CN117475090A - 一种轨迹生成模型、轨迹生成方法、装置、终端及介质 - Google Patents
一种轨迹生成模型、轨迹生成方法、装置、终端及介质 Download PDFInfo
- Publication number
- CN117475090A CN117475090A CN202311815492.5A CN202311815492A CN117475090A CN 117475090 A CN117475090 A CN 117475090A CN 202311815492 A CN202311815492 A CN 202311815492A CN 117475090 A CN117475090 A CN 117475090A
- Authority
- CN
- China
- Prior art keywords
- track
- trajectory
- target
- dimensional
- loss function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 95
- 239000013598 vector Substances 0.000 claims abstract description 187
- 230000009467 reduction Effects 0.000 claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 149
- 238000012549 training Methods 0.000 claims description 50
- 230000007613 environmental effect Effects 0.000 claims description 41
- 238000003062 neural network model Methods 0.000 claims description 29
- 238000005457 optimization Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 10
- 230000001131 transforming effect Effects 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 2
- 230000001133 acceleration Effects 0.000 description 8
- 238000005265 energy consumption Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Geometry (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Hardware Design (AREA)
- Mathematical Optimization (AREA)
- Medical Informatics (AREA)
- Computer Graphics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Radar Systems Or Details Thereof (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明公开了一种轨迹生成模型、轨迹生成方法、装置、终端及介质,该轨迹生成模型包括:轨迹嵌入器、向量序列变换器以及轨迹解码器。轨迹嵌入器,轨迹嵌入器用于对至少一个移动物体的初始轨迹数据进行高维语义向量空间表示,以得到高维嵌入向量序列。向量序列变换器,向量序列变换器用于将高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列。轨迹解码器,轨迹解码器用于对目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。本发明可基于深度神经网络生成至少一个移动物体的轨迹,可以实现对大批量甚至超大批量移动物体进行精准且安全的轨迹预测、规划和冲突协调。
Description
技术领域
本发明涉及轨迹生成技术领域,尤其涉及一种轨迹生成模型、轨迹生成方法、装置、终端及介质。
背景技术
当前针对单个与多个移动目标物的轨迹预测、规划等方法,受到计算复杂度和硬件计算资源的限制,只能实现小批量移动物体的。例如,现有技术中,轨迹预测通常以随机时间序列(time series)建模,使用大量数据通过监督或无监督学习,实现轨迹的预测。而轨迹规划常采用基于搜索的方法、基于优化的方法或基于二者结合的方法。
且现有技术中的移动物体的轨迹规划方法,没有对轨迹的坐标点进行语义建模,现有技术的轨迹规划方法中的坐标点的表示是三维或四维几何坐标本身。这种直接的几何坐标,无法表达轨迹与环境、其他静态、移动物体之间的关系与测度,导致轨迹规划不准确,无法满足实际的需求。
因此,现有技术还有待改进和提高。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种轨迹生成模型、轨迹生成方法、装置、终端及介质,旨在解决传统的轨迹规划方法中的坐标点的表示是三维或四维几何坐标本身,无法表达轨迹与环境、其他静态、移动物体之间的关系与测度,导致轨迹规划不准确,无法满足实际的需求的问题。
为了解决上述技术问题,本发明所采用的技术方案如下:
第一方面,本发明提供一种轨迹生成模型,其中,所述轨迹生成模型包括:
轨迹嵌入器,所述轨迹嵌入器用于对至少一个移动物体的初始轨迹数据进行高维语义向量空间表示,以得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标;
向量序列变换器,所述向量序列变换器用于将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列;
轨迹解码器,所述轨迹解码器用于对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。
在一种实现方式中,所述空间坐标为三维的空间坐标,包括一个物体的三维坐标或者一个物体的多个关键点的三维坐标。
在一种实现方式中,所述轨迹嵌入器用于对至少一个移动物体的初始轨迹数据进行高维语义向量空间表示,包括:
将轨迹关联信息嵌入至所述初始轨迹数据,并对已嵌入所述轨迹关联信息的初始轨迹数据进行高维语义向量空间表示;
所述轨迹关联信息至少包括轨迹任务信息、物体属性信息、运动约束信息以及与环境障碍物的关系信息的其中一个。
在一种实现方式中,所述轨迹生成模型还包括:
轨迹优化器,所述轨迹优化器用于对所述目标轨迹的空间坐标进行迭代更新,以得到目标优化轨迹。
在一种实现方式中,所述轨迹优化器用于对所述目标轨迹的空间坐标进行迭代更新,包括:
基于所述目标轨迹、所述轨迹关联信息、目标损失函数对所述目标轨迹的空间坐标进行优化更新,得到满足所述目标损失函数要求的轨迹坐标;
所述目标损失函数至少包括环境冲突损失函数、轨迹间冲突损失函数、轨迹性能损失函数以及物理约束损失函数的其中一个损失函数;
其中,所述环境冲突损失函数用于计算生成的目标轨迹和环境碰撞的测度,所述轨迹间冲突损失函数用于计算生成的多个目标轨迹之间相互碰撞的测度,所述轨迹性能损失函数用于计算生成的目标轨迹的性能指标,所述物理约束损失函数用于计算生成的目标轨迹与物理学约束间的差距。
第二方面,本发明实施例还提供一种基于上述方案所述的轨迹生成模型的轨迹生成方法,所述方法包括:
获取至少一个移动物体的初始轨迹数据,基于已训练的轨迹生成模型对所述初始轨迹数据进行高维语义向量空间表示,得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标;
基于所述轨迹生成模型,将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列;
基于所述轨迹生成模型,对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。
在一种实现方式中,所述获取至少一个移动物体的初始轨迹数据,包括:
所述初始轨迹数据为至少一个移动物体的起始轨迹点;
获取至少一个移动物体的起始轨迹点,并基于所述起始轨迹点进行单步轨迹点预测,得到下一个轨迹点;
基于下一个轨迹点重复进行单步轨迹点预测,直至生成所述初始轨迹数据。
在一种实现方式中,所述获取至少一个移动物体的初始轨迹数据,包括:
所述初始轨迹数据为至少一个移动物体的起始轨迹点与终点轨迹点;
分别获取至少一个移动物体的起始轨迹点与终点轨迹点,并在三维坐标空间中,对所述起始轨迹点与所述终点轨迹点之间进行采样,得到所述起始轨迹点与所述终点轨迹点之间的连线;
在一维时间戳信息层面进行采样,得到所述连线上各点对应的时间戳信息;
分别将所述时间戳信息和所述连线上的各个三维坐标点对应组合,得到初始轨迹数据。
在一种实现方式中,所述获取至少一个移动物体的初始轨迹数据,包括:
所述初始轨迹数据为至少一个移动物体的起始轨迹点、中途轨迹点与终点轨迹点;
获取至少一个移动物体的起始轨迹点、中途轨迹点与终点轨迹点;
对所述起始轨迹点、所述中途轨迹点进行分段连线,对所述中途轨迹点、所述终点轨迹点进行分段连线,并通过适当采样的方式获得其他轨迹点,得到所述初始轨迹数据。
在一种实现方式中,所述基于所述轨迹生成模型,将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列,包括:
基于所述轨迹生成模型,确定所述高维嵌入向量序列中每一个高维向量匹配所述轨迹约束条件的概率信息;
基于所述概率信息,从所述高维嵌入向量序列中筛选出满足所述轨迹约束条件的高维向量,得到所述目标轨迹高维向量序列。
在一种实现方式中,若所述轨迹生成方法应用于轨迹规划或者轨迹冲突协调,则所述轨迹约束条件至少包括当前物体与环境没有碰撞、多个移动物体之间没有碰撞、多个移动物体与移动物体没有碰撞的其中一个;
在一种实现方式中,若所述轨迹生成方法应用于轨迹规划,则所述轨迹约束条件还包括:所述目标轨迹的终点轨迹点与环境或者其他物体没有碰撞。
在一种实现方式中,所述方法还包括:
基于所述轨迹生成模型对所述目标轨迹的空间坐标进行迭代更新,以得到目标优化轨迹。
第三方面,本发明实施例还提供一种轨迹生成模型的训练方法,其中,所述训练方法包括:
将初始轨迹数据输入预设的神经网络模型;
所述预设的神经网络模型将所述轨迹关联信息嵌入到所述初始轨迹数据后得到高维嵌入向量序列,并进一步根据所述高维嵌入向量序列生成目标轨迹高维向量序列,再对所述目标轨迹高维向量序列进行降维解码以输出目标轨迹;
基于所述目标轨迹通过目标损失函数对预设的神经网络模型进行训练,得到已训练的轨迹生成模型;
其中,所述轨迹关联信息至少包括轨迹任务信息、物体属性信息、运动约束信息以及与环境障碍物的关系信息的其中一个;
所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标。
在一种实现方式中,所述轨迹生成模型包括轨迹嵌入器、向量序列变换器以及轨迹解码器,所述基于目标轨迹通过目标损失函数对预设的神经网络模型进行训练,得到已训练的轨迹生成模型,包括:
基于所述轨迹关联信息,确定环境冲突损失函数、轨迹间冲突损失函数、轨迹性能损失函数以及物理约束损失函数,其中,所述环境冲突损失函数用于计算生成的目标轨迹和环境碰撞的测度,所述轨迹间冲突损失函数用于计算生成的多个目标轨迹之间相互碰撞的测度,所述轨迹性能损失函数用于计算生成的目标轨迹的性能指标,所述物理约束损失函数用于计算生成的目标轨迹与物理学约束间的差距;
将所述环境冲突损失函数、所述轨迹间冲突损失函数、所述轨迹性能损失函数以及所述物理约束损失函数进行加权求和,得到目标损失函数;
基于所述目标损失函数并通过优化的方法对所述神经网络模型中的向量序列变换器进行训练,训练后的向量序列变换器用于将高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列。
在一种实现方式中,所述训练方法还包括:
所述初始轨迹数据包括样本真实轨迹;所述样本真实轨迹是至少一个样本物体的样本初始轨迹与满足约束条件的轨迹的映射对;
将所述样本初始轨迹输入所述神经网络模型后输出目标轨迹;
所述目标损失函数包括匹配损失函数,用于计算生成的目标轨迹和样本真实轨迹之间的偏差;
基于所述目标轨迹和所述样本物体的真实轨迹计算目标损失函数及其梯度,并使用所述目标损失函数及其梯度对预设的神经网络模型进行训练,得到已训练的轨迹生成模型,其中,所述真实轨迹为满足轨迹约束条件的轨迹。
在一种实现方式中,所述轨迹生成模型还包括轨迹优化器,所述训练方法还包括:
利用所述轨迹优化器对所述样本真实轨迹中的样本初始轨迹进行优化,并使用优化后的样本作为真实目标轨迹对所述轨迹生成模型进行训练。
第四方面,本发明实施例还提供一种基于轨迹生成模型的轨迹生成装置,其中,所述轨迹生成装置包括:
轨迹嵌入模块,用于获取至少一个移动物体的初始轨迹数据,基于已训练的轨迹生成模型对所述初始轨迹数据进行高维语义向量空间表示,得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的初始轨迹点序列的轨迹点,所述轨迹点包括时间信息和空间坐标;
向量序列变换模块,用于基于所述轨迹生成模型,将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列;
目标轨迹输出模块,用于基于所述轨迹生成模型,对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。
第五方面,本发明实施例还提供一种终端,其中,所述终端包括存储器、处理器及存储在存储器中并可在处理器上运行的基于神经网络的轨迹生成程序,处理器执行基于神经网络的轨迹生成程序时,实现上述方案中所述的基于轨迹生成模型的轨迹生成方法的步骤或者实现上述方案中所述的轨迹生成模型的训练方法的步骤。
第六方面,本发明实施例还提供一种计算机可读存储介质,其中,计算机可读存储介质上存储有基于神经网络的轨迹生成程序,所述基于神经网络的轨迹生成程序被处理器执行时,实现上述方案中所述的基于轨迹生成模型的轨迹生成方法的步骤或者实现上述方案中所述的轨迹生成模型的训练方法的步骤。
有益效果:与现有技术相比,本发明提供了一种轨迹生成模型,该轨迹生成模型包括:轨迹嵌入器、向量序列变换器以及轨迹解码器。所述轨迹嵌入器,所述轨迹嵌入器用于对至少一个移动物体的初始轨迹数据进行高维语义向量空间表示,以得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标。所述向量序列变换器,所述向量序列变换器用于将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列。所述轨迹解码器,所述轨迹解码器用于对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。本发明通过将移动物体的初始轨迹数据输入至轨迹生成模型中,利用轨迹生成模型自动输出符合轨迹约束条件要求的目标轨迹,不但提高了轨迹生成的效率,并且利用轨迹生成模型对初始轨迹数据进行高维语义向量空间表示,隐式映射了移动物体轨迹与环境、其他静态、移动物体之间的关系与测度,提高轨迹生成的准确性。此外,本发明获取的是至少一个移动物体的初始轨迹数据,可自动输出符合轨迹约束条件要求的目标轨迹,计算复杂度降低,有利于实现对同时对大批量甚至超大批量移动物体进行轨迹生成,在满足实际物理条件下实现精准且安全的轨迹预测、轨迹规划、轨迹冲突协调。
附图说明
图1为本发明实施例提供的基于轨迹生成模型的架构示意图。
图2为本发明实施例提供的基于轨迹生成模型的轨迹生成方法的较佳实施例的流程图。
图3为本发明实施例提供的基于轨迹生成模型的训练方法流程图。
图4为本发明实施例提供的对轨迹生成模型进行训练的流程示意图。
图5为本发明实施例提供的带轨迹优化器的轨迹生成模型的架构示意图。
图6为本发明实施例提供的基于轨迹生成模型的轨迹生成装置的原理框图。
图7为本发明实施例提供的终端的原理框图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
现有技术中,基于深度学习的方法为轨迹规划问题提供了一种新的思路。深度学习方法通过使用神经网络模型来学习环境特征和智能体之间的相互关系。这些深度学习模型可以基于大规模数据集的训练,自动地生成高质量的路径规划方案,以满足各种约束条件和优化目标。强化学习方法将轨迹规划问题转化为马尔可夫决策过程,通过与环境的交互,智能体可以根据奖励信号来调整其行为,以最大化长期累积奖励并避免碰撞,最终得到对应的最优轨迹。这种学习过程可以通过Q-learning(强化学习中一种基于值的算法)、策略梯度等强化学习算法来实现。基于学习的方法在解决轨迹规划问题时的优势在于可以学习并适应不同的环境和约束条件,并生成高效的路径规划方案。然而,这类方法也面临一些挑战,如训练时间较长、算法的可扩展性、生成轨迹在现实物理世界中不能保证可行性等问题。
为解决现有技术的问题,如图1中所示,本实施例提供一种轨迹生成模型,该轨迹生成模型包括轨迹嵌入器、向量序列变换器以及轨迹解码器,其中,轨迹嵌入器用于对至少一个移动物体的初始轨迹数据进行高维语义向量空间表示,以得到高维嵌入向量序列;所述向量序列变换器用于将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列;所述轨迹解码器用于对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。
本实施例的移动物体包括可移动的智能机器人,车,船,飞行器,航天器等可移动的物体。本方法用于预测移动物体轨迹应用时,本实施例的移动物体包括可移动的陆地动物、水中动物、空中动物、人,以及车、船、工具等被动移动的物体。本实施例的初始轨迹数据为至少一个移动物体的轨迹点。轨迹点包括时间信息和空间坐标,该轨迹点包括起始轨迹点和终点轨迹点。轨迹点的时间信息和空间坐标具有一定的对应关系。当移动物体为飞行器时,获取到的初始轨迹数据就是该飞行器的起落时间、位置等数据。本实施例中空间坐标为三维的空间坐标,其形态可以是三维空间的一个物体的3D坐标,因此轨迹点包括一维时间信息和三维空间坐标。当然,其他实现方式中,三维的空间坐标的形态也可以是一个物体的N个关键点的3D坐标,即轨迹点可以是多维坐标,包括一维时间信息和多组三维空间。例如,当移动物体为智能机器人时,其轨迹点对应的空间坐标可以是该智能机器人多个关键节点的三维坐标。当获取到初始轨迹数据后,本实施例可将初始轨迹数据输入至已训练的轨迹生成模型中,所述轨迹生成模型可对所述初始轨迹数据进行高维语义向量空间表示,具体可通过所述轨迹生成模型中的轨迹嵌入器(trajectory embedder)可以是轨迹嵌入表示模型,将轨迹关联信息嵌入至所述初始轨迹数据,并对已嵌入所述轨迹关联信息的初始轨迹数据进行高维语义向量空间表示,从而得到高维嵌入向量序列。
具体地,本实施例的轨迹关联信息是指与移动物体轨迹关联的信息,至少包括轨迹任务信息、物体属性信息、运动约束信息以及与环境障碍物的关系信息的其中一个。所述轨迹任务信息包括:起始轨迹点、中途轨迹点、终点轨迹点,载物质量、载物尺寸大小以及耗能情况;所述物体属性信息包括:移动物体的速度、加速度、质量、姿态以及安全距离。所述物体属性信息可根据轨迹任务信息进行调整,例如移动物体的安全距离可根据移动物体的大小、完成的轨迹任务来确定。运动约束信息包含:移动物体的速度约束、加速度约束、运动学约束、动力学等约束。与环境障碍物的关系信息:移动物体与环境障碍物的距离(即轨迹点与环境障碍物表面的最短距离)以及与其他移动物体的距离。当移动物体与环境障碍物(包含建筑、树木等客观环境中存在的障碍)的距离既小于该移动物体的安全距离也小于该环境障碍物自身要求的安全距离时,被认定为环境碰撞。因此,本实施例将轨迹任务信息、物体属性信息、轨迹运动信息以及环境障碍物信息作为轨迹关联信息。在其他实现方式中,本实施例的轨迹关联信息还可包括能耗数据,天气信息、电磁信息等。
所述轨迹生成模型的轨迹嵌入器将所述轨迹关联信息嵌入至初始轨迹数据,就可以实现对所述初始轨迹数据进行语义表示。接着,对已嵌入所述轨迹关联信息的初始轨迹数据进行高维向量空间表示,就可以得到所述高维嵌入向量序列。具体地,可通过相对距离保持(relative distance preserved vector embedding)把时空-空间四维坐标映射到高维N(如1024或2048维或更高)维向量空间,通过高维向量可隐式(implicit)构建时空-坐标表示。本实施例中,轨迹生成模型已通过神经网络训练,把轨迹任务信息、物体属性信息、轨迹运动信息以及环境障碍物信息作为轨迹关联信息嵌入移动物体的初始轨迹数据,对初始轨迹数据进行高维语义向量空间表示,以此形成语义驱动的四维时空轨迹点的生成能力。
本实施例的轨迹生成模型中的向量序列变换器用于将所述高维嵌入向量序列转换成满足轨迹约束条件的轨迹高维向量序列,例如使用transformer、Convolution等各类可实现长向量序列变换的模型,负责将已嵌入所述轨迹关联信息的初始轨迹数据,转换到成满足轨迹约束条件的目标轨迹高维向量序列。在具体应用时,本实施例的向量序列变换器可以是transformer,采用概率模型(比如transformer的sequence的概率模型)保证输出目标轨迹高维向量序列满足轨迹规划条件或轨迹预测条件的概率Pr(高维嵌入向量序列|满足轨迹约束条件)。在具体应用时,本实施例的向量序列变换器可以是transformer,采用概率模型(比如transformer的sequence的概率模型)作为单条或多条轨迹的安全评价模型。该安全评价模型,通过轨迹点嵌入考虑多种相关要素(如与其他物体距离、速度关系等),可以再将向量序列变换器输出的目标轨迹高维向量序列通过距离解码器解码后得到与环境/其他移动物体的距离,以评估目标轨迹的安全性、隐含性能等复合评分。
本实施例的轨迹生成模型可保证输出的目标轨迹至少满足如下轨迹约束条件中的任意一个:1)当前物体与环境没有碰撞;2)多个移动物体之间没有碰撞;3)多个移动物体与其他移动物体没有碰撞。因此,轨迹生成模型可同时应用在轨迹的预测、规划、冲突协调等问题。若所述轨迹生成模型应用于轨迹规划或者轨迹冲突协调,则输出的目标轨迹需要满足以上三个要求。如果该轨迹生成模型用于轨迹的预测,该方法依据对移动物体性质的判断,输出的目标轨迹在终点轨迹点前满足以上三个要求外,还需进一步满足目标轨迹的终点轨迹点与环境或者其他物体没有碰撞。
在本实施例中,所述轨迹生成模型中的轨迹解码器(trajectory decoder),可以是全连接网络,将满足轨迹约束条件的目标轨迹高维向量序列降维解码成四维坐标。
在实际应用中,本实施的轨迹解码器还可以被配置成轨迹点距离解码器,处理生成轨迹点外,同时生成轨迹点与周围环境及其他移动物体中最近点的距离。
在一种实现方式中,本实施例的轨迹生成模型还包括轨迹优化器,该轨迹优化器用于对所述目标轨迹的空间坐标进行迭代更新,以得到目标优化轨迹。该轨迹优化器可基于目标轨迹、所述轨迹关联信息、目标损失函数对所述目标轨迹的空间坐标进行优化更新,得到满足所述目标损失函数要求的轨迹坐标。在轨迹优化器中,本实施例利用损失函数的梯度反向传播对多个移动物体目标轨迹上的每个点进行调整,得到满足无环境碰撞、无编队内部碰撞、轨迹长度更短等轨迹约束条件的多个移动物体的轨迹点。本实施例中,轨迹优化器带可微几何和物理约束,通过可微可导的物理模型约束,可保证最终输出的目标轨迹能满足实际的物理现实条件。轨迹优化器可使用各个优化算法,如Adam、Adam-W等,利用损失函数的梯度反向传播对多个移动物体的目标轨迹上的每个点进行调整,以逆向损失更新轨迹,得到满足无环境碰撞、无编队内部碰撞、轨迹长度更短等约束条件且可满足实际物理实现条件的多个移动物体的轨迹点。
本实施例的轨迹优化器的目标损失函数的确定,需考虑轨迹任务信息、物体属性信息、轨迹运动信息等。本实施例的轨迹优化器的优化对象不是模型参数,而是目标轨迹的轨迹点坐标本身。在此,本实施例给出轨迹优化器的目标损失函数的潜在可行组合:
第一项是环境冲突损失函数(environment collision loss),计算生成的目标轨迹和环境碰撞的测度,该指标通过计算目标轨迹上每点和环境障碍物在安全时间间隔内的最短距离与安全距离比较差得到;
第二项是轨迹间冲突损失函数(inter- trajectory collision loss),计算生成的多条目标轨迹相互碰撞测度,该指标由计算每条目标轨迹上每点和其他轨迹每点在安全时间间隔范围内的最短距离及安全距离比较差得到;
第三项是轨迹性能损失函数(performance loss),计算生成的目标轨迹的性能指标。例如目标轨迹的长度,更短的目标轨迹被认为是性能更优的轨迹,因其可满足移动物体对于能耗、效率方面的需求,添加目标轨迹长度的约束以训练轨迹优化器生成更短的飞行轨迹。
第四项是物理约束损失函数(physics constraints loss),计算轨迹与物理学约束间的差距。例如,最大及最小速度约束,轨迹平滑度约束等。
对轨迹生成模型结合轨迹优化器应用过程时,本实施例首先确定环境冲突损失函数、轨迹间冲突损失函数、轨迹性能损失函数以及物理约束损失函数,然后从所述环境冲突损失函数、所述轨迹间冲突损失函数、所述轨迹性能损失函数以及所述物理约束损失函数中确定一个作为目标损失函数。接着,基于轨迹解码器输出的目标轨迹、所述轨迹关联信息、以及确定的目标损失函数对所述目标轨迹的空间坐标进行优化更新,得到满足所述目标损失函数要求的轨迹坐标。
轨迹优化器的目标损失函数实现了对目标轨迹可微可导的物理模型约束,可保证最终输出的目标轨迹能满足实际的物理现实条件。本实施例的轨迹优化器可生成轨迹生成模型所需的单个或多个移动物体的样本轨迹数据,该样本轨迹数据可用作训练轨迹生成模型的训练数据。轨迹优化器还可用于对轨迹生成模型生成的单个或多个移动物体的目标轨迹进行额外优化,得到性能更加强化的单个或多个移动物体的目标轨迹,以实现轨迹规划与冲突协调。从图5可看出,轨迹生成模型和轨迹优化器可配合使用,首先,轨迹生成模型基于输入的初始轨迹数据,通过轨迹解码器生成目标轨迹。 然后,将轨迹解码器生成的目标轨迹,作为轨迹优化器的输入,进行额外优化,最后生成更优的性能更优的目标轨迹。本实施例的额外优化是指对轨迹解码器生成的目标轨迹上各轨迹点进行进一步调整,保证至少满足如下条件中的任意一个:(1)不与环境发生冲突,(2)编队内部个体之间没有冲突,(3)轨迹性能优越(轨迹平滑、飞行距离短等)。经过额外优化后的目标轨迹由轨迹优化器输出,可得到更优的安全性能和更短的移动距离的一个或多个移动物体的目标轨迹,可应用于对应安全性能和移动距离要求更高的移动物体的轨迹规划与冲突协调任务。
基于上述实施例,本发明提供一种基于轨迹生成模型的轨迹生成方法,基于该方法可提高轨迹生成的准确性,且可实现同时对大批量甚至超大批量移动物体进行轨迹生成,在满足实际物理条件下实现精准且安全的轨迹预测、轨迹规划、轨迹冲突协调。具体实施时,本实施例首先获取至少一个移动物体的初始轨迹数据,基于已训练的轨迹生成模型对所述初始轨迹数据进行高维语义向量空间表示,得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标。然后,基于所述轨迹生成模型,将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列。最后,基于所述轨迹生成模型,对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。由于本实施例是将包括时间信息和空间坐标的轨迹点输入至轨迹生成模型中,利用轨迹生成模型自动输出符合轨迹约束条件要求的目标轨迹,不但提高了轨迹规划的效率,并且由于高维嵌入向量序列包含了嵌入的轨迹关联信息,以此高维嵌入向量序列转换的目标轨迹高维向量序列满足轨迹约束条件,有利于反映轨迹与环境、其他静态、移动物体之间的关系与测度,提高轨迹规划的准确性。且本实施例获取的是至少一个移动物体的初始轨迹数据,计算复杂度降低,因此有利于实现对大批量甚至超大批量移动物体进行精准且安全的轨迹规划。
本实施例的基于轨迹生成模型的轨迹生成方法可应用于终端中,所述终端为电脑、手机等智能化产品终端。如图1中所示,本实施例的基于轨迹生成模型的轨迹生成方法包括如下步骤:
步骤S100、获取至少一个移动物体的初始轨迹数据,基于已训练的轨迹生成模型对所述初始轨迹数据进行高维语义向量空间表示,得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标。
如图2中所示,本发明可获取至少一个移动物体的初始轨迹数据,本实施例的移动物体包括可移动的智能机器人,车,船,飞行器,航天器等可移动的物体。在具体应用时,本实施例的初始轨迹数据为至少一个移动物体的轨迹点。轨迹点包括起始轨迹点和终点轨迹点,该轨迹点包括时间信息和空间坐标,轨迹点的时间信息和空间坐标具有一定的对应关系。当移动物体为飞行器时,获取到的初始轨迹数据就是该飞行器的起落时间、位置等数据。本实施例中空间坐标为三维的空间坐标,其形态可以是三维空间的一个物体的3D坐标,因此轨迹点反映的是4D坐标,其包括一维时间信息和三维空间坐标。当然,其他实现方式中,三维的空间坐标的形态也可以是一个物体的N个关键点的3D坐标,即轨迹点反映的可以是多维坐标,包括一维时间信息和多组三维空间。例如,当移动物体为智能机器人时,其轨迹点对应的空间坐标可以是该智能机器人多个关键节点的三维坐标。当获取到初始轨迹数据后,本实施例可将初始轨迹数据输入至已训练的轨迹生成模型中,所述轨迹生成模型可对所述初始轨迹数据进行高维语义向量空间表示,得到高维嵌入向量序列。本实施例的高维嵌入向量序列是将轨迹关联信息嵌入至初始轨迹数据后并进行高维语义空间表示的向量序列。
进一步的,本实施例获取初始轨迹数据方式有三种。具体地,本实施例的初始轨迹数据可为至少一个移动物体的起始轨迹点,因此,本实施例可获取至少一个移动物体的起始轨迹点,然后将该起始轨迹点输入至轨迹生成模型,利用所述轨迹生成模型基于所述起始轨迹点进行单步轨迹点预测,得到下一个轨迹点。然后再基于下一个轨迹点重复进行单步轨迹点预测,以此类推,逐次完成所述初始轨迹数据的构造,直至生成所述初始轨迹数据。在另一种实现方式中,本实施例的初始轨迹数据可为至少一个移动物体的起始轨迹点与终点轨迹点。因此,本实施例可通过起始轨迹点与终点轨迹点之间的采样点作为初始轨迹数据。具体地,本实施例分别获取至少一个移动物体的起始轨迹点与终点轨迹点,并在三维坐标空间中,对所述起始轨迹点与所述终点轨迹点之间按一定规则(如等距离、等密度等)进行采样,得到所述起始轨迹点与所述终点轨迹点之间的连线,此时该连线为在三维坐标空间中采样得到的三维坐标点。接着,本实施例在一维时间戳信息层面按一定规则(如等距离、等密度等)进行采样,得到所述连线上各点对应的时间戳信息,然后分别将所述时间戳信息和所述连线上的各个三维坐标点对应组合,这样就得到了起始轨迹点与终点轨迹点之间的连线上的四维时间-空间的坐标点序列,并作为初始轨迹数据。在其他实现方式中,本实施例的初始轨迹数据还可为至少一个移动物体的起始轨迹点、中途轨迹点与终点轨迹点。因此,本实施例还可以依据单个或者多个移动物体的部分已知轨迹点来获得其他轨迹点。比如,本实施例可获取至少一个移动物体的起始轨迹点、中途轨迹点与终点轨迹点。然后对所述起始轨迹点、所述中途轨迹点进行分段连线,对所述中途轨迹点、所述终点轨迹点进行分段连线,并通过适当采样的方式获得其他轨迹点,得到所述初始轨迹数据。由此可见,本实施例可在获取至少一个移动物体的初始轨迹数据时,可基于一个移动物体或多个移动物体的起始轨迹点和终点轨迹点来确定,也可基于一个移动物体或多个移动物体的已知轨迹来确定。当获取到初始轨迹数据后,本实施例将该初始轨迹数据输入至预先已进行训练的轨迹生成模型,以通过该轨迹生成模型来对初始轨迹数据进行分析,进而输出满足轨迹约束条件的目标轨迹。
具体地,如图1所示,本实施例的轨迹生成模型包括轨迹嵌入器、向量序列变换器以及轨迹解码器,其中,轨迹嵌入器可以是一个轨迹嵌入表示模型,用于将与轨迹关联信息对应的轨迹关联信息嵌入至所述初始轨迹数据,并对所述初始轨迹数据进行高维语义向量空间表示,得到高维嵌入向量序列。所述向量序列变换器用于将所述高维嵌入向量序列转换成满足轨迹约束条件的轨迹高维向量序列,例如transformer。所述轨迹解码器,可以是全连接网络,用于将所述轨迹高维向量序列降维解码成所述目标轨迹。
具体地,本实施例的轨迹生成模型是基于预设的神经网络模型训练得到的。如图3所示,本实施例的轨迹生成模型的训练步骤包括:
步骤S1、将初始轨迹数据输入预设的神经网络模型;
步骤S2、所述预设的神经网络模型将轨迹关联信息嵌入到所述初始轨迹数据后得到高维嵌入向量序列,并进一步根据所述高维嵌入向量序列生成目标轨迹高维向量序列,再对所述目标轨迹高维向量序列进行降维解码以输出目标轨迹;
步骤S3、基于所述目标轨迹通过目标损失函数对预设的神经网络模型进行训练,得到已训练的轨迹生成模型。
具体地,本实施例通过计算目标损失函数并通过优化的方法(如基于Adam等梯度下降的方法)对轨迹生成模型进行训练。本实施例首先获取初始轨迹数据将初始轨迹数据输入预设的神经网络模型。
接着,本实施例将初始轨迹数据输入预设的神经网络模型(如transformer或Convolution等模型),然后通过预设的神经网络模型将所述轨迹关联信息嵌入到所述初始轨迹数据后得到高维嵌入向量序列。
所述轨迹关联信息至少包括轨迹任务信息、物体属性信息、运动约束信息以及与环境障碍物的关系信息的其中一个;所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标。所述轨迹任务信息包括:起始轨迹点、途径点、终点轨迹点,载物质量、载物大小以及耗能情况;所述物体属性信息包括:移动物体的速度、加速度、质量、姿态以及安全距离。所述物体属性信息可根据轨迹任务信息进行调整,例如移动物体的安全距离可根据移动物体的大小、完成的轨迹任务来确定。运动约束信息包含:移动物体的速度约束、加速度约束、运动学约束、动力学等约束。与环境障碍物的关系信息:移动物体与环境障碍物的距离(即轨迹点与环境障碍物表面的最短距离)以及与其他移动物体的距离。当移动物体与环境障碍物(包含建筑、树木等客观环境中存在的障碍)的距离既小于该移动物体的安全距离也小于该环境障碍物自身要求的安全距离时,被认定为环境碰撞。因此,本实施例将轨迹任务信息、物体属性信息、轨迹运动信息以及环境障碍物信息作为轨迹关联信息,在其他实现方式中,该轨迹关联信息还可包括能耗数据,天气信息、电磁信息等。
在得到高维嵌入向量序列后,并进一步根据所述高维嵌入向量序列生成目标轨迹高维向量序列,再对所述目标轨迹高维向量序列进行降维解码以输出目标轨迹。同样地,本实施例的初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标。本实施例可通过相对距离保持(relative distance preserved vector embedding)把时空-空间四维坐标映射到高维N(如1024或2048维或更高)维向量空间,通过高维向量可隐式(implicit)构建时空-坐标表示。本实施例通过神经网络模型把轨迹对应的轨迹任务信息、与环境的关系、与其他移动物体的关系、与速度、加速度、运动学约束、动力学约束等与轨迹预测、轨迹规划、冲突协调相关的意义嵌入轨迹的高维表示,以此形成语义驱动的目标轨迹的生成能力。
接着,本实施例使用有监督学习和/或无监督学习的方法,通过计算目标损失函数并基于优化(如基于Adam等梯度下降)的方法预设的神经网络模型进行训练,得到已训练的轨迹生成模型,该轨迹生成模型包括轨迹嵌入器、向量序列变换器以及轨迹解码器。如图4中所示,本实施例可配置成监督学习、无监督学习训练模式及两种模式的混合。具体地,本实施例可基于上述轨迹关联信息中具体的内容,选择其中的一项或者多项确定轨迹约束条件,然后基于该轨迹约束条件来确定目标损失函数。在一种实现方式中,本实施例可基于轨迹关联信息,确定匹配损失函数(matching loss)、环境冲突损失函数(environmentcollision loss)、轨迹间冲突损失函数(inter- trajectory collision loss)、轨迹性能损失函数(performance loss)以及物理约束损失函数(physics constraints loss))。其中,所述匹配损失函数用于有监督学习的训练,输入的初始轨迹数据中包含样本真实轨迹,该匹配损失函数用于计算生成的目标轨迹和样本真实轨迹之间的偏差,在实际应用时,该偏差可通过计算生成的目标轨迹和样本真实轨迹之间每个点对应的偏差值累加求平均得到。所述环境冲突损失函数用于计算生成的目标轨迹和环境碰撞的测度,该测度可通过计算目标轨迹上每点和环境障碍物在安全时间间隔内的最短距离与安全距离作差得到。所述轨迹间冲突损失函数用于计算生成的多个目标轨迹之间相互碰撞的测度,该测度可通过计算每条目标轨迹上每个点和其他轨迹每个点在安全时间间隔范围内的最短距离及安全距离作差得到。所述轨迹性能损失函数用于计算生成的目标轨迹的性能指标,例如性能指标可为生成的目标轨迹的长度,更短的目标轨迹被认为是性能更优的轨迹,因其可满足无人机对于能耗、效率方面的需求,因此添加轨迹长度的约束以训练向量序列变换器生成更短的目标轨迹。所述物理约束损失函数用于计算生成的目标轨迹与物理学约束间的差距,例如,最大及最小速度约束,轨迹平滑度约束等。然后,本实施例可从所述匹配损失函数、所述环境冲突损失函数、所述轨迹间冲突损失函数、所述轨迹性能损失函数以及所述物理约束损失函数中确定一个作为目标损失函数,或者可将所述匹配损失函数、所述环境冲突损失函数、所述轨迹间冲突损失函数、所述轨迹性能损失函数以及所述物理约束损失函数进行加权求和,得到目标损失函数。接着,本实施例基于目标损失函数并通过优化的方法对神经网络模型中的向量序列变换器进行训练,训练后的向量序列变换器用于将高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列,该目标轨迹高维向量序列满足无碰撞等涵盖各类任务目标、运动学、动力学等相关的轨迹约束信息。
具体应用时,本实施例目标损失函数包括环境冲突损失函数(environmentcollision loss)、轨迹间冲突损失函数(inter- trajectory collision loss)、轨迹性能损失函数(performance loss)以及物理约束损失函数(physics constraints loss)中的一个损失函数。所述环境冲突损失函数用于计算生成的目标轨迹和环境碰撞的测度,该测度可通过计算目标轨迹上每点和环境障碍物在安全时间间隔内的最短距离与安全距离作差得到。所述轨迹间冲突损失函数用于计算生成的多个目标轨迹之间相互碰撞的测度,该测度可通过计算每条目标轨迹上每个点和其他轨迹每个点在安全时间间隔范围内的最短距离及安全距离作差得到。所述轨迹性能损失函数用于计算生成的目标轨迹的性能指标,例如性能指标可为生成的目标轨迹的长度,更短的目标轨迹被认为是性能更优的轨迹,因其可满足无人机对于能耗、效率方面的需求,因此添加轨迹长度的约束可使得轨迹优化器得到更优的目标轨迹。所述物理约束损失函数用于计算生成的目标轨迹与物理学约束间的差距。例如,最大及最小速度约束,轨迹平滑度约束等。本实施例通过从所述环境冲突损失函数、所述轨迹间冲突损失函数、所述轨迹性能损失函数以及所述物理约束损失函数中计算目标损失函数,并基于确定出的目标损失函数、目标轨迹、轨迹关联信息,对所述目标轨迹的空间坐标进行优化更新,得到满足所述目标损失函数要求的轨迹坐标。
在本实施例中,碰撞分为两类,环境碰撞与编队内部碰撞,以无人机为例,环境碰撞指无人机与环境障碍物(包含建筑、树木等客观环境中存在的障碍)的距离既小于该无人机的安全距离也小于该环境障碍物要求的安全距离时,被认定为环境碰撞。环境障碍物采用三维坐标表示,不包含时间戳信息。编队内部碰撞指无人机与无人机在相近时刻(无人机的飞行轨迹的时间戳的差值小于设定的时间阈值,认定为相近时刻)的距离既小于该无人机的安全距离也小于其他移动物体的安全距离,被认定为编队内部碰撞。安全距离为保证无人机运行操作不受环境和其他无人机干扰的,该安全距离的值设定需根据无人机大小、完成的任务类型来确定。
在具体的训练过程中,针对匹配损失函数进行向量序列变换器的训练时,本实施例可采用有监督学习的训练方案来训练向量序列变换器,此时,目标损失函数还包括匹配损失函数,输入至神经网络模型的初始轨迹数据包括样本真实轨迹;所述样本真实轨迹数据是至少一个样本物体的样本初始轨迹与满足约束条件的轨迹的映射对。此时的监督数据的形态为,其中/>,由k=1,…,K一共K个样本物体的样本初始轨迹组成。每个样本物体的初始轨迹由t个轨迹点组成,其中为第i个样本真实轨迹里的第k个样本物体的t个初始轨迹点,为对应标注好的样本真实轨迹的t个真实轨迹点。本实施例基于所述目标轨迹和所述样本物体的真实轨迹计算目标损失函数及其梯度,并使用所述目标损失函数及其梯度对预设的神经网络模型进行训练,得到轨迹生成模型,其中,所述真实轨迹为满足轨迹约束条件的轨迹。在一种实现方式中,本实施例还可对所述初始轨迹数据中的样本真实轨迹进行替换,并使用替换后的初始轨迹数据对所述轨迹生成模型进行训练。具体地,本实施例在轨迹生成模型的有监督学习训练阶段,为增加轨迹生成的冲突协调能力以及鲁棒性,可扩展已有的监督数据/>。对其中的样本真实轨迹进行难度增强变换,以增强轨迹生成模型对次优轨迹、存在问题轨迹的改进能力。例如,如把第i个样本真实轨迹里的第k个样本物体的轨迹/>为对应标注好的样本真实轨迹的t个真实轨迹点,用其他有问题的轨迹点替换(如跟环境或跟其他移动物体有冲突的轨迹点),然后把新形成的轨迹作为初始轨迹数据,与已有样本真实轨迹并集形成新的初始轨迹数据:/>,并使用新的初始轨迹数据进行轨迹生成模型的增强训练,从而提高轨迹生成模型的鲁棒性。
在无监督学习的训练方法中,在针对环境冲突损失函数、轨迹间冲突损失函数、轨迹性能损失函数、物理约束损失函数来进行轨迹生成模型的训练时,本实施例采用无监督学习的训练方案来训练轨迹生成模型。此时,输入至神经网络模型中的初始轨迹数据不包括样本真实轨迹,因此,本实施例可将所述环境冲突损失函数、所述轨迹间冲突损失函数、所述轨迹性能损失函数以及所述物理约束损失函数进行加权求和,得到目标损失函数;然后基于所述目标损失函数并通过优化的方法对所述神经网络模型中的向量序列变换器进行训练,训练后的向量序列变换器用于将高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列。
基于本实施例所训练的轨迹生成模型包括:轨迹嵌入器、向量序列变换器以及轨迹解码器。因此,当将至少一个移动物体的初始轨迹数据输入至轨迹生成模型后,该轨迹生成模型中的轨迹嵌入器就会将轨迹关联信息嵌入至所述初始轨迹数据,并对已嵌入所述轨迹关联信息的初始轨迹数据进行高维语义向量空间表示。由于本实施例的初始轨迹数据为至少一个移动物体的轨迹点。轨迹点包括起始轨迹点和终点轨迹点,该轨迹点包括时间信息和空间坐标,轨迹点的时间信息和空间坐标具有一定的对应关系。所述空间坐标为三维的空间坐标,包括一个物体的三维坐标或者一个物体的多个关键点的三维坐标。因此,该轨迹生成模型可对该初始轨迹数据的时空-空间四维坐标隐式映射至高维向量,实现时空坐标到高维向量的转换,得到高维嵌入向量序列。
本实施例的轨迹生成模型还包括轨迹优化器,本实施例还可利用所述轨迹优化器对所述样本真实轨迹中的样本初始轨迹进行优化,并使用优化后的样本作为真实目标轨迹来对所述轨迹生成模型进行训练。
在具体应用时,本实施例的轨迹解码器可为全连接网络。因此,基于上述对于轨迹嵌入器、向量序列变换器以及轨迹解码器的训练,得到本实施例的轨迹生成器。本实施例的轨迹生成器可保证输出的目标轨迹至少满足如下条件中的任意一个:1)当前物体与环境没有碰撞;2)多个移动物体之间没有碰撞;3)多个移动物体与其他移动物体没有碰撞。因此,本实施例训练出的轨迹生成模型可同时应用在轨迹的预测、规划、冲突协调等问题。若所述轨迹生成模型应用于轨迹规划或者轨迹冲突协调,则输出的目标轨迹需要满足以上三个要求。如果该轨迹生成模型用于轨迹的预测,该方法依据对移动物体性质的判断,输出的目标轨迹在终点前满足以上三个要求外,还需进一步满足目标轨迹的终点轨迹点与环境或者其他物体没有碰撞。
步骤S200、基于所述轨迹生成模型,将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列。
由于本实施例的轨迹生成模型中的向量序列变换器是基于transformer的sequence的概率模型以高维嵌入向量序列需满足轨迹约束条件进行训练得到。具体地,本实施例的轨迹生成模型将所述轨迹关联信息嵌入至所述初始轨迹数据,以实现对所述初始轨迹数据进行语义表示,并进行高维向量空间表示,得到了高维嵌入向量序列。而轨迹关联信息至少包括轨迹任务信息、物体属性信息、运动约束信息以及与环境障碍物的关系信息的其中一个。所述轨迹任务信息包括:起始轨迹点、途径点、终点轨迹点,载物质量、载物大小以及耗能情况;所述物体属性信息包括:移动物体的速度、加速度、质量、姿态以及安全距离。所述物体属性信息可根据轨迹任务信息进行调整,例如移动物体的安全距离可根据移动物体的大小、完成的轨迹任务来确定。运动约束信息包含:移动物体的速度约束、加速度约束、运动学约束、动力学等约束。与环境障碍物的关系信息:移动物体与环境障碍物的距离(即轨迹点与环境障碍物表面的最短距离)以及与其他移动物体的距离。因此,当将轨迹关联信息与对应的任务、与环境的关系、与其他移动物体的关系、与速度、加速度、运动学约束、动力学约束等与轨迹生成、规划、冲突协调相关的意义嵌入轨迹的高维表示,轨迹生成模型就可以过transformer的注意力机制,学会了嵌入高维向量的轨迹关联信息包括轨迹任务信息、物体本身的属性信息、运动约束信息、与环境障碍物的关系信息等其他信息。再通过隐藏在transformer的sequence的概率模型保证输出目标轨迹高维向量序列sequence满足轨迹规划条件或轨迹预测条件的概率Pr(sequence|如满足无碰撞等要求)。也就是确定所述高维嵌入向量序列中每一个高维向量匹配所述轨迹约束条件的概率信息。然后,基于所述概率信息,从所述高维嵌入向量序列中筛选出满足所述轨迹约束条件的高维向量,得到所述目标轨迹高维向量序列。
步骤S300、基于所述轨迹生成模型,对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。
当得到目标轨迹高维向量序列后,轨迹生成模型可基于轨迹解码器来将目标轨迹高维向量序列降维解码到四维坐标,生成目标轨迹。生成的目标轨迹即可用于对多个移动物体分别进行轨迹预测、规划或轨迹冲突协调。因在步骤200中轨迹生成模型在转换成满足轨迹约束条件的目标轨迹高维向量序列的过程中,隐式考虑轨迹点本身时空坐标与轨迹关联信息,即轨迹生成模型在转换成目标轨迹高维向量序列时已同时隐式考虑了移动物体在一段时间内的空间坐标需满足轨迹相关信息的条件,不仅是移动物体本身的属性信息、运动约束信息、与环境障碍物的关系信息,还可以包括其他信息。因此轨迹生成模型通过降维解码(decoding)过程,可以得到满足轨迹预测、轨迹规划、冲突协调要求的单个或多个移动物体的轨迹。
由于通过前述的轨迹生成方法,只能大概率输出满足轨迹约束条件的目标轨迹,但不能完全保证在物理现实条件中可行。因此,本实施例中的轨迹生成模型中还包括轨迹优化器,用于对所述目标轨迹的空间坐标进行迭代更新,以得到目标优化轨迹。也就是将满足条件的单个或多个移动物体轨迹的生成过程转为一个优化问题。
以空中交通的无人机为例,空中飞行体系中无人机是重要且数量最庞大的参与主体,同时飞行器的运行环境处于一个复杂且开放性的环境中,在这样的环境下对多机轨迹预测、规划、冲突协调的要求不仅仅在于能够为小批量的无人机实现轨迹预测、规划、冲突协调。本实施例利用深度神经网络实现多无人机的目标轨迹生成,用单一模型同时解决轨迹的预测、规划与冲突协调问题,能够快速生成高效的轨迹方案。相比于传统的搜索和优化算法,能够大幅度提高规划速度,适应大规模无人机应用的需求。本实施例充分利用大量的训练数据,对空中飞行场景下的飞行需求进行学习和模式识别,得到更准确的轨迹规划结果。相较于传统方法中可能存在的规划误差,本实施例能够提供更精确的轨迹规划,提高任务执行的准确性。同时本实施例技术方案基于的深度神经网络能够学习和适应复杂环境的特征和规律,使得多无人机在空中交通中能够更好地规划轨迹,提高任务执行效率和安全性。另一方面,由于本实施例基于深度神经网络,具备良好的扩展性和灵活性,在未来它可以适应不同类型的无人机任务和需求,并且可以通过训练来不断优化和适配,满足空中交通中的多样化应用场景的需求,并应用于多无人机轨迹冲突协调的任务中,有利于实现大量及大批量移动物体存在冲突的轨迹进行协调和冲突协调的功能。这些特性将更好的支撑空中交通系统,保证空中交通系统安全稳定高效的运行。
基于上述实施例,本发明提供一种基于神经网络的轨迹生成装置,如图6所示,所述装置包括:轨迹嵌入模块10、向量序列变换模块20以及目标轨迹输出模块30。具体地,所述坐标嵌入模块10,用于获取至少一个移动物体的初始轨迹数据,基于已训练的轨迹生成模型对所述初始轨迹数据进行高维语义向量空间表示,得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的初始轨迹点序列的轨迹点,所述轨迹点包括时间信息和空间坐标。所述向量序列变换模块20,用于基于所述轨迹生成模型,将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列。所述目标轨迹输出模块30,用于基于所述轨迹生成模型,对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。
本实施例的基于轨迹生成模型的轨迹生成装置中各个模块的工作原理与上述方法实施例中各个步骤的原理相同,此处不再赘述。
基于上述实施例,本发明还提供了一种终端,所述终端的原理框图可以如图7所示。终端可以包括一个或多个处理器100(图7中仅示出一个),存储器101以及存储在存储器101中并可在一个或多个处理器100上运行的计算机程序102,例如,基于神经网络的轨迹生成程序。一个或多个处理器100执行计算机程序102时可以实现基于轨迹生成模型的轨迹生成方法以及轨迹生成模型的训练方法的实施例中的各个步骤。或者,一个或多个处理器100执行计算机程序102时可以实现基于轨迹生成模型的轨迹生成方法以及轨迹生成模型的训练方法的实施例中各模块/单元的功能,此处不作限制。
在一个实施例中,所称处理器100可以是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在一个实施例中,存储器101可以是电子设备的内部存储单元,例如电子设备的硬盘或内存。存储器101也可以是电子设备的外部存储设备,例如电子设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,存储器101还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器101用于存储计算机程序以及终端所需的其他程序和数据。存储器101还可以用于暂时地存储已经输出或者将要输出的数据。
本领域技术人员可以理解,图7中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的终端的限定,具体的终端以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、运营数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双运营数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (20)
1.一种轨迹生成模型,其特征在于,所述轨迹生成模型包括:
轨迹嵌入器,所述轨迹嵌入器用于对至少一个移动物体的初始轨迹数据进行高维语义向量空间表示,以得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标;
向量序列变换器,所述向量序列变换器用于将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列;
轨迹解码器,所述轨迹解码器用于对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。
2.根据权利要求1所述的轨迹生成模型,其特征在于,所述空间坐标为三维的空间坐标,包括一个物体的三维坐标或者一个物体的多个关键点的三维坐标。
3.根据权利要求1所述的轨迹生成模型,其特征在于,所述轨迹嵌入器用于对至少一个移动物体的初始轨迹数据进行高维语义向量空间表示,包括:
将轨迹关联信息嵌入至所述初始轨迹数据,并对已嵌入所述轨迹关联信息的初始轨迹数据进行高维语义向量空间表示;
所述轨迹关联信息至少包括轨迹任务信息、物体属性信息、运动约束信息以及与环境障碍物的关系信息的其中一个。
4.根据权利要求3所述的轨迹生成模型,其特征在于,所述轨迹生成模型还包括:
轨迹优化器,所述轨迹优化器用于对所述目标轨迹的空间坐标进行迭代更新,以得到目标优化轨迹。
5.根据权利要求4所述的轨迹生成模型,其特征在于,所述轨迹优化器用于对所述目标轨迹的空间坐标进行迭代更新,包括:
基于所述目标轨迹、所述轨迹关联信息、目标损失函数对所述目标轨迹的空间坐标进行优化更新,得到满足所述目标损失函数要求的轨迹坐标;
所述目标损失函数至少包括环境冲突损失函数、轨迹间冲突损失函数、轨迹性能损失函数以及物理约束损失函数的其中一个损失函数;
其中,所述环境冲突损失函数用于计算生成的目标轨迹和环境碰撞的测度,所述轨迹间冲突损失函数用于计算生成的多个目标轨迹之间相互碰撞的测度,所述轨迹性能损失函数用于计算生成的目标轨迹的性能指标,所述物理约束损失函数用于计算生成的目标轨迹与物理学约束间的差距。
6.一种基于权利要求1-5任一项所述的轨迹生成模型的轨迹生成方法,其特征在于,所述方法包括:
获取至少一个移动物体的初始轨迹数据,基于已训练的轨迹生成模型对所述初始轨迹数据进行高维语义向量空间表示,得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标;
基于所述轨迹生成模型,将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列;
基于所述轨迹生成模型,对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。
7.根据权利要求6所述的基于轨迹生成模型的轨迹生成方法,其特征在于,所述获取至少一个移动物体的初始轨迹数据,包括:
所述初始轨迹数据为至少一个移动物体的起始轨迹点;
获取至少一个移动物体的起始轨迹点,并基于所述起始轨迹点进行单步轨迹点预测,得到下一个轨迹点;
基于下一个轨迹点重复进行单步轨迹点预测,直至生成所述初始轨迹数据。
8.根据权利要求6所述的基于轨迹生成模型的轨迹生成方法,其特征在于,所述获取至少一个移动物体的初始轨迹数据,包括:
所述初始轨迹数据为至少一个移动物体的起始轨迹点与终点轨迹点;
分别获取至少一个移动物体的起始轨迹点与终点轨迹点,并在三维坐标空间中,对所述起始轨迹点与所述终点轨迹点之间进行采样,得到所述起始轨迹点与所述终点轨迹点之间的连线;
在一维时间戳信息层面进行采样,得到所述连线上各点对应的时间戳信息;
分别将所述时间戳信息和所述连线上的各个三维坐标点对应组合,得到初始轨迹数据。
9.根据权利要求6所述的基于轨迹生成模型的轨迹生成方法,其特征在于,所述获取至少一个移动物体的初始轨迹数据,包括:
所述初始轨迹数据为至少一个移动物体的起始轨迹点、中途轨迹点与终点轨迹点;
获取至少一个移动物体的起始轨迹点、中途轨迹点与终点轨迹点;
对所述起始轨迹点、所述中途轨迹点进行分段连线,对所述中途轨迹点、所述终点轨迹点进行分段连线,并通过适当采样的方式获得其他轨迹点,得到所述初始轨迹数据。
10.根据权利要求6所述的基于轨迹生成模型的轨迹生成方法,其特征在于,所述基于所述轨迹生成模型,将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列,包括:
基于所述轨迹生成模型,确定所述高维嵌入向量序列中每一个高维向量匹配所述轨迹约束条件的概率信息;
基于所述概率信息,从所述高维嵌入向量序列中筛选出满足所述轨迹约束条件的高维向量,得到所述目标轨迹高维向量序列。
11.根据权利要求10所述的基于轨迹生成模型的轨迹生成方法,其特征在于,若所述轨迹生成方法应用于轨迹规划或者轨迹冲突协调,则所述轨迹约束条件至少包括当前物体与环境没有碰撞、多个移动物体之间没有碰撞、多个移动物体与移动物体没有碰撞的其中一个。
12.根据权利要求11所述的基于轨迹生成模型的轨迹生成方法,其特征在于,若所述轨迹生成方法应用于轨迹规划,则所述轨迹约束条件还包括:所述目标轨迹的终点轨迹点与环境或者其他物体没有碰撞。
13.根据权利要求6所述的基于轨迹生成模型的轨迹生成方法,其特征在于,所述方法还包括:
基于所述轨迹生成模型对所述目标轨迹的空间坐标进行迭代更新,以得到目标优化轨迹。
14.一种轨迹生成模型的训练方法,其特征在于,所述训练方法包括:
将初始轨迹数据输入预设的神经网络模型;
所述预设的神经网络模型将轨迹关联信息嵌入到所述初始轨迹数据后得到高维嵌入向量序列,并进一步根据所述高维嵌入向量序列生成目标轨迹高维向量序列,再对所述目标轨迹高维向量序列进行降维解码以输出目标轨迹;
基于所述目标轨迹通过目标损失函数对预设的神经网络模型进行训练,得到已训练的轨迹生成模型;
其中,所述轨迹关联信息至少包括轨迹任务信息、物体属性信息、运动约束信息以及与环境障碍物的关系信息的其中一个;
所述初始轨迹数据为至少一个移动物体的轨迹点,所述轨迹点包括时间信息和空间坐标。
15.根据权利要求14所述的轨迹生成模型的训练方法,其特征在于,所述轨迹生成模型包括轨迹嵌入器、向量序列变换器以及轨迹解码器,所述基于目标轨迹通过目标损失函数对预设的神经网络模型进行训练,得到已训练的轨迹生成模型,包括:
基于所述轨迹关联信息,确定环境冲突损失函数、轨迹间冲突损失函数、轨迹性能损失函数以及物理约束损失函数,所述环境冲突损失函数用于计算生成的目标轨迹和环境碰撞的测度,所述轨迹间冲突损失函数用于计算生成的多个目标轨迹之间相互碰撞的测度,所述轨迹性能损失函数用于计算生成的目标轨迹的性能指标,所述物理约束损失函数用于计算生成的目标轨迹与物理学约束间的差距;
将所述环境冲突损失函数、所述轨迹间冲突损失函数、所述轨迹性能损失函数以及所述物理约束损失函数进行加权求和,得到目标损失函数;
基于所述目标损失函数并通过优化的方法对所述神经网络模型中的向量序列变换器进行训练,训练后的向量序列变换器用于将高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列。
16.根据权利要求15所述的轨迹生成模型的训练方法,其特征在于,所述训练方法还包括:
所述初始轨迹数据包括样本真实轨迹;所述样本真实轨迹是至少一个样本物体的样本初始轨迹与满足约束条件的轨迹的映射对;
将所述样本初始轨迹输入所述神经网络模型后输出目标轨迹;
所述目标损失函数包括匹配损失函数,用于计算生成的目标轨迹和样本真实轨迹之间的偏差;
基于所述目标轨迹和所述样本物体的真实轨迹计算目标损失函数及其梯度,并使用所述目标损失函数及其梯度对预设的神经网络模型进行训练,得到已训练的轨迹生成模型,其中,所述真实轨迹为满足轨迹约束条件的轨迹。
17.根据权利要求16所述的基于轨迹生成模型的训练方法,其特征在于,所述轨迹生成模型还包括轨迹优化器,所述训练方法还包括:
利用所述轨迹优化器对所述样本真实轨迹中的样本初始轨迹进行优化,并使用优化后的样本作为真实目标轨迹对所述轨迹生成模型进行训练。
18.一种基于轨迹生成模型的轨迹生成装置,其特征在于,所述轨迹生成装置包括:
轨迹嵌入模块,用于获取至少一个移动物体的初始轨迹数据,基于已训练的轨迹生成模型对所述初始轨迹数据进行高维语义向量空间表示,得到高维嵌入向量序列,其中,所述初始轨迹数据为至少一个移动物体的初始轨迹点序列的轨迹点,所述轨迹点包括时间信息和空间坐标;
向量序列变换模块,用于基于所述轨迹生成模型,将所述高维嵌入向量序列转换成满足轨迹约束条件的目标轨迹高维向量序列;
目标轨迹输出模块,用于基于所述轨迹生成模型,对所述目标轨迹高维向量序列进行降维解码,得到至少一个移动物体的目标轨迹。
19.一种终端,其特征在于,所述终端包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的基于神经网络的轨迹生成程序,所述处理器执行基于神经网络的轨迹生成程序时,实现如权利要求6-13任一项所述的基于轨迹生成模型的轨迹生成方法的步骤或者实现如权利要求14-17任一项所述的轨迹生成模型的训练方法的步骤。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于神经网络的轨迹生成程序,所述基于神经网络的轨迹生成程序被处理器执行时,实现如权利要求6-13任一项所述的基于轨迹生成模型的轨迹生成方法的步骤或者实现如权利要求14-17任一项所述的轨迹生成模型的训练方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311815492.5A CN117475090B (zh) | 2023-12-27 | 2023-12-27 | 一种轨迹生成模型、轨迹生成方法、装置、终端及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311815492.5A CN117475090B (zh) | 2023-12-27 | 2023-12-27 | 一种轨迹生成模型、轨迹生成方法、装置、终端及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117475090A true CN117475090A (zh) | 2024-01-30 |
CN117475090B CN117475090B (zh) | 2024-06-11 |
Family
ID=89631563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311815492.5A Active CN117475090B (zh) | 2023-12-27 | 2023-12-27 | 一种轨迹生成模型、轨迹生成方法、装置、终端及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117475090B (zh) |
Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040024527A1 (en) * | 2002-07-30 | 2004-02-05 | Patera Russell Paul | Vehicular trajectory collision conflict prediction method |
CN108256233A (zh) * | 2018-01-18 | 2018-07-06 | 中国第汽车股份有限公司 | 基于驾驶员风格的智能车轨迹规划及跟踪方法和系统 |
CN111339867A (zh) * | 2020-02-18 | 2020-06-26 | 广东工业大学 | 一种基于生成对抗网络的行人轨迹预测方法 |
CN111497863A (zh) * | 2019-01-30 | 2020-08-07 | 斯特拉德视觉公司 | 基于轨迹的行动分析判断车辆模式是否变更的方法和装置 |
CN111750887A (zh) * | 2020-06-11 | 2020-10-09 | 上海交通大学 | 降低事故严重程度的无人驾驶车辆轨迹规划方法及系统 |
CN111831010A (zh) * | 2020-07-15 | 2020-10-27 | 武汉大学 | 一种基于数字空间切片的无人机避障飞行方法 |
CN112348293A (zh) * | 2021-01-07 | 2021-02-09 | 北京三快在线科技有限公司 | 一种障碍物的轨迹预测方法及装置 |
CN112581795A (zh) * | 2020-12-16 | 2021-03-30 | 东南大学 | 一种基于视频的船桥及船间碰撞实时预警方法与系统 |
US20210201504A1 (en) * | 2019-12-31 | 2021-07-01 | Baidu Usa Llc | Vehicle trajectory prediction model with semantic map and lstm |
CN113269114A (zh) * | 2021-06-04 | 2021-08-17 | 北京易航远智科技有限公司 | 一种基于多隐变量预测器及关键点的行人轨迹预测方法 |
CN113538506A (zh) * | 2021-07-23 | 2021-10-22 | 陕西师范大学 | 基于全局动态场景信息深度建模的行人轨迹预测方法 |
CN113658214A (zh) * | 2021-08-16 | 2021-11-16 | 北京百度网讯科技有限公司 | 轨迹预测方法、碰撞检测方法、装置、电子设备及介质 |
US20220011122A1 (en) * | 2020-07-09 | 2022-01-13 | Beijing Tusen Weilai Technology Co., Ltd. | Trajectory prediction method and device |
CN114997307A (zh) * | 2022-05-31 | 2022-09-02 | 中国第一汽车股份有限公司 | 一种轨迹预测方法、装置、设备及存储介质 |
CN115049009A (zh) * | 2022-06-21 | 2022-09-13 | 长三角信息智能创新研究院 | 基于语义融合表征的轨迹预测方法 |
CN115547040A (zh) * | 2022-09-19 | 2022-12-30 | 河南大学 | 安全势场下基于informer神经网络的驾驶行为预测方法 |
CN115841080A (zh) * | 2022-12-19 | 2023-03-24 | 中国矿业大学 | 多视图动态时空语义嵌入的露天矿卡车运输时间预测方法 |
CN116311905A (zh) * | 2023-01-31 | 2023-06-23 | 重庆理工大学 | 一种基于博弈论的无信号右转交叉口行人轨迹预测方法 |
CN116645395A (zh) * | 2023-01-09 | 2023-08-25 | 山东新一代信息产业技术研究院有限公司 | 一种机器人巡检目标的轨迹预测方法、装置、设备及介质 |
CN116910484A (zh) * | 2023-08-24 | 2023-10-20 | 驭势科技(北京)有限公司 | 轨迹预测方法、装置、电子设备和存储介质 |
CN117035142A (zh) * | 2022-08-29 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 车辆碰撞检测方法、装置、计算机设备和存储介质 |
CN117141518A (zh) * | 2023-09-13 | 2023-12-01 | 厦门大学 | 一种基于意图感知时空注意网络的车辆轨迹预测方法 |
CN117173931A (zh) * | 2023-09-18 | 2023-12-05 | 合肥湛达智能科技有限公司 | 一种基于图神经网络的人与非机动车碰撞预判方法及系统 |
-
2023
- 2023-12-27 CN CN202311815492.5A patent/CN117475090B/zh active Active
Patent Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040024527A1 (en) * | 2002-07-30 | 2004-02-05 | Patera Russell Paul | Vehicular trajectory collision conflict prediction method |
CN108256233A (zh) * | 2018-01-18 | 2018-07-06 | 中国第汽车股份有限公司 | 基于驾驶员风格的智能车轨迹规划及跟踪方法和系统 |
CN111497863A (zh) * | 2019-01-30 | 2020-08-07 | 斯特拉德视觉公司 | 基于轨迹的行动分析判断车辆模式是否变更的方法和装置 |
US20210201504A1 (en) * | 2019-12-31 | 2021-07-01 | Baidu Usa Llc | Vehicle trajectory prediction model with semantic map and lstm |
CN111339867A (zh) * | 2020-02-18 | 2020-06-26 | 广东工业大学 | 一种基于生成对抗网络的行人轨迹预测方法 |
CN111750887A (zh) * | 2020-06-11 | 2020-10-09 | 上海交通大学 | 降低事故严重程度的无人驾驶车辆轨迹规划方法及系统 |
US20220011122A1 (en) * | 2020-07-09 | 2022-01-13 | Beijing Tusen Weilai Technology Co., Ltd. | Trajectory prediction method and device |
CN111831010A (zh) * | 2020-07-15 | 2020-10-27 | 武汉大学 | 一种基于数字空间切片的无人机避障飞行方法 |
CN112581795A (zh) * | 2020-12-16 | 2021-03-30 | 东南大学 | 一种基于视频的船桥及船间碰撞实时预警方法与系统 |
CN112348293A (zh) * | 2021-01-07 | 2021-02-09 | 北京三快在线科技有限公司 | 一种障碍物的轨迹预测方法及装置 |
CN113269114A (zh) * | 2021-06-04 | 2021-08-17 | 北京易航远智科技有限公司 | 一种基于多隐变量预测器及关键点的行人轨迹预测方法 |
CN113538506A (zh) * | 2021-07-23 | 2021-10-22 | 陕西师范大学 | 基于全局动态场景信息深度建模的行人轨迹预测方法 |
CN113658214A (zh) * | 2021-08-16 | 2021-11-16 | 北京百度网讯科技有限公司 | 轨迹预测方法、碰撞检测方法、装置、电子设备及介质 |
CN114997307A (zh) * | 2022-05-31 | 2022-09-02 | 中国第一汽车股份有限公司 | 一种轨迹预测方法、装置、设备及存储介质 |
CN115049009A (zh) * | 2022-06-21 | 2022-09-13 | 长三角信息智能创新研究院 | 基于语义融合表征的轨迹预测方法 |
CN117035142A (zh) * | 2022-08-29 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 车辆碰撞检测方法、装置、计算机设备和存储介质 |
CN115547040A (zh) * | 2022-09-19 | 2022-12-30 | 河南大学 | 安全势场下基于informer神经网络的驾驶行为预测方法 |
CN115841080A (zh) * | 2022-12-19 | 2023-03-24 | 中国矿业大学 | 多视图动态时空语义嵌入的露天矿卡车运输时间预测方法 |
CN116645395A (zh) * | 2023-01-09 | 2023-08-25 | 山东新一代信息产业技术研究院有限公司 | 一种机器人巡检目标的轨迹预测方法、装置、设备及介质 |
CN116311905A (zh) * | 2023-01-31 | 2023-06-23 | 重庆理工大学 | 一种基于博弈论的无信号右转交叉口行人轨迹预测方法 |
CN116910484A (zh) * | 2023-08-24 | 2023-10-20 | 驭势科技(北京)有限公司 | 轨迹预测方法、装置、电子设备和存储介质 |
CN117141518A (zh) * | 2023-09-13 | 2023-12-01 | 厦门大学 | 一种基于意图感知时空注意网络的车辆轨迹预测方法 |
CN117173931A (zh) * | 2023-09-18 | 2023-12-05 | 合肥湛达智能科技有限公司 | 一种基于图神经网络的人与非机动车碰撞预判方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117475090B (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pfeiffer et al. | A data-driven model for interaction-aware pedestrian motion prediction in object cluttered environments | |
Casas et al. | Implicit latent variable model for scene-consistent motion forecasting | |
Xin et al. | Intention-aware long horizon trajectory prediction of surrounding vehicles using dual LSTM networks | |
Lefkopoulos et al. | Interaction-aware motion prediction for autonomous driving: A multiple model kalman filtering scheme | |
Mousavi et al. | Traffic light control using deep policy‐gradient and value‐function‐based reinforcement learning | |
Liu et al. | Deep instance segmentation with automotive radar detection points | |
Liu et al. | A survey on deep-learning approaches for vehicle trajectory prediction in autonomous driving | |
Gindele et al. | Learning context sensitive behavior models from observations for predicting traffic situations | |
CN113110592A (zh) | 一种无人机避障与路径规划方法 | |
Käfer et al. | Recognition of situation classes at road intersections | |
Gostar et al. | Multi-Bernoulli sensor-selection for multi-target tracking with unknown clutter and detection profiles | |
Akan et al. | Stretchbev: Stretching future instance prediction spatially and temporally | |
US20230038673A1 (en) | Sequential pedestrian trajectory prediction using step attention for collision avoidance | |
CN114155270A (zh) | 行人轨迹预测方法、装置、设备及存储介质 | |
Zernetsch et al. | A holistic view on probabilistic trajectory forecasting–case study. cyclist intention detection | |
Huang et al. | Diversity-aware vehicle motion prediction via latent semantic sampling | |
Wang et al. | Vessel trajectory prediction based on spatio-temporal graph convolutional network for complex and crowded sea areas | |
Lin et al. | Research on UUV obstacle avoiding method based on recurrent neural networks | |
CN117475090B (zh) | 一种轨迹生成模型、轨迹生成方法、装置、终端及介质 | |
Zhou et al. | Sa-sgan: A vehicle trajectory prediction model based on generative adversarial networks | |
CN116523002A (zh) | 多源异构数据的动态图生成对抗网络轨迹预测方法和系统 | |
CN116080681A (zh) | 基于循环卷积神经网络的周车行为识别与轨迹预测方法 | |
Dulian et al. | Multi-modal anticipation of stochastic trajectories in a dynamic environment with conditional variational autoencoders | |
Dewangan et al. | UAP-BEV: Uncertainty Aware Planning Using Bird's Eye View Generated From Surround Monocular Images | |
Chen et al. | Towards bio-inspired place recognition over multiple spatial scales |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |