CN116910538A - 一种轨迹预测模型训练方法及系统 - Google Patents
一种轨迹预测模型训练方法及系统 Download PDFInfo
- Publication number
- CN116910538A CN116910538A CN202310731530.2A CN202310731530A CN116910538A CN 116910538 A CN116910538 A CN 116910538A CN 202310731530 A CN202310731530 A CN 202310731530A CN 116910538 A CN116910538 A CN 116910538A
- Authority
- CN
- China
- Prior art keywords
- track
- neural network
- network model
- loss value
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000003062 neural network model Methods 0.000 claims abstract description 142
- 230000006870 function Effects 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000033001 locomotion Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 4
- 239000000758 substrate Substances 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种轨迹预测模型训练方法及系统,该方法包括:将历史轨迹输入第一神经网络模型并输出第一预估轨迹,第一神经网络模型包含运动学参数约束,其用于轨迹预测;计算实际轨迹和第一预估轨迹的第一损失值;如果第一损失值低于设定的第一阈值,则停止训练第一神经网络模型,否则根据第一损失值,更新第一神经网络模型的权重参数后继续训练第一神经网络模型。其中,对第一损失值计算时,基于实际轨迹的几何参数对轨迹上的点赋予损失值权重。本申请提出的技术方案,将轨迹的几何参数用于损失函数的计算,提升神经网络模型训练的收敛效率和训练精度,缓解模型输出的预估轨迹准确性不佳的技术问题。
Description
技术领域
本发明涉及目标的检测跟踪技术领域,特别是涉及一种轨迹预测模型训练方法及系统。
背景技术
轨迹预测是指采用对象的历史轨迹数据,基于历史轨迹建立轨迹预测模型,以轨迹的已知部分作为预测模型的输入,通过模型的推演运算,输出预估的轨迹。现有技术中,将历史轨迹、图片等单个或多个信息作为输入样本,利用预估轨迹与真实轨迹之间的损失函数进行轨迹预测模型优化,从而使用优化后的模型进行轨迹预测。
然而现有技术在构建预估轨迹与真实轨迹之间的损失函数时,对所有样本点做相同的处理,导致预测模型输出的预估轨迹准确性不佳。
因此,如何解决上述问题成为本领域技术人员亟待解决的技术问题。
发明内容
(一)发明目的
本申请的目的是在传统的方法基础上,提供出一种轨迹预测模型训练方法及系统,训练用于轨迹预测的神经网络模型,引入轨迹的几何参数用于损失函数的计算,以缓解预测模型输出的预估轨迹准确性不佳的技术问题。
(二)技术方案
根据一些实施例,本发明的第一方面提供了一种轨迹预测模型训练方法,包括:将历史轨迹输入第一神经网络模型并输出第一预估轨迹,第一神经网络模型包含运动学参数约束,其用于轨迹预测;计算实际轨迹和第一预估轨迹的第一损失值;如果第一损失值低于设定的第一阈值,则停止训练第一神经网络模型,否则根据第一损失值,更新第一神经网络模型的权重参数后继续训练第一神经网络模型;固定第一神经网络模型的权重参数,训练第二神经网络模型,将历史轨迹、第一预估轨迹输入到第二神经网络模型并输出第二预估轨迹,第二神经网络模型包含随机参数约束,其用于估计轨迹预测的随机性;计算第二神经网络模型的第二损失值;如果第二损失值低于设定的第二阈值,则停止训练第二神经网络模型,否则根据第二损失值,更新第二神经网络模型的权重参数后继续训练第二神经网络模型。
在一个实施例中,对第一损失值或计算第二损失值计算时,基于实际轨迹的几何参数对轨迹上的点赋予损失值权重。
在一个实施例中,训练第二神经网络模型的步骤,还包括:将历史轨迹输入第一神经网络模型并输出第一预估轨迹,将第一预估轨迹与实际轨迹的差记为第一预估偏差,将历史轨迹、第一预估偏差作为输入,输入到第二神经网络模型并输出第二预估偏差,将第一预估轨迹加上第二预估偏差得到第二预估轨迹。
在一个实施例中,运动学参数约束包括:驱动轨迹趋向第一目标的运动学参数约束,及驱动轨迹避让第二目标的运动学参数约束。
在一个实施例中,采用均方误差损失函数计算第一损失值或第二损失值,以计算第一神经网络模型或第二神经网络模型权重参数的梯度。
在一个实施例中,采用条件变分自编码机通过语义编码表征随机参数约束,通过第二神经网络模型的训练迭代优化语义编码。
在一个实施例中,几何参数包括轨迹点在参考坐标系下的偏航角、方位角及俯仰角中的至少一个,以描述轨迹点的运动方向。
在一个实施例中,基于实际轨迹的几何参数对轨迹上的点赋予损失值权重的步骤,包括:计算轨迹上点的几何参数;对轨迹上点的几何参数进行聚类,得到不同的类别;根据类别,对轨迹上点赋予损失值权重。
在一个实施例中,基于分段阈值或近邻准则对轨迹上点的几何参数进行聚类,通过距离判据将几何参数划分为不同的类别。
在一个实施例中,在停止训练第一神经网络模型或第二神经网络模型之后,还包括:基于平均替换误差和终点替换误差评测预测轨迹与实际轨迹的误差。
在一个实施例中,如果预测轨迹为多条,根据最小平均替换误差和最小终点替换误差指标评测预测轨迹与实际轨迹的误差。
根据一些实施例,本发明的第二方面提供了一种轨迹预测模型训练系统,包括:第一训练模块,其用于将历史轨迹输入第一神经网络模型并输出第一预估轨迹,第一模型为包含运动学参数约束的神经网络模型,其用于轨迹预测;第一损失计算模块,其用于计算实际轨迹和第一预估轨迹的第一损失值;如果第一损失值低于设定的第一阈值,则停止训练第一神经网络模型,否则根据第一损失值,更新第一神经网络模型的权重参数后继续训练第一神经网络模型。第二训练模块,其用于固定第一神经网络模型的权重参数,训练第二神经网络模型,将历史轨迹、第一预估轨迹输入到第二神经网络模型并输出第二预估轨迹,第二神经网络模型包含随机参数约束,其用于估计轨迹预测的随机性;第二损失计算模块,其用于计算第二神经网络模型的第二损失值;如果第二损失值低于设定的第二阈值,则停止训练第二神经网络模型,否则根据第二损失值,更新第二神经网络模型的权重参数后继续训练第二神经网络模型。
根据一些实施例,本发明的第三方面提供了一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行存储器中的计算机程序,以实现本发明第一方面方法的步骤。
(三)有益效果
本发明的上述技术方案具有如下有益的技术效果:根据第一损失值,更新第一神经网络模型的权重参数后继续训练第一神经网络模型;其中,对第一损失值计算时,基于实际轨迹的几何参数对轨迹上的点赋予损失值权重;从而将轨迹的几何参数用于损失函数的计算,提升第一神经网络模型训练的收敛效率和训练精度,以缓解模型输出的预估轨迹准确性不佳的技术问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一种实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种轨迹预测模型训练方法流程示意图;
图2是本发明实施例提供的轨迹点偏航角原理示意图;
图3是本发明实施例一种轨迹预测模型训练系统的结构示意图;
图4是本发明实施例一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
图1为本发明实施例一种轨迹预测模型训练方法流程示意图。
如图1所示,该方法实施例包括如下四个步骤。
步骤S1:将历史轨迹输入第一神经网络模型并输出第一预估轨迹。其中,第一神经网络模型包含运动学参数约束,其用于轨迹预测。
在一个实施例中,运动学参数约束包括:驱动轨迹趋向第一目标的运动学参数约束,及驱动轨迹避让第二目标的运动学参数约束。
示例性地,驱动轨迹趋向第一目标的运动学参数约束,可以通过定义第一目标牵引力Fg实现,第一目标牵引力Fg表征吸引对象向第一目标运动的力,对象可以为地面的活动目标或者空中的活动目标,对象所经过的点的集合形成对象的轨迹。
其中,pt,表示对象在t时刻的坐标位置和速度,Δt为常数,将T时刻对象的位置设置为第一目标,NN1为第一神经网络模型中表示Fg的部分,通过训练迭代优化从而提高轨迹的预测精度。
示例性地,驱动轨迹避让第二目标的运动学参数约束,可以通过定义第二目标的排斥力Fc实现,第二目标的数量可以是多个。假设Ωt表示对象n在t时刻半径为r邻域内的第二目标集合。若对象n有m个第二目标,则其排斥力其中,
其中a和b为常数,NN2为第一神经网络中表示Fc的部分,sigmoid为激活函数,用于神经网络模型的前向传递。
示例性地,对第一网络模型进行训练的样本数据可以来源于视频,例如视频中轨迹的长度为L帧,以L帧中的前L1帧为历史轨迹、以后面的L-L1帧的实际轨迹作为标签。将L1帧的历史轨迹送入第一神经网络模型,输出预测的第一预估轨迹,第一预估轨迹为L-L1帧的实际轨迹的预测值。
需要进行说明的是,第一神经网络模型还可以分解成两个网络模型,其中一个网络模型用于表征驱动轨迹趋向第一目标的运动学参数约束,另一个模型用于表征驱动轨迹避让第二目标的运动学参数约束,两个模型可以分步骤依次进行训练。
步骤S2:计算训练损失并进行迭代。具体地,计算实际轨迹和第一预估轨迹的第一损失值;如果第一损失值低于设定的第一阈值,则停止训练第一神经网络模型,否则根据第一损失值,更新第一神经网络模型的权重参数后继续训练第一神经网络模型。
在一个实施例中,对第一损失值计算时,基于实际轨迹的几何参数对轨迹上的点赋予损失值权重。
实际轨迹和第一预估轨迹的第一损失值表征实际轨迹和第一预估轨迹的差异,如果第一损失值低于设定的第一阈值,表明第一神经网络模型的预测误差已经在预期的范围内,对第一神经网络模型的训练已经完成。如果第一损失值高于设定的第一阈值,则需要利用神经网络模型的返向传递原理,计算第一损失值关于第一神经网络模型权重参数的梯度,采用梯度下降相关算法来更新模型权重参数,从而不断减少第一损失值,提升模型的预测效果。
在一个实施例中,采用均方误差损失函数计算第一损失值,以计算第一神经网络模型权重参数的梯度。示例性地,如果实际轨迹点的坐标为(x,y),在第一预估轨迹中该点的坐标为(x1,y1),则采用均方误差损失函数计算第一损失值为
基于实际轨迹的几何参数对轨迹上的点赋予损失值权重,具体为根据轨迹几何参数的度量对第一损失值赋予不同的损失值计算权重,例如其中w1为实际轨迹(x,y)处的损失值权重。几何参数反应实际轨迹的复杂程度,使第一神经网络模型在训练过程中更加关注轨迹中变化较大的点或区域,从而更好地学习这些特征,提高轨迹预测的准确性。
在一个实施例中,几何参数包括轨迹点在参考坐标系下的偏航角、方位角及俯仰角中的至少一个,以描述轨迹点的运动方向。参考坐标系可以是以地球为基准的惯性坐标系,也可以是根据指定方向定义的本地坐标系。
需要进行说明的是,偏航角和方位角表示对象在三维空间水平面内的轨迹方向,俯仰角表示对象在三维空间竖直面内的轨迹方向。例如,对象在地球表面上,偏航角和方位角表示东西南北方向上轨迹的相对度量,俯仰角表示竖直高度上轨迹的相对度量。
在一些实施例中,偏航角可以是轨迹点前一点和当前点的运动方向夹角,可以利用偏航角计算条件式θ=arccos(<u,v>/||u||*||v||)计算轨迹点的偏航角;其中u表示前一个轨迹点运动的二维向量,v表示当前轨迹点运动的二维向量,<u,v>表示向量内积,||u||和||v||均表示向量范数。
在一个实施例中,方位角可以是当前轨迹点运动方向与当地正北方向的夹角。在θ=arccos(<u,v>/||u||*||v||)中,将u替换为当地正北方向的单位向量,即可计算得到方位角。
在一个实施例中,俯仰角可以是当前轨迹点运动方向与当地水平方向的夹角。在θ=arccos(<u,v>/||u||*||v||)中,将u替换为当地水平方向的单位向量,即可计算得到俯仰角。
需要进行说明的是,几何参数可以是轨迹点的偏航角、方位角及俯仰角中的一个,也可以两个参数组成的二维向量、或三个参数组成的三维向量,通过不同组合的几何参数,可以度量轨迹在三维空间不同维度的复杂度。
图2是本发明实施例提供的轨迹点偏航角原理示意图。
参考图2,依时间顺序在对象的历史轨迹中采样三个点,获得它们的坐标P1(x1,y1)、P2(x2,y2)和P3(x3,y3)。P2点行人的偏航角为图1中θ,偏航角计算条件式为θ=arccos(<u,v>/||u||*||v||),其中u=[x2-x1,y2-y1],v=[x3-x2,y3-y2],<u,v>表示向量内积,||u||和||v||均表示向量范数。
在一个实施例中,基于实际轨迹的几何参数对轨迹上的点赋予损失值权重的步骤,包括:计算轨迹上点的几何参数;对轨迹上点的几何参数进行聚类,得到不同的类别;根据类别,对轨迹上点赋予损失值权重。
需要进行说明的是,对轨迹上点的几何参数进行聚类,可以将几何参数相近的轨迹点,赋予相同的损失值权重,降低轨迹点几何参数变化量的量化程度,从而提升第一神经网络模型的训练效率。
在一个实施例中,基于分段阈值或近邻准则对轨迹上点的几何参数进行聚类,通过距离判据将几何参数划分为不同的类别。
本申请一个实施例中,一条活动目标的轨迹,其共包含A-E等5个历史轨迹点,位置坐标分别为A(0,0),B(2,2),C(3,2.5),D(1,2),E(2,0.5)。进一步,轨迹起始点A和E设置偏航角度数为0,针对中间轨迹点B、C和D,利用上述的偏航角计算条件式,计算得到各偏航角度数约为:B点:18度;C点:167度;D点:110度。
进一步,基于上述公开的具体实施例可知,分段阈值为60°,基于该分段阈值,按照[0,60度],[60,120]和[120,180]将偏航角划分成三个段位;以及轨迹起始点A和E设置偏航角度数为0,偏航角度数约为:B点:18度;C点:167度;D点:110度;进一步,A-E五个历史轨迹点归到相应的段位,其中,第一级段位包括A、B和E轨迹点,第二级段位包括D轨迹点,第三级段位包括C轨迹点;根据三个段位等级对应设置权重W1、W2、W3;其中,W1对应第一级段位,W2对应第二级段位,W3对应第三级段位。
进一步,利用损失函数加权计算该条轨迹的第一损失值(即实际轨迹与第一预估轨迹的损失值)为:
W1*L(A,A的预估值)+W1*L(B,B的预估值)+W3*L(C,C的预估值)+W2*L(D,D的预估值)+W1*L(E,E的预估值);式中,L(A,A的预估值)表示为实际轨迹点A和A的预估轨迹点之间的损失,W1*L(A,A的预估值)表示为赋予A轨迹点赋予W1权重;可以理解的是,轨迹点B-E均参照轨迹点A的理解。
在一个相似的实施例中,使用紧邻准则进行几何参数聚类,例如将偏航角参数,则轨迹点A、B和E属于一类,C和D属于另一类,从而分别赋予不同的损失值权重。
步骤S3:训练第二神经网络模型。具体地,固定第一神经网络模型的权重参数,训练第二神经网络模型,将历史轨迹、第一预估轨迹输入到第二神经网络模型并输出第二预估轨迹,第二神经网络模型包含随机参数约束,其用于估计轨迹预测的随机性。
需要进行说明的是,第一神经网络模型从运动学的维度对历史轨迹进行预测,而第二神经网络模型则是从随机过程的角度对第一神经网络模型输出的第一预估轨迹进行进一步预估修正,从而提升轨迹预测的精度。在进行第二神经网络模型训练时,不改变第一神经网络模型的权重参数,从而实现对第一神经网络模型和第二神经网络模型的分步训练。
在一个实施例中,训练第二神经网络模型的步骤,还包括:将历史轨迹输入第一神经网络模型并输出第一预估轨迹,将第一预估轨迹与实际轨迹的差记为第一预估偏差,将历史轨迹、第一预估偏差作为输入,输入到第二神经网络模型并输出第二预估偏差,将第一预估轨迹加上第二预估偏差得到第二预估轨迹。
步骤S4:计算第二损失值并进行迭代。具体地,计算第二神经网络模型的第二损失值;如果第二损失值低于设定的第二阈值,则停止训练第二神经网络模型,否则根据第二损失值,更新第二神经网络模型的权重参数后继续训练第二神经网络模型。
在一个实施例中,对计算第二损失值计算时,基于实际轨迹的几何参数对轨迹上的点赋予损失值权重。
在一个实施例中,采用条件变分自编码机通过语义编码表征随机参数约束,通过第二神经网络模型的训练迭代优化语义编码。条件变分自编码机(conditionalvariational auto-encoder,CVAE)通过语义编码的技术手段将轨迹中的随机因素进行编码,再通过训练得到第二预估偏差,第一预估轨迹加上第二预估偏差得到第二预估轨迹,使得第二预估轨迹更逼近实际轨迹。
需要进行说明的是,对第二损失值计算时,也可以采用均方误差损失函数,以计算第二神经网络模型权重参数的梯度。
在一个实施例中,在停止训练第一神经网络模型或第二神经网络模型之后,还包括:基于平均替换误差和终点替换误差评测预测轨迹与实际轨迹的误差。
需要进行说明的是,第一损失值或第二损失值是用于训练过程中的误差迭代,平均替换误差和终点替换误差则是用于评测已训练完成的模型的性能。
在一个实施例中,如果预测轨迹为多条,根据最小平均替换误差和最小终点替换误差评测指标评测预测轨迹与实际轨迹的误差。
图3是本发明实施例的一种轨迹预测模型训练系统的结构示意图。
参考图3,本发明实施例提供的一种轨迹预测模型训练系统,包括以下两个模块。
第一训练模块201,其用于将历史轨迹输入第一神经网络模型并输出第一预估轨迹,第一模型为包含运动学参数约束的神经网络模型,其用于轨迹预测;
第一损失计算模块202,其用于计算实际轨迹和第一预估轨迹的第一损失值;如果第一损失值低于设定的第一阈值,则停止训练第一神经网络模型,否则根据第一损失值,更新第一神经网络模型的权重参数后继续训练第一神经网络模型。
第二训练模块203,其用于固定第一神经网络模型的权重参数,训练第二神经网络模型,将历史轨迹、第一预估轨迹输入到第二神经网络模型并输出第二预估轨迹,第二神经网络模型包含随机参数约束,其用于估计轨迹预测的随机性;
第二损失计算模块204,其用于计算第二神经网络模型的第二损失值;如果第二损失值低于设定的第二阈值,则停止训练第二神经网络模型,否则根据第二损失值,更新第二神经网络模型的权重参数后继续训练第二神经网络模型。
图4是本发明实施例一种电子设备的结构示意图。
参考图4,本发明实施例还提供了一种电子设备。如图4所示,该实施例的电子设备300包括:处理器301、存储器302,以及存储在存储器302中并可在处理器301上运行的程序。处理器301执行程序时实现上述各个轨迹预测模型训练方法实施例中的步骤,例如图1所示的步骤S1至S4。或者,处理器301执行程序时实现上述系统实施例中各模块的功能,例如图3中的模块以实现轨迹预测模型训练系统。
示例性地,所述程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器302中,并由所述处理301器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列程序指令段,该指令段用于描述所述程序在电子设备中的执行过程。例如,所述程序可以被分割为第一训练模块201、第一损失计算模块202、第二训练模块203和第二损失计算模块204。
各模块具体功能如下:第一训练模块201,其用于将历史轨迹输入第一神经网络模型并输出第一预估轨迹,第一模型为包含运动学参数约束的神经网络模型,其用于轨迹预测;第一损失计算模块202,其用于计算实际轨迹和第一预估轨迹的第一损失值;如果第一损失值低于设定的第一阈值,则停止训练第一神经网络模型,否则根据第一损失值,更新第一神经网络模型的权重参数后继续训练第一神经网络模型。第二训练模块203,其用于固定第一神经网络模型的权重参数,训练第二神经网络模型,将历史轨迹、第一预估轨迹输入到第二神经网络模型并输出第二预估轨迹,第二神经网络模型包含随机参数约束,其用于估计轨迹预测的随机性;第二损失计算模块204,其用于计算第二神经网络模型的第二损失值;如果第二损失值低于设定的第二阈值,则停止训练第二神经网络模型,否则根据第二损失值,更新第二神经网络模型的权重参数后继续训练第二神经网络模型。
所述电子设备可以是单片机系统、桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。所述电子设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述示意图仅仅是示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备还可以包括输入输出设备等,输入输出设备与处理器、存储器可以通过总线连接。
所称处理器可以是微控制单元(Microcontroller Unit,MCU),中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分。
所述存储器可用于存储所述程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的程序和/或模块,以及调用存储在存储器内的数据,实现所述轨迹预测模型训练方法及系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例系统装置中的模块可以根据实际需要进行合并、划分和删减。
Claims (13)
1.一种轨迹预测模型训练方法,其特征在于,包括:
将历史轨迹输入第一神经网络模型并输出第一预估轨迹,所述第一神经网络模型包含运动学参数约束,其用于轨迹预测;
计算实际轨迹和所述第一预估轨迹的第一损失值;
如果所述第一损失值低于设定的第一阈值,则停止训练所述第一神经网络模型,否则根据所述第一损失值,更新所述第一神经网络模型的权重参数后继续训练所述第一神经网络模型;
固定所述第一神经网络模型的权重参数,训练第二神经网络模型,将所述历史轨迹、第一预估轨迹输入到第二神经网络模型并输出第二预估轨迹,所述第二神经网络模型包含随机参数约束,其用于估计轨迹预测的随机性;
计算所述第二神经网络模型的第二损失值;
如果所述第二损失值低于设定的第二阈值,则停止训练所述第二神经网络模型,否则根据所述第二损失值,更新所述第二神经网络模型的权重参数后继续训练所述第二神经网络模型。
2.根据权利要求1所述的方法,其特征在于,对所述第一损失值或计算第二损失值计算时,基于所述实际轨迹的几何参数对轨迹上的点赋予损失值权重。
3.根据权利要求1所述的方法,其特征在于,训练所述第二神经网络模型的步骤,还包括:
将所述历史轨迹输入第一神经网络模型并输出第一预估轨迹,将所述第一预估轨迹与实际轨迹的差记为第一预估偏差,将所述历史轨迹、第一预估偏差作为输入,输入到所述第二神经网络模型并输出第二预估偏差,将所述第一预估轨迹加上第二预估偏差得到第二预估轨迹。
4.根据权利要求1所述的方法,其特征在于,所述运动学参数约束包括:
驱动轨迹趋向第一目标的运动学参数约束,及驱动轨迹避让第二目标的运动学参数约束。
5.根据权利要求1所述的方法,其特征在于,
采用均方误差损失函数计算所述第一损失值或第二损失值,以计算所述第一神经网络模型或第二神经网络模型权重参数的梯度。
6.根据权利要求1所述的方法,其特征在于,
采用条件变分自编码机通过语义编码表征所述随机参数约束,通过所述第二神经网络模型的训练迭代优化所述语义编码。
7.根据权利要求2所述的方法,其特征在于,
所述几何参数包括轨迹点在参考坐标系下的偏航角、方位角及俯仰角中的至少一个,以描述所述轨迹点的运动方向。
8.根据权利要求7所述的方法,其特征在于,基于所述实际轨迹的几何参数对轨迹上的点赋予损失值权重的步骤,包括:
计算轨迹上点的几何参数;
对所述轨迹上点的几何参数进行聚类,得到不同的类别;
根据所述类别,对所述轨迹上点赋予损失值权重。
9.根据权利要求8所述的方法,其特征在于,
基于分段阈值或近邻准则对所述轨迹上点的几何参数进行聚类,通过距离判据将所述几何参数划分为不同的类别。
10.根据权利要求1所述的方法,其特征在于,在停止训练所述第一神经网络模型或第二神经网络模型之后,还包括:
基于平均替换误差和终点替换误差评测预测轨迹与所述实际轨迹的误差。
11.根据权利要求10所述的方法,其特征在于,
如果所述预测轨迹为多条,根据最小平均替换误差和最小终点替换误差指标评测所述预测轨迹与实际轨迹的误差。
12.一种轨迹预测模型训练系统,其特征在于,包括:
第一训练模块,其用于将历史轨迹输入第一神经网络模型并输出第一预估轨迹,所述第一模型为包含运动学参数约束的神经网络模型,其用于轨迹预测;
第一损失计算模块,其用于计算实际轨迹和所述第一预估轨迹的第一损失值;如果所述第一损失值低于设定的第一阈值,则停止训练所述第一神经网络模型,否则根据所述第一损失值,更新所述第一神经网络模型的权重参数后继续训练所述第一神经网络模型。
第二训练模块,其用于固定所述第一神经网络模型的权重参数,训练第二神经网络模型,将所述历史轨迹、第一预估轨迹输入到第二神经网络模型并输出第二预估轨迹,所述第二神经网络模型包含随机参数约束,其用于估计轨迹预测的随机性;
第二损失计算模块,其用于计算所述第二神经网络模型的第二损失值;如果所述第二损失值低于设定的第二阈值,则停止训练所述第二神经网络模型,否则根据所述第二损失值,更新所述第二神经网络模型的权重参数后继续训练所述第二神经网络模型。
13.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-11中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310731530.2A CN116910538A (zh) | 2023-06-20 | 2023-06-20 | 一种轨迹预测模型训练方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310731530.2A CN116910538A (zh) | 2023-06-20 | 2023-06-20 | 一种轨迹预测模型训练方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116910538A true CN116910538A (zh) | 2023-10-20 |
Family
ID=88352092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310731530.2A Pending CN116910538A (zh) | 2023-06-20 | 2023-06-20 | 一种轨迹预测模型训练方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116910538A (zh) |
-
2023
- 2023-06-20 CN CN202310731530.2A patent/CN116910538A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113039563B (zh) | 学习生成用于训练神经网络的合成数据集 | |
CN111091708B (zh) | 车辆轨迹预测方法及装置 | |
CN107103754B (zh) | 一种道路交通状况预测方法及系统 | |
Beach et al. | Quantum image processing (quip) | |
CN106204522B (zh) | 对单个图像的联合深度估计和语义标注 | |
JP7273129B2 (ja) | 車線検出方法、装置、電子機器、記憶媒体及び車両 | |
US20240257423A1 (en) | Image processing method and apparatus, and computer readable storage medium | |
CN112734931B (zh) | 一种辅助点云目标检测的方法及系统 | |
US20240249170A1 (en) | Data source correlation techniques for machine learning and convolutional neural models | |
CN113298910A (zh) | 生成交通标志线地图的方法、设备和存储介质 | |
CN114091515A (zh) | 障碍物检测方法、装置、电子设备和存储介质 | |
Doan et al. | Visual localization under appearance change: filtering approaches | |
CN113989574B (zh) | 图像解释方法、图像解释装置、电子设备和存储介质 | |
CN111161238A (zh) | 图像质量评价方法及装置、电子设备、存储介质 | |
CN116958267B (zh) | 位姿处理方法、装置、电子设备及存储介质 | |
CN116977712B (zh) | 基于知识蒸馏的道路场景分割方法、系统、设备及介质 | |
CN110458867B (zh) | 一种基于注意力循环网络的目标跟踪方法 | |
CN117173607A (zh) | 多层级融合多目标跟踪方法、系统及计算机可读存储介质 | |
Li et al. | SRHEN: stepwise-refining homography estimation network via parsing geometric correspondences in deep latent space | |
CN116910538A (zh) | 一种轨迹预测模型训练方法及系统 | |
US20230214453A1 (en) | Training an environment generator of a generative adversarial network (gan) to generate realistic environments that incorporate reinforcement learning (rl) algorithm feedback | |
US20230281843A1 (en) | Generating depth images for image data | |
CN1200397C (zh) | 对象行为建模方法 | |
CN113469204A (zh) | 数据处理方法、装置、设备和计算机存储介质 | |
CN113537258A (zh) | 行动轨迹预测方法、装置、计算机可读介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |