CN114757355B - 轨迹数据集差异性度量方法、系统、设备及存储介质 - Google Patents

轨迹数据集差异性度量方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN114757355B
CN114757355B CN202210364773.2A CN202210364773A CN114757355B CN 114757355 B CN114757355 B CN 114757355B CN 202210364773 A CN202210364773 A CN 202210364773A CN 114757355 B CN114757355 B CN 114757355B
Authority
CN
China
Prior art keywords
track
data set
distribution
vehicle
conditional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210364773.2A
Other languages
English (en)
Other versions
CN114757355A (zh
Inventor
陈宗海
包鹏
王纪凯
戴德云
赵皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202210364773.2A priority Critical patent/CN114757355B/zh
Publication of CN114757355A publication Critical patent/CN114757355A/zh
Application granted granted Critical
Publication of CN114757355B publication Critical patent/CN114757355B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Remote Sensing (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种轨迹数据集差异性度量方法、系统、设备及存储介质,将多轨迹的时空依赖关系形式化表达为条件分布,利用已有车辆轨迹数据估计条件分布密度模型的参数,利用具备解析形式的概率密度分布近似轨迹数据集蕴含的条件分布,并利用基于采样的方法计算条件分布之间的距离,从而度量轨迹数据集的差异性。本发明首次度量多车轨迹数据集中时空依赖关系的差异性,表征了不同交通场景下车辆交互特性和时空依赖关系的差异性,有助于理解和量化不同交通场景的差异性,理解同一交通场景下多车之间时空依赖关系的变化特性和规律,帮助针对不同交通场景和同一时变交通场景进行单独处理和针对性研究。

Description

轨迹数据集差异性度量方法、系统、设备及存储介质
技术领域
本发明涉及轨迹数据集差异度量技术领域,尤其涉及一种轨迹数据集差异性度量方法、系统、设备及存储介质。
背景技术
随着机械化与智能化水平的不断提高,辅助驾驶与智能驾驶逐渐成为研究的热点。在智能驾驶研究中,为了进行驾驶算法的设计和验证,或进行驾驶行为的分析与研究,需要对大量车辆轨迹进行分析,其中最重要的是分析不同交通场景中车辆轨迹之间的差异性。在不同的交通场景中,车辆之间的交互方式不同,从而影响车辆的未来运动轨迹。度量时空依赖关系的变动,对于启发鲁棒的轨迹预测模型设计、智能交通等应用具有重要的意义。
目前,比较轨迹数据之间差异的方法主要包括:
公开号为CN107798346A的中国专利申请《一种基于Fréchet距离阈值的轨迹相似性快速匹配方法》提出了一种在大规模轨迹数据集上基于Fréchet距离阈值的轨迹相似性快速匹配方法。
公开号为CN110991475A中国专利申请《一种基于多维距离度量的移动对象轨迹聚类方法》公开了一种基于多维距离度量的移动对象轨迹聚类方法,从轨迹数据识别关键点,分割原始轨迹数据,生成轨迹段集;构建基于空间距离和时间距离的多维距离度量函数,计算轨迹段间的距离。
公开号为CN111125189A中国专利申请《基于加权实数代价编辑距离的轨迹相似性度量方法》公开了一种基于加权实数代价编辑距离的轨迹相似性度量方法,包括以下步骤:步骤1:将轨迹数据表示成有序的多维实数序列;步骤2:获取两两轨迹点之间的加权欧式距离;步骤3:获取两两轨迹序列之间的加权实数代价编辑距离;步骤4:采用指数函数方法,以0.99为底,以步骤3中的加权实数代价编辑距离为幂数,获取两轨迹序列之间的轨迹相似度,进而得到其他两两轨迹序列之间的轨迹相似度。
公开号为CN111191884A中国专利申请《一种基于数据集距离评价样本集划分质量的方法》公开了一种基于数据集距离评价样本集划分质量的方法,该方法可克服常规基于误差分析有量化、难评价的缺陷,紧紧抓住训练集和测试集需相互独立且来自同一分布这一基本假设,通过对样本间距离矩阵的分解,估计样本集的均值和方差,计算训练集和测试集两个分布之间的距离。
经文献检索分析发现,现有轨迹数据集距离度量方法只能对轨迹进行两两配对度量,或者只能对数据的整体分布进行度量,然而在交通场景中产生的轨迹数据,往往包含动态数目,因此无法使用两两配对进行差异度量。此外,场景中多轨迹之间的时空依赖性本质上是条件分布,然而以上各项专利技术中也并未对此进行度量。
发明内容
本发明的目的是提供一种轨迹数据集差异性度量方法、系统、设备及存储介质,实现了多车轨迹数据集差异性的度量,充分表达了实际多车运动场景中的时空依赖关系的差异,可用于涉及轨迹预测、数据度量以及智能交通等相关科学研究和实际应用。
本发明的目的是通过以下技术方案实现的:
一种轨迹数据集差异性度量方法,包括:
对包含多个车辆轨迹序列的每一轨迹数据集,利用当前选择的目标车辆将所有车辆的轨迹序列进行维度统一,再结合当前选择的目标车辆的历史轨迹序列构造条件向量;
对于每一轨迹数据集,将构造的条件向量作为输入,利用混合密度网络估计条件分布密度模型的参数,由条件分布密度模型结合估计出的参数与所述条件向量估计轨迹数据集中车辆轨迹的时空依赖关系作为轨迹数据集的条件概率密度分布,并结合预先构造的训练损失函数对所述混合密度网络进行训练,获得每一轨迹数据集对应的混合密度网络;其中,轨迹数据集中车辆轨迹的时空依赖关系是指,目标车辆的未来的轨迹受到目标车辆的历史轨迹序列及其周围车辆的历史轨迹序列的影响;
对于待度量的轨迹数据集,分别利用自身对应的混合密度网络估计相应的条件概率密度分布,再使用蒙特卡洛采样的方法计算待度量的轨迹数据集的差异。
一种轨迹数据集差异性度量系统,该系统包括:
针对轨迹数据集的条件向量构造单元,用于对包含多个车辆轨迹序列的每一轨迹数据集,利用当前选择的目标车辆将所有车辆的轨迹序列进行维度统一,再结合当前选择的目标车辆的历史轨迹序列构造条件向量;
条件概率密度分布估计与网络训练单元,用于对于每一轨迹数据集,将构造的条件向量作为输入,利用混合密度网络估计条件分布密度模型的参数,由条件分布密度模型结合估计出的参数与所述条件向量估计轨迹数据集中车辆轨迹的时空依赖关系作为轨迹数据集的条件概率密度分布,并结合预先构造的损失函数对所述混合密度网络进行训练,获得每一轨迹数据集对应的混合密度网络;其中,轨迹数据集中车辆轨迹的时空依赖关系是指,目标车辆的未来的轨迹受到目标车辆的历史轨迹序列及其周围车辆的历史轨迹序列的影响;
差异度量单元,用于对于待度量的轨迹数据集,分别利用自身对应的混合密度网络估计相应的条件概率密度分布,再使用蒙特卡洛采样的方法计算待度量的轨迹数据集的差异。
一种处理设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现前述的方法。
一种可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现前述的方法。
由上述本发明提供的技术方案可以看出,将多轨迹的时空依赖关系形式化表达为条件分布,利用已有车辆轨迹数据估计条件分布密度模型的参数,利用具备解析形式的概率密度分布近似轨迹数据集蕴含的条件分布,并利用基于采样的方法计算条件分布之间的距离,从而度量轨迹数据集的差异性。相较于现有技术,本发明首次度量多车轨迹数据集中时空依赖关系的差异性,表征了不同交通场景下车辆交互特性和时空依赖关系的差异性,有助于理解和量化不同交通场景的差异性,理解同一交通场景下多车之间时空依赖关系的变化特性和规律,帮助针对不同交通场景和同一时变交通场景进行单独处理和针对性研究,可用于涉及轨迹预测、数据度量、迁移学习、终身学习以及智能交通等相关科学研究和实际应用。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种轨迹数据集差异性度量方法的流程图;
图2为本发明实施例提供的混合密度网络的结构示意图;
图3为本发明实施例提供的一种轨迹数据集差异性度量系统的示意图;
图4为本发明实施例提供的一种处理设备的示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
首先对本文中可能使用的术语进行如下说明:
术语“包括”、“包含”、“含有”、“具有”或其它类似语义的描述,应被解释为非排它性的包括。例如:包括某技术特征要素(如原料、组分、成分、载体、剂型、材料、尺寸、零件、部件、机构、装置、步骤、工序、方法、反应条件、加工条件、参数、算法、信号、数据、产品或制品等),应被解释为不仅包括明确列出的某技术特征要素,还可以包括未明确列出的本领域公知的其它技术特征要素。
下面对本发明所提供的一种轨迹数据集差异性度量方法、系统、设备及存储介质进行详细描述。本发明实施例中未作详细描述的内容属于本领域专业技术人员公知的现有技术。本发明实施例中未注明具体条件者,按照本领域常规条件或制造商建议的条件进行。
实施例一
针对当前轨迹数据集距离度量方法无法实现交通场景中多轨迹时空依赖关系度量的缺陷,本发明实施例提供一种轨迹数据集差异性度量方法,它是一种基于条件概率密度分布估计和概率论模型的多轨迹时空依赖性差异度量方法,由于每个交通场景中包含多条车辆轨迹,通过发明提供的方法能够针对多条轨迹构成的场景的整体差异进行两两不同场景的差异度量,可用于交通场景差异性评估、车辆轨迹预测、辅助驾驶、智能交通等相关应用。轨迹数据集的差异核心在于轨迹的时空依赖关系,本发明将其形式化表达为条件分布,并利用具备解析形式的概率密度分布模型近似轨迹数据集蕴含的条件分布。
目前,可以在交通场景中收集多车轨迹,其中目标车辆的未来轨迹受到目标车辆的历史轨迹和周围车辆的历史轨迹影响,这种时空依赖关系可表征为条件分布。记目标车辆历史轨迹序列为其中,(1,2,...,th)代表历史轨迹持续时间,/>和/>分别为u时刻的横坐标和纵坐标,u=1,2,...,th;周围车辆历史轨迹序列为其中n为场景中除目标车辆以外车辆的数量(即后文所称的目标车辆的周围数量)且因场景不同而动态变化;目标车辆未来轨迹序列为/>其中(th+1,th+2,...,th+tf)代表未来轨迹持续时间,则场景中轨迹的时空依赖关系为条件分布/>需要说明的是历史轨迹持续时间与未来轨迹持续时间所包含的时间范围可以根据所需的场景大小自行设定,本发明不做具体的限定。为了估计度量不同轨迹数据集中条件分布/>的差异性,本发明涉及了一种轨迹数据集差异性度量方法,如图1所示,其主要包括如下步骤:
步骤1、对包含多个车辆轨迹序列的每一轨迹数据集,利用当前选择的目标车辆将所有车辆的轨迹序列进行维度统一,再结合当前选择的目标车辆的历史轨迹序列构造条件向量。
本步骤优选实施方式如下:
1)轨迹归一化。
为便于陈述,且不失一般性,以车辆轨迹预测为例,常以待预测目标车辆为中心考虑周围车辆的影响。对于当前选择的目标车辆及其每一周围车辆,均利用目标车辆对自身的轨迹序列进行中心化,再结合所有车辆中心化后的轨迹序列进行归一化。
对于周围车辆l=1,2,...,n和目标车辆e,对自身的轨迹序列进行中心化为目标车辆在th时刻的坐标,轨迹序列/>包含历史轨迹序列与未来轨迹序列,t=th+tf,l'=1,2,...,n,e;之后,结合所有车辆中心化后的轨迹序列进行归一化,表示为:/>其中,/>分别表示周围车辆1、周围车辆n中心化后的轨迹序列,/>表示车辆l'归一化后的轨迹序列,车辆l'包含周围车辆l与目标车辆e,下标1:t,表示从1时刻到t时刻,即涵盖了历史轨迹持续时间与未来轨迹持续时间,归一化后的历史轨迹序列与未来轨迹序列将分别应用于维度统一阶段与混合网络训练阶段。
2)维度统一。
由于场景中存在的车辆数目为动态变化,使得条件分布中的条件向量的维度动态变化,不利于进行条件分布的表达。因此,本发明实施例中,使用拉普拉斯(Laplacian)矩阵进行维度统一,此部分主要使用前述归一化后的周围车辆历史轨迹序列,维度统一的步骤包括:
根据设定的场景大小,从n辆周围车辆中选出nv辆与所述目标车辆最近的周围车辆,并计算邻接矩阵其中,nv≤n;矩阵中的元素aij表示周围车辆i和周围车辆j的历史轨迹的接近程度,两车越接近,则邻接矩阵元素aij越大,计算方式为:
其中,和/>分别为周围车辆i归一化后的k时刻的横坐标和纵坐标,/>和/>分别为周围车辆j归一化后的k时刻的横坐标和纵坐标;/>为随时间的衰减系数,表示越接近于th时刻,两车距离所占的比重越大,λ为衰减常数。
利用所述邻接矩阵A计算矩阵其中的元素/>
联合邻接矩阵A与矩阵D计算拉普拉斯矩阵L=D-A,表征每个车辆对周围车辆的影响情况。
所述拉普拉斯矩阵L中每一元素表示一个特征值,通过矩阵的特征值分解获得所述拉普拉斯矩阵L所有特征值对应的特征向量,选取最大p个特征值对应的特征向量v1,v2,...,vp,并与目标车辆归一化后的历史轨迹序列串接,构造条件向量/>此时,维度动态变化的条件/>转化为维度固定为dX=2th+pnv的条件条件分布转化为/>Y表示归一化后的目标车辆未来轨迹序列。
本发明实施例中,对于每一轨迹数据集,通过选择不同的目标车辆能够构造不同的条件向量。
步骤2、对于每一轨迹数据集,将构造的条件向量作为输入,利用混合密度网络估计条件分布密度模型的参数,以此表达轨迹数据集中车辆轨迹的条件概率密度分布,并结合预先构造的训练损失函数对所述混合密度网络进行训练,获得每一轨迹数据集对应的混合密度网络。
如之前所述,轨迹数据集中车辆轨迹的条件概率密度分布能够体现轨迹数据集中车辆轨迹的时空依赖关系,轨迹数据集中车辆轨迹的时空依赖关系是指,目标车辆的未来的轨迹受到目标车辆的历史轨迹序列及其周围车辆的历史轨迹序列的影响。
本发明实施例中,使用GMMs(Gaussian Mixture Models,高斯混合模型)作为条件分布密度模型,使用基于MDN(Mixture Density Network,混合密度网络)的GMMs(GaussianMixture Models,高斯混合模型)参数估计。为了实现CPDF(Conditional ProbabilityDensity Function,条件概率密度分布函数)估计,本发明提出利用混合密度网络对其进行估计。高斯混合模型对多个高斯分布进行加权,通过选取合适的参数,可实现对任意分布的近似。具体来说:
通过高斯混合模型对多个高斯分布进行加权,估计轨迹数据集中车辆轨迹的时空依赖关系,表示为:
其中,Y表示目标车辆归一化后的未来轨迹序列,m为高斯分布的数目,αf(X)为第f个高斯分布的加权参数,φf(Y∣X)为第f个高斯分布的概率密度函数,μf(X)为第f个高斯分布的均值向量,σf(X)2为第f个高斯分布的方差,dX为高斯分布的维度,π为圆周率符号。
将估计出的轨迹数据集中车辆轨迹的时空依赖关系p(Y∣X)作为轨迹数据集的条件概率密度分布;由于对条件概率密度分布进行近似,因此,高斯分布的加权参数αf(X),高斯分布的均值向量μf(X),以及高斯分布的方差σf(X)2三类参数均与条件向量X有关,本发明实施例使用混合密度网络估计上述三类参数。
本发明实施例中,构建包括多层感知机以及三个独立的全连接层(FC)的混合密度网络,如图2所示,利用所述多层感知机对所述条件向量X进行特征编码和提取,获得特征编码向量Z;三个全连接层的输入均为所述特征编码向量Z,每一全连接层独自估计一类参数。
其中,为了保证需要利用softmax函数进行处理,即(Z)f与(Z)f'分别表示特征编码向量Z的第f个分量与第f'个分量。高斯分布假设的均值向量μf(X),f=1,...,m不受约束,即μf(X)=FC2(Z)f。σf(X)作为高斯分布假设的方差,要求严格大于0,因此需要利用softplus函数进行处理,即σf(X)=log(1+exp(FC3(Z)f));上述计算公式中FC1、FC2与FC3各自表示一个全连接层。
所述混合密度网络的训练损失函数表示为:Lmdn=-logp(Y∣X),表征了输入的序列Y(即目标车辆归一化后的未来轨迹序列)在以输入X为条件下训练的混合密度网络表示的高斯混合模型下的似然概率的相反数,通过最小化该训练损失函数,序列Y在混合密度网络表示的高斯混合模型下的概率将最大,即使得通过混合密度网络得到的高斯混合模型能尽可能捕获真实数据X和Y的条件依赖关系。
每一轨迹数据集都利用自身构造的条件向量参照上述方案估计条件分布密度模型的参数,估计条件概率密度分布,并带入上述损失函数训练相应的混合密度网络。
步骤3、对于待度量的轨迹数据集,分别利用自身对应的混合密度网络估计相应的条件概率密度分布,再使用蒙特卡洛采样的方法计算待度量的轨迹数据集的差异。
本发明实施例中,使用基于MC(Monte-Carlo,蒙特卡洛)采样的CKLD(ConditionalKullback-Leibler Divergence,条件KL散度)计算方案。
CKLD为经典KLD(KL散度)在条件分布下的扩展,定义为由于条件分布已被近似为因此可利用MC采样方法进行计算。具体如下:对于待度量的两个轨迹数据集,任选其中一个轨迹数据集作为第一轨迹数据集,获取其构造的n1个条件向量/>(在前述步骤1构造,此步骤可以直接调用);将每一个条件向量Xr,r=1,2,...,n1,分别输入至两个轨迹数据集各自对应的混合密度网络(也即通过前述步骤2的训练得到的混合密度网络),各自估计条件分布密度模型的参数,通过相应参数的条件分布密度模型估计出条件概率密度分布,记为p1(Yr∣Xr)与p2(Yr∣Xr);其中,p1(Yr∣Xr)为第一轨迹数据集对应的条件概率密度分布,表示以条件向量为Xr时,对应目标车辆未来轨迹序列Yr的分布;p2(Yr∣Xr)为第二轨迹数据集对应的条件概率密度分布,表示以条件向量为Xr时,对应目标车辆未来轨迹序列Yr的分布;
使用蒙特卡洛采样的方法,通过两个轨迹数据集各自对应条件分布密度模型根据目标车辆未来轨迹序列Yr的分布分别采样nmc个样本,将第一轨迹数据集对应的样本记为将第二轨迹数据集对应的样本记为/>
利用条件向量Xr与采样的样本计算出对应的条件概率密度分布/>利用条件向量Xr与采样的样本/>计算出对应的条件概率密度分布/>再通过下式计算条件向量为Xr时的nmc个样本的距离均值:
通过下式度量两个轨迹数据集条件概率密度分布的距离,作为两个轨迹数据集的差异:
其中,粗体的X和粗体的Y涵盖了计算过程所有条件向量及相应的目标车辆未来轨迹序列,KLD(.|.)表示计算两个条件概率密度分布的KL散度,CKLD(.|.)表示计算两个条件概率密度分布的条件KL散度。
本发明实施例上述方案,将多轨迹的时空依赖关系形式化表达为条件分布,利用已有车辆轨迹数据估计条件分布密度模型的参数,利用具备解析形式的概率密度分布近似轨迹数据集蕴含的条件分布,并利用基于采样的方法计算条件分布之间的距离,从而度量轨迹数据集的差异性。相较于现有技术,本发明首次度量多车轨迹数据集中时空依赖关系的差异性,表征了不同交通场景下车辆交互特性和时空依赖关系的差异性,有助于理解和量化不同交通场景的差异性,理解同一交通场景下多车之间时空依赖关系的变化特性和规律,帮助针对不同交通场景和同一时变交通场景进行单独处理和针对性研究,可用于涉及轨迹预测、数据度量、迁移学习、终身学习以及智能交通等相关科学研究和实际应用。
为了便于理解,下面提供一个度量五个公开数据集相互之间的距离的示例。
一、数据集预处理。
1、US101公开数据集。US101是NGSIM下的一个数据集,在美国高速路上记录了车辆轨迹,将其中7:50-8:05的数据记为us101-1。由于US101数据集轨迹较多,不失一般性,取其中第一时间段的数据,即早上7:50-8:05记录的车辆轨迹数据,取其中周围车辆数目为3和4的情况,进行预处理,车辆轨迹持续长度分割为8.0s,按照7:1:2的比例分割训练集、验证集以及测试集,并进行数据归一化处理,处理后记为us101-1。
2、I80公开数据集。I80数据集是NGSIM下面的一个数据集,在美国高速路上记录了车辆轨迹,取其中第一个时间段记录的数据,记为i801。数据处理方法与us101数据集一致;
3、HighD数据集。HighD数据集是在德国高速路记录的车辆轨迹数据,取其中20track的记录,记为HighD20。数据处理方法与us101数据集一致,但不限定周围车辆的数目;
4、Interaction数据集。Interaction数据集在多个国家采集了车辆轨迹数据,取其中在中国城市道路上的DR_CHN_Merging_ZS中的记录轨迹中的5个文件,记为inter5d。数据处理方法与us101数据集一致,但不限定周围车辆的数目;
5、US101公开数据集。US101是NGSIM下的一个数据集,在美国高速路上记录了车辆轨迹,将其中8:05-8:15的数据记为US101-2。数据处理方法与us101数据集一致。
为方便起见,将上述1~5处理得到的数据集分别记为D1~D5。
二、数据集相互之间的距离度量。
1、固定场景中车辆总数nv=5,取拉普拉斯矩阵最大p=3个特征值对应的特征向量。
2、训练混合密度网络。使用Adam优化器进行训练,batch_size(批尺寸)为4096,学习率γ=0.0004。
3、进行MC采样,对于每个Xr,采样数目nmc=20000。
表1为计算的数据集之间的距离。从数据集的设置来看,us101-1(即D1)与us101-2(即D5)由于在同一条高速路上不同时间采集的数据,距离应当接近,同时i801(即D2)与us101数据集(即D1与D5)都为美国的高速路数据集,距离也应当接近,而inter5d(D4)和highd20(D3)则是在另外的国家采集的数据,应当与其余数据集距离较大。
D1 D2 D3 D4 D5
D1 0 22.7347 203.3769 111.6124 16.3982
D2 25.6842 0 266.2677 114.9378 23.2883
D3 79.5152 49.3029 0 105.1715 54.5354
D4 259.3124 138.1871 311.7633 0 179.1496
D5 18.1057 18.2247 205.6429 102.9876 0
表1五个数据集之间的距离
从表1可见,实际计算得到的数据集之间的距离与预期一致,表明了数据集距离度量的正确性。
实施例二
本发明还提供一种轨迹数据集差异性度量系统,其主要基于前述实施例一提供的方法实现,如图3所示,该系统主要包括:
针对轨迹数据集的条件向量构造单元,用于对包含多个车辆轨迹序列的每一轨迹数据集,利用当前选择的目标车辆将所有车辆的轨迹序列进行维度统一,再结合当前选择的目标车辆的历史轨迹序列构造条件向量;
条件概率密度分布估计与网络训练单元,用于对于每一轨迹数据集,将构造的条件向量作为输入,利用混合密度网络估计条件分布密度模型的参数,由条件分布密度模型结合估计出的参数与所述条件向量估计轨迹数据集中车辆轨迹的时空依赖关系作为轨迹数据集的条件概率密度分布,并结合预先构造的损失函数对所述混合密度网络进行训练,获得每一轨迹数据集对应的混合密度网络;其中,轨迹数据集中车辆轨迹的时空依赖关系是指,目标车辆的未来的轨迹受到目标车辆的历史轨迹序列及其周围车辆的历史轨迹序列的影响;
差异度量单元,用于对于待度量的轨迹数据集,分别利用自身对应的混合密度网络估计相应的条件概率密度分布,再使用蒙特卡洛采样的方法计算待度量的轨迹数据集的差异。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
需要说明的时候,系统各个单元所涉及的计算原理在之前的实施例一中已经做了详细的说明,故不再赘述。
实施例三
本发明还提供一种处理设备,如图4所示,其主要包括:一个或多个处理器;存储器,用于存储一个或多个程序;其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现前述实施例提供的方法。
进一步的,所述处理设备还包括至少一个输入设备与至少一个输出设备;在所述处理设备中,处理器、存储器、输入设备、输出设备之间通过总线连接。
本发明实施例中,所述存储器、输入设备与输出设备的具体类型不做限定;例如:
输入设备可以为触摸屏、图像采集设备、物理按键或者鼠标等;
输出设备可以为显示终端;
存储器可以为随机存取存储器(Random Access Memory,RAM),也可为非不稳定的存储器(non-volatile memory),例如磁盘存储器。
实施例四
本发明还提供一种可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现前述实施例提供的方法。
本发明实施例中可读存储介质作为计算机可读存储介质,可以设置于前述处理设备中,例如,作为处理设备中的存储器。此外,所述可读存储介质也可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (10)

1.一种轨迹数据集差异性度量方法,其特征在于,包括:
对包含多个车辆轨迹序列的每一轨迹数据集,利用当前选择的目标车辆将所有车辆的轨迹序列进行维度统一,再结合当前选择的目标车辆的历史轨迹序列构造条件向量;
对于每一轨迹数据集,将构造的条件向量作为输入,利用混合密度网络估计条件分布密度模型的参数,由条件分布密度模型结合估计出的参数与所述条件向量估计轨迹数据集中车辆轨迹的时空依赖关系作为轨迹数据集的条件概率密度分布,并结合预先构造的训练损失函数对所述混合密度网络进行训练,获得每一轨迹数据集对应的混合密度网络;其中,轨迹数据集中车辆轨迹的时空依赖关系是指,目标车辆的未来的轨迹受到目标车辆的历史轨迹序列及其周围车辆的历史轨迹序列的影响;
对于待度量的轨迹数据集,分别利用自身对应的混合密度网络估计相应的条件概率密度分布,再使用蒙特卡洛采样的方法计算待度量的轨迹数据集的差异。
2.根据权利要求1所述的一种轨迹数据集差异性度量方法,其特征在于,利用当前选择的目标车辆将所有车辆的轨迹序列进行维度统一之前包括:
对于每一周围车辆和当前选择的目标车辆,均利用目标车辆对自身的轨迹序列进行中心化,再结合所有车辆中心化后的轨迹序列进行归一化,步骤包括:
对于周围车辆l=1,2,...,n与目标车辆e,对自身的轨迹序列进行中心化,表示为:
其中,为目标车辆在th时刻的坐标,历史轨迹持续时间为(1,2,...,th),轨迹序列包含历史轨迹序列与未来轨迹序列,l'=1,2,...,n,e;
结合所有车辆中心化后的轨迹序列进行归一化,表示为:
其中,分别表示周围车辆1、周围车辆n中心化后的轨迹序列,/>表示周围车辆l归一化后的轨迹序列,/>表示车辆l'归一化后的轨迹序列,车辆l'包含周围车辆l与目标车辆e,下标1:t,表示从1时刻到t时刻,即涵盖了轨迹持续时间与未来轨迹持续时间。
3.根据权利要求1或2所述的一种轨迹数据集差异性度量方法,其特征在于,所述利用当前选择的目标车辆将所有车辆的轨迹序列进行维度统一,再结合当前选择的目标车辆的历史轨迹序列构造条件向量包括:
根据设定的场景大小,从n辆周围车辆中选出nv辆与所述目标车辆最近的周围车辆,并计算邻接矩阵其中,矩阵中的元素aij表示周围车辆i和周围车辆j的历史轨迹的接近程度,计算方式为:
其中,(1,2,...,th)为历史轨迹持续时间,和/>分别为周围车辆i归一化后的k时刻的横坐标和纵坐标,/>和/>分别为周围车辆j归一化后的k时刻的横坐标和纵坐标;为随时间的衰减系数,λ为衰减常数;
利用所述邻接矩阵A计算矩阵其中的元素/>
联合邻接矩阵A与矩阵D计算拉普拉斯矩阵L=D-A;
所述拉普拉斯矩阵L中每一元素表示一个特征值,通过矩阵的特征值分解获得所述拉普拉斯矩阵L所有特征值对应的特征向量,选取最大p个特征值对应的特征向量v1,v2,...,vp并与目标车辆归一化后的历史轨迹序列串接,构造条件向量/>
4.根据权利要求1所述的一种轨迹数据集差异性度量方法,其特征在于,所述由条件分布密度模型结合估计出的参数与所述条件向量估计轨迹数据集中车辆轨迹的时空依赖关系作为轨迹数据集的条件概率密度分布包括:
利用高斯混合模型作为分布密度模型,通过高斯混合模型对多个高斯分布进行加权,估计轨迹数据集中车辆轨迹的时空依赖关系,表示为:
其中,Y表示目标车辆归一化后的未来轨迹序列,m为高斯分布的数目,αf(X)为第f个高斯分布的加权参数,φf(Y∣X)为第f个高斯分布的概率密度函数,μf(X)为第f个高斯分布的均值向量,σf(X)2为第f个高斯分布的方差,dX为高斯分布的维度,π为圆周率符号;
将估计出的轨迹数据集中车辆轨迹的时空依赖关系p(Y∣X)作为轨迹数据集的条件概率密度分布;其中,高斯分布的加权参数αf(X),高斯分布的均值向量μf(X),以及高斯分布的方差σf(X)2三类参数均与条件向量X有关,利用所述混合密度网络估计。
5.根据权利要求4所述的一种轨迹数据集差异性度量方法,其特征在于,所述将所述条件向量作为输入,利用混合密度网络估计条件分布密度模型的参数包括:
构建包括多层感知机以及三个独立的全连接层的混合密度网络;
利用所述多层感知机对所述条件向量X进行特征编码和提取,获得特征编码向量Z;三个全连接层的输入均为所述特征编码向量Z,每一全连接层独自估计一类参数,表示为:
μf(X)=FC2(Z)f
σf(X)=log(1+exp(FC3(Z)f))
其中,FC1、FC2与FC3各自表示一个全连接层,(Z)f与(Z)f'分别表示特征编码向量Z的第f个分量与第f'个分量。
6.根据权利要求5所述的一种轨迹数据集差异性度量方法,其特征在于,所述训练损失函数表示为:
Lmdn=-log(Y∣X)
通过最小化上述训练损失函数,目标车辆归一化后的未来轨迹序列Y在混合密度网络下的概率将最大。
7.根据权利要求1所述的一种轨迹数据集差异性度量方法,其特征在于,所述对于待度量的轨迹数据集,分别利用自身对应的混合密度网络估计相应的条件概率密度分布,再使用蒙特卡洛采样的方法计算待度量的轨迹数据集的差异包括:
对于待度量的两个轨迹数据集,任选其中一个轨迹数据集作为第一轨迹数据集,获取其构造的n1个条件向量{X1,X2,...,Xn1};将每一个条件向量Xr,r=1,2,...,n1,均分别输入至两个轨迹数据集各自对应的训练得到的混合密度网络,各自估计条件分布密度模型的参数后,通过相应参数的条件分布密度模型估计出条件概率密度分布,记为p1(Yr∣Xr)与p2(Yr∣Xr);其中,p1(Yr∣Xr)为第一轨迹数据集对应的条件概率密度分布,表示以条件向量为Xr时,对应目标车辆未来轨迹序列Yr的分布;p2(Yr∣Xr)为第二轨迹数据集对应的条件概率密度分布,表示以条件向量为Xr时,对应目标车辆未来轨迹序列Yr的分布;
使用蒙特卡洛采样的方法,通过两个轨迹数据集各自对应条件分布密度模型根据目标车辆未来轨迹序列Yr的分布分别采样nmc个样本,将第一轨迹数据集对应的样本记为将第二轨迹数据集对应的样本记为/>
利用条件向量Xr与采样的样本计算出对应的条件概率密度分布/>利用条件向量Xr与采样的样本/>计算出对应的条件概率密度分布/>再通过下式计算条件向量为Xr时的nmc个样本的距离均值:
通过下式度量两个轨迹数据集条件概率密度分布的距离,作为两个轨迹数据集的差异:
其中,粗体的X和粗体的Y涵盖所有条件向量及相应的目标车辆未来轨迹序列,KLD(.|.)表示计算两个条件概率密度分布的KL散度,CKLD(.|.)表示计算两个条件概率密度分布的条件KL散度。
8.一种轨迹数据集差异性度量系统,其特征在于,基于权利要求1~7任一项所述的方法实现,该系统包括:
针对轨迹数据集的条件向量构造单元,用于对包含多个车辆轨迹序列的每一轨迹数据集,利用当前选择的目标车辆将所有车辆的轨迹序列进行维度统一,再结合当前选择的目标车辆的历史轨迹序列构造条件向量;
条件概率密度分布估计与网络训练单元,用于对于每一轨迹数据集,将构造的条件向量作为输入,利用混合密度网络估计条件分布密度模型的参数,由条件分布密度模型结合估计出的参数与所述条件向量估计轨迹数据集中车辆轨迹的时空依赖关系作为轨迹数据集的条件概率密度分布,并结合预先构造的损失函数对所述混合密度网络进行训练,获得每一轨迹数据集对应的混合密度网络;其中,轨迹数据集中车辆轨迹的时空依赖关系是指,目标车辆的未来的轨迹受到目标车辆的历史轨迹序列及其周围车辆的历史轨迹序列的影响;
差异度量单元,用于对于待度量的轨迹数据集,分别利用自身对应的混合密度网络估计相应的条件概率密度分布,再使用蒙特卡洛采样的方法计算待度量的轨迹数据集的差异。
9.一种处理设备,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序;
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1~7任一项所述的方法。
10.一种可读存储介质,存储有计算机程序,其特征在于,当计算机程序被处理器执行时实现如权利要求1~7任一项所述的方法。
CN202210364773.2A 2022-04-08 2022-04-08 轨迹数据集差异性度量方法、系统、设备及存储介质 Active CN114757355B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210364773.2A CN114757355B (zh) 2022-04-08 2022-04-08 轨迹数据集差异性度量方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210364773.2A CN114757355B (zh) 2022-04-08 2022-04-08 轨迹数据集差异性度量方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114757355A CN114757355A (zh) 2022-07-15
CN114757355B true CN114757355B (zh) 2024-04-02

Family

ID=82328363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210364773.2A Active CN114757355B (zh) 2022-04-08 2022-04-08 轨迹数据集差异性度量方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114757355B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114996659B (zh) * 2022-07-26 2023-04-07 北京理工大学 一种具有持续学习能力的车辆轨迹预测方法及系统
CN115601393B (zh) * 2022-09-29 2024-05-07 清华大学 轨迹生成方法、装置、设备和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107298100A (zh) * 2017-05-16 2017-10-27 开易(北京)科技有限公司 一种基于高斯混合模型的车辆轨迹预测方法、系统
CN109034448A (zh) * 2018-06-14 2018-12-18 重庆邮电大学 基于车辆轨迹语义分析和深度信念网络的轨迹预测方法
CN110610271A (zh) * 2019-09-17 2019-12-24 北京理工大学 一种基于长短记忆网络的多重车辆轨迹预测方法
CN112015842A (zh) * 2020-09-02 2020-12-01 中国科学技术大学 自行车轨迹预测的自动驾驶车辆风险评估方法及系统
WO2021003379A1 (en) * 2019-07-03 2021-01-07 Waymo Llc Agent trajectory prediction using anchor trajectories
CN112327903A (zh) * 2020-09-15 2021-02-05 南京航空航天大学 一种基于深度混合密度网络的航空器轨迹生成方法
CN112733890A (zh) * 2020-12-28 2021-04-30 北京航空航天大学 一种考虑时空特征的网联车辆轨迹聚类方法
CN113076599A (zh) * 2021-04-15 2021-07-06 河南大学 一种基于长短时记忆网络的多模态车辆轨迹预测方法
WO2021232229A1 (zh) * 2020-05-19 2021-11-25 深圳元戎启行科技有限公司 虚拟场景生成方法、装置、计算机设备和存储介质
CN113954864A (zh) * 2021-09-22 2022-01-21 江苏大学 一种融合周边车辆交互信息的智能汽车轨迹预测系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3757900A1 (en) * 2019-06-24 2020-12-30 Tata Consultancy Services Limited Time series prediction with confidence estimates using sparse recurrent mixture density networks

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107298100A (zh) * 2017-05-16 2017-10-27 开易(北京)科技有限公司 一种基于高斯混合模型的车辆轨迹预测方法、系统
CN109034448A (zh) * 2018-06-14 2018-12-18 重庆邮电大学 基于车辆轨迹语义分析和深度信念网络的轨迹预测方法
WO2021003379A1 (en) * 2019-07-03 2021-01-07 Waymo Llc Agent trajectory prediction using anchor trajectories
CN110610271A (zh) * 2019-09-17 2019-12-24 北京理工大学 一种基于长短记忆网络的多重车辆轨迹预测方法
WO2021232229A1 (zh) * 2020-05-19 2021-11-25 深圳元戎启行科技有限公司 虚拟场景生成方法、装置、计算机设备和存储介质
CN112015842A (zh) * 2020-09-02 2020-12-01 中国科学技术大学 自行车轨迹预测的自动驾驶车辆风险评估方法及系统
CN112327903A (zh) * 2020-09-15 2021-02-05 南京航空航天大学 一种基于深度混合密度网络的航空器轨迹生成方法
CN112733890A (zh) * 2020-12-28 2021-04-30 北京航空航天大学 一种考虑时空特征的网联车辆轨迹聚类方法
CN113076599A (zh) * 2021-04-15 2021-07-06 河南大学 一种基于长短时记忆网络的多模态车辆轨迹预测方法
CN113954864A (zh) * 2021-09-22 2022-01-21 江苏大学 一种融合周边车辆交互信息的智能汽车轨迹预测系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张雪翔 ; 吴训成 ; 史训昂 ; 侍俊 ; .LSTGHP:基于分层时空图的异构代理轨迹分布预测.软件.2020,(09),44-50. *
韩皓 ; 谢天 ; .基于注意力Seq2Seq网络的高速公路交织区车辆变道轨迹预测.中国公路学报.2020,(06),110-122. *

Also Published As

Publication number Publication date
CN114757355A (zh) 2022-07-15

Similar Documents

Publication Publication Date Title
CN114757355B (zh) 轨迹数据集差异性度量方法、系统、设备及存储介质
WO2018076571A1 (zh) Lte网络中的异常值检测方法及系统
Li et al. Applying various algorithms for species distribution modelling
CN112699960B (zh) 基于深度学习的半监督分类方法、设备及存储介质
Schultz et al. Approximation of diagonal line based measures in recurrence quantification analysis
CN111967535B (zh) 一种储粮管理场景温度传感器故障诊断方法及其诊断装置
Steingroever et al. Bayes factors for reinforcement-learning models of the Iowa gambling task.
CN116522265A (zh) 工业互联网时序数据异常检测方法及装置
He et al. A selective overview of feature screening methods with applications to neuroimaging data
CN113822336A (zh) 一种云硬盘故障预测方法、装置、系统及可读存储介质
CN116737681A (zh) 一种实时异常日志检测方法、装置、计算机设备和存储介质
Stano et al. Explaining predictions of deep neural classifier via activation analysis
CN115545152A (zh) 基于长短期Transformer模型的交通流量预测方法
Misaii et al. Multiple imputation of masked competing risks data using machine learning algorithms
CN113850314A (zh) 客户价值等级预测模型建立方法、装置、介质及设备
Urbanek et al. On the value of parameters of use case points method
CN110647915A (zh) 一种用于高维数据一致性分析的动态模式判断方法
Feng et al. Elf: extract landmark features by optimizing topology maintenance, redundancy, and specificity
CN115393362B (zh) 一种青光眼自动识别模型选择方法、设备和介质
Han et al. Prototype‐based method for incremental radar emitter identification
CN113035363B (zh) 一种概率密度加权的遗传代谢病筛查数据混合采样方法
CN117437973B (zh) 一种单细胞转录组测序数据插补方法
CN113191263B (zh) 一种视频描述方法及装置
CN117831789B (zh) 癌症治疗反应预测系统及其控制方法
Insabato et al. Bayesian estimation for large scale multivariate Ornstein-Uhlenbeck model of brain connectivity

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant