CN114283576A - 一种车辆意图预测方法及相关装置 - Google Patents

一种车辆意图预测方法及相关装置 Download PDF

Info

Publication number
CN114283576A
CN114283576A CN202011045331.9A CN202011045331A CN114283576A CN 114283576 A CN114283576 A CN 114283576A CN 202011045331 A CN202011045331 A CN 202011045331A CN 114283576 A CN114283576 A CN 114283576A
Authority
CN
China
Prior art keywords
coordinate value
data
exit
driving
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011045331.9A
Other languages
English (en)
Other versions
CN114283576B (zh
Inventor
范时伟
李飞
李向旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202011045331.9A priority Critical patent/CN114283576B/zh
Publication of CN114283576A publication Critical patent/CN114283576A/zh
Application granted granted Critical
Publication of CN114283576B publication Critical patent/CN114283576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供一种车辆意图预测方法及相关装置,该方法包括:获取意图预测模型,其中,所述意图预测模型用于对车辆向路口各个方向的行驶的意图进行预测;对所述目标行驶数据进行栅格化编码得到目标图像样本,其中所述目标行驶数据中的不同类型的数据、对应不同出口方向的数据分别编码到所述一个图像样本中的不同数据通道中;将所述目标图像样本输入到所述意图预测模型,得到所述第二车辆向所述路口各个方向的行驶的意图概率。采用本申请实施例,能够提高车辆在复杂路况的意图预测准确度。

Description

一种车辆意图预测方法及相关装置
技术领域
本发明涉及车联网技术领域,尤其涉及一种车辆意图预测方法及相关装置。
背景技术
随着智能驾驶技术的发展,智能车成为各大厂商重点研究的目标。智能驾驶包括辅助驾驶和自动驾驶,其实现的关键技术有:定位、感知、预测、规划控制等。车辆意图预测是指根据当前时刻以及历史时刻的目标车辆状态对目标车辆的行为意图进行预测,例如在顺行道路场景下车辆意图可以包括车道保持、左换道、右换道等,在路口场景下车辆意图可以包括直行、左转、右转以及调头等。在城市道路中,实时、准确、可靠地对车辆意图预测,可以帮助自车预知前方的交通状况,建立自车周围的交通态势,有助于对周围他车目标车辆重要性判断,筛选交互的关键目标车辆,便于自车提前进行路径规划,安全通过复杂路口场景。
近些年随着传感器硬件发展和算法的进步带来了自动驾驶领域快速发展,对车辆轨迹预测的研究也逐渐增多,目前的主要预测方法包括:
(1)基于规则的轨迹预测方法:主要利用了运动模型,如匀速、匀加速模型,根据预测目标车辆的位置和速度等信息来预测目标车辆在未来时间的运动,再结合高精地图的信息,如目标车辆临近的车道,以及与临近车道相连的后续车道,车道的转向信息等,来预测目标车辆未来较长时间可能行驶的路线。由于实际道路复杂,此方法工程量大,难以遍历所有的情况,并且严重依赖感知的精度和高精地图的准确性。
(2)基于概率统计的方法:此类方法提取了目标车辆的行驶状态,如速度、加速度、角速度等,利用隐马尔科夫模型(Hidden Markov Model,HMM)、动态贝叶斯网络(DynamicBayesian Network,DBN)等模型,来预测目标车辆的直行、转向等意图。此类模型的表示能力有限,因此泛化性能较差,并且输出的转向意图在一些复杂路口中并不实用。
(3)基于机器学习的方法:此类方法首先提取了一系列目标车辆的特征,如车辆形状、运动状态,周围车道的属性以及相关关系等,利用多层感知机(Multi LayerPerceptron,MLP)、k均值聚类算法(Kmeans)等方法,实现转向意图的分类。此类方法需要人工设计特征,在复杂的场景表示能力有限,并且输出的转向意图在一些复杂路口中并不实用。
可以看出,目前的预测方法在一些复杂路口情况下难以准确预测目标车辆的行驶意图。
发明内容
本申请实施例公开了一种车辆意图预测方法及相关装置,能够提高车辆在复杂路口的意图预测准确度,且预测泛化性较好,能够适用于各种出口数量的路口的预测。
第一方面,本申请实施例提供一种车辆意图预存模型的训练方法,该方法包括:
获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别编码到所述一个图像样本中的不同数据通道中;
通过所述多个样本数据对车辆意图预测模型进行训练,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的真实情况。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
结合第一方面,在第一方面的一种可能的实现方式中,所述对所述多条行驶数据进行栅格化编码得到多个图像样本,包括:
根据参考图像的规格和第一行驶数据中的轨迹的起点确定第一缩放因子,其中,所述第一行驶数据为所述多条行驶数据中的任意一条行驶数据;
根据所述第一缩放因子对所述第一行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
其中,所述第一数据通道上,对应的时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度加强体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第一缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第一缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
结合第一方面,或者第一方面的上述任一种可能的实现方式,在第一方面的又一种可能的实现方式中,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
结合第一方面,或者第一方面的上述任一种可能的实现方式,在第一方面的又一种可能的实现方式中,所述第一缩放因子满足如下关系:
Figure BDA0002706479820000031
其中,scale为所述第一缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P,Gi‖表示所述第一行驶数据中的轨迹的起点P与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
在这种计算方式中,分子取图像高和图像宽中的最小值,车辆的活动范围取了路口区域的尽可能大的区域,因此经过这种方式计算出的scale对第一坐标值、第二坐标值、第三坐标值等坐标值进行缩放后,这些坐标值基本不会超出图像坐标值范围,能够保证栅格化编码后信息不丢失。
结合第一方面,或者第一方面的上述任一种可能的实现方式,在第一方面的又一种可能的实现方式中,还包括:
向预测设备发送所述意图预测模型。
可以理解,将该意图预测模型发送给预测设备,由预测设备对车辆的意图进行预测,预测结果能够帮助车辆合理地进行驾驶控制,提高驾驶安全性。
第二方面,本申请实施例提供一种车辆意图预测方法,该方法包括:
获取意图预测模型,其中,所述意图预测模型用于对车辆向路口各个方向的行驶的意图进行预测;
获取目标行驶数据,其中,所述目标行驶数据包括第一参考信息和第二车辆行驶经过所述路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
对所述目标行驶数据进行栅格化编码得到目标图像样本,其中所述目标行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
将所述目标图像样本输入到所述意图预测模型,得到所述第二车辆向所述路口各个方向的行驶的意图概率。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
结合第二方面,在第二方面的一种可能的实现方式中,所述获取意图预测模型,包括:
接收模型训练设备发送的意图预测模型,其中,所述意图预测模型为基于由多条行驶数据栅格化编码得到的多个图像样本训练得到的,所述多条行驶数据中每条行驶数据的数据格式与所述目标行驶数据的数据格式相同。
结合第二方面,或者第二方面的上述任一种可能的实现方式,在第二方面的又一种可能的实现方式中,所述对所述目标行驶数据进行栅格化编码得到目标图像样本,包括:
根据参考图像的规格和目标行驶数据中的轨迹的起点确定第二缩放因子;
根据所述第二缩放因子对所述目标行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述目标行驶数据对应的目标图像样本,其中,所述目标图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
所述第一数据通道上,对应的时间越靠后对应时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第二缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第二缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
结合第二方面,或者第二方面的上述任一种可能的实现方式,在第二方面的又一种可能的实现方式中:
所述行驶数据还包括所述第二车辆在所述一条轨迹上的行驶速度,所述目标图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
第三方面,本申请实施例提供一种图像数据处理方法,该方法包括:
获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
向模型训练设备发送所述多个样本数据,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的意图真实情况。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,后续用于模型训练时,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此这样的样本数据后续用于模型训练时,能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
第四方面,本申请实施例提供一种车辆意图预测模型的训练装置,该装置包括:
获取单元,用于获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过目标路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
编码单元,用于对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
训练单元,用于通过所述多个样本数据对车辆意图预测模型进行训练,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的真实情况。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
结合第四方面,在第四方面的一种可能的实现方式中,在对所述多条行驶数据进行栅格化编码得到多个图像样本,所述编码单元具体用于:
根据参考图像的规格和第一行驶数据中的轨迹的起点确定第一缩放因子,其中,所述第一行驶数据为所述多条行驶数据中的任意一条行驶数据;
根据所述第一缩放因子对所述第一行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
其中,所述第一数据通道上,对应的时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第一缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第一缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
结合第四方面,或者第四方面的上述任一种可能的实现方式,在第四方面的又一种可能的实现方式中:
所述行驶数据还包括所述第一车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
结合第四方面,或者第四方面的上述任一种可能的实现方式,在第四方面的又一种可能的实现方式中,所述第一缩放因子满足如下关系:
Figure BDA0002706479820000071
其中,scale为所述第一缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P,Gi‖表示所述第一行驶数据中的轨迹的起点P与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
在这种计算方式中,分子取图像高和图像宽中的最小值,车辆的活动范围取了路口区域的尽可能大的区域,因此经过这种方式计算出的scale对第一坐标值、第二坐标值、第三坐标值等坐标值进行缩放后,这些坐标值基本不会超出图像坐标值范围,能够保证栅格化编码后信息不丢失。
结合第四方面,或者第四方面的上述任一种可能的实现方式,在第四方面的又一种可能的实现方式中,还包括:
发送单元,用于向预测设备发送所述意图预测模型。
可以理解,将该意图预测模型发送给预测设备,由预测设备对车辆的意图进行预测,预测结果能够帮助车辆合理地进行驾驶控制,提高驾驶安全性。
第五方面,本申请实施例提供一种车辆意图预测装置,该装置包括:
第一获取单元,用于获取意图预测模型,其中,所述意图预测模型用于对车辆向路口各个方向的行驶的意图进行预测;
第二获取单元,用于获取目标行驶数据,其中,所述目标行驶数据包括第一参考信息和第二车辆行驶经过所述路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
编码单元,用于对所述目标行驶数据进行栅格化编码得到目标图像样本,其中所述目标行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
预测单元,用于将所述目标图像样本输入到所述意图预测模型,得到所述第二车辆向所述路口各个方向的行驶的意图概率。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
结合第五方面,在第五方面的一种可能的实现方式中,在对所述目标行驶数据进行栅格化编码得到目标图像样本方面,所述编码单元具体用于:
根据参考图像的规格和目标行驶数据中的轨迹的起点确定第二缩放因子;
根据所述第二缩放因子对所述目标行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述目标行驶数据对应的目标图像样本,其中,所述目标图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
所述第一数据通道上,对应的时间越靠后对应时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第二缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第二缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
结合第五方面,或者第五方面的上述任一种可能的实现方式,在第五方面的又一种可能的实现方式中:
所述行驶数据还包括所述第二车辆在所述一条轨迹上的行驶速度,所述目标图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
第六方面,本申请实施例提供一种图像数据处理装置,该装置包括:
获取单元,用于获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过目标路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
编码单元,用于对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
发送单元,用于向模型训练设备发送所述多个样本数据,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的意图真实情况。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,后续用于模型训练时,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此这样的样本数据后续用于模型训练时,能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
第七方面,本申请实施例提供一种模型生成设备,所述模型生成设备包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序在所述处理器上运行是实现第一方面或者第一方面的任一种可能的实现方式所描述的方法。
第八方面,本申请实施例提供一种预测设备,所述预测设备包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序在所述处理器上运行是实现第二方面或者第二方面的任一种可能的实现方式所描述的方法。该预测设备可以为车辆,或者部署在云端的虚拟机,或者为一台服务器,或者为多台服务器组成的服务器集群。
第九方面,本申请实施例提供一种目标设备,所述目标包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序在所述处理器上运行是实现第三方面或者第二方面的任一种可能的实现方式所描述的方法。该目标设备可以为车辆,或者部署在云端的虚拟机,或者为一台服务器,或者为多台服务器组成的服务器集群。
第十方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在处理器上运行时,实现第一方面或者第一方面的任一种可能的实现方式所描述的方法,或者实现第二方面或者第二方面的任一种可能的实现方式所描述的方法,或者实现第三方面或者第三方面的任一种可能的实现方式所描述的方法。
通过实施本申请实施例,需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
附图说明
以下对本申请实施例用到的附图进行介绍。
图1是本申请实施例提供的一种车辆多模态意图预测的场景示意图;
图2是本申请实施例提供的一种车辆预测模型的神经网络结构示意图;
图3是本申请实施例提供的一种自动驾驶的控制流程示意图;
图4是本申请实施例提供的一种行驶数据的处理流程示意图;
图5是本申请实施例提供的一种车辆多模态意图预测方法的流程示意图;
图6是本申请实施例提供的一种模型训练的算法框架示意图;
图7是本申请实施例提供的一种模型训练设备的结构示意图;
图8是本申请实施例提供的一种预测设备的结构示意图;
图9是本申请实施例提供的一种目标设备的结构示意图;
图10是本申请实施例提供的一种车辆意图预存模型的训练装置的结构示意图;
图11是本申请实施例提供的一种车辆意图预测装置的结构示意图;
图12是本申请实施例提供的一种图像数据处理装置的结构示意图。
具体实施方式
下面结合本申请实施例中的附图对本申请实施例进行描述。
本申请发明人发现,现有技术中通过基于深度学习的方法训练车辆意图预测模型时,依旧存在一些问题,例如:
1)编码效率低:上述方法采用非固定坐标系,即以目标车辆当前时刻的位置和朝向作为坐标参考,对于每帧数据需要单独进行栅格化编码,耗时较多。
2)泛化性能不足:上述方法将目标车辆意图预测问题转换为十二元分类问题,十二元类别对应目标车坐标系下的不同扇区,实际应用中目标车辆出口并不一定落在某一扇区,也有可能多个出口落在同一扇形区域,因此上述方法在目标位置、朝向时变且不同结构路口场景条件下性能差异较大。
3)编码方式不利于CNN学习:上述方法将目标位置、高精地图中的车道线信息编码到同一图像中,信息量大,结构复杂,且存在较多的交叉区域,使得CNN的学习难度较大,通常需要更复杂的CNN模型,带来更高的运算代价。
4)无法解决意图多模态问题:意图预测问题中存在意图模糊的情况,即多模态问题,上述方法将多模态意图预测问题转换为特定的十二元分类问题,因此无法解决意图预测中的多模态问题。
针对上述基于深度学习的车辆意图方法所存在的问题,本申请发明人提出了一种车辆多模态意图预测方法,该方法可以解决编码效率低、泛化性能不足、编码方式不利于CNN学习、无法解决意图多模态问题的缺陷,下面对该一种车辆多模态意图预测方法进行详细介绍。
请参见图1,图1是本申请实施例提供的一种车辆多模态意图预测的场景示意图,该场景中包括模型训练设备101、车辆102,车辆102与该模型训练设备101之间建立了通信连接,该通信连接的方式此处不做限定,可以是无线通信技术连接,也可以是无线通信技术连接结合有线通信技术连接,例如,该车辆102通过无线通信技术接入到信号中继站(如基站),中继站通过有线通信技术与模型训练设备101连接。
该无线通信技术可以为第二代移动通信技术(The 2nd-Generation,2G)、第三代移动通信技术(The 3rd-Generation,3G)、长期演进(long term evolution,LTE)、第四代移动通信技术(the 4th Generation mobile communication,4G)、第五代移动通信技术(the 5th-Generation,5G)、或者无线保真(Wireless-Fidelity,Wi-Fi)技术、或者蓝牙技术、或者ZigBee技术,或者其他现有的通信技术、或后续研究出的通信技术,等等。
该模型训练设备101可以为具有较强计算能力的设备,例如,一个服务器,或者由多个服务器组成的服务器集群,或者基于云端的虚拟机。该模型训练设备101通过卷积神经网络对车辆的行驶数据进行训练,从而得到意图预测模型,该意图预测模型用于对车辆的行驶意图进行预测。
卷积神经网络的结构可以包括多种,如图2示出了一些实施例所提供的一种卷积神经网络结构,该卷积神经网络的输入为通道数*图像高度*图像宽度(channel*height*width)的张量,在图2中,cov表示卷积层,7*7表示卷积核的大小,“norm relu”表示数据先经过batch normalization然后经过relu,而pooling表示池化层。flatten表示将张量展开为一维向量,fully connect表示全连接层。本申请所使用的卷积神经网络可以基于深度学习领域关于卷积神经网络已有的模块(例如图2中的模块,或者是其它尺寸的卷积核)按照需要组合即可,并不局限于图2中具体架构。
车辆102可以为车载设备,例如,汽车、自行车、电动车等。输入到模型训练设备101进行训练的行驶数据,可以来源于一个车辆在不同时刻分别产生的多条行驶数据,也可以为多个车辆分别产生的不同行驶数据。在模型训练设备101训练得到意图预测模型之后,向该模型训练设备101输入某个车辆产生的一条行驶数据时,就可以预测该车辆的行驶意图。
本申请实施例中,车辆102采集到行驶数据之后可以将其发送给模型训练设备101,模型训练设备101接收到一定量的行驶数据后,基于该一定量的行驶数据生成意图预测模型,然后将该意图预测模型发送给预测设备,该预测设备可以为车辆、或者部署在云端的虚拟机、或者一台服务器,或者多台服务器组成的服务器集群;例如,当预测设备为车辆时,该车辆通过该意图预测模型预测得到车辆的意图后,基于该车辆的意图进行后续的控制决策。再如,当预测设备为部署在云端的虚拟机时,该云端虚拟机通过该意图预测模型预测得到车辆的意图后,可以将该车辆的意图信息发送给车辆,以供车辆进行后续的控制决策。
可以理解,发送行驶数据的车辆102与基于意图信息进行控制决策的车辆102可以为相同的车辆,也可以为不同的车辆。图1所示的场景以3个车辆为例进行示意,这三个车辆可以为同时出现在路口的车辆,也可以不同时刻出现在路口的车辆。
本申请实施例中,当由车辆基于意图预测模型预测车辆的行驶意图时,可以具体为车辆预测他车的行驶意图,也可以为车辆预测本车的行驶意图(这种情况可以看作是本车为本车规划路线)。及时、准确地预测车辆的行驶意图在很多场景中都会用到,以自动驾驶场景为例,通过对车辆行驶意图进行预测,能够在危险场景下作出判断并采取紧急安全措施以保障车辆安全,避免碰撞的发生。
如图3所示,在自动驾驶场景中,车辆在获得训练好的意图预测模型后,通过传感器(如摄像头、雷达等)感知他车的历史行为信息,然后将车辆当前路口区域的高精度地图的信息与感知的他车的历史行为信息进行融合,接着将融合后的数据输入到意图预测模型,以预测出他车的行驶意图,进而根据他车的行驶意图来规划路线,这有利于驾驶导航,及车辆控制。
如图4所示,本申请在预测环节,涉及到编码信息的提取,提取的信息主要来自两方面,一方面是采集的车辆行驶过程中产生的历史行为信息,另一方面包括高精度地图中关于路口的道路结构信息;提取这些信息之后,对这些信息进行编码,例如,对历史行为信息中与车辆行驶轨迹相关的信息进行编码,对高精度地图中路口的虚拟车道线、出口区域等信息进行编码(可称之为道路结构编码),最后将编码得到的图像,即目标图像样本输入到前面得到的意图预测模型,进行意图概率的估计(即预测)。
为例更好的理解本申请实施例的方案,下面结合图5对本申请的方法流程进行介绍。
请参见图5,图5是本申请实施例提供的一种车辆多模态意图预测方法的流程示意图,该方法应用于图1所示的场景,该方法包括但不限于如下步骤:
步骤S501:模型训练设备获取多条行驶数据。
其中,每条行驶数据包括第一参考信息和第一车辆行驶经过路口时的一条轨迹的第一坐标值,也即是说,这多条行驶数据均包括第一参考信息和第一坐标值,但是,不同的行驶数据包括的第一参考信息可能相同也可能不相同,不同的行驶数据包括的第一坐标值可能相同也可能不同,因为对任意一条行驶数据而言,其包括的第一参考信息和第一坐标值具体是什么是由该行驶数据描述的第一车辆的行驶行为决定,而不同第一车辆的行驶行为往往各不相同。
该路口具体是哪个路口不做限定,其可以为任意一个可供车辆行驶的路口。可选的,这多条行驶数据描述的第一车辆可以为相同车辆,也可以为不同车辆,这多条行驶数据包括的第一坐标值所属的轨迹可以来自相同的路口,也可以来自不同路口。
首先,对于任意一条行驶数据而言,其包括的一条轨迹的第一坐标值通常包括多个坐标值,例如,对行驶轨迹进行采样,采样得到的坐标值即为该第一坐标值。
可选的,该一条轨迹的第一坐标值所在坐标系的原点是该一条轨迹的起始点。
其次,对于任意一条行驶数据而言,其包括的第一参考信息具体包括路口的各个出口方向上的虚拟车道线的第二坐标值和/或路口的各个出口方向上的出口区域的第三坐标值;虚拟车道线的第二坐标值所在坐标系的原点,以及出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点。
举例来说,如果路口有四个出口方向,分别表示为出口方向1、出口方向2、出口方向3和出口方向4,如果第一参考信息包括第二坐标值,那么第一参考信息具体包括路口处,通向出口方向1的虚拟车道线的第二坐标值、通向出口方向2的虚拟车道线的第二坐标值、通向出口方向3的虚拟车道线的第二坐标值、通向出口方向4的虚拟车道线的第二坐标值。另外,对于任意一个出口方向而言,该出口方向上的虚拟车道线的第二坐标值是对该虚拟车道线进行采样得到的,因此该出口方向上的虚拟车道线的第二坐标值的数量通常为多个。可选的,可以将第二坐标值按照出口属性进行聚合,同一出口的虚拟车道线聚到一组,以方便后续处理。
同理,如果路口有四个出口方向,分别表示为出口方向1、出口方向2、出口方向3和出口方向4,如果第一参考信息包括第三坐标值,那么第一参考信息具体包括路口处,出口方向1上的出口区域的第三坐标值、出口方向2上的出口区域的第三坐标值、出口方向3上的出口区域的第三坐标值、出口方向4上的出口区域的第三坐标值。另外,对于任意一个出口方向而言,该出口方向上的出口区域的第三坐标值是对该出口区域进行采样得到的,因此该出口方向上的出口区域的第三坐标值的数量通常为多个。可选的,采样该出口区域的中心位置作为一个第三坐标值,另外围绕该中心位置再采集一些偏离中心位置的其他位置作为一些第三坐标值。
可选的,如果把上述数据通道也当做坐标系的一个维度的话,上述第一坐标值、第二坐标值、第三坐标值可以分别为不同坐标系中的坐标值;如果不把上述数据通道当做坐标系的一个维度的话,上述第一坐标值、第二坐标值、第三坐标值可以为同一个坐标系中的坐标值。
本申请实施例中,路口的很多信息(如虚拟车道线、出口区域、出口区域的中心位置)的初始来源可以是高精度地图,因此,这些信息都是通过相应算法预先设定或者选择好了,这些信息可以认为是已知的一些信息。但是本申请实施例会对这些高精度地图中的初始信息以行驶数据为参照进行变换,例如,在高精度地图中,虚拟车道线、出口区域、出口区域的中心位置再高精度地图是有原始的坐标原点为参照的,但是本申请实施例需要将这些虚拟车道线、出口区域、出口区域的中心位置的坐标原点变换成该一条轨迹的起始点,即,将一个坐标系中的内容映射到了另一个坐标系中;从而得到本申请实施例中的驾驶数据中的虚拟车道线、出口区域、出口区域的中心位置的坐标值。
可选的,高度精度地图中某个出口的出口区域可以通过一个中心位置、两个边缘位置确定,这两个边缘位置可以位于该出口的道路的两个边缘上,两个边缘位置、中心位置三点一线,且该连线与该某个出口的车道线垂直,另外,该连线到路口中心的距离要小于或者等于一个设定的值,例如,5米,或者6米,具体可以根据实际需要进行设定。之后,以该中心位置为中心,以这两个边缘位置的连线为长边,绘制椭圆,绘制椭圆时用到的短边可以是根据需要预先设置的一个数值,例如,3米;也可以是根据需要预设设置的一个比值,例如长边的2/3,再如,长边的1/2,这个椭圆区域就是该出口的出口区域。
可选的,每条行驶数据还可以包括第一车辆行驶经过路口时的一条轨迹上的驾驶速度和/驾驶朝向,例如,上述第一坐标值处的驾驶速度和/或驾驶朝向。
步骤S502:模型训练设备对所述多条行驶数据进行栅格化编码得到多个图像样本。
由于宏观世界是连续的,通常难以用一定的模型来进行精确的表示,因此在实际计算中,可以将宏观世界中连续的信息进行离散化,如连续的车道线需要使用离散的点序列进行表示。栅格化编码就是宏观世界的一种离散表示。将某个地图区域进行栅格化,如分割为0.1m乘0.1m的栅格,以一定的缩放比例投影到图像上,那么图像上的一个像素就可以用来表示真实世界的一个栅格,像素值就可以表示真实世界的具体元素信息,如车道线、车辆等。
申请实施例中,一条行驶数据用于栅格化编码得到一个图像样本,因此,多条行驶数据可以栅格化编码得到多个图像样本。以一条行驶数据为例来说,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中。
例如,上述一条轨迹的坐标值、虚拟车道线的坐标值、出口区域的坐标值分别为三种不同类型的数据,当该行驶数据还包括行驶速度和相对行驶朝向时,该行驶速度和该相对行驶朝向又属于另外两种不同类型的数据。再如,如果路口有4个不同出口方向,那么单就虚拟车道线而言,四个不同出口方向的虚拟车道线分别对应四个数据通道(一个出口方向对应一个数据通道)。并且,相对朝向是相对于出口方向的,因此,当存在4个不同出口方向时,就会有四个不同的相对行驶朝向,也需要分别对应四个数据通道。
因此,如果一条行驶数据包括第一坐标值、分别对应于四个出口方向的第二坐标值、分别对应于四个出口方向的第三坐标值,那么综合考虑数据类型、出口方向两个维度的话,该一条行驶数据需要编码到一个具有9个数据通道的图像样本上。
同理,如果一条行驶数据包括第一坐标值、分别对应于四个出口方向的第二坐标值、分别对应于四个出口方向的第三坐标值、行驶速度、分别对应四个出口方向的相对行驶朝向,那么综合考虑数据类型、出口方向两个维度的话,该一条行驶数据需要编码到一个具有14个数据通道的图像样本上。
为了便于理解,下面以该多条行驶数据中的一条行驶数据为例,讲述如何对所述多条行驶数据进行栅格化编码,因此,所述第一行驶数据可以认为为所述多条行驶数据中的任意一条行驶数据,即该多条行驶数据中的任意一条行驶数据的处理过程均与此处描述的第一行驶数据的处理过程相同,第一行驶数据的处理过程如下:
首先,根据参考图像的规格和第一行驶数据中的轨迹的起点确定第一缩放因子;可选的,该参考图像的规格可以认为是设定的一个期望图像规格,该规格至少包括图像高(height)和图像宽(width)这两项参数,能够体现参考图像的大小。需要说明的是,确定第一缩放因子过程中,除了用到参考图像的规格和第一行驶数据中的轨迹的起点外,还可能会用到其他信息,例如,路口的各个出口区域的第三坐标值。可选的,第一缩放因子满足如下关系:
Figure BDA0002706479820000141
其中,scale为所述第一缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P,Gi‖表示所述第一行驶数据中的轨迹的起点P与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
然后,根据所述第一缩放因子对所述第一行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息。具体来说,如果第一参考信息包括第二坐标值不包括第三坐标值,那么需要根据第一缩放因子对第一坐标值、第二坐标值进行缩放处理;如果第一参考信息包括第三坐标值不包括第二坐标值,那么需要根据第一缩放因子对第一坐标值、第三坐标值进行缩放处理;如果第一参考信息包括第二坐标值和第三坐标值,那么需要根据第一缩放因子对第一坐标值、第二坐标值、第三坐标值进行缩放处理。
例如,如果计算得到的第一缩放因子scale=0.85,第一坐标值为(54,66),第一参考信息包括第二坐标值和第三坐标值,且第二坐标值为(84,26),第三坐标值为(28,96),那么,第一坐标值(54,66)缩放后得到的第四坐标值为(45.9,56.1),第二坐标值(84,26)缩放后得到的第五坐标值为(71.4,22.1),第三坐标值(28,96)缩放后得到的第五坐标值为(23.8,81.6)。
接着,生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,所述第一数据通道上所述第四坐标值表示的位置填充了数值,所述至少一个第二数据通道上所述第二参考信息表示的位置填充了数值。
可选的,所述第一数据通道上,对应时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;由于该一条轨迹是由顺序依次产生的多个位置构成,因此可以认为该一条轨迹上的不同第一坐标值是存在先后顺序的,因此,对应的时间越靠后的第一坐标值也相当于距离该一条轨迹的终点越近的第一坐标。通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),即相当于通过亮度或者颜色深度加强(accentuate)了车辆轨迹终点,因为较之起始位置的轨迹数据而言,位于出口处的轨迹数据表示了车辆对于出口的真实的选择,因此在整个轨迹数据中具有更大的权重/重要性。而通过上述的设置,在基于卷积神经网络架构的意图预测模型使用这些数据进行训练的过程中,意图预测模型可以对接近轨迹终点处的图像数据具有更强的学习/识别能力,因此后续以此为基础得到的意图预测模型在使用时的准确度更高。
举例来说,如果该一条轨迹上包括四个第一坐标值,依次表示为第一坐标值1、第一坐标值2、第一坐标值3和第一坐标值4,其中,第一坐标值1对应的时间越最靠后,第一坐标值2次之,第一坐标值3再次之,第一坐标值4对应的时间最靠前;第一坐标值1缩放后得到的第四坐标值表示为第四坐标值1,第一坐标值2缩放后得到的第四坐标值表示为第四坐标值2,第一坐标值3缩放后得到的第四坐标值表示为第四坐标值3,第一坐标值4缩放后得到的第四坐标值表示为第四坐标值4。那么,在第四坐标值1上填充的数值最大,在第四坐标值2上填充的数值次之,在第四坐标值3上填充的数值再次之,在第四坐标值4上填充的数值最小。
另外,在编码的过程中,还可以将多个第四坐标值相连得到一条连线,然后将该连线绘制到(即编码到)图像样本的第一数据通道上。
可选的,所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大。因此对于该第一参考信息包括第二坐标值和第三坐标值的情况(其他情况原理相同),该方案可以为:所述第二数据通道上,越靠近出口区域的第二坐标值缩放得到的第五坐标值表示的位置上填充的数值越大,越靠近出口区域中心位置的第三坐标值缩放得到的第六坐标值表示的位置上填充的数值越大。
举例来说,如果路口的某个出口方向上的虚拟车道线的第二坐标值有四个,依次表示为第二坐标值1、第二坐标值2、第二坐标值3和第二坐标值4,其中,第二坐标值1距离该某个出口方向上的出口区域最近,第二坐标值2次之,第二坐标值3再次之,第二坐标值4距离该某个出口方向上的出口区域最远;第二坐标值1缩放后得到的第五坐标值表示为第五坐标值1,第二坐标值2缩放后得到的第五坐标值表示为第五坐标值2,第二坐标值3缩放后得到的第五坐标值表示为第五坐标值3,第二坐标值4缩放后得到的第五坐标值表示为第五坐标值4。那么,在第五坐标值1上填充的数值最大,在第五坐标值2上填充的数值次之,在第五坐标值3上填充的数值再次之,在第五坐标值4上填充的数值最小。路口的其他出口方向上的虚拟车道线的第二坐标值缩放后的数值的填充原理以此类推。
再如,如果路口的某个出口方向上的出口区域包括四个第三坐标值,依次表示为第三坐标值1、第三坐标值2、第三坐标值3和第三坐标值4,其中,第三坐标值1距离出口区域的中心位置最近,第三坐标值2次之,第三坐标值3再次之,第三坐标值4距离该出口区域的中心位置最远;第三坐标值1缩放后得到的第六坐标值表示为第六坐标值1,第三坐标值2缩放后得到的第六坐标值表示为第六坐标值2,第三坐标值3缩放后得到的第六坐标值表示为第六坐标值3,第三坐标值4缩放后得到的第六坐标值表示为第六坐标值4。那么,在第六坐标值1上填充的数值最大,在第六坐标值2上填充的数值次之,在第六坐标值3上填充的数值再次之,在第六坐标值4上填充的数值最小。路口的其他出口方向上的出口区域的第三坐标值缩放后的数值的填充原理以此类推。
可选的,若所述第一参考信息包括所述第二坐标值和第三坐标值,则缩放后分别得到的所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据。
可选的,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据。
例如,如果第一参考信息包括4个出口方向上的第二坐标值,分别表示为方向1上的第二坐标值、方向2上的第二坐标值、方向3上的第二坐标值、方向4上的第二坐标值,那么,方向1上的第二坐标值缩放得到的第五坐标值、方向2上的第二坐标值缩放得到的第五坐标值、方向3上的第二坐标值缩放得到的第五坐标值、方向4上的第二坐标值缩放得到的第五坐标值分别用在4个不同的第二数据通道中填充数据。
再如,如果第一参考信息包括4个出口方向上的第三坐标值,分别表示为方向1上的第三坐标值、方向2上的第三坐标值、方向3上的第三坐标值、方向4上的第三坐标值,那么,方向1上的第三坐标值缩放得到的第六坐标值、方向2上的第三坐标值缩放得到的第六坐标值、方向3上的第三坐标值缩放得到的第六坐标值、方向4上的第三坐标值缩放得到的第六坐标值分别用在4个不同的第二数据通道中填充数据。
另外,在编码的过程中,还可以将多个第五坐标值(对应同一出口方向的)相连得到一条连线,然后将该连线绘制到(即编码到)图像样本的一个第二数据通道上。还可以将多个第六坐标值(对应同一出口方向的)相连得到一条连线,然后将该连线绘制到(即编码到)图像样本的又第二数据通道上。
可选的,对于任意一条行驶数据来说,该行驶数据还包括所述第一车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度。这里提及的行驶速度可以为一个或多个,当为多个是,例如,可以具体是在该行驶数据包括的第一坐标值的位置处采集的瞬时速度,因此,有多个第一坐标值,就可以采集到的多个瞬时速度,即多个行驶速度。那么在填充时,如果存在4个第一坐标值,分别表示为第一坐标值1、第一坐标值2、第一坐标值3和第一坐标值4,其中,第一坐标值1缩放得到的第四坐标值表示为第四坐标值1、第一坐标值2缩放得到的第四坐标值表示为第四坐标值2、第一坐标值3缩放得到的第四坐标值表示为第四坐标值3和第一坐标值4缩放得到的第四坐标值表示为第四坐标值4,那么,所述第三数据通道上第四坐标值1表示的位置填充了在第一坐标值1处采集的行驶速度,所述第三数据通道上第四坐标值2表示的位置填充了在第一坐标值2处采集的行驶速度,所述第三数据通道上第四坐标值3表示的位置填充了在第一坐标值3处采集的行驶速度,所述第三数据通道上第四坐标值4表示的位置填充了在第一坐标值4处采集的行驶速度。这里的速度可以为速度的绝对值。
可选的,对于任意一条行驶数据来说,该行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。例如,多个相对行驶朝向可以具体是在该行驶数据包括的第一坐标值的位置处采集的多个瞬时朝向,因此,有多个第一坐标值,就可以采集到多组的多个瞬时朝向。如果路口有4个出口方向,分别表示是出口方向1、出口方向2、出口方向3和出口方向4,那么第一坐标值处采集的相对行驶朝向具体为4个,其中,1个相对行驶朝向是以出口方向1为参照得到的朝向,1个相对行驶朝向是以出口方向2为参照得到的朝向,1个相对行驶朝向是以出口方向3为参照得到的朝向,1个相对行驶朝向是以出口方向4为参照得到的朝向。而一条轨迹上又有多个第一坐标值,因此,会存在多组多个相对行驶朝向,每个第一坐标值对应一组多个相对行驶朝向。
下面以其中一个第一坐标值为例讲述如何填充数值(其他第一坐标值的原理相同),如果第一坐标值缩放得到第四坐标值,那么,在第四数据通道1上第四坐标值表示的位置填充在第一坐标值处采集的相对于出口方向1的相对行驶朝向,在第四数据通道2上第四坐标值表示的位置填充在第一坐标值处采集的相对于出口方向2的相对行驶朝向,在第四数据通道3上第四坐标值表示的位置填充在第一坐标值处采集的相对于出口方向3的相对行驶朝向,在第四数据通道4上第四坐标值表示的位置填充在第一坐标值处采集的相对于出口方向4的相对行驶朝向。其中,第四数据通道1、第四数据通道2、第四数据通道3和第四数据通道4分别为四个不同的第四数据通道。
需要说明的是,对于任意一条行驶数据来说,其可以包括上述行驶速度和行驶朝向中的一个,或者两个,或者这两个都不包括。
由以上介绍可知,得到的每个图像样本实际为一个维度为(数据通道数量*图像高度*图像宽度)的一个张量。
需要说明的是,上述步骤S501和S502也可以由目标设备来完成,该目标设备专门用于对数据进行规范化处理,然后将规范化处理后的数据发送给模型训练设备,这样就无需模型训练设备对大量数据进行规范化处理,只需基于接收的规范数据,即上述多个样本数据,然后基于该多个样本数据对意图预测模型进行训练即可。可选的,该目标设备可以部署在云端,其具有较强的计算能力,能够高效的完成对大量数据的处理。
步骤S503:模型训练设备通过所述多个样本数据对车辆意图预测模型进行训练。
其中,所述多个样本数据中的每个样本数据包括所述多个图像样本中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的真实情况;因此,基于上述多个图像样本可以得到多个样本数据。
本申请实施例中,由于一个图像样本是由一条行驶数据编码得到,因此,一个图像样本中的第一车辆具体是指该一个图像样本对应的一条行驶数据中涉及的第一车辆,例如,该一条行驶数据描述了某个车辆在路口行驶的轨迹、行驶速度、行驶朝向等信息,那么,该一条行驶数据编码得到的一个图像样本中的第一车辆就是指该某个车辆。
如果路口有四个出口,分别为出口1、出口2、出口3和出口4,那么该一个样本数据中的标签信息包括四个标签值,分别对应这四个出口方向,其中每个出口方向对应一个标签值,表示为:标签信息(出口1标签值,出口2标签值,出口3标签值,出口4标签值);需要说明的是,在这四个出口中,哪个出口是该一个样数据中的图像样本涉及的第一车辆的真实出口,则可以将该出口的标签值标为第一值,其余非真实出口得标签值可以标为第二值,以第一值为1,第二值为0,出口2为真实出口,出口1、出口3和出口4为非真实出口为例,那么一个样本数据中的标签信息为(0,1,0,0)。
本申请实施例中,图像样本涉及的第一车辆的真实出口,实际上就是编码得到该图像样本的一条行驶数据中涉及的一条轨迹的终点方向所指示的出口。因此,在每个图像样本涉及的第一车辆的真实出口、非真实出口都是已知的情况下,可以确定每个图像样本对应的标签信息,进而基于该图像样本和该图像样本对应的标签信息确定一条样本数据。
本申请实施例中,对多个样本数据进行训练,实质就是学习图像样本的各个维度的信息与标签信息之间的深层次关系,图6示意了训练过程的算法框架,具体以路口有三个出口方向为例进行了示意,由于第四坐标值(与轨迹相关)对应的数据通道有1个,对应于3个出口方向的3个第五坐标值(与虚拟车道线相关)对应的数据通道有3个,对应于3个出口方向的3个第六坐标值(与出口区域相关)对应的数据通道有3个,对应于3个出口方向的3个相对行驶朝向对应的数据通道有3个,行驶速度对应的数据通道有1个,因此,总共有11个数据通道,将包括11个数据通道的图像样本输入神经网络,具体将这11个数据通道按照出口进行组合,得到3组分别对应于3出口方向的输入张量,具体如下:
对应于出口方向1的输入张量包括第一数据通道、第二数据通道11、第二数据通道12、第三数据通道、第四数据通道,其中,第一数据通道为填充了第四坐标值(基于第一车辆的轨迹变换得到)的数据通道、第二数据通道11为填充了第五坐标值(基于出口方向1上的虚拟车道线变换得到)的数据通道、第二数据通道12为填充了第六坐标值(基于出口方向1上的出口区域变换得到)的数据通道、第三数据通道为填充了第一车辆在行驶过程中的行驶速度的数据通道、第四数据通道为填充了第一车辆在行驶过程中相对于出口方向1的相对行驶朝向的数据通道。
对应于出口方向2的输入张量包括第一数据通道、第二数据通道21、第二数据通道22、第三数据通道、第四数据通道,其中,第一数据通道为填充了第四坐标值(基于第一车辆的轨迹变换得到)的数据通道、第二数据通道21为填充了第五坐标值(基于出口方向2上的虚拟车道线变换得到)的数据通道、第二数据通道22为填充了第六坐标值(基于出口方向2上的出口区域变换得到)的数据通道、第三数据通道为填充了第一车辆在行驶过程中的行驶速度的数据通道、第四数据通道为填充了第一车辆在行驶过程中相对于出口方向2的相对行驶朝向的数据通道。
对应于出口方向3的输入张量包括第一数据通道、第二数据通道31、第二数据通道32、第三数据通道、第四数据通道,其中,第一数据通道为填充了第四坐标值(基于第一车辆的轨迹变换得到)的数据通道、第二数据通道31为填充了第五坐标值(基于出口方向3上的虚拟车道线变换得到)的数据通道、第二数据通道32为填充了第六坐标值(基于出口方向3上的出口区域变换得到)的数据通道、第三数据通道为填充了第一车辆在行驶过程中的行驶速度的数据通道、第四数据通道为填充了第一车辆在行驶过程中相对于出口方向3的相对行驶朝向的数据通道。
因此,将各个出口的输入张量经过卷积神经网络后得到的输出经过softmax后,预测各个出口的意图概率;构建交叉熵损失函数,表示预测出的意图概率与标签信息表示的真实出口情况的差异的范围,基于该交叉熵损失函数对卷积神经网络的进行训练,从而训练得到一个预测准确度较高的意图预测模型。后续,向该意图预测模型输入一个图像样本后,就可以预测出车辆向所述路口各个方向的行驶的概率,即行驶意图。
可选的,车辆意图预测模型是可以持续进化的,特别是训练意图预测模型由云端实现的时候,随着训练数据的增加,意图预测模型可以持续进化/更新,更新后的意图预测模型(或者只是其参数)可以发送给预测设备(如车辆)以更新预测设备的模型。
步骤S504:预测设备获取意图预测模型。
本申请实施例中,该预测设备可以为部署在云端的虚拟机,或者一台服务器,或者多台服务器组成的服务器集群,或者车辆,下面以该预测设备为车辆为例进行描述。
车辆获取车辆意图预测模型的方式有很多,例如,车辆与上述模型训练设备之间建立了无线或有线通信连接,因此可以接收该模型训练设备发送的意图预测模型。再如,通过人工的方式将意图预测模型从模型训练设备拷贝到车辆中。
可选的,该车辆上的意图预测模型可以定期或者不定期的更新。例如,每隔一个月进行一次更新,这就属于定期更新;再如,在新的意图预测模型生成时进行一次更新,这就属于不定期更新。
步骤S505:预测设备获取目标行驶数据。
下面以预测设备为车辆为例进行描述。
其中,目标行驶数据包括第一参考信息和第二车辆行驶经过路口时的一条轨迹的第一坐标值,该路口前面已有介绍,此处不再赘述。
可选的,这目标行驶数据描述的第二车辆与上述多条行驶数据描述的第一车辆可以为相同车辆,也可以为不同车辆,可以来自相同的路口,也可以来自不同路口。
首先,目标行驶数据包括的一条轨迹的第一坐标值通常包括多个坐标值,例如,对行驶轨迹进行采样,采样得到的坐标值即为该第一坐标值。
可选的,该一条轨迹的第一坐标值所在坐标系的原点是该一条轨迹的起始点。
其次,目标行驶数据包括的第一参考信息具体包括路口的各个出口方向上的虚拟车道线的第二坐标值和/或路口的各个出口方向上的出口区域的第三坐标值;虚拟车道线的第二坐标值所在坐标系的原点,以及出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点。
举例来说,如果路口有四个出口方向,分别表示为出口方向1、出口方向2、出口方向3和出口方向4,如果第一参考信息包括第二坐标值,那么第一参考信息具体包括路口处,通向出口方向1的虚拟车道线的第二坐标值、通向出口方向2的虚拟车道线的第二坐标值、通向出口方向3的虚拟车道线的第二坐标值、通向出口方向4的虚拟车道线的第二坐标值。另外,对于任意一个出口方向而言,该出口方向上的虚拟车道线的第二坐标值是对该虚拟车道线进行采样得到的,因此该出口方向上的虚拟车道线的第二坐标值的数量通常为多个。
同理,如果路口有四个出口方向,分别表示为出口方向1、出口方向2、出口方向3和出口方向4,如果第一参考信息包括第三坐标值,那么第一参考信息具体包括路口处,出口方向1上的出口区域的第三坐标值、出口方向2上的出口区域的第三坐标值、出口方向3上的出口区域的第三坐标值、出口方向4上的出口区域的第三坐标值。另外,对于任意一个出口方向而言,该出口方向上的出口区域的第三坐标值是对该出口区域进行采样得到的,因此该出口方向上的出口区域的第三坐标值的数量通常为多个。可选的,采样该出口区域的中心位置作为一个第三坐标值,另外围绕该中心位置再采集一些偏离中心位置的其他位置作为一些第三坐标值。
本申请实施例中,路口的很多信息(如虚拟车道线、出口区域、出口区域的中心位置)的初始来源可以是高精度地图,因此,这些信息都是通过相应算法预先设定或者选择好了,这些信息可以认为是已知的一些信息。但是本申请实施例会对这些高精度地图中的初始信息以行驶数据为参照进行变换,例如,再高精度地图中,虚拟车道线、出口区域、出口区域的中心位置再高精度地图是有原始的坐标原点为参照的,但是本申请实施例需要将这些虚拟车道线、出口区域、出口区域的中心位置的坐标原点变换成该一条轨迹的起始点,即,将一个坐标系中的内容映射到了另一个坐标系中;从而得到本申请实施例中的目标驾驶数据中的虚拟车道线、出口区域、出口区域的中心位置的坐标值。
可选的,目标行驶数据还可以包括第二车辆行驶经过路口时的一条轨迹上的驾驶速度和/驾驶朝向,例如,上述第一坐标值处的驾驶速度和/或驾驶朝向。
步骤S506:预测设备对目标行驶数据进行栅格化编码得到目标图像样本。
下面以预测设备为车辆为例进行描述。
其中,目标行驶数据用于栅格化编码得到目标图像样本,其中,目标行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述目标图像样本中的不同数据通道中。
例如,上述一条轨迹的坐标值、虚拟车道线的坐标值、出口区域的坐标值分别为三种不同类型的数据,当该目标行驶数据还包括行驶速度和相对行驶朝向时,该行驶速度和该相对行驶朝向又属于另外两种不同类型的数据。再如,如果路口有4个不同出口方向,那么单就虚拟车道线而言,四个不同出口方向的虚拟车道线分别对应四个数据通道(一个出口方向对应一个数据通道)。并且,相对朝向是相对于出口方向的,因此,当存在4个不同出口方向时,就会有四个不同的相对行驶朝向,也需要分别对应四个数据通道。
因此,如果目标行驶数据包括第一坐标值、分别对应于四个出口方向的第二坐标值、分别对应于四个出口方向的第三坐标值,那么综合考虑数据类型、出口方向两个维度的话,该目标行驶数据需要编码到一个具有9个数据通道的目标图像样本上。
同理,如果目标行驶数据包括第一坐标值、分别对应于四个出口方向的第二坐标值、分别对应于四个出口方向的第三坐标值、行驶速度、分别对应四个出口方向的相对行驶朝向,那么综合考虑数据类型、出口方向两个维度的话,该目标行驶数据需要编码到一个具有14个数据通道的目标图像样本上。
为了便于理解,下面详细讲述如何对目标行驶数据进行栅格化编码,得到目标图像样本:
首先,根据参考图像的规格和目标行驶数据中的轨迹的起点确定第二缩放因子;可选的,该参考图像的规格可以认为是设定的一个期望图像规格,该规格至少包括图像高(height)和图像宽(width)这两项参数,能够体现参考图像的大小。需要说明的是,确定第二缩放因子过程中,除了用到参考图像的规格和目标行驶数据中的轨迹的起点外,还可能会用到其他信息,例如,路口的各个出口区域的第三坐标值,可选的,第二缩放因子满足如下关系:
Figure BDA0002706479820000201
其中,scale为所述第二缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P0,Gi‖表示所述目标行驶数据中的轨迹的起点P0与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
然后,根据所述第二缩放因子对所述目标行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息。具体来说,如果第一参考信息包括第二坐标值不包括第三坐标值,那么需要根据第一缩放因子对第一坐标值、第二坐标值进行缩放处理;如果第一参考信息包括第三坐标值不包括第二坐标值,那么需要根据第一缩放因子对第一坐标值、第三坐标值进行缩放处理;如果第一参考信息包括第二坐标值和第三坐标值,那么需要根据第一缩放因子对第一坐标值、第二坐标值、第三坐标值进行缩放处理。
例如,如果计算得到的第二缩放因子scale=0.85,第一坐标值为(54,66),第一参考信息包括第二坐标值和第三坐标值,且第二坐标值为(84,26),第三坐标值为(28,96),那么,第一坐标值(54,66)缩放后得到的第四坐标值为(45.9,56.1),第二坐标值(84,26)缩放后得到的第五坐标值为(71.4,22.1),第三坐标值(28,96)缩放后得到的第五坐标值为(23.8,81.6)。
接着,生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,所述第一数据通道上所述第四坐标值表示的位置填充了数值,所述至少一个第二数据通道上所述第二参考信息表示的位置填充了数值。
可选的,所述第一数据通道上,对应的时间越靠后的对应时间越靠后第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;由于该一条轨迹是由顺序依次产生的多个位置构成,因此可以认为该一条轨迹上的不同第一坐标值是存在先后顺序的,因此,对应的时间越靠后的第一坐标值也相当于距离该一条轨迹的终点越近的第一坐标值。通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,从而增强了对靠近轨迹终点的坐标的识别能力,因此后续以此为基础得到的意图预测模型的准确度更高。
举例来说,如果该一条轨迹上包括四个第一坐标值,依次表示为第一坐标值1、第一坐标值2、第一坐标值3和第一坐标值4,其中,第一坐标值1对应的时间最靠后,第一坐标值2次之,第一坐标值3再次之,第一坐标值4对应的时间最靠前;第一坐标值1缩放后得到的第四坐标值表示为第四坐标值1,第一坐标值2缩放后得到的第四坐标值表示为第四坐标值2,第一坐标值3缩放后得到的第四坐标值表示为第四坐标值3,第一坐标值4缩放后得到的第四坐标值表示为第四坐标值4。那么,在第四坐标值1上填充的数值最大,在第四坐标值2上填充的数值次之,在第四坐标值3上填充的数值再次之,在第四坐标值4上填充的数值最小。
可选的,所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大。因此对于该第一参考信息包括第二坐标值和第三坐标值的情况(其他情况原理相同),该方案可以为:所述第二数据通道上,越靠近出口区域的第二坐标值缩放得到的第五坐标值表示的位置上填充的数值越大,越靠近出口区域中心位置的第三坐标值缩放得到的第六坐标值表示的位置上填充的数值越大。
举例来说,如果路口的某个出口方向上的虚拟车道线的第二坐标值有四个,依次表示为第二坐标值1、第二坐标值2、第二坐标值3和第二坐标值4,其中,第二坐标值1距离该某个出口方向上的出口区域最近,第二坐标值2次之,第二坐标值3再次之,第二坐标值4距离该某个出口方向上的出口区域最远;第二坐标值1缩放后得到的第五坐标值表示为第五坐标值1,第二坐标值2缩放后得到的第五坐标值表示为第五坐标值2,第二坐标值3缩放后得到的第五坐标值表示为第五坐标值3,第二坐标值4缩放后得到的第五坐标值表示为第五坐标值4。那么,在第五坐标值1上填充的数值最大,在第五坐标值2上填充的数值次之,在第五坐标值3上填充的数值再次之,在第五坐标值4上填充的数值最小。路口的其他出口方向上的虚拟车道线的第二坐标值缩放后的数值的填充原理以此类推。
再如,如果路口的某个出口方向上的出口区域包括四个第三坐标值,依次表示为第三坐标值1、第三坐标值2、第三坐标值3和第三坐标值4,其中,第三坐标值1距离出口区域的中心位置最近,第三坐标值2次之,第三坐标值3再次之,第三坐标值4距离该出口区域的中心位置最远;第三坐标值1缩放后得到的第六坐标值表示为第六坐标值1,第三坐标值2缩放后得到的第六坐标值表示为第六坐标值2,第三坐标值3缩放后得到的第六坐标值表示为第六坐标值3,第三坐标值4缩放后得到的第六坐标值表示为第六坐标值4。那么,在第六坐标值1上填充的数值最大,在第六坐标值2上填充的数值次之,在第六坐标值3上填充的数值再次之,在第六坐标值4上填充的数值最小。路口的其他出口方向上的出口区域的第三坐标值缩放后的数值的填充原理以此类推。
可选的,若所述第一参考信息包括所述第二坐标值和第三坐标值,则缩放后分别得到的所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据。
可选的,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据。
例如,如果第一参考信息包括4个出口方向上的第二坐标值,分别表示为方向1上的第二坐标值、方向2上的第二坐标值、方向3上的第二坐标值、方向4上的第二坐标值,那么,方向1上的第二坐标值缩放得到的第五坐标值、方向2上的第二坐标值缩放得到的第五坐标值、方向3上的第二坐标值缩放得到的第五坐标值、方向4上的第二坐标值缩放得到的第五坐标值分别用在4个不同的第二数据通道中填充数据。
再如,如果第一参考信息包括4个出口方向上的第三坐标值,分别表示为方向1上的第三坐标值、方向2上的第三坐标值、方向3上的第三坐标值、方向4上的第三坐标值,那么,方向1上的第三坐标值缩放得到的第六坐标值、方向2上的第三坐标值缩放得到的第六坐标值、方向3上的第三坐标值缩放得到的第六坐标值、方向4上的第三坐标值缩放得到的第六坐标值分别用在4个不同的第二数据通道中填充数据。
可选的,目标行驶数据还包括所述第二车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度。这里提及的行驶速度可以为一个或多个,当为多个是,例如,可以具体是在该目标行驶数据包括的第一坐标值的位置处采集的瞬时速度,因此,有多个第一坐标值,就可以采集到的多个瞬时速度,即多个行驶速度。那么在填充时,如果存在4个第一坐标值,分别表示为第一坐标值1、第一坐标值2、第一坐标值3和第一坐标值4,其中,第一坐标值1缩放得到的第四坐标值表示为第四坐标值1、第一坐标值2缩放得到的第四坐标值表示为第四坐标值2、第一坐标值3缩放得到的第四坐标值表示为第四坐标值3和第一坐标值4缩放得到的第四坐标值表示为第四坐标值4,那么,所述第三数据通道上第四坐标值1表示的位置填充了在第一坐标值1处采集的行驶速度,所述第三数据通道上第四坐标值2表示的位置填充了在第一坐标值2处采集的行驶速度,所述第三数据通道上第四坐标值3表示的位置填充了在第一坐标值3处采集的行驶速度,所述第三数据通道上第四坐标值4表示的位置填充了在第一坐标值4处采集的行驶速度。这里的速度可以为速度的绝对值。
可选的,目标行驶数据还包括所述第二车辆在所述一条轨迹上的多个相对行驶朝向,所述目标图像样本还包括多个第四数据通道,每个第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。例如,多个相对行驶朝向可以具体是在该目标行驶数据包括的第一坐标值的位置处采集的多个瞬时朝向,因此,有多个第一坐标值,就可以采集到多组的多个瞬时朝向。如果路口有4个出口方向,分别表示是出口方向1、出口方向2、出口方向3和出口方向4,那么第一坐标值处采集的相对行驶朝向具体为4个,其中,1个相对行驶朝向是以出口方向1为参照得到的朝向,1个相对行驶朝向是以出口方向2为参照得到的朝向,1个相对行驶朝向是以出口方向3为参照得到的朝向,1个相对行驶朝向是以出口方向4为参照得到的朝向。而一条轨迹上又有多个第一坐标值,因此,会存在多组多个相对行驶朝向,每个第一坐标值对应一组多个相对行驶朝向。
下面以其中一个第一坐标值为例讲述如何填充数值(其他第一坐标值的原理相同),如果第一坐标值缩放得到第四坐标值,那么,在第四数据通道1上第四坐标值表示的位置填充在第一坐标值处采集的相对于出口方向1的相对行驶朝向,在第四数据通道2上第四坐标值表示的位置填充在第一坐标值处采集的相对于出口方向2的相对行驶朝向,在第四数据通道3上第四坐标值表示的位置填充在第一坐标值处采集的相对于出口方向3的相对行驶朝向,在第四数据通道4上第四坐标值表示的位置填充在第一坐标值处采集的相对于出口方向4的相对行驶朝向。其中,第四数据通道1、第四数据通道2、第四数据通道3和第四数据通道4分别为四个不同的第四数据通道。
需要说明的是,目标行驶数据可以包括上述行驶速度和行驶朝向中的一个,或者两个,或者这两个都不包括。
由以上介绍可知,得到的目标图像样本实际为一个维度为(数据通道数量*图像高度*图像宽度)的一个张量。
步骤S507:预测设备将所述目标图像样本输入到所述车辆意图预测模型,得出所述目标图像样本中的第二车辆往所述各个出口中每个出口行驶的意图概率。
下面以预测设备为车辆为例进行描述。
由于在训练意图预测模型的过程中,标签信息体现了车辆从路口的各个出口驶出的真实情况,因此,将目标图像样本输入到意图预测模型,可以预测目标图像样本中的第二车辆往所述各个出口中每个出口行驶的情况,即往所述各个出口中每个出口行驶的意图概率。
例如,将目标图像样本输入到意图预测模型之后,输出的预测信息为(0.06,0.50,0.11,0.13),其表明目标图像样本中的第二车辆往路口的出口1行驶的概率为0.06,往路口的出口2行驶的概率为0.50,往路口的出口3行驶的概率为0.11,往路口的出口4行驶的概率为0.13。
可以看出,本申请实施例属于针对多个出口的多模态意图预测。
另外,本申请中基于意图预测模型预测意图概率的车辆,可以为上述第一车辆,或者第二车辆,或者是其他的车辆。
采用本申请实施例能过达到如下效果:
预测精度高:传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息。
运行效率高:由于本申请的轨迹上的第一坐标值、虚拟车道线上的第二坐标值、出口区域上的第三坐标值都是以车辆在路口的起始位置为参照,因此当基于某一条轨迹对应的行驶数据生成图像样本后,如果车辆继续行驶,那么继续行驶产生的数据可以直接补充到该图像样本中,无需重新生成新的图像样本,无需重新构建新的图像坐标,相当于图像样本可以一次生成、多次利用,能够降低运算成本;另外,本申请神经网络模型精简,占用存储小,运算效率高。
泛化性好:由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
抗噪性能好:以编码图片方式实现预测,对车辆位置抖动不敏感,受感知精度影响较小。
有效解决多模态问题:将出口意图预测抽象为二分类问题,即车辆与路口每个出口的匹配,当车辆意图不明显时会匹配多个出口,从而解决多模态问题。
外界依赖条件弱:不强依赖精准的高精地图车道线,即便高精度地图中部分信息缺失,依然有较高的预测精度。另外,由于本申请中涉及的位置相关的信息,大部分都转换为了以车辆在路口的起始位置(即轨迹的起始位置)为坐标原点,使得这些信息更能够体现车辆的运行状态,因此,基于这些信息进行意图预测,准确度更高,也降低了对高精度的依赖。
另外,如果将行驶速度和/或行驶朝向也纳入到编码范围,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
请参见图7,图7是本申请实施例提供的一种模型训练设备70,该模型训练设备为一个服务,或者为由多个服务器组成的服务器集群,或者为云端的虚拟机,该模型训练设备70包括处理器701、存储器702和通信接口703,所述处理器701、存储器702和通信接口703通过总线相互连接。
存储器702包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmableread only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器702用于相关计算机程序及数据。通信接口703用于接收和发送数据。
处理器701可以是一个或多个中央处理器(central processing unit,CPU),在处理器701是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
该模型训练设备70中的处理器701用于读取所述存储器702中存储的计算机程序代码,执行以下操作:
获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别编码到所述一个图像样本中的不同数据通道中;
通过所述多个样本数据对车辆意图预测模型进行训练,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的真实情况。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
在一种可选的方案中,在对所述多条行驶数据进行栅格化编码得到多个图像样本,该处理器701具体用于:
根据参考图像的规格和第一行驶数据中的轨迹的起点确定第一缩放因子,其中,所述第一行驶数据为所述多条行驶数据中的任意一条行驶数据;
根据所述第一缩放因子对所述第一行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
其中,所述第一数据通道上,对应的时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第一缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第一缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
在又一种可选的方案中:
所述行驶数据还包括所述第一车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
在又一种可选的方案中,所述第一缩放因子满足如下关系:
Figure BDA0002706479820000261
其中,scale为所述第一缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P,Gi‖表示所述第一行驶数据中的轨迹的起点P与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
在这种计算方式中,分子取图像高和图像宽中的最小值,车辆的活动范围取了路口区域的尽可能大的区域,因此经过这种方式计算出的scale对第一坐标值、第二坐标值、第三坐标值等坐标值进行缩放后,这些坐标值基本不会超出图像坐标值范围,能够保证栅格化编码后信息不丢失。
在又一种可选的方案中,该处理器701还用于通过通信接口703向预测设备发送所述意图预测模型。
可以理解,将该意图预测模型发送给预测设备,由预测设备对车辆的意图进行预测,预测结果能够帮助车辆合理地进行驾驶控制,提高驾驶安全性。
需要说明的是,各个操作的实现还可以参照图5所示的方法实施例的相应描述。
请参见图8,图8是本申请实施例提供的一种预测设备80,该预测设备80可以为车辆、或者部署在云端的虚拟机、或者一台服务器,或者多台服务器组成的服务器集群;该预测设备80包括处理器801、存储器802和通信接口803,所述处理器801、存储器802和通信接口803通过总线相互连接。
存储器802包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmableread only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器802用于相关计算机程序及数据。通信接口803用于接收和发送数据。
处理器801可以是一个或多个中央处理器(central processing unit,CPU),在处理器801是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
该预测设备80中的处理器801用于读取所述存储器802中存储的计算机程序代码,执行以下操作:
获取意图预测模型,其中,所述意图预测模型用于对车辆向路口各个方向的行驶的意图进行预测;
获取目标行驶数据,其中,所述目标行驶数据包括第一参考信息和第二车辆行驶经过所述路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
对所述目标行驶数据进行栅格化编码得到目标图像样本,其中所述目标行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
将所述目标图像样本输入到所述意图预测模型,得到所述第二车辆向所述路口各个方向的行驶的意图概率。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
在一种可选的方案中,在获取意图预测模型方面,所述处理器801具体用于:
通过通信接口803接收模型训练设备发送的意图预测模型,其中,所述意图预测模型为基于由多条行驶数据栅格化编码得到的多个图像样本训练得到的,所述多条行驶数据中每条行驶数据的数据格式与所述目标行驶数据的数据格式相同。
在又一种可选的方案中,在对所述目标行驶数据进行栅格化编码得到目标图像样本方面,所述处理器801具体用于:
根据参考图像的规格和目标行驶数据中的轨迹的起点确定第二缩放因子;
根据所述第二缩放因子对所述目标行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述目标行驶数据对应的目标图像样本,其中,所述目标图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
所述第一数据通道上,对应的时间越靠后对应时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第二缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第二缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
在又一种可选的方案中:
所述行驶数据还包括所述第二车辆在所述一条轨迹上的行驶速度,所述目标图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
在又一种可选的方案中,所述第二缩放因子满足如下关系:
Figure BDA0002706479820000281
其中,scale为所述第二缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P0,Gi‖表示所述目标行驶数据中的轨迹的起点P0与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
在这种计算方式中,分子取图像高和图像宽中的最小值,车辆的活动范围取了路口区域的尽可能大的区域,因此经过这种方式计算出的scale对第一坐标值、第二坐标值、第三坐标值等坐标值进行缩放后,这些坐标值基本不会超出图像坐标值范围,能够保证栅格化编码后信息不丢失。
需要说明的是,各个操作的实现还可以参照图5所示的方法实施例的相应描述。
请参见图9,图9是本申请实施例提供的一种进行图像数据处理的目标设备90,该目标设备90为一个服务器,或者为由多个服务器组成的服务器集群,或者为部署在云端的虚拟机,该目标设备90包括处理器901、存储器902和通信接口903,所述处理器901、存储器902和通信接口903通过总线相互连接。
存储器902包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmableread only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器902用于相关计算机程序及数据。通信接口903用于接收和发送数据。
处理器901可以是一个或多个中央处理器(central processing unit,CPU),在处理器901是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
该目标设备90中的处理器901用于读取所述存储器902中存储的计算机程序代码,执行以下操作:
获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别编码到所述一个图像样本中的不同数据通道中;
向模型训练设备发送所述多个样本数据,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的意图真实情况。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,后续用于模型训练时,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此这样的样本数据后续用于模型训练时,能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
在一种可选的方案中,在对所述多条行驶数据进行栅格化编码得到多个图像样本,该处理器901具体用于:
根据参考图像的规格和第一行驶数据中的轨迹的起点确定第一缩放因子,其中,所述第一行驶数据为所述多条行驶数据中的任意一条行驶数据;
根据所述第一缩放因子对所述第一行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
其中,所述第一数据通道上,对应的时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第一缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第一缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
在又一种可选的方案中:
所述行驶数据还包括所述第一车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
在又一种可选的方案中,所述第一缩放因子满足如下关系:
Figure BDA0002706479820000301
其中,scale为所述第一缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P,Gi‖表示所述第一行驶数据中的轨迹的起点P与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
在这种计算方式中,分子取图像高和图像宽中的最小值,车辆的活动范围取了路口区域的尽可能大的区域,因此经过这种方式计算出的scale对第一坐标值、第二坐标值、第三坐标值等坐标值进行缩放后,这些坐标值基本不会超出图像坐标值范围,能够保证栅格化编码后信息不丢失。
需要说明的是,各个操作的实现还可以参照图5所示的方法实施例的相应描述。
请参见图10,图10是本申请实施例提供的一种车辆意图预存模型的训练装置100的结构示意图,该装置100可以为上述模型训练设备,或者上述模型训练设备中的器件或模块,该装置100可以包括获取单元1001、编码单元1002和训练单元1003,其中,各个单元的详细描述如下。
获取单元1001,用于获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过目标路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
编码单元1002,用于对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
训练单元1003,用于通过所述多个样本数据对车辆意图预测模型进行训练,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的真实情况。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
在一种可选的方案中,在对所述多条行驶数据进行栅格化编码得到多个图像样本,所述编码单元1002具体用于:
根据参考图像的规格和第一行驶数据中的轨迹的起点确定第一缩放因子,其中,所述第一行驶数据为所述多条行驶数据中的任意一条行驶数据;
根据所述第一缩放因子对所述第一行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
其中,所述第一数据通道上,对应的时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第一缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第一缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
在又一种可选的方案中:
所述行驶数据还包括所述第一车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
在又一种可选的方案中,所述第一缩放因子满足如下关系:
Figure BDA0002706479820000321
其中,scale为所述第一缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P,Gi‖表示所述第一行驶数据中的轨迹的起点P与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
在这种计算方式中,分子取图像高和图像宽中的最小值,车辆的活动范围取了路口区域的尽可能大的区域,因此经过这种方式计算出的scale对第一坐标值、第二坐标值、第三坐标值等坐标值进行缩放后,这些坐标值基本不会超出图像坐标值范围,能够保证栅格化编码后信息不丢失。
在又一种可选的方案中,该装置还包括:
发送单元,用于向预测设备发送所述意图预测模型。
可以理解,将该意图预测模型发送给预测设备,由预测设备对车辆的意图进行预测,预测结果能够帮助车辆合理地进行驾驶控制,提高驾驶安全性。
需要说明的是,各个单元的实现还可以对应参照图5所示的方法实施例的相应描述。
请参见图11,图11是本申请实施例提供的一种车辆意图预测装置110的结构示意图,该装置110可以为上述预测设备,或者上述预测设备中的器件或模块,该装置110可以包括第一获取单元1101、第二获取单元1102、编码单元1103和预测单元1104,其中,各个单元的详细描述如下。
第一获取单元1101,用于获取意图预测模型,其中,所述意图预测模型用于对车辆向路口各个方向的行驶的意图进行预测;
第二获取单元1102,用于获取目标行驶数据,其中,所述目标行驶数据包括第一参考信息和第二车辆行驶经过所述路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
编码单元1103,用于对所述目标行驶数据进行栅格化编码得到目标图像样本,其中所述目标行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
预测单元1104,用于将所述目标图像样本输入到所述意图预测模型,得到所述第二车辆向所述路口各个方向的行驶的意图概率。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
在一种可选的方案中,在对所述目标行驶数据进行栅格化编码得到目标图像样本方面,所述编码单元1103具体用于:
根据参考图像的规格和目标行驶数据中的轨迹的起点确定第二缩放因子;
根据所述第二缩放因子对所述目标行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述目标行驶数据对应的目标图像样本,其中,所述目标图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
所述第一数据通道上,对应的时间越靠后对应时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第二缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第二缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
在又一种可选的方案中:所述行驶数据还包括所述第二车辆在所述一条轨迹上的行驶速度,所述目标图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;和/或,所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。在一种可选的方案中,所述第二缩放因子满足如下关系:
Figure BDA0002706479820000341
其中,scale为所述第二缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P0,Gi‖表示所述目标行驶数据中的轨迹的起点P0与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
在这种计算方式中,分子取图像高和图像宽中的最小值,车辆的活动范围取了路口区域的尽可能大的区域,因此经过这种方式计算出的scale对第一坐标值、第二坐标值、第三坐标值等坐标值进行缩放后,这些坐标值基本不会超出图像坐标值范围,能够保证栅格化编码后信息不丢失。
需要说明的是,各个单元的实现还可以对应参照图5所示的方法实施例的相应描述。
请参见图12,图12是本申请实施例提供的一种进行图像数据处理装置120的结构示意图,该装置120可以为上述目标设备,或者上述目标设备中的器件或模块,该装置120可以包括获取单元1201、编码单元1202和发送单元1203,其中,各个单元的详细描述如下。
获取单元1201,用于获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过目标路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
编码单元1202,用于对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
发送单元1203,用于向模型训练设备发送所述多个样本数据,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的意图真实情况。
需要说明的是,传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息,因此针对车辆意图的预测精度较高。并且,由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
在一种可选的方案中,在对所述多条行驶数据进行栅格化编码得到多个图像样本,所述编码单元1202具体用于:
根据参考图像的规格和第一行驶数据中的轨迹的起点确定第一缩放因子,其中,所述第一行驶数据为所述多条行驶数据中的任意一条行驶数据;
根据所述第一缩放因子对所述第一行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;采用这种方式,通过在第一数据通道的第四坐标值上填充数据,以及在第二数据通道的第二参考信息上填充数值,有效地将轨迹的相关信息、虚拟车道线的相关信息、出口区域的相关信息编码到了图像;并且,引入缩放因子能够保证相关数据完整体现到图像而不溢出。
其中,所述第一数据通道上,对应的时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;需要说明的是,通过将数据通道中填充的数值设置为渐进变化来体现相应坐标值距离轨迹终点(一般靠近出口),或者出口区域,或者出口区域的中心位置的远近,即相当于通过亮度或者颜色深度体现了车辆距离轨迹终点,或者出口区域,或者出口区域的中心位置的远近,从而增强了对靠近轨迹终点,或者出口区域,或者出口区域的中心位置的坐标的识别能力,因此最终得到的意图预测模型的准确度更高。
另外,若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第一缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第一缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;并且,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;可以理解,虚拟车道线相关的第五坐标值和出口区域相关的第六坐标值分别体现到不同的数据通道,不同出口方向的信息分别体现到不同的数据通道,更有效地避免了不同信息的相互干扰。
在又一种可选的方案中:
所述行驶数据还包括所述第一车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
这种方式中,意图预测模型的预测中引入了行驶速度和/行驶朝向的因素,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
在又一种可选的方案中,所述第一缩放因子满足如下关系:
Figure BDA0002706479820000351
其中,scale为所述第一缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P,Gi‖表示所述第一行驶数据中的轨迹的起点P与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
在这种计算方式中,分子取图像高和图像宽中的最小值,车辆的活动范围取了路口区域的尽可能大的区域,因此经过这种方式计算出的scale对第一坐标值、第二坐标值、第三坐标值等坐标值进行缩放后,这些坐标值基本不会超出图像坐标值范围,能够保证栅格化编码后信息不丢失。
需要说明的是,各个单元的实现还可以对应参照图5所示的方法实施例的相应描述。
本申请实施例还提供一种芯片系统,所述芯片系统包括至少一个处理器,存储器和接口电路,所述存储器、所述收发器和所述至少一个处理器通过线路互联,所述至少一个存储器中存储有计算机程序;所述计算机程序被所述处理器执行时,图5所示的方法流程得以实现。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在处理器上运行时,图5所示的方法流程得以实现。
本申请实施例还提供一种计算机程序产品,当所述计算机程序产品在处理器上运行时,图5所示的方法流程得以实现。
综上所述,采用本申请实施例能过达到如下效果:
预测精度高:传统的图像一般为3个数据通道,分别代表红、绿、蓝三种基色,传统方法采用不同颜色编码不同信息,每种编码颜色实际上在三个数据通道上同时进行了编码。本申请实施例不存在编码颜色的概念,而是将不同类型的信息、对应不同出口方向的信息编码至单独的数据通道,避免复杂信息的重叠,不同信息之间不存在相互交叉和干扰,更容易学习到不同元素的潜在信息。
运行效率高:由于本申请的轨迹上的第一坐标值、虚拟车道线上的第二坐标值、出口区域上的第三坐标值都是以车辆在路口的起始位置为参照,因此当基于某一条轨迹对应的行驶数据生成图像样本后,如果车辆继续行驶,那么继续行驶产生的数据可以直接补充到该图像样本中,无需重新生成新的图像样本,无需重新构建新的图像坐标值,相当于图像样本可以一次生成、多次利用,能够降低运算成本;另外,本申请神经网络模型精简,占用存储小,运算效率高。
泛化性好:由于本申请针对不同类型的信息、对应不同出口方向的信息编码到不同的数据通道,因此无论路口的出口数量多或者少,简单或者复杂,均可以根据实际需要设置相应数量的数据通道,比较灵活;同时也无需设计特征,通过神经网络学习深层逻辑,能够覆盖各种复杂场景。另外,由于数据通道按照出口方向进行了划分,因此能够准确的训练各个出口方向的特性,从而预测各个出口方向的行驶意图概率,相当于一个可变数量的分类框架,能够适应不同出口数量的路口。
抗噪性能好:以编码图片方式实现预测,对车辆位置抖动不敏感,受感知精度影响较小。
有效解决多模态问题:将出口意图预测抽象为二分类问题,即车辆与路口每个出口的匹配,当车辆意图不明显时会匹配多个出口,从而解决多模态问题。
外界依赖条件弱:不强依赖精准的高精地图车道线,即便高精度地图中部分信息缺失,依然有较高的预测精度。另外,由于本申请中涉及的位置相关的信息,大部分都转换为了以车辆在路口的起始位置(即轨迹的起始位置)为坐标原点,使得这些信息更能够体现车辆的运行状态,因此,基于这些信息进行意图预测,准确度更高,也降低了对高精度的依赖。
另外,如果将行驶速度和/或行驶朝向也纳入到编码范围,则能够更全面地学习到车辆的转向和运动趋势,进一步提高了行驶意图的预测准确度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来计算机程序相关的硬件完成,该计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储计算机程序代码的介质。

Claims (20)

1.一种车辆意图预测模型的训练方法,其特征在于,包括:
获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
使用所述多个样本数据对车辆意图预测模型进行训练,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的真实情况。
2.根据权利要求1所述的方法,其特征在于,所述对所述多条行驶数据进行栅格化编码得到多个图像样本,包括:
根据参考图像的规格和第一行驶数据中的轨迹的起点确定第一缩放因子,其中,所述第一行驶数据为所述多条行驶数据中的任意一条行驶数据;
根据所述第一缩放因子对所述第一行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;所述第一数据通道上,对应的时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;
若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第一缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第一缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;
其中,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据。
3.根据权利要求1或2所述的方法,其特征在于:
所述行驶数据还包括所述第一车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一缩放因子满足如下关系:
Figure FDA0002706479810000021
其中,scale为所述第一缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P,Gi‖表示所述第一行驶数据中的轨迹的起点P与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:
向预测设备发送所述意图预测模型。
6.一种车辆意图预测方法,其特征在于,包括:
获取意图预测模型,其中,所述意图预测模型用于对车辆向路口各个方向的行驶的意图进行预测;
获取目标行驶数据,其中,所述目标行驶数据包括第一参考信息和第二车辆行驶经过所述路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
对所述目标行驶数据进行栅格化编码得到目标图像样本,其中所述目标行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
将所述目标图像样本输入到所述意图预测模型,得到所述第二车辆向所述路口各个方向的行驶的意图概率。
7.根据权利要求6所述的方法,其特征在于,所述获取意图预测模型,包括:
接收模型训练设备发送的意图预测模型,其中,所述意图预测模型为基于由多条行驶数据栅格化编码得到的多个图像样本训练得到的,所述多条行驶数据中每条行驶数据的数据格式与所述目标行驶数据的数据格式相同。
8.根据权利要求6或7所述的方法,其特征在于,所述对所述目标行驶数据进行栅格化编码得到目标图像样本,包括:
根据参考图像的规格和目标行驶数据中的轨迹的起点确定第二缩放因子;
根据所述第二缩放因子对所述目标行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述目标行驶数据对应的目标图像样本,其中,所述目标图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;
若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第二缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第二缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;
对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据;
所述第一数据通道上,对应时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大。
9.根据权利要求6-8任一项所述的方法,其特征在于:
所述行驶数据还包括所述第二车辆在所述一条轨迹上的行驶速度,所述目标图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
10.一种图像数据处理方法,其特征在于,包括:
获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
向模型训练设备发送所述多个样本数据,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的意图真实情况。
11.一种车辆意图预测模型的训练装置,其特征在于,包括:
获取单元,用于获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过目标路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
编码单元,用于对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
训练单元,用于通过所述多个样本数据对车辆意图预测模型进行训练,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的真实情况。
12.根据权利要求11所述的装置,其特征在于,在对所述多条行驶数据进行栅格化编码得到多个图像样本方面,所述编码单元具体用于:
根据参考图像的规格和第一行驶数据中的轨迹的起点确定第一缩放因子,其中,所述第一行驶数据为所述多条行驶数据中的任意一条行驶数据;
根据所述第一缩放因子对所述第一行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述第一行驶数据对应的图像样本,其中,所述图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;所述第一数据通道上,对应的时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;
若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第一缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第一缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;
其中,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据。
13.根据权利要求11或12所述的装置,其特征在于:
所述行驶数据还包括所述第一车辆在所述一条轨迹上的行驶速度,所述一个图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述相对行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
14.根据权利要求11-13任一项所述的装置,其特征在于,所述第一缩放因子满足如下关系:
Figure FDA0002706479810000041
其中,scale为所述第一缩放因子,h为所述参考图像的高度,w为所述参考图像的宽度,‖P,Gi‖表示所述第一行驶数据中的轨迹的起点P与所述路口的第i个出口区域Gi的距离;
其中,i取1至N之间的整数,N为所述路口的出口区域数量。
15.根据权利要求11-14任一项所述的装置,其特征在于,还包括:
发送单元,用于向预测设备发送所述意图预测模型。
16.一种车辆意图预测装置,其特征在于,包括:
第一获取单元,用于获取意图预测模型,其中,所述意图预测模型用于对车辆向路口各个方向的行驶的意图进行预测;
第二获取单元,用于获取目标行驶数据,其中,所述目标行驶数据包括第一参考信息和第二车辆行驶经过所述路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
编码单元,用于对所述目标行驶数据进行栅格化编码得到目标图像样本,其中所述目标行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
预测单元,用于将所述目标图像样本输入到所述意图预测模型,得到所述第二车辆向所述路口各个方向的行驶的意图概率。
17.根据权利要求16所述的装置,其特征在于,在对所述目标行驶数据进行栅格化编码得到目标图像样本方面,所述编码单元具体用于:
根据参考图像的规格和目标行驶数据中的轨迹的起点确定第二缩放因子;
根据所述第二缩放因子对所述目标行驶数据中的轨迹的第一坐标值和所述第一参考信息进行缩放处理,得到第四坐标值和第二参考信息;
生成与所述目标行驶数据对应的目标图像样本,其中,所述目标图像样本包括第一数据通道和至少一个第二数据通道,在所述第一数据通道上所述第四坐标值表示的位置填充数值,在所述至少一个第二数据通道上所述第二参考信息表示的位置填充数值;
所述第一数据通道上,对应的时间越靠后对应时间越靠后的第一坐标值缩放得到的第四坐标值表示的位置上填充的数值越大;所述第二数据通道上,越靠近出口区域或出口区域的中心位置的第一参考信息缩放得到的第二参考信息表示的位置上填充的数值越大;
若所述第一参考信息包括所述第二坐标值和第三坐标值,则所述第二参考信息包括第五坐标值和第六坐标值,所述第五坐标值为所述第二坐标值经过所述第二缩放因子缩放得到的,所述第六坐标值为所述第三坐标值经过所述第二缩放因子缩放得到的;其中,所述第五坐标值和所述第六坐标值分别用在不同的第二数据通道中填充数据;
其中,对应于不同出口方向上的第一参考信息经缩放后得到的第二参考信息,分别用在不同的第二数据通道中填充数据。
18.根据权利要求16或17所述的装置,其特征在于:
所述行驶数据还包括所述第二车辆在所述一条轨迹上的行驶速度,所述目标图像样本还包括第三数据通道,所述第三数据通道上所述第四坐标值表示的位置填充了所述行驶速度;
和/或,
所述行驶数据还包括所述第一车辆在所述一条轨迹上的多个相对行驶朝向,所述一个图像样本还包括多个第四数据通道,每个所述第四数据通道上所述第四坐标值表示的位置填充了与一个所述行驶朝向相关的信息,其中,所述多个相对行驶朝向分别为相对所述路口的不同出口方向的行驶朝向。
19.一种图像数据处理装置,其特征在于,包括:
获取单元,用于获取多条行驶数据,其中,每条行驶数据包括第一参考信息和第一车辆行驶经过目标路口时的一条轨迹的第一坐标值,其中,所述第一参考信息包括所述路口的各个出口方向上的虚拟车道线的第二坐标值和/或所述路口的各个出口方向上的出口区域的第三坐标值;所述虚拟车道线的第二坐标值所在坐标系的原点,以及所述出口区域的第三坐标值所在坐标系的原点均为所述一条轨迹的起始点;
编码单元,用于对所述多条行驶数据进行栅格化编码得到多个图像样本,其中,一条行驶数据中的不同类型的数据、对应不同出口方向的数据分别被编码到所述一个图像样本中的不同数据通道中;
发送单元,用于向模型训练设备发送所述多个样本数据,其中,所述多个样本数据中的每个样本数据包括所述多个样本图像中的一个图像样本和一条标签信息,所述一条标签信息用于表征所述一个图像样本中的第一车辆往所述各个出口中的出口行驶的意图真实情况。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当其在处理器上运行时,实现权利要求1-10任一项所述的方法。
CN202011045331.9A 2020-09-28 2020-09-28 一种车辆意图预测方法及相关装置 Active CN114283576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011045331.9A CN114283576B (zh) 2020-09-28 2020-09-28 一种车辆意图预测方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011045331.9A CN114283576B (zh) 2020-09-28 2020-09-28 一种车辆意图预测方法及相关装置

Publications (2)

Publication Number Publication Date
CN114283576A true CN114283576A (zh) 2022-04-05
CN114283576B CN114283576B (zh) 2023-03-31

Family

ID=80868494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011045331.9A Active CN114283576B (zh) 2020-09-28 2020-09-28 一种车辆意图预测方法及相关装置

Country Status (1)

Country Link
CN (1) CN114283576B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970819A (zh) * 2022-05-26 2022-08-30 哈尔滨工业大学 一种基于意图推理与深度强化学习的移动目标搜索跟踪方法及系统
CN115083162A (zh) * 2022-06-15 2022-09-20 北京三快在线科技有限公司 路况预测方法、装置、设备以及存储介质
CN114970819B (zh) * 2022-05-26 2024-05-03 哈尔滨工业大学 一种基于意图推理与深度强化学习的移动目标搜索跟踪方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190049970A1 (en) * 2017-08-08 2019-02-14 Uber Technologies, Inc. Object Motion Prediction and Autonomous Vehicle Control
US20190129436A1 (en) * 2017-10-28 2019-05-02 TuSimple System and method for real world autonomous vehicle trajectory simulation
CN109829351A (zh) * 2017-11-23 2019-05-31 华为技术有限公司 车道信息的检测方法、装置及计算机可读存储介质
CN110400490A (zh) * 2019-08-08 2019-11-01 腾讯科技(深圳)有限公司 轨迹预测方法和装置
CN111046919A (zh) * 2019-11-21 2020-04-21 南京航空航天大学 一种融合行为意图的周围动态车辆轨迹预测系统及方法
US20200269841A1 (en) * 2019-02-21 2020-08-27 Baidu Online Network Technology (Beijing) Co., Ltd. Information processing method and apparatus, and storage medium
CN111595352A (zh) * 2020-05-14 2020-08-28 陕西重型汽车有限公司 一种基于环境感知和车辆行驶意图的轨迹预测方法
CN111639591A (zh) * 2020-05-28 2020-09-08 深圳地平线机器人科技有限公司 轨迹预测模型生成方法、装置、可读存储介质及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190049970A1 (en) * 2017-08-08 2019-02-14 Uber Technologies, Inc. Object Motion Prediction and Autonomous Vehicle Control
US20190129436A1 (en) * 2017-10-28 2019-05-02 TuSimple System and method for real world autonomous vehicle trajectory simulation
CN109829351A (zh) * 2017-11-23 2019-05-31 华为技术有限公司 车道信息的检测方法、装置及计算机可读存储介质
US20200269841A1 (en) * 2019-02-21 2020-08-27 Baidu Online Network Technology (Beijing) Co., Ltd. Information processing method and apparatus, and storage medium
CN110400490A (zh) * 2019-08-08 2019-11-01 腾讯科技(深圳)有限公司 轨迹预测方法和装置
CN111046919A (zh) * 2019-11-21 2020-04-21 南京航空航天大学 一种融合行为意图的周围动态车辆轨迹预测系统及方法
CN111595352A (zh) * 2020-05-14 2020-08-28 陕西重型汽车有限公司 一种基于环境感知和车辆行驶意图的轨迹预测方法
CN111639591A (zh) * 2020-05-28 2020-09-08 深圳地平线机器人科技有限公司 轨迹预测模型生成方法、装置、可读存储介质及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
夏卓群 等: "EAVTP:一种环境自适应车辆轨迹预测方法", 《小型微型计算机系统》 *
陆川伟 等: "车辆轨迹数据的道路学习提取法", 《测绘学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970819A (zh) * 2022-05-26 2022-08-30 哈尔滨工业大学 一种基于意图推理与深度强化学习的移动目标搜索跟踪方法及系统
CN114970819B (zh) * 2022-05-26 2024-05-03 哈尔滨工业大学 一种基于意图推理与深度强化学习的移动目标搜索跟踪方法及系统
CN114997297B (zh) * 2022-05-26 2024-05-03 哈尔滨工业大学 一种基于多级区域划分的目标运动意图推理方法及系统
CN115083162A (zh) * 2022-06-15 2022-09-20 北京三快在线科技有限公司 路况预测方法、装置、设备以及存储介质
CN115083162B (zh) * 2022-06-15 2023-11-17 北京三快在线科技有限公司 路况预测方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN114283576B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
US20200302662A1 (en) System and Methods for Generating High Definition Maps Using Machine-Learned Models to Analyze Topology Data Gathered From Sensors
US11221413B2 (en) Three-dimensional object detection
US11794785B2 (en) Multi-task machine-learned models for object intention determination in autonomous driving
US11715012B2 (en) Feature compression and localization for autonomous devices
US11475675B2 (en) Systems and methods for identifying unknown instances
US11131993B2 (en) Methods and systems for trajectory forecasting with recurrent neural networks using inertial behavioral rollout
EP4152204A1 (en) Lane line detection method, and related apparatus
CN114845913A (zh) 基于物体运动的自顶向下场景预测
JP2022539245A (ja) アクションデータに基づくトップダウンシーンの予測
US20220214457A1 (en) Three-Dimensional Object Detection
EP3822852B1 (en) Method, apparatus, computer storage medium and program for training a trajectory planning model
US11891087B2 (en) Systems and methods for generating behavioral predictions in reaction to autonomous vehicle movement
US20220261601A1 (en) Multiple Stage Image Based Object Detection and Recognition
JPWO2021007106A5 (zh)
US20220032452A1 (en) Systems and Methods for Sensor Data Packet Processing and Spatial Memory Updating for Robotic Platforms
CN114787739A (zh) 使用向量化输入的智能体轨迹预测
US11367289B1 (en) Machine learning-based framework for drivable surface annotation
CN115146873A (zh) 一种车辆轨迹预测方法及系统
CN116737857A (zh) 道路数据处理方法、相关装置和介质
CN114283576B (zh) 一种车辆意图预测方法及相关装置
CN115520223A (zh) 网联环境下基于驾驶员交互行为特征的车辆轨迹预测方法
CN114516336A (zh) 一种考虑道路约束条件的车辆轨迹预测方法
CN113888601B (zh) 目标轨迹预测方法、电子设备及存储介质
US11886199B2 (en) Multi-scale driving environment prediction with hierarchical spatial temporal attention
US20240104934A1 (en) Training a codebook for trajectory determination

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant