WO2019047595A1

WO2019047595A1 - 一种基于端到端的自动驾驶系统舒适度的评估方法及装置

Info

Publication number: WO2019047595A1
Application number: PCT/CN2018/093356
Authority: WO
Inventors: 闫泳杉; 郁浩; 郑超; 唐坤; 张云飞; 姜雨
Original assignee: 百度在线网络技术（北京）有限公司
Priority date: 2017-09-05
Filing date: 2018-06-28
Publication date: 2019-03-14
Also published as: CN107807625A; CN107807625B

Abstract

一种基于端到端的自动驾驶系统舒适度的评估方法及装置，方法包括：根据自动驾驶系统输出的速度序列和时间序列确定加速度序列；根据加速度序列确定加加速度序列；根据加加速度序列的平均加加速度值对自动导航系统的舒适度进行评估。本发明根据平均加加速度值评估自动驾驶系统的横向控制模型和纵向控制模型，能够客观、真实的对自动驾驶系统的舒适度进行评估，进而提高的深度学习在自动驾驶领域的学习效率。

Description

一种基于端到端的自动驾驶系统舒适度的评估方法及装置

本专利申请要求于2017年9月5日提交的、申请号为201710792218.9、申请人为百度在线网络技术(北京)有限公司、发明名称为“一种基于端到端的自动驾驶系统舒适度的评估方法及装置”的中国专利申请的优先权，该申请的全文以引用的方式并入本申请中。

技术领域

本发明涉及计算机领域，尤其涉及一种基于端到端的自动驾驶系统舒适度的评估方法及装置。

背景技术

随着深度学习的迅速发展以及人工智能的深入研究，汽车工业发生了革命性的变化，通过端到端的深度学习实现自动驾驶便是自动驾驶领域的一个主要研究方向。在现有技术中，通过不同的神经网络可以产生很多驾驶模型。例如，通过选择成本函数并遵循贝尔曼原则对自动驾驶汽车的交通行为进行预估。但该方案仅仅是提出了使自动驾驶汽车在形式过程中避免急加速或减速的情况，并没有系统的理论和计算过程，从而无法满足对自动驾驶系统舒适度的评估要求，从而限制了深度学习在自动驾驶领域的发展。

发明内容

本发明解决的技术问题之一是缺乏有效的方法对自动驾驶系统舒适度进行评估。

根据本发明一方面的一个实施例，提供了一种基于端到端的自动驾驶系统舒适度的评估方法，包括：

根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列；

根据所述加速度序列确定加加速度序列；

根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估。

根据本发明另一方面的一个实施例，提供了一种基于端到端的自动驾驶系统舒适度的评估装置，包括：

用于根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列的装置；

用于根据所述加速度序列确定加加速度序列的装置；

用于根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估的装置。

所述加加速度指在加速度的基础上求加速度变化量与时间的比值。

由于本实施例根据预定自动驾驶系统输出的速度序列和时间序列确定在预定里程中的平均加加速度值，并根据该平均加加速度值评估该自动驾驶系统的横向控制模型和纵向控制模型，从而能够客观、真实的对自动驾驶系统的舒适度进行评估，进而提高的深度学习在自动驾驶领域的学习效率。

本领域普通技术人员将了解，虽然下面的详细说明将参考图示实施例、附图进行，但本发明并不仅限于这些实施例。而是，本发明的范围是广泛的，且意在仅通过后附的权利要求限定本发明的范围。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示出了根据本发明一实施例中的基于端到端的自动驾驶系统舒适度的评估方法的流程图。

图2示出了本发明的实施例一提出的基于端到端的自动驾驶系统舒适度的评估方法的流程图。

图3示出了本发明的实施例二提出的基于端到端的自动驾驶系统舒适度的评估方法的流程图。

图4示出了根据本发明一实施例中的基于端到端的自动驾驶系统舒适度的评估装置的框图。

图5示出了本发明的实施例三提出的基于端到端的自动驾驶系统舒适度的评估装置的框图。

图6示出了本发明的实施例四提出的基于端到端的自动驾驶系统舒适度的评估装置的框图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

在上下文中所称“计算机设备”，也称为“电脑”，是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备，其可以包括处理器与存储器，由处理器执行在存储器中预存的存续指令来执行预定处理过程，或是由ASIC、FPGA、DSP等硬件执行预定处理过程，或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。

所述计算机设备包括用户设备与网络设备。其中，所述用户设备包括但不限于电脑、智能手机、PDA等；所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中，所述计算机设备可单独运行来实现本发明，也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中，所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。

需要说明的是，所述用户设备、网络设备和网络等仅为举例，其他现有的或今后可能出现的计算机设备或网络如可适用于本发明，也应包含在本发明保护范围以内，并以引用方式包含于此。

后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时，用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。

这里所公开的具体结构和功能细节仅仅是代表性的，并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现，并且不应当被解释成仅仅受限于这里所阐述的实施例。

应当理解的是，虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元，但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说，在不背离示例性实施例的范围的情况下，第一单元可以被称为第二单元，并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。

应当理解的是，当一个单元被称为“连接”或“耦合”到另一单元时，其可以直接连接或耦合到所述另一单元，或者可以存在中间单元。与此相对，当一个单元被称为“直接连接”或“直接耦合”到另一单元时，则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”，“与...邻近”相比于“与...直接邻近”等等)。

这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指，否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是，这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在，而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。

还应当提到的是，在一些替换实现方式中，所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说，取决于所涉及的功能/动作，相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。

下面结合附图对本发明作进一步详细描述。

图1是根据本发明一个实施例的基于端到端的自动驾驶系统舒适度的评估方法的流程图。

结合图1中所示，本实施例所述的基于端到端的自动驾驶系统舒适度的评估方法包括如下步骤：

S110、根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列；

S120、根据所述加速度序列确定加加速度序列；

S130、根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估。

下面对各步骤做进一步详细介绍。

步骤S110中，首先提取预定自动驾驶系统输出的速度序列和时间序列。在本实施例中该速度序列包括但不限于从所述自动驾驶系统的横向控制模型和纵向控制模型中分别提取预定数量的速度值以及所述速度值对应的时间值。其中的速度值包括但不限于以协调世界时间作为基准将当前时刻的正东方向的速度分量和正北方向的速度通过合成获得。

可选的，将所述正东方向的速度分量和正北方向的速度分量进行合成的过程通过以下的计算式计算获得：

其中，v表示速度值，v _east表示正东方向的速度分量，v _north表示正北方向的速度分量。

在计算获得预定数量的速度值后，可将这些速度值存储为速度序列，并且将每个速度值对应的时间也存储为时间序列，再通过在一个时间段内速度值的变化量与对应的时间的比值能够获得在该时间段内的加速度值，并将这些加速度值存储为加速度序列。

步骤S120中，在获得加速度序列之后，本实施例还可从将该加速度序列转换为加加速度序列。

可选的，加加速度值通过以下的计算式确定：

其中，j表示加加速度值，Δa表示加速度变化量，t表示时间。

步骤S130中，加加速度序列的平均加加速度值通过以下计算式确定：

其中，

表示平均加加速度值，n表示可评估的数据个数，j ₁,j ₂,j ₃,...,j _n表示加加速度序列中的加加速度值。

在计算获得加加速度序列的平均加加速度值之后，可判断该平均加加速度值与评估阈值的大小关系，若该平均加加速度值小于该评估阈值，则该平均加加速度值对应的自动驾驶系统的横向控制模型和/或纵向控制模型的评估结果为较好。

可选的，对于该评估加加速度值大于该评估阈值的情况，可将大于该评估阈值的该平均加加速度值返回给横向控制模型和/或纵向控制模型，以供该横向控制模型和/或纵向控制模型进行进一步优化。

采用本实施例提出的技术方案，根据预定自动驾驶系统输出的速度序列和时间序列确定在预定里程中的平均加加速度值，并根据该平均加加速度值评估该自动驾驶系统的横向控制模型和纵向控制模型，从而能够客观、真实的对自动驾驶系统的舒适度进行评估，进而提高的深度学习在自动驾驶领域的学习效率。

实施例一

在本领域的现有技术中，通过选择成本函数并遵循贝尔曼原则可对自动驾驶汽车的交通行为进行预估，但仍然缺少系统的理论和计算过程。而实际上如何评估自动驾驶系统的舒适度要比交通行为复杂的多，所以传统方法都无法满足对自动驾驶系统的舒适度进行评估的要求。

因此，本实施例提出了又一种基于端到端的自动驾驶系统舒适度的评估方法，结合图2中所示，包括如下步骤：

S210、读取速度序列和时间序列。

以协调世界时间为基准，读取当前时刻的正东方向速度分量v _east和正北方向速度分量v _north，并通过计算式将v _east和v _north合成为速度v。

在提取若干个时刻的v _east和v _north后，可以获得v的序列为[v ₁，v ₂，v ₃，v ₄…]。

并且还将每个速度对应的时间存储为时间序列[t ₁，t ₂，t ₃，t ₄…]。

S220、通过速度序列计算加速度序列。

通过在一个时间段内速度值的变化量与对应的时间的比值能够获得在该时间段内的加速度值，例如在t ₂-t ₁的时间段内，对应的速度变化量Δv为v ₂-v ₁，则在该时间段内的加速度可通过以下计算式计算获得：

将计算获得的所有时间段的加速度值存储为加速度序列[a ₁,a ₂,a ₃,a ₄…]。

S230、通过加速度序列计算获得加加速度序列。

通过在一个时间段内加速度值的变化量与对应的时间的比值能够获得在该时间段内的加加速度值，例如在t ₂-t ₁的时间段内，对应的加速度变化量Δa为a ₂-a ₁，则在该时间段内的加加速度可通过以下计算式计算获得：

将计算获得的所有时间段的加加速度值存储为加加速度序列[j ₁,j ₂,j ₃,j ₄…]。

S240、对加加速度序列求平均值获得里程平均加加速度。

加加速度序列的平均加加速度值可值通过以下计算式确定：

其中，

计算获得的该平均加加速度值即可作为在待评估行驶里程内的平均加加速度。

S250、对自动驾驶系统舒适度进行评估。

可首先设定一个评估阈值，并将计算获得的平均加加速度与该评估阈值进行比较。若该平均加加速度小于该评估阈值，则该平均加加速度对应的横向控制模型和/或纵向控制模型的评估结果为较好，可以作为深度学习的学习对象；若该平均加加速度大于该评估阈值，则该平均加加速度对应的横向控制模型和/或纵向控制模型的评估结果为较差，不推荐作为深度学习的学习对象。

在本实施例中，将自动驾驶系统的横向控制模型或纵向控制模型中的两个速度分量作为输出，从而获得该自动驾驶系统的加加速度，进而获得整个行驶旅程的平均加加速度，因此可使用该平均加加速度作为指标进行评估。并且，通过将采集车实时回传的速度值进行计算，能够实现对基于端到端的自动驾驶系统舒适度的评估。

实施例二

在本领域的现有技术中，通过选择成本函数并遵循贝尔曼原则可对自动驾驶汽车的交通行为进行预估，但仍然缺少系统的理论和计算过程，无法对自动驾驶系统舒适度进行客观的评估，更无法根据自动驾驶系统收集的数据对横向控制模型和纵向控制模型进行优化。

根据牛顿第二定律F＝ma可知加速度与力之间的这关系，而瞬时力则等于质量与加加速度的乘积，即瞬时力越小则给乘车人员带来的冲击越小，舒适度就越高。因此，本实施例提出了一种基于端到端的自动驾驶系统舒适度的评估方法，结合图3中所示，包括如下步骤：

S310、根据自动驾驶系统输出的速度序列和时间序列确定加速度序列。

本实施例以横向控制系统为例，当自动驾驶系统开始运行时，首先可以分别提取正东方向速度分量和正北方向速度分量。下表所示的是一组正东方向速度分量和正北方向速度分量：

然后可通过公式计算将上表所示的速度分量合成为如下表所示的速度值。

再存储对应的时间序列。在预定导航系统中的时间通常为GPS周和周内秒，由于本实施例为计算加速度和加加速度需要的数据是时间段，因此可不必将周内秒转换为协调世界时间(UTC time)。下表所示的是一组与上表的正东方向速度分量和正北方向速度分量对应的GPS秒：

	时间1(s)	时间2(s)	时间3(s)	时间4(s)
周内秒	442531.00	442531.05	442531.10	442531.15

根据该速度序列可以计算出在三个时间段内的加速度序列，该加速度序列如下表所示：

	时间段1	时间段2	时间段3
加速度值	0.0026	0.001	0.0026

S320、根据加速度序列确定加加速度序列。

由上述的三个加速度值和三个时间段的结果可知，时间段1与时间段2之间的加速度变化量为0.0016，时间段2与时间段3之间的加速度变化量为0.0016。并且，每两个时间段的时长为10秒，则在该行驶里程内的加加速度序列为[0.00016,0.00016]。

S330、判断所述平均加加速度值与评估阈值的大小关系。

自动驾驶系统舒适度可以用冲击量或者冲击力大小来衡量。Jerk(急动)作为量化舒适度的一个指标，是指加速度对时间的变化率，即加加速度，急动指数越低，舒适感越强。人体可忍受的最大横向加加速度约在0.4～1.0ms ³。因此本实施例中可采用0.1ms ³作为评估阈值阈值。

在步骤S320中获得的加加速度序列的平均加加速度值为0.00016ms ³，该平均加加速度值小于该评估阈值。

S340、将大于评估阈值的平均加加速度值返回给横向控制模型。

在步骤S330中的比较结果为该平均加加速度值小于该评估阈值，因此可以将该横向控制模型的评估结果确定为较好，适合作为深度学习的学习对象。

如果当某个时间段的平均加加速度值大于该评估阈值时，则可以将该平均加加速度值返回给该横向控制模型，以使该横向控制模型能够根据该平均加加速度值进行优化，以避免产生大于该评估阈值的平均加加速度值。经过一段时间的深度学习后，该横向控制模型能够在正常行驶过程中不输出大于该平均加加速度值的控制量，以满足乘客对舒适度的需求。

图4是根据本发明一个实施例的基于端到端的自动驾驶系统舒适度的评估装置的框图。

结合图4中所示，本实施例所述的基于端到端的自动驾驶系统舒适度的评估装置(以下简称“评估装置”)，包括如下装置：

用于根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列的装置(以下简称“序列提取装置”)410；

用于根据所述加速度序列确定加加速度序列的装置(以下简称“加加速度序列确定装置”)420；

用于根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估的装置(以下简称“评估装置”)430。

下面对各装置做进一步详细介绍。

首先通过序列提取装置410提取预定自动驾驶系统输出的速度序列和时间序列。在本实施例中该速度序列包括但不限于从所述自动驾驶系统的横向控制模型和纵向控制模型中分别提取预定数量的速度值以及所述速度值对应的时间值。其中的速度值包括但不限于以协调世界时间作为基准将当前时刻的正东方向的速度分量和正北方向的速度通过合成获得。

可选的，将所述正东方向的速度分量和正北方向的速度分量进行合成的过程可由序列提取装置410通过以下的计算式计算获得：

在计算获得预定数量的速度值后，可通过序列提取装置410将这些速度值存储为速度序列，并且将每个速度值对应的时间也存储为时间序列，再通过序列提取装置410在一个时间段内速度值的变化量与对应的时间的比值获得在该时间段内的加速度值，并将这些加速度值存储为加速度序列。

在获得加速度序列之后，本实施例还可通过加加速度序列确定装置420从将该加速度序列转换为加加速度序列。

可选的，加加速度值通过以下的计算式确定：

加加速度序列的平均加加速度值可由评估装置430通过以下计算式确定：

其中，

在计算获得加加速度序列的平均加加速度值之后，可由评估装置430判断该平均加加速度值与评估阈值的大小关系，若该平均加加速度值小于该评估阈值，则该平均加加速度值对应的自动驾驶系统的横向控制模型和/或纵向控制模型的评估结果为较好。

可选的，对于该评估加加速度值大于该评估阈值的情况，可由评估装置430将大于该评估阈值的该平均加加速度值返回给横向控制模型和/或纵向控制模型，以供该横向控制模型和/或纵向控制模型进行进一步优化。

实施例三

因此，本实施例提出了又一种基于端到端的自动驾驶系统舒适度的评估装置，结合图5中所示，包括如下装置：

用于读取速度序列和时间序列的装置(以下简称“读取装置”)510；

用于通过速度序列计算加速度序列的装置(以下简称“第一计算装置”)520；

用于通过加速度序列计算获得加加速度序列的装置(以下简称“第二计算装置”)530；

用于对加加速度序列求平均值获得里程平均加加速度的装置(以下简称“第三计算装置”)540；

用于对自动驾驶系统舒适度进行评估的装置(以下简称“第一评估装置”)550。

以协调世界时间为基准，通过读取装置510读取当前时刻的正东方向速度分量v _east和正北方向速度分量v _north，并通过计算式将v _east和v _north合成为速度v。

并且还通过读取装置510将每个速度对应的时间存储为时间序列[t ₁，t ₂，t ₃，t ₄…]。

通过第一计算装置520在一个时间段内速度值的变化量与对应的时间的比值能够获得在该时间段内的加速度值，例如在t ₂-t ₁的时间段内，对应的速度变化量Δv为v ₂-v ₁，则在该时间段内的加速度可通过以下计算式计算获得：

并通过第一计算装置520将计算获得的所有时间段的加速度值存储为加速度序列[a ₁,a ₂,a ₃,a ₄…]。

通过第二计算装置530在一个时间段内加速度值的变化量与对应的时间的比值能够获得在该时间段内的加加速度值，例如在t ₂-t ₁的时间段内，对应的加速度变化量Δa为a ₂-a ₁，则在该时间段内的加加速度可通过以下计算式计算获得：

通过第二计算装置530将计算获得的所有时间段的加加速度值存储为加加速度序列[j ₁,j ₂,j ₃,j ₄…]。

加加速度序列的平均加加速度值可值由第三计算装置540通过以下计算式确定：

其中，

通过第三计算装置540计算获得的该平均加加速度值即可作为在待评估行驶里程内的平均加加速度。

可首先设定一个评估阈值，并通过第一评估装置550将计算获得的平均加加速度与该评估阈值进行比较。若该平均加加速度小于该评估阈值，则该平均加加速度对应的横向控制模型和/或纵向控制模型的评估结果为较好，可以作为深度学习的学习对象；若该平均加加速度大于该评估阈值，则该平均加加速度对应的横向控制模型和/或纵向控制模型的评估结果为较差，不推荐作为深度学习的学习对象。

实施例四

根据牛顿第二定律F＝ma可知加速度与力之间的这关系，而瞬时力则等于质量与加加速度的乘积，即瞬时力越小则给乘车人员带来的冲击越小，舒适度就越高。因此，本实施例提出了一种基于端到端的自动驾驶系统舒适度的评估装置，结合图6中所示，包括如下装置：

用于根据自动驾驶系统输出的速度序列和时间序列确定加速度序列的装置(以下简称“第四计算装置”)610；

用于根据加速度序列确定加加速度序列的装置(以下简称“第五计算装置”)620；

用于判断所述平均加加速度值与评估阈值的大小关系的装置(以下简称“第二评估装置”)630；

用于将大于评估阈值的平均加加速度值返回给横向控制模型的装置(以下简称“优化装置”)640。

本实施例以横向控制系统为例，当自动驾驶系统开始运行时，首先可以通过第四计算装置610分别提取正东方向速度分量和正北方向速度分量。下表所示的是一组正东方向速度分量和正北方向速度分量：

然后可由第四计算装置610通过公式计算将上表所示的速度分量合成为如下表所示的速度值。

再通过第四计算装置610存储对应的时间序列。在预定导航系统中的时间通常为GPS周和周内秒，由于本实施例为计算加速度和加加速度需要的数据是时间段，因此可不必将周内秒转换为协调世界时间(UTC time)。下表所示的是一组与上表的正东方向速度分量和正北方向速度分量对应的GPS秒：

根据该速度序列可以通过第四计算装置610计算出在三个时间段内的加速度序列，该加速度序列如下表所示：

	时间段1	时间段2	时间段3
加速度值	0.0026	0.001	0.0026

根据上述的三个加速度值和三个时间段的结果，可通过第五计算装置620计算获得时间段1与时间段2之间的加速度变化量为0.0016，时间段2与时间段3之间的加速度变化量为0.0016。并且，每两个时间段的时长为10秒，则在该行驶里程内的加加速度序列为[0.00016,0.00016]。

通过第二评估装置630可以确定加加速度序列的平均加加速度值为0.00016ms ³，该平均加加速度值小于该评估阈值。因此可以通过第二评估装置630将该横向控制模型的评估结果确定为较好，适合作为深度学习的学习对象。

如果当某个时间段的平均加加速度值大于该评估阈值时，则可以通过优化装置640将该平均加加速度值返回给该横向控制模型，以使该横向控制模型能够根据该平均加加速度值进行优化，以避免产生大于该评估阈值的平均加加速度值。经过一段时间的深度学习后，该横向控制模型能够在正常行驶过程中不输出大于该平均加加速度值的控制量，以满足乘客对舒适度的需求。

需要注意的是，本发明可在软件和/或软件与硬件的组合体中被实施，例如，本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中，本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本发明的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

虽然前面特别示出并且描述了示例性实施例，但是本领域技术人员将会理解的是，在不背离权利要求书的精神和范围的情况下，在其形式和细节方面可以有所变化。这里所寻求的保护在所附权利要求书中做了阐述。

Claims

一种基于端到端的自动驾驶系统舒适度的评估方法，包括：

根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列；

根据所述加速度序列确定加加速度序列；

根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估。
根据权利要求1所述的方法，根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列的步骤包括：

从所述自动驾驶系统的横向控制模型和纵向控制模型中分别提取预定数量的速度值以及所述速度值对应的时间值。
根据权利要求2所述的方法，根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列的步骤还包括：

将计算获得的多个加速度值存储为加加速度序列。
根据权利要求1所述的方法，所述加加速度序列包括预定数量的加加速度值，所述加加速度值通过以下的计算式确定：

其中，j表示加加速度值，Δa表示加速度变化量，t表示时间。
根据权利要求1所述的方法，所述加加速度序列的平均加加速度值通过以下计算式确定：

其中，
表示平均加加速度值，n表示可评估的数据个数，j ₁,j ₂,j ₃,...,j _n表示加加速度序列中的加加速度值。
根据权利要求1所述的方法，根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估的步骤包括：

判断所述平均加加速度值与评估阈值的大小关系，若所述平均加加速度值小于所述评估阈值，则所述平均加加速度值对应的自动驾驶系统的横向控制模型和/或纵向控制模型的评估结果为较好。
根据权利要求6所述的方法，根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估的步骤还包括：

将大于所述评估阈值的所述平均加加速度值返回给所述横向控制模型和/或纵向控制模型。
一种基于端到端的自动驾驶系统舒适度的评估装置，包括：

用于根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列的装置；

用于根据所述加速度序列确定加加速度序列的装置；

用于根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估的装置。
根据权利要求8所述的装置，在所述用于根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列的装置中包括：

用于从所述自动驾驶系统的横向控制模型和纵向控制模型中分别提取预定数量的速度值以及所述速度值对应的时间值的装置。
根据权利要求9所述的装置，在所述用于根据所述自动驾驶系统输出的速度序列和时间序列确定加速度序列的装置中还包括：

用于将计算获得的多个加速度值存储为加加速度序列的装置。
根据权利要求8所述的装置，在所述用于根据所述加速度序列确定加加速度序列的装置中，所述加加速度序列包括预定数量的加加速度值，所述加加速度值通过以下的计算式确定：

其中，j表示加加速度值，Δa表示加速度变化量，t表示时间。
根据权利要求8所述的装置，在所述用于根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估的装置中，所述加加速度序列的平均加加速度值通过以下计算式确定：

其中，
表示平均加加速度值，n表示可评估的数据个数，j ₁,j ₂,j ₃,...,j _n表示加加速度序列中的加加速度值。
根据权利要求8所述的装置，在所述用于根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估的装置中包括：

用于判断所述平均加加速度值与评估阈值的大小关系，若所述平均加加速度值小于所述评估阈值，则所述平均加加速度值对应的自动驾驶系统的横向控制模型和/或纵向控制模型的评估结果为较好的装置。
根据权利要求13所述的装置，在所述用于根据所述加加速度序列的平均加加速度值对所述自动导航系统的舒适度进行评估的装置中还包括：

用于将大于所述评估阈值的所述平均加加速度值返回给所述横向控制模型和/或纵向控制模型的装置。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机代码，当所述计算机代码被执行时，如权利要求1至7中任一项所述的方法被执行。
一种计算机程序产品，当所述计算机程序产品被计算机设备执行时，如权利要求1至7中任一项所述的方法被执行。
一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储器，用于存储一个或多个计算机程序；

当所述一个或多个计算机程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至7中任一项所述的方法。