CN107564363B - 一种用于驾驶模式切换的方法和装置 - Google Patents

一种用于驾驶模式切换的方法和装置 Download PDF

Info

Publication number
CN107564363B
CN107564363B CN201710792452.1A CN201710792452A CN107564363B CN 107564363 B CN107564363 B CN 107564363B CN 201710792452 A CN201710792452 A CN 201710792452A CN 107564363 B CN107564363 B CN 107564363B
Authority
CN
China
Prior art keywords
driving mode
data
model
training
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710792452.1A
Other languages
English (en)
Other versions
CN107564363A (zh
Inventor
姜雨
郁浩
闫泳杉
郑超
唐坤
张云飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710792452.1A priority Critical patent/CN107564363B/zh
Publication of CN107564363A publication Critical patent/CN107564363A/zh
Priority to PCT/CN2018/093357 priority patent/WO2019047596A1/zh
Application granted granted Critical
Publication of CN107564363B publication Critical patent/CN107564363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/182Selecting between different operative modes, e.g. comfort and performance modes
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B9/00Simulators for teaching or training purposes
    • G09B9/02Simulators for teaching or training purposes for teaching control of vehicles or other craft
    • G09B9/04Simulators for teaching or training purposes for teaching control of vehicles or other craft for teaching control of land vehicles
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明的目的是提供一种用于驾驶模式切换的方法和装置。与现有技术相比,本发明利用自动驾驶车辆的车载传感器所采集到的安全场景数据和不安全场景数据,训练一个用于在端对端驾驶模式与循迹驾驶模式之前切换的深度学习决策模型,在实际应用中,该模型能够感知到当前实际场景是否安全,做出决策,输出指令在该两种驾驶模式中进行切换。本发明利用深度学习的决策能力自动切换循迹驾驶模式和端对端驾驶模式,训练出有推理决策能力的模型,将循迹驾驶模式与端对端自动驾驶模式自然地融合,大大提高了自动驾驶的安全性。

Description

一种用于驾驶模式切换的方法和装置
技术领域
本发明涉及车辆自动驾驶技术领域,尤其涉及一种用于驾驶模式切换的技术。
背景技术
现有的自动驾驶的两种主要模式是循迹驾驶模式和端对端自动驾驶模式,循迹驾驶模式具有很高的安全性,但是必须预设轨迹,实用性不强;端对端自动驾驶模式灵活性强,具有实用性,然而安全性较低。现有的二者结合的做法要么是简单的糅合,达不到相辅相成的效果,要么是基于人工定义规则进行自动切换,切换的时机难以正确把握,甚至会起到反作用。
因此,如何使得自动驾驶车辆准确、高效地在该两种驾驶模式中进行切换,成为本领域亟需解决的问题之一。
发明内容
本发明的目的是提供一种用于驾驶模式切换的方法和装置。
根据本发明的一个方面,提供了一种用于驾驶模式切换的方法,其中,该方法包括:
a获取自动驾驶车辆的车载传感器所采集的传感器数据,其中,所述传感器数据包括所述自动驾驶车辆的安全场景数据和不安全场景数据;
b将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型;
其中,该方法还包括:
x实时获取所述自动驾驶车辆的车载传感器所采集的当前实际场景;
y根据所述当前实际场景,基于所述模式切换模型,在端对端驾驶模式或循迹驾驶模式中进行切换。
优选地,所述步骤a中的不安全场景数据由驾驶员故意进行不安全行为而采集。
优选地,所述步骤b包括:
建立卷积神经网络模型,将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
更优选地,在所述卷积神经网络模型的每两层卷积层中加入负反馈层,每三层卷积层中加入dropout层。
优选地,所获取的车载传感器所采集的传感器数据分为测试集与训练集;
其中,所述步骤b包括:
将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
更优选地,所述步骤b包括:
将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练获得多个候选切换模型;
其中,该方法还包括:
根据所述测试集,自所述多个候选切换模型中选择确定所述模式切换模型。
优选地,该方法还包括:
记录所述自动驾驶车辆在自动驾驶过程中驾驶员的接手行为,获取对应时刻所述车载传感器所采集的传感器修正数据;
根据所述传感器修正数据,对所述模式切换模型进行修正。
根据本发明的另一个方面,还提供了一种用于驾驶模式切换的装置,其中,该装置包括:
采集装置,用于获取自动驾驶车辆的车载传感器所采集的传感器数据,其中,所述传感器数据包括所述自动驾驶车辆的安全场景数据和不安全场景数据;
训练装置,用于将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型;
其中,该装置还包括:
获取装置,用于实时获取所述自动驾驶车辆的车载传感器所采集的当前实际场景;
切换装置,用于根据所述当前实际场景,基于所述模式切换模型,在端对端驾驶模式或循迹驾驶模式中进行切换。
优选地,所述不安全场景数据由驾驶员故意进行不安全行为而采集。
优选地,所述训练装置用于:
建立卷积神经网络模型,将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
更优选地,在所述卷积神经网络模型的每两层卷积层中加入负反馈层,每三层卷积层中加入dropout层。
优选地,所获取的车载传感器所采集的传感器数据分为测试集与训练集;
其中,所述训练装置用于:
将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
更优选地,所述训练装置用于:
将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练获得多个候选切换模型;
其中,该装置还包括:
选择装置,用于根据所述测试集,自所述多个候选切换模型中选择确定所述模式切换模型。
优选地,该装置还包括修正装置,用于:
记录所述自动驾驶车辆在自动驾驶过程中驾驶员的接手行为,获取对应时刻所述车载传感器所采集的传感器修正数据;
根据所述传感器修正数据,对所述模式切换模型进行修正。
根据本发明的又一个方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如前任一项所述的方法被执行。
根据本发明的再一个方面,还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如前任一项所述的方法被执行。
根据本发明的再一个方面,还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前任一项所述的方法。
与现有技术相比,本发明获取自动驾驶车辆的车载传感器所采集的传感器数据,其中,所述传感器数据包括所述自动驾驶车辆的安全场景数据和不安全场景数据;将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型;实时获取所述自动驾驶车辆的车载传感器所采集的当前实际场景;根据所述当前实际场景,基于所述模式切换模型,在端对端驾驶模式或循迹驾驶模式中进行切换;本发明利用传感器所采集到的安全场景数据和不安全场景数据,训练一个用于在端对端驾驶模式与循迹驾驶模式之前切换的深度学习决策模型,在实际应用中,该模型能够感知到当前实际场景是否安全,做出决策,输出指令在该两种驾驶模式中进行切换。本发明利用深度学习的决策能力自动切换循迹驾驶模式和端对端驾驶模式,训练出有推理决策能力的模型,将循迹驾驶模式与端对端自动驾驶模式自然地融合,大大提高了自动驾驶的安全性。
进一步地,本发明利用封闭园区区域小,可操作性强的特点,让驾驶员故意模拟大量不安全行为来创造数据,训练一个用于端对端自动驾驶与循迹切换的深度学习决策模型。
进一步地,在训练好模型之后,随时接收模型的输出指令切换循迹驾驶模式与端对端驾驶模式,在这个过程中,通过记录驾驶员接手行为,指出模型的错误决策,采集对应时刻的传感器数据对模型进行加强训练,使该模型的决策能力越来越好,进一步提高了自动驾驶的安全性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图;
图2示出根据本发明一个方面的用于驾驶模式切换的方法的流程示意图;
图3示出根据本发明另一个方面的用于驾驶模式切换的装置的结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”,“与...邻近”相比于“与...直接邻近”等等)。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
下面结合附图对本发明作进一步详细描述。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未示出,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图1中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理。
例如,存储器28中存储有用于执行本发明的各项功能和处理的计算机程序,处理单元16执行相应计算机程序时,本发明在网络端对来电意图的识别被实现。
以下将详细描述本发明用于驾驶模式切换的具体功能/步骤。
图2示出根据本发明一个方面的用于驾驶模式切换的方法的流程示意图。
在步骤S201中,装置1获取自动驾驶车辆的车载传感器所采集的传感器数据,其中,所述传感器数据包括所述自动驾驶车辆的安全场景数据和不安全场景数据。
具体地,自动驾驶车辆的车载传感器可以采集到对应的不同的传感器数据,这些传感器数据例如是自动驾驶车辆在驾驶过程中的视频数据、图像数据、雷达数据等。在此,这些传感器数据可以是该自动驾驶车辆在自动驾驶过程中被采集的,也可以是该自动驾驶车辆在驾驶员的辅助驾驶过程中被采集的。在此,这些传感器数据可以是该自动驾驶车辆的安全场景数据,即,该自动驾驶车辆在正常的自动驾驶过程或由驾驶员辅助驾驶过程中所采集到的视频数据、图像数据、雷达数据等;也可以是该自动驾驶车辆的不安全场景数据,即,该自动驾驶车辆在自动驾驶过程或由驾驶员辅助驾驶过程中所遇到的不安全的情况,如在发生碰撞、异常加速、异常减速、方向盘打死等情况下车载传感器所采集到的视频数据、图像数据、雷达数据等。
在步骤S201中,装置1通过自动驾驶车辆的车载传感器采集上述传感器数据。在此,自动驾驶车辆的车载传感器包括但不限于车载摄像头、车载雷达等。例如,当自动驾驶车辆自动驾驶时,装置1通过该自动驾驶车辆的车载摄像头采集各个视角的视频或图像数据。在此,该车载摄像头用来模拟驾驶员的视线与视角,其例如可以位于自动驾驶车辆的驾驶室、左侧、右侧后视镜、中央后视镜等,该车载摄像头例如可以是双目摄像机。通过该车载摄像头所采集到的视频或图像数据例如可以视作假设该自动驾驶车辆由驾驶员驾驶时,该驾驶员所看到的各种周围景象。随后,若该自动驾驶车辆碰到了某个不安全场景,如突然刹车,装置1继续通过该自动驾驶车辆的车载摄像头采集各个视角的视频或图像数据,并保存为不安全场景数据,以供后续模型训练使用。
在此,该方式例如适用于车辆自动驾驶中的端对端驾驶模式,端对端驾驶模式是指自动驾驶车辆利用车载传感器,如车载摄像头、车载雷达等,感知周围景象来判断如何进行自动驾驶,如判断是踩油门还是踩刹车、判断如何打方向盘等,其车辆自动驾驶的自由度较高;与之相对的是循迹驾驶模式,循迹驾驶模式是指自动驾驶车辆利用高精度GPS获知自身的位置,沿着预设轨迹来进行自动驾驶,虽然相对来讲很安全,但行驶轨迹是固定不变的,没有那么灵活。
进一步地,上述端对端驾驶模式或循迹驾驶模式例如是在封闭园区中进行的,在此,封闭园区是指具有有限的路线、有限的物理区域的有限场景,现实中较常见的如港口、停车场、博览会场、校园内部等,当然,该封闭园区也可以进行定制。
本领域技术人员应能理解,上述车载传感器仅为举例,其他现有或今后可能出现的车载传感器,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
本领域技术人员还应能理解,上述采集传感器数据的方式仅为举例,其他现有或今后可能出现的采集传感器数据的方式,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
优选地,所述不安全场景数据由驾驶员故意进行不安全行为而采集。
具体地,驾驶员可以辅助来驾驶该自动驾驶车辆,当驾驶员采用人工来进行驾驶时,可以故意模拟大量不安全行为,例如故意碰撞、故意突然踩油门加速、突然急踩刹车、方向盘打算等,从而使得该自动驾驶车辆上的车载传感器在面临这些不安全场景时,可以采集到相对应的传感器数据。例如,对于某个封闭园区,由于在封闭园区中较为安全,因此,驾驶员在该封闭园区中驾驶该自动驾驶车辆时,可以故意模拟大量不安全行为。
在此,由于训练有素的驾驶员正常驾驶过程中很难产生有效的不安全场景数据,因此,可以利用封闭园区场地小、可操作性强等特点,让驾驶员故意做出各类不安全行为来采集对应的传感器数据。
例如,驾驶员在该封闭园区辅助驾驶该自动驾驶车辆,并在车辆行驶过程中故意去碰撞路边的树,则该自动驾驶车辆上的车载摄像头可以采集到该车辆碰撞树时的景象,如拍摄到对应视频,该视频中出现路边的树不断接近并最后撞上的画面;或者,该自动驾驶车辆上的车载雷达也可以采集对应的信息,如该车载雷达测量到该树作为障碍物与该车辆之间的距离信息;从而,在步骤S201中,装置1采集这些传感器数据,并可以在随后训练模型过程中使用。
又如,若在该自动驾驶车辆不断接近路边的树的过程中,该驾驶员急踩刹车,则该自动驾驶车辆上的车载摄像头可以采集到对应的景象,如拍摄到对应视频,该视频中出现路边的树先不断接近后减速接近最后静止的画面;或者,该自动驾驶车辆上的车载雷达也可以采集对应的信息,如该车载雷达测量到该树作为障碍物与该车辆之间的距离信息,如该距离不断变短最后不再变化。
本领域技术人员应能理解,上述驾驶员故意为之的不安全行为仅为举例,其他现有或今后可能出现的不安全行为,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
在此,装置1利用封闭园区区域小,可操作性强的特点,让驾驶员故意模拟大量不安全行为来创造数据,训练一个用于端对端自动驾驶与循迹切换的深度学习决策模型。
在步骤S202中,装置1将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型。
具体地,在步骤S202中,装置1将在步骤S201中采集的传感器数据作为输入,而这些传感器数据都有对应的驾驶模式,例如,安全场景数据对应端对端驾驶模式,不安全场景数据对应循迹驾驶模式,将该端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型。例如,在训练模式切换模型时,输入为传感器数据,输出为当前该自动驾驶车辆应启用的驾驶模式编号,0为端对端驾驶模式,1为循迹驾驶模式。
在此,安全场景数据是该自动驾驶车辆在正常驾驶过程中所采集到的传感器数据,由于采用端对端驾驶模式的自由度较高,因此,在自动驾驶车辆未遇到不安全场景时可以采用端对端驾驶模式来进行驾驶,即,这些安全场景数据可对应端对端驾驶模式;而不安全场景数据是该自动驾驶车辆在驾驶过程中遇到不安全场景时所采集到的传感器数据,由于循迹驾驶模式本身的安全度较高,因此,在车辆遇到不安全场景时可以采用循迹驾驶模式来进行驾驶,即,这些不安全场景数据可对应循迹驾驶模式。
在此,该模式切换模型例如可以是一个简单的分类模型,其可以通过现有的对分类模型的训练方式来训练得到,例如,在此,已知自动驾驶车辆是在安全场景下所采集到的传感器数据还是在不安全场景下所采集到的传感器数据,并且已知安全场景下所采集到的传感器数据对应的是端对端驾驶模式,不安全场景下所采集到的传感器数据对应的是循迹驾驶模式,据此来通过各个分类输入得到各个分类输出,例如,在此,输入为传感器数据,输出为当前该自动驾驶车辆应启用的驾驶模式编号,0为端对端驾驶模式,1为循迹驾驶模式,从而训练该模式切换模型;在该模式切换模型训练完成之后,可以对不同的传感器数据进行分类,如当装置1通过车载摄像头采集到的是视频数据时,场景分析模型根据该视频数据,先确实是安全场景数据还是不安全场景数据,并据此确定对应的驾驶模式是端对端驾驶模式还是循迹驾驶模式。
本领域技术人员应能理解,上述训练模式切换模型的方式仅为举例,其他现有或今后可能出现的训练模式切换模型的方式,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
优选地,在步骤S202中,装置1建立卷积神经网络模型,将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
具体地,在步骤S202中,装置1建立卷积神经网络模型,将在步骤S201中采集的传感器数据作为输入,对应的驾驶模式作为输出,例如,安全场景数据作为输入,对应的端对端驾驶模式则作为输出,不安全场景数据作为输入,对应的循迹驾驶模式则作为输出,从而训练模式切换模型。例如,在训练模式切换模型时,将模式切换模型的输出定为当前该自动驾驶车辆应启用的驾驶模式编号,0为端对端驾驶模式,1为循迹驾驶模式,则在安全场景数据作为输入时,输出为0,不安全场景数据作为输入时,输出为1。
更优选地,在步骤S202中,装置1在所述卷积神经网络模型的每两层卷积层中加入负反馈层,每三层卷积层中加入dropout层。
具体地,在步骤S202中,装置1在训练模式切换模型时,建立卷积神经网络模型,并且,在该卷积神经网络模型的每两层卷积层中加入负反馈层,从而增强该卷积神经网络模型的推理能力,并在该卷积神经网络模型的每三层卷积层中加入dropout层,从而增强该卷积神经网络模型的泛化能力。
优选地,所获取的车载传感器所采集的传感器数据分为测试集与训练集;其中,在步骤S202中,装置1将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
具体地,车载传感器所采集的传感器数据可以分为测试集和训练集,该分类的方式可以不做任何限制,例如仅从数量方面考虑即可;其中,该训练集用来训练模式切换模型,测试集则用来测试训练好的模式切换模型。例如,在步骤S202中,装置1将训练集作为输入,训练集中同样也包括安全场景数据和不安全场景数据,装置1将这些安全场景数据和不安全场景数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练该模式切换模型。
更优选地,在步骤S202中,装置1将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练获得多个候选切换模型;其中,该方法还包括步骤S205(未示出),在步骤S205中,装置1根据所述测试集,自所述多个候选切换模型中选择确定所述模式切换模型。
具体地,在步骤S202中,装置1将车载传感器所采集的传感器数据的训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,可以训练获得多个候选切换模型,例如,随着时间的推进,模型不断得到训练,期间可以获得多个候选切换模型;随后,在步骤S205中,装置1根据车载传感器所采集的传感器数据的测试集,对这多个候选切换模型进行测试,例如,该测试集中同样也包括安全场景数据和不安全场景数据,将测试集中的安全场景数据输入至候选切换模型,检验其输出是否是端对端驾驶模式,将测试集中的不安全场景数据输入至候选切换模型,检验其输出是否是循迹驾驶模式,从而自该多个候选切换模型中选择确定最终的模式切换模型。
本领域技术人员应能理解,上述确定模式切换模型的方式仅为举例,其他现有或今后可能出现的确定模式切换模型的方式,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
其中,该方法还包括步骤S203和步骤S204。
在步骤S203中,装置1实时获取所述自动驾驶车辆的车载传感器所采集的当前实际场景。
具体地,前述步骤S201和S202是对模式切换模型的训练,属于前期工作,而在该模式切换模型训练完成之后,该自动驾驶车辆在实际自动驾驶过程中可以应用该模式切换模型,从而判断是在端对端驾驶模式下进行自动驾驶还是在循迹驾驶模式下进行自动驾驶。
该自动驾驶车辆在实际自动驾驶过程中,其上的车载传感器可以实时地采集数据,例如,位于自动驾驶车辆的驾驶室、左侧、右侧后视镜、中央后视镜等位置的车载摄像头,在自动驾驶车辆实际自动驾驶过程中,不断地进行拍摄,捕捉、采集对应的视频或图像数据。在步骤S203中,装置1在车辆自动驾驶过程中,通过与该自动驾驶车辆的车载传感器的交互,获取该车载传感器所采集的实时数据,该实时数据例如是该自动驾驶车辆所处的当前实际场景,并将该实时数据实时输入至该模式切换模型,根据该模式切换模型的输出,来判断应在哪种驾驶模式下进行驾驶。
在步骤S204中,装置1根据所述当前实际场景,基于所述模式切换模型,在端对端驾驶模式或循迹驾驶模式中进行切换。
具体地,在步骤S204中,装置1根据在步骤S203中所获取的该自动驾驶车辆所处的当前实际场景,将该当前实际场景输入至该模式切换模型,根据该模式切换模型所输出的驾驶模式,在端对端驾驶模式或循迹驾驶模式中进行切换,例如,假设模式切换模型的输出为当前该自动驾驶车辆应启用的驾驶模式编号,0为端对端驾驶模式,1为循迹驾驶模式,则根据输入至该模式切换模型的当前实际场景,该模式切换模型可以输出对应的驾驶模式编号,根据该驾驶模式编号,装置1即可以知道该自动驾驶车辆当前应采用哪种驾驶模式进行自动驾驶。
例如,原本该自动驾驶车辆正在进行正常的端对端自动驾驶,其上的车载摄像头不断地实时采集视频或图像数据,在步骤S203中,装置1也不断地自该车载摄像头获取该实时采集到的视频或图像数据,并实时输入至该模式切换模型,模式切换模型的输出为端对端驾驶模式,则装置1无须切换该自动驾驶车辆的驾驶模式;此后,该自动驾驶车辆碰到了某个不安全场景,例如,该自动驾驶车辆即将撞上路边的树,其上的车载摄像头仍然不断地实时采集视频或图像数据,在步骤S203中,装置1也仍旧不断地自该车载摄像头获取该实时采集到的视频或图像数据,即,实时获取该自动驾驶车辆的当前实际场景,并实时输入至该模式切换模型,而此时,该模式切换模型的输出为循迹驾驶模式,则在步骤S204中,装置1将该自动驾驶车辆的驾驶模式切换为循迹驾驶模式。
在此,由于车载传感器是连续不断地采集实时数据,该装置1也是连续不断地获取该实时数据,并输入至模式切换模型进行判断,因此,该装置1可以在该模式切换模型一旦输出的驾驶模式发生变化时,即切换该自动驾驶车辆的驾驶模式;也可以利用多个采集到的实时数据来进行判断,例如,对于一定数量的实时传感器数据,若模式切换模型输出的驾驶模式变化的次数超过预定阈值,则切换该自动驾驶车辆的驾驶模式,以避免少量实时数据可能出现的错误的判断,因此,可以多取一些实时数据来进行判断,以增加判断的准确性。
本领域技术人员应能理解,上述切换自动驾驶车辆的驾驶模式的方式仅为举例,其他现有或今后可能出现的切换自动驾驶车辆的驾驶模式的方式,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
在此,装置1获取自动驾驶车辆的车载传感器所采集的传感器数据,其中,所述传感器数据包括所述自动驾驶车辆的安全场景数据和不安全场景数据;将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型;实时获取所述自动驾驶车辆的车载传感器所采集的当前实际场景;根据所述当前实际场景,基于所述模式切换模型,在端对端驾驶模式或循迹驾驶模式中进行切换;当自动驾驶车辆感知到不安全场景时,自动切换到循迹驾驶模式,如果是安全场景,则自动切换到端对端驾驶模式。装置1利用传感器所采集到的安全场景数据和不安全场景数据,训练一个用于在端对端驾驶模式与循迹驾驶模式之前切换的深度学习决策模型,在实际应用中,该模型能够感知到当前实际场景是否安全,做出决策,输出指令在该两种驾驶模式中进行切换。本发明利用深度学习的决策能力自动切换循迹驾驶模式和端对端驾驶模式,训练出有推理决策能力的模型,将循迹驾驶模式与端对端自动驾驶模式自然地融合,大大提高了自动驾驶的安全性。
优选地,该方法还包括步骤S206(未示出)。在步骤S206中,装置1记录所述自动驾驶车辆在自动驾驶过程中驾驶员的接手行为,获取对应时刻所述车载传感器所采集的传感器修正数据;根据所述传感器修正数据,对所述模式切换模型进行修正。
具体地,在自动驾驶车辆的自动驾驶过程中,驾驶员也可以坐在其中辅助进行驾驶,在该自动驾驶车辆发生不恰当的驾驶行为时,驾驶员可以及时进行人工干预对其进行纠正,在步骤S206中,装置1可以记录在该自动驾驶车辆的自动驾驶过程中驾驶员的接手行为,并且,由于该自动驾驶车辆的车载传感器是连续不断地采集传感器数据的,在步骤S206中,装置1还可以获取在驾驶员接手进行人工驾驶该自动驾驶车辆时,该时刻该车载传感器所采集到的传感器数据,在此,为便于描述,将其称为传感器修正数据,其实际也同样是自动驾驶车辆的车载传感器所采集到的诸如视频、图像或雷达数据等。随后,该装置1可以根据该传感器修正数据,对模式切换模型进行修正。
例如,对于某个传感器数据,如对于某个被摄物不断接近的视频数据,在训练该模式切换模型时是将其归纳为对应端对端驾驶模式,因此,在该自动驾驶车辆的实际驾驶过程中,假设该自动驾驶车辆的车载传感器同样采集到了某个被摄物不断接近的视频数据,在步骤S203中,装置1获取到了该视频数据,作为该自动驾驶车辆的当前实际场景;随后,在步骤S204中,装置1将该当前实际场景输入至模式切换模型,得到的驾驶模式是端对端驾驶模式,因此,该自动驾驶车辆在端对端驾驶模式下进行自动驾驶;而此时驾驶员发现该当前实际场景实际上是一个不安全场景,因此,该驾驶员接手了该自动驾驶车辆而进行人工驾驶,如接手该自动驾驶车辆的方向盘、刹车或换挡手柄,则在步骤S206中,装置1记录该驾驶员的接手行为,并获取此时车载传感器所采集的传感器修正数据,如此时车载摄像头拍摄到被摄物不再接近而是转换角度远离了,因此,装置1可以判断出该当前实际场景是一个不安全场景,并将该模式切换模型修正为当输入是该当前实际场景时,输出是循迹驾驶模式,则此后,该自动驾驶车辆若仍旧碰上该场景时,可以切换至循迹驾驶模式进行自动驾驶。
在此,在训练好模型之后,装置1随时接收模型的输出指令切换循迹驾驶模式与端对端驾驶模式,在这个过程中,通过记录驾驶员接手行为,指出模型的错误决策,采集对应时刻的传感器数据对模型进行加强训练,使该模型的决策能力越来越好,进一步提高了自动驾驶的安全性。
图3示出根据本发明另一个方面的用于驾驶模式切换的装置的结构示意图。
装置1包括采集装置301、训练装置302、获取装置303和切换装置304。该装置1例如位于计算机设备中,该计算机设备例如位于自动驾驶车辆中,也可以是与该自动驾驶车辆通过网络相连接的网络设备,进一步地,该装置1可以部分装置位于网络设备中,部分装置位于自动驾驶车辆中,例如,前述采集装置301和训练装置302位于网络设备中,前述获取装置303和切换装置304位于自动驾驶车辆中。本领域技术人员应能理解,上述装置所处位置仅为举例,其他现有或今后可能出现的装置所处位置,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
其中,采集装置301获取自动驾驶车辆的车载传感器所采集的传感器数据,其中,所述传感器数据包括所述自动驾驶车辆的安全场景数据和不安全场景数据。
具体地,自动驾驶车辆的车载传感器可以采集到对应的不同的传感器数据,这些传感器数据例如是自动驾驶车辆在驾驶过程中的视频数据、图像数据、雷达数据等。在此,这些传感器数据可以是该自动驾驶车辆在自动驾驶过程中被采集的,也可以是该自动驾驶车辆在驾驶员的辅助驾驶过程中被采集的。在此,这些传感器数据可以是该自动驾驶车辆的安全场景数据,即,该自动驾驶车辆在正常的自动驾驶过程或由驾驶员辅助驾驶过程中所采集到的视频数据、图像数据、雷达数据等;也可以是该自动驾驶车辆的不安全场景数据,即,该自动驾驶车辆在自动驾驶过程或由驾驶员辅助驾驶过程中所遇到的不安全的情况,如在发生碰撞、异常加速、异常减速、方向盘打死等情况下车载传感器所采集到的视频数据、图像数据、雷达数据等。
采集装置301通过自动驾驶车辆的车载传感器采集上述传感器数据。在此,自动驾驶车辆的车载传感器包括但不限于车载摄像头、车载雷达等。例如,当自动驾驶车辆自动驾驶时,采集装置301通过该自动驾驶车辆的车载摄像头采集各个视角的视频或图像数据。在此,该车载摄像头用来模拟驾驶员的视线与视角,其例如可以位于自动驾驶车辆的驾驶室、左侧、右侧后视镜、中央后视镜等,该车载摄像头例如可以是双目摄像机。通过该车载摄像头所采集到的视频或图像数据例如可以视作假设该自动驾驶车辆由驾驶员驾驶时,该驾驶员所看到的各种周围景象。随后,若该自动驾驶车辆碰到了某个不安全场景,如突然刹车,采集装置301继续通过该自动驾驶车辆的车载摄像头采集各个视角的视频或图像数据,并保存为不安全场景数据,以供后续模型训练使用。
在此,该方式例如适用于车辆自动驾驶中的端对端驾驶模式,端对端驾驶模式是指自动驾驶车辆利用车载传感器,如车载摄像头、车载雷达等,感知周围景象来判断如何进行自动驾驶,如判断是踩油门还是踩刹车、判断如何打方向盘等,其车辆自动驾驶的自由度较高;与之相对的是循迹驾驶模式,循迹驾驶模式是指自动驾驶车辆利用高精度GPS获知自身的位置,沿着预设轨迹来进行自动驾驶,虽然相对来讲很安全,但行驶轨迹是固定不变的,没有那么灵活。
进一步地,上述端对端驾驶模式或循迹驾驶模式例如是在封闭园区中进行的,在此,封闭园区是指具有有限的路线、有限的物理区域的有限场景,现实中较常见的如港口、停车场、博览会场、校园内部等,当然,该封闭园区也可以进行定制。
本领域技术人员应能理解,上述车载传感器仅为举例,其他现有或今后可能出现的车载传感器,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
本领域技术人员还应能理解,上述采集传感器数据的方式仅为举例,其他现有或今后可能出现的采集传感器数据的方式,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
优选地,所述不安全场景数据由驾驶员故意进行不安全行为而采集。
具体地,驾驶员可以辅助来驾驶该自动驾驶车辆,当驾驶员采用人工来进行驾驶时,可以故意模拟大量不安全行为,例如故意碰撞、故意突然踩油门加速、突然急踩刹车、方向盘打算等,从而使得该自动驾驶车辆上的车载传感器在面临这些不安全场景时,可以采集到相对应的传感器数据。例如,对于某个封闭园区,由于在封闭园区中较为安全,因此,驾驶员在该封闭园区中驾驶该自动驾驶车辆时,可以故意模拟大量不安全行为。
在此,由于训练有素的驾驶员正常驾驶过程中很难产生有效的不安全场景数据,因此,可以利用封闭园区场地小、可操作性强等特点,让驾驶员故意做出各类不安全行为来采集对应的传感器数据。
例如,驾驶员在该封闭园区辅助驾驶该自动驾驶车辆,并在车辆行驶过程中故意去碰撞路边的树,则该自动驾驶车辆上的车载摄像头可以采集到该车辆碰撞树时的景象,如拍摄到对应视频,该视频中出现路边的树不断接近并最后撞上的画面;或者,该自动驾驶车辆上的车载雷达也可以采集对应的信息,如该车载雷达测量到该树作为障碍物与该车辆之间的距离信息;从而,采集装置301采集这些传感器数据,并可以在随后训练模型过程中使用。
又如,若在该自动驾驶车辆不断接近路边的树的过程中,该驾驶员急踩刹车,则该自动驾驶车辆上的车载摄像头可以采集到对应的景象,如拍摄到对应视频,该视频中出现路边的树先不断接近后减速接近最后静止的画面;或者,该自动驾驶车辆上的车载雷达也可以采集对应的信息,如该车载雷达测量到该树作为障碍物与该车辆之间的距离信息,如该距离不断变短最后不再变化。
本领域技术人员应能理解,上述驾驶员故意为之的不安全行为仅为举例,其他现有或今后可能出现的不安全行为,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
在此,装置1利用封闭园区区域小,可操作性强的特点,让驾驶员故意模拟大量不安全行为来创造数据,训练一个用于端对端自动驾驶与循迹切换的深度学习决策模型。
训练装置302将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型。
具体地,训练装置302将采集装置301采集的传感器数据作为输入,而这些传感器数据都有对应的驾驶模式,例如,安全场景数据对应端对端驾驶模式,不安全场景数据对应循迹驾驶模式,将该端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型。例如,在训练模式切换模型时,输入为传感器数据,输出为当前该自动驾驶车辆应启用的驾驶模式编号,0为端对端驾驶模式,1为循迹驾驶模式。
在此,安全场景数据是该自动驾驶车辆在正常驾驶过程中所采集到的传感器数据,由于采用端对端驾驶模式的自由度较高,因此,在自动驾驶车辆未遇到不安全场景时可以采用端对端驾驶模式来进行驾驶,即,这些安全场景数据可对应端对端驾驶模式;而不安全场景数据是该自动驾驶车辆在驾驶过程中遇到不安全场景时所采集到的传感器数据,由于循迹驾驶模式本身的安全度较高,因此,在车辆遇到不安全场景时可以采用循迹驾驶模式来进行驾驶,即,这些不安全场景数据可对应循迹驾驶模式。
在此,该模式切换模型例如可以是一个简单的分类模型,其可以通过现有的对分类模型的训练方式来训练得到,例如,在此,已知自动驾驶车辆是在安全场景下所采集到的传感器数据还是在不安全场景下所采集到的传感器数据,并且已知安全场景下所采集到的传感器数据对应的是端对端驾驶模式,不安全场景下所采集到的传感器数据对应的是循迹驾驶模式,据此来通过各个分类输入得到各个分类输出,例如,在此,输入为传感器数据,输出为当前该自动驾驶车辆应启用的驾驶模式编号,0为端对端驾驶模式,1为循迹驾驶模式,从而训练该模式切换模型;在该模式切换模型训练完成之后,可以对不同的传感器数据进行分类,如当采集装置301通过车载摄像头采集到的是视频数据时,场景分析模型根据该视频数据,先确实是安全场景数据还是不安全场景数据,并据此确定对应的驾驶模式是端对端驾驶模式还是循迹驾驶模式。
本领域技术人员应能理解,上述训练模式切换模型的方式仅为举例,其他现有或今后可能出现的训练模式切换模型的方式,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
优选地,训练装置302建立卷积神经网络模型,将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
具体地,训练装置302建立卷积神经网络模型,将采集装置301采集的传感器数据作为输入,对应的驾驶模式作为输出,例如,安全场景数据作为输入,对应的端对端驾驶模式则作为输出,不安全场景数据作为输入,对应的循迹驾驶模式则作为输出,从而训练模式切换模型。例如,在训练模式切换模型时,将模式切换模型的输出定为当前该自动驾驶车辆应启用的驾驶模式编号,0为端对端驾驶模式,1为循迹驾驶模式,则在安全场景数据作为输入时,输出为0,不安全场景数据作为输入时,输出为1。
更优选地,训练装置302在所述卷积神经网络模型的每两层卷积层中加入负反馈层,每三层卷积层中加入dropout层。
具体地,训练装置302在训练模式切换模型时,建立卷积神经网络模型,并且,在该卷积神经网络模型的每两层卷积层中加入负反馈层,从而增强该卷积神经网络模型的推理能力,并在该卷积神经网络模型的每三层卷积层中加入dropout层,从而增强该卷积神经网络模型的泛化能力。
优选地,所获取的车载传感器所采集的传感器数据分为测试集与训练集;其中,训练装置302将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
具体地,车载传感器所采集的传感器数据可以分为测试集和训练集,该分类的方式可以不做任何限制,例如仅从数量方面考虑即可;其中,该训练集用来训练模式切换模型,测试集则用来测试训练好的模式切换模型。例如,训练装置302将训练集作为输入,训练集中同样也包括安全场景数据和不安全场景数据,训练装置302将这些安全场景数据和不安全场景数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练该模式切换模型。
更优选地,训练装置302将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练获得多个候选切换模型;其中,该装置1还包括选择装置(未示出),选择装置根据所述测试集,自所述多个候选切换模型中选择确定所述模式切换模型。
具体地,训练装置302将车载传感器所采集的传感器数据的训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,可以训练获得多个候选切换模型,例如,随着时间的推进,模型不断得到训练,期间可以获得多个候选切换模型;随后,选择装置根据车载传感器所采集的传感器数据的测试集,对这多个候选切换模型进行测试,例如,该测试集中同样也包括安全场景数据和不安全场景数据,将测试集中的安全场景数据输入至候选切换模型,检验其输出是否是端对端驾驶模式,将测试集中的不安全场景数据输入至候选切换模型,检验其输出是否是循迹驾驶模式,从而自该多个候选切换模型中选择确定最终的模式切换模型。
本领域技术人员应能理解,上述确定模式切换模型的方式仅为举例,其他现有或今后可能出现的确定模式切换模型的方式,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
其中,该装置1还包括获取装置303和切换装置304。
获取装置303实时获取所述自动驾驶车辆的车载传感器所采集的当前实际场景。
具体地,前述采集装置301和训练装置302是对模式切换模型的训练,属于前期工作,而在该模式切换模型训练完成之后,该自动驾驶车辆在实际自动驾驶过程中可以应用该模式切换模型,从而判断是在端对端驾驶模式下进行自动驾驶还是在循迹驾驶模式下进行自动驾驶。
该自动驾驶车辆在实际自动驾驶过程中,其上的车载传感器可以实时地采集数据,例如,位于自动驾驶车辆的驾驶室、左侧、右侧后视镜、中央后视镜等位置的车载摄像头,在自动驾驶车辆实际自动驾驶过程中,不断地进行拍摄,捕捉、采集对应的视频或图像数据。获取装置303在车辆自动驾驶过程中,通过与该自动驾驶车辆的车载传感器的交互,获取该车载传感器所采集的实时数据,该实时数据例如是该自动驾驶车辆所处的当前实际场景,并将该实时数据实时输入至该模式切换模型,根据该模式切换模型的输出,来判断应在哪种驾驶模式下进行驾驶。
切换装置304根据所述当前实际场景,基于所述模式切换模型,在端对端驾驶模式或循迹驾驶模式中进行切换。
具体地,切换装置304根据获取装置303所获取的该自动驾驶车辆所处的当前实际场景,将该当前实际场景输入至该模式切换模型,根据该模式切换模型所输出的驾驶模式,在端对端驾驶模式或循迹驾驶模式中进行切换,例如,假设模式切换模型的输出为当前该自动驾驶车辆应启用的驾驶模式编号,0为端对端驾驶模式,1为循迹驾驶模式,则根据输入至该模式切换模型的当前实际场景,该模式切换模型可以输出对应的驾驶模式编号,根据该驾驶模式编号,切换装置304即可以知道该自动驾驶车辆当前应采用哪种驾驶模式进行自动驾驶。
例如,原本该自动驾驶车辆正在进行正常的端对端自动驾驶,其上的车载摄像头不断地实时采集视频或图像数据,获取装置303也不断地自该车载摄像头获取该实时采集到的视频或图像数据,并实时输入至该模式切换模型,模式切换模型的输出为端对端驾驶模式,则切换装置304无须切换该自动驾驶车辆的驾驶模式;此后,该自动驾驶车辆碰到了某个不安全场景,例如,该自动驾驶车辆即将撞上路边的树,其上的车载摄像头仍然不断地实时采集视频或图像数据,获取装置303也仍旧不断地自该车载摄像头获取该实时采集到的视频或图像数据,即,实时获取该自动驾驶车辆的当前实际场景,并实时输入至该模式切换模型,而此时,该模式切换模型的输出为循迹驾驶模式,则切换装置304将该自动驾驶车辆的驾驶模式切换为循迹驾驶模式。
在此,由于车载传感器是连续不断地采集实时数据,该获取装置303也是连续不断地获取该实时数据,并输入至模式切换模型进行判断,因此,该切换装置304可以在该模式切换模型一旦输出的驾驶模式发生变化时,即切换该自动驾驶车辆的驾驶模式;也可以利用多个采集到的实时数据来进行判断,例如,对于一定数量的实时传感器数据,若模式切换模型输出的驾驶模式变化的次数超过预定阈值,则切换该自动驾驶车辆的驾驶模式,以避免少量实时数据可能出现的错误的判断,因此,可以多取一些实时数据来进行判断,以增加判断的准确性。
本领域技术人员应能理解,上述切换自动驾驶车辆的驾驶模式的方式仅为举例,其他现有或今后可能出现的切换自动驾驶车辆的驾驶模式的方式,如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用的方式包含于此。
在此,装置1获取自动驾驶车辆的车载传感器所采集的传感器数据,其中,所述传感器数据包括所述自动驾驶车辆的安全场景数据和不安全场景数据;将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型;实时获取所述自动驾驶车辆的车载传感器所采集的当前实际场景;根据所述当前实际场景,基于所述模式切换模型,在端对端驾驶模式或循迹驾驶模式中进行切换;当自动驾驶车辆感知到不安全场景时,自动切换到循迹驾驶模式,如果是安全场景,则自动切换到端对端驾驶模式。装置1利用传感器所采集到的安全场景数据和不安全场景数据,训练一个用于在端对端驾驶模式与循迹驾驶模式之前切换的深度学习决策模型,在实际应用中,该模型能够感知到当前实际场景是否安全,做出决策,输出指令在该两种驾驶模式中进行切换。本发明利用深度学习的决策能力自动切换循迹驾驶模式和端对端驾驶模式,训练出有推理决策能力的模型,将循迹驾驶模式与端对端自动驾驶模式自然地融合,大大提高了自动驾驶的安全性。
优选地,该装置1还包括修正装置(未示出)。修正装置记录所述自动驾驶车辆在自动驾驶过程中驾驶员的接手行为,获取对应时刻所述车载传感器所采集的传感器修正数据;根据所述传感器修正数据,对所述模式切换模型进行修正。
具体地,在自动驾驶车辆的自动驾驶过程中,驾驶员也可以坐在其中辅助进行驾驶,在该自动驾驶车辆发生不恰当的驾驶行为时,驾驶员可以及时进行人工干预对其进行纠正,修正装置可以记录在该自动驾驶车辆的自动驾驶过程中驾驶员的接手行为,并且,由于该自动驾驶车辆的车载传感器是连续不断地采集传感器数据的,修正装置还可以获取在驾驶员接手进行人工驾驶该自动驾驶车辆时,该时刻该车载传感器所采集到的传感器数据,在此,为便于描述,将其称为传感器修正数据,其实际也同样是自动驾驶车辆的车载传感器所采集到的诸如视频、图像或雷达数据等。随后,该修正装置可以根据该传感器修正数据,对模式切换模型进行修正。
例如,对于某个传感器数据,如对于某个被摄物不断接近的视频数据,在训练该模式切换模型时是将其归纳为对应端对端驾驶模式,因此,在该自动驾驶车辆的实际驾驶过程中,假设该自动驾驶车辆的车载传感器同样采集到了某个被摄物不断接近的视频数据,获取装置303获取到了该视频数据,作为该自动驾驶车辆的当前实际场景;随后,切换装置304将该当前实际场景输入至模式切换模型,得到的驾驶模式是端对端驾驶模式,因此,该自动驾驶车辆在端对端驾驶模式下进行自动驾驶;而此时驾驶员发现该当前实际场景实际上是一个不安全场景,因此,该驾驶员接手了该自动驾驶车辆而进行人工驾驶,如接手该自动驾驶车辆的方向盘、刹车或换挡手柄,则修正装置记录该驾驶员的接手行为,并获取此时车载传感器所采集的传感器修正数据,如此时车载摄像头拍摄到被摄物不再接近而是转换角度远离了,因此,修正装置可以判断出该当前实际场景是一个不安全场景,并将该模式切换模型修正为当输入是该当前实际场景时,输出是循迹驾驶模式,则此后,该自动驾驶车辆若仍旧碰上该场景时,可以切换至循迹驾驶模式进行自动驾驶。
在此,在训练好模型之后,装置1随时接收模型的输出指令切换循迹驾驶模式与端对端驾驶模式,在这个过程中,通过记录驾驶员接手行为,指出模型的错误决策,采集对应时刻的传感器数据对模型进行加强训练,使该模型的决策能力越来越好,进一步提高了自动驾驶的安全性。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如前任一项所述的方法被执行。
本发明还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如前任一项所述的方法被执行。
本发明还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前任一项所述的方法。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (12)

1.一种用于驾驶模式切换的方法,其中,该方法包括:
a获取自动驾驶车辆的车载传感器所采集的传感器数据,其中,所述传感器数据包括所述自动驾驶车辆的安全场景数据和不安全场景数据;
b将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型;
其中,该方法还包括:
x实时获取所述自动驾驶车辆的车载传感器所采集的当前实际场景;
y根据所述当前实际场景,基于所述模式切换模型,在端对端驾驶模式或循迹驾驶模式中进行切换;
该方法还包括:
记录所述自动驾驶车辆在自动驾驶过程中驾驶员的接手行为,获取对应时刻所述车载传感器所采集的传感器修正数据;
根据所述传感器修正数据,对所述模式切换模型进行修正。
2.根据权利要求1所述的方法,其中,所述步骤b包括:
建立卷积神经网络模型,将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
3.根据权利要求2所述的方法,其中,在所述卷积神经网络模型的每两层卷积层中加入负反馈层,每三层卷积层中加入dropout层。
4.根据权利要求1至3中任一项所述的方法,其中,所获取的车载传感器所采集的传感器数据分为测试集与训练集;
其中,所述步骤b包括:
将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
5.根据权利要求4所述的方法,其中,所述步骤b包括:
将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练获得多个候选切换模型;
其中,该方法还包括:
根据所述测试集,自所述多个候选切换模型中选择确定所述模式切换模型。
6.一种用于驾驶模式切换的装置,其中,该装置包括:
采集装置,用于获取自动驾驶车辆的车载传感器所采集的传感器数据,其中,所述传感器数据包括所述自动驾驶车辆的安全场景数据和不安全场景数据;
训练装置,用于将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练模式切换模型;
其中,该装置还包括:
获取装置,用于实时获取所述自动驾驶车辆的车载传感器所采集的当前实际场景;
切换装置,用于根据所述当前实际场景,基于所述模式切换模型,在端对端驾驶模式或循迹驾驶模式中进行切换;
其中,该装置还包括修正装置,用于:
记录所述自动驾驶车辆在自动驾驶过程中驾驶员的接手行为,获取对应时刻所述车载传感器所采集的传感器修正数据;
根据所述传感器修正数据,对所述模式切换模型进行修正。
7.根据权利要求6所述的装置,其中,所述训练装置用于:
建立卷积神经网络模型,将所述传感器数据作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
8.根据权利要求7所述的装置,其中,在所述卷积神经网络模型的每两层卷积层中加入负反馈层,每三层卷积层中加入dropout层。
9.根据权利要求6至8中任一项所述的装置,其中,所获取的车载传感器所采集的传感器数据分为测试集与训练集;
其中,所述训练装置用于:
将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练所述模式切换模型。
10.根据权利要求9所述的装置,其中,所述训练装置用于:
将所述训练集作为输入,对应的端对端驾驶模式或循迹驾驶模式作为输出,训练获得多个候选切换模型;
其中,该装置还包括:
选择装置,用于根据所述测试集,自所述多个候选切换模型中选择确定所述模式切换模型。
11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如权利要求1至5中任一项所述的方法被执行。
12.一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的方法。
CN201710792452.1A 2017-09-05 2017-09-05 一种用于驾驶模式切换的方法和装置 Active CN107564363B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710792452.1A CN107564363B (zh) 2017-09-05 2017-09-05 一种用于驾驶模式切换的方法和装置
PCT/CN2018/093357 WO2019047596A1 (zh) 2017-09-05 2018-06-28 一种用于驾驶模式切换的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710792452.1A CN107564363B (zh) 2017-09-05 2017-09-05 一种用于驾驶模式切换的方法和装置

Publications (2)

Publication Number Publication Date
CN107564363A CN107564363A (zh) 2018-01-09
CN107564363B true CN107564363B (zh) 2019-11-05

Family

ID=60979111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710792452.1A Active CN107564363B (zh) 2017-09-05 2017-09-05 一种用于驾驶模式切换的方法和装置

Country Status (2)

Country Link
CN (1) CN107564363B (zh)
WO (1) WO2019047596A1 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107564363B (zh) * 2017-09-05 2019-11-05 百度在线网络技术(北京)有限公司 一种用于驾驶模式切换的方法和装置
CN107491073B (zh) * 2017-09-05 2021-04-02 百度在线网络技术(北京)有限公司 无人驾驶车辆的数据训练方法和装置
KR102496654B1 (ko) * 2018-02-21 2023-02-07 현대자동차주식회사 차량의 주행모드 전환 제어 장치 및 방법, 그리고 차량 시스템
CN108446727B (zh) * 2018-03-09 2021-09-21 上海安亭地平线智能交通技术有限公司 驾驶行为决策方法、系统和电子设备
CN108549911B (zh) * 2018-04-18 2020-11-03 清华大学 基于神经网络的驾驶员转向介入识别方法
CN108635861B (zh) * 2018-05-18 2022-04-22 腾讯科技(深圳)有限公司 控制应用中车辆的方法、装置、设备及存储介质
CN108891415A (zh) * 2018-07-18 2018-11-27 上海蓥石汽车技术有限公司 一种提供多种车辆模式选择的控制装置
CN108984275A (zh) * 2018-08-27 2018-12-11 洛阳中科龙网创新科技有限公司 基于Unity3D和深度增强学习的智能无人农用驾驶训练方法
CN109795505A (zh) 2018-12-10 2019-05-24 北京百度网讯科技有限公司 自动驾驶判别方法、装置、计算机设备及存储介质
CN109858369A (zh) 2018-12-29 2019-06-07 百度在线网络技术(北京)有限公司 自动驾驶方法和装置
CN109866772B (zh) * 2019-01-28 2020-08-04 重庆邮电大学 一种智能车辆人-机协同驾驶的变结构控制方法
CN110263709B (zh) * 2019-06-19 2021-07-16 百度在线网络技术(北京)有限公司 驾驶决策挖掘方法和装置
CN110428693B (zh) * 2019-07-31 2021-08-24 驭势科技(北京)有限公司 用户驾驶习惯培训方法、培训模块、车载设备及存储介质
CN110737260B (zh) * 2019-08-29 2022-02-11 南京智慧光信息科技研究院有限公司 基于大数据和人工智能的自动作业方法和机器人系统
CN110654314A (zh) * 2019-09-30 2020-01-07 浙江鸿泉车联网有限公司 基于深度学习的后视镜自动调节方法和装置
CN110930811B (zh) * 2019-11-11 2020-10-16 北京交通大学 一种适用于无人驾驶决策学习和训练的系统
CN111613076A (zh) * 2020-04-09 2020-09-01 吉利汽车研究院(宁波)有限公司 辅助驾驶方法、系统、服务器及存储介质
CN111798717B (zh) * 2020-07-03 2022-05-03 福建百信信息技术有限公司 一种支持vr驾驶培训的电动车控制系统和方法
CN112052956B (zh) * 2020-07-16 2021-12-17 山东派蒙机电技术有限公司 一种强化车辆执行最佳动作的训练方法
CN112331034A (zh) * 2020-11-13 2021-02-05 重庆交通大学 高速列车驾驶员监测、辅助系统
CN113665590B (zh) * 2021-09-24 2024-04-19 阿波罗智联(北京)科技有限公司 控制车辆的方法、装置、设备、介质和车辆
DE102022001383A1 (de) 2022-04-22 2023-10-26 Mercedes-Benz Group AG Fahrzeug und Verfahren zur Ausgabe von Empfehlungen an eine fahrzeugführende Person zur Übernahme einer Fahrzeugsteuerung

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6445983B1 (en) * 2000-07-07 2002-09-03 Case Corporation Sensor-fusion navigator for automated guidance of off-road vehicles
CN102393744A (zh) * 2011-11-22 2012-03-28 湖南大学 一种无人驾驶汽车的导航方法
CN104477167A (zh) * 2014-11-26 2015-04-01 浙江大学 一种智能驾驶系统及其控制方法
CN106143750A (zh) * 2015-01-06 2016-11-23 刘岗 涉及交通移动的系统
CN106951847A (zh) * 2017-03-13 2017-07-14 百度在线网络技术(北京)有限公司 障碍物检测方法、装置、设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9665101B1 (en) * 2012-09-28 2017-05-30 Waymo Llc Methods and systems for transportation to destinations by a self-driving vehicle
DE102014218905A1 (de) * 2013-09-24 2015-03-26 Ford Global Technologies, Llc Verfahren und Schaltsystem zum Aktivieren eines Betriebsmodus eines Fahrzeugs
CN105523039B (zh) * 2014-10-22 2018-03-23 中国移动通信集团公司 一种车辆驾驶模式切换方法及系统
JP6376059B2 (ja) * 2015-07-06 2018-08-22 トヨタ自動車株式会社 自動運転車両の制御装置
CN105270407B (zh) * 2015-10-20 2017-10-31 广州橙行智动汽车科技有限公司 一种自动驾驶汽车行驶模式切换方法及系统
CN105892471B (zh) * 2016-07-01 2019-01-29 北京智行者科技有限公司 汽车自动驾驶方法和装置
CN107564363B (zh) * 2017-09-05 2019-11-05 百度在线网络技术(北京)有限公司 一种用于驾驶模式切换的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6445983B1 (en) * 2000-07-07 2002-09-03 Case Corporation Sensor-fusion navigator for automated guidance of off-road vehicles
CN102393744A (zh) * 2011-11-22 2012-03-28 湖南大学 一种无人驾驶汽车的导航方法
CN104477167A (zh) * 2014-11-26 2015-04-01 浙江大学 一种智能驾驶系统及其控制方法
CN106143750A (zh) * 2015-01-06 2016-11-23 刘岗 涉及交通移动的系统
CN106951847A (zh) * 2017-03-13 2017-07-14 百度在线网络技术(北京)有限公司 障碍物检测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2019047596A1 (zh) 2019-03-14
CN107564363A (zh) 2018-01-09

Similar Documents

Publication Publication Date Title
CN107564363B (zh) 一种用于驾驶模式切换的方法和装置
Song et al. Real-time obstacles detection and status classification for collision warning in a vehicle active safety system
US9573277B2 (en) Intelligent visual humanoid robot and computer vision system programmed to perform visual artificial intelligence processes
CN110377025A (zh) 用于自动驾驶车辆的传感器聚合框架
CN109032103A (zh) 无人驾驶车辆的测试方法、装置、设备及存储介质
CN108028016A (zh) 增强现实显示系统
CN110119148A (zh) 一种六自由度姿态估计方法、装置及计算机可读存储介质
CN109101861A (zh) 障碍物类型识别方法、装置、设备及存储介质
CN107985313A (zh) 用于自主车辆的基于弹簧系统的变换车道方法
CN111899515B (zh) 一种基于智慧道路边缘计算网关的车辆检测系统
JP2020121714A (ja) 最近の走行経路に対する軌跡基盤行動分析を遂行して、車両のモードを手動走行モードから自律走行モードに変更するか否かを判断する学習方法及び学習装置
George et al. DAARIA: Driver assistance by augmented reality for intelligent automobile
CN109117691A (zh) 可行驶区域检测方法、装置、设备及存储介质
CN109358627A (zh) 基于无人驾驶的驾驶辅助方法、装置、设备、介质和车辆
CN107766872A (zh) 一种识别光照驾驶场景的方法和装置
CN109271857A (zh) 一种伪车道线剔除方法及装置
CN105151044B (zh) 车辆辅助驾驶方法及装置
CN109658442A (zh) 多目标跟踪方法、装置、设备及计算机可读存储介质
JP2019182400A (ja) 全自動運転用の視界によるサンプル効率的な強化学習のフレームワーク
CN109635861A (zh) 一种数据融合方法、装置、电子设备及存储介质
CN109117690A (zh) 可行驶区域检测方法、装置、设备及存储介质
CN108876857A (zh) 无人驾驶车辆的定位方法、系统、设备及存储介质
CN108268831A (zh) 一种无人车视觉检测的鲁棒性测试方法和系统
CN108073076A (zh) 车辆控制方法和装置
Li et al. DBUS: Human driving behavior understanding system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant