CN118475504A - 数据处理方法、装置、计算机设备、车辆和可读存储介质 - Google Patents
数据处理方法、装置、计算机设备、车辆和可读存储介质 Download PDFInfo
- Publication number
- CN118475504A CN118475504A CN202280058783.1A CN202280058783A CN118475504A CN 118475504 A CN118475504 A CN 118475504A CN 202280058783 A CN202280058783 A CN 202280058783A CN 118475504 A CN118475504 A CN 118475504A
- Authority
- CN
- China
- Prior art keywords
- data
- driving
- vehicle
- related data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 32
- 238000012216 screening Methods 0.000 claims abstract description 145
- 238000012545 processing Methods 0.000 claims abstract description 114
- 238000000034 method Methods 0.000 claims abstract description 72
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000002372 labelling Methods 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 35
- 238000011156 evaluation Methods 0.000 claims description 28
- 230000007613 environmental effect Effects 0.000 claims description 23
- 230000004927 fusion Effects 0.000 claims description 20
- 230000003068 static effect Effects 0.000 claims description 17
- 238000004891 communication Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 239000000758 substrate Substances 0.000 claims 2
- 239000000523 sample Substances 0.000 claims 1
- 230000006872 improvement Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 description 18
- 230000000694 effects Effects 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000001133 acceleration Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000011158 quantitative evaluation Methods 0.000 description 3
- 230000016776 visual perception Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000000586 desensitisation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Human Computer Interaction (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Traffic Control Systems (AREA)
Abstract
本申请提供了一种数据处理方法、装置、计算机设备、车辆和可读存储介质,涉及智能车辆领域。该方法包括:获取多个第一自动驾驶车辆的驾驶相关数据,对数据进行云端筛选处理,驾驶相关数据包括进行车端筛选处理后所获取的数据,车端筛选处理包括第一价值筛选;利用处理后的驾驶相关数据进行模型训练得到数据驱动模型;对数据驱动模型进行测评,将测评后的数据驱动模型下发至第二自动驾驶车辆,数据驱动模型用于第二自动驾驶车辆的自动驾驶,第一自动驾驶车辆的自动驾驶级别低于第二自动驾驶车辆的自动驾驶级别。通过海量数据的获取以及通过闭环自动化带来的数据处理效率的提升,使数据驱动的算法迭代速度提高,进而促进海量数据获取的数量和效率。
Description
本申请涉及智能车辆技术领域,尤其是涉及到一种数据处理方法、数据处理装置、计算机设备、车辆和计算机可读存储介质。
按照国际汽车工程师学会(SAE international)的分类标准,L4级别自动驾驶属于“高度自动驾驶”,除某些特殊情况,一般无需驾驶员干预。然而,L4级别的自动驾驶也会有限制条件,比如车辆需要在一定限速范围内行驶,且驾驶区域相对固定。此外,自动驾驶车辆一般需依靠可实时更新的道路信息数据支持,实现自动启停车、自动避障等出行的真实场景。
实现L4级别无人驾驶,需要把车辆驾驶过程中遇到的动态元素和静态元素进行结合。其中,静态元素是指行驶道路上的车道线、指引线、道路指示牌等静止不动的元素,而动态元素是指道路上行走的人、行驶的车等运动的元素。因此,无人驾驶(L4及以上)的问题求解空间是静态元素结合每一时刻的动态元素,由于动态元素的引入,会导致求解空间里出现长尾问题。
另外,对于一些不常见的场景、极端的情况以及无法预测的人类行为,也会导致自动驾驶长尾问题。由于这些长尾问题涉及的场景通常难以预测、不遵循统一规则、且相关数据的获取及采集具有非常大的挑战性,因此,长尾问题逐渐成为了制约自动驾驶发展的关键因素。
发明内容
有鉴于此,本申请提供了一种数据处理方法、数据处理装置、计算机设备、车辆和计算机可读存储介质,解决了实现L4级别无人驾驶出现的长尾问 题。
第一方面,本申请实施例提供了一种数据处理方法,应用于云端服务器,该方法包括:获取多个第一自动驾驶车辆的驾驶相关数据,并对驾驶相关数据进行云端筛选处理,其中,驾驶相关数据包括从第一自动驾驶车辆进行车端筛选处理后所获取的数据,车端筛选处理包括对驾驶相关数据进行第一价值筛选;利用云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型;对数据驱动模型进行测评,以及将测评后的数据驱动模型下发至第二自动驾驶车辆,数据驱动模型用于第二自动驾驶车辆的自动驾驶;第一自动驾驶车辆的自动驾驶级别低于第二自动驾驶车辆对应的自动驾驶级别。
在该实施例中,云端服务器获取多个第一自动驾驶车辆的驾驶相关数据,并对驾驶相关数据进行云端筛选处理,再利用云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型,对数据驱动模型进行测评,以及将测评后的数据驱动模型下发至第二自动驾驶车辆,以供第二自动驾驶车辆根据数据驱动模型进行自动驾驶。
本申请实施例,通过海量数据的获取,以及通过闭环自动化带来的数据处理效率的提升,使得数据驱动的算法迭代速度大大提高,进而又可以促进海量数据获取的数量和效率,由此构成了包含海量数据、数据驱动、闭环自动化三个方面互相作用解决自动驾驶车辆遇到的长尾问题,提升自动驾驶技术升级和迭代的效率。
在上述技术方案中,可选地,车端筛选处理还包括对驾驶相关数据进行第一质量筛选;云端筛选处理包括对所述驾驶相关数据进行第二质量筛选。
在该实施例中,驾驶相关数据在第一自动驾驶车辆上除了进行第一价值筛选,还进行第一质量筛选,确保提供给云端服务器的数据为有效数据。
在将驾驶相关数据上传至云端服务器后,云端服务器还会对驾驶相关数据进行第二质量筛选,进一步地确保数据的有效性,保证构建的数据驱动模型的准确性。
在上述任一技术方案中,可选地,第一自动驾驶车辆的传感器数据与 第二自动驾驶车辆的传感器数据可以互相转换。可以理解的,前述第一自动驾驶车辆的传感器数据与第二自动驾驶车辆的传感器数据可以互相转换,包括:第一自动驾驶车辆的传感器数据与第二自动驾驶车辆的传感器数据相同,或者可以通过数据处理的方式将第一自动驾驶车辆的传感器数据转换为与第二自动驾驶车辆的传感器数据相同的数据,反之亦然,本申请实施例对此不作限定。
在上述任一技术方案中,可选地,第一自动驾驶车辆与第二自动驾驶车辆的传感器型号、数量、安装位置、技术规格、生产商等参数完全相同或者基本相同,本申请实施例对此不作限定。
在该实施例中,量产自动驾驶车辆(也即,第一自动驾驶车辆)和完全无人驾驶车辆(也即,第二自动驾驶车辆),需要建立在统一的量产传感器以及统一的技术路线基础上,使两者在数据和技术互相转换或协同。由此可以使通过量产自动驾驶车辆获得的传感器数据用于完全无人驾驶技术的模型训练以及算法的迭代和升级。
在上述任一技术方案中,可选地,驾驶相关数据包括环境数据和/或自车数据,环境数据包括静态环境数据和/或动态环境数据,自车数据包括以下任一项:车辆基础数据、车辆运行数据、车辆定位数据。
在该实施例中,通过对多种类型数据的采集,保证提供多样化的海量数据,由此能够应对多场景下的自动驾驶。
在上述任一技术方案中,可选地,获取多个第一自动驾驶车辆的驾驶相关数据,包括:按照预设时间周期,在第一自动驾驶车辆的存储装置中获取预先存储的驾驶相关数据;或者,通过通信网络,从第一自动驾驶车辆获取驾驶相关数据。
本申请实施例上传数据的方式具有较高的灵活性,在不同场景下使用不同的上传方式,提高了数据传输的效率。
在上述任一技术方案中,可选地,利用云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型,包括:根据数据驱动方式,对云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型;数据驱动模型包括以下至少一项:感知单元、融合预测单元、规控单元。
在该实施例中,根据数据驱动方式对云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型。云端服务器中的数据驱动模型包括感知单元、融合预测单元、规控单元等,数据驱动模型能够为自动驾驶做自动感知、自动预测、自动规控等。需要说明的是,上述感知单元、融合预测单元、规控单元也可称之为感知模块、融合预测模块、规控模块。
通过数据驱动的方式,基本不需要人工设定规则和参数,通过收集到足够数量的数据,构建数据驱动模型,就可以自动化地解决大部分问题,能够实现低成本、高速的系统迭代。
在上述任一技术方案中,可选地,利用云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型,包括:对云端筛选处理后的驾驶相关数据进行自动化标注,生成驾驶相关数据的标注标签,从而对驾驶相关数据进行分类;利用分类后的驾驶相关数据进行模型训练,得到数据驱动模型。
在本申请实施例中,自动化标注算法会不断地在海量数据上迭代,从而实现数据标注,提高标注效率和准确性,使得数据驱动模型的准确率会越来越高。
在上述任一技术方案中,可选地,该方法还包括:利用树形结构对驾驶相关数据的数据处理事件进行描述;将驾驶相关数据和树形结构存储在数据库中;其中,数据处理事件包括数据获取、筛选处理、自动化标注。
在该实施例中,通过树形结构实现将数据处理事件进行标签化的描述,能够有效地进行数据的管理、存储和查询。
在上述任一技术方案中,可选地,该方法还包括:响应于数据查询指令,解析数据查询指令,获取目标标签;根据目标标签与数据库中的标注标签的对比结果,确定与目标标签匹配的标注标签所对应的驾驶相关数据。
在该实施例中,通过标签的方式把所有驾驶相关数据组织好后,允许进行人工或代码的查询。在需要使用数据时,即可基于该树形结构按照标签查询的方式,有效地进行数据的查询,以满足对数据的使用需求。
在上述任一技术方案中,可选地,对数据驱动模型进行测评,包括:将不同维度的驾驶相关数据进行正交处理,得到不同维度的驾驶相关数据 的交集数据;对交集数据进行第二价值筛选,并利用第二价值筛选后的交集数据,对数据驱动模型进行定量测评。
本申请实施例,通过多维度数据进行模型测评,使得对数据驱动模型的测评结果更加准确。
在上述任一技术方案中,可选地,将测评后的数据驱动模型下发至第二自动驾驶车辆,包括:响应于对测评后的多个数据驱动模型的选择指令,确定目标数据驱动模型;响应于对目标数据驱动模型的下发指令,向第二自动驾驶车辆下发目标数据驱动模型。
在该实施例中,当自动测评后,可能得到多种不同的模型算法,再由人工选择能部署到车端的目标数据驱动模型,由此可以保证筛选一个真正适合的模型算法部署到车端,实现自动驾驶技术的升级和迭代。
第二方面,本申请实施例提供了一种数据处理方法,应用于第一自动驾驶车辆,该方法包括:采集驾驶相关数据,并对驾驶相关数据进行车端筛选处理,其中,车端筛选处理包括对驾驶相关数据进行第一价值筛选;向云端服务器上传车端筛选处理后的驾驶相关数据,驾驶相关数据用于云端服务器构建和测评数据驱动模型以及向第二自动驾驶车辆下发数据驱动模型,数据驱动模型用于第二自动驾驶车辆的自动驾驶,第一自动驾驶车辆的自动驾驶级别低于第二自动驾驶车辆的自动驾驶级别。
在该实施例中,第一自动驾驶车辆将采集的驾驶相关数据进行车端筛选处理后上传至云端服务器,由云端服务器构建和评测数据驱动模型,并将数据驱动模型下发至第二自动驾驶车辆,以用于第二自动驾驶车辆的自动驾驶。
本申请实施例,通过海量数据的获取,以及通过闭环自动化带来的数据处理效率的提升,使得数据驱动的算法迭代速度大大提高,进而又可以促进海量数据获取的数量和效率,由此构成了包含海量数据、数据驱动、闭环自动化三个方面互相作用解决自动驾驶车辆遇到的长尾问题,提升自动驾驶技术升级和迭代的效率。
在上述技术方案中,可选地,驾驶相关数据包括环境数据和/或自车数据,环境数据包括静态环境数据和/或动态环境数据,自车数据包括以下至 少一项:车辆基础数据、车辆运行数据、车辆定位数据;车端筛选处理还包括对驾驶相关数据进行第一质量筛选。
在该实施例中,通过对多种类型数据的采集,保证提供多样化的海量数据,由此能够应对多场景下的自动驾驶。
在该实施例中,驾驶相关数据在第一自动驾驶车辆上除了进行第一价值筛选,还进行第一质量筛选,从而确保提供给云端服务器的数据为有效数据,保证构建的数据驱动模型的准确性。
在上述任一技术方案中,可选地,第一自动驾驶车辆的传感器数据与第二自动驾驶车辆的传感器数据可以互相转换。
在该实施例中,量产自动驾驶车辆(也即,第一自动驾驶车辆)和完全无人驾驶车辆(也即,第二自动驾驶车辆),需要建立在统一的量产传感器以及统一的技术路线基础上,使两者在数据和技术互相转换或协同。由此可以使通过量产自动驾驶车辆获得的传感器数据用于完全无人驾驶技术的模型训练以及算法的迭代和升级。
在上述任一技术方案中,可选地,向云端服务器上传车端筛选处理后的所述驾驶相关数据,包括:将采集的驾驶相关数据存储至第一自动驾驶车辆的存储装置中,并按照预设时间周期,将存储装置中的驾驶相关数据上传至云端服务器;或者,通过通信网络,将采集的驾驶相关数据上传至云端服务器。
在该实施例中,上传数据的方式具有较高的灵活性,在不同场景下使用不同的上传方式,提高了数据传输的效率。
第三方面,本申请实施例提供了一种数据处理装置,应用于云端服务器,该装置包括:获取模块,用于获取多个第一自动驾驶车辆的驾驶相关数据;云端筛选模块,用于对驾驶相关数据进行云端筛选处理,其中,驾驶相关数据包括从第一自动驾驶车辆进行车端筛选处理后所获取的数据,车端筛选处理包括对驾驶相关数据进行第一价值筛选;模型训练模块,用于利用云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型;模型测评模块,用于对数据驱动模型进行测评;云端发送模块,用于将测评后的数据驱动模型下发至第二自动驾驶车辆,数据驱动模型用于第二自 动驾驶车辆的自动驾驶,第一自动驾驶车辆的自动驾驶级别低于第二自动驾驶车辆的自动驾驶级别。
第四方面,本申请实施例提供了一种数据处理装置,应用于第一自动驾驶车辆,该装置包括:采集模块,用于采集驾驶相关数据;车端筛选模块,用于对驾驶相关数据进行车端筛选处理,其中,车端筛选处理包括对驾驶相关数据进行第一价值筛选;车端发送模块,用于向云端服务器上传车端筛选处理后的驾驶相关数据,驾驶相关数据用于云端服务器构建和测评数据驱动模型以及向第二自动驾驶车辆下发数据驱动模型,数据驱动模型用于第二自动驾驶车辆的自动驾驶,第一自动驾驶车辆的自动驾驶级别低于第二自动驾驶车辆的自动驾驶级别。
第五方面,本申请实施例提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器存储可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面或第二方面的方法的步骤。
第六方面,本申请实施例提供一种车辆,该车辆包括处理器和存储器,存储器存储可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第二方面的方法的步骤。
第七方面,本申请实施例提供了一种计算机可读存储介质,该可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面或第二方面的方法的步骤。
第八方面,本申请实施例提供了一种芯片,该芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面或第二方面的方法。
第九方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面或第二方面的方法。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段和技术方案,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例的飞轮式数据处理逻辑的示意图之一;
图2示出了本申请实施例的数据处理方法的流程示意图;
图3示出了本申请实施例的飞轮式数据处理逻辑的示意图之二;
图4示出了本申请实施例的应用于云端服务器的数据处理装置的结构框图;
图5示出了本申请实施例的应用于第一自动驾驶车辆的数据处理装置的结构框图;
图6示出了本申请实施例的应用于计算机设备的结构框图。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
如图1所述,本申请实施例提出“飞轮式”数据处理方法,典型地可以用于L4(Level 4)级别及更高级别自动驾驶技术的开发、升级、迭代,以飞轮式海量数据+数据驱动+闭环自动化的方式,解决自动驾驶技术中遇到的长尾问题。本申请实施例中所称的自动驾驶级别,可以参照中国国家标准、国际汽车工程师学会(SAE international)或国际标准组织(ISO,International Organization for Standardization)发布的自动驾驶分级标准,以及其他国家或地区发布的自动驾驶分级标准,本申请实施例对此不作限定。可以理解的,本申请实施例中的“飞轮式”数据处理方法也可以用于L4以下的汽车自动/辅助驾驶技术的开发、升级、迭代。
本申请实施例提出的“飞轮式”技术方法,通过海量数据的获取,以及通过闭环自动化带来的数据处理效率的提升,使得数据驱动的算法迭代速度大大提高,进而又可以促进海量数据获取的数量和效率,由此构成了包含上述三个方面互相作用解决自动驾驶车辆遇到的长尾问题、自动驾驶技术升级和迭代的方法。
本申请实施例中“飞轮”技术的关键在于其闭环(Closed Loop)的特性,利用MPD(Miles Per Disengagement,每英里脱离率)、MPI(Miles per Intervention,接管里程数)等关键指标作为驱动闭环的评价指标,以驱动飞轮“转动”,并且为了让飞轮“转动”起来,需要靠数据和消化这些数据的算法进行驱动,例如机器学习或者深度学习算法等。而为了能够使整个闭环高效地运转,需要一套自动化的基础设施,自动化地收集数据、处理数据、训练模型算法、评测模型算法,评测完后能够与历史版本模型算法做比较,最后自动化地部署在车辆上,再开始新一轮的测试。所以,闭环自动化的作用是能够让整个飞轮转的更快,更能够让研究开发工作聚焦在数据本身以及算法本身的问题上。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的数据处理方法、数据处理装置、计算机设备、车辆和计算机可读存储介质进行详细地说明。
本申请实施例提供了一种数据处理方法,如图2所示,该方法包括:
步骤201,第一自动驾驶车辆采集驾驶相关数据,并对驾驶相关数据进行车端筛选处理。
其中,驾驶相关数据包括从第一自动驾驶车辆进行车端筛选处理后所获取的数据,车端筛选处理包括对驾驶相关数据进行第一价值筛选。
在该实施例中,第一自动驾驶车辆自动识别驾驶过程中遇到的问题,从而采集问题所涉及的驾驶相关数据。例如,当发现自动驾驶车辆出现突然且强制的驾驶员刹车动作,且车辆也感知到自车前方很近距离有其它车辆,则可以据此推断预测算法对与前车的距离预测有误或者未进行有效的车辆控制,由此导致人工的介入,即驾驶员接管车辆的驾驶并进行了制动操作,该场景对于自动驾驶技术来说属于一个非常有价值的场景,第一自动驾驶车辆会采集这个过程的驾驶相关数据。
在本申请的一个实施例中,上述驾驶相关数据包括环境数据和/或自车数据,环境数据是车辆的各种传感器识别到的外部环境情况,包括静态数据和/或动态数据,静态数据包括车道线、交通标识等静态元素,动态数据包括行人、行驶的车辆等动态元素,自车数据包括但不限于车辆基础数据、车辆运行数据、车辆定位数据等,车辆基础数据包括VIN(Vehicle Identification Number,车辆识别码)、发动机号、车型、车牌、颜色、尺寸等表征车辆特性,车辆运行数据包括匀速、加速、减速、行车怠速、驻车怠速、换档变速、滑行、制动、加速控速、转向、倒车、当前能量(电量或油量)、累计里程、车灯开关、车辆起步、紧急制动减速、联网状态、关键零部件运行状态(摄像头、激光雷达、毫米波雷达等)、驾驶员接管监测、驾驶员状态监测、灯光控制、刮水器控制、纵向加速、纵向制动、车轮转向等,车辆定位数据包括车用电子导航地图数据、北斗卫星定位数据、差分定位数据等。可以理解的,此处的车辆可以为单一的车辆,也可以包括编队行驶的多个车辆(fleet),本申请对此不作限定。通过对多种类型数据的采集,保证提供多样化的海量数据,由此能够应对多场景下的自动驾驶。
在数据采集上,本申请实施例利用量产自动驾驶车辆(也即,第一自动驾驶车辆),持续地获取自动驾驶相关数据,从而促进L4级别或者更高级别 的自动驾驶驾驶车辆(也即,第二自动驾驶车辆)的开发,并将自动驾驶技术应用于量产车辆,使自动驾驶系统和技术不断进化。量产自动驾驶车辆和完全无人驾驶车辆,需要建立在统一的量产传感器以及统一的技术路线基础上,使两者在数据和技术互相转换或协同。作为一种具体的实施方式,量产车辆的传感器数据与完全无人驾驶车辆的传感器数据可以互相转换,包括:量产自动驾驶车辆的传感器数据与完全无人驾驶车辆的传感器数据相同,或者可以通过数据处理的方式将量产自动驾驶车辆的传感器数据转换为与完全无人驾驶车辆的传感器数据相同的数据,又或者可以通过数据处理的方式将完全无人驾驶车辆的传感器数据转换为与量产自动驾驶车辆的传感器数据相同的数据,本申请实施例对此不作限定。由此可以使通过量产自动驾驶车辆(例如:百万辆级别的量产车辆)获得的传感器数据用于完全无人驾驶技术的模型训练以及算法的迭代和升级。
作为本申请的一个实施例,量产自动驾驶车辆的传感器配置与完全无人驾驶车辆的传感器配置相同或者基本相同,传感器配置相同包括传感器型号、数量、型号、安装位置、技术规格、生产商等参数完全相同、基本相同或者能够实现相同的技术效果,本申请实施例不做具体限定。
例如,如果量产自动驾驶车辆上安装的摄像头无法提供车辆侧面角度的图像,即使有百万级别的量产车辆每天采集大量的自动驾驶相关数据,但如果因为缺失车辆侧面角度图像数据而导致无法用于自动驾驶技术和产品,其也不具备实用价值。所以,量产自动驾驶车辆和完全无人驾驶车辆具有统一的传感器配置,可以保证采集和回传的数据能同时应用于量产自动驾驶车辆的算法和完全无人驾驶车辆的算法。
进一步地,对于本申请一些特定的实施例,由于传感器配置不统一而导致的采集和回传数据不同的问题,也可以通过一些算法进行弥补。例如,将车辆上的摄像头采集的数据拼成一个柱状图,如果车端安装了12个相机,相机采集图像的视角范围包括30度、60度、120度、180度等,不同视角范围的图像能够拼成一个车身360度环绕的柱状图,然后在柱状图中取出真正需 要的一些数据。由此,无论车辆外部摄像头如何设置,只要所获取的图像确定能覆盖到车身360度,并且保证一定的清晰度,就可以取出想要的数据。
在本申请的一个实施例中,车端采集到驾驶相关数据后,通过车端设置的一些筛选器对驾驶相关数据进行车端筛选处理,也即,实现对驾驶相关数据进行价值、质量的初步自动筛选,通过该筛选方式,确保提供给云端服务器的数据为有效数据,为构建精准的数据驱动模型提供基础。
需要说明的是,对于价值筛选和质量筛选之间的先后顺序不作具体限定。
筛选的标准可以基于车辆的技术标准确定或者由工程师按照技术需求设定,具体地,可以根据自动驾驶过程中遇到的问题确定所采取的筛选方式,或者确定筛选器中嵌入的筛选模型。
例如,对于摄像头采集的图像,先对图像数据的质量进行判断,根据图像数据是否有遮挡、有脏污等指标,确定这些图像数据是否可用。在质量判断后,再对图像数据进行价值判断,也即图像数据对数据驱动的贡献程度,如果数据驱动模型能将一帧图像中的事物(object)感知、预测出来,则这帧图像的价值相对较低;如果数据驱动模型对这帧图像中的事物无法感知、预测,或者是感知、预测的有偏差,该帧图像的价值则相对较高,该帧图像会被回传至云端服务器,从而利用这种有价值的数据去驱动模型算法迭代。再如,数据驱动模型会利用采集的图像数据,对某一个位置感知到有车辆的结果进行打分,分数越高代表感知越置信,也即这个位置确实有车辆的可能性越高,分数越低代表感知不置信,而这些分数较低的数据会被回传至云端服务器。再如,在检测图像时,上一帧图像在某一个位置识别有某个特定的物体(例如,一棵树),下一帧图像在该位置没有识别到该特定物体,那么很可能是检测本身不稳定,由此会把检测的图像数据回传至云端服务器。
另外,不同传感器之间的筛选数据是可以相互影响的,也即,除了借助传感器自身的模型算法对数据进行判断之外,也会借助其他传感器进行有价值的数据的筛选。例如,在使用摄像头采集的数据判断前方是否有车时,可利用雷达数据作为摄像头采集数据的真值进行校验。具体地,会根据雷达在相同的位置是否有同样的检测结果:如果雷达检测到前方有车,但是摄像头 没有识别到前方有车,这种情形对摄像头本身而言也是有价值的评价。相反地,在筛选雷达的有价值数据时,也会结合摄像头的识别结果。
本申请实施例,通过海量数据的获取,为后续的数据驱动提供基础,从而解决自动驾驶车辆遇到的长尾问题。此外,本申请实施例可以自动化地收集数据、筛选数据,提高了数据处理的自动化程度。
步骤202,第一自动驾驶车辆将车端筛选处理后的驾驶相关数据上传至云端服务器。
在本申请的一个实施例中,驾驶相关数据在车端进行筛选之后,被发送到云端服务器。需要说明的是,车端安装了自动驾驶软件,获得必要的授权后,就可以对数据进行采集和上传。
车端向云端服务器进行数据发送的方式包括:在进行大规模的数据采集时,因为通过互联网传输数据的速度比较慢、传输数据量比较大,所以在车端采集数据之后,将数据先存储到车端的存储装置中,然后利用存储装置按照一定时间段(例如,一天)上传到云端服务器;对于已交付给终端用户的量产车,让用户用存储装置来传递数据存在较大难度,因此,数据是在车端通过互联网直接传输至云端服务器,对于需要脱敏的数据则进行必要的脱敏处理之后,通过互联网直接传输至云端服务器。
本申请实施例上传数据的方式具有较高的灵活性,在不同场景下使用不同的上传方式,提高了数据传输的效率。
步骤203,云端服务器获取多个第一自动驾驶车辆的驾驶相关数据,并对驾驶相关数据进行云端筛选处理。
在该实施例中,云端服务器利用在车端获取的海量的驾驶相关数据进行数据驱动。这里需要说明的是,海量数据可以为通过百万辆级别的量产车获取的驾驶相关数据。示例性的,通过100万辆的量产车获取的海量数据,按照每辆车每天运行8个小时、每辆车每天可以获取200T(terabyte)的数据量估算,通过100万辆量产车每天可以获取2×10
8T的海量数据。
在本申请的一个实施例中,为了保证回传数据的正确性,云端服务器会对回传的驾驶相关数据进行云端筛选处理,也即,进行第二质量筛选,具体 为对驾驶相关数据进行进行正确性的判断,以避免车端的判断失误。值得注意的是,在第一自动驾驶车辆进行的第一价值筛选为判断更容易识别的质量问题,比如数据本身的质量,例如,图像数据是否有遮挡、有脏污等指标,而在云端服务器进行的第二价值筛选为判断不容易识别的质量问题,比如受传感器状态所影响的数据质量问题,例如,某个传感器已在车端使用较长时间,由于车辆行驶过程中的震动引起传感器的位置与其初始位置相比发生偏移,进而导致其检测的数据存在误差,所以通过该传感器的检测信号对其回传的数据进行正确性的判断。
步骤204,云端服务器利用云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型。
在该实施例中,根据数据驱动方式对云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型。云端服务器中的数据驱动模型包括感知单元、融合预测单元、规控单元等,数据驱动模型能够为自动驾驶做自动感知、自动预测、自动规控等。需要说明的是,上述感知单元、融合预测单元、规控单元也可称之为感知模块、融合预测模块、规控模块。
相关技术中基于human-driven(规则驱动)算法实现数据驱动的主要挑战之一是用有限的人力解决百万级别的问题,human-driven算法包括完全的规则驱动或者一些简单的小模型,规则驱动是指由人工制定规则,而简单的小模型里面的参数也是人工指定的,并不是通过数据学习而来的。但是,遇到百万级的问题(corner case),使用human driven算法并不现实,因为human driven算法需要使用先验经验。例如,将直路对应直行这个先验知识写在代码里,然后控制车辆在识别到直路时直行,这是一个非常简单的规则,但是一旦遇到道路不是直路,而是有一个“S”弯,并且“S”弯的曲率不确定,那这时上述先验知识就不适用了,也即human driven算法中预先指定的参数不适用了,会导致车辆无法行驶。
所以,本申请实施例设计一套基于后验知识的data driven(数据驱动)算法框架,通过量产数据驱动的方式,基本不需要人工设定规则和参数,通过收集到足够数量的数据,构建数据驱动模型,就可以自动化地解决大部分问 题,从而降低研发成本。相比于human-driven算法,data-driven的算法是可规模化的、自动地解决罕见场景,能够实现低成本、高速的系统迭代。例如,当车辆的行驶速度很快,则根据自动驾驶算法预测其5秒后的行驶距离也应当相应得较长,然而,如果此时根据自动驾驶算法预测车辆未来5秒的所在位置较劲,则可以推定根据该模型预测的准确性很低。如此数据驱动的预测模型就可以对算法进行调整,不断地进行自主迭代,相应地预测准确性也就越来越高。
通过100%数据驱动(data-driven)的方式构建出准确的预测算法,并通过海量真实路面场景的数据回流,自动化地提高预测算法的性能。通过融合海量数据中成熟人类司机的驾驶行为,来理解周围环境,理解不同车之间的交互以及车和路之间的交互,从而更准确地预测目标的未来行驶轨迹,让算法更可靠地处理复杂路况,为用户提供更安全、安心的驾驶体验。
需要说明的是,data-driven算法在云端服务器做训练和迭代,最终部署在车端,也就是说,data-driven算法实时运行在车端,并且在车端实时运行的同时,在云端服务器也会对该套算法进行维护。
感知、融合预测和规控等算法模块都可以通过数据驱动的方式实现快速迭代与更新。感知、融合预测和规控是一个串行作业,先进行感知,感知包括视觉的感知、毫米波雷达感知、激光雷达的感知等,感知之后进行融合,对视觉感知、毫米波雷达感知、激光雷达感知的结果进行融合,然后基于融合结果进行路径预测、车辆控制逻辑预测,最后依据预测进行规划和控制。实际上,自动驾驶系统在车端运行时,感知、融合预测和规控可以是一个流水线的作业,传感器得到的每一帧数据都会去做感知,然后进行融合和预测以及规控,类似地,对下一帧数据又进行感知、融合预测和规控,而整个过程的延时是非常低的,所以相当于是流水线作业,并不是每一帧数据都要完全处理完才能处理下一帧。
以上所述的融合逻辑属于后融合,也即,各个传感器先做感知,先各自给出感知结果,然后再对感知结果去做融合。当然,本申请也可以应用前融合的逻辑,在此不对融合方式做具体限定。
在本申请的一个实施例中,云端服务器中维护有一个大规模的数据库,该数据库能够将所有回流的驾驶相关数据,包括传感器的感知结果、车辆的执行状态、道路环境状态等数据汇总在一起,实现持续回流、安全管理。
在本申请的一个实施例中,对云端筛选处理后的驾驶相关数据进行自动化标注,生成驾驶相关数据的标注标签,从而对驾驶相关数据进行分类;对分类后的驾驶相关数据进行模型训练,得到数据驱动模型。
相关技术中的数据标注以手动标注为主,通过数据标注服务商、众包平台等途径进行人工标记,例如:对于一帧图像,以人工的方式标记图像里有人的位置、有车的位置等。而本申请实施例实现了一套基于上述数据库进行驾驶相关数据的自动化标注算法,自动化标注算法会不断地在数据库中的海量数据上迭代,从而实现数据标注,使得准确率会越来越高。
通过上述方式,在数据库的基础上,对所有回传的数据进行自动化标注,如果自动化标注的准确率足够高,则直接用于后续模型训练,而对于准确率不够的部分数据,则不使用或者是少量使用。由此,不断地提高整个自动化标注的效率和准确率。
在本申请的一个实施例中,上述数据库除了存储海量的驾驶相关数据,还存储有用于对驾驶相关数据的数据处理事件进行描述的树形结构,其中,数据处理事件包括数据获取、筛选处理、自动化标注等。
在该实施例中,车端对驾驶相关数据的采集、筛选,以及云端服务器对驾驶相关数据的筛选、标注,称为数据处理事件,整个处理过程可以称为事件产线或者事件生产流水线。本申请实施例提出一个树形结构对数据处理事件进行描述,树形结构是一个具有层次的嵌套结构,指的是数据元素之间存在着“一对多”的树形关系的数据结构。数据处理事件可划分为动态场景事件和静态场景事件,还可以划分为bad事件(bad event)和good事件(good event),其中,bad事件例如发生了危险变道导致的碰撞风险,它会有很多MPD问题和MPI问题,将MPD问题和MPI问题全部囊括在树形结构中,good事件跟产品描述相关,产品上要求的车道保持状态、变道导航状态等描述,会通过一个结构化方式囊括在树形结构中。
本申请实施例,通过树形结构实现将数据处理事件进行标签化的描述,能够有效地进行数据的管理、存储和查询。
在本申请的一个实施例中,在对云端筛选处理后的驾驶相关数据进行自动化标注之后,该方法还包括:获取数据查询指令,解析数据查询指令,获取目标标签;将目标标签与数据库中的标注标签进行对比,确定与目标标签匹配的标注标签所对应的驾驶相关数据。
在该实施例中,通过标签的方式把所有驾驶相关数据组织好后,允许进行人工或代码的查询。具体地,在获取到数据查询指令后,获取数据查询指令所携带的目标标签,在数据库中进行对比,确定与目标标签匹配的标注标签,进而确定该标注标签所对应的驾驶相关数据,实现数据的查询。在需要使用数据时,即可基于该树形结构按照标签查询的方式,有效地进行数据的查询,以满足对数据的使用需求。
本申请实施例,能够基于自动筛选出的海量黄金数据,实现数据驱动算法的自动构建和迭代,以解决自动驾驶车辆遇到的长尾问题。
步骤205,云端服务器对数据驱动模型进行测评,以及将测评后的数据驱动模型下发至第二自动驾驶车辆。
其中,数据驱动模型用于第二自动驾驶车辆的自动驾驶。
在该实施例中,云端服务器对数据驱动模型进行测评,生成测评报告,该测评报告中的评测结果可用于确定是否进行模型发版。
在本申请的一个实施例中,将测评后的数据驱动模型下发至第二自动驾驶车辆,包括:接收对测评后的多个数据驱动模型的选择指令,在多个数据驱动模型中确定目标数据驱动模型;接收对目标数据驱动模型的下发指令,将目标数据驱动模型发至第二自动驾驶车辆。也就是说,测评之后是人工介入的节点,当自动测评后,可能得到多种不同的模型算法,再由人工选择能部署到车端的目标数据驱动模型,由此可以保证筛选一个真正适合的模型算法部署到车端(也即,第二自动驾驶车辆)。相比于第二自动驾驶车辆当前部署的模型算法,新部署的模型算法是具有性能提升的,部署到车端后再进行一些实车测试,最终推广到所有车商,实现自动驾驶技术的升级和迭代。
在本申请的一个实施例中,对数据驱动模型进行测评,包括:对数据驱动模型进行定性测评、定量测评和定场景测评。
其中,定性测评是指人工采取以经验进行观察与判断的方法,侧重从数据的性质方面进行测评。定量测评是通过设计的一些评价指标对驱动模型的数据进行测评。定场景测评是更具有针对性和代表性的,具体为,将不同维度的驾驶相关数据进行正交处理,得到不同维度的驾驶相关数据的交集数据,再对交集数据进行第二价值筛选,并利用第二价值筛选后的交集数据,对数据驱动模型进行定量测评。其中,作为一种具体的实施方式,上述正交处理可以是指对驾驶相关数据进行正交实验,也即,利用数据统计学和正交性原理,通过正交表合理地安排多驾驶相关数据进行试验,以寻求最优数据交集组合。
本申请实施例中,上述正交表的行参数表示车辆的行驶场景,正交表的列参数表示数据驱动模型的表现参数,行参数可以包括高速、城市、路口、坡道、汇流口、匝道、天气条件等,在一些情况下,还可以对不同的场景参数耦合速度参数或者距离参数等。列参数可以包括准确率、召回率、位置偏差等,在一些情况下,还可以对不同的表现参数与车、道路障碍物、VRU(Vulnerable Road Users,弱势道路参与者)等方面进行耦合。可以理解的,以上的行参数或列参数仅为示例性的,根据不同模型定场景评测的需求,可以对行参数和列参数进行互换,也可以对行或列的参数进行增加或减少,本申请实施例对此不作限定。
本申请实施例对数据驱动模型进行测评的方式即为定场景测评,通过多维度数据进行测评,使得对数据驱动模型的测评结果更加准确。
需要说明的是,第一自动驾驶车辆的自动驾驶级别低于第二自动驾驶车辆的自动驾驶级别,例如,第一自动驾驶车辆为量产自动驾驶车辆,可以为L4以下级别的车辆,而第二自动驾驶车辆为L4级别或者更高级别的自动驾驶车辆。通过将利用较低级别自动驾驶车辆的驾驶相关数据构建的数据驱动模型用于较高级别自动驾驶车辆的自动驾驶,促进了较高级别自动驾驶车辆的开发。
此外,在一些实施例中,第一自动驾驶车辆的自动驾驶级别也可以高于或者等同于第二自动驾驶车辆对应的自动驾驶级别,例如第一自动驾驶车辆为L4级别车辆,第二自动驾驶车辆为L4级别或者更低级别的车辆,通过将利用较高级别自动驾驶车辆的驾驶相关数据构建的数据驱动模型用于较低级别自动驾驶车辆的自动驾驶,提高了较低级别车辆的驾驶性能。
如图3所示,闭环自动化工具链包含上述数据采集、回流、分析、标注、模型训练及验证环节,用来帮助数据和算法之间形成快速迭代的反馈闭环,这个工具链可以自动筛选出海量黄金数据,驱动算法自动迭代,让“飞轮”越转越快,从而通过借助闭环自动化能力将长尾数据不断消化吸收,持续提高性能天花板。
需要说明的是,本申请实施例一直在不断地把每一个环节的自动化程度做得越来越高,但是中间如果出现了一些异常数据,则可能需要人工介入来分析数据的异常,例如,传感器标签异常,对车辆的自驾行驶安全是有很大影响的,所以在通过数据判断发现这个问题后,由人工介入对该车辆重新标定修复。
以下给出飞轮式数据处理方法的几个实施例。
在车道线感知场景中,对于一段路的车道线的感知,是每隔一定距离打一个点,通过这些点连成车道线。打点数据包括三种情况,第一种情况,点可能比较模糊,导致完全识别不出来;第二种情况,虽然能识别出来,但并不完整,导致通过点连成的车道线中间会有缺失;第三种情况,虽然能检出车道线,但是可能有一些比较特殊的线,例如,某些城市的一些路口附近的车道线与其他城市的车道线差异比较大,会出现2条车道变3条车道、3条车道变4条车道、左转待转区域、待直行区域等。以上三种类型数据会通过对应的筛选器进行筛选,并被回传到云端服务器。
利用行驶过这段路的所有车辆采集的数据进行车道线识别模型的构建,得到更精准车道线识别模型,再将该车道线识别模型部署到车端,实现在无人驾驶的过程中进行车道线识别。并且,采集数据的车辆越多,数据质量越高,模型就更精准,由此形成了一个闭环。
在慢车超车场景中,当自动驾驶车辆识别出其前车为慢车,该慢车显著地低于周围车的车速,并且自动驾驶车辆(也即,自车)又跟该慢车在同一个车道上,对于该情形自车就要做出决策,例如,变道超车。变道超车需要按照一条行驶轨迹(Trajectory)去执行,例如,向左变道、加速超车这么一条轨迹。
而相关技术中的planning方法是按照规则去做这个决策,然后规划出来一条轨迹。而本申请会有一个深度学习算法,这个深度学习算法的输入是地图和感知的一些行人、车辆、位置、速度等,输出就是对自车的规划轨迹,当然会输出多条轨迹,然后依据多个维度的指标给每一个轨迹都进行打分,多个维度的指标包括安全性、舒适性、效率。例如引发碰撞的轨迹分数较低,拐弯太急的或者加减速太急的轨迹分数较低,限速越低的轨迹分数较低。
如果模型对于慢车超车的事件不敏感,那就需要从历史数据去挖掘或者去收集大量的人类驾驶员遇到相同或者相似场景时,进行慢车超车操作的相关数据。比如收集了成千上万个这样的数据,数据里面都是自动驾驶车遇到一个慢车从而变道超车的轨迹,然后把这种数据加到模型训练过程中,以提高模型的精准度。
在车辆加塞的场景中,从车辆的实际行驶过程采集了海量数据,作为视觉感知的原始训练数据,同时以激光雷达输出的距离信息作为真值,使视觉感知算法自主学习其他行驶目标的具体位置信息,通过视觉感知可以准确判断出车辆所在位置以及其与车道线、其他行驶目标之间的相对位置关系,预判其他行驶目标未来的行动轨迹,也即预判了加塞行为,提前进行避让,实现自车准确应对各种复杂的加塞场景。
示例性的,在车辆加塞场景中,在车辆行驶速度为80km/h(千米/小时)的条件下,将制动时机提前800毫秒,可以提前17.8m制动,如果车辆的时速为60km/h,则可以提前13.3m制动。由此可以显著提高车辆行驶的安全性,并改善车辆制动导致驾乘不适感。
作为应用于云端服务器的数据处理方法的具体实现,本申请实施例提供了一种应用于云端服务器的数据处理装置。如图4所示,该数据处理装置400 包括:获取模块401、云端筛选模块402、模型训练模块403、模型测评模块404以及云端发送模块405。
其中,获取模块401,用于获取多个第一自动驾驶车辆的驾驶相关数据;云端筛选模块402,用于对驾驶相关数据进行云端筛选处理,其中,驾驶相关数据包括从第一自动驾驶车辆进行车端筛选处理后所获取的数据,车端筛选处理包括对驾驶相关数据进行第一价值筛选;模型训练模块403,用于利用云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型;模型测评模块404,用于对数据驱动模型进行测评;云端发送模块405,用于将测评后的数据驱动模型下发至第二自动驾驶车辆,数据驱动模型用于第二自动驾驶车辆的自动驾驶;第一自动驾驶车辆的自动驾驶级别低于第二自动驾驶车辆对应的自动驾驶级别。
进一步地,车端筛选处理还包括对驾驶相关数据进行第一质量筛选;云端筛选处理包括对所述驾驶相关数据进行第二质量筛选。
进一步地,驾驶相关数据包括环境数据和/或自车数据,环境数据包括静态环境数据和/或动态环境数据,自车数据包括以下任一项:车辆基础数据、车辆运行数据、车辆定位数据。
进一步地,获取模块401,具体用于:按照预设时间周期,在第一自动驾驶车辆的存储装置中获取预先存储的驾驶相关数据;或者,通过通信网络,从第一自动驾驶车辆获取驾驶相关数据。
进一步地,模型训练模块403,具体用于根据数据驱动方式,对云端筛选处理后的驾驶相关数据进行模型训练,得到数据驱动模型;数据驱动模型包括以下至少一项:感知单元、融合预测单元、规控单元。
进一步地,模型训练模块403,具体用于:对云端筛选处理后的驾驶相关数据进行自动化标注,生成驾驶相关数据的标注标签,从而对驾驶相关数据进行分类;利用分类后的驾驶相关数据进行模型训练,得到数据驱动模型。
进一步地,该装置还包括:存储模块,用于利用树形结构对驾驶相关数据的数据处理事件进行描述,并将驾驶相关数据和树形结构存储在数据库中;其中,数据处理事件包括数据获取、筛选处理、自动化标注。
进一步地,获取模块401,还用于获取数据查询指令,解析数据查询指令,获取目标标签;该装置还包括:查询模块,用于根据目标标签与数据库中的标注标签的对比结果,确定与目标标签匹配的标注标签所对应的驾驶相关数据。
进一步地,模型测评模块404,具体用于:将不同维度的驾驶相关数据进行正交处理,得到不同维度的驾驶相关数据的交集数据;对交集数据进行第二价值筛选,并利用第二价值筛选后的交集数据,对数据驱动模型进行定量测评。
进一步地,获取模块401,还用于获取对测评后的多个数据驱动模型的选择指令,确定目标数据驱动模型,以及获取对目标数据驱动模型的下发指令;云端发送模块405,具体用于响应于下发指令,向第二自动驾驶车辆下发目标数据驱动模型。
作为应用于第一自动驾驶车辆的数据处理方法的具体实现,本申请实施例提供了一种应用于第一自动驾驶车辆的数据处理装置。如图5所示,该数据处理装置500包括:采集模块501、车端筛选模块502以及车端发送模块503。
其中,采集模块501,用于采集驾驶相关数据;车端筛选模块502,用于对驾驶相关数据进行车端筛选处理,其中,车端筛选处理包括对驾驶相关数据进行第一价值筛选;车端发送模块503,用于向云端服务器上传车端筛选处理后的驾驶相关数据,驾驶相关数据用于云端服务器构建和测评数据驱动模型以及向第二自动驾驶车辆下发数据驱动模型,数据驱动模型用于第二自动驾驶车辆的自动驾驶,第一自动驾驶车辆的自动驾驶级别低于第二自动驾驶车辆的自动驾驶级别。
进一步地,驾驶相关数据包括环境数据和/或自车数据,环境数据包括静态环境数据和/或动态环境数据,自车数据包括以下至少一项:车辆基础数据、车辆运行数据、车辆定位数据;车端筛选处理包括对驾驶相关数据进行第一价值筛选、第一质量筛选。
进一步地,车端发送模块503,具体用于:将采集的驾驶相关数据存储至第一自动驾驶车辆的存储装置中,并按照预设时间周期,将存储装置中的驾驶相关数据上传至云端服务器;或者,通过通信网络,将采集的驾驶相关数据上传至云端服务器。
本申请实施例中的上述数据处理装置可以是计算机设备,也可以是计算机设备中的部件,例如集成电路或芯片。
本申请实施例中的数据处理装置可以为具有操作系统的装置,对于操作系统的具体类型本申请实施例不作限定。
本申请实施例提供的数据处理装置能够实现数据处理方法实施例实现的各个过程,为避免重复,这里不再赘述。
本申请实施例还提供一种计算机设备,该计算机设备可以是服务器。如图6所示,该计算机设备600包括处理器601和存储器602,存储器602上存储有可在处理器601上运行的程序或指令,该程序或指令被处理器601执行时实现上述数据处理方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的计算机设备包括上述的移动计算机设备和非移动计算机设备。
存储器602可用于存储软件程序以及各种数据。存储器602可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器602可以包括易失性存储器或非易失性存储器,或者,存储器602可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、 双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请实施例中的存储器602包括但不限于这些和任意其它适合类型的存储器。
处理器601可包括一个或多个处理单元;可选的,处理器601集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器601中。
本申请实施例还提供一种车辆,该车辆包括处理器和存储器,存储器存储可在处理器上运行的程序或指令,程序或指令被处理器执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供了一种芯片,该芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
本申请实施例还提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下, 由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (30)
- 一种数据处理方法,其特征在于,应用于云端服务器,所述方法包括:获取多个第一自动驾驶车辆的驾驶相关数据,并对所述驾驶相关数据进行云端筛选处理,其中,所述驾驶相关数据包括从所述第一自动驾驶车辆进行车端筛选处理后所获取的数据,所述车端筛选处理包括对驾驶相关数据进行第一价值筛选;利用云端筛选处理后的所述驾驶相关数据进行模型训练,得到数据驱动模型;对所述数据驱动模型进行测评,以及将测评后的所述数据驱动模型下发至第二自动驾驶车辆,所述数据驱动模型用于所述第二自动驾驶车辆的自动驾驶,所述第一自动驾驶车辆的自动驾驶级别低于所述第二自动驾驶车辆的自动驾驶级别。
- 根据权利要求1所述的方法,其特征在于,所述车端筛选处理还包括对驾驶相关数据进行第一质量筛选;云端筛选处理包括对所述驾驶相关数据进行第二质量筛选。
- 根据权利要求1所述的方法,其特征在于,所述驾驶相关数据包括环境数据和/或自车数据,所述环境数据包括静态环境数据和/或动态环境数据,所述自车数据包括以下任一项:车辆基础数据、车辆运行数据、车辆定位数据。
- 根据权利要求1所述的方法,其特征在于,获取多个第一自动驾驶车辆的驾驶相关数据,包括:按照预设时间周期,在所述第一自动驾驶车辆的存储装置中获取预先存储的所述驾驶相关数据;或者,通过通信网络,从所述第一自动驾驶车辆获取所述驾驶相关数据。
- 根据权利要求1所述的方法,其特征在于,利用云端筛选处理后的所述驾驶相关数据进行模型训练,得到数据驱动模型,包括:根据数据驱动方式,对云端筛选处理后的所述驾驶相关数据进行模型 训练,得到数据驱动模型;所述数据驱动模型包括以下至少一项:感知单元、融合预测单元、规控单元。
- 根据权利要求1至5中任一项所述的方法,其特征在于,利用云端筛选处理后的所述驾驶相关数据进行模型训练,得到数据驱动模型,包括:对云端筛选处理后的所述驾驶相关数据进行自动化标注,生成所述驾驶相关数据的标注标签,从而对所述驾驶相关数据进行分类;利用分类后的所述驾驶相关数据进行模型训练,得到数据驱动模型。
- 根据权利要求6所述的方法,其特征在于,还包括:利用树形结构对所述驾驶相关数据的数据处理事件进行描述;将所述驾驶相关数据和所述树形结构存储在数据库中;其中,所述数据处理事件包括数据获取、筛选处理、自动化标注。
- 根据权利要求7所述的方法,其特征在于,还包括:响应于数据查询指令,解析所述数据查询指令,获取目标标签;根据所述目标标签与所述数据库中的标注标签的对比结果,确定与所述目标标签匹配的标注标签所对应的驾驶相关数据。
- 根据权利要求1至5中任一项所述的方法,其特征在于,对所述数据驱动模型进行测评,包括:将不同维度的所述驾驶相关数据进行正交处理,得到不同维度的所述驾驶相关数据的交集数据;对所述交集数据进行第二价值筛选,并利用第二价值筛选后的所述交集数据,对所述数据驱动模型进行定量测评。
- 根据权利要求1至5中任一项所述的方法,其特征在于,将测评后的所述数据驱动模型下发至第二自动驾驶车辆,包括:响应于对测评后的多个所述数据驱动模型的选择指令,确定目标数据驱动模型;响应于对所述目标数据驱动模型的下发指令,向第二自动驾驶车辆下发所述目标数据驱动模型。
- 一种数据处理方法,其特征在于,应用于第一自动驾驶车辆,所 述方法包括:采集驾驶相关数据,并对所述驾驶相关数据进行车端筛选处理,其中,所述车端筛选处理包括对驾驶相关数据进行第一价值筛选;向云端服务器上传车端筛选处理后的所述驾驶相关数据,所述驾驶相关数据用于所述云端服务器构建和测评数据驱动模型以及向第二自动驾驶车辆下发所述数据驱动模型,所述数据驱动模型用于所述第二自动驾驶车辆的自动驾驶,所述第一自动驾驶车辆的自动驾驶级别低于所述第二自动驾驶车辆的自动驾驶级别。
- 根据权利要求11所述的方法,其特征在于,所述驾驶相关数据包括环境数据和/或自车数据,所述环境数据包括静态环境数据和/或动态环境数据,所述自车数据包括以下至少一项:车辆基础数据、车辆运行数据、车辆定位数据;所述车端筛选处理还包括对所述驾驶相关数据第一质量筛选。
- 根据权利要求11或12所述的方法,其特征在于,向云端服务器上传车端筛选处理后的所述驾驶相关数据,包括:将采集的驾驶相关数据存储至所述第一自动驾驶车辆的存储装置中,并按照预设时间周期,将所述存储装置中的所述驾驶相关数据上传至云端服务器;或者,通过通信网络,将采集的驾驶相关数据上传至云端服务器。
- 一种数据处理装置,其特征在于,应用于云端服务器,所述装置包括:获取模块,用于获取多个第一自动驾驶车辆的驾驶相关数据;云端筛选模块,用于对所述驾驶相关数据进行云端筛选处理,其中,所述驾驶相关数据包括从所述第一自动驾驶车辆进行车端筛选处理后所获取的数据,所述车端筛选处理包括对驾驶相关数据进行第一价值筛选;模型训练模块,用于利用云端筛选处理后的所述驾驶相关数据进行模型训练,得到数据驱动模型;模型测评模块,用于对所述数据驱动模型进行测评;云端发送模块,用于将测评后的所述数据驱动模型下发至第二自动驾 驶车辆,所述数据驱动模型用于所述第二自动驾驶车辆的自动驾驶,所述第一自动驾驶车辆的自动驾驶级别低于所述第二自动驾驶车辆的自动驾驶级别。
- 根据权利要求14所述的装置,其特征在于,所述车端筛选处理还包括对驾驶相关数据进行第一质量筛选;云端筛选处理包括对所述驾驶相关数据进行第二质量筛选。
- 根据权利要求14所述的装置,其特征在于,所述驾驶相关数据包括环境数据和/或自车数据,所述环境数据包括静态环境数据和/或动态环境数据,所述自车数据包括以下任一项:车辆基础数据、车辆运行数据、车辆定位数据。
- 根据权利要求14所述的装置,其特征在于,所述获取模块,具体用于:按照预设时间周期,在所述第一自动驾驶车辆的存储装置中获取预先存储的所述驾驶相关数据;或者,通过通信网络,从所述第一自动驾驶车辆获取所述驾驶相关数据。
- 根据权利要求14所述的装置,其特征在于,所述模型训练模块,具体用于根据数据驱动方式,对云端筛选处理后的所述驾驶相关数据进行模型训练,得到数据驱动模型;所述数据驱动模型包括以下至少一项:感知单元、融合预测单元、规控单元。
- 根据权利要求14至18中任一项所述的装置,其特征在于,所述模型训练模块,具体用于:对云端筛选处理后的所述驾驶相关数据进行自动化标注,生成所述驾驶相关数据的标注标签,从而对所述驾驶相关数据进行分类;利用分类后的所述驾驶相关数据进行模型训练,得到数据驱动模型。
- 根据权利要求19所述的装置,其特征在于,还包括:存储模块,用于利用树形结构对所述驾驶相关数据的数据处理事件进行描述,并将所述驾驶相关数据和所述树形结构存储在数据库中;其中,所述数据处理事件包括数据获取、筛选处理、自动化标注。
- 根据权利要求20所述的装置,其特征在于,所述获取模块,还用于响应于数据查询指令,解析所述数据查询指令,获取目标标签;所述装置还包括:查询模块,用于根据所述目标标签与所述数据库中的标注标签的对比结果,确定与所述目标标签匹配的标注标签所对应的驾驶相关数据。
- 根据权利要求14至18中任一项所述的装置,其特征在于,所述模型测评模块,具体用于:将不同维度的所述驾驶相关数据进行正交处理,得到不同维度的所述驾驶相关数据的交集数据;对所述交集数据进行第二价值筛选,并利用第二价值筛选后的所述交集数据,对所述数据驱动模型进行定量测评。
- 根据权利要求14至18中任一项所述的装置,其特征在于,所述获取模块,还用于响应于对测评后的多个所述数据驱动模型的选择指令,确定目标数据驱动模型,以及响应于对所述目标数据驱动模型的下发指令;所述云端发送模块,具体用于响应于下发指令,向第二自动驾驶车辆下发所述目标数据驱动模型。
- 一种数据处理装置,其特征在于,应用于第一自动驾驶车辆,所述装置包括:采集模块,用于采集驾驶相关数据;车端筛选模块,用于对所述驾驶相关数据进行车端筛选处理,其中,所述车端筛选处理包括对驾驶相关数据进行第一价值筛选;车端发送模块,用于向云端服务器上传车端筛选处理后的所述驾驶相关数据,所述驾驶相关数据用于所述云端服务器构建和测评数据驱动模型以及向第二自动驾驶车辆下发所述数据驱动模型,所述数据驱动模型用于所述第二自动驾驶车辆的自动驾驶,所述第一自动驾驶车辆的自动驾驶级别低于所述第二自动驾驶车辆的自动驾驶级别。
- 根据权利要求24所述的装置,其特征在于,所述驾驶相关数据包括环境数据和/或自车数据,所述环境数据包括静态环境数据和/或动态环境数据,所述自车数据包括以下至少一项:车辆基础数据、车辆运行数据、车辆定位数据;所述车端筛选处理还包括对所述驾驶相关数据第一质量筛选。
- 根据权利要求24或25所述的装置,其特征在于,所述车端发送模块,具体用于:将采集的驾驶相关数据存储至所述第一自动驾驶车辆的存储装置中,并按照预设时间周期,将所述存储装置中的所述驾驶相关数据上传至云端服务器;或者,通过通信网络,将采集的驾驶相关数据上传至云端服务器。
- 一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至10中任一项所述的数据处理方法的步骤,或者实现如权利要求11至13中任一项所述的数据处理方法的步骤。
- 一种车辆,其特征在于,包括处理器和存储器,所述存储器存储有在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求11至13中任一项所述的数据处理方法的步骤。
- 一种计算机可读存储介质,其上存储有程序或指令,其特征在于,所述程序或指令被处理器执行时实现如权利要求1至10中任一项所述的数据处理方法的步骤,或者实现如权利要求11至13中任一项所述的数据处理方法的步骤。
- 一种计算机程序产品,其特征在于,所述计算机程序产品被存储在存储介质中,所述计算机程序产品被至少一个处理器执行以实现如权利要求1至10中任一项所述的数据处理方法的步骤,或者实现如权利要求11至13中任一项所述的数据处理方法的步骤。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2022/137330 WO2024119412A1 (zh) | 2022-12-07 | 2022-12-07 | 数据处理方法、装置、计算机设备、车辆和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118475504A true CN118475504A (zh) | 2024-08-09 |
Family
ID=91378450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280058783.1A Pending CN118475504A (zh) | 2022-12-07 | 2022-12-07 | 数据处理方法、装置、计算机设备、车辆和可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN118475504A (zh) |
WO (1) | WO2024119412A1 (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113799793B (zh) * | 2020-05-29 | 2023-05-12 | 魔门塔(苏州)科技有限公司 | 一种基于数据驱动的实现预测模型自动化迭代的系统 |
US11605306B2 (en) * | 2020-06-30 | 2023-03-14 | Toyota Research Institute, Inc. | Systems and methods for driver training during operation of automated vehicle systems |
WO2022115987A1 (zh) * | 2020-12-01 | 2022-06-09 | 浙江吉利控股集团有限公司 | 一种自动驾驶数据采集和闭环管理的方法及系统 |
CN113962141A (zh) * | 2021-09-22 | 2022-01-21 | 北京智行者科技有限公司 | 一种目标检测模型自动化迭代方法、设备及存储介质 |
CN114970303A (zh) * | 2021-09-22 | 2022-08-30 | 北京智行者科技有限公司 | 一种模型自动化迭代方法、设备及存储介质 |
CN114379581B (zh) * | 2021-11-29 | 2024-01-30 | 江铃汽车股份有限公司 | 基于自动驾驶下的算法迭代系统及方法 |
CN114780349A (zh) * | 2022-05-05 | 2022-07-22 | 中国第一汽车股份有限公司 | 自动驾驶车辆的数据处理方法、装置 |
-
2022
- 2022-12-07 WO PCT/CN2022/137330 patent/WO2024119412A1/zh unknown
- 2022-12-07 CN CN202280058783.1A patent/CN118475504A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2024119412A1 (zh) | 2024-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Thorn et al. | A framework for automated driving system testable cases and scenarios | |
US10957201B2 (en) | System and method for relative positioning based safe autonomous driving | |
CN114077541A (zh) | 验证用于自动驾驶车辆的自动控制软件的方法和系统 | |
CN110606093A (zh) | 车辆性能评测方法、装置、设备和存储介质 | |
CN111527013A (zh) | 车辆变道预测 | |
Ionita | Autonomous vehicles: from paradigms to technology | |
US11704912B2 (en) | Label-free performance evaluator for traffic light classifier system | |
DE102019114595B4 (de) | Verfahren zum Steuern des Betriebs eines Kraftfahrzeugs und zum Ableiten von Straßenabschnittsgeschwindigkeitsgrenzwerten | |
US11727694B2 (en) | System and method for automatic assessment of comparative negligence for one or more vehicles involved in an accident | |
CN111882924A (zh) | 车辆测试系统、驾驶行为判断控制方法及事故预警方法 | |
CN113176949A (zh) | 优先级车辆管理 | |
US20220172606A1 (en) | Systems and Methods for Extracting Data From Autonomous Vehicles | |
CN115451987A (zh) | 一种自动驾驶汽车的路径规划学习方法 | |
US10953871B2 (en) | Transportation infrastructure communication and control | |
EP4145420A1 (en) | Hierarchical processing of traffic signal face states | |
CN118475504A (zh) | 数据处理方法、装置、计算机设备、车辆和可读存储介质 | |
CN114179814A (zh) | 用于评价机动车的行驶行为的方法、装置和存储介质 | |
US10950129B1 (en) | Infrastructure component broadcast to vehicles | |
KR102350197B1 (ko) | 주행경로 설정장치 및 주행경로 설정방법 | |
CN114968189A (zh) | 用于自动驾驶系统的感知系统开发的平台 | |
CN116745819A (zh) | 从基础设施信号确定交通灯标签和分类质量 | |
CN117612140B (zh) | 道路场景的识别方法、装置和存储介质及电子设备 | |
EP4394626A1 (en) | Classification of objects present on a road | |
US20230401443A1 (en) | Training a Neural Network to Select Objects | |
Narasimhan Ramakrishnan | Design and evaluation of perception system algorithms for semi-autonomous vehicles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |