CN116821699B - 一种感知模型训练方法、装置及电子设备和存储介质 - Google Patents

一种感知模型训练方法、装置及电子设备和存储介质 Download PDF

Info

Publication number
CN116821699B
CN116821699B CN202311110633.3A CN202311110633A CN116821699B CN 116821699 B CN116821699 B CN 116821699B CN 202311110633 A CN202311110633 A CN 202311110633A CN 116821699 B CN116821699 B CN 116821699B
Authority
CN
China
Prior art keywords
network
meta
interference
perception model
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311110633.3A
Other languages
English (en)
Other versions
CN116821699A (zh
Inventor
张腾飞
李茹杨
张恒
邓琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Mass Institute Of Information Technology
Original Assignee
Shandong Mass Institute Of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Mass Institute Of Information Technology filed Critical Shandong Mass Institute Of Information Technology
Priority to CN202311110633.3A priority Critical patent/CN116821699B/zh
Publication of CN116821699A publication Critical patent/CN116821699A/zh
Application granted granted Critical
Publication of CN116821699B publication Critical patent/CN116821699B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本申请公开了一种感知模型训练方法、装置及电子设备和存储介质,涉及计算机技术领域,该方法包括:获取云端感知模型;云端感知模型包括基础元网络组和抗干扰元网络组,基础元网络组包括多个基础元网络,抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,基础元网络包括依次连接的多个网络模块,抗干扰元网络包括依次连接的多个网络模块,基础元网络组中部分或全部基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;基于正常场景数据和干扰场景数据训练云端感知模型得到训练完成的云端感知模型;干扰场景数据包括多个干扰因素对应的干扰样本。本申请提高了感知模型的鲁棒性。

Description

一种感知模型训练方法、装置及电子设备和存储介质
技术领域
本申请涉及计算机技术领域,更具体地说,涉及一种感知模型训练方法、装置及电子设备和存储介质。
背景技术
感知系统是自动驾驶的关键组成部分,用于感知和理解车辆周围环境,当前主流的自动驾驶感知模型,通常以摄像机、激光雷达等传感器采集的数据作为输入,输出对周围环境的感知结果,如道路目标检测、车道线检测、可行驶区域分割等。基于深度学习的感知模型已取得显著进展,但模型鲁棒性仍面临严重挑战,面对交通场景中的各种恶劣环境因素(如炫光、弱光、雨、雪)、传感器故障(摄像机损坏、激光雷达损坏等)以及恶意攻击等情况,模型准确性难以保证,对自动驾驶安全构成严重威胁。
当前提升感知模型鲁棒性的方法通常只针对一种或某几种干扰因素,没有涵盖尽可能多的干扰因素,所获得的模型只能在一种或某几种干扰因素下具备较好的鲁棒性,当模型部署到车端,仍容易遭受其他干扰因素的影响,如针对恶劣天气因素训练的模型,仍会受到恶意攻击的影响,导致鲁棒性下降,威胁自动驾驶安全。
因此,如何提高感知模型的鲁棒性是本领域技术人员需要解决的技术问题。
发明内容
本申请的目的在于提供一种感知模型训练方法、装置及一种电子设备和一种计算机可读存储介质,提高了感知模型的鲁棒性。
为实现上述目的,本申请提供了一种感知模型训练方法,包括:
获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本。
其中,所述网络模块包括卷积神经网络层或全连接层或注意力层。
其中,所述云端感知模型还包括每个所述干扰因素对应的元特征编码网络,所述干扰因素对应的元特征编码网络用于提取所述干扰因素对应的干扰样本的元特征;
所述抗干扰元网络的第一个网络模块包括目标网络单元和参数特异化网络,所述目标网络单元为所述卷积神经网络层或所述全连接层或所述注意力层,所述参数特异化网络为1×1×K的卷积神经网络,K为所述抗干扰元网络对应的干扰因素的元特征的维度,所述参数特异化网络的参数基于所述干扰因素的元特征初始化,所述干扰因素的元特征为所述干扰因素对应的所有干扰样本的元特征的均值,所述抗干扰元网络的第一个网络模块的输出特征为所述目标网络单元的输出特征与所述参数特异化网络的输出特征相加。
其中,所述元特征编码网络包括依次连接的编码模块和解码模块,所述方法还包括:
将所述干扰因素对应的干扰样本输入所述干扰因素对应的元特征编码网络,依次经过所述编码模块和所述解码模块得到重构样本,计算所述干扰样本与所述重构样本之间的重构损失,基于所述重构损失训练所述干扰因素对应的元特征编码网络,得到训练完成的所述干扰因素对应的元特征编码网络;
所述干扰因素对应的元特征编码网络具体用于利用所述干扰因素对应的训练完成的元特征编码网络中的编码模块提取所述干扰因素对应的干扰样本的元特征。
其中,所述编码模块包括依次连接的一个或多个卷积神经网络、特征变形单元、一个或多个全连接层,所述解码模块包括依次连接的一个或多个全连接层、特征变形单元、一个或多个卷积神经网络。
其中,所述重构损失的计算公式为:
其中,为重构损失,K为所述干扰样本包含的元素数量,/>为所述干扰样本中的第k个元素,/>为所述重构样本中的第k个元素。
其中,所述云端感知模型包括依次连接的输入模块、基础网络、云端元网络、元知识融合网络和任务网络,所述云端元网络包括所述基础元网络组和所述抗干扰元网络组。
其中,所述输入模块包括多个单模态的输入单元,每个所述输入单元通过对应的基础网络连接多模态融合网络,所述多模态融合网络连接所述云端元网络。
其中,所述基础网络包括依次连接的预处理模块、骨干网络和多尺度特征提取网络。
其中,所述任务网络包括多个子任务网络。
其中,所述基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型,包括:
确定正常训练样本的第一采样率或干扰训练样本的第二采样率;其中,所述第一采样率与所述第二采样率的和为一;
基于所述第一采样率或所述第二采样率在正常场景数据中采样正常训练样本、在干扰场景数据中采样干扰训练样本;
将所述干扰训练样本输入所述云端感知模型中,基于所述云端感知模型中任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型。
其中,将所述干扰训练样本输入所述云端感知模型中,基于所述云端感知模型中任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型,包括:
确定所述干扰训练样本对应的标注;其中,所述标注包括任务标注和干扰因素;
将所述干扰训练样本输入所述云端感知模型中所述干扰因素对应的抗干扰元网络中,得到任务网络的输出结果,基于所述输出结果和所述任务标注计算任务网络的损失;
基于所述任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型。
为实现上述目的,本申请提供了一种感知模型训练方法,包括:
获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本;
基于所述训练完成的云端感知模型构建车端感知模型;其中,所述车端感知模型包括多个基础元网络和多个抗干扰元网络,所述车端感知模型包含的基础元网络数量小于所述云端感知模型包含的基础元网络数量,所述车端感知模型包含的抗干扰元网络数量小于所述云端感知模型包含的抗干扰元网络数量;
基于所述正常场景数据和所述干扰场景数据训练所述车端感知模型得到训练完成的车端感知模型。
其中,所述车端感知模型包括依次连接的输入模块、基础网络、车端元网络、元知识融合网络和所述任务网络,车端元网络包括多个所述基础元网络和多个所述抗干扰元网络。
其中,所述基于所述训练完成的云端感知模型构建车端感知模型,包括:
将所述训练完成的云端感知模型中云端元网络中的所有基础元网络划分为第一预设数量个类别;其中,所述第一预设数量为所述车端感知模型包含的基础元网络的数量;
对每个类别中基础元网络的参数进行均值融合得到车端感知模型中对应的基础元网络的参数;
将所述训练完成的云端感知模型中云端元网络中的所有抗干扰元网络划分为第二预设数量个类别;其中,所述第二预设数量为所述车端感知模型包含的抗干扰元网络的数量;
对每个类别中抗干扰元网络的参数进行均值融合得到车端感知模型中对应的抗干扰元网络的参数。
其中,所述基于所述正常场景数据和所述干扰场景数据训练所述车端感知模型得到训练完成的车端感知模型,包括:
确定正常训练样本的第三采样率或干扰训练样本的第四采样率;其中,所述第三采样率与所述第四采样率的和为一;
基于所述第三采样率或所述第四采样率在正常场景数据中采样正常训练样本、在干扰场景数据中采样干扰训练样本;
将所述干扰训练样本输入所述车端感知模型中,基于所述车端感知模型中任务网络的损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型。
其中,所述基于所述车端感知模型中任务网络的损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型,包括:
基于所述车端感知模型中任务网络的损失和知识蒸馏损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型;
其中,所述知识蒸馏损失为基于所述训练完成的云端感知模型中的多模态融合网络输出的融合特征和所述车端感知模型中的多模态融合网络输出的融合特征计算得到的,或,所述知识蒸馏损失为基于所述训练完成的云端感知模型中的元知识融合网络输出的融合特征和所述车端感知模型中的元知识融合网络输出的融合特征计算得到的。
其中,所述知识蒸馏损失的计算公式为:
其中,为所述知识蒸馏损失,/>为所述训练完成的云端感知模型中的多模态融合网络或元知识融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,/>所述车端感知模型中的多模态融合网络或元知识融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,1≤i≤W,1≤j≤H,1≤k≤C,W为融合特征的宽度,H为融合特征的高度,C为融合特征的通道数量。
为实现上述目的,本申请提供了一种感知模型训练装置,包括:
获取单元,用于获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
第一训练单元,用于基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本。
为实现上述目的,本申请提供了一种感知模型训练装置,包括:
获取单元,用于获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
第一训练单元,用于基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本;
构建单元,用于基于所述训练完成的云端感知模型构建车端感知模型;其中,所述车端感知模型包括多个基础元网络和多个抗干扰元网络,所述车端感知模型包含的基础元网络数量小于所述云端感知模型包含的基础元网络数量,所述车端感知模型包含的抗干扰元网络数量小于所述云端感知模型包含的抗干扰元网络数量;
第二训练单元,用于基于所述正常场景数据和所述干扰场景数据训练所述车端感知模型得到训练完成的车端感知模型。
为实现上述目的,本申请提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述感知模型训练方法的步骤。
为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述感知模型训练方法的步骤。
通过以上方案可知,本申请提供的一种感知模型训练方法,包括:获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本。
本申请提供的感知模型训练方法,针对云端感知模型,在特定数量的基础元网络间进行参数共享,以在不同的基础元网络间共享知识,提高基础元网络组的整体性能。在相同干扰因素对应的抗干扰元网络间进行参数共享,以在相同干扰因素对应的不同的抗干扰元网络间共享知识,提高抗干扰元网络组的整体性能以及对干扰因素的鲁棒性。本申请还公开了一种感知模型训练装置及一种电子设备和一种计算机可读存储介质,同样能实现上述技术效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1为根据一示例性实施例示出的一种感知模型训练方法的流程图;
图2为根据一示例性实施例示出的一种云端感知模型的结构图;
图3为根据一示例性实施例示出的一种基础元网络间第一个网络模块参数共享的示意图;
图4为根据一示例性实施例示出的一种抗干扰元网络的第一个网络模块的结构图;
图5为根据一示例性实施例示出的一种元特征编码网络的结构图;
图6为根据一示例性实施例示出的一种图像模态的元特征编码网络的结构图;
图7为根据一示例性实施例示出的另一种车端感知模型训练方法的流程图;
图8为根据一示例性实施例示出的一种车端感知模型的结构图;
图9为根据一示例性实施例示出的一种车端感知模型知识蒸馏示意图;
图10为本申请提供的一种应用实施例的流程图;
图11为根据一示例性实施例示出的一种感知模型训练装置的结构图;
图12为根据一示例性实施例示出的另一种感知模型训练装置的结构图;
图13为根据一示例性实施例示出的一种电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。另外,在本申请实施例中,“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
感知大模型(即云端感知模型)是具有大规模参数的模型,其参数量通常为亿级别以上,甚至可达百亿、千亿级别,感知大模型可以为单模态或多模态大模型。相比传统的感知小模型(即车端感知模型),感知大模型参数量更多,模型的表达能力和鲁棒性更强。针对传统的车端小模型表达能力较弱,难以同时兼顾多种类型干扰因素,以及使用多种类型干扰因素增强的数据训练小模型,容易造成小模型在正常场景下性能下降的问题,本发明使用感知大模型增强小模型的鲁棒性,首先提供了一种提高感知模型鲁棒性的抗干扰大模型结构,通过显式的构建抗干扰元网络,能够显著提高感知大模型对干扰因素的鲁棒性,通过另一部分基础元网络组,可确保模型对正常场景的准确感知能力;本发明还设计了干扰因素元特征编码网络以获得各类型干扰因素的元特征,并基于元特征实现了干扰因素组的划分以及抗干扰元网络间的参数共享,通过参数共享提高了元网络组的整体性能;进一步的,本发明提出参数特异化网络来提高抗干扰元网络组对各类型干扰因素的鲁棒性。使用正常场景数据和多类型干扰数据训练感知大模型,提升感知大模型对多种干扰因素的鲁棒性,使用感知大模型,通过知识蒸馏,提升车端感知模型对多种干扰因素的鲁棒性。
综上所述,本发明提出的方法使车端感知模型具备对恶劣环境、硬件故障以及恶意攻击等多种干扰因素的鲁棒性,进而提升自动驾驶系统的安全性。
本申请实施例公开了一种感知模型训练方法,提高了感知模型的鲁棒性。
参见图1,根据一示例性实施例示出的一种车端感知模型训练方法的流程图,如图1所示,包括:
S101:获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
在本实施例中,云端感知模型包括云端元网络,云端元网络包括基础元网络组和抗干扰元网络组,基础元网络组包括多个基础元网络,抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络。作为一种可行的实施方式,所述云端感知模型包括依次连接的输入模块、基础网络、云端元网络、元知识融合网络和任务网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括第一预设数量个基础元网络,所述抗干扰元网络组包括第二预设数量个抗干扰元网络。在具体实施中,云端感知模型如图2所示,包括依次连接的输入模块、基础网络、云端元网络、元知识融合网络和任务网络。作为一种优选实施方式,所述输入模块包括多个单模态的输入单元,每个所述输入单元通过对应的基础网络连接多模态融合网络,所述多模态融合网络连接所述云端元网络。基础网络包括依次连接的预处理模块、骨干网络和多尺度特征提取网络。骨干网络可采用卷积神经网络如ResNet(Residual Network,残差网络),Transformer 网络如Swin Transformer等,多尺度特征提取网络可采用特征金字塔网络,多模态特征融合网络可采用卷积神经网络层、全连接层或Transformer交叉注意力层组成,多模态特征融合网络输出融合后的特征,随后输入云端元网络。云端元网络包括基础元网络组和抗干扰元网络组,基础元网络组包括多个基础元网络,抗干扰元网络组包括多个抗干扰元网络。元网络可由卷积神经网络、多层感知机等网络结构组成。元知识融合网络以各元网络的输出作为输出,对各元网络的输出进行融合,获得元知识融合后的特征,并输入到任务网络中。元知识融合网络可采用卷积神经网络层、全连接层或Transformer交叉注意力层组成。任务网络可以包括多个子任务网络,如3D目标检测、车道线分割、目标跟踪等子任务。
对于基础元网络组,本实施例构建Enormal个基础元网络,例如Enormal=100。对于抗干扰元网络组,本实施例构建Edisturb个抗干扰元网络/>,具体地,本实施例为每类干扰因素构建Eper_disturb个抗干扰元网络,Eper_disturb≥1,例如对20类干扰因素,每类构建5个抗干扰元网络,此时Eper_disturb=5,Edisturb=100。通过对每类干扰因素设置多个抗干扰元网络,可显著提升对干扰因素的鲁棒性。基础元网络和抗干扰元网络均包括依次连接的多个网络模块,网络模块包括卷积神经网络层或全连接层或注意力层。
进一步的,为了在不同的元网络间共享知识,确保元网络组的稳定性,以及提高元网络组的整体性能,本实施例设计了参数共享的元网络结构,对于基础元网络组,其中每Eshare_normal个基础元网络间第一个网络模块是参数共享的,如图3中的网络模块A,其中Eshare_normal<Enormal,例如Enormal=100,Eshare_normal=20。对于抗干扰元网络,首先根据干扰因素对应的元特征,计算元特征间的相似性,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享。
作为一种优选实施方式,所述云端感知模型还包括每个所述干扰因素对应的元特征编码网络,所述干扰因素对应的元特征编码网络用于提取所述干扰因素对应的干扰样本的元特征;所述抗干扰元网络的第一个网络模块包括目标网络单元和参数特异化网络,所述目标网络单元为所述卷积神经网络层或所述全连接层或所述注意力层,所述参数特异化网络为1×1×K的卷积神经网络,K为所述抗干扰元网络对应的干扰因素的元特征的维度,所述参数特异化网络的参数基于所述干扰因素的元特征初始化,所述干扰因素的元特征为所述干扰因素对应的所有干扰样本的元特征的均值,所述抗干扰元网络的第一个网络模块的输出特征为所述目标网络单元的输出特征与所述参数特异化网络的输出特征相加。
在具体实施中,为了提高对不同类型干扰因素的鲁棒性,本发明实施例提出抗干扰元网络参数特异化的方法,即在每个抗干扰元网络的参数共享的网络模块并行增加一个参数特异化网络,该参数特异化网络包含了特定干扰因素的元特征,使得抗干扰元网络具备对该特定干扰因素的高鲁棒性。对于某个特定类型的干扰因素,本发明实施例首先使用该干扰因素对应的元特征编码网络从该干扰因素对应的干扰样本中编码元特征,取该干扰因素对应的所有干扰样本的元特征的均值作为该干扰因素的元特征;随后使用元特征初始化该干扰因素对应的抗干扰元网络中的参数特异化网络;在该干扰因素对应的抗干扰元网络中,使用目标网络单元和参数特异化网络分别处理前一层输出的特征,目标网络单元可以为卷积神经网络层或全连接层或注意力层,并将目标网络单元和参数特异化网络输出的特征相加,作为输出特征,送入抗干扰元网络的后续网络模块中。若目标网络单元为卷积网络块,抗干扰元网络的第一个网络模块的结构图如图4所示。对于第i类干扰因素对应的一个抗干扰元网络,上述流程可表示为以下公式:
其中,fin为输入特征,fout为输出特征,是目标网络单元,/>为目标网络单元输出的特征A,/>是被第i类干扰因素的元特征Mi进行参数初始化的参数特异化网络,/>为参数特异化网络输出的特征B。参数特异化网络为一个1x1xK的卷积网络,K与从干扰因素元特征编码网络中获得的元特征的维度相同,例如元特征的维度为128,则K=128。
参数特异化方法显式的将每个抗干扰元网络分配到一种类型的干扰因素上,使得每个抗干扰元网络更加专业化,对特定干扰因素的鲁棒性更好。
作为一种可行的实施方式,所述元特征编码网络包括依次连接的编码模块和解码模块,所述方法还包括:将所述干扰因素对应的干扰样本输入所述干扰因素对应的元特征编码网络,依次经过所述编码模块和所述解码模块得到重构样本,计算所述干扰样本与所述重构样本之间的重构损失,基于所述重构损失训练所述干扰因素对应的元特征编码网络,得到训练完成的所述干扰因素对应的元特征编码网络;所述干扰因素对应的元特征编码网络具体用于利用所述干扰因素对应的训练完成的元特征编码网络中的编码模块提取所述干扰因素对应的干扰样本的元特征。
在具体实施中,本发明实施例提出的干扰因素对应的元特征编码网络,如图5所示,输入数据为干扰因素包含的干扰数据的原始数据样本或经过处理后的特征,输入数据经编码网络处理后,得到元特征Mi,j,其中i表示干扰因素类型索引,j表示该干扰因素中的干扰样本索引,随后解码网络将元特征解码为与输入数据格式一致的重构样本或特征,在输入样本或特征与输出的重构样本或特征间计算重构损失,使用重构损失,以及该类型干扰因素包含的全部干扰数据训练干扰因素元特征编码网络,直到收敛。其中,编码网络可采用卷积神经网络、全连接网络等网络结构,解码网络可使用反卷积网络、全连接网络等网络结构。也即,作为一种可行的实施方式,所述编码模块包括依次连接的一个或多个卷积神经网络、特征变形单元、一个或多个全连接层,所述解码模块包括依次连接的一个或多个全连接层、特征变形单元、一个或多个卷积神经网络。使用训练完成的干扰因素元特征编码网络处理该类型干扰因素包含的全部干扰数据,得到该类型干扰因素的全部的元特征,Ni表示第i类干扰因素对应的干扰样本数量,将所有元特征求均值,得到该类型干扰因素对应的元特征:
重构损失函数也即重构损失的计算公式为:
其中,为重构损失,K为所述干扰样本包含的元素数量,/>为所述干扰样本中的第k个元素,/>为所述重构样本中的第k个元素。
以图像模态的某类型干扰因素为例,介绍干扰因素元特征编码网络的一种实现方案。如图6所示,本发明实施例提供一种图像模态的元特征编码网络的具体方案,对于某个特定类型的干扰因素,使用该干扰因素的数据训练干扰因素特异化编码网络。对于该干扰因素类型的一个大小为256×256×3的输入图像,首先使用3个卷积网络处理,卷积网络1的输入通道为3、输出通道为32、卷积核大小为3×3、步长为1、填充为1,卷积网络2的输入通道为32、输出通道为64、卷积核大小为3×3、步长为2、填充为1,卷积网络3的输入通道为64、输出通道为64、卷积核大小为3×3、步长为2、填充为1,得到64×64×64的特征;随后通过特征变形单元将该特征处理成大小为262144的特征向量,特征变形单元的输入为64×64×64,输出维度为262144;使用后续的两个全连接网络处理特征,全连接网络1的输入维度为262144、输出维度为128,全连接网络2的输入维度为128、输出维度为128,得到大小为128维的元特征;之后,采用两个全连接网络将该元特征向量处理为大小为262144的特征向量,全连接网络3的输入维度为128、输出维度为128,全连接网络4的输入维度为128、输出维度为262144,并通过特征变形单元将该特征向量的形状调整为64×64×64,特征变形单元的输入为262144,输出为64×64×64;进一步地,使用两个反卷积网络处理特征,反卷积网络1的输入通道为64、输出通道为32、卷积核大小为4×4、步长为2、填充为1,反卷积网络2的输入通道为32、输出通道为3、卷积核大小为4×4、步长为2、填充为1,得到256×256×3的输出图像。对输入图像和输出图像,计算重构损失,重构损失函数如下:
其中,为重构损失,/>为输入图像第(i,j)位置的第k通道处的像素值,/>为输出图像第(i,j)位置的第k通道处的像素值,1≤i≤W,1≤j≤H,1≤k≤C,W为图像的宽度,H为图像的高度,C为图像的通道数量。
使用重构损失函数训练干扰因素对应的元特征编码网络,直至收敛。随后使用训练完成的该干扰因素对应的元特征编码网络处理该干扰因素的图像样本,得到每个图像样本对应的元特征向量,将所有图像样本的元特征向量求均值,得到平均元特征向量,作为该类型干扰因素的元特征。
每类干扰因素的元特征是对该类干扰因素的一种高层语义描述,其表征了该类干扰因素数据的特点。通过这种显式的使用编码网络获取每类干扰因素元特征,并将元特征添加到抗干扰元网络中,可以显著提升抗干扰元网络对特定干扰因素的鲁棒性。
S102:基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本。
正常场景数据为摄像机采集的图像数据和激光雷达采集的点云数据,其中不存在干扰因素。干扰场景数据为存在干扰因素的图像数据或点云数据,干扰因素主要可分为恶劣环境和硬件故障。恶劣环境包含影响摄像机成像质量的各种光照因素,如:炫光、反光等;雨、雪、雾、霾等天气条件会影响摄像机和激光雷达采集的数据质量;当各种传感器发生硬件故障时,会造成采集的数据质量降低甚至完全失效。如摄像机成像时产生的噪声以及一些坏点;激光雷达也可能出现故障,导致对部分视角无法采集到点云数据。
对于正常场景数据或干扰数据,均由数据帧F表示,每帧数据包含至少一种模态的数据,如,表示第i帧数据Fi包含M种模态,模态包括图像、点云等,其中每种模态样本集合又包含至少一条数据,如/>,表示第1个模态/>包含N条数据。对于干扰数据帧,其中包含至少一条干扰数据。数据集中的数据来源包括:在车辆行驶过程中采集的道路场景数据;通过仿真软件获得的道路场景数据;通过模型生成的道路场景数据。
可见,本发明实施例针对各类干扰因素进行数据采集,为提高云端感知模型对干扰因素的鲁棒性提供了良好的数据基础。
进一步的,对数据集中的样本进行标注,包括任务标注,如对目标检测任务,标注每个样本中感兴趣目标的边界框、类别等信息,对场景分割任务,标注每个像素或点云的类别。对于干扰样本,除了针对特定任务的任务标注外,还需要标注该数据帧中包含的干扰因素,如{p1,p2,p3}表示当前数据帧中包含3种干扰因素。样本标注可采用人工标注,或采用云端感知模型的预测结果作为标注,以及人工标注和云端感知模型预测相结合的方式。
作为一种优选的实施方式,所述基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型,包括:确定正常训练样本的第一采样率或干扰训练样本的第二采样率;其中,所述第一采样率与所述第二采样率的和为一;基于所述第一采样率或所述第二采样率在正常场景数据中采样正常训练样本、在干扰场景数据中采样干扰训练样本;将所述干扰训练样本输入所述云端感知模型中,基于所述云端感知模型中任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型。
在具体实施中,对正常训练样本和干扰训练样本采取对应的采样概率,正常训练样本的采样概率为αnormal,干扰训练样本的采样概率为αdisturb,其中,αnormaldisturb=1。例如,αnormal=0.5、αdisturb0.5。在模型训练过程中,每次训练前,根据前述采样概率首先确定当前选取的是正常训练样本还是干扰训练样本,如果为正常训练样本,则直接选取正常训练样本;如果为干扰训练样本,则从包含至少一种干扰因素的数据帧中采样干扰数据帧。上述采样策略通过调整采样概率,可以平衡正常场景和干扰数据样本量的差异,可以提升模型对各类干扰因素的鲁棒性,同时保持模型在正常场景下的性能。每次训练时,采用上述采样策略从正常场景数据和干扰数据中采样一个批次的训练样本,训练完整的云端感知模型,显著提高云端感知模型的训练效果,得到更鲁棒的云端感知模型。
作为一种可行的实施方式,将所述干扰训练样本输入所述云端感知模型中,基于所述云端感知模型中任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型,包括:确定所述干扰训练样本对应的标注;其中,所述标注包括任务标注和干扰因素;将所述干扰训练样本输入所述云端感知模型中所述干扰因素对应的抗干扰元网络中,得到任务网络的输出结果,基于所述输出结果和所述任务标注计算任务网络的损失;基于所述任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型。
在具体实施中,每次训练时,采用前述的干扰数据采样策略从正常场景数据集和感知鲁棒性干扰数据库中采样一个批次的训练样本,如批次大小设定为32,即表示采样32个数据帧F,使用各子任务网络计算获得的损失,如3D目标检测子任务网络中的目标分类损失和位置回归损失等,反向传播优化云端感知模型。优化器可采用Gradient Descent (GD,梯度下降)、Adaptive Moment estimation(Adam,自适应矩估计)、Adam Weight DecayRegularization(AdamW,解耦梯度下降与权重衰减正则化)等。
本申请实施例提供的感知模型训练方法,针对云端感知模型,在特定数量的基础元网络间进行参数共享,以在不同的基础元网络间共享知识,提高基础元网络组的整体性能。在相同干扰因素对应的抗干扰元网络间进行参数共享,以在相同干扰因素对应的不同的抗干扰元网络间共享知识,提高抗干扰元网络组的整体性能以及对干扰因素的鲁棒性。
本申请实施例公开了一种感知模型训练方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
参见图7,根据一示例性实施例示出的另一种感知模型训练方法的流程图,如图7所示,包括:
S201:获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
S202:基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本;
S203:基于所述训练完成的云端感知模型构建车端感知模型;其中,所述车端感知模型包括多个基础元网络和多个抗干扰元网络,所述车端感知模型包含的基础元网络数量小于所述云端感知模型包含的基础元网络数量,所述车端感知模型包含的抗干扰元网络数量小于所述云端感知模型包含的抗干扰元网络数量;
车端感知模型的结构与云端感知模型类似,区别在于车端感知模型包含的基础元网络和抗干扰元网络的数量少于云端感知模型,车端感知模型不包含参数特异化网络和特征编码网络。作为一种可行的实施方式,所述车端感知模型包括依次连接的输入模块、基础网络、车端元网络、元知识融合网络和所述任务网络,车端元网络包括第三预设数量个基础元网络和第四预设数量个抗干扰元网络。在具体实施中,基础网络包括依次连接的预处理模块、骨干网络和多尺度特征提取网络,骨干网络可采用ResNet等;多尺度特征提取网络,如特征金字塔网络;多模态特征融合网络可采用卷积神经网络层、全连接层或Transformer交叉注意力层组成,多模态特征融合网络输出融合后的特征,随后输入元网络,元网络由至少一个基础元网络和至少一个抗干扰元网络构成,如图8所示,分别设置了一个基础元网络和一个抗干扰元网络。知识融合网络以各元网络的输出作为输出,对各元网络的输出进行融合,获得元知识融合后的特征,并输入到各下游子任务网络中,如3D目标检测、车道线分割、目标跟踪等子任务。元知识融合网络可采用卷积神经网络层、全连接层或Transformer交叉注意力层组成。
作为一种可行的实施方式,所述基于所述训练完成的云端感知模型构建车端感知模型,包括:将所述训练完成的云端感知模型中云端元网络中的所有基础元网络划分为第一预设数量个类别;其中,所述第一预设数量为所述车端感知模型包含的基础元网络的数量;对每个类别中基础元网络的参数进行均值融合得到车端感知模型中对应的基础元网络的参数;将所述训练完成的云端感知模型中云端元网络中的所有抗干扰元网络划分为第二预设数量个类别;其中,所述第二预设数量为所述车端感知模型包含的抗干扰元网络的数量;对每个类别中抗干扰元网络的参数进行均值融合得到车端感知模型中对应的抗干扰元网络的参数。
在具体实施中,当车端感知模型只包含一个基础元网络和一个抗干扰元网络时,使用云端感知模型的全部基础元网络的参数均值、全部抗干扰元网络的参数均值来初始化车端感知模型的基础元网络、抗干扰元网络。当车端感知模型包含enormal(enormal>1)个基础元网络或edisturb(edisturb>1)个抗干扰元网络时,则将云端感知模型的Enormal个基础元网络划分为enormal组,每组包含Enormal/enormal个基础元网络,对应一个车端感知模型的基础元网络,将云端感知模型的Edisturb个抗干扰元网络划分为edisturb组,使用每组的Edisturb/edisturb个云端感知模型的抗干扰元网络的参数均值来初始化该组对应的车端感知模型的抗干扰元网络。需要注意的是,当Enormal/enormal或Edisturb/edisturb不为整数时,则向下取整,在划分完前(enormal-1)、(edisturb-1)组后,将剩余的基础元网络分为一组、剩余的抗干扰元网络分为一组。
S204:基于所述正常场景数据和所述干扰场景数据训练所述车端感知模型得到训练完成的车端感知模型。
在本步骤中,基于正常场景数据和干扰场景数据训练车端感知模型得到训练完成的车端感知模型。
作为一种优选的实施方式,所述基于所述正常场景数据和所述干扰场景数据训练所述车端感知模型得到训练完成的车端感知模型,包括:确定正常训练样本的第三采样率或干扰训练样本的第四采样率;其中,所述第三采样率与所述第四采样率的和为一;基于所述第三采样率或所述第四采样率在正常场景数据中采样正常训练样本、在干扰场景数据中采样干扰训练样本;将所述干扰训练样本输入所述车端感知模型中,基于所述任务网络的损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型。
在具体实施中,每次训练时,采用前述的干扰数据采样策略从正常场景数据集和感知鲁棒性干扰数据库中采样一个批次的训练样本,如批次大小设定为32,即表示采样32个数据帧F。需要注意的是,此时干扰数据采集策略中的采样概率不必与云端感知模型训练阶段保持一致,可以灵活修改。将每个批次的训练样本分别输入云端感知模型和车端感知模型中,获得各自的多模态融合特征和融合的元知识特征,并使用各子任务网络计算获得的损失,反向传播优化车端感知模型。
作为一种优选的实施方式,所述基于所述任务网络的损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型,包括:基于所述任务网络的损失和知识蒸馏损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型;其中,所述知识蒸馏损失为基于所述训练完成的云端感知模型中的多模态融合网络输出的融合特征和所述车端感知模型中的多模态融合网络输出的融合特征计算得到的,或,所述知识蒸馏损失为基于所述训练完成的云端感知模型中的元知识融合网络输出的融合特征和所述车端感知模型中的元知识融合网络输出的融合特征计算得到的。
在具体实施中,计算车端感知模型鲁棒性蒸馏损失函数,使用蒸馏损失和各子任务网络计算获得的损失,反向传播优化车端感知模型。通过知识蒸馏提升车端感知模型的鲁棒性以及在正常场景下的感知准确率。如图9所示,本发明提供两种知识蒸馏模块,分别为多模态融合特征知识蒸馏模块、元知识蒸馏模块。多模态融合特征知识蒸馏模块使用云端感知模型的多模态融合网络的输出特征,对车端感知模型的多模态融合网络的输出特征进行知识蒸馏。
若使用多模态融合特征知识蒸馏模块,使用Γ表示云端感知模型的多模态融合网络输出的融合特征,其形状为(W,H,C),分别表示特征的宽、高、通道数量,使用τ表示车端感知模型的多模态融合网络输出的融合特征,其形状为(W,H,C),在多模态融合特征知识蒸馏模块中,使用知识蒸馏损失函数进行知识蒸馏,知识蒸馏损失的计算公式为:
其中,为所述知识蒸馏损失,/>为所述训练完成的云端感知模型中的多模态融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,/>所述车端感知模型中的多模态融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,1≤i≤W,1≤j≤H,1≤k≤C,W为融合特征的宽度,H为融合特征的高度,C为融合特征的通道数量。
在云端感知模型和车端感知模型的多模态融合网络输出的融合特征间进行知识蒸馏,提高车端感知模型多模态融合特征的质量,进而提高车端感知模型在正常场景下的感知准确性以及对干扰因素的鲁棒性。
对于元知识蒸馏模块,同样采用上述流程在云端感知模型的元知识融合网络输出的融合元知识特征和车端感知模型的元知识融合网络输出的融合元知识特征间进行知识蒸馏,知识蒸馏损失的计算公式为:
其中,为所述知识蒸馏损失,/>为所述训练完成的云端感知模型中的元知识融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,/>所述车端感知模型中的元知识融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,1≤i≤W,1≤j≤H,1≤k≤C,W为融合特征的宽度,H为融合特征的高度,C为融合特征的通道数量。
在云端感知模型和车端感知模型的元知识融合网络输出的融合的元知识特征间进行知识蒸馏,提高车端感知模型元知识特征的质量,进而提高车端感知模型在正常场景下的感知准确性以及对干扰因素的鲁棒性。
由此可见,本发明提出基于抗干扰元网络组的大模型结构,通过显式的构建抗干扰元网络,能够显著提高云端感知模型对干扰因素的鲁棒性,通过另一部分基础元网络组,可确保模型对正常场景的准确感知能力;本发明还设计了干扰因素元特征编码网络以获得各类型干扰因素的元特征,并基于元特征实现了干扰因素组的划分以及抗干扰元网络间的参数共享,通过参数共享提高了元网络组的整体性能;进一步的,本发明提出参数特异化网络来提高抗干扰元网络组对各类型干扰因素的鲁棒性。使用大模型来应对各类型干扰因素对感知模型鲁棒性的影响是一种较为通用的解决方案,但是相关方法通常缺少对特定的抗干扰大模型结构(如本发明中的抗干扰元网络组结构)的设计,此外,本发明提出的干扰因素元特征编码方法,基于元特征的干扰因素组划分、干扰因素组内抗干扰元网络间的参数共享方法,以及抗干扰元网络内的参数特异化网络结构,均是领域内常用的云端感知模型方案所缺少的,本发明提出的这些方法和网络结构设计,可以有效的提升云端感知模型的性能和对干扰因素的鲁棒性。
下面介绍本申请提供的一种应用实施例,如图10所示,包括以下步骤:
步骤1:采集正常场景数据和干扰数据,构建数据集;
步骤2:从数据集中选取各类型干扰样本,训练各类型干扰因素的干扰因素元特征编码网络,获得各类干扰因素对应的元特征;
步骤3:对相同干扰因素对应的抗干扰元网络设置参数共享网络层;
步骤4:使用各类型干扰因素对应的元特征初始化干扰因素对应的抗干扰元网络中的参数特异化网络的参数;
步骤5:从数据集中选取正常场景样本和干扰样本,训练感知大模型;
步骤6:从数据集中选取正常场景样本和干扰样本,利用上一步得到的感知大模型,训练车端感知模型;
步骤7:将训练完成的车端感知模型部署至自动驾驶系统中。
下面对本申请实施例提供的一种感知模型训练装置进行介绍,下文描述的一种感知模型训练装置与上文描述的一种感知模型训练方法可以相互参照。
参见图11,根据一示例性实施例示出的一种感知模型训练装置的结构图,如图11所示,包括:
获取单元100,用于获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
第一训练单元200,用于基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本。
本申请实施例提供的感知模型训练装置,针对云端感知模型,在特定数量的基础元网络间进行参数共享,以在不同的基础元网络间共享知识,提高基础元网络组的整体性能。在相同干扰因素对应的抗干扰元网络间进行参数共享,以在相同干扰因素对应的不同的抗干扰元网络间共享知识,提高抗干扰元网络组的整体性能以及对干扰因素的鲁棒性。
在上述实施例的基础上,作为一种优选实施方式,所述网络模块包括卷积神经网络层或全连接层或注意力层。
在上述实施例的基础上,作为一种优选实施方式,所述云端感知模型还包括每个所述干扰因素对应的元特征编码网络,所述干扰因素对应的元特征编码网络用于提取所述干扰因素对应的干扰样本的元特征;
所述抗干扰元网络的第一个网络模块包括目标网络单元和参数特异化网络,所述目标网络单元为所述卷积神经网络层或所述全连接层或所述注意力层,所述参数特异化网络为1×1×K的卷积神经网络,K为所述抗干扰元网络对应的干扰因素的元特征的维度,所述参数特异化网络的参数基于所述干扰因素的元特征初始化,所述干扰因素的元特征为所述干扰因素对应的所有干扰样本的元特征的均值,所述抗干扰元网络的第一个网络模块的输出特征为所述目标网络单元的输出特征与所述参数特异化网络的输出特征相加。
在上述实施例的基础上,作为一种优选实施方式,所述元特征编码网络包括依次连接的编码模块和解码模块,所述装置还包括:
第三训练单元,用于将所述干扰因素对应的干扰样本输入所述干扰因素对应的元特征编码网络,依次经过所述编码模块和所述解码模块得到重构样本,计算所述干扰样本与所述重构样本之间的重构损失,基于所述重构损失训练所述干扰因素对应的元特征编码网络,得到训练完成的所述干扰因素对应的元特征编码网络;
所述干扰因素对应的元特征编码网络具体用于利用所述干扰因素对应的训练完成的元特征编码网络中的编码模块提取所述干扰因素对应的干扰样本的元特征。
在上述实施例的基础上,作为一种优选实施方式,所述编码模块包括依次连接的一个或多个卷积神经网络、特征变形单元、一个或多个全连接层,所述解码模块包括依次连接的一个或多个全连接层、特征变形单元、一个或多个卷积神经网络。
在上述实施例的基础上,作为一种优选实施方式,所述重构损失的计算公式为:
其中,为重构损失,K为所述干扰样本包含的元素数量,/>为所述干扰样本中的第k个元素,/>为所述重构样本中的第k个元素。
在上述实施例的基础上,作为一种优选实施方式,所述云端感知模型包括依次连接的输入模块、基础网络、云端元网络、元知识融合网络和任务网络,所述云端元网络包括所述基础元网络组和所述抗干扰元网络组。
在上述实施例的基础上,作为一种优选实施方式,所述输入模块包括多个单模态的输入单元,每个所述输入单元通过对应的基础网络连接多模态融合网络,所述多模态融合网络连接所述云端元网络。
在上述实施例的基础上,作为一种优选实施方式,所述基础网络包括依次连接的预处理模块、骨干网络和多尺度特征提取网络。
在上述实施例的基础上,作为一种优选实施方式,所述任务网络包括多个子任务网络。
在上述实施例的基础上,作为一种优选实施方式,所述第一训练单元200包括:
第一确定子单元,用于确定正常训练样本的第一采样率或干扰训练样本的第二采样率;其中,所述第一采样率与所述第二采样率的和为一;
第一采样子单元,用于基于所述第一采样率或所述第二采样率在正常场景数据中采样正常训练样本、在干扰场景数据中采样干扰训练样本;
第一训练子单元,用于将所述干扰训练样本输入所述云端感知模型中,基于所述云端感知模型中任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型。
在上述实施例的基础上,作为一种优选实施方式,所述训练子单元具体用于:确定所述干扰训练样本对应的标注;其中,所述标注包括任务标注和干扰因素;将所述干扰训练样本输入所述云端感知模型中所述干扰因素对应的抗干扰元网络中,得到任务网络的输出结果,基于所述输出结果和所述任务标注计算任务网络的损失;基于所述任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型。
下面对本申请实施例提供的另一种感知模型训练装置进行介绍,下文描述的一种感知模型训练装置与上文描述的另一种感知模型训练方法可以相互参照。
参见图12,根据一示例性实施例示出的一种感知模型训练装置的结构图,如图12所示,包括:
获取单元100,用于获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
第一训练单元200,用于基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本;
构建单元300,用于基于所述训练完成的云端感知模型构建车端感知模型;其中,所述车端感知模型包括多个基础元网络和多个抗干扰元网络,所述车端感知模型包含的基础元网络数量小于所述云端感知模型包含的基础元网络数量,所述车端感知模型包含的抗干扰元网络数量小于所述云端感知模型包含的抗干扰元网络数量;
第二训练单元400,用于基于所述正常场景数据和所述干扰场景数据训练所述车端感知模型得到训练完成的车端感知模型。
本申请实施例提供的感知模型训练装置,针对云端感知模型,在特定数量的基础元网络间进行参数共享,以在不同的基础元网络间共享知识,提高基础元网络组的整体性能。在相同干扰因素对应的抗干扰元网络间进行参数共享,以在相同干扰因素对应的不同的抗干扰元网络间共享知识,提高抗干扰元网络组的整体性能以及对干扰因素的鲁棒性。车端感知模型基于云端感知模型进行构建,提高了车端感知模型的整体性能和对干扰因素的鲁棒性。
在上述实施例的基础上,作为一种优选实施方式,所述车端感知模型包括依次连接的输入模块、基础网络、车端元网络、元知识融合网络和所述任务网络,车端元网络包括多个所述基础元网络和多个所述抗干扰元网络。
在上述实施例的基础上,作为一种优选实施方式,所述构建单元300具体用于:将所述训练完成的云端感知模型中云端元网络中的所有基础元网络划分为第一预设数量个类别;其中,所述第一预设数量为所述车端感知模型包含的基础元网络的数量;对每个类别中基础元网络的参数进行均值融合得到车端感知模型中对应的基础元网络的参数;将所述训练完成的云端感知模型中云端元网络中的所有抗干扰元网络划分为第二预设数量个类别;其中,所述第二预设数量为所述车端感知模型包含的抗干扰元网络的数量;对每个类别中抗干扰元网络的参数进行均值融合得到车端感知模型中对应的抗干扰元网络的参数。
在上述实施例的基础上,作为一种优选实施方式,所述第二训练单元400包括:
第二确定子单元,用于确定正常训练样本的第三采样率或干扰训练样本的第四采样率;其中,所述第三采样率与所述第四采样率的和为一;
第二采样子单元,用于基于所述第三采样率或所述第四采样率在正常场景数据中采样正常训练样本、在干扰场景数据中采样干扰训练样本;
第二训练子单元,用于将所述干扰训练样本输入所述车端感知模型中,基于所述车端感知模型中任务网络的损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型。
在上述实施例的基础上,作为一种优选实施方式,所述第二训练子单元具体用于:将所述干扰训练样本输入所述车端感知模型中,基于所述车端感知模型中任务网络的损失和知识蒸馏损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型;
其中,所述知识蒸馏损失为基于所述训练完成的云端感知模型中的多模态融合网络输出的融合特征和所述车端感知模型中的多模态融合网络输出的融合特征计算得到的,或,所述知识蒸馏损失为基于所述训练完成的云端感知模型中的元知识融合网络输出的融合特征和所述车端感知模型中的元知识融合网络输出的融合特征计算得到的。
在上述实施例的基础上,作为一种优选实施方式,所述知识蒸馏损失的计算公式为:
其中,为所述知识蒸馏损失,/>为所述训练完成的云端感知模型中的多模态融合网络或元知识融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,/>所述车端感知模型中的多模态融合网络或元知识融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,1≤i≤W,1≤j≤H,1≤k≤C,W为融合特征的宽度,H为融合特征的高度,C为融合特征的通道数量。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于上述程序模块的硬件实现,且为了实现本申请实施例的方法,本申请实施例还提供了一种电子设备,图13为根据一示例性实施例示出的一种电子设备的结构图,如图13所示,电子设备包括:
通信接口1,能够与其它设备比如网络设备等进行信息交互;
处理器2,与通信接口1连接,以实现与其它设备进行信息交互,用于运行计算机程序时,执行上述一个或多个技术方案提供的车端感知模型训练方法。而所述计算机程序存储在存储器3上。
当然,实际应用时,电子设备中的各个组件通过总线系统4耦合在一起。可理解,总线系统4用于实现这些组件之间的连接通信。总线系统4除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图13中将各种总线都标为总线系统4。
本申请实施例中的存储器3用于存储各种类型的数据以支持电子设备的操作。这些数据的示例包括:用于在电子设备上操作的任何计算机程序。
可以理解,存储器3可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本申请实施例描述的存储器3旨在包括但不限于这些和任意其它适合类型的存储器。
上述本申请实施例揭示的方法可以应用于处理器2中,或者由处理器2实现。处理器2可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器2中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器2可以是通用处理器、DSP,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器2可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器3,处理器2读取存储器3中的程序,结合其硬件完成前述方法的步骤。
处理器2执行所述程序时实现本申请实施例的各个方法中的相应流程,为了简洁,在此不再赘述。
在示例性实施例中,本申请实施例还提供了一种存储介质,即计算机存储介质,具体为计算机可读存储介质,例如包括存储计算机程序的存储器3,上述计算机程序可由处理器2执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、CD-ROM等存储器。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机、服务器、网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (22)

1.一种感知模型训练方法,其特征在于,包括:
获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本,所述正常场景数据为摄像机采集的图像数据和激光雷达采集的点云数据,所述干扰场景数据为存在干扰因素的图像数据或点云数据。
2.根据权利要求1所述感知模型训练方法,其特征在于,所述网络模块包括卷积神经网络层或全连接层或注意力层。
3.根据权利要求2所述感知模型训练方法,其特征在于,所述云端感知模型还包括每个所述干扰因素对应的元特征编码网络,所述干扰因素对应的元特征编码网络用于提取所述干扰因素对应的干扰样本的元特征;
所述抗干扰元网络的第一个网络模块包括目标网络单元和参数特异化网络,所述目标网络单元为所述卷积神经网络层或所述全连接层或所述注意力层,所述参数特异化网络为1×1×K的卷积神经网络,K为所述抗干扰元网络对应的干扰因素的元特征的维度,所述参数特异化网络的参数基于所述干扰因素的元特征初始化,所述干扰因素的元特征为所述干扰因素对应的所有干扰样本的元特征的均值,所述抗干扰元网络的第一个网络模块的输出特征为所述目标网络单元的输出特征与所述参数特异化网络的输出特征相加。
4.根据权利要求3所述感知模型训练方法,其特征在于,所述元特征编码网络包括依次连接的编码模块和解码模块,所述方法还包括:
将所述干扰因素对应的干扰样本输入所述干扰因素对应的元特征编码网络,依次经过所述编码模块和所述解码模块得到重构样本,计算所述干扰样本与所述重构样本之间的重构损失,基于所述重构损失训练所述干扰因素对应的元特征编码网络,得到训练完成的所述干扰因素对应的元特征编码网络;
所述干扰因素对应的元特征编码网络具体用于利用所述干扰因素对应的训练完成的元特征编码网络中的编码模块提取所述干扰因素对应的干扰样本的元特征。
5.根据权利要求4所述感知模型训练方法,其特征在于,所述编码模块包括依次连接的一个或多个卷积神经网络、特征变形单元、一个或多个全连接层,所述解码模块包括依次连接的一个或多个全连接层、特征变形单元、一个或多个卷积神经网络。
6.根据权利要求4所述感知模型训练方法,其特征在于,所述重构损失的计算公式为:
其中,为重构损失,K为所述干扰样本包含的元素数量,/>为所述干扰样本中的第k个元素,/>为所述重构样本中的第k个元素。
7.根据权利要求1所述感知模型训练方法,其特征在于,所述云端感知模型包括依次连接的输入模块、基础网络、云端元网络、元知识融合网络和任务网络,所述云端元网络包括所述基础元网络组和所述抗干扰元网络组。
8.根据权利要求7所述感知模型训练方法,其特征在于,所述输入模块包括多个单模态的输入单元,每个所述输入单元通过对应的基础网络连接多模态融合网络,所述多模态融合网络连接所述云端元网络。
9.根据权利要求7所述感知模型训练方法,其特征在于,所述基础网络包括依次连接的预处理模块、骨干网络和多尺度特征提取网络。
10.根据权利要求7所述感知模型训练方法,其特征在于,所述任务网络包括多个子任务网络。
11.根据权利要求1所述感知模型训练方法,其特征在于,所述基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型,包括:
确定正常训练样本的第一采样率或干扰训练样本的第二采样率;其中,所述第一采样率与所述第二采样率的和为一;
基于所述第一采样率或所述第二采样率在正常场景数据中采样正常训练样本、在干扰场景数据中采样干扰训练样本;
将所述干扰训练样本输入所述云端感知模型中,基于所述云端感知模型中任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型。
12.根据权利要求11所述感知模型训练方法,其特征在于,将所述干扰训练样本输入所述云端感知模型中,基于所述云端感知模型中任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型,包括:
确定所述干扰训练样本对应的标注;其中,所述标注包括任务标注和干扰因素;
将所述干扰训练样本输入所述云端感知模型中所述干扰因素对应的抗干扰元网络中,得到任务网络的输出结果,基于所述输出结果和所述任务标注计算任务网络的损失;
基于所述任务网络的损失对所述云端感知模型的模型参数进行训练,得到训练完成的云端感知模型。
13.一种感知模型训练方法,其特征在于,包括:
获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本,所述正常场景数据为摄像机采集的图像数据和激光雷达采集的点云数据,所述干扰场景数据为存在干扰因素的图像数据或点云数据;
基于所述训练完成的云端感知模型构建车端感知模型;其中,所述车端感知模型包括多个基础元网络和多个抗干扰元网络,所述车端感知模型包含的基础元网络数量小于所述云端感知模型包含的基础元网络数量,所述车端感知模型包含的抗干扰元网络数量小于所述云端感知模型包含的抗干扰元网络数量;
基于所述正常场景数据和所述干扰场景数据训练所述车端感知模型得到训练完成的车端感知模型。
14.根据权利要求13所述感知模型训练方法,其特征在于,所述车端感知模型包括依次连接的输入模块、基础网络、车端元网络、元知识融合网络和任务网络,车端元网络包括多个所述基础元网络和多个所述抗干扰元网络。
15.根据权利要求13所述感知模型训练方法,其特征在于,所述基于所述训练完成的云端感知模型构建车端感知模型,包括:
将所述训练完成的云端感知模型中云端元网络中的所有基础元网络划分为第一预设数量个类别;其中,所述第一预设数量为所述车端感知模型包含的基础元网络的数量;
对每个类别中基础元网络的参数进行均值融合得到车端感知模型中对应的基础元网络的参数;
将所述训练完成的云端感知模型中云端元网络中的所有抗干扰元网络划分为第二预设数量个类别;其中,所述第二预设数量为所述车端感知模型包含的抗干扰元网络的数量;
对每个类别中抗干扰元网络的参数进行均值融合得到车端感知模型中对应的抗干扰元网络的参数。
16.根据权利要求13所述感知模型训练方法,其特征在于,所述基于所述正常场景数据和所述干扰场景数据训练所述车端感知模型得到训练完成的车端感知模型,包括:
确定正常训练样本的第三采样率或干扰训练样本的第四采样率;其中,所述第三采样率与所述第四采样率的和为一;
基于所述第三采样率或所述第四采样率在正常场景数据中采样正常训练样本、在干扰场景数据中采样干扰训练样本;
将所述干扰训练样本输入所述车端感知模型中,基于所述车端感知模型中任务网络的损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型。
17.根据权利要求16所述感知模型训练方法,其特征在于,所述基于所述车端感知模型中任务网络的损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型,包括:
基于所述车端感知模型中任务网络的损失和知识蒸馏损失对所述车端感知模型的模型参数进行训练,得到训练完成的车端感知模型;
其中,所述知识蒸馏损失为基于所述训练完成的云端感知模型中的多模态融合网络输出的融合特征和所述车端感知模型中的多模态融合网络输出的融合特征计算得到的,或,所述知识蒸馏损失为基于所述训练完成的云端感知模型中的元知识融合网络输出的融合特征和所述车端感知模型中的元知识融合网络输出的融合特征计算得到的。
18.根据权利要求17所述感知模型训练方法,其特征在于,所述知识蒸馏损失的计算公式为:
其中,为所述知识蒸馏损失,/>为所述训练完成的云端感知模型中的多模态融合网络或元知识融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,/>为所述车端感知模型中的多模态融合网络或元知识融合网络输出的融合特征第(i,j)位置的第k通道处的特征值,1≤i≤W,1≤j≤H,1≤k≤C,W为融合特征的宽度,H为融合特征的高度,C为融合特征的通道数量。
19.一种感知模型训练装置,其特征在于,包括:
获取单元,用于获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
第一训练单元,用于基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本,所述正常场景数据为摄像机采集的图像数据和激光雷达采集的点云数据,所述干扰场景数据为存在干扰因素的图像数据或点云数据。
20.一种感知模型训练装置,其特征在于,包括:
获取单元,用于获取云端感知模型;其中,所述云端感知模型包括云端元网络,所述云端元网络包括基础元网络组和抗干扰元网络组,所述基础元网络组包括多个基础元网络,所述抗干扰元网络组包括多个干扰因素分别对应的多个抗干扰元网络,所述基础元网络包括依次连接的多个网络模块,所述抗干扰元网络包括依次连接的多个网络模块,所述基础元网络组中每目标数量个基础元网络中的第一个网络模块的参数共享,相同干扰因素对应的抗干扰元网络中的第一个网络模块的参数共享;
第一训练单元,用于基于正常场景数据和干扰场景数据训练所述云端感知模型得到训练完成的云端感知模型;其中,所述干扰场景数据包括多个所述干扰因素对应的干扰样本,所述正常场景数据为摄像机采集的图像数据和激光雷达采集的点云数据,所述干扰场景数据为存在干扰因素的图像数据或点云数据;
构建单元,用于基于所述训练完成的云端感知模型构建车端感知模型;其中,所述车端感知模型包括多个基础元网络和多个抗干扰元网络,所述车端感知模型包含的基础元网络数量小于所述云端感知模型包含的基础元网络数量,所述车端感知模型包含的抗干扰元网络数量小于所述云端感知模型包含的抗干扰元网络数量;
第二训练单元,用于基于所述正常场景数据和所述干扰场景数据训练所述车端感知模型得到训练完成的车端感知模型。
21.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至18任一项所述感知模型训练方法的步骤。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至18任一项所述感知模型训练方法的步骤。
CN202311110633.3A 2023-08-31 2023-08-31 一种感知模型训练方法、装置及电子设备和存储介质 Active CN116821699B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311110633.3A CN116821699B (zh) 2023-08-31 2023-08-31 一种感知模型训练方法、装置及电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311110633.3A CN116821699B (zh) 2023-08-31 2023-08-31 一种感知模型训练方法、装置及电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN116821699A CN116821699A (zh) 2023-09-29
CN116821699B true CN116821699B (zh) 2024-01-19

Family

ID=88139659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311110633.3A Active CN116821699B (zh) 2023-08-31 2023-08-31 一种感知模型训练方法、装置及电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN116821699B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990026A (zh) * 2021-03-19 2021-06-18 西北大学 基于对抗训练的无线信号感知模型构建、感知方法及系统
CN113065443A (zh) * 2021-03-25 2021-07-02 携程计算机技术(上海)有限公司 图片识别模型的训练方法、识别方法、系统、设备和介质
CN113420495A (zh) * 2021-05-31 2021-09-21 西南电子技术研究所(中国电子科技集团公司第十研究所) 主动诱骗式智能抗干扰方法
WO2022126797A1 (zh) * 2020-12-17 2022-06-23 之江实验室 基于多层级知识蒸馏预训练语言模型自动压缩方法及平台
CN115100614A (zh) * 2022-06-21 2022-09-23 重庆长安汽车股份有限公司 车辆感知系统的评估方法、装置、车辆及存储介质
WO2022217434A1 (zh) * 2021-04-12 2022-10-20 华为技术有限公司 感知网络、感知网络的训练方法、物体识别方法及装置
WO2023040147A1 (zh) * 2021-09-14 2023-03-23 上海商汤智能科技有限公司 神经网络的训练方法及装置、存储介质和计算机程序
CN115879535A (zh) * 2023-02-10 2023-03-31 北京百度网讯科技有限公司 一种自动驾驶感知模型的训练方法、装置、设备和介质
CN115907009A (zh) * 2023-02-10 2023-04-04 北京百度网讯科技有限公司 一种自动驾驶感知模型的迁移方法、装置、设备和介质
CN116467594A (zh) * 2023-03-31 2023-07-21 华为技术有限公司 一种推荐模型的训练方法及相关装置
CN116524324A (zh) * 2023-04-19 2023-08-01 重庆长安汽车股份有限公司 Bev模型训练方法、装置、系统、车辆及可读存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022126797A1 (zh) * 2020-12-17 2022-06-23 之江实验室 基于多层级知识蒸馏预训练语言模型自动压缩方法及平台
CN112990026A (zh) * 2021-03-19 2021-06-18 西北大学 基于对抗训练的无线信号感知模型构建、感知方法及系统
CN113065443A (zh) * 2021-03-25 2021-07-02 携程计算机技术(上海)有限公司 图片识别模型的训练方法、识别方法、系统、设备和介质
WO2022217434A1 (zh) * 2021-04-12 2022-10-20 华为技术有限公司 感知网络、感知网络的训练方法、物体识别方法及装置
CN113420495A (zh) * 2021-05-31 2021-09-21 西南电子技术研究所(中国电子科技集团公司第十研究所) 主动诱骗式智能抗干扰方法
WO2023040147A1 (zh) * 2021-09-14 2023-03-23 上海商汤智能科技有限公司 神经网络的训练方法及装置、存储介质和计算机程序
CN115100614A (zh) * 2022-06-21 2022-09-23 重庆长安汽车股份有限公司 车辆感知系统的评估方法、装置、车辆及存储介质
CN115879535A (zh) * 2023-02-10 2023-03-31 北京百度网讯科技有限公司 一种自动驾驶感知模型的训练方法、装置、设备和介质
CN115907009A (zh) * 2023-02-10 2023-04-04 北京百度网讯科技有限公司 一种自动驾驶感知模型的迁移方法、装置、设备和介质
CN116467594A (zh) * 2023-03-31 2023-07-21 华为技术有限公司 一种推荐模型的训练方法及相关装置
CN116524324A (zh) * 2023-04-19 2023-08-01 重庆长安汽车股份有限公司 Bev模型训练方法、装置、系统、车辆及可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Dongyan Guo.SiamCAR: Siamese Fully Convolutional Classification and Regression for Visual Tracking.《IEEE Xplore》.2020,全文. *
凌贵.面向环保无人船的多任务视觉感知与模型加速研究.《万方数据库》.2022,全文. *
杨志峰 ; 李增辉 ; 刘笑 ; 冀鑫炜 ; 王恩堂 ; .生成对抗网络在雷达反欺骗干扰中的应用框架.现代雷达.2020,(第08期),全文. *

Also Published As

Publication number Publication date
CN116821699A (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
US20200250436A1 (en) Video object segmentation by reference-guided mask propagation
US11200424B2 (en) Space-time memory network for locating target object in video content
CN110599492B (zh) 图像分割模型的训练方法、装置、电子设备及存储介质
CN113780296B (zh) 基于多尺度信息融合的遥感图像语义分割方法及系统
CN108734210B (zh) 一种基于跨模态多尺度特征融合的对象检测方法
CN112507990A (zh) 视频时空特征学习、抽取方法、装置、设备及存储介质
CN113409361B (zh) 一种多目标跟踪方法、装置、计算机及存储介质
CN112634296A (zh) 门机制引导边缘信息蒸馏的rgb-d图像语义分割方法及终端
CN115147598B (zh) 目标检测分割方法、装置、智能终端及存储介质
CN112396645A (zh) 一种基于卷积残差学习的单目图像深度估计方法和系统
dos Santos Rosa et al. Sparse-to-continuous: Enhancing monocular depth estimation using occupancy maps
CN112597918A (zh) 文本检测方法及装置、电子设备、存储介质
CN112446888A (zh) 图像分割模型的处理方法和处理装置
CN116433903A (zh) 实例分割模型构建方法、系统、电子设备及存储介质
CN116861262B (zh) 一种感知模型训练方法、装置及电子设备和存储介质
CN116757978A (zh) 一种红外与可见光图像自适应融合方法、系统和电子设备
CN116980541B (zh) 视频编辑方法、装置、电子设备以及存储介质
CN113744280A (zh) 图像处理方法、装置、设备及介质
CN116363037B (zh) 一种多模态图像融合方法、装置及设备
CN116821699B (zh) 一种感知模型训练方法、装置及电子设备和存储介质
CN116824625A (zh) 基于生成式多模态图像融合的目标重识别方法
CN116052108A (zh) 基于Transformer的交通场景小样本目标检测方法及装置
EP4235492A1 (en) A computer-implemented method, data processing apparatus and computer program for object detection
CN112052863B (zh) 一种图像检测方法及装置、计算机存储介质、电子设备
CN115577768A (zh) 半监督模型训练方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant