CN112949827A - 神经网络生成、数据处理、智能行驶控制方法及装置 - Google Patents
神经网络生成、数据处理、智能行驶控制方法及装置 Download PDFInfo
- Publication number
- CN112949827A CN112949827A CN202110215347.8A CN202110215347A CN112949827A CN 112949827 A CN112949827 A CN 112949827A CN 202110215347 A CN202110215347 A CN 202110215347A CN 112949827 A CN112949827 A CN 112949827A
- Authority
- CN
- China
- Prior art keywords
- vector
- neural network
- target
- determining
- gradient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 451
- 238000000034 method Methods 0.000 title claims abstract description 112
- 238000012545 processing Methods 0.000 title claims description 33
- 239000013598 vector Substances 0.000 claims abstract description 675
- 230000001537 neural effect Effects 0.000 claims abstract description 91
- 238000003672 processing method Methods 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 3
- 238000013526 transfer learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本公开提供了一种神经网络生成方法、数据处理方法、智能行驶控制方法、装置、电子设备及存储介质,该神经网络生成方法包括:确定表征神经网络结构的结构向量;基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量;其中,所述神经预测器用于预测所述结构向量对应的神经网络结构的性能;所述梯度向量用于表征所述结构向量对应的神经网络结构的调整信息;基于所述梯度向量、和所述结构向量,确定目标神经网络。
Description
技术领域
本公开涉及深度学习技术领域,具体而言,涉及一种神经网络生成方法、数据处理方法、智能行驶控制方法、装置、电子设备及存储介质。
背景技术
随着技术的发展,神经网络被应用于各个领域内,为了确定神经网络的网络结构,神经架构搜索(Neural Architecture Search,NAS)应用而生。由于神经架构搜索能够自动发现高效且表现好的网络结构,故NAS在计算机视觉任务上取得了令人惊讶的成就。
一般的,NAS要从一个搜索空间中采样并训练大量的候选网络结构,并且评估他们的性能来发现最优的网络结构,但是搜索空间中包括大量的网络结构,使得搜索的效率较低。
发明内容
有鉴于此,本公开至少提供一种神经网络生成方法、数据处理方法、智能行驶控制方法、装置、电子设备及存储介质。
第一方面,本公开提供了一种神经网络生成方法,包括:
确定表征神经网络结构的结构向量;
基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量;其中,所述神经预测器用于预测所述结构向量对应的神经网络结构的性能;所述梯度向量用于表征所述结构向量对应的神经网络结构的调整信息;
基于所述梯度向量、和所述结构向量,确定目标神经网络。
上述方法中,通过基于训练后的神经预测器和结构向量,确定结构向量对应的梯度向量,该梯度向量可以表征结构向量对应的神经网络结构的调整信息,通过梯度向量可以较准确的控制结构向量对应的神经网络结构朝向性能较优的方向调整,进而可以较准取的确定性能较优的目标神经网络。同时,本方案与现有方案相比,通过确定结构向量对应的梯度向量,基于梯度向量和结构向量确定目标神经网络,比如可以利用梯度向量对结构向量进行调整,即利用梯度向量指示的调整信息对结构向量对应的神经网络结构进行调整,确定目标神经网络,不需要多次采样神经网络结构,提高了生成目标神经网络的效率。
一种可能的实施方式中,所述基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量,包括:
基于所述训练后的神经预测器、和所述结构向量,确定所述结构向量对应的神经网络结构的性能参数;
基于所述神经网络结构的性能参数、和设置的所述性能参数对应的目标值,确定所述神经网络结构的预测误差;
基于所述预测误差、和所述结构向量对应的神经网络结构,确定所述结构向量对应的梯度向量。
采用上述方法,通过确定结构向量对应的神经网络结构的预测误差,基于该预测误差和结构向量对应的神经网络结构,确定结构向量对应的梯度向量,该梯度向量可以表征神经网络结构的性能参数朝向目标值进行优化的调整信息,以便使得调整后结构向量对应的神经网络结构的性能参数可以达到设置的目标值。
一种可能的实施方式中,所述基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量,包括:
从表征神经网络结构的多个结构向量中选取第一结构向量,将选取的所述第一结构向量确定为待检测结构向量;
基于所述训练后的神经预测器、和所述待检测结构向量,确定所述待检测结构向量对应的待检测神经网络结构的性能参数;
基于所述待检测神经网络结构的性能参数、所述待检测结构向量对应的待检测神经网络结构,确定所述待检测结构向量的梯度向量。
一种可能的实施方式中,所述基于所述待检测神经网络结构的性能参数、所述待检测结构向量对应的待检测神经网络结构,确定所述待检测结构向量的梯度向量,包括:
基于所述待检测神经网络结构的性能参数,确定所述待检测神经网络结构的预测误差;
基于所述预测误差、和所述待检测结构向量对应的待检测神经网络结构,确定所述待检测结构向量的梯度向量。
一种可能的实施方式中,所述基于所述梯度向量、和所述结构向量,确定目标神经网络,包括:
基于所述待检测结构向量对应的梯度向量、和所述待检测结构向量,确定中间结构向量;
将所述中间结构向量确定为新的待检测结构向量,返回至基于所述训练后的神经预测器、和所述待检测结构向量,确定所述待检测结构向量对应的待检测神经网络结构的性能参数的步骤,直至满足预设的截止条件;
将满足预设截止条件时的所述中间结构向量对应的神经网络结构,确定为目标神经网络结构;
对所述目标神经网络结构进行神经网络训练,确定所述目标神经网络。
采用上述方法,可以为通过多次迭代的方式,循序渐进的调整结构向量对应的神经网络结构,较准确的确定较优的目标神经网络结构。
一种可能的实施方式中,所述预设的截止条件包括以下至少一种:
迭代次数达到设置的次数阈值;
生成的中间结构向量对应的神经网络结构的准确率大于设置的准确率阈值;
生成的中间结构向量对应的神经网络结构的运算要求满足设置的运算约束条件。
这里,设置多种截止条件,可以提升确定目标神经网络的灵活性和准确性。
一种可能的实施方式中,所述结构向量中包括至少一个第一元素,每个第一元素对应所述神经网络结构的一个结构参数信息,所述基于所述梯度向量、和所述结构向量,确定目标神经网络,包括:
利用所述梯度向量,对所述结构向量中的至少一个第一元素进行调整,生成调整后结构向量;
对所述调整后结构向量对应的目标神经网络结构进行神经网络训练,得到所述目标神经网络。
一种可能的实施方式中,利用所述梯度向量,对所述结构向量中的至少一个第一元素进行调整,生成调整后结构向量,包括:
确定所述结构向量对应的归一化向量;其中,所述归一化向量中的每个第二元素表征所述结构向量中对应结构参数信息的变化程度;
利用所述归一化向量对所述梯度向量进行归一化处理,生成处理后的梯度向量;
基于所述处理后的梯度向量,确定所述结构向量中的待处理第一元素;
利用所述梯度向量指示的与所述待处理第一元素匹配的梯度值,对所述结构向量中待处理第一元素进行调整,生成调整后结构向量。
这里,可以通过确定待处理第一元素,对待处理第一元素进行调整,生成调整后结构向量,避免对结构向量中的多个第一元素进行调整时,造成结构向量的过度调整。
一种可能的实施方式中,所述确定所述结构向量对应的归一化向量,包括:
确定所述结构向量对应的神经网络结构的第一计算量;
针对所述结构向量中的每个第一元素,基于所述第一元素对应的基准值,调整所述结构向量中所述第一元素的值,生成中间结构向量;
确定所述中间结构向量对应的神经网络结构的第二计算量;
基于所述第一计算量和所述第二计算量,生成所述归一化向量中与所述第一元素匹配的第二元素。
一种可能的实施方式中,在所述神经网络结构用于执行多个目标任务的情况下,所述基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量,包括:
针对每个目标任务,基于所述目标任务对应的训练后的神经预测器和所述结构向量,确定所述结构向量在所述目标任务下的中间梯度向量;
基于所述结构向量在各个目标任务下的中间梯度向量,确定所述结构向量对应的梯度向量。
采用上述方法,在神经网络结构用于执行多个目标任务时,可以控制结构向量对应的神经网络结构进行多任务学习,使得得到的目标神经网络在执行每个目标任务时,能够得到较优的检测结果。
一种可能的实施方式中,在所述神经网络结构用于执行多个目标任务的情况下,所述基于所述梯度向量、和所述结构向量,确定目标神经网络,包括:基于所述多个目标任务中第一目标任务对应的梯度向量、和所述第一目标任务对应的结构向量,确定所述第一目标任务对应的第一目标神经网络;
所述方法还包括:将所述第一目标神经网络的神经网络结构对应的结构向量,作为所述多个目标任务中第二目标任务对应的结构向量;
基于所述第二目标任务对应的训练后的神经预测器、和所述第二目标任务对应的结构向量,确定所述第二目标任务对应的梯度向量;
基于所述第二目标任务对应的梯度向量、和所述第二目标任务对应的结构向量,确定所述第二目标任务对应的第二目标神经网络。
采用上述方法,在神经网络结构能够用于执行多个目标任务时,可以控制结构向量对应的神经网络结构进行任务迁移学习,即控制神经网络结构从在执行目标任务A时能够得到较准确的检测结果,变换为在执行目标任务B时能够得到较准确的检测结果,提高得到的目标神经网络的利用率。
一种可能的实施方式中,所述神经网络结构用于执行以下目标任务中的一个或多个:图像分类、语义分割、三维3D目标检测、视频分类;
在所述神经网络结构用于执行多个目标任务的情况下,每个目标任务对应一个神经预测器。
上述方法中,神经网络结构可以执行的目标任务的种类较多,可以使得得到的目标神经网络的应用较为广泛,进而提高目标神经网络的利用率。
一种可能的实施方式中,根据下述步骤训练每个目标任务对应的神经预测器:
确定由各个所述结构向量对应的神经网络结构所构成的搜索空间;
从所述搜索空间中选取多个第一神经网络结构;其中,每个所述第一神经网络结构对应一个第一结构向量;
利用所述目标任务对应的样本数据,对所述多个第一神经网络结构进行训练,得到训练后的所述多个第一神经网络结构对应的性能参数;
基于所述多个第一神经网络结构对应的第一结构向量和所述性能参数,对所述目标任务对应的神经预测器进行训练,得到所述目标任务对应的训练后的神经预测器。
采用上述方法,通过从搜索空间中选取多个第一神经网络结构,利用目标任务对应的样本数据,对多个第一神经网络结构进行训练,得到训练后的多个第一神经网络结构对应的性能参数;由于多个神经网络结构对应的性能参数较为丰富,再使用多个第一神经网络结构对应的第一结构向量和性能参数,对目标任务对应的神经预测器进行训练,可以使得目标任务对应的训练后的神经预测器的准确率较高。
以下装置、电子设备等的效果描述参见上述方法的说明,这里不再赘述。
第二方面,本公开提供了一种数据处理方法,包括:
获取待处理数据;所述待处理数据包括:待处理图像、和/或待处理视频;
利用第一神经网络,对所述待处理数据进行处理,得到所述待处理数据的数据处理结果;其中,所述第一神经网络包括基于第一方面任一项所述的神经网络生成方法生成的目标神经网络。
第三方面,本公开提供了一种智能行驶控制方法,包括:
获取行驶装置在行驶过程中采集的图像、或视频;
利用第二神经网络,检测所述图像或者视频中的目标对象;其中,所述第二神经网络包括基于第一方面任一项所述的神经网络生成方法生成的目标神经网络;
基于检测的所述目标对象,控制所述行驶装置。
第四方面,本公开提供了一种神经网络生成装置,包括:
第一确定模块,用于确定表征神经网络结构的结构向量;
第二确定模块,用于基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量;其中,所述神经预测器用于预测所述结构向量对应的神经网络结构的性能;所述梯度向量用于表征所述结构向量对应的神经网络结构的调整信息;
第三确定模块,用于基于所述梯度向量、和所述结构向量,确定目标神经网络。
第五方面,本公开提供了一种数据处理装置,包括:
第一获取模块,用于获取待处理数据;所述待处理数据包括:待处理图像、和/或待处理视频;
处理模块,用于利用第一神经网络,对所述待处理数据进行处理,得到所述待处理数据的数据处理结果;其中,所述第一神经网络包括基于第一方面任一项所述的神经网络生成方法生成的目标神经网络。
第六方面,本公开提供了一种智能行驶控制装置,包括:
第二获取模块,用于获取行驶装置在行驶过程中采集的图像、或视频;
检测模块,用于利用第二神经网络,检测所述图像或者视频中的目标对象;其中,所述第二神经网络包括基于第一方面所述的神经网络生成方法生成的目标神经网络;
控制模块,用于基于检测的所述目标对象,控制所述行驶装置。
第七方面,本公开提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述第一方面或任一实施方式所述的神经网络生成方法的步骤;或执行如上述第二方面所述的数据处理方法的步骤;或执行如上述第三方面所述的智能行驶控制方法的步骤。
第八方面,本公开提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述第一方面或任一实施方式所述的神经网络生成方法的步骤;或执行如上述第二方面所述的数据处理方法的步骤;或执行如上述第三方面所述的智能行驶控制方法的步骤。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种神经网络生成方法的流程示意图;
图2示出了本公开实施例所提供的一种神经网络生成方法中,神经网络结构示意图;
图3示出了本公开实施例所提供的一种神经网络生成方法中,训练每个目标任务对应的神经预测器的流程示意图;
图4示出了本公开实施例所提供的一种数据处理方法的流程示意图;
图5示出了本公开实施例所提供的一种智能行驶控制方法的流程示意图;
图6示出了本公开实施例所提供的一种神经网络生成装置的架构示意图;
图7示出了本公开实施例所提供的一种数据处理装置的架构示意图;
图8示出了本公开实施例所提供的一种智能行驶控制装置的架构示意图;
图9示出了本公开实施例所提供的一种电子设备的结构示意图;
图10示出了本公开实施例所提供的另一种电子设备的结构示意图;
图11示出了本公开实施例所提供的另一种电子设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
NAS在对神经网络进行自动网络结构搜索时,若神经网络包括有n个网络层,每个网络层有m种可选的操作(即由m个可选的算子),则最终构成的搜索空间有mn条搜索路径,每条搜索路径由n层网络中每层网络的一个可选的操作连接形成,每条搜索路径分别对应于一个神经网络结构,其中m和n为正整数。
一般的,可以通过从搜索空间中多次选取搜索路径,通过确定选取的搜索路径之间的相对性能,选取性能较佳的神经网络结构。但是,搜索空间中包括大量的网络结构,比如,若m为10,n为8时,则搜索空间中包括108条搜索路径,可知搜索空间中包括的搜索路径较多,搜索到最佳的网络结构的效率较低。为了解决上述问题,本公开实施例提供了一种神经网络生成方法。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本公开实施例进行理解,首先对本公开实施例所公开的一种神经网络生成方法、数据处理方法、智能行驶控制方法进行详细介绍。本公开实施例所提供的神经网络生成方法、数据处理方法、智能行驶控制方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该神经网络生成方法、数据处理方法、智能行驶控制方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
参见图1所示,为本公开实施例所提供的神经网络生成方法的流程示意图,该方法包括S101-S103,其中:
S101,确定表征神经网络结构的结构向量;
S102,基于训练后的神经预测器、和结构向量,确定结构向量对应的梯度向量;其中,神经预测器用于预测结构向量对应的神经网络结构的性能;梯度向量用于表征结构向量对应的神经网络结构的调整信息;
S103,基于梯度向量、和结构向量,确定目标神经网络。
上述方法中,通过基于训练后的神经预测器和结构向量,确定结构向量对应的梯度向量,该梯度向量可以表征结构向量对应的神经网络结构的调整信息,通过梯度向量可以较准确的控制结构向量对应的神经网络结构朝向性能较优的方向调整,进而可以较准取的确定性能较优的目标神经网络。
同时,本方案中与现有方案相比,通过确定结构向量对应的梯度向量,基于梯度向量和结构向量确定目标神经网络,比如可以利用梯度向量对结构向量进行调整,即利用梯度向量指示的调整信息对结构向量对应的神经网络结构进行调整,确定目标神经网络,不需要多次采样神经网络结构,提高了生成目标神经网络的效率。
下述对S101-S103进行具体说明。
针对S101:
这里,针对神经网络结构,可以确定表征神经网络结构的结构向量,其中结构向量中可以包括至少一个第一元素,每个第一元素对应神经网络结构的一个结构参数信息。比如,结构参数信息可以为卷积层的数量、每个卷积层的尺寸、每个卷积层的通道数等。
示例的,参见图2所示的一种神经网络结构示意图,该神经网络结构可以用27维的结构向量进行表征,示例性的,该27维结构向量可以为:
其中,i1为第一特征层21的尺寸,i2为第二特征层22的尺寸,b1为第一阶段中融合模块的数量(图2中b1=1),为第一阶段的第一分支中卷积层的数量(图2中),为第一阶段中第一分支中卷积层的通道数;b2为第二阶段中融合模块的数量(图2中),为第二阶段的第一分支中卷积层的数量(图2中),为第二阶段的第一分支中卷积层的通道数,为第二阶段的第二分支中卷积层的数量(图2中),为第二阶段的第二分支中卷积层的通道数;b3为第三阶段中融合模块的数量(图2中b3=1),为第三阶段的第一分支中卷积层的数量(图2中),为第三阶段的第一分支中卷积层的通道数,为第三阶段的第二分支中卷积层的数量(图2中),为第三阶段的第二分支中卷积层的通道数,为第三阶段的第三分支中卷积层的数量(图2中),为第三阶段的第三分支中卷积层的通道数;b4为第三阶段中融合模块的数量(图2中b4=2),为第四阶段的第一分支中卷积层的数量(图2中),为第四阶段的第一分支中卷积层的通道数,为第四阶段的第二分支中卷积层的数量(图2中),为第四阶段的第二分支中卷积层的通道数,为第四阶段的第三分支中卷积层的数量(图2中),为第四阶段的第三分支中卷积层的通道数,为第四阶段的第四分支中卷积层的数量(图2中),为第四阶段的第四分支中卷积层的通道数;o1为输出层的通道数。
其中,第一阶段中包括第一分支;第二阶段中包括第一分支和第二分支;第三阶段中包括第一分支、第二分支和第三分支;第四阶段中包括第一分支、第二分支、第三分支和第四分支。
其中,神经网络结构的结构向量可以根据实际情况进行确定。在得到了神经网络结构的结构向量后,结构向量中每个第一元素对应一个可选数据集合,不同的第一元素构成了不同的结构向量,各个不同结构向量分别对应的神经网络结构,构成了对应的搜索空间,即搜索空间中包括各个不同结构向量分别对应的神经网络结构。
假设,在结构向量为由{a1,a2,a3}构成的3维向量时,结构向量中的第一元素a1对应神经网络结构的卷积层的数量,第一元素a2对应神经网络结构的卷积层的尺寸,第一元素a3对应神经网络结构的卷积层的通道数,在a1对应的可选数据集合包括3至10中的任一数值,a2对应的可选数据集合包括3、5、7、9;a3对应的可选数据集合包括36、72、144,则构成的搜索空间的大小为8×4×3=96,即搜索空间中包括由96个结构向量分别对应的神经网络结构。
示例性的,结构向量{3,5,36}对应的神经网络结构可以包括3个卷积层,每个卷积层的尺寸为5×5,每个卷积层的通道数为36;结构向量{10,9,72}对应的神经网络结构可以包括10个卷积层,每个卷积层的尺寸为9×9,每个卷积层的通道数为72等。
针对S102以及S103:
神经预测器可以为用于预测结构向量对应的神经网络结构的性能的神经网络。其中,神经预测器的输入为结构向量,输出为结构向量对应的神经网络结构的性能参数。比如,性能参数可以包括:准确率、浮点运算次数(floating point of operations,FLOPs)、平均交并比(Mean Intersection over Union,mIoU)、均值平均精度(Mean AveragePrecision,mAP)等参数中的一个或多个。神经预测器的结构可以根据需要进行设置,比如神经预测器可以为三层的多层感知器。
一种可选实施方式中,神经网络结构用于执行以下目标任务中的一个或多个:图像分类、语义分割、三维3D目标检测、视频分类。
上述方法中,神经网络结构可以执行的目标任务的种类较多,可以使得得到的目标神经网络的应用较为广泛,进而提高目标神经网络的利用率。
示例性的,图像分类的目标任务用于检测图像中包括的目标对象的类别,该类别可以根据需要进行设置,比如,在自动驾驶场景中,该类别可以为行人、车辆等。语义分割的目标任务可以用于检测图像中包括的目标对象的轮廓信息。3D目标检测可以用于检测图像中包括的目标对象的三维检测框信息。视频分类的目标任务可以用于检测视频中包括的目标对象的类别。
其中,在神经网络结构用于执行多个目标任务的情况下,每个目标任务对应一个神经预测器。即可以为每个目标任务训练一个对应的神经预测器。
一种可选实施方式中,参见图3所示,可以根据下述步骤训练每个目标任务对应的神经预测器:
S301,确定由各个结构向量对应的神经网络结构所构成的搜索空间;
S302,从搜索空间中选取多个第一神经网络结构;其中,每个第一神经网络结构对应一个第一结构向量;
S303,利用目标任务对应的样本数据,对多个第一神经网络结构进行训练,得到训练后的多个第一神经网络结构对应的性能参数;
S304,基于多个第一神经网络结构对应的第一结构向量和性能参数,对目标任务对应的神经预测器进行训练,得到目标任务对应的训练后的神经预测器。
采用上述方法,通过从搜索空间中选取多个第一神经网络结构,利用目标任务对应的样本数据,对多个第一神经网络结构进行训练,得到训练后的多个第一神经网络结构对应的性能参数;由于多个神经网络结构对应的性能参数较为丰富,再使用多个第一神经网络结构对应的第一结构向量和性能参数,对目标任务对应的神经预测器进行训练,可以使得目标任务对应的训练后的神经预测器的准确率较高。
这里,搜索空间中包括多个结构向量分别对应的神经网络结构,即每个神经网络结构匹配一个结构向量。然后可以随机从搜索空间中选取多个第一神经网络结构,比如,可以随机从搜索空间中选取2500个第一神经网络结构。
获取目标任务对应的样本数据,比如,针对图像分类的目标任务,获取的样本数据可以为多帧样本图像,每帧样本图像上标注有目标对象的类别。
针对选取的多个第一神经网络结构中的每个第一神经网络结构,将获取的样本数据输入至该第一神经网络结构中,对该第一神经网络结构进行训练,直至该第一神经网络结构满足预设要求,比如,预设要求可以为准确率大于设置的准确率阈值;或者,损失值小于设置的损失阈值等。
进而,根据训练后的各个第一神经网络结构,可以得到训练后的每个第一神经网络结构的性能参数。其中,性能参数可以为表征第一神经网络结构的性能的任一参数,比如,针对图像分类的目标任务,性能参数可以为分类准确率、FLOPs、模型参数量等。针对语义分割的目标任务,性能参数可以为准确率、FLOPs、模型参数量、mIoU等。其中,性能参数可以根据实际需要进行选取。
选取的每个第一神经网络结构对应一个第一结构向量。将多个第一神经网络结构分别对应的第一结构向量和性能参数,输入至目标任务对应的神经预测器中,对目标任务对应的神经预测器进行训练,得到目标任务对应的训练后的神经预测器。其中,各个第一神经网络结构分别对应的第一结构向量和性能参数,可以视为目标任务对应的神经预测器的训练样本。
在神经网络结构用于执行的目标任务包括:图像分类、语义分割、三维3D目标检测、和视频分类时,可以得到图像分类的目标任务对应的训练后的第一神经预测器;可以得到语义分割的目标任务对应的训练后的第二神经预测器;可以得到3D目标检测的目标任务对应的训练后的第三神经预测器;可以得到视频分类的目标任务对应的训练后的第四神经预测器。
具体实施时,方式一中,可以对结构向量对应的神经网络结构进行一次调整,生成目标神经网络;方式二中,也可以对结构向量对应的神经网络结构进行多次调整,生成目标神经网络。
下述可以先针对方式一中对结构向量对应的神经网络结构进行一次调整,生成目标神经网络的过程进行具体说明。
一种可选实施方式中,S102中,基于训练后的神经预测器、和结构向量,确定结构向量对应的梯度向量,可以包括:
S1021,基于训练后的神经预测器、和结构向量,确定结构向量对应的神经网络结构的性能参数;
S1022,基于神经网络结构的性能参数、和设置的性能参数对应的目标值,确定神经网络结构的预测误差;
S1023,基于预测误差、和结构向量对应的神经网络结构,确定结构向量对应的梯度向量。
采用上述方法,通过确定结构向量对应的神经网络结构的预测误差,基于该预测误差和结构向量对应的神经网络结构,确定结构向量对应的梯度向量,该梯度向量可以表征神经网络结构的性能参数朝向目标值进行优化的调整信息,以便使得调整后结构向量对应的神经网络结构的性能参数可以达到设置的目标值。
在S1021中,结构向量可以为搜索空间中任一神经网络结构对应的结构向量。可以将结构向量输入至训练后的神经预测器中,确定结构向量对应的神经网络结构的性能参数。该性能参数为神经预测器的输出结果,该性能参数包括的信息可以根据实际需要进行确定,比如,性能参数可以包括准确率、模型参数量、FLOPs等。
在S1022中,神经网络结构的预测误差可以为神经网络结构的损失值,比如,该损失值可为L1范数损失、L2范数损失等。性能参数对应的目标值可以根据需要进行设置,比如,在性能参数为准确率时,性能参数对应的目标值可以为0.85、0.9等。在性能参数中包括多个不同的参数时,性能参数中的每个参数对应一个目标值,比如,性能参数包括分类准确率和FLOPs时,性能参数对应的目标值包括分类准确率对应的目标值、和FLOPs对应的目标值。
可以利用对应的损失函数,基于神经网络结构对应的性能参数和设置的性能参数对应的目标值,确定神经网络结构的预测误差(即损失值)。
具体实施时,在S1023中,可以使用梯度下降法结合反向传播算法,基于预测误差和结构向量对应的神经网络结构,确定结构向量对应的梯度向量。其中,梯度向量为用于表征结构向量对应的神经网络结构的调整信息。
这里,在神经网络结构执行的目标任务为一个时,比如,目标任务包括图像分类时,则将结构向量输入至该图像分类对应的神经预测器中,确定结构向量对应的神经网络结构在目标任务下的性能参数。进而可以得到结构向量在目标任务下的梯度向量。
一种可选实施方式中,在神经网络结构用于执行多个目标任务的情况下,基于训练后的神经预测器、和结构向量,确定结构向量对应的梯度向量,包括:
步骤一、针对每个目标任务,基于目标任务对应的训练后的神经预测器和结构向量,确定结构向量在目标任务下的中间梯度向量;
步骤二、基于结构向量在各个目标任务下的中间梯度向量,确定结构向量对应的梯度向量。
在步骤一中,在目标任务为多个时,可以分别基于S1021-S1023的步骤,确定多个目标任务中每个目标任务对应的中间梯度向量。
在步骤二中,可以将各个目标任务下的中间梯度向量相加,确定结构向量对应的梯度向量。
在得到梯度向量之后,可以基于梯度向量和结构向量,确定目标结构向量,再利用获取的样本数据,对目标结构向量对应的神经网络结构进行多轮训练,生成目标神经网络。即目标结构向量对应的神经网络结构,可以为目标神经网络的网络结构。
采用上述方法,在神经网络结构用于执行多个目标任务时,可以控制结构向量对应的神经网络结构进行多任务学习,使得得到的目标神经网络在执行每个目标任务时,能够得到较优的检测结果。
一种可选实施方式中,S103中,基于梯度向量、和结构向量,确定目标神经网络,可以包括:
S1031,利用梯度向量,对结构向量中的至少一个第一元素进行调整,生成调整后结构向量;
S1032,对调整后结构向量对应的目标神经网络结构进行神经网络训练,得到目标神经网络。
这里,可以通过确定待处理第一元素,对待处理第一元素进行调整,生成调整后结构向量,避免对结构向量中的多个第一元素进行调整时,造成结构向量的过度调整。
在S1031中,一种可选实施方式中,可以将梯度向量与结构向量相减,生成调整后结构向量。即利用梯度向量中的各个梯度值,对结构向量中的至少一个第一元素进行调整,生成调整后结构向量。
考虑到,生成的梯度向量中的梯度值存在为小数的情况,可以先将梯度向量进行四舍五入处理,利用处理后的梯度向量,对结构向量中的至少一个第一元素进行调整,生成调整后结构向量。
再或者,考虑到对第一元素调整后,调整后第一元素的值大于设置的最大值的情况,在利用梯度向量,对结构向量中的至少一个第一元素进行调整后,可以将大于最大值的第一元素的值调整为最大值,生成调整后结构向量。
在另一种可选实施方式中,S1031中,利用梯度向量,对结构向量中的至少一个第一元素进行调整,生成调整后结构向量,可以包括:
步骤一、确定结构向量对应的归一化向量;其中,归一化向量中的每个第二元素表征结构向量中对应结构参数信息的变化程度;
步骤二、利用归一化向量对梯度向量进行归一化处理,生成处理后的梯度向量;
步骤三、基于处理后的梯度向量,确定结构向量中的待处理第一元素;
步骤四、利用梯度向量指示的与待处理第一元素匹配的梯度值,对结构向量中待处理第一元素进行调整,生成调整后结构向量。
在步骤一中,可以根据下述步骤A1-A4,确定结构向量对应的归一化向量:
步骤A1,确定结构向量对应的神经网络结构的第一计算量;
步骤A2,针对结构向量中的每个第一元素,基于第一元素对应的基准值,调整结构向量中该第一元素的值,生成中间结构向量;
步骤A3,确定中间结构向量对应的神经网络结构的第二计算量;
步骤A4,基于第一计算量和第二计算量,生成归一化向量中与第一元素匹配的第二元素。
归一化向量与结构向量的维数相同,比如,结构向量为27维向量,则归一化向量也为27维向量。其中,归一化向量中每个第二元素表征结构向量中对应结构参数信息的变化程度。比如,归一化向量中的第一维的第二元素,用于表征结构向量中第一维的第一元素对应的结构参数信息的变化程度;归一化向量中的第二维的第二元素,用于表征结构向量中第二维的第一元素对应的结构参数信息的变化程度。
具体实施时,可以使用FLOPs表征神经网络结构的计算量。即确定结构向量对应的神经网络结构的第一FLOPs。
结构向量中每个第一元素对应一个预设的基准值,该基准值可以用于表征第一元素的调整基准,其中,该基准值可以根据第一元素对应的结构参数信息进行确定。比如,若第一元素A对应的结构参数信息为卷积层的数量,则第一元素A对应的基准值可以为1;若第一元素B对应的结构参数信息为卷积层的通道数时,则第一元素B对应的基准值可以为8等。
针对结构向量中的每个第一元素,可以将结构向量中的该第一元素与基准值相加或相减,生成中间结构向量;并确定中间结构向量对应的神经网络结构的第二计算量;进而,可以基于第一计算量和第二计算量,生成归一化向量中与第一元素匹配的第二元素。比如,可以将第一计算量与第二计算量相减,将得到的差值确定为归一化向量中与第一元素匹配的第二元素的值。
比如,若结构向量为{4,7,72},在确定结构向量{4,7,72}对应的神经网络结构的第一计算量A之后,可以针对第一维的第一元素,该第一元素对应的基准值为1,则生成的中间结构向量为{5,7,72};针对第二维的第一元素,该第一元素对应的基准值为2,则生成的中间结构向量为{4,9,72};针对第三维的第一元素,该第一元素对应的基准值为8,则生成的中间结构向量为{4,9,80}。
再可以确定中间结构向量为{5,7,72}对应的神经网络结构的第二计算量a;可以确定中间结构向量为{4,9,72}对应的神经网络结构的第二计算量b;可以确定中间结构向量为{4,9,80}对应的神经网络结构的第二计算量c。
进而可以基于第一计算量A与第二计算量a,生成归一化向量中第一维的第二元素r1;可以基于第一计算量A与第二计算量b,生成归一化向量中第二维的第二元素r2;可以基于第一计算量A与第二计算量c,生成归一化向量中第三维的第二元素r3,即生成的归一化向量为{r1,r2,r3}。
在步骤二中,梯度向量与结构向量和归一化向量的维数相同。可以将梯度向量中每个梯度值与归一化向量中对应的第二元素相除,生成处理后的梯度向量。比如,若梯度向量为归一化向量为{r1,r2,r3},则处理后的梯度向量为其中,为梯度向量的第一维的梯度值;为梯度向量的第二维的梯度值;为梯度向量的第三维的梯度值。r1为归一化向量中第一维的第二元素;r2为归一化向量中第二维的第二元素;r3为归一化向量中第三维的第二元素。
在步骤三中,可以基于处理后的梯度向量,确定结构向量中的待处理第一元素。具体实施时,在待处理第一元素为一个时,可以根据下述方式确定待处理第一元素:
方式一、若处理后的梯度向量中,存在负数时,该负数表征神经网络结构的调整方向为减少计算量的方向,则可以将该负数所处的维数,确定为目标维数,并将结构向量中的目标维数的第一元素,确定为待处理第一元素。比如,处理后的梯度向量中为负数,则该目标维数为第二维,将结构向量中第二维的第一元素确定为待处理第一元素。
方式二、若处理后的梯度向量中,存在多个负数时,可以将多个负数中的最小值对应的维数,确定为目标维数。将结构向量中的目标维数的第一元素,确定为待处理第一元素。
方式三、若处理后的梯度向量中,不存在负数时,可以将梯度向量中最大的梯度值对应的维数,确定为目标维数。将结构向量中的目标维数的第一元素,确定为待处理第一元素。
其中,待处理第一元素的数量、以及待处理第一元素的确定方式,可以根据需要将进行设置。比如,若待处理第一元素的数量为多个时,若处理后的梯度向量中,不存在负数时,可以将梯度向量中较大的多个梯度值对应的维数,确定为目标维数。将结构向量中的目标维数的第一元素,确定为待处理第一元素。
在S1032中,可以使用样本数据,对调整后结构向量对应的目标神经网络结构进行多轮神经网络训练,直至训练后的目标神经网络结构的性能满足性能要求,得到目标神经网络。
下述可以再对结构向量对应的神经网络结构进行多次调整,生成目标神经网络的过成进行具体说明。
一种可选实施方式中,基于训练后的神经预测器、和结构向量,确定结构向量对应的梯度向量,包括步骤B1-B3:
步骤B1、从表征神经网络结构的多个结构向量中选取第一结构向量,将选取的第一结构向量确定为待检测结构向量;
步骤B2、基于训练后的神经预测器、和待检测结构向量,确定待检测结构向量对应的待检测神经网络结构的性能参数;
步骤B3、基于待检测神经网络结构的性能参数、待检测结构向量对应的待检测神经网络结构,确定待检测结构向量的梯度向量。
实施时,可以随机从表征神经网络结构的多个结构向量中选取一个第一结构向量,将选取的第一结构向量确定为待检测结构向量。将待检测结构向量输入至训练后的神经预测器中,确定待检测结构向量对应的待检测神经网络结构的性能参数。确定待检测结构向量对应的待检测神经网络结构的性能参数的过程与S1021的过程相同,此处不再赘述。
一种可选实施方式中,步骤B3中,基于待检测神经网络结构的性能参数、待检测结构向量对应的待检测神经网络结构,确定待检测结构向量的梯度向量,包括:
步骤一、基于待检测神经网络结构的性能参数,确定待检测神经网络结构的预测误差;
步骤二、基于预测误差、和待检测结构向量对应的待检测神经网络结构,确定待检测结构向量的梯度向量。
可以基于待检测神经网络结构的性能参数,确定性能参数的中间目标值,再可以利用设置的损失函数,基于待检测神经网络结构的性能参数、和确定的中间目标值,确定待检测神经网络结构的预测误差(比如可以为损失值)。比如,性能参数的类型为分类准确率和FLOPs时,若待检测神经网络结构的性能参数为分类准确率为0.75,FLOPs为5G;则确定的性能参数的中间目标值可以为分类准确率为0.85,FLOPs为4G。
再可以使用梯度下降法和反向传播算法,基于预测误差、和待检测结构向量对应的待检测神经网络结构,确定待检测结构向量的梯度向量。
在得到待检测结构向量的梯度向量之后,还可以包括:
步骤B4、基于待检测结构向量对应的梯度向量、和待检测结构向量,确定中间结构向量;
步骤B5、将中间结构向量确定为新的待检测结构向量,返回至步骤B2,直至满足预设的截止条件;
步骤B6、将满足预设截止条件时的中间结构向量对应的神经网络结构,确定为目标神经网络结构;
步骤B7、对目标神经网络结构进行神经网络训练,确定目标神经网络。
在步骤B4中,可以参考S1031的过程生成中间结构向量,比如,可以基于梯度向量对待检测结构向量中的每个第一元素进行调整,生成中间结构向量;比如,若待检测结构向量为{ed1,ed2,ed3},梯度向量为 则生成的中间结构向量为
或者,也可以确定待检测结构向量中待检测第一元素,利用梯度向量中与待检测第一元素匹配的梯度值,对待检测第一元素进行调整,对待检测结构向量中除待检测第一元素之外的其他第一元素不进行调整,生成中间结构向量。比如,若待检测结构向量为{ed1,ed2,ed3},梯度向量为待处理第一元素为e2时,则可以使用对e2进行调整,待检测结构向量中除待处理第一元素之外的其他第一元素不进行调整,生成中间结构向量,即中间结构向量为
在步骤B5中,预设的截止条件包括以下至少一种:一、迭代次数达到设置的次数阈值;二、生成的中间结构向量对应的神经网络结构的准确率大于设置的准确率阈值;三、生成的中间结构向量对应的神经网络结构的运算要求满足设置的运算约束条件;比如,运算约束条件可以为FLOPs的值小于设置的运算阈值;或者,模型参数量小于设置的参数量阈值等。这里,设置多种截止条件,可以提升确定目标神经网络的灵活性和准确性。
在不满足预设的截止条件时,可以将中间结构向量确定为新的待检测结构向量,返回至执行步骤B2基于训练后的神经预测器、和待检测结构向量,确定待检测结构向量对应的待检测神经网络结构的性能参数。
在步骤B6和B7中,可以将满足预设截止条件时的中间结构向量对应的神经网络结构,确定为目标神经网络结构;并利用样本数据,训练目标神经网络结构,确定目标神经网络。
在步骤B1-B3中包括一个目标任务和多个目标任务的情况,具体的一个目标任务和多个目标任务的情况,可参考前述对一个目标任务和多个目标任务的具体说明,此处不再具体说明。
采用上述方法,可以为通过多次迭代的方式,循序渐进的调整结构向量对应的神经网络结构,较准确的确定较优的目标神经网络结构。
考虑到在实际应用中存在的目标任务的迁移学习的情况,即假设神经网络结构A可以对图像分类的目标任务有较好的检测,若想要神经网络结构A对语义分割的目标任务有较好的检测时,可以进行神经网络结构A进行目标任务的迁移学习。
一种可选实施方式中,在神经网络结构用于执行多个目标任务的情况下,基于梯度向量、和结构向量,确定目标神经网络,包括:基于多个目标任务中第一目标任务对应的梯度向量、和第一目标任务对应的结构向量,确定第一目标任务对应的第一目标神经网络;
该方法还包括:
步骤一、将第一目标神经网络的神经网络结构对应的结构向量,作为多个目标任务中第二目标任务对应的结构向量;
步骤二、基于第二目标任务对应的训练后的神经预测器、和第二目标任务对应的结构向量,确定第二目标任务对应的梯度向量;
步骤三、基于第二目标任务对应的梯度向量、和第二目标任务对应的结构向量,确定第二目标任务对应的第二目标神经网络。
在神经网络结构用于执行多个目标任务时,可以使用S101-S103的步骤,确定多个目标任务中第一目标任务对应的第一目标神经网络。
再可以将第一目标神经网络的神经网络结构对应的结构向量,确定为多个目标任务中第二目标任务对应的结构向量。并利用第二目标任务对应的训练后的神经预测器和第二目标任务对应的结构向量,确定第二目标任务对应的结构向量的神经网络结构的预测误差;使用反向传播算法和梯度下降法,基于第二目标任务对应的结构向量的神经网络结构的预测误差,确定第二目标任务对应的梯度向量。
进而,基于第二目标任务对应的梯度向量、和第二目标任务对应的结构向量,确定第二目标任务对应的目标神经网络结构;对第二目标任务对应的目标神经网络结构进行多轮神经网络训练,确定第二目标任务对应的第二目标神经网络。
采用上述方法,在神经网络结构能够用于执行多个目标任务时,可以控制结构向量对应的神经网络结构进行任务迁移学习,即控制神经网络结构从在执行目标任务A时能够得到较准确的检测结果,变换为在执行目标任务B时能够得到较准确的检测结果,提高得到的目标神经网络的利用率。
参见图4所示,本公开实施例还提供一种数据处理方法,包括:
S401,获取待处理数据;所述待处理数据包括:待处理图像、和/或待处理视频;
S402,利用第一神经网络,对所述待处理数据进行处理,得到所述待处理数据的数据处理结果;其中,所述第一神经网络包括基于上述实施例所述的神经网络生成方法生成的目标神经网络。
示例性的,对待处理数据的处理包括:人脸识别、物体检测、图像分类、视频分类以及语义分割中至少一种。这里,人脸识别例如包括:人脸关键点识别、人脸情绪识别、人脸属性(如年龄、性别等)识别,活体检测中至少一种。物体检测例如包括:物体位置检测、物体类别检测中至少一种。物体检测可以为三维目标检测。
本公开实施例提供的数据处理方法,使用了基于本公开任一实施例提供的神经网络生成方法生成的目标神经网络来对待处理数据进行处理,由于所生成的目标神经网络具有更好的性能,因此所得到的数据处理结果具有更高的准确度。
参见图5所示,本公开实施例还提供一种智能行驶控制方法,包括:
S501,获取行驶装置在行驶过程中采集的图像、或视频;
S502,利用第二神经网络,检测所述图像或者视频中的目标对象;其中,所述第二神经网络包括上述任一实施例所述的神经网络生成方法生成的目标神经网络;
S503,基于检测的所述目标对象,控制所述行驶装置。
在具体实施中,行驶装置例如但不限于下述任一种:自动驾驶车辆、装有高级驾驶辅助系统(Advanced Driving Assistance System,ADAS)的车辆、或者机器人等。目标对象可以包括行人、车辆、交通道路路标等。控制行驶装置,例如包括控制行驶装置加速、减速、转向、制动等,或者可以播放语音提示信息,以提示驾驶员控制行驶装置加速、减速、转向、制动等。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于相同的构思,本公开实施例还提供了一种神经网络生成装置,参见图6所示,为本公开实施例提供的神经网络生成装置的架构示意图,包括第一确定模块601、第二确定模块602、第三确定模块603,具体的:
第一确定模块601,用于确定表征神经网络结构的结构向量;
第二确定模块602,用于基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量;其中,所述神经预测器用于预测所述结构向量对应的神经网络结构的性能;所述梯度向量用于表征所述结构向量对应的神经网络结构的调整信息;
第三确定模块603,用于基于所述梯度向量、和所述结构向量,确定目标神经网络。
一种可能的实施方式中,所述第二确定模块602,在基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量时,用于:
基于所述训练后的神经预测器、和所述结构向量,确定所述结构向量对应的神经网络结构的性能参数;
基于所述神经网络结构的性能参数、和设置的所述性能参数对应的目标值,确定所述神经网络结构的预测误差;
基于所述预测误差、和所述结构向量对应的神经网络结构,确定所述结构向量对应的梯度向量。
一种可能的实施方式中,所述结构向量中包括至少一个第一元素,每个第一元素对应所述神经网络结构的一个结构参数信息,所述第三确定模块603,在基于所述梯度向量、和所述结构向量,确定目标神经网络时,用于:利用所述梯度向量,对所述结构向量中的至少一个第一元素进行调整,生成调整后结构向量;
对所述调整后结构向量对应的目标神经网络结构进行神经网络训练,得到所述目标神经网络。
一种可能的实施方式中,所述第三确定模块603,在利用所述梯度向量,对所述结构向量中的至少一个第一元素进行调整,生成调整后结构向量时,用于:确定所述结构向量对应的归一化向量;其中,所述归一化向量中的每个第二元素表征所述结构向量中对应结构参数信息的变化程度;
利用所述归一化向量对所述梯度向量进行归一化处理,生成处理后的梯度向量;
基于所述处理后的梯度向量,确定所述结构向量中的待处理第一元素;
利用所述梯度向量指示的与所述待处理第一元素匹配的梯度值,对所述结构向量中待处理第一元素进行调整,生成调整后结构向量。
一种可能的实施方式中,所述第三确定模块603,在确定所述结构向量对应的归一化向量时,用于:
确定所述结构向量对应的神经网络结构的第一计算量;
针对所述结构向量中的每个第一元素,基于所述第一元素对应的基准值,调整所述结构向量中所述第一元素的值,生成中间结构向量;
确定所述中间结构向量对应的神经网络结构的第二计算量;
基于所述第一计算量和所述第二计算量,生成所述归一化向量中与所述第一元素匹配的第二元素。
一种可能的实施方式中,所述第二确定模块602,在基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量时,用于:
从表征神经网络结构的多个结构向量中选取第一结构向量,将选取的所述第一结构向量确定为待检测结构向量;
基于所述训练后的神经预测器、和所述待检测结构向量,确定所述待检测结构向量对应的待检测神经网络结构的性能参数;
基于所述待检测神经网络结构的性能参数、所述待检测结构向量对应的待检测神经网络结构,确定所述待检测结构向量的梯度向量。
一种可能的实施方式中,所述第二确定模块602,在基于所述待检测神经网络结构的性能参数、所述待检测结构向量对应的待检测神经网络结构,确定所述待检测结构向量的梯度向量时,用于:
基于所述待检测神经网络结构的性能参数,确定所述待检测神经网络结构的预测误差;
基于所述预测误差、和所述待检测结构向量对应的待检测神经网络结构,确定所述待检测结构向量的梯度向量。
一种可能的实施方式中,所述第三确定模块603,在基于所述梯度向量、和所述结构向量,确定目标神经网络时,用于:
基于所述待检测结构向量对应的梯度向量、和所述待检测结构向量,确定中间结构向量;
将所述中间结构向量确定为新的待检测结构向量,返回至基于所述训练后的神经预测器、和所述待检测结构向量,确定所述待检测结构向量对应的待检测神经网络结构的性能参数的步骤,直至满足预设的截止条件;
将满足预设截止条件时的所述中间结构向量对应的神经网络结构,确定为目标神经网络结构;
对所述目标神经网络结构进行神经网络训练,确定所述目标神经网络。
一种可能的实施方式中,所述预设的截止条件包括以下至少一种:迭代次数达到设置的次数阈值;生成的中间结构向量对应的神经网络结构的准确率大于设置的准确率阈值;生成的中间结构向量对应的神经网络结构的运算要求满足设置的运算约束条件。
一种可能的实施方式中,所述神经网络结构用于执行以下目标任务中的一个或多个:图像分类、语义分割、三维3D目标检测、视频分类;
在所述神经网络结构用于执行多个目标任务的情况下,每个目标任务对应一个神经预测器。
一种可能的实施方式中,所述装置还包括训练模块604,用于根据下述步骤训练每个目标任务对应的神经预测器:
确定由各个所述结构向量对应的神经网络结构所构成的搜索空间;
从所述搜索空间中选取多个第一神经网络结构;其中,每个所述第一神经网络结构对应一个第一结构向量;
利用所述目标任务对应的样本数据,对所述多个第一神经网络结构进行训练,得到训练后的所述多个第一神经网络结构对应的性能参数;
基于所述多个第一神经网络结构对应的第一结构向量和所述性能参数,对所述目标任务对应的神经预测器进行训练,得到所述目标任务对应的训练后的神经预测器。
一种可能的实施方式中,在所述神经网络结构用于执行多个目标任务的情况下,所述第二确定模块602,在基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量时,用于:
针对每个目标任务,基于所述目标任务对应的训练后的神经预测器和所述结构向量,确定所述结构向量在所述目标任务下的中间梯度向量;
基于所述结构向量在各个目标任务下的中间梯度向量,确定所述结构向量对应的梯度向量。
一种可能的实施方式中,在所述神经网络结构用于执行多个目标任务的情况下,所述第三确定模块603,在基于所述梯度向量、和所述结构向量,确定目标神经网络时,用于:基于所述多个目标任务中第一目标任务对应的梯度向量、和所述第一目标任务对应的结构向量,确定所述第一目标任务对应的第一目标神经网络;
所述装置还包括:迁移学习模块605,用于:将所述第一目标神经网络的神经网络结构对应的结构向量,作为所述多个目标任务中第二目标任务对应的结构向量;
基于所述第二目标任务对应的训练后的神经预测器、和所述第二目标任务对应的结构向量,确定所述第二目标任务对应的梯度向量;
基于所述第二目标任务对应的梯度向量、和所述第二目标任务对应的结构向量,确定所述第二目标任务对应的第二目标神经网络。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模板可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
基于相同的构思,本公开实施例还提供了一种数据处理装置,参见图7所示,为本公开实施例提供的数据处理装置的架构示意图,包括第一获取模块701、处理模块702,具体的:
第一获取模块701,用于获取待处理数据;所述待处理数据包括:待处理图像、和/或待处理视频;
处理模块702,用于利用第一神经网络,对所述待处理数据进行处理,得到所述待处理数据的数据处理结果;其中,所述第一神经网络包括基于上述实施例所述的神经网络生成方法生成的目标神经网络。
基于相同的构思,本公开实施例还提供了一种智能行驶控制装置,参见图8所示,为本公开实施例提供的智能行驶控制装置的架构示意图,包括第二获取模块801、检测模块802、控制模块803,具体的:
第二获取模块801,用于获取行驶装置在行驶过程中采集的图像、或视频;
检测模块802,用于利用第二神经网络,检测所述图像或者视频中的目标对象;其中,所述第二神经网络包括基于上述实施例所述的神经网络生成方法生成的目标神经网络;
控制模块803,用于基于检测的所述目标对象,控制所述行驶装置。
基于同一技术构思,本公开实施例还提供了一种电子设备。参照图9所示,为本公开实施例提供的电子设备的结构示意图,包括处理器901、存储器902、和总线903。其中,存储器902用于存储执行指令,包括内存9021和外部存储器9022;这里的内存9021也称内存储器,用于暂时存放处理器901中的运算数据,以及与硬盘等外部存储器9022交换的数据,处理器901通过内存9021与外部存储器9022进行数据交换,当电子设备900运行时,处理器901与存储器902之间通过总线903通信,使得处理器901在执行以下指令:
确定表征神经网络结构的结构向量;
基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量;其中,所述神经预测器用于预测所述结构向量对应的神经网络结构的性能;所述梯度向量用于表征所述结构向量对应的神经网络结构的调整信息;
基于所述梯度向量、和所述结构向量,确定目标神经网络。
基于同一技术构思,本公开实施例还提供了一种电子设备。参照图10所示,为本公开实施例提供的电子设备的结构示意图,包括处理器1001、存储器1002、和总线1003。其中,存储器1002用于存储执行指令,包括内存10021和外部存储器10022;这里的内存10021也称内存储器,用于暂时存放处理器1001中的运算数据,以及与硬盘等外部存储器10022交换的数据,处理器1001通过内存10021与外部存储器10022进行数据交换,当电子设备1000运行时,处理器1001与存储器1002之间通过总线1003通信,使得处理器1001在执行以下指令:
获取待处理数据;所述待处理数据包括:待处理图像和/或待处理视频;
利用第一神经网络,对所述待处理数据进行处理,得到所述待处理数据的数据处理结果;其中,所述第一神经网络包括基于上述实施例所述的神经网络生成方法生成的目标神经网络。
基于同一技术构思,本公开实施例还提供了一种电子设备。参照图11所示,为本公开实施例提供的电子设备的结构示意图,包括处理器1101、存储器1102、和总线1103。其中,存储器1102用于存储执行指令,包括内存11021和外部存储器11022;这里的内存11021也称内存储器,用于暂时存放处理器1101中的运算数据,以及与硬盘等外部存储器11022交换的数据,处理器1101通过内存11021与外部存储器11022进行数据交换,当电子设备1100运行时,处理器1101与存储器1102之间通过总线1103通信,使得处理器1101在执行以下指令:
获取行驶装置在行驶过程中采集的图像、或视频;
利用第二神经网络,检测所述图像或者视频中的目标对象;其中,所述第二神经网络包括基于上述实施例所述的神经网络生成方法生成的目标神经网络;
基于检测的所述目标对象,控制所述行驶装置。
此外,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的神经网络生成方法、或数据处理方法、或智能行驶控制方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的神经网络生成方法、数据处理方法、或智能行驶控制方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (20)
1.一种神经网络生成方法,其特征在于,包括:
确定表征神经网络结构的结构向量;
基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量;其中,所述神经预测器用于预测所述结构向量对应的神经网络结构的性能;所述梯度向量用于表征所述结构向量对应的神经网络结构的调整信息;
基于所述梯度向量、和所述结构向量,确定目标神经网络。
2.根据权利要求1所述的方法,其特征在于,所述基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量,包括:
基于所述训练后的神经预测器、和所述结构向量,确定所述结构向量对应的神经网络结构的性能参数;
基于所述神经网络结构的性能参数、和设置的所述性能参数对应的目标值,确定所述神经网络结构的预测误差;
基于所述预测误差、和所述结构向量对应的神经网络结构,确定所述结构向量对应的梯度向量。
3.根据权利要求1所述的方法,其特征在于,所述基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量,包括:
从表征神经网络结构的多个结构向量中选取第一结构向量,将选取的所述第一结构向量确定为待检测结构向量;
基于所述训练后的神经预测器、和所述待检测结构向量,确定所述待检测结构向量对应的待检测神经网络结构的性能参数;
基于所述待检测神经网络结构的性能参数、所述待检测结构向量对应的待检测神经网络结构,确定所述待检测结构向量的梯度向量。
4.根据权利要求3所述的方法,其特征在于,所述基于所述待检测神经网络结构的性能参数、所述待检测结构向量对应的待检测神经网络结构,确定所述待检测结构向量的梯度向量,包括:
基于所述待检测神经网络结构的性能参数,确定所述待检测神经网络结构的预测误差;
基于所述预测误差、和所述待检测结构向量对应的待检测神经网络结构,确定所述待检测结构向量的梯度向量。
5.根据权利要求3或4所述的方法,其特征在于,所述基于所述梯度向量、和所述结构向量,确定目标神经网络,包括:
基于所述待检测结构向量对应的梯度向量、和所述待检测结构向量,确定中间结构向量;
将所述中间结构向量确定为新的待检测结构向量,返回至基于所述训练后的神经预测器、和所述待检测结构向量,确定所述待检测结构向量对应的待检测神经网络结构的性能参数的步骤,直至满足预设的截止条件;
将满足预设截止条件时的所述中间结构向量对应的神经网络结构,确定为目标神经网络结构;
对所述目标神经网络结构进行神经网络训练,确定所述目标神经网络。
6.根据权利要求5所述的方法,其特征在于,所述预设的截止条件包括以下至少一种:
迭代次数达到设置的次数阈值;
生成的中间结构向量对应的神经网络结构的准确率大于设置的准确率阈值;
生成的中间结构向量对应的神经网络结构的运算要求满足设置的运算约束条件。
7.根据权利要求1~6任一所述的方法,其特征在于,所述结构向量中包括至少一个第一元素,每个第一元素对应所述神经网络结构的一个结构参数信息,所述基于所述梯度向量、和所述结构向量,确定目标神经网络,包括:
利用所述梯度向量,对所述结构向量中的至少一个第一元素进行调整,生成调整后结构向量;
对所述调整后结构向量对应的目标神经网络结构进行神经网络训练,得到所述目标神经网络。
8.根据权利要求7所述的方法,其特征在于,利用所述梯度向量,对所述结构向量中的至少一个第一元素进行调整,生成调整后结构向量,包括:
确定所述结构向量对应的归一化向量;其中,所述归一化向量中的每个第二元素表征所述结构向量中对应结构参数信息的变化程度;
利用所述归一化向量对所述梯度向量进行归一化处理,生成处理后的梯度向量;
基于所述处理后的梯度向量,确定所述结构向量中的待处理第一元素;
利用所述梯度向量指示的与所述待处理第一元素匹配的梯度值,对所述结构向量中待处理第一元素进行调整,生成调整后结构向量。
9.根据权利要求8所述的方法,其特征在于,所述确定所述结构向量对应的归一化向量,包括:
确定所述结构向量对应的神经网络结构的第一计算量;
针对所述结构向量中的每个第一元素,基于所述第一元素对应的基准值,调整所述结构向量中所述第一元素的值,生成中间结构向量;
确定所述中间结构向量对应的神经网络结构的第二计算量;
基于所述第一计算量和所述第二计算量,生成所述归一化向量中与所述第一元素匹配的第二元素。
10.根据权利要求1~9任一所述的方法,其特征在于,在所述神经网络结构用于执行多个目标任务的情况下,所述基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量,包括:
针对每个目标任务,基于所述目标任务对应的训练后的神经预测器和所述结构向量,确定所述结构向量在所述目标任务下的中间梯度向量;
基于所述结构向量在各个目标任务下的中间梯度向量,确定所述结构向量对应的梯度向量。
11.根据权利要求1~9任一所述的方法,其特征在于,在所述神经网络结构用于执行多个目标任务的情况下,所述基于所述梯度向量、和所述结构向量,确定目标神经网络,包括:
基于所述多个目标任务中第一目标任务对应的梯度向量、和所述第一目标任务对应的结构向量,确定所述第一目标任务对应的第一目标神经网络;
所述方法还包括:
将所述第一目标神经网络的神经网络结构对应的结构向量,作为所述多个目标任务中第二目标任务对应的结构向量;
基于所述第二目标任务对应的训练后的神经预测器、和所述第二目标任务对应的结构向量,确定所述第二目标任务对应的梯度向量;
基于所述第二目标任务对应的梯度向量、和所述第二目标任务对应的结构向量,确定所述第二目标任务对应的第二目标神经网络。
12.根据权利要求1~11任一所述的方法,其特征在于,所述神经网络结构用于执行以下目标任务中的一个或多个:
图像分类、语义分割、三维3D目标检测、视频分类;
在所述神经网络结构用于执行多个目标任务的情况下,每个目标任务对应一个神经预测器。
13.根据权利要求12所述的方法,其特征在于,根据下述步骤训练每个目标任务对应的神经预测器:
确定由各个所述结构向量对应的神经网络结构所构成的搜索空间;
从所述搜索空间中选取多个第一神经网络结构;其中,每个所述第一神经网络结构对应一个第一结构向量;
利用所述目标任务对应的样本数据,对所述多个第一神经网络结构进行训练,得到训练后的所述多个第一神经网络结构对应的性能参数;
基于所述多个第一神经网络结构对应的第一结构向量和所述性能参数,对所述目标任务对应的神经预测器进行训练,得到所述目标任务对应的训练后的神经预测器。
14.一种数据处理方法,其特征在于,包括:
获取待处理数据;所述待处理数据包括:待处理图像、和/或待处理视频;
利用第一神经网络,对所述待处理数据进行处理,得到所述待处理数据的数据处理结果;其中,所述第一神经网络包括基于权利要求1-13任一项所述的神经网络生成方法生成的目标神经网络。
15.一种智能行驶控制方法,其特征在于,包括:
获取行驶装置在行驶过程中采集的图像、或视频;
利用第二神经网络,检测所述图像或者视频中的目标对象;其中,所述第二神经网络包括基于权利要求1-13任一项所述的神经网络生成方法生成的目标神经网络;
基于检测的所述目标对象,控制所述行驶装置。
16.一种神经网络生成装置,其特征在于,包括:
第一确定模块,用于确定表征神经网络结构的结构向量;
第二确定模块,用于基于训练后的神经预测器、和所述结构向量,确定所述结构向量对应的梯度向量;其中,所述神经预测器用于预测所述结构向量对应的神经网络结构的性能;所述梯度向量用于表征所述结构向量对应的神经网络结构的调整信息;
第三确定模块,用于基于所述梯度向量、和所述结构向量,确定目标神经网络。
17.一种数据处理装置,其特征在于,包括:
第一获取模块,用于获取待处理数据;所述待处理数据包括:待处理图像、和/或待处理视频;
处理模块,用于利用第一神经网络,对所述待处理数据进行处理,得到所述待处理数据的数据处理结果;其中,所述第一神经网络包括基于权利要求1-13任一项所述的神经网络生成方法生成的目标神经网络。
18.一种智能行驶控制装置,其特征在于,包括:
第二获取模块,用于获取行驶装置在行驶过程中采集的图像、或视频;
检测模块,用于利用第二神经网络,检测所述图像或者视频中的目标对象;其中,所述第二神经网络包括基于权利要求1-13任一项所述的神经网络生成方法生成的目标神经网络;
控制模块,用于基于检测的所述目标对象,控制所述行驶装置。
19.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至13任一所述的神经网络生成方法的步骤;或执行如权利要求14所述的数据处理方法的步骤;或执行如权利要求15所述的智能行驶控制方法的步骤。
20.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至13任一所述的神经网络生成方法的步骤;或执行如权利要求14所述的数据处理方法的步骤;或执行如权利要求15所述的智能行驶控制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110215347.8A CN112949827B (zh) | 2021-02-25 | 2021-02-25 | 神经网络生成、数据处理、智能行驶控制方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110215347.8A CN112949827B (zh) | 2021-02-25 | 2021-02-25 | 神经网络生成、数据处理、智能行驶控制方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112949827A true CN112949827A (zh) | 2021-06-11 |
CN112949827B CN112949827B (zh) | 2024-05-21 |
Family
ID=76246346
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110215347.8A Active CN112949827B (zh) | 2021-02-25 | 2021-02-25 | 神经网络生成、数据处理、智能行驶控制方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112949827B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019082165A1 (en) * | 2017-10-26 | 2019-05-02 | Uber Technologies, Inc. | GENERATION OF NEURAL NETWORKS WITH COMPRESSED REPRESENTATION HAVING A HIGH DEGREE OF PRECISION |
CN110364232A (zh) * | 2019-07-08 | 2019-10-22 | 河海大学 | 一种基于忆阻器-梯度下降法神经网络的高性能混凝土强度预测方法 |
CN111340223A (zh) * | 2020-02-27 | 2020-06-26 | 上海商汤临港智能科技有限公司 | 神经网络压缩、目标检测、行驶控制方法以及装置 |
WO2020221200A1 (zh) * | 2019-04-28 | 2020-11-05 | 华为技术有限公司 | 神经网络的构建方法、图像处理方法及装置 |
CN112052950A (zh) * | 2020-08-24 | 2020-12-08 | 北京达佳互联信息技术有限公司 | 神经网络训练方法、模型计算服务器及存储介质 |
-
2021
- 2021-02-25 CN CN202110215347.8A patent/CN112949827B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019082165A1 (en) * | 2017-10-26 | 2019-05-02 | Uber Technologies, Inc. | GENERATION OF NEURAL NETWORKS WITH COMPRESSED REPRESENTATION HAVING A HIGH DEGREE OF PRECISION |
WO2020221200A1 (zh) * | 2019-04-28 | 2020-11-05 | 华为技术有限公司 | 神经网络的构建方法、图像处理方法及装置 |
CN110364232A (zh) * | 2019-07-08 | 2019-10-22 | 河海大学 | 一种基于忆阻器-梯度下降法神经网络的高性能混凝土强度预测方法 |
CN111340223A (zh) * | 2020-02-27 | 2020-06-26 | 上海商汤临港智能科技有限公司 | 神经网络压缩、目标检测、行驶控制方法以及装置 |
CN112052950A (zh) * | 2020-08-24 | 2020-12-08 | 北京达佳互联信息技术有限公司 | 神经网络训练方法、模型计算服务器及存储介质 |
Non-Patent Citations (1)
Title |
---|
卞伟伟;邱旭阳;申研;: "基于神经网络结构搜索的目标识别方法", 空军工程大学学报(自然科学版), no. 04 * |
Also Published As
Publication number | Publication date |
---|---|
CN112949827B (zh) | 2024-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3380939B1 (en) | Adaptive artificial neural network selection techniques | |
Zhao et al. | Where are you heading? dynamic trajectory prediction with expert goal examples | |
US20180181858A1 (en) | Convolutional neural network (cnn) processing method and apparatus | |
CN111079780B (zh) | 空间图卷积网络的训练方法、电子设备及存储介质 | |
CN113570029A (zh) | 获取神经网络模型的方法、图像处理方法及装置 | |
CN111797983A (zh) | 一种神经网络构建方法以及装置 | |
EP3251058A1 (en) | Hyper-parameter selection for deep convolutional networks | |
CN110880034B (zh) | 使用卷积神经网络的计算装置及其操作方法 | |
CN111382868A (zh) | 神经网络结构搜索方法和神经网络结构搜索装置 | |
GB2574372A (en) | Implementing Traditional Computer Vision Algorithmis As Neural Networks | |
CN112381227B (zh) | 神经网络生成方法、装置、电子设备及存储介质 | |
CN113011364B (zh) | 神经网络训练、目标对象检测、行驶控制方法及装置 | |
CN113033364A (zh) | 轨迹预测、行驶控制方法、装置、电子设备及存储介质 | |
CN115147598A (zh) | 目标检测分割方法、装置、智能终端及存储介质 | |
CN112926461B (zh) | 神经网络训练、行驶控制方法及装置 | |
CN114119991A (zh) | 一种目标检测的方法、装置、电子设备及存储介质 | |
CN115601692A (zh) | 数据处理方法、神经网络模型的训练方法及装置 | |
CN111310821A (zh) | 多视图特征融合方法、系统、计算机设备及存储介质 | |
KR20210090249A (ko) | 이미지 처리 방법, 장치, 차량 탑재 연산 플랫폼, 전자 디바이스 및 시스템 | |
CN114612774A (zh) | 目标检测及其模型构建方法、电子设备和存储介质 | |
CN113393494A (zh) | 模型训练及目标跟踪方法、装置、电子设备和存储介质 | |
CN110728359B (zh) | 搜索模型结构的方法、装置、设备和存储介质 | |
CN111325328A (zh) | 神经网络的生成方法、数据处理方法及装置 | |
CN112949827A (zh) | 神经网络生成、数据处理、智能行驶控制方法及装置 | |
CN111325343B (zh) | 神经网络的确定、目标检测、智能行驶控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |