WO2021204227A1

WO2021204227A1 - 用于神经网络训练和智能分析的处理资源配置方法和装置

Info

Publication number: WO2021204227A1
Application number: PCT/CN2021/086051
Authority: WO
Inventors: 浦世亮; 徐习明; 郭阶添
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2020-04-09
Filing date: 2021-04-09
Publication date: 2021-10-14
Also published as: CN111752703A; CN111752703B

Abstract

一种用于神经网络训练和智能分析的处理资源配置方法，该方法包括，在神经网络模型的智能分析使用当前处理资源的任意时间，判断是否满足触发逻辑，如果满足触发逻辑，则基于当前空闲的处理资源，为待更新神经网络模型配置训练所需的处理资源，基于当前空闲的处理资源，执行待更新神经网络模型的训练。其实现了神经网络模型的智能分析和训练的一体化，并且，在确保神经网络模型优先完成应用智能分析的情形下，最大化地利用了硬件资源来进行训练，实现了处理资源在智能分析和训练之间的弹性配置，提高了神经网络模型的自主升级应用的便利。

Description

用于神经网络训练和智能分析的处理资源配置方法和装置

本申请要求于2020年04月09日提交中国专利局、申请号为202010272345.8发明名称为“用于神经网络训练和智能分析的处理资源配置方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及视频监控分析领域，尤其涉及一种用于神经网络训练和智能分析的处理资源配置方法。

背景技术

经过训练的神经网络可以将其所学应用于数字世界的任务——例如：识别图像、口语词、血液疾病，或者向某人推荐她/他接下来可能要购买的鞋子等各种各样的应用。这种更快更高效的神经网络可以基于其训练成果对其所获得的新数据进行“推导”，在人工智能领域，这个过程被称为推理，也称为智能分析。

随着人工智能技术的发展，越来越多的神经网络模型也被应用于视频监控和分析中。

目前视频分析领域中，通常是将搜集的样本数据在第一硬件设备上对神经网络模型进行训练，然后再将训练好的神经网络模型移植到实际需要应用的第二设备上，以使得训练后的神经网络模型通过智能分析得以实现应用功能，这种方式实际上是离线训练神经网络模型，在线部署神经网络模型进行智能分析，神经网络模型的训练和智能分析的部署在不同的硬件设备上实现，这对于用于实时在线智能分析的神经网络模型应用的维护和升级都带来不便。

发明内容

本申请提供了一种用于神经网络训练和智能分析的处理资源配置方法，以实现神经网络模型的训练和智能分析一体化。具体技术方案如下：

第一方面，本申请实施例提供了一种用于神经网络训练和智能分析的处理资源配置方法，该方法包括：

在神经网络模型进行智能分析使用当前处理资源的任意时间，判断是否满足触发逻辑；

如果满足触发逻辑，则根据当前处理资源进行资源评估，确定当前空闲的处理资源；

基于当前空闲的处理资源，为待更新神经网络模型配置训练所需的处理资源；

基于训练所需的处理资源，对待更新神经网络模型进行训练。

可选的，所述触发逻辑至少包括如下之一：

当前前景运动分析满足设定的触发事件，

当前时间到达符合设定的对待更新定神经网络模型启动训练的第一时间，所述当前时间包括，基于系统时间确定的绝对时间，或，基于计时设定的相对时间，

当前空闲处理资源的资源量达到设定的对待更新神经网络模型启动训练的第一阈值；

该方法进一步包括，

在待更新神经网络模型的训练使用当前处理资源的任意时间，如果不满足触发逻辑，则存储当前训练中的待更新神经网络模型，暂停训练线程，启动神经网络模型的智能分析。

可选的，所述基于当前空闲的处理资源，执行待更新神经网络模型的训练，包括，

加载待更新神经网络模型、训练参数、以及训练数据，执行训练，并实时监控当前处理资源，

所述在神经网络模型的训练使用当前处理资源的任意时间，如果不满足触发逻辑，进一步包括，

当检测到前景信息时，判断当前处理资源中的显存和/或内存资源是否充足，

如果充足，则暂停当前训练线程，如果不充足，则杀死训练线程；

判断待更新神经网络模型是否训练完毕，如果是，则保存训练好的神经网络模型，并部署该神经网络模型，否则，返回执行所述在神经网络模型的智能分析使用当前处理资源的任意时间，判断是否满足触发逻辑的步骤；

所述训练参数包括，并发线程的数量、线程启动信号和等待信号、迭代次数、学习率之一或其任意组合。

可选的，所述基于当前空闲的处理资源，为待更新神经网络模型配置训练所需的处理资源，包括，

触发当前处理资源的资源评估，确定当前空闲的处理资源，

根据资源评估结果，为待更新神经网络模型配置自适应训练参数，

所述判断待更新神经网络模型是否训练完毕之前进一步包括，

判断当前空闲处理资源的资源量达到设定的对待更新神经网络模型暂停训练的第二阈值；如果是，则存储当前训练中的待更新神经网络模型，暂停训练线程，否则，继续当前训练。

可选的，所述判断当前空闲处理资源的资源量达到设定的对待更新神经网络模型暂停训练的第二阈值进一步包括，

如果当前空闲处理资源的资源量未达到第二阈值，则判断当前时间是否到达设定的对待更新神经网络模型暂停训练的第二时间，如果是，则存储当前训练中的待更新神经网络模型，暂停训练线程，否则，继续当前训练，直至待更新神经网络模型训练完毕。

可选的，当触发逻辑为当前空闲处理资源的资源量达到设定的对待更新神经网络模型启动训练的第一阈值，或，当前时间到达符合设定的对待更新定神经网络模型启动训练的第一时间，所述在神经网络模型的训练使用当前处理资源的任意时间，如果不满足触发逻辑，包括，

判断当前空闲处理资源的资源量是否到达设定的对待更新神经网络模型暂停训练的第二阈值，或者，判断当前时间到达符合设定的对待更新定神经网络模型暂停训练的第二时间，如果是，则存储当前训练中的待更新神经网络模型，暂停训练线程，否则，则继续当前训练，直至待更新神经网络模型训练完毕。

可选的，所述在神经网络模型进行智能分析使用当前处理资源的任意时间，如果满足触发逻辑，进一步包括，

按照对前景敏感度和/或占用处理资源，选择性地保留前景检测工作，选择性地暂停神经网络模型所进行的智能分析，并释放所暂停神经网络模型进行智能分析所占用的处理资源；

所述触发事件包括，在设定的第一时间阈值内未检测到运动前景，在设定的第二时间阈值内未检测到光流，在设定的第三时间阈值内未检测到目标，在设定的第四时间阈值内未检测到目标分割结果中的一个事件或任意的组合。

可选的，所述处理资源包括，系统内存、处理器的处理资源、图形处理器GPU显存、带宽资源、线程数之一或其任意组合；

所述第一阈值包括，系统内存的阈值，处理器的处理资源的阈值，GPU显存的阈值，带宽资源的阈值，线程数量的阈值之一或其任意组合；

所述第二阈值包括，系统内存的阈值，处理器的处理资源的阈值，GPU显存的阈值，带宽资源的阈值，线程数量的阈值之一或其任意组合；

所述判断当前空闲处理资源的资源量是否达到对待更新神经网络模型启动训练的设定的第一阈值，进一步包括，

根据空闲处理资源的各个资源量，分别判断各个资源量是否达到其设定的阈值，

所述根据资源评估结果，为待更新神经网络模型配置自适应训练参数包括，

根据各个空闲的处理资源量来配置训练参数；

所述判断当前空闲处理资源的资源量是否达到对待更新神经网络模型暂停训练的设定的第二阈值，进一步包括，

根据空闲处理资源的各个资源量，分别判断各个资源量是否达到其设定的阈值，当其中任一资源量达到其设定的阈值时，根据当前空闲处理资源调整当前训练，直至所有资源量都达到各个设定的阈值。

可选的，所述待更新神经网络模型为两个以上，

所述基于当前空闲的处理资源，为待更新神经网络模型配置训练所需的处理资源，进一步包括，

按照优先级选择待更新神经网络模型，或者，

根据当前空闲处理资源匹配待更新神经网络模型，将一定比率的处理资源用于配置训练参数。

第二方面，本申请实施例提供了一种用于神经网络训练和智能分析的处理资源配置的装置，该装置包括：

触发逻辑检测模块，用于在神经网络模型的智能分析使用当前处理资源的任意时间，判断是否满足触发逻辑；

训练模块，用于在满足触发逻辑时，根据当前处理资源进行资源评估，确定当前空闲的处理资源，基于当前空闲的处理资源，为待更新神经网络模型配置训练所需的处理资源；基于训练所需处理资源，对待更新神经网络模型进行训练。

第三方面，本申请实施例提供了一种用于神经网络训练和智能分析的处理资源配置的电子设备，该设备包括存储器和处理器，其中，存储器存储有可被处理器执行的指令，指令被处理器执行，以使处理器执行上述用于神经网络训练和智能分析的处理资源配置方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，计算机程序被处理器执行时实现上述用于神经网络训练和智能分析的处理资源配置方法。

第五方面，本申请实施例提供了一种计算机程序产品，用于在运行时执行：上述用于神经网络训练和智能分析的处理资源配置方法。

应用本申请实施例，进行智能分析使用当前处理资源的任意时间，通过触发逻辑，控制待更新神经网络模型基于当前空闲的处理资源进行训练，实现了神经网络模型的智能分析和训练的一体化，并且，在确保神经网络模型完成智能分析的情形下，最大化地利用了硬件资源来进行训练，实现了处理资源在智能分析和训练之间的弹性配置，提高了神经网络模型的自主升级应用的便利。

附图说明

为了更清楚地说明本申请实施例和现有技术的技术方案，下面对实施例和现有技术中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的结合视频分析采用事件触发的方式来启动用于神经网络训练和智能分析的处理资源配置方法的流程示意图。

图2为本申请实施例的结合视频分析采用时间触发的方式来启动用于神经网络训练和智能分析的处理资源配置方法的流程示意图。

图3为本申请实施例的结合视频分析采用空闲处理资源触发的方式来启动用于神经网络训练和智能分析的处理资源配置方法的流程示意图。

图4为本申请实施例的结合视频分析采用事件、时间、以及处理资源组合触发的方式来启动用于神经网络训练和智能分析的处理资源配置方法的流程示意图。

图5为本申请实施例的神经网络模型进行智能分析所占用的处理资源与待更新神经网络模型进行训练所占用处理资源配置的框架示意图。

图6为本申请实施例的用于神经网络训练和智能分析的处理资源配置装置的结构示意图。

图7为本申请实施例的用于神经网络训练和智能分析的处理资源配置的电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案、及优点更加清楚明白，以下参照附图并举实施例，对本申请进一步详细说明。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

随着芯片产业的发展，作为处理资源的处理器的处理能力(算力)、内存资源、带宽资源越来越充足，在芯片上实现更多的神经网络功能智能分析的同时，还能够支撑神经网络模型的训练。本申请根据神经网络模型智能分析时所占用处理资源，在智能分析所占用处理资源处于空闲的时间窗内，为神经网络模型的训练配置处理资源进行训练，从而实现神经网络模型的训练和智能分析一体化。

以下将以部署于视频分析的神经网络模型的智能分析和训练为例来说明。

在视频监控系统中，用神经网络模型对监控到的视频中的目标进行分析是一种较广的应用。通常，先利用运动前景(例如背景声音)、光流、图像分割等进行前景运动信息分析，然后通过神经网络模型分析当前视频的目标框、目标类别、姿态估计等智能分析，其中，前景运行信息分析对处理资源消耗低，神经网络模型的智能分析对处理资源消耗高。在视频分析中，处理资源通常包括且不限于系统内存、处理器的处理资源、GPU(Graphics Processing Unit，图形处理单元)显存、带宽资源、线程数之一或其任意组合，其中，处理器包括CPU(Central Processing Unit，中央处理单元)和/或GPU。鉴于不遗漏目标是视频分析性能好坏的因素之一，这使得前景分析和神经网络的智能分析所需的处理资源是实时被满足的，这与神经网络的在线训练的处理资源需求形成矛盾。为解决该矛盾，本申请实施例通过设置触发逻辑来实现处理资源的配置。

本申请实施例提供了一种用于神经网络训练和智能分析的处理资源配置方法，包括如下步骤：

参见图1所示，图1为本申请实施例的结合视频分析采用事件触发的方式来启动用于神经网络训练和智能分析的处理资源配置方法的流程示意图。当神经网络模型迭代一段时间、评估模型的目标性能后需要进行更新时，执行如下步骤：

步骤101，判断当前前景运动分析是否满足设定的触发事件。

当前进行智能分析所使用的神经网络模型可能是多个，例如，有些神经网络模型做运动检测、有些神经网络模型做目标检测、有些神经网络模型做目标跟踪、有些神经网络模型做目标识别等等。在智能分析的过程中，可以不间断地对采集图像进行前景运动分析，如果当前前景运动分析满足设定的触发事件，则部分地或全部地暂停当前神经网络模型所进行的智能分析，并释放已暂停神经网络模型的智能分析所占用的处理资源，然后执行步骤102。

否则，判断神经网络模型所进行的智能分析是否已启动，如果是，则保持当前神经网络模型进行智能分析，如果没有启动，则启动神经网络模型进行智能分析。

其中，触发事件包括如下之一或其任意组合：在设定的第一时间阈值内未检测到运动前景，在设定的第二时间阈值内未检测到光流，在设定的第三时间阈值内未检测到目标，在设定的第四时间阈值内未检测到目标分割结果。

即在当前前景运动分析时，分析出在设定的第一时间阈值内未检测到运动前景、在设定的第二时间阈值内未检测到光流、在设定的第三时间阈值内未检测到目标、在设定的第四时间阈值内未检测到目标分割结果等，就可以确定当前前景运动分析满足设定的触发事件，会触发部分地或全部地暂停当前神经网络模型所进行的智能分析，并释放已暂停神经网络模型的智能分析所占用的处理资源的操作。第一时间阈值、第二时间阈值、第三时间阈值、第四时间阈值可以相同，也可以不同；当各个阈值不同时，可以形成触发事件的优先级。

为了确保不遗漏目标，该步骤中，即使全部地暂停神经网络模型所进行的智能分析，仍可以保留前景运动分析中对前景敏感度高、占用处理资源少的前景检测不间断运行，这时，智能分析所占用处理资源处于空闲的时间窗并不包括前景目标的时间窗，其中，时间窗是指不同分析模块所占的时间片上的时间段，用于配置资源。由于前景检测指的是背景建模分析出来图像的哪个区域有运动或者目标检测检测出有目标，因此，前景检测的结果可能有多个，可根据各种前景检测结果和基于各前景检测的神经网络模型智能分析所占用的处理资源设置优先级，保留优先级高的前景检测、以及基于该前景检测的神经网络模型智能分析处于开启的状态，暂停优先级低的前景检测及其神经网络模型所进行的智能分析。

步骤102，触发当前处理资源的资源评估，以便为待更新神经网络训练所需的处理资源进行配置。

在该步骤中，统计当前前景检测、当前神经网络模型所进行的智能分析等已占用的处理资源，以及剩余处理资源；处理资源可包括系统内存、处理器的处理资源、GPU显存、带宽资源、线程数之一或其任意组合。

步骤103，根据处理资源评估结果，为待更新神经网络模型自动地配置自适应的训练参数；训练参数包括，并发线程的数量、线程启动信号和等待信号、迭代次数、学习率等。

其中，自适应的训练参数根据经验设定；启动和等待信号根据前景检测的前景信息、和/或处理资源触发，具体地，当检测到前景信息中有目标、和/或处理资源小于设定的阈值，则触发等待信号，否则，触发启动信号。

进一步地，当待更新神经网络模型有多个时，可以按照优先级选择一个待更新神经网络模型来配置参数，也可以根据当前空闲的处理资源匹配一待更新神经网络模型，例如，根据各个待更新神经网络模型在历史训练中所占用的处理资源的统计，按照当前空闲资源选择一待更新神经网络模型。

此外，可以将第一比率的当前空闲的处理资源配置为用于训练待更新神经网络模型所需的处理资源，例如，将总的当前空闲的处理资源的20％～30％配置为用于训练待更新神经网络模型所需的处理资源。

步骤104，加载待更新神经网络模型、训练参数、训练数据，执行训练过程，并实时监控当前处理资源，一旦检测到前景信息，则存储当前训练中的神经网络模型，判断当前处理资源中显存和/或内存资源是否充足，如果充足，则暂停训练线程，并启动神经网络模型进行智能分析，以免遗漏目标，否则，终止(KILL)训练线程，启动神经网络模型进行智能分析。

其中，判断当前处理资源中显存和/或内存资源是否充足可依据：训练时的神经网络模型所占用的显存和/或内存资源与进行智能分析的神经网络模型所占用的显存和/或内存资源之和是否小于等于总的显存和/或内存。加载的训练数据可以是带有人工标注的标签信息的训练是数据；可以是无标签的数据，通过模型自动给训练数据打标签。

步骤105，判断待更新的神经网络模型是否训练完毕，如果是，则保存训练好的神经网络模型，并部署该神经网络模型，否则，返回步骤101。

本申请实施例以前景检测的事件作为触发逻辑，在不遗漏目标的前提下兼顾了待更新神经网络的在同一硬件上的训练，最大化地利用了硬件资源进行训练，支撑了神经网络模型的自主升级应用，实现了神经网络模型训练和智能分析一体化，以及处理资源的弹性配置。

参见图2所示，图2为本申请实施例的结合视频分析采用时间触发的方式来启动用于神经网络训练和智能分析的处理资源配置方法的流程示意图。当神经网络模型迭代一段时间、评估模型的目标性能后需要进行更新时，执行如下步骤：

步骤201，判断当前时间是否到达符合设的对待更新定神经网络模型启动训练的第一时间，如果是，则保留对前景敏感度高的前景检测，暂停部分或所有神经网络模型所进行的智能分析，然后执行步骤202，否则，保持当前前景运动分析，并进行神经网络模型的智能分析，返回步骤201。

第一时间可以根据视频分析的数据确定，例如，对于某一监控设备，从视频分析的历史数据看，其在夜间的若干时间段没有检测到前景，故而可以此来设定第一时间。

当前时间可以基于系统时间确定的绝对时间，例如，某月某日某时；或，基于计时设定的相对时间，例如，通过计时器设定的时长。

步骤202，触发当前处理资源的资源评估，以便为待更新神经网络训练所需的处理资源进行配置，该步骤与步骤102相同；

步骤203，根据处理资源评估结果，为待更新神经网络模型自动地配置自适应训练参数；该步骤与步骤103相同。

步骤204，加载待更新神经网络模型、训练参数、训练数据，执行训练过程，并实时监控当前处理资源，一旦检测到前景信息，则存储当前训练中的神经网络模型，判断当前处理资源中显存和/或内存资源是否充足，如果充足，则暂停训练线程，并启动神经网络模型进行智能分析；否则，终止训练线程，启动神经网络模型进行智能分析。

步骤205，当智能分析结束后，判断是否到达设定的对待更新神经网络模型暂停训练的第二时间，如果是，存储当前训练中的神经网络模型，暂停训练线程，否则，返回步骤202。

步骤206，判断待更新的神经网络模型是否训练完毕，如果是，则保存训练好的神经网络模型，并部署该神经网络模型，否则，返回步骤201。

如果待更新的神经网络模型达到预期的收敛条件，或者迭代次数达到指定次数，则可以确定待更新的神经网络模型训练完毕。

上述实施方式中，在兼顾了在线训练的同时，保证了不遗失目标。

作为另一实施方式，上述步骤204～205还可以是：

步骤204′，加载待更新神经网络模型、训练参数、训练数据，执行训练过程，并实时监控当前处理资源。

步骤205′，判断是否到达设定的对待更新神经网络模型暂停训练的第二时间，如果是，存储当前训练中的神经网络模型，暂停训练线程，否则，继续当前的训练。

进一步地，当检测到前景信息时，可以将当前视频存储于外设中，待到达第二时间后，再基于存储的前景信息进行神经网络模型的智能分析，该实施方式使得训练过程不被偶发的前景检测而中断，有利于提高训练的效率。

参见图3所示，图3为本申请实施例的结合视频分析采用空闲处理资源触发的方式来启动用于神经网络训练和智能分析的处理资源配置方法的流程示意图。

步骤301，判断当前空闲处理资源的资源量是否达到对待更新神经网络模型启动训练的设定的第一阈值，如果是，则执行步骤302，否则，保持当前前景运动分析以及当前的神经网络模型的智能分析，返回步骤301。

其中，空闲的处理资源的资源量包括，系统内存、处理器的处理资源、GPU显存、带宽资源、线程数之一或其任意组合；具体可以为各个空闲的处理资源量分别设置阈值，例如，所述第一阈值包括，系统内存的阈值，处理器的处理资源的阈值，GPU显存的阈值，带宽资源的阈值，线程数量的阈值。

当前空闲处理资源的资源量根据总的处理资源减去当前已占用的处理资源而得到。

步骤302，根据当前空闲处理资源，为待更新神经网络模型自动地配置自适应训练参数；该步骤与步骤103相同。

在该步骤中，进一步地，可以根据各个空闲的处理资源量来配置训练参数。

步骤303，加载待更新神经网络模型、训练参数、训练数据，执行训练过程，并实时监控当前处理资源。

步骤304，判断当前空闲处理资源的资源量是否达到对待更新神经网络模型暂停训练的设定的第二阈值，如果是，则存储当前训练中的神经网络模型，暂停训练线程，否则，返回步骤302。

在该步骤中，进一步地，可以根据空闲处理资源的各个资源量，分别判断各个资源量是否达到对应设定的第二阈值，当其中任一资源量达到设定的第二阈值时，可根据当前空闲处理资源调整当前训练以及自适应训练参数，例如，暂停占用处理资源超过设定阈值的线程，降低训练的数据量，反复调整训练，直至所有资源量都达到各个设定的阈值，说明当前空闲处理资源已得到充分的利用，则存储当前训练中的神经网络模型，暂停训练线程。

步骤305，判断待更新的神经网络模型是否训练完毕，如果是，则保存训练好的神经网络模型，并部署该神经网络模型，否则，返回步骤301。

本实施例以当前空闲处理资源为触发逻辑，实现了对当前空闲处理资源的实时监控，在不影响当前神经网络模型进行智能分析的同时，使得空闲处理资源能够动态地被利用，从而在同一硬件上完成了待更新神经网络模型的训练。

参见图4所示，图4为本申请实施例的结合视频分析采用事件、时间、以及处理资源组合触发的方式来启动用于神经网络训练和智能分析的处理资源配置方法的流程示意图。

步骤401，判断是否满足至少如下触发条件之一：当前前景运动分析是否满足设定的触发事件，当前时间是否到达符合设定的对待更新定神经网络模型启动训练的第一时间，当前空闲处理资源的资源量是否达到对待更新神经网络模型启动训练的设定的第一阈值。

如果是，则保留对前景敏感度高的前景检测，暂停部分或所有神经网络模型所进行的智能分析，然后执行步骤402，否则，保持当前前景运动分析，并进行神经网络的智能分析，返回步骤401。

步骤402，触发当前处理资源的资源评估，以便为待更新神经网络训练所需的处理资源进行配置，该步骤与步骤102相同。

步骤403，根据处理资源评估结果，为待更新神经网络模型自动地配置自适应训练参数；该步骤与步骤103相同。

步骤404，加载待更新神经网络模型、训练参数、训练数据，执行训练过程，并实时监控当前处理资源，一旦检测到前景信息，则存储当前训练中的神经网络模型，判断当前处理资源中显存和/或内存资源是否充足，如果充足，则暂停训练线程，并启动神经网络模型进行智能分析；否则，终止训练线程，启动神经网络模型进行智能分析。

当智能分析结束后：

步骤405，判断当前空闲处理资源的资源量是否达到对待更新神经网络模型暂停训练的设定的第二阈值。

如果是，存储当前训练中的神经网络模型，暂停训练线程。

否则，判断是否到达设定的对待更新神经网络模型暂停训练的第二时间，如果是，存储当前训练中的神经网络模型，暂停训练线程，以便及时将用于训练的处理资源释放出来，为即将进行的神经网络模型智能分析做好准备，提高系统的鲁棒性，否则，返回步骤402。

步骤406，判断待更新的神经网络模型是否训练完毕，如果是，则保存训练好的神经网络模型，并部署该神经网络模型，否则，存储当前训练中的神经网络模型，暂停训练线程，返回步骤401。

本实施例从事件、时间、处理资源三个维度来控制神经网络模型的训练，既保证了视频分析的稳定性和鲁棒性，又最大程度地利用了空闲的处理资源，使得空闲处理资源能够灵活地被利用。

参见图5所示，图5为本申请实施例的神经网络模型进行智能分析所占用的处理资源与待更新神经网络模型进行训练所占用处理资源配置的框架示意图。通过上述实施方式或其组合，使得处理资源在神经网络模型的智能分析和训练的任何时间弹性地、动态地分配。

参见图6所示，图6为本申请实施例的用于神经网络模型训练和智能分析的处理资源配置装置的结构示意图。该装置包括，

其中，触发逻辑检测模块至少包括如下之一模块：

前景运动分析模块，用于检测当前前景运动分析是否满足设定的触发事件；当满足时，向训练模块输出触发信号；

时间触发检测模块，用于检测当前时间到达符合设定的对待更新定神经网络模型启动训练的第一时间，当满足时，向训练模块输出触发信号；

处理资源检测模块，用于当前空闲处理资源的资源量达到设定的对待更新神经网络模型启动训练的第一阈值，当满足时，向训练模块输出触发信号；

训练模块包括，

资源评估模块，根据触发信号当前处理资源的资源评估，确定当前空闲的处理资源；

训练参数配置模块，根据资源评估结果，为待更新神经网络模型配置自适应训练参数，

训练进行执行模块，加载待更新神经网络模型、训练参数、以及训练数据，执行训练，并实时监控当前处理资源；

该装置还包括，

神经网络模型智能分析模块，在触发逻辑不满足时，基于神经网络模型进行智能分析；

模型存储部署模块，将训练后的待更新神经网络模型进行保存，并部署该模型的智能分析。

可选的，触发逻辑检测模块至少包括如下之一模块：前景运动分析模块、时间触发检测模块和处理资源检测模块；

时间触发检测模块，用于检测当前时间是否到达符合设定的对待更新神经网络模型启动训练的第一时间，当前时间包括基于系统时间确定的绝对时间，或，基于计时设定的相对时间；当满足时，向训练模块输出触发信号；

处理资源检测模块，用于检测当前空闲的处理资源的资源量是否达到设定的对待更新神经网络模型启动训练的第一阈值；当满足时，向训练模块输出触发信号；

训练模块，还用于在待更新神经网络模型进行训练使用当前处理资源的任意时间，如果不满足触发逻辑，则存储当前训练中的待更新神经网络模型，暂停训练线程，启动神经网络模型进行智能分析。

可选的，训练模块，具体用于加载待更新神经网络模型、训练参数、以及训练数据，执行训练，并实时监控当前处理资源；当检测到前景信息时，判断当前处理资源中的GPU显存和/或系统内存资源是否充足；如果GPU显存和/或系统内存资源充足，则暂停训练线程，并启动神经网络模型进行智能分析；如果GPU显存和/或系统内存资源不充足，则终止训练线程，并启动神经网络模型进行智能分析；判断待更新神经网络模型是否训练完毕；如果是，则保存训练好的神经网络模型，并部署该神经网络模型，否则，返回执行在神经网络模型进行智能分析使用当前处理资源的任意时间，判断是否满足触发逻辑的步骤；其中，训练参数包括，并发线程的数量、线程启动信号和等待信号、迭代次数、学习率之一或其任意组合。

可选的，训练模块，具体用于根据当前空闲的处理资源，为待更新神经网络模型配置自适应训练参数；判断当前空闲的处理资源的资源量是否达到设定的对待更新神经网络模型暂停训练的第二阈值；如果当前空闲的处理资源的资源量达到第二阈值，则存储当前训练中的待更新神经网络模型，并暂停训练线程和/或调整训练参数；如果当前空闲的处理资源的资源量未达到第二阈值，则继续当前训练。

可选的，训练模块，具体用于如果当前空闲的处理资源的资源量未达到第二阈值，则判断当前时间是否到达设定的对待更新神经网络模型暂停训练的第二时间；如果当前时间到达第二时间，则存储当前训练中的待更新神经网络模型，并暂停训练线程；如果当前时间未到达第二时间，则继续当前训练，直至待更新神经网络模型训练完毕。

可选的，训练模块，具体用于在触发逻辑为当前空闲的处理资源的资源量达到设定的对待更新神经网络模型启动训练的第一阈值的情况下，或，在触发逻辑为当前时间到达符合设定的对待更新神经网络模型启动训练的第一时间的情况下，判断当前空闲的处理资源的资源量是否到达设定的对待更新神经网络模型暂停训练的第二阈值、当前时间是否到达符合设定的对待更新定神经网络模型暂停训练的第二时间；如果当前空闲的处理资源的资源量到达第二阈值，或者，当前时间到达第二时间，则存储当前训练中的待更新神经网络模型，暂停训练线程；如果当前空闲的处理资源的资源量未到达第二阈值、当前时间未到达第二时间，则继续当前训练，直至待更新神经网络模型训练完毕。

可选的，训练模块，具体用于按照对前景敏感度和/或占用处理资源，选择性地保留前景检测工作，选择性地暂停神经网络模型所进行的智能分析，并释放暂停的神经网络模型进行智能分析所占用的处理资源；触发事件包括，在设定的第一时间阈值内未检测到运动前景，在设定的第二时间阈值内未检测到光流，在设定的第三时间阈值内未检测到目标，在设定的第四时间阈值内未检测到目标分割结果中的一个事件或任意的组合。

可选的，处理资源包括，系统内存、处理器的处理资源、GPU显存、带宽资源、线程数之一或其任意组合；

第一阈值包括，系统内存的阈值，处理器的处理资源的阈值，GPU显存的阈值，带宽资源的阈值，线程数量的阈值之一或其任意组合；

第二阈值包括，系统内存的阈值，处理器的处理资源的阈值，GPU显存的阈值，带宽资源的阈值，线程数量的阈值之一或其任意组合；

训练模块，具体用于根据当前空闲的处理资源的各个资源量，分别判断各个资源量是否达到对应设定的第一阈值；根据当前空闲的处理资源的各个资源量，配置待更新神经网络模型的自适应训练参数；根据当前空闲的处理资源的各个资源量，分别判断各个资源量是否达到对应设定的第二阈值，当任一资源量达到对应设定的第二阈值时，根据当前空闲的处理资源调整当前训练以及自适应训练参数，直至所有资源量都达到各自对应设定的第二阈值。

可选的，待更新神经网络模型为两个以上；

训练模块，具体用于按照优先级选择待更新神经网络模型，或者，根据当前空闲的处理资源匹配待更新神经网络模型；将一定比率的当前空闲的处理资源配置为用于训练待更新神经网络模型所需的处理资源。

本申请实施例提供了一种用于神经网络训练和智能分析的处理资源配置的电子设备，如图7所示，可以包括处理器701和存储器702，存储器702存储有能够被处理器701执行的指令，该指令被处理器701执行，以使处理器执行上述用于神经网络训练和智能分析的处理资源配置方法。

上述存储器可以包括RAM(Random Access Memory，随机存取存储器)，也可以包括NVM(Non-Volatile Memory，非易失性存储器)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离上述处理器的存储装置。上述处理器可以是通用处理器，包括CPU、NP(Network Processor，网络处理器)等；还可以是DSP(Digital Signal Processing，数字信号处理器)、ASIC(Application Specific Integrated Circuit，专用集成电路)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

存储器702与处理器701之间可以通过有线连接或者无线连接的方式进行数据传输，并且电子设备可以通过有线通信接口或者无线通信接口与其他的设备进行通信。图7所示的仅为处理器701与存储器702之间通过总线进行数据传输的示例，不作为具体连接方式的限定。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，计算机程序被处理器执行时实现上述用于神经网络训练和智能分析的处理资源配置方法。

本申请实施例还提供一种计算机程序产品，用于在运行时执行上述用于神经网络训练和智能分析的处理资源配置方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、DSL(Digital Subscriber Line，数字用户线))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD(Digital Versatile Disc，数字多功能光盘))、或者半导体介质(例如SSD(Solid State Disk，固态硬盘))等。

对于装置、电子设备、计算机可读存储介质和计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于计算机可读取存储介质中，这里所称得的存储介质，如：ROM/RAM、磁碟、光盘等。

以上所述仅为本申请的较佳实施例，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

Claims

一种用于神经网络训练和智能分析的处理资源配置方法，其特征在于，所述方法包括，

在神经网络模型进行智能分析使用当前处理资源的任意时间，判断是否满足触发逻辑；

如果满足所述触发逻辑，则根据所述当前处理资源进行资源评估，确定当前空闲的处理资源；

基于所述当前空闲的处理资源，为待更新神经网络模型配置训练所需的处理资源；

基于所述训练所需的处理资源，对所述待更新神经网络模型进行训练。
如权利要求1所述的方法，其特征在于，所述触发逻辑至少包括如下之一：当前前景运动分析满足设定的触发事件；当前时间到达符合设定的对待更新神经网络模型启动训练的第一时间，所述当前时间包括基于系统时间确定的绝对时间，或，基于计时设定的相对时间；当前空闲的处理资源的资源量达到设定的对待更新神经网络模型启动训练的第一阈值；

在所述基于所述训练所需的处理资源，对所述待更新神经网络模型进行训练的步骤之后，所述方法还包括，

在所述待更新神经网络模型进行训练使用当前处理资源的任意时间，如果不满足所述触发逻辑，则存储当前训练中的待更新神经网络模型，暂停训练线程，启动神经网络模型进行智能分析。
如权利要求2所述的方法，其特征在于，所述基于所述训练所需的处理资源，对所述待更新神经网络模型进行训练的步骤，包括：

加载所述待更新神经网络模型、训练参数、以及训练数据，执行训练，并实时监控当前处理资源；

在所述存储当前训练中的待更新神经网络模型，暂停训练线程，启动神经网络模型进行智能分析的步骤之前，所述方法还包括：

当检测到前景信息时，判断当前处理资源中的图形处理器GPU显存和/或系统内存资源是否充足；

所述暂停训练线程，启动神经网络模型进行智能分析的步骤，包括：

如果所述GPU显存和/或系统内存资源充足，则暂停训练线程，并启动神经网络模型进行智能分析；

所述方法还包括：

如果所述GPU显存和/或系统内存资源不充足，则终止训练线程，并启动神经网络模型进行智能分析；

判断所述待更新神经网络模型是否训练完毕；

如果是，则保存训练好的神经网络模型，并部署该神经网络模型，

否则，返回执行所述在神经网络模型进行智能分析使用当前处理资源的任意时间，判断是否满足触发逻辑的步骤；

所述训练参数包括，并发线程的数量、线程启动信号和等待信号、迭代次数、学习率之一或其任意组合。
如权利要求3所述的方法，其特征在于，所述基于所述当前空闲的处理资源，为待更新神经网络模型配置训练所需的处理资源的步骤，包括：

根据所述当前空闲的处理资源，为待更新神经网络模型配置自适应训练参数；

在所述判断所述待更新神经网络模型是否训练完毕的步骤之前，所述方法还包括：

判断所述当前空闲的处理资源的资源量是否达到设定的对所述待更新神经网络模型暂停训练的第二阈值；

所述存储当前训练中的待更新神经网络模型的步骤，包括：

如果所述当前空闲的处理资源的资源量达到所述第二阈值，则存储当前训练中的待更新神经网络模型，并暂停训练线程和/或调整训练参数；

所述方法还包括：

如果所述当前空闲的处理资源的资源量未达到所述第二阈值，则继续当前训练。
如权利要求4所述的方法，其特征在于，在所述继续当前训练的步骤之前，所述方法还包括：

如果所述当前空闲的处理资源的资源量未达到所述第二阈值，则判断当前时间是否到达设定的对所述待更新神经网络模型暂停训练的第二时间；

所述继续当前训练的步骤，包括：

如果所述当前时间未到达所述第二时间，则继续当前训练，直至待更新神经网络模型训练完毕；

所述存储当前训练中的待更新神经网络模型的步骤，包括：

如果所述当前时间到达所述第二时间，则存储当前训练中的待更新神经网络模型，并暂停训练线程。
如权利要求2所述的方法，其特征在于，在所述触发逻辑为当前空闲的处理资源的资源量达到设定的对待更新神经网络模型启动训练的第一阈值的情况下，或，在所述触发逻辑为当前时间到达符合设定的对待更新神经网络模型启动训练的第一时间的情况下，在所述存储当前训练中的待更新神经网络模型，暂停训练线程，启动神经网络模型进行智能分析的步骤之前，所述方法还包括：

判断所述当前空闲的处理资源的资源量是否到达设定的对待更新神经网络模型暂停训练的第二阈值、当前时间是否到达符合设定的对待更新定神经网络模型暂停训练的第二时间；

所述存储当前训练中的待更新神经网络模型，暂停训练线程的步骤，包括：

如果所述当前空闲的处理资源的资源量到达所述第二阈值，或者，所述当前时间到达所述第二时间，则存储当前训练中的待更新神经网络模型，暂停训练线程；

所述方法还包括：

如果所述当前空闲的处理资源的资源量未到达所述第二阈值、所述当前时间未到达所述第二时间，则继续当前训练，直至待更新神经网络模型训练完毕。
如权利要求2所述的方法，其特征在于，在所述根据所述当前处理资源进行资源评估，确定当前空闲的处理资源的步骤之前，所述方法还包括：

按照对前景敏感度和/或占用处理资源，选择性地保留前景检测工作，选择性地暂停神经网络模型所进行的智能分析，并释放暂停的神经网络模型进行智能分析所占用的处理资源；

所述触发事件包括，在设定的第一时间阈值内未检测到运动前景，在设定的第二时间阈值内未检测到光流，在设定的第三时间阈值内未检测到目标，在设定的第四时间阈值内未检测到目标分割结果中的一个事件或任意的组合。
如权利要求4所述的方法，其特征在于，所述处理资源包括，系统内存、处理器的处理资源、GPU显存、带宽资源、线程数之一或其任意组合；

所述第一阈值包括，系统内存的阈值，处理器的处理资源的阈值，GPU显存的阈值，带宽资源的阈值，线程数量的阈值之一或其任意组合；

所述第二阈值包括，系统内存的阈值，处理器的处理资源的阈值，GPU显存的阈值，带宽资源的阈值，线程数量的阈值之一或其任意组合；

所述判断当前空闲的处理资源的资源量是否达到对待更新神经网络模型启动训练的第一阈值的步骤，包括：

根据当前空闲的处理资源的各个资源量，分别判断各个资源量是否达到对应设定的第一阈值；

所述根据所述当前空闲的处理资源，为待更新神经网络模型配置自适应训练参数的步骤，包括：

根据当前空闲的处理资源的各个资源量，配置待更新神经网络模型的自适应训练参数；

所述判断所述当前空闲的处理资源的资源量是否达到对所述待更新神经网络模型暂停训练的设定的第二阈值的步骤，包括：

根据所述当前空闲的处理资源的各个资源量，分别判断各个资源量是否达到对应设定的第二阈值，当任一资源量达到对应设定的第二阈值时，根据当前空闲的处理资源调整当前训练以及自适应训练参数，直至所有资源量都达到各自对应设定的第二阈值。
如权利要求1所述的方法，其特征在于，所述待更新神经网络模型为两个以上；

所述基于所述当前空闲的处理资源，为待更新神经网络模型配置训练所需的处理资源的步骤，包括：

按照优先级选择待更新神经网络模型，或者，根据当前空闲的处理资源匹配待更新神经网络模型；

将一定比率的当前空闲的处理资源配置为用于训练所述待更新神经网络模型所需的处理资源。
一种用于神经网络训练和智能分析的处理资源配置的装置，其特征在于，该装置包括，

触发逻辑检测模块，用于在神经网络模型进行智能分析使用当前处理资源的任意时间，判断是否满足触发逻辑；

训练模块，用于在满足所述触发逻辑时，根据所述当前处理资源进行资源评估，确定当前空闲的处理资源，基于所述当前空闲的处理资源，为待更新神经网络模型配置训练所需的处理资源；基于所述训练所需处理资源，对所述待更新神经网络模型进行训练。
如权利要求10所述的装置，其特征在于，所述触发逻辑检测模块至少包括如下之一模块：前景运动分析模块、时间触发检测模块和处理资源检测模块；

所述前景运动分析模块，用于检测当前前景运动分析是否满足设定的触发事件；当满足时，向所述训练模块输出触发信号；

所述时间触发检测模块，用于检测当前时间是否到达符合设定的对待更新神经网络模型启动训练的第一时间，所述当前时间包括基于系统时间确定的绝对时间，或，基于计时设定的相对时间；当满足时，向所述训练模块输出触发信号；

所述处理资源检测模块，用于检测当前空闲的处理资源的资源量是否达到设定的对待更新神经网络模型启动训练的第一阈值；当满足时，向所述训练模块输出触发信号；

所述训练模块，还用于在所述待更新神经网络模型进行训练使用当前处理资源的任意时间，如果不满足所述触发逻辑，则存储当前训练中的待更新神经网络模型，暂停训练线程，启动神经网络模型进行智能分析。
如权利要求11所述的装置，其特征在于，所述训练模块，具体用于加载所述待更新神经网络模型、训练参数、以及训练数据，执行训练，并实时监控当前处理资源；当检测到前景信息时，判断当前处理资源中的图形处理器GPU显存和/或系统内存资源是否充足；如果所述GPU显存和/或系统内存资源充足，则暂停训练线程，并启动神经网络模型进行智能分析；如果所述GPU显存和/或系统内存资源不充足，则终止训练线程，并启动神经网络模型进行智能分析；判断所述待更新神经网络模型是否训练完毕；如果是，则保存训练好的神经网络模型，并部署该神经网络模型，否则，返回执行所述在神经网络模型进行智能分析使用当前处理资源的任意时间，判断是否满足触发逻辑的步骤；所述训练参数包括，并发线程的数量、线程启动信号和等待信号、迭代次数、学习率之一或其任意组合。
如权利要求12所述的装置，其特征在于，所述训练模块，具体用于根据所述当前空闲的处理资源，为待更新神经网络模型配置自适应训练参数；判断所述当前空闲的处理资源的资源量是否达到设定的对所述待更新神经网络模型暂停训练的第二阈值；如果所述当前空闲的处理资源的资源量达到所述第二阈值，则存储当前训练中的待更新神经网络模型，并暂停训练线程和/或调整训练参数；如果所述当前空闲的处理资源的资源量未达到所述第二阈值，则继续当前训练。
如权利要求13所述的装置，其特征在于，所述训练模块，具体用于如果所述当前空闲的处理资源的资源量未达到所述第二阈值，则判断当前时间是否到达设定的对所述待更新神经网络模型暂停训练的第二时间；如果所述当前时间到达所述第二时间，则存储当前训练中的待更新神经网络模型，并暂停训练线程；如果所述当前时间未到达所述第二时间，则继续当前训练，直至待更新神经网络模型训练完毕。
如权利要求11所述的装置，其特征在于，所述训练模块，具体用于在所述触发逻辑为当前空闲的处理资源的资源量达到设定的对待更新神经网络模型启动训练的第一阈值的情况下，或，在所述触发逻辑为当前时间到达符合设定的对待更新神经网络模型启动训练的第一时间的情况下，判断所述当前空闲的处理资源的资源量是否到达设定的对待更新神经网络模型暂停训练的第二阈值、当前时间是否到达符合设定的对待更新定神经网络模型暂停训练的第二时间；如果所述当前空闲的处理资源的资源量到达所述第二阈值，或者，所述当前时间到达所述第二时间，则存储当前训练中的待更新神经网络模型，暂停训练线程；如果所述当前空闲的处理资源的资源量未到达所述第二阈值、所述当前时间未到达所述第二时间，则继续当前训练，直至待更新神经网络模型训练完毕。
如权利要求11所述的装置，其特征在于，所述训练模块，具体用于按照对前景敏感度和/或占用处理资源，选择性地保留前景检测工作，选择性地暂停神经网络模型所进行的智能分析，并释放暂停的神经网络模型进行智能分析所占用的处理资源；所述触发事件包括，在设定的第一时间阈值内未检测到运动前景，在设定的第二时间阈值内未检测到光流，在设定的第三时间阈值内未检测到目标，在设定的第四时间阈值内未检测到目标分割结果中的一个事件或任意的组合。
如权利要求13所述的装置，其特征在于，所述处理资源包括，系统内存、处理器的处理资源、GPU显存、带宽资源、线程数之一或其任意组合；

所述第一阈值包括，系统内存的阈值，处理器的处理资源的阈值，GPU显存的阈值，带宽资源的阈值，线程数量的阈值之一或其任意组合；

所述第二阈值包括，系统内存的阈值，处理器的处理资源的阈值，GPU显存的阈值，带宽资源的阈值，线程数量的阈值之一或其任意组合；

所述训练模块，具体用于根据当前空闲的处理资源的各个资源量，分别判断各个资源量是否达到对应设定的第一阈值；根据当前空闲的处理资源的各个资源量，配置待更新神经网络模型的自适应训练参数；根据所述当前空闲的处理资源的各个资源量，分别判断各个资源量是否达到对应设定的第二阈值，当任一资源量达到对应设定的第二阈值时，根据当前空闲的处理资源调整当前训练以及自适应训练参数，直至所有资源量都达到各自对应设定的第二阈值。
如权利要求10所述的装置，其特征在于，所述待更新神经网络模型为两个以上；

所述训练模块，具体用于按照优先级选择待更新神经网络模型，或者，根据当前空闲的处理资源匹配待更新神经网络模型；将一定比率的当前空闲的处理资源配置为用于训练所述待更新神经网络模型所需的处理资源。
一种用于神经网络训练和智能分析的处理资源配置的电子设备，其特征在于，该设备包括存储器和处理器，其中，存储器存储有可被处理器执行的指令，所述指令被处理器执行，以使所述处理器执行如权利要求1至9任一所述用于神经网络训练和智能分析的处理资源配置方法。
一种计算机可读存储介质，其特征在于，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至9任一所述用于神经网络训练和智能分析的处理资源配置方法。