WO2023207361A1

WO2023207361A1 - 一种内存管理方法、系统、设备及计算机可读存储介质

Info

Publication number: WO2023207361A1
Application number: PCT/CN2023/080786
Authority: WO
Inventors: 何也
Original assignee: 山东云海国创云计算装备产业创新中心有限公司
Priority date: 2022-04-26
Filing date: 2023-03-10
Publication date: 2023-11-02
Also published as: CN114816752A

Abstract

本申请公开了一种内存管理方法、系统、设备及计算机可读存储介质，获取目标神经网络模型；基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数；分发子函数至对应的目标计算设备；对于每个目标计算设备，均基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理。使得各个目标计算设备所需运算的子函数与自身的运算性能相符合，且以执行单元为粒度对目标计算设备进行内存管理，实现了对计算设备内存的准确管理。本申请提供的内存管理系统、设备及计算机可读存储介质也解决了相应技术问题。

Description

一种内存管理方法、系统、设备及计算机可读存储介质

相关申请的交叉引用

本申请要求于2022年04月26日提交中国专利局，申请号为202210446431.5，申请名称为“一种内存管理方法、系统、设备及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，更具体地说，涉及一种内存管理方法、系统、设备及计算机非易失性可读存储介质。

背景技术

在神经网络模型的使用过程中，需要借助具有计算能力的计算设备来运行神经网络模型中的相应计算，因为神经网络模型中算子的输入输出会占据一定的存储空间，而计算设备的内存空间有限，如果内存分配不合理的话，会使得神经网络模型的运算速度降低，所以为了提高神经网络模型的运算速度，需对计算设备的内存进行准确管理。

发明内容

本申请的目的是提供一种内存管理方法，其能在一定程度上解决如何对计算设备的内存进行准确管理的技术问题。本申请还提供了一种内存管理系统、设备及计算机非易失性可读存储介质。

为了实现上述目的，本申请提供如下技术方案：

一种内存管理方法，包括：

获取目标神经网络模型；

基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数；

分发子函数至对应的目标计算设备；

对于每个目标计算设备，均基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理。

在一些实施例中，以执行单元为粒度对目标计算设备进行内存管理，包括：

将目标计算设备的内存划分为目标内存及预留内存；

确定执行单元在目标内存中的内存占用信息；

基于内存占用信息对目标计算设备的内存进行管理。

在一些实施例中，确定执行单元在目标内存中的内存占用信息，包括：

将目标内存划分为与各个执行单元对应的内存块；

将执行单元与内存块间的对应关系作为内存占用信息。

在一些实施例中，将目标内存划分为与各个执行单元对应的内存块，包括：

基于内存复用原则，将目标内存划分为与各个执行单元对应的内存块。

在一些实施例中，基于内存占用信息对目标计算设备的内存进行管理，包括：

统计各个执行单元在子函数中的出现次数，将出现次数作为执行单元对应的内存块的使用次数，并且若执行单元在目标计算设备中出现一次，则将使用次数的值减1；

对于每个执行单元，判断对应的内存块的使用次数的值是否为0；

若使用次数的值为0，则允许对执行单元对应的内存块进行复用；

若使用次数的值不为0，则禁止对执行单元对应的内存块进行复用，并返回执行若执行单元在目标计算设备中出现一次，则将使用次数的值减1的步骤。

基于执行速度最快原则，将目标内存划分为与各个执行单元对应的内存块。

在一些实施例中，基于内存占用信息对目标计算设备的内存进行管理之后，还包括：

应用预留内存对目标内存进行内存补偿。

一种内存管理系统，包括：

第一获取模块，用于获取目标神经网络模型；

第一剖分模块，用于基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数；

第一分发模块，用于分发子函数至对应的目标计算设备；

第二剖分模块，用于对于每个目标计算设备，均基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理。

一种内存管理设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序时实现如上任一内存管理方法的步骤。

一种计算机非易失性可读存储介质，计算机非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如上任一内存管理方法的步骤。

本申请提供的一种内存管理方法，获取目标神经网络模型；基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数；分发子函数至对应的目标计算设备；对于每个目标计算设备，均基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理。本申请中，可以先基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数，使得各个目标计算设备所需运算的子函数与自身的运算性能相符合，且之后对于每个目标计算设备，还需基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理，实现了对计算设备内存的准确管理。本申请提供的一种内存管理系统、设备及计算机非易失性可读存储介质也解决了相应技术问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种内存管理方法的第一流程图；

图2为本申请实施例提供的一种内存管理方法的第二流程图；

图3为内存的分配示意图；

图4为子函数的示意图；

图5为本申请实施例提供的一种内存管理系统的结构示意图；

图6为本申请实施例提供的一种内存管理处理设备的结构示意图；

图7为本申请实施例提供的一种内存管理处理设备的另一结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1，图1为本申请实施例提供的一种内存管理方法的第一流程图。

本申请实施例提供的一种内存管理方法，可以包括以下步骤：

步骤S101：获取目标神经网络模型。

实际应用中，可以先获取待运算的目标神经网络模型，目标神经网络模型的类型可以根据实际需要确定，本申请在此不做具体限定。

步骤S102：基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数。

实际应用中，在获取目标神经网络模型之后，便可以基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数，比如有的目标计算设备适合卷积运算，则可以将目标神经网络模型中的卷积算子剖分成相应的子函数来分发给该目标计算设备，再比如有的目标计算设备适合池化运算，则可以将目标神经网络模型中的池化算子剖分成相应的子函数来分发给该目标计算设备等。

需要说明的是，目标计算设备指的是具有计算能力的设备，目标计算设备及目标神经网络模型中算子的类型均可以根据实际需要确定，比如目标计算设备可以为CPU(central processing unit，中央处理器)、GPU(graphics processing unit，图形处理器)、FPGA(Field Programmable Gate Array，现场可编程逻辑门阵列)等，目标神经网络模型中的算子可以为卷积算子、池化算子、激活算子等，本申请在此不做具体限定。

步骤S103：分发子函数至对应的目标计算设备。

实际应用中，在基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数之后，便可以分发得到的子函数至对应的目标计算设备，以使目标计算设备可以对相应的子函数进行处理。

步骤S104：对于每个目标计算设备，均基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理。

实际应用中，在分发子函数至对应的目标计算设备之后，对于每个目标计算设备，还需基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理，因为执行单元的粒度小于子函数的粒度，所以以执行单元为粒度对目标计算设备进行内存管理的话，可以更细致、准确的对目标计算设备的内存进行管理。

需要说明的是，本申请提供的内存管理方法的执行主体可以根据实际需要确定，比如该执行主体可以为深度学习编译器，此时，深度学习编译器在获取目标神经网络模型时，可以读取深度学习框架生成的目标神经网络模型，以得到满足深度学习编译器的IR(Intermediate Representation，中间表示)形式的目标神经网络模型，进而便于深度学习编译器对目标神经网络模型进行处理，当然，该执行主体还可以为部署该深度学习编译器的计算机设备，或者为需运行目标神经网络模型的计算机设备等，本申请在此不做具体限定。

本申请提供的一种内存管理方法，获取目标神经网络模型；基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数；分发子函数至对应的目标计算设备；对于每个目标计算设备，均基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理。本申请中，可以先基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数，使得各个目标计算设备所需运算的子函数与自身的运算性能相符合，且之后对于每个目标计算设备，还需基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理，实现了对计算设备内存的准确管理。

请参阅图2，图2为本申请实施例提供的一种内存管理方法的第二流程图。

步骤S201：获取目标神经网络模型。

步骤S202：基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数。

步骤S203：分发子函数至对应的目标计算设备。

步骤S204：对于每个目标计算设备，均基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，将目标计算设备的内存划分为目标内存及预留内存；确定执行单元在目标内存中的内存占用信息；基于内存占用信息对目标计算设备的内存进行管理。

实际应用中，在以执行单元为粒度对目标计算设备进行内存管理的过程中，可以将目标计算设备的内存划分为目标内存及预留内存；确定执行单元在目标内存中的内存占用信息；基于内存占用信息对目标计算设备的内存进行管理。也即先使用目标内存来处理执行单元，将预留内存作为目标内存不足时的留存内存，比如在目标内存不足以满足执行单元的内存需求时，应用预留内存对目标内存进行内存补偿等。

实际应用中，在确定执行单元在目标内存中的内存占用信息的过程中，可以将目标内存划分为与各个执行单元对应的内存块；将执行单元与内存块间的对应关系作为内存占用信息。这样，可以基于执行单元与内存块间的对应关系来准确对执行单元进行内存管理。假设执行单元有4个，则内存的分配情况可以如图3所示，其中，图3中的内存空间1表示第一个执行单元对应的内存块，图3中的内存空间2表示第二个执行单元对应的内存块，图3中的内存空间3表示第三个执行单元对应的内存块，图3中的内存空间4表示第四个执行单元对应的内存块，图3中未编号的内存空间表示预留内存等。

实际应用中，在将目标内存划分为与各个执行单元对应的内存块的过程中，可以基于内存复用原则，将目标内存划分为与各个执行单元对应的内存块。需要说明的是，内存复用原则可以为不同执行单元间复用同一个内存块，也可以为同一个执行单元的输入、输出复用同一个内存块等，本申请在此不做具体限定。

具体应用场景中，在基于内存复用原则将目标内存划分为与各个执行单元对应的内存块之后，同一个内存块可能会被多个执行单元所使用，由此会使得内存块的存储数据被覆盖掉，如果被覆盖掉的数据还在后续有应用的话，会导致后续运算操作无法进行，进而导致无法得到最终的运算结果，为了避免此种情况，在基于内存占用信息对目标计算设备的内存进行管理的过程中，可以统计各个执行单元在子函数中的出现次数，将出现次数作为执行单元对应的内存块的使用次数，并且若执行单元在目标计算设备中出现一次，则将使用次数的值减1，若执行单元在目标计算设备中未出现，则保持使用次数的值不变；对于每个执行单元，判断对应的内存块的使用次数的值是否为0；若使用次数的值为0，则允许对执行单元对应的内存块进行复用；若使用次数的值不为0，则禁止对执行单元对应的内存块进行复用，并返回执行若执行单元在目标计算设备中出现一次，则将使用次数的值减1的步骤。这样，在内存块的使用次数的值不为0的情况下，也即在内存块还需被使用的情况下，无法对内存块进行复用，也就无法对内存块中的数据进行覆盖，可以保证内存块中的数据被后续使用。

为了便于理解，假设子函数的类型如图4所示，从子函数的第三个算子和第四个算子开始采用深度优先遍历的方式统计每个算子在计算图的不同路径上出现的次数，这个次数即表示该算子的输出需要被后续算子使用的次数，由图4可知，从上到下第一个算子出现在两条路径上，它的输出分别被第三个算子和第二个算子所使用，它的使用计数为2。完成各算子的统计计数后同第一次一样，从输出开始进行深度优先遍历，计数各个算子的输入和输出所占内存编号，因此首先处理的是第一个算子，它的输入为整个子函数的输入，假设它所占的内存编号为0，更新此内存编号的次数为当前使用它的数据的统计次数，整个函数的输入只使用一次，因此编号为0的内存编号的次数为1，对于它的输出，首先遍历已有的内存编号，比较该内存编号的使用次数是否为0，若为0且该内存编号的区块大小大于等于该算子输出所需要空间，则将输出的内存编号置为此内存编号，否则从内存中新开辟一段空间给它新的编号。在遍历已有内存编号的过程中对于存储的是当前算子的输入的内存块的使用次数减1。通过这样的方式即能确定每个算子的输入输出编号，且实现了内存的重用。

实际应用中，在将目标内存划分为与各个执行单元对应的内存块的过程中，还可以基于执行速度最快原则，将目标内存划分为与各个执行单元对应的内存块等，本申请在此不做具体限定。

请参阅图5，图5为本申请实施例提供的一种内存管理系统的结构示意图。

本申请实施例提供的一种内存管理系统，可以包括：

第一获取模块101，用于获取目标神经网络模型；

第一剖分模块102，用于基于各个目标计算设备对目标神经网络模型中算子的运算支持，将目标神经网络模型剖分为与各个目标计算设备对应的子函数；

第一分发模块103，用于分发子函数至对应的目标计算设备；

第二剖分模块104，用于对于每个目标计算设备，均基于目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个计算单元对应的执行单元，以执行单元为粒度对目标计算设备进行内存管理。

本申请实施例提供的一种内存管理系统，第二剖分模块可以包括：

第一划分单元，用于将目标计算设备的内存划分为目标内存及预留内存；

第一确定单元，用于确定执行单元在目标内存中的内存占用信息；

第一管理单元，用于基于内存占用信息对目标计算设备的内存进行管理。

本申请实施例提供的一种内存管理系统，第一确定单元可以具体用于：将目标内存划分为与各个执行单元对应的内存块；将执行单元与内存块间的对应关系作为内存占用信息。

本申请实施例提供的一种内存管理系统，第一确定单元可以具体用于：基于内存复用原则，将目标内存划分为与各个执行单元对应的内存块。

本申请实施例提供的一种内存管理系统，第一管理单元可以具体用于：统计各个执行单元在子函数中的出现次数，将出现次数作为执行单元对应的内存块的使用次数，并且若执行单元在目标计算设备中出现一次，则将使用次数的值减1；对于每个执行单元，判断对应的内存块的使用次数的值是否为0；若使用次数的值为0，则允许对执行单元对应的内存块进行复用；若使用次数的值不为0，则禁止对执行单元对应的内存块进行复用，并返回执行若执行单元在目标计算设备中出现一次，则将使用次数的值减1的步骤。

本申请实施例提供的一种内存管理系统，第一确定单元可以具体用于：基于执行速度最快原则，将目标内存划分为与各个执行单元对应的内存块。

本申请实施例提供的一种内存管理系统，还可以包括：

第一补偿模块，用于第二剖分模块基于内存占用信息对目标计算设备的内存进行管理之后，应用预留内存对目标内存进行内存补偿。

本申请还提供了一种内存管理设备及计算机非易失性可读存储介质，其均具有本申请实施例提供的一种内存管理方法具有的对应效果。请参阅图6，图6为本申请实施例提供的一种内存管理处理设备的结构示意图。

本申请实施例提供的一种内存管理设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：

获取目标神经网络模型；

分发子函数至对应的目标计算设备；

本申请实施例提供的一种内存管理设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：将目标计算设备的内存划分为目标内存及预留内存；确定执行单元在目标内存中的内存占用信息；基于内存占用信息对目标计算设备的内存进行管理。

本申请实施例提供的一种内存管理设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：将目标内存划分为与各个执行单元对应的内存块；将执行单元与内存块间的对应关系作为内存占用信息。

本申请实施例提供的一种内存管理设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：基于内存复用原则，将目标内存划分为与各个执行单元对应的内存块。

本申请实施例提供的一种内存管理设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：统计各个执行单元在子函数中的出现次数，将出现次数作为执行单元对应的内存块的使用次数，并且若执行单元在目标计算设备中出现一次，则将使用次数的值减1；对于每个执行单元，判断对应的内存块的使用次数的值是否为0；若使用次数的值为0，则允许对执行单元对应的内存块进行复用；若使用次数的值不为0，则禁止对执行单元对应的内存块进行复用，并返回执行若执行单元在目标计算设备中出现一次，则将使用次数的值减1的步骤。

本申请实施例提供的一种内存管理设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：基于执行速度最快原则，将目标内存划分为与各个执行单元对应的内存块。

本申请实施例提供的一种内存管理设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：基于内存占用信息对目标计算设备的内存进行管理之后，应用预留内存对目标内存进行内存补偿。

请参阅图7，本申请实施例提供的另一种内存管理设备中还可以包括：与处理器202连接的输入端口203，用于传输外界输入的命令至处理器202；与处理器202连接的显示单元204，用于显示处理器202的处理结果至外界；与处理器202连接的通信模块205，用于实现内存管理设备与外界的通信。显示单元204可以为显示面板、激光扫描使显示器等；通信模块205所采用的通信方式包括但不局限于移动高清链接技术(HML)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线连接：无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术。

本申请实施例提供的一种计算机非易失性可读存储介质，计算机非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：

获取目标神经网络模型；

分发子函数至对应的目标计算设备；

本申请实施例提供的一种计算机非易失性可读存储介质，计算机非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：将目标计算设备的内存划分为目标内存及预留内存；确定执行单元在目标内存中的内存占用信息；基于内存占用信息对目标计算设备的内存进行管理。

本申请实施例提供的一种计算机非易失性可读存储介质，计算机非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：将目标内存划分为与各个执行单元对应的内存块；将执行单元与内存块间的对应关系作为内存占用信息。

本申请实施例提供的一种计算机非易失性可读存储介质，计算机非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：基于内存复用原则，将目标内存划分为与各个执行单元对应的内存块。

本申请实施例提供的一种计算机非易失性可读存储介质，计算机非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：统计各个执行单元在子函数中的出现次数，将出现次数作为执行单元对应的内存块的使用次数，并且若执行单元在目标计算设备中出现一次，则将使用次数的值减1；对于每个执行单元，判断对应的内存块的使用次数的值是否为0；若使用次数的值为0，则允许对执行单元对应的内存块进行复用；若使用次数的值不为0，则禁止对执行单元对应的内存块进行复用，并返回执行若执行单元在目标计算设备中出现一次，则将使用次数的值减1的步骤。

本申请实施例提供的一种计算机非易失性可读存储介质，计算机非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：基于执行速度最快原则，将目标内存划分为与各个执行单元对应的内存块。

本申请实施例提供的一种计算机非易失性可读存储介质，计算机非易失性可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：基于内存占用信息对目标计算设备的内存进行管理之后，应用预留内存对目标内存进行内存补偿。

本申请所涉及的计算机非易失性可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。

本申请实施例提供的内存管理系统、设备及计算机非易失性可读存储介质中相关部分的说明请参见本申请实施例提供的内存管理方法中对应部分的详细说明，在此不再赘述。另外，本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种内存管理方法，其特征在于，包括：

获取目标神经网络模型；

基于各个目标计算设备对所述目标神经网络模型中算子的运算支持，将所述目标神经网络模型剖分为与各个所述目标计算设备对应的子函数；

分发所述子函数至对应的所述目标计算设备；

对于每个所述目标计算设备，均基于所述目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个所述计算单元对应的执行单元，以所述执行单元为粒度对所述目标计算设备进行内存管理。
根据权利要求1所述的方法，其特征在于，所述以所述执行单元为粒度对所述目标计算设备进行内存管理，包括：

将所述目标计算设备的内存划分为目标内存及预留内存；

确定所述执行单元在所述目标内存中的内存占用信息；

基于所述内存占用信息对所述目标计算设备的内存进行管理。
根据权利要求2所述的方法，其特征在于，所述确定所述执行单元在所述目标内存中的内存占用信息，包括：

将所述目标内存划分为与各个所述执行单元对应的内存块；

将所述执行单元与所述内存块间的对应关系作为所述内存占用信息。
根据权利要求3所述的方法，其特征在于，所述将所述目标内存划分为与各个所述执行单元对应的内存块，包括：

基于内存复用原则，将所述目标内存划分为与各个所述执行单元对应的内存块。
根据权利要求4所述的方法，其特征在于，所述基于所述内存占用信息对所述目标计算设备的内存进行管理，包括：

统计各个所述执行单元在所述子函数中的出现次数，将所述出现次数作为所述执行单元对应的所述内存块的使用次数，并且若所述执行单元在所述目标计算设备中出现一次，则将所述使用次数的值减1；

对于每个所述执行单元，判断对应的所述内存块的所述使用次数的值是否为0；

若所述使用次数的值为0，则允许对所述执行单元对应的所述内存块进行复用；

若所述使用次数的值不为0，则禁止对所述执行单元对应的所述内存块进行复用，并返回执行所述若所述执行单元在所述目标计算设备中出现一次，则将所述使用次数的值减1的步骤。
根据权利要求3所述的方法，其特征在于，所述将所述目标内存划分为与各个所述执行单元对应的内存块，包括：

基于执行速度最快原则，将所述目标内存划分为与各个所述执行单元对应的内存块。
根据权利要求2至6任一项所述的方法，其特征在于，所述基于所述内存占用信息对所述目标计算设备的内存进行管理之后，还包括：

应用所述预留内存对所述目标内存进行内存补偿。
根据权利要求1所述的方法，其特征在于，所述将所述目标神经网络模型剖分为与各个所述目标计算设备对应的子函数，包括：

将所述目标神经网络模型剖分为与各个所述目标计算设备的类型对应的子函数。
根据权利要求8所述的方法，其特征在于，所述目标计算设备的类型包括：中央处理器、图形处理器、现场可编程逻辑门阵列。
根据权利要求8所述的方法，其特征在于，所述目标神经网络模型中的算子包括：卷积算子、池化算子、激活算子。
根据权利要求1所述的方法，其特征在于，所述执行单元的粒度小于所述子函数的粒度。
根据权利要求1所述的方法，其特征在于，所述方法应用于深度学习编译器或部署深度学习编译器的计算机设备。
根据权利要求1所述的方法，其特征在于，所述方法应用于运行目标神经网络模型的计算机设备。
根据权利要求4所述的方法，其特征在于，所述内存复用原则为不同执行单元间复用同一个内存块。
根据权利要求4所述的方法，其特征在于，所述内存复用原则为同一个执行单元的输入、输出复用同一个内存块。
根据权利要求5所述的方法，其特征在于，所述统计各个所述执行单元在所述子函数中的出现次数，包括：

采用深度优先遍历的方式统计各个所述执行单元在所述子函数中的出现次数。
根据权利要求5所述的方法，其特征在于，所述出现次数表征所述算子的输出需要被后续算子使用的次数。
一种内存管理系统，其特征在于，包括：

第一获取模块，用于获取目标神经网络模型；

第一剖分模块，用于基于各个目标计算设备对所述目标神经网络模型中算子的运算支持，将所述目标神经网络模型剖分为与各个所述目标计算设备对应的子函数；

第一分发模块，用于分发所述子函数至对应的所述目标计算设备；

第二剖分模块，用于对于每个所述目标计算设备，均基于所述目标计算设备中各个计算单元的运算信息，将对应的子函数剖分为与各个所述计算单元对应的执行单元，以所述执行单元为粒度对所述目标计算设备进行内存管理。
一种内存管理设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至17任一项所述内存管理方法的步骤。
一种计算机非易失性可读存储介质，其特征在于，所述计算机非易失性可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至17任一项所述内存管理方法的步骤。