WO2021232769A1

WO2021232769A1 - 一种存储数据的方法及数据处理装置

Info

Publication number: WO2021232769A1
Application number: PCT/CN2020/136966
Authority: WO
Inventors: 张峰; 周乃彪; 胡英俊; 王文强; 蒋科
Original assignee: 北京市商汤科技开发有限公司
Priority date: 2020-05-18
Filing date: 2020-12-16
Publication date: 2021-11-25
Also published as: JP7164733B2; TW202145010A; TWI779438B; CN113688062B; JP2022537007A; KR20210144730A; CN113688062A

Abstract

本申请实施例公开了一种用于存储数据的方法和相关产品，该方法包括：基于待存储数据所需的存储空间大小，确定目标存储器中的至少两个候选存储空间；基于所述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，其中，每个候选存储空间对应于至少一种候选存储方案；基于所述多种候选存储方案中每种候选存储方案对应的目标权重，确定所述待存储数据的目标存储方案。

Description

[根据细则37.2由ISA制定的发明名称]　一种存储数据的方法及数据处理装置

技术领域

本申请涉及计算机领域，尤其涉及用于存储数据的方法和相关产品。

背景技术

人工智能(artificial intelligence，AI)芯片一般是由多个不同功能的计算单元、空间有限的高速共享缓存和双倍速率同步动态随机存储器(Double Data Rate Synchronous Dynamic Random Access Memory，DDR SDRAM，简称DDR)组成。

发明内容

本申请实施例公开了用于存储数据的方法和相关产品。

第一方面，本申请实施例提供了一种用于存储数据的方法，该方法包括：基于待存储数据所需的存储空间大小，确定目标存储器中的至少两个候选存储空间；基于所述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，其中，每个候选存储空间对应于至少一种候选存储方案；基于所述多种候选存储方案中每种候选存储方案的目标权重，确定所述待存储数据的目标存储方案。

第二方面，本申请实施例提供了一种数据处理装置，该装置包括：第一确定单元，用于基于待存储数据所需的存储空间大小，确定目标存储器中的至少两个候选存储空间；第二确定单元，用于基于所述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，其中，每个候选存储空间对应于至少一种候选存储方案；第三确定单元，用于基于所述多种候选存储方案中每种候选存储方案的目标权重，确定所述待存储数据的目标存储方案。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括：存储有处理器可执行指令的存储器、目标存储器和处理器，其中，所述处理器在执行所述指令时，实现如上述第一方面以及任一种可选的实现方式的方法。

第四方面，本申请实施例提供了一种芯片，该芯片包括处理器、数据接口以及上述第一方面所述的目标存储器，其中，处理器用于执行第一方面或第一方面的任意可能实现方式中的方法。

第五方面，本申请实施例提供了一种计算机可读存储介质，该计算机存储介质存储有计算机程序，该计算机程序包括程序指令，该程序指令当被电子设备的处理器执行时使该处理器执行上述第一方面以及任一种可选的实现方式的方法。

第六方面，本申请实施例提供了一种计算机程序产品，该计算机程序产品包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面以及任一种可选的实现方式的方法。

本申请实施例中，基于所述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，可以从多种候选存储方案中确定一种能够有效减少内存碎片的存储方案。

附图说明

图1为本申请实施例提供的一种用于存储数据的方法流程图；

图2为本申请实施例提供的一种计算目标权重的过程示意图；

图3为本申请实施例提供的另一种用于存储数据的方法流程图；

图4为本申请实施例提供的一种数据处理装置结构示意图；

图5为本申请实施例提供的另一种数据处理装置结构示意图；

图6是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

本申请的说明书实施例和权利要求书及上述附图中的术语“第一”、“第二”、和“第三”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元。方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

AI芯片的高速共享缓存的大小一般为几MB，目前常见的为8MB或12MB。由于 AI芯片的指令和中央处理器(Central Processing Unit，CPU)指令不同，CPU的寄存器是固定大小的，比如32位CPU的寄存器是固定32位的。然而AI芯片中没有寄存器，并且神经网络的张量(tensor)大小不是固定的，无法分配固定的存储空间给tensor。鉴于共享缓存空间有限，且待分配tensor大小不定，如果分配策略效果不佳，很容易产生内存碎片，这些内存碎片以小且不连续方式出现在不同的位置，导致这些空闲的内存无法使用，不能够充分发挥高速共享缓存的作用。实际上这些空闲内存碎片存在的方式有两种：内部碎片和外部碎片。

内部碎片的产生：因为所有的内存分配必须起始于可被4、8或16整除(视处理器体系结构而定)的地址或者因为内存管理单元(memory management unit，MMU)的分页机制的限制，决定内存分配算法仅能把预定大小的内存块分配给数据。假设当存储某个数据需要占用一个43字节的内存块时，因为没有适合大小的内存，所以它可能会获得44字节、48字节等稍大一点的字节，因此由所需大小向上取整而产生的多余空间就叫内部碎片。

外部碎片的产生：频繁的分配与回收物理页面会导致大量的、连续且小的页面块夹杂在已分配的页面中间，就会产生外部碎片。假设有一块一共有100个单位(例如一个地址)的连续空闲的内存空间，范围是0～99。如果从中申请一块内存，如10个单位，那么申请出来的内存块可以占用0～9区间。这时候如果继续申请一块内存，比如说5个单位大，第二块申请到的内存块可以占用10～14区间。如果把第一块内存块释放，然后再申请一块大于10个单位的内存块，比如说20个单位。因为刚被释放的内存块不能满足新的请求，所以只能从15开始分配出20个单位的内存块。现在整个内存空间的状态是0～9空闲，10～14被占用，15～24被占用，25～99空闲。其中0～9就是一个内存碎片了。如果10～14一直被占用，而以后申请的空间都大于10个单位，无法使用0～9的区间，则0～9区间变成外部碎片。

为充分发挥高速共享缓存的作用，本申请实施例提供了能够减少碎片的用于存储数据的方法。

本申请实施例提供的用于存储数据的方法主要应用于AI芯片中共享缓存的分配场景。应理解，AI芯片执行数据处理任务，例如文本识别、图像识别、图像超分辨率处理、语音识别、文本翻译等，均需要占用共享缓存。也就是说，本申请实施例提供的用于存储数据的方法主要应用于AI芯片执行数据处理任务的场景，但本公开实施例提供的用于存储的方法也可以应用于其他内存或缓存分配场景，本公开实施例对此不做限定。

本申请实施例提供的用于存储数据的方法还能够应用于AI模型的编译场景，即将AI模型利用编译软件编译为AI芯片可执行的指令序列的场景。在AI模型的编译场景中，数据处理装置可执行本申请实施例提供的用于存储数据的方法来模拟AI模型执行处理操作时共享缓存的分配，进而对AI模型编译得到能指示共享缓存的内存分配和释放的指令序列。AI芯片执行编译AI模型得到的指令序列时，共享缓存的内存分配和释放流程与执行本申请实施例提供的用于存储数据的方法得到的内存分配和释放流程相同。在这种场景中，AI芯片在执行数据处理任务不需要实时执行本申请实施例提供的用于存储数据的方法，仅需执行指令序列，花费时间更短。

在上述场景中，数据处理装置中的AI芯片在执行数据处理任务时，可以减少内存碎片的产生，提高缓存分配的成功率。

下面先介绍本公开实施例中出现的一些术语的含义。

AI芯片的共享缓存是在数据处理装置的程序运行时动态分配的，其中，共享缓存可以划分成多个存储空间，如缓存块，不同缓存块的大小可以相同或不同，可以基于缓存数据的需求来决定。在本公开实施例中，可以对缓存块的状态进行标记，例如，已分配的块可以被标记为used_item，未分配的块可以被标记为free_item，初始状态是整个共享缓存为一个free_item，经过一定次数的内存分配和释放后，可能有多个used_item，这些used_item之间可能有1个或0个free_item。已分配的块是指被占用的存储空间，未分配的块是指未被占用的存储空间。

在一些实施例中，编译器产生指令序列给AI芯片，每个指令在指令序列中的序号称为指令序号。编译器为数据处理装置运行的一个软件或一段程序代码。每个tensor(可以理解为数据)可能会被多条指令使用(作为指令的输出或者作为指令的输入)，这些指令中最小的序号可被称作tensor的起始序号(start program counter，简称为start_pc)，最大的序号可被称作tensor的结束序号(end program counter,简称为end_pc)，end_pc和start_pc的差值可被称作tensor的生命周期。数据的数据释放时间是指该数据占用的地址被释放的时间，即数据被释放的时间。

图1为本申请实施例提供的一种用于存储数据的方法流程图。

101、数据处理装置基于待存储数据所需的存储空间大小，确定目标存储器中的至少两个候选存储空间。

可选地，待存储数据可以为输入图片数据，或者是通过神经网络对输入图片进行处理所产生的中间结果和/或最终结果，例如，待存储数据可以为特征图的至少一部分，或者，待存储数据也可以为模型数据，例如模型的权重，等等，但本公开实施例对此不做限定。

每个候选存储空间(对应于free_item)的大小大于或等于存储上述待存储数据所需占用的存储空间的大小。数据处理装置可以是服务器、台式电脑、笔记本电脑、手机、平板电脑等可执行数据处理操作的设备。可选的，上述目标存储器为人工智能AI芯片中的共享缓存。

数据处理装置可以从上述目标存储器未分配的多个离散存储空间(即free_item)中，确定可存储上述待存储数据的两个或两个以上候选存储空间。在实际应用中，数据处理装置中的处理器可以线性扫描共享缓存的所有存储空间(即item)，将大于或者等于待存储数据(如tensor)所需占用的存储空间的free_item作为候选存储空间，得到上述至少两个候选存储空间。

102、基于上述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将上述待存储数据存储至上述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重。

其中，每个候选存储空间对应于至少一种候选存储方案。上述待存储数据的第一数据释放时间可以是上述待存储数据被释放的时间，即上述待存储数据占用的存储空间被释放的时间。上述待存储数据的生命周期可以是上述待存储数据被释放的时间与上述待存储数据被存储的时间的间隔。示例性的，每个候选存储方案的目标权重与上述待存储数据的第一数据释放时间和第二数据释放时间之间的间隔负相关，其中，上述第二数据释放时间为与上述待存储数据在上述候选存储方案中的存储位置相邻的存储空间所存储数据的数据释放时间。后续再详述步骤102的实现方式。

103、基于上述多种候选存储方案中每种候选存储方案的目标权重，确定上述待存储数据的目标存储方案。

基于上述多种候选存储方案中每种候选存储方案的目标权重，确定上述待存储数据的目标存储方案可以是数据处理装置在上述多种候选存储方案各自的目标权重中，将最大的一个目标权重对应的候选存储方案确定为上述待存储数据的目标存储方案；也可以是数据处理装置在上述多种候选存储方案各自的目标权重中，将超过预设权重阈值的任一个目标权重对应的候选存储方案确定为上述待存储数据的目标存储方案；其中，上述权重阈值可以是0.6、0.75、0.8等。

可选的，数据处理装置执行步骤103之后，还可以执行如下操作：将上述待存储数据存储至上述目标存储方案对应的候选存储空间的第一地址至第二地址；将上述第一地址至上述第二地址对应的存储空间设置为已分配的存储空间(即used_item)。可选的，上述第一地址和上述第二地址中的一个为上述目标存储方案对应的候选存储空间的起始地址，或者，上述第一地址和上述第二地址中的一个为上述目标存储方案对应的候选存储空间的结束地址。在一些实施例中，数据处理装置在上述待存储数据对应的第一数据释放时间到达之后，还可以执行如下操作：释放上述第一地址至上述第二地址对应的存储空间；将上述第一地址至上述第二地址对应的存储空间设置为未分配的存储空间(即free_item)。在一些实施例中，数据处理装置运行的某个内存管理软件来执行图1的方法流程。

在一些实施例中，若目标存储方案对应的候选存储空间大于待存储数据所需的存储空间，则在将待存储数据存储至上述第一地址至第二地址后，将目标存储方案对应的候选存储空间中未存储待存储数据的空间仍设置为未分配的存储空间(即free_item)。例如，假设第一地址为目标存储方案对应的候选存储空间的起始地址，则将第二地址的下一个地址到目标存储方案对应的候选存储空间的结束地址之间的存储空间设置为未分配的存储空间。又例如，假设第二地址为目标存储方案对应的候选存储空间的结束地址，则将目标存储方案对应的候选存储空间的起始地址到第一地址的上一个地址之间的存储空间设置为未分配的存储空间。

本申请实施例中，基于上述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将上述待存储数据存储至上述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，根据多个目标权重，可以从多种候选存储方案中确定一种能够有效减少内存碎片的存储方案。

在一些实施例中，每个候选存储空间对应的候选存储方案包括第一候选存储方案和第二候选存储方案中的至少一种，其中，上述第一候选存储方案中的起始存储地址为上述候选存储空间的起始地址，上述第二候选存储方案中的结束存储地址为上述候选存储空间的结束地址。也就是说，每个候选存储空间对应1种或2种分配方法，即靠左分配(对应于第一候选存储方案)和靠右分配(对应于第二候选存储方案)，可以分别计算这两种分配方法的目标权重。靠左分配是指将待存储数据存储至某个候选存储空间的起始地址至某个地址，即为该待存储数据分配该候选存储空间的起始地址至后面连续多个地址。靠右分配是指将待存储数据存储至某个候选存储空间的某个地址至结束地址，即为该待存储数据分配该存储空间的结束地址以及该结束地址前面连续的多个地址。当某个候选存储空间的大小大于存储待存储数据所需的存储空间的大小时，该候选存储空间有两种分配方法(即靠左分配和靠右分配不同)；当某个候选存储空间的大小等于存储待存储数据所需的存储空间的大小时，该候选存储空间只有1种分配方法(即靠左分配和靠右分配相同)。举例来说，有10个候选存储空间的大小大于存储待存储数据所需的存储空间的大小，则数据处理装置执行20轮目标权重计算，即计算每个候选存储空间采用靠左分配方式对应的目标权重和采用靠右分配方式对应的目标权重。

在该实现方式中，采用第一候选存储方案或第二候选存储方案存储待存储数据之后，在该待存储数据占用的存储空间被释放之后能够与其相邻的存储空间合并为一个更大的存储空间，以减少内存碎片。

图2为本申请实施例提供的一种计算候选存储方案的目标权重的过程示意图。如图2所示，如211-216所示的黑色的矩形区域表示目标存储器中已分配的存储空间(即used_item)，如201-205所示的白色的矩形区域表示该目标存储器中未分配的存储空间(即free_item)，假设存储空间201、存储空间203、存储空间205均可存储待存储数据，存储空间201和存储空间203的大小大于存储待存储数据所需的存储空间的大小，存储空间205的大小等于存储待存储数据所需的存储空间的大小。如图2所示，在权重计算中，图中黑色矩形区域表示存储空间被占用的部分，白色矩形区域表示存储空间未被占用的部分，矩形区域的上沿表示对应的存储空间的起始地址，矩形区域的下沿表示对应的存储空间的结束地址。在第1轮目标权重计算中，计算将待存储数据存储至存储空间201的起始地址至某个地址(靠左分配)时的目标权重。在第2轮目标权重计算中，计算将待存储数据存储至存储空间201的某个地址至结束地址(即靠右分配)时的目标权重。在第3轮目标权重计算中，计算将待存储数据存储至存储空间203的起始地址至某个地址(靠左分配)时的目标权重。在第4轮目标权重计算中，计算将待存储数据存储至存储空间203的某个地址至结束地址(靠右分配)时的目标权重。在第5轮目标权重计算中，计算将待存储数据存储至存储空间205的起始地址至结束地址(即靠左分配和靠右分配相同)时的目标权重；以此类推。

在一些实施例中，数据处理装置在第N轮目标权重计算中，计算将上述待存储数据存储至某个候选存储空间的目标权重，可以将该目标权重作为第一目标权重，之后还可执行如下操作：在当前最大目标权重小于上述第一目标权重的情况下，将上述当前最大目标权重更新为上述第一目标权重。可选的，数据处理装置执行第1轮的目标权重计算得到一个目标权重之后，将该目标权重作为当前最大目标权重并保存；将第i轮目标权重计算得到的目标权重与保存的当前最大目标权重进行比较，如果新计算得到的目标权重大于当前最大目标权重，则将当前最大目标权重更新为新计算得到的目标权重，否则，保持当前最大目标权重不变，其中i为大于1的正整数。

前述实施例未详述确定将待存储数据存储到至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重的实现方式，下面以计算参考候选存储方案的目标权重为例介绍一些计算目标权重可选的实现方式。上述参考候选存储方案为上述至少两个候选存储空间中任一种候选存储方案。

在一个可选的实现方式中，基于待存储数据的第一数据释放时间和第二数据释放时间之间的时间间隔，可以确定候选存储方案的目标权重。参考候选存储方案对应的目标权重与上述待存储数据的第一数据释放时间和第二数据释放时间之间的时间间隔负相关，其中，上述第二数据释放时间为与上述待存储数据在上述参考候选存储方案中的存储位置相邻的存储空间所存储数据的数据释放时间。示例性的，参考候选存储方案对应的目标权重为上述待存储数据的第一数据释放时间和第二数据释放时间之间的间隔的倒数。举例来说，第一数据释放时间为t1，第二数据释放时间为t2，参考候选存储方案对应的目标权重为

以图2为例，对于存储空间201，其相邻的存储空间为211或212。在第1轮权重计算时，由于为靠左分配，存储空间201的相邻的存储空间为211，在第2轮权重计算时，由于为靠右分配，存储空间201的相邻的存储空间为212。对于存储空间205，其相邻的存储空间可以为215，也可以为216。

在一个可选的实现方式中，上述基于上述待存储数据对应的第一数据释放时间和生命周期中的至少一项，确定将上述待存储数据存储至上述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：基于上述待存储数据的生命周期和上述候选存储方案对应的候选存储空间的起始地址，确定上述候选存储方案的目标权重。可选的，上述目标存储方案的确定使得上述目标存储器中存储的数据的生命周期随着存储地址递增或递减。可以理解，数据处理装置执行本申请实施例提供的用于存储数据的方法可以使得上述目标存储器中存储的数据的生命周期随着存储地址递增或递减。也就是说，尽量将生命周期小的待存储数据存储在存储空间的一侧(如靠左侧存储)，将生命周期长的待存储数据存储在存储空间的另一侧(如靠右侧存储)。在一些实施例中，上述基于上述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将上述待存储数据存储至上述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：确定上述待存储数据对应的最大生命周期；确定上述待存储数据的生命周期与上述最大生命周期之间的第一比值；确定上述候选存储方案对应的候选存储空间的起始地址与上述目标存储器的结束地址之间的第二比值；基于第一比值和第二比值，确定上述候选存储方案的目标权重。示例性的，上述候选存储方案的目标权重与上述第一比值和上述第二比值之差的绝对值负相关。待存储数据对应的最大生命周期可以是指令序列中各指令分别对应的数据的生命周期中最大的生命周期，即与待存储数据相关的数据占用目标存储器的最大时长。示例性的，待存储数据对应的最大生命周期为本次图像处理过程中产生的所有需要存储的数据的生命周期的最大值，包括已分配内存和尚未分配内存的所有数据的生命周期的最大值，但本公开实施例对此不限于此。

在一些实施例中，候选存储空间的起始地址可以表示为候选存储空间的起始地址相对于目标存储器的起始地址的偏移值，目标存储器的结束地址可以表示为目标存储器的结束地址相对于目标存储器的起始地址的偏移值。

在一个可选的实现方式中，可以确定候选存储空间的起始地址与目标存储器的总存储空间大小之间的第二比值，并将该第二比值作为该候选存储空间对应的至少一种候选存储方案的第二比值，但本公开实施例不限于此。

在一个可选的实现方式中，上述基于上述待存储数据对应的第一数据释放时间和生命周期中的至少一项，确定将上述待存储数据存储至上述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：基于上述待存储数据对应的第一数据释放时间和与上述候选存储方案对应的存储位置相邻的存储空间所存储数据的第二数据释放时间，确定上述候选存储方案的第一权重；基于上述待存储数据的生命周期和上述候选存储方案对应的候选存储空间的起始地址，确定上述候选存储方案的第二权重；基于上述第一权重和上述第二权重的加权和，得到上述候选存储方案的目标权重。

在该实现方式中，综合考虑待存储数据的第一数据释放时间和生命周期，能够更有效的减少内存碎片。

在一个可选的实现方式中，上述基于上述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将上述待存储数据存储至上述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：基于上述待存储数据的第一数据释放时间、生命周期和多种候选存储方案中每种候选存储方案对应的存储空间大小，确定所述每种候选存储方案的目标权重。其中，候选存储方案对应的存储空间大小可以是该候选存储方案对应的候选存储空间的大小。

在一些实施例中，上述候选存储方案对应的目标权重包括第一指标、第二指标以及第三指标的加权和。其中，上述第一指标由上述待存储数据的第一数据释放时间和第二数据释放时间之间的间隔确定，上述第二数据释放时间为与上述待存储数据在上述候选存储方案中的存储位置相邻的存储空间所存储数据的数据释放时间；上述第二指标由第一比值和第二比值之间的差值确定，上述第一比值为上述待存储数据的生命周期与上述待存储数据对应的最大生命周期之间的比值，上述第二比值为上述候选存储方案对应的候选存储空间的起始地址与上述目标存储器的结束地址之间的比值；上述第三指标由上述候选存储方案对应的存储空间与上述目标存储器的总存储空间的比值确定。

在该实现方式中，综合考虑待存储数据的第一数据释放时间、生命周期和所需的存储空间大小，以便于确定的目标存储方案能更有效的减少内存碎片，并减少占用的存储空间。

可选的，上述候选存储方案对应的目标权重满足如下公式(1)：

weight＝α*w1+β*w2+γ*w3 (1)；

其中，α、β、γ均为不小于0的目标权重系数，且α+β+γ＝1，weight表示上述候选存储方案对应的目标权重，w1表示第一指标，w2表示第二指标，w3表示第三指标。可选的，cost1＝abs(e-e1)，w1＝1/cost1，e表示上述第一数据释放时间，e1表示上述第二数据释放时间，abs(e-e1)表示e和e1的差值的绝对值。可选的，cost2＝abs((c/c_max)-(start/mem_size))，w2＝1-cost2，c表示上述待存储数据的生命周期，c_max表示上述待存储数据对应的最大生命周期，start表示上述候选存储方案对应的候选存储空间的起始地址，mem_size表示目标存储器的总存储空间的大小，可以表示为目标存储器的结束地址。可选的，w3＝1-s_cand/mem_size，s_cand表示候选存储方案对应的候选存储空间的大小，mem_size表示上述目标存储器的总存储空间的大小。

在该实现方式中，目标权重系数α、β和γ是通过测试得到的结果。可以按一定的步进改变α、β和γ的值，并保证α+β+γ＝1，这样可以得到多组不同的参数组合方式，运行一组测试集合，并保存每组参数组合方式在该测试集合下的结果。从而最终选择一组性能优越的参数组合方式。

在该实现方式中，计算候选存储方案的目标权重的方式为三种分配原则的综合结果。 w1对应第一种分配原则，该原则是尽量分配在end_pc相近的位置，使得相邻存储空间释放时间相近，有利于合并成大的空闲存储空间，从而减少内存碎片。每个数据对应一个end_pc，每个数据对应的end_pc表示该数据占用的存储空间被释放的时间点。尽量分配在end_pc相近的位置可以将尽量将待存储数据分配在对应的end_pc与该待存储数据对应的end_pc较接近的数据相邻的位置。举例来说，目标存储器中某个存储空间存储的数据对应的end_pc与该待存储数据对应的end_pc较接近，则将该待存储数据分配在于该存储空间相邻的空间存储空间。w2对应第二种分配原则，该原则是将生命周期短的数据(分配释放频繁的)与生命周期长的数据分段分配，将分配和释放频繁的数据所设置的位置尽量接近，也可减少内存碎片。w3对应第三种分配原则，该原则是把既能满足需求，又是最小的空闲存储空间分配给待存储数据。在该实现方式中，结合多种分配原则来为待分配数据分配地址，可以有效减少内存碎片。

应理解，数据处理装置可以结合这三种分配原则中任意两种来计算目标权重，也可以仅采用根据第一种原则或者第二种原则来计算目标权重。举例来说，上述候选存储方案对应的目标权重满足如下公式(2)：

weight＝α*w1+β*w2 (2)；

其中，式(2)中的w1、w2分别与式(1)中w1、w2相同，α、β均为大于0的权重系数，且α+β＝1。

又举例来说，上述候选存储方案对应的目标权重满足如下公式(3)：

weight＝α*w1+γ*w3 (3)；

其中，式(3)中的w1、w3分别与式(1)中w1、w3相同，α、γ均为大于0的权重系数，且α+γ＝1。

又举例来说，上述候选存储方案对应的目标权重满足如下公式(4)：

weight＝β*w2+γ*w3 (4)；

其中，式(4)中的w2、w3分别与式(1)中w2、w3相同，β、γ均为大于0的目标权重系数，且β+γ＝1。

又举例来说，上述候选存储方案对应的目标权重满足如下公式(5)：

weight＝w2＝1-cost2 (5)；

又举例来说，上述候选存储方案对应的目标权重满足如下公式(6)：

weight＝w1＝1/cost1 (6)；

在该实现方式中，结合多种分配原则来为待分配数据分配地址，可以有效减少内存碎片。

图3为本申请实施例提供的另一种用于存储数据的方法流程图。如图3所示，该方法可包括以下步骤。

301、数据处理装置从目标存储器未分配的多个离散存储空间中，确定可存储待存储数据的两个或两个以上候选存储空间。

302、在第N轮目标权重计算中，基于待存储数据的第一数据释放时间和生命周期中的至少一项，计算将待存储数据存储至第一候选存储空间的第一目标权重。

可选的，上述第一候选存储空间为上述两个或两个以上候选存储空间中任一候选存储空间，计算将待存储数据存储至第一候选存储空间的第一目标权重可以是采用式(1)至式(6)中的任一个来计算目标权重。可以理解，数据处理装置是计算假定将待存储数据存储至第一候选存储空间时的目标权重，并不执行将待存储数据存储至第一候选存储空间的操作。上述N为大于0的整数。在实际应用中，数据处理装置可以计算每个候选存储空间存储待存储数据对应的一个目标权重或者两个目标权重，每轮目标权重计算可计算得到一个目标权重。

303、更新当前最大目标权重。

在一些实施例中，当N＝1时，更新当前最大目标权重可以是将第1轮计算得到的目标权重保存为当前最大目标权重。当N>1时，更新当前最大目标权重可以是在第N轮计算得到的目标权重大于当前保存的当前最大目标权重的情况下，将当前最大目标权重更新为在第N轮计算得到的目标权重；在第N轮计算得到的目标权重不大于当前保存的当前最大目标权重的情况下，保持当前最大目标权重不变。

304、判断是否停止下一轮目标权重的计算。

在一些实施例中，判断是否停止下一轮目标权重的计算可以是在当前计算得到每种候选存储方案的目标权重的情况下，判断停止下一轮目标权重的计算；在当前未计算得到每种候选存储方案的目标权重的情况下，判断继续下一轮目标权重的计算。若不停止下一轮目标权重计算，则N+1，并执行步骤302；若停止下一轮目标权重计算，执行步骤305。

305、将当前最大目标权重对应的候选存储方案作为目标存储方案，并将待存储数据存储至目标存储方案对应的候选存储空间的第一地址至第二地址。

306、将上述第一地址至上述第二地址对应的存储空间设置为已分配的存储空间。

307、在第一数据释放时间到达后，释放上述第一地址至上述第二地址。

在一些实施例中，可以将上述第一地址至上述第二地址对应的存储空间设置为未分配的存储空间。

308、若第二地址为候选存储空间的结束地址，则在上述第二地址的下一地址至第三地址(第三地址位于第二地址的右侧)均未存储数据的情况下，将上述第一地址至上述第三地址设置为一个未分配的离散存储空间。其中，以第三地址的下一地址为起始地址的存储空间为已分配的存储空间(used_item)。

步骤308可以替换为：若第一地址为候选存储空间的起始地址，则在上述目标存储器的第四地址(第四地址位于第一地址的左侧)至上述第一地址的上一地址均未存储数据的情况下，将上述第四地址至上述第二地址设置为一个未分配的离散存储空间。其中，以第四地址的上一地址为结束地址的存储空间为已分配的存储空间(used_item)。

这样，可以快速地将相邻的两个未分配的存储空间设置为一个较大的未分配的存储空间。

本申请实施例提供的方法，能够有效减少内存碎片。

前述实施例描述的用于存储数据的方法可以应用于数据处理装置通过AI芯片执行数据处理任务的场景，即实时管理共享缓存的地址分配和释放；也可以应用于AI模型的编译场景。在AI模型的编译场景中，数据处理装置可执行本申请实施例提供的用于存储数据的方法来模拟AI模型执行处理操作时共享缓存的分配，进而对AI模型编译得到能指示共享缓存的内存分配和释放的指令序列。数据处理装置中的AI芯片可执行指令序列来执行数据处理任务。AI芯片在执行指令序列来执行数据处理任务的过程中，按照指令序列中的指令将数据存储至共享缓存以及释放共享缓存中的数据，可以提供共享缓存的利用率。

图4为本申请实施例提供的一种数据处理装置的结构示意图，如图4所示，该装置包括第一确定单元401、第二确定单元402和第三确定单元403。

第一确定单元401，用于基于待存储数据所需的存储空间大小，确定目标存储器中的至少两个候选存储空间。

第二确定单元402，用于基于上述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将上述待存储数据存储至上述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，其中，每个候选存储空间对应于至少一种候选存储方案。

第三确定单元403，用于基于上述多种候选存储方案中每种候选存储方案的目标权重，确定上述待存储数据的目标存储方案。

在一个可选的实现方式中，上述候选存储空间对应的候选存储方案包括第一候选存储方案和第二候选存储方案中的至少一种，其中，上述第一候选存储方案中的起始存储地址为上述候选存储空间的起始地址，上述第二候选存储方案中的结束存储地址为上述候选存储空间的结束地址。

在一个可选的实现方式中，第二确定单元401还用于对于每种候选存储方案，基于所述待存储数据的第一数据释放时间和第二数据释放时间，确定该候选存储方案的目标权重，其中，所述第二数据释放时间为与所述待存储数据在所述候选存储方案中的存储位置相邻的存储空间所存储数据的数据释放时间。

在一个可选的实现方式中，上述候选存储方案对应的目标权重与上述待存储数据的第一数据释放时间和第二数据释放时间之间的间隔负相关。

在一个可选的实现方式中，第二确定单元402，还用于对于每种候选存储方案，基于上述待存储数据的生命周期和上述候选存储方案对应的候选存储空间的起始地址，确定上述候选存储方案的目标权重。

在一个可选的实现方式中，第二确定单元402，还用于确定所述待存储数据对应的最大生命周期；确定上述待存储数据的生命周期与上述最大生命周期之间的第一比值；确定上述候选存储方案对应的候选存储空间的起始地址与上述目标存储器的结束地址之间的第二比值；基于第一比值和第二比值，确定上述候选存储方案的目标权重。

在一个可选的实现方式中，上述候选存储方案的目标权重与上述第一比值和上述第二比值之差的绝对值负相关。

在一个可选的实现方式中，第二确定单元402，还用于对于每种候选存储方案，基于上述待存储数据对应的第一数据释放时间和第二数据释放时间，确定上述候选存储方案的第一权重，其中，第二数据释放时间为与待存储数据在该候选存储方案中的存储位置相邻的存储空间所存储数据的数据释放时间；基于上述待存储数据的生命周期和上述候选存储方案对应的候选存储空间的起始地址，确定上述候选存储方案的第二权重；基于上述第一权重和上述第二权重的加权和，得到上述候选存储方案的目标权重。

在一个可选的实现方式中，第二确定单元402，还用于对于每种候选存储方案，基于上述待存储数据的第一数据释放时间、生命周期和该候选存储方案对应的存储空间大小，确定该候选存储方案的目标权重。

在一个可选的实现方式中，第二确定单元402，还用于基于所述待存储数据对应的第一数据释放时间和与第二数据释放时间，确定该候选存储方案的第一权重，其中，所述第二数据释放时间为与所述待存储数据在该候选存储方案中的存储位置相邻的存储空间所存储数据的数据释放时间；基于所述待存储数据的生命周期和该候选存储方案对应的候选存储空间的起始地址，确定该候选存储方案的第二权重；基于所述候选存储方案对应的候选存储空间的大小和所述目标存储器的总存储空间的大小，确定该候选存储方案的第三权重；基于所述第一权重、所述第二权重和所述第三权重的加权和，得到该候选存储方案的所述目标权重。

在一个可选的实现方式中，第二确定单元402，还用于对于每种候选存储方案，基于所述待存储数据的第一数据释放时间和该候选存储方案对应的存储空间大小，确定该候选存储方案的目标权重。

在一个可选的实现方式中，第二确定单元402，还用于对于每种候选存储方案，基于所述待存储数据的生命周期和该候选存储方案对应的存储空间大小，确定该候选存储方案的目标权重。

在一个可选的实现方式中，所述装置还包括设置单元404，用于将所述待存储数据存储至所述目标存储方案对应的候选存储空间的第一地址至第二地址；并将所述第一地址至所述第二地址对应的存储空间设为已分配的存储空间；其中，所述第一地址和所述第二地址中的一个为所述目标存储方案对应的候选存储空间的起始地址，或者，所述第一地址和所述第二地址中的一个为所述目标存储方案对应的候选存储空间的结束地址。

在一个可选的实现方式中，所述装置还包括释放单元405，用于在所述待存储数据对应的第一数据释放时间到达之后，释放所述第一地址至所述第二地址对应的存储空间；设置单元404还用于将所述第一地址至所述第二地址对应的存储空间设置为未分配的存储空间。

在一个可选的实现方式中，第三确定单元403，还用于在所述多种候选存储方案各自的目标权重中，将最大的一个目标权重对应的候选存储方案确定为所述待存储数据的所述目标存储方案；或所述多种候选存储方案各自的目标权重中，将超过预设权重阈值的任一个目标权重对应的候选存储方案确定为所述目标存储方案。

在一个可选的实现方式中，上述目标存储器为人工智能AI芯片中的共享缓存。

在一个可选的实现方式中，第一确定单元401，还用于从上述目标存储器未分配的多个离散存储空间中，确定可存储上述待存储数据的上述至少两个候选存储空间，其中所述候选存储空间的大小大于或等于待存储数据占用的存储空间。

在一个可选的实现方式中，设置单元404，还用于若第二地址为候选存储空间的结束地址，在上述第二地址的下一地址至第三地址均未存储数据的情况下，将上述第一地址至上述第三地址设置为一个未分配的离散存储空间。其中，以第三地址的下一地址为起始地址的存储空间为已分配的存储空间。

在一个可选的实现方式中，设置单元404，还用于若第一地址为候选存储空间的起始地址，在上述目标存储器的第四地址至上述第一地址的上一地址均未存储数据的情况下，将上述第四地址至上述第二地址设置为一个未分配的离散存储空间。其中，以第四地址的上一地址为结束地址的存储空间为已分配的存储空间。

图5是本申请实施例提供的一种数据处理装置的结构示意图。如图5所示，数据处理装置包括AI芯片510和存储器520，AI芯片510可从存储器520获取数据和指令，并将最终的处理结果输出至存储器520，AI芯片510中的计算单元501执行处理任务，计算单元501在处理数据的过程中将数据存储至共享缓存502(即目标存储器)以及从该共享缓存502获取数据。共享缓存502的地址分配和释放可采用前述实施例中的用于存储数据的方法。在一些实施例中，存储器520可能位于AI芯片510内部。在一些实施例中，在AI芯片执行某种数据处理任务时，数据处理装置运行的某个内存管理软件执行前述实施例中的用于存储数据的方法来管理共享缓存的地址分配和释放。在一些实施例中，在AI芯片执行某种数据处理任务时，执行从存储器读取的指令来实现数据处理任务，在实现数据处理任务的过程中从存储器读取的指令指示了共享缓存的地址分配和释放。也就是说，AI芯片执行从存储器读取的指令就可实现与前述实施例相同的内存分配和释放流程。

图6是本申请实施例提供的一种电子设备的结构示意图，该电子设备600可因配置或性能不同而产生比较大的差异，可以包括一个或多个中央处理器(central processing units，CPU)622(例如，一个或多个处理器)和存储器632，一个或多个存储应用程序642或数据644的存储介质630(例如一个或多个海量存储设备)，一个或多个AI芯片624。其中，存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或多个模块(图示没标出)，每个模块可以包括对电子设备中的一系列指令操作。更进一步地，中央处理器622可以设置为与存储介质630通信，在电子设备600上执行存储介质630中的一系列指令操作。AI芯片624可执行CPU 622分配的各种数据处理任务。电子设备600可以为本申请提供的数据处理装置。

电子设备600还可以包括一个或多个电源626，一个或多个有线或无线网络接口650，一个或多个输入输出接口658，和/或，一个或多个操作系统641，例如Windows Server ^TM，Mac OS X ^TM，Unix ^TM,Linux ^TM，FreeBSD ^TM等等。

上述实施例中由数据处理装置所执行的步骤可以基于该图6所示的电子设备结构。具体的，中央处理器622可实现图4中各单元的功能。

本申请实施例提供了一种计算机可读存储介质，上述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，上述计算机程序被处理器执行时实现：基于待存储数据所需的存储空间大小，确定目标存储器中的至少两个候选存储空间；基于上述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将上述待存储数据存储至上述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，其中，每个候选存储空间对应于至少一种候选存储方案；基于上述多种候选存储方案中每种候选存储方案的目标权重，确定上述待存储数据的目标存储方案。该计算机可读存储介质可以是非易失性的存储介质。

本申请实施例提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行前述实施例所提供的用于存储数据的方法。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种用于存储数据的方法，其特征在于，包括：

基于待存储数据所需的存储空间大小，确定目标存储器中的至少两个候选存储空间；

基于所述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，其中，每个候选存储空间对应于至少一种候选存储方案；

基于所述多种候选存储方案中每种候选存储方案的目标权重，确定所述待存储数据的目标存储方案。
根据权利要求1所述的方法，其特征在于，所述候选存储空间对应的候选存储方案包括第一候选存储方案和第二候选存储方案中的至少一种，其中，所述第一候选存储方案中的起始存储地址为所述候选存储空间的起始地址，所述第二候选存储方案中的结束存储地址为所述候选存储空间的结束地址。
根据权利要求1或2所述的方法，其特征在于，所述基于所述待存储数据对应的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：

对于每种候选存储方案，基于所述待存储数据的第一数据释放时间和第二数据释放时间，确定该候选存储方案的目标权重，其中，所述第二数据释放时间为与所述待存储数据在所述候选存储方案中的存储位置相邻的存储空间所存储数据的数据释放时间。
根据权利要求3所述的方法，其特征在于，该候选存储方案的所述目标权重与所述第一数据释放时间和所述第二数据释放时间之间的时间间隔负相关。
根据权利要求1或2所述的方法，其特征在于，所述基于所述待存储数据对应的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：

对于每种候选存储方案，基于所述待存储数据的生命周期和所述候选存储方案对应的候选存储空间的起始地址，确定该候选存储方案的目标权重。
根据权利要求5中所述的方法，其特征在于，所述对于每种候选存储方案，基于所述待存储数据的生命周期和该候选存储方案对应的候选存储空间的起始地址，确定该候选存储方案的目标权重，包括：

确定所述待存储数据对应的最大生命周期；

确定所述待存储数据的生命周期与所述最大生命周期之间的第一比值；

确定该候选存储方案对应的候选存储空间的起始地址与所述目标存储器的结束地址之间的第二比值；

基于所述第一比值和所述第二比值，确定该候选存储方案的所述目标权重。
根据权利要求6所述的方法，其特征在于，所述候选存储方案的所述目标权重与所述第一比值和所述第二比值之差的绝对值负相关。
根据权利要求1或2所述的方法，其特征在于，所述基于所述待存储数据对应的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：

对于每种候选存储方案，

基于所述待存储数据对应的第一数据释放时间和与第二数据释放时间，确定该候选存储方案的第一权重，其中，所述第二数据释放时间为与所述待存储数据在该候选存储方案中的存储位置相邻的存储空间所存储数据的数据释放时间；

基于所述待存储数据的生命周期和该候选存储方案对应的候选存储空间的起始地址，确定该候选存储方案的第二权重；

基于所述第一权重和所述第二权重的加权和，得到该候选存储方案的目标权重。
根据权利要求1或2所述的方法，其特征在于，所述基于所述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：

对于每种候选存储方案，基于所述待存储数据的第一数据释放时间、生命周期和该候选存储方案对应的存储空间大小，确定该候选存储方案的目标权重。
根据权利要求9所述的方法，其特征在于，所述确定该候选存储方案的目标权重，包括：

基于所述待存储数据对应的第一数据释放时间和与第二数据释放时间，确定该候选存储方案的第一权重，其中，所述第二数据释放时间为与所述待存储数据在该候选存储方案中的存储位置相邻的存储空间所存储数据的数据释放时间；

基于所述待存储数据的生命周期和该候选存储方案对应的候选存储空间的起始地址，确定该候选存储方案的第二权重；

基于所述候选存储方案对应的候选存储空间的大小和所述目标存储器的总存储空间的大小，确定该候选存储方案的第三权重；

基于所述第一权重、所述第二权重和所述第三权重的加权和，得到该候选存储方案的所述目标权重。
根据权利要求1或2所述的方法，其特征在于，所述基于所述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：

对于每种候选存储方案，基于所述待存储数据的第一数据释放时间和该候选存储方案对应的存储空间大小，确定该候选存储方案的目标权重。
根据权利要求1或2所述的方法，其特征在于，所述基于所述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，包括：

对于每种候选存储方案，基于所述待存储数据的生命周期和该候选存储方案对应的存储空间大小，确定该候选存储方案的目标权重。
根据权利要求1至12任一项所述的方法，其特征在于，所述方法还包括：

将所述待存储数据存储至所述目标存储方案对应的候选存储空间的第一地址至第二地址；

将所述第一地址至所述第二地址对应的存储空间设置为已分配的存储空间；

其中，所述第一地址和所述第二地址中的一个为所述目标存储方案对应的候选存储空间的起始地址，或者，所述第一地址和所述第二地址中的一个为所述目标存储方案对应的候选存储空间的结束地址。
根据权利要求13所述的方法，其特征在于，所述方法还包括：

在所述待存储数据对应的第一数据释放时间到达之后，释放所述第一地址至所述第二地址对应的存储空间；并将所述第一地址至所述第二地址对应的存储空间设置为未分配的存储空间。
根据权利要求1至14任一项所述的方法，其特征在于，所述基于所述多种候选存储方案中每种候选存储方案的目标权重，确定所述待存储数据的目标存储方案，包括：

在所述多种候选存储方案各自的目标权重中，将最大的一个目标权重对应的候选存储方案确定为所述待存储数据的所述目标存储方案；或

在所述多种候选存储方案各自的目标权重中，将超过预设权重阈值的任一个目标权重对应的候选存储方案确定为所述目标存储方案。
根据权利要求1至15任一项所述的方法，其特征在于，所述目标存储器为人工智能AI芯片中的共享缓存。
一种数据处理装置，其特征在于，包括：

第一确定单元，用于基于待存储数据所需的存储空间大小，确定目标存储器中的至少两个候选存储空间；

第二确定单元，用于基于所述待存储数据的第一数据释放时间和生命周期中的至少一项，确定将所述待存储数据存储至所述至少两个候选存储空间的多种候选存储方案中每种候选存储方案的目标权重，其中，每个候选存储空间对应于至少一种候选存储方案；

第三确定单元，用于基于所述多种候选存储方案中每种候选存储方案的目标权重，确定所述待存储数据的目标存储方案。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被电子设备的处理器执行时，使所述处理器执行权利要求1至16任一项所述的方法。
一种电子设备，其特征在于，包括存储有处理器可执行指令的存储器、目标存储器和处理器，其中，所述处理器，在执行所述指令时用于实现如权利要求1至16任一项所述的方法。
根据权利要求19所述的电子设备，其特征在于，所述电子设备为AI芯片，所述目标存储器为所述AI芯片中的共享缓存。