CN111694768A - 运算方法、装置及相关产品 - Google Patents

运算方法、装置及相关产品 Download PDF

Info

Publication number
CN111694768A
CN111694768A CN201910197509.2A CN201910197509A CN111694768A CN 111694768 A CN111694768 A CN 111694768A CN 201910197509 A CN201910197509 A CN 201910197509A CN 111694768 A CN111694768 A CN 111694768A
Authority
CN
China
Prior art keywords
offline model
model file
stored
weight
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910197509.2A
Other languages
English (en)
Other versions
CN111694768B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cambricon Information Technology Co Ltd
Original Assignee
Shanghai Cambricon Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cambricon Information Technology Co Ltd filed Critical Shanghai Cambricon Information Technology Co Ltd
Priority to CN201910197509.2A priority Critical patent/CN111694768B/zh
Publication of CN111694768A publication Critical patent/CN111694768A/zh
Application granted granted Critical
Publication of CN111694768B publication Critical patent/CN111694768B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0806Multiuser, multiprocessor or multiprocessing cache systems
    • G06F12/0811Multiuser, multiprocessor or multiprocessing cache systems with multilevel cache hierarchies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0866Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches for peripheral storage systems, e.g. disk cache
    • G06F12/0871Allocation or management of cache space

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种运算方法、装置及相关产品,所述产品包括控制器单元,所述控制器单元包括:指令缓存单元、指令处理单元和存储队列单元;所述指令缓存单元,用于存储所述人工神经网络运算关联的计算指令;所述指令处理单元,用于对所述计算指令解析得到多个运算指令;所述存储队列单元,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。通过以上方法,本公开可以提高相关产品在进行神经网络模型的运算时的运算效率。

Description

运算方法、装置及相关产品
技术领域
本公开涉及信息处理技术领域,尤其涉及一种运算方法、装置及相关产品。
背景技术
在人工智能技术领域,神经网络算法是最近非常流行的一种机器学习算法,在各种领域中都取得了非常好的效果,比如图像识别,语音识别,自然语言处理等。随着神经网络算法的发展,算法的复杂度也越来越高,为了提高识别度,模型的规模也在逐渐增大。
发明内容
有鉴于此,本公开提出了一种离线模型文件替换方法及装置。
根据本公开的一方面,提供了一种离线模型文件替换方法,所述方法包括:
在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,其中,所述第一离线模型文件的权重大于或等于待存储的离线模型文件的权重,所述权重用于表示离线模型文件的大小;
根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件。
在一种可能的实现方式中,缓存区中剩余的缓存大小不足以存储待存储的离线模型文件时,需要替换缓存区内存储的离线模型文件。
在一种可能的实现方式中,已存储的离线模型文件的数量大于或等于第一数量阈值时,需要替换缓存区内存储的离线模型文件。
在一种可能的实现方式中,所述缓存区包括多个子缓存区,每个子缓存区中存储的离线模型文件的权重位于该子缓存区对应的权重区间内,不同的子缓存区对应的权重区间不同,
在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,包括:
确定待存储的离线模型文件的权重所属的权重区间,其中,所述权重区间包括权重上限和权重下限,待存储的离线模型文件的权重位于所述权重下限和所述权重上限之间;
若待存储的离线模型文件的权重所属的权重区间对应的子缓存区内存储的离线模型文件需要替换,则将该子缓存区存储的离线模型文件确定为第一离线模型文件。
在一种可能的实现方式中,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应,
若待存储的离线模型文件的权重所属的权重区间对应的子缓存区中存储的离线模型文件的数量大于或等于第二数量阈值,则该子缓存区内存储的离线模型文件需要替换。
在一种可能的实现方式中,所述缓存替换策略为替换被使用次数最少的离线模型文件,所述第二离线模型文件为第一离线模型文件中被使用次数最少的。
在一种可能的实现方式中,根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件,包括:
获取第一离线模型文件的被使用次数;
根据第一离线模型文件的被使用次数确定第二离线模型文件;
删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
在一种可能的实现方式中,所述方法还包括:
记录所述待存储的离线模型文件的存储地址以及被使用次数。
在一种可能的实现方式中,所述方法还包括:
在已存储的离线模型文件被使用时,将该离线模型文件的被使用次数加1。
在一种可能的实现方式中,所述方法还包括:
建立文件检索信息,所述文件检索信息包括已存储的离线模型文件的存储地址和被使用次数之间的关联关系。
在一种可能的实现方式中,所述文件检索信息以矩阵的形式记录,所述矩阵被划分为多个不同的区域,每个区域中记录的离线模型文件的权重位于该区域对应的权重区间内,所述权重区间包括权重上限和权重下限;
每个权重区间对应缓存区中的一个子缓存区,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应。
在一种可能的实现方式中,在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,包括:
确定待存储的离线模型文件的权重所属的权重区间,其中,待存储的离线模型文件的权重位于所属的权重区间的权重下限和权重上限之间;
若待存储的离线模型文件的权重所属的权重区间,在文件检索信息中对应的区域记录的离线模型文件的数量大于或等于第二数量阈值,则根据文件检索信息确定权重位于所述权重区间内的离线模型文件为第一离线模型文件。
在一种可能的实现方式中,根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件,包括:
根据所述文件检索信息获取第一离线模型文件的被使用次数;
将被使用次数最少的第一离线模型文件确定为第二离线模型文件;
根据所述关联关系以及第二离线模型文件的被使用次数确定第二离线模型文件的存储地址;
根据第二离线模型文件的存储地址删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
在一种可能的实现方式中,所述方法还包括:
将文件检索信息中第二离线模型文件的存储地址、被使用次数分别替换为所述待存储的离线模型文件的存储地址、被使用次数。
在一种可能的实现方式中,所述方法还包括:
在已存储的离线模型文件被使用时,将文件检索信息中该被使用的离线模型文件的被使用次数加1。
在一种可能的实现方式中,所述方法还包括:
根据待存储的离线模型文件对应的神经网络中的算子确定待存储的离线模型文件的权重。
根据本公开的另一方面,提供了一种离线模型文件替换装置,所述装置包括:
确定模块,用于在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,其中,所述第一离线模型文件的权重大于或等于待存储的离线模型文件的权重,所述权重用于表示离线模型文件的大小;
替换模块,用于根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件。
在一种可能的实现方式中,缓存区中剩余的缓存大小不足以存储待存储的离线模型文件时,需要替换缓存区内存储的离线模型文件。
在一种可能的实现方式中,已存储的离线模型文件的数量大于或等于第一数量阈值时,需要替换缓存区内存储的离线模型文件。
在一种可能的实现方式中,所述缓存区包括多个子缓存区,每个子缓存区中存储的离线模型文件的权重位于该子缓存区对应的权重区间内,不同的子缓存区对应的权重区间不同,
所述确定模块包括:
第一确定单元,用于确定待存储的离线模型文件的权重所属的权重区间,其中,所述权重区间包括权重上限和权重下限,待存储的离线模型文件的权重位于所述权重下限和所述权重上限之间;
第二确定单元,用于若待存储的离线模型文件的权重所属的权重区间对应的子缓存区内存储的离线模型文件需要替换,则将该子缓存区存储的离线模型文件确定为第一离线模型文件。
在一种可能的实现方式中,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应,
若待存储的离线模型文件的权重所属的权重区间对应的子缓存区中存储的离线模型文件的数量大于或等于第二数量阈值,则该子缓存区内存储的离线模型文件需要替换。
在一种可能的实现方式中,所述缓存替换策略为替换被使用次数最少的离线模型文件,所述第二离线模型文件为第一离线模型文件中被使用次数最少的。
在一种可能的实现方式中,所述替换模块包括:
第一获取单元,用于获取第一离线模型文件的被使用次数;
第三确定单元,用于根据第一离线模型文件的被使用次数确定第二离线模型文件;
第一存储单元,用于删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
在一种可能的实现方式中,所述装置还包括:
第一记录模块,用于记录所述待存储的离线模型文件的存储地址以及被使用次数。
在一种可能的实现方式中,所述装置还包括:
第一更新模块,用于在已存储的离线模型文件被使用时,将该离线模型文件的被使用次数加1。
在一种可能的实现方式中,所述装置还包括:
建立模块,用于建立文件检索信息,所述文件检索信息包括已存储的离线模型文件的存储地址和被使用次数之间的关联关系。
在一种可能的实现方式中,所述文件检索信息以矩阵的形式记录,所述矩阵被划分为多个不同的区域,每个区域中记录的离线模型文件的权重位于该区域对应的权重区间内,所述权重区间包括权重上限和权重下限;
每个权重区间对应缓存区中的一个子缓存区,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应。
在一种可能的实现方式中,所述确定模块包括:
第一确定单元,用于确定待存储的离线模型文件的权重所属的权重区间,其中,待存储的离线模型文件的权重位于所属的权重区间的权重下限和权重上限之间;
第四确定单元,用于若待存储的离线模型文件的权重所属的权重区间,在文件检索信息中对应的区域记录的离线模型文件的数量大于或等于第二数量阈值,则根据文件检索信息确定权重位于所述权重区间内的离线模型文件为第一离线模型文件。
在一种可能的实现方式中,所述替换模块包括:
第二获取单元,用于根据所述文件检索信息获取第一离线模型文件的被使用次数;
第五确定单元,用于将被使用次数最少的第一离线模型文件确定为第二离线模型文件;
第六确定单元,用于根据所述关联关系以及第二离线模型文件的被使用次数确定第二离线模型文件的存储地址;
第二存储单元,用于根据第二离线模型文件的存储地址删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
在一种可能的实现方式中,所述装置还包括:
第二记录模块,用于将文件检索信息中第二离线模型文件的存储地址、被使用次数分别替换为所述待存储的离线模型文件的存储地址、被使用次数。
在一种可能的实现方式中,所述装置还包括:
第二更新模块,用于在已存储的离线模型文件被使用时,将文件检索信息中该被使用的离线模型文件的被使用次数加1。
在一种可能的实现方式中,所述装置还包括:
权重确定模块,用于根据待存储的离线模型文件对应的神经网络中的算子确定待存储的离线模型文件的权重。
根据本公开的另一方面,提供了一种离线模型文件替换装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。
根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
通过选择已存储的离线模型文件中权重大于或等于待存储的离线模型文件作为备选的被替换的离线模型文件(第一离线模型文件),并根据缓存替换策略用待存储的离线模型文件替换第一离线模型文件中的第二离线模型文件。根据本公开的离线模型文件替换方式,可以避免出现被替换的离线模型文件较小导致无法缓存待存储的离线模型文件的情况,减小了替换开销,提高替换的效率。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出根据本公开一实施例的离线模型文件替换方法的流程图。
图2a示出根据本公开一实施例的步骤S11的方法的流程图。
图2b示出根据本公开一实施例的缓存区划分的示例。
图3示出根据本公开一实施例的步骤S12的方法的流程图。
图4示出根据本公开一实施例的步骤S11的方法的流程图.
图5示出根据本公开一实施例的步骤S12的方法的流程图.
图6示出根据本公开一实施例的离线模型文件替换装置的框图。
图7示出根据本公开一实施例的离线模型文件替换装置的框图。
图8是根据一示例性实施例示出的用于离线模型文件替换的装置的框图。
图9示出根据本公开一实施例的处理器的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
神经网络模型经过编译后生成的离线模型文件缓存在内存的缓存区,在需要通过神经网络模型对数据(图像数据、视频数据等)进行处理时,可以从缓存区获取神经网络模型对应的离线模型文件对数据进行处理。为了保证神经网络执行框架的计算性能,缓存区缓存的离线模型文件数据不能太多,当缓存的离线模型文件数量超出一定数量时,或导致神经网络执行框架命中离线模型文件的时间增加,计算性能下降。
在替换离线模型文件时,还要考虑不同神经网络对应的离线模型文件的替换开销。因为根据不同神经网络模型编译生成的离线模型文件的大小是不一样的,从缓存区中替换的开销也是不同的。比如说,不同的离线模型文件大小不同,缓存区中缓存块的大小都不一样,当要缓存一个较大的离线模型文件时,如果通过传统的LRU(Least RecentlyUsed,最近最少使用)算法选择的被替换的离线模型文件较小,换出较小文件后的空间并不能存下较大的文件,可能还需要再次选择被替换的离线模型文件,导致开销较大。
为了解决上述技术问题,本公开提供了一种离线模型文件替换方法及相关装置。该方法可以应用于处理器,所述处理器可以为通用处理器,例如,处理器可以为中央处理单元CPU(Central Processing Unit)、图形处理单元GPU(Graphics Processing Unit)等。所述处理器还可以为用于执行人工智能运算的人工智能处理器,人工智能运算可包括机器学习运算,类脑运算等。其中,机器学习运算包括神经网络运算、k-means运算、支持向量机运算等。该人工智能处理器可例如包括NPU(Neural-Network Processing Unit,神经网络处理单元)、DSP(Digital Signal Process,数字信号处理单元)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)芯片中的一种或组合。人工智能处理器可以包括多个运算单元,多个运算单元可以并行执行运算。
图1示出根据本公开一实施例的离线模型文件替换方法的流程图。如图1所示,该方法可以包括:
步骤S11,在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,
其中,所述第一离线模型文件的权重大于或等于待存储的离线模型文件的权重,所述权重用于表示离线模型文件的大小;
步骤S12,根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件。
通过选择已存储的离线模型文件中权重大于或等于待存储的离线模型文件作为备选的被替换的离线模型文件(第一离线模型文件),并根据缓存替换策略用待存储的离线模型文件替换第一离线模型文件中的第二离线模型文件。根据本公开的离线模型文件替换方式,可以避免出现被替换的离线模型文件较小导致无法缓存待存储的离线模型文件的情况,减小了替换开销,提高替换的效率。
其中,缓存区可以进行高速数据交换,先于内存与处理器交换数据,速率很快。在一种可能的实现方式中,可以根据已存储的离线模型文件的数量与第一数量阈值之间的关系确定是否需要替换缓存区内存储的离线模型文件。其中,已存储的离线模型文件的数量可以是指存储在缓存区中的离线模型文件的数量,第一数量阈值可以是预先设置的缓存区中可以存储的离线模型文件的数量的最大值,例如,第一数量阈值可以为10。若已存储的离线模型文件的数量大于或等于第一数量阈值,则需要替换缓存区内存储的离线模型文件;若已存储的离线模型文件的数量小于第一数量阈值,则不需要替换缓存区内存储的离线模型文件,可以直接将待存储的离线模型文件存储在缓存区中。
需要说明的是,以上实施方式仅仅是判断缓存区是否已满的一个示例,本公开不限于此。事实上,还可以通过直接获取缓存区的剩余缓存,根据剩余缓存与待存储的离线模型文件的大小确定是否需要替换缓存区内存储的离线模型文件,例如,缓存区中剩余的缓存大小不足以存储待存储的离线模型文件时表示需要替换缓存区内存储的离线模型文件,缓存区中剩余的缓存大小足以存储待存储的离线模型文件时表示不需要替换缓存区内存储的离线模型文件。
在一种可能的实现方式中,上述权重可以通过以下方式确定:根据待存储的离线模型文件对应的神经网络中的算子确定待存储的离线模型文件的权重。其中,待存储的离线模型文件对应的神经网络可以是待使用的神经网络,也就是要使用该神经网络对数据(例如,图像数据、视频数据或者音频数据等)进行处理,待存储的离线模型文件可以是指根据待使用的神经网络进行编译生成的编译文件。待存储的离线模型文件的权重可以根据待使用的神经网络的算子确定。
在一个示例中,每一个算子记一个权重,可以在对待使用的神经网络进行编译生成待存储的离线模型文件时,遍历待使用的神经网络,计算出待使用的神经网络的算子的数量,从而得到待存储的离线模型文件的权重。
在另一个示例中,不同类型的算子可以对应不同的权重,不同类型的算子的计算复杂度不同,编译后对应的指令数量也不同,因此,可以根据算子的类型确定该类算子的权重。在对待使用的神经网络进行编译生成待存储的离线模型文件时,可以遍历待使用的神经网络,计算出待使用的神经网络中包含的算子类型以及每类算子的算子数量,从而得到待存储的离线模型文件的权重:
Figure BDA0001996287340000091
其中,N可以表示算子类型数,wj表示第j类算子对应的权重,NOPj表示第j类算子的算子数量。
需要说明的是,以上两个示例仅仅是示例性的说明本公开的待存储的离线模型文件的权重的确定方式,不以任何方式限制本公开。事实上,本领域技术人员完全可以根据应用场景确定待存储的离线模型文件的权重的确定方式,只要能够衡量文件的大小即可。
已存储的离线模型文件的权重可以在存储离线模型文件时进行记录,例如,可以作为离线模型文件的一个属性信息进行记录。
对于“从已存储的离线模型文件中确定第一离线模型文件”的具体方式,在一个示例中,可以逐一确定已存储的离线模型文件的权重,筛选出权重大于或等于待存储的离线模型文件的权重的文件作为第一离线模型文件,本公开不限于此。
例如,在另一个示例中,所述缓存区可以包括多个子缓存区,每个子缓存区中存储的离线模型文件的权重位于该子缓存区对应的权重区间内,不同的子缓存区对应的权重区间不同,图2a示出根据本公开一实施例的步骤S11的方法的流程图,如图2a所示,步骤S11可以包括:
步骤S111,确定待存储的离线模型文件的权重所属的权重区间,其中,所述权重区间包括权重上限和权重下限,待存储的离线模型文件的权重位于所述权重下限和所述权重上限之间;
步骤S112,若待存储的离线模型文件的权重所属的权重区间对应的子缓存区内存储的离线模型文件需要替换,则将该子缓存区存储的离线模型文件确定为第一离线模型文件。
在一种可能的实现方式中,可以划分为多个不同的权重区间,每个权重区间对应缓存区上的一个子缓存区。图2b示出根据本公开一实施例的缓存区划分的示例,如图2b所示,例如,缓存区可以划分为三个子缓存区:子缓存区1、子缓存区2、子缓存区3,可以划分为三个权重区间:权重≤100、100<权重≤200、200<权重≤300,这三个权重区间分别对应缓存区上的三个不同的子缓存区。如图2b所示,每个子缓存区可以被划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应,也就是说,若待存储的离线模型文件的大小为该子缓存区对应的权重区间的上限,该子缓存区中的每个缓存块的都可以存储该待存储的离线模型文件。
举例来说,如图2b所示,权重区间(权重≤100)对应的子缓存区1可以包括多(5)个缓存块,每个缓存块都可以存储的最大文件为权重为100的离线模型文件。
这样,已存储的离线模型文件的权重,或者,第一离线模型文件的权重,可以对应该离线模型文件的权重所述的权重区间的上限。因此,在步骤S111中确定待存储的离线模型文件的权重所属的权重区间后,可以判断该权重区间对应的子缓存区内存储的离线模型文件是否需要替换,若权重区间对应的子缓存区内存储的离线模型文件需要替换,可以将该权重区间对应的子缓存区中存储的离线模型文件作为第一离线模型文件,效率更高。
其中,权重区间对应的子缓存区内存储的离线模型文件是否需要替换也可以根据子缓存区已存储的离线模型文件的数量和第二数量阈值之间的关系确定。其中,第二数量阈值可以是预先设置的子缓存区中可以存储的离线模型文件的数量的最大值,例如,第二数量阈值可以为2、3或5等。若已存储的离线模型文件的数量大于或等于第二数量阈值,则子缓存区内存储的离线模型文件需要替换;若已存储的离线模型文件的数量小于第二数量阈值,则子缓存区内存储的离线模型文件不需要替换,可以直接将待存储的离线模型文件存储在该子缓存区中
通过划分权重区间并根据权重分区缓存,可以快速找到对应的缓存区,并且可以确保对应的缓存区存储的离线模型文件都可以作为待存储的离线模型文件的备选的替换文件,提高了替换的效率、降低替换开销。
对于步骤S12,其中的缓存替换策略可以为替换第一离线模型文件中任意一个离线模型文件,或者可以为替换第一离线模型文件中权重最小的离线模型文件。
或者,缓存替换策略也可以为替换被使用次数最少的离线模型文件,所述第二离线模型文件为第一离线模型文件中被使用次数最少的。在一种可能的实现方式中,已存储的离线模型文件的被使用次数可以作为离线模型文件的一个属性信息进行记录。
需要说明的是,以上仅仅是缓存替换策略的一些示例,但本领域技术人员能够理解,本公开应不限于此。事实上,完全可根据实际应用场景灵活设定缓存替换策略,例如还可以采用FIFO(First Input First Output,先进先出)、LFU(Least Frequently Used,最近最不常用)等策略。
图3示出根据本公开一实施例的步骤S12的方法的流程图,如图3所示,步骤S12可以包括:
步骤S121,获取第一离线模型文件的被使用次数;
步骤S122,根据第一离线模型文件的被使用次数确定第二离线模型文件;
步骤S123,删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
如上所述,可以根据记录的第一离线模型文件的属性信息获取第一离线模型文件的被使用次数。然后,将被使用次数最少的第一离线模型文件确定为第二离线模型文件。可以将缓存区中的第二离线模型文件删除,然后将待存储的离线模型文件存储在第二离线模型文件被存储的缓存块中。
这样,可以选择第一离线模型文件中被使用次数最少的第二离线模型文件替换待存储的离线模型文件。也就是,将使用频率比较少的离线模型文件替换掉,避免频繁替换离线模型文件,降低替换开销。
在一种可能的实现方式中,在存储待存储的离线模型文件时,还可以记录所述待存储的离线模型文件的存储地址以及被使用次数。在已存储的离线模型文件每次被用来处理数据(被使用)时,该被使用的离线模型文件的被使用次数加1。
在一种可能的实现方式中,本公开的离线模型文件替换方法还可以包括:
建立文件检索信息,所述文件检索信息包括已存储的离线模型文件的存储地址和被使用次数之间的关联关系。
文件检索信息可以作为记录的已存储的离线模型文件的存储地址以及被使用次数的一个示例。
在一个示例中,所述文件检索信息以矩阵的形式记录,所述矩阵被划分为多个不同的区域,每个区域中记录的离线模型文件的权重位于该区域对应的权重区间内,所述权重区间包括权重上限和权重下限,如上所述,每个权重区间对应缓存区上的一个子缓存区,每个子缓存区被划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应。需要说明的是,也可以表的形式记录文件检索信息,本公开对此不作限定。
表1示出根据本公开一实施方式的文件检索信息的示例
表1
Figure BDA0001996287340000121
其中,Addr 1~Addr 10表示已存储的离线模型文件的存储地址,F1~F10表示已存储的离线模型文件的被使用次数。文件检索信息中还可以存储离线模型文件的标识,本公开对此不作限定,离线模型文件的标识可以是能够唯一表示某一离线模型文件的信息,例如,离线模型文件的文件名等。
在一种可能的实现方式中,在已存储的离线模型文件每次被用来处理数据(被使用)时,可以将文件检索信息中记录的该被使用的离线模型文件的被使用次数加1。
图4示出根据本公开一实施例的步骤S11的方法的流程图,如图4所示,在该实现方式中,步骤S11可以包括:
步骤S111,确定待存储的离线模型文件的权重所属的权重区间,其中,待存储的离线模型文件的权重位于所属的权重区间的权重下限和权重上限之间;
步骤S113,若待存储的离线模型文件的权重所属的权重区间,在文件检索信息中对应的区域记录的离线模型文件的数量大于或等于第二数量阈值,则根据文件检索信息确定权重位于所述权重区间内的离线模型文件为第一离线模型文件。
以表1为例,在步骤S111中确定待存储的离线模型文件的权重所属的权重区间后,可以根据该权重区间对应的区域中记录的离线模型文件的数量与第二阈值数量的关系确定该权重区间对应的子缓存区内存储的离线模型文件是否需要替换:若大于或等于第二阈值数量,则表明子缓存区内存储的离线模型文件需要替换,可以将在该权重区间对应的区域中记录的存储地址存储的离线模型文件作为第一离线模型文件;若小于第二数量阈值,则表明子缓存区内存储的离线模型文件不需要替换,可以将待存储的离线模型文件存储在该待存储的离线模型文件的权重对应的子缓存区的缓存块中,检索效率更高。
举例来说,假设待存储的离线模型文件的权重为80,小于100,在此示例中第二数据阈值为5,若表1中权重区间(权重≤100)记录了5个离线模型文件的信息,等于第二数量阈值5,这5个离线模型文件即为第一离线模型文件,也就是,存储在地址Addr 1~Addr 5的离线模型文件为第一离线模型文件;若表1中权重区间(权重≤100)记录了4个离线模型文件的信息,小于第二数量阈值5,则可以在权重区间(权重≤100)对应的子缓存区1中的没有存储文件的缓存快中存储待存储的离线模型文件,并在表1中权重区间(权重≤100)对应的区域记录存储地址、被使用次数1。
图5示出根据本公开一实施例的步骤S12的方法的流程图,如图5所示,在该实现方式中,步骤S12可以包括:
步骤S124,根据文件检索信息获取第一离线模型文件的被使用次数;
步骤S125,将被使用次数最少的第一离线模型文件确定为第二离线模型文件;
步骤S126,根据所述关联关系以及第二离线模型文件的被使用次数确定第二离线模型文件的存储地址;
步骤S127,根据第二离线模型文件的存储地址删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
以表1为例,假设待存储的离线模型文件的权重为80,小于100,表1中权重区间(权重≤100)记录了多个离线模型文件的信息,由表1可知第一离线模型文件的被使用次数分别为F1~F5。假设在F1~F5中F1最小,那么存储在地址Addr 1的离线模型文件为第二离线模型文件。根据存储地址Addr 1查找到第二离线模型文件并删除第二离线模型文件,将待存储的离线模型文件存储在第二离线模型文件存储的缓存块中。
在一种可能的实现方式中,若第一离线模型文件中存在多个离线模型文件的被使用次数最少,则可以任意选择一个作为第二离线模型文件。或者,文件检索信息中可以对记录的信息进行编号,可以选择编号最小的作为第二离线模型文件。在检索过程中,可以按编号的顺序检索,将第一个检索到的被使用次数最小号的离线模型文件作为第二离线模型文件,提高检索的效率。
在一种可能的实现方式中,还可以将文件检索信息中第二离线模型文件的存储地址、被使用次数分别替换为所述待存储的离线模型文件的存储地址、被使用次数。其中,存储待存储的离线模型文件时,被使用次数可以记为1,也就是第一次被使用。
在一种可能的实现方式中,在已存储的离线模型文件被使用时,可以将文件检索信息中该被使用的离线模型文件的被使用次数加1,以实时更新已存储的离线模型文件的被使用次数。
根据本公开的离线模型文件替换方式,可以避免出现被替换的离线模型文件较小导致无法缓存待存储的离线模型文件的情况,减小了替换开销,提高替换的效率。
应用示例
为了更清楚的说明本公开的离线模型文件替换方法,下面结合图2b以及表1举例说明。
离线模型文件1需要存储在缓存区,确定离线模型文件1的权重为80,确定离线模型文件1的权重对应的权重区间(权重≤100),若权重区间对应的子缓存区1内存储的离线模型文件需要替换,将子缓存区1中存储的离线模型文件确定为第一离线模型文件,也就是,存储在地址Addr 1~Addr 5的离线模型文件为第一离线模型文件。由表1可知第一离线模型文件的被使用次数分别为F1~F5。假设在F1~F5中F1最小,那么存储在地址Addr 1的离线模型文件为第二离线模型文件。根据存储地址Addr 1查找到第二离线模型文件并删除第二离线模型文件,将离线模型文件1存储在第二离线模型文件存储的缓存块中。将文件检索信息中Addr 1和F1替换为离线模型文件1的存储地址、被使用次数1。
离线模型文件2需要存储在缓存区,确定离线模型文件1的权重为120,确定离线模型文件1的权重对应的权重区间(100<权重≤200),假设表1的权重区间(100<权重≤200)对应的区域只记载了(Addr 6,F6)和(Addr 7,F,7),则权重区间(100<权重≤200)对应的子缓存区内存储的离线模型文件不需要替换,在离线模型文件2的权重120对应的子缓存区2的缓存块中存储离线模型文件2,并在文件检索信息中权重区间(100<权重≤200)对应的区域内的空闲位置记录离线模型文件2的存储地址、被使用次数1。
图6示出根据本公开一实施例的离线模型文件替换装置的框图。该离线模型文件替换装置可以应用于处理器,所述处理器可以为通用处理器,例如,处理器可以为中央处理单元CPU(Central Processing Unit)、图形处理单元GPU(Graphics Processing Unit)等。所述处理器还可以为用于执行人工智能运算的人工智能处理器,人工智能运算可包括机器学习运算,类脑运算等。其中,机器学习运算包括神经网络运算、k-means运算、支持向量机运算等。该人工智能处理器可例如包括NPU(Neural-Network Processing Unit,神经网络处理单元)、DSP(Digital Signal Process,数字信号处理单元)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)芯片中的一种或组合。人工智能处理器可以包括多个运算单元,多个运算单元可以并行执行运算。
如图6所示,所述装置可以包括:
确定模块61,用于在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,其中,所述第一离线模型文件的权重大于或等于待存储的离线模型文件的权重,所述权重用于表示离线模型文件的大小;
替换模块62,用于根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件。
通过选择已存储的离线模型文件中权重大于或等于待存储的离线模型文件作为备选的被替换的离线模型文件(第一离线模型文件),并根据缓存替换策略用待存储的离线模型文件替换第一离线模型文件中的第二离线模型文件。根据本公开的离线模型文件替换方式,可以避免出现被替换的离线模型文件较小导致无法缓存待存储的离线模型文件的情况,减小了替换开销,提高替换的效率。
在一种可能的实现方式中,缓存区中剩余的缓存大小不足以存储待存储的离线模型文件时,需要替换缓存区内存储的离线模型文件。
在一种可能的实现方式中,已存储的离线模型文件的数量大于或等于第一数量阈值时,需要替换缓存区内存储的离线模型文件。
图7示出根据本公开一实施例的离线模型文件替换装置的框图。
在一种可能的实现方式中,所述缓存区包括多个子缓存区,每个子缓存区中存储的离线模型文件的权重位于该子缓存区对应的权重区间内,不同的子缓存区对应的权重区间不同,
如图7所示,所述确定模块61可以包括:
第一确定单元611,用于确定待存储的离线模型文件的权重所属的权重区间,其中,所述权重区间包括权重上限和权重下限,待存储的离线模型文件的权重位于所述权重下限和所述权重上限之间;
第二确定单元612,用于若待存储的离线模型文件的权重所属的权重区间对应的子缓存区内存储的离线模型文件需要替换,则将该子缓存区存储的离线模型文件确定为第一离线模型文件。
在一种可能的实现方式中,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应,若待存储的离线模型文件的权重所属的权重区间对应的子缓存区中存储的离线模型文件的数量大于或等于第二数量阈值,则该子缓存区内存储的离线模型文件需要替换。
在一种可能的实现方式中,所述缓存替换策略为替换被使用次数最少的离线模型文件,所述第二离线模型文件为第一离线模型文件中被使用次数最少的。
在一种可能的实现方式中,所述替换模块62包括:
第一获取单元621,用于获取第一离线模型文件的被使用次数;
第三确定单元622,用于根据第一离线模型文件的被使用次数确定第二离线模型文件;
第一存储单元623,用于删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
在一种可能的实现方式中,所述装置还包括:
第一记录模块63,用于记录所述待存储的离线模型文件的存储地址以及被使用次数。
在一种可能的实现方式中,所述装置还包括:
第一更新模块64,用于在已存储的离线模型文件被使用时,将该离线模型文件的被使用次数加1。
在一种可能的实现方式中,所述装置还包括:
建立模块65,用于建立文件检索信息,所述文件检索信息包括已存储的离线模型文件的存储地址和被使用次数之间的关联关系。
在一种可能的实现方式中,所述文件检索信息以矩阵的形式记录,所述矩阵被划分为多个不同的区域,每个区域中记录的离线模型文件的权重位于该区域对应的权重区间内,所述权重区间包括权重上限和权重下限;
每个权重区间对应缓存区中的一个子缓存区,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应。
在一种可能的实现方式中,所述确定模块61还包括:
第四确定单元613,用于若待存储的离线模型文件的权重所属的权重区间,在文件检索信息中对应的区域记录的离线模型文件的数量大于或等于第二数量阈值,则根据文件检索信息确定权重位于所述权重区间内的离线模型文件为第一离线模型文件。
在一种可能的实现方式中,所述替换模块63包括:
第二获取单元624,用于根据所述文件检索信息获取第一离线模型文件的被使用次数;
第五确定单元625,用于将被使用次数最少的第一离线模型文件确定为第二离线模型文件;
第六确定单元626,用于根据所述关联关系以及第二离线模型文件的被使用次数确定第二离线模型文件的存储地址;
第二存储单元627,用于根据第二离线模型文件的存储地址删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
在一种可能的实现方式中,所述装置还包括:
第二记录模块66,用于将文件检索信息中第二离线模型文件的存储地址、被使用次数分别替换为所述待存储的离线模型文件的存储地址、被使用次数。
在一种可能的实现方式中,所述装置还包括:
第二更新模块67,用于在已存储的离线模型文件被使用时,将文件检索信息中该被使用的离线模型文件的被使用次数加1。
在一种可能的实现方式中,所述装置还包括:
权重确定模块68,用于根据待存储的离线模型文件对应的神经网络中的算子确定待存储的离线模型文件的权重。
图8是根据一示例性实施例示出的一种用于离线模型文件替换的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图8,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由装置800的处理器820执行以完成上述方法。
图9示出根据本公开一实施例的处理器的框图。该处理器可以应用于上述离线模型文件替换。参阅图9,该处理器用于执行机器学习计算,该处理器包括:控制器单元141和运算单元142,其中,控制器单元141与运算单元142连接,处理器可以包括多个运算单元142,该多个运算单元142包括:一个主处理电路和多个从处理电路;
控制器单元141,用于获取输入数据以及计算指令。该输入数据可以是经过处理器进行补齐处理后的数据。
在一种可选方案中,一个主处理电路和多个从处理电路可以为树型结构、H型结构或者脉冲阵列机结构,本公开对主处理电路和从处理电路之前的连接方式不作限定。
在一种可选方案中,具体的,获取输入数据以及计算指令方式可以通过数据输入输出单元得到,该数据输入输出单元具体可以为一个或多个数据I/O接口或I/O引脚。
上述计算指令包括但不限于:正向运算指令或反向训练指令,或其他神经网络运算指令等等,例如卷积运算指令,本申请具体实施方式并不限制上述计算指令的具体表现形式。
控制器单元141,还用于解析该计算指令得到多个运算指令,将该多个运算指令以及所述输入数据发送给所述主处理电路;
主处理电路101,用于对所述输入数据执行前序处理以及与所述多个从处理电路之间传输数据以及运算指令;
多个从处理电路102,用于依据从所述主处理电路传输的数据以及运算指令并行执行中间运算得到多个中间结果,并将多个中间结果传输给所述主处理电路;
主处理电路101,用于对所述多个中间结果执行后续处理得到所述计算指令的计算结果。
本申请提供的技术方案将运算单元设置成一主多从结构,对于正向运算的计算指令,其可以将依据正向运算的计算指令将数据进行拆分,这样通过多个从处理电路即能够对计算量较大的部分进行并行运算,从而提高运算速度,节省运算时间,进而降低功耗。
可选的,上述机器学习计算具体可以包括:人工神经网络运算,上述输入数据具体可以包括:输入神经元数据和权值数据。上述计算结果具体可以为:人工神经网络运算的结果即输出神经元数据。
对于神经网络中的运算可以为神经网络中的一层的运算,对于多层神经网络,其实现过程是,在正向运算中,当上一层人工神经网络执行完成之后,下一层的运算指令会将运算单元中计算出的输出神经元作为下一层的输入神经元进行运算(或者是对该输出神经元进行某些操作再作为下一层的输入神经元),同时,将权值也替换为下一层的权值;在反向运算中,当上一层人工神经网络的反向运算执行完成后,下一层运算指令会将运算单元中计算出的输入神经元梯度作为下一层的输出神经元梯度进行运算(或者是对该输入神经元梯度进行某些操作再作为下一层的输出神经元梯度),同时将权值替换为下一层的权值。
上述机器学习计算还可以包括支持向量机运算,k-近邻(k-nn)运算,k-均值(k-means)运算,主成分分析运算等等。为了描述的方便,下面以人工神经网络运算为例来说明机器学习计算的具体方案。
对于人工神经网络运算,如果该人工神经网络运算具有多层运算,多层运算的输入神经元和输出神经元并非是指整个神经网络的输入层中神经元和输出层中神经元,而是对于网络中任意相邻的两层,处于网络正向运算下层中的神经元即为输入神经元,处于网络正向运算上层中的神经元即为输出神经元。以卷积神经网络为例,设一个卷积神经网络有L层,K=1,2,...,L-1,对于第K层和第K+1层来说,我们将第K层称为输入层,其中的神经元为所述输入神经元,第K+1层称为输出层,其中的神经元为所述输出神经元。即除最顶层外,每一层都可以作为输入层,其下一层为对应的输出层。
可选的,上述处理器还可以包括:该存储单元140和直接内存访问单元50,存储单元140可以包括:寄存器、缓存中的一个或任意组合,具体的,所述缓存,用于存储所述计算指令;所述寄存器,用于存储所述输入数据和标量;所述缓存为高速暂存缓存。直接内存访问单元50用于从存储单元10读取或存储数据。
可选的,该控制器单元包括:指令存储单元410、指令处理单元411和存储队列单元413;
指令存储单元410,用于存储所述人工神经网络运算关联的计算指令;
所述指令处理单元411,用于对所述计算指令解析得到多个运算指令;
存储队列单元413,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。
举例说明,在一个可选的技术方案中,主运算处理电路也可以包括一个控制器单元,该控制器单元可以包括主指令处理单元,具体用于将指令译码成微指令。当然在另一种可选方案中,从运算处理电路也可以包括另一个控制器单元,该另一个控制器单元包括从指令处理单元,具体用于接收并处理微指令。上述微指令可以为指令的下一级指令,该微指令可以通过对指令的拆分或解码后获得,能被进一步解码为各部件、各单元或各处理电路的控制信号。
在一种可选方案中,该计算指令的结构可以如下表所示。
操作码 寄存器或立即数 寄存器/立即数
上表中的省略号表示可以包括多个寄存器或立即数。
在另一种可选方案中,该计算指令可以包括:一个或多个操作域以及一个操作码。该计算指令可以包括神经网络运算指令。以神经网络运算指令为例,如表1所示,其中,寄存器号0、寄存器号1、寄存器号2、寄存器号3、寄存器号4可以为操作域。其中,每个寄存器号0、寄存器号1、寄存器号2、寄存器号3、寄存器号4可以是一个或者多个寄存器的号码。
Figure BDA0001996287340000211
上述寄存器可以为片外存储器,当然在实际应用中,也可以为片内存储器,用于存储数据,该数据具体可以为n维数据,n为大于等于1的整数,例如,n=1时,为1维数据,即向量,如n=2时,为2维数据,即矩阵,如n=3或3以上时,为多维张量。
可选的,该控制器单元还可以包括:
所述依赖关系处理单元412,用于在具有多个运算指令时,确定第一运算指令与所述第一运算指令之前的第零运算指令是否存在关联关系,如所述第一运算指令与所述第零运算指令存在关联关系,则将所述第一运算指令缓存在所述指令存储单元内,在所述第零运算指令执行完毕后,从所述指令存储单元提取所述第一运算指令传输至所述运算单元;
所述确定该第一运算指令与第一运算指令之前的第零运算指令是否存在关联关系包括:
依据所述第一运算指令提取所述第一运算指令中所需数据(例如矩阵)的第一存储地址区间,依据所述第零运算指令提取所述第零运算指令中所需矩阵的第零存储地址区间,如所述第一存储地址区间与所述第零存储地址区间具有重叠的区域,则确定所述第一运算指令与所述第零运算指令具有关联关系,如所述第一存储地址区间与所述第零存储地址区间不具有重叠的区域,则确定所述第一运算指令与所述第零运算指令不具有关联关系。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (34)

1.一种离线模型文件替换方法,其特征在于,所述方法包括:
在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,其中,所述第一离线模型文件的权重大于或等于待存储的离线模型文件的权重,所述权重用于表示离线模型文件的大小;
根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件。
2.根据权利要求1所述的方法,其特征在于,缓存区中剩余的缓存大小不足以存储待存储的离线模型文件时,需要替换缓存区内存储的离线模型文件。
3.根据权利要求1所述的方法,其特征在于,已存储的离线模型文件的数量大于或等于第一数量阈值时,需要替换缓存区内存储的离线模型文件。
4.根据权利要求1所述的方法,其特征在于,所述缓存区包括多个子缓存区,每个子缓存区中存储的离线模型文件的权重位于该子缓存区对应的权重区间内,不同的子缓存区对应的权重区间不同,
在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,包括:
确定待存储的离线模型文件的权重所属的权重区间,其中,所述权重区间包括权重上限和权重下限,待存储的离线模型文件的权重位于所述权重下限和所述权重上限之间;
若待存储的离线模型文件的权重所属的权重区间对应的子缓存区内存储的离线模型文件需要替换,则将该子缓存区存储的离线模型文件确定为第一离线模型文件。
5.根据权利要求4所述的方法,其特征在于,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应,
若待存储的离线模型文件的权重所属的权重区间对应的子缓存区中存储的离线模型文件的数量大于或等于第二数量阈值,则该子缓存区内存储的离线模型文件需要替换。
6.根据权利要求1所述的方法,其特征在于,所述缓存替换策略为替换被使用次数最少的离线模型文件,所述第二离线模型文件为第一离线模型文件中被使用次数最少的。
7.根据权利要求1-6任意一项所述的方法,其特征在于,根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件,包括:
获取第一离线模型文件的被使用次数;
根据第一离线模型文件的被使用次数确定第二离线模型文件;
删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
记录所述待存储的离线模型文件的存储地址以及被使用次数。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在已存储的离线模型文件被使用时,将该离线模型文件的被使用次数加1。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
建立文件检索信息,所述文件检索信息包括已存储的离线模型文件的存储地址和被使用次数之间的关联关系。
11.根据权利要求10所述的方法,其特征在于,所述文件检索信息以矩阵的形式记录,所述矩阵被划分为多个不同的区域,每个区域中记录的离线模型文件的权重位于该区域对应的权重区间内,所述权重区间包括权重上限和权重下限;
每个权重区间对应缓存区中的一个子缓存区,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应。
12.根据权利要求11所述的方法,其特征在于,在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,包括:
确定待存储的离线模型文件的权重所属的权重区间,其中,待存储的离线模型文件的权重位于所属的权重区间的权重下限和权重上限之间;
若待存储的离线模型文件的权重所属的权重区间,在文件检索信息中对应的区域记录的离线模型文件的数量大于或等于第二数量阈值,则根据文件检索信息确定权重位于所述权重区间内的离线模型文件为第一离线模型文件。
13.根据权利要求12所述的方法,其特征在于,
根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件,包括:
根据所述文件检索信息获取第一离线模型文件的被使用次数;
将被使用次数最少的第一离线模型文件确定为第二离线模型文件;
根据所述关联关系以及第二离线模型文件的被使用次数确定第二离线模型文件的存储地址;
根据第二离线模型文件的存储地址删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
14.根据权利要求13所述的方法,其特征在于,所述方法还包括:
将文件检索信息中第二离线模型文件的存储地址、被使用次数分别替换为所述待存储的离线模型文件的存储地址、被使用次数。
15.根据权利要求13或14所述的方法,其特征在于,所述方法还包括:
在已存储的离线模型文件被使用时,将文件检索信息中该被使用的离线模型文件的被使用次数加1。
16.根据权利要求1-15任意一项所述的方法,其特征在于,所述方法还包括:
根据待存储的离线模型文件对应的神经网络中的算子确定待存储的离线模型文件的权重。
17.一种离线模型文件替换装置,其特征在于,所述装置包括:
确定模块,用于在需要替换缓存区内存储的离线模型文件时,从已存储的离线模型文件中确定第一离线模型文件,其中,所述第一离线模型文件的权重大于或等于待存储的离线模型文件的权重,所述权重用于表示离线模型文件的大小;
替换模块,用于根据缓存替换策略用所述待存储的离线模型文件替换所述第一离线模型文件中的第二离线模型文件。
18.根据权利要求17所述的装置,其特征在于,缓存区中剩余的缓存大小不足以存储待存储的离线模型文件时,需要替换缓存区内存储的离线模型文件。
19.根据权利要求17所述的装置,其特征在于,已存储的离线模型文件的数量大于或等于第一数量阈值时,需要替换缓存区内存储的离线模型文件。
20.根据权利要求17所述的装置,其特征在于,所述缓存区包括多个子缓存区,每个子缓存区中存储的离线模型文件的权重位于该子缓存区对应的权重区间内,不同的子缓存区对应的权重区间不同,
所述确定模块包括:
第一确定单元,用于确定待存储的离线模型文件的权重所属的权重区间,其中,所述权重区间包括权重上限和权重下限,待存储的离线模型文件的权重位于所述权重下限和所述权重上限之间;
第二确定单元,用于若待存储的离线模型文件的权重所属的权重区间对应的子缓存区内存储的离线模型文件需要替换,则将该子缓存区存储的离线模型文件确定为第一离线模型文件。
21.根据权利要求20所述的装置,其特征在于,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应,
若待存储的离线模型文件的权重所属的权重区间对应的子缓存区中存储的离线模型文件的数量大于或等于第二数量阈值,则该子缓存区内存储的离线模型文件需要替换。
22.根据权利要求17所述的装置,其特征在于,所述缓存替换策略为替换被使用次数最少的离线模型文件,所述第二离线模型文件为第一离线模型文件中被使用次数最少的。
23.根据权利要求17-22任意一项所述的装置,其特征在于,所述替换模块包括:
第一获取单元,用于获取第一离线模型文件的被使用次数;
第三确定单元,用于根据第一离线模型文件的被使用次数确定第二离线模型文件;
第一存储单元,用于删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
24.根据权利要求23所述的装置,其特征在于,所述装置还包括:
第一记录模块,用于记录所述待存储的离线模型文件的存储地址以及被使用次数。
25.根据权利要求24所述的装置,其特征在于,所述装置还包括:
第一更新模块,用于在已存储的离线模型文件被使用时,将该离线模型文件的被使用次数加1。
26.根据权利要求17所述的装置,其特征在于,所述装置还包括:
建立模块,用于建立文件检索信息,所述文件检索信息包括已存储的离线模型文件的存储地址和被使用次数之间的关联关系。
27.根据权利要求26所述的装置,其特征在于,所述文件检索信息以矩阵的形式记录,所述矩阵被划分为多个不同的区域,每个区域中记录的离线模型文件的权重位于该区域对应的权重区间内,所述权重区间包括权重上限和权重下限;
每个权重区间对应缓存区中的一个子缓存区,每个子缓存区划分为多个缓存块,对于每个子缓存区,该子缓存区中的缓存块的大小与该子缓存区对应的权重区间的上限对应。
28.根据权利要求27所述的装置,其特征在于,所述确定模块包括:
第一确定单元,用于确定待存储的离线模型文件的权重所属的权重区间,其中,待存储的离线模型文件的权重位于所属的权重区间的权重下限和权重上限之间;
第四确定单元,用于若待存储的离线模型文件的权重所属的权重区间,在文件检索信息中对应的区域记录的离线模型文件的数量大于或等于第二数量阈值,则根据文件检索信息确定权重位于所述权重区间内的离线模型文件为第一离线模型文件。
29.根据权利要求28所述的装置,其特征在于,所述替换模块包括:
第二获取单元,用于根据所述文件检索信息获取第一离线模型文件的被使用次数;
第五确定单元,用于将被使用次数最少的第一离线模型文件确定为第二离线模型文件;
第六确定单元,用于根据所述关联关系以及第二离线模型文件的被使用次数确定第二离线模型文件的存储地址;
第二存储单元,用于根据第二离线模型文件的存储地址删除所述第二离线模型文件,并将所述待存储的离线模型文件存储在第二离线模型文件被存储的缓存区。
30.根据权利要求29所述的装置,其特征在于,所述装置还包括:
第二记录模块,用于将文件检索信息中第二离线模型文件的存储地址、被使用次数分别替换为所述待存储的离线模型文件的存储地址、被使用次数。
31.根据权利要求29或30所述的装置,其特征在于,所述装置还包括:
第二更新模块,用于在已存储的离线模型文件被使用时,将文件检索信息中该被使用的离线模型文件的被使用次数加1。
32.根据权利要求17-31任意一项所述的装置,其特征在于,所述装置还包括:
权重确定模块,用于根据待存储的离线模型文件对应的神经网络中的算子确定待存储的离线模型文件的权重。
33.一种离线模型文件替换装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行指令时实现权利要求1至16中任意一项所述的方法。
34.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至16中任意一项所述的方法。
CN201910197509.2A 2019-03-15 2019-03-15 运算方法、装置及相关产品 Active CN111694768B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910197509.2A CN111694768B (zh) 2019-03-15 2019-03-15 运算方法、装置及相关产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910197509.2A CN111694768B (zh) 2019-03-15 2019-03-15 运算方法、装置及相关产品

Publications (2)

Publication Number Publication Date
CN111694768A true CN111694768A (zh) 2020-09-22
CN111694768B CN111694768B (zh) 2022-11-01

Family

ID=72475892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910197509.2A Active CN111694768B (zh) 2019-03-15 2019-03-15 运算方法、装置及相关产品

Country Status (1)

Country Link
CN (1) CN111694768B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766467A (zh) * 2021-04-06 2021-05-07 深圳市一心视觉科技有限公司 基于卷积神经网络模型的图像识别方法
CN116126750A (zh) * 2023-02-24 2023-05-16 之江实验室 一种基于硬件特性的数据处理的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103038755A (zh) * 2011-08-04 2013-04-10 华为技术有限公司 多节点系统中数据缓存的方法、装置及系统
US20140223107A1 (en) * 2011-09-15 2014-08-07 Telefonaktiebolaget L M Ericsson (Publ) Cache Replacement Method and System
US20160371193A1 (en) * 2015-06-17 2016-12-22 International Business Machines Corporation Caching policies for selection and replacement of objects
CN109032964A (zh) * 2018-07-02 2018-12-18 京东方科技集团股份有限公司 缓存替换方法及其装置、异构多核系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103038755A (zh) * 2011-08-04 2013-04-10 华为技术有限公司 多节点系统中数据缓存的方法、装置及系统
US20140223107A1 (en) * 2011-09-15 2014-08-07 Telefonaktiebolaget L M Ericsson (Publ) Cache Replacement Method and System
US20160371193A1 (en) * 2015-06-17 2016-12-22 International Business Machines Corporation Caching policies for selection and replacement of objects
CN109032964A (zh) * 2018-07-02 2018-12-18 京东方科技集团股份有限公司 缓存替换方法及其装置、异构多核系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
褚信等: "用户行为选择参与的五层十五级瓦片缓存置换策略研究", 《浙江大学学报(理学版)》 *
黄丹等: "基于内容价值的缓存替换策略", 《电信科学》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766467A (zh) * 2021-04-06 2021-05-07 深圳市一心视觉科技有限公司 基于卷积神经网络模型的图像识别方法
CN116126750A (zh) * 2023-02-24 2023-05-16 之江实验室 一种基于硬件特性的数据处理的方法及装置
CN116126750B (zh) * 2023-02-24 2023-08-22 之江实验室 一种基于硬件特性的数据处理的方法及装置

Also Published As

Publication number Publication date
CN111694768B (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN109829433B (zh) 人脸图像识别方法、装置、电子设备及存储介质
JP7096888B2 (ja) ネットワークモジュール、割り当て方法及び装置、電子機器並びに記憶媒体
WO2023279739A1 (zh) 一种图像处理方法及装置、电子设备和存储介质
CN111581488A (zh) 一种数据处理方法及装置、电子设备和存储介质
JP2022512023A (ja) バッチ正規化データの処理方法及び装置、電子機器及び記憶媒体
CN111695682B (zh) 数据处理方法及装置
TW202030648A (zh) 一種目標對象處理方法、裝置、電子設備及儲存介質
CN110245757B (zh) 一种图像样本的处理方法及装置、电子设备和存储介质
CN109165738B (zh) 神经网络模型的优化方法及装置、电子设备和存储介质
KR20220113919A (ko) 딥 러닝 네트워크 결정 방법, 장치, 전자 디바이스 및 저장 매체
US20170249067A1 (en) User interface feature recommendation
WO2020232976A1 (zh) 信息处理方法及装置、电子设备和存储介质
CN110659690A (zh) 神经网络的构建方法及装置、电子设备和存储介质
CN111694768B (zh) 运算方法、装置及相关产品
JP2022510660A (ja) データ処理方法及びその装置、電子機器、並びに記憶媒体
US11494117B2 (en) Method and system for data processing
WO2023279740A1 (zh) 一种图像处理方法及装置、电子设备和存储介质
CN111582432B (zh) 一种网络参数处理方法及装置
CN111695686A (zh) 运算方法、装置及相关产品
CN109447258B (zh) 神经网络模型的优化方法及装置、电子设备和存储介质
CN110163372B (zh) 运算方法、装置及相关产品
CN110297970B (zh) 信息推荐模型训练方法及装置
CN115098107B (zh) 神经网络任务的代码生成方法和装置
CN109460458B (zh) 查询改写意图的预测方法及装置
CN116542289A (zh) 一种数据处理方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant