CN111626401B - 运算方法及装置 - Google Patents

运算方法及装置 Download PDF

Info

Publication number
CN111626401B
CN111626401B CN201910149687.8A CN201910149687A CN111626401B CN 111626401 B CN111626401 B CN 111626401B CN 201910149687 A CN201910149687 A CN 201910149687A CN 111626401 B CN111626401 B CN 111626401B
Authority
CN
China
Prior art keywords
network model
result
weight
updating
compiling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910149687.8A
Other languages
English (en)
Other versions
CN111626401A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cambricon Information Technology Co Ltd
Original Assignee
Shanghai Cambricon Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cambricon Information Technology Co Ltd filed Critical Shanghai Cambricon Information Technology Co Ltd
Priority to CN201910149687.8A priority Critical patent/CN111626401B/zh
Publication of CN111626401A publication Critical patent/CN111626401A/zh
Application granted granted Critical
Publication of CN111626401B publication Critical patent/CN111626401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Stored Programmes (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开涉及一种运算方法及装置,所述装置包括控制模块,所述控制模块包括:指令缓存子模块、指令处理子模块和存储队列子模块;所述指令缓存子模块,用于存储所述人工神经网络运算关联的计算指令;所述指令处理子模块,用于对所述计算指令解析得到多个运算指令;所述存储队列子模块,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。通过以上方法,本公开可以提高相关产品在进行神经网络模型的运算时的运算效率。

Description

运算方法及装置
技术领域
本公开涉及信息技术领域,尤其涉及一种数据处理方法及装置。
背景技术
通常情况下,神经网络具有多层算子以及权值,神经网络的结构复杂,算子种类众多,同时具有输入输出,权值等参数参与运算,且神经网络的运算量大,简单的分类识别网络通常都具有几十层,每层多个节点参与运算。因此,深度神经网络编译过程非常耗时,相关技术中,会在缓存中生成神经网络的缓存模型来帮助减少编译时间消耗。但是,如果神经网络发生变化,例如,仅仅神经网络的权值发生变化时,都需要重新将整个神经网络作为整体进行编译后生成新的缓存模型,严重降低了编译神经网络的效率。
发明内容
有鉴于此,本公开提出了一种数据处理方法及装置。
根据本公开的一方面,提供了一种数据处理方法,所述方法应用于人工智能处理器,包括:
在针对第一网络模型进行编译之前,判断第一网络模型的网络结构和权值相对于已编译的第二网络模型是否发生变化;
在判断第一网络模型的网络结构未发生变化且权值发生变化时,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,并将所述更新结果作为第一网络模型的第一编译结果。
在一种可能的实现方式中,所述方法应用于单核人工智能处理器,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,包括:
确定第一网络模型相对于第二网络模型发生变化的权值;
确定所述发生变化的权值在所述第二编译结果中的位置;
根据确定出的位置和所述发生变化的权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
在一种可能的实现方式中,所述方法应用于多核人工智能处理器,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,包括:
确定第一网络模型相对于第二网络模型发生变化的权值;
调用拆分信息将所述发生变化的权值拆分至各个核,得到与各核对应的拆分权值,所述拆分信息为将网络模型拆分至各人工智能处理器的核以执行的信息;
确定所述拆分权值在所述第二编译结果的子编译结果中的位置;
根据确定出的位置和所述拆分权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
在一种可能的实现方式中,所述第二编译结果包括网络结构编译结果和第二权值编译结果;
更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,包括:
更新所述第二权值编译结果中的权值,得到第一权值编译结果;
将所述网络结构编译结果和所述第一权值编译结果作为所述更新结果。
在一种可能的实现方式中,所述方法还包括:
在判断第一网络模型的网络结构发生变化时,则不再判断权值是否发生变化,并对第一网络模型进行整体编译,或
在判断第一网络模型的网络结构未发生变化且权值未发生变化时,将所述第二编译结果作为第一网络模型的第一编译结果。
根据本公开的另一方面,提供了一种数据处理装置,所述装置应用于人工智能处理器,包括:
判断模块,用于在针对第一网络模型进行编译之前,判断第一网络模型的网络结构和权值相对于已编译的第二网络模型是否发生变化;
更新模块,用于在判断第一网络模型的网络结构未发生变化且权值发生变化时,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,并将所述更新结果作为第一网络模型的第一编译结果。
在一种可能的实现方式中,所述装置应用于单核人工智能处理器,所述更新模块包括:
第一确定子模块,用于确定第一网络模型相对于第二网络模型发生变化的权值,
第二确定子模块,用于确定所述发生变化的权值在所述第二编译结果中的位置;
第一更新子模块,用于根据确定出的位置和所述发生变化的权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
在一种可能的实现方式中,所述装置应用于多核人工智能处理器,所述更新模块包括:
第三确定子模块,用于确定第一网络模型相对于第二网络模型发生变化的权值;
拆分子模块,用于调用拆分信息将所述发生变化的权值拆分至各个核,得到与各核对应的拆分权值,所述拆分信息为将网络模型拆分至各人工智能处理器的核以执行的信息;
第四确定子模块,用于确定所述拆分权值在所述第二编译结果的子编译结果中的位置;
第二更新子模块,用于根据确定出的位置和所述拆分权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
在一种可能的实现方式中,所述第二编译结果包括网络结构编译结果和第二权值编译结果;
所述更新模块包括:
第三更新子模块,用于更新所述第二权值编译结果中的权值,得到第一权值编译结果;
第四更新子模块,用于将所述网络结构编译结果和所述第一权值编译结果作为所述更新结果。
在一种可能的实现方式中,所述装置还包括:
编译模块,用于在判断第一网络模型的网络结构发生变化时,则不再判断权值是否发生变化,并对第一网络模型进行整体编译,或
调用模块,用于在判断第一网络模型的网络结构未发生变化且权值未发生变化时,将所述第二编译结果作为第一网络模型的第一编译结果。
在一种可能的实现方式中,所述第一网络结构信息、所述第一参数信息、所述第一编译结果、所述第二网络结构信息、所述第二参数信息和所述第二编译结果存储在缓存中。
根据本公开的另一方面,提供了一种数据处理装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。
根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
本公开实施例通过在针对第一网络模型进行编译之前,在判断第一网络模型的网络结构未发生变化且权值发生变化时,更新已被编译的第二网络模型的第二编译结果中的权值,得到第一网络模型的第一编译结果,由此在待编译的第一网络模型相较于之前已编译的第二网络模型仅权值发生变化时,仅更新已编译的第二网络模型的编译结果的权值,即可得到第一网络模型的编译结果,而无需重新对第一网络模型进行整体编译,由此大大提升了网络模型的编译效率。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1是根据一示例性实施例示出的一种数据处理方法的流程图。
图2是根据一示例性实施例示出的一种数据处理方法中步骤101的流程图。
图3是根据一示例性实施例示出的一种数据处理方法中步骤101的流程图。
图4是根据一示例性实施例示出的一种数据处理方法中步骤101的流程图。
图5是根据一示例性实施例示出的一种数据处理方法的流程图。
图6是一应用示例示出的一种数据处理方法的流程图。
图7是根据一示例性实施例示出的一种数据处理装置的框图。
图8是根据一示例性实施例示出的一种数据处理装置的框图。
图9是根据一示例性实施例示出的一种数据处理装置的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1是根据一示例性实施例示出的一种数据处理方法的流程图。如图1所示,该方法可以包括:
步骤100,在针对第一网络模型进行编译之前,判断第一网络模型的网络结构和权值相对于已编译的第二网络模型是否发生变化。
步骤101,在判断第一网络模型的网络结构未发生变化且权值发生变化时,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,并将所述更新结果作为第一网络模型的第一编译结果。
本公开实施例可以应用于人工智能处理器中,该人工智能处理器可以用于执行人工智能运算,人工智能运算可包括诸如神经网络运算、k-means运算、支持向量机运算等机器学习运算,或类脑运算等。该人工智能处理器可以例如包括NPU(Neural-NetworkProcessing Unit,神经网络处理单元)、ASIC(Application Specific IntegratedCircuit,应用专用集成电路)、DSP(Digital Signal Process,数字信号处理单元)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)芯片、控制器、微控制器、微处理器中的一种或多种。该人工智能处理器可以包括一个或多个运算单元,多个运算单元可以并行执行运算。需要说明的是,可以根据编译网络模型的需要选择适用的人工智能处理器,本公开实施例对人工智能处理器的类型不做限定。
在本公开实施例中,编译(compilation compile)可以表示为利用编译程序从源语言编写的源程序产生可直接被计算机运行的机器码集合的过程。网络模型的编译结果可以表示为根据网络模型编译得到的可直接被计算机运行的机器码集合。
作为本实施例的一个示例,人工智能处理器可以在针对第一网络模型进行编译之前,获取已编译的第二网络模型。人工智能处理器可以判断第一网络模型相对于已编译的第二网络模型网络结构和权值是否发生变化(例如,人工智能处理器可以遍历对比第一网络模型和第二网络模型,来判断第一网络模型的网络结构和权值相对于第二网络模型对否发生变化,人工智能处理器也可以对比第一网络模型和第二网络模型的哈希值,来判断第一网络模型的网络结构和权值相对于第二网络模型对否发生变化)。人工智能处理器在判断第一网络模型的网络结构未发生变化且权值发生变化时,可以更新第二网络模型被编译时得到第二编译结果中的权值,得到第一网络模型的第一编译结果(例如,若人工智能处理器在遍历对比第一网络模型和第二网络模型过程中,判断第一网络模型的网络结构未发生变化且权值发生变化时,则可以确定变化了的权值,以及变化了的权值在第二编译结果中的位置信息,并更新第二编译结果中确定的位置信息所对应的权值,得到第一网络模型的第一编译结果)。
本公开实施例通过在针对第一网络模型进行编译之前,在判断第一网络模型的网络结构未发生变化且权值发生变化时,更新已被编译的第二网络模型的第二编译结果中的权值,得到第一网络模型的第一编译结果,由此在待编译的第一网络模型相较于之前已编译的第二网络模型仅权值发生变化时,仅更新已编译的第二网络模型的编译结果的权值,即可得到第一网络模型的编译结果,而无需重新对第一网络模型进行整体编译,由此大大提升了网络模型的编译效率。
作为本实施例的一个示例,人工智能处理器可以在针对第一网络模型进行编译之前,确定第一网络模型的第一网络结构信息和第一网络模型中每个权值对应的第一权值信息,并获取第二网络模型的第二网络结构信息和第二网络模型中每个权值对应的第二权值信息(其中,网络模型的网络结构信息可以表示为用于描述网络模型中算子结构的信息。权值信息可以为权值的唯一编号,例如,权值的权值信息可以包括在权值被首次编译时产生的校验码,两个权值的权值信息不一致则两个权值不同)。
人工智能处理器可以对比第一网络结构信息和第二网络结构信息是否一致,并可以在第一网络结构信息和第二网络结构信息相一致时,对比第一权值信息和第二权值信息是否一致。人工智能处理器可以在第一网络结构信息和第二网络结构信息一致,且第一权值信息和第二权值信息不一致时,判断第一网络模型的网络结构未发生变化且权值发生变化。
这样,本公开实施例仅通过对比第一网络模型和第二网络模型的网络结构信息、权值信息,就可以判断是否需要对已编译的第二网络模型的第二编译结果的权值进行更新,无需进行例如整体对比第一网络模型和第二网络模型等复杂处理,可以进一步提高网络模型编译的效率。
作为本实施例的一个示例,本公开实施例的方法可以应用于单核人工智能处理器,图2是根据一示例性实施例示出的一种数据处理方法中步骤101的流程图。如图2所示,步骤101可以包括:
步骤200,确定第一网络模型相对于第二网络模型发生变化的权值。
步骤201,确定所述发生变化的权值在所述第二编译结果中的位置。
步骤202,根据确定出的位置和所述发生变化的权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
本公开实施例通过确定发生变化的权值在第二编译结果中的位置,并更新该位置对应的权值,无需进行诸如遍历第二编译结果的复杂操作,可以进一步提升网络模型的编译效率。
举例来讲,人工智能处理器在针对第一网络模型进行编译之前,可以确定第一网络模型中每个权值对应的第一算子信息和第一权值信息,并可以获取第二网络模型的第二编译结果,以及第二网络模型中每个权值对应的第二算子信息与第二权值信息。其中,算子信息可以包括算子的唯一标号,由于网络模型是由一个或多个算子组成的,可以根据网络模型的权值所对应的算子信息,在网络模型的编译结果中确定该权值的位置。人工智能处理器可以对比第一权值信息和第二权值信息,并可以在第一权值信息和第二权值信息不一致时,确定第一网络模型相对于第二网络模型发生变化的权值。人工智能处理器可以确定发生变化的权值对应的第二算子信息(发生变化的权值在所述第二编译结果中的位置的示例),并可以更新第二编译结果中确定的第二算子信息所对应的权值,由此得到第一编译结果。
例如,若第一网络模型包括算子a,算子a对应于权值A,算子a的第一算子信息为a’,权值A的第一权值信息为A’;第二网络模型包括算子a,算子a对应于权值B,算子a的第二算子信息为a’,权值B的第二权值信息为B’,则人工智能处理器根据第一权值信息和第二权值信息可以确定发生变化的权值为权值B,并可以确定权值B所对应的第二算子信息a’,接着,人工智能处理器可以将第二编译结果中第二算子信息a’对应的权值B更新为权值A,由此得到第一编译结果。其中,本公开实施例通过网络模型的权值的算子信息,可以快速的定位发生变化的权值在网络模型的编译结果中的位置,进一步提升网络模型的编译效率。
作为本实施例的一个示例,所述方法可以应用于多核人工智能处理器,图3是根据一示例性实施例示出的一种数据处理方法中步骤101的流程图。如图3所示,步骤101可以包括:
步骤300,确定第一网络模型相对于第二网络模型发生变化的权值。
步骤301,调用拆分信息将所述发生变化的权值拆分至各个核,得到与各核对应的拆分权值,所述拆分信息为将网络模型拆分至各人工智能处理器的核以执行的信息。
步骤302,确定所述拆分权值在所述第二编译结果的子编译结果中的位置。
步骤303,根据确定出的位置和所述拆分权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
在本公开实施例中,第二编译结果可以包括与人工智能处理器的不同核对应的子编译结果。拆分信息可以为将网络模型拆分至各人工智能处理器的核以执行的信息,当两个网络模型的网络结构相同,两个网络模型的拆分信息也相同。
举例来讲,人工智能处理器在针对第一网络模型进行编译之前,可以确定第一网络模型的第一拆分信息,以及第一网络模型中每个权值对应的第一算子信息和第一权值信,并可以获取第二网络模型的第二拆分信息、第二编译结果,以及第二网络模型中每个权值对应的第二算子信息和第二权值信息。
人工智能处理器可以对比第一权值信息和第二权值信息,并可以在第一权值信息和第二权值信息不一致时,确定第一网络模型相对于第二网络模型发生变化的权值。人工智能处理器可以调用第一拆分信息或第二拆分信息,将发生变化的权值拆分至各个核,得到与各核对应的拆分权值。人工智能处理器可以确定拆分权值的算子信息(拆分权值在第二编译结果的子编译结果中的位置的示例),并可以更新第二编译结果中确定的算子信息所对应的权值,得到更新结果。
本公开实施例在人工智能处理器为多核的情况下,可以根据网络模型的拆分信息拆分发生变化的权值,有利于快速定位并更新网络模型编译结果中需要被更新的权值,进行进一步提升网络模型的编译效率。
作为本实施例的一个示例,所述第二编译结果包括网络结构编译结果和第二权值编译结果,图4是根据一示例性实施例示出的一种数据处理方法中步骤101的流程图。如图4所示,步骤101可以包括:
步骤400,更新所述第二权值编译结果中的权值,得到第一权值编译结果。
步骤401,将所述网络结构编译结果和所述第一权值编译结果作为所述更新结果。
在本公开实施例中,网络结构编译结果可以为针对网络模型的网络结构的编译结果,权值编译结果可以为针对网络模型的权值的编译结果。
举例来讲,在人工智能处理器为单核的情况下,人工智能处理器在针对第一网络模型进行编译之前,可以确定第一网络模型中每个权值的第一权值信息和第一算子信息,并可以获取第二网络模型的第二编译结果,以及第二网络模型中每个权值的第二权值信息和第二算子信息。人工智能处理器可以根据第一权值信息和第二权值信息,确定第一网络模型相对于第二网络模型发生变化的权值,并可以确定发生变化的权值的第二算子信息。人工智能处理器可以更新第二权值编译结果中确定的第二算子信息所对应的权值,得到第一权值编译结果。人工智能处理器可以将第二网络模型的网络结构编译结果和第一权值编译结果作为更新结果,并将该更新结果作为第一网络模型的第一编译结果。
举例来讲,在人工智能处理器为多核的情况下,人工智能处理器在针对第一网络模型进行编译之前,可以提取第一网络模型的第一拆分信息,以及第一网络模型中每个权值对应的第一权值信息和第一算子信息,并可以获取第二网络模型的第二拆分信息和第二编译结果,以及第二网络模型中每个权值对应的第二权值信息和第二算子信息。人工智能处理器可以根据第一权值信息和第二权值信息,确定第一网络模型相对于第二网络模型发生变化的权值,并可以调用第一拆分信息或第二拆分信息,将发生变化的权值拆分至各个核,得到与各核对应的拆分权值。人工智能处理器可以确定拆分权值的第二算子信息,并可以更新第二权值编译结果中确定的第二算子信息所对应的权值,得到第一权值编译结果。人工智能处理器可以将第二网络模型的网络结构编译结果和第一权值编译结果作为更新结果,并将该更新结果作为第一网络模型的第一编译结果。
图5是根据一示例性实施例示出的一种数据处理方法的流程图。如图5所示,图5与图1之间的区别在于,所述方法还可以包括:
步骤500,在判断第一网络模型的网络结构发生变化时,则不再判断权值是否发生变化,并对第一网络模型进行整体编译,或
步骤501,在判断第一网络模型的网络结构未发生变化且权值未发生变化时,将所述第二编译结果作为第一网络模型的第一编译结果。
作为本实施例的一个示例,人工智能处理器可以先判断第一网络模型和第二网络模型的网络结构是否一致,并可以在判断第一网络模型的网络结构相对于第二网络模型的网络结构发生变化时,对第一网络模型进行整体编译。这样,本公开实施例可以通过在判断待编译的网络模型和已编译的网络模型的网络结构发生变化时,即对待编译的网络模型进行整体编译,无需再判断待编译的网络模型的权值相对已编译的网络模型的权值是否发生变化,提升了编译网络模型的效率。
作为本实施例的一个示例,人工智能处理器可以在判断第一网络模型相对于第二网络模型的网络结构和权值均未发生变化时,将编译第二网络模型产生的第二编译结果作为第一网络模型的第一编译结果。这样,本公开实施例仅通过判断第一网络模型相对于第二网络模型的网络结构和权值是否变化既可以判断是否需要对网络模型进行局部编译或直接调用编译第二网络模型产生的编译结果,由此可以进一步提升网络模型的编译效率。
在一种可能的实现方式中,第一网络结构信息、第一权值信息、第一算子信息、第一拆分信息、第一编译结果、第二网络结构信息、第二权值信息、第二算子信息、第二拆分信息和第二编译结果可以存储在缓存中。这样,有利于人工智能处理器更快速的获取上述各项参数信息,有利于提高编译网络模型的效率。
图6是一应用示例示出的一种数据处理方法的流程图。如图6所示,编译第一网络模型的过程可以包括以下步骤:
在步骤600中,人工智能处理器在编译第一网络模型之前,可以输入缓存模型(第二编译结果的示例)的网络信息(第二网络模型的第二网络结构信息、第二网络模型中权值对应的权值信息和算子信息的示例)。并可以提取第一网络模型的第一网络结构信息,以及第一网络模型中权值对应的第一权值信息和第一算子信息。
在步骤601,网络模型解析过程中,人工智能处理器可以比较第一网络结构信息和第二网络结构信息是否一致,并可以在判断第一网络结构信息和第二网络结构信息一致,且第一权值信息和第二权值信息一致时,确定缓存模型无变化,将缓存模型直接作为第一网络模型的编译结果。
人工智能处理器可以在判断第一网络结构信息和第二网络结构信息一致,且第一权值信息和第二权值信息不一致时,模型不变权值变化,可以进行更新权值操作。
在步骤602,权值解析过程中,人工智能处理器可以确定发生变化的权值。在人工智能处理器为多核的情况下,需要拆分权值,则人工智能处理器可以调用拆分信息将发生变化的权值拆分至各个核,得到与各核对应的拆分权值。在人工智能处理器为单核的情况下,无需拆分权值,则人工智能处理器可以调用更新过程。
在步骤603,权值更新过程中,人工智能处理器可以确定发生变化的权值的位置,并更新缓存模型的相应的位置对应的权值,得到更新后的缓存模型,
在步骤604中,人工智能处理器可以输出更新后的缓存模型,将更新后的缓存模型作为第一网络模型的编译结果。
图7是根据一示例性实施例示出的一种数据处理装置的框图。如图7所示,该装置可以包括:
判断模块71,用于在针对第一网络模型进行编译之前,判断第一网络模型的网络结构和权值相对于已编译的第二网络模型是否发生变化;
更新模块72,用于在判断第一网络模型的网络结构未发生变化且权值发生变化时,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,并将所述更新结果作为第一网络模型的第一编译结果。
图8是根据一示例性实施例示出的一种数据处理装置的框图。为了便于说明,在图8中仅展示出了与本实施例相关的部分。图8中标号与图7相同的组件具有相同的功能,为了简明起见,省略对这些组件的详细说明。如图8所示,
在一种可能的实现方式中,所述装置应用于单核人工智能处理器,所述更新模块72包括:
第一确定子模块721,用于确定第一网络模型相对于第二网络模型发生变化的权值;
第二确定子模块722,用于确定所述发生变化的权值在所述第二编译结果中的位置;
第一更新子模块723,用于根据确定出的位置和所述发生变化的权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
在一种可能的实现方式中,所述装置应用于多核人工智能处理器,所述更新模块72包括:
第三确定子模块724,用于确定第一网络模型相对于第二网络模型发生变化的权值;
拆分子模块725,用于调用拆分信息将所述发生变化的权值拆分至各个核,得到与各核对应的拆分权值,所述拆分信息为将网络模型拆分至各人工智能处理器的核以执行的信息;
第四确定子模块726,用于确定所述拆分权值在所述第二编译结果的子编译结果中的位置;
第二更新子模块727,用于根据确定出的位置和所述拆分权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
在一种可能的实现方式中,所述第二编译结果包括网络结构编译结果和第二权值编译结果;
所述更新模块72包括:
第三更新子模块728,用于更新所述第二权值编译结果中的权值,得到第一权值编译结果;
第四更新子模块729,用于将所述网络结构编译结果和所述第一权值编译结果作为所述更新结果。
在一种可能的实现方式中,所述装置还包括:
编译模块73,用于在判断第一网络模型的网络结构发生变化时,则不再判断权值是否发生变化,并对第一网络模型进行整体编译,或
调用模块74,用于在判断第一网络模型的网络结构未发生变化且权值未发生变化时,将所述第二编译结果作为第一网络模型的第一编译结果。
图9是根据一示例性实施例示出的一种数据处理装置的框图。例如,装置1900可以被提供为一服务器。参照图9,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由装置1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (12)

1.一种数据处理方法,其特征在于,所述方法应用于人工智能处理器,包括:
在针对第一网络模型进行编译之前,判断第一网络模型的网络结构和权值相对于已编译的第二网络模型是否发生变化;
在判断第一网络模型的网络结构未发生变化且权值发生变化时,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,并将所述更新结果作为第一网络模型的第一编译结果;
所述方法应用于多核人工智能处理器,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,包括:
确定第一网络模型相对于第二网络模型发生变化的权值;
调用拆分信息将所述发生变化的权值拆分至各个核,得到与各核对应的拆分权值,所述拆分信息为将网络模型拆分至各人工智能处理器的核以执行的信息。
2.根据权利要求1所述的方法,其特征在于,所述方法应用于单核人工智能处理器,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,包括:
确定第一网络模型相对于第二网络模型发生变化的权值;
确定所述发生变化的权值在所述第二编译结果中的位置;
根据确定出的位置和所述发生变化的权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
3.根据权利要求1所述的方法,其特征在于,所述方法应用于多核人工智能处理器,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,还包括:
确定所述拆分权值在所述第二编译结果的子编译结果中的位置;
根据确定出的位置和所述拆分权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
4.根据权利要求1所述的方法,其特征在于,所述第二编译结果包括网络结构编译结果和第二权值编译结果;
更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,包括:
更新所述第二权值编译结果中的权值,得到第一权值编译结果;
将所述网络结构编译结果和所述第一权值编译结果作为所述更新结果。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在判断第一网络模型的网络结构发生变化时,则不再判断权值是否发生变化,并对第一网络模型进行整体编译,或
在判断第一网络模型的网络结构未发生变化且权值未发生变化时,将所述第二编译结果作为第一网络模型的第一编译结果。
6.一种数据处理装置,其特征在于,所述装置应用于人工智能处理器,包括:
判断模块,用于在针对第一网络模型进行编译之前,判断第一网络模型的网络结构和权值相对于已编译的第二网络模型是否发生变化;
更新模块,用于在判断第一网络模型的网络结构未发生变化且权值发生变化时,更新第二网络模型被编译时得到第二编译结果中的权值,得到更新结果,并将所述更新结果作为第一网络模型的第一编译结果;
所述装置应用于多核人工智能处理器,所述更新模块包括:
第三确定子模块,用于确定第一网络模型相对于第二网络模型发生变化的权值;
拆分子模块,用于调用拆分信息将所述发生变化的权值拆分至各个核,得到与各核对应的拆分权值,所述拆分信息为将网络模型拆分至各人工智能处理器的核以执行的信息。
7.根据权利要求6所述的装置,其特征在于,所述装置应用于单核人工智能处理器,所述更新模块包括:
第一确定子模块,用于确定第一网络模型相对于第二网络模型发生变化的权值;
第二确定子模块,用于确定所述发生变化的权值在所述第二编译结果中的位置;
第一更新子模块,用于根据确定出的位置和所述发生变化的权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
8.根据权利要求6所述的装置,其特征在于,所述装置应用于多核人工智能处理器,所述更新模块还包括:
第四确定子模块,用于确定所述拆分权值在所述第二编译结果的子编译结果中的位置;
第二更新子模块,用于根据确定出的位置和所述拆分权值,更新所述第二编译结果中所述位置上的权值,得到更新结果。
9.根据权利要求6所述的装置,其特征在于,所述第二编译结果包括网络结构编译结果和第二权值编译结果;
所述更新模块包括:
第三更新子模块,用于更新所述第二权值编译结果中的权值,得到第一权值编译结果;
第四更新子模块,用于将所述网络结构编译结果和所述第一权值编译结果作为所述更新结果。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
编译模块,用于在判断第一网络模型的网络结构发生变化时,则不再判断权值是否发生变化,并对第一网络模型进行整体编译,或
调用模块,用于在判断第一网络模型的网络结构未发生变化且权值未发生变化时,将所述第二编译结果作为第一网络模型的第一编译结果。
11.一种数据处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
执行时实现权利要求1至5中任意一项所述的方法。
12.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至5中任意一项所述的方法。
CN201910149687.8A 2019-02-28 2019-02-28 运算方法及装置 Active CN111626401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910149687.8A CN111626401B (zh) 2019-02-28 2019-02-28 运算方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910149687.8A CN111626401B (zh) 2019-02-28 2019-02-28 运算方法及装置

Publications (2)

Publication Number Publication Date
CN111626401A CN111626401A (zh) 2020-09-04
CN111626401B true CN111626401B (zh) 2022-11-01

Family

ID=72271609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910149687.8A Active CN111626401B (zh) 2019-02-28 2019-02-28 运算方法及装置

Country Status (1)

Country Link
CN (1) CN111626401B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727633A (zh) * 2019-09-17 2020-01-24 广东高云半导体科技股份有限公司 基于SoC FPGA的边缘人工智能计算系统构架

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101902763A (zh) * 2009-05-27 2010-12-01 大唐移动通信设备有限公司 一种广播波束权值的配置和更新方法及装置
CN105608435A (zh) * 2015-12-23 2016-05-25 上海华力创通半导体有限公司 基于并行处理的图像数据背景快速识别方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6745019B2 (ja) * 2015-10-29 2020-08-26 株式会社Preferred Networks 情報処理装置及び情報処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101902763A (zh) * 2009-05-27 2010-12-01 大唐移动通信设备有限公司 一种广播波束权值的配置和更新方法及装置
CN105608435A (zh) * 2015-12-23 2016-05-25 上海华力创通半导体有限公司 基于并行处理的图像数据背景快速识别方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于FPGA的BP神经网络硬件实现及改进;杨景明等;《计算机工程与设计》;20180616(第06期);全文 *
矩阵型自适应复数滤波器算法研究及核心单元FPGA设计;王莎莎等;《南京邮电大学学报(自然科学版)》;20130709(第04期);全文 *

Also Published As

Publication number Publication date
CN111626401A (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
CN109343857B (zh) 线上部署机器学习模型的方法、设备和存储介质
US20200175370A1 (en) Decentralized distributed deep learning
CN111682954A (zh) 管理微服务的网络
KR20210110530A (ko) 딥 러닝에 기반한 연산자 등록 처리 방법, 장치 및 전자 기기
US20220101194A1 (en) Method, electronic device, and computer program product for processing machine learning model
CN110609755A (zh) 跨区块链节点的消息处理方法及装置、设备、介质
US11461291B2 (en) Method, electronic device and computer program product for processing machine learning model
CN111966361A (zh) 用于确定待部署模型的方法、装置、设备及其存储介质
CN107729001B (zh) 一种表达式处理方法和装置
CN110046025B (zh) 一种用于重启虚拟机的方法、介质、计算机系统和系统
CN111882038A (zh) 模型转换方法与装置
CN111626401B (zh) 运算方法及装置
US20190073198A1 (en) Multi-flavored software execution from a singular code base
US10754630B2 (en) Build-time code section-specific compiler selection
CN116701143A (zh) 性能分析方法、装置、系统、计算设备及存储介质
US10409573B1 (en) Batch script decomposer
CN112579151A (zh) 一种模型文件的生成方法和装置
CN114548407A (zh) 层级目标定向因果发现方法、装置及电子设备
US10289788B1 (en) System and method for suggesting components associated with an electronic design
US20160359727A1 (en) Quantifying and designing optimal connecting networks
US20190385091A1 (en) Reinforcement learning exploration by exploiting past experiences for critical events
CN111078230A (zh) 一种代码生成方法和装置
CN113031962B (zh) 编译方法、编译装置、电子设备、存储介质和程序产品
CN116974922B (zh) 深度学习模型的性能分析方法、装置、设备和存储介质
US11816478B1 (en) Shrinking delta files based on function analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant