CN113379038A - 数据处理方法和电子设备 - Google Patents
数据处理方法和电子设备 Download PDFInfo
- Publication number
- CN113379038A CN113379038A CN202110719742.XA CN202110719742A CN113379038A CN 113379038 A CN113379038 A CN 113379038A CN 202110719742 A CN202110719742 A CN 202110719742A CN 113379038 A CN113379038 A CN 113379038A
- Authority
- CN
- China
- Prior art keywords
- layer
- data
- format
- network
- network layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000006243 chemical reaction Methods 0.000 claims abstract description 63
- 238000012545 processing Methods 0.000 claims abstract description 51
- 238000003062 neural network model Methods 0.000 claims abstract description 37
- 238000000034 method Methods 0.000 claims description 21
- 238000011084 recovery Methods 0.000 claims description 20
- 230000008859 change Effects 0.000 claims description 18
- 238000012216 screening Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Design And Manufacture Of Integrated Circuits (AREA)
Abstract
本申请提出了一种数据处理方法和电子设备,涉及数据处理技术领域。其中,上述数据处理方法包括:首先,确定待处理数据的第一数据排布格式。然后,从神经网络模型的各个网络层中筛选第一网络层,目标芯片在第一网络层支持的数据排布格式与第一数据排布格式不一致。其次,根据筛选出的第一网络层,确定至少一个网络层子集,每个网络层子集包括至少一个第一网络层。最后,为每个网络层子集添加格式转换层,并基于添加格式转换层的神经网络模型对待处理数据进行处理。从而,可以对输入网络层子集的待处理数据进行数据排布格式转换,提高目标芯片对各种排布格式的数据的处理效率。
Description
【技术领域】
本申请涉及数据处理技术领域,尤其涉及一种数据处理方法和电子设备。
【背景技术】
在深度学习领域,神经网络模型处理的数据通常是多维数据。多维数据具有不同的排布格式,以常见的四维数据为例,四个维度分别为:数量(N)、高度(H)、宽度(W)以及通道数(C),其排布格式主要有NHWC以及NCHW。
应用神经网络模型进行数据处理时,芯片对输入各个网络层的数据的排布格式有特定的要求。如果输入数据的排布格式与芯片要求的排布格式不符,那么芯片的处理效率会比较低,甚至无法处理。在这种情况下,如何提高数据处理效率是待解决的问题。
【发明内容】
本申请实施例提供了一种数据处理方法和电子设备,用以提高目标芯片对各种排布格式的待处理数据的处理效率。
第一方面,本申请实施例提供一种数据处理方法,包括:确定待处理数据的第一数据排布格式;从神经网络模型的各个网络层中筛选第一网络层,所述目标芯片在所述第一网络层支持的数据排布格式与所述第一数据排布格式不一致;根据筛选出的所述第一网络层,确定至少一个网络层子集,每个所述网络层子集包括至少一个所述第一网络层;为每个所述网络层子集添加格式转换层,所述格式转换层用于对所述待处理数据进行数据排布格式转换;基于添加所述格式转换层的神经网络模型对所述待处理数据进行处理。
其中一种可能的实现方式中,根据筛选出的所述第一网络层,确定至少一个网络层子集,包括:如果排布次序连续的N个网络层均为第一网络层,则将所述N个第一网络层确定为一个网络层子集,所述N为正整数。
其中一种可能的实现方式中,根据筛选出的所述第一网络层,确定至少一个网络层子集,包括:如果N个第一网络层之间连接有至少一个第二网络层,则将所述N个第一网络层和所述至少一个第二网络层确定为一个网络层子集;所述目标芯片在所述第二网络层的处理效率与数据排布格式无关。
其中一种可能的实现方式中,所述格式转换层包括格式更改层和格式恢复层;为每个所述网络层子集添加格式转换层,包括:在每个所述网络层子集的首个第一网络层的输入侧添加所述格式更改层,所述格式更改层用于将所述第一数据排布格式更改为所述目标芯片支持的数据排布格式;在每个所述网络层子集的最后一个第一网络层的输出侧添加所述格式恢复层,所述格式恢复层用于将输出数据的数据排布格式还原为所述第一数据排布格式。
第二方面,本申请实施例提供一种数据处理方法,包括:将第一数据排布格式的待处理数据输入神经网络模型,所述神经网络模型包括至少一个网络层子集,每个所述网络层子集均添加有格式转换层,每个所述网络层子集包括至少一个第一网络层,目标芯片在所述第一网络层支持的数据排布格式与所述第一数据排布格式不一致;对所述待处理数据进行处理,其中,所述格式转换层用于对所述待处理数据进行数据排布格式转换。
其中一种可能的实现方式中,所述方法还包括:所述格式转换层包括格式更改层和格式恢复层;所述格式更改层添加在每个所述网络层子集的首个第一网络层的输入侧,用于将所述第一数据排布格式更改为所述目标芯片支持的数据排布格式;所述格式恢复层添加在每个所述网络层子集的最后一个第一网络层的输出侧,用于将输出数据的数据排布格式还原为所述第一数据排布格式。
第三方面,本申请实施例提供一种数据处理装置,包括:第一确定模块,用于确定待处理数据的第一数据排布格式;筛选模块,用于从神经网络模型的各个网络层中筛选第一网络层,所述目标芯片在所述第一网络层支持的数据排布格式与所述第一数据排布格式不一致;第二确定模块,用于根据筛选出的所述第一网络层,确定至少一个网络层子集,每个所述网络层子集包括至少一个所述第一网络层;添加模块,用于为每个所述网络层子集添加格式转换层,所述格式转换层用于对所述待处理数据进行数据排布格式转换;执行模块,用于基于添加所述格式转换层的神经网络模型对所述待处理数据进行处理。
其中一种可能的实现方式中,所述第二确定模块具体用于,如果排布次序连续的N个网络层均为第一网络层,则将所述N个第一网络层确定为一个网络层子集,所述N为正整数。
其中一种可能的实现方式中,所述第二确定模块具体用于,如果N个第一网络层之间连接有至少一个第二网络层,则将所述N个第一网络层和所述至少一个第二网络层确定为一个网络层子集;所述目标芯片在所述第二网络层的处理效率与数据排布格式无关。
其中一种可能的实现方式中,所述格式转换层包括格式更改层和格式恢复层,所述添加模块具体用于,在每个所述网络层子集的首个第一网络层的输入侧添加所述格式更改层,所述格式更改层用于将所述第一数据排布格式更改为所述目标芯片支持的数据排布格式;在每个所述网络层子集的最后一个第一网络层的输出侧添加所述格式恢复层,所述格式恢复层用于将输出数据的数据排布格式还原为所述第一数据排布格式。
第四方面,本申请实施例提供一种数据处理装置,包括:输入模块,用于将第一数据排布格式的待处理数据输入神经网络模型,所述神经网络模型包括至少一个网络层子集,每个所述网络层子集均添加有格式转换层,每个所述网络层子集包括至少一个第一网络层,目标芯片在所述第一网络层支持的数据排布格式与所述第一数据排布格式不一致;处理模块,用于对所述待处理数据进行处理,其中,所述格式转换层用于对所述待处理数据进行数据排布格式转换。
第五方面,本申请实施例提供一种电子设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如第一方面所述的方法。
第六方面,本申请实施例提供一种电子设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如第二方面所述的方法。
第七方面,本申请实施例提供一种芯片,所述芯片包括处理器与数据接口,所述处理器通过所述数据接口读取存储器上存储的指令,能够执行如第一方面和第二方面所述的方法。
第八方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如第一方面和第二方面所述的方法。
以上技术方案中,首先,确定待处理数据的第一数据排布格式。然后,从神经网络模型的各个网络层中筛选第一网络层,目标芯片在第一网络层支持的数据排布格式与第一数据排布格式不一致。其次,根据筛选出的第一网络层,确定至少一个网络层子集,每个网络层子集包括至少一个第一网络层。最后,为每个网络层子集添加格式转换层,并基于添加格式转换层的神经网络模型对待处理数据进行处理。从而,可以对输入网络层子集的待处理数据进行数据排布格式转换,提高目标芯片对各种排布格式的数据的处理效率。
【附图说明】
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种数据处理方法的流程图;
图2为本申请实施例提供的一种数据处理方法的结构示意图;
图3为本申请实施例提供的另一种数据处理方法的结构示意图;
图4为本申请实施例提供的另一种数据处理方法的结构示意图;
图5为本申请实施例提供的另一种数据处理方法的流程图;
图6为本申请实施例提供的一种数据处理装置的结构示意图;
图7为本申请实施例提供的另一种数据处理装置的结构示意图;
图8为本申请实施例提供的一种电子设备的结构示意图。
【具体实施方式】
为了更好的理解本申请的技术方案,下面结合附图对本申请实施例进行详细描述。
应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
本申请可提供一种数据处理设备,该数据处理设备可包含至少一个神经网络芯片。神经网络芯片指的是,能够利用神经网络模型进行数据处理的芯片,示例性的,如数字信号处理(Digital Signal Processing,DSP)芯片、嵌入式神经网络处理芯片(Neural-network Processing Unit,NPU)等。本申请提供的数据处理设备可用于执行本申请提供的数据处理方法,从而提高目标芯片对待处理数据的处理效率。目标芯片可以是,数据处理设备包含的任意一个神经网络芯片。
图1为本申请实施例提供的一种数据处理方法的流程图,如图1所示,上述数据处理方法可以包括:
步骤101,确定待处理数据的第一数据排布格式。
在深度学习领域,神经网络模型的待处理数据通常为多维数据。多维数据的存储和读取均为线性格式。本申请实施例所描述的数据排布格式,即为多维数据不同的线性排布方式。以四维数据为例,四个维度包括:数量(Batch,N)、高度(Height,H)、宽度(Width,W)以及通道数(Channels,C)。四维数据常见的数据排布格式主要有NHWC以及NCHW两种。
步骤102,从神经网络模型的各个网络层中筛选第一网络层,目标芯片在第一网络层支持的数据排布格式与第一数据排布格式不一致。
本申请实施例中,神经网络模型可包括多个网络层。由于芯片硬件设计的限制,目标芯片在不同的网络层所支持的数据排布格式可能不同。
基于上述说明,首先,可确定目标芯片在各个网络层所支持的数据排布格式。然后,可根据在各个网络层所支持的数据排布格式,筛选出各个第一网络层。目标芯片在第一网络层支持的数据排布格式与上述待处理数据的第一数据排布格式不一致。
步骤103,根据筛选出的第一网络层,确定至少一个网络层子集。
本申请实施例中,在确定网络层子集时,采取数量最少原则,以最少的网络层子集包含筛选出的全部第一网络层。即,每个网络层子集中均需包含尽量多的第一网络层。
具体的,可根据各个第一网络层在神经网络模型中的排布次序,将排布次序连续的N个第一网络层确定为一个网络层子集。由此,可得到至少一个网络层子集,且每个网络层子集均包含至少一个第一网络层。
其中,N为正整数。
举例说明,如图2所示,将神经网络模型中排布次序连续的N个第一网络层确定为一个网络层子集,由此,可得到两个网络层子集。两个网络层子集分别为网络层子集10、以及网络层子集20。其中,网络层子集10中可包括第一网络层11、第一网络层12以及第一网络层13。网络层子集20中可包括第一网络层21。
步骤104,为每个网络层子集添加格式转换层。
根据上述可知,网络层子集中的网络层均为第一网络层,也就是说,目标芯片在各个网络层子集所支持的数据排布格式与待处理数据的数据排布格式不一致。
因此,为了提高芯片在各个网络层子集处的处理效率,可为各个网络层子集添加格式转换层。格式转换层可用于对待处理数据进行数据排布格式转换,使得输入网络层子集的待处理数据转换为目标芯片所支持的排布格式。
具体的,如图3所示,格式转换层可包括格式更改层和格式恢复层。首先,可在每个网络层子集的首个第一网络层的输入侧添加格式更改层。格式更改层可用于将第一数据排布格式更改为目标芯片支持的数据排布格式。
然后,可在每个网络层子集的最后一个第一网络层的输出侧添加格式恢复层。格式恢复层可用于将输出数据的数据排布格式还原为第一数据排布格式。
步骤105,基于添加格式转换层的神经网络模型对待处理数据进行处理。
本申请实施例提供的方案通过为网络层子集添加格式转换层,可提高目标芯片对不同排布格式的数据的处理效率。并且,本申请实施例通过添加一对格式转换层,可一并实现对网络层子集中多个第一网络层的待处理数据的排布格式转换,提高了格式转换的效率,进一步提升了目标芯片的处理效率。
本申请另一实施例中,对上述步骤103作进一步说明。
本申请实施例中,神经网络模型中,除第一网络层外,还可以包括第二网络层。目标芯片在第二网络层的处理效率与数据排布格式无关。因此,待处理数据的数据排布格式可在第二网络层进行任意转换,而不会影响目标芯片的处理效率。
基于上述说明,本申请实施例确定的网络层子集中,还可包含至少一个第二网络层。
具体的,根据神经网络模型中各个网络层的排布次序,如果N个第一网络层之间连接有至少一个第二网络层,那么,依据确定网络层子集时的数量最少原则,可将N个第一网络层和至少一个第二网络层确定为一个网络层子集。从而,可以将尽量多的第一网络层划分至同一个网络层子集,减少网络层子集的数量,从而减少添加的格式转换层的数量。其中,N为正整数。
需要说明的是,上述第二网络层除了可位于多个第一网络层之间,还可以位于多个第一网络层之后。
举例来说,如图4所示,根据神经网络模型中各个网络层的排布次序,可确定网络层子集30。网络层子集30中包括第一网络层31、第一网络层33,以及位于第一网络层31和第一网络层33之间的第二网络层32。
本申请实施例提供的方案可进一步减少确定出的网络层子集的数量,进而减少添加的格式转换层的数量。从而,可进一步提高格式转换效率,减少格式转换层带来的额外计算量,提升目标芯片的处理效率。
图5为本申请实施例提供的另一种数据处理方法的流程图。本申请实施例中,上述数据处理方法可以包括:
步骤201,将待处理数据输入添加有格式转换层的神经网络模型。
本申请实施例中,待处理数据的数据排布格式可以为第一数据排布格式。神经网络模型可包括至少一个网络层子集。各个网络层子集可包括至少一个第一网络层。至少一个第一网络层在神经网络模型中的排布次序连续。进一步的,各个网络层子集还可包括至少一个第二网络层。第二网络层可位于各个第一网络层之间,还可位于各个第一网络层之后。每个网络层子集均添加有格式转换层。
步骤202,对待处理数据进行处理,其中,由格式转换层对待处理数据进行数据排布格式转换。
本申请实施例中,神经网络模型对待处理数据进行处理时,格式转换层可对待处理数据进行数据排布格式转换。具体的,格式更改层可将第一数据排布格式更改为目标芯片支持的数据排布格式。格式恢复层可将输出数据的数据排布格式还原为第一数据排布格式。
本申请实施例中,基于添加格式转换层的神经网络模型对待处理数据进行处理,可提高目标芯片对不同排布格式的数据的处理效率。
图6为本申请实施例提供的一种数据处理装置的结构示意图。如图6所示,上述数据处理装置可以包括:第一确定模块61、筛选模块62、第二确定模块63、添加模块64以及执行模块65。
第一确定模块61,用于确定待处理数据的第一数据排布格式。
筛选模块62,用于从神经网络模型的各个网络层中筛选第一网络层,目标芯片在第一网络层支持的数据排布格式与第一数据排布格式不一致。
第二确定模块63,用于根据筛选出的第一网络层,确定至少一个网络层子集,每个网络层子集包括至少一个第一网络层。
添加模块64,用于为每个网络层子集添加格式转换层,格式转换层用于对待处理数据进行数据排布格式转换。
执行模块65,用于基于添加格式转换层的神经网络模型对待处理数据进行处理。
一种具体的实现方式中,第二确定模块63具体用于,如果排布次序连续的N个网络层均为第一网络层,则将N个第一网络层确定为一个网络层子集,N为正整数。
一种具体的实现方式中,第二确定模块63具体用于,如果N个第一网络层之间连接有至少一个第二网络层,则将N个第一网络层和至少一个第二网络层确定为一个网络层子集;目标芯片在第二网络层的处理效率与数据排布格式无关。
一种具体的实现方式中,格式转换层包括格式更改层和格式恢复层,添加模块64具体用于,在每个网络层子集的首个第一网络层的输入侧添加格式更改层,格式更改层用于将第一数据排布格式更改为目标芯片支持的数据排布格式;在每个网络层子集的最后一个第一网络层的输出侧添加格式恢复层,格式恢复层用于将输出数据的数据排布格式还原为第一数据排布格式。
图7为本申请实施例提供的另一种数据处理装置的结构示意图。如图7所示,上述数据处理装置可以包括:输入模块71以及处理模块72。
输入模块71,用于将第一数据排布格式的待处理数据输入神经网络模型,神经网络模型包括至少一个网络层子集,每个网络层子集均添加有格式转换层,每个网络层子集包括至少一个第一网络层,目标芯片在第一网络层支持的数据排布格式与第一数据排布格式不一致。
处理模块72,用于对待处理数据进行处理,其中,格式转换层用于对待处理数据进行数据排布格式转换。
图8为本申请实施例提供的一种电子设备的结构示意图。如图8所示,上述电子设备可以包括至少一个处理器;以及与上述处理器通信连接的至少一个存储器,其中:存储器存储有可被处理器执行的程序指令,上述处理器调用上述程序指令能够执行本申请实施例提供的数据处理方法。
其中,上述电子设备可以为数据处理设备,本实施例对上述电子设备的具体形态不作限定。
图8示出了适于用来实现本申请实施方式的示例性电子设备的框图。图8显示的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8所示,电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:一个或者多个处理器410,存储器430,连接不同系统组件(包括存储器430和处理器410)的通信总线440。
通信总线440表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器430可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)和/或高速缓存存储器。电子设备可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read Only Memory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read Only Memory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与通信总线440相连。存储器430可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块的程序/实用工具,可以存储在存储器430中,这样的程序模块包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本申请所描述的实施例中的功能和/或方法。
电子设备也可以与一个或多个外部设备(例如键盘、指向设备、显示器等)通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过通信接口420进行。并且,电子设备还可以通过网络适配器(图8中未示出)与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide AreaNetwork;以下简称:WAN)和/或公共网络,例如因特网)通信,上述网络适配器可以通过通信总线440与电子设备的其它模块通信。应当明白,尽管图8中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Drives;以下简称:RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器410通过运行存储在存储器430中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例提供的数据处理方法。
本申请实施例还提供一种计算机可读存储介质,上述计算机可读存储介质存储计算机指令,上述计算机指令使上述计算机执行本申请实施例提供的数据处理方法。
上述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory;以下简称:ROM)、可擦式可编程只读存储器(Erasable Programmable ReadOnly Memory;以下简称:EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
需要说明的是,本申请实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer;以下简称:PC)、个人数字助理(Personal Digital Assistant;以下简称:PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
确定待处理数据的第一数据排布格式;
从神经网络模型的各个网络层中筛选第一网络层,所述目标芯片在所述第一网络层支持的数据排布格式与所述第一数据排布格式不一致;
根据筛选出的所述第一网络层,确定至少一个网络层子集,每个所述网络层子集包括至少一个所述第一网络层;
为每个所述网络层子集添加格式转换层,所述格式转换层用于对所述待处理数据进行数据排布格式转换;
基于添加所述格式转换层的神经网络模型对所述待处理数据进行处理。
2.根据权利要求1所述的方法,其特征在于,根据筛选出的所述第一网络层,确定至少一个网络层子集,包括:
如果排布次序连续的N个网络层均为第一网络层,则将所述N个第一网络层确定为一个网络层子集,所述N为正整数。
3.根据权利要求1所述的方法,其特征在于,根据筛选出的所述第一网络层,确定至少一个网络层子集,包括:
如果N个第一网络层之间连接有至少一个第二网络层,则将所述N个第一网络层和所述至少一个第二网络层确定为一个网络层子集;所述目标芯片在所述第二网络层的处理效率与数据排布格式无关。
4.根据权利要求1所述的方法,其特征在于,所述格式转换层包括格式更改层和格式恢复层;为每个所述网络层子集添加格式转换层,包括:
在每个所述网络层子集的首个第一网络层的输入侧添加所述格式更改层,所述格式更改层用于将所述第一数据排布格式更改为所述目标芯片支持的数据排布格式;
在每个所述网络层子集的最后一个第一网络层的输出侧添加所述格式恢复层,所述格式恢复层用于将输出数据的数据排布格式还原为所述第一数据排布格式。
5.一种数据处理方法,其特征在于,包括:
将第一数据排布格式的待处理数据输入神经网络模型,所述神经网络模型包括至少一个网络层子集,每个所述网络层子集均添加有格式转换层,每个所述网络层子集包括至少一个第一网络层,目标芯片在所述第一网络层支持的数据排布格式与所述第一数据排布格式不一致;
对所述待处理数据进行处理,其中,所述格式转换层用于对所述待处理数据进行数据排布格式转换。
6.根据权利要求5所述的方法,其特征在于,所述格式转换层包括格式更改层和格式恢复层;所述格式更改层添加在每个所述网络层子集的首个第一网络层的输入侧,用于将所述第一数据排布格式更改为所述目标芯片支持的数据排布格式;
所述格式恢复层添加在每个所述网络层子集的最后一个第一网络层的输出侧,用于将输出数据的数据排布格式还原为所述第一数据排布格式。
7.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至4任一所述的方法。
8.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求5至6任一所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至6任一所述的方法。
10.一种芯片,所述芯片包括处理器与数据接口,所述处理器通过所述数据接口读取存储器上存储的指令,能够执行如权利要求1至6任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110719742.XA CN113379038A (zh) | 2021-06-28 | 2021-06-28 | 数据处理方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110719742.XA CN113379038A (zh) | 2021-06-28 | 2021-06-28 | 数据处理方法和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113379038A true CN113379038A (zh) | 2021-09-10 |
Family
ID=77579510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110719742.XA Pending CN113379038A (zh) | 2021-06-28 | 2021-06-28 | 数据处理方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113379038A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113867817A (zh) * | 2021-09-24 | 2021-12-31 | 深圳Tcl新技术有限公司 | 一种数据处理方法、装置、电子设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242286A (zh) * | 2020-01-14 | 2020-06-05 | Oppo广东移动通信有限公司 | 一种数据格式变换方法、装置及计算机可读存储介质 |
CN112465122A (zh) * | 2020-12-09 | 2021-03-09 | 安徽寒武纪信息科技有限公司 | 优化神经网络模型中原始维度算子的装置和方法 |
CN113449841A (zh) * | 2020-03-27 | 2021-09-28 | 华为技术有限公司 | 插入转换算子的方法和装置 |
-
2021
- 2021-06-28 CN CN202110719742.XA patent/CN113379038A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242286A (zh) * | 2020-01-14 | 2020-06-05 | Oppo广东移动通信有限公司 | 一种数据格式变换方法、装置及计算机可读存储介质 |
CN113449841A (zh) * | 2020-03-27 | 2021-09-28 | 华为技术有限公司 | 插入转换算子的方法和装置 |
CN112465122A (zh) * | 2020-12-09 | 2021-03-09 | 安徽寒武纪信息科技有限公司 | 优化神经网络模型中原始维度算子的装置和方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113867817A (zh) * | 2021-09-24 | 2021-12-31 | 深圳Tcl新技术有限公司 | 一种数据处理方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108628807B (zh) | 浮点数矩阵的处理方法、装置、设备及计算机可读存储介质 | |
CN111813465B (zh) | 一种信息获取方法、装置、介质和设备 | |
CN103488502A (zh) | 一种数据加载方法及装置 | |
CN114610650A (zh) | 内存压缩方法、装置、存储介质及电子设备 | |
WO2022041188A1 (zh) | 用于神经网络的加速器、方法、装置及计算机存储介质 | |
CN110198473B (zh) | 视频处理方法、装置、电子设备及计算机可读存储介质 | |
CN113379038A (zh) | 数据处理方法和电子设备 | |
CN114374392A (zh) | 一种数据压缩存储方法、装置、终端设备及可读存储介质 | |
CN105320669A (zh) | 数据存储、读取方法及数据存储、读取装置 | |
CN113987152A (zh) | 一种知识图谱抽取方法、系统、电子设备及介质 | |
CN109408191A (zh) | 页面更新方法、装置、设备及存储介质 | |
US20240037179A1 (en) | Data processing method and apparatus | |
CN113657408B (zh) | 确定图像特征的方法、装置、电子设备和存储介质 | |
CN109543835B (zh) | 运算方法、装置及相关产品 | |
CN109542837B (zh) | 运算方法、装置及相关产品 | |
CN112394920A (zh) | 一种应用软件开发方法、平台和电子设备 | |
Bicer et al. | Improving I/O throughput of scientific applications using transparent parallel compression | |
CN108182656A (zh) | 一种图像处理方法及终端 | |
CN110852202A (zh) | 一种视频分割方法及装置、计算设备、存储介质 | |
US20230106805A1 (en) | System and method of efficient coding and decoding of contact matrices | |
CN111950572A (zh) | 训练分类器的方法、装置、电子设备和计算机可读存储介质 | |
CN109543836B (zh) | 运算方法、装置及相关产品 | |
CN109558564B (zh) | 运算方法、装置及相关产品 | |
CN115344506B (zh) | 内存地址的映射方法、内存访问方法和装置、芯片、设备 | |
CN109542531A (zh) | 一种文件布局调整方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210910 |
|
RJ01 | Rejection of invention patent application after publication |