WO2020200244A1

WO2020200244A1 - 数据处理方法及装置以及相关产品

Info

Publication number: WO2020200244A1
Application number: PCT/CN2020/082775
Authority: WO
Inventors: 刘少礼; 王秉睿; 周晓勇; 庄毅敏; 兰慧盈; 梁军; 李震; 吴健华; 郝勇峥
Original assignee: 中科寒武纪科技股份有限公司
Priority date: 2019-04-04
Filing date: 2020-04-01
Publication date: 2020-10-08
Also published as: JP2021520591A; JP7150802B2; KR20210002518A; KR102579192B1; EP3825847B1; JP2021170312A; JP7121101B2; EP3800547A4; JP2021120849A; JP2021140745A; KR20210003931A; EP3825842A1; KR102522416B1; KR20210002741A; JP7121100B2; KR102519470B1; KR102379406B1; JP2021140744A; EP3825848A1; EP3825847A1

Abstract

一种数据处理方法及装置以及相关产品，该方法包括：在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，获取所述描述符的内容（S11a），根据所述描述符的内容，执行所述第一处理指令（S12a）。通过以上方法可以提高相关产品在进行神经网络模型的运算时的运算效率。

Description

数据处理方法及装置以及相关产品

技术领域

本公开涉及计算机技术领域，尤其涉及一种数据处理方法及装置以及相关产品。

背景技术

随着人工智能技术的不断发展，其应用领域越来越广泛，在图像识别、语音识别、自然语言处理等领域中都得到了良好的应用。然而，随着人工智能算法的复杂度提高，需要处理的数据量和数据维度都在不断增大。在相关技术中，处理器通常通过获取指令的参数来确定数据地址，然后根据数据地址完成数据的读取和使用。这就要求技术人员在设计参数时设定数据存取的相关参数(例如数据之间或数据维度之间的相互关系等)，从而生成指令传递给处理器来完成数据的存取，该方式降低了处理器的处理效率。

发明内容

有鉴于此，本公开提出了一种数据处理技术方案。

根据本公开的一方面，提供了一种数据处理方法，包括：在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，获取所述描述符的内容，所述描述符用于指示张量的形状；根据所述描述符的内容，执行所述第一处理指令。

根据本公开的另一方面，提供了一种数据处理装置，包括：内容获取模块，用于在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，获取所述描述符的内容，所述描述符用于指示张量的形状；指令执行模块，用于根据所述描述符的内容，执行所述第一处理指令。

根据本公开的另一方面，提供了一种神经网络芯片，所述芯片包括如上所述的数据处理装置。

根据本公开的另一方面，提供了一种电子设备，所述电子设备包括如上所述的神经网络芯片。

根据本公开的另一方面，提供了一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如上所述的神经网络芯片；其中，所述神经网络芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；所述存储器件，用于存储数据；所述接口装置，用于实现所述神经网络芯片与外部设备之间的数据传输；所述控制器件，用于对所述神经网络芯片的状态进行监控。

根据本公开的实施例，通过引入指示张量形状的描述符，能够在解码的处理指令的操作数中包括描述符标识时确定对应的描述符内容，并根据描述符内容执行该处理指令，从而降低数据存取的复杂度，提高数据存取的效率。

根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面，并且用于解释本公开的原理。

图1a示出根据本公开实施例的数据处理方法的流程图。

图1b示出根据本公开实施例的数据处理装置的框图。

图1c示出根据本公开实施例的数据同步方法的流程图。

图1d1示出根据本公开实施例的应用场景的示意图。

图1d2示出根据本公开实施例的处理器操作方法的流程图。

图1e示出根据本公开实施例的数据同步方法的流程图。

图1f示出根据本公开实施例的数据处理方法的流程图。

图1g示出根据本公开实施例的处理器操作方法的流程图。

图2示出根据本公开实施例的数据存储空间的示意图。

图3a示出根据本公开实施例的数据处理装置的框图。

图3b示出根据本公开实施例的数据处理方法的流程图。

图3c1示出根据本公开实施例的数据同步方法的流程图。

图3c2示出根据本公开实施例的数据同步方法的流程图。

图3c3示出根据本公开实施例的数据同步装置的框图。

图3c4示出根据本公开实施例的数据同步装置的框图。

图3c5示出根据本公开实施例的数据同步装置的框图。

图3d示出根据本公开实施例的处理器操作装置的框图。

图3e示出根据本公开实施例的数据同步装置的框图。

图3f示出根据本公开实施例的数据处理装置的框图。

图3g示出根据本公开实施例的处理器操作装置的框图。

图4示出根据本公开实施例的板卡的结构框图。

图5a和图5b示出根据本公开实施例的处理器操作方法的应用场景的示意图。

图6a和图6b示出根据本公开实施例的处理器操作方法的应用场景的示意图。

图7a和图7b示出根据本公开实施例的处理器操作方法的应用场景的示意图。

图8示出根据本公开实施例的处理器操作方法的循环缓冲存储区域的示意图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本公开，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本公开同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本公开的主旨。

根据本公开的实施例，提供了一种数据处理方法。图1a示出根据本公开实施例的数据处理方法的流程图。如图1a所示，该数据处理方法包括：

在步骤S11a中，在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，获取所述描述符的内容，所述描述符用于指示张量的形状；

在步骤S12a中，根据所述描述符的内容，执行所述第一处理指令。

举例来说，该数据处理方法可应用于处理器中，该处理器可包括通用处理器(例如中央处理器CPU、图形处理器GPU)和专用处理器(例如人工智能处理器、科学计算处理器或数字信号处理器等)。本公开对处理器的类型不作限制。

在一种可能的实现方式中，待处理的数据可包括N维的张量数据(N为大于或等于零的整数，例如N＝1、2或3)，其中，张量可以包含多种形式的数据组成方式，张量可以是不同维度的，比如标量可以看作是0维张量，向量可以看作1维张量，而矩阵可以是2维或2维以上的张量。张量的形状包括张量的维度、张量各个维度的尺寸等信息。举例而言，对于张量：

该张量的形状可以被描述符描述为(2，4)，也即通过两个参数表示该张量为二维张量，且该张量的第一维度(列)的尺寸为2、第二维度(行)的尺寸为4。需要说明的是，本申请对于描述符指示张量形状的方式并不做限定。在存储器中存储张量数据时，根据其数据地址(或存储区域)无法确定张量数据的形状，进而也无法确定多个张量数据之间相互关系等相关信息，导致处理器对张量数据的存取效率较低。

在该情况下，可引入描述符(张量描述符)来指示张量(N维的张量数据)的形状。其中，N的取值可根据张量数据的维数(阶数)来确定，也可以根据张量数据的使用需要进行设定。例如，在N的取值为3时，张量数据为三维的张量数据，描述符可用来指示该三维的张量数据在三个维度方向上的形状(例如偏移量、尺寸等)。应当理解，本领域技术人员可以根据实际需要对N的取值进行设置，本公开对此不作限制。

在一种可能的实现方式中，描述符可包括标识和内容等，描述符的标识可用于对描述符进行区分，例如为编号；描述符的内容可包括表示张量数据的形状的至少一个形状参数(例如张量的各个维度方向上的尺寸等)，还可以包括表示张量数据的地址的至少一个地址参数(例如数据基准点的基准地址)。本公开对描述符的内容包括的具体参数不作限制。

通过采用描述符来指示张量数据的方式，能够表达张量数据的形状，进而也能够确定多个张量数据之间的相互关系等相关信息，提高对张量数据的存取效率。

在一种可能的实现方式中，在接收到处理指令时，可先对处理指令进行解码(译码)。其中，所述方法还包括：对接收到的第一处理指令进行解码处理，得到解码后的第一处理指令，

其中，解码后的第一处理指令包括操作码以及一个或多个操作数，所述操作码用于指示与所述第一处理指令对应的处理类型。

在该情况下，第一处理指令经解码后，可得到解码后的第一处理指令(微指令)。其中，第一处理指令可包括数据存取指令、运算指令、描述符管理指令以及同步指令等。本公开对第一处理指令的具体类型及解码的具体方式不作限制。

该解码后的第一处理指令可包括操作码以及一个或多个操作数，操作码用于指示与第一处理指令对应的处理类型，操作数用于指示待处理的数据。例如，该指令可表示为：Add；A；B，其中Add为操作码，A和B为操作数，该指令用于对A和B相加。本公开对解码后的指令的操作数的数量以及指令的表示形式不作限制。

在一种可能的实现方式中，如果解码后的第一处理指令的操作数包括描述符的标识，则可通过该描述符的标识确定与描述符对应的描述符存储空间，并从描述符存储空间获取描述符的内容(包括表征张量数据的形状、地址等信息)；然后，可根据描述符的内容执行第一处理指令。

在一种可能的实现方式中，步骤S12a可包括：

根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址；

根据所述数据地址，执行与所述第一处理指令对应的数据处理。

举例来说，根据描述符的内容，可计算第一处理指令中包括描述符标识的操作数对应的数据在数据存储空间中的数据地址，进而可以根据该数据地址执行对应的处理。例如，对于指令Add；A；B，如果操作数A和B中分别包括描述符的标识TR1和TR2，则处理器可根据描述符的标识TR1和TR2分别确定与TR1和TR2对应的描述符存储空间，并读取描述符存储空间中的内容(例如形状参数和地址参数)；根据描述符的内容，可计算数据A和B的数据地址，例如A在内存中的数据地址1为ADDR64-ADDR127，B在内存中的数据地址2为ADDR1023-ADDR1087。然后，处理器可从地址1和地址2中分别读取数据，执行加法(Add)运算，得到运算结果(A+B)。

在一种可能的实现方式中，根据本公开实施例的方法可通过相关技术的硬件结构实现。在该情况下，应用该方法的处理器可包括控制单元及执行单元，控制单元用于进行控制，例如读取存储器或外部传入的指令，对指令进行解码(译码)，向相应的部件发出微操作控制信号等。执行单元用于执行具体的指令，执行单元可以例如为算术逻辑单元(arithmetic and logic unit，ALU)、内存存取单元(memory access unit，MAU)、人工智能运算单元(neural functional unit，NFU)等。本公开对执行单元的具体硬件类型不作限制。

在一种可能的实现方式中，可通过控制单元对指令进行解码，得到解码后的第一处理指令；如果解码后的第一处理指令的操作数包括描述符的标识，则控制单元可确定与描述符对应的描述符存储空间，并从描述符存储空间获取描述符的内容(形状、地址等信息)；然后，控制单元可将描述符的内容及第一处理指令发送到执行单元，以使执行单元根据描述符的内容执行第一处理指令。执行单元在接收到描述符的内容及第一处理指令时，可以根据描述符的内容，计算第一处理指令中包括描述符标识的操作数对应的数据在数据存储空间中的数据地址，进而可以根据该数据地址执行对应的处理。

例如，对于指令Add；A；B，如果操作数A和B中分别包括描述符的标识TR1和TR2，则控制单元可确定与TR1和TR2对应的描述符存储空间，读取描述符存储空间中的内容(例如形状参数和地址参数)并将其发送给执行单元。执行单元在接收到描述符的内容后，可以计算数据A和B的数据地址，例如A在内存中的地址1为ADDR64-ADDR127，B在内存中的地址2为ADDR1023-ADDR1087。然后，执行单元可从地址1和地址2中分别读取数据，执行加法(Add)运算，得到运算结果(A+B)。

在一种可能的实现方式中，可以通过对相关技术的硬件结构进行改进，以实现根据本公开实施例的方法。例如，可以在控制单元中设置有张量控制模块，以实现与描述符相关联的操作，例如描述符的注册、修改及注销；对描述符内容的读写等。张量控制模块可例如为张量接口单元(Tensor interface Unit，TIU)，本公开对张量控制模块的具体硬件类型不作限制。通过这种方式，可以通过专用的硬件实现与描述符相关联的操作，进一步提高了张量数据的存取效率。

在该情况下，如果控制单元解码后的第一处理指令的操作数包括描述符的标识，则可以通过张量控制模块确定与描述符对应的描述符存储空间；确定描述符存储空间后，可从描述符存储空间获取描述符的内容(形状、地址等信息)。然后，控制单元可将描述符的内容及第一处理指令发送到执行单元，以使执行单元根据描述符的内容执行第一处理指令。

在一种可能的实现方式中，张量控制模块还可以实现与描述符相关联的操作以及指令的执行，例如描述符的注册、修改及注销；对描述符内容的读写；数据地址的计算以及数据存取指令的执行等。在该情况下，如果控制单元解码后的第一处理指令的操作数包括描述符的标识，则可以通过张量控制模块确定与描述符对应的描述符存储空间；确定描述符存储空间后，可从描述符存储空间获取描述符的内容；根据描述符的内容，通过张量控制模块确定与第一处理指令的操作数对应的数据在数据存储空间中的数据地址；根据数据地址，通过张量控制模块执行与所述第一处理指令对应的数据处理。

本公开对实现本公开实施例的方法所采用的具体硬件结构不作限制。

通过这种方式，可以从描述符存储空间获取描述符内容，进而获取数据地址，无需在每次存取时通过指令传入地址，从而提高了处理器的数据存取效率。

在一种可能的实现方式中，描述符的标识和内容可存储在描述符存储空间中，该描述符存储空间可以为控制单元的内部存储器(例如寄存器、片上的SRAM或其他介质缓存等)中的存储空间。描述符所指示的张量数据的数据存储空间可为控制单元的内部存储器(例如片上缓存)或与控制单元连接的外部存储器(片下存储器)中的存储空间。数据存储空间中的数据地址可以为实际的物理地址或虚拟地址。本公开对描述符存储空间及数据存储空间的位置以及数据地址的类型不作限制。

在一种可能的实现方式中，描述符的标识、内容以及描述符所指示的张量数据可以位于同一块区域，例如，可使用片上缓存的一块连续区域存储描述符的相关内容，其地址为ADDR0-ADDR1023，其中，地址ADDR0-ADDR31可用于存储描述符的标识，地址ADDR32-ADDR63可用于存储描述符的内容，地址ADDR64-ADDR1023可用于存储描述符指示的张量数据。其中，地址ADDR并不限于1位或一个字节，此处用来表示一个地址，是一个地址单位。本领域技术人员可以根据实际情况确定存储区域及其地址，本公开对此不作限制。

在一种可能的实现方式中，描述符的标识、内容以及描述符所指示的张量数据可以分开存储在内部存储器的不同区域，例如，可以将寄存器作为描述符存储空间，在寄存器中存储描述符的标识及内容，将片上缓存作为数据存储空间，存储描述符所指示的张量数据。

在一种可能的实现方式中，还可以设置专门供描述符使用的专用寄存器(SR)，描述符中的数据可以是立即数也可以从专用寄存器中获取。在使用寄存器存储描述符的标识和内容时，可以使用寄存器的编号来表示描述符的标识，例如，寄存器的编号为0时，其存储的描述符的标识为0。当寄存器中的描述符有效时，可根据描述符所指示的张量数据的大小在缓存空间中分配一块区域(例如在缓存中为每个张量数据创建一个张量缓存单元)用于存储该张量数据。应当理解，也可以采用预设的缓存空间存储该张量数据，本公开对此不作限制。

在一种可能的实现方式中，描述符的标识及内容可存储在内部存储器，描述符所指示的张量数据可存储在外部存储器。例如，可以采用在片上存储描述符的标识及内容、在片下存储描述符所指示的张量数据的方式。

在一种可能的实现方式中，与描述符对应的数据存储空间的数据地址可以是固定地址。例如，可以为张量数据划分单独的数据存储空间，每个张量数据在数据存储空间的起始地址与描述符的标识一一对应。在这种情况下，执行单元根据描述符的内容即可确定与操作数对应数据的数据地址，然后执行第一处理指令。

在一种可能的实现方式中，在与描述符的标识对应的数据存储空间的数据地址为可变地址时，所述描述符还可用于指示N维的张量数据的地址，其中，所述描述符的内容还可包括表示张量数据的地址的至少一个地址参数。例如，张量数据为3维数据，在描述符指向该张量数据的地址时，描述符的内容可包括表示该张量数据的地址的一个地址参数，例如张量数据的起始地址，也可以包括该张量数据的地址的多个地址参数，例如张量数据的起始地址+地址偏移量，或张量数据基于各维度的地址参数。本领域技术人员可以根据实际需要对地址参数进行设置，本公开对此不作限制。

在一种可能的实现方式中，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址。其中，基准地址可根据数据基准点的变化而不同。本公开对数据基准点的选取不作限制。

在一种可能的实现方式中，所述基准地址可包括所述数据存储空间的起始地址。在描述符的数据基准点是数据存储空间的第一个数据块时，描述符的基准地址即为数据存储空间的起始地址。在描述符的数据基准点是数据存储空间中第一个数据块以外的其他数据时，描述符的基准地址即为该数据块在数据存储空间中的物理地址。

在一种可能的实现方式中，所述张量数据的形状参数包括以下至少一种：所述张量数据的数据存储空间在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置、所述描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系。其中，数据描述位置是描述符所指示的张量数据中的点或区域的映射位置，例如，张量数据为3维数据时，描述符可使用三维空间坐标(x，y，z)来表示该张量数据的形状，该张量数据的数据描述位置可以是使用三维空间坐标(x，y，z)表示的、该张量数据映射在三维空间中的点或区域的位置。

应当理解，本领域技术人员可以根据实际情况选择表示张量数据的形状参数，本公开对此不作限制。

图2示出根据本公开一实施例的数据存储空间的示意图。如图2所示，数据存储空间21采用行优先的方式存储了一个二维数据，可通过(x，y)来表示(其中，X轴水平向右，Y轴垂直向下)，X轴方向上的尺寸(每行的尺寸)为ori_x(图中未示出)，Y轴方向上的尺寸(总行数)为ori_y(图中未示出)，数据存储空间21的起始地址PA_start(基准地址)为第一个数据块22的物理地址。数据块23是数据存储空间21中的部分数据，其在X轴方向上的偏移量25表示为offset_x，在Y轴方向上的偏移量24表示为offset_y，在X轴方向上的尺寸表示为size_x，在Y轴方向上的尺寸表示为size_y。

在一种可能的实现方式中，使用描述符来定义数据块23时，描述符的数据基准点可使用数据存储空间21的第一个数据块，描述符的基准地址为数据存储空间21的起始地址PA_start，然后可以结合数据存储空间21在X轴的尺寸ori_x、在Y轴上的尺寸ori_y，以及数据块23在Y轴方向的偏移量offset_y、X轴方向上的偏移量offset_x、X轴方向上的尺寸size_x以及Y轴方向上的尺寸size_y来确定数据块23的描述符的内容。

在一种可能的实现方式中，可以使用下述公式(1)来表示描述符的内容：

应当理解，虽然上述示例中，描述符描述的是二维空间，但本领域技术人员可以根据实际情况对描述符的内容表示的维度进行设置，本公开对此不作限制。

在一种可能的实现方式中，可根据所述描述符的数据基准点在所述数据存储空间中的基准地址、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置，确定所述张量数据的描述符的内容。

举例来说，可以使用描述符的数据基准点在数据存储空间中的基准地址PA_base，以及对角位置的两个顶点相对于数据基准点的位置，确定出图2中数据块23的描述符的内容。首先，确定描述符的数据基准点以及其在数据存储空间中的基准地址PA_base，例如，可以在数据存储空间21中选取一个数据(例如，位置为(2，2)的数据)作为数据基准点，将该数据在数据存储空间中的物理地址作为基准地址PA_base；然后，确定数据块23的对角位置的至少两个顶点相对于数据基准点的位置，例如，使用左上至右下方向的对角位置顶点相对于数据基准点的位置，其中，左上角顶点的相对位置为(x_min，y_min)，右下角顶点的相对位置为(x_max，y_max)，然后可以根据基准地址PA_base、左上角顶点的相对位置(x_min，y_min)以及右下角顶点的相对位置(x_max，y_max)确定出数据块23的描述符的内容。

在一种可能的实现方式中，可以使用下述公式(2)来表示描述符的内容：

应当理解，虽然上述示例中使用左上角和右下角两个顶点来确定描述符的内容，但本领域技术人员可以根据实际需要对至少两个顶点的具体顶点进行设置，本公开对此不作限制。

在一种可能的实现方式中，可根据所述描述符的数据基准点在所述数据存储空间中的基准地址，以及所述描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系，确定所述张量数据的描述符的内容。其中，数据描述位置与数据地址之间的映射关系可以根据实际需要进行设定，例如，描述符所指示的张量数据为三维空间数据时，可是使用函数f(x，y，z)来定义数据描述位置与数据地址之间的映射关系。

在一种可能的实现方式中，可以使用下述公式(3)来表示描述符的内容：

应当理解，本领域技术人员可以根据实际情况对数据描述位置与数据地址之间的映射关系进行设定，本公开对此不作限制。

在采用公式(1)表示描述符的内容的情况下，对于张量数据中的任意一个数据点，设其数据描述位置为(x _q，y _q)，那么，该数据点在数据存储空间中的数据地址PA2 _(x,y)可以使用下述公式(4)来确定：

PA2 _(x,y)＝PA_start+(offset_y+y _q-1)*ori_x+(offset_x+x _q) (4)

通过这种方式，执行单元可以根据描述符的内容计算出描述符所指示的张量数据在数据存储空间中的数据地址，进而根据该地址执行与处理指令对应的处理。

在一种可能的实现方式中，可以通过描述符的管理指令来实现描述符的注册、修改及注销等管理，并为这些管理指令设定相应的操作码。例如可通过描述符注册指令(TRCreat)来注册(创建)描述符；通过描述符修改指令来修改描述符的各个参数(形状、地址等)；通过描述符注销指令(TRRelease)来注销(删除)描述符等。本公开对描述符的管理指令的种类及操作码的具体设定不作限制。

在一种可能的实现方式中，所述方法还包括：

在所述第一处理指令为描述符注册指令时，获取所述第一处理指令中描述符的注册参数，所述注册参数包括所述描述符的标识、张量形状以及描述符所指示的张量数据的内容中的至少一种；

根据所述描述符的注册参数，确定所述描述符的内容在描述符存储空间中的第一存储区域，以及所述描述符所指示的张量数据的内容在数据存储空间中的第二存储区域；

根据所述描述符的注册参数以及所述第二存储区域，确定所述描述符的内容，以建立所述描述符与所述第二存储区域之间的对应关系；

将所述描述符的内容存储到所述第一存储区域。

举例来说，描述符注册指令可用于注册描述符，该指令中可包括描述符的注册参数。该注册参数可包括描述符的标识(ID)、张量形状以及描述符所指示的张量数据的内容中的至少一种。例如，该注册参数可包括标识为TR0、张量形状(维度数量、各维度的尺寸、偏移量、起始数据地址等)。本公开对注册参数的具体内容不作限制。

在一种可能的实现方式中，当根据解码后的第一处理指令的操作码确定该指令为描述符注册指令时，根据第一处理指令中的注册参数，可创建相应的描述符。其中，可通过控制单元或通过张量控制模块创建相应的描述符，本公开对此不作限制。

在一种可能的实现方式中，可以先确定描述符的内容在描述符存储空间中的第一存储区域，以及所述描述符所指示的张量数据的内容在数据存储空间中的第二存储区域。

举例来说，如果已经预先设定了存储区域中的至少一个，则可以直接确定第一存储区域和/或第二存储区域。例如预设了描述符内容和张量数据内容存储于同一存储空间，并且描述符的标识TR0对应的描述符的内容的存储地址为ADDR32-ADDR63，张量数据的内容的存储地址为ADDR64-ADDR1023，则可以直接确定这两个地址为第一存储区域和第二存储区域。

在一种可能的实现方式中，如果没有预设的存储区域，则可以为描述符内容在描述符存储空间中分配第一存储区域，并为张量数据内容在数据存储空间中分配第二存储区域。其中，可通过控制单元或通过张量控制模块分配存储区域，本公开对此不作限制。

在一种可能的实现方式中，根据注册参数中的张量形状以及所述第二存储区域的数据地址，可以建立张量形状与地址之间的对应关系，进而确定描述符内容，从而能够在数据处理时根据描述符内容确定对应的数据地址。在确定描述符内容后，可将其存入第一存储区域中，完成描述符的注册过程。

例如，对于如图2所示的张量数据23，注册参数可以包括数据存储空间21的起始地址PA_start(基准地址)、在X轴方向上的偏移量25(表示为offset_x)，在Y轴方向上的偏移量24(表示为offset_y)，在X轴方向上的尺寸(表示为size_x)，在Y轴方向上的尺寸(表示为size_y)。通过这些参数，可以将描述符的内容表示为公式(1)，并将其存储到第一存储区域中，从而完成描述符的注册过程。

通过这种方式，可以根据描述符注册指令自动创建描述符，实现描述符所指示的张量与数据地址之间的对应，从而在数据处理时通过描述符内容获取数据地址，提高处理器的数据存取效率。

在一种可能的实现方式中，所述方法还包括：

在所述第一处理指令为描述符注销指令时，获取所述第一处理指令中描述符的标识；

根据所述描述符的标识，分别释放所述描述符在描述符存储空间中的存储区域以及所述描述符所指示的张量数据的内容在数据存储空间中的存储区域。

举例来说，描述符注销指令可用于注销(删除)描述符，以便释放描述符所占用的空间。该指令中可至少包括描述符的标识。

在一种可能的实现方式中，当根据解码后的第一处理指令的操作码确定该指令为描述符注销指令时，根据第一处理指令中的描述符标识，可注销相应的描述符。可通过控制单元或通过张量控制模块注销相应的描述符，本公开对此不作限制。

在一种可能的实现方式中，根据描述符的标识，可释放该描述符在描述符存储空间中的存储区域，和/或描述符所指示的张量数据的内容在数据存储空间中的存储区域，从而解除该描述符对各存储区域的占用。

通过这种方式，可以在描述符使用结束后释放描述符所占用的空间，重复利用有限的存储资源，提高了资源的利用效率。

在一种可能的实现方式中，所述方法还包括：

在所述第一处理指令为描述符修改指令时，获取所述第一处理指令中描述符的修改参数，所述修改参数包括所述描述符的标识、待修改的张量形状以及描述符所指示的张量数据的内容中的至少一种；

根据所述描述符的修改参数，确定所述描述符的待更新内容；

根据待更新内容，更新所述描述符存储空间中的所述描述符的内容和/或数据存储空间中张量数据的内容。

举例来说，描述符修改指令可用于修改描述符的各种参数，例如标识、张量形状等。该指令中可包括修改参数，该修改参数包括所述描述符的标识、待修改的张量形状以及描述符所指示的张量数据的内容中的至少一种。本公开对修改参数的具体内容不作限制。

在一种可能的实现方式中，当根据解码后的第一处理指令的操作码确定该指令为描述符修改指令时，根据第一处理指令中的修改参数，可确定描述符的待更新内容，例如将张量的维度由3维改为2维，更改张量在一个或多个维度方向上的尺寸等。

在一种可能的实现方式中，在确定待更新内容后，可更新描述符存储空间中的描述符内容和/或数据存储空间中张量数据的内容，以便修改张量数据并使得更新后的描述符内容能够指示修改后的张量数据的形状。本公开对待更新内容的范围及具体更新方式不作限制。

通过这种方式，可以在描述符所指示的张量数据发生改变时，直接修改描述符，以保持描述符与张量数据之间的对应，提高资源的利用效率。

在一种可能的实现方式中，所述方法还包括：

根据所述描述符的标识，确定是否存在未完成处理的第二处理指令，所述第二处理指令包括指令队列中在所述第一处理指令之前的，且操作数中具有所述描述符的标识的处理指令；

在存在未完成处理的第二处理指令时，阻塞或缓存所述第一处理指令。

举例来说，在设定描述符后，可以根据描述符进行指令之间的依赖关系的判断。如果解码后的第一处理指令的操作数包括描述符的标识，则可确定该第一处理指令的前序指令中是否存在与该第一处理指令具有依赖关系的指令。

在该情况下，对于指令队列中的在第一处理指令之前的指令(前序指令)，如果前序指令的操作数中具有所述描述符的标识，则可认为该前序指令是与该第一处理指令具有依赖关系的第二处理指令。在第一处理指令的操作数中具有多个描述符的标识的情况下，可分别判断对应于每个描述符的依赖关系，也就是说，将操作数中具有多个描述符中的至少一个描述符的标识的前序指令作为具有依赖关系的第二处理指令。可在控制单元中设置依赖关系判断模块以便判断处理指令之间的依赖关系，本公开对此不作限制。

在一种可能的实现方式中，如果存在未完成处理的第二处理指令，则第一处理指令需在第二处理指令完成之后再执行。例如，如果第一处理指令为针对描述符TR0的运算指令，第二处理指令为对描述符TR0的写指令，则第二处理指令与第一处理指令之间具有依赖关系。在该第二处理指令执行期间，不能执行第一处理指令。再例如，如果第二处理指令包括针对第一处理指令的同步指令(sync)，则第二处理指令与第一处理指令之间具有依赖关系，需要在该第二处理指令执行完成后，再执行第一处理指令。

在一种可能的实现方式中，如果存在未完成处理的第二处理指令，则可以阻塞第一处理指令，也即暂停第一处理指令及之后的其他指令的执行，直到第二处理指令执行完成后，再执行第一处理指令及之后的其他指令。

在一种可能的实现方式中，如果存在未完成处理的第二处理指令，则可以缓存第一处理指令，也即将第一处理指令存储到预设的缓存空间，而不影响其他指令的执行。在第二处理指令执行完成后，再执行缓存空间中的第一处理指令。本公开对存在未完成处理的第二处理指令时对第一处理指令的处理方式不作限制。

通过这种方式，可以确定由于指令类型产生的指令之间的依赖关系以及由同步指令产生的依赖关系，并在具有依赖关系的前序指令未完成处理时阻塞或缓存第一处理指令，从而保证指令的执行顺序，确保数据处理的正确性。

在一种可能的实现方式中，所述方法还包括：

根据所述描述符的标识，确定所述描述符当前的状态，所述描述符的状态包括可操作状态或不可操作状态；

在所述描述符当前处于不可操作状态时，阻塞或缓存所述第一处理指令。

举例来说，可以设置描述符的状态的对应表(例如，在张量控制模块中存放描述符的状态的对应表)，从而显示描述符当前的状态，描述符的状态包括可操作状态或不可操作状态。

在一种可能的实现方式中，在第一处理指令的前序指令当前正在对描述符进行操作(例如写入或读取)的情况下，可将描述符的当前状态设置为不可操作状态。在该状态下，无法执行第一处理指令，可阻塞或缓存第一处理指令。反之，在当前没有对描述符进行操作的前序指令的情况下，可将描述符的当前状态设置为可操作状态。在该状态下，能够执行第一处理指令。

在一种可能的实现方式中，在描述符内容存储在寄存器TR(张量寄存器，Tensor Register)中时，描述符的状态对应表中还可以存放TR的使用情况，从而确定TR被占用还是被释放，实现有限的寄存器资源的管理。

通过这种方式，可根据描述符的状态判断指令之间的依赖关系，从而保证指令的执行顺序，确保数据处理的正确性。

在一种可能的实现方式中，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，

其中，步骤S11a包括：在所述源数据和所述目的数据中的至少一个包括描述符的标识时，从所述描述符存储空间获取所述描述符的内容；

其中，步骤S12a包括：根据所述描述符的内容，分别确定所述源数据的第一数据地址和/或所述目的数据的第二数据地址；从所述第一数据地址读取数据并写入到所述第二数据地址。

举例来说，数据存取指令的操作数包括源数据和目的数据，用于从源数据的数据地址读取数据并写入到目的数据的数据地址。在第一处理指令为数据存取指令时，可通过描述符来实现张量数据的存取。在数据存取指令的源数据和目的数据中的至少一个包括描述符的标识时，可确定描述符的描述符存储空间。

在一种可能的实现方式中，如果源数据包括第一描述符的标识，且目的数据包括第二描述符的标识，则可分别确定第一描述符的第一描述符存储空间和第二描述符的第二描述符存储空间；然后从第一描述符存储空间和第二描述符存储空间分别读取第一描述符的内容和第二描述符的内容；根据第一描述符和第二描述符的内容，可分别计算源数据的第一数据地址和目的数据的第二数据地址；从第一数据地址读取数据并写入到第二数据地址，从而完成整个存取过程。

例如，源数据可以是片下的待读取数据，其第一描述符的标识为1，目的数据是片上的一块存储空间，其第二描述符的标识为2。可根据源数据中第一描述符的标识1以及目的数据中第二描述符的标识2，从描述符存储空间分别获取第一描述符的内容D1和第二描述符的内容D2。其中，第一描述符的内容D1和第二描述符的内容可分别表示如下：

根据第一描述符的内容D1和第一描述符的内容D2，可分别获取源数据的起始物理地址PA3和目的数据的起始物理地址PA4，分别表示如下：

PA3＝PA_start1+(offset_y1-1)*ori_x1+offset_x1

PA4＝PA_start2+(offset_y2-1)*ori_x2+offset_x2

根据源数据的起始物理地址PA3和目的数据的起始物理地址PA4，以及第一描述符的内容D1和第二描述符的内容 D2，可分别确定第一数据地址和第二数据地址，并从第一数据地址读取数据并写入第二数据地址(可通过IO通路)，从而完成将D1所指示的张量数据载入到D2所指示的存储空间。

在一种可能的实现方式中，如果仅有源数据包括第一描述符的标识，则可确定第一描述符的第一描述符存储空间；然后从第一描述符存储空间读取第一描述符的内容；根据第一描述符的内容，可计算源数据的第一数据地址；根据指令的操作数中目的数据的第二数据地址，可从第一数据地址读取数据并写入到第二数据地址，从而完成整个存取过程。

在一种可能的实现方式中，如果仅有目的数据包括第二描述符的标识，则可确定第二描述符的第二描述符存储空间；然后从第二描述符存储空间读取第二描述符的内容；根据第二描述符的内容后，可计算目的数据的第二数据地址；根据指令的操作数中源数据的第一数据地址，可从第一数据地址读取数据并写入到第二数据地址，从而完成整个存取过程。

通过这种方式，可使用描述符完成数据的存取，无需在每次存取时通过指令传入数据地址，从而提高数据存取效率。

在一种可能的实现方式中，所述第一处理指令包括运算指令，步骤S12a包括：

根据所述数据地址，执行与所述第一处理指令对应的运算。

举例来说，在第一处理指令为运算指令时，可通过描述符来实现张量数据的运算。在运算指令的操作数中包括描述符的标识时，可确定描述符的描述符存储空间，然后从描述符存储空间读取描述符的内容；根据描述符的内容后，可计算操作数对应的数据的地址，进而从数据地址读取数据进行运算，从而完成整个运算过程。通过这种方式，可在运算时使用描述符完成数据的读取，无需通过指令传入数据地址，从而提高数据运算效率。

根据本公开实施例的数据处理方法，引入了能够指示张量形状的描述符，使得数据处理指令运行过程中能够通过描述符来确定数据的地址，从硬件方面简化了指令生成方式，从而降低数据存取的复杂度，并且提高处理器存取数据的效率。

图3a示出根据本公开实施例的数据处理装置的框图。如图3a所示，本公开还提供了一种数据处理装置，包括：

内容获取模块31a，用于在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，获取所述描述符的内容，所述描述符用于指示张量的形状；指令执行模块32a，用于根据所述描述符的内容，执行所述第一处理指令。

在一种可能的实现方式中，所述指令执行模块包括：地址确定子模块，用于根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址；数据处理子模块，用于根据所述数据地址，执行与所述第一处理指令对应的数据处理。

在一种可能的实现方式中，所述装置还包括：第一参数获取模块，用于在所述第一处理指令为描述符注册指令时，获取所述第一处理指令中描述符的注册参数，所述注册参数包括所述描述符的标识、张量形状以及描述符所指示的张量数据的内容中的至少一种；区域确定模块，用于根据所述描述符的注册参数，确定所述描述符的内容在描述符存储空间中的第一存储区域，以及所述描述符所指示的张量数据的内容在数据存储空间中的第二存储区域；内容确定模块，用于根据所述描述符的注册参数以及所述第二存储区域，确定所述描述符的内容，以建立所述描述符与所述第二存储区域之间的对应关系；内容存储模块，用于将所述描述符的内容存储到所述第一存储区域。

在一种可能的实现方式中，所述装置还包括：标识获取模块，用于在所述第一处理指令为描述符注销指令时，获取所述第一处理指令中描述符的标识；空间释放模块，用于根据所述描述符的标识，分别释放所述描述符在描述符存储空间中的存储区域以及所述描述符所指示的张量数据的内容在数据存储空间中的存储区域。

在一种可能的实现方式中，所述装置还包括：第二参数获取模块，用于在所述第一处理指令为描述符修改指令时，获取所述第一处理指令中描述符的修改参数，所述修改参数包括所述描述符的标识、待修改的张量形状以及描述符所指示的张量数据的内容中的至少一种；更新内容确定模块，用于根据所述描述符的修改参数，确定所述描述符的待更新内容；内容更新模块，用于根据待更新内容，更新描述符存储空间中的所述描述符的内容和/或数据存储空间中张量数据的内容。

在一种可能的实现方式中，所述装置还包括：指令确定模块，用于根据所述描述符的标识，确定是否存在未完成处理的第二处理指令，所述第二处理指令包括指令队列中在所述第一处理指令之前的，且操作数中具有所述描述符的标识的处理指令；第一指令缓存模块，用于在存在未完成处理的第二处理指令时，阻塞或缓存所述第一处理指令。

在一种可能的实现方式中，所述装置还包括：状态确定模块，用于根据所述描述符的标识，确定所述描述符当前的状态，所述描述符的状态包括可操作状态或不可操作状态；第二指令缓存模块，用于在所述描述符当前处于不可操作状态时，阻塞或缓存所述第一处理指令。

在一种可能的实现方式中，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，其中，所述内容获取模块包括：内容获取子模块，用于在所述源数据和所述目的数据中的至少一个包括描述符的标识时，从描述符存储空间获取所述描述符的内容；其中，所述指令执行模块包括：第一地址确定子模块，用于根据所述描述符的内容，分别确定所述源数据的第一数据地址和/或所述目的数据的第二数据地址；存取子模块，用于从所述第一数据地址读取数据并写入到所述第二数据地址。

在一种可能的实现方式中，所述第一处理指令包括运算指令，其中，所述指令执行模块包括：第二地址确定子模块，用于根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址；运算子模块，用于根据所述数据地址，执行与所述第一处理指令对应的运算。

在一种可能的实现方式中，所述描述符用于指示N维的张量数据的形状，N为大于或等于零的整数，其中，所述描述符的内容包括表示张量数据的形状的至少一个形状参数。

在一种可能的实现方式中，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

在一种可能的实现方式中，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址；其中，所述张量数据的形状参数包括以下至少一种：所述数据存储空间在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置、所述描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系。

在一种可能的实现方式中，所述装置还包括：解码模块，用于对接收到的第一处理指令进行解码处理，得到解码后的第一处理指令，其中，解码后的第一处理指令包括操作码以及一个或多个操作数，所述操作码用于指示与所述第一处理指令对应的处理类型。

在一种可能的实现方式中，还公开了一种神经网络芯片，其包括了上述数据处理装置。

在一种可能的实现方式中，还公开了一种板卡，其包括存储器件、接口装置和控制器件以及上述神经网络芯片；其中，所述神经网络芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；所述存储器件，用于存储数据；所述接口装置，用于实现所述神经网络芯片与外部设备之间的数据传输；所述控制器件，用于对所述神经网络芯片的状态进行监控。

图4示出根据本公开实施例的板卡的结构框图，参阅图4，上述板卡除了包括上述芯片389以外，还可以包括其他的配套部件，该配套部件包括但不限于：存储器件390、接口装置391和控制器件392；

所述存储器件390与所述神经网络芯片通过总线连接，用于存储数据。所述存储器件可以包括多组存储单元393。每一组所述存储单元与所述神经网络芯片通过总线连接。可以理解，每一组所述存储单元可以是DDR SDRAM(英文：Double Data Rate SDRAM，双倍速率同步动态随机存储器)。

DDR不需要提高时钟频率就能加倍提高SDRAM的速度。DDR允许在时钟脉冲的上升沿和下降沿读出数据。DDR的速度是标准SDRAM的两倍。在一个实施例中，所述存储装置可以包括4组所述存储单元。每一组所述存储单元可以包括多个DDR4颗粒(芯片)。在一个实施例中，所述神经网络芯片内部可以包括4个72位DDR4控制器，上述72位DDR4控制器中64bit用于传输数据，8bit用于ECC校验。可以理解，当每一组所述存储单元中采用DDR4-3200颗粒时，数据传输的理论带宽可达到25600MB/s。

在一个实施例中，每一组所述存储单元包括多个并联设置的双倍速率同步动态随机存储器。DDR在一个时钟周期内可以传输两次数据。在所述芯片中设置控制DDR的控制器，用于对每个所述存储单元的数据传输与数据存储的控制。

所述接口装置与所述神经网络芯片电连接。所述接口装置用于实现所述神经网络芯片与外部设备(例如服务器或计算机)之间的数据传输。例如在一个实施例中，所述接口装置可以为标准PCIE接口。比如，待处理的数据由服务器通过标准PCIE接口传递至所述芯片，实现数据转移。优选的，当采用PCIE 3.0 X 16接口传输时，理论带宽可达到16000MB/s。在另一个实施例中，所述接口装置还可以是其他的接口，本申请并不限制上述其他的接口的具体表现形式，所述接口单元能够实现转接功能即可。另外，所述神经网络芯片的计算结果仍由所述接口装置传送回外部设备(例如服务器)。

所述控制器件与所述神经网络芯片电连接。所述控制器件用于对所述神经网络芯片的状态进行监控。具体的，所述神经网络芯片与所述控制器件可以通过SPI接口电连接。所述控制器件可以包括单片机(Micro Controller Unit，MCU)。如所述神经网络芯片可以包括多个处理芯片、多个处理核或多个处理电路，可以带动多个负载。因此，所述神经网络芯片可以处于多负载和轻负载等不同的工作状态。通过所述控制装置可以实现对所述神经网络芯片中多个处理芯片、多个处理和或多个处理电路的工作状态的调控。

在一种可能的实现方式中，公开了一种电子设备，其包括了上述神经网络芯片。电子设备包括数据处理装置、机器人、电脑、打印机、扫描仪、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、服务器、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备、交通工具、家用电器、和/或医疗设备。

所述交通工具包括飞机、轮船和/或车辆；所述家用电器包括电视、空调、微波炉、冰箱、电饭煲、加湿器、洗衣机、电灯、燃气灶、油烟机；所述医疗设备包括核磁共振仪、B超仪和/或心电图仪。

A1、一种数据处理方法，所述方法包括：

在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，获取所述描述符的内容，所述描述符用于指示张量的形状；

根据所述描述符的内容，执行所述第一处理指令。

A2、根据权利要求A1所述的方法，根据所述描述符的内容，执行所述第一处理指令，包括：

A3、根据权利要求A1或A2所述的方法，所述方法还包括：

将所述描述符的内容存储到所述第一存储区域。

A4、根据权利要求A1-A3中任意一项所述的方法，所述方法还包括：

A5、根据权利要求A1-A4中任意一项所述的方法，所述方法还包括：

根据待更新内容，更新描述符存储空间中的所述描述符的内容和/或数据存储空间中张量数据的内容。

A6、根据权利要求A1-A5中任意一项所述的方法，所述方法还包括：

A7、根据权利要求A1-A6中任意一项所述的方法，所述方法还包括：

A8、根据权利要求A1-A7中任意一项所述的方法，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，

其中，根据所述描述符的标识，获取所述描述符的内容，包括：

在所述源数据和所述目的数据中的至少一个包括描述符的标识时，从描述符存储空间获取所述描述符的内容；

其中，根据所述描述符的内容，执行所述第一处理指令，包括：

根据所述描述符的内容，分别确定所述源数据的第一数据地址和/或所述目的数据的第二数据地址；

从所述第一数据地址读取数据并写入到所述第二数据地址。

A9、根据权利要求A1-A7中任意一项所述的方法，所述第一处理指令包括运算指令，其中，根据所述描述符的内容，执行所述第一处理指令，包括：

根据所述数据地址，执行与所述第一处理指令对应的运算。

A10、根据权利要求A1-A9中任意一项所述的方法，所述描述符用于指示N维的张量数据的形状，N为大于或等于零的整数，

其中，所述描述符的内容包括表示张量数据的形状的至少一个形状参数。

A11、根据权利要求A10所述的方法，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A12、根据权利要求A11所述的方法，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

所述数据存储空间在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置、所述描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系。

A13、根据权利要求A1-A12中任意一项所述的方法，所述方法还包括：

对接收到的第一处理指令进行解码处理，得到解码后的第一处理指令，

A14、一种数据处理装置，所述装置包括：

内容获取模块，用于在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，获取所述描述符的内容，所述描述符用于指示张量的形状；

指令执行模块，用于根据所述描述符的内容，执行所述第一处理指令。

A15、根据权利要求A14所述的装置，所述指令执行模块包括：

地址确定子模块，用于根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址；

数据处理子模块，用于根据所述数据地址，执行与所述第一处理指令对应的数据处理。

A16、根据权利要求A14或A15所述的装置，所述装置还包括：

第一参数获取模块，用于在所述第一处理指令为描述符注册指令时，获取所述第一处理指令中描述符的注册参数，所述注册参数包括所述描述符的标识、张量形状以及描述符所指示的张量数据的内容中的至少一种；

区域确定模块，用于根据所述描述符的注册参数，确定所述描述符的内容在描述符存储空间中的第一存储区域，以及所述描述符所指示的张量数据的内容在数据存储空间中的第二存储区域；

内容确定模块，用于根据所述描述符的注册参数以及所述第二存储区域，确定所述描述符的内容，以建立所述描述符与所述第二存储区域之间的对应关系；

内容存储模块，用于将所述描述符的内容存储到所述第一存储区域。

A17、根据权利要求A14-A16中任意一项所述的装置，所述装置还包括：

标识获取模块，用于在所述第一处理指令为描述符注销指令时，获取所述第一处理指令中描述符的标识；

空间释放模块，用于根据所述描述符的标识，分别释放所述描述符在描述符存储空间中的存储区域以及所述描述符所指示的张量数据的内容在数据存储空间中的存储区域。

A18、根据权利要求A14-A17中任意一项所述的装置，所述装置还包括：

第二参数获取模块，用于在所述第一处理指令为描述符修改指令时，获取所述第一处理指令中描述符的修改参数，所述修改参数包括所述描述符的标识、待修改的张量形状以及描述符所指示的张量数据的内容中的至少一种；

更新内容确定模块，用于根据所述描述符的修改参数，确定所述描述符的待更新内容；

内容更新模块，用于根据待更新内容，更新描述符存储空间中的所述描述符的内容和/或数据存储空间中张量数据的内容。

A19、根据权利要求A14-A18中任意一项所述的装置，所述装置还包括：

指令确定模块，用于根据所述描述符的标识，确定是否存在未完成处理的第二处理指令，所述第二处理指令包括指令队列中在所述第一处理指令之前的，且操作数中具有所述描述符的标识的处理指令；

第一指令缓存模块，用于在存在未完成处理的第二处理指令时，阻塞或缓存所述第一处理指令。

A20、根据权利要求A14-A19中任意一项所述的装置，所述装置还包括：

状态确定模块，用于根据所述描述符的标识，确定所述描述符当前的状态，所述描述符的状态包括可操作状态或不可操作状态；

第二指令缓存模块，用于在所述描述符当前处于不可操作状态时，阻塞或缓存所述第一处理指令。

A21、根据权利要求A14-A20中任意一项所述的装置，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，

其中，所述内容获取模块包括：

内容获取子模块，用于在所述源数据和所述目的数据中的至少一个包括描述符的标识时，从描述符存储空间获取所述描述符的内容；

其中，所述指令执行模块包括：

第一地址确定子模块，用于根据所述描述符的内容，分别确定所述源数据的第一数据地址和/或所述目的数据的第二数据地址；

存取子模块，用于从所述第一数据地址读取数据并写入到所述第二数据地址。

A22、根据权利要求A14-A20中任意一项所述的装置，所述第一处理指令包括运算指令，其中，所述指令执行模块包括：

第二地址确定子模块，用于根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址；

运算子模块，用于根据所述数据地址，执行与所述第一处理指令对应的运算。

A23、根据权利要求A14-A22中任意一项所述的装置，所述描述符用于指示N维的张量数据的形状，N为大于或等于零的整数，

A24、根据权利要求A23所述的装置，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A25、根据权利要求A24所述的装置，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

A26、根据权利要求A14-A25中任意一项所述的装置，所述装置还包括：

解码模块，用于对接收到的第一处理指令进行解码处理，得到解码后的第一处理指令，

A27、一种神经网络芯片，所述芯片包括如权利要求A14-A26中任意一项所述的数据处理装置。

A28、一种电子设备，所述电子设备包括如权利要求A27所述的神经网络芯片。

A29、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如权利要求A27所述的神经网络芯片；

其中，所述神经网络芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；

所述存储器件，用于存储数据；

所述接口装置，用于实现所述神经网络芯片与外部设备之间的数据传输；

所述控制器件，用于对所述神经网络芯片的状态进行监控。

A30、根据权利要求A29所述的板卡，

所述存储器件包括：多组存储单元，每一组所述存储单元与所述神经网络芯片通过总线连接，所述存储单元为：DDR SDRAM；

所述芯片包括：DDR控制器，用于对每个所述存储单元的数据传输与数据存储的控制；

所述接口装置为：标准PCIE接口。

根据本公开的实施例，提供了一种数据处理装置。图1b示出根据本公开实施例的数据处理装置的框图。如图1b所示，该数据处理装置包括控制单元11b以及执行单元12b，所述控制单元11b用于：

在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，从描述符存储空间获取所述描述符的内容，所述描述符用于指示张量的形状；

向所述执行单元发送所述描述符的内容及所述第一处理指令，以使所述执行单元根据所述描述符的内容执行所述第一处理指令。

根据本公开的实施例，控制单元通过第一处理指令操作数中的描述符的标识获取描述符的内容，并向执行单元发送描述符内容以执行第一处理指令，使得执行处理指令时可以通过描述符来获取操作数，从而降低数据存取的复杂度，提高处理器的数据存取效率。

在一种可能的实现方式中，所述数据处理装置可应用于处理器，其中，处理器可包括通用处理器(例如中央处理器CPU、图形处理器GPU)和专用处理器(例如人工智能处理器、科学计算处理器或数字信号处理器)。本公开对处理器的类型不作限制。

在一种可能的实现方式中，所述控制单元11b可用于对接收到的第一处理指令进行解码处理，得到解码后的第一处理指令，其中，解码后的第一处理指令包括操作码以及一个或多个操作数，所述操作码用于指示与所述第一处理指令对应的处理类型。其中，第一处理指令可包括数据存取指令、运算指令、描述符管理指令以及同步指令等。本公开对第一处理指令的具体类型不作限制。

在一种可能的实现方式中，控制单元11b对接收到的第一处理指令进行解码处理后，在该指令的操作数包括描述符的标识时，根据描述符的标识从描述符存储空间获取描述符的内容，并将描述符的内容及第一处理指令发送给执行单元12b；执行单元12b在接收到描述符的内容及第一处理指令后，首先根据描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址，然后根据数据地址，执行与第一处理指令对应的数据处理。其中，数据存储空间中的数据地址可以为实际的物理地址或虚拟地址，本公开对数据地址的类型不作限制。

在一种可能的实现方式中，描述符存储空间可以为控制单元11b的内部存储器中的存储空间，数据存储空间可以为控制单元11b的内部存储器或与控制单元11b连接的外部存储器中的存储空间。本公开对此不作限制。

在一种可能的实现方式中，所述描述符用于指示N维的张量数据的形状，N为正整数，例如N＝1、2或3。其中，张量可以包含多种形式的数据组成方式，张量可以是不同维度的，比如标量可以看作是0维张量，向量可以看作1维张量，而矩阵可以是2维或2维以上的张量。张量的形状包括张量的维度、张量各个维度的尺寸等信息。举例而言，对于张量：

该张量的形状可以被描述符描述为(2，4)，也即通过两个参数表示该张量为二维张量，且该张量的第一维度(列)的尺寸为2、第二维度(行)的尺寸为4。需要说明的是，本申请对于描述符指示张量形状的方式并不做限定。

在一种可能的实现方式中，N的取值可根据张量数据的维数(阶数)来确定，也可以根据张量数据的使用需要进行设定。例如，在N的取值为3时，张量数据为三维的张量数据，描述符可用来指示该三维的张量数据在三个维度方向上的形状(例如偏移量、尺寸等)。应当理解，本领域技术人员可以根据实际需要对N的取值进行设置，本公开对此不作限制。

在一种可能的实现方式中，所述描述符可包括描述符的标识和描述符的内容。其中，描述符的标识用于对描述符进行区分，例如描述符的标识为其编号；描述符的内容包括表示张量数据的形状的至少一个形状参数。例如，张量数据为3维数据，在该张量数据的三个维度中，其中两个维度的形状参数固定不变，其描述符的内容可包括表示该张量数据的另一个维度的形状参数。

在一种可能的实现方式中，描述符的标识和内容可存储在描述符存储空间(内部存储器)，例如寄存器、片上的SRAM或其他介质缓存等。描述符所指示的张量数据可存储在数据存储空间(内部存储器或外部存储器)，例如片上缓存或片下存储器等。本公开对描述符存储空间及数据存储空间的具体位置不作限制。

在一种可能的实现方式中，描述符的标识、内容以及描述符所指示的张量数据可以存储在内部存储器的同一块区域，例如，可使用片上缓存的一块连续区域来存储描述符的相关内容，其地址为ADDR0-ADDR1023，其中，可将地址ADDR0-ADDR63作为描述符存储空间，存储描述符的标识和内容，地址ADDR64-ADDR1023作为数据存储空间，存储描述符所指示的张量数据。在描述符存储空间中，可用地址ADDR0-ADDR31存储描述符的标识，地址ADDR32-ADDR63存储描述符的内容。应当理解，地址ADDR并不限于1位或一个字节，此处用来表示一个地址，是一个地址单位。本领域技术人员可以根据实际情况确定描述符存储空间、数据存储空间以及其具体地址，本公开对此不作限制。

在一种可能的实现方式中，描述符的标识、内容以及描述符所指示的张量数据可以存储在内部存储器的不同区域。例如，可以将寄存器作为描述符存储空间，在寄存器中存储描述符的标识及内容，将片上缓存作为数据存储空间，存储描述符所指示的张量数据。

在一种可能的实现方式中，在使用寄存器存储描述符的标识和内容时，可以使用寄存器的编号来表示描述符的标识。例如，寄存器的编号为0时，其存储的描述符的标识设置为0。当寄存器中的描述符有效时，可根据描述符所指示的张量数据的大小在缓存空间中分配一块区域用于存储该张量数据。

在一种可能的实现方式中，与描述符的标识对应的数据存储空间的数据地址可以是固定地址。例如，可以为张量数据划分单独的数据存储空间，每个张量数据在数据存储空间的起始地址与描述符的标识一一对应。在这种情况下，执行单元根据描述符的内容即可确定与操作数对应的数据在数据存储空间中的数据地址，然后执行第一处理指令。

在一种可能的实现方式中，在与描述符的标识对应的数据存储空间的数据地址为可变地址时，所述描述符还可用于指示N维的张量数据的地址，其中，所述描述符的内容还可包括表示张量数据的地址的至少一个地址参数。例如，张量数据为3维数据，在描述符指向该张量数据的地址时，描述符的内容可包括表示该张量数据的地址的一个地址参数，例如张量数据的起始物理地址，也可以包括该张量数据的地址的多个地址参数，例如张量数据的起始地址+地址偏移量，或张量数据基于各维度的地址参数。本领域技术人员可以根据实际需要对地址参数进行设置，本公开对此不作限制。

在一种可能的实现方式中，所述基准地址可包括所述数据存储空间的起始地址。在描述符的数据基准点是数据存储空间的第一个数据块时，描述符的基准地址即为数据存储空间的起始地址。在描述符的数据基准点是数据存储空间中第一个数据块以外的其他数据时，描述符的基准地址即为该数据块在数据存储空间中的地址。

在一种可能的实现方式中，所述张量数据的形状参数包括以下至少一种：所述数据存储空间在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置、所述描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系。其中，数据描述位置是描述符所指示的张量数据中的点或区域的映射位置，例如，张量数据为3维数据时，描述符可使用三维空间坐标(x，y，z)来表示该张量数据的形状，该张量数据的数据描述位置可以是使用三维空间坐标(x，y，z)表示的、该张量数据映射在三维空间中的点或区域的位置。应当理解，本领域技术人员可以根据实际情况选择表示张量数据的形状参数，本公开对此不作限制。

通过在数据存取过程中使用描述符，可建立数据之间的关联，从而降低数据存取的复杂度，提高指令处理效率。

在一种可能的实现方式中，可根据所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址、所述数据存储空间的N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的尺寸和/或所述存储区域在N个维度方向的至少一个方向上的偏移量，确定所述张量数据的描述符的内容。

图2示出根据本公开实施例的数据存储空间的示意图。如图2所示，数据存储空间21采用行优先的方式存储了一个二维数据，可通过(x，y)来表示(其中，X轴水平向右，Y轴垂直向下)，X轴方向上的尺寸(每行的尺寸)为ori_x(图中未示出)，Y轴方向上的尺寸(总行数)为ori_y(图中未示出)，数据存储空间21的起始地址PA_start(基准地址)为第一个数据块22的物理地址。数据块23是数据存储空间21中的部分数据，其在X轴方向上的偏移量25表示为offset_x，在Y轴方向上的偏移量24表示为offset_y，在X轴方向上的尺寸表示为size_x，在Y轴方向上的尺寸表示为size_y。

应当理解，虽然上述示例中，描述符的内容表示的是二维空间，但本领域技术人员可以根据实际情况对描述符的内容表示的具体维度进行设置，本公开对此不作限制。

应当理解，虽然上述示例中使用左上角和右下角两个对角位置的顶点来确定描述符的内容，但本领域技术人员可以根据实际需要对对角位置的至少两个顶点的具体顶点进行设置，本公开对此不作限制。

在一种可能的实现方式中，执行单元12接收到控制单元11发送的描述符的内容及第一处理指令时，可根据描述符的内容，确定与第一处理指令的操作数对应的数据在数据存储空间中的数据地址。其中，数据地址的计算由硬件自动完成，且描述符的内容的表示方式不同时，数据地址的计算方法也会不同。本公开对数据地址的具体计算方法不作限制。

例如，操作数中描述符的内容是使用公式(1)表示的，描述符所指示的张量数据在数据存储空间中的偏移量分别为offset_x和offset_y，尺寸为size_x*size_y，那么，该描述符所指示的张量数据在数据存储空间中的起始数据地址PA1 _(x,y)可以使用下述公式(4)来确定：

PA1 _(x,y)＝PA_start+(offset_y-1)*ori_x+offset_x (4)

根据上述公式(4)确定的数据起始地址PA1 _(x,y)，结合偏移量offset_x和offset_y，以及存储区域的尺寸size_x和size_y，可确定出描述符所指示的张量数据在数据存储空间中的存储区域。

在一种可能的实现方式中，执行单元12接收到控制单元11发送的描述符的内容及第一处理指令，当操作数还包括针对描述符的数据描述位置时，可根据描述符的内容以及数据描述位置，确定操作数对应的数据在数据存储空间中的数据地址。通过这种方式，可以对描述符所指示的张量数据中的部分数据(例如一个或多个数据)进行处理。

例如，操作数中描述符的内容是使用公式(1)表示的，描述符所指示的张量数据在数据存储空间中偏移量分别为offset_x和offset_y，尺寸为size_x*size_y，操作数中包括的针对描述符的数据描述位置为(x _q，y _q)，那么，该描述符所指示的张量数据在数据存储空间中的数据地址PA2 _(x,y)可以使用下述公式(5)来确定：

PA2 _(x,y)＝PA_start+(offset_y+y _q-1)*ori_x+(offset_x+x _q) (5)

其中，所述控制单元11b用于在所述源数据包括第一描述符的标识，且所述目的数据包括第二描述符的标识时，从所述描述符存储空间分别获取所述第一描述符的内容和所述第二描述符的内容；向所述执行单元12b发送所述第一描述符的内容、所述第二描述符的内容及所述第一处理指令；

其中，所述执行单元12b用于根据接收到的所述第一描述符的内容和所述第二描述符的内容，分别获取所述源数据的第一数据地址和所述目的数据的第二数据地址；从所述第一数据地址读取数据并写入到所述第二数据地址。

举例来说，在源数据和目的数据均包括描述符的标识的情况下，源数据可以是片下的一组待读取数据，其第一描述符的标识为1，目的数据是片上的一块存储空间，其第二描述符的标识为2。控制单元11b可根据源数据中第一描述符的标识1以及目的数据中第二描述符的标识2，从描述符存储空间分别获取第一描述符的内容D1和第二描述符的内容D2，并将第一描述符的内容D1、第二描述符的内容D2以及第一处理指令发给执行单元12b。其中，第一描述符的内容D1和第二描述符的内容可分别表示如下：

执行单元12b根据接收到的第一描述符的内容D1和第一描述符的内容D2，可分别获取源数据的起始物理地址PA3和目的数据的起始物理地址PA4，分别表示如下：

PA3＝PA_start1+(offset_y1-1)*ori_x1+offset_x1

PA4＝PA_start2+(offset_y2-1)*ori_x2+offset_x2

执行单元12b根据源数据的起始物理地址PA3和目的数据的起始物理地址PA4，以及第一描述符的内容D1和第二描述符的内容D2，可分别确定第一数据地址和第二数据地址，然后从第一数据地址读取数据并写入第二数据地址(可通过IO通路)，从而完成将D1所指向的张量数据载入到D2所指向的存储空间，即，完成了数据从片下到片上的载入。应当理解，数据从片上到片下的传输，与上述过程类似，此处不再赘述。

在一种可能的实现方式中，数据载入时可以设定载入数据的规模，其中，载入数据的规模，可根据使用需要或存储空间的大小进行设定。例如，根据使用需要，在数据载入时，可以设定载入D1中的前10个数据。本公开对载入数据的具体规模不作限制。

通过这种方式可使用描述符完成数据的存取，描述符的内容存储在描述符存储空间，无需在每次存取时通过指令传入数据地址，从而可以提高处理器的数据存取效率。

其中，所述控制单元11b用于在所述源数据包括第三描述符的标识时，从所述描述符存储空间获取所述第三描述符的内容；向所述执行单元12b发送所述第三描述符的内容及所述第一处理指令；

其中，所述执行单元12b用于根据接收到的所述第三描述符的内容，获取所述源数据的第三数据地址；从所述第三数据地址读取数据并写入到所述目的数据的数据地址。

举例来说，在源数据和目的数据均包括描述符的标识的情况下，源数据可以是片下的一组待读取数据，其第一描述符的标识为3，目的数据是片上的一块存储空间。控制单元11可根据源数据中第三描述符的标识3，从描述符存储空间获取第三描述符的内容D3，并将第三描述符的内容D3以及第一处理指令发给执行单元12b。其中，第三描述符的内容D3可表示如下：

执行单元12b根据接收到的第三描述符的内容D3，可获取源数据的起始物理地址PA5，表示如下：

PA5＝PA_start3+(offset_y3-1)*ori_x3+offset_x3

执行单元12b可根据第一处理指令中目的数据的地址信息，计算目的数据的起始物理地址以及目标数据的数据地址。例如，目的数据的地址信息中包括起始地址、偏移量的通用寄存器编号，可以先访问通用寄存器获取偏移量，再将起始地址与偏移量相加，得到目的数据的起始物理地址；然后根据目标数据的尺寸，即可确定目的数据的数据地址。

执行单元12b根据源数据的起始物理地址PA5以及第三描述符的内容D3，可确定第三数据地址，然后从第三数据地址读取数据并写入到目的数据的数据地址(可通过IO通路)，从而完成将D3所指向的张量数据载入到目的数据的存储空间，即，完成了数据从片下到片上的载入。应当理解，数据从片上到片下的传输，与上述过程类似，此处不再赘述。

其中，所述控制单元11b用于在所述目的数据包括第四描述符的标识时，从所述描述符存储空间获取所述第四描述符的内容；向所述执行单元12b发送所述第四描述符的内容及所述第一处理指令；

其中，所述执行单元12b用于根据接收到的所述第四描述符的内容，获取所述目的数据的第四数据地址；从所述源数据的数据地址读取数据并写入到所述第四数据地址。

举例来说，在目的数据包括描述符的标识的情况下，源数据可以是片下的一组待读取数据，目的数据是片上的一块存储空间，其第四描述符的标识为4。控制单元11b可根据目标数据中第四描述符的标识4，从描述符存储空间获取第四描述符的内容D4，并将第四描述符的内容D4以及第一处理指令发给执行单元12b。其中，第四描述符的内容D4可表示如下：

执行单元12b根据接收到的第四描述符的内容D4，可获取目标数据的起始物理地址PA6，表示如下：

PA6＝PA_start4+(offset_y4-1)*ori_x4+offset_x4

执行单元12b可根据第一处理指令中源数据的地址信息，计算源数据的起始物理地址以及源数据的数据地址，例如，源数据的地址信息中包括起始地址、偏移量的通用寄存器编号，可以先访问通用寄存器获取偏移量，再将起始地址与偏移量相加，得到源数据的起始物理地址；然后根据源数据的尺寸，即可确定源数据的数据地址。

执行单元12b根据目标数据的起始物理地址PA6以及第四描述符的内容D4，可确定第四数据地址，然后从源数据的数据地址读取数据并写入到第四数据地址(可通过IO通路)，从而完成将源数据载入到D4所指向的存储空间，即，完成了数据从片下到片上的载入。应当理解，数据从片上到片下的传输，与上述过程类似，此处不再赘述。

在一种可能的实现方式中，所述第一处理指令包括运算指令，其中，所述执行单元根据所述数据地址，执行与所述第一处理指令对应的数据处理可包括：从所述数据地址读取数据并执行与所述运算指令对应的运算。

举例来说，在第一处理指令为运算指令，且运算指令的操作数包括描述符标识的情况下，控制单元11可根据描述符的标识，从描述符存储空间获取描述符的内容，并将描述符的内容及运算指令发送给执行单元12；执行单元12根据接收到的描述符的内容，确定待运算数据的数据地址，从该数据地址读取待运算的数据并执行与运算指令对应的运算。例如，运算指令为ADD指令，在其操作数包括描述符的标识时，控制单元11可根据描述符的标识获取描述符的内容，并将描述符的内容及ADD指令发送给执行单元12b，执行单元12b可根据描述符的内容确定出待运算数据的数据地址，并执行ADD运算。在操作数是片下数据时，执行单元12b可根据数据地址，通过IO通路将数据载入到片上，然后从操作数在片上的数据地址中读取数据并执行ADD操作。

通过这种方式，可以使用描述符完成数据的传输，提高处理器的数据存取效率。

根据本公开实施例的数据处理装置，引入了能够描述数据的形状的描述符，使得第一处理指令运行过程中能够通过描述符来确定数据的地址，从硬件方面简化了指令生成方式，从而降低数据存取的复杂度，并且提高处理器存取数据的效率。

需要说明的是，尽管以上述实施例作为示例介绍了数据处理装置如上，但本领域技术人员能够理解，本公开应不限于此。事实上，用户完全可根据个人喜好和/或实际应用场景灵活设定各模块，只要符合本公开的技术方案即可。

图3b示出根据本公开实施例的数据处理方法的流程图。如图3b所示，所述数据处理方法应用于处理器，所述方法包括：

步骤S41b，在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，从描述符存储空间获取所述描述符的内容，所述描述符用于指示张量的形状；

步骤S42b，根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址；

步骤S43b，根据所述数据地址，执行与所述第一处理指令对应的数据处理。

在一种可能的实现方式中，步骤S42b可包括：

在所述操作数还包括针对所述描述符的数据描述位置时，根据所述描述符的内容以及所述数据描述位置，确定所述操作数对应的数据在所述数据存储空间中的数据地址。

在一种可能的实现方式中，所述描述符用于指示N维的张量数据的形状，N为正整数，

在一种可能的实现方式中，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

在一种可能的实现方式中，所述基准地址包括所述数据存储空间的起始地址。

其中，在解码后的第一处理指令的操作数包括描述符的标识时，步骤S41b可包括：在所述源数据包括第一描述符的标识，且所述目的数据包括第二描述符的标识时，从所述描述符存储空间分别获取所述第一描述符的内容和所述第二描述符的内容；

其中，步骤S42b可包括：根据所述第一描述符的内容和所述第二描述符的内容，分别获取所述源数据的第一数据地址和所述目的数据的第二数据地址；

其中，步骤S43b可包括：从所述第一数据地址读取数据并写入到所述第二数据地址。

其中，在解码后的第一处理指令的操作数包括描述符的标识时，步骤S41b可包括：在所述源数据包括第三描述符的标识时，从所述描述符存储空间获取所述第三描述符的内容；

其中，步骤S42b可包括：根据所述第三描述符的内容，获取所述源数据的第三数据地址；

其中，步骤S43b可包括：从所述第三数据地址读取数据并写入到所述目的数据的数据地址。

其中，在解码后的第一处理指令的操作数包括描述符的标识时，步骤S41b可包括：在所述目的数据包括第四描述符的标识时，从所述描述符存储空间获取所述第四描述符的内容；

其中，步骤S42b可包括：根据所述第四描述符的内容，获取所述目的数据的第四数据地址；

其中，步骤S43b可包括：从所述源数据的数据地址读取数据并写入到所述第四数据地址。

在一种可能的实现方式中，所述第一处理指令包括运算指令，

其中，步骤S43b可包括：从所述数据地址读取数据并执行与所述运算指令对应的运算。

在一种可能的实现方式中，所述方法还包括：

在一种可能的实现方式中，所述描述符存储空间为所述处理器的内部存储器中的存储空间，所述数据存储空间为所述处理器的内部存储器或外部存储器中的存储空间。

在一种可能的实现方式中，还公开了一种人工智能芯片，其包括了上述数据处理装置。

在一种可能的实现方式中，还公开了一种板卡，其包括存储器件、接口装置和控制器件以及上述人工智能芯片；其中，所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；所述存储器件，用于存储数据；所述接口装置，用于实现所述人工智能芯片与外部设备之间的数据传输；所述控制器件，用于对所述人工智能芯片的状态进行监控。

所述存储器件390与所述人工智能芯片通过总线连接，用于存储数据。所述存储器件可以包括多组存储单元393。每一组所述存储单元与所述人工智能芯片通过总线连接。可以理解，每一组所述存储单元可以是DDR SDRAM(英文：Double Data Rate SDRAM，双倍速率同步动态随机存储器)。

DDR不需要提高时钟频率就能加倍提高SDRAM的速度。DDR允许在时钟脉冲的上升沿和下降沿读出数据。DDR的速度是标准SDRAM的两倍。在一个实施例中，所述存储装置可以包括4组所述存储单元。每一组所述存储单元可以包括多个DDR4颗粒(芯片)。在一个实施例中，所述人工智能芯片内部可以包括4个72位DDR4控制器，上述72位DDR4控制器中64bit用于传输数据，8bit用于ECC校验。可以理解，当每一组所述存储单元中采用DDR4-3200颗粒时，数据传输的理论带宽可达到25600MB/s。

所述接口装置与所述人工智能芯片电连接。所述接口装置用于实现所述人工智能芯片与外部设备(例如服务器或计算机)之间的数据传输。例如在一个实施例中，所述接口装置可以为标准PCIE接口。比如，待处理的数据由服务器通过标准PCIE接口传递至所述芯片，实现数据转移。优选的，当采用PCIE 3.0 X 16接口传输时，理论带宽可达到16000MB/s。在另一个实施例中，所述接口装置还可以是其他的接口，本申请并不限制上述其他的接口的具体表现形式，所述接口单元能够实现转接功能即可。另外，所述人工智能芯片的计算结果仍由所述接口装置传送回外部设备(例如服务器)。

所述控制器件与所述人工智能芯片电连接。所述控制器件用于对所述人工智能芯片的状态进行监控。具体的，所述人工智能芯片与所述控制器件可以通过SPI接口电连接。所述控制器件可以包括单片机(Micro Controller Unit，MCU)。如所述人工智能芯片可以包括多个处理芯片、多个处理核或多个处理电路，可以带动多个负载。因此，所述人工智能芯片可以处于多负载和轻负载等不同的工作状态。通过所述控制装置可以实现对所述人工智能芯片中多个处理芯片、多个处理和或多个处理电路的工作状态的调控。

在一种可能的实现方式中，公开了一种电子设备，其包括了上述人工智能芯片。电子设备包括数据处理装置、机器人、电脑、打印机、扫描仪、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、服务器、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备、交通工具、家用电器、和/或医疗设备。

A1、一种数据处理装置，所述装置包括控制单元以及执行单元，所述控制单元用于：

A2、根据权利要求A1所述的装置，所述执行单元用于：

根据接收到的描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址；

A3、根据权利要求A2所述的装置，根据接收到的描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址，包括：

A4、根据权利要求A1-A3中任意一项所述的装置，所述描述符用于指示N维的张量数据的形状，N为正整数，

A5、根据权利要求A4所述的装置，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A6、根据权利要求A5所述的装置，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

A7、根据权利要求A6所述的装置，所述基准地址包括所述数据存储空间的起始地址。

A8、根据权利要求A2-A7中任意一项所述的装置，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，

其中，所述控制单元用于：

在所述源数据包括第一描述符的标识，且所述目的数据包括第二描述符的标识时，从所述描述符存储空间分别获取所述第一描述符的内容和所述第二描述符的内容；

向所述执行单元发送所述第一描述符的内容、所述第二描述符的内容及所述第一处理指令；

其中，所述执行单元用于：

根据接收到的所述第一描述符的内容和所述第二描述符的内容，分别获取所述源数据的第一数据地址和所述目的数据的第二数据地址；

从所述第一数据地址读取数据并写入到所述第二数据地址。

A9、根据权利要求A2-A7中任意一项所述的装置，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，

其中，所述控制单元用于：

在所述源数据包括第三描述符的标识时，从所述描述符存储空间获取所述第三描述符的内容；

向所述执行单元发送所述第三描述符的内容及所述第一处理指令；

其中，所述执行单元用于：

根据接收到的所述第三描述符的内容，获取所述源数据的第三数据地址；

从所述第三数据地址读取数据并写入到所述目的数据的数据地址。

A10、根据权利要求A2-A7中任意一项所述的装置，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，

其中，所述控制单元用于：

在所述目的数据包括第四描述符的标识时，从所述描述符存储空间获取所述第四描述符的内容；

向所述执行单元发送所述第四描述符的内容及所述第一处理指令，

其中，所述执行单元用于：

根据接收到的所述第四描述符的内容，获取所述目的数据的第四数据地址；

从所述源数据的数据地址读取数据并写入到所述第四数据地址。

A11、根据权利要求A2所述的装置，所述第一处理指令包括运算指令，

其中，所述执行单元根据所述数据地址，执行与所述第一处理指令对应的数据处理，包括：

从所述数据地址读取数据并执行与所述运算指令对应的运算。

A12、根据权利要求A1-A11中任意一项所述的装置，所述控制单元还用于：

A13、根据权利要求A1-A12中任意一项所述的装置，所述描述符存储空间为所述控制单元的内部存储器中的存储空间，所述数据存储空间为所述控制单元的内部存储器或与所述控制单元连接的外部存储器中的存储空间。

A14、一种数据处理方法，所述方法应用于处理器，所述方法包括：

A15、根据权利要求A14所述的方法，根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址，包括：

A16、根据权利要求A14或A15所述的方法，所述描述符用于指示N维的张量数据的形状，N为正整数，

A17、根据权利要求A16所述的方法，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A18、根据权利要求A17所述的方法，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

A19、根据权利要求A18所述的方法，所述基准地址包括所述数据存储空间的起始地址。

A20、根据权利要求A14-A19中任意一项所述的方法，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，

其中，在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，从描述符存储空间获取所述描述符的内容，包括：在所述源数据包括第一描述符的标识，且所述目的数据包括第二描述符的标识时，从所述描述符存储空间分别获取所述第一描述符的内容和所述第二描述符的内容；

其中，根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址，包括：根据所述第一描述符的内容和所述第二描述符的内容，分别获取所述源数据的第一数据地址和所述目的数据的第二数据地址；

其中，根据所述数据地址，执行与所述第一处理指令对应的数据处理，包括：从所述第一数据地址读取数据并写入到所述第二数据地址。

A21、根据权利要求A14-A19中任意一项所述的方法，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，

其中，在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，从描述符存储空间获取所述描述符的内容，包括：在所述源数据包括第三描述符的标识时，从所述描述符存储空间获取所述第三描述符的内容；

其中，根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址，包括：根据所述第三描述符的内容，获取所述源数据的第三数据地址；

其中，根据所述数据地址，执行与所述第一处理指令对应的数据处理，包括：从所述第三数据地址读取数据并写入到所述目的数据的数据地址。

A22、根据权利要求A14-A19中任意一项所述的方法，所述第一处理指令包括数据存取指令，所述操作数包括源数据和目的数据，

其中，在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，从描述符存储空间获取所述描述符的内容，包括：在所述目的数据包括第四描述符的标识时，从所述描述符存储空间获取所述第四描述符的内容；

其中，根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址，包括：

根据所述第四描述符的内容，获取所述目的数据的第四数据地址；

其中，根据所述数据地址，执行与所述第一处理指令对应的数据处理，包括：从所述源数据的数据地址读取数据并写入到所述第四数据地址。

A23、根据权利要求A14所述的方法，所述第一处理指令包括运算指令，

其中，根据所述数据地址，执行与所述第一处理指令对应的数据处理，包括：

A24、根据权利要求A14-A23中任意一项所述的方法，所述方法还包括：

A25、根据权利要求A14-A24中任意一项所述的方法，所述描述符存储空间为所述处理器的内部存储器中的存储空间，所述数据存储空间为所述处理器的内部存储器或外部存储器中的存储空间。

A26、一种人工智能芯片，所述芯片包括如权利要求A1-A13中任意一项所述的数据处理装置。

A27、一种电子设备，所述电子设备包括如权利要求A26所述的人工智能芯片。

A28、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如权利要求A26所述的人工智能芯片；

其中，所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；

所述存储器件，用于存储数据；

所述接口装置，用于实现所述人工智能芯片与外部设备之间的数据传输；

所述控制器件，用于对所述人工智能芯片的状态进行监控。

A29、根据权利要求A28所述的板卡，所述存储器件包括：多组存储单元，每一组所述存储单元与所述人工智能芯片通过总线连接，所述存储单元为：DDR SDRAM；

所述接口装置为：标准PCIE接口。

随着人工智能算法的复杂度提高，需要处理的数据量和数据维度都在不断增大，通常需要多核和/或多芯片进行数据处理。在进行核间或芯片间的数据同步时，采用相关技术的同步方式的同步开销较大，处理效率较低。

根据本公开的实施例，提供了一种数据同步方法。图1c示出根据本公开实施例的数据同步方法的流程图。该数据同步方法可应用于第一处理器中，该第一处理器可包括通用处理器(例如中央处理器CPU、图形处理器GPU)和专用处理器(例如人工智能处理器、科学计算处理器或数字信号处理器等)。本公开对第一处理器的类型不作限制。

如图1c所示，该数据同步方法包括：

在步骤S11c中，根据待同步的张量数据的描述符，生成描述符同步指令，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容，所述描述符用于指示待同步的张量数据的形状；

在步骤S12c中，向第二处理器发送所述描述符同步指令，所述描述符同步指令用于指示第二处理器根据所述描述符同步指令获取所述待同步的张量数据。

举例来说，待同步的数据可包括N维的张量数据(N为大于或等于零的整数，例如N＝1、2或3)，其中，张量可以包含多种形式的数据组成方式，张量可以是不同维度的，比如标量可以看作是0维张量，向量可以看作1维张量，而矩阵可以是2维或2维以上的张量。张量的形状包括张量的维度、张量各个维度的尺寸等信息。例如对于张量：

该张量的形状可以被描述符描述为(2，4)，也即通过两个参数表示该张量为二维张量，且该张量的第一维度(列)的尺寸为2、第二维度(行)的尺寸为4。需要说明的是，本公开对于描述符指示张量形状的方式并不做限定。在存储器中存储张量数据时，根据其数据地址(或存储区域)无法确定张量数据的形状，进而也无法确定多个张量数据之间相互关系等相关信息，导致处理器对张量数据的存取效率较低，在进行数据同步时的复杂度也较大。

在该情况下，可设定描述符(张量描述符)来指示张量数据(N维的张量数据)的形状。其中，N的取值可根据张量数据的维数(阶数)来确定，也可以根据张量数据的使用需要进行设定。例如，在N的取值为3时，张量数据为三维的张量数据，描述符可用来指示该三维的张量数据在三个维度方向上的形状(例如偏移量、尺寸等)。应当理解，本领域技术人员可以根据实际需要对N的取值进行设置，本公开对此不作限制。

在一种可能的实现方式中，描述符可包括标识和内容等，描述符的标识可用于对描述符进行区分，例如为编号；描述符的内容可包括表示张量数据的形状的至少一个形状参数(例如张量的各个维度方向上的尺寸等)，还可以包括表示张量数据的地址的至少一个地址参数(例如数据基准点的基准地址)。本公开对描述符的内容包括的具体参数不作限制。通过采用描述符来指示张量数据的方式，能够表达张量数据的形状，进而也能够确定多个张量数据之间的相互关系等相关信息，提高对张量数据的存取效率，从而降低数据同步时的复杂度。

在一种可能的实现方式中，在数据处理过程中，可能需要进行多个处理器(例如人工智能芯片的多个核)之间的数据同步，例如将处理器A1的运算结果同步到处理器A2中做为另一项运算的输入数据。在该情况下，可以采用基于描述符的数据同步机制实现数据同步。

在一种可能的实现方式中，第一处理器是数据同步的发送方，第二处理器是数据同步的接收方。当存在待同步的张量数据时，第一处理器可在步骤S11c中根据该张量数据的描述符，生成描述符同步指令，并在步骤S12c中向待同步的第二处理器发送该描述符同步指令。其中，第二处理器可包括通用处理器(例如中央处理器CPU、图形处理器GPU)和专用处理器(例如人工智能处理器、科学计算处理器或数字信号处理器等)。第二处理器可与第一处理器的类型相同或不同，本公开对第二处理器的类型不作限制。

在一种可能的实现方式中，第一处理器可以主动发起对第二处理器的数据同步，例如在第一处理器完成一项运算得到运算结果(张量数据)时，主动发起对需要使用该运算结果的第二处理器的数据同步。在另一个示例中，第一处理器也可以响应于第二处理器的同步请求，发起对第二处理器的数据同步，例如在接收到第二处理器的同步请求指令时，发起对第二处理器的数据同步。本公开对数据同步的发起时机不作限制。

在一种可能的实现方式中，当第一处理器确定存在待同步的张量数据时，可以获取该张量数据的描述符。该描述符可以是已注册(创建)的用于指示该张量数据的形状的描述符，也可以根据该张量数据的形状参数注册(创建)新的描述符，本公开对此不作限制。

在一种可能的实现方式中，根据该张量数据的描述符，可生成描述符同步指令，该描述符同步指令包括所述描述符的标识和/或所述描述符的内容。如果第二处理器中已注册有指示该待同步的张量数据的描述符，则描述符同步指令可仅包括描述符的标识(例如在描述符的标识为TR1时，将描述符同步指令表示为Send TR1)，以指示第二处理器根据该描述符的标识(TR1)实现张量数据的同步；如果第二处理器中未注册指示该待同步的张量数据的描述符，则描述符同步指令可包括描述符的内容，或同时包括描述符的标识和内容两者，以指示第二处理器根据该描述符的内容实现张量数据的同步。本公开对描述符同步指令包括的具体内容不作限制。

在一种可能的实现方式中，在生成描述符同步指令后，可向第二处理器发送该描述符同步指令，以指示第二处理器根据所述描述符同步指令获取所述待同步的张量数据。如果描述符同步指令包括描述符的标识，则第二处理器可根据描述符的标识获取描述符的内容，再根据描述符的内容获取描述符所指示的张量数据，从而实现张量数据的同步。如果描述符同步指令包括描述符的内容，则第二处理器可根据描述符的内容直接获取描述符所指示的张量数据，从而实现张量数据的同步。

根据本公开实施例的数据同步方法，通过设定指示张量数据的形状的描述符，能够在需要数据同步时，根据待同步的张量数据的描述符生成描述符同步指令并向第二处理器发送该指令，以指示第二处理器根据描述符同步指令获取待同步的张量数据，从而减少同步开销，降低数据同步的复杂度，提高数据同步的效率。

在一种可能的实现方式中，所述方法还包括：根据来自第二处理器的描述符同步请求指令，确定所述待同步的张量数据的描述符。

举例来说，第一处理器可响应于第二处理器的同步请求，发起对第二处理器的数据同步。其中，来自第二处理器的描述符同步请求指令可包括待同步的张量数据的信息，例如指示该待同步的张量数据的描述符的标识、该待同步的张量数据的数据特征等。其中，张量数据的数据特征可包括张量数据的形状、来源、地址等信息，本公开对描述符同步请求指令的具体内容不作限制。根据描述符同步请求指令中的信息，第一处理器可确定待同步的张量数据的描述符，进而生成描述符同步指令。

通过这种方式，可以根据第二处理器的同步请求确定待同步的张量数据的描述符，以便生成描述符同步指令，从而避免不必要的数据同步，提高了数据同步的效率。

在一种可能的实现方式中，所述描述符同步请求指令包括描述符的标识，

其中，所述根据来自第二处理器的描述符同步请求指令，确定所述待同步的张量数据的描述符的步骤可包括：解析所述描述符同步请求指令，获得所述描述符的标识；根据所述描述符的标识，确定所述待同步的张量数据的描述符。

举例来说，如果第一处理器和第二处理器均已注册有指示该张量数据的描述符，且描述符的标识相同或具有对应关系，则描述符同步请求指令中可包括描述符的标识，例如在描述符的标识为TR1时，将描述符同步请求指令表示为Receive TR1。第一处理器可解析来自第二处理器的描述符同步请求指令，得到描述符的标识；进而根据描述符的标识，确定所述待同步的张量数据的描述符，以便生成描述符同步指令。

通过这种方式，可以根据请求指令中的描述符标识确定待同步的张量数据的描述符，以便实现张量数据的同步，从而减小同步时传输的数据量，提高处理效率。

在一种可能的实现方式中，所述描述符同步请求指令包括所述待同步的张量数据的数据特征，

其中，所述根据来自第二处理器的描述符同步请求指令，确定所述待同步的张量数据的描述符的步骤可包括：解析所述描述符同步请求指令，获得待同步的张量数据的数据特征；根据待同步的张量数据的数据特征，确定所述待同步的张量数据的描述符。

举例来说，如果第二处理器中未注册指示该张量数据的描述符，或已注册有指示该张量数据的描述符但描述符标识不具有对应关系，则描述符同步请求指令中可包括待同步的张量数据的数据特征。第一处理器可解析来自第二处理器的描述符同步请求指令，得到待同步的张量数据的数据特征；进而根据待同步的张量数据的数据特征，确定所述待同步的张量数据及其描述符，以便生成描述符同步指令。

在一种可能的实现方式中，待同步的张量数据的数据特征可包括张量数据的形状、来源、地址等信息。例如，该张量数据的数据来源为第K个发送方(第K个处理器)、该张量数据的数据来源为编号200的卷积操作的运算结果、该张量数据的地址为特定的地址区域(例如地址ADDR0-ADDR127)、该张量数据的形状为指定的形状(例如20*10的二维张量)等。本领域技术人员可根据实际情况设定待同步的张量数据的数据特征，本公开对此不作限制。

在一种可能的实现方式中，根据该数据特征，第一处理器可查找到待同步的张量数据，并确定该待同步的张量数据的描述符，例如直接获取或新注册对应的描述符。根据该待同步的张量数据的描述符，可生成并发送描述符同步指令，以指示第二处理器实现该张量数据的同步。

通过这种方式，可以根据请求指令中的数据特征确定待同步的张量数据的描述符，以便实现张量数据的同步，从而在同步时无需传输张量数据本身，减小了传输的数据量和同步开销，提高了处理效率。

在一种可能的实现方式中，所述描述符同步指令包括待同步的张量数据的描述符的内容，其中，步骤S11c可包括：

在待同步的张量数据的存储地址处于共用存储空间中时，根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

举例来说，多个处理器(多个核)可以具有共用存储空间，例如第一处理器和第二处理器均可以访问的片下存储器。该共用存储空间可以是多个核(多个处理器)均能够存取数据的存储空间，也可以是部分核(部分处理器)能够存取数据的存储空间，可以预先设定有核间的共用存储空间，本公开对共用存储空间的设定方式不作限制。

在一种可能的实现方式中，如果待同步的张量数据的存储地址处于共用存储空间中，则由于第二处理器也可从共用存储空间存取数据，第二处理器根据描述符的内容就可以直接读取张量数据以实现同步。在该情况下，描述符同步指令可包括待同步的张量数据的描述符的内容，也即，可根据所述待同步的张量数据的描述符的内容，生成描述符同步指令。第二处理器接收到描述符同步指令后，可解析指令以得到描述符的内容；根据描述符的内容，第二处理器可确定待同步的张量数据的数据地址，并从共用存储空间获取所述待同步的张量数据，从而实现整个同步过程。

通过这种方式，可以避免不必要的数据传输，减少张量数据存取次数，提高了同步的处理效率。

在一种可能的实现方式中，步骤S11c可包括：

将所述待同步的张量数据的描述符的内容存储到同步数据存储空间；

根据所述描述符的内容在所述同步数据存储空间中的地址，生成描述符同步指令，以指示所述第二处理器从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容。

举例来说，多个处理器(多个核)可以具有同步数据存储空间，专门用于存储同步数据。该同步数据存储空间可以是上述的共用存储空间，也可以是共用存储空间的一部分，还可以是与共用存储空间不同的存储空间，本公开对此不作限制。

在一种可能的实现方式中，同步数据存储空间可以是多个核(多个处理器)均能够存取同步数据的存储空间，也可以是部分核(部分处理器)能够存取同步数据的存储空间，本公开对此不作限制。

在一种可能的实现方式中，第一处理器在确定待同步的张量数据的描述符后，可以将描述符的内容存储到同步数据存储空间；并根据描述符的内容在同步数据存储空间中的地址，生成并发送描述符同步指令。第二处理器接收到描述符同步指令后，可解析指令以得到描述符的内容的存储地址；根据该存储地址，第二处理器可从同步数据存储空间获取待同步的张量数据的描述符的内容，进而根据描述符的内容确定待同步的张量数据的数据地址，获取所述待同步的张量数据，从而实现整个同步过程。

通过这种方式，可以进一步减少同步时处理器间的数据传输，提高同步的处理效率。

在一种可能的实现方式中，步骤S11c可包括：

在待同步的张量数据的存储地址处于非共用存储空间中时，将所述待同步的张量数据存储到共用存储空间；

根据所述待同步的张量数据在共用存储空间中的地址，生成所述待同步的张量数据的描述符；

根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

举例来说，第一处理器可以具有非共用存储空间，第一处理器可存取该非共用存储空间中的数据，而第二处理器无法访问到第一处理器的非共用存储空间，不能存取该非共用存储空间中的数据。如果待同步的张量数据的存储地址处于非共用存储空间，则第二处理器无法直接获取该张量数据。在该情况下，第一处理器可将待同步的张量数据转存到共用存储空间，以使第二处理器能够存取该张量数据。在完成转存后，如果第一处理器中未注册指示该待同步的张量数据的描述符，或已注册有指示非共用存储空间中的该张量数据的描述符且该描述符不可修改(例如正在被操作)，则第一处理器可生成所述待同步的张量数据的描述符，也即，注册新的描述符，以指示在共用存储空间中的该张量数据。

在一种可能的实现方式中，在生成描述符后，第一处理器可根据描述符的内容生成描述符同步指令。第二处理器接收到描述符同步指令后，可解析指令以得到描述符的内容；根据描述符的内容，第二处理器可确定待同步的张量数据的数据地址，并从共用存储空间获取所述待同步的张量数据，从而实现整个同步过程。

通过这种方式，可将非共用存储空间中待同步的张量数据主动转存到共用存储空间，以使第二处理器能够获取待同步的张量数据，从而减少同步时处理器间的数据传输，提高同步的处理效率。

在一种可能的实现方式中，步骤S11c可包括：

根据所述待同步的张量数据在共用存储空间中的地址，修改所述待同步的张量数据的描述符；

举例来说，与上面的描述类似，如果待同步的张量数据处于第一处理器非共用存储空间，则第一处理器可将待同步的张量数据转存到共用存储空间。在完成转存后，如果第一处理器中已注册有指示非共用存储空间中的该张量数据的描述符且该描述符可修改(例如描述符未被操作)，则第一处理器可直接修改待同步的张量数据的描述符，使得该描述符指示在共用存储空间中的该张量数据。

在一种可能的实现方式中，在修改描述符后，第一处理器可根据描述符的内容生成描述符同步指令。第二处理器接收到描述符同步指令后，可解析指令以得到描述符的内容；根据描述符的内容，第二处理器可确定待同步的张量数据的数据地址，并从共用存储空间获取所述待同步的张量数据，从而实现整个同步过程。

通过这种方式，可将非共用存储空间中待同步的张量数据主动转存到共用存储空间，减少同步时处理器间的数据传输，提高同步的处理效率；并且，第一处理器不需要创建新的描述符，节省了有限的描述符资源。

图3c1示出根据本公开实施例的数据同步方法的流程图。该数据同步方法可应用于第二处理器中。如图3c1所示，该数据同步方法包括：

在步骤S21c中，解析来自第一处理器的描述符同步指令，得到待同步的张量数据的描述符，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容，所述描述符用于指示待同步的张量数据的形状；

在步骤S22c中，根据所述待同步的张量数据的描述符，获取所述待同步的张量数据。

举例来说，第一处理器(发送方)可以主动发起对第二处理器(接收方)的数据同步，例如在第一处理器完成一项运算得到运算结果(张量数据)时，主动发起对需要使用该运算结果的第二处理器的数据同步。

在一种可能的实现方式中，第二处理器在接收到来自第一处理器的描述符同步指令时，可解析该描述符同步指令，得到待同步的张量数据的描述符(例如描述符的标识和/或所述描述符的内容)。

在一种可能的实现方式中，如果该描述符同步指令仅包括描述符的标识，则第二处理器可内部查找该描述符的标识对应的描述符内容，进而根据描述符内容获取待同步的张量数据，从而实现张量数据的同步。

在一种可能的实现方式中，如果该描述符同步指令包括描述符的标识和内容，则第二处理器可查找该描述符的标识对应的描述符，并根据描述符同步指令中的描述符内容，更新原来的描述符内容；根据更新后的描述符内容获取待同步的张量数据，从而实现张量数据的同步。

在一种可能的实现方式中，如果该描述符同步指令包括描述符的内容，则第二处理器可根据描述符的内容，注册指示该待同步的张量数据的描述符，并根据描述符的内容获取待同步的张量数据，从而实现张量数据的同步。

根据本公开实施例的数据同步方法，通过设定指示张量数据的形状的描述符，能够根据描述符同步指令中的指示待同步的张量数据的描述符，获取待同步的张量数据，实现张量数据的同步，从而减少同步开销，降低数据同步的复杂度，提高数据同步的效率。

在一种可能的实现方式中，所述描述符同步指令包括所述待同步的张量数据的描述符的内容，其中，步骤S22c包括：

根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

举例来说，如果待同步的张量数据的存储地址处于共用存储空间中，则第二处理器可从共用存储空间存取数据。在该情况下，描述符同步指令可包括待同步的张量数据的描述符的内容。第二处理器接收到描述符同步指令后，可解析指令以得到描述符的内容；根据描述符的内容，第二处理器可确定待同步的张量数据的数据地址，并从共用存储空间获取所述待同步的张量数据，从而实现整个同步过程。

在一种可能的实现方式中，所述描述符同步指令包括所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，其中，步骤S22c包括：

根据所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容；

举例来说，第一处理器在确定待同步的张量数据的描述符后，可以将描述符的内容存储到同步数据存储空间；并根据描述符的内容在同步数据存储空间中的地址，生成并发送描述符同步指令。第二处理器接收到描述符同步指令后，可解析指令以得到描述符的内容的存储地址；根据该存储地址，第二处理器可从同步数据存储空间获取待同步的张量数据的描述符的内容，进而根据描述符的内容确定待同步的张量数据的数据地址，获取所述待同步的张量数据，从而实现整个同步过程。

图3c2示出根据本公开实施例的数据同步方法的流程图。该数据同步方法可应用于第二处理器中。如图3c2所示，该数据同步方法包括：

在步骤S31c中，当存在待同步的张量数据时，生成描述符同步请求指令，所述描述符同步请求指令用于指示第一处理器根据所述描述符同步请求指令发送待同步的张量数据的描述符，所述描述符用于指示待同步的张量数据的形状；

在步骤S32c中，向所述第一处理器发送所述描述符同步请求指令。

举例来说，当第二处理器中存在待同步的张量数据时，可以主动向第一处理器发送描述符同步请求指令，以便获取该待同步的张量数据。第二处理器可根据待同步的张量数据的信息，例如指示该待同步的张量数据的描述符的标识、该待同步的张量数据的数据特征等，生成描述符同步请求指令。本公开对描述符同步请求指令的具体内容不作限制。根据描述符同步请求指令中的信息，第一处理器可确定待同步的张量数据的描述符，进而生成描述符同步指令。

通过这种方式，可以在需要同步时主动发起同步请求，提高数据同步的效率。

在一种可能的实现方式中，所述描述符同步请求指令包括描述符的标识和/或所述待同步的张量数据的数据特征，以使第一处理器能够确定待同步的张量数据。其中，张量数据的数据特征可包括张量数据的形状、来源、地址等信息。本领域技术人员可根据实际情况设定待同步的张量数据的数据特征，本公开对此不作限制。

在一种可能的实现方式中，所述方法还包括：

解析来自第一处理器的描述符同步指令，得到待同步的张量数据的描述符，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容；

根据所述待同步的张量数据的描述符，获取所述待同步的张量数据。

在一种可能的实现方式中，第二处理器接收到描述符同步指令时，可解析该描述符同步指令，得到待同步的张量数据的描述符(描述符的标识和/或描述符的内容)。如果该描述符同步指令仅包括描述符的标识，则第二处理器可内部查找该描述符的标识对应的描述符内容，进而根据描述符内容获取待同步的张量数据，从而实现张量数据的同步。

通过这种方式，可以降低数据同步的复杂度，提高数据同步的效率。

在一种可能的实现方式中，所述描述符同步指令包括所述待同步的张量数据的描述符的内容，其中，所述根据所述待同步的张量数据的描述符，获取所述待同步的张量数据的步骤可包括：

在一种可能的实现方式中，所述描述符同步指令包括所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，其中，所述根据所述待同步的张量数据的描述符，获取所述待同步的张量数据的步骤可包括：

第一处理器在确定待同步的张量数据的描述符后，可以将描述符的内容存储到同步数据存储空间；并根据描述符的内容在同步数据存储空间中的地址，生成并发送描述符同步指令。第二处理器接收到描述符同步指令后，可解析指令以得到描述符的内容的存储地址；根据该存储地址，第二处理器可从同步数据存储空间获取待同步的张量数据的描述符的内容，进而根据描述符的内容确定待同步的张量数据的数据地址，获取所述待同步的张量数据，从而实现整个同步过程。

在一种可能的实现方式中，描述符的标识和内容可存储在描述符存储空间中，该描述符存储空间可以为处理器的内部存储器(例如寄存器、片上的SRAM或其他介质缓存等)中的存储空间。描述符所指示的张量数据的数据存储空间可为处理器的内部存储器(例如片上缓存)或与处理器连接的外部存储器(片下存储器)中的存储空间。数据存储空间中的数据地址可以为实际的物理地址或虚拟地址。本公开对描述符存储空间及数据存储空间的位置以及数据地址的类型不作限制。

在一种可能的实现方式中，与描述符对应的数据存储空间的数据地址可以是固定地址。例如，可以为张量数据划分单独的数据存储空间，每个张量数据在数据存储空间的起始地址与描述符的标识一一对应。在这种情况下，处理器根据描述符的内容即可确定张量数据的数据地址。

在一种可能的实现方式中，在与描述符对应的数据存储空间的数据地址为可变地址时，所述描述符还可用于指示N维的张量数据的地址，其中，所述描述符的内容还可包括表示张量数据的地址的至少一个地址参数。例如，张量数据为3维数据，在描述符指向该张量数据的地址时，描述符的内容可包括表示该张量数据的地址的一个地址参数，例如张量数据的起始地址，也可以包括该张量数据的地址的多个地址参数，例如张量数据的起始地址+地址偏移量，或张量数据基于各维度的地址参数。本领域技术人员可以根据实际需要对地址参数进行设置，本公开对此不作限制。

PA2 _(x,y)＝PA_start+(offset_y+y _q-1)*ori_x+(offset_x+x _q) (4)

通过这种方式，处理器可以根据描述符的内容计算出描述符所指示的张量数据在数据存储空间中的数据地址，进而根据该地址执行对应的处理(例如数据运算、数据同步等)，从而可降低数据存取的复杂度，提高处理器的处理效率。

图3c3示出根据本公开实施例的数据同步装置的框图。该数据同步装置应用于第一处理器，如图3c3所示，该数据同步装置包括：

同步指令生成模块51c，用于根据待同步的张量数据的描述符，生成描述符同步指令，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容，所述描述符用于指示待同步的张量数据的形状；

同步指令发送模块52c，用于向第二处理器发送所述描述符同步指令，所述描述符同步指令用于指示第二处理器根据所述描述符同步指令获取所述待同步的张量数据。

在一种可能的实现方式中，所述装置还包括：第一描述符确定模块，用于根据来自第二处理器的描述符同步请求指令，确定所述待同步的张量数据的描述符。

在一种可能的实现方式中，所述描述符同步请求指令包括描述符的标识，其中，所述第一描述符确定模块包括：

第一解析子模块，用于解析所述描述符同步请求指令，获得所述描述符的标识；

第一确定子模块，用于根据所述描述符的标识，确定所述待同步的张量数据的描述符。

在一种可能的实现方式中，所述描述符同步请求指令包括所述待同步的张量数据的数据特征，其中，所述第一描述符确定模块包括：

第二解析子模块，用于解析所述描述符同步请求指令，获得待同步的张量数据的数据特征；

第二确定子模块，用于根据待同步的张量数据的数据特征，确定所述待同步的张量数据的描述符。

在一种可能的实现方式中，所述描述符同步指令包括待同步的张量数据的描述符的内容，其中，所述同步指令生成模块包括：

第一生成子模块，用于在待同步的张量数据的存储地址处于共用存储空间中时，根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

在一种可能的实现方式中，所述同步指令生成模块包括：

第一存储子模块，用于将所述待同步的张量数据的描述符的内容存储到同步数据存储空间；

第二生成子模块，用于根据所述描述符的内容在所述同步数据存储空间中的地址，生成描述符同步指令，以指示所述第二处理器从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容。

在一种可能的实现方式中，所述同步指令生成模块包括：

第二存储子模块，用于在待同步的张量数据的存储地址处于非共用存储空间中时，将所述待同步的张量数据存储到共用存储空间；

描述符生成子模块，用于根据所述待同步的张量数据在共用存储空间中的地址，生成所述待同步的张量数据的描述符；

第三生成子模块，用于根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

在一种可能的实现方式中，所述同步指令生成模块包括：

第三存储子模块，用于在待同步的张量数据的存储地址处于非共用存储空间中时，将所述待同步的张量数据存储到共用存储空间；

描述符修改子模块，用于根据所述待同步的张量数据在共用存储空间中的地址，修改所述待同步的张量数据的描述符；

第四生成子模块，用于根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

图3c4示出根据本公开实施例的数据同步装置的框图。该数据同步装置应用于第二处理器，如图3c4所示，该数据同步装置包括：

第一解析模块61c，用于解析来自第一处理器的描述符同步指令，得到待同步的张量数据的描述符，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容，所述描述符用于指示待同步的张量数据的形状；

第一数据获取模块62c，用于根据所述待同步的张量数据的描述符，获取所述待同步的张量数据。

在一种可能的实现方式中，所述描述符同步指令包括所述待同步的张量数据的描述符的内容，其中，所述第一数据获取模块包括：

第一数据获取子模块，用于根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

在一种可能的实现方式中，所述描述符同步指令包括所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，其中，所述第一数据获取模块包括：

第一内容获取子模块，用于根据所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容；

第二数据获取子模块，用于根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

图3c5示出根据本公开实施例的数据同步装置的框图。该数据同步装置应用于第二处理器，如图3c5所示，该数据同步装置包括：

请求指令生成模块71c，用于当存在待同步的张量数据时，生成描述符同步请求指令，所述描述符同步请求指令用于指示第一处理器根据所述描述符同步请求指令发送待同步的张量数据的描述符，所述描述符用于指示待同步的张量数据的形状；

请求指令发送模块72c，用于向所述第一处理器发送所述描述符同步请求指令。

在一种可能的实现方式中，所述描述符同步请求指令包括描述符的标识和/或所述待同步的张量数据的数据特征。

在一种可能的实现方式中，所述装置还包括：

第二解析模块，用于解析来自第一处理器的描述符同步指令，得到待同步的张量数据的描述符，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容；

第二数据获取模块，用于根据所述待同步的张量数据的描述符，获取所述待同步的张量数据。

在一种可能的实现方式中，所述描述符同步指令包括所述待同步的张量数据的描述符的内容，其中，所述第二数据获取模块包括：

第三数据获取子模块，用于根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

在一种可能的实现方式中，所述描述符同步指令包括所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，其中，所述第二数据获取模块包括：

第二内容获取子模块，用于根据所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容；

第四数据获取子模块，用于根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

在一种可能的实现方式中，还公开了一种人工智能芯片，其包括了上述数据同步装置。

A1、一种数据同步方法，所述方法应用于第一处理器，包括：根据待同步的张量数据的描述符，生成描述符同步指令，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容，所述描述符用于指示待同步的张量数据的形状；向第二处理器发送所述描述符同步指令，所述描述符同步指令用于指示第二处理器根据所述描述符同步指令获取所述待同步的张量数据。

A2、根据权利要求A1所述的方法，所述方法还包括：根据来自第二处理器的描述符同步请求指令，确定所述待同步的张量数据的描述符。

A3、根据权利要求A2所述的方法，所述描述符同步请求指令包括描述符的标识，其中，所述根据来自第二处理器的描述符同步请求指令，确定所述待同步的张量数据的描述符，包括：解析所述描述符同步请求指令，获得所述描述符的标识；根据所述描述符的标识，确定所述待同步的张量数据的描述符。

A4、根据权利要求A2所述的方法，所述描述符同步请求指令包括所述待同步的张量数据的数据特征，其中，所述根据来自第二处理器的描述符同步请求指令，确定所述待同步的张量数据的描述符，包括：解析所述描述符同步请求指令，获得待同步的张量数据的数据特征；根据待同步的张量数据的数据特征，确定所述待同步的张量数据的描述符。

A5、根据权利要求A1-A4中任意一项所述的方法，所述描述符同步指令包括待同步的张量数据的描述符的内容，其中，所述根据待同步的张量数据的描述符，生成描述符同步指令，包括：在待同步的张量数据的存储地址处于共用存储空间中时，根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

A6、根据权利要求A1-A4中任意一项所述的方法，所述根据待同步的张量数据的描述符，生成描述符同步指令，包括：将所述待同步的张量数据的描述符的内容存储到同步数据存储空间；根据所述描述符的内容在所述同步数据存储空间中的地址，生成描述符同步指令，以指示所述第二处理器从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容。

A7、根据权利要求A1-A4中任意一项所述的方法，所述根据待同步的张量数据的描述符，生成描述符同步指令，包括：在待同步的张量数据的存储地址处于非共用存储空间中时，将所述待同步的张量数据存储到共用存储空间；根据所述待同步的张量数据在共用存储空间中的地址，生成所述待同步的张量数据的描述符；根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

A8、根据权利要求A1-A4中任意一项所述的方法，所述根据待同步的张量数据的描述符，生成描述符同步指令，包括：在待同步的张量数据的存储地址处于非共用存储空间中时，将所述待同步的张量数据存储到共用存储空间；根据所述待同步的张量数据在共用存储空间中的地址，修改所述待同步的张量数据的描述符；根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

A9、一种数据同步方法，所述方法应用于第二处理器，包括：解析来自第一处理器的描述符同步指令，得到待同步的张量数据的描述符，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容，所述描述符用于指示待同步的张量数据的形状；根据所述待同步的张量数据的描述符，获取所述待同步的张量数据。

A10、根据权利要求A9所述的方法，所述描述符同步指令包括所述待同步的张量数据的描述符的内容，其中，所述根据所述待同步的张量数据的描述符，获取所述待同步的张量数据，包括：根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

A11、根据权利要求A9所述的方法，所述描述符同步指令包括所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，其中，所述根据所述待同步的张量数据的描述符，获取所述待同步的张量数据，包括：根据所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容；根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

A12、一种数据同步方法，所述方法应用于第二处理器，包括：当存在待同步的张量数据时，生成描述符同步请求指令，所述描述符同步请求指令用于指示第一处理器根据所述描述符同步请求指令发送待同步的张量数据的描述符，所述描述符用于指示待同步的张量数据的形状；向所述第一处理器发送所述描述符同步请求指令。

A13、根据权利要求A12所述的方法，所述描述符同步请求指令包括描述符的标识和/或所述待同步的张量数据的数据特征。

A14、根据权利要求A12或A13所述的方法，所述方法还包括：解析来自第一处理器的描述符同步指令，得到待同步的张量数据的描述符，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容；根据所述待同步的张量数据的描述符，获取所述待同步的张量数据。

A15、根据权利要求A14所述的方法，所述描述符同步指令包括所述待同步的张量数据的描述符的内容，其中，所述根据所述待同步的张量数据的描述符，获取所述待同步的张量数据，包括：根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

A16、根据权利要求A14所述的方法，所述描述符同步指令包括所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，其中，所述根据所述待同步的张量数据的描述符，获取所述待同步的张量数据，包括：根据所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容；根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

A17、一种数据同步装置，所述装置应用于第一处理器，包括：同步指令生成模块，用于根据待同步的张量数据的描述符，生成描述符同步指令，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容，所述描述符用于指示待同步的张量数据的形状；同步指令发送模块，用于向第二处理器发送所述描述符同步指令，所述描述符同步指令用于指示第二处理器根据所述描述符同步指令获取所述待同步的张量数据。

A18、根据权利要求A17所述的装置，所述装置还包括：第一描述符确定模块，用于根据来自第二处理器的描述符同步请求指令，确定所述待同步的张量数据的描述符。

A19、根据权利要求A18所述的装置，所述描述符同步请求指令包括描述符的标识，其中，所述第一描述符确定模块包括：第一解析子模块，用于解析所述描述符同步请求指令，获得所述描述符的标识；第一确定子模块，用于根据所述描述符的标识，确定所述待同步的张量数据的描述符。

A20、根据权利要求A18所述的装置，所述描述符同步请求指令包括所述待同步的张量数据的数据特征，其中，所述第一描述符确定模块包括：第二解析子模块，用于解析所述描述符同步请求指令，获得待同步的张量数据的数据特征；第二确定子模块，用于根据待同步的张量数据的数据特征，确定所述待同步的张量数据的描述符。

A21、根据权利要求A17-A20中任意一项所述的装置，所述描述符同步指令包括待同步的张量数据的描述符的内容，其中，所述同步指令生成模块包括：第一生成子模块，用于在待同步的张量数据的存储地址处于共用存储空间中时，根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

A22、根据权利要求A17-A20中任意一项所述的装置，所述同步指令生成模块包括：第一存储子模块，用于将所述待同步的张量数据的描述符的内容存储到同步数据存储空间；第二生成子模块，用于根据所述描述符的内容在所述同步数据存储空间中的地址，生成描述符同步指令，以指示所述第二处理器从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容。

A23、根据权利要求A17-A20中任意一项所述的装置，所述同步指令生成模块包括：第二存储子模块，用于在待同步的张量数据的存储地址处于非共用存储空间中时，将所述待同步的张量数据存储到共用存储空间；描述符生成子模块，用于根据所述待同步的张量数据在共用存储空间中的地址，生成所述待同步的张量数据的描述符；第三生成子模块，用于根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

A24、根据权利要求A17-A20中任意一项所述的装置，所述同步指令生成模块包括：第三存储子模块，用于在待同步的张量数据的存储地址处于非共用存储空间中时，将所述待同步的张量数据存储到共用存储空间；描述符修改子模块，用于根据所述待同步的张量数据在共用存储空间中的地址，修改所述待同步的张量数据的描述符；第四生成子模块，用于根据所述待同步的张量数据的描述符的内容，生成描述符同步指令，以指示所述第二处理器根据所述待同步的张量数据的描述符的内容，从所述共用存储空间获取所述待同步的张量数据。

A25、一种数据同步装置，所述装置应用于第二处理器，包括：第一解析模块，用于解析来自第一处理器的描述符同步指令，得到待同步的张量数据的描述符，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容，所述描述符用于指示待同步的张量数据的形状；第一数据获取模块，用于根据所述待同步的张量数据的描述符，获取所述待同步的张量数据。

A26、根据权利要求A25所述的装置，所述描述符同步指令包括所述待同步的张量数据的描述符的内容，其中，所述第一数据获取模块包括：第一数据获取子模块，用于根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

A27、根据权利要求A25所述的装置，所述描述符同步指令包括所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，其中，所述第一数据获取模块包括：

第一内容获取子模块，用于根据所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容；第二数据获取子模块，用于根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

A28、一种数据同步装置，所述装置应用于第二处理器，包括：请求指令生成模块，用于当存在待同步的张量数据时，生成描述符同步请求指令，所述描述符同步请求指令用于指示第一处理器根据所述描述符同步请求指令发送待同步的张量数据的描述符，所述描述符用于指示待同步的张量数据的形状；请求指令发送模块，用于向所述第一处理器发送所述描述符同步请求指令。

A29、根据权利要求A28所述的装置，所述描述符同步请求指令包括描述符的标识和/或所述待同步的张量数据的数据特征。

A30、根据权利要求A28或A29所述的装置，所述装置还包括：第二解析模块，用于解析来自第一处理器的描述符同步指令，得到待同步的张量数据的描述符，所述描述符同步指令包括所述描述符的标识和/或所述描述符的内容；第二数据获取模块，用于根据所述待同步的张量数据的描述符，获取所述待同步的张量数据。

A31、根据权利要求A30所述的装置，所述描述符同步指令包括所述待同步的张量数据的描述符的内容，其中，所述第二数据获取模块包括：第三数据获取子模块，用于根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

A32、根据权利要求A30所述的装置，所述描述符同步指令包括所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，其中，所述第二数据获取模块包括：

第二内容获取子模块，用于根据所述待同步的张量数据的描述符的内容在同步数据存储空间中的地址，从所述同步数据存储空间获取所述待同步的张量数据的描述符的内容；第四数据获取子模块，用于根据所述待同步的张量数据的描述符的内容，从共用存储空间获取所述待同步的张量数据。

A33、一种人工智能芯片，所述芯片包括如权利要求A17-A32中任意一项所述的数据同步装置。

A34、一种电子设备，所述电子设备包括如权利要求A33所述的人工智能芯片。

A35、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如权利要求A33所述的人工智能芯片；其中，所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；所述存储器件，用于存储数据；所述接口装置，用于实现所述人工智能芯片与外部设备之间的数据传输；所述控制器件，用于对所述人工智能芯片的状态进行监控。

A36、根据权利要求A35所述的板卡，所述存储器件包括：多组存储单元，每一组所述存储单元与所述人工智能芯片通过总线连接，所述存储单元为：DDR SDRAM；所述芯片包括：DDR控制器，用于对每个所述存储单元的数据传输与数据存储的控制；所述接口装置为：标准PCIE接口。

随着人工智能技术的不断发展，需要处理的数据量和数据维度都在不断增大。在相关技术中，当多个操作针对相同的存储区域进行操作时，需要等待前一条操作完毕，后一条操作才能执行，降低了处理器的处理效率。

根据本公开的实施例，提供了一种处理器操作方法。图1d1示出根据本公开实施例的应用场景的示意图。其中，处理器100可以是通用处理器(例如中央处理器CPU、图形处理器GPU)，也可以是专用处理器(例如人工智能处理器、科学计算处理器或数字信号处理器等)，本公开对处理器的类型不作限制。存储设备200包括至少一个目标存储区域210，其中，目标存储区域210可以是描述符所指示的张量数据的存储区域。可以理解，处理器可以通过执行读操作或者执行写操作来实现对某个目标存储区域210的访问，处理器执行针对某个目标存储区域210的读操作，可以是指处理器通过描述符获取该目标存储区域210中的张量数据。而处理器执行针对某个目标存储区域210的写操作，可以是指处理器将描述符所指示的张量数据写入该目标存储区域210中。在相关技术中，由于处理器可以并行执行多个操作，为了避免冲突，当处理器并行执行的多个操作都是针对某个目标存储区域210的操作时，处理器将只执行该多个操作中的一个，同时阻塞其他操作，从而会导致处理器的效率降低。本公开提供的处理器操作方法将目标存储区域210进一步划分为多个细粒度区域211，当处理器并行执行的多个操作都是针对某个目标存储区域210的操作时，处理器可以判断该多个操作针对的细粒度区域211是否重叠，如果各个操作针对的细粒度区域211不重叠，就可并行执行该多个操作，因此，大大提高了处理器的效率。需要说明的是，存储设备200可以设置在处理器内部(例如片上缓存或寄存器等)，也可以设置在处理器的外部且可以与处理器进行数据通信(例如片下存储器等)。本公开对存储设备的类型不做限定。本公开所涉及的操作，可以是处理器硬件支持的基本操作，也可以是将该基本操作进行解析后的微指令(例如请求信号等)。本公开对操作的具体类型不做限定。本公开处理器可以并行执行两个操作，也可以并行执行两个以上的操作，本公开对并行执行的操作的数量不做限定。

图1d2示出根据本公开实施例的处理器操作方法的流程图。所述处理器操作方法可应用于处理器。如图1d2所示，该处理器操作方法包括：

步骤S11d，在第一操作为针对描述符的操作时，获取所述描述符所指示的张量数据的目标存储区域。

第一操作可以是针对描述符的读操作或者写操作。本公开对第一操作的具体类型不作限制。描述符可用于指示张量的形状。其中，张量可以包含多种形式的数据组成方式，张量可以是不同维度的，比如标量可以看作是0维张量，向量可以看作1维张量，而矩阵可以是2维或2维以上的张量。张量的形状包括张量的维度、张量各个维度的尺寸等信息。举例而言，对于张量：

该张量的形状可以被描述符描述为(2，4)，也即通过两个参数表示该张量为二维张量，且该张量的第一维度(列)的尺寸为2、第二维度(行)的尺寸为4。需要说明的是，本公开对于描述符指示张量形状的方式并不做限定。

在一种可能的实现方式中，第一操作的操作数可以是一个或多个描述符。目标存储区域可以是第一操作的操作数中一个或多个描述符所指示的张量数据的存储区域，也可以是第一操作的操作数中任意一个描述符所指示的张量数据的存储空间。目标存储区域所在的整体存储区域可以是处理器的内部存储器(例如片上缓存或寄存器等)，也可以是连接到处理器的外部存储器(例如片下存储器等)。

在一种可能的实现方式中，目标存储区域可包括至少一个细粒度区域。其中，细粒度区域的尺寸和/或数量的确定方式，可以包括根据硬件设计确定的方式、根据描述符所指示的张量数据的相关操作确定的方式、根据操作中相关参数进行定义的方式中的其中一种或任意组合。其中，根据硬件设计确定的方式，即在硬件设计时确定细粒度区域的尺寸，譬如确定目标存储区域的一行或多行为一个细粒度区域。根据描述符所指示的张量数据的相关操作确定的方式，包括根据描述符所指示的张量数据的处理需求、存储方式、或传输方式等进行确定的方式，例如描述符所指示的张量数据为一个二维矩阵数据，其规模为M*Q(M，Q均为正整数)，表示存储所占字节数，即一行M字节，共有Q行，可以确定M字节为一个细粒度区域，该描述符所指示的张量数据所对应的目标存储区域包括Q个细粒度区域。根据操作中相关参数进行定义的方式，包括根据操作中携带的细粒度的尺寸和/或数量，将目标存储区域划分为多个细粒度区域。需要说明的是，多个细粒度区域的尺寸可以相同，也可以不同。例如，各细粒度区域的数据位数可以分别为64位、256位、512位等。可以根据需求确定各细粒度区域的尺寸和/或数量。本公开对此不做限定。

在一种可能的实现方式中，在第一操作为针对描述符的操作时，可通过第一操作所针对的描述符，来获取该描述符所指示的张量数据的目标存储区域，从而确定第一操作所针对的目标存储区域。

步骤S12d，判断是否存在正在进行的针对所述目标存储区域的第二操作。

其中，第二操作可以是读操作或写操作，本公开对第二操作的具体类型不作限制。第二操作可包括一个或多个操作数，第二操作的操作数可以是描述符、立即数、张量数据等各种数据，本公开对第二操作的操作数的具体数量和类型不作限制。

在一种可能的实现方式中，可通过根据该目标存储区域的占用状态来判断是否存在正在进行的针对目标存储区域的第二操作。例如，处理器可以通过查询占用状态列表来判断目标存储区域是否被占用，如被占用，则判断结果为存在正在进行的针对目标存储区域的第二操作。其中，该占用状态列表可以是预先设置并存储在存储器上，也可以是在处理器开始执行某个任务之前生成，并在该任务完成之后注销。当各存储区域的占用状态发生变化时，处理器更新该占用状态列表的内容以记录各存储区域的占用状态。

在一种可能的实现方式中，可以通过查询各操作的执行状态来判断是否存在正在进行的针对目标存储区域的第二操作。例如，可以记录各操作的操作数所对应的存储区域，并记录各操作的执行状态。若针对目标存储区域的操作的执行状态为未完成，则判断结果为存在正在进行的针对目标操作区域的第二操作。还可以通过判断操作数的占用状态，来确定操作数对应的目标存储区域是否被占用，从而确定是否存在正在进行的针对目标存储区域的第二操作。本公开对判断是否存在正在进行的针对目标存储区域的第二操作的判断依据不做限定。

在一种可能的实现方式中，第二操作可以是针对描述符的操作，第二操作所针对的描述符可以与第一操作所针对的描述符一致，则第二操作所针对的描述符的存储区域与目标存储区域一致，当第二操作未完成时，存在针对目标存储区域的第二操作；或第二操作所针对的描述符的存储区域与目标存储区域有重叠区域，当第二操作针对重叠区域进行操作时，则存在针对目标存储区域的第二操作。

在一种可能的实现方式中，在针对目标存储区域的第一操作执行前，可判断是否存在正在进行的针对目标存储区域的第二操作。

在一种可能的实现方式中，在第一操作针对目标存储区域的执行过程中，也可以判断是否存在正在进行的针对目标存储区域的第二操作。

步骤S13d，在存在所述第二操作时，判断所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域与所述第二操作当前所针对的所述目标存储区域中的第二细粒度区域之间是否有重叠。

第一细粒度区域和第二细粒度区域可以为目标存储区域中多个细粒度区域中的任意细粒度区域。可以是将目标存储区域所在的整体存储区域进行细粒度的划分，则针对整体存储区域的各操作所针对的细粒度区域的尺寸一致。

也可以是各操作将操作数所针对的存储区域按照各操作中携带的细粒度划分信息进行细粒度划分，则针对相同存储区域，不同的操作可以进行不同粒度的细粒度划分。第一细粒度区域可以是第一操作将目标存储区域划分为多个细粒度区域中的任意细粒度区域，第二细粒度区域可以是第二操作将其操作数所在的存储区域进行细粒度划分后得到的任意细粒度区域。第一细粒度区域与第二细粒度区域的尺寸可以不同。

例如，第一操作可以携带第一细粒度的尺寸(各细粒度区域的数据位数)，并可以将该第一细粒度的尺寸设置为64位，而第二操作可以携带第二细粒度尺寸(例如各细粒度区域的数据位数)，并可以将该第二细粒度的尺寸设置为256位。即在执行第一操作时，将每64位作为一个细粒度区域，而在执行第二操作时，每256位作为一个细粒度区域。又如，第一操作和第二操作所携带的细粒度尺寸(例如各细粒度区域的数据位数)均为512位。同样的，第一操作也可以携带第一细粒度的数量(例如设置为4个)，而第二操作携带第二细粒度的数量(例如设置为8个)。即在执行第一操作时，将目标存储区域划分为4个细粒度区域，而在执行第二操作时，将目标存储区域划分为8个细粒度区域。可以理解，操作中还可以同时携带细粒度的尺寸、数量这两个参数。可以根据需求确定各细粒度区域的尺寸和/或数量，本公开对此不做限定。

可以理解的是，针对目标存储区域的操作，即为针对目标存储区域中各细粒度区域的操作。例如，目标存储区域A为第1行至第10行，每1行为一个细粒度区域，目标存储区域A包括10个细粒度区域。针对目标存储区域A的写操作可以看做针对此10个细粒度区域的写操作。其执行过程可以为，写第1个细粒度区域(第1行)，第1个细粒度区域写完后写第2个细粒度区域(第2行)，第2个细粒度区域写完后写第3个细粒度区域(第3行)，以此类推，直至写完第10个细粒度区域(第10行)，完成目标存储区域A的写操作。

当有针对目标存储区域的操作时，随着操作的执行，目标存储区域中的细粒度区域的状态，可以包括已被操作完成状态、正在进行操作状态和未被操作状态。操作当前所针对的细粒度区域的状态为正在进行操作状态。由此，当存在针对目标存储区域的操作时，可以认为是存在针对目标存储区域中的一个细粒度区域的操作，正在被操作的细粒度区域，即为操作当前所针对的细粒度区域。

在一种可能的实现方式中，第一操作当前所针对的目标存储区域中的第一细粒度区域，可以包括将要执行的第一操作所针对的目标存储区域中的细粒度区域，通常为第一个细粒度区域。也可以包括正在执行的第一操作当前所针对的目标存储区域中的细粒度区域，可以为任意一个细粒度区域。第二操作当前所针对的目标存储区域中的第二细粒度区域，可以为正在执行的第二操作当前所针对的目标存储区域中的细粒度区域，可以为任意一个细粒度区域。

在一种可能的实现方式中，可根据物理地址、指针位置、细粒度区域标识等，来判断第一操作当前所针对的目标存储区域中的第一细粒度区域与第二操作当前所针对的目标存储区域中的第二细粒度区域之间是否重叠。例如，可记录各操作当前的物理地址，根据第一操作当前的物理地址以及第二操作当前的物理地址，以及物理地址与细粒度区域之间的对应关系，分别确定第一操作当前所针对的目标存储区域中的第一细粒度区域以及第二操作当前所针对的目标存储区域中的第二细粒度区域，进而判断第一细粒度区域与第二细粒度区域是否重叠。物理地址可以包括细粒度区域的起始地址、终止地址、设定位置的地址或实时操作地址中的一种或任意组合。再例如，可为各操作设置指针，指针指向操作当前所针对的细粒度区域。根据第一操作的指针位置和第二操作的指针位置，分别确定第一操作当前所针对的目标存储区域中的第一细粒度区域以及第二操作当前所针对的目标存储区域中的第二细粒度区域，进而判断第一细粒度区域与第二细粒度区域是否重叠。再例如，还可以为各细粒度区域设置标识，通过记录操作当前所针对的细粒度区域的标识来判断第一细粒度区域与第二细粒度区域是否重叠。标识可以包括字母、数字或符号的任意组合。还可以通过其他方式判断第一细粒度区域与第二细粒度区域是否重叠，本公开对第一细粒度区域与第二细粒度区域之间是否重叠的判断依据不作限制。

步骤S14d，在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

在一种可能的实现方式中，如果第一操作当前所针对的目标存储区域中的第一细粒度区域与第二操作当前所针对的目标存储区域中的第二细粒度区域不重叠，则第一细粒度区域可以是第二操作已经操作完成的细粒度区域，也可以是第二操作不需要进行操作的细粒度区域，此时执行第一操作不会对第二操作的操作过程及操作结果产生影响，可以执行第一操作。

根据本实施例，能够在第一操作为针对描述符的操作时，获取描述符所指示的张量数据的目标存储区域，并在存在正在进行的针对目标存储区域的第二操作时，判断第一操作当前所针对的目标存储区域中的第一细粒度区域与第二操作当前针对的目标存储区域中的第二细粒度区域之间是否有重叠，在两者无重叠时，执行第一操作。这样，第一操作和第二操作当前操作的细粒度区域无重叠即可执行，使得第一操作和第二操作可以同时对目标存储区域进行操作，提高了处理器的处理效率。

在一种可能的实现方式中，所述方法还可包括：在所述第一细粒度区域与所述第二细粒度区域有重叠时，阻塞所述第一操作。

在一种可能的实现方式中，第一细粒度区域与第二细粒度区域有重叠，包括第一细粒度区域与第二细粒度区域完全重叠或部分重叠。第一细粒度区域与第二细粒度区域有重叠时，若执行第一操作，则第一操作针对重叠部分区域的操作，可以影响第二操作的执行导致第二操作的操作结果不准确，也可以影响第一操作的执行导致第一操作的操作结果不准确。此时，可阻塞第一操作，即暂停第一操作的执行，可以在第二操作对当前所针对的目标存储区域中的第二细粒度区域操作完成后，执行第一操作。即第一细粒度区域与第二细粒度区域不重叠时，执行第一操作。

在本实施例中，在第一细粒度区域与第二细粒度区域有重叠时，阻塞第一操作，能够避免由于各操作的细粒度区域的重叠而导致的操作错误、操作结果不准确，保证各操作的正确性。

图5a和图5b示出根据本公开实施例的处理器操作方法的应用场景的示意图。如图5a和图5b所示，整体存储区域20d中包括目标存储区域21d，其中，目标存储区域21d被划分为4个细粒度区域，依次为细粒度区域22d、细粒度区域23d、细粒度区域24d和细粒度区域25d。

如图5a所示，当前仅包括写操作，用写指针wp表示写操作当前所针对的目标存储区域21d中的细粒度区域。在写操作刚开始时，写指针wp指向细粒度区域22d，可首先判断是否存在正在进行的针对目标存储区域21d的第二操作，如果判断结果为不存在第二操作，则开始对细粒度区域22d进行写操作；当完成对细粒度区域22d的写操作后，写指针wp增加，即wp++，并指向下一个细粒度区域23d，进行同样的判断后，开始对细粒度区域23d进行写操作；当完成对细粒度区域23d的写操作后，写指针wp增加，指向下一个细粒度区域24d，进行同样的判断后，开始对细粒度区域24d进行写操作。

又如图5b所示，当前包括两个操作，读操作和写操作，其中读操作为第一操作，写操作为第二操作。并且使用写操作的写指针wp和读操作的读指针rp分别表示写操作和读操作当前所针对的细粒度区域。

在执行读操作(第一操作)时，判断是否存在正在进行的针对目标存储区域21d的第二操作。经判断，当前存在正在进行的针对目标存储区域21d的第二操作写操作，进一步判断读操作(第一操作)当前所针对的目标存储区域21d中的第一细粒度区域(图5b中的细粒度区域22d)与写操作(第二操作)当前所针对的目标存储区域21d中的第二细粒度区域(图5b中的细粒度区域24d)之间是否重叠，例如可根据细粒度区域的编号(22d和24d)，或根据rp与wp之间的关系(rp＝0，wp＝2，rp<wp)，确定出第一细粒度区域与第二细粒度区域之间不重叠，然后，可执行读操作(第一操作)。

当完成对细粒度区域22d的读操作后，rp增加，即rp++，并指向下一个细粒度区域23d，进行同样的判断后，第一操作开始对细粒度区域23d进行操作；当完成对细粒度区域23d的读操作后，rp增加并指向下一个细粒度区域24d。在该情况下，继续判断第一细粒度区域与第二细粒度区域之间是否重叠，如果细粒度区域编号相同或指针rp＝wp，即可判断第一操作当前所针对的目标存储区域21d中的第一细粒度区域与第二操作当前所针对的目标存储区域21d中的第二细粒度区域重叠，则第一操作不可执行，阻塞第一操作。当第二操作完成对细粒度区域24d的操作后，wp增加，并指向下一个细粒度区域25d时，细粒度区域的编号不同(24d和25d)或者指针rp<wp，可执行第一操作。

在一种可能的实现方式中，所述第一操作和所述第二操作中可至少一个操作为写操作。即，当对操作数的操作为写后读(第二操作为写操作，第一操作为读操作)、读后写(第二操作为读操作，第一操作为写操作)或者写后写(第二操作和第一操作均为写操作)时，可采用本公开实施例中的方法。

例如，如果第一操作为针对描述符的读操作，第二操作为写操作，第一操作需要读取的描述符所指示的张量数据需要是第二操作写操作后的数据，第二操作所针对的目标存储区域中的第二细粒度区域的编号为8，则第一操作仅能够读取编号在8之前的细粒度区域的数据。也就是说，如果第一操作当前所针对的目标存储区域中的第一细粒度区域为编号1～7的细粒度区域中的任意一个，则可以执行第一操作。

在一种可能的实现方式中，如果第一操作和第二操作均为读操作，则第一操作和第二操作的细粒度区域之间的关系不会影响操作结果，可以采用本公开实施例中的方法，也可直接执行第一操作而不进行细粒度区域的判断。

在本实施例中，当第一操作和第二操作中的至少一个操作为写操作时，通过使用本公开实施例中的方法，通过将描述符所指示的张量数据的目标存储区域划分为一个或多个细粒度区域，并以细粒度区域为单位执行操作，可以使得读后写、写后读、写后写等操作既能够正确的执行，得到准确的执行结果，又可以减少操作之间的等待时间，提高处理器的执行效率。

在一种可能的实现方式中，所述细粒度区域的尺寸和/或数量可以是根据设定长度的数据所在区域、设定维数的数据所在区域中的至少一种确定的。

可以理解，确定所述细粒度区域的尺寸和/或数量可以是在操作生成前预先设定好的，也可以是每条操作生成时实时确定的。其中，在操作前预先设定好细粒度区域的尺寸和/或数量，可以包括根据预设长度的数据所在区域、预设维度的数据所在区域中的至少一种，确定细粒度区域的尺寸和/或数量。而设定长度的数据和预设维度的数据可以与各操作的操作数无关，也可以预先根据各操作的操作数综合确定，可以根据需求确定。而在每条操作生成时实时确定细粒度区域的尺寸和/或数量，可以包括根据各操作的操作数，确定设定长度的数据或设定维度的数据，即，可以根据各操作的操作数的不同，实时确定设定长度的数据所在区域、设定维数的数据所在区域中的至少一种，确定细粒度区域的尺寸和/或数量。

举例来说，可根据设定长度的数据所在区域的大小，确定细粒度区域的尺寸和/或数量。例如，可根据描述符所指示的张量数据中设定长度的数据所在目标存储区域的尺寸，来设定细粒度区域的尺寸，该区域可以为固定的位宽。例如，描述符所指示的张量数据B是20*10*5的三维数据，其在目标存储区域的存储方式为40*25(即每行40位数据，共25行)，则可将设定长度设定为40位，将目标存储区域的每1行设为一个细粒度区域，描述符所指示的张量数据B的目标存储区域可划分为25个细粒度区域；也可将目标存储区域的每5行设为一个细粒度区域，描述符所指示的张量数据B的目标存储区域可划分为5个细粒度区域。本公开对此不作限制。

可以理解的是，根据设定长度的数据所在区域、设定维数的数据所在区域中的至少一种，可以在目标存储区域中确定细粒度区域的尺寸和/或数量，也可以在目标存储区域所在的整体存储区域中确定细粒度区域的尺寸和/或数量，以及在整体存储区域中的其他区域确定细粒度区域的尺寸和/或数量。上述示例仅给出其中一种情况，本公开不限定根据设定长度的数据所在区域、设定维数的数据所在区域中的至少一种，确定细粒度区域的尺寸和/或数量的适用划分范围。

在一种可能的实现方式中，还可根据设定维数的数据所在区域的大小，确定细粒度区域的尺寸和/或数量。例如，描述符所指示的张量数据C是20*10的二维数据，可根据设定维数为1维、长度为20的数据，将描述符所指示的张量数据C的目标存储区域划分为10个细粒度区域。

此外，还可同时根据描述符所指示的张量数据的目标存储区域中设定长度的数据所在区域的大小和设定维度的数据所在区域的大小，确定细粒度区域的尺寸和/或数量。例如，针对描述符所指示的张量数据C，可根据设定维数为2维、尺寸为4*2的数据来划分细粒度区域，从而将描述符所指示的张量数据C的目标存储区域划分为25个细粒度区域。

应当理解，本领域技术人员可根据实际情况设定划分细粒度区域的尺寸和/或数量，本公开对此不作限制。

在本实施例中，通过根据设定长度的数据所在区域的大小和/或设定维度的数据所在区域的大小，来确定所述细粒度区域的尺寸和/或数量，可针对数据特性来完成对细粒度区域的划分，能够提高细粒度区域划分的灵活性，从而提高多操作的执行的效率，也可以使得细粒度区域的划分结果能够更加符合不同操作数的特性，从而适应不同类型操作数的处理需求，进一步提高多操作的整体执行效率。

在一种可能的实现方式中，所述细粒度区域的尺寸和/或数量可以是根据硬件计算能力、硬件带宽中的至少一种确定的。

其中，硬件计算能力可以是硬件在一个计算周期内并行处理的数据量，硬件带宽可以是数据传输能力，例如单位时间内传输的数据量。

举例来说，应用该处理器操作方法的处理器，其硬件计算能力为一个计算周期内并行处理100位数据，硬件带宽为单位时间内传输200位数据，对于大小为1000位的目标存储区域，可根据硬件计算能力将该目标存储区域划分为10个细粒度区域，其中，每个细粒度区域包括100位数据；也可根据硬件带宽将该目标存储区域划分为5个细粒度区域，其中，每个细粒度区域包括200位数据。

应该理解，硬件计算能力、硬件带宽可根据处理器硬件的不同而不同，本公开对硬件计算能力、硬件带宽不作限制。

可以理解的是，根据硬件计算能力、硬件带宽中的至少一种，可以在目标存储区域中确定细粒度区域的尺寸和/或数量，也可以在目标存储区域所在的整体存储区域中确定细粒度区域的尺寸和/或数量，以及在整体存储区域中的其他区域确定细粒度区域的尺寸和/或数量。上述示例仅给出其中一种情况，本公开不限定根据硬件计算能力、硬件带宽中的至少一种，确定细粒度区域的尺寸和/或数量的适用划分范围。

通过这种方式，可根据处理器的处理能力(硬件计算能力和/或硬件带宽)来确定所述细粒度区域的尺寸和/或数量，使得细粒度区域的划分结果更加符合不同硬件使用环境的需求，使得根据细粒度区域执行的操作与处理器的处理能力趋于同步，能够尽可能地发挥硬件的执行效率，从而提高处理器的处理效率。

在一种可能的实现方式中，所述第一操作可以为第一处理指令中的操作，所述第二操作可以为第二处理指令中的操作，所述第二处理指令为指令队列中在所述第一处理指令之前的处理指令。

其中，第一处理指令和第二处理指令可包括数据存取指令、运算指令、同步指令和通信指令等一种或多种，譬如该指令为读且运算指令。本公开对第一处理指令和第二处理指令的具体类型不作限制。

在一种可能的实现方式中，第一指令可以与第二指令有依赖关系，例如，第一指令需要使用第二指令的计算结果等依赖关系。第一指令也可以与第二指令没有依赖关系。当第一指令与第二指令有依赖关系时，通过本公开实施例中的方法，第一指令与第二指令可以并行执行。

在本实施例中，第一操作和第二操作可以是不同指令中的操作，利用本公开实施例中的方法，可以提高指令执行效率。

在一种可能的实现方式中，第一操作和第二操作也可以为同一处理指令中的两个操作，第二操作可以与第一操作无关，或者第二操作可以基于第一操作的结果。其中，该处理指令可以包括数据存取指令、运算指令、同步指令和通信指令等一种或多种，譬如该指令为“读和加”运算指令，则第一操作为读操作，第二操作为加法运算操作。本公开对该处理指令的具体类型不作限制。

在一种可能的实现方式中，所述方法还可包括：记录所述第一操作当前操作的第一细粒度区域的第一位置信息和所述第二操作当前操作的第二细粒度区域的第二位置信息，

步骤S14d可包括：当所述第一位置信息与所述第二位置信息不一致时，执行所述第一操作。

在一种可能的实现方式中，位置信息可包括细粒度区域的标识信息。标识信息可以包括数字、字母符号的任意组合。本公开对此不做限定。

例如，位置信息可使用细粒度区域的编号信息来表示，可将目标存储区域划分为6个细粒度区域，其编号依次为0-5。在执行针对目标存储区域的第一操作和第二操作时，可分别记录第一操作当前操作的第一细粒度区域的第一位置信息(例如编号为2)和第二操作当前操作的第二细粒度区域的第二位置信息(例如编号为5)；然后根据编号信息之间的关系(2<5)，可知，第一位置信息与第二位置信息不一致；此时，可执行第一操作。

在一种可能的实现方式中，位置信息可包括细粒度区域的地址信息。地址信息可以包括细粒度区域的起始地址信息、终止地址信息、细粒度区域中预设位置的地址信息、地址偏移量信息中的至少一个。例如，细粒度区域的位置信息为ADDR1515-ADDR1531。

通过这种方式，可使用位置信息直接高效地判断第一细粒度区域与第二细粒度区域是否重叠，确定是否执行第一操作，可提高处理器的执行效率。

在一种可能的实现方式中，所述第一位置信息可包括第一操作已操作完成的细粒度区域的第一数量，所述第二位置信息可包括第二操作已操作完成的细粒度区域的第二数量，

当所述第一位置信息与所述第二位置信息不一致时，执行所述第一操作，可包括：当所述第一操作为所述第二操作之后的操作，且所述第一数量小于所述第二数量时，执行所述第一操作。

举例来说，第一操作为第二操作之后的操作，其目标存储区域被划分为6个细粒度区域，其位置信息可使用已操作完成的细粒度区域的数量来表示。在执行针对目标存储区域的第一操作和第二操作时，可分别记录第一操作已操作完成的细粒度区域的第一数量(例如第一数量为3)和第二操作已操作完成的细粒度区域的第二数量(例如第二数量为5)；然后根据第一操作与第二操作的执行顺序，以及第一数量与第二数量的关系，可知，第一操作为第二操作之后的操作，且第一数量3小于第二数量5，此时，可执行第一操作。

通过这种方式，可根据已操作完成的细粒度区域的数量来直观地判断第一细粒度区域与第二细粒度区域是否重叠，进而确定是否执行第一操作，可简化判断过程，提高处理器的执行效率。

在一种可能的实现方式中，所述目标存储区域可包括可操作区域和非可操作区域，步骤S13d可包括：在存在所述第二操作，且所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域位于所述可操作区域内时，判断所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域与所述第二操作当前所针对的所述目标存储区域中的第二细粒度区域之间是否有重叠。

在一种可能的实现方式中，目标存储区域中可包括一个或多个非可操作区域、也可包括连续或不连续的非可操作区域。

在一种可能的实现方式中，目标存储区域中可包括一个或多个可操作区域、也可包括连续或不连续的可操作区域。本公开对此不做限定。

在一种可能的实现方式中，在第一操作为针对描述符的操作时，可首先获取描述符所指示的张量数据的目标存储区域，然后判断是否存在正在进行的针对目标存储区域的第二操作；当存在第二操作时，判断第一操作所针对的目标存储区域中的第一细粒度区域是否位于可操作区域内；当存在第二操作，且第一操作所针对的目标存储区域中的第一细粒度区域位于可操作区域内时，然后再判断第一操作所针对的目标存储区域中的第一细粒度区域与第二操作所针对的目标存储区域中的第二细粒度区域之间是否有重叠；当第一细粒度区域与第二细粒度区域之间没有重叠时，执行第一操作。

在一种可能的实现方式中，所述非可操作区域可以包括禁止操作区域和非禁止操作区域。如果第一操作为针对描述符的写操作，当描述符所指示的张量数据中的部分数据不可修改时，可将该部分数据所在的存储区域设定为禁止操作区域，以避免误修改该部分数据；如果正在进行的第二操作为读取第一操作之前的数据的读操作(读后写)，则可将第二操作所在的一个或多个细粒度区域设定为非禁止操作区域，当第二操作完成对非禁止操作区域的读取后，可将该非禁止操作区域变更为可操作区域。本公开对非可操作区域的分类及划分方式不作限制。

在本实施例中，可先判断第一操作的细粒度区域是否可操作，再判断不同操作的细粒度区域之间的关系，一方面提高了判断的效率，另一方面可以对指定数据进行保护以防止有误操作发生，也可以对指定的空间禁止读写，从而预留出该空间，用于执行其他操作，进一步提高了处理器在执行细粒度同步时的灵活性。

在一种可能的实现方式中，所述非可操作区域可以为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域在所述非可操作区域内的位置随所述第二操作的操作位置更新，所述方法还可包括：当所述第二操作所针对的所述目标存储区域中的第二细粒度区域移出所述非可操作区域后，更新所述非可操作区域的位置。

也就是说，包括第二细粒度区域在内的多个细粒度区域的非可操作区域，可以不随第二操作所针对的目标存储区域中的第二细粒度区域的更新而更新，当第二操作所针对的目标存储区域中的第二细粒度区域移出非可操作区域后，更新非可操作区域的位置。例如，非可操作区域可以为包括所述第二细粒度区域在内的R个细粒度区域(R为大于1的整数)，当前的非可操作区域包括第2至第2+R-1个细粒度区域。当第二操作在非可操作区域内执行完R个细粒度区域后，移出非可操作区域，则非可操作区域的位置随着第二操作所针对的细粒度区域的位置进行更新，更新后的非可操作区域包括第2+R个至2+R+R-1个细粒度区域。其中，R的大小可以根据需求任意确定。

图6a和图6b示出根据本公开实施例的处理器操作方法的应用场景的示意图。如图6a所示，目标存储区域30d包括8个细粒度区域，其中，可操作区域包括5个细粒度区域(细粒度区域31d、细粒度区域35d、细粒度区域36d、细粒度区域37d和细粒度区域38d)，非可操作区域M0包括3个细粒度区域(细粒度区域32d、细粒度区域33d和细粒度区域34d)。其中，第二操作当前所针对的目标存储区域30d中的第二细粒度区域为细粒度区域32d。

当第二操作执行完对细粒度区域32d的操作后，第二操作当前所针对的目标存储区域30d中的第二细粒度区域为细粒度区域33d，此时，第二操作当前所针对的目标存储区域30d中的第二细粒度区域(细粒度区域33d)未移出非可操作区域，不更新非可操作区域的位置；当第二操作执行完对细粒度区域33d的操作后，第二操作当前所针对的目标存储区域30d中的第二细粒度区域为细粒度区域34d，此时，第二操作当前所针对的目标存储区域30d中的第二细粒度区域(细粒度区域34d)还未移出非可操作区域，不更新非可操作区域的位置；当第二操作执行完对细粒度区域34d的操作后，第二操作当前所针对的目标存储区域30中的第二细粒度区域为细粒度区域35d，此时，第二操作当前所针对的目标存储区域30d中的第二细粒度区域(细粒度区域35d)已移出非可操作区域，更新非可操作区域的位置到细粒度区域35d、36d和37d)。需要说明的是，本公开对非可操作区域的大小不做限定。

如图6b所示，更新非可操作区域的位置后，在目标存储区域30d中，可操作区域包括5个细粒度区域(细粒度区域31d、细粒度区域32d、细粒度区域33d、细粒度区域34d和细粒度区域38d)，非可操作区域M0包括3个细粒度区域(细粒度区域35d、细粒度区域36d和细粒度区域37d)。

通过这种方式，不需要实时更新非可操作区域的位置，能够降低更新非可操作区域所产生的开销。

在一种可能的实现方式中，所述非可操作区域可以为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域位于所述非可操作区域内的设定位置，所述非可操作区域的位置随所述第二操作的操作位置更新。

也就是说，当非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域时，可以设定第二细粒度区域在非可操作区域中的位置(例如中间位置、最后位置等)，非可操作区域的位置随第二操作的操作位置而更新。例如，非可操作区域可以为包括所述第二细粒度区域在内的R个细粒度区域，当前的非可操作区域包括第2至第2+R-1个细粒度区域，第二细粒度区域在非可操作区域内的设定位置为第S个(其中S≤R)。当第二操作执行完成对当前所针对的细粒度区域的操作后，第二操作开始执行针对下一个细粒度区域的操作，此时，非可操作区域的位置随第二操作的操作位置而更新，更新后的非可操作区域包括第2+1至第2+R个细粒度区域。其中，R的大小及S的取值可根据需求确定。本公开对非可操作区域包括的细粒度区域的数量、第二细粒度区域位于非可操作区域内的位置均不作限制。

图7a和图7b示出根据本公开实施例的处理器操作方法的应用场景的示意图。如图7a所示，目标存储区域40中包括8个细粒度区域，其中，可操作区域包括5个细粒度区域(细粒度区域41、细粒度区域45、细粒度区域46、细粒度区域47和细粒度区域48)，非可操作区域M1包括3个细粒度区域(细粒度区域42、细粒度区域43和细粒度区域44)。其中，第二操作当前所针对的目标存储区域40中的第二细粒度区域设定为位于非可操作区域M1的第二个细粒度区域，即细粒度区域43。

当第二操作执行完对细粒度区域43的操作后，第二操作当前所针对的目标存储区域40中的第二细粒度区域为细粒度区域44，此时，非可操作区域的位置随第二操作的操作位置而更新，以使第二操作当前所针对的目标存储区域40中的第二细粒度区域位于非可操作区域M1的第二个细粒度区域。

如图7b所示，更新非可操作区域的位置后，在目标存储区域40中，可操作区域包括5个细粒度区域(细粒度区域41、细粒度区域42、细粒度区域46、细粒度区域47和细粒度区域48)，非可操作区域M1包括3个细粒度区域(细粒度区域43、细粒度区域44和细粒度区域45)。

通过这种方式，能够实时更新非可操作区域的位置，提高细粒度处理的同步程度，从而进一步提高数据同步处理的效率。

在一种可能的实现方式中，所述目标存储区域可包括：循环缓冲存储区域。所述循环缓冲存储区域可用于循环存储数据。

图8示出根据本公开实施例的处理器操作方法的循环缓冲存储区域的示意图。如图8所示，目标存储区域50中包括循环缓冲存储区域51，其地址为start_addr～end_addr。

例如，第二操作为写操作，可将操作数写入循环缓冲存储区域51，其地址指针point从起始地址start_addr开始，依次向下存储数据，直到结束地址end_addr，即占满循环缓冲存储区域51的存储空间，此时，地址指针point跳回到start_addr，判断该地址是否被所需同步的第一操作使用完毕，如果使用完毕，则将数据存储到该地址，覆盖原有数据，之后地址指针point依次向下移动，直到end_addr，此时，可重新覆盖数据，循环上述过程。

在本实施例中，采用循环缓冲存储区域来存储数据，既可节省数据存储空间，也可提高存储空间利用率。

在一种可能的实现方式中，可将循环缓冲存储区域划分为多个细粒度区域。对于每个细粒度区域，可通过列表或标志位或其他方式来对细粒度区域中的数据是否可覆盖进行管理，例如，可设置覆盖标志位来表示细粒度区域中的数据是否可覆盖。

举例来说，第一操作为读操作，第二操作为写操作，即先写后读，可使用写指针wp和读指针rp分别表示第二操作和第一操作当前所针对的细粒度区域。在第二操作当前所针对的第二细粒度区域的覆盖标志位为可覆盖时，可执行第二操作，写入数据，数据写入完成后，将该第二细粒度区域的覆盖标志位设为不可覆盖，wp++，第二操作当前所针对的第二细粒度区域为下一个细粒度区域，如果wp>end_addr，则wp＝start_addr；在第一操作当前所针对的第一细粒度区域与第二细粒度区域之间不重叠，且第一细粒度区域的覆盖标志位为不可覆盖时，可执行第一操作，读取数据，数据读取完成后，将该第一细粒度区域的覆盖标志位设为可覆盖，rp++，第一操作当前所针对的第一细粒度区域为下一个细粒度区域，如果rp>end_addr，则rp＝start_addr；在第一细粒度区域与第二细粒度区域有重叠，即rp＝wp时，则不可执行第一操作，需等待第二操作完成对当前所针对的第二细粒度区域的操作后，可执行第一操作。

在本实施例中，将循环缓冲存取区域划分为多个细粒度区域，使得多个操作可同时对循环缓冲存储区域进行操作，从而提高处理器的处理效率。

在一种可能的实现方式中，所述细粒度区域可包括状态标识，所述状态标识可包括针对所述细粒度区域的操作处于已完成状态或未完成状态，

步骤S14d可包括：在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，判断所述第一细粒度区域的状态标识是否为已完成状态；若是，则执行所述第一操作。

在一种可能的实现方式中，细粒度区域可包括状态标识，状态标识可包括操作细粒度区域的已完成状态或未完成状态。例如，状态标识可使用0和1来表示，其中，0表示操作细粒度区域的未完成状态，1表示操作细粒度区域的已完成状态，或者0表示操作细粒度区域的已完成状态，1表示操作细粒度区域的未完成状态。本公开对状态标识的表示方式不作限制。

在一种可能的实现方式中，第二操作可将目标存储区域中已操作完成的细粒度区域的状态标识设置为已完成状态，未操作或正在操作的细粒度区域的状态标识设置为未完成状态。也可将已操作完成的细粒度区域中的部分细粒度区域的状态标识设置为已完成状态，其他细粒度区域设置为未完成状态。例如，第二操作已操作完成5个细粒度区域，可将前3个细粒度区域的状态标识设置为已完成状态，其他细粒度区域设置为未完成状态。

在一种可能的实现方式中，在存在正在进行的针对目标存储区域的第二操作时，对于第一操作当前所针对的第一细粒度区域与第二操作当前所针对的第二细粒度区域，可在确定第一细粒度区域与第二细粒度区域之间不重叠后，判断第一细粒度区域的状态标识是否为已完成状态；如果第一细粒度区域的状态标识为已完成状态，可执行第一操作。

在本实施例中，细粒度区域包括状态标识，在第一细粒度区域与第二细粒度区域之间不重叠时，根据第一细粒度区域的状态标识，确定第一操作是否可执行，可在提高处理器的处理效率的同时，提高数据处理的正确性。

步骤S14d可包括：判断所述第一细粒度区域的状态标识是否为已完成状态；若是，则在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

也就是说，在存在正在进行的针对目标存储区域的第二操作时，对于第一操作当前所针对的第一细粒度区域与第二操作当前所针对的第二细粒度区域，可在确定第一细粒度区域的状态标识为已完成状态后，根据第一细粒度区域与第二细粒度区域之间重叠关系，确定第一操作是否可执行。在第一细粒度区域与第二细粒度区域之间不重叠时，可执行第一操作。

在本实施例中，细粒度区域包括状态标识，可在确定第一细粒度区域的状态标识为已完成状态后，根据第一细粒度区域与第二细粒度区域之间重叠关系，确定第一操作是否可执行，可在提高数据处理的正确性同时，提高处理器的处理效率。

在一种可能的实现方式中，所述第二操作为针对所述描述符的操作。

也就是说，第二操作的操作数与第一操作的操作数相同，即第二操作与第一操作为针对同一个描述符的操作，第二操作的操作数的存储区域与目标存储区域完全重叠。可将描述符所指示的张量数据的目标存储区域划分为多个细粒度区域后，根据本公开实施例中的方法，可以使得操作相同描述符的两个操作并行执行而不影响各操作的执行结果。

在一种可能的实现方式中，在第二操作的操作数与第一操作的操作数相同时，可根据操作的执行进程来分别确定第一细粒度区域与第二细粒度区域。

在一种可能的实现方式中，当在针对目标存储区域的第一操作执行前，判断是否存在正在进行的针对目标存储区域的第二操作时，第一操作当前所针对的目标存储区域中的第一细粒度区域，为第一操作将要执行的目标存储区域中的细粒度区域。例如，在针对目标存储区域的第一操作执行前，第一操作当前所针对的目标存储区域中的第一细粒度区域通常为目标存储区域的第一个细粒度区域。此时，针对第一细粒度区域的第一操作还未执行。而正在进行的第二操作当前所针对的目标存储区域中的第二细粒度区域，可以与第二操作的执行进程相关。若第二操作也刚开始执行，则第二细粒度区域也可为目标存储区域的第一个细粒度区域。此时，第一细粒度区域与第二细粒度区域重叠。若第二操作已经完成第一个细粒度区域的操作，当前所针对的目标存储区域中的第二细粒度区域为第P个细粒度区域(P为大于1的整数)，则第一细粒度区域与第二细粒度区域不重叠。

在一种可能的实现方式中，当在第一操作针对目标存储区域的操作过程中，判断是否存在正在进行的针对目标存储区域的第二操作时，可根据第一操作的执行进程确定第一细粒度区域，根据第二操作的执行进程确定第二细粒度区域，进而判断第一细粒度区域与第二细粒度区域是否重叠。在第一细粒度区域与第二细粒度区域之间不重叠时，可执行第一操作。

在一种可能的实现方式中，若各操作执行过程的节拍一致，可只在针对目标存储区域的第一操作执行前，判断是否存在正在进行的针对目标存储区域的第二操作，并判断第一细粒度区域与第二细粒度区域是否重叠。其中，节拍一致是指在细粒度区域的尺寸相同的情况下，两个操作对于一个细粒度区域的操作时长相同。

在一种可能的实现方式中，若各操作执行过程的节拍不一致或不能确定是否一致，可在第一操作针对目标存储区域的操作过程中，每完成当前所针对的目标存储区域中的第一细粒度区域的操作后，再继续判断是否存在正在进行的针对目标操作区域的第二操作，以及继续判断第一细粒度区域与第二细粒度区域是否重叠，以确定第一操作是否可以继续执行。

在本实施例中，第二操作的操作数与第一操作的操作数相同时，可使用本公开实施例中的方法，实现针对同一个描述符的两个或多个操作的并行执行，或者根据各操作的执行进程来确定各操作当前所针对的细粒度区域，在第一细粒度区域与第二细粒度区域之间不重叠时，执行第一操作，使得针对同一个描述符的两个或多个操作可以并行执行而不影响各操作的执行效果，从而提高处理器的执行效率。

在一种可能的实现方式中，所述第二操作的操作数的存储区域与所述目标存储区域有重叠。

在一种可能的实现方式中，当第二操作的操作数的存储区域与目标存储区域有重叠，且第二操作正在进行针对重叠区域的操作时，可以将第二操作的操作数的存储区域与目标存储区域的分别划分为多个细粒度区域，或者将目标存储区域所在的整体存储区域划分为多个细粒度区域，然后根据本公开实施例中的方法，对重叠区域中的细粒度区域进行判断，确定是否可执行第一操作，从而可以使得操作数的存储区域有重叠区域的两个操作并行执行而不影响各操作的执行结果。

在一种可能的实现方式中，在第二操作为针对描述符的操作，且第二操作所针对的描述符与第一操作所针对的描述符不同时，可根据创建描述符时是否允许描述符所指示的张量数据的存储区域重叠，来确定第二操作的操作数的存储区域与目标存储区域是否可能重叠。

在一种可能的实现方式中，如果在创建描述符时，不允许描述符所指示的张量数据的存储区域重叠，则在第二操作所针对的描述符与第一操作所针对的描述符不同时，第二操作所针对的描述符所指示的张量数据的存储区域与目标存储区域不重叠，第一操作和第二操作的细粒度区域之间的不会重叠，不需要对针对不同描述符的操作进行细粒度区域的判断。

在一种可能的实现方式中，如果在创建描述符时，允许描述符所指示的张量数据的存储区域重叠，则在第二操作所针对的描述符与第一操作所针对的描述符不同时，第二操作所针对的描述符的存储区域可能与第一操作所针对的描述符所指示的目标存储区域存在重叠，此时，可以采用本公开实施例中的方法，使得针对具有重叠区域的不同描述符的两个操作可以并行执行。

在本实施例中，当第二操作的操作数的存储区域与目标存储区域有重叠时，可使用本公开实施例中的方法实现两个或多个操作的并行执行，从而提高处理器的执行效率。

在一种可能的实现方式中，所述方法还可包括：将目标存储区域所在的整体存储区域划分为多个细粒度区域。

在一种可能的实现方式中，目标存储区域可以为存储装置的整体存储区域中的部分存储区域或全部存储区域，所述整体存储区域包括预设的多个细粒度区域。

例如目标存储区域所在的整体存储区域为RAM1，RAM1可以包括预先设定m个细粒度区域(m为正整数)。目标存储区域在RAM1中可以占据RAM1中的n个细粒度区域(n为正整数，且n<＝m)。需要说明的是，目标存储区域也可以包括某细粒度区域中的部分区域。在如上示例的RAM1中，假设每个细粒度区域为整体存储区域RAM1中的一行，每行为100比特。目标存储区域可以包括前面(n-1)个完整的细粒度区域，并且又包括最后一个细粒度区域的部分区域，例如为RAM1中第n行(第n个细粒度区域)中的前80个比特。

在一种可能的实现方式中，当将存储装置的整体存储区域划分为多个细粒度区域时，针对整体存储区域中任意目标存储区域的任意操作，且无论是第一操作所针对的描述符所指示的张量数据的目标存储区域，还是第二操作的操作数的存储区域与目标存储区域的重叠区域，都可以根据整体存储区域的细粒度划分结果，确定目标存储区域或重叠区域中的细粒度区域。任意操作的任意操作数在整体存储区域的中存储区域，具有相同尺寸的细粒度区域。

在一种可能的实现方式中，可以根据存储装置的硬件特性，确定整体存储区域的细粒度区域的尺寸和/或数量，即可以根据存储装置的硬件计算能力、硬件带宽中的至少一种，确定整体存储区域的细粒度区域的尺寸和/或数量。

在本实施例中，将目标存储区域所在的整体存储区域划分为多个细粒度区域，针对整体存储区域中任意目标存储区域的任意操作，都可以按照相同的细粒度尺寸执行，不同操作按照本公开实施例中的方法并行时，可以更加方便地同步，提高操作并行度，进而提高处理器的处理效率。

在一种可能的实现方式中，所述方法还可包括：

根据第一操作中携带的第一细粒度划分信息，将所述目标存储区域划分为多个细粒度区域，及

根据第二操作中携带的第二细粒度划分信息，将所述第二操作的操作数的存储区域划分为多个细粒度区域。

在一种可能的实现方式中，可以在操作中携带细粒度划分信息，细粒度划分信息可以包括细粒度的尺寸和/或数量。不同的操作可以携带不同的细粒度划分信息。相同类型的操作可携带相同的细粒度划分信息。可在操作中操作数的设定位置携带细粒度划分信息，也可在操作码或操作数中携带是否进行细粒度划分的标识信息。本公开对细粒度划分信息中的内容及表现方式不做限定。

在一种可能的实现方式中，根据第一操作中携带的第一细粒度划分信息，将目标存储区域划分为多个第一细粒度区域。第一操作所针对的描述符指示的张量数据所在的整体存储区域中的其他区域，可不进行细粒度的划分，也可按照其他操作携带的细粒度划分信息，进行细粒度的划分。本公开对此不做限定。

可以理解的是，当第二操作的操作数与第一操作所针对的描述符所指示的张量数据一致时，第二操作的操作数的存储区域与目标存储区域完全重叠。而第一细粒度划分信息和第二细粒度划分信息可以一致，也可以不一致。当第一细粒度划分信息和第二细粒度划分信息不一致时，目标存储区域可同时按照第二细粒度划分信息进行细粒度划分。即，针对目标存储区域，不同的操作可以将其划分为不同尺寸或数量的多个细粒度区域。此时，可根据第一操作当前所针对的目标存储区域中的第一细粒度区域的物理地址，以及第二操作当前所述针对的目标存储区域中的第二细粒度区域之间的物理地址，判断第一细粒度区域与第二细粒度区域是否重叠，并根据判断结果进行第一操作和第二操作的并行执行。

在一种可能的实现方式中，各操作中携带的细粒度划分信息，可包括根据设定长度的操作数据所在区域、设定维数的操作数所在区域中的至少一种，确定出的所述细粒度区域的尺寸和/或数量，使得细粒度的划分结果更加符合操作中操作数的类型或属性。

在本实施例中，根据第一操作中携带的第一细粒度划分信息，将目标存储区域划分为多个细粒度区域，及根据第二操作中携带的第二细粒度划分信息，将第二操作的操作数的存储区域划分为多个细粒度区域。根据操作中携带的细粒度划分信息进行细粒度的划分，可使得细粒度的划分结果，更加符合各操作的处理需求，操作并行更加灵活。

应当理解，本领域技术人员可以根据实际情况将目标存储区域进行细粒度区域的划分与设置，本公开对此不作限制。

在一种可能的实现方式中，所述描述符可用于指示N维的张量数据的形状，N为大于或等于零的整数，其中，所述描述符的内容可包括表示张量数据的形状的至少一个形状参数。

在一种可能的实现方式中，描述符可用于指示N维的张量数据的形状。其中，N的取值可根据张量数据的维数(阶数)来确定，也可以根据张量数据的使用需要进行设定。例如，张量数据为三维数据，N的取值可以为3(根据维数来确定)，描述符可用来指示该张量数据在三个维度方向上的形状(例如偏移量、尺寸等)。应当理解，本领域技术人员可以根据实际需要对N的取值进行设置，本公开对此不作限制。

在一种可能的实现方式中，描述符可包括标识和内容等，描述符的标识可用于对描述符进行区分，例如为编号；描述符的内容可包括表示张量数据的形状的至少一个形状参数(例如张量的各个维度方向上的尺寸等)。本公开对描述符的内容包括的具体形状参数不作限制。

在本实施例中，能够使用描述符来指示张量数据的形状，通过描述符指示的张量数据的形状，可确定多个张量数据之间的相互关系，从而提高处理器的存取效率。

在一种可能的实现方式中，描述符的标识和内容可存储在描述符存储空间中，该描述符存储空间可以为控制单元的内部存储器(例如寄存器、片上的SRAM或其他介质缓存等)中的存储空间。描述符所指示的张量数据的目标存储区域可以为所述控制单元的内部存储器(例如片上缓存)或与所述控制单元连接的外部存储器(片下存储器)中的存储空间。目标存储区域中的数据地址可以为实际的物理地址或虚拟地址。本公开对描述符存储空间及目标存储区域的位置以及数据地址的类型不作限制。

在一种可能的实现方式中，描述符的标识、内容以及描述符所指示的张量数据可以分别存储在内部存储器的不同区域，例如，可以将寄存器作为描述符存储空间，在寄存器中存储描述符的标识及内容，将片上缓存作为整体存储区域，存储描述符所指示的张量数据。

在一种可能的实现方式中，与描述符的标识对应的存储区域的数据地址可以是固定地址。例如，可以为张量数据划分单独的存储区域，每个张量数据在存储区域的起始地址与描述符的标识一一对应。在这种情况下，根据描述符的标识及对应关系，可直接确定描述符所指示的张量数据的目标存储区域。

在一种可能的实现方式中，所述描述符还可用于指示N维的张量数据的地址，其中，所述描述符的内容还可包括表示张量数据的地址的至少一个地址参数。

在一种可能的实现方式中，描述符还可用于指示N维的张量数据的地址，其中，地址可以是例如张量数据的起始地址、地址偏移量、寄存器地址或其他地址，本公开对地址类型不作限制。例如，地址可以为张量数据的起始地址，在与描述符的标识对应的存储区域的数据地址为固定地址时，描述符所指示的N维张量数据的起始地址为固定地址；在与描述符的标识对应的存储区域的数据地址为可变地址时，描述符所指示的N维张量数据的起始地址可根据其具体存储区域来确定。本公开对此不作限制。

在一种可能的实现方式中，描述符的内容还可包括表示张量数据的地址的至少一个地址参数。举例来说，张量数据为3维数据，可以使用描述符来指示该张量数据的地址，描述符的内容可包括表示该张量数据的地址的一个地址参数(例如张量数据的起始地址)，也可以包括该张量数据的地址的多个地址参数(例如张量数据的起始地址+地址偏移量，或张量数据基于各维度的地址参数)。本领域技术人员可以根据实际需要对地址参数进行设置，本公开对此不作限制。

在本实施例中，能够使用描述符来指示张量数据的地址，通过描述符指示的张量数据的地址，可确定多个张量数据之间的相互关系，从而提高处理器的存取效率。

在一种可能的实现方式中，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据所在的整体存储区域中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

所述张量数据所在的整体存储区域在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置、所述描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系。

在一种可能的实现方式中，张量数据的地址参数包括描述符的数据基准点在张量数据所在的整体存储区域中的基准地址。其中，基准地址可根据数据基准点的变化而不同。本公开对数据基准点的选取不作限制。

在一种可能的实现方式中，基准地址可包括整体存储区域的起始地址。在描述符的数据基准点是整体存储区域的第一个数据块时，描述符的基准地址即为整体存储区域的起始地址。在描述符的数据基准点是整体存储区域中第一个数据块以外的其他数据时，描述符的基准地址即为该数据块在整体存储区域中的物理地址。

在一种可能的实现方式中，张量数据的形状参数包括以下至少一种：张量数据所在的整体存储区域在N个维度方向的至少一个方向上的尺寸、张量数据的存储区域在N个维度方向的至少一个方向上的尺寸、张量数据的存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置、描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系。其中，数据描述位置是描述符所指示的张量数据中的点或区域的映射位置，例如，张量数据为3维数据时，描述符可使用三维空间坐标(x，y，z)来表示该张量数据的形状，该张量数据的数据描述位置可以是使用三维空间坐标(x，y，z)表示的、该张量数据映射在三维空间中的点或区域的位置。

如图2所示，整体存储区域21采用行优先的方式存储了一个二维数据，可通过(x，y)来表示(其中，X轴水平向右，Y轴垂直向下)，X轴方向上的尺寸(每行的尺寸)为ori_x(图中未示出)，Y轴方向上的尺寸(总行数)为ori_y(图中未示出)，整体存储区域21的起始地址PA_start(基准地址)为第一个数据块22的物理地址。数据块23是整体存储区域21中的张量数据，其在X轴方向上的偏移量25表示为offset_x，在Y轴方向上的偏移量24表示为offset_y，在X轴方向上的尺寸表示为size_x，在Y轴方向上的尺寸表示为size_y。

在一种可能的实现方式中，使用描述符来定义数据块23时，描述符的数据基准点可使用整体存储区域21的第一个数据块，描述符的基准地址为整体存储区域21的起始地址PA_start，然后可以结合整体存储区域21在X轴的尺寸ori_x、在Y轴上的尺寸ori_y，以及数据块23在Y轴方向的偏移量offset_y、X轴方向上的偏移量offset_x、X轴方向上的尺寸size_x以及Y轴方向上的尺寸size_y来确定数据块23的描述符的内容。

在一种可能的实现方式中，可根据描述符的数据基准点在整体存储区域中的基准地址、处于N个维度方向的对角位置的至少两个顶点相对于数据基准点的位置，确定所述张量数据的描述符的内容。

举例来说，可以使用描述符的数据基准点在整体存储区域中的基准地址PA_base，以及对角位置的两个顶点相对于数据基准点的位置，确定出图2中数据块23的描述符的内容。首先，确定描述符的数据基准点以及其在整体存储区域中的基准地址PA_base，例如，可以在整体存储区域21中选取一个数据(例如，位置为(2，2)的数据)作为数据基准点，将该数据在整体存储区域21中的物理地址作为基准地址PA_base；然后，确定数据块23的对角位置的至少两个顶点相对于数据基准点的位置，例如，使用左上至右下方向的对角位置顶点相对于数据基准点的位置，其中，左上角顶点的相对位置为(x_min，y_min)，右下角顶点的相对位置为(x_max，y_max)，然后可以根据基准地址PA_base、左上角顶点的相对位置(x_min，y_min)以及右下角顶点的相对位置(x_max，y_max)确定出数据块73的描述符的内容。

在一种可能的实现方式中，可根据描述符的数据基准点在整体存储区域中的基准地址，以及描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系，确定所述张量数据的描述符的内容。其中，数据描述位置与数据地址之间的映射关系可以根据实际需要进行设定，例如，描述符所指示的张量数据为三维空间数据时，可是使用函数f(x，y，z)来定义数据描述位置与数据地址之间的映射关系。

在本实施例中，能够使用张量数据的基准地址和至少一个形状参考来确定描述符的内容，从而可根据各操作的处理需要使用不同的描述符。

在一种可能的实现方式中，根据描述符的标识，可确定描述符在描述符存储空间中的位置，进而从描述符存储空间中获取描述符的内容；然后可根据描述符的内容，确定描述符所指示的张量数据在整体存储区域中的数据地址。其中，数据地址的计算可通过硬件自动完成或通过软件方式实现。在描述符的内容的不同时，描述符所指示的张量数据在整体存储区域中的数据地址的计算方式也可以不同。

举例来说，在采用公式(1)表示描述符的内容的情况下，描述符所指示的张量数据在整体存储区域中的偏移量分别为offset_x和offset_y，尺寸为size_x*size_y，那么，该描述符所指示的张量数据在整体存储区域中的起始数据地址PA1 _(x,y)可以使用下述公式(4)来确定：

PA1 _(x,y)＝PA_start+(offset_y-1)*ori_x+offset_x (4)

对于描述符所指示的张量数据中的任意一个数据点，设其数据描述位置为(x _q，y _q)，那么，该数据点在整体存储区域中的数据地址PA2 _(x,y)可以使用下述公式(5)来确定：

PA2 _(x,y)＝PA_start+(offset_y+y _q-1)*ori_x+(offset_x+x _q) (5)

应当理解，本领域技术人员可以根据实际情况确定数据地址的计算方法，本公开对此不作限制。

在本实施例中，能够根据描述符的标识，获取描述符的内容；并根据描述符的内容，可确定描述符所指示的张量数据在整体存储区域中的数据地址；根据数据地址，可确定描述符所指示的张量数据的目标存储区域。通过这种方式，可在数据存取过程中使用描述符，从而可降低数据存取的复杂度，提高处理器的处理效率。

需要说明的是，尽管以上述实施例作为示例介绍了处理器操作方法如上，但本领域技术人员能够理解，本公开应不限于此。事实上，用户完全可根据个人喜好和/或实际应用场景灵活设定各步骤，只要符合本公开的技术方案即可。

图3d示出根据本公开实施例的处理器操作装置的框图。如图3d所示，所述处理器操作装置包括：

区域确定模块81，用于在第一操作为针对描述符的操作时，获取所述描述符所指示的张量数据的目标存储区域；

操作判断模块82，用于判断是否存在正在进行的针对所述目标存储区域的第二操作；

重叠判断模块83，用于在存在所述第二操作时，判断所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域与所述第二操作当前所针对的所述目标存储区域中的第二细粒度区域之间是否有重叠；

执行模块84，用于在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

在一种可能的实现方式中，所述装置还包括：执行控制模块，用于在所述第一细粒度区域与所述第二细粒度区域有重叠时，阻塞所述第一操作。

在一种可能的实现方式中，所述第一操作和所述第二操作中的至少一个操作为写操作。

在一种可能的实现方式中，所述细粒度区域的尺寸和/或数量是根据设定长度的数据所在区域、设定维数的数据所在区域中的至少一种确定的。

在一种可能的实现方式中，所述细粒度区域的尺寸和/或数量是根据硬件计算能力、硬件带宽中的至少一种确定的。

在一种可能的实现方式中，所述第一操作为第一处理指令中的操作，所述第二操作为第二处理指令中的操作，所述第二处理指令为指令队列中在所述第一处理指令之前的处理指令。

在一种可能的实现方式中，所述装置还包括：位置记录模块，用于记录所述第一操作当前操作的第一细粒度区域的第一位置信息和所述第二操作当前操作的第二细粒度区域的第二位置信息，

所述执行模块84，包括：第一执行子模块，用于当所述第一位置信息与所述第二位置信息不一致时，执行所述第一操作。

在一种可能的实现方式中，所述第一位置信息包括第一操作已操作完成的细粒度区域的第一数量，所述第二位置信息包括第二操作已操作完成的细粒度区域的第二数量，

所述第一执行子模块，还用于：当所述第一操作为所述第二操作之后的操作，且所述第一数量小于所述第二数量时，执行所述第一操作。

在一种可能的实现方式中，所述目标存储区域包括可操作区域和非可操作区域，所述重叠判断模块83，包括：判断子模块，用于在存在所述第二操作，且所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域位于所述可操作区域内时，判断所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域与所述第二操作当前所针对的所述目标存储区域中的第二细粒度区域之间是否重叠。

在一种可能的实现方式中，所述非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域在所述非可操作区域内的位置随所述第二操作的操作位置更新，所述装置还包括：更新模块，用于当所述第二操作所针对的所述目标存储区域中的第二细粒度区域移出所述非可操作区域后，更新所述非可操作区域的位置。

在一种可能的实现方式中，所述非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域位于所述非可操作区域内的设定位置，所述非可操作区域的位置随所述第二操作的操作位置更新。

在一种可能的实现方式中，所述目标存储区域包括：循环缓冲存储区域。

在一种可能的实现方式中，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态，所述执行模块84，包括：

第一状态判断子模块，用于在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，判断所述第一细粒度区域的状态标识是否为已完成状态；

第二执行子模块，用于在所述第一细粒度区域的状态标识为已完成状态时，执行所述第一操作。

第二状态判断子模块，用于判断所述第一细粒度区域的状态标识是否为已完成状态；

第三执行子模块，用于在所述第一细粒度区域的状态标识为已完成状态，且所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

在一种可能的实现方式中，所述装置还包括：第一设定模块，用于将目标存储区域所在的整体存储区域划分为多个细粒度区域。

在一种可能的实现方式中，所述装置还包括：

第二设定模块，用于根据第一操作中携带的第一细粒度划分信息，将所述目标存储区域划分为多个细粒度区域，及

第三设定模块，用于根据第二操作中携带的第二细粒度划分信息，将所述第二操作的操作数的存储区域划分为多个细粒度区域。

在一种可能的实现方式中，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据所在的整体存储区域中的基准地址；其中，所述张量数据的形状参数包括以下至少一种：所述张量数据所在的整体存储区域在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置、所述描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系。

在一种可能的实现方式中，还公开了一种人工智能芯片，其包括了上述处理器操作装置。

在一种可能的实现方式中，所述存储器件包括：多组存储单元，每一组所述存储单元与所述人工智能芯片通过总线连接，所述存储单元为：DDR SDRAM；所述芯片包括：DDR控制器，用于对每个所述存储单元的数据传输与数据存储的控制；所述接口装置为：标准PCIE接口。

A1、一种处理器操作方法，所述方法包括：

在第一操作为针对描述符的操作时，获取所述描述符所指示的张量数据的目标存储区域；

判断是否存在正在进行的针对所述目标存储区域的第二操作；

在存在所述第二操作时，判断所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域与所述第二操作当前所针对的所述目标存储区域中的第二细粒度区域之间是否有重叠；

在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

A2、根据权利要求A1所述的方法，所述方法还包括：

在所述第一细粒度区域与所述第二细粒度区域有重叠时，阻塞所述第一操作。

A3、根据权利要求A1所述的方法，所述第一操作和所述第二操作中的至少一个操作为写操作。

A4、根据权利要求A1所述的方法，所述细粒度区域的尺寸和/或数量是根据设定长度的数据所在区域、设定维数的数据所在区域中的至少一种确定的。

A5、根据权利要求A1所述的方法，所述细粒度区域的尺寸和/或数量是根据硬件计算能力、硬件带宽中的至少一种确定的。

A6、根据权利要求A1所述的方法，所述第一操作为第一处理指令中的操作，所述第二操作为第二处理指令中的操作，所述第二处理指令为指令队列中在所述第一处理指令之前的处理指令。

记录所述第一操作当前操作的第一细粒度区域的第一位置信息和所述第二操作当前操作的第二细粒度区域的第二位置信息，

在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作，包括：

当所述第一位置信息与所述第二位置信息不一致时，执行所述第一操作。

A8、根据权利要求A7所述的方法，所述第一位置信息包括第一操作已操作完成的细粒度区域的第一数量，所述第二位置信息包括第二操作已操作完成的细粒度区域的第二数量，

当所述第一位置信息与所述第二位置信息不一致时，执行所述第一操作，包括：

当所述第一操作为所述第二操作之后的操作，且所述第一数量小于所述第二数量时，执行所述第一操作。

A9、根据权利要求A1所述的方法，所述目标存储区域包括可操作区域和非可操作区域，在存在所述第二操作时，判断所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域与所述第二操作当前所针对的所述目标存储区域中的第二细粒度区域之间是否重叠，包括：

在存在所述第二操作，且所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域位于所述可操作区域内时，判断所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域与所述第二操作当前所针对的所述目标存储区域中的第二细粒度区域之间是否重叠。

A10、根据权利要求A9所述的方法，所述非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域在所述非可操作区域内的位置随所述第二操作的操作位置更新，所述方法还包括：

当所述第二操作所针对的所述目标存储区域中的第二细粒度区域移出所述非可操作区域后，更新所述非可操作区域的位置。

A11、根据权利要求A9所述的方法，所述非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域位于所述非可操作区域内的设定位置，

所述非可操作区域的位置随所述第二操作的操作位置更新。

A12、根据权利要求A1所述的方法，所述目标存储区域包括：循环缓冲存储区域。

A13、根据权利要求A1所述的方法，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态，

在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，判断所述第一细粒度区域的状态标识是否为已完成状态；

若是，则执行所述第一操作。

A14、根据权利要求A1所述的方法，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态，

判断所述第一细粒度区域的状态标识是否为已完成状态；

若是，则在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

A15、根据权利要求A1所述的方法，所述第二操作为针对所述描述符的操作。

A16、根据权利要求A1所述的方法，所述第二操作的操作数的存储区域与所述目标存储区域有重叠。

A17、根据权利要求A1-A16中任意一项所述的方法，所述方法还包括：

将目标存储区域所在的整体存储区域划分为多个细粒度区域。

A18、根据权利要求A1-A17中任意一项所述的方法，所述方法还包括：

A19、根据权利要求A1所述的方法，所述描述符用于指示N维的张量数据的形状，N为大于或等于零的整数，

A20、根据权利要求A19所述的方法，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A21、根据权利要求A20所述的方法，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据所在的整体存储区域中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

A22、一种处理器操作装置，所述装置包括：

区域确定模块，用于在第一操作为针对描述符的操作时，获取所述描述符所指示的张量数据的目标存储区域；

操作判断模块，用于判断是否存在正在进行的针对所述目标存储区域的第二操作；

重叠判断模块，用于在存在所述第二操作时，判断所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域与所述第二操作当前所针对的所述目标存储区域中的第二细粒度区域之间是否有重叠；

执行模块，用于在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

A23、根据权利要求A22所述的装置，所述装置还包括：

执行控制模块，用于在所述第一细粒度区域与所述第二细粒度区域有重叠时，阻塞所述第一操作。

A24、根据权利要求A22所述的装置，所述第一操作和所述第二操作中的至少一个操作为写操作。

A25、根据权利要求A22所述的装置，所述细粒度区域的尺寸和/或数量是根据设定长度的数据所在区域、设定维数的数据所在区域中的至少一种确定的。

A26、根据权利要求A22所述的装置，所述细粒度区域的尺寸和/或数量是根据硬件计算能力、硬件带宽中的至少一种确定的。

A27、根据权利要求A22所述的方装置，所述第一操作为第一处理指令中的操作，所述第二操作为第二处理指令中的操作，所述第二处理指令为指令队列中在所述第一处理指令之前的处理指令。

A28、根据权利要求A22-A27中任意一项所述的装置，所述装置还包括：

位置记录模块，用于记录所述第一操作当前操作的第一细粒度区域的第一位置信息和所述第二操作当前操作的第二细粒度区域的第二位置信息，

所述执行模块，包括：

第一执行子模块，用于当所述第一位置信息与所述第二位置信息不一致时，执行所述第一操作。

A29、根据权利要求A28所述的装置，所述第一位置信息包括第一操作已操作完成的细粒度区域的第一数量，所述第二位置信息包括第二操作已操作完成的细粒度区域的第二数量，

所述第一执行子模块，还用于：

A30、根据权利要求A22所述的装置，所述目标存储区域包括可操作区域和非可操作区域，所述重叠判断模块，包括：

判断子模块，用于在存在所述第二操作，且所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域位于所述可操作区域内时，判断所述第一操作当前所针对的所述目标存储区域中的第一细粒度区域与所述第二操作当前所针对的所述目标存储区域中的第二细粒度区域之间是否重叠。

A31、根据权利要求A30所述的装置，所述非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域在所述非可操作区域内的位置随所述第二操作的操作位置更新，所述装置还包括：

更新模块，用于当所述第二操作所针对的所述目标存储区域中的第二细粒度区域移出所述非可操作区域后，更新所述非可操作区域的位置。

A32、根据权利要求A30所述的装置，所述非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域位于所述非可操作区域内的设定位置，

所述非可操作区域的位置随所述第二操作的操作位置更新。

A33、根据权利要求A22所述的装置，所述目标存储区域包括：循环缓冲存储区域。

A34、根据权利要求A22所述的装置，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态，

所述执行模块，包括：

A35、根据权利要求A22所述的装置，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态，

所述执行模块，包括：

A36、根据权利要求A22所述的装置，所述第二操作为针对所述描述符的操作。

A37、根据权利要求A22所述的装置，所述第二操作的操作数的存储区域与所述目标存储区域有重叠。

A38、根据权利要求A22-A37中任意一项所述的装置，所述装置还包括：

第一设定模块，用于将目标存储区域所在的整体存储区域划分为多个细粒度区域。

A39、根据权利要求A22-A37中任意一项所述的装置，所述装置还包括：

A40、根据权利要求A22所述的装置，所述描述符用于指示N维的张量数据的形状，N为大于或等于零的整数，

A41、根据权利要求A40所述的装置，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A42、根据权利要求A41所述的装置，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据所在的整体存储区域中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

A43、一种人工智能芯片，所述芯片包括如权利要求A22-A42中任意一项所述的处理器操作装置。

A44、一种电子设备，所述电子设备包括如权利要求A43所述的人工智能芯片。

A45、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如权利要求A43所述的人工智能芯片；

所述存储器件，用于存储数据；

所述控制器件，用于对所述人工智能芯片的状态进行监控。

A46、根据权利要求A45所述的板卡，所述存储器件包括：多组存储单元，每一组所述存储单元与所述人工智能芯片通过总线连接，所述存储单元为：DDR SDRAM；

所述接口装置为：标准PCIE接口。

根据本公开的实施例，提供了一种数据同步方法。图1e示出根据本公开实施例的数据同步方法的流程图。该数据同步方法可应用于处理器中，该处理器可包括通用处理器(例如中央处理器CPU、图形处理器GPU)和专用处理器(例如人工智能处理器、科学计算处理器或数字信号处理器等)。本公开对处理器的类型不作限制。

如图1e所示，该数据同步方法包括：

在步骤S11e中，在解码后的处理指令为描述符同步指令时，获取所述处理指令中的描述符的同步信息，所述描述符用于指示待同步的张量数据的形状；

在步骤S12e中，根据所述同步信息，执行所述处理指令。

通过采用描述符来指示张量数据的方式，能够表达张量数据的形状，进而也能够确定多个张量数据之间的相互关系等相关信息，提高对张量数据的存取效率，从而降低数据同步时的复杂度。

在数据处理过程中，可能需要对当前的处理器A1(例如人工智能芯片中的处理器核)中的张量数据进行数据同步，例如将另一个处理器A0中的一项运算的运算结果同步到处理器A1中做为另一项运算的输入数据。在该情况下，可以采用描述符同步指令实现数据同步。也即，当存在待同步的张量数据时，同步数据的发送方(例如另一个处理器A0)可以向处理器A1发送描述符同步指令，以指示当前的处理器A1进行数据同步。

在一种可能的实现方式中，在步骤S11e之前，所述方法还包括：

对接收到的处理指令进行解码，得到解码后的处理指令，

其中，所述解码后的处理指令包括操作码，所述操作码用于指示进行同步处理。

举例来说，当前的处理器A1在接收到处理指令时，可以对处理指令进行解码(解析)，得到解码后的处理指令。该解码后的处理指令可至少包括操作码和操作数，操作码用于指示与所述处理指令对应的处理类型，操作数用于指示待处理的数据。处理指令可包括数据存取指令、运算指令、描述符管理指令以及同步指令等。本公开对处理指令的具体类型及解码的具体方式不作限制。

在一种可能的实现方式中，如果解码后的处理指令的操作码指示进行描述符同步处理，则可确定该处理指令为描述符同步指令。在解码后的处理指令为描述符同步指令时，处理器可在步骤S11e中获取所述处理指令中的描述符的同步信息，以便对描述符所指示的待同步的张量数据进行同步。

在一种可能的实现方式中，描述符的同步信息可例如包括所述描述符的标识及所述描述符的内容中的至少一种。如果处理器中已注册有指示该待同步的张量数据的描述符且无需修改，则描述符同步指令中的同步信息可仅包括描述符的标识(例如在描述符的标识为TR1时，将描述符同步指令表示为Send TR1)，处理器可根据处理指令中的该描述符的标识(TR1)实现张量数据的同步；如果处理器中未注册指示该待同步的张量数据的描述符，则描述符同步指令中的同步信息可包括描述符的内容，处理器可根据处理指令中的描述符内容实现张量数据的同步；如果处理器中已注册有指示该待同步的张量数据的描述符但需要修改描述符的内容，则描述符同步指令中的同步信息可同时包括描述符的标识和内容两者，处理器可根据处理指令中的描述符标识和内容实现张量数据的同步。本公开对描述符的同步信息所包括的具体内容不作限制。

在一种可能的实现方式中，在得到描述符同步指令的同步信息后，处理器可在步骤S12e中根据同步信息执行该处理指令(描述符同步指令)，以实现张量数据的同步。

根据本公开实施例的数据同步方法，通过设定指示张量数据的形状的描述符，能够在解码后的处理指令为描述符同步指令时，获取处理指令中的描述符的同步信息，并根据描述符的同步信息执行指令以实现张量数据的同步，从而减少同步开销，提高数据同步的效率。

在一种可能的实现方式中，步骤S12e可包括：

在所述描述符所指示的张量数据的存储区域处于共用存储空间中时，根据所述同步信息，从所述共用存储空间中获取所述张量数据。

举例来说，多个处理器(多个核)可以具有共用存储空间，例如处理器A0和处理器A1均可以访问的片下存储器。该共用存储空间可以是多个核(多个处理器)均能够存取数据的存储空间，也可以是部分核(部分处理器)能够存取数据的存储空间，可以预先设定有核间的共用存储空间，本公开对共用存储空间的设定方式不作限制。

在一种可能的实现方式中，如果待同步的张量数据的存储地址处于共用存储空间中，则由于当前的处理器A1也可从共用存储空间存取数据，处理器A1根据描述符的内容就可以直接读取张量数据以实现同步。

在一种可能的实现方式中，如果描述符同步请求指令中的同步信息仅包括描述符的标识，例如描述符的标识为TR1，描述符同步请求指令表示为Send TR1，则处理器A1可内部查找该描述符的标识对应的描述符内容，进而根据描述符内容从共用存储空间中获取待同步的张量数据，从而实现整个同步过程。

在一种可能的实现方式中，如果该描述符同步指令中的同步信息包括描述符的标识和内容，则处理器A1可查找该描述符的标识对应的描述符，并根据描述符同步指令中的描述符内容，更新原来的描述符内容；进而根据更新后的描述符内容从共用存储空间中获取待同步的张量数据，从而实现张量数据的同步。

在一种可能的实现方式中，如果该描述符同步指令中的同步信息仅包括描述符的内容，则处理器A1可根据描述符的内容，注册指示该待同步的张量数据的描述符，并根据描述符的内容从共用存储空间中获取待同步的张量数据，从而实现张量数据的同步。

通过这种方式，能够根据描述符同步指令中的描述符的同步信息，获取描述符所指示的待同步的张量数据，实现张量数据的同步，从而避免不必要的数据传输，减少张量数据存取次数，提高同步的处理效率。

在一种可能的实现方式中，多个处理器(多个核)可以具有同步数据存储空间，专门用于存储同步数据。该同步数据存储空间可以是上述的共用存储空间，也可以是共用存储空间的一部分，还可以是与共用存储空间不同的存储空间，本公开对此不作限制。

在一种可能的实现方式中，同步数据存储空间可是多个核(多个处理器)均能够存取同步数据的存储空间，也可以是部分核(部分处理器)能够存取同步数据的存储空间，本公开对此不作限制。

在一种可能的实现方式中，如果该描述符同步指令中的同步信息包括待同步的张量数据的描述符的内容在同步数据存储空间中的地址，则处理器A1可根据该地址，从同步数据存储空间获取待同步的张量数据的描述符的内容，根据描述符的内容注册描述符并确定待同步的张量数据的数据地址，进而获取所述待同步的张量数据，从而实现整个同步过程。

在一种可能的实现方式中，所述张量数据的形状参数包括以下至少一种：所述张量数据的数据存储空间在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置、所述描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系。其中，数据描述位置是描述符所指示的张量数据中的点或区域的映射位置，例如，张量数据为3维数据时，描述符可使用三维空间坐标(x，y，z)来表示该张量数据的形状，该张量数据的数据描述位置可以是使用三维空间坐标(x，y，z)表示的、该张量数据映射在三维空间中的点或区域的位置。

图2示出根据本公开一实施例的数据存储空间的示意图。如图2所示，数据存储空间21采用行优先的方式存储了一个二维数据，可通过(x，y)来表示(其中，X轴水平向右，Y轴垂直向下)，X轴方向上的尺寸(每行的尺寸)为ori_x (图中未示出)，Y轴方向上的尺寸(总行数)为ori_y(图中未示出)，数据存储空间21的起始地址PA_start(基准地址)为第一个数据块22的物理地址。数据块23是数据存储空间21中的部分数据，其在X轴方向上的偏移量25表示为offset_x，在Y轴方向上的偏移量24表示为offset_y，在X轴方向上的尺寸表示为size_x，在Y轴方向上的尺寸表示为size_y。

PA2 _(x,y)＝PA_start+(offset_y+y _q-1)*ori_x+(offset_x+x _q) (4)

图3e示出根据本公开实施例的数据同步装置的框图。该数据同步装置可应用于处理器，如图3e所示，该数据同步装置包括：

同步信息获取模块31e，用于在解码后的处理指令为描述符同步指令时，获取所述处理指令中的描述符的同步信息，所述描述符用于指示待同步的张量数据的形状；

指令执行模块32e，用于根据所述同步信息，执行所述处理指令。

在一种可能的实现方式中，所述同步信息包括以下至少一种：所述描述符的标识及所述描述符的内容。

在一种可能的实现方式中，所述指令执行模块包括：数据获取子模块，用于在所述描述符所指示的张量数据的存储区域处于共用存储空间中时，根据所述同步信息，从所述共用存储空间中获取所述张量数据。

在一种可能的实现方式中，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址。

在一种可能的实现方式中，所述张量数据的形状参数包括以下至少一种：

在一种可能的实现方式中，所述装置还包括：解码模块，用于对接收到的处理指令进行解码，得到解码后的处理指令，其中，所述解码后的处理指令包括操作码，所述操作码用于指示进行同步处理。

A1、一种数据同步方法，所述方法包括：

在解码后的处理指令为描述符同步指令时，获取所述处理指令中的描述符的同步信息，所述描述符用于指示待同步的张量数据的形状；

根据所述同步信息，执行所述处理指令。

A2、根据权利要求A1所述的方法，所述同步信息包括以下至少一种：所述描述符的标识及所述描述符的内容。

A3、根据权利要求A1或A2所述的方法，根据所述同步信息，执行所述处理指令，包括：

A4、根据权利要求A1-A3中任意一项所述的方法，所述描述符用于指示N维的张量数据的形状，N为大于或等于零的整数，

A5、根据权利要求A4所述的方法，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A6、根据权利要求A5所述的方法，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址。

A7、根据权利要求A6所述的方法，所述张量数据的形状参数包括以下至少一种：

A8、根据权利要求A1-A7中任意一项所述的方法，所述方法还包括：

对接收到的处理指令进行解码，得到解码后的处理指令，

A9、一种数据同步装置，所述装置包括：

同步信息获取模块，用于在解码后的处理指令为描述符同步指令时，获取所述处理指令中的描述符的同步信息，所述描述符用于指示待同步的张量数据的形状；

指令执行模块，用于根据所述同步信息，执行所述处理指令。

A10、根据权利要求A9所述的装置，所述同步信息包括以下至少一种：所述描述符的标识及所述描述符的内容。

A11、根据权利要求A9或A10所述的装置，所述指令执行模块包括：

数据获取子模块，用于在所述描述符所指示的张量数据的存储区域处于共用存储空间中时，根据所述同步信息，从所述共用存储空间中获取所述张量数据。

A12、根据权利要求A9-A11中任意一项所述的装置，所述描述符用于指示N维的张量数据的形状，N为大于或等于零的整数，

A13、根据权利要求A12所述的装置，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A14、根据权利要求A13所述的装置，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址。

A15、根据权利要求A14所述的装置，所述张量数据的形状参数包括以下至少一种：

A16、根据权利要求A9-A15中任意一项所述的装置，所述装置还包括：

解码模块，用于对接收到的处理指令进行解码，得到解码后的处理指令，

A17、一种人工智能芯片，所述芯片包括如权利要求A9-A16中任意一项所述的数据同步装置。

A18、一种电子设备，所述电子设备包括如权利要求A17所述的人工智能芯片。

A19、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如权利要求17所述的人工智能芯片；其中，所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；所述存储器件，用于存储数据；所述接口装置，用于实现所述人工智能芯片与外部设备之间的数据传输；所述控制器件，用于对所述人工智能芯片的状态进行监控。

A20、根据权利要求A19所述的板卡，

所述存储器件包括：多组存储单元，每一组所述存储单元与所述人工智能芯片通过总线连接，所述存储单元为：DDR SDRAM；

所述芯片包括：DDR控制器，用于对每个所述存储单元的数据传输与数据存储的控制；所述接口装置为：标准PCIE接口。

随着人工智能技术的不断发展，需要处理的数据量和数据维度都在不断增大。在相关技术中，处理器通常通过获取指令的参数来确定数据地址，然后根据数据地址来判断指令之间的依赖关系，这种判断指令之间的依赖关系要先计算操作数的数据地址的方式，降低了处理器的处理效率。

根据本公开的实施例，提供了一种数据处理方法。图1f示出根据本公开实施例的数据处理方法的流程图。如图1f所示，该数据处理方法包括：

在步骤S11f中，在已解码的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，判断所述第一处理指令是否可执行，所述描述符用于指示张量的形状；

在步骤S12f中，在所述第一处理指令可执行时，根据所述描述符的标识，执行与所述第一处理指令对应的数据处理。

在一种可能的实现方式中，该数据处理方法可应用于处理器。处理器可包括通用处理器(例如中央处理器CPU、图形处理器GPU)和专用处理器(例如人工智能处理器、科学计算处理器或数字信号处理器等)。本公开对处理器的类型不作限制。

在一种可能的实现方式中，已解码的第一处理指令包括操作码以及一个或多个操作数，所述操作码用于指示与所述第一处理指令对应的处理类型。其中，第一处理指令可包括数据存取指令、运算指令、描述符管理指令以及同步通信指令等。本公开对第一处理指令的具体类型不作限制。

在一种可能的实现方式中，描述符可用于指示N维的张量数据的形状，N为大于或等于零的整数。其中，N的取值可根据张量数据的维数(阶数)来确定，也可以根据张量数据的使用需要进行设定。例如，在N的取值为3时，张量数据为三维数据，描述符可用来指示该张量数据在三个维度方向上的形状(例如偏移量、尺寸等)。应当理解，本领域技术人员可以根据实际需要对N的取值进行设置，本公开对此不作限制。

在一种可能的实现方式中，描述符的标识和内容可存储在描述符存储空间中，该描述符存储空间可以为控制单元的内部存储器(例如寄存器、片上的SRAM或其他介质缓存等)中的存储空间。描述符所指示的张量数据的数据存储空间可为所述控制单元的内部存储器(例如片上缓存)或与所述控制单元连接的外部存储器(片下存储器)中的存储空间。数据存储空间中的数据地址可以为实际的物理地址或虚拟地址。本公开对描述符存储空间及数据存储空间的位置以及数据地址的类型不作限制。

在一种可能的实现方式中，与描述符对应的数据存储空间的数据地址可以是固定地址。例如，可以为张量数据划分单独的数据存储空间，每个张量数据在数据存储空间的起始地址与描述符的标识一一对应。在这种情况下，控制单元可根据描述符的内容，通过张量控制模块确定与操作数对应的数据的数据地址，然后执行第一处理指令。

在一种可能的实现方式中，在与描述符的标识对应的数据存储空间的数据地址为可变地址时，所述描述符还可用于指示N维的张量数据的地址，其中，所述描述符的内容还可包括表示张量数据的地址的至少一个地址参数。例如，张量数据为3维数据，在描述符指示该张量数据的地址时，描述符的内容可包括表示该张量数据的地址的一个地址参数，例如张量数据的起始地址，也可以包括该张量数据的地址的多个地址参数，例如张量数据的起始地址+地址偏移量，或张量数据基于各维度的地址参数。本领域技术人员可以根据实际需要对地址参数进行设置，本公开对此不作限制。

在一种可能的实现方式中，所述张量数据的地址参数包括所述描述符的数据基准点在所述数据存储空间中的基准地址。其中，基准地址可根据数据基准点的变化而不同。本公开对数据基准点的选取不作限制。

在一种可能的实现方式中，所述张量数据的形状参数包括以下至少一种：所述数据存储空间在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于所述数据基准点的位置、所述描述符所指示的张量数据的数据描述位置与数据地址之间的映射关系。其中，数据描述位置是描述符所指示的张量数据中的点或区域的映射位置，例如，张量数据为3维数据时，描述符可使用三维空间坐标(x，y，z)来表示该张量数据的形状，该张量数据的数据描述位置可以是使用三维空间坐标(x，y，z)表示的、该张量数据映射在三维空间中的点或区域的位置。

在一种可能的实现方式中，可以在步骤S11f中，在已解码的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，判断所述第一处理指令是否可执行。其中，描述符的标识是否相同，可表示描述符所指示的张量数据是否相同。与数据的存储地址相比，描述符的标识更加简单，通过描述符的标识判断是否存在同样操作此描述符的前序指令的过程，比通过数据的存储地址判断是否存在前序指令的过程也要更加简单高效，其中前序指令可以为与第一处理指令具有依赖关系的处理指令。

在一种可能的实现方式中，可根据描述符的标识以及预设的执行条件来判断第一处理指令是否可执行。例如，在使用寄存器存储描述符的标识时，其中，每个寄存器保存一个描述符标识，访问同一寄存器的多个指令可按指令提交顺序执行，因此可判断指令队列中第一处理指令之前的、访问同一寄存器的指令是否均已完成；并在访问同一寄存器的指令执行完成后，确定第一处理指令可执行。预设的执行条件可以是，先注册所需描述符、描述符未使用完毕不可注销等。本公开对预设的执行条件不作限制。

在一种可能的实现方式中，步骤S11f可包括：根据所述描述符的标识，判断是否存在未处理完成的第二处理指令，所述第二处理指令包括指令队列中在所述第一处理指令之前的，且操作数中具有所述描述符的标识的处理指令；当不存在第二处理指令时，确定所述第一处理指令可执行。

也就是说，在第一处理指令的操作数包括描述符的标识时，可根据描述符的标识，确定出指令队列中是否存在在第一处理指令之前的、操作数中具有该描述符的标识的第二处理指令，将查找到的第二处理指令作为与第一处理指令具有依赖关系的处理指令。在第一处理指令的操作数中具有多个描述符的标识的情况下，可分别判断对应于每个描述符的依赖关系，也就是说，将操作数中具有多个描述符中的至少一个描述符的标识的前序指令作为具有依赖关系的第二处理指令。

当存在未处理完成的第二处理指令时，第一处理指令不可执行；当不存在第二处理指令时，第一处理指令可执行。

举例来说，在第一处理指令的操作数包括至少一个描述符的标识时，判断是否存在未执行完成的第二处理指令时，可对操作数包括的所有描述符的标识进行判断，在第一处理指令的操作数中存在至少一个描述符的标识与第二处理指令的操作数中的描述符的标识相同时，第一处理指令与第二处理指令具有依赖关系，在第二处理指令未执行完成时，第一处理指令不可执行。

例如，在第一处理指令为ADD；TR10；TR11；TR12，第二处理指令为ADD；TR10；TR11；TR12时，第一处理指令与第二操作指令的操作数中的描述符的标识完全相同，则第一处理指令与第二处理指令具有依赖关系。在第二处理指令未执行完成时，第一处理指令不可执行。

在第一处理指令为ADD；TR10；TR11；TR13，第二处理指令为ADD；TR10；TR11；TR12时，第一处理指令与第二操作指令的操作数中有两个描述符的标识(TR10和TR11)相同，则第一处理指令与第二处理指令具有依赖关系。在第二处理指令未执行完成时，第一处理指令不可执行。

在第一处理指令为ADD；TR10；TR12；TR13，第二处理指令为ADD；TR10；TR14；TR15时，第一处理指令与第二操作指令的操作数中有一个描述符的标识(TR10)相同，则第一处理指令与第二处理指令具有依赖关系。在第二处理指令未执行完成时，第一处理指令不可执行。

在第一处理指令为ADD；TR10；TR11；TR12，第二处理指令为ADD；TR13；TR14；TR15时，第一处理指令与第二操作指令的操作数中描述符的标识完全不同，则第一处理指令与第二处理指令没有依赖关系。在第二处理指令未执行完成时，第一处理指令可执行。

在第一处理指令为SUM；TR10，第二处理指令为SUM；TR10时，第一处理指令与第二操作指令的操作数中描述符的标识完全相同，则第一处理指令与第二处理指令具有依赖关系。在第二处理指令未执行完成时，第一处理指令不可执行。

通过这种方式，可以根据描述符的标识来直接判断指令是否可执行，无需多次获取指令中所涉及的操作数的基地址和操作范围，计算得到指令中操作数的数据地址及操作范围，降低了处理器判断指令是否可执行的复杂度，简化了指令中操作数的数据地址的分析过程，提高了处理器的执行效率。

在一种可能的实现方式中，所述第一处理指令和所述第二处理指令中的至少一个包括针对所述描述符的写操作。

例如，第一处理指令为针对描述符TR2的读指令，第二处理指令也为针对描述符TR2的读指令，即第一处理指令和第二处理指令都不包括针对描述符TR2的写操作，则第一处理指令可执行。如果第二处理指令为针对TR2的写指令，则在第二处理指令未处理完成时，第一处理指令不可执行。

通过这种方式，一个描述符同时允许多个指令操作，可提高指令的并发执行效率，从而提高处理器的处理效率。

在一种可能的实现方式中，所述第一处理指令的操作数可包括至少一个描述符的标识，步骤S11f可包括：根据所述至少一个描述符的标识，分别确定各描述符的第一状态，所述第一状态包括已注册状态或未注册状态；在各描述符的第一状态均为已注册状态时，确定所述第一处理指令可执行。也就是说，操作数包括的所有描述符的状态均为已注册时，第一处理指令可执行。

例如，第一处理指令的操作数中包括两个描述符的标识TR3和TR4。根据描述符的标识TR3和TR4，可确定出TR3和TR4的状态(已注册或未注册)，当TR3和TR4中至少一个的状态为未注册时，第一处理指令不可执行；此时，可调用描述符注册指令对TR3和/或TR4进行注册，注册成功后将TR3和/或TR4的状态变更为已注册。在描述符TR3和TR4的状态均为已注册时，第一处理指令可执行。

在一种可能的实现方式中，描述符的第一状态可有多种表示方式。例如，可在描述符中设置第一标志位来表示第一状态，例如，在寄存器中保存描述符的标识，寄存器的最高位用于作为第一标志位，从次高位开始存储描述符的相关信息。也可设置状态对应表，将描述符的第一状态写入状态对应表中。本领域技术人员可以根据实际需要设置第一状态的表示方式，本公开对此不作限制。

通过这种方式，可根据描述符的第一状态来判断指令是否可执行，降低了处理器判断指令是否可执行的复杂度。以注销操作为例，当该描述符即将被注销时，只需要将该状态改变，即可完成操作，无需对描述符相关存储区域进行清空，再有其他描述符使用这块空间时，对该区域直接覆盖即可。以运算操作为例，首先可直接判断该操作符的状态，当该操作符无效时，通过第一状态即可判断该指令不可执行，从而无需进行进一步判断，即可阻塞该指令。

在一种可能的实现方式中，所述第一处理指令的操作数可包括至少一个描述符的标识，步骤S11f可包括：根据所述至少一个描述符的标识，分别确定各描述符的第二状态，所述第二状态包括可操作状态或不可操作状态；在各描述符的第二状态均为可操作状态时，确定所述第一处理指令可执行。

举例来说，在第一处理指令的前序指令当前正在对描述符进行操作(例如写入或读取)的情况下，描述符的当前状态为不可操作状态。在该状态下，无法执行第一处理指令，可阻塞或缓存第一处理指令。反之，在当前没有对描述符进行操作的前序指令的情况下，可将描述符的当前状态设置为可操作状态。在该状态下，能够执行第一处理指令。

在一种可能的实现方式中，当对该描述符进行操作的前序指令为两条以上时，可操作状态用“0”表示，不可操作状态用“1”表示，当所有前序指令操作完毕后，第二状态的标志位置为“0”，否则为“1”；或，可操作状态用“0”表示，不可操作状态用“N”表示，N为操作该描述符的前序指令的数量，每一个前序指令操作完毕则N-1，直至标志位的值为0，该描述符的第二状态为可操作状态。本公开对状态的具体表示方式不作限制。

在一种可能的实现方式中，描述符的第二状态可包括可操作状态或不可操作状态，其中，第二状态可通过多种方式表示。例如，可在描述符中设置第二标志位来表示第二状态，也可将描述符的第二状态写入状态对应表中。其中，状态对应表可存储在寄存器中，并可通过硬件方式来实现对状态对应表中第一状态和第二状态的判断。本领域技术人员可以根据实际需要设置第二状态的表示方式，本公开对此不作限制。

通过这种方式，可根据描述符的第二状态来判断指令是否可操作，降低了处理器判断指令是否可操作的复杂度。以运算操作为例，直接判断该指令涉及的描述符的第二状态是否为可操作状态，而无需对该指令所涉及的操作数据，获取操作数的基地址以及操作范围，从而获取运算的实际操作区域，再进行判断区域间是否有重叠，得到该指令是否为可操作状态的结论。

在一种可能的实现方式中，通过步骤S11f确定第一处理指令可执行时，可以在步骤S12f中，根据所述描述符的标识，执行与所述第一处理指令对应的数据处理。也就是说，第一处理指令可执行时，可根据描述符的标识，通过计算得到描述符所指示的张量数据的数据地址，然后从数据地址中读取张量数据并执行与第一处理指令对应的数据处理。

在一种可能的实现方式中，根据描述符的标识，可直接得到描述符所指示的张量数据的数据地址，例如，描述符的内容为张量数据的数据地址时，无需计算，可直接从描述符存储空间读取数据地址，并从数据地址中读取张量数据，执行与第一处理指令对应的数据处理。

在一种可能的实现方式中，步骤S12f可包括：根据所述描述符的标识，从描述符存储空间获取所述描述符的内容；根据所述描述符的内容，确定与所述操作数对应的数据在数据存储空间中的数据地址；根据所述数据地址，执行与所述第一处理指令对应的数据处理。

在本实施例中，在第一处理指令可执行时，可根据操作数中描述符的标识，从描述符存储空间获取所述描述符的内容。也就是说，根据描述符的标识，可确定描述符在描述符存储空间中的位置，进而从描述符存储空间中获取描述符的内容。从而，可以降低软件编程的复杂度，无需在软件侧了解硬件侧数据存储方式，对硬件实际存储地址进行计算；同时也可以降低指令的复杂度，无需将多次使用的参数(如：描述符中的内容)在每次使用时都写入指令中。

在获取描述符的内容后，可根据描述符的内容，确定与操作数对应的数据在数据存储空间中的数据地址。其中，数据地址的计算可通过硬件自动完成或通过软件方式实现。在描述符的内容的不同时，与操作数对应的数据在数据存储空间中的数据地址的计算方式也可以不同。本公开对数据地址的计算方式不作限制。

例如，在采用公式(1)表示描述符的内容的情况下，对于张量数据中的任意一个数据点，设其数据描述位置为(x _q，y _q)，那么，该数据点在数据存储空间中的数据地址PA2 _(x,y)可以使用下述公式(4)来确定：

PA2 _(x,y)＝PA_start+(offset_y+y _q-1)*ori_x+(offset_x+x _q) (4)

在得到与操作数对应的数据在数据存储空间中的数据地址后，可根据数据地址，执行与第一处理指令对应的数据处理。

举例来说，对于第一处理指令为运算指令ADD；A；B，如果操作数A和B中分别包括描述符的标识TR5和TR6，则可根据TR5和TR6，分别从描述符存储空间获取描述符TR5和TR6的内容(例如形状参数和地址参数)；然后根据描述符TR5和TR6的内容，分别计算数据A和B的数据地址，数据A在数据存储空间中的地址1为ADDR64-ADDR127，数据B在数据存储空间中的地址2为ADDR1023-ADDR1087。然后，从地址1和地址2中分别读取数据，执行加法(ADD)运算，得到运算结果(A+B)。

在一种可能的实现方式中，所述方法还可包括：在所述第一处理指令为描述符注册指令时，获取所述第一处理指令中描述符的注册参数，所述注册参数包括所述描述符的标识、张量形状以及描述符所指示的张量数据的内容中的至少一项；根据所述描述符的注册参数，判断所述第一处理指令是否可执行；在所述第一处理指令可执行时，执行所述第一处理指令。

在本实施例中，在第一处理指令为描述符注册指令时，可从第一处理指令中获取描述符的注册参数，其中，注册参数可包括描述符的标识、张量形状以及描述符所指示的张量数据的内容中的至少一项；然后根据描述符的注册参数，判断第一处理指令是否可执行，即可根据描述符的注册参数，判断描述符是否可注册。例如，在描述符的标识被占用或描述符存储空间不足的情况下，描述符无法注册成功。应当理解，本领域技术人员可根据实际情况对注册参数的判断进行设置，本公开对此不作限制。

在一种可能的实现方式中，根据所述描述符的注册参数，判断所述第一处理指令是否可执行，可包括：在满足所述描述符的标识未被占用、存储所述描述符的内容的第一存储区域未被占用，以及存储所述描述符所指示的张量数据的第二存储区域未被占用中的至少一项时，确定所述第一处理指令可执行。也就说是，在注册参数满足描述符的标识未被占用、第一存储区域未被占用或第二存储区域未被占用中的至少一项时，第一处理指令可执行。

在第一处理指令可执行时，执行所述第一处理指令(描述符注册指令)。例如，可首先确定描述符的内容在描述符存储空间的第一存储区域以及描述符所指示的张量数据的内容在数据存储区域的第二存储区域；然后，根据注册参数以及第二存储区域，确定描述符的内容，即建立描述符与第二存储区域之间的对应关系；然后，将描述符的内容存储到第一存储区域，完成描述符的注册。

在一种可能的实现方式中，所述方法还包括：在所述第一处理指令为描述符注销指令时，根据所述第一处理指令中描述符的标识，判断是否存在未完成处理的第四处理指令，所述第四处理指令为指令队列中的、操作数包括所述描述符的标识的处理指令；在不存在未完成处理的第四处理指令时，执行所述第一处理指令。

在本实施例中，在第一处理指令为描述符注销指令时，可根据描述符的标识判断在指令队列中是否有操作数包括描述符的标识的第四处理指令，当存在未完成处理的第四处理指令时，第一处理指令不可执行；当不存在未完成处理的第四处理指令时，执行第一处理指令即描述符注销指令，此时，可分别释放描述符在描述符存储空间的存储区域以及描述符所指示的数据在数据存储空间的存储区域。

举例来说，第一处理指令为描述符注销指令，注销的描述符的标识为TR7，可首先在指令队列中查找是否有操作数包括TR7的第四处理指令，例如，指令队列中有两个第四处理指令：针对TR7的运算指令和读指令；然后判断这两个第四处理指令(针对TR7的运算指令和读指令)是否执行完成；在这两个第四处理指令均未执行完成时，第一处理指令(描述符注销指令)不可执行；当两个第四处理指令均执行完成时，第一处理指令可执行。之后，执行第一处理指令(描述符注销指令)，分别释放TR7在描述符存储空间的存储区域以及TR6指示的数据在数据存储空间的存储区域。

在一种可能的实现方式中，在第一处理指令为描述符注销指令时，可根据描述符的标识，确定描述符的第一状态是否为已注册。在描述符的第一状态为已注册时，第一处理指令(描述符注销指令)可执行。否则，第一处理指令(描述符注销指令)不可执行。即，操作数中的描述符为已注册状态时，描述符注销指令才可执行。

在一种可能的实现方式中，所述方法还可包括：在所述第一处理指令不可执行时，阻塞或缓存所述第一处理指令。也就是说，在第一处理指令不可执行时，可以阻塞第一处理指令，暂停第一处理指令及之后的其他指令的执行，直到第二处理指令执行完成后，再执行第一处理指令及之后的其他指令；也可以缓存第一处理指令，将第一处理指令存储到预设的缓存空间，而不影响其他指令的执行，在第二处理指令执行完成后，再执行缓存空间中的第一处理指令。本公开对第一处理指令不可执行时的处理方式不作限制。

根据本公开的实施例的数据处理方法，在已解码的处理指令的操作数中包括描述符的标识时，能够通过描述符的标识来判断指令是否可执行，并在指令可执行时，根据描述符的标识来执行与指令对应的数据处理，从而可降低处理器判断指令是否可执行的复杂度，提高处理器的处理效率。

需要说明的是，尽管以上述实施例作为示例介绍了数据处理方法如上，但本领域技术人员能够理解，本公开应不限于此。事实上，用户完全可根据个人喜好和/或实际应用场景灵活设定各步骤，只要符合本公开的技术方案即可。

图3f示出根据本公开实施例的数据处理装置的框图。如图3f所示，所述数据处理装置包括：

判断模块31f，用于在已解码的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，判断所述第一处理指令是否可执行，所述描述符用于指示张量的形状；

执行模块32f，用于在所述第一处理指令可执行时，根据所述描述符的标识，执行与所述第一处理指令对应的数据处理。

在一种可能的实现方式中，所述执行模块32f，包括：内容获取子模块，用于根据所述描述符的标识，从描述符存储空间获取所述描述符的内容；地址确定子模块，用于根据所述描述符的内容，确定与所述操作数对应的数据在数据存储空间中的数据地址；第一执行子模块，用于根据所述数据地址，执行与所述第一处理指令对应的数据处理。

在一种可能的实现方式中，所述判断模块31f，包括：指令判断子模块，用于根据所述描述符的标识，判断是否存在未处理完成的第二处理指令，所述第二处理指令包括指令队列中在所述第一处理指令之前的，且操作数中具有所述描述符的标识的处理指令；第一执行确定子模块，用于当不存在第二处理指令时，确定所述第一处理指令可执行。

在一种可能的实现方式中，所述第一处理指令的操作数包括至少一个描述符的标识，其中，所述判断模块31f，包括：第一状态确定子模块，用于根据所述至少一个描述符的标识，分别确定各描述符的第一状态，所述第一状态包括已注册状态或未注册状态；第二执行确定子模块，用于在各描述符的第一状态均为已注册状态时，确定所述第一处理指令可执行。

在一种可能的实现方式中，所述第一处理指令的操作数包括至少一个描述符的标识，其中，所述判断模块31f，包括：第二状态确定子模块，用于根据所述至少一个描述符的标识，分别确定各描述符的第二状态，所述第二状态包括可操作状态或不可操作状态；第三执行确定子模块，用于在各描述符的第二状态均为可操作状态时，确定所述第一处理指令可执行。

在一种可能的实现方式中，所述装置还包括：注销判断模块，用于在所述第一处理指令为描述符注销指令时，根据所述第一处理指令中描述符的标识，判断是否存在未完成处理的第四处理指令，所述第四处理指令为指令队列中的、操作数包括所述描述符的标识的处理指令；注销执行模块，用于在不存在未完成处理的第四处理指令时，执行所述第一处理指令。

在一种可能的实现方式中，所述装置还包括：参数获取模块，用于在所述第一处理指令为描述符注册指令时，获取所述第一处理指令中描述符的注册参数，所述注册参数包括所述描述符的标识、张量形状以及描述符所指示的张量数据的内容中的至少一项；注册判断模块，用于根据所述描述符的注册参数，判断所述第一处理指令是否可执行；注册执行模块，用于在所述第一处理指令可执行时，执行所述第一处理指令。

在一种可能的实现方式中，所述注册判断模块，包括：条件判断子模块，用于在满足所述描述符的标识未被占用、存储所述描述符的内容的第一存储区域未被占用，以及存储所述描述符所指示的张量数据的第二存储区域未被占用中的至少一项时，确定所述第一处理指令可执行。

在一种可能的实现方式中，所述装置还包括：执行控制模块，用于在所述第一处理指令不可执行时，阻塞或缓存所述第一处理指令。

A1、一种数据处理方法，所述方法包括：

在已解码的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，判断所述第一处理指令是否可执行，所述描述符用于指示张量的形状；

在所述第一处理指令可执行时，根据所述描述符的标识，执行与所述第一处理指令对应的数据处理。

A2、根据权利要求A1所述的方法，根据所述描述符的标识，执行与所述第一处理指令对应的数据处理，包括：

根据所述描述符的标识，从描述符存储空间获取所述描述符的内容；

根据所述描述符的内容，确定与所述操作数对应的数据在数据存储空间中的数据地址；

A3、根据权利要求A1所述的方法，根据所述描述符的标识，判断所述第一处理指令是否可执行，包括：

根据所述描述符的标识，判断是否存在未处理完成的第二处理指令，所述第二处理指令包括指令队列中在所述第一处理指令之前的，且操作数中具有所述描述符的标识的处理指令；

当不存在第二处理指令时，确定所述第一处理指令可执行。

A4、根据权利要求A3所述的方法，所述第一处理指令和所述第二处理指令中的至少一个包括针对所述描述符的写操作。

A5、根据权利要求A1所述的方法，所述第一处理指令的操作数包括至少一个描述符的标识，

其中，根据所述描述符的标识，判断所述第一处理指令是否可执行，包括：

根据所述至少一个描述符的标识，分别确定各描述符的第一状态，所述第一状态包括已注册状态或未注册状态；

在各描述符的第一状态均为已注册状态时，确定所述第一处理指令可执行。

A6、根据权利要求A1所述的方法，所述第一处理指令的操作数包括至少一个描述符的标识，

根据所述至少一个描述符的标识，分别确定各描述符的第二状态，所述第二状态包括可操作状态或不可操作状态；

在各描述符的第二状态均为可操作状态时，确定所述第一处理指令可执行。

在所述第一处理指令为描述符注销指令时，根据所述第一处理指令中描述符的标识，判断是否存在未完成处理的第四处理指令，所述第四处理指令为指令队列中的、操作数包括所述描述符的标识的处理指令；

在不存在未完成处理的第四处理指令时，执行所述第一处理指令。

在所述第一处理指令为描述符注册指令时，获取所述第一处理指令中描述符的注册参数，所述注册参数包括所述描述符的标识、张量形状以及描述符所指示的张量数据的内容中的至少一项；

根据所述描述符的注册参数，判断所述第一处理指令是否可执行；

在所述第一处理指令可执行时，执行所述第一处理指令。

A9、根据权利要求A8所述的方法，根据所述描述符的注册参数，判断所述第一处理指令是否可执行，包括：

在满足所述描述符的标识未被占用、存储所述描述符的内容的第一存储区域未被占用，以及存储所述描述符所指示的张量数据的第二存储区域未被占用中的至少一项时，确定所述第一处理指令可执行。

A10、根据权利要求A1-A9中任意一项所述的方法，所述方法还包括：

在所述第一处理指令不可执行时，阻塞或缓存所述第一处理指令。

A11、根据权利要求A1所述的方法，所述描述符用于指示N维的张量数据的形状，N为大于或等于零的整数，

A12、根据权利要求A11所述的方法，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A13、根据权利要求A12所述的方法，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

A14、一种数据处理装置，所述装置包括：

判断模块，用于在已解码的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，判断所述第一处理指令是否可执行，所述描述符用于指示张量的形状；

执行模块，用于在所述第一处理指令可执行时，根据所述描述符的标识，执行与所述第一处理指令对应的数据处理。

A15、根据权利要求A14所述的装置，所述执行模块，包括：

内容获取子模块，用于根据所述描述符的标识，从描述符存储空间获取所述描述符的内容；

地址确定子模块，用于根据所述描述符的内容，确定与所述操作数对应的数据在数据存储空间中的数据地址；

第一执行子模块，用于根据所述数据地址，执行与所述第一处理指令对应的数据处理。

A16、根据权利要求A14所述的装置，所述判断模块，包括：

指令判断子模块，用于根据所述描述符的标识，判断是否存在未处理完成的第二处理指令，所述第二处理指令包括指令队列中在所述第一处理指令之前的，且操作数中具有所述描述符的标识的处理指令；

第一执行确定子模块，用于当不存在第二处理指令时，确定所述第一处理指令可执行。

A17、根据权利要求A16所述的装置，所述第一处理指令和所述第二处理指令中的至少一个包括针对所述描述符的写操作。

A18、根据权利要求A14所述的装置，所述第一处理指令的操作数包括至少一个描述符的标识，

其中，所述判断模块，包括：

第一状态确定子模块，用于根据所述至少一个描述符的标识，分别确定各描述符的第一状态，所述第一状态包括已注册状态或未注册状态；

第二执行确定子模块，用于在各描述符的第一状态均为已注册状态时，确定所述第一处理指令可执行。

A19、根据权利要求A14所述的装置，所述第一处理指令的操作数包括至少一个描述符的标识，

其中，所述判断模块，包括：

第二状态确定子模块，用于根据所述至少一个描述符的标识，分别确定各描述符的第二状态，所述第二状态包括可操作状态或不可操作状态；

第三执行确定子模块，用于在各描述符的第二状态均为可操作状态时，确定所述第一处理指令可执行。

注销判断模块，用于在所述第一处理指令为描述符注销指令时，根据所述第一处理指令中描述符的标识，判断是否存在未完成处理的第四处理指令，所述第四处理指令为指令队列中的、操作数包括所述描述符的标识的处理指令；

注销执行模块，用于在不存在未完成处理的第四处理指令时，执行所述第一处理指令。

A21、根据权利要求A14-A20中任意一项所述的装置，所述装置还包括：

参数获取模块，用于在所述第一处理指令为描述符注册指令时，获取所述第一处理指令中描述符的注册参数，所述注册参数包括所述描述符的标识、张量形状以及描述符所指示的张量数据的内容中的至少一项；

注册判断模块，用于根据所述描述符的注册参数，判断所述第一处理指令是否可执行；

注册执行模块，用于在所述第一处理指令可执行时，执行所述第一处理指令。

A22、根据权利要求A21所述的装置，所述注册判断模块，包括：

条件判断子模块，用于在满足所述描述符的标识未被占用、存储所述描述符的内容的第一存储区域未被占用，以及存储所述描述符所指示的张量数据的第二存储区域未被占用中的至少一项时，确定所述第一处理指令可执行。

A23、根据权利要求A14-A22中任意一项所述的装置，所述装置还包括：

执行控制模块，用于在所述第一处理指令不可执行时，阻塞或缓存所述第一处理指令。

A24、根据权利要求A14所述的装置，所述描述符用于指示N维的张量数据的形状，N为大于或等于零的整数，

A25、根据权利要求A24所述的装置，所述描述符还用于指示N维的张量数据的地址，其中，所述描述符的内容还包括表示张量数据的地址的至少一个地址参数。

A26、根据权利要求A25所述的装置，所述张量数据的地址参数包括所述描述符的数据基准点在所述张量数据的数据存储空间中的基准地址；

其中，所述张量数据的形状参数包括以下至少一种：

A27、一种人工智能芯片，所述芯片包括如权利要求A14-A26中任意一项所述的数据处理装置。

A28、一种电子设备，所述电子设备包括如权利要求A27所述的人工智能芯片。

A29、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如权利要求A27所述的人工智能芯片；

所述存储器件，用于存储数据；

所述控制器件，用于对所述人工智能芯片的状态进行监控。

A30、根据权利要求A29所述的板卡，所述存储器件包括：多组存储单元，每一组所述存储单元与所述人工智能芯片通过总线连接，所述存储单元为：DDR SDRAM；

所述接口装置为：标准PCIE接口。

根据本公开的实施例，提供了一种处理器操作方法。

图1g示出根据本公开实施例的处理器操作方法的流程图。所述处理器操作方法可应用于处理器。

如图1g所示，该处理器操作方法包括：

步骤S11g，在第一操作为针对目标存储区域的操作时，判断是否存在正在进行的针对所述目标存储区域的第二操作，所述目标存储区域包括至少一个细粒度区域。

其中，第一操作可以是读操作或者写操作，类似的，第二操作也可以是读操作或者写操作。本公开对第一操作和第二操作的具体类型不作限制。一个操作可包括一个或多个操作数。目标存储区域可以是第一操作和第二操作的一个或多个操作数所对应的存储区域。目标存储区域所在的整体存储区域可以是处理器的内部存储器(例如片上缓存或寄存器等)，也可以是连接到处理器的外部存储器(例如片下存储器等)。

在一种可能的实现方式中，第一操作和/或第二操作可以包括一个或多个操作数，目标存储区域可以是第一操作和第二操作中的任意操作数对应的存储区域。目标存储区域为第一操作中的至少一个操作数和第二操作中的至少一个操作数共同对应的存储区域。例如，对于第一操作中的第一操作数和第二操作中的第二操作数，第一操作数可以为第一操作中的任意操作数，第二操作数可以为第二操作中的任意操作数。当第一操作数和第二操作数为相同的操作数时，目标存储区域可以为第一操作数的存储区域或第二操作的存储区域。当第一操作数的存储区域和第二操作数的存储区域有重叠区域时，目标存储区域为重叠区域。

在一种可能的实现方式中，目标存储区域包括至少一个细粒度区域。其中，细粒度区域的尺寸和/或数量的确定方式，可以包括根据硬件设计确定的方式、根据目标操作数的相关操作确定的方式、根据操作中相关参数进行定义的方式中的其中一种或任意组合。其中，根据硬件设计确定的方式，即在硬件设计时确定细粒度区域的尺寸，譬如确定存储区域的一行或多行为一个细粒度区域。根据目标操作数的相关操作确定的方式，包括根据目标操作数的处理需求、存储方式、或传输方式等进行确定的方式，例如目标操作数为一个二维矩阵数据，其规模为M*N(M，N均为正整数)，表示存储所占字节数，即一行M字节，共有N行，可以确定M字节为一个细粒度区域，该目标操作数所对应的目标存储区域包括N个细粒度区域。根据操作中相关参数进行定义的方式，包括根据操作中携带的细粒度的尺寸和/或数量，将目标存储区域划分为多个细粒度区域。当第一操作中的第一操作数和第二操作中的第二操作数共同对应此目标存储区域时，第一操作和第二操作可以根据目标存储区域中划分出的多个细粒度区域，采用本公开实施例中的方法。

需要说明的是，多个细粒度区域的尺寸可以相同，也可以不同。例如，第一操作可以携带第一细粒度的尺寸(各细粒度区域的数据位数)，并可以将该第一细粒度的尺寸设置为64位，而第二操作可以携带第二细粒度尺寸(例如各细粒度区域的数据位数)，并可以将该第二细粒度的尺寸设置为256位。即在执行第一操作时，将每64位作为一个细粒度区域，而在执行第二操作时，每256位作为一个细粒度区域。又如，第一操作和第二操作所携带的细粒度尺寸(例如各细粒度区域的数据位数)均为512位。同样的，第一操作也可以携带第一细粒度的数量(例如设置为4个)，而第二操作携带第二细粒度的数量(例如设置为8个)。即在执行第一操作时，将目标存储区域划分为4个细粒度区域，而在执行第二操作时，将目标存储区域划分为8个细粒度区域。可以理解，操作中还可以同时携带细粒度的尺寸、数量这两个参数。可以根据需求确定各细粒度区域的尺寸和/或数量，本公开对此不做限定。

在一种可能的实现方式中，可以通过查询各操作的执行状态来判断是否存在正在进行的针对目标存储区域的第二操作。例如，可以记录各操作的操作数所对应的存储区域，并记录各操作的执行状态。若针对目标存储区域的操作的执行状态为未完成，则判断结果为存在正在进行的针对目标操作区域的第二操作。还可以通过判断操作数的占用状态，来确定操作数对应的目标存储区域是否被占用，从而确定是否存在正在进行的针对目标操作区域的第二操作。本公开对判断是否存在正在进行的针对目标操作区域的第二操作的判断依据不做限定。

步骤S12g，在存在所述第二操作时，判断所述第一操作当前所针对的第一细粒度区域与所述第二操作当前所针对的第二细粒度区域之间是否重叠。

第一细粒度区域和第二细粒度区域可以为目标存储区域中多个细粒度区域中的任意细粒度区域。可以理解的是，针对目标存储区域的操作，即为针对目标存储区域中各细粒度区域的操作。例如，目标存储区域A为第1行至第10行，每1行为一个细粒度区域，目标存储区域A包括10个细粒度区域。针对目标存储区域A的写操作可以看做针对此10个细粒度区域的写操作。其执行过程可以为，写第1个细粒度区域(第1行)，第1个细粒度区域写完后写第2个细粒度区域(第2行)，第2个细粒度区域写完后写第3个细粒度区域(第3行)，以此类推，直至写完第10个细粒度区域(第10行)，完成目标存储区域A的写操作。

在一种可能的实现方式中，第一操作当前所针对的第一细粒度区域，可以包括将要执行的第一操作所针对的细粒度区域，通常为第一个细粒度区域。也可以包括正在执行的第一操作当前所针对的细粒度区域，可以为任意一个细粒度区域。第二操作当前所针对的第二细粒度区域，可以为正在执行的第二操作当前所针对的细粒度区域，可以为任意一个细粒度区域。

在一种可能的实现方式中，当在针对目标存储区域的第一操作执行前，判断是否存在正在进行的针对目标存储区域的第二操作时，第一操作当前所针对的第一细粒度区域，为第一操作将要执行的细粒度区域。例如，在针对目标存储区域的第一操作执行前，第一操作当前所针对的第一细粒度区域通常为目标存储区域的第一个细粒度区域。此时，第一操作还未对第一细粒度区域执行操作。而正在进行的第二操作当前所针对的第二细粒度区域，可以与第二操作的执行进程相关。若第二操作也刚开始执行，则第二细粒度区域也可为目标存储区域的第一个细粒度区域。此时，第一细粒度区域与第二细粒度区域重叠。若第二操作已经完成第一个细粒度区域的操作，当前所针对的第二细粒度区域为第P个细粒度区域(P为大于1的整数)，则第一细粒度区域与第二细粒度区域不重叠。

在一种可能的实现方式中，当在第一操作针对目标存储区域的操作过程中，判断是否存在正在进行的针对目标存储区域的第二操作时，可根据第一操作的执行进程确定第一细粒度区域，根据第二操作的执行进程确定第二细粒度区域，进而判断第一细粒度区域与第二细粒度区域是否重叠。

在一种可能的实现方式中，若各操作执行过程的节拍不一致或不能确定是否一致，可在第一操作针对目标存储区域的操作过程中，每完成当前所针对的第一细粒度区域的操作后，再继续判断是否存在正在进行的针对目标操作区域的第二操作，以及继续判断第一细粒度区域与第二细粒度区域是否重叠，以确定第一操作是否可以继续执行。

在一种可能的实现方式中，可根据物理地址、指针位置、细粒度区域标识等，来判断第一操作当前所针对的第一细粒度区域与第二操作当前所针对的第二细粒度区域之间是否重叠。例如，可记录各操作当前的物理地址，根据第一操作当前的物理地址以及第二操作当前的物理地址，以及物理地址与细粒度区域之间的对应关系，分别确定第一操作当前所针对的第一细粒度区域以及第二操作当前所针对的第二细粒度区域，进而判断第一细粒度区域与第二细粒度区域是否重叠。物理地址可以包括细粒度区域的起始地址、终止地址、设定位置的地址或实时操作地址中的一种或任意组合。再例如，可为各操作设置指针，指针指向操作当前所针对的细粒度区域。根据第一操作的指针位置和第二操作的指针位置，分别确定第一操作当前所针对的第一细粒度区域以及第二操作当前所针对的第二细粒度区域，进而判断第一细粒度区域与第二细粒度区域是否重叠。再例如，还可以为各细粒度区域设置标识，通过记录操作当前所针对的细粒度区域的标识来判断第一细粒度区域与第二细粒度区域是否重叠。标识可以包括字母、数字或符号的任意组合。还可以通过其他方式判断第一细粒度区域与第二细粒度区域是否重叠，本公开对第一细粒度区域与第二细粒度区域之间是否重叠的判断依据不作限制。

步骤S13g，在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

在一种可能的实现方式中，如果第一操作当前所针对的第一细粒度区域与第二操作当前所针对的第二细粒度区域不重叠，可以是第一细粒度区域是第二操作已经操作完成的细粒度区域，也可以是第二操作不需要进行操作的细粒度区域，此时执行第一操作不会对第二操作的操作过程及操作结果产生影响，可以执行第一操作。

根据本实施例，能够在第一操作针对的目标存储区域包括至少一个细粒度区域，且存在正在进行的针对目标存储区域的第二操作时，判断第一操作当前所针对的第一细粒度区域与第二操作当前所针对的第二细粒度区域之间是否有重叠，在两者无重叠时，执行第一操作。这样，第一操作和第二操作当前所针对的细粒度区域无重叠即可执行，使得第一操作和第二操作可以同时对目标存储区域进行操作，提高了处理器的处理效率。

在一种可能的实现方式中，第一细粒度区域与第二细粒度区域有重叠，包括第一细粒度区域与第二细粒度区域完全重叠或部分重叠。第一细粒度区域与第二细粒度区域有重叠时，若执行第一操作，则第一操作针对重叠部分区域的操作，可以影响第二操作的执行导致第二操作的操作结果不准确，也可以影响第一操作的执行导致第一操作的操作结果不准确。此时，可阻塞第一操作，即暂停第一操作的执行，可以在第二操作对当前所针对的第二细粒度区域操作完成后，执行第一操作。即第一细粒度区域与第二细粒度区域不重叠时，执行第一操作。

如图5a所示，当前仅包括写操作，用写指针wp表示写操作当前所针对的细粒度区域。在写操作刚开始时，写指针wp指向细粒度区域22d，可首先判断是否存在正在进行的针对目标存储区域21d的第二操作，如果判断结果为不存在第二操作，则开始对细粒度区域22d进行写操作；当完成对细粒度区域22d的写操作后，写指针wp增加，即wp++，并指向下一个细粒度区域23d，进行同样的判断后，开始对细粒度区域23d进行写操作；当完成对细粒度区域23d的写操作后，写指针wp增加，指向下一个细粒度区域24d，进行同样的判断后，开始对细粒度区域24d进行写操作。

在执行读操作(第一操作)时，判断是否存在正在进行的针对目标存储区域21d的第二操作。经判断，当前存在第二操作写操作，进一步判断读操作(第一操作)当前所针对的第一细粒度区域(图5b中的细粒度区域22d)与写操作(第二操作)当前所针对的第二细粒度区域(图5b中的细粒度区域24d)之间是否重叠，例如可根据细粒度区域的编号(22d和24d)，或根据rp与wp之间的关系(rp＝0，wp＝2，rp<wp)，确定出第一细粒度区域与第二细粒度区域之间不重叠，然后，可执行读操作(第一操作)。

当完成对细粒度区域22d的读操作后，rp增加，即rp++，并指向下一个细粒度区域23d，进行同样的判断后，第一操作开始对细粒度区域23d进行操作；当完成对细粒度区域23d的读操作后，rp增加并指向下一个细粒度区域24d。在该情况下，继续判断第一细粒度区域与第二细粒度区域之间是否重叠，如果细粒度区域编号相同或指针rp＝wp，即可判断第一操作当前所针对的第一细粒度区域与第二操作当前所针对的第二细粒度区域重叠，则第一操作不可执行，阻塞第一操作。当第二操作完成对细粒度区域24d的操作后，wp增加，并指向下一个细粒度区域25d时，rp<wp，可以执行第一操作。

在一种可能的实现方式中，所述第一操作和所述第二操作中可至少一个操作为写操作。即，当对目标数据的操作为写后读(第二操作为写操作，第一操作为读操作)、读后写(第二操作为读操作，第一操作为写操作)或者写后写(第二操作和第一操作均为写操作)时，可采用本公开实施例中的方法。

例如，如果第一操作为读操作，第二操作为写操作，第一操作需要读取的目标操作数需要是第二操作写操作后的数据，第二操作所针对的第二细粒度区域的编号为8，则第一操作仅能够读取编号在8之前的细粒度区域的数据。也就是说，如果第一操作当前所针对的第一细粒度区域为编号1～7的细粒度区域中的任意一个，则可以执行第一操作。

在本实施例中，当第一操作和第二操作中的至少一个操作为写操作时，通过使用本公开实施例中的方法，通过将目标存储区域划分为一个或多个细粒度区域，并以细粒度区域为单位执行操作，可以使得读后写、写后读、写后写等操作既能够正确的执行，得到准确的执行结果，又可以减少操作之间的等待时间，提高处理器的执行效率。

可以理解，确定所述细粒度区域的尺寸和/或数量可以是在操作生成前预先设定好的，也可以是每条操作生成时实时确定的。其中，在操作前预先设定好细粒度区域的尺寸和/或数量，可以包括根据预先设定好的预设长度的数据所在区域、预先设定好的预设维度的数据所在区域中的至少一种，确定细粒度区域的尺寸和/或数量。而设定长度的数据和预设维度的数据可以与各操作的操作数无关，也可以预先根据各操作的操作数综合确定，可以根据需求确定。而在每条操作生成时实时确定细粒度区域的尺寸和/或数量，可以包括根据各操作的操作数，确定设定长度的数据或设定维度的数据，即，可以根据各操作的操作数的不同，实时确定设定长度的数据所在区域、设定维数的数据所在区域中的至少一种，确定细粒度区域的尺寸和/或数量。

举例来说，可根据设定长度的数据所在区域的大小，确定细粒度区域的尺寸和/或数量。例如，可根据目标操作数中设定长度的数据所在存储区域的尺寸，来设定细粒度区域的尺寸，该区域可以为固定的位宽。例如，目标操作数B是20*10*5的三维数据，其在目标存储区域的存储方式为40*25(即每行40位数据，共25行)，则可将设定长度设定为40位，将目标存储区域的每1行设为一个细粒度区域，目标操作数B的存储区域可划分为25个细粒度区域；也可将存储区域的每5行设为一个细粒度区域，目标操作数B的存储区域可划分为5个细粒度区域。本公开对此不作限制。

在一种可能的实现方式中，还可根据设定维数的数据所在区域的大小，确定细粒度区域的尺寸和/或数量。例如，目标操作数C是20*10的二维数据，可根据设定维数为1维、长度为20的数据，将目标操作数C的存储区域划分为10个细粒度区域。

此外，还可同时根据目标操作数的存储区域中的设定长度的数据所在区域的大小和设定维度的数据所在区域的大小，确定细粒度区域的尺寸和/或数量。例如，针对目标操作数C，可根据设定维数为2维、尺寸为4*2的数据来划分细粒度区域，从而将目标操作数C的存储区域划分为25个细粒度区域。

步骤S13g可包括：当所述第一位置信息与所述第二位置信息不一致时，执行所述第一操作。

例如，位置信息可使用细粒度区域的编号信息来表示，可将目标存储区域被划分为6个细粒度区域，其编号依次为0-5。在执行针对目标存储区域的第一操作和第二操作时，可分别记录第一操作当前操作的第一细粒度区域的第一位置信息(例如编号为2)和第二操作当前操作的第二细粒度区域的第二位置信息(例如编号为5)；然后根据编号信息之间的关系(2<5)，可知，第一位置信息与第二位置信息不一致；此时，执行第一操作。

在一种可能的实现方式中，位置信息可包括细粒度区域的地址信息。地址信息可以包括细粒度区域的起始地址信息、终止地址信息、细粒度区域中预设位置的地址信息、地址偏移量信息中的至少一个。例如，细粒度区域的位置信息为ADDR15-ADDR31。

举例来说，第一操作为第二操作之后的操作，其目标存储区域被划分为6个细粒度区域，其位置信息可使用已操作完成的细粒度区域的数量来表示。在执行针对目标存储区域的第一操作和第二操作时，可分别记录第一操作已操作完成的细粒度区域的第一数量(例如第一数量为3)和第二操作已操作完成的细粒度区域的第二数量(例如第二数量为5)；然后根据第一操作与第二操作的执行顺序，以及第一数量与第二数量的关系，可知，第一操作为第二操作之后的操作，且第一数量3小于第二数量5，此时，执行第一操作。

在一种可能的实现方式中，所述目标存储区域可包括可操作区域和非可操作区域，步骤S12g可包括：在存在所述第二操作，且所述第一操作当前所针对的第一细粒度区域位于所述可操作区域内时，判断所述第一操作当前所针对的第一细粒度区域与所述第二操作当前所针对的第二细粒度区域之间是否有重叠。

在一种可能的实现方式中，在第一操作为针对目标存储区域的操作时，可首先判断是否存在正在进行的针对目标存储区域的第二操作；当存在第二操作时，判断第一操作所针对的第一细粒度区域是否位于可操作区域内；当存在第二操作，且第一操作所针对的第一细粒度区域位于可操作区域内时，然后再判断第一操作所针对的第一细粒度区域与第二操作所针对的第二细粒度区域之间是否有重叠；当第一细粒度区域与第二细粒度区域之间没有重叠时，执行第一操作。

在一种可能的实现方式中，所述非可操作区域可以包括禁止操作区域和非禁止操作区域。如果第一操作为写操作，当目标操作数的部分数据不可修改时，可将该部分数据所在的存储区域设定为禁止操作区域，以避免误修改该部分数据；如果正在进行的第二操作为读取第一操作之前的数据的读操作(读后写)，则可将第二操作所在的一个或多个细粒度区域设定为非禁止操作区域，当第二操作完成对非禁止操作区域的读取后，可将该非禁止操作区域变更为可操作区域。本公开对非可操作区域的分类及划分方式不作限制。

在一种可能的实现方式中，所述非可操作区域可以为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域在所述非可操作区域内的位置随所述第二操作的操作位置更新，所述方法还可包括：当所述第二操作所针对的第二细粒度区域移出所述非可操作区域后，更新所述非可操作区域的位置。

也就是说，包括第二细粒度区域在内的非可操作区域可以不随第二操作所针对的第二细粒度区域的更新而更新，当第二操作所针对的第二细粒度区域移出非可操作区域后，更新非可操作区域的位置。例如，非可操作区域可以为包括所述第二细粒度区域在内的Q个细粒度区域(Q为大于1的整数)，当前的非可操作区域包括第2至第2+Q-1个细粒度区域。当第二操作在非可操作区域内执行完Q个细粒度区域后，移出非可操作区域，则非可操作区域的位置随着第二操作所针对的细粒度区域的位置进行更新，更新后的非可操作区域包括第2+Q个至2+Q+Q-1个细粒度区域。其中，Q的大小可以根据需求任意确定。

图6a和图6b示出根据本公开实施例的处理器操作方法的应用场景的示意图。如图6a所示，目标存储区域30d包括8个细粒度区域，其中，可操作区域包括5个细粒度区域(细粒度区域31d、细粒度区域35d、细粒度区域36d、细粒度区域37d和细粒度区域38d)，非可操作区域M0包括3个细粒度区域(细粒度区域32d、细粒度区域33d和细粒度区域34d)。其中，第二操作当前所针对的第二细粒度区域为细粒度区域32。

------------------------------------------------------------------------------------------

当第二操作执行完对细粒度区域32d的操作后，第二操作当前所针对的第二细粒度区域为细粒度区域33d，此时，第二操作当前所针对的第二细粒度区域(细粒度区域33d)未移出非可操作区域，不更新非可操作区域的位置；当第二操作执行完对细粒度区域33d的操作后，第二操作当前所针对的第二细粒度区域为细粒度区域34d，此时，第二操作当前所针对的第二细粒度区域(细粒度区域34d)还未移出非可操作区域，不更新非可操作区域的位置；当第二操作执行完对细粒度区域34d的操作后，第二操作当前所针对的第二细粒度区域为细粒度区域35d，此时，第二操作当前所针对的第二细粒度区域(细粒度区域35d)已移出非可操作区域，更新非可操作区域的位置到细粒度区域(35d、36d和37d)。需要说明的是，本公开对非可操作区域的大小不做限定。

如图6b所示，更新非可操作区域的位置后，在目标存储区域30d中可操作区域包括5个细粒度区域(细粒度区域31d、细粒度区域32d、细粒度区域33d、细粒度区域34d和细粒度区域38d)，非可操作区域M0包括3个细粒度区域(细粒度区域35d、细粒度区域36d和细粒度区域37d)。

也就是说，当非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域时，可以设定第二细粒度区域在非可操作区域中的位置(例如中间位置、最后位置等)，非可操作区域的位置随第二操作的操作位置而更新。例如，非可操作区域可以为包括所述第二细粒度区域在内的Q个细粒度区域，当前的非可操作区域包括第2至第2+Q-1个细粒度区域，第二细粒度区域在非可操作区域内的设定位置为第R个(其中R≤Q)。当第二操作执行完成对当前所针对的细粒度区域的操作后，第二操作开始执行针对下一个细粒度区域的操作，此时，非可操作区域的位置随第二操作的操作位置而更新，更新后的非可操作区域包括第2+1至第2+Q个细粒度区域。其中，Q的大小及R的取值可根据需求确定。本公开对非可操作区域包括的细粒度区域的数量、第二细粒度区域位于非可操作区域内的位置均不作限制。

图7a和图7b示出根据本公开实施例的处理器操作方法的应用场景的示意图。如图7a所示，目标存储区域40中包括8个细粒度区域，其中，可操作区域包括5个细粒度区域(细粒度区域41、细粒度区域45、细粒度区域46、细粒度区域47和细粒度区域48)，非可操作区域M1包括3个细粒度区域(细粒度区域42、细粒度区域43和细粒度区域44)。其中，第二操作当前所针对的第二细粒度区域设定为位于非可操作区域M1的第二个细粒度区域，即细粒度区域43。

当第二操作执行完对细粒度区域43的操作后，第二操作当前所针对的第二细粒度区域为细粒度区域44，此时，非可操作区域的位置随第二操作的操作位置而更新，以使第二操作当前所针对的第二细粒度区域位于非可操作区域M1的第二个细粒度区域。

如图7b所示，更新非可操作区域的位置后的目标存储区域40中，可操作区域包括5个细粒度区域(细粒度区域41、细粒度区域42、细粒度区域46、细粒度区域47和细粒度区域48)，非可操作区域M1包括3个细粒度区域(细粒度区域43、细粒度区域44和细粒度区域45)。

例如，第二操作为写操作，可将目标操作数写入循环缓冲存储区域51中，其地址指针point从start_addr开始，依次向下存储数据，直到end_addr，即占满循环缓冲存储区域51的存储空间，此时，地址指针point跳回到start_addr，判断该地址是否被所需同步的第一操作使用完毕，如果使用完毕，则将数据存储到该地址，覆盖原有数据，之后地址指针point依次向下移动，直到end_addr，此时，可重新覆盖数据，循环上述过程。

在本实施例中，采用循环缓冲存储区域来存储数据，既可节省数据存储空间，也可提高存储空间使用效率。

步骤S13g可包括：在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，判断所述第一细粒度区域的状态标识是否为已完成状态；若是，则执行所述第一操作。

在一种可能的实现方式中，细粒度区域可包括状态标识，状态标识可包括针对细粒度区域的操作处于已完成状态或未完成状态。例如，状态标识可使用0和1来表示，其中，0表示针对细粒度区域的操作处于未完成状态，1表示针对细粒度区域的操作处于已完成状态，或者0表示针对细粒度区域的操作处于已完成状态，1表示针对细粒度区域的操作处于未完成状态。本公开对状态标识的表示方式不作限制。

在一种可能的实现方式中，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态，步骤S13g可包括：判断所述第一细粒度区域的状态标识是否为已完成状态；若是，则在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

在一种可能的实现方式中，所述第一操作和所述第二操作的目标操作数一致，所述目标存储区域为所述目标操作数的存储区域。

在一种可能的实现方式中，当第一操作的目标操作数和第二操作的目标操作数一致时，目标存储区域可以是一个目标操作数的存储区域。此目标操作数的存储区域即为目标存储区域。将目标存储区域划分为多个细粒度区域后，根据本公开实施例中的方法，可以使得操作相同目标操作数的两个操作并行执行而不影响各操作的执行结果。

在本实施例中，可使用本公开实施例中的方法，实现针对相同操作数的两个操作的并行执行，提高处理器的执行效率。

在一种可能的实现方式中，所述目标存储区域为第一操作中第一操作数的第一存储区域和第二操作中第二操作数的第二存储区域之间的重叠区域。

在一种可能的实现方式中，当两个操作数的存储区域存在重叠区域时，目标存储区域即为重叠区域。可以将两个操作的存储区域中的重叠区域划分为多个细粒度区域，根据本公开实施例中的方法，可以使得操作数的存储区域有重叠区域的两个操作并行执行而不影响各操作的执行结果。

在本实施例中，当两个操作的操作数的存储区域有重叠时，可使用本公开实施例中的方法实现两个操作的并行执行，提高处理器的执行效率。

在一种可能的实现方式中，当将存储装置的整体存储区域划分为多个细粒度区域时，针对整体存储区域中任意目标存储区域的任意操作，且无论目标存储区域为第一操作和第二操作的相同目标操作数的存储区域，还是目标存储区域为第一操作中第一操作数的存储区域和第二操作中第二操作数的存储区域的重叠区域，都可以根据整体存储区域的细粒度划分结果，确定目标存储区域中的细粒度区域。任意操作的任意操作数在整体存储区域的中存储区域，具有相同尺寸的细粒度区域。

在本实施例中，将目标存储区域所在的整体存储区域划分为多个细粒度区域，针对整体存储区域中任意目标存储区域的任意操作，都可以按照相同的细粒度尺寸执行，不同操作按照本公开实施例中的方法并行执行时，可以更加方便地同步，提高操作并行度，进而提高处理器的处理效率。

在一种可能的实现方式中，所述方法还可包括：

根据第一操作中携带的第一细粒度划分信息，将所述第一操作中第一操作数的第一存储区域划分为多个细粒度区域，及

根据第二操作中携带的第二细粒度划分信息，将所述第二操作中第二操作数的第二存储区域划分为多个细粒度区域。

在一种可能的实现方式中，根据第一操作中携带的第一细粒度划分信息，将第一操作数的第一存储区域划分为多个第一细粒度区域。第一操作数所在的整体存储区域中的其他区域，可不进行细粒度的划分，也可按照其他操作携带的细粒度划分信息，进行细粒度的划分。本公开对此不做限定。

可以理解的是，当第二操作的第二操作数与第一操作的第一操作数一致时，第一存储区域与第二存储区域完全重叠。而第一细粒度划分信息和第二细粒度划分信息可以一致，也可以不一致。当第一细粒度划分信息和第二细粒度划分信息不一致时，第一存储区域可同时按照第二细粒度划分信息进行细粒度划分。即，针对同一个存储区域，不同的操作可以将其划分为不同尺寸或数量的多个细粒度区域。此时，可根据第一操作当前所针对的第一细粒度区域的物理地址，以及第二操作当前所述针对的第二细粒度区域之间的物理地址，判断第一细粒度区域与第二细粒度区域是否重叠，并根据判断结果进行第一操作和第二操作的并行执行。

在本实施例中，根据第一操作中携带的第一细粒度划分信息，将所述第一操作中第一操作数的第一存储区域划分为多个细粒度区域，及根据第二操作中携带的第二细粒度划分信息，将所述第二操作中第二操作数的第二存储区域划分为多个细粒度区域。根据操作中携带的细粒度划分信息进行细粒度的划分，可使得细粒度的划分结果，更加符合各操作的处理需求，操作并行更加灵活。

图3g示出根据本公开实施例的处理器操作装置的框图。如图3g所示，所述处理器操作装置包括：

操作判断模块71g，用于在第一操作为针对目标存储区域的操作时，判断是否存在正在进行的针对所述目标存储区域的第二操作，所述目标存储区域包括至少一个细粒度区域；

重叠判断模块72g，用于在存在所述第二操作时，判断所述第一操作当前所针对的第一细粒度区域与所述第二操作当前所针对的第二细粒度区域之间是否有重叠；

执行模块73g，用于在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

在一种可能的实现方式中，所述装置还包括：位置记录模块，用于记录所述第一操作当前操作的第一细粒度区域的第一位置信息和所述第二操作当前操作的第二细粒度区域的第二位置信息，所述执行模块73，包括：第一执行子模块，用于当所述第一位置信息与所述第二位置信息不一致时，执行所述第一操作。

在一种可能的实现方式中，所述第一位置信息包括第一操作已操作完成的细粒度区域的第一数量，所述第二位置信息包括第二操作已操作完成的细粒度区域的第二数量，第一执行子模块，还用于：当所述第一操作为所述第二操作之后的操作，且所述第一数量小于所述第二数量时，执行所述第一操作。

在一种可能的实现方式中，所述目标存储区域包括可操作区域和非可操作区域，所述重叠判断模块72，包括：判断子模块，用于在存在所述第二操作，且所述第一操作当前所针对的第一细粒度区域位于所述可操作区域内时，判断所述第一操作当前所针对的第一细粒度区域与所述第二操作当前所针对的第二细粒度区域之间是否重叠。

在一种可能的实现方式中，所述非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域在所述非可操作区域内的位置随所述第二操作的操作位置更新，所述装置还包括：

更新模块，用于当所述第二操作所针对的第二细粒度区域移出所述非可操作区域后，更新所述非可操作区域的位置。

在一种可能的实现方式中，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态，

所述执行模块73g，包括：第一状态判断子模块，用于在所述第一细粒度区域与所述第二细粒度区域之间不重叠时，判断所述第一细粒度区域的状态标识是否为已完成状态；第二执行子模块，用于在所述第一细粒度区域的状态标识为已完成状态时，执行所述第一操作。

所述执行模块73g，包括：第二状态判断子模块，用于判断所述第一细粒度区域的状态标识是否为已完成状态；第三执行子模块，用于在所述第一细粒度区域的状态标识为已完成状态，且所述第一细粒度区域与所述第二细粒度区域之间不重叠时，执行所述第一操作。

在一种可能的实现方式中，所述装置还包括：

第二设定模块，用于根据第一操作中携带的第一细粒度划分信息，将所述第一操作中第一操作数的第一存储区域划分为多个细粒度区域，及

第三设定模块，用于根据第二操作中携带的第二细粒度划分信息，将所述第二操作中第二操作数的第二存储区域划分为多个细粒度区域。

在一种可能的实现方式中，所述存储器件包括：多组存储单元，每一组所述存储单元与所述人工智能芯片通过总线连接，所述存储单元为：DDR SDRAM；所述人工智能芯片包括：DDR控制器，用于对每个所述存储单元的数据传输与数据存储的控制；所述接口装置为：标准PCIE接口。

A1、一种处理器操作方法，所述方法包括：

在第一操作为针对目标存储区域的操作时，判断是否存在正在进行的针对所述目标存储区域的第二操作，所述目标存储区域包括至少一个细粒度区域；

在存在所述第二操作时，判断所述第一操作当前所针对的第一细粒度区域与所述第二操作当前所针对的第二细粒度区域之间是否有重叠；

A2、根据权利要求A1所述的方法，所述方法还包括：

A9、根据权利要求A1所述的方法，所述目标存储区域包括可操作区域和非可操作区域，在存在所述第二操作时，判断所述第一操作当前所针对的第一细粒度区域与所述第二操作当前所针对的第二细粒度区域之间是否重叠，包括：

在存在所述第二操作，且所述第一操作当前所针对的第一细粒度区域位于所述可操作区域内时，判断所述第一操作当前所针对的第一细粒度区域与所述第二操作当前所针对的第二细粒度区域之间是否重叠。

当所述第二操作所针对的第二细粒度区域移出所述非可操作区域后，更新所述非可操作区域的位置。

所述非可操作区域的位置随所述第二操作的操作位置更新。

若是，则执行所述第一操作。

A14、根据权利要求A1所述的方法，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态；

判断所述第一细粒度区域的状态标识是否为已完成状态；

A15、根据权利要求A1所述的方法，所述第一操作和所述第二操作的目标操作数一致，所述目标存储区域为所述目标操作数的存储区域。

A16、根据权利要求A1所述的方法，所述目标存储区域为第一操作中第一操作数的第一存储区域和第二操作中第二操作数的第二存储区域之间的重叠区域。

A19、一种处理器操作装置，所述装置包括：

操作判断模块，用于在第一操作为针对目标存储区域的操作时，判断是否存在正在进行的针对所述目标存储区域的第二操作，所述目标存储区域包括至少一个细粒度区域；

重叠判断模块，用于在存在所述第二操作时，判断所述第一操作当前所针对的第一细粒度区域与所述第二操作当前所针对的第二细粒度区域之间是否有重叠；

A20、根据权利要求A19所述的装置，所述装置还包括：

A21、根据权利要求A19所述的装置，所述第一操作和所述第二操作中的至少一个操作为写操作。

A22、根据权利要求A19所述的装置，所述细粒度区域的尺寸和/或数量是根据设定长度的数据所在区域、设定维数的数据所在区域中的至少一种确定的。

A23、根据权利要求A19所述的装置，所述细粒度区域的尺寸和/或数量是根据硬件计算能力、硬件带宽中的至少一种确定的。

A24、根据权利要求A19所述的装置，所述第一操作为第一处理指令中的操作，所述第二操作为第二处理指令中的操作，所述第二处理指令为指令队列中在所述第一处理指令之前的处理指令。

A25、根据权利要求A19-A24中任意一项所述的装置，所述装置还包括：

所述执行模块，包括：

A26、根据权利要求A25所述的装置，所述第一位置信息包括第一操作已操作完成的细粒度区域的第一数量，所述第二位置信息包括第二操作已操作完成的细粒度区域的第二数量，

所述第一执行子模块，还用于：

A27、根据权利要求A19所述的装置，所述目标存储区域包括可操作区域和非可操作区域，所述重叠判断模块，包括：

判断子模块，用于在存在所述第二操作，且所述第一操作当前所针对的第一细粒度区域位于所述可操作区域内时，判断所述第一操作当前所针对的第一细粒度区域与所述第二操作当前所针对的第二细粒度区域之间是否重叠。

A28、根据权利要求A27所述的装置，所述非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域在所述非可操作区域内的位置随所述第二操作的操作位置更新，所述装置还包括：

A29、根据权利要求A27所述的装置，所述非可操作区域为包括所述第二细粒度区域在内的多个细粒度区域，且所述第二细粒度区域位于所述非可操作区域内的设定位置，

所述非可操作区域的位置随所述第二操作的操作位置更新。

A30、根据权利要求A19所述的装置，所述目标存储区域包括：循环缓冲存储区域。

A31、根据权利要求A19所述的装置，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态，

所述执行模块，包括：

A32、根据权利要求A19所述的装置，所述细粒度区域包括状态标识，所述状态标识包括针对所述细粒度区域的操作处于已完成状态或未完成状态，

所述执行模块，包括：

A33、根据权利要求A19所述的装置，所述第一操作和所述第二操作的目标操作数一致，所述目标存储区域为所述目标操作数的存储区域。

A34、根据权利要求A19所述的装置，所述目标存储区域为第一操作中第一操作数的第一存储区域和第二操作中第二操作数的第二存储区域之间的重叠区域。

A35、根据权利要求A19-A34中任意一项所述的装置，所述装置还包括：

A36、根据权利要求A19-A35中任意一项所述的装置，所述装置还包括：

A37、一种人工智能芯片，所述人工智能芯片包括如权利要求A19-A36中任意一项所述的处理器操作装置。

A38、一种电子设备，所述电子设备包括如权利要求A37所述的人工智能芯片。

A39、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如权利要求A37所述的人工智能芯片；

所述存储器件，用于存储数据；

所述控制器件，用于对所述人工智能芯片的状态进行监控。

A40、根据权利要求A39所述的板卡，所述存储器件包括：多组存储单元，每一组所述存储单元与所述人工智能芯片通过总线连接，所述存储单元为：DDR SDRAM；

所述人工智能芯片包括：DDR控制器，用于对每个所述存储单元的数据传输与数据存储的控制；

所述接口装置为：标准PCIE接口。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

一种数据处理方法，其特征在于，所述方法包括：

在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，获取所述描述符的内容，所述描述符用于指示张量的形状；

根据所述描述符的内容，执行所述第一处理指令。
根据权利要求1所述的方法，其特征在于，根据所述描述符的内容，执行所述第一处理指令，包括：

根据所述描述符的内容，确定与所述第一处理指令的操作数对应的数据在数据存储空间中的数据地址；

根据所述数据地址，执行与所述第一处理指令对应的数据处理。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述第一处理指令为描述符注册指令时，获取所述第一处理指令中描述符的注册参数，所述注册参数包括所述描述符的标识、张量形状以及描述符所指示的张量数据的内容中的至少一种；

根据所述描述符的注册参数，确定所述描述符的内容在描述符存储空间中的第一存储区域，以及所述描述符所指示的张量数据的内容在数据存储空间中的第二存储区域；

根据所述描述符的注册参数以及所述第二存储区域，确定所述描述符的内容，以建立所述描述符与所述第二存储区域之间的对应关系；

将所述描述符的内容存储到所述第一存储区域。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述第一处理指令为描述符注销指令时，获取所述第一处理指令中描述符的标识；

根据所述描述符的标识，分别释放所述描述符在描述符存储空间中的存储区域以及所述描述符所指示的张量数据的内容在数据存储空间中的存储区域。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述第一处理指令为描述符修改指令时，获取所述第一处理指令中描述符的修改参数，所述修改参数包括所述描述符的标识、待修改的张量形状以及描述符所指示的张量数据的内容中的至少一种；

根据所述描述符的修改参数，确定所述描述符的待更新内容；

根据待更新内容，更新描述符存储空间中的所述描述符的内容和/或数据存储空间中张量数据的内容。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述描述符的标识，确定是否存在未完成处理的第二处理指令，所述第二处理指令包括指令队列中在所述第一处理指令之前的，且操作数中具有所述描述符的标识的处理指令；

在存在未完成处理的第二处理指令时，阻塞或缓存所述第一处理指令。
一种数据处理装置，其特征在于，所述装置包括：

内容获取模块，用于在解码后的第一处理指令的操作数包括描述符的标识时，根据所述描述符的标识，获取所述描述符的内容，所述描述符用于指示张量的形状；

指令执行模块，用于根据所述描述符的内容，执行所述第一处理指令。
一种神经网络芯片，其特征在于，所述芯片包括如权利要求7所述的数据处理装置。
一种电子设备，其特征在于，所述电子设备包括如权利要求8所述的神经网络芯片。
一种板卡，其特征在于，所述板卡包括：存储器件、接口装置和控制器件以及如权利要求8所述的神经网络芯片；

其中，所述神经网络芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；

所述存储器件，用于存储数据；

所述接口装置，用于实现所述神经网络芯片与外部设备之间的数据传输；

所述控制器件，用于对所述神经网络芯片的状态进行监控。