WO2022094964A1

WO2022094964A1 - 处理指令的方法以及图计算装置

Info

Publication number: WO2022094964A1
Application number: PCT/CN2020/127243
Authority: WO
Inventors: 朱凡; 周若愚; 孙文博; 周昔平
Original assignee: 华为技术有限公司
Priority date: 2020-11-06
Filing date: 2020-11-06
Publication date: 2022-05-12
Also published as: EP4227801A4; EP4227801A1; CN116348850A; US20230297385A1

Abstract

一种处理指令的方法以及图计算装置，能够提高投机执行的效率和降低投机失败的代价。该图计算装置基于数据流架构，其包括信息缓冲器IB和加载队列LQ，IB用于缓存指令队列，LQ用于缓存读取指令队列。其中，IB中包括投机位和投机标识ID域段，投机位用于指示当前指令是否为可投机执行的指令，投机ID域段用于存储当前指令的一次投机操作的投机ID。该方法包括：IB将第一指令发射至LQ，第一指令用于请求读取数据，第一指令符合第一预设条件，第一预设条件包括：第一指令在IB中的投机位设置为是（S401）；IB确定第一投机ID，并将第一投机ID存入第一指令在IB的投机ID域段，第一投机ID用于指示当前投机操作（S402）。

Description

处理指令的方法以及图计算装置

技术领域

本申请涉及图计算领域，尤其涉及处理指令的方法以及图计算装置。

背景技术

数据流架构是一种计算机系统体系结构。有别于业界主流的冯·诺依曼架构以程序计数器指示指令的执行顺序，数据流架构通过判断程序参数的有效性来决定执行顺序。这种方式将指令对控制流的依赖转换为对数据流的依赖，从而使得数据流架构在并行度的利用上具有巨大的优势。但传统的数据流架构还需要对控制流进行支持，这种数据流+控制流的计算机架构统称为图计算装置或者图计算架构(graphflow architecture)。

在执行指令序列的过程中，内存别名(memory aliasing)是影响硬件存取效率的常见问题。其中，内存别名是指两个指针同时指向一个存储地址的情况。在冯·诺依曼架构中，程序的执行顺序必须遵守指令间的真依赖，例如在下面的执行指令的例子中：

指令1：R3<＝R1+R2；

指令2：R4<＝R5+R3。

由于指令2中的R3需要依赖于指令1的完成，因此指令2必须等到指令1的结果算出之后才能开始执行。在这个例子中，指令2和指令1之间存在依赖关系，但依赖关系是静态的，处理器很容易识别。这种对于某一个值的依赖关系被称之为数据依赖。但是对于存取指令，还存在一种内存别名引起的依赖关系，其并不能在执行程序之前被处理器预先识别，因此经常影响硬件的存取效率。例如，如下面的例子所示：

指令3：store R1，2(R2)；

指令4：load R3，4(R4)。

其中，指令3表示将寄存器R1的数据存入地址(R2+2)中，指令4表示将地址(R4+4)中的数据读取到寄存器R3中。由于存取指令间的依赖并不能通过识别寄存器编号来预先判断，而是要等到R2+2与R4+4的结果算出才知道依赖关系是否存在。因此两条指令之间存在顺序依赖，即指令3执行完之后才能执行指令4，如果地址不同，则不存在顺序依赖。即两条指令的执行顺序不会影响程序的正确性。因此，指令4需要延迟直到存取指令的依赖关系确立后再发射。然而在大部分情况下，R2+2是不等于R4+4的，也就是说，大部分情况下顺序依赖是不存在的。指令4的延迟在这种情况下就会降低效率。

为了解决这个问题，主流的计算机系统都会采用投机执行的方式，也就是在还未得到地址的情况下，假设顺序依赖不成立，从而投机执行读取指令。在真实应用中，大部分顺序依赖都不成立，那么投机执行的读取指令不会受到任何影响，并且节省了大量等待计算地址的时间。在小部分情况下，若顺序依赖成立，那么投机行为作废，计算机系统清除并重新进行读取操作和后续已经进入流水线的其它操作。

在投机执行的方式中，若投机执行失败，则会清空流水线中投机失败指令之后的所有指令。这将导致一部分和投机失败没有关系的指令也被重新执行，从而导致性能损失。类似地，基于数据流架构的图计算装置在执行程序时也面临着内存别名问题，因此在数据流架构中如何提高投机执行的效率亟待解决。

发明内容

本申请提供一种处理指令的方法以及图计算装置，能够提高投机执行的效率和降低投机失败的代价。

第一方面，提供了一种处理指令的方法，所述方法应用于图计算装置，所述图计算装置基于数据流架构，所述图计算装置包括至少一个处理引擎PE和加载存储单元LSU，所述PE包括信息缓冲器IB，所述IB用于缓存指令队列，所述PE用于执行所述IB中缓存的指令；其中，所述IB中包括投机位和投机标识ID域段，所述投机位用于指示当前指令是否为可投机执行的指令，所述投机ID域段用于存储当前指令的一次投机操作的投机ID，所述LSU包括加载队列LQ，所述LQ用于缓存读取指令队列；所述方法包括：所述IB将第一指令发射至所述LQ，所述第一指令用于请求读取数据，所述第一指令符合第一预设条件，所述第一预设条件包括：所述第一指令在所述IB中的投机位设置为是；所述IB确定第一投机ID，并将所述第一投机ID存入所述第一指令在所述IB的投机ID域段，所述第一投机ID用于指示当前投机操作。

其中，数据流架构执行基于数据依赖图的指令，数据依赖图可以指由节点和连接节点的有向弧组成的数据流图。节点表示执行的运算或功能，有向弧表示节点被执行的次序。

其中，投机操作可以指在一条指令存在依赖于另一条指令的可能性且另一条指令尚未执行的情况下，首先执行该指令的操作。若另一条指令在执行之后，确认其与该指令不存在依赖关系，则投机成功。若另一条指令在执行之后，确认其与该指令存在依赖关系，则投机失败。

通过在图计算装置的IB中为指令设置投机位和投机ID域段，以便于图计算装置根据投机位判断该指令是否可以执行投机操作，并通过投机ID指示该次投机操作，从而能够利用投机ID标记投机源头，在出现投机错误时，只清除和重新执行与该投机ID有关联关系的指令，而避免重新执行与投机ID无关的指令，从而减少了投机错误的代价，提高了数据流架构执行存取指令的投机操作的效率。

可选地，投机位为是的情形包括第一指令对其它指令存在可投机依赖的情形。例如，第一指令和第三指令之间存在可投机依赖关系，所述可投机依赖关系表示所述第一指令存在依赖于所述第三指令的可能性，且所述第一指令可投机执行。

可选地，所述第一指令和所述第三指令符合第二预设条件，所述第二预设条件包括所述第一指令的理想执行顺序在所述第三指令之后，所述第一指令对所述第三指令有存在内存依赖关系的可能性，所述内存依赖关系指存取指令之间存在由于操作同一地址导致的顺序依赖关系。

结合第一方面，在一种可能的实现方式中，所述LQ中包括所述投机ID域段，所述方法还包括：在所述IB将所述第一指令发射至所述LQ之后，所述LQ为所述第一指令分配所述第一投机ID，并将所述第一投机ID写入所述第一指令在所述LQ的投机ID域段；所述LQ向所述IB发送所述第一投机ID；所述IB确定第一投机ID，包括：所述IB从所述LQ接收所述第一投机ID。

结合第一方面，在一种可能的实现方式中，所述投机ID为独热码。

投机ID采用了独热码，由于两个独热码在相或之后得到的新的投机ID依然可以保留之前的投机ID的信息，因此，在投机操作失败后，利用独热码可以快速找到投机操作的源头，以便于清除和重新执行与该投机操作有关的指令，以提高数据流架构执行存取指令的投机操作的效率。

结合第一方面，在一种可能的实现方式中，所述方法还包括：所述LQ根据所述第一指令，从所述SB或者内存查找并获取所述第一指令请求读取的数据。

可选地，所述内存可以为片上内存，也可以为片外内存。或者，可以理解为，所述内存为除所述SB外的其它存储设备。

结合第一方面，在一种可能的实现方式中，还包括：在获取所述第一指令请求读取的数据之后，所述LQ将所述第一投机ID传输至第二指令在所述IB中的投机ID域段，所述第二指令依赖于所述第一指令。

在投机操作之后，在与第一指令存在依赖关系的第二指令之中也携带该第一投机ID，以便于投机操作失败之后根据第一投机ID寻找与该第一投机ID关联的指令，从而提高投机操作的效率。

可选地，若所述第二指令还依赖于第四指令，所述第四指令为已进行投机操作的指令，且该投机操作对应于第三投机ID。则所述IB可以基于第一投机ID和第三投机ID生成第四投机ID，并将所述第四投机ID存储至第二指令在所述IB中的投机ID域段。

其中，利用投机ID为独热码的特性，第四投机ID可以保留第一投机ID和第三投机ID的信息，即第四投机ID可以同时指示第一投机ID和第三投机ID对应的投机操作，从而根据第四投机ID可以追溯多个投机操作，以便于任一个投机操作失败之后，能够根据第四投机ID针对性地追溯并清除与该投机操作有关的指令，减少投机失败的代价。

结合第一方面，在一种可能的实现方式中，所述IB中还包括投机标记位，所述投机标记位用于指示当前指令是否已经被投机发射，所述方法还包括：在所述IB向所述LQ发射所述第一指令之后，所述IB将所述第一指令的投机标记位设置为是。

结合第一方面，在一种可能的实现方式中，所述IB中还包括投机标记位，所述投机标记位用于指示当前指令是否已经被投机发射，所述方法还包括：在获取所述第一指令请求读取的数据之后，所述IB发射第二指令，所述第二指令依赖于所述第一指令；在发射所述第二指令之后，所述IB在所述第二指令的投机标记位设置为是。

结合第一方面，在一种可能的实现方式中，所述IB中还包括依赖有效位和依赖存在位，所述依赖有效位用于指示当前指令是否依赖于另一条指令执行完成之后才执行，所述依赖存在位用于指示当前指令所依赖的指令是否执行完成；所述第一预设条件还包括：所述第一指令在所述IB中的依赖有效位设置为是，依赖存在位设置为否。

结合第一方面，在一种可能的实现方式中，所述IB中还包括至少一个参数域、至少一个参数域有效位以及至少一个参数域存在位，所述至少一个参数域与所述至少一个参数域有效位一一对应，所述至少一个参数域有效位与所述至少一个参数域存在位一一对应，所述参数域用于存储当前指令的输入数据，所述参数域有效位用于指示所述参数域有效位对应的参数域是否有效，所述参数域存在位用于指示数据是否已存在于所述参数域存在位对应的参数域中；其中，所述第一预设条件还包括：所述至少一个参数域有效位中的第一参数域有效位设置为是，所述第一参数域有效位对应的参数域存在位设置为是，所述第一参数域有效位为所述至少一个参数域有效位中的任意一个有效位。

结合第一方面，在一种可能的实现方式中，所述LSU中还包括存储缓冲器SB，所述SB用于缓存存储指令队列，所述方法还包括：所述IB根据所述第三指令的存储地址和所述第一指令的读取地址，确定所述第一投机ID对应的所述第一指令的投机操作是否错误；在所述第一投机ID对应的所述第一指令的投机操作错误的情况下，所述IB重新向所述LQ发射所述第一指令。

结合第一方面，在一种可能的实现方式中，所述方法还包括：所述IB根据所述第三指令的存储地址和所述第一指令的读取地址，确定所述第一投机ID对应的所述第一指令的投机操作是否错误；在所述第一投机ID对应的所述第一指令的投机操作错误的情况下，所述IB重新向所述LQ发射所述第一指令。

结合第一方面，在一种可能的实现方式中，所述方法还包括：在所述IB重新向所述LQ发射所述第一指令之后，所述LQ重新为所述第一指令分配第二投机ID，并将所述第二投机ID写入所述第一指令在所述LQ的投机ID域段；所述LQ将所述第二投机ID传输至所述第一指令在所述IB的投机ID域段。

在本申请实施例中，一个投机ID用于指示一次投机操作。因此，当重新执行第一指令时，LQ将为第一指令分配新的投机ID，以便于利用新的投机ID重新追踪与新的投机操作相关的指令，以提高投机操作的效率。

结合第一方面，在一种可能的实现方式中，所述方法还包括：在所述第一投机ID的对应的投机操作错误的情况下，所述IB向所述至少一个PE、所述LQ或所述SB广播所述第一投机ID；所述至少一个PE、所述LQ或所述SB将所述第一投机ID与自身正在执行的指令的投机ID进行比较，以判断两者是否存在关联关系；在存在关联关系的情况下，所述至少一个PE、所述LQ或所述SB停止执行所述正在执行的指令，并停止传输所述正在执行的指令的数据或依赖关系。。

在第一指令的投机操作错误的情况下，IB向图计算装置中的流水线广播第一指令的第一投机ID，以便于只清除与投机操作有关的指令，而避免清除在投机操作之后的与投机操作无关的指令，从而降低了投机失败的代价，提高了投机操作的效率。

结合第一方面，在一种可能的实现方式中，所述IB中还包括时间戳，所述时间戳用于指示存取指令的理想执行顺序，所述存取指令包括存储指令或者读取指令。

图计算装置执行数据依赖图中的指令，在编译数据依赖图时，为指令中的存取指令分配时间戳，以指示存取指令之间的理想执行顺序，时间戳可以作为执行指令的辅助信息，以支持存取指令的正确执行，从而提升了基于数据流架构的内存存取效率。

结合第一方面，在一种可能的实现方式中，所述SB和所述LQ中也包括所述时间戳。

第二方面，提供了一种图计算装置，所述图计算装置基于数据流架构，所述图计算装置包括至少一个处理引擎PE和加载存储单元LSU，所述PE包括信息缓冲器IB，所述IB用于缓存指令队列，所述PE用于执行所述IB中缓存的指令；其中，所述IB中包括投机位和投机标识ID域段，所述投机位用于指示当前指令是否为可投机执行的指令，所述投机ID域段用于存储当前指令的一次投机操作的投机ID，所述LSU包括加载队列LQ，所述LQ用于缓存读取指令队列。

结合第二方面，在一种可能的实现方式中，所述投机ID域段中的投机ID为独热码。

结合第二方面，在一种可能的实现方式中，所述IB用于执行以下操作：所述IB将第一指令发射至所述LQ，所述第一指令用于请求读取数据，所述第一指令符合第一预设条件，所述第一预设条件包括：所述第一指令在所述IB中的投机位设置为是；所述IB确定第一投机ID，并将所述第一投机ID存入所述第一指令在所述IB的投机ID域段，所述第一投机ID用于指示当前投机操作。

结合第二方面，在一种可能的实现方式中，所述LQ中包括所述投机ID域段，所述LQ用于：在所述IB将所述第一指令发射至所述LQ之后，为所述第一指令分配所述第一投机ID，并将所述第一投机ID写入所述第一指令在所述LQ的投机ID域段；向所述IB发送所述第一投机ID；所述IB具体用于从所述LQ接收所述第一投机ID。

结合第二方面，在一种可能的实现方式中，所述LQ用于根据所述第一指令，从所述SB或者内存查找并获取所述第一指令请求读取的数据。

结合第二方面，在一种可能的实现方式中，所述IB还用于：在获取所述第一指令请求读取的数据之后，发射第二指令，所述第二指令依赖于所述第一指令；以及在发射所述第二指令之后，在所述第二指令的投机标记位设置为是。

结合第二方面，在一种可能的实现方式中，所述IB中还包括依赖有效位和依赖存在位，所述依赖有效位用于指示当前指令是否依赖于另一条指令执行完成之后才执行，所述依赖存在位用于指示当前指令所依赖的指令是否执行完成；

结合第二方面，在一种可能的实现方式中，所述第一预设条件还包括：所述第一指令在所述IB中的依赖有效位设置为是，依赖存在位设置为否。

结合第二方面，在一种可能的实现方式中，所述LSU中还包括存储缓冲器SB，所述SB用于缓存存储指令队列。

结合第二方面，在一种可能的实现方式中，所述IB还用于：在发射所述第一指令之后，向所述SB发射第三指令，所述第三指令为存储指令，其中，所述第一指令和所述第三指令符合第二预设条件，所述第二预设条件包括所述第一指令的理想执行顺序在所述第三指令之后，所述第一指令对所述第三指令有存在内存依赖关系的可能性，所述内存依赖关系指存取指令之间存在由于操作同一地址导致的顺序依赖关系；在发射所述第三指令之后，将所述第三指令的存储地址发送至所述LQ。

结合第二方面，在一种可能的实现方式中，所述IB还用于：根据所述第三指令的存储地址和所述第一指令的读取地址，确定所述第一投机ID对应的所述第一指令的投机操作是否错误；在所述第一投机ID对应的所述第一指令的投机操作错误的情况下，重新向所述LQ发射所述第一指令。

结合第二方面，在一种可能的实现方式中，所述LQ还用于：在所述IB重新向所述 LQ发射所述第一指令之后，重新为所述第一指令分配第二投机ID，并将所述第二投机ID写入所述第一指令在所述LQ的投机ID域段；将所述第二投机ID传输至所述第一指令在所述IB的投机ID域段。

结合第二方面，在一种可能的实现方式中，所述IB还用于：在所述第一投机ID的对应的投机操作错误的情况下，所述IB向所述至少一个PE、所述LQ或所述SB广播所述第一投机ID；所述至少一个PE、所述LQ或所述SB用于：将所述第一投机ID与自身正在执行的指令的投机ID进行比较，以判断两者是否存在关联关系；以及在存在关联关系的情况下，停止执行所述正在执行的指令，并停止传输所述正在执行的指令的数据或依赖关系。

结合第二方面，在一种可能的实现方式中，所述IB中还包括时间戳，所述时间戳用于指示存取指令的理想执行顺序，所述存取指令包括存储指令或者读取指令。

结合第二方面，在一种可能的实现方式中，所述SB和所述LQ中也包括所述时间戳。

第三方面，提供了一种处理指令的方法，包括：获取程序代码；确定所述程序代码中的多个指令以及所述多个指令之间的依赖关系；根据所述多个指令和所述依赖关系，确定数据依赖图；其中，所述确定所述程序代码中的多个指令以及所述多个指令之间的依赖关系，包括：对于所述多个指令中无法识别出依赖关系的指令，将符合第二预设条件的第一指令和第三指令之间建立可投机依赖关系，所述第二预设条件包括：所述第一指令为读取指令，所述第三指令为存储指令，所述第一指令的理想执行顺序在所述第三指令之后，所述第一指令对所述第三指令有存在内存依赖关系的可能性，所述内存依赖关系指存取指令之间存在由于操作同一地址导致的顺序依赖关系。

其中，可投机依赖关系可以指第一指令存在依赖于第三指令的可能性，且所述第一指令可投机执行。

在编译数据依赖图时，可以利用数据流架构执行数据依赖图的特点，对读取指令之后接读取指令的情形建立可投机依赖关系，从而在编译阶段识别可投机依赖关系，以便于数据流架构在后续执行程序时进行投机操作，从而提升了基于数据流架构的内存存取效率。

结合第三方面，在一种可能的实现方式中，确定所述程序代码中的多个指令以及所述多个指令之间的依赖关系，还包括：对于所述多个指令中可识别出依赖关系的指令，建立指令间的依赖关系；对于所述多个指令中可识别出不存在依赖关系的指令，确定不建立指令间的依赖关系。

结合第三方面，在一种可能的实现方式中，所述确定所述程序代码中的多个指令以及所述多个指令之间的依赖关系，还包括：为所述多个指令中的存取指令分配时间戳，所述时间戳用于指示所述存取指令之间的理想执行顺序，所述存取指令包括存储指令或读取指令。

结合第三方面，在一种可能的实现方式中，在所述多个指令中的存取指令中存在多个分支的情况下，在所述多个分支汇聚之处采用第一分支的最后一个时间戳开始计数，所述第一分支为所述多个分支中存取指令数目最多的分支。

结合第三方面，在一种可能的实现方式中，所述依赖关系包括以下至少一种：数据依赖关系、内存依赖关系、控制依赖关系。

第四方面，提供了一种处理指令的方法，包括：获取程序代码；确定所述程序代码中的多个指令以及所述多个指令之间的依赖关系；根据所述多个指令和所述依赖关系，确定数据依赖图；其中，所述确定所述程序代码中的多个指令以及所述多个指令之间的依赖关系，包括：为所述多个指令中的存取指令分配时间戳，所述时间戳用于指示所述存取指令之间的理想执行顺序，所述存取指令包括存储指令或读取指令。

在编译数据依赖图时，为指令中的存取指令分配时间戳，以指示存取指令之间的理想执行顺序，时间戳可以作为执行指令的辅助信息，以支持存取指令的正确执行。

结合第四方面，在一种可能的实现方式中，在所述多个指令中的存取指令中存在多个分支的情况下，在所述多个分支汇聚之处采用第一分支的最后一个时间戳开始计数，所述第一分支为所述多个分支中存取指令数目最多的分支。

时间戳可以在多个分支并行的情况下提供各个分支汇聚时的执行顺序的解决方案，从而提升了基于数据流架构的内存存取效率。

第五方面，提供了一种处理指令的装置，所述装置包括功能单元，所述功能单元用于执行第三方面或第三方面的任意可能的实现方式中的方法的指令，或者用于执行第四方面或第四方面的任意可能的实现方式中的方法的指令。

第六方面，提供了一种计算机存储介质，用于存储指令，该指令在图计算装置上运行时，使得所述图计算装置执行第一方面或第一方面的任意可能的实现方式中的方法的指令。

第七方面，提供了一种计算机存储介质，用于存储指令，该指令在计算机上运行时，使得所述计算机用于执行第三方面或第三方面的任意可能的实现方式中的方法的指令，或者用于执行第四方面或第四方面的任意可能的实现方式中的方法的指令。

附图说明

图1是本申请一实施例的图计算装置100的结构示意图。

图2是本申请一实施例的处理指令的方法的流程示意图。

图3是本申请一实施例的数据依赖图的示意图。

图4是本申请一实施例的标识时间戳的数据依赖图的示意图。

图5是本申请一实施例的IB111的结构示意图。

图6是本申请一实施例的LQ141的结构示意图。

图7是本申请一实施例的投机ID的示意图。

图8是本申请一实施例的SB142的结构示意图。

图9是本申请一实施例的处理指令的方法的示意图。

图10是本申请一实施例的图计算装置100的指令执行流程的示意图。

图11是本申请一实施例的数据依赖图的示意图。

图12至图19分别为图计算装置100执行图11的数据依赖图的不同阶段的状态示意图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

图1是本申请一实施例的图计算装置100的结构示意图。如图1所示，图计算装置 100包括：

执行单元(process engine，PE)110、图架构初始化单元(graph build unit，GBU)120、数据总线与依赖总线(data&predication bus)130、加载存储单元(load store unit，LSU)140。其中，图计算装置100中可包括一个或多个PE 110，图1中以包括8个PE 110为例进行说明，应理解，PE 110的数目也可以减少或增加。

可选地，图计算装置100可作为中央处理器(central processing unit，CPU)的一部分，通过利用指令间并行度与图架构的低功耗优势达到加速指令执行并减少CPU功耗的作用。

GBU120主要用于初始化图指令，并将图指令发送至各个PE 110。

PE110主要用于执行放入其中的图指令，并将数据或请求发给图计算装置100中的其它单元，例如，其它PE110或者LSU 140。PE 110中包括信息缓冲器(information buffer，IB)111。IB 111用于缓存数据流指令，并选择已经准备完成的指令发射到PE 110内部或LSU 140中执行。

可选地，PE110中还包括控制单元(图1中未示出)，该控制单元可用于控制IB111执行相应的功能，例如控制IB111发射(issue)指令或者接收数据和信息。可以理解为，在本申请实施例中，IB111所执行的方法是由PE110中的控制单元所控制执行的。为了简洁，本申请实施例中将PE110的控制单元控制IB111实现的功能描述为由IB111执行。

数据总线与依赖总线130主要用于在PE 110之间传递数据和依赖信息。依赖信息可以指用于指示指令之间的依赖关系的信息。

LSU 140主要用于接收并执行来自各个PE110的存取指令。存取指令包括存储指令和读取指令。LSU 140中还包括加载队列(load queue，LQ)141以及为存储缓冲器(store buffer，SB)142。LQ141用于缓存请求读取内存数据的指令队列。SB142用于缓存请求向内存中存储数据的指令队列。在一些示例中，SB142还可以用于将数据传输至LQ141中，以避免访问内存产生的功耗和延时。

在一些示例中，IB111也可以称为指令信息缓存，LQ141也可以称为读取请求缓存，SB142也可以称为存储请求缓存。

可选地，LSU140中该包括控制单元(图1中未示出)，该控制单元可用于控制LQ141和SB142执行相应的功能，例如控制LQ141和SB142发送或者接收数据和信息。可以理解为，在本申请实施例中，LQ141和SB142所执行的方法是由LSU140中的控制单元所控制执行的。为了简洁，本申请实施例中将LSU140中的控制单元控制LQ141或SB142实现的功能描述为由LQ141或SB142执行。

图1中还示出了CPU前端(CPU front-end)200，其主要包括CPU前端的取指和解码单元，用于从内存读取并解析指令内容，并将图指令发送给图计算装置100。需要说明的是，CPU前端200并不属于图计算装置100的硬件部分。

应理解，图计算装置100是基于数据流架构的硬件系统。其中，数据流架构通过在指令集层面上明确描述(explicit)指令的依赖关系，将指令间并行度直接展现给硬件来执行。数据流架构可以抽象化成一个由N个节点组成的有向图，即数据依赖图。节点与节点的连接代表一条数据流(dataflow)。一旦每个节点的输入准备好后，当前节点就可以进行运算并将结果传给下个节点。在同一个图里面并不在一条路径上的节点可并发运行。

应理解，图1中的图计算装置100仅仅作为示例，在实践中，图计算装置100中的各个单元也可以进行合并、替换等操作。或者包括更多或更少的单元。本申请实施例对此不作限定。

数据流架构的汇编编写也与主流的冯·诺依曼架构程序汇编不同。其每一条汇编指令不用指明该程序的输入，而只需要指明该指令的输出结果目的地。采用这种表述的代码，可以使得硬件容易发现指令间的依赖链条。

本申请利用上述优势，针对存取指令进行了优化。提出了一种针对数据流架构的存取指令投机执行的方法。该方法提高了数据流架构中存取指令的效率。并且根据数据流架构执行数据依赖图的特点，利用存取指令的可投机特性加速图指令的运行，降低了投机失败后的重新执行代价。即在投机失败之后只重新执行依赖于投机失败结果的指令，从而提升了基于数据流架构的图计算装置的内存存取效率。

其中，数据依赖图可以指由节点和连接节点的有向弧组成的数据流图。节点表示执行的运算或功能，有向弧表示节点被执行的次序。数据依赖图中的不同路径中的节点可以并行执行。

投机操作可以指在一条指令存在依赖于另一条指令的可能性且另一条指令尚未执行的情况下，首先执行该指令的操作。若另一条指令在执行之后，确认其与该指令不存在依赖关系，则投机成功。若另一条指令在执行之后，确认其与该指令存在依赖关系，则投机失败。

在图计算装置100处理指令之前，首先需要由编译器根据原程序分析指令之间的依赖关系，并根据依赖关系将原程序编译成基于数据依赖图的指令集。然后将编译后的指令集发送至图计算装置100中的IB111，以便于图计算装置100执行指令。下面首先描述编译器侧执行的处理指令的方法。

图2是本申请一实施例的处理指令的方法的流程示意图。该方法可以由编译器执行。如图2所示，该方法包括：

S201、获取程序代码。

其中，上述程序代码可以指通过开发工具所支持的语言写出的源文件。

S202、确定所述程序代码中的多个指令以及所述多个指令之间的依赖关系。

可选地，所述依赖关系包括以下至少一种：数据依赖关系、内存依赖关系、控制依赖关系。数据依赖关系可以指一条指令需要获取另一条指令传输的数据之后才能执行。内存依赖关系可以指存取指令之间存在由于操作同一地址导致的顺序依赖关系。控制依赖关系可以指由于控制流导致的条件依赖。例如，前续指令为条件语句，则后续指令和前续指令之间产生了控制依赖关系。作为示例，条件语句包括如果-或者(if-else)语句。

顺序依赖关系可以指一条指令必须在另一条指令完成之后执行。需要说明的是，内存依赖关系、数据依赖关系、控制依赖关系均可以导致顺序依赖关系。或者说，顺序依赖关系包括数据依赖关系、内存依赖关系和控制依赖关系。

编译器在获取原始的指令之后，可以进行依赖关系的分析，确定编译器可识别的依赖关系，以建立数据依赖图。在数据依赖图中，指令可以抽象为指令节点。其中，上述确定所述程序代码中的多个指令以及所述多个指令之间的依赖关系，包括但不限于以下三种情况：

在第一种情况下，对于所述多个指令中可识别出依赖关系的指令，建立指令间的依赖关系。

在第二种情况下，对于所述多个指令中可识别出不存在依赖关系的指令，确定不建立指令间的依赖关系。

在第三种情况下，对于所述多个指令中无法识别出依赖关系的指令，在第一种处理方式中，编译器可以为符合第二预设条件的第一指令与第三指令之间建立可投机依赖关系。第一指令为读取指令，第三指令为存储指令，可投机依赖关系是指第一指令存在依赖于第三指令的可能性，且所述第一指令可投机执行。其中，对于可投机依赖关系，编译器可以为两条指令之间建立依赖关系，同时表明在后的指令是可以投机执行的。

其中，所述第二预设条件包括：所述第一指令为读取指令，所述第三指令为存储指令，所述第一指令的理想执行顺序在所述第三指令之后，所述第一指令对所述第三指令有存在内存依赖关系的可能性，所述内存依赖关系指存取指令之间存在由于操作同一地址导致的顺序依赖关系。

应理解，第三种情况主要针对于存取指令，即存储指令或者读取指令。编译器主要用于分析存取指令之间的内存依赖关系，即与内存别名有关的分析。

在第三种情况下，编译器无法识别存取指令间是否存在内存依赖关系，需要等到执行状态才能知道是否存在内存依赖关系。对于这部分存取指令，可以为读取指令之后接存储指令的情形建立可投机依赖关系。其中，对于存在可投机依赖关系的指令，图计算装置100可以对其执行投机操作。需要说明的是，上述读取指令之后接存储指令的情形，是指读取指令的理想执行顺序在存储指令之前，两个指令之间还可以存在其它指令，也可以不存在其它指令。下文中的其它情形也遵循类似的原则，例如，读取指令之后接读取指令，不再赘述。

在第三种情况的第二种处理方式中，对于多个指令中无法识别出内存依赖关系的存取指令，编译器也可以不建立依赖关系，而是由图计算装置100直接去投机执行。对于存取指令的内存依赖关系的分析主要包括以下四种：存储指令之后接读取指令，存储指令之后接存储指令的情形，读取指令之后接读取指令的情形以及读取指令之后接存储指令的情形。接下来依次分析上述四种情形下不建立依赖关系的处理方式。

在一些示例中，不建立读取指令后接存储指令的依赖关系是因为在后续执行指令过程中，这里可以指图计算装置100可以通过SB142查询到之前已发射的存取指令的顺序和地址信息，并从正确的地方读取数据。由于图计算装置100在执行程序过程中，存储指令的对应数据实际存在SB142之中，直到程序执行完毕，再相应地更新内存中的存储数据。假设程序有一条读取指令后接一条存储指令，并且两者具有相同的地址，但本应在读取指令后发射的存储指令实际上先于读取指令发射。通过顺序和地址信息，即使存储指令先于读取指令发射，图计算装置100也会发现SB142中有相同地址的存储指令，其顺序晚于读取指令，于是指引读取指令从内存读取数据，而非从SB142取值。

在一些示例中，不建立存储指令后接存储指令的依赖关系的原因是，由于存储指令之间保序的发射顺序不会影响指令执行的效率，因此为了流程简单，图计算装置100可以选择存储指令强保序(total store ordering)。其中，强保序也可以称为绝对保序。即图计算装置100可以保证存储指令之间严格按照理想顺序执行，因此无需建立存储指令之间的可投机依赖关系。

在一些示例中，不建立读取指令后接读取指令的依赖关系的原因是，如果两个读取指令之间不存在存储指令，则两个读取指令读取同一地址时，获取的都是相同的值，不存在顺序依赖。若如果两个读取指令之间不存在存储指令，则可以按照存储指令后接读取指令的情形处理。

在一些示例中，编译器也无需为存储指令后接读取指令的情形建立依赖关系，而是通过图计算装置100识别存取顺序，其原理同读取指令后接存储指令的硬件解决方法类似，每当接收到存储指令后，图计算装置100会通过读取LQ141查询之前已发射的读取指令的顺序和地址信息。若存在一条地址相同，但本应在该存储指令之后发射的读取指令，则图计算装置100触发读取指令投机错误，并会重新执行。若不存在，则该存储指令没有因乱序发射导致的问题。

图3是本申请一实施例的数据依赖图的示意图。如图3所示，指令1表示将寄存器1中的数据存储到内存[x]中。指令2表示从内存[x+i]中读取数据，并存放至寄存器2中。指令3表示从内存[x]读取数据并存放至寄存器9中。指令4表示将寄存器9中的数据存储至内存[x+n]中。指令5表示将寄存器3与寄存器2的值相加，并将结果存储至寄存器4中。指令6表示将寄存器6和寄存器5的值相加，并存储入寄存器7中。

编译器通过对上述指令的依赖关系的分析可得到如下结果。

对于指令1和指令3，编译器可以识别出两者之间存在内存依赖关系和顺序依赖关系，因为两者都是对地址x的存储操作。因此，指令3需要等待指令1写入内存后才能执行，以保证读取到正确的数据。对于指令1和指令3之间明显的顺序依赖关系，编译器将在两个节点之间加一条表示顺序依赖关系的边线(即边线1)。

对于指令1和指令2，若i的值为0，则指令1和指令2之间存在顺序依赖关系，因为指令1会向内存x地址写数据，指令2会在指令1执行完成后将内存x地址的数据读出。若i的值不为0，则指令1与指令2之间不存在顺序依赖关系。由于i的值只有在图计算装置100运行时才能得到，编译器无法预先得知，所以编译器将假设两条指令间存在可投机依赖关系，并在两个节点之间增加一条表示可投机依赖关系的边线(即边线2)，以确保程序的正确运行。

对于指令2和指令5，两者之间存在数据依赖关系，并且可以被编译器识别。因此两者之间增加存在数据依赖关系的边线(即边线3)。

对于指令4和其它读取指令，它们之间不存在任何依赖关系，并且可以被编译器识别，因此，指令4所在的节点没有表示依赖关系的边线。

对于指令1和指令6，为了存储指令的强保序，存储指令间将按照执行顺序被串联成一条指令依赖链(即图3中的边线4)。可选地，存储指令的强保序可由硬件来执行，无需编译器建立指令依赖链。

S203、根据多个指令和所述依赖关系，确定数据依赖图。

在本申请实施例中，在编译数据依赖图时，可以利用数据流架构执行数据依赖图的特点，对读取指令之后接读取指令的情形建立可投机依赖关系，从而在编译阶段识别可投机依赖关系，以便于数据流架构在后续执行程序时进行投机操作，从而提升了基于数据流架构的内存存取效率。

可选地，所述确定所述程序代码中的多个指令以及所述多个指令之间的依赖关系，还包括：为所述多个指令中的存取指令分配时间戳，所述时间戳用于指示所述存取指令之间的理想执行顺序，所述存取指令包括存储指令或读取指令。

在一些示例中，上述时间戳只应用于多个指令之中的存取指令，而不应用于其它类型的指令。例如，图3中的指令4和指令5并非存取指令，因此无需分配时间戳。

可选地，在所述多个指令中的存取指令中存在多个分支的情况下，在所述多个分支汇聚之处采用第一分支的最后一个时间戳开始计数，所述第一分支为所述多个分支中存取指令数目最多的分支。

在本申请实施例中，在编译数据依赖图时，为指令中的存取指令分配时间戳，以指示存取指令之间的理想执行顺序，时间戳可以作为执行指令的辅助信息，以支持存取指令的正确执行。并可以在多个分支并行的情况下提供各个分支汇聚时的执行顺序的解决方案，从而提升了基于数据流架构的内存存取效率。

图4是本申请一实施例的标识时间戳的数据依赖图的示意图。其中，ST表示存储指令，LD表示读取指令。如图4所示，为了支持保证存取指令的正确执行，编译器会预先将程序中的存取指令按照理想执行顺序分配时间戳(stamp)。例如，时间戳1至8用于标识各个存储指令的理想执行顺序。若程序遇到如果-或者(if-else)分支，每个分支都将以相同的时间戳开始计数。在结尾汇聚时，以拥有存取指令最多的分支的最后一个时间戳为起始开始计数。例如，在时间戳1之后出现两个分支，因此采用时间戳2分别开始计数。并且在两个分支汇聚之处，由于右边的分支包括更多的存取指令，因此以右边的分支的最后一个时间戳5开始继续计数。

接下来描述本申请实施例的硬件侧方案，即图计算装置100侧的方案。

如图1所示，在图计算装置100中，可以放置三个存储装置来帮助存取指令的实现。该三个存储装置包括IB 111、LQ141和SB142。其中IB111用于缓存数据流指令，并选择符合条件的指令发射执行。LQ141用于缓存读取指令队列。SB142用于缓存存储指令队列。SB142还可以用于将数据直接传递到LQ141中，以避免访问内存产生的功耗和延时。

下面将结合附图详细描述IB111、LQ141以及SB142的结构和功能。

(1)IB111

图5是本申请一实施例的IB111的结构示意图。如图5所示，IB111可包括多个域段。上述多个域段的定义如下表1所示。需要说明的是，图5的各个域段仅仅作为示例，IB111中还可以包括更多或更少的域段。

表1

其中，指令域(Inst)和参数域(op0/1)为辅助数据流架构运行所需的信息，其用于指示图计算装置100按照指令去执行相关操作。指令域(Inst)可以用于指示指令的操作类型：例如，存储指令(表示为ST)、读取指令(表示为LD)等。参数域(op0/1)用于存放当前指令的输入数据。上述输入数据可以包括地址或者参数等。

可选地，每条指令在IB111中可存在一个或多个参数域(op0/1)、一个或多个参数域有效位(vld0/1)以及一个或多个参数域存在位(rdy0/1)。参数域(op0/1)与参数域有效位(vld0/1)、参数域存在位(rdy0/1为一一对应的关系。本申请实施例中以包括两个参数域(op0/1)、两个参数域有效位(vld0/1)和两个参数域存在位(rdy0/1为例说明。

在一些示例中，若指令只需要一个参数域，则第一参数域(op0)的参数域有效位(vld0)为1。第二参数域(op1)的参数域有效位(vld1)为0。若指令需要两个参数域，则两个参数域有效位(vld0/1)全部设置为1。需要说明的是，在本申请实施例中，1表示有效，0表示无效。但以上仅作为示例，可选地，也可以用0代表有效，1代表无效。

需要说明的是，发射(issue)指令可以指IB111开始执行该指令，并将指令的相关信息发送至图计算装置100中的相应单元，以便于执行该指令。

在一些示例中，参数域存在位(rdy0/1)表示该指令所需的输入已经存在于op0/1中。当某一条指令的参数域有效位(vld0/1)与参数域存在位(rdy0/1)同时有效时，表示这条指令所需要的输入已经准备就绪，可以发射执行。

例如，若第二参数域有效位(vld1)为1，第二参数域存在位(rdy1)为0，则表示这条指令还存在没有准备好的参数域，则该指令还不能发射执行。

在一种情况下，图计算装置100不需要根据参数域有效位(vld0/1)与参数域存在位(rdy0/1)同时有效来判断是否可以执行。即对于任意一条指令，当其投机标记位(sgo)为1时，若其任意一个参数域(op0/1)被更新，并且对应的参数域有效位(vld0/1)被置1。则无论该指令的另一个参数域是否有效，该指令都可以发射执行。这种情况出现时，代表之前的某条读取指令出现投机错误，后续指令需要重新触发执行。因此被更新的参数域是导致投机错误的参数域，本次更新可以输入正确的数据，而另一个参数域中存储的数据为之前投机操作时已存入的数据，因此无需确认另一参数域是否有效。

依赖有效位(prd)用于指示当前指令是否依赖于另一条指令执行完成之后才执行。依赖有效位(prd)可用于表示编译器添加的依赖关系。例如，在编译器判断两条指令之间存在依赖关系情况下，可以将依赖有效位(prd)设置为是。

在一些示例中，依赖有效位(prd)仅用于指示除数据依赖之外的其它依赖关系。也就是说，对于当前指令依赖于另一条指令传输的数据才能执行的情况，可以不使用依赖有效位(prd)指示。作为示例，依赖有效位(prd)可以用于指示当前指令对其它指令存在内存依赖或控制依赖的情形，而不用于指示当前指令对其它指令存在数据依赖的情形。

在一些示例中，若当前指令对另一条件指令存在可投机依赖关系，则可以将依赖有效位设置为是。

依赖存在位(prdy)与依赖有效位(prd)对应，依赖存在位(prdy)用于指示当前指令所依赖的指令是否执行完成。

可选地，若依赖有效位(prd)不用于指示数据依赖的情形，相应地，依赖存在位(prdy)也不用于指示与当前指令存在数据依赖关系的指令是否执行完成，而是用于指示与当前指令存在内存依赖关系或控制依赖关系的指令是否执行完成。

投机位(spc)用于表示当前的存取指令可以被投机执行。作为示例，一般情况下依赖有效位(prd)为1的指令需等待其依赖的指令执行完成后才能执行该指令，但对于存取指令，若其投机位(spc)被置1，则不用等待其依赖的存取指令完成即可执行。换句话说，不用等待依赖有效位(prd)所对应的依赖存在位(prdy)变为1即可执行。这种情况可以称为存取指令的投机执行或投机操作。并且，当存取指令被投机发射时，可以将投机标记位(sgo)置为1。

作为示例，在编译器设置当前指令对另一条指令存在可投机依赖关系的情况下，可以将IB111中依赖有效位(prd)设置为是，将投机位(spc)设置为是。

作为示例，对于编译器无法识别内存依赖关系的指令，若编译器没有设置可投机依赖关系，则可以将IB111中的投机位(spc)设置为是，将依赖有效位(prd)设置为否。也就是编译器在图2中的第三种情形的第二种处理方式。

换句话说，无论依赖有效位(prd)如何设置，只要投机位(spc)设置为是，该指令就可以投机执行。

时间戳(stamp)用于表示存取指令间的理想执行顺序，其将会在存取指令执行时存入LQ或SB。需要说明的是，考虑到投机执行的情形，在实际执行程序时，存取指令并不一定按照时间戳指示的先后顺序执行。若不考虑投机执行的情形，存取指令应按照时间戳指示的先后顺序执行。

可选地，当读取指令被投机执行后，LQ141会分配给该投机读取的数据一个投机标识(identity,ID)(spcID)。通过该投机操作获取的数据可以称为投机数据，如果在后续的指令中继续传递该投机数据，则使用该投机数据和后续由该数据衍生出的数据的指令的投机ID(spcID)域段均可以携带该投机ID的信息，即携带投机源头的信息，以表示该数据是投机得到的，若投机错误则可以清除和更改后续的指令。

(2)LQ141

图6是本申请一实施例的LQ141的结构示意图。如图6所示，LQ141包括多个域段。上述多个域段的定义如下表2所示。需要说明的是，图6的各个域段仅仅作为示例，LQ141中还可以包括更多或更少的域段。

表2

域段

简称

定义

地址	addr	用于存储读取指令的地址域段，以用于查找内存
目的地	dest	读取数据返回后，将该数据送到目的地所指示的IB的参数域中
数据	data	用于暂存读取指令返还的数据
时间戳	stamp	用于表示存取指令的理想执行顺序。
投机ID	spcID	用于指示该读取指令为投机执行的标识
存在位	rdy	表示数据已经从内存或SB返还
有效位	vld	表示该读取指令有效

当读取指令从IB111发射至LQ141之后，LQ141将记录该读取指令的地址、目的地等信息，并将该读取指令对应的有效位置为1，以表示该读取指令有效。

为了保证之后出现投机错误时，图计算装置100可以快速清空由该投机操作衍生的后续操作，LQ141将为该读取指令的投机操作分配一个投机ID。另外，若投机ID置为0，则表示该指令不是投机产生的。

可选地，LQ141生成的投机ID是独热码(one-hot code)，独热码是指用一个比特位表示一种状态的码值。换句话说，存在多少个状态，独热码中就包括多少个比特。因此，独热码中的每一个比特位表示一个投机ID。

图7是本申请一实施例的投机ID的示意图。如图7所示，当某条指令的两个输入来自于不同的投机ID时，该指令的投机ID中需要同时保留两个ID。如果投机ID是独热码，只需要将两个投机ID进行相或，就可以得到新的投机ID。例如，一个投机ID为001，另一个投机ID为010，相或之后得到的投机ID为011，其仍然保留了两次投机操作的ID信息。若之后发现某一个投机ID投机失败后，图计算装置100在检查时只需要将错误的ID与当前正在执行的ID相与，如果结果不是全0，则代表该数据来自于投机错误的数据。

将该投机ID同时存放在LQ141和IB111对应的投机ID(spc ID)域段。在返还数据时，LQ141将投机ID和数据一起传输给读取指令的目的地。因此，每条指令的输入若来自投机操作，则能够快速地找到投机操作的源头。携带投机ID的作用是当图计算装置100发现某一次投机操作错误时，可以高效率地将所有使用来自于该投机操作的数据的指令停止并清空。

在一些示例中，在将读取指令写入LQ141的同时，图计算装置100可以使用读取指令中的时间戳和地址去查询SB142。如果SB142中有相同的地址的存储指令，并且该存储指令的时间戳小于当前读取指令的时间戳，即相同地址的存储指令先于读取指令，图计算装置100将把该存储指令在SB142中的数据，发送至LQ142中，并返回给读取指令的目的地。若SB142中没有相同地址的请求，或相同地址的存储指令的时间戳大于当前读取指令的时间戳，即相同地址的存储指令晚于该读取指令，则图计算装置100将该读取指令发射给内存。当内存返回数据之后，数据将被存入LQ142的数据(data)域段，并将数据返还给读取指令的目的地。

(3)SB142

图8是本申请一实施例的SB142的结构示意图。如图8所示，SB142包括多个域段。上述多个域段的定义如下表3所示。需要说明的是，图8的各个域段仅仅作为示例，SB142中还可以包括更多或更少的域段。

表3

域段	简称	描述
地址	Addr	存储指令的地址域段，通过地址可以将数据存入对应内存位置
数据	data	用于暂存存储指令的数据
时间戳	stamp	用于表示存取指令间的理想执行顺序。
投机ID	spcID	表示存储指令的地址或数据直接或间接的来自投机读取操作
有效位	vld	表示存储指令有效

可选地，对于与存储指令的地址相同的读取指令，SB142根据读取指令的时间戳，从SB142中的地址相同的至少一个读取指令中选择小于该时间戳并与该时间戳最接近的存储指令，并返回数据，以节省读取内存的时间。其中，时间戳越小，在时间上的排序越靠前。

在一些示例中，除了记录存储指令的地址和数据外，SB142还通过投机ID记录上述地址和数据是否来自于投机数据。例如，若SB142接收到清除指令请求，该清除指令请求用于指示清除与目标投机ID存在关联关系的指令，SB142将会查找其缓存的存储指令中的投机ID是否与目标投机ID关联。若存在，则把该存储指令的有效位置0。若没有，则忽略该清除指令请求。当SB142接收到发射指令的指示后，SB142可以将其缓存的存储指令依次发射给内存。

接下来将介绍图计算装置侧的处理指令的方法。

图9是本申请一实施例的处理指令的方法的示意图。该方法可以由图计算装置100执行。图9中的IB可以为图1中的IB111，LQ可以为图1中的LQ141，SB可以为图1中的SB142，PE可以为图1中的PE110。图计算装置100用于执行基于数据依赖图的指令。该方法包括：

S401、IB将第一指令发射至所述LQ，所述第一指令用于请求读取数据，所述第一指令符合第一预设条件，所述第一预设条件包括：所述第一指令在所述IB中的投机位设置为是。

S402、IB确定第一投机ID，并将第一投机ID存入第一指令在所述IB的投机ID域段，第一投机ID用于指示当前投机操作。

其中，所述投机ID域段(即spcID)和投机位(即spc)的定义可以参见图5中的相关描述，此处不再赘述。

可选地，在投机位为是的情形包括第一指令对其它指令存在可投机依赖的情形。例如，第一指令和第三指令之间存在可投机依赖关系，所述可投机依赖关系表示所述第一指令存在依赖于所述第三指令的可能性，且所述第一指令可投机执行。

其中，所述第一指令和所述第三指令符合第二预设条件，所述第二预设条件包括所述第一指令的理想执行顺序在所述第三指令之后，所述第一指令对所述第三指令有存在内存依赖关系的可能性，所述内存依赖关系指存取指令之间存在由于操作同一地址导致的顺序依赖关系。

上述第二预设条件可以理解为第一指令和第三指令之间存在由于内存别名导致的依赖关系的可能性，但是编译器无法识别出确定的依赖关系，该依赖关系只能在指令运行之后才能确定。对于存在可投机依赖关系的指令，图计算装置100可以执行投机操作。

可选地，所述第一预设条件还包括：所述第一指令在所述IB中的依赖有效位设置为是，依赖存在位置为否。表示第一指令与其它指令之间存在依赖关系，并且与其存在依赖关系的指令并未执行完成，但是第一指令可以进行投机操作。如果投机操作错误，则后续将重新执行该第一指令。

可选地，所述IB中还包括至少一个参数域、至少一个参数域有效位以及至少一个参数域存在位，所述至少一个参数域与所述至少一个参数域有效位一一对应，所述至少一个参数域有效位与所述至少一个参数域存在位一一对应，所述参数域用于存储当前指令的输入数据，所述参数域有效位用于指示其对应的参数域是否有效，所述参数域存在位用于指示其对应的参数域的数据是否已存在于缓存中。

进一步地，所述第一预设条件还包括：所述至少一个参数域有效位中的第一参数域有效位设置为是，所述第一参数域有效位对应的参数域存在位设置为是。假设第一参数域有效位对应于第一参数域，其表示第一指令的第一参数域有效并且输入数据已经存入第一参数域中。例如，对于读取指令来说，上述输入数据可以为读取指令的地址。

可选地，所述IB中还包括时间戳，所述时间戳用于指示存取指令的理想执行顺序，所述存取指令包括存储指令或者读取指令。其中，所述第一指令和所述第三指令的时间戳用于指示所述第一指令的理想执行顺序晚于所述第三指令。

可选地，所述SB和所述LQ中也包括所述时间戳。

其中，关于依赖有效位(即prd)、参数域(即op0/1)、参数域有效位(即vld0/1)、参数域存在位(即rdy0/1)以及时间戳(stamp)的定义可以参见前文中的相关描述，此处不再赘述。

在本申请实施例中，通过在图计算装置的IB中为指令设置投机位和投机ID域段，以便于图计算装置根据投机位判断该指令是否可以执行投机操作，并通过投机ID指示该次投机操作，从而能够利用投机ID标记投机源头，在出现投机错误时，只清除和重新执行与该投机ID有关联关系的指令，而避免重新执行与投机ID无关的指令，从而减少了投机错误的代价，提高了数据流架构执行存取指令的投机操作的效率。

进一步地，该方法还包括：在接收第一指令之后，LQ为第一指令分配第一投机ID，并将第一投机ID写入第一指令在LQ的投机ID域段；LQ将第一投机ID传输至第一指令在IB的投机ID域段。

可选地，上述投机ID为独热码。关于独热码的定义可以参见前文中的描述。

在本申请实施例中，投机ID采用了独热码，由于两个独热码在相或之后得到的新的投机ID依然可以保留之前的投机ID的信息，因此，在投机操作失败后，利用独热码可以快速找到投机操作的源头，以便于清除和重新执行与该投机操作有关的指令，以提高数据流架构执行存取指令的投机操作的效率。

可选地，在接收到第一指令之后，LQ根据第一指令，从SB或者内存查找并获取第一指令请求读取的数据。LQ可以首先根据第一指令中的地址在SB中查找数据，若不存在，则在内存中查找数据。

可选地，在获取第一指令请求读取的数据之后，LQ将第一投机ID传输至第二指令在IB中的投机ID域段，第二指令依赖于第一指令。

在投机操作之后，在与第一指令存在依赖关系的第二指令之中也携带该第一投机ID，以便于投机操作失败之后根据第一投机ID寻找来自该第一投机ID的指令。

可选地，如前文中的图7所示，如果第二指令还依赖于其它投机操作，则可以将两次投机操作对应的两个投机ID相或，将得到新的投机ID作为第二指令的投机ID。

可选地，该方法还包括：在所述IB向所述LQ发射所述第一指令之后，所述IB将所述第一指令的投机标记位(即sgo)设置为是，以表示该第一指令已经被投机发射。

可选地，该方法还包括：在获取所述第一指令请求读取的数据之后，所述IB发射第二指令，所述第二指令依赖于所述第一指令；在发射所述第二指令之后，所述IB在所述第二指令的投机标记位(即sgo)设置为是。即与第一指令存在依赖关系的后续指令也可以被投机标记位(sgo)标记。

可选地，图9的方法还包括：在发射第一指令之后，IB向SB发射第三指令。在发射第三指令之后，IB将第三指令的存储地址传递至第一指令在IB中的参数域，并且将第一指令在IB中的依赖存在位设置为是。换句话说，IB在发射第三指令之后，可以将第一指令的依赖存在位设置为是，以表示第一指令所依赖的指令已执行完成。

可选地，图9的方法还包括：IB根据第三指令的存储地址和第一指令的读取地址，确定第一投机ID对应的第一指令的投机操作是否错误；在第一投机ID对应的第一指令的投机操作错误的情况下，IB重新选择并重新向LQ发射第一指令。

例如，第一指令在IB中的第一参数域可用于存储第一指令的读取地址，第二参数域中可用于存储第三指令的存储地址。

具体地，若上述两个地址相等，则说明两条指令之间存在内存别名问题，该投机操作错误。若上述两个地址不相等，则说明该投机操作正确。

可选地，在第一投机ID对应的投机操作错误的情况下，图9的方法还包括：LQ重新为第一指令分配第二投机ID，并将第二投机ID写入LQ的投机ID域段；LQ将第二投机ID传输至第一指令在IB的投机ID域段。

可选地，图9的方法还包括：在第一指令的投机操作错误的情况下，IB向至少一个PE、LQ或SB广播第一指令的第一投机ID；至少一个PE、LQ以及SB将第一投机ID与自身正在执行的指令的投机ID进行比较，以判断两者是否存在关联关系；在存在关联关系的情况下，至少一个PE、LQ以及SB停止执行当前的指令，并停止传输当前指令的数据或依赖关系。

可以理解为，在第一指令的投机操作错误的情况下，IB向图计算装置100中的流水线广播第一指令的第一投机ID，以便于只清除与投机操作有关的指令，而避免清除在投机操作之后的与投机操作无关的指令，从而降低了投机失败的代价，提高了投机操作的效率。

上述至少一个PE可以包括IB所在的PE以及其它PE。向上述至少一个PE广播可以包括向至少一个PE内部的单元广播。例如，可以包括IB或者其它功能单元。

其中，上述判断是否存在关联关系的方式可以包括：判断正在执行的指令的投机ID与第一投机ID是否相同，或者是否来源于所述第一投机ID。例如，如前文所述，利用独热码的特性，将当前投机ID与第一投机ID相与，如果结果不是全0，则代表当前投机ID与第一投机ID存在关联关系。

在本申请实施例中，当出现投机错误的情况下，图计算装置可以根据第一投机ID追踪与该错误投机操作存在关联关系的后续的指令，并停止传输当前指令的数据和依赖关系，以保证指令的正确操作。并且利用投机ID可以只清除与错误投机操作有关的指令，而保留与该投机操作无关的指令，从而可以提高数据流架构存取指令的投机操作的效率。

图10是本申请一实施例的图计算装置100的指令执行流程的示意图。如图10所示，当图计算装置100开始运行时，IB从自身存储的指令中选择一条指令并发射该指令。该指令符合以下四种条件中的任意一条，并且在符合条件的指令中的时间戳中最小。上述四个条件包括：

条件1：指令的存在的输入都有效，并且输入不来于自投机操作。即该指令输入准备就绪，并且输入都不来自于投机数据。其中，指令的输入还包括依赖关系，即该指令不存在依赖关系或者其依赖的指令已执行完成。

条件2：该指令为可投机读取指令，且未被投机执行过。即投机位(spc)置为1，并且投机标记位(sgo)置为0。条件2表示图计算装置100将第一次投机执行读取指令。IB投机执行该读取指令，并将读取指令发射至LQ。

条件3：该指令为已经投机操作过的读取指令，并且之前的投机操作错误。即图计算装置确定该读取指令与存储指令的地址相同，两者之间存在依赖关系。在条件3的情况下，由于之前投机操作错误，因此在读取指令所依赖的存储指令执行之后，该读取指令的地址被更新，即该读取指令中的用于存储地址的参数域被更新。因此该参数域对应的参数域有效位(vld)、投机标记位(sgo)与依赖存在位(prdy)均为1。

条件3表示图计算装置100识别出了该读取指令之前发出的是错误的投机数据，因此需要重新执行该指令，并且将投机ID广播至图计算装置100的流水线中，以清除与该投机ID存在关系的指令。

条件4：该指令为非读取指令，并且之前的投机操作错误。条件4表示当前指令之前使用错误的投机数据执行过，因此需要重新执行该指令，并且传递新的投机ID。由于该指令的输入已更新，因此该指令的一个参数域对应的参数域有效位为1，并且投机标记位(sgo)为1。

在选择条件2或条件3的指令时，读取指令都将进入到LQ中，并由LQ分配一个投机ID。在获取数据之后，LQ将该数据发送给指令的目的地。后续对这条指令有依赖关系的指令均可以投机执行，但是后续指令的输入均需携带该投机ID。

可选地，在对读取指令执行可投机操作之后，若执行读取指令存在可投机依赖关系的存储指令，则该存储指令可以触发硬件识别出之前读取指令的投机操作是否失败。具体地，IB可以将该存储指令发射至SB中，并向存储指令指示的目的地发送地址和依赖信息其中，该目的地可以指有可能依赖于该存储指令的指令在IB中的参数域。IB将在接收到地址后比较存储指令传来的地址和其本身的地址。若地址相等，则表示该读取指令之前的投机是错误的。硬件将广播该读取指令的投机ID，使正在执行的对应于该投机ID的指令的操作停止。执行存储指令所获取的数据将一直存储于SB中，直到IB发送指示信号指示SB向内存发送其存储的数据。

根据上文所述，存储指令可能会触发IB识别出之前读取指令的投机失败。因此在存储指令执行之后，读取指令将被IB的选取逻辑重新选取，并从SB中读取到更新后的数据，以及将数据发送至读取指令的目的地。在IB中依赖于该读取指令并且被投机执行过的指令也将会重新执行。这些投机失败的指令的投机标记位置为1，以表示该指令在之前使用投机数据执行过。其一个参数域(op0/1)的有效位置为1，表示该参数域更新了数据。这表示指令之前的数据来自于错误的投机，新的数据将会使这些指令重新执行。

接下来将结合具体实例来描述本申请实施例的投机机制以及投机出现错误之后的纠正机制。

图11是本申请一实施例的数据依赖图的示意图。图12至图19分别为图计算装置100执行图11的数据依赖图的不同阶段的状态示意图，其显示了图计算装置100执行指令过程中在IB111、LQ141和SB142中的信息内容。

如图11所示，该数据依赖图包括4个指令，这4个指令抽象为四个节点。其中，指令1(ST[x]，a)为存储指令，用于指示将数据a存入内存中的地址x。指令2(LD[x+i])为读取指令，用于指示从内存中的地址x+i读出数据并传送给指令4。指令3(ST[z]，b)为存储指令，用于指示将数据b存入内存中的地址z。指令4(addi)为加法指令，用于指示将两个输入相加，这两个输入分别来自指令2的数据以及常数1。

继续参见图11，编译器可以根据图2至图4中的规则增加节点之间的依赖关系。对于存储指令之后接读取指令的情形(即指令1后接指令2)，由于编译器无法知道i的值，因此无法识别地址x+i与地址x是否相等，所以编译器对这两条指令建立可投机依赖关系(边线p)。

对于读取指令之后接存储指令(指令2后接指令3)的情形，虽然编译器识别不出地址z是否与x+i相等，但根据编译器侧的规则，读取指令后接存储指令之间不需要建立依赖关系。

对于指令1和指令3，编译器可以对存储指令之后接存储指令建立强保序关系。或者，也可以由硬件分析和建立强保序关系，编译器侧不对这两个指令建立依赖关系。

当编译器侧对图11中的数据依赖图完成初始配置之后，可以将相关指令存入IB111中。图12是图11的数据依赖图的指令在IB111中存储的信息的示意图。当程序开始执行时，图计算装置100可以选取输入有效指令开始执行。其中，输入有效可以指该指令的参数域中的数据均已准备完成，并且其依赖的指令也已经执行完成。

如图12所示，由于指令1至指令3为存取指令，因此需要分配时间戳。其在IB111中的时间戳依次为0、1、2，这表示了指令1至指令3的理想执行顺序。

如图12所示，指令1、指令3和指令4均缺乏执行的条件。其中，指令1缺少存储的数据和地址(op0/1为空)。指令3的输入数据已准备好，但是根据存储指令之间的强保序原则，指令3必须在指令1执行完成之后才能执行，指令3的依赖有效位(prdy)为1，依赖存在位(prdy)为0，并且投机位(spc)也为0。指令4缺少来自指令2的数据以作为其输入数据。

如图12所示，指令2缺少其可投机依赖的指令执行完成的标记，即依赖存在位(prdy)为0。但是指令2的投机位(spc)置为1。这表示图计算装置100不需要等待其可投机依赖的指令完成即可执行指令2。指令2的第一参数域(op0)对应的第一参数域有效位(vld0)为1，第一参数域(op0)对应的第一存在位(rdy0)也为1。第二参数域(op1)对应的第二参数域有效位(vld1)为0。这表示指令2只有一个输入数据，并且该输入数据已经存在于第一参数域(op0)，因此可以发射指令2。

其中，发射指令可以指IB111将指令的信息发射至其它单元以执行该指令。例如，若指令为存储指令，则可以将该指令发射至SB142。若该指令为读取指令，则将该指令发射至LQ141。若该指令为运算指令，则可以将该指令发射至PE110中的计算单元。

如图13所示，当IB111发射指令2之后，可以将指令2的第一存在位(rdy0)置为0，表示指令2的第一参数域(op0)中的数据已经不再有效。投机标记位(sgo)将置1，以表示指令2是投机执行的。

与此同时，指令2被发射至LQ141，LQ141可以记录指令2的信息，上述信息可以包括指令2的地址、目的地、时间戳等信息。

LQ141根据指令2中的地址，首先查找SB142，若SB142中没有指令2请求读取的数据，则向内存发射指令2，以请求获取数据。

LQ141还将为指令2分配投机ID，并将其写入LQ141的投机ID域段。其中，图13中以“001”表示该投机ID。LQ141还用于向IB111发送该投机ID，以便于写入IB111的投机ID(spc ID)域段。

在LQ141获取指令2请求的数据之后，可以将其存入LQ141的数据域段。其中，图13中以“72”表示该数据。

如图14所示，在LQ141获取指令2请求的数据之后，可以将该数据传输至指令4在IB111的第一参数域(op0)，并将第一参数域(op0)对应的参数域存在位(rdy0)置为1。由于该数据是投机得到的，IB111可以将投机ID写入指令4的投机ID(spcID)域段。对于之后得到的指令4的结果，若其由此投机数据得到的，在结果传递时，也需要在目的地对应的投机ID(spcID)中写入该投机ID。

如图15所示，指令4的输入数据已准备完成，可以执行IB111中的指令4。在执行时，可以将指令4发射至PE110中的计算器件。由于指令4的数据来自于投机行为，因此投机标志位(sgo)被置为1。另外，在发射指令4之后，其参数域存在位(rdy0/1)将被置0，代表其该指令已经被发出。

如图16所示，在某个时钟周期之后，指令1的输入数据全部准备就绪。IB111将指令1的信息发送至SB142。SB142记录指令1的存储请求的地址、数据、时间戳、投机ID等信息。其中，指令1的地址为x，数据为a，时间戳为0。指令1并非投机行为，因此并没有为其分配投机ID，投机ID置0。

与此同时，IB111将指令1的参数域存在位(rdy0/1)置0，以表示参数域(op0/1)中存储的数据已发出。

如图17所示，在执行指令1之后，IB111向指令1的目的地发送依赖指示以及存储地址。所述依赖指示用于指示指令2可投机依赖的指令已经完成。所述存储地址为指令1的读取数据的地址。

可选地，上述向目的地发送依赖指示包括：将指令2在IB111中的依赖存在位(prdy)置为1，以指示指令2可投机依赖的指令已执行完成。

可选地，上述向目的地发送存储地址包括：将指令1的读取数据的地址写入指令2在IB111中的第二参数域(op1)，并将第二参数域对应的参数域存在位(rdy1)置为1。

IB111将比较指令2在IB111中新写入的地址(存储于op1)其投机执行的地址(存储于op0)是否相等。若两者相等，则表示指令2之前投机执行的读取操作是错误的。因此，IB111将重新执行指令2。若两者不相等，则无需重新执行指令2，并且将指令2在IB111中的第二参数域存在位(rdy1)以及依赖存在位(prdy)置0。

可选地，在执行指令1之后，IB111还可以将指令3在IB中的依赖存在位(prdy)置为1，以表示指令3所依赖的指令1已经执行完成。

可选地，根据存储指令之间的强保序原则，在指令1发射之后，才能执行指令3。如图17所示，指令3的依赖存在位(prdy)置为1，并且指令3的输入数据早已准备完成，因此，可以向SB142发射指令3。在指令3进入SB142之后，SB142可以记录指令3的地址、数据、时间戳、投机ID信息。其中，地址为z，数据为b，时间戳为2，由于存储指令的地址和数据都不是来自于投机行为，所以投机ID为0。

可选地，假设指令2之前的投机执行是错误的。IB111将向硬件的各级流水线广播指令2的投机ID(spcID)。各级流水线在收到该投机ID后，将对比正在执行指令的投机ID，以确定投机ID与流水线当前正在执行的指令的投机ID是否存在关联关系。

其中，上述各级流水线可以指图计算装置100中的用于执行指令的单元，包括但不限于，IB111、LQ141、SB142以及PE110。

例如，投机ID通常为独热码，若两个投机ID中的某一比特位都为1，则说明两者之间存在关联关系，因此需要停止执行当前指令并停止传输当前指令的数据或依赖关系。若两个投机ID中没有同时为1的比特位，则说明两者之间不存在关联关系，不影响任何执行操作。

如图18所示，在重新将指令2发射至LQ141后，LQ141将之前的指令2替换成新的指令2，并为指令2分配新的投机ID。例如，图18中新分配的投机ID表示为“010”。LQ141根据新的指令2重新查找SB142或者内存，并获取指令2所请求的数据。在图18中，该数据表示为数据a。

在指令2完成之后，因为指令4与指令2之间存在数据依赖关系，因此IB111需要重新执行指令4。如图19所示，当LQ141获取指令2请求的数据a之后，将数据a和投机ID再次传给指令2的目的地，并更新该目的地的投机ID。例如，指令2的目的地为指令4的第一参数域(op0)，更新后的投机ID为“010”。

在指令4获取指令2传输的数据之后，其第一参数域(op0)的参数域存在位(rdy0)为1，第二参数域(op1)的参数域有效位(rdy1)为0，这代表第二参数域(op1)的数据还未准备好。但根据在前文中IB111的执行规则，由于IB111中的投机标记位(sgo)置为1，说明指令4曾经被投机执行过，因此第二参数域(op1)的数据一直存在于IB111当中，所以指令4可以重新执行。

在执行指令4之后，图11的数据依赖图中的指令已全部执行完毕。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种处理指令的方法，其特征在于，所述方法应用于图计算装置，所述图计算装置基于数据流架构，所述图计算装置包括至少一个处理引擎PE和加载存储单元LSU，所述PE包括信息缓冲器IB，所述IB用于缓存指令队列，所述PE用于执行所述IB中缓存的指令；其中，所述IB中包括投机位和投机标识ID域段，所述投机位用于指示当前指令是否为可投机执行的指令，所述投机ID域段用于存储当前指令的一次投机操作的投机ID，所述LSU包括加载队列LQ，所述LQ用于缓存读取指令队列；

所述方法包括：

所述IB将第一指令发射至所述LQ，所述第一指令用于请求读取数据，所述第一指令符合第一预设条件，所述第一预设条件包括：所述第一指令在所述IB中的投机位设置为是；

所述IB确定第一投机ID，并将所述第一投机ID存入所述第一指令在所述IB的投机ID域段，所述第一投机ID用于指示当前投机操作。
如权利要求1所述的方法，其特征在于，所述LQ中包括所述投机ID域段，所述方法还包括：

在所述IB将所述第一指令发射至所述LQ之后，所述LQ为所述第一指令分配所述第一投机ID，并将所述第一投机ID写入所述第一指令在所述LQ的投机ID域段；

所述LQ向所述IB发送所述第一投机ID；

所述IB确定第一投机ID，包括：所述IB从所述LQ接收所述第一投机ID。
如权利要求2所述的方法，其特征在于，所述投机ID为独热码。
如权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

所述LQ根据所述第一指令，从所述SB或者内存查找并获取所述第一指令请求读取的数据。
如权利要求1至4中任一项所述的方法，其特征在于，还包括：

在获取所述第一指令请求读取的数据之后，所述LQ将所述第一投机ID传输至第二指令在所述IB中的投机ID域段，所述第二指令依赖于所述第一指令。
如权利要求1至5中任一项所述的方法，其特征在于，所述IB中还包括投机标记位，所述投机标记位用于指示当前指令是否已经被投机发射，所述方法还包括：

在所述IB向所述LQ发射所述第一指令之后，所述IB将所述第一指令的投机标记位设置为是。
如权利要求1至6中任一项所述的方法，其特征在于，所述IB中还包括投机标记位，所述投机标记位用于指示当前指令是否已经被投机发射，所述方法还包括：

在获取所述第一指令请求读取的数据之后，所述IB发射第二指令，所述第二指令依赖于所述第一指令；

在发射所述第二指令之后，所述IB在所述第二指令的投机标记位设置为是。
如权利要求1至7中任一项所述的方法，其特征在于，所述IB中还包括依赖有效位和依赖存在位，所述依赖有效位用于指示当前指令是否依赖于另一条指令执行完成之后才执行，所述依赖存在位用于指示当前指令所依赖的指令是否执行完成；

所述第一预设条件还包括：所述第一指令在所述IB中的依赖有效位设置为是，依赖存在位设置为否。
如权利要求1至8中任一项所述的方法，其特征在于，所述LSU中还包括存储缓冲器SB，所述SB用于缓存存储指令队列，所述方法还包括：

在发射所述第一指令之后，所述IB向所述SB发射第三指令，所述第三指令为存储指令，其中，所述第一指令和所述第三指令符合第二预设条件，所述第二预设条件包括所述第一指令的理想执行顺序在所述第三指令之后，所述第一指令对所述第三指令有存在内存依赖关系的可能性，所述内存依赖关系指存取指令之间存在由于操作同一地址导致的顺序依赖关系；

在发射所述第三指令之后，所述IB将所述第三指令的存储地址发送至所述LQ。
如权利要求9所述的方法，其特征在于，所述方法还包括：

所述IB根据所述第三指令的存储地址和所述第一指令的读取地址，确定所述第一投机ID对应的所述第一指令的投机操作是否错误；

在所述第一投机ID对应的所述第一指令的投机操作错误的情况下，所述IB重新向所述LQ发射所述第一指令。
如权利要求10所述的方法，其特征在于，所述方法还包括：

在所述IB重新向所述LQ发射所述第一指令之后，所述LQ重新为所述第一指令分配第二投机ID，并将所述第二投机ID写入所述第一指令在所述LQ的投机ID域段；

所述LQ将所述第二投机ID传输至所述第一指令在所述IB的投机ID域段。
如权利要求1至11中任一项所述的方法，其特征在于，所述方法还包括：

在所述第一投机ID的对应的投机操作错误的情况下，所述IB向所述至少一个PE、所述LQ或所述SB广播所述第一投机ID；

所述至少一个PE、所述LQ或所述SB将所述第一投机ID与自身正在执行的指令的投机ID进行比较，以判断两者是否存在关联关系；

在存在关联关系的情况下，所述至少一个PE、所述LQ或所述SB停止执行所述正在执行的指令，并停止传输所述正在执行的指令的数据或依赖关系。
如权利要求1至12中任一项所述的方法，其特征在于，所述IB中还包括时间戳，所述时间戳用于指示存取指令的理想执行顺序，所述存取指令包括存储指令或者读取指令。
一种图计算装置，其特征在于，所述图计算装置基于数据流架构，所述图计算装置包括至少一个处理引擎PE和加载存储单元LSU，所述PE包括信息缓冲器IB，所述IB用于缓存指令队列，所述PE用于执行所述IB中缓存的指令；其中，所述IB中包括投机位和投机标识ID域段，所述投机位用于指示当前指令是否为可投机执行的指令，所述投机ID域段用于存储当前指令的一次投机操作的投机ID，所述LSU包括加载队列LQ，所述LQ用于缓存读取指令队列。
如权利要求14所述的装置，其特征在于，所述投机ID域段中的投机ID为独热码。
如权利要求14或15所述的装置，其特征在于，所述IB用于：将第一指令发射至所述LQ，所述第一指令用于请求读取数据，所述第一指令符合第一预设条件，所述第一预设条件包括：所述第一指令在所述IB中的投机位设置为是；

所述IB还用于：确定第一投机ID，并将所述第一投机ID存入所述第一指令在所述IB的投机ID域段，所述第一投机ID用于指示当前投机操作。
如权利要求16所述的装置，其特征在于，所述LQ中包括所述投机ID域段，所述LQ用于：在所述IB将所述第一指令发射至所述LQ之后，为所述第一指令分配所述第一投机ID，并将所述第一投机ID写入所述第一指令在所述LQ的投机ID域段；向所述IB发送所述第一投机ID；

所述IB具体用于从所述LQ接收所述第一投机ID。
如权利要求16或17所述的装置，其特征在于，所述LQ用于根据所述第一指令，从所述SB或者内存查找并获取所述第一指令请求读取的数据。
如权利要求16至18中任一项所述的装置，其特征在于，所述LQ还用于：在获取所述第一指令请求读取的数据之后，将所述第一投机ID传输至第二指令在所述IB中的投机ID域段，所述第二指令依赖于所述第一指令。
如权利要求14至19中任一项所述的装置，其特征在于，所述IB中还包括投机标记位，所述投机标记位用于指示当前指令是否已经被投机发射。
如权利要求20所述的装置，其特征在于，所述IB还用于在向所述LQ发射所述第一指令之后，将所述第一指令的投机标记位设置为是。
如权利要求20或21所述的装置，其特征在于，所述IB还用于：在获取所述第一指令请求读取的数据之后，发射第二指令，所述第二指令依赖于所述第一指令；以及在发射所述第二指令之后，在所述第二指令的投机标记位设置为是。
如权利要求14至22中任一项所述的装置，其特征在于，所述IB中还包括依赖有效位和依赖存在位，所述依赖有效位用于指示当前指令是否依赖于另一条指令执行完成之后才执行，所述依赖存在位用于指示当前指令所依赖的指令是否执行完成；
如权利要求23所述的装置，其特征在于，所述第一预设条件还包括：所述第一指令在所述IB中的依赖有效位设置为是，依赖存在位设置为否。
如权利要求14至24中任一项所述的装置，其特征在于，所述LSU中还包括存储缓冲器SB，所述SB用于缓存存储指令队列。
如权利要求25所述的装置，其特征在于，所述IB还用于：在发射所述第一指令之后，向所述SB发射第三指令，所述第三指令为存储指令，其中，所述第一指令和所述第三指令符合第二预设条件，所述第二预设条件包括所述第一指令的理想执行顺序在所述第三指令之后，所述第一指令对所述第三指令有存在内存依赖关系的可能性，所述内存依赖关系指存取指令之间存在由于操作同一地址导致的顺序依赖关系；在发射所述第三指令之后，将所述第三指令的存储地址发送至所述LQ。
如权利要求26所述的装置，其特征在于，所述IB还用于：根据所述第三指令的存储地址和所述第一指令的读取地址，确定所述第一投机ID对应的所述第一指令的投机操作是否错误；在所述第一投机ID对应的所述第一指令的投机操作错误的情况下，重新向所述LQ发射所述第一指令。
如权利要求27所述的装置，其特征在于，所述LQ还用于：在所述IB重新向所述LQ发射所述第一指令之后，重新为所述第一指令分配第二投机ID，并将所述第二投机ID写入所述第一指令在所述LQ的投机ID域段；将所述第二投机ID传输至所述第一指令在所述IB的投机ID域段。
如权利要求16至28中任一项所述的装置，其特征在于，所述IB还用于：在所述第一投机ID的对应的投机操作错误的情况下，所述IB向所述至少一个PE、所述LQ或所述SB广播所述第一投机ID；

所述至少一个PE、所述LQ或所述SB用于：将所述第一投机ID与自身正在执行的指令的投机ID进行比较，以判断两者是否存在关联关系；以及在存在关联关系的情况下，停止执行所述正在执行的指令，并停止传输所述正在执行的指令的数据或依赖关系。
如权利要求14至29中任一项所述的装置，其特征在于，所述IB中还包括时间戳，所述时间戳用于指示存取指令的理想执行顺序，所述存取指令包括存储指令或者读取指令。
一种计算机存储介质，其特征在于，包括指令，其特征在于，当所述指令在图计算装置上运行时，使得所述图计算装置执行如权利要求1至13中任一项所述的方法。