CN117093266A - 指令处理装置、方法、电子设备和存储介质 - Google Patents
指令处理装置、方法、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117093266A CN117093266A CN202311055614.5A CN202311055614A CN117093266A CN 117093266 A CN117093266 A CN 117093266A CN 202311055614 A CN202311055614 A CN 202311055614A CN 117093266 A CN117093266 A CN 117093266A
- Authority
- CN
- China
- Prior art keywords
- instruction
- storage
- candidate
- node
- target load
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims description 27
- 230000004044 response Effects 0.000 claims abstract description 32
- 238000003672 processing method Methods 0.000 claims abstract description 11
- 239000002243 precursor Substances 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/3004—Arrangements for executing specific machine instructions to perform operations on memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/3004—Arrangements for executing specific machine instructions to perform operations on memory
- G06F9/30043—LOAD or STORE instructions; Clear instruction
Abstract
本公开提供了一种指令处理装置,涉及人工智能技术领域,尤其涉及芯片技术领域和指令调度技术领域。该装置包括:存储单元;处理单元,配置为:从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令;响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前。本公开还提供了一种指令处理方法、电子设备和存储介质。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及芯片技术领域和指令调度技术领域。更具体地,本公开提供了一种指令处理装置、方法、电子设备和存储介质。
背景技术
随着人工智能技术和计算机技术的发展,多种处理器可以被应用于执行人工智能任务。指令调度是处理器的一种优化方式,可以改善指令执行的效率。
发明内容
本公开提供了一种指令处理装置、方法、设备以及存储介质。
根据本公开的一方面,提供了一种指令处理装置,该装置包括:存储单元;处理单元,配置为:从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令;响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前。
根据本公开的另一方面,提供了一种指令处理方法,该方法包括:从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令;响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前。
根据本公开的另一方面,提供了一种电子设备,包括本公开提供的指令处理装置。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据本公开提供的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开的一个实施例的指令处理装置的示意框图;
图2A是根据本公开的一个实施例的数据依赖图的示意图;
图2B是根据本公开的一个实施例的调整后的数据依赖图的示意图;
图3是根据本公开的一个实施例的电子设备的示意框图;
图4是根据本公开的一个实施例的指令处理方法的流程图;以及
图5是根据本公开的一个实施例的可以应用指令处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
指令调度可以重新安排指令执行的顺序来减少指令之间的依赖关系,也可以减少处理器中执行单元的空闲时间,以最大限度地利用处理器资源。指令调度可以包括静态指令调度和动态指令调度。
静态指令调度可以在编译或汇编时进行。例如,编译器可以根据指令之间的依赖关系、执行时间以及处理器架构的特性,重新确定指令的执行顺序。
动态指令调度可以在程序运行时进行。例如,可以根据实际的指令执行情况进行调整,从而最大限度地利用处理器资源。动态指令调度需要处理器硬件具备乱序执行能力。托马苏洛(Tomasulo)算法是一种常见的动态调度算法,可以支持乱序执行以更高效地使用处理器中的多个执行单元。基于托马苏洛算法,可以在指令进入指令队列的头部且保留站(Reservation Station)中存在空闲的情况下,将该指令发送到保留站。接下来,在该指令的源操作数就绪的情况下,可以将保留站中的该指令发射到执行单元。
在访存指令被处理器执行之前,部分加载(load)指令或存储(store)指令对应的内存地址是否存在重叠,难以确定。由此,可以阻塞存储指令之前的全部加载指令,直至确定了该加载指令之前的全部存储指令对应的地址。然而,若存储指令在一加载指令之前、已确定一加载指令的地址与存储指令的地址之间无重叠、且加载指令与存储指令无数据依赖,该加载指令也会被阻塞。即使加载指令可以被执行,也会在之前的存储指令被执行之后再执行,严重影响了硬件的执行效率。
由此,为了提高指令执行效率,本公开提供了一种指令处理装置,下面将进行说明。
图1是根据本公开的一个实施例的指令处理装置的示意框图。
如图1所示,装置100可以包括存储单元110和处理单元120。
存储单元110,可以包括内存、寄存器和显存等各种存储单元。内存中的多个地址空间可以作为多个存储空间。寄存器内的存储区域也可以作为存储空间。可以理解,以内存为例,内存中在前指令对应的地址空间可以被释放,以便被在后指令对应的数据使用。由此,不同指令的地址空间可以完全重叠或部分重叠。
处理单元120,配置为:从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令。响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前。
在本公开实施例中,处理单元120可以运行编译器。编译器可以对代码进行编译,得到多个待执行指令以及待执行指令各自的执行时刻。
在本公开实施例中,可以将任一加载指令作为目标加载指令,
在本公开实施例中,可以将执行时刻在目标加载指令之前的任一存储指令作为候选存储指令。
在本公开实施例中,可以建立目标加载指令与候选存储指令之间的依赖关系,使得目标加载指令在候选存储指令之前执行。
通过本公开实施例中,即使存储指令的执行时刻在加载指令之前,若加载指令的存储空间与存储指令的存储空间不重叠,加载指令不会被存储指令阻塞。由此,在多个待执行指令被执行时,减少加载指令以及相关在后指令的等待时间,加速指令执行效率,提高芯片的性能。
可以理解,上文对本公开的指令执行装置进行了说明,下面将对本公开的处理单元进行进一步说明。
在一些实施例中,处理单元还可以配置为:响应于确定执行时刻在候选加载指令之前的至少一个待执行指令中存在存储指令,将候选加载指令确定为目标加载指令。
在一些实施例中,处理单元还可以配置为确定目标加载指令的前驱指令是否包括候选存储指令。
在本公开实施例中,处理单元还可以配置为执行以下操作以响应于确定目标加载指令对应的存储单元存储空间和候选存储指令对应的存储单元中存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前:响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠且目标加载指令的前驱指令不包括候选存储指令,将目标加载指令的执行时刻调整至候选存储指令之前。
在本公开实施例中,前驱指令为与目标指令相关的在前指令。例如,第一计算指令的输出是第二计算指令的输入。目标加载指令可以加载第二计算指令的输出。第一计算指令和第二计算指令均可以作为目标加载指令的前驱指令。
在本公开实施例中,处理单元还可以配置为:响应于确定目标加载指令的存储空间和候选存储指令的存储空间重叠或确定目标加载指令的前驱指令包括候选存储指令,返回至确定候选存储指令的操作。例如,目标加载指令的第一候选存储指令用于将第一数据存储至第一存储空间。上述第一计算指令的输入是该第一数据。由此,第一候选存储指令可以作为目标加载指令的前驱指令,可以返回至确定候选存储指令的操作。又例如,接下来,可以确定目标加载指令的第二候选存储指令是否为目标加载指令的前驱指令,以及也可以确定目标加载指令的存储空间是否与第二候选存储指令的存储空间重叠。第二候选存储指令可以将第二数据存储至第二存储空间。
在一些实施例中,处理单元还可以配置为:响应于确定已确定目标加载指令的任一候选存储指令的存储空间是否与目标加载指令的存储空间重叠,返回至确定目标加载指令的操作。例如,可以从多个待执行指令中再确定出一加载指令,作为新的目标加载指令。
可以理解,上文对本公开的处理单元进行了说明,下面将结合数据依赖图对本公开的处理单元进行进一步说明。
在一些实施例中,处理单元还可以配置为:获取与多个待执行指令对应的数据依赖图(Data Dependence Graph,DDG)。
在本公开实施例中,数据依赖图包括与多个待执行指令对应的多个结点,数据依赖图还包括至少一个边,边用于连接两个结点,边用于指示两个结点之间的依赖关系。例如,如上述,编译器可以确定多个待执行指令,也可以确定数据依赖图。数据依赖图可以是有向无环图(Directed Acyclic Graph,DAG)。数据依赖图中每个结点与一个待执行指令对应。数据依赖图中的边可以为有向边。如上述,第一计算指令的输出作为第二计算指令的输入。在数据依赖图中,第一计算指令可以与第一计算结点对应,第二计算指令可以与第二计算结点对应。经由一有向边,第一计算结点可以与第二计算结点连接。该有向边由第一计算结点指向第二计算结点。
可以理解,上文对本公开的数据依赖图进行了说明,下面将结合图2A对本公开的数据依赖图进行进一步说明。
图2A是根据本公开的一个实施例的数据依赖图的示意图。
如图2A所示,数据依赖图20可以包括多个结点。多个结点可以包括存储结点S211、计算结点C211、计算结点C212、加载结点L211、计算结点C221、存储结点S221、计算结点C222和计算结点C223。可以理解,计算结点C211例如可以为上述的第一计算结点。计算结点C212例如可以为上述的第二计算结点。
在本公开实施例中,处理单元还可以配置为执行以下操作以响应于确定执行时刻在候选加载指令之前的至少一个待执行指令中存在存储指令,将候选加载指令确定为目标加载指令:响应于确定候选加载结点之前的至少一个结点中存在存储结点,将候选加载结点确定目标加载结点。例如,可以遍历数据依赖图20的多个结点。在遍历到加载结点L211时,可以将该加载结点L211作为候选加载结点。接下来,可以确定加载结点L211之前的结点存在存储结点S211和存储结点S221。由此,可以将加载结点L211确定为目标加载结点。
在本公开实施例中,处理单元还可以配置为执行以下操作以从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令:从目标加载结点之前的至少一个结点中确定候选存储结点,其中,候选存储结点与存储指令对应。例如,可以将存储结点S221作为候选存储结点。
在本公开实施例中,处理单元还配置为执行以下操作以响应于确定目标加载指令的存储空间和候选存储指令的存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前:响应于确定目标加载指令的存储空间和候选存储指令的存储空间不重叠且目标加载结点的前驱结点不包括候选存储结点,建立由目标加载结点指向候选存储结点的有向边,得到调整后的数据依赖图。例如,如图2A所示,存储结点S211对应的存储指令可以将第一数据存储至第一存储空间。计算结点C211对应的计算指令可以将第一数据作为输入。计算结点C212对应的计算指令可以将计算结点C211对应的计算指令的计算结果作为输入。加载结点L211对应的加载指令可以加载计算结点C212对应的计算指令的计算结果。由此,加载结点L211的前驱结点包括存储结点S211、计算结点C211和计算结点C212,不包括存储结点S221。接下来,若确定加载结点L211对应的加载指令的存储空间与存储结点S221对应的存储指令的存储空间不重叠,可以建立由加载结点L211指向存储结点S221的有向边,得到如图2B所示的调整后的数据依赖图21。
图2B是根据本公开的一个实施例的调整后的数据依赖图。
如图2B所示,调整后的数据依赖图21中包括由加载结点L211指向存储结点S221的有向边。
在本公开实施例中,处理单元还可以配置为:响应于已确定目标加载指令的一候选存储指令的存储空间是否与目标加载指令的存储空间重叠,返回至确定候选存储指令的操作。例如,响应于已确定存储结点S221的存储空间是否与加载结点L211的存储空间重叠,可以将上述的存储结点S211作为下一个候选存储结点。
若存储结点S211的存储空间与加载结点L211不重叠,可以确定存储结点S211是否为加载结点L211的前驱结点。如图2A所示,存储结点S211为加载结点L211的前驱结点。由此,为了保证计算结果的精确性,可以不对调整后的数据依赖图进行再次调整。接下来,在已确定加载结点L211的任一候选存储结点的存储空间是否与加载结点L211的存储空间重叠的情况下,可以返回至确定目标加载结点的操作。
在本公开实施例中,处理单元还可以配置为:利用调整后的数据依赖图执行多个待执行指令。例如,可以利用上述调整后的数据依赖图21执行多个待执行指令。在计算结点C221对应的计算指令执行完成之后,存储结点S221对应的存储指令可以在加载结点L211对应的加载指令执行完成之后再执行。
通过本公开实施例,利用数据依赖图可以快速确定加载指令和存储指令对应的执行时间,也可以快速确定结点前驱结点。由此,可以提高指令处理效率,提高芯片性能。
在本公开实施例中,处理单元还配置为执行以下操作以响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前:响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠、目标加载指令的前驱指令不包括候选存储指令且目标加载指令与候选存储指令之间不存在依赖关系,将目标加载指令的执行时刻调整至候选存储指令之前。
例如,可以获取目标加载指令的依赖关系。目标加载指令例如可以与第二计算指令之间存在依赖关系,与候选存储指令不存在依赖关系。由此,在目标加载指令的存储空间与候选存储指令的存储空间不重叠、目标加载指令的前驱指令不包括候选存储指令且目标加载指令与候选存储指令不存在依赖关系的情况下,可以将目标加载指令的执行时刻调整至候选存储指令之前。
又例如,也可以根据上述的数据依赖图,确定与加载结点L211存在依赖关系的结点。如图2A所示,加载结点L211与计算结点C212之间经由有向边连接。加载结点L211与计算结点C212之间存在依赖关系。加载结点L211未与存储结点S221连接。加载结点L211与存储结点S221之间不存在依赖关系。由此,在加载结点L211对应的加载指令的存储空间与存储结点S221对应的存储指令的存储空间不重叠、加载结点L211的前驱结点不包括存储结点S221且加载结点L211与存储结点S221之间不存在依赖关系的情况下,可以建立由加载结点L211指向存储结点S221的有向边。
可以理解,确定目标加载指令与候选存储指令的存储空间是否重叠、确定目标加载指令的前驱指令是否包括候选存储指令以及确定目标加载指令是否与候选存储指令存在依赖关系,可以按照任意顺序执行,也可以并行执行。
可以理解,上文对本公开的指令处理装置进行了说明,下面将对包括该指令处理装置的识别进行说明。
图3是根据本公开的一个实施例的电子设备的示意图。
如图3所示,电子设备3000可以包括装置300。
在本公开实施例中,装置300可以为上述的装置100。
可以理解,上文对本公开的电子设备进行了说明,下面将对本公开的指令处理方法进行说明。
图4是根据本公开的一个实施例的指令处理方法的示意流程图。
如图4所示,该方法400可以包括操作S410至操作S420。
在操作S410,从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令。
在操作S420,响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前。可以理解,方法400例如可以由上述的处理单元120执行。
在一些实施例中,方法400还可以包括:获取与多个待执行指令对应的数据依赖图。例如,数据依赖图包括与多个待执行指令对应的多个结点,数据依赖图还包括至少一个边,边用于连接两个结点,边用于指示两个结点之间的依赖关系。
在一些实施例中,多个结点包括与目标加载指令对应的目标加载结点,从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令包括:从目标加载结点之前的至少一个结点中确定候选存储结点。例如,候选存储结点与存储指令对应。
在一些实施例中,将目标加载指令的执行时刻调整至候选存储指令之前包括:建立由目标加载结点指向候选存储结点的有向边,得到调整后的数据依赖图。
在一些实施例中,方法400还可以包括:利用调整后的数据依赖图执行多个待执行指令。
在一些实施例中,响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前包括:响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠且目标加载指令的前驱指令不包括候选存储指令,将目标加载指令的执行时刻调整至候选存储指令之前。
在一些实施例中,响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠,将目标加载指令的执行时刻调整至候选存储指令之前包括:响应于确定目标加载指令对应的存储单元中存储空间和候选存储指令对应的存储单元中存储空间不重叠且目标加载结点的前驱结点不包括候选存储结点,建立由目标加载结点指向候选存储结点的有向边,得到调整后的数据依赖图
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如指令处理方法。例如,在一些实施例中,指令处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的指令处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行指令处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)显示器或者LCD(液晶显示器));以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (18)
1.一种指令处理装置,包括:
存储单元;
处理单元,配置为:
从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令;
响应于确定所述目标加载指令对应的所述存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠,将所述目标加载指令的执行时刻调整至所述候选存储指令之前。
2.根据权利要求1所述的装置,其中,所述处理单元还配置为:
获取与多个所述待执行指令对应的数据依赖图,其中,所述数据依赖图包括与多个所述待执行指令对应的多个结点,所述数据依赖图还包括至少一个边,所述边用于连接两个所述结点,所述边用于指示两个所述结点之间的依赖关系。
3.根据权利要求2所述的装置,其中,多个所述结点包括与所述目标加载指令对应的目标加载结点,
所述处理单元还配置为执行以下操作以从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令:
从所述目标加载结点之前的至少一个所述结点中确定候选存储结点,其中,所述候选存储结点与存储指令对应。
4.根据权利要求3所述的装置,其中,所述处理单元还配置为执行以下操作以将所述目标加载指令的执行时刻调整至所述候选存储指令之前:
建立由所述目标加载结点指向所述候选存储结点的有向边,得到调整后的数据依赖图。
5.根据权利要求4所述的装置,其中,所述处理单元还配置为:
利用所述调整后的数据依赖图执行多个所述待执行指令。
6.根据权利要求1所述的装置,其中,所述处理单元还配置为执行以下操作以响应于确定所述目标加载指令对应的所述存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠,将所述目标加载指令的执行时刻调整至所述候选存储指令之前:
响应于确定所述目标加载指令对应的所述存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠且所述目标加载指令的前驱指令不包括所述候选存储指令,将所述目标加载指令的执行时刻调整至所述候选存储指令之前。
7.根据权利要求3所述的装置,其中,所述处理单元还配置为执行以下操作以响应于确定所述目标加载指令对应的所述存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠,将所述目标加载指令的执行时刻调整至所述候选存储指令之前:
响应于确定所述目标加载指令对应的所述存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠且所述目标加载结点的前驱结点不包括所述候选存储结点,建立由所述目标加载结点指向所述候选存储结点的有向边,得到调整后的数据依赖图。
8.一种电子设备,包括如权利要求1至7任一项所述的装置。
9.一种指令处理方法,包括:
从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令;
响应于确定所述目标加载指令对应的存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠,将所述目标加载指令的执行时刻调整至所述候选存储指令之前。
10.根据权利要求9所述的方法,还包括:
获取与多个所述待执行指令对应的数据依赖图,其中,所述数据依赖图包括与多个所述待执行指令对应的多个结点,所述数据依赖图还包括至少一个边,所述边用于连接两个所述结点,所述边用于指示两个所述结点之间的依赖关系。
11.根据权利要求10所述的方法,其中,多个所述结点包括与所述目标加载指令对应的目标加载结点,
所述从执行时刻在目标加载指令之前的至少一个待执行指令中确定候选存储指令包括:
从所述目标加载结点之前的至少一个所述结点中确定候选存储结点,其中,所述候选存储结点与存储指令对应。
12.根据权利要求11所述的方法,其中,所述将所述目标加载指令的执行时刻调整至所述候选存储指令之前包括:
建立由所述目标加载结点指向所述候选存储结点的有向边,得到调整后的数据依赖图。
13.根据权利要求12所述的方法,还包括:
利用所述调整后的数据依赖图执行多个所述待执行指令。
14.根据权利要求9所述的方法,其中,所述响应于确定所述目标加载指令对应的存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠,将所述目标加载指令的执行时刻调整至所述候选存储指令之前包括:
响应于确定所述目标加载指令对应的所述存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠且所述目标加载指令的前驱指令不包括所述候选存储指令,将所述目标加载指令的执行时刻调整至所述候选存储指令之前。
15.根据权利要求11所述的方法,其中,所述响应于确定所述目标加载指令对应的存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠,将所述目标加载指令的执行时刻调整至所述候选存储指令之前包括:
响应于确定所述目标加载指令对应的所述存储单元中存储空间和所述候选存储指令对应的所述存储单元中存储空间不重叠且所述目标加载结点的前驱结点不包括所述候选存储结点,建立由所述目标加载结点指向所述候选存储结点的有向边,得到调整后的数据依赖图。
16.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求9至15中任一项所述的方法。
17.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求9至15中任一项所述的方法。
18.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求9至15中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311055614.5A CN117093266A (zh) | 2023-08-21 | 2023-08-21 | 指令处理装置、方法、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311055614.5A CN117093266A (zh) | 2023-08-21 | 2023-08-21 | 指令处理装置、方法、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117093266A true CN117093266A (zh) | 2023-11-21 |
Family
ID=88781038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311055614.5A Pending CN117093266A (zh) | 2023-08-21 | 2023-08-21 | 指令处理装置、方法、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117093266A (zh) |
-
2023
- 2023-08-21 CN CN202311055614.5A patent/CN117093266A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113961351B (zh) | 深度学习模型的分布式训练方法、装置、设备及存储介质 | |
US9501318B2 (en) | Scheduling and execution of tasks based on resource availability | |
CN112540806B (zh) | 一种小程序页面渲染方法、装置、电子设备及存储介质 | |
CN110825436B (zh) | 应用于人工智能芯片的计算方法和人工智能芯片 | |
CN112925587A (zh) | 用于初始化应用的方法和装置 | |
EP3961395A1 (en) | Method and apparatus for scheduling memory access request, device and storage medium | |
CN114816393B (zh) | 信息生成方法、装置、设备以及存储介质 | |
CN116243978A (zh) | 分布式训练中的数据规约方法、装置、介质和训练系统 | |
CN114675890B (zh) | 一种指令执行方法、装置、设备及存储介质 | |
CN116243983A (zh) | 处理器、集成电路芯片、指令处理方法、电子设备和介质 | |
CN114579187B (zh) | 一种指令分配方法、装置、电子设备及可读存储介质 | |
CN116126719A (zh) | 接口测试方法、装置、电子设备及存储介质 | |
CN112783574B (zh) | 应用程序开发方法、装置、设备和存储介质 | |
CN113377360B (zh) | 任务执行方法、装置、电子设备、存储介质和程序产品 | |
CN117093266A (zh) | 指令处理装置、方法、电子设备和存储介质 | |
CN115329143A (zh) | 有向无环图评估方法、装置、设备及存储介质 | |
CN114386577A (zh) | 用于执行深度学习模型的方法、设备和存储介质 | |
CN115495312B (zh) | 业务请求处理方法和装置 | |
CN115600687B (zh) | 模型训练方法、装置、设备以及存储介质 | |
CN116107927A (zh) | 数据处理装置、数据处理方法和电子设备 | |
CN110765098B (zh) | 流程运行预测系统及方法 | |
CN117608798A (zh) | 一种工作流调度方法、装置、设备及介质 | |
CN117270862A (zh) | 基于动态编译的软件可插拔方法、装置、设备和介质 | |
CN116451174A (zh) | 任务执行装置、方法、电子设备和存储介质 | |
CN117608660A (zh) | 指令调度方法、装置、介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |