CN116841622B - 一种地址自增访存指令的生成方法、装置、设备及介质 - Google Patents
一种地址自增访存指令的生成方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116841622B CN116841622B CN202311118433.2A CN202311118433A CN116841622B CN 116841622 B CN116841622 B CN 116841622B CN 202311118433 A CN202311118433 A CN 202311118433A CN 116841622 B CN116841622 B CN 116841622B
- Authority
- CN
- China
- Prior art keywords
- chain expression
- recursive chain
- recursive
- subset
- access instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000014509 gene expression Effects 0.000 claims abstract description 253
- 238000012216 screening Methods 0.000 claims abstract description 15
- 125000004122 cyclic group Chemical group 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 208000008918 voyeurism Diseases 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 230000001939 inductive effect Effects 0.000 claims description 4
- 238000000151 deposition Methods 0.000 claims 1
- 230000006870 function Effects 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000011800 void material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 244000144985 peep Species 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/32—Address formation of the next instruction, e.g. by incrementing the instruction counter
- G06F9/322—Address formation of the next instruction, e.g. by incrementing the instruction counter for non-sequential address
- G06F9/325—Address formation of the next instruction, e.g. by incrementing the instruction counter for non-sequential address for loops, e.g. loop detection or loop counter
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/34—Addressing or accessing the instruction operand or the result ; Formation of operand address; Addressing modes
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Executing Machine-Instructions (AREA)
Abstract
本发明公开了地址自增访存指令的生成方法、装置、设备及介质。该方法包括:对递归链表达式集合进行分组获取多个递归链表达式子集合,并从各递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合;获取目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据关联关系对原始代码进行更新获取中间代码;将中间代码中符合合并条件的访存指令替换为地址自增访存指令。通过生成针对访存指令的递归链表达式集合,并根据所筛选出的目标递归链表达式子集合获取中间代码,并将中间代码中符合合并条件的访存指令替换为地址自增访存指令,从而无需用户参与编写内置函数的情况下,就可以便捷高效的生成地址自增访存指令。
Description
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种地址自增访存指令的生成方法、装置、设备及介质。
背景技术
在现代大规模集成电路设计中,由于晶体管的功耗不再随着晶体管的尺寸缩小而成比例的降低,因此晶体管的功耗往往成为制约大规模集成电路芯片设计的主要障碍。
除去逻辑计算单元等产生高功耗外,多级存储访存带来的高功耗也越来越多的被视为阻碍芯片发展的重要因素,目前在进行多级存储访存时虽然可以通过动态地址自增访存指令来减少访存功耗,但目前并没有通用的语法来生成动态地址自增访存指令,需要程序员通过编写内置函数甚至内联汇编来实现,从而增加了地址自增访存指令的编译难度以及生成效率。
发明内容
本发明实施例提供一种地址自增访存指令的生成方法、装置、设备及介质,以实现地址自增访存指令的自动生成。
第一方面,本发明实施例提供了一种地址自增访存指令的生成方法,包括:对原始代码进行识别确定位于循环结构中的访存指令,并生成针对所述访存指令的递归链表达式集合;
对所述递归链表达式集合进行分组获取多个递归链表达式子集合,并从各所述递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合,其中,各所述递归链表达式子集合中包括步长相同,并且地址间隔符合等差规律的递归链表达式;
获取所述目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据所述关联关系对所述原始代码进行更新获取中间代码;
将所述中间代码中符合合并条件的访存指令替换为地址自增访存指令。
第二方面,本发明实施例提供了一种地址自增访存指令的生成装置,包括:递归链表达式集合生成模块,用于对原始代码进行识别确定位于循环结构中的访存指令,并生成针对所述访存指令的递归链表达式集合;
目标递归链集合确定模块,用于对所述递归链表达式集合进行分组获取多个递归链表达式子集合,并从各所述递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合,其中,各所述递归链表达式子集合中包括步长相同,并且地址间隔符合等差规律的递归链表达式;
中间代码生成模块,用于获取所述目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据所述关联关系对所述原始代码进行更新获取中间代码;
自增访存指令生成模块,用于将所述中间代码中符合合并条件的访存指令替换为地址自增访存指令。
第三方面,本发明实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的方法。
第四方面,本发明实施例提供了一种计算机可执行指令的存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的方法。
本发明通过生成针对访存指令的递归链表达式集合,并根据所筛选出的目标递归链表达式子集合获取中间代码,并将中间代码中符合合并条件的访存指令替换为地址自增访存指令,从而无需用户参与编写内置函数的情况下,就可以便捷高效的生成地址自增访存指令。
附图说明
图1是本发明实施例一中的一种地址自增访存指令的生成方法的流程图;
图2是本发明实施例二中的一种地址自增访存指令的生成方法的流程图;
图3是本发明实施例三中的一种地址自增访存指令的生成装置的结构示意图;
图4是本发明实施例四中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供了一种地址自增访存指令的生成方法流程图,本实施例可适用于自动生成地址自增访存指令的情况,该方法可以由一种地址自增访存指令的生成装置来执行,该装置可以采用硬件和/或软件的形式实现。如图1所示,该方法包括:
步骤S101,对原始代码进行识别确定位于循环结构中的访存指令,并生成针对访存指令的递归链表达式集合。
可选的,对原始代码进行识别确定位于循环结构中的访存指令,并生成针对访存指令的递归链表达式集合,包括:获取原始代码循环结构中所包括的归纳变量;根据循环结构的上下文确定归纳变量的递归链表达式,其中,归纳变量在循环结构中随循环迭代发生变化;扫描原始代码中的访存指令,并根据访存指令中所使用的归纳变量所对应的递归链表达式生成递归链表达式集合。
可选的,根据循环结构的上下文确定归纳变量的递归链表达式,包括:从循环结构的上下文中确定与归纳变量关联的初始地址、操作方式以及步长;根据初始地址、操作方式以及步长生成归纳变量的递归链表达式。
在一个具体实现中,当确定原始代码中存在一个如下形式的循环结构体:
(1)for(i=0; i < n; ++i) {
(2) idx = b + 2 * i;
(3) a[idx] = i*i;
(4)}
其中,首先识别循环结构体中的归纳变量,归纳变量指的是会随着循环迭代发生变化的变量,例如,i和idx。在识别出归纳变量之后会进一步根据上述循环结构的上下文确定归纳变量的递归链表达式,例如针对归纳变量idx来说,根据上下文可以得知其初始地址为b、步长为2、操作方式为递增,因此可以生成针对idx的递归链表达式为{b,+,2},当然,本实施方式中仅是举例说明,而并不对各递归链的递归链表达式的生成方式进行限定。
需要说明的是,为了进一步减少递归链的数量,本实施方式中仅关心存在访存的归纳变量,例如,a[idx] 使用的归纳变量idx来访存,因此归纳变量idx存在访存,而归纳变量i并没有被用作访存,因此归纳变量i不存在访存,因此本实施方式中并不生成归纳变量i的递归链表达式。由于在原始代码中会包含多个循环结构,并且还可能存在多层嵌套的循环结构,因此存在访存的归纳变量的数目众多,相应的可以获取到多个递归链表达式。本实施方式中会扫描原始代码中的访存指令,并根据访存指令中所使用的归纳变量所对应的递归链表达式生成递归链表达式集合,因此在递归链表达式集合中包括多个递归链表达式,本实施方式中并不对所集合中所包含的递归链表达式的数量进行限定。
步骤S102,对递归链表达式集合进行分组获取多个递归链表达式子集合,并从各递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合。
可选的,对递归链表达式集合进行分组获取多个递归链表达式子集合,包括:确定递归链表达式集合中待分组递归链表达式,并获取待分组递归链表达式所对应的目标集合;将待分组递归链表达式存放到目标集合以获取递归链表达式子集合。
可选的,获取待分组递归链表达式所对应的目标集合,包括:当确定分组为空时创建初始集合,并将初始集合作为目标集合;当确定分组为非空时,将待分组递归链表达式与各已有递归链表达式子集合进行对比,将与所包含的各递归链表达式步长相同,并且相减为常数的递归链表达式子集合作为目标集合。
具体的说,本实施方式中在获取到递归链表达式集合之后,会对集合中的各递归链表达式进行分组,即将类似的递归链分为一组,具体分组方式为从集合中任取一个待分组的递归链表达式,并获取待分组的递归链表达式所对应的目标集合,在进行分组时具体采用的是如下方式:
情况a):当确定分组为空时创建初始集合,将初始集合作为目标集合,并将待分组的递归链表达式放入该目标集合中以获取递归链表达式子集合;
情况b):当确定分组为非空时,首先将待分组递归链表达式与各已有的递归链表达式子集合进行对比,当确定与所包含的各递归链表达式步长相同,并且相减为常数的递归链表达式子集合作为目标集合,并将待分组递归链表达式加入该目标集合。若目前已有的递归链表达式子集合均不满足时,则重新创建一个新的初始集合作为目标集合,并将该待分组递归链表达式放入该空的目标集合中。从而在各递归链表达式子集合中包括步长相同,并且地址间隔符合等差规律的递归链表达式。
需要说明的是,本实施方式中在获取到各递归链表达式子集合之后,会进一步对各子集合进行特征考察。并从各递归链表达式子集合中筛选出递归链表达式数量大于等于2个的候选递归链表达式子集合。然后在判断各候选递归链表达式子集合中的递归链表达式是否满足如下规律:
%2 - %1 == %3 - %2 == … == %n - %n -1 = %1 + {步长,+,0} - %n,其中,%n表示候选递归链表达式子集合中的第n个递归链表达式,各相邻递归链表达式差值为指定数值的递归链表达式子集合,而指定数值为第一个递归链表达式加上步长与最后一个递归链表达式相减的差。当确定满足时,则将符合规律的候选递归链表达式子集合筛选出来,并将筛选出的候选递归链表达式子集合作为目标递归链表达式子集合。
步骤S103,获取目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据关联关系对原始代码进行更新获取中间代码。
具体的说,本实施方式中在获取到目标递归链表达式子集合之后,还会根据该子集合中各递归链表达式之间的关联关系对原始代码进行更新获取中间代码,例如,当确定原始代码为下述内容:
(1) void foo(int *lhs, int *rhs, int n) {
(2) for(int i=0;i<n;i+=4) {
(3)int a = *(lhs+i);
(4)int b = *(lhs+i+1);
(5)int c = *(lhs+i+2);
(6)int d = *(lhs+i+3);
(7)*rhs++ = a+b+c+d;
(8) }
(9) }
在代码行(3)(4)(5)(6)的赋值表达式中,我们进行了四次访存操作,因此针对上述循环结构体可以获取到四个递归链表达式,分别为:%a = {%lhs,+,#4}、
%b = {%lhs+1,+,#4}、%c = {%lhs+2,+,#4}、%d = {%lhs+3,+,#4}。对于代码行(3)(4)(5)(6)的访存而言,由于其递归链表达式起始地址相近,且步长相同,因此我们将其构建出一组目标递归链表达式子集合,这里#4代表立即数4,这是因为这四个访存表达式地址在每次迭代中的增量均为4。
进一步地,本发明从递归链信息中可以分析得到:%a与%b在循环的单次迭代中,其访存地址间距为1。依据递归链的运算规则,可得%b = %a + 1,这对于循环的任何一次迭代都是成立的,类似的我们可以得到:%d = %c + 1等,因此可以同组内的递归链可以变换表示为:%a = {%lhs,+,#4}、%b = {%lhs+1,+,#4} = {%lhs,+,#4} + 1 = %a + 1、%c = {%lhs+2,+,#4} = {%lhs+1,+,#4} + 1 = %b + 1、%d = {%lhs+3,+,#4} = {%lhs+2,+,#4} +1 = %c + 1。而在循环的相邻迭代间,也可以通过递归链变换而知:%a + 4 = {%lhs,+,#4}+ 4 = {%lhs+3,+,#4} + 1 = %d + 1。在获取到各递归链表达式之间的关系后,可以根据关联关系对原始代码进行更新获取中间代码如下所示:
(1)void foo(int *lhs, int *rhs, int n) {
(2) int *p = lhs;
(3) for(int i=0;i<n;i+=4) {
(4) int a = *p++;
(5) int b = *p++;
(6) int c = *p++;
(7) int d = *p++;
(8) *rhs++ = a+b+c+d;
(9) }
(10)}
步骤S104,将中间代码中符合合并条件的访存指令替换为地址自增访存指令。
可选的,将中间代码中符合合并条件的访存指令替换为地址自增访存指令,包括:通过窥孔优化对中间代码执行模式匹配并确定匹配范围;当确定匹配成功时对中间代码中匹配范围的访存指令进行替换,以生成地址自增访存指令。
具体的说,本实施方式中在获取到中间代码后,会通过窥孔优化对中间代码执行模式匹配并确定匹配范围,其主要功能是寻找访存地址的更新指令,并判断是否符合合并访存指令与地址更新指令的条件,假如符合则生成相应的地址后增访存指令,本实施方式中并不对窥孔优化的具体原理进行限定。
需要说明的是,上述的中间代码采用的是等效的C语言的编码形式,但在编码过程中实际使用的是编译器能够识别的语言形式,如三地址码等,例如,当确定匹配范围内的三地址码访存指令如下所示:
(1)VLOAD vr0, [r4]
…
(n)ADD r4, r4, #4
其中,在确定匹配成功,即中间代码符合合并条件时会将上述的访存指令进行合并以生成地址自增访存指令,如下所示:
(1)// 循环头的基本块中生成自增量的读入特殊寄存器指令
(2)MOV sp,#4
(3)// 循环体的基本块中生成一下后增指令
其中,本实施方式中使用特殊寄存器sp保存自增量,并将自增量放入特殊寄存器中,再动态后增指令中,其在访存后,会执行r4+sp的操作,即r4+#4,以完成动态地址后增指令的生成。
本申请通过生成针对访存指令的递归链表达式集合,并根据所筛选出的目标递归链表达式子集合获取中间代码,并将中间代码中符合合并条件的访存指令替换为地址自增访存指令,从而无需用户参与编写内置函数的情况下,就可以便捷高效的生成地址自增访存指令。
实施例二
图2为本发明实施例二提供的一种地址自增访存指令的生成方法流程图,本实施例中在获取中间代码之后,还包括对中间代码进行检测,如图2所示,该方法包括:
步骤S201,对原始代码进行识别确定位于循环结构中的访存指令,并生成针对访存指令的递归链表达式集合。
可选的,对原始代码进行识别确定位于循环结构中的访存指令,并生成针对访存指令的递归链表达式集合,包括:获取原始代码循环结构中所包括的归纳变量;根据循环结构的上下文确定归纳变量的递归链表达式,其中,归纳变量在循环结构中随循环迭代发生变化;扫描原始代码中的访存指令,并根据访存指令中所使用的归纳变量所对应的递归链表达式生成递归链表达式集合。
可选的,根据循环结构的上下文确定归纳变量的递归链表达式,包括:从循环结构的上下文中确定与归纳变量关联的初始地址、操作方式以及步长;根据初始地址、操作方式以及步长生成归纳变量的递归链表达式。
步骤S202,对递归链表达式集合进行分组获取多个递归链表达式子集合,并从各递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合。
可选的,对递归链表达式集合进行分组获取多个递归链表达式子集合,包括:确定递归链表达式集合中待分组递归链表达式,并获取待分组递归链表达式所对应的目标集合;将待分组递归链表达式存放到目标集合以获取递归链表达式子集合。
可选的,获取待分组递归链表达式所对应的目标集合,包括:当确定分组为空时创建初始集合,并将初始集合作为目标集合;当确定分组为非空时,将待分组递归链表达式与各已有递归链表达式子集合进行对比,将与所包含的各递归链表达式步长相同,并且相减为常数的递归链表达式子集合作为目标集合。
步骤S203,获取目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据关联关系对原始代码进行更新获取中间代码。
步骤S204,对中间代码进行检测。
具体的说,本实施方式中在在获取到中间代码之后,还会对中间代码进行检测,具体可以是对中间代码的语法格式进行检测,确定中间代码是否符合标准编译规范,当确定所获取的中间代码的语法格式不符合标准编译规范时,则说明所获取的中间代码有误,并生成中间代码错误提示信息;当所获取的中间代码的语法格式符合标准编译规范时,则生成中间代码正确提示信息。
步骤S205,将中间代码中符合合并条件的访存指令替换为地址自增访存指令。
可选的,将中间代码中符合合并条件的访存指令替换为地址自增访存指令,包括:通过窥孔优化对中间代码执行模式匹配并确定匹配范围;当确定匹配成功时对中间代码中匹配范围的访存指令进行替换,以生成地址自增访存指令。
本申请通过生成针对访存指令的递归链表达式集合,并根据所筛选出的目标递归链表达式子集合获取中间代码,并将中间代码中符合合并条件的访存指令替换为地址自增访存指令,从而无需用户参与编写内置函数的情况下,就可以便捷高效的生成地址自增访存指令。
实施例三
图3为本发明实施例三提供的一种地址自增访存指令的生成装置的结构示意图,如图3所示,该装置包括:递归链表达式收集模块310、目标递归链表达式处理模块320、中间代码生成模块330和自增访存指令生成模块340。
递归链表达式收集模块310,用于对原始代码进行识别确定位于循环结构中的访存指令,并生成针对访存指令的递归链表达式集合;
目标递归链表达式处理模块320,用于对递归链表达式集合进行分组获取多个递归链表达式子集合,并从各递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合,其中,各递归链表达式子集合中包括步长相同,并且地址间隔符合等差规律的递归链表达式;
中间代码生成模块330,用于获取目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据关联关系对原始代码进行更新获取中间代码;
自增访存指令生成模块340,用于将中间代码中符合合并条件的访存指令替换为地址自增访存指令。
可选的,递归链表达式集合生成模块,用于获取原始代码循环结构中所包括的归纳变量;
根据循环结构的上下文确定归纳变量的递归链表达式,其中,归纳变量在循环结构中随循环迭代发生变化;
扫描原始代码中的访存指令,并根据访存指令中所使用的归纳变量所对应的递归链表达式生成递归链表达式集合。
可选的,递归链表达式集合生成模块,还用于从循环结构的上下文中确定与归纳变量关联的初始地址、操作方式以及步长;
根据初始地址、操作方式以及步长生成归纳变量的递归链表达式。
可选的,目标递归链表达式子集合确定模块包括递归链表达式子集合获取单元,用于 确定递归链表达式集合中待分组递归链表达式,并获取待分组递归链表达式所对应的目标集合;
将待分组递归链表达式存放到目标集合以获取递归链表达式子集合。
可选的,递归链表达式子集合获取单元,还用于当确定分组为空时创建初始集合,并将初始集合作为目标集合;
当确定分组为非空时,将待分组递归链表达式与各已有递归链表达式子集合进行对比,将与所包含的各递归链表达式步长相同,并且相减为常数的递归链表达式子集合作为目标集合。
可选的,目标递归链表达式子集合确定模块包括目标递归链表达式子集合确定单元,用于从各递归链表达式子集合中选择出递归链表达式数量大于等于2个的候选递归链表达式子集合;
从各候选递归链表达式子集合中筛选出所包含的各相邻递归链表达式差值为指定数值的递归链表达式子集合,其中,指定数值为第一个递归链表达式加上步长与最后一个递归链表达式相减的差;
将筛选出的递归链表达式子集合作为目标递归链表达式子集合。
可选的,自增访存指令生成模块,用于通过窥孔优化对中间代码执行模式匹配并确定匹配范围;
当确定匹配成功时对中间代码中匹配范围的访存指令进行替换,以生成地址自增访存指令。
本发明实施例所提供的地址自增访存指令的生成装置可执行本发明任意实施例所提供的地址自增访存指令的生成方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例六提供的一种计算机设备的结构示意图,如图4所示,该计算机设备包括处理器610、存储器620、输入装置630和输出装置640;计算机设备中处理器610的数量可以是一个或多个,图4中以一个处理器610为例;计算机设备中的处理器610、存储器620、输入装置630和输出装置640可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器620作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的地址自增访存指令的生成方法对应的程序指令/模块。处理器610通过运行存储在存储器620中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的地址自增访存指令的生成方法。
地址自增访存指令的生成方法包括:
对原始代码进行识别确定位于循环结构中的访存指令,并生成针对访存指令的递归链表达式集合;
对递归链表达式集合进行分组获取多个递归链表达式子集合,并从各递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合,其中,各递归链表达式子集合中包括步长相同,并且地址间隔符合等差规律的递归链表达式;
获取目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据关联关系对原始代码进行更新获取中间代码;
将中间代码中符合合并条件的访存指令替换为地址自增访存指令。
存储器620可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器620可进一步包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置630可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。
实施例五
本发明实施例七还提供一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行一种地址自增访存指令的生成方法;
对原始代码进行识别确定位于循环结构中的访存指令,并生成针对访存指令的递归链表达式集合;
对递归链表达式集合进行分组获取多个递归链表达式子集合,并从各递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合,其中,各递归链表达式子集合中包括步长相同,并且地址间隔符合等差规律的递归链表达式;
获取目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据关联关系对原始代码进行更新获取中间代码;
将中间代码中符合合并条件的访存指令替换为地址自增访存指令。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上的方法操作,还可以执行本发明任意实施例所提供的地址自增访存指令的生成方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(RandomAccess Memory, RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
值得注意的是,上述地址自增访存指令的生成装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (9)
1.一种地址自增访存指令的生成方法,其特征在于,包括:
对原始代码进行识别确定位于循环结构中的访存指令,并生成针对所述访存指令的递归链表达式集合;
对所述递归链表达式集合进行分组获取多个递归链表达式子集合,并从各所述递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合,其中,各所述递归链表达式子集合中包括步长相同,并且地址间隔符合等差规律的递归链表达式;
获取所述目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据所述关联关系对所述原始代码进行更新获取中间代码;
将所述中间代码中符合合并条件的访存指令替换为地址自增访存指令;
所述从各所述递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合,包括:从各所述递归链表达式子集合中选择出递归链表达式数量大于等于2个的候选递归链表达式子集合;
从各所述候选递归链表达式子集合中筛选出所包含的各相邻递归链表达式差值为指定数值的递归链表达式子集合,其中,所述指定数值为第一个递归链表达式加上步长与最后一个递归链表达式相减的差;
将所述筛选出的递归链表达式子集合作为所述目标递归链表达式子集合。
2.根据权利要求1所述的方法,其特征在于,所述对原始代码进行识别确定位于循环结构中的访存指令,并生成针对所述访存指令的递归链表达式集合,包括:
获取所述原始代码循环结构中所包括的归纳变量;
根据所述循环结构的上下文确定所述归纳变量的递归链表达式,其中,所述归纳变量在所述循环结构中随循环迭代发生变化;
扫描所述原始代码中的访存指令,并根据所述访存指令中所使用的归纳变量所对应的递归链表达式生成所述递归链表达式集合。
3.根据权利要求2所述的方法,其特征在于,所述根据所述循环结构的上下文确定所述归纳变量的递归链表达式,包括:
从所述循环结构的上下文中确定与所述归纳变量关联的初始地址、操作方式以及步长;
根据所述初始地址、所述操作方式以及所述步长生成所述归纳变量的递归链表达式。
4.根据权利要求1所述的方法,其特征在于,所述对所述递归链表达式集合进行分组获取多个递归链表达式子集合,包括:
确定所述递归链表达式集合中待分组递归链表达式,并获取所述待分组递归链表达式所对应的目标集合;
将所述待分组递归链表达式存放到所述目标集合以获取所述递归链表达式子集合。
5.根据权利要求4所述的方法,其特征在于,所述获取所述待分组递归链表达式所对应的目标集合,包括:
当确定分组为空时创建初始集合,并将所述初始集合作为所述目标集合;
当确定分组为非空时,将待分组递归链表达式与各已有递归链表达式子集合进行对比,将与所包含的各递归链表达式步长相同,并且相减为常数的递归链表达式子集合作为所述目标集合。
6.根据权利要求1所述的方法,其特征在于,所述将所述中间代码中符合合并条件的访存指令替换为地址自增访存指令,包括:
通过窥孔优化对所述中间代码执行模式匹配并确定匹配范围;
当确定匹配成功时对所述中间代码中所述匹配范围的访存指令进行替换,以生成所述地址自增访存指令。
7.一种地址自增访存指令的生成装置,其特征在于,包括:
递归链表达式收集模块,用于对原始代码进行识别确定位于循环结构中的访存指令,并生成针对所述访存指令的递归链表达式集合;
目标递归链表达式处理模块,用于对所述递归链表达式集合进行分组获取多个递归链表达式子集合,并从各所述递归链表达式子集合中筛选出符合地址自增规则的目标递归链表达式子集合,其中,各所述递归链表达式子集合中包括步长相同,并且地址间隔符合等差规律的递归链表达式;
中间代码生成模块,用于获取所述目标递归链表达式子集合中各递归链表达式之间的关联关系,并根据所述关联关系对所述原始代码进行更新获取中间代码;
自增访存指令生成模块,用于将所述中间代码中符合合并条件的访存指令替换为地址自增访存指令;
所述目标递归链表达式处理模块,用于从各所述递归链表达式子集合中选择出递归链表达式数量大于等于2个的候选递归链表达式子集合;
从各所述候选递归链表达式子集合中筛选出所包含的各相邻递归链表达式差值为指定数值的递归链表达式子集合,其中,所述指定数值为第一个递归链表达式加上步长与最后一个递归链表达式相减的差;
将所述筛选出的递归链表达式子集合作为所述目标递归链表达式子集合。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一项所述的方法。
9.一种计算机可执行指令的存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311118433.2A CN116841622B (zh) | 2023-09-01 | 2023-09-01 | 一种地址自增访存指令的生成方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311118433.2A CN116841622B (zh) | 2023-09-01 | 2023-09-01 | 一种地址自增访存指令的生成方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116841622A CN116841622A (zh) | 2023-10-03 |
CN116841622B true CN116841622B (zh) | 2023-11-24 |
Family
ID=88167486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311118433.2A Active CN116841622B (zh) | 2023-09-01 | 2023-09-01 | 一种地址自增访存指令的生成方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116841622B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1296226A2 (en) * | 2001-01-31 | 2003-03-26 | Siroyan Limited | Processing program loops in a processor |
CN102314342A (zh) * | 2010-06-18 | 2012-01-11 | 微软公司 | 用于数据并行编程模型的编译器生成的调用存根 |
CN104899147A (zh) * | 2015-06-19 | 2015-09-09 | 北京理工大学 | 一种面向安全检查的代码静态分析方法 |
CN105242929A (zh) * | 2015-10-13 | 2016-01-13 | 西安交通大学 | 一种针对多核平台的二进制程序自动并行化的设计方法 |
CN106201641A (zh) * | 2015-04-29 | 2016-12-07 | 龙芯中科技术有限公司 | 函数的访存优化编译方法和装置 |
CN106610860A (zh) * | 2015-10-26 | 2017-05-03 | 三星电子株式会社 | 半导体装置的操作方法和半导体系统 |
CN107533466A (zh) * | 2015-04-14 | 2018-01-02 | 微软技术许可有限责任公司 | 独立表达式动画 |
CN108509723A (zh) * | 2018-04-02 | 2018-09-07 | 东南大学 | 基于人工神经网络的LRU Cache预取机制性能收益评估方法 |
CN110457041A (zh) * | 2018-05-07 | 2019-11-15 | 英特尔公司 | 利用循环和数据分区的编译器变换 |
CN110741617A (zh) * | 2018-12-14 | 2020-01-31 | Oppo广东移动通信有限公司 | 资源更新方法、装置、计算机设备和存储介质 |
CN112749038A (zh) * | 2021-01-26 | 2021-05-04 | 北京中电兴发科技有限公司 | 一种在软件系统中实现软件看门狗的方法及系统 |
CN113508385A (zh) * | 2019-02-19 | 2021-10-15 | 洛林·G·克雷默三世 | 使用子例程图谱进行形式语言处理的方法和系统 |
CN113805499A (zh) * | 2021-09-14 | 2021-12-17 | 北京邮电大学 | 一种航天器遥控指令计划生成方法 |
CN115098162A (zh) * | 2022-06-10 | 2022-09-23 | 南京大学 | 基于高精度静态程序分析的循环上界计算方法 |
CN115344866A (zh) * | 2022-07-20 | 2022-11-15 | 国网黑龙江省电力有限公司 | 基于符号执行的跨架构二进制可执行文件漏洞检测方法及系统 |
CN115794122A (zh) * | 2023-02-13 | 2023-03-14 | 深圳开源互联网安全技术有限公司 | 函数调用链递归解除方法、装置、系统与可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8869109B2 (en) * | 2008-03-17 | 2014-10-21 | Microsoft Corporation | Disassembling an executable binary |
US9424011B2 (en) * | 2014-04-01 | 2016-08-23 | International Business Machines Corporation | Recursive expression simplification |
US10908901B2 (en) * | 2017-06-29 | 2021-02-02 | Texas Instruments Incorporated | Streaming engine with early exit from loop levels supporting early exit loops and irregular loops |
-
2023
- 2023-09-01 CN CN202311118433.2A patent/CN116841622B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1296226A2 (en) * | 2001-01-31 | 2003-03-26 | Siroyan Limited | Processing program loops in a processor |
CN102314342A (zh) * | 2010-06-18 | 2012-01-11 | 微软公司 | 用于数据并行编程模型的编译器生成的调用存根 |
CN107533466A (zh) * | 2015-04-14 | 2018-01-02 | 微软技术许可有限责任公司 | 独立表达式动画 |
CN106201641A (zh) * | 2015-04-29 | 2016-12-07 | 龙芯中科技术有限公司 | 函数的访存优化编译方法和装置 |
CN104899147A (zh) * | 2015-06-19 | 2015-09-09 | 北京理工大学 | 一种面向安全检查的代码静态分析方法 |
CN105242929A (zh) * | 2015-10-13 | 2016-01-13 | 西安交通大学 | 一种针对多核平台的二进制程序自动并行化的设计方法 |
CN106610860A (zh) * | 2015-10-26 | 2017-05-03 | 三星电子株式会社 | 半导体装置的操作方法和半导体系统 |
CN108509723A (zh) * | 2018-04-02 | 2018-09-07 | 东南大学 | 基于人工神经网络的LRU Cache预取机制性能收益评估方法 |
CN110457041A (zh) * | 2018-05-07 | 2019-11-15 | 英特尔公司 | 利用循环和数据分区的编译器变换 |
CN110741617A (zh) * | 2018-12-14 | 2020-01-31 | Oppo广东移动通信有限公司 | 资源更新方法、装置、计算机设备和存储介质 |
CN113508385A (zh) * | 2019-02-19 | 2021-10-15 | 洛林·G·克雷默三世 | 使用子例程图谱进行形式语言处理的方法和系统 |
CN112749038A (zh) * | 2021-01-26 | 2021-05-04 | 北京中电兴发科技有限公司 | 一种在软件系统中实现软件看门狗的方法及系统 |
CN113805499A (zh) * | 2021-09-14 | 2021-12-17 | 北京邮电大学 | 一种航天器遥控指令计划生成方法 |
CN115098162A (zh) * | 2022-06-10 | 2022-09-23 | 南京大学 | 基于高精度静态程序分析的循环上界计算方法 |
CN115344866A (zh) * | 2022-07-20 | 2022-11-15 | 国网黑龙江省电力有限公司 | 基于符号执行的跨架构二进制可执行文件漏洞检测方法及系统 |
CN115794122A (zh) * | 2023-02-13 | 2023-03-14 | 深圳开源互联网安全技术有限公司 | 函数调用链递归解除方法、装置、系统与可读存储介质 |
Non-Patent Citations (1)
Title |
---|
一种针对异构计算平台的编译期优化方法;裴根;朱振国;孔颖;;计算机应用研究(第05期);第1402-1405页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116841622A (zh) | 2023-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110187885B (zh) | 一种量子程序编译的中间代码生成方法及装置 | |
CN111078290B (zh) | 一种用于可扩展指令集的编译器及编译方法 | |
US10394694B2 (en) | Unexplored branch search in hybrid fuzz testing of software binaries | |
US7069548B2 (en) | Inter-procedure global register allocation method | |
CN109829096B (zh) | 一种数据采集方法、装置、电子设备及存储介质 | |
JP2014506692A (ja) | Fsmを実装するための専用要素の利用 | |
CN108139896A (zh) | 扩展虚拟机指令集体系架构 | |
US20200225921A1 (en) | Lookup table optimization for programming languages that target synchronous digital circuits | |
US11301218B2 (en) | Graph-based vectorization for software code optimization references | |
KR102013582B1 (ko) | 혼합 모드 프로그램의 소스 코드 오류 위치 검출 장치 및 방법 | |
Gorlatch | Extracting and implementing list homomorphisms in parallel program development | |
CN115469894A (zh) | 一种应用程序的安装控制方法、装置、设备及存储介质 | |
CN111240772A (zh) | 一种基于区块链的数据处理方法、装置及存储介质 | |
US11256488B1 (en) | Graph-based vectorization for software code optimizations | |
CN113987405A (zh) | 一种基于ast的数学表达式计算算法 | |
CN116484947B (zh) | 算子的自动生成方法、装置、设备及介质 | |
CN116841622B (zh) | 一种地址自增访存指令的生成方法、装置、设备及介质 | |
CN103270512A (zh) | 智能架构创建器 | |
CN112948400A (zh) | 一种数据库管理方法、数据库管理装置及终端设备 | |
CN112527304A (zh) | 基于异构平台的自适应节点融合编译优化方法 | |
CN114840256A (zh) | 一种程序数据级并行分析方法、装置及相关设备 | |
CN112114817A (zh) | 基于cobol语言的数据字典字段信息获取方法及装置 | |
CN116414396A (zh) | 一种llvm的目标定义文件生成方法、装置和电子设备 | |
CN116560667B (zh) | 一种基于预编译延迟执行的拆分调度系统及方法 | |
CN112905181B (zh) | 一种模型编译、运行方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |