CN108920151A - 一种生成并行程序的方法及装置 - Google Patents
一种生成并行程序的方法及装置 Download PDFInfo
- Publication number
- CN108920151A CN108920151A CN201710283260.8A CN201710283260A CN108920151A CN 108920151 A CN108920151 A CN 108920151A CN 201710283260 A CN201710283260 A CN 201710283260A CN 108920151 A CN108920151 A CN 108920151A
- Authority
- CN
- China
- Prior art keywords
- execution
- parallel
- sequence
- sentence
- target program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims description 28
- 238000005457 optimization Methods 0.000 claims description 6
- 239000002245 particle Substances 0.000 claims description 6
- 238000002922 simulated annealing Methods 0.000 claims description 6
- 230000002068 genetic effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 10
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/44—Encoding
- G06F8/443—Optimisation
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
本发明实施例公开了一种调整程序执行顺序的方法及装置,该方法包括:获取目标程序的当前执行顺序,所述目标程序包括第一执行语句和第二执行语句,所述第一执行语句和所述第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系,所述依赖关系是指所述第二执行语句的执行依赖所述第一执行语句的执行结果;根据所述依赖关系,将所述目标程序的当前执行顺序调整为目标执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路。由此可见,当串行执行的两条执行语句不存在依赖关系时可以自动调整为并行执行,提高了开发并行程序的工作效率,降低了开发并行程序的难度。
Description
技术领域
本发明涉及软件程序自动优化技术领域,尤其涉及一种生成并行程序的方法及装置。
背景技术
计算机程序或者软件程序(通常简称程序)是指一组指示计算机或其他具有信息处理能力装置执行动作或做出判断的指令,通常用某种程序设计语言编写,运行于某种目标体系结构上。
最初的计算机只具有单核体系架构的处理器,基于此,计算机程序员编写的程序为串行程序,即编写好的程序只有一条串行执行支路,即程序中所有执行语句均处于上述串行执行支路中,其中,相邻的两条执行语句中后一条执行语句的执行并不一定依赖前一条执行语句的执行结果。而目前计算机大多使用多核多个中央处理器(英文:CentralProcessing Unit,简称:CPU),即多个CPU,每个处理器中集成两个或多个完整的计算引擎,为方便解决大规模的计算问题,可以挖掘问题求解过程中的并行性,寻求并行算法与并行机器体系结构的最佳匹配和映射,合理组织并行任务,减少额外消息传递和数据移动开销,然后就产生了并行计算,也就是说程序员需要开发并行程序。
发明人经过研究发现,计算机程序员以串行程序思路开发软件的工作效率更高,而计算机程序员以并行程序思路开发并行程序其工作效率低,开发难度也比较大,且所开发并行程序的并行计算的效率多依赖于软件工程师的技术水平和经验累积。
发明内容
本发明所要解决的技术问题是,提供一种调整程序执行顺序的方法及装置,以提高了开发并行程序的工作效率,降低了开发并行程序的难度。
第一方面,本发明实施例提供了一种调整程序执行顺序的方法,该方法包括:
获取目标程序的当前执行顺序,所述目标程序包括第一执行语句和第二执行语句,所述第一执行语句和所述第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系,所述依赖关系是指所述第二执行语句的执行依赖所述第一执行语句的执行结果;
根据所述依赖关系,将所述目标程序的当前执行顺序调整为目标执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路。
优选的,所述根据所述依赖关系,将所述目标程序的当前执行顺序调整为目标执行顺序,具体包括:
根据所述依赖关系,将所述目标程序的当前执行顺序调整为第一执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路;
获取调整为第一执行顺序的目标程序中并行执行支路的数量;
若所述调整为第一执行顺序的目标程序中并行执行支路的数量大于预设阈值,根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,所述调整为目标执行顺序的目标程序中并行执行支路的数量不大于所述预设阈值,所述预设阈值是根据所述目标程序需运行平台的并行计算资源设定的;
若所述调整为第一执行顺序的目标程序中并行执行支路的数量不大于预设阈值,则将所述第一执行顺序确定为所述目标程序的目标执行顺序。
优选的,所述根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,具体包括:
根据所述预设阈值,从所述调整为第一执行顺序的目标程序中并行执行支路的集合中选取并行执行支路,获得第一并行执行支路集合,所述第一并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
根据所述依赖关系和所述第一并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
优选的,所述根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,具体包括:
获取所述调整为第一执行顺序的目标程序中并行执行支路中各执行语句在所述并行计算资源上或异构并行计算资源不同架构上的计算时间;
根据所述并行执行支路中各执行语句的计算时间,对所述并行执行支路中各执行语句进行合并和/或分拆,获得第二并行执行支路集合,所述第二并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
根据所述依赖关系和所述第二并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
优选的,所述合并和/或分拆采用优化算法,所述算法包括模拟退火算法、遗传算法、蚁群算法和粒子群算法。
第二方面,本发明实施例提供了一种调整程序执行顺序的装置,该装置包括:
获取当前执行顺序单元,用于获取目标程序的当前执行顺序,所述目标程序包括第一执行语句和第二执行语句,所述第一执行语句和所述第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系,所述依赖关系是指所述第二执行语句的执行依赖所述第一执行语句的执行结果;
第一调整单元,用于根据所述依赖关系,将所述目标程序的当前执行顺序调整为目标执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路。
优选的,所述第一调整单元具体包括第二调整单元、获取支路数量单元、第三调整单元和确定单元;
所述第二调整单元,用于根据所述依赖关系,将所述目标程序的当前执行顺序调整为第一执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路;
所述获取支路数量单元,用于获取调整为第一执行顺序的目标程序中并行执行支路的数量;
所述第三调整单元,用于若所述调整为第一执行顺序的目标程序中并行执行支路的数量大于预设阈值,根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,所述调整为目标执行顺序的目标程序中并行执行支路的数量不大于所述预设阈值,所述预设阈值是根据所述目标程序需运行平台的并行计算资源设定的;
所述确定单元,用于若所述调整为第一执行顺序的目标程序中并行执行支路的数量不大于预设阈值,则将所述第一执行顺序确定为所述目标程序的目标执行顺序。
优选的,所述第三调整单元具体包括第一获得单元和第四调整单元;
所述第一获得单元,用于根据所述预设阈值,从所述调整为第一执行顺序的目标程序中并行执行支路的集合中选取并行执行支路,获得第一并行执行支路集合,所述第一并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
所述第四调整单元,用于根据所述依赖关系和所述第一并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
优选的,所述第三调整单元具体包括获取计算时间单元、第二获得单元和第五调整单元;
所述获取计算时间单元,用于获取所述调整为第一执行顺序的目标程序中并行执行支路中各执行语句在所述并行计算资源上或异构并行计算资源不同架构上的计算时间;
所述第二获得单元,用于根据所述并行执行支路中各执行语句的计算时间,对所述并行执行支路中各执行语句进行合并和/或分拆,获得第二并行执行支路集合,所述第二并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
所述第五调整单元,用于根据所述依赖关系和所述第二并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
优选的,所述第二获得单元采用优化算法,所述算法包括模拟退火算法、遗传算法、蚁群算法和粒子群算法。
与现有技术相比,本发明至少具有以下优点:
采用本发明实施例的技术方案,当目标程序的第一执行语句和第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系时,根据所述依赖关系,将所述目标程序的所述第一执行语句和所述第二执行语句调整到不同的并行执行支路上。由此可见,当串行执行的两条执行语句不存在依赖关系时可以调整为并行执行,提高了开发并行程序的工作效率,降低了开发并行程序的难度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种调整程序执行顺序的方法的流程示意图;
图2为本发明实施例提供的目标程序的当前执行顺序图;
图3为本发明实施例提供的目标程序中执行语句的依赖关系图;
图4为本发明实施例提供的目标程序调整后的第一执行顺序图;
图5为本发明实施例提供的一种目标程序调整后的目标执行顺序图;
图6为本发明实施例提供的另一种目标程序调整后的目标执行顺序图;
图7为本发明实施例提供的另一种调整程序执行顺序的方法的流程示意图;
图8为本发明实施例提供的一种调整程序执行顺序的装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
发明人经过研究发现,当程序员创建一个串行程序时,他就会想象一个处理器在没有中断和干扰的情况下按部就班地执行这个程序的情况,因此计算机程序员以串行程序思路开发软件的工作效率更高,而程序员编写并发程序的代码时,必须采取一种完全不同的思维,想象多项计算同时执行,因此计算机程序员以并行程序思路开发并行程序其工作效率低,开发难度也比较大,且所开发并行程序的并行计算的效率多依赖于软件工程师的技术水平和经验累积。
为了解决这一问题,在本发明实施例中,当目标程序的第一执行语句和第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系时,根据所述依赖关系,将所述目标程序的所述第一执行语句和所述第二执行语句调整到不同的并行执行支路上。由此可见,当串行执行的两条执行语句不存在依赖关系时可以自动调整为并行执行,提高了开发并行程序的工作效率,降低了开发并行程序的难度。
下面结合附图,通过实施例来详细说明本发明实施例中调整程序执行顺序的方法及装置的具体实现方式。
示例性方法
参见图1,示出了本发明实施例中一种调整程序执行顺序的方法的流程示意图。在本实施例中,所述方法例如可以包括以下步骤:
步骤101:获取目标程序的当前执行顺序,所述目标程序包括第一执行语句和第二执行语句,所述第一执行语句和所述第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系,所述依赖关系是指所述第二执行语句的执行依赖所述第一执行语句的执行结果。
在本实施例中,所述获取目标程序的当前执行顺序是指获取目标程序中多条执行语句之间的当前执行顺序,一条执行语句代表一条或者多条执行动作。
例如,可以将目标程序变更为顺序连接图,即为获取目标程序的当前执行顺序,所述顺序连接图是由代表执行语句的顶点和代表执行顺序的有向边组成,执行顺序上相邻两条语句所对应的两条动作之间以有向边进行连接,该有向边从前一个顶点指向后一个顶点。如图2所示目标程序的当前执行顺序,图2也就是顺序连接图,左侧图表示目标程序,右侧图表示目标程序的当前执行顺序,右侧图中顶点L2代表左侧的程序代码L2,右侧图中顶点L3代表左侧的程序代码L3-L5,右侧图中顶点L7代表左侧的程序代码L7,右侧图中顶点L8代表左侧的程序代码L8-L10,右侧图中顶点L12代表左侧的程序代码L12,右侧图中顶点L13代表左侧的程序代码L13-L15,右侧图中顶点L16代表左侧的程序代码L16。右侧图中顶点L2、L3、L7、L8、L12、L13、L16之间为有向边,代表执行顺序,7个顶点代表的执行语句明显处于同一串行执行支路,目标程序的当前执行顺序为串行。
步骤102:根据所述依赖关系,将所述目标程序的当前执行顺序调整为目标执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路。
由于所述目标程序中的所述第一执行语句和所述第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系,因此可以根据所述依赖关系将所述目标程序中所述第一执行语句和所述第二执行语句的执行顺序由串行调整为并行。
需要说明的是,根据所述依赖关系调整所述目标程序的当前执行顺序是具体是将所述目标程序中处于同一串行执行支路又不存在依赖关系的所述第一执行语句和所述第二执行语句的执行顺序调整为并行,调整后的目标程序是需要在具有并行计算资源的运行平台运行的,所述运行平台的并行计算资源一般是预先设置好的,例如,一个计算机的CPU数量是预设好的,CPU中内核(CORE)的数量也是预设好的,内核支持的线程数量也是预设好的,也就是说调整执行顺序之后的目标程序中并行执行支路的数量不可以大于预设阈值(运行平台的并行计算资源设定的),因此,若根据所述依赖关系,第一次调整后的目标程序中并行执行支路的数量大于预设阈值,可以根据所述依赖关系和所述预设阈值,进行第二次调整,将目标程序中并行执行支路的数量调整到不大于预设阈值。在本实施例的一些实施方式中,所述步骤102,具体例如可以包括:根据所述依赖关系,将所述目标程序的当前执行顺序调整为第一执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路;获取调整为第一执行顺序的目标程序中并行执行支路的数量;若所述调整为第一执行顺序的目标程序中并行执行支路的数量大于预设阈值,根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,所述调整为目标执行顺序的目标程序中并行执行支路的数量不大于所述预设阈值,所述预设阈值是根据所述目标程序需运行平台的并行计算资源设定的;若所述调整为第一执行顺序的目标程序中并行执行支路的数量不大于预设阈值,则将所述第一执行顺序确定为所述目标程序的目标执行顺序。
需要说明的是,在确定目标程序中执行语句的依赖关系之后,需要删除所述依赖关系中的冗余依赖关系;其中,若第四执行语句对第三执行语句存在依赖关系,第五执行语句对所述第四执行语句存在依赖关系,所述第五执行语句对所述第三执行语句存在依赖关系,则所述第五执行语句对所述第三执行语句存在依赖关系为冗余依赖关系,也就是说,若顶点C存在对顶点A的依赖关系、顶点B存在对顶点A的依赖关系、顶点C存在对顶点B的依赖关系,则顶点C对顶点A的依赖关系相对于“顶点B存在对顶点A的依赖关系、顶点C存在对顶点B的依赖关系”是一种冗余依赖关系。
需要说明的是,当调整为第一执行顺序的目标程序中并行执行支路的数量大于预设阈值时,所述根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序的步骤,在本实施例中一般可以两种方式,第一种方式是只在所述调整为第一执行顺序的目标程序中并行执行支路的集合中随机选取预设阈值数量的并行执行支路,未被选取的并行执行支路调整到所述目标程序中与并行支路连接的串行支路上;第二种方式是利用所述调整为第一执行顺序的目标程序中并行执行支路中各执行语句在所述并行计算资源上或异构并行计算资源不同架构上的计算时间,将所述并行执行支路中各执行语句进行合并和/或分拆以得到预设阈值数量的并行执行支路。
第一种方式例如具体可以包括以下步骤:
S1:根据所述预设阈值,从所述调整为第一执行顺序的目标程序中并行执行支路的集合中选取并行执行支路,获得第一并行执行支路集合,所述第一并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
S2:根据所述依赖关系和所述第一并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
第二种方式例如具体可以包括以下步骤:
S1:获取所述调整为第一执行顺序的目标程序中并行执行支路中各执行语句在所述并行计算资源上或异构并行计算资源不同架构上的计算时间;
S2:根据所述并行执行支路中各执行语句的计算时间,对所述并行执行支路中各执行语句进行合并和/或分拆,获得第二并行执行支路集合,所述第二并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
S3:根据所述依赖关系和所述第二并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
需要说明的是,所述合并和/或分拆采用优化算法,所述算法包括模拟退火算法、遗传算法、蚁群算法和粒子群算法。
需要说明的是,合并和/或分拆后,第二并行执行支路集合中各执行支路中各执行语句的总计算时间的最大值或时间差或方差最小。
例如,根据图2可以确定出如图3所示目标程序中执行语句的依赖关系,图中虚线所示依赖关系,L2→L3、L2→L16、L3→L16、L7→L8、L7→L16、L8→L16、L12→L13、L12→L16、L13→L16,确定图中顶点之间的依赖关系的原则是:若后面的顶点B的执行依赖前面某一顶点A的执行结果,则后面的顶点B对前面的顶点A存在依赖关系。
其中,由于L2→L3、L3→L16、L12→L16,所以L2→L16为表示冗余依赖关系的有向边,由于L7→L8、L8→L16、L7→L16,所以L7→L16为表示冗余依赖关系的有向边,由于L12→L13、L13→L16、L12→L16,所以L12→L16为表示冗余依赖关系的有向边,总结来说,L2→L16、L7→L16、L12→L16可以删除,删除之后仅保留L2→L3、L3→L16、L7→L8、L8→L16、L12→L13、L13→L16表示无冗余依赖关系的有向边。
由图3的依赖关系可以得到如图4所示目标程序调整后的第一执行顺序,左侧图表示无冗余依赖关系,右侧图表示目标程序调整后的第一执行顺序,由左侧图可整理得到右侧图,右侧图中存在依赖关系的执行语句必须处于同一串行执行支路,不存在依赖关系的执行语句可以调整到不同的并行执行支路上。
如图5所示一种目标程序调整后的目标执行顺序,当所述预设阈值为2时,上述图4所示目标程序调整后的第一执行顺序进行第二次调整,从L2→L3、L7→L8、L12→L13中随机选取2条并行执行支路,例如选取L2→L3、L7→L8作为第一并行执行支路集合,未被选取的L12→L13调整到所述目标程序中与并行支路连接的串行支路上,即L12→L13与L2→L3、L7→L8、L16均串行执行,得到目标执行顺序。
如图6所示另一种目标程序调整后的目标执行顺序,当所述预设阈值为2时,上述图4所示目标程序调整后的第一执行顺序进行第二次调整,得到L2的计算时间t(L2),L3的计算时间t(L3),L7的计算时间t(L7),L8的计算时间t(L8),L12的计算时间t(L12),L13的计算时间t(L13),因为t(L2)+t(L3)与t(L7)+t(L8)+(tL12)+t(L13)非常接近,所以合并L7、L8、L12、L13,得到目标执行顺序。
通过本实施例提供的各种实施方式,当目标程序的第一执行语句和第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系时,根据所述依赖关系和预设阈值,将所述目标程序的所述第一执行语句和所述第二执行语句调整到不同的并行执行支路上。由此可见,当串行执行的两条执行语句不存在依赖关系时可以自动调整为并行执行,提高了开发并行程序的工作效率,降低了开发并行程序的难度,而且调整为目标执行顺序的目标程序可以充分利用并行计算资源,运行速度快、效率高。
参见图7,示出了本发明实施例中另一种调整程序执行顺序的方法的流程示意图。在本实施例中,所述方法例如可以包括以下步骤:
步骤701:获取目标程序的当前执行顺序和所有执行语句,所述目标程序包括第一执行语句和第二执行语句,所述第一执行语句和所述第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系,所述依赖关系是指所述第二执行语句的执行依赖所述第一执行语句的执行结果;
步骤702:确定所述所有执行语句之间的依赖关系。
步骤703:删除所述所有执行语句之间的冗余依赖关系,得到所有执行语句之间的无冗余依赖关系,其中,若第四执行语句对第三执行语句存在依赖关系,第五执行语句对所述第四执行语句存在依赖关系,所述第五执行语句对所述第三执行语句存在依赖关系,则所述第五执行语句对所述第三执行语句存在依赖关系为冗余依赖关系。
步骤704:根据所述无冗余依赖关系,将所述目标程序的当前执行顺序调整为第一执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路。
步骤705:获取调整为第一执行顺序的目标程序中并行执行支路的数量。
步骤706:判断所述调整为第一执行顺序的目标程序中并行执行支路的数量是否大于预设阈值,若是,进入步骤707;若否,进入步骤708。
步骤707:根据所述无冗余依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,所述调整为目标执行顺序的目标程序中并行执行支路的数量不大于所述预设阈值,所述预设阈值是根据所述目标程序需运行平台的并行计算资源设定的。
可选的,所述步骤707例如具体可以包括:根据所述预设阈值,从所述调整为第一执行顺序的目标程序中并行执行支路的集合中选取并行执行支路,获得第一并行执行支路集合,所述第一并行执行支路集合中并行执行支路的数量不大于所述预设阈值;根据所述无冗余依赖关系和所述第一并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
可选的,所述步骤707例如具体可以包括:获取所述调整为第一执行顺序的目标程序中并行执行支路中各执行语句在所述并行计算资源上或异构并行计算资源不同架构上的计算时间;根据所述并行执行支路中各执行语句的计算时间,对所述并行执行支路中各执行语句进行合并和/或分拆,获得第二并行执行支路集合,所述第二并行执行支路集合中并行执行支路的数量不大于所述预设阈值;根据所述无冗余依赖关系和所述第二并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
步骤708:将所述第一执行顺序确定为所述目标程序的目标执行顺序。
通过本实施例提供的各种实施方式,当目标程序的第一执行语句和第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系时,根据所述依赖关系和预设阈值,将所述目标程序的所述第一执行语句和所述第二执行语句调整到不同的并行执行支路上。由此可见,当串行执行的两条执行语句不存在依赖关系时可以自动调整为并行执行,提高了开发并行程序的工作效率,降低了开发并行程序的难度,而且调整为目标执行顺序的目标程序可以充分利用并行计算资源,运行速度快、效率高。
示例性设备
参见图8,示出了本发明实施例中一种调整程序执行顺序的装置的结构示意图。在本实施例中,所述装置例如具体可以包括:
获取当前执行顺序单元801,用于获取目标程序的当前执行顺序,所述目标程序包括第一执行语句和第二执行语句,所述第一执行语句和所述第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系,所述依赖关系是指所述第二执行语句的执行依赖所述第一执行语句的执行结果.
第一调整单元802,用于根据所述依赖关系,将所述目标程序的当前执行顺序调整为目标执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路。
可选的,所述第一调整单元802例如具体可以包括第二调整单元、获取支路数量单元、第三调整单元和确定单元;
所述第二调整单元,用于根据所述依赖关系,将所述目标程序的当前执行顺序调整为第一执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路;
所述获取支路数量单元,用于获取调整为第一执行顺序的目标程序中并行执行支路的数量;
所述第三调整单元,用于若所述调整为第一执行顺序的目标程序中并行执行支路的数量大于预设阈值,根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,所述调整为目标执行顺序的目标程序中并行执行支路的数量不大于所述预设阈值,所述预设阈值是根据所述目标程序需运行平台的并行计算资源设定的;
所述确定单元,用于若所述调整为第一执行顺序的目标程序中并行执行支路的数量不大于预设阈值,则将所述第一执行顺序确定为所述目标程序的目标执行顺序。
可选的,所述第三调整单元例如具体可以包括第一获得单元和第四调整单元;
所述第一获得单元,用于根据所述预设阈值,从所述调整为第一执行顺序的目标程序中并行执行支路的集合中选取并行执行支路,获得第一并行执行支路集合,所述第一并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
所述第四调整单元,用于根据所述依赖关系和所述第一并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
可选的,所述第三调整单元例如具体可以包括获取计算时间单元、第二获得单元和第五调整单元;
所述获取计算时间单元,用于获取所述调整为第一执行顺序的目标程序中并行执行支路中各执行语句在所述并行计算资源上或异构并行计算资源不同架构上的计算时间;
所述第二获得单元,用于根据所述并行执行支路中各执行语句的计算时间,对所述并行执行支路中各执行语句进行合并和/或分拆,获得第二并行执行支路集合,所述第二并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
所述第五调整单元,用于根据所述依赖关系和所述第二并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
可选的,所述第二获得单元例如可以采用优化算法,所述算法包括模拟退火算法、遗传算法、蚁群算法和粒子群算法。
通过本实施例提供的各种实施方式,当目标程序的第一执行语句和第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系时,根据所述依赖关系和预设阈值,将所述目标程序的所述第一执行语句和所述第二执行语句调整到不同的并行执行支路上。由此可见,当串行执行的两条执行语句不存在依赖关系时可以自动调整为并行执行,提高了开发并行程序的工作效率,降低了开发并行程序的难度,而且调整为目标执行顺序的目标程序可以充分利用并行计算资源,运行速度快、效率高。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (10)
1.一种调整程序执行顺序的方法,其特征在于,包括:
获取目标程序的当前执行顺序,所述目标程序包括第一执行语句和第二执行语句,所述第一执行语句和所述第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系,所述依赖关系是指所述第二执行语句的执行依赖所述第一执行语句的执行结果;
根据所述依赖关系,将所述目标程序的当前执行顺序调整为目标执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路。
2.根据权利要求1所述的方法,其特征在于,所述根据所述依赖关系,将所述目标程序的当前执行顺序调整为目标执行顺序,具体包括:
根据所述依赖关系,将所述目标程序的当前执行顺序调整为第一执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路;
获取调整为第一执行顺序的目标程序中并行执行支路的数量;
若所述调整为第一执行顺序的目标程序中并行执行支路的数量大于预设阈值,根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,所述调整为目标执行顺序的目标程序中并行执行支路的数量不大于所述预设阈值,所述预设阈值是根据所述目标程序需运行平台的并行计算资源设定的;
若所述调整为第一执行顺序的目标程序中并行执行支路的数量不大于预设阈值,则将所述第一执行顺序确定为所述目标程序的目标执行顺序。
3.根据权利要求2所述的方法,其特征在于,所述根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,具体包括:
根据所述预设阈值,从所述调整为第一执行顺序的目标程序中并行执行支路的集合中选取并行执行支路,获得第一并行执行支路集合,所述第一并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
根据所述依赖关系和所述第一并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
4.根据权利要求2所述的方法,其特征在于,所述根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,具体包括:
获取所述调整为第一执行顺序的目标程序中并行执行支路中各执行语句在所述并行计算资源上或异构并行计算资源不同架构上的计算时间;
根据所述并行执行支路中各执行语句的计算时间,对所述并行执行支路中各执行语句进行合并和/或分拆,获得第二并行执行支路集合,所述第二并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
根据所述依赖关系和所述第二并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
5.根据权利要求4所述的方法,其特征在于,所述合并和/或分拆采用优化算法,所述算法包括模拟退火算法、遗传算法、蚁群算法和粒子群算法。
6.一种调整程序执行顺序的装置,其特征在于,包括:
获取当前执行顺序单元,用于获取目标程序的当前执行顺序,所述目标程序包括第一执行语句和第二执行语句,所述第一执行语句和所述第二执行语句处于同一串行执行支路,且所述第二执行语句对所述第一执行语句不存在依赖关系,所述依赖关系是指所述第二执行语句的执行依赖所述第一执行语句的执行结果;
第一调整单元,用于根据所述依赖关系,将所述目标程序的当前执行顺序调整为目标执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路。
7.根据权利要6所述的装置,其特征在于,所述第一调整单元具体包括第二调整单元、获取支路数量单元、第三调整单元和确定单元;
所述第二调整单元,用于根据所述依赖关系,将所述目标程序的当前执行顺序调整为第一执行顺序,其中,所述第一执行语句和所述第二执行语句处于不同的并行执行支路;
所述获取支路数量单元,用于获取调整为第一执行顺序的目标程序中并行执行支路的数量;
所述第三调整单元,用于若所述调整为第一执行顺序的目标程序中并行执行支路的数量大于预设阈值,根据所述依赖关系和所述预设阈值,将所述目标程序的第一执行顺序调整为目标执行顺序,所述调整为目标执行顺序的目标程序中并行执行支路的数量不大于所述预设阈值,所述预设阈值是根据所述目标程序需运行平台的并行计算资源设定的;
所述确定单元,用于若所述调整为第一执行顺序的目标程序中并行执行支路的数量不大于预设阈值,则将所述第一执行顺序确定为所述目标程序的目标执行顺序。
8.根据权利要7所述的装置,其特征在于,所述第三调整单元具体包括第一获得单元和第四调整单元;
所述第一获得单元,用于根据所述预设阈值,从所述调整为第一执行顺序的目标程序中并行执行支路的集合中选取并行执行支路,获得第一并行执行支路集合,所述第一并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
所述第四调整单元,用于根据所述依赖关系和所述第一并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
9.根据权利要7述的装置,其特征在于,所述第三调整单元具体包括获取计算时间单元、第二获得单元和第五调整单元;
所述获取计算时间单元,用于获取所述调整为第一执行顺序的目标程序中并行执行支路中各执行语句在所述并行计算资源上或异构并行计算资源不同架构上的计算时间;
所述第二获得单元,用于根据所述并行执行支路中各执行语句的计算时间,对所述并行执行支路中各执行语句进行合并和/或分拆,获得第二并行执行支路集合,所述第二并行执行支路集合中并行执行支路的数量不大于所述预设阈值;
所述第五调整单元,用于根据所述依赖关系和所述第二并行执行支路集合,将所述目标程序的第一执行顺序调整为目标执行顺序。
10.根据权利要9所述的装置,其特征在于,所述第二获得单元采用优化算法,所述算法包括模拟退火算法、遗传算法、蚁群算法和粒子群算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710283260.8A CN108920151A (zh) | 2017-04-26 | 2017-04-26 | 一种生成并行程序的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710283260.8A CN108920151A (zh) | 2017-04-26 | 2017-04-26 | 一种生成并行程序的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108920151A true CN108920151A (zh) | 2018-11-30 |
Family
ID=64402850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710283260.8A Pending CN108920151A (zh) | 2017-04-26 | 2017-04-26 | 一种生成并行程序的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108920151A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807144A (zh) * | 2010-03-17 | 2010-08-18 | 上海大学 | 一种前瞻多线程并行执行优化方法 |
-
2017
- 2017-04-26 CN CN201710283260.8A patent/CN108920151A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807144A (zh) * | 2010-03-17 | 2010-08-18 | 上海大学 | 一种前瞻多线程并行执行优化方法 |
Non-Patent Citations (1)
Title |
---|
闫昭等: "基于数据依赖关系的程序自动并行化方法", 《吉林大学学报(理学版)》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103282878B (zh) | 基于循环分割或索引阵列的循环并行化 | |
Borges et al. | Symbolic execution with interval solving and meta-heuristic search | |
CN104798043B (zh) | 一种数据处理方法和计算机系统 | |
CN110389910A (zh) | 用于管理级联神经网络中的存储器的方法和安排 | |
CN102279738B (zh) | 标识强连通分量的入口和出口的技术 | |
US10437587B2 (en) | Software package analyzer for increasing parallelization of code editing | |
CN109684190A (zh) | 软件测试装置和方法 | |
US8495535B2 (en) | Partitioning and scheduling uniform operator logic trees for hardware accelerators | |
CN111902819A (zh) | 使用量化预测函数的机器学习电路优化 | |
CN109919310A (zh) | 一种面向深度学习训练任务的gpu内存优化方法及系统 | |
US10754744B2 (en) | Method of estimating program speed-up in highly parallel architectures using static analysis | |
CN107844415A (zh) | 一种基于插值的模型检测路径缩减方法、计算机 | |
US10977098B2 (en) | Automatically deploying hardware accelerators based on requests from users | |
CN102968369B (zh) | 一种动态断点的自动生成方法及系统 | |
Xie et al. | Graphiler: Optimizing graph neural networks with message passing data flow graph | |
CN113901745A (zh) | 芯片测试方法、装置、电子设备及计算机可读存储介质 | |
US11144357B2 (en) | Selecting hardware accelerators based on score | |
CN113807046A (zh) | 一种测试激励优化回归验证方法、系统及介质 | |
CN110276689A (zh) | 基于动态决策的智能合约实现方法 | |
Felten et al. | A toolkit for reliable benchmarking and research in multi-objective reinforcement learning | |
CN112949711B (zh) | 面向软件定义卫星的神经网络模型可复用训练方法、装置 | |
CN108009298B (zh) | 一种互联网人物搜索信息整合分析控制方法 | |
CN109102141A (zh) | 一种服务水平评分方法和装置 | |
CN104778088A (zh) | 一种基于减少进程间通信开销的并行i/o优化方法与系统 | |
CN108920151A (zh) | 一种生成并行程序的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181130 |
|
RJ01 | Rejection of invention patent application after publication |