CN101894046A - 一种应用软件最优化运行方案的寻找方法 - Google Patents
一种应用软件最优化运行方案的寻找方法 Download PDFInfo
- Publication number
- CN101894046A CN101894046A CN2009100173404A CN200910017340A CN101894046A CN 101894046 A CN101894046 A CN 101894046A CN 2009100173404 A CN2009100173404 A CN 2009100173404A CN 200910017340 A CN200910017340 A CN 200910017340A CN 101894046 A CN101894046 A CN 101894046A
- Authority
- CN
- China
- Prior art keywords
- scal
- application software
- extensibility
- parallel system
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000013178 mathematical model Methods 0.000 claims description 9
- 238000011221 initial treatment Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 abstract description 3
- 238000011056 performance test Methods 0.000 abstract description 2
- 238000013210 evaluation model Methods 0.000 abstract 1
- 238000010998 test method Methods 0.000 abstract 1
- 238000011160 research Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种应用软件最优化运行方案的寻找方法,此方法建立在一种新的应用可扩展性评价模型的基础之上,此方法为高性能计算领域的应用软件提供了一种在大规模并行系统上快速寻找最优化运行方案的方法。通过对应用软件在大规模并行系统上逐渐增多处理器运行数目时的性能测试结果,根据新的应用可扩展性数学模型,判断、继而寻找此规模应用问题基于该平台的最优化运行方案。本发明的测试方法和可扩展性评价模型简单、易行、实用性强,可适用于高性能计算领域中众多应用软件,可提高应用软件的执行速率和硬件平台的使用率。
Description
技术领域
本发明涉及计算机应用技术,具体地说是一种高性能计算方面应用软件的性能测试和性能评估,更具体的说,涉及在大规模并行系统上基于应用软件的固定问题规模,快速寻找最优化运行方案的方法。
背景技术
随着数值计算需要解决的问题逐渐复杂和高性能计算机集群技术的迅速发展,如何在大规模并行系统上高效的运行计算流体力学、生命科学、石油勘探及航空航天等专业领域的应用软件已成为当前一个重要问题。
可扩展性是数值并行计算所重视的一个指标,而通常进行的可扩展性研究集中在并行算法和并行系统相结合的可扩展性上,它的前提是在问题规模和并行系统规模都各自增大的前提下,研究系统性能的增减。而对于并行应用软件在固定问题规模的可扩展性讨论较少,这对于在实际科研问题求解中,更高效率的使用并行系统运行应用软件具有重要意义。
发明内容
本发明主要提供了一种在大规模并行系统上的最优化运行方案的找寻方法,可以找出应用软件在固定规模问题下的最优化运行方案。
本发明的一种在大规模并行系统上的最优化运行方案的找寻方法,是按以下方式实现的,该方法包括以下步骤:
A、根据经验值设定两个较小的初始处理器运行数目P0和P1,其中P0<P1,运行软件后得到两个运行时间TP0、TP1;计算固定问题规模可扩展性Scal(Pi,Pj),其数学模型的推理过程如下:
由加速比计算公式Spi=Tpi/TPj
效率计算公式Epi=Spi/Pi×100%
推出并行系统在机器规模由Pi扩展到Pj时的固定问题规模可扩展性数学模型是:
Scal(Pi,Pj)=EPj/EPi=SPj/Spi×Pj/Pi=TPj/Tpi×Pj/Pi。
B、根据固定问题规模可扩展性数学模型Scal(Pi,Pj)=Tpi/TPj*Pi/Pj,计算判断Pj台处理器相对于Pi台处理器是否具有可扩展性,其中Pi<Pj,均表示处理器运行数目;
C、判断当Scal(Pi,Pj)>Pj/Pi时,则回到步骤A,增加处理器运行数目,以上步骤循环执行;
D、判断当0<Scal(Pi,Pj)≤Pj/Pi时,则停止测试,Pi即为此规模应用的优化处理器运行数目;
可以看出,在本发明中的固定规模可扩展性数学模型中有一个非常实用的特性,就是利用比值约分省去了问题的单处理器运行时间,因为当问题规模很大,处理机台数很多时,根本无法也没有必要在单处理器上进行求解。
本发明的有益效果是:可以快速确定大规模并行系统运行某规模应用问题的最佳处理机数目,从而提升大规模并行系统的工作效率,满足应用问题求解需求,缩短运行时间。
附图说明
附图1为本发明方法的步骤流程图。
具体实施方式
参照附图对本发明的方法作以下详细的说明;
由前述内容可知,本发明提供的是一种大规模并行系统上优化运行方案的找寻方法,其步骤流程图如图1所示,包括如下步骤:
步骤A:在大规模并行系统上运行固定规模应用软件,根据经验值设定两个较小的初始处理器运行数目P0和P1,其中P0<P1,运行软件后得到两个运行时间TP0、TP1;
步骤B:将TP0、TP1带入本发明中的可扩展性数学模型Scal(Pi,Pj)=Tpi/TPj*Pi/Pj中,计算并判断在此应用规模下Pj台处理器相对于Pi台处理器是否具有可扩展性,具体判断情况分为:
◆若Scal(Pi,Pj)>1,则Pj台处理器相对于Pi台处理器是超线性可扩展的;
◆若Scal(Pi,Pj)=1,则Pj台处理器相对于Pi台处理器是线性可扩展的;
◆若Pj/Pi<Scal(Pi,Pj)<1,则Pj台处理器相对于Pi台处理器是次线性可扩展的;
◆若0<Scal(Pi,Pj)≤Pj/Pi,则Pj台处理器相对于Pi台处理器是不可扩展的;
步骤C:判断当Scal(Pi,Pj)>Pj/Pi时,即当前的机器规模还可进行扩展,则增大处理器运行数目返回步骤A、B进行循环寻找判断;直到0<Scal(Pi,Pj)≤Pj/Pi时,即当前规模的应用问题为相对不可扩展的情况,则可判定Pi即为此规模应用的最优化处理器运行数目。
综上所述,依照本发明中的大规模并行系统上最优化运行方案的找寻方法,可以快速确定固定规模应用问题的最优化处理器运行数目,提升大规模并行系统的工作效率,满足应用问题求解需求,缩短运行时间。这是一种简单、易行又非常实用的方案确定方法,在高性能计算领域的应用软件中具有广泛的应用范围和很高的应用价值。
Claims (2)
1.一种应用软件最优化运行方案的寻找方法,其特征在于,利用固定问题规模可扩展性数学模型,寻找在大规模并行系统上应用软件的最优化运行方案,寻找步骤如下:
A、根据经验值设定两个较小的初始处理器运行数目P0和P1,其中P0<P1,运行软件后得到两个运行时间TP0、TP1;
B、根据固定问题规模可扩展性数学模型Scal(Pi,Pj)=Tpi/TPj*Pi/Pj,计算判断Pj台处理器相对于Pi台处理器是否具有可扩展性,其中Pi<Pj,均表示处理器运行数目,固定问题规模可扩展性数学模型Scal(Pi,Pj)是评价在机器规模由Pi扩展到Pj时并行系统的可扩展性,Scal(Pi,Pj)的数学模型推理过程如下:
设并行系统的加速比模型为Spi=T1/Ti,同设效率模型为Epi=Spi/Pi×100%,则并行系统在机器规模由Pi扩展到Pj时的固定问题规模可扩展性为:
Scal(Pi,Pj)=EPj/EPi=SPj/Spi×Pj/Pi=TPj/Tpi×Pj/Pi;
C、判断当Scal(Pi,Pj)>Pj/Pi时,则回到步骤A,增加处理器运行数目,以上步骤循环执行;
D、判断当0<Scal(Pi,Pj)≤Pj/Pi时,则停止测试,Pi即为此规模应用的优化处理器运行数目。
2.根据权利要求1中所述的方法,其特征在于,在所述步骤C步骤和D步骤中,根据Scal(Pi,Pj)值的大小判断是否返还到循环体A、B当中,直到0<Scal(Pi,Pj)≤Pj/Pi时,停止循环,此时即确定优化处理器运行数目Pi。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100173404A CN101894046A (zh) | 2009-07-27 | 2009-07-27 | 一种应用软件最优化运行方案的寻找方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100173404A CN101894046A (zh) | 2009-07-27 | 2009-07-27 | 一种应用软件最优化运行方案的寻找方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101894046A true CN101894046A (zh) | 2010-11-24 |
Family
ID=43103242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009100173404A Pending CN101894046A (zh) | 2009-07-27 | 2009-07-27 | 一种应用软件最优化运行方案的寻找方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101894046A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902512A (zh) * | 2012-08-31 | 2013-01-30 | 浪潮电子信息产业股份有限公司 | 一种基于多线程编程及消息队列的多线程并行处理方法 |
CN103049245A (zh) * | 2012-10-25 | 2013-04-17 | 浪潮电子信息产业股份有限公司 | 一种基于cpu多核平台的软件性能优化方法 |
CN103279449A (zh) * | 2013-06-14 | 2013-09-04 | 浪潮电子信息产业股份有限公司 | 大规模异构众核处理器平台的效率核算方法 |
CN103473430A (zh) * | 2013-09-25 | 2013-12-25 | 浪潮电子信息产业股份有限公司 | 一种运用高性能应用软件实现材料性能预测的方法 |
CN104965758A (zh) * | 2015-06-11 | 2015-10-07 | 深圳市华傲数据技术有限公司 | 优化嵌入式软件服务质量的调度方法 |
CN111176839A (zh) * | 2019-12-18 | 2020-05-19 | 同济大学 | 一种考虑数据、算法和体系结构结合的可扩展性度量方法 |
CN111833465A (zh) * | 2020-06-23 | 2020-10-27 | 武汉菲奥达物联科技有限公司 | 一种基于汽车流量的小区停车收费平台扩展方法及装置 |
-
2009
- 2009-07-27 CN CN2009100173404A patent/CN101894046A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902512A (zh) * | 2012-08-31 | 2013-01-30 | 浪潮电子信息产业股份有限公司 | 一种基于多线程编程及消息队列的多线程并行处理方法 |
CN102902512B (zh) * | 2012-08-31 | 2015-12-16 | 浪潮电子信息产业股份有限公司 | 一种基于多线程编程及消息队列的多线程并行处理方法 |
CN103049245A (zh) * | 2012-10-25 | 2013-04-17 | 浪潮电子信息产业股份有限公司 | 一种基于cpu多核平台的软件性能优化方法 |
CN103049245B (zh) * | 2012-10-25 | 2015-12-02 | 浪潮电子信息产业股份有限公司 | 一种基于中央处理器cpu多核平台的软件性能优化方法 |
CN103279449A (zh) * | 2013-06-14 | 2013-09-04 | 浪潮电子信息产业股份有限公司 | 大规模异构众核处理器平台的效率核算方法 |
CN103473430A (zh) * | 2013-09-25 | 2013-12-25 | 浪潮电子信息产业股份有限公司 | 一种运用高性能应用软件实现材料性能预测的方法 |
CN104965758A (zh) * | 2015-06-11 | 2015-10-07 | 深圳市华傲数据技术有限公司 | 优化嵌入式软件服务质量的调度方法 |
CN104965758B (zh) * | 2015-06-11 | 2018-04-17 | 深圳市华傲数据技术有限公司 | 优化嵌入式软件服务质量的调度方法 |
CN111176839A (zh) * | 2019-12-18 | 2020-05-19 | 同济大学 | 一种考虑数据、算法和体系结构结合的可扩展性度量方法 |
CN111176839B (zh) * | 2019-12-18 | 2023-05-02 | 同济大学 | 一种考虑数据、算法和体系结构结合的可扩展性度量方法 |
CN111833465A (zh) * | 2020-06-23 | 2020-10-27 | 武汉菲奥达物联科技有限公司 | 一种基于汽车流量的小区停车收费平台扩展方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101894046A (zh) | 一种应用软件最优化运行方案的寻找方法 | |
Collange et al. | Numerical reproducibility for the parallel reduction on multi-and many-core architectures | |
Yang et al. | An efficient parallel algorithm for longest common subsequence problem on gpus | |
Jarus et al. | Performance evaluation and energy efficiency of high-density HPC platforms based on Intel, AMD and ARM processors | |
CN1739079A (zh) | 用于估计和控制电流变化率引起的电源电压变化的机制 | |
US7802241B2 (en) | Method for estimating processor energy usage | |
Anzt et al. | Energy efficiency of mixed precision iterative refinement methods using hybrid hardware platforms: An evaluation of different solver and hardware configurations | |
CN103246541B (zh) | 一种自动并行化多级并行代价评估方法 | |
Selvan et al. | Carbon footprint of selecting and training deep learning models for medical image analysis | |
Dasika et al. | PEPSC: A power-efficient processor for scientific computing | |
CN102841881A (zh) | 一种基于众核处理器的多重积分计算方法 | |
Chen et al. | ViennaCL++ Enable TensorFlow/Eigen via ViennaCL with OpenCL C++ Flow | |
Li et al. | Heterogeneous systems with reconfigurable neuromorphic computing accelerators | |
Zymbler | Best-match time series subsequence search on the Intel Many Integrated Core architecture | |
Ji et al. | Using the first-level cache stack distance histograms to predict multi-level LRU cache misses | |
Cassidy et al. | A high-level analytical model for application specific CMP design exploration | |
Ma et al. | Improving energy efficiency of gpu based general-purpose scientific computing through automated selection of near optimal configurations | |
Corrigan et al. | A hybrid grid compressible flow solver for large-scale supersonic jet noise simulations on multi-GPU clusters | |
Zhou et al. | Protein database search of hybrid alignment algorithm based on GPU parallel acceleration | |
Carracciuolo et al. | Toward a new linpack‐like benchmark for heterogeneous computing resources | |
Wang et al. | Characterization and architectural implications of big data workloads | |
Di Tucci et al. | Salsa: a domain specific architecture for sequence alignment | |
CN103279449A (zh) | 大规模异构众核处理器平台的效率核算方法 | |
Qu et al. | A grain-adaptive computing structure for FPGA CNN acceleration | |
Liu et al. | Research on longest common subsequence fast algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20101124 |