CN101894046A - 一种应用软件最优化运行方案的寻找方法 - Google Patents

一种应用软件最优化运行方案的寻找方法 Download PDF

Info

Publication number
CN101894046A
CN101894046A CN2009100173404A CN200910017340A CN101894046A CN 101894046 A CN101894046 A CN 101894046A CN 2009100173404 A CN2009100173404 A CN 2009100173404A CN 200910017340 A CN200910017340 A CN 200910017340A CN 101894046 A CN101894046 A CN 101894046A
Authority
CN
China
Prior art keywords
scal
application software
extensibility
parallel system
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009100173404A
Other languages
English (en)
Inventor
吕文静
马超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Langchao Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Langchao Electronic Information Industry Co Ltd filed Critical Langchao Electronic Information Industry Co Ltd
Priority to CN2009100173404A priority Critical patent/CN101894046A/zh
Publication of CN101894046A publication Critical patent/CN101894046A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种应用软件最优化运行方案的寻找方法,此方法建立在一种新的应用可扩展性评价模型的基础之上,此方法为高性能计算领域的应用软件提供了一种在大规模并行系统上快速寻找最优化运行方案的方法。通过对应用软件在大规模并行系统上逐渐增多处理器运行数目时的性能测试结果,根据新的应用可扩展性数学模型,判断、继而寻找此规模应用问题基于该平台的最优化运行方案。本发明的测试方法和可扩展性评价模型简单、易行、实用性强,可适用于高性能计算领域中众多应用软件,可提高应用软件的执行速率和硬件平台的使用率。

Description

一种应用软件最优化运行方案的寻找方法
技术领域
本发明涉及计算机应用技术,具体地说是一种高性能计算方面应用软件的性能测试和性能评估,更具体的说,涉及在大规模并行系统上基于应用软件的固定问题规模,快速寻找最优化运行方案的方法。
背景技术
随着数值计算需要解决的问题逐渐复杂和高性能计算机集群技术的迅速发展,如何在大规模并行系统上高效的运行计算流体力学、生命科学、石油勘探及航空航天等专业领域的应用软件已成为当前一个重要问题。
可扩展性是数值并行计算所重视的一个指标,而通常进行的可扩展性研究集中在并行算法和并行系统相结合的可扩展性上,它的前提是在问题规模和并行系统规模都各自增大的前提下,研究系统性能的增减。而对于并行应用软件在固定问题规模的可扩展性讨论较少,这对于在实际科研问题求解中,更高效率的使用并行系统运行应用软件具有重要意义。
发明内容
本发明主要提供了一种在大规模并行系统上的最优化运行方案的找寻方法,可以找出应用软件在固定规模问题下的最优化运行方案。
本发明的一种在大规模并行系统上的最优化运行方案的找寻方法,是按以下方式实现的,该方法包括以下步骤:
A、根据经验值设定两个较小的初始处理器运行数目P0和P1,其中P0<P1,运行软件后得到两个运行时间TP0、TP1;计算固定问题规模可扩展性Scal(Pi,Pj),其数学模型的推理过程如下:
由加速比计算公式Spi=Tpi/TPj
效率计算公式Epi=Spi/Pi×100%
推出并行系统在机器规模由Pi扩展到Pj时的固定问题规模可扩展性数学模型是:
Scal(Pi,Pj)=EPj/EPi=SPj/Spi×Pj/Pi=TPj/Tpi×Pj/Pi。
B、根据固定问题规模可扩展性数学模型Scal(Pi,Pj)=Tpi/TPj*Pi/Pj,计算判断Pj台处理器相对于Pi台处理器是否具有可扩展性,其中Pi<Pj,均表示处理器运行数目;
C、判断当Scal(Pi,Pj)>Pj/Pi时,则回到步骤A,增加处理器运行数目,以上步骤循环执行;
D、判断当0<Scal(Pi,Pj)≤Pj/Pi时,则停止测试,Pi即为此规模应用的优化处理器运行数目;
可以看出,在本发明中的固定规模可扩展性数学模型中有一个非常实用的特性,就是利用比值约分省去了问题的单处理器运行时间,因为当问题规模很大,处理机台数很多时,根本无法也没有必要在单处理器上进行求解。
本发明的有益效果是:可以快速确定大规模并行系统运行某规模应用问题的最佳处理机数目,从而提升大规模并行系统的工作效率,满足应用问题求解需求,缩短运行时间。
附图说明
附图1为本发明方法的步骤流程图。
具体实施方式
参照附图对本发明的方法作以下详细的说明;
由前述内容可知,本发明提供的是一种大规模并行系统上优化运行方案的找寻方法,其步骤流程图如图1所示,包括如下步骤:
步骤A:在大规模并行系统上运行固定规模应用软件,根据经验值设定两个较小的初始处理器运行数目P0和P1,其中P0<P1,运行软件后得到两个运行时间TP0、TP1;
步骤B:将TP0、TP1带入本发明中的可扩展性数学模型Scal(Pi,Pj)=Tpi/TPj*Pi/Pj中,计算并判断在此应用规模下Pj台处理器相对于Pi台处理器是否具有可扩展性,具体判断情况分为:
◆若Scal(Pi,Pj)>1,则Pj台处理器相对于Pi台处理器是超线性可扩展的;
◆若Scal(Pi,Pj)=1,则Pj台处理器相对于Pi台处理器是线性可扩展的;
◆若Pj/Pi<Scal(Pi,Pj)<1,则Pj台处理器相对于Pi台处理器是次线性可扩展的;
◆若0<Scal(Pi,Pj)≤Pj/Pi,则Pj台处理器相对于Pi台处理器是不可扩展的;
步骤C:判断当Scal(Pi,Pj)>Pj/Pi时,即当前的机器规模还可进行扩展,则增大处理器运行数目返回步骤A、B进行循环寻找判断;直到0<Scal(Pi,Pj)≤Pj/Pi时,即当前规模的应用问题为相对不可扩展的情况,则可判定Pi即为此规模应用的最优化处理器运行数目。
综上所述,依照本发明中的大规模并行系统上最优化运行方案的找寻方法,可以快速确定固定规模应用问题的最优化处理器运行数目,提升大规模并行系统的工作效率,满足应用问题求解需求,缩短运行时间。这是一种简单、易行又非常实用的方案确定方法,在高性能计算领域的应用软件中具有广泛的应用范围和很高的应用价值。

Claims (2)

1.一种应用软件最优化运行方案的寻找方法,其特征在于,利用固定问题规模可扩展性数学模型,寻找在大规模并行系统上应用软件的最优化运行方案,寻找步骤如下:
A、根据经验值设定两个较小的初始处理器运行数目P0和P1,其中P0<P1,运行软件后得到两个运行时间TP0、TP1
B、根据固定问题规模可扩展性数学模型Scal(Pi,Pj)=Tpi/TPj*Pi/Pj,计算判断Pj台处理器相对于Pi台处理器是否具有可扩展性,其中Pi<Pj,均表示处理器运行数目,固定问题规模可扩展性数学模型Scal(Pi,Pj)是评价在机器规模由Pi扩展到Pj时并行系统的可扩展性,Scal(Pi,Pj)的数学模型推理过程如下:
设并行系统的加速比模型为Spi=T1/Ti,同设效率模型为Epi=Spi/Pi×100%,则并行系统在机器规模由Pi扩展到Pj时的固定问题规模可扩展性为:
Scal(Pi,Pj)=EPj/EPi=SPj/Spi×Pj/Pi=TPj/Tpi×Pj/Pi
C、判断当Scal(Pi,Pj)>Pj/Pi时,则回到步骤A,增加处理器运行数目,以上步骤循环执行;
D、判断当0<Scal(Pi,Pj)≤Pj/Pi时,则停止测试,Pi即为此规模应用的优化处理器运行数目。
2.根据权利要求1中所述的方法,其特征在于,在所述步骤C步骤和D步骤中,根据Scal(Pi,Pj)值的大小判断是否返还到循环体A、B当中,直到0<Scal(Pi,Pj)≤Pj/Pi时,停止循环,此时即确定优化处理器运行数目Pi
CN2009100173404A 2009-07-27 2009-07-27 一种应用软件最优化运行方案的寻找方法 Pending CN101894046A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100173404A CN101894046A (zh) 2009-07-27 2009-07-27 一种应用软件最优化运行方案的寻找方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100173404A CN101894046A (zh) 2009-07-27 2009-07-27 一种应用软件最优化运行方案的寻找方法

Publications (1)

Publication Number Publication Date
CN101894046A true CN101894046A (zh) 2010-11-24

Family

ID=43103242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100173404A Pending CN101894046A (zh) 2009-07-27 2009-07-27 一种应用软件最优化运行方案的寻找方法

Country Status (1)

Country Link
CN (1) CN101894046A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902512A (zh) * 2012-08-31 2013-01-30 浪潮电子信息产业股份有限公司 一种基于多线程编程及消息队列的多线程并行处理方法
CN103049245A (zh) * 2012-10-25 2013-04-17 浪潮电子信息产业股份有限公司 一种基于cpu多核平台的软件性能优化方法
CN103279449A (zh) * 2013-06-14 2013-09-04 浪潮电子信息产业股份有限公司 大规模异构众核处理器平台的效率核算方法
CN103473430A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种运用高性能应用软件实现材料性能预测的方法
CN104965758A (zh) * 2015-06-11 2015-10-07 深圳市华傲数据技术有限公司 优化嵌入式软件服务质量的调度方法
CN111176839A (zh) * 2019-12-18 2020-05-19 同济大学 一种考虑数据、算法和体系结构结合的可扩展性度量方法
CN111833465A (zh) * 2020-06-23 2020-10-27 武汉菲奥达物联科技有限公司 一种基于汽车流量的小区停车收费平台扩展方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902512A (zh) * 2012-08-31 2013-01-30 浪潮电子信息产业股份有限公司 一种基于多线程编程及消息队列的多线程并行处理方法
CN102902512B (zh) * 2012-08-31 2015-12-16 浪潮电子信息产业股份有限公司 一种基于多线程编程及消息队列的多线程并行处理方法
CN103049245A (zh) * 2012-10-25 2013-04-17 浪潮电子信息产业股份有限公司 一种基于cpu多核平台的软件性能优化方法
CN103049245B (zh) * 2012-10-25 2015-12-02 浪潮电子信息产业股份有限公司 一种基于中央处理器cpu多核平台的软件性能优化方法
CN103279449A (zh) * 2013-06-14 2013-09-04 浪潮电子信息产业股份有限公司 大规模异构众核处理器平台的效率核算方法
CN103473430A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种运用高性能应用软件实现材料性能预测的方法
CN104965758A (zh) * 2015-06-11 2015-10-07 深圳市华傲数据技术有限公司 优化嵌入式软件服务质量的调度方法
CN104965758B (zh) * 2015-06-11 2018-04-17 深圳市华傲数据技术有限公司 优化嵌入式软件服务质量的调度方法
CN111176839A (zh) * 2019-12-18 2020-05-19 同济大学 一种考虑数据、算法和体系结构结合的可扩展性度量方法
CN111176839B (zh) * 2019-12-18 2023-05-02 同济大学 一种考虑数据、算法和体系结构结合的可扩展性度量方法
CN111833465A (zh) * 2020-06-23 2020-10-27 武汉菲奥达物联科技有限公司 一种基于汽车流量的小区停车收费平台扩展方法及装置

Similar Documents

Publication Publication Date Title
CN101894046A (zh) 一种应用软件最优化运行方案的寻找方法
Collange et al. Numerical reproducibility for the parallel reduction on multi-and many-core architectures
Yang et al. An efficient parallel algorithm for longest common subsequence problem on gpus
Jarus et al. Performance evaluation and energy efficiency of high-density HPC platforms based on Intel, AMD and ARM processors
CN1739079A (zh) 用于估计和控制电流变化率引起的电源电压变化的机制
US7802241B2 (en) Method for estimating processor energy usage
Anzt et al. Energy efficiency of mixed precision iterative refinement methods using hybrid hardware platforms: An evaluation of different solver and hardware configurations
CN103246541B (zh) 一种自动并行化多级并行代价评估方法
Selvan et al. Carbon footprint of selecting and training deep learning models for medical image analysis
Dasika et al. PEPSC: A power-efficient processor for scientific computing
CN102841881A (zh) 一种基于众核处理器的多重积分计算方法
Chen et al. ViennaCL++ Enable TensorFlow/Eigen via ViennaCL with OpenCL C++ Flow
Li et al. Heterogeneous systems with reconfigurable neuromorphic computing accelerators
Zymbler Best-match time series subsequence search on the Intel Many Integrated Core architecture
Ji et al. Using the first-level cache stack distance histograms to predict multi-level LRU cache misses
Cassidy et al. A high-level analytical model for application specific CMP design exploration
Ma et al. Improving energy efficiency of gpu based general-purpose scientific computing through automated selection of near optimal configurations
Corrigan et al. A hybrid grid compressible flow solver for large-scale supersonic jet noise simulations on multi-GPU clusters
Zhou et al. Protein database search of hybrid alignment algorithm based on GPU parallel acceleration
Carracciuolo et al. Toward a new linpack‐like benchmark for heterogeneous computing resources
Wang et al. Characterization and architectural implications of big data workloads
Di Tucci et al. Salsa: a domain specific architecture for sequence alignment
CN103279449A (zh) 大规模异构众核处理器平台的效率核算方法
Qu et al. A grain-adaptive computing structure for FPGA CNN acceleration
Liu et al. Research on longest common subsequence fast algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101124