CN117632520B - 基于申威众核处理器的主从核监测交互的计算量调度方法 - Google Patents
基于申威众核处理器的主从核监测交互的计算量调度方法 Download PDFInfo
- Publication number
- CN117632520B CN117632520B CN202410100805.7A CN202410100805A CN117632520B CN 117632520 B CN117632520 B CN 117632520B CN 202410100805 A CN202410100805 A CN 202410100805A CN 117632520 B CN117632520 B CN 117632520B
- Authority
- CN
- China
- Prior art keywords
- core
- slave
- master
- calculated
- slave core
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 131
- 230000003993 interaction Effects 0.000 title claims abstract description 84
- 238000012544 monitoring process Methods 0.000 title claims abstract description 36
- 238000004364 calculation method Methods 0.000 claims abstract description 91
- 238000009826 distribution Methods 0.000 claims abstract description 42
- 230000005540 biological transmission Effects 0.000 claims description 59
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- 238000013468 resource allocation Methods 0.000 abstract description 3
- 238000009827 uniform distribution Methods 0.000 abstract description 3
- 238000004590 computer program Methods 0.000 description 6
- 230000001133 acceleration Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Multi Processors (AREA)
Abstract
本发明涉及基于申威众核处理器的主从核监测交互的计算量调度方法,属于电子信息技术领域。包括:在计算量传输过程中,通过从核状态监测器SW‑CSM实现主核对从核状态的判断与监测;通过主从核协作交互器MCCI实现将计算量均匀分配到每个从核中,完成主从核监测交互的计算量调度。本发明根据单个核组内的资源配置情况,针对因计算量不同而导致的负载不均衡问题,解决了主从核交互过程中执行程序段中的计算量分配问题。该方法可以快捷、便利地实现申威众核处理器主从核交互过程中计算量的均匀分配问题,有效的降低程序执行的时间,从而提高应用程序的并行效率。该方法可以适用于申威系列众核处理器。
Description
技术领域
本发明涉及基于申威众核处理器的主从核监测交互的计算量调度方法,属于电子信息技术领域。
背景技术
高性能计算作为战略性、前沿性的高端技术,不仅是科技人才培养、创新体系建设的重要组成部分,同时也是竞争的战略目标。超级计算机代表了高性能计算系统的最先进水平,这不仅是科技能力在信息社会的重要体现,也是科技发展水平和综合国力的重要标志。超级计算机已开始建设和使用,为多个领域的科学计算应用软件提供了自主可控的并行计算平台,为各领域的数据模拟和科学研究提供了有力支持。
新一代高性能异构多核处理器SW26010pro的设计用于大规模下的线程和数据并行,并在并行工作负载上提供高性能计算能力。SW26010pro处理器包含6个核组,核组之间通过片上网络连接。与此同时,每个核组有65个核心,其中包括1个主核、64个从核和1个存储器,共计390核。64个从核通过8×8网格的形式排列。SW26010pro处理器的硬件架构如图1所示。SW26010pro处理器中从核阵列的架构如图2所示。
由于申威众核处理器架构的特殊性,在主核与从核交互的过程中,会出现每个从核所分配的计算量不同的情况,从而出现负载不均衡的问题,这就需要使用控制计算量的均匀分配的方法。
在主核与从核交互的过程中,对计算量的分配情况难以确定。由于计算量的分配是难以评估与界定的,这就导致每个从核所分配的计算量是不均匀、不统一的。对于计算量分配多的从核需要更多的时间完成并行程序的计算,从而会导致并行效率的下降;对于计算量分配少的从核所需更短的的时间,从而会导致资源的浪费。因此,由于计算量分配的难以界定,导致每个从核计算时间不确定性增加,从而会导致负载不均衡。
发明内容
针对现有技术的不足,本发明提供了一种基于新一代申威众核处理器的主从核监测与交互过程中计算量不同而导致负载不均衡的解决方法。
由上述情况可知,为了避免负载不均衡的问题,需要完成对于计算量的平均分配,在保证提高并行效率的同时,也要避免资源的浪费。因此,本发明根据单个核组内的资源配置情况,针对因计算量不同而导致的负载不均衡问题,解决了主从核交互过程中执行程序段中的计算量分配问题。该方法可以快捷、便利地实现申威众核处理器主从核交互过程中计算量的均匀分配问题,有效的降低程序执行的时间,从而提高应用程序的并行效率。该方法可以适用于申威系列众核处理器。
本发明的技术方案为:
基于申威众核处理器的主从核监测交互的计算量调度方法,包括:
在计算量传输过程中,通过从核状态监测器SW-CSM(Cpe Status Monitor) 实现主核对从核状态的判断与监测;
通过主从核协作交互器MCCI(Mpe-Cpe Collaborative Interactor)实现将计算量均匀分配到每个从核中,完成主从核监测交互的计算量调度。
根据本发明优选的,主核对从核状态的判断与监测,包括:根据从核号判断计算量的传输情况,实现由主存到本地局存的计算量传输。
根据本发明优选的,根据从核号判断计算量的传输情况,实现由主存到本地局存的计算量传输,包括:
从核状态的监测,包括:
在执行判断的过程中,主核根据计算量的传输情况将从核设置为三种状态变量:idle(空闲),busy(工作)和end(完成);
在主核执行传输操作之前,对从核设置的三种状态进行检查并确保当前从核的状态为idle;在主核执行传输操作的过程中,更新从核的状态为busy,以体现对当前计算量的传输过程;在主核执行传输操作完毕后,再次对从核设置的三种状态进行检查并更新当前从核的状态为end;
待三种从核的状态变量均实现由idle→busy→end的周期过程后,则表示主核到从核计算量传输的结束;
主核对从核计算量的传输,包括:
通过异步的方式进行主核和从核阵列之间的计算量的传输,包括主核计算量的分配与从核计算量的获取;
主核计算量的分配,包括:主核根据从核的三种状态变量,在状态变量为idle时进行计算量的分配或资源的释放,在状态变量为end时结束计算量的传输过程;
从核计算量的获取,包括:从核在接收计算量的前处于被动的等待计算量的状态,在获取到主核分配的对应的计算量后,从核开始执行对应的计算操作,在计算完毕后判断对应的计算量操作是否完成,并更新自己的状态变量。
根据本发明优选的,根据应用程序的需求分为线程级交互模式与进程级交互模式。
根据应用程序的需求,主从核协作交互器MCCI包括线程级交互模式与进程级交互模式。
根据本发明优选的,线程级交互模式,包括:
单核组内由主核到从核计算量的分配过程中,确定从核执行状态为idle(空闲)后,通过主从核协作交互器MCCI控制的形式,以当前执行的计算量编号与总计算量的比较情况为基准,并设置目前执行的计算量编号大于总计算量时终止;
根据每个从核分配所得到计算量的平均情况设置对应的计算量平衡器k_amount,计算量平衡器k_amount为前一从核计算量的与后一从核计算量的比值;设置计算量平衡器k_amount的数值区间范围;当实际的k_amount小于计算量平衡器k_amount的数值区间范围时,加大下一从核的计算量传输;当实际的k_amount大于计算量平衡器k_amount的数值区间范围时,减少下一从核的计算量传输;当实际的k_amount在此区间范围内,继续后续从核计算的传输;
在单个从核完成相关的计算操作后,采用计算量更新器num_amount_set及时更新已完成计算量的计数与从核号,确保每个从核计算量均传输完毕;在判断所有计算量分配完毕后,以此确定该核组中所有从核执行完毕。
进一步优选的,计算量平衡器k_amount的数值区间范围为0.8~1.2。
根据本发明优选的,进程级交互模式,包括:
核组间的计算量的分配过程中,通过核组的主核上运行的进程来并行完成计算量的分配工作,在执行的过程中,计算量根据总体的分配情况分配到每个进程中,实现由进程级交互模式到线程级交互模式的转换,实现整个进程级交互模式。
进一步优选的,计算量根据总体的分配情况分配到每个进程中,包括:
进程级交互模式下,计算量的分配主要为核组间的进程级并行,其具体分配方式如下:
程序员以总计算量的需求以及应用程序并行编程框架提供的接口为依据,通过使用MPI进程号对每个进程所应分配的计算量进行预划分,并根据计算量的大小情况分为mpe_A、mpe_B、mpe_C三种划分规模以启用不同的从核组,由此来实现进程级计算量的传输工作;
程序员可根据自身需求定义进程级交互模式下三种规模mpe_A、mpe_B、mpe_C所启用的从核数组个数;
在进程级交互模式中,采用MCCI_athread_spawn进行从核组的启动工作,并采用MCCI_amount_allcoate( )进行进程级计算量的分配;
在进程级计算量分配结束后,开启由进程级交互模式到线程级交互模式的转换,并开启线程级交互模式的执行。
进一步优选的,通常情况下,mpe_A启用1个核组,mpe_B启用3个核组,mpe_C启用6个核组即全部核组。
根据本发明优选的,在进程级交互模式或线程级交互模式执行完毕后,确定计算量的遗漏情况,进行已完成计算量与总计算量的差值计算。在确定计算量无遗漏情况后,即可完成每个从核计算量的平均分配。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现基于申威众核处理器的主从核监测交互的计算量调度方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现基于申威众核处理器的主从核监测交互的计算量调度方法的步骤。
本发明的有益效果为:
本发明根据单个核组内的资源配置情况,针对因计算量不同而导致的负载不均衡问题,解决了主从核交互过程中执行程序段中的计算量分配问题。该方法可以快捷、便利地实现申威众核处理器主从核交互过程中计算量的均匀分配问题,有效的降低程序执行的时间,从而提高应用程序的并行效率。该方法可以适用于申威系列众核处理器。
附图说明
图1为SW26010pro处理器硬件架构示意图;
图2为SW26010pro处理器中从核阵列的架构示意图;
图3为计算量传输情况的判断过程示意图;
图4为线程级交互模式的实现过程示意图。
具体实施方式
下面结合说明书附图和实施例对本发明作进一步限定,但不限于此。
实施例1
基于申威众核处理器的主从核监测交互的计算量调度方法,包括:
在计算量传输过程中,通过从核状态监测器SW-CSM(Cpe Status Monitor) 实现主核对从核状态的判断与监测;
通过主从核协作交互器MCCI(Mpe-Cpe Collaborative Interactor)实现将计算量均匀分配到每个从核中,完成主从核监测交互的计算量调度。
实施例2
根据实施例1所述的基于申威众核处理器的主从核监测交互的计算量调度方法,其区别在于:
主核对从核状态的判断与监测,包括:根据从核号判断计算量的传输情况,实现由主存到本地局存的计算量传输。
根据从核号判断计算量的传输情况,实现由主存到本地局存的计算量传输,包括:
从核状态的监测,包括:
该监测过程主要体现在主核传输计算量到从核时,根据从核状态变量进行数据量的监测与更新的过程。在执行判断的过程中,主核根据计算量的传输情况将从核设置为三种状态变量:idle(空闲),busy(工作)和end(完成);
在主核执行传输操作之前,对从核设置的三种状态进行检查并确保当前从核的状态为idle;在主核执行传输操作的过程中,更新从核的状态为busy,以体现对当前计算量的传输过程;在主核执行传输操作完毕后,再次对从核设置的三种状态进行检查并更新当前从核的状态为end;
待三种从核的状态变量均实现由idle→busy→end的周期过程后,则表示主核到从核计算量传输的结束;以1号从核的执行情况为例:当1号从核状态为idle时,启动主核对从核的计算量传输工作,同时将其状态更新为busy,并开始从核异步执行状态,在计算量传输完毕后,此时1号从核则被更新为end,即完成了由主核到1号从核计算量的传输工作。在1号从核计算量传输完毕后,会反馈相关信息告知自身的完成情况以实现主核的同步操作,并开启下一从核的计算量传输。其具体实施过程如图3所示。
主核对从核计算量的传输,包括:
通过异步的方式进行主核和从核阵列之间的计算量的传输,包括主核计算量的分配与从核计算量的获取;
主核计算量的分配,包括:主核根据从核的三种状态变量,在状态变量为idle时进行计算量的分配或资源的释放,在状态变量为end时结束计算量的传输过程;
从核计算量的获取,包括:从核在接收计算量的前处于被动的等待计算量的状态,在获取到主核分配的对应的计算量后,从核开始执行对应的计算操作,在计算完毕后判断对应的计算量操作是否完成,并更新自己的状态变量。在整个计算量传输的过程中,主核负责计算量的分配与资源释放,从核负责完成相关的计算任务与实时更新自身的状态变量。表1为从核状态监测器SW-CSM具体所需函数表。
表1
为了避免因计算量分配不均匀而导致的负载不均衡问题,本发明设计了主从核协作交互器MCCI(Mpe-Cpe Collaborative Interactor)。MCCI主要功能为使得计算量均匀分配到每个从核之中,根据应用程序的需求分为线程级交互模式与进程级交互模式。
根据应用程序的需求,主从核协作交互器MCCI包括线程级交互模式与进程级交互模式。
线程级交互模式,包括:
单核组内由主核到从核计算量的分配过程中,确定从核执行状态为idle(空闲)后,通过主从核协作交互器MCCI控制的形式,以当前执行的计算量编号与总计算量的比较情况为基准,并设置目前执行的计算量编号大于总计算量时终止;
根据每个从核分配所得到计算量的平均情况设置对应的计算量平衡器k_amount,计算量平衡器k_amount为前一从核计算量的与后一从核计算量的比值;k_amount的数值由程序员根据初始的总计算量total_amount决定,设置计算量平衡器k_amount的数值区间范围;当实际的k_amount小于计算量平衡器k_amount的数值区间范围时,加大下一从核的计算量传输;当实际的k_amount大于计算量平衡器k_amount的数值区间范围时,减少下一从核的计算量传输;当实际的k_amount在此区间范围内,继续后续从核计算的传输;
在单个从核完成相关的计算操作后,采用计算量更新器num_amount_set及时更新已完成计算量的计数与从核号,确保每个从核计算量均传输完毕;在判断所有计算量分配完毕后,以此确定该核组中所有从核执行完毕。上述过程可结束线程级交互模式。
计算量平衡器k_amount的数值区间范围为0.8~1.2。
具体步骤如图4所示,具体使用伪代码如下所示。
Input:
total_amount:计算量总数;
cur_amount_id:当前传输的计算量编号;
completed_amount:已传输完的计算量;
cpe_amount:每个从核所需处理的计算量;
k_amount:计算量平衡器;
cpe_id:从核编号
num_amount_set:计算量更新器
k_amount= cpe_i+1_ammount/cpe_i_amount
ifcur_amount_id<total_amountthen //判断程序的执行情况
cur_amount_id++
end if
ifcpe_amount_i+1/cpe_amount_i<=k_amountthen //判断单个从核计算量传输情况
completed_amount++
cpe_id= cpe_id+1
end if
for allcpe_iddo //分配每个从核所需处理的计算量
array[i].cpe.id=i;
array[i]. completed_amount= cpe_amount
end for
ifcompleted_amount= total_amountthen //判断计算量是否完全分配完成
completed
end if
进程级交互模式,包括:
核组间的计算量的分配过程中,通过核组的主核上运行的进程来并行完成计算量的分配工作,在执行的过程中,计算量根据总体的分配情况分配到每个进程中,实现由进程级交互模式到线程级交互模式的转换,实现整个进程级交互模式。
计算量根据总体的分配情况分配到每个进程中,包括:
进程级交互模式下,计算量的分配主要为核组间的进程级并行,其具体分配方式如下:
程序员以总计算量的需求以及应用程序并行编程框架提供的接口为依据,通过使用MPI进程号对每个进程所应分配的计算量进行预划分,并根据计算量的大小情况分为mpe_A、mpe_B、mpe_C三种划分规模以启用不同的从核组,由此来实现进程级计算量的传输工作;
程序员可根据自身需求定义进程级交互模式下三种规模mpe_A、mpe_B、mpe_C所启用的从核数组个数;
在进程级交互模式中,采用MCCI_athread_spawn进行从核组的启动工作,并采用MCCI_amount_allcoate( )进行进程级计算量的分配;
在进程级计算量分配结束后,开启由进程级交互模式到线程级交互模式的转换,并开启线程级交互模式的执行。
通常情况下,mpe_A启用1个核组,mpe_B启用3个核组,mpe_C启用6个核组即全部核组。
在进程级交互模式或线程级交互模式执行完毕后,确定计算量的遗漏情况,进行已完成计算量与总计算量的差值计算。在确定计算量无遗漏情况后,即可完成每个从核计算量的平均分配。表2为主从核协作交互器MCCI具体所需函数表。
表2
以上过程即可完成每个从核计算量的平均分配,以此解决因计算量分配不均而导致的负载不均衡问题。本发明能够快速、有效地解决主核与从核交互过程中的计算量分配问题,有效的缩短了运行时间,提升了应用程序的并行性能与加速效果。
稀疏矩阵向量乘SpMV(sparse matrix-vector multipliSW-CSMion)是科学与工程计算中一个非常重要的算法,其主要实现方式为把一个稀疏矩阵与一个向量相乘。作为一种通用的运算,该算法在科学应用、经济模型、数据挖掘、信息检索中广泛应用。稀疏矩阵向量乘SpMV程序在申威众核处理器中并行运行时,根据并行方法,采用6个计算结点以完成数据集的测试工作,以矩阵规模做为计算量的输入,并采用500、1000、2500、5000、10000五种计算量做为计算量的测试数量。表3为使用本发明方法测试的对比加速效果表。
表3
本发明将使用此算法的测试时间与未使用此算法的测试时间进行对比,该实验证明本发明方法具有明显的加速效果。本发明方法的实现,能够快速、有效地解决主核与从核交互过程中的计算量分配问题,有效的缩短了运行时间,提升了应用程序的并行性能与加速效果。
实施例3
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现实施例1或2所述的基于申威众核处理器的主从核监测交互的计算量调度方法的步骤。
实施例4
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现实施例1或2所述的基于申威众核处理器的主从核监测交互的计算量调度方法的步骤。
Claims (8)
1.基于申威众核处理器的主从核监测交互的计算量调度方法,包括:
在计算量传输过程中,通过从核状态监测器SW-CSM实现主核对从核状态的判断与监测;
通过主从核协作交互器MCCI实现将计算量均匀分配到每个从核中,完成主从核监测交互的计算量调度;
主核对从核状态的判断与监测,包括:根据从核号判断计算量的传输情况,实现由主存到本地局存的计算量传输;
根据从核号判断计算量的传输情况,实现由主存到本地局存的计算量传输,包括:
从核状态的监测,包括:
在执行判断的过程中,主核根据计算量的传输情况将从核设置为三种状态变量:idle,busy和end;
在主核执行传输操作之前,对从核设置的三种状态进行检查并确保当前从核的状态为idle;在主核执行传输操作的过程中,更新从核的状态为busy,以体现对当前计算量的传输过程;在主核执行传输操作完毕后,再次对从核设置的三种状态进行检查并更新当前从核的状态为end;
待三种从核的状态变量均实现由idle→busy→end的周期过程后,则表示主核到从核计算量传输的结束;
主核对从核计算量的传输,包括:
通过异步的方式进行主核和从核阵列之间的计算量的传输,包括主核计算量的分配与从核计算量的获取;
主核计算量的分配,包括:主核根据从核的三种状态变量,在状态变量为idle时进行计算量的分配或资源的释放,在状态变量为end时结束计算量的传输过程;
从核计算量的获取,包括:从核在接收计算量的前处于被动的等待计算量的状态,在获取到主核分配的对应的计算量后,从核开始执行对应的计算操作,在计算完毕后判断对应的计算量操作是否完成,并更新自己的状态变量。
2.根据权利要求1所述的基于申威众核处理器的主从核监测交互的计算量调度方法,其特征在于,根据应用程序的需求,主从核协作交互器MCCI包括线程级交互模式与进程级交互模式。
3.根据权利要求2所述的基于申威众核处理器的主从核监测交互的计算量调度方法,其特征在于,线程级交互模式,包括:
单核组内由主核到从核计算量的分配过程中,确定从核执行状态为idle后,通过主从核协作交互器MCCI控制的形式,以当前执行的计算量编号与总计算量的比较情况为基准,并设置目前执行的计算量编号大于总计算量时终止;
根据每个从核分配所得到计算量的平均情况设置对应的计算量平衡器k_amount,计算量平衡器k_amount为前一从核计算量的与后一从核计算量的比值;设置计算量平衡器k_amount的数值区间范围;当实际的k_amount小于计算量平衡器k_amount的数值区间范围时,加大下一从核的计算量传输;当实际的k_amount大于计算量平衡器k_amount的数值区间范围时,减少下一从核的计算量传输;当实际的k_amount在此区间范围内,继续后续从核计算的传输;
在单个从核完成相关的计算操作后,采用计算量更新器num_amount_set及时更新已完成计算量的计数与从核号,确保每个从核计算量均传输完毕;在判断所有计算量分配完毕后,以此确定该核组中所有从核执行完毕。
4.根据权利要求3所述的基于申威众核处理器的主从核监测交互的计算量调度方法,其特征在于,计算量平衡器k_amount的数值区间范围为0.8~1.2。
5.根据权利要求2所述的基于申威众核处理器的主从核监测交互的计算量调度方法,其特征在于,进程级交互模式,包括:
核组间的计算量的分配过程中,通过核组的主核上运行的进程来并行完成计算量的分配工作,在执行的过程中,计算量根据总体的分配情况分配到每个进程中,实现由进程级交互模式到线程级交互模式的转换,实现整个进程级交互模式。
6.根据权利要求5所述的基于申威众核处理器的主从核监测交互的计算量调度方法,其特征在于,计算量根据总体的分配情况分配到每个进程中,包括:
以总计算量的需求以及应用程序并行编程框架提供的接口为依据,通过使用MPI进程号对每个进程所应分配的计算量进行预划分,并根据计算量的大小情况分为mpe_A、mpe_B、mpe_C三种划分规模以启用不同的从核组,由此来实现进程级计算量的传输工作;
根据自身需求定义进程级交互模式下三种规模mpe_A、mpe_B、mpe_C所启用的从核数组个数;
在进程级交互模式中,采用MCCI_athread_spawn进行从核组的启动工作,并采用MCCI_amount_allcoate()进行进程级计算量的分配;
在进程级计算量分配结束后,开启由进程级交互模式到线程级交互模式的转换,并开启线程级交互模式的执行。
7.根据权利要求6所述的基于申威众核处理器的主从核监测交互的计算量调度方法,其特征在于,mpe_A启用1个核组,mpe_B启用3个核组,mpe_C启用6个核组即全部核组。
8.根据权利要求2-7任一所述的基于申威众核处理器的主从核监测交互的计算量调度方法,其特征在于,在进程级交互模式或线程级交互模式执行完毕后,确定计算量的遗漏情况,进行已完成计算量与总计算量的差值计算;在确定计算量无遗漏情况后,即完成每个从核计算量的平均分配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410100805.7A CN117632520B (zh) | 2024-01-25 | 2024-01-25 | 基于申威众核处理器的主从核监测交互的计算量调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410100805.7A CN117632520B (zh) | 2024-01-25 | 2024-01-25 | 基于申威众核处理器的主从核监测交互的计算量调度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117632520A CN117632520A (zh) | 2024-03-01 |
CN117632520B true CN117632520B (zh) | 2024-05-17 |
Family
ID=90025492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410100805.7A Active CN117632520B (zh) | 2024-01-25 | 2024-01-25 | 基于申威众核处理器的主从核监测交互的计算量调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117632520B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150065349A (ko) * | 2013-12-05 | 2015-06-15 | 한국항공우주연구원 | 위성용 컴퓨터 시스템 및 그 운용방법 |
CN110262900A (zh) * | 2019-06-20 | 2019-09-20 | 山东省计算中心(国家超级计算济南中心) | 一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法 |
CN112181894A (zh) * | 2019-07-04 | 2021-01-05 | 山东省计算中心(国家超级计算济南中心) | 一种基于申威众核处理器的核组内分组自适应调整运行方法 |
WO2022111453A1 (zh) * | 2020-11-24 | 2022-06-02 | 北京灵汐科技有限公司 | 任务处理方法及装置、任务分配方法、电子设备、介质 |
CN114968600A (zh) * | 2022-07-19 | 2022-08-30 | 山东省计算中心(国家超级计算济南中心) | 一种基于新一代申威众核处理器的从核阵列任务分配实现负载均衡的方法 |
CN116167304A (zh) * | 2023-04-23 | 2023-05-26 | 山东省计算中心(国家超级计算济南中心) | 基于神威架构的油藏数值模拟gmres优化方法及系统 |
WO2023092620A1 (zh) * | 2021-11-29 | 2023-06-01 | 山东领能电子科技有限公司 | 基于risc-v的三维互联众核处理器架构及其工作方法 |
-
2024
- 2024-01-25 CN CN202410100805.7A patent/CN117632520B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150065349A (ko) * | 2013-12-05 | 2015-06-15 | 한국항공우주연구원 | 위성용 컴퓨터 시스템 및 그 운용방법 |
CN110262900A (zh) * | 2019-06-20 | 2019-09-20 | 山东省计算中心(国家超级计算济南中心) | 一种基于申威众核处理器的主核与核组之间通信锁同步运行加速方法 |
CN112181894A (zh) * | 2019-07-04 | 2021-01-05 | 山东省计算中心(国家超级计算济南中心) | 一种基于申威众核处理器的核组内分组自适应调整运行方法 |
WO2022111453A1 (zh) * | 2020-11-24 | 2022-06-02 | 北京灵汐科技有限公司 | 任务处理方法及装置、任务分配方法、电子设备、介质 |
WO2023092620A1 (zh) * | 2021-11-29 | 2023-06-01 | 山东领能电子科技有限公司 | 基于risc-v的三维互联众核处理器架构及其工作方法 |
CN114968600A (zh) * | 2022-07-19 | 2022-08-30 | 山东省计算中心(国家超级计算济南中心) | 一种基于新一代申威众核处理器的从核阵列任务分配实现负载均衡的方法 |
CN116167304A (zh) * | 2023-04-23 | 2023-05-26 | 山东省计算中心(国家超级计算济南中心) | 基于神威架构的油藏数值模拟gmres优化方法及系统 |
Non-Patent Citations (3)
Title |
---|
姚庆 ; 郑凯 ; 刘垚 ; 王肃 ; 孙军 ; 徐梦轩 ; .SOM算法在申威众核上的实现和优化.计算机科学.2018,(第S2期),全文. * |
杨松 ; 漆昭铃 ; 贺亚龙 ; 柴俊 ; .基于多核DSP的软件主从架构设计.电子技术与软件工程.2019,(第11期),全文. * |
赵瑞祥 ; 郑凯 ; 刘垚 ; 王肃 ; 刘艳 ; 沈焕学 ; 周谦豪 ; .基于申威众核处理器的混合并行遗传算法.计算机应用.2017,(第09期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN117632520A (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Olmedo et al. | Dissecting the CUDA scheduling hierarchy: a performance and predictability perspective | |
CN105487838A (zh) | 一种动态可重构处理器的任务级并行调度方法与系统 | |
Menon et al. | Automated load balancing invocation based on application characteristics | |
US20120315966A1 (en) | Scheduling method and system, computing grid, and corresponding computer-program product | |
Iserte et al. | DMRlib: easy-coding and efficient resource management for job malleability | |
CN110297661B (zh) | 基于amp构架dsp操作系统的并行计算方法、系统及介质 | |
CN106293947B (zh) | 虚拟化云环境下gpu-cpu混合资源分配系统和方法 | |
CN103699432A (zh) | 一种异构环境下的多任务运行时协同调度系统 | |
CN114610474A (zh) | 一种异构超算环境下多策略的作业调度方法及系统 | |
Langguth et al. | Memory bandwidth contention: Communication vs computation tradeoffs in supercomputers with multicore architectures | |
CN111459647A (zh) | 基于嵌入式操作系统的dsp多核处理器并行运算方法及装置 | |
CN117032945A (zh) | 一种通过能耗感知调整计算资源平衡能耗的异构计算架构 | |
CN117632520B (zh) | 基于申威众核处理器的主从核监测交互的计算量调度方法 | |
CN115775199B (zh) | 数据处理方法和装置、电子设备和计算机可读存储介质 | |
CN112698931B (zh) | 一种云工作流分布式调度系统 | |
CN110415162B (zh) | 大数据中面向异构融合处理器的自适应图划分方法 | |
CN110262884B (zh) | 一种基于申威众核处理器的核组内多程序多数据流分区并行的运行方法 | |
CN114356550A (zh) | 一种面向三级并行中间件的计算资源自动分配方法及系统 | |
CN108062249A (zh) | 基于大数据的云端数据分配调度方法 | |
CN112559032B (zh) | 基于循环段的众核程序重构方法 | |
CN107329818A (zh) | 一种任务调度处理方法及装置 | |
Xiao et al. | An application-level scheduling with task bundling approach for many-task computing in heterogeneous environments | |
CN111090508A (zh) | 一种基于OpenCL的异构协同并行计算中设备间动态任务调度方法 | |
CN116149794B (zh) | 一种基于容器架构的云仿真方法 | |
Singla et al. | Task Scheduling Algorithms for Grid Computing with Static Jobs: A Review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |