CN116501589A - 面向并行应用核间通信竞争的通信性能预测方法及装置 - Google Patents

面向并行应用核间通信竞争的通信性能预测方法及装置 Download PDF

Info

Publication number
CN116501589A
CN116501589A CN202310471570.8A CN202310471570A CN116501589A CN 116501589 A CN116501589 A CN 116501589A CN 202310471570 A CN202310471570 A CN 202310471570A CN 116501589 A CN116501589 A CN 116501589A
Authority
CN
China
Prior art keywords
communication
processor
data
core
heterogeneous multi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310471570.8A
Other languages
English (en)
Inventor
甘润东
王策
卫薇
龙玉江
钟掖
李洵
王杰峰
卢仁猛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202310471570.8A priority Critical patent/CN116501589A/zh
Publication of CN116501589A publication Critical patent/CN116501589A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7807System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
    • G06F15/781On-chip cache; Off-chip memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种面向并行应用核间通信竞争的通信性能预测方法及装置,涉及通信性能预测技术领域,该方法为:确定完成数据传输类型以及通信缓存类型选择后,异构多核处理器模型提取并分阶段运行并行应用通信数据的第一个并发任务,得出其处理时间并记录于预设的轮询时间间隔表内,作为初始轮询时间间隔作用于剩余并发任务上,同时在异构多核处理器模型上运行剩余并发任务,根据后续剩余并发任务处理时间递增或递减初始轮训时间间隔并记录。本发明通过根据异构多核处理器的运行背景以及自身结构选择出适合其通信的通信构架,这样减少了无用性能因素的检测,加快了通信性能预测的时间,大大提高了通信性能预测的效率。

Description

面向并行应用核间通信竞争的通信性能预测方法及装置
技术领域
本发明涉及面向并行应用核间通信竞争的通信性能预测方法及装置,属于通信性能预测技术领域。
背景技术
在通信系统中,随着技术的不断发展,越来越多的平台从单核处理器的单级网络互连转变为更为复杂得多核架构,异构多核处理器同时具有两个或两个以上不同架构的处理器内核,其结构具有较强的针对性,常应用于一些特定的行业领域,由于应用的需要,多核处理器间需频繁地进行信息交换,这使得核间通信效率严格地制约着系统的高性能处理能力;异构多核处理器通常包括一个或多个通用处理器(GPP)内核,以及多个特定高性能处理器内核(DSP)系统可将多个任务分配至不同类型的内核上并行处理,从而为不同类型的应用提供更加灵活高效的处理机制。
目前随着并行应用的规模增加,应用通信开销逐渐成为限制并行应用整体性能的重要因素,因此对于应用通信性能的优化可以有效地帮助优化应用的整体性能,通常建立评估系统来对并行应用核间通信性能进行相关预测,而一般的通信性能预测方法及装置在进行预测时,通常需要对该多核架构进行全方位的预测,由于影响通信性能的影响因子包括通信粒度的大小、通信缓存类型以及消息传输机制等等,部分预测系统只对单一的性能影响因素进行分析,没有将影响因素进行抽象、综合形成完整的指标体系,而每个影响因子又包含至少两种及两种类型,这样导致预测过程中所产生的结果多且复杂,并且部分无用结果占用预测系统负载,影响预测系统的预测效率。
现有的通信性能预测方法只对单一的通信性能影响因素进行分析,同时全方位的预测导致预测过程中产生的结果多且复杂,影响预测效率,为此我们提出面向并行应用核间通信竞争的通信性能预测方法及装置。
发明内容
本发明要解决的技术问题是:提供面向并行应用核间通信竞争的通信性能预测方法及装置,解决现有的通信性能预测方法只对单一的通信性能影响因素进行分析、同时全方位的预测导致预测过程中产生的结果多且复杂导致影响预测效率的问题。
本发明采取的技术方案为:面向并行应用核间通信竞争的通信性能预测方法,包括以下步骤:
S1、从待预测的异构多核处理器出发,获取该异构多核处理器针对性应用领域,以及该异构多核处理器的组成结构,其中包括通用处理器、高性能处理器以及片外数据存储器的数量;
S2、构建异构多核处理器模型,获取步骤S1中得到的该异构多核处理器的组成结构,并输入异构多核处理器模型内部,同时根据该异构多核处理器的针对性应用领域获取针对该应用领域所运行的并行应用通信数据;
S3、异构多核处理器模型评估并行应用通信数据的数据块大小,根据预设的数据块大小阈值,选择应用于异构多核处理器模型上数据传输类型,即选择分化机制或者合并机制;
S4、确定完成数据传输类型选择后异构多核处理器模型根据用处理器与高性能处理器之间传递的数据大小以及异构多核处理器的成本高低,选择通信缓存类型,即选择片外数据存储器或者片内缓存;
S5、确定完成数据传输类型以及通信缓存类型选择后,异构多核处理器模型提取并分阶段运行并行应用通信数据的第一个并发任务,得出其处理时间并记录于预设的轮询时间间隔表内,作为初始轮询时间间隔作用于剩余并发任务上,同时在异构多核处理器模型上运行剩余并发任务,根据后续剩余并发任务处理时间递增或递减初始轮训时间间隔并记录;
S6、根据轮询时间间隔表中记录的所有轮询时间间隔,计算得出其平均时间作为最佳轮询时间间隔,重新运行异构多核处理器模型采用最佳轮询时间间隔完成并行应用通信数据的通信过程;
S7、统合异构多核处理器模型在各阶段核间通信耗时,直观得出各通信性能影响因子对各阶段耗时的影响,从而得出该通信性能影响因子对异构多核处理器模型的性能影响。
进一步地,上述在步骤S1中,通用处理器以及高性能处理器作为异构多核处理器的处理计算单元,其中通用处理器为主处理核心,高性能处理器为作为协助处理器辅助通用处理器完成任务处理,片外数据存储器为异构多核处理器外接共享数据缓存。
进一步地,上述异构多核处理器模型分五个阶段完成并行应用通信数据的通信过程,包括以下步骤:
a、通用处理器拷贝并行应用通信数据至通用处理器与高性能处理器共享的数据缓存内部;
b、通用处理器生成通信控制消息并写入数据缓存,通用处理器使用轮询机制来请求高性能处理器进行通信;
c、高性能处理器接收到通信请求后从消息列表中读取控制消息,高性能处理器根据控制消息读取通信数据,并开始执行任务请求,高性能处理器处理完任务后,就会开始另一个核间通信过程,并将处理结果或错误状态等信息返回至通用处理器,高性能处理器拷贝任务处理后的返回数据到共享数据缓存内部,从而通用处理器获取处理结果,高性能处理器生成通信控制消息并将其输入至数据缓存中,该消息包含返回数据的地址和大小;
d、高性能处理器通过轮询机制告知通用处理器其任务已经处理完成,通用处理器读取通信控制消息;
e、通用处理器根据控制消息获得处理结果。
进一步地,上述步骤b中提到的通信控制消息包括通信数据的地址、数据大小和被调用的高性能处理器功能,通信控制消息录入于预设列表中,以允许通用处理器持续对高性能处理器发出新请求,同时高性能处理器有序执行高性能处理请求。
进一步地,上述通用处理器与高性能处理器之间交互的通信数据块的大小直接影响核间通信过程中步骤a、c以及e的耗时,其中,通信数据块越大,传送所需时间越多,而其时间在整个通信过程中的占比越大,从而削弱其他各阶段的通信耗时,分化机制是分多个核间通信过程分别处理这些数据,从而处理数据块,其增加核间通信次数和核间通信过程中控制交互过程中的耗时,从而增加核间通信的时间开销;合并机制是合并多个通信数据和高性能处理器通信请求,从而通过一次核间通信过程传递数据块。
进一步地,上述通信缓存类型包括片外数据存储器以及片内缓存,片内缓存是通用处理器与高性能处理器中的片内缓存共享,以实现数据缓存共享,片内缓存比片外数据存储器小,且成本价格更高。
进一步地,上述轮询机制主要通过不断检查标志位来判断是否有未处理的通信请求,当有通信请求时,异构多核处理器模型设置或重置共享内存中某个标志位,包括以下步骤:通用处理器将通信数据和控制消息写入共享缓存后,在共享缓存内部的一个特殊地址处设置一个标志位,特殊地址指将共享缓存分块存储,预先设置一块为特殊地址;高性能处理器读取该地址的标志位,并判断是否有未处理的通信请求;若该标志位已被设置,高性能处理器就读取共享通信缓存中的通信控制消息和缓存数据;若标志位未被设置,则一段时间后高性能处理器再次检查该标志位。
面向并行应用核间通信竞争的通信性能预测装置,包括模拟平台以及与其建立控制连接的获取模块、评估模块、分配模块以及统合模块;
获取模块:用于获取待预测的异构多核处理器针对性应用领域,以及该异构多核处理器的组成结构,包括通用处理器、高性能处理器以及片外数据存储器的数量,并发送至预测平台;
模拟平台:根据所获取的异构处理器结构,输入至预测平台内部并建立异构多核处理器模型,预测平台根据该异构多核处理器应用领域向异构多核处理器模型内部输入针对该应用领域所运行的并行应用通信数据,预测平台用于模拟预测异构多核处理器模型的通信性能,其中将模拟过程分为五个阶段;
评估模块:用于根据模拟平台提供的并行通信数据,评估其数据块大小,设置数据块大小阈值,确定选择分化机制或者合并机制;分化机制通过多个核间通信过程分别传送通信数据,合并机制通过进行一次核间通信过程传送通信数据;同时评估模块用于根据通用处理器与高性能处理器之间传递的数据大小以及异构多核处理器的成本高低,选择片外数据存储器或者片内缓存;
监控分配模块:异构多核处理器模型采用轮询机制作为通用处理器与高性能处理器的消息传输机制,分配模块内建立轮询时间间隔表,监控分配模块监控第一个并发任务的处理时间并记录,作为初始轮询时间间隔,并将初始轮询时间间隔应用至模拟平台,根据后续剩余并发任务处理时间递增或递减初始轮训时间间隔并记录;
统合模块:用于统计模拟平台中异构多核处理器模型在各阶段中通信数据传递耗时,根据各阶段并行应用通信数据的处理时间耗时来具体预测该异构多核处理器的性能结果。
进一步地,上述评估模块中所提到的预设数据块大小阈值为32M,即当数据块小于32M时选择分化机制,若数据块大于32M时选择合并机制。
本发明的有益效果:与现有技术相比,本发明的效果如下:
1)本发明通过构建异构多核处理器模型,将待检测的异构多核处理器针对性应用领域以及其组成结构进行复制模拟,最终得到与待检测异构多核处理器完全相同的异构多核处理器模型,根据该异构多核处理器模型进行相关性能的检测,能够全方位且针对性的进行性能预测;异构多核处理器模型将通信过程分为五个阶段,统计所有并发任务在每个阶段的通信耗时,即可得到各通信性能影响因子在通信过程中性能影响;
2)本发明通过设置评估模块,根据模拟平台提供的并行通信数据块大小,选择分化机制或者合并机制,这样可以根据异构多核处理器在其领域运行的并行应用通信数据大小来提高数据传输速度,减少其通信过程中的占比,同时根据根据通用处理器与高性能处理器之间传递的数据大小以及异构多核处理器的成本高低,选择片外数据存储器或者片内缓存,这样可以针对通信过程中的数据缓存大小以及成本进行片外或者片内缓存的选择,根据以上两个性能影响因素,通过根据异构多核处理器的运行背景以及自身结构选择出适合其通信的通信构架,这样减少了无用性能因素的检测,加快了通信性能预测的时间,大大提高了通信性能预测的效率;
3)本发明通过设置轮询机制作为异构多核处理器模型的消息传输机制,针对其第一个并发任务的处理时间作为初始轮询时间间隔,根据后续剩余并发任务处理时间递增或递减初始轮询时间间隔并记录,直至选择出最佳轮询时间间隔,这样不仅对该异构多核处理器模型的通信性能进行检测,同时给出优化其通信性能的优化方案,一举多得。
附图说明
图1为面向并行应用核间通信竞争的通信性能预测方法的流程图;
图2为面向并行应用核间通信竞争的通信性能预测方法的异构多核处理器模型通信阶段流程图;
图3为面向并行应用核间通信竞争的通信性能预测装置的系统框图。
具体实施方式
下面结合附图及具体的实施例对本发明进行进一步介绍。
实施例1:如图1-3所示,面向并行应用核间通信竞争的通信性能预测方法,包括以下步骤:
S1、从待预测的异构多核处理器出发,获取该异构多核处理器针对性应用领域,以及该异构多核处理器的组成结构,其中包括通用处理器、高性能处理器以及片外数据存储器的数量;
其中,通用处理器以及高性能处理器作为异构多核处理器的处理计算单元,其中通用处理器为主处理核心,高性能处理器为作为协助处理器辅助通用处理器完成任务处理,片外数据存储器为异构多核处理器外接共享数据缓存;
S2、构建异构多核处理器模型,获取步骤S1中得到的该异构多核处理器的组成结构,并输入异构多核处理器模型内部,同时根据该异构多核处理器的针对性应用领域获取针对该应用领域所运行的并行应用通信数据;
其中,异构多核处理器模型分五个阶段完成并行应用通信数据的通信过程,包括以下步骤:
a、通用处理器拷贝并行应用通信数据至通用处理器与高性能处理器共享的数据缓存内部;
b、通用处理器生成通信控制消息并写入数据缓存,通用处理器使用轮询机制来请求高性能处理器进行通信;
其中,通信控制消息包括通信数据的地址、数据大小和被调用的高性能处理器功能,通信控制消息录入于预设列表中,以允许通用处理器持续对高性能处理器发出新请求,同时高性能处理器有序执行高性能处理请求;
c、高性能处理器接收到通信请求后从消息列表中读取控制消息,高性能处理器根据控制消息读取通信数据,并开始执行任务请求,高性能处理器处理完任务后,就会开始另一个核间通信过程,并将处理结果或错误状态等信息返回至通用处理器,高性能处理器拷贝任务处理后的返回数据到共享数据缓存内部,从而通用处理器获取处理结果,高性能处理器生成通信控制消息并将其输入至数据缓存中,该消息包含返回数据的地址和大小;
d、高性能处理器通过轮询机制告知通用处理器其任务已经处理完成,通用处理器读取通信控制消息;
e、通用处理器根据控制消息获得处理结果;
其中,通用处理器与高性能处理器之间交互的通信数据块的大小直接影响核间通信过程中步骤a、c以及e的耗时,其中,通信数据块越大,传送所需时间越多,而其时间在整个通信过程中的占比越大,从而削弱其他各阶段的通信耗时,分化机制是分多个核间通信过程分别处理这些数据,从而处理数据块,其增加核间通信次数和核间通信过程中控制交互过程中的耗时,从而增加核间通信的时间开销;合并机制是合并多个通信数据和高性能处理器通信请求,从而通过一次核间通信过程传递数据块;
S3、异构多核处理器模型评估并行应用通信数据的数据块大小,根据预设的数据块大小阈值,选择应用于异构多核处理器模型上数据传输类型,即选择分化机制或者合并机制;
S4、确定完成数据传输类型选择后异构多核处理器模型根据用处理器与高性能处理器之间传递的数据大小以及异构多核处理器的成本高低,选择通信缓存类型,即选择片外数据存储器或者片内缓存;
其中,通信缓存类型包括片外数据存储器以及片内缓存,片内缓存是通用处理器与高性能处理器中的片内缓存共享,以实现数据缓存共享,片内缓存比片外数据存储器小,且成本价格更高;
S5、确定完成数据传输类型以及通信缓存类型选择后,异构多核处理器模型提取并分阶段运行并行应用通信数据的第一个并发任务,得出其处理时间并记录于预设的轮询时间间隔表内,作为初始轮询时间间隔作用于剩余并发任务上,同时在异构多核处理器模型上运行剩余并发任务,根据后续剩余并发任务处理时间递增或递减初始轮训时间间隔并记录;
其中,轮询机制主要通过不断检查标志位来判断是否有未处理的通信请求,当有通信请求时,异构多核处理器模型设置或重置共享内存中某个标志位,包括以下步骤:通用处理器将通信数据和控制消息写入共享缓存后,在共享缓存内部的一个特殊地址处设置一个标志位,特殊地址指将共享缓存分块存储,预先设置一块为特殊地址;高性能处理器读取该地址的标志位,并判断是否有未处理的通信请求;若该标志位已被设置,高性能处理器就读取共享通信缓存中的通信控制消息和缓存数据;若标志位未被设置,则一段时间后高性能处理器再次检查该标志位;
S6、根据轮询时间间隔表中记录的所有轮询时间间隔,计算得出其平均时间作为最佳轮询时间间隔,重新运行异构多核处理器模型采用最佳轮询时间间隔完成并行应用通信数据的通信过程;
S7、统合异构多核处理器模型在各阶段核间通信耗时,直观得出各通信性能影响因子对各阶段耗时的影响,从而得出该通信性能影响因子对异构多核处理器模型的性能影响。
在本实施例中,设并行应用通信数据中有x个并发任务,其周期性地出发异构核间通信过程,记为Ti,记第i各任务出发通信过程的时间间隔为pi,其中i=1,2,...,x。对于Ti,通用处理器传送di 2字节的通信数据作为处理结果,记mi代表共享通信缓存类型,mi=0表示片内通信缓存,mi=1表示片外数据存储器,记v1和v2分别表示片内和片外通信缓存访问速率,记ni代表Ti消息通知机制,ni=1表示使用中断机制,ni=0表示使用轮询机制且轮询时间间隔为pti;ci表示Ti占用的时间,其通过式(1)来衡量:
其中te表示执行一个通信请求的耗时,它包括从初始化到完成通信请求任务的耗时;t1表示使用中断机制进行消息通知的耗时,t2表示使用轮询机制检查消息状态的耗时,与/>均表示处理器传送的字节大小。
其一:内存约束,本发明假设通用处理器和高性能处理器使用同一块通信缓存来存储任务完成前后的数据,使用中断机制时,Ti在任务处理过程中需要的缓存大小为使用轮询机制时,假设共享通信缓存被周期性地分配、释放并返还,其需要的最大缓存为/>所有通信过程使用的总缓存大小不能超过通信缓存总量,记为X,因此,异构多核处理器模型在任何状态下都必须满足式(2)的内存约束:
其二:时间约束,通常Ti有一定的时间限制,若Ti使用中断机制,则记其最大耗时为如式(3)所示,其中,td指高性能处理器处理通信请求的耗时。
式中,ti表示指异构核间通信过程耗时,若Ti使用轮询机制,则记其最大耗时为如式(4)所示。
记Ti的时间约束为Yi,则异构多核处理器模型在任何时候都需要满足式(5)的时间约束:
其三:性能目标,异构多核处理器模型的性能目标定义了通信性能优化的方向,如式(6)所示。
式(2)、式(5)以及式(6)共同构成了通信策略优化模型,为了达到异构多核处理器模型的性能目标,可以在不违背系统性能约束的前提下动态的调整x各周期性核间通信过程采取的通信策略。
其四:通信策略集,通讯策略集是包含可使用通信策略的集合,它定义了通信策略调整的范围,假设Ti在通信粒度实现方便有Ti g个可选方案,且对Ti都可采用中断机制或轮询机制,也都能使用片内或片外通信缓存,因此,异构多核处理器模型可采用的组合通信策略总共有种,当环境参数改变时,异构多核处理器模型能够基于内存和时间约束来评价各个通信过程采取的通信策略的优劣,进而从通信策略集中选取其他策略进行调整。
实施例2:如图3所示,面向并行应用核间通信竞争的通信性能预测装置,包括模拟平台,以及与其建立控制连接的获取模块、评估模块、分配模块以及统合模块;
获取模块:用于获取待预测的异构多核处理器针对性应用领域,以及该异构多核处理器的组成结构,包括通用处理器、高性能处理器以及片外数据存储器的数量,并发送至预测平台;
模拟平台:根据所获取的异构处理器结构,输入至预测平台内部并建立异构多核处理器模型,预测平台根据该异构多核处理器应用领域向异构多核处理器模型内部输入针对该应用领域所运行的并行应用通信数据,预测平台用于模拟预测异构多核处理器模型的通信性能,其中将模拟过程分为五个阶段;
评估模块:用于根据模拟平台提供的并行通信数据,评估其数据块大小,设置数据块大小阈值,确定选择分化机制或者合并机制;分化机制通过多个核间通信过程分别传送通信数据,合并机制通过进行一次核间通信过程传送通信数据;同时评估模块用于根据通用处理器与高性能处理器之间传递的数据大小以及异构多核处理器的成本高低,选择片外数据存储器或者片内缓存;
其中,预设的数据块大小阈值为32M,即当数据块小于32M时选择分化机制,若数据块大于32M时选择合并机制;
监控分配模块:异构多核处理器模型采用轮询机制作为通用处理器与高性能处理器的消息传输机制,分配模块内建立轮询时间间隔表,监控分配模块监控第一个并发任务的处理时间并记录,作为初始轮询时间间隔,并将初始轮询时间间隔应用至模拟平台,根据后续剩余并发任务处理时间递增或递减初始轮训时间间隔并记录;
统合模块:用于统计模拟平台中异构多核处理器模型在各阶段中通信数据传递耗时,根据各阶段并行应用通信数据的处理时间耗时来具体预测该异构多核处理器的性能结果。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.面向并行应用核间通信竞争的通信性能预测方法,其特征在于,包括以下步骤:
S1、从待预测的异构多核处理器出发,获取该异构多核处理器针对性应用领域,以及该异构多核处理器的组成结构,其中包括通用处理器、高性能处理器以及片外数据存储器的数量;
S2、构建异构多核处理器模型,获取步骤S1中得到的该异构多核处理器的组成结构,并输入异构多核处理器模型内部,同时根据该异构多核处理器的针对性应用领域获取针对该应用领域所运行的并行应用通信数据;
S3、异构多核处理器模型评估并行应用通信数据的数据块大小,根据预设的数据块大小阈值,选择应用于异构多核处理器模型上数据传输类型,即选择分化机制或者合并机制;
S4、确定完成数据传输类型选择后异构多核处理器模型根据用处理器与高性能处理器之间传递的数据大小以及异构多核处理器的成本高低,选择通信缓存类型,即选择片外数据存储器或者片内缓存;
S5、确定完成数据传输类型以及通信缓存类型选择后,异构多核处理器模型提取并分阶段运行并行应用通信数据的第一个并发任务,得出其处理时间并记录于预设的轮询时间间隔表内,作为初始轮询时间间隔作用于剩余并发任务上,同时在异构多核处理器模型上运行剩余并发任务,根据后续剩余并发任务处理时间递增或递减初始轮训时间间隔并记录;
S6、根据轮询时间间隔表中记录的所有轮询时间间隔,计算得出其平均时间作为最佳轮询时间间隔,重新运行异构多核处理器模型采用最佳轮询时间间隔完成并行应用通信数据的通信过程;
S7、统合异构多核处理器模型在各阶段核间通信耗时,直观得出各通信性能影响因子对各阶段耗时的影响,从而得出该通信性能影响因子对异构多核处理器模型的性能影响。
2.根据权利要求1所述的面向并行应用核间通信竞争的通信性能预测方法,其特征在于,在步骤S1中,所述通用处理器以及高性能处理器作为异构多核处理器的处理计算单元,其中通用处理器为主处理核心,高性能处理器为作为协助处理器辅助通用处理器完成任务处理,所述片外数据存储器为异构多核处理器外接共享数据缓存。
3.根据权利要求1或2所述的面向并行应用核间通信竞争的通信性能预测方法,其特征在于,所述异构多核处理器模型分五个阶段完成并行应用通信数据的通信过程,包括以下步骤:
a、通用处理器拷贝并行应用通信数据至通用处理器与高性能处理器共享的数据缓存内部;
b、通用处理器生成通信控制消息并写入数据缓存,通用处理器使用轮询机制来请求高性能处理器进行通信;
c、高性能处理器接收到通信请求后从消息列表中读取控制消息,高性能处理器根据控制消息读取通信数据,并开始执行任务请求,高性能处理器处理完任务后,就会开始另一个核间通信过程,并将处理结果或错误状态的信息返回至通用处理器,高性能处理器拷贝任务处理后的返回数据到共享数据缓存内部,从而通用处理器获取处理结果,高性能处理器生成通信控制消息并将其输入至数据缓存中,该消息包含返回数据的地址和大小;
d、高性能处理器通过轮询机制告知通用处理器其任务已经处理完成,通用处理器读取通信控制消息;
e、通用处理器根据控制消息获得处理结果。
4.根据权利要求3所述的面向并行应用核间通信竞争的通信性能预测方法,其特征在于,所述步骤b中提到的通信控制消息包括通信数据的地址、数据大小和被调用的高性能处理器功能,通信控制消息录入于预设列表中,以允许通用处理器持续对高性能处理器发出新请求,同时高性能处理器有序执行高性能处理请求。
5.根据权利要求1或2所述的面向并行应用核间通信竞争的通信性能预测方法,其特征在于,所述通用处理器与高性能处理器之间交互的通信数据块的大小直接影响核间通信过程中步骤a、c以及e的耗时,所述分化机制是分多个核间通信过程分别处理这些数据,从而处理数据块,其增加核间通信次数和核间通信过程中控制交互过程中的耗时,从而增加核间通信的时间开销;所述合并机制是合并多个通信数据和高性能处理器通信请求,从而通过一次核间通信过程传递数据块。
6.根据权利要求5所述的面向并行应用核间通信竞争的通信性能预测方法,其特征在于,所述通信缓存类型包括片外数据存储器以及片内缓存,所述片内缓存是通用处理器与高性能处理器中的片内缓存共享,以实现数据缓存共享。
7.根据权利要求1或2所述的面向并行应用核间通信竞争的通信性能预测方法,其特征在于,所述轮询机制主要通过不断检查标志位来判断是否有未处理的通信请求,当有通信请求时,异构多核处理器模型设置或重置共享内存中某个标志位,即:通用处理器将通信数据和控制消息写入共享缓存后,在共享缓存内部的一个特殊地址处设置一个标志位,特殊地址指将共享缓存分块存储,预先设置一块为特殊地址;高性能处理器读取该地址的标志位,并判断是否有未处理的通信请求;若该标志位已被设置,高性能处理器就读取共享通信缓存中的通信控制消息和缓存数据;若标志位未被设置,则一段时间后高性能处理器再次检查该标志位。
8.面向并行应用核间通信竞争的通信性能预测装置,其特征在于,包括模拟平台以及与其建立控制连接的获取模块、评估模块、分配模块以及统合模块;
获取模块:用于获取待预测的异构多核处理器针对性应用领域,以及该异构多核处理器的组成结构,包括通用处理器、高性能处理器以及片外数据存储器的数量,并发送至预测平台;
模拟平台:根据所获取的异构处理器结构,输入至预测平台内部并建立异构多核处理器模型,预测平台根据该异构多核处理器应用领域向异构多核处理器模型内部输入针对该应用领域所运行的并行应用通信数据,所述预测平台用于模拟预测异构多核处理器模型的通信性能;
评估模块:用于根据模拟平台提供的并行通信数据,评估其数据块大小,设置数据块大小阈值,确定选择分化机制或者合并机制;所述分化机制通过多个核间通信过程分别传送通信数据,所述合并机制通过进行一次核间通信过程传送通信数据;同时所述评估模块用于根据通用处理器与高性能处理器之间传递的数据大小以及异构多核处理器的成本高低,选择片外数据存储器或者片内缓存;
监控分配模块:所述异构多核处理器模型采用轮询机制作为通用处理器与高性能处理器的消息传输机制,所述分配模块内建立轮询时间间隔表,所述监控分配模块监控第一个并发任务的处理时间并记录,作为初始轮询时间间隔,并将初始轮询时间间隔应用至模拟平台,根据后续剩余并发任务处理时间递增或递减初始轮训时间间隔并记录;
统合模块:用于统计模拟平台中异构多核处理器模型在各阶段中通信数据传递耗时,根据各阶段并行应用通信数据的处理时间耗时来具体预测该异构多核处理器的性能结果。
9.根据权利要求8所述的面向并行应用核间通信竞争的通信性能预测装置,其特征在于,所述评估模块中所提到的预设数据块大小阈值为32M,即当数据块小于32M时选择分化机制,若数据块大于32M时选择合并机制。
CN202310471570.8A 2023-04-27 2023-04-27 面向并行应用核间通信竞争的通信性能预测方法及装置 Pending CN116501589A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310471570.8A CN116501589A (zh) 2023-04-27 2023-04-27 面向并行应用核间通信竞争的通信性能预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310471570.8A CN116501589A (zh) 2023-04-27 2023-04-27 面向并行应用核间通信竞争的通信性能预测方法及装置

Publications (1)

Publication Number Publication Date
CN116501589A true CN116501589A (zh) 2023-07-28

Family

ID=87329809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310471570.8A Pending CN116501589A (zh) 2023-04-27 2023-04-27 面向并行应用核间通信竞争的通信性能预测方法及装置

Country Status (1)

Country Link
CN (1) CN116501589A (zh)

Similar Documents

Publication Publication Date Title
US7895260B2 (en) Processing data access requests among a plurality of compute nodes
CN101459600B (zh) 用于跟踪网络争用的方法和设备
CN109542830B (zh) 一种数据处理系统及数据处理方法
CN111190735B (zh) 一种基于Linux的片上CPU/GPU流水化计算方法及计算机系统
US20120297216A1 (en) Dynamically selecting active polling or timed waits
WO2011128369A1 (en) Querying performance data on a parallel computer system having compute nodes
JP2023511327A (ja) モデル訓練方法および装置
US20090313636A1 (en) Executing An Application On A Parallel Computer
CN111597048B (zh) 基于服务质量的微服务调度方法、系统及电子设备
EP3379421B1 (en) Method, apparatus, and chip for implementing mutually-exclusive operation of multiple threads
CN116360972A (zh) 资源管理方法、装置及资源管理平台
WO2020163327A1 (en) System-based ai processing interface framework
CN111475213A (zh) 多核结构固态硬盘的功耗降低方法、装置和计算机设备
CN105426163A (zh) 一种基于mic协处理器的单数据流分位数处理方法
CN112306628B (zh) 一种基于多核服务器的虚拟网络功能资源管理系统
WO2021115082A1 (zh) 作业调度方法以及作业调度装置
CN117349026A (zh) 一种用于aigc模型训练的分布式算力调度系统
CN111858656A (zh) 一种基于分布式架构的静态数据的查询方法和设备
CN116501589A (zh) 面向并行应用核间通信竞争的通信性能预测方法及装置
US20210004658A1 (en) System and method for provisioning of artificial intelligence accelerator (aia) resources
CN109117247A (zh) 一种基于异构多核拓扑感知的虚拟资源管理系统及方法
CN115576661A (zh) 数据处理系统、方法和控制器
JPH08212178A (ja) 並列計算機
CN113568728A (zh) 一种作业调度方法、装置、设备及介质
US8601238B2 (en) Arithmetic processing apparatus, arithmetic processing system, and arithmetic processing method which utilize limitation information to perform enhanced arithmetic processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination