CN111858070B - 计算资源配置方法、装置、设备以及存储介质 - Google Patents

计算资源配置方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN111858070B
CN111858070B CN202010780661.6A CN202010780661A CN111858070B CN 111858070 B CN111858070 B CN 111858070B CN 202010780661 A CN202010780661 A CN 202010780661A CN 111858070 B CN111858070 B CN 111858070B
Authority
CN
China
Prior art keywords
workload
computing resources
level
data
resource allocation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010780661.6A
Other languages
English (en)
Other versions
CN111858070A (zh
Inventor
王虎君
王卓
王海华
张筱松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010780661.6A priority Critical patent/CN111858070B/zh
Publication of CN111858070A publication Critical patent/CN111858070A/zh
Application granted granted Critical
Publication of CN111858070B publication Critical patent/CN111858070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及云计算技术领域,本发明的实施例提出一种计算资源配置方法,包括:获取工作负载的运行数据,根据所述工作负载的运行数据对所述工作负载分类;对经分类的工作负载配置计算资源;其中,所述工作负载为计算机系统上并行运行的多个工作负载,所述工作负载的运行数据包括CPU指令级别的硬件指标数据。根据本发明实施例的计算资源配置方法,通过对工作负载分类,再根据不同类型的工作负载制定符合各自运行需求的资源调度策略,能够实现对计算资源合理、有效分配,提高工作负载运行效率。本发明的实施例还提供了一种计算资源配置装置、设备以及存储介质。

Description

计算资源配置方法、装置、设备以及存储介质
技术领域
本发明实施例的计算资源配置方法、装置以及存储介质可用于云计算领域的计算机资源配置,也可用于除云计算领域之外的其他领域。
背景技术
随着互联网网络规模不断扩大,互联网所需要处理的业务量也随之快速增长。通常计算机系统为前端的应用提供了一个集中式处理平台,使得在操作系统上可以同时运行多种工作负载,如何对这些工作负载进行管理以提供合理的资源配置是当前面临的问题之一。
在传统的工作负载管理中,根据历史经验对工作负载分类存在精确度低,容易造成资源调度与实际需求不匹配的情况;或者,由于不同类型的工作负载有其各自的运行特点,采用统一的负载管理策略难以使所有的工作负载的运行效果达到最佳,容易出现资源分配不均衡的情况;并且,上述资源配置的过程在系统内部实现,管理员无法直接对资源配置的有效性、及时性等进行评价。
发明内容
本发明的实施例提供了涉及计算资源配置方法、装置以及存储介质,解决相关技术中的计算资源分配不均衡、资源管理可靠性低的问题。
根据本发明的一个方面,提供了一种计算资源配置方法,包括:获取工作负载运行期间的CPU指令级别的硬件指标数据,根据所述CPU指令级别的硬件指标数据对所述工作负载分类;对经分类的工作负载配置计算资源;其中,所述工作负载用于部署应用程序,多个所述工作负载在计算机系统上并行运行。
在一些实施方式中,根据所述CPU指令级别的硬件指标数据对所述工作负载分类的步骤包括:对所述CPU指令级别的硬件指标数据进行解析,获得表征所述CPU指令级别的硬件指标的计数数据;对所述计数数据进行计算,获得一级缓存未命中率和相对嵌套强度;对所述一级缓存未命中率和所述相对嵌套强度进行分析,并根据所述分析结果对所述工作负载分类;其中,所述一级缓存未命中率为CPU对Cache存储器的一级缓存进行数据访问时,未获取到所需数据的概率;所述相对嵌套强度为计算机系统的多核处理器之间发生数据交互访问的亲和度。
在一些实施方式中,所述工作负载的类型包括批量型工作负载和联机型工作负载,其中,所述批量型工作负载用于执行批量操作业务,所述联机型工作负载用于执行联机交易业务。
在一些实施方式中,对经分类的工作负载配置计算资源的步骤包括:根据所述工作负载的运行时间,为所述工作负载配置计算资源;根据所述工作负载的级别,为所述工作负载配置计算资源,其中,所述级别反映所述工作负载使用的重要程度。
在一些实施方式中,根据所述工作负载的运行时间,为所述工作负载配置计算资源的步骤包括:统计所述批量型工作负载和所述联机型工作负载各自运行时间,设置批量时段和联机时段,根据所述批量型工作负载和所述联机型工作负载各自运行时间,在所述批量时段优先为所述批量型工作负载提供计算资源,以及在所述联机时段优先为所述联机型工作负载提供计算资源。
在一些实施方式中,根据所述工作负载的级别,为所述工作负载配置计算资源的步骤包括:对所述工作负载分级,根据所述工作负载具有的级别为所述工作负载配置相应比例的计算资源。
在一些实施方式中,对经分类的工作负载配置计算资源的步骤还包括:当所述工作负载占用的计算资源的比例超过预定范围,对所述工作负载占用的计算资源的比例进行调整,以使所述工作负载占用的计算资源的比例在所述预定范围之内。
在一些实施方式中,计算资源配置方法还包括获取所述工作负载在不同时刻的资源占用比例和所述工作负载上发生的资源配置行为的信息,根据所述信息判断所述计算资源配置是否符合所述计算资源配置需求。
根据本发明的另一个方面,提供了一种计算资源配置装置,包括:数据获取模块,用于获取工作负载运行期间的CPU指令级别的硬件指标数据;工作负载分类模块,用于根据所述CPU指令级别的硬件指标数据对所述工作负载进行分类,其中,所述工作负载用于部署应用程序,多个所述工作负载在计算机系统上并行运行;计算资源配置模块,用于对经分类的工作负载配置计算资源。
根据本发明的另一个方面,提供了一种计算资源配置设备,包括:处理器;存储器,其上存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述实施方式中的计算资源配置方法。
根据本发明的另一个方面,提供了一种计算机可读存储介质,用于存储程序,其中,所述程序被执行时实现上述实施方式中的计算资源配置方法。
根据本发明实施例的计算资源配置方法,通过对工作负载分类,再根据不同类型的工作负载制定符合各自运行需求的资源调度策略,能够实现对计算资源合理、有效分配,提高工作负载运行效率。
附图说明
通过下文中参照附图对本发明所作的描述,本发明的其它目的和优点将显而易见,并可帮助对本发明有全面的理解。
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施方式的计算资源配置方法的流程示意图;
图2示出了根据本发明实施方式的IBM主机系统的框架示意图;
图3示出了根据本发明示例性实施例的计算资源配置过程的示意图;
图4示出了根据本发明实施方式的计算资源配置装置的结构示意图;
图5示出了根据本发明实施方式的计算机系统的结构示意图。
需要说明的是,附图并不一定按比例来绘制,而是仅以不影响读者理解的示意性方式示出。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,均应当属于本发明保护的范围。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
根据本发明实施例的计算资源配置方法,可基于CPU指令级别的硬件指标对工作负载进行分类,以提供准确的负载分类方法;同时,由于各类型工作负载具有各自运行特点,在负载分类的基础上,进行资源按需分配,有利于资源的均衡配置,也有利于各工作负载高效运行。
图1示出了根据本发明实施方式的计算资源配置方法的流程示意图。计算资源配置方法包括:步骤S101,获取工作负载运行期间的CPU指令级别的硬件指标数据,根据所述CPU指令级别的硬件指标数据对所述工作负载分类;其中,所述工作负载用于部署应用程序,多个所述工作负载在计算机系统上并行运行;步骤S102,对经分类的工作负载配置计算资源。
为便于理解,结合本发明应用场景进行说明。本发明实施例的方法、装置可基于IBM主机系统实现。IBM主机为前端的应用提供了一个集中式的处理平台,在主机操作系统上,可以同时运行多种工作负载,并通过工作负载管理组件对这些并行运行的工作负载进行CPU资源调度。工作负载为一种树状逻辑结构,用于组织虚拟服务器和应用程序。根据工作负载的用途等对其分类,以便根据其运行需求进行资源的合理配置。
在一些实施方式中,步骤S101,获取工作负载运行期间的CPU指令级别的硬件指标数据,通常,CPU指令级别的硬件指标数据的初始格式为多个数据集成在一条记录或一个报告中,为获取计算所需的数据,需要对初始格式的硬件指标数据进行解析,获得计算所需的各类计数格式的数据,计数数据可以包括基础计数、扩展计数、问题状态计数等,根据实际需求选择不同的计数。进一步,通过将计数数据按照一定规则计算可获得CPU指令级别的运行指标数据,该运行指标数据可以包括CPU-SPD(CPU主频)、CPI(每个时钟周期内可以执行的指令数)、PRBSTATE(问题状态的时间百分比)、L1MP(一级缓存未命中率)、L2P(二级缓存百分比)、L3P(同一芯片的三级缓存百分比)、L4LP(四级本地缓存百分比)、L4RP(四级远程缓存百分比)、MEMP(内存百分比)、CPU-seconds(CPU使用秒数)、LPARCPU(CPU利用率)和RNI(相对嵌套强度)。
参照表1,提供一种计数数据的计算规则,通过计算获得所需的CPU指令级别的运行指标数据。如表1所示,例如计算L1MP(一级缓存未命中率)时,需要获取B1、B2和B4这三个计数,然后根据计算规则计算得到L1MP的值。而计算RNI(相对嵌套强度)时,则需要通过计算一系列指标L3P、L4LP、L4RP、MEMP再根据计算规则计算得到RNI的值。
进一步,通过对计算所得的L1MP(一级缓存未命中率)和RNI(相对嵌套强度)进行分析,根据分析结果可对负载进行分类。
表1 CPU指令级别的运行指标计算规则
为便于理解,对IBM主机系统的框架进行说明。图2示出了根据本发明实施方式的IBM主机系统的框架示意图。IBM主机采用多核框架结构,若干个CPU集中在一个处理器芯片单元(简称为chip),同一个chip中的CPU可以共享该chip内的多级缓存,反之,如果CPU是跨chip分布的,那么CPU指令和数据需要在多个chip之间通过集成在系统控制模块中的缓存进行交换。
如图2所示,每个处理器芯片单元(chip)可以具有三级缓存(L1-L3cache),当涉及处理器芯片单元之间的数据访问时,可通过控制模块3中的四级缓存(L4cache)实现。L1-L4cache在使用时,例如对于L1cache(一级缓存),当CPU读取数据时,可通过地址总线把物理地址送到L1cache中,与L1cache中的块地址标签进行对比,若相符合,则表示此数据已经存在于L1cache中,此时可称为命中。对于上一级缓存中未命中的数据访问需要在下一级缓存中继续进行。其中,L1cache命中率对于CPU指令的运行效率影响较为明显。
进一步,通过对各级缓存数据按一定规则计算(如表1中的公式),可得到RNI(相对嵌套强度),其用于反映CPU指令在chip之间交互的亲和度。通过对L1MP(一级缓存未命中率)和RNI(相对嵌套强度)综合分析,可得到准确的工作负载分类。
本发明实施例提供一种工作负载分类规则,如表2所示。例如当L1MP(一级缓存未命中率)取值为<3%,RNI(相对嵌套强度)取值为<0.75时,将工作负载划分为偏向第一类;当L1MP(一级缓存未命中率)取值为<3%,RNI(相对嵌套强度)取值为≥0.75时,将工作负载划分为第一类或第二类(此时可结合工作负载的实际应用场景进行再划分)。
表2工作负载分类规则
类似的,还可通过对CPU指令级别的运行指标的其他指标进行综合分析,实现对工作负载分类,可根据实际需要灵活调整,本发明实施例不作限定。
在一些实施方式中,第一类负载可以是批量型工作负载,第二类负载可以是联机型工作负载。批量型工作负载例如可以是用于进行重复性批量操作的一类应用或多类应用;联机型工作负载例如可以是涉及联机交易常用的一类应用或多类应用。通过将工作负载分类,便于根据其运行特点按需分配资源,优化资源分配策略,同时有利于使多负载同时高效运行。
在一些实施方式中,步骤S102,对经分类的工作负载配置计算资源的步骤包括:根据工作负载的运行时间,为工作负载配置计算资源。基于批量型工作负载和联机型工作负载通常具有各自运行时间区域,例如,白天通常涉及更多的交易业务,因而对联机型工作负载的使用需求可能较大,而夜晚更适合系统进行业务的自动批量处理,因而对批量型工作负载的使用需求可能较大。可将全天划分为多个时段,例如划分批量时段和联机时段,通过统计批量型工作负载和联机型工作负载在各时段的使用情况,提供相匹配的资源调度策略。例如在批量时段优先为批量型工作负载提供计算资源,以及在联机时段优先为联机型工作负载提供计算资源。
在一些实施方式中,步骤S102,对经分类的工作负载配置计算资源的步骤包括:根据工作负载的级别,为工作负载配置计算资源。在一些实施方式中,可根据工作负载的使用的优先程度,对工作负载分级,例如分为一级、二级、三级;一级表示工作负载具有较高的使用优先级,对此类工作负载可配置比例较大的CPU资源,三级表示工作负载具有较低的使用优先级,对此类工作负载可配置比例较小的CPU资源。或者还可以对业务处理中经常使用的工作负载,在CPU资源相对紧张的情况下,为其优先配置CPU资源,以保证其高速运行。
在一些实施方式中,步骤S102,对经分类的工作负载配置计算资源包括:当工作负载占用的计算资源的比例超过预定范围,对工作负载占用的计算资源的比例进行调整,以使工作负载占用的计算资源的比例在预定范围之内。对于一些优先级别较低的工作负载,可能出现占用过多CPU资源的情况,造成资源紧张导致优先级别较高的工作负载难以高效运行,此时可对资源进行重新分配调整,避免资源分配不均衡或使用不合理。
在一些实施方式中,计算资源配置方法还包括对计算资源配置的效果进行评价。通过对资源调度的时机、资源分配情况等进行评估,便于对资源调度策略的合理性、有效性、可靠性等进行分析,以便及时调整资源调度策略,提高资源管理效果。
在一些实施方式中,可通过获取工作负载在不同时刻的资源占用比例和工作负载上发生的资源配置行为的信息,根据信息判断计算资源配置是否符合实际需求。例如,通过比较工作负载在不同时刻使用资源的比例,关注不同时刻使用资源的比例的变化,了解资源配置发生的时机、配置的策略是否及时、有效(是否因为资源配置不及时或资源配置不均衡等影响工作负载正常运行或对其运行速率造成影响)。或者,可通过获取一些应用程序的运行速率数据,若这些应用程序的运行速率总是能够达到设定标准,表明资源配置策略能够满足实际需求,并且提供了可靠、稳定的资源配置方法。
为便于理解,以下通过实施例对本发明的计算资源配置流程进行说明。图3示出了根据本发明示例性实施例的计算资源配置过程的示意图。
首先获取IBM主机SMF113数据(该类数据包括硬件指标等数据),其包括CPU指令级别的硬件指标数据;然后对数据解析,获取计算所需的各类计数数据,将计数数据按照一定规则计算可获得CPU指令级别的运行指标,该运行指标包括L1MP(一级缓存未命中率)和RNI(相对嵌套强度)。进一步对L1MP(一级缓存未命中率)和RNI(相对嵌套强度)综合分析,以便得到准确的工作负载分类。
在一些实施例中,通过将L1MP(一级缓存未命中率)和RNI(相对嵌套强度)的值关联,提供工作负载分类规则,例如前述表2所示。工作负载的类型可以包括批量型工作负载和联机型工作负载,当然还可以根据工作负载的其他用途、使用场景等对其分类。
根据批量型工作负载和联机型工作负载的使用场景,提供合理的资源调度策略。例如提供资源的分时管理策略,将全天划分为多个时段,例如划分批量时段和联机时段,通过统计批量型工作负载和联机型工作负载在各时段的使用情况,提供相匹配的资源调度策略。例如在批量时段优先为批量型工作负载提供计算资源,以及在联机时段优先为联机型工作负载提供计算资源。
在一些实施例中,还可以提供分级管理策略。根据工作负载的重要程度,设置优先级,优先级较高的负载例如可配置比例较大的CPU资源,优先级较低的负载例如可配置比例较小的CPU资源。或者对于业务处理中经常使用的负载,为其优先配置CPU资源,以保证负载的高速运行。
在一些实施例中,还可以提供资源帽管理策略。例如对各工作负载设置资源使用范围(即资源帽),要求工作负载在其设定的合理范围内占用资源,当出现一些优先级别较低的工作负载占用过多CPU资源的情况,造成资源紧张导致优先级别较高的工作负载难以高效运行时,此时可调整占用过多CPU资源的工作负载的资源占用率,或者对各负载的资源占用进行重新分配调整,实现资源的合理分配。
在一些实施例中,还可以对上述资源配置效果进行跟踪。通过获取IBM主机SMF99数据(该类数据包括资源管理决策中用到的数据),对该数据解析,以获取各工作负载发生资源调度的时间、具体调度操作等信息,利用该信息对资源调度的有效性、及时性等进行评价,例如当资源调度策略不能满足实际需求时,可根据历史资源调度记录进行分析,总结经验,以便灵活调整资源配置策略,实现资源管理有效、稳定。
根据本发明的实施例,还提供一种计算资源配置装置,如图4所示,计算资源配置装置200包括:数据获取模块20,用于获取工作负载运行期间的CPU指令级别的硬件指标数据;工作负载分类模块21,用于根据所述CPU指令级别的硬件指标数据对所述工作负载进行分类,其中,所述工作负载用于部署应用程序,多个所述工作负载在计算机系统上并行运行;计算资源配置模块22,用于对经分类的工作负载配置计算资源。
对于计算资源配置装置各模块的功能,其可用于实现前述计算资源配置方法中提及的效果,对于具有相同功能或效果的描述,请参考前述实施方式,在此不再赘述。
根据本发明的实施例,还提供一种计算资源配置设备,包括:处理器;存储器,其上存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述实施方式中的计算资源配置方法。
根据本发明的实施例,还提供一种计算机可读存储介质,用于存储程序,其中,所述程序被执行时实现上述实施方式中的计算资源配置方法。
本发明实施例还提供一种计算机系统的结构示意图,图5示意性示出了根据本发明实施例的适于实现上文描述的方法的计算机系统的方框图。图5示出的计算机系统仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,根据本发明实施例的计算机系统300包括处理器30,其可以根据存储在只读存储器(ROM)31中的程序或者从存储部分37加载到随机访问存储器(RAM)32中的程序而执行各种适当的动作和处理。处理器30例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器30还可以包括用于缓存用途的板载存储器。处理器30可以包括用于执行根据本发明实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 32中,存储有系统300操作所需的各种程序和数据。处理器30、ROM 31以及RAM 32通过总线33彼此相连。处理器30通过执行ROM 31和/或RAM 32中的程序来执行根据本发明实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 31和RAM32以外的一个或多个存储器中。处理器30也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本发明实施例的方法流程的各种操作。
根据本发明的实施例,系统300还可以包括输入/输出(I/O)接口34,输入/输出(I/O)接口34也连接至总线33。系统300还可以包括连接至I/O接口34的以下部件中的一项或多项:包括键盘、鼠标等的输入部分35;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分36;包括硬盘等的存储部分37;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分38。通信部分38经由诸如因特网的网络执行通信处理。驱动器39也根据需要连接至I/O接口34。可拆卸介质310,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器39上,以便于从其上读出的计算机程序根据需要被安装入存储部分37。
对于本发明的实施例,还需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合以得到新的实施例。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种计算资源配置方法,包括:
获取工作负载运行期间的CPU指令级别的硬件指标数据,根据所述CPU指令级别的硬件指标数据对所述工作负载分类;
对经分类的工作负载配置计算资源,包括:
根据所述工作负载的运行时间,为所述工作负载配置计算资源;
根据所述工作负载的级别,为所述工作负载配置计算资源,其中,所述级别反映所述工作负载使用的重要程度;
所述工作负载用于部署应用程序,多个所述工作负载在计算机系统上并行运行。
2.根据权利要求1所述的方法,其中,根据所述CPU指令级别的硬件指标数据对所述工作负载分类的步骤包括:
对所述CPU指令级别的硬件指标数据进行解析,获得表征所述CPU指令级别的硬件指标的计数数据;
对所述计数数据进行计算,获得一级缓存未命中率和相对嵌套强度;
对所述一级缓存未命中率和所述相对嵌套强度进行分析,并根据分析结果对所述工作负载分类;
其中,所述一级缓存未命中率为CPU对Cache存储器的一级缓存进行数据访问时,未获取到所需数据的概率;所述相对嵌套强度为计算机系统的多核处理器之间发生数据交互访问的亲和度。
3.根据权利要求2所述的方法,其中,
所述工作负载的类型包括批量型工作负载和联机型工作负载,其中,所述批量型工作负载用于执行批量操作业务,所述联机型工作负载用于执行联机交易业务。
4.根据权利要求3所述的方法,其中,根据所述工作负载的运行时间,为所述工作负载配置计算资源的步骤包括:
统计所述批量型工作负载和所述联机型工作负载各自运行时间,设置批量时段和联机时段,根据所述批量型工作负载和所述联机型工作负载各自运行时间,在所述批量时段优先为所述批量型工作负载提供计算资源,以及在所述联机时段优先为所述联机型工作负载提供计算资源。
5.根据权利要求1所述的方法,其中,根据所述工作负载的级别,为所述工作负载配置计算资源的步骤包括:
对所述工作负载分级,根据所述工作负载具有的级别为所述工作负载配置相应比例的计算资源。
6.根据权利要求5所述的方法,其中,对经分类的工作负载配置计算资源的步骤还包括:
当所述工作负载占用的计算资源的比例超过预定范围,对所述工作负载占用的计算资源的比例进行调整,以使所述工作负载占用的计算资源的比例在所述预定范围之内。
7.根据权利要求1-6中任一项所述的方法,还包括:
获取所述工作负载在不同时刻的资源占用比例和所述工作负载上发生的资源配置行为的信息,根据所述信息判断所述计算资源配置是否符合所述计算资源配置需求。
8.一种计算资源配置装置,包括:
数据获取模块,用于获取工作负载运行期间的CPU指令级别的硬件指标数据;
工作负载分类模块,用于根据所述CPU指令级别的硬件指标数据对所述工作负载进行分类,其中,所述工作负载用于部署应用程序,多个所述工作负载在计算机系统上并行运行;
计算资源配置模块,用于对经分类的工作负载配置计算资源,其中,对经分类的工作负载配置计算资源的步骤包括:
根据所述工作负载的运行时间,为所述工作负载配置计算资源;
根据所述工作负载的级别,为所述工作负载配置计算资源,其中,所述级别反映所述工作负载使用的重要程度。
9.一种计算资源配置设备,包括:
处理器;
存储器,其上存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7中任一项所述的计算资源配置方法。
10.一种计算机可读存储介质,用于存储程序,其中,所述程序被执行时实现权利要求1-7中任一项所述的计算资源配置方法。
CN202010780661.6A 2020-08-05 2020-08-05 计算资源配置方法、装置、设备以及存储介质 Active CN111858070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010780661.6A CN111858070B (zh) 2020-08-05 2020-08-05 计算资源配置方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010780661.6A CN111858070B (zh) 2020-08-05 2020-08-05 计算资源配置方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN111858070A CN111858070A (zh) 2020-10-30
CN111858070B true CN111858070B (zh) 2023-12-01

Family

ID=72972205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010780661.6A Active CN111858070B (zh) 2020-08-05 2020-08-05 计算资源配置方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN111858070B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114143322B (zh) * 2021-11-25 2024-02-27 中电信数智科技有限公司 一种混合云场景中计算资源的配置行动评估方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021441A (zh) * 2016-11-03 2018-05-11 中国移动通信集团广东有限公司 一种基于云计算的虚拟机资源配置方法及装置
CN110515739A (zh) * 2019-10-23 2019-11-29 上海燧原智能科技有限公司 深度学习神经网络模型负载计算方法、装置、设备及介质
CN110795221A (zh) * 2019-04-19 2020-02-14 成都海光集成电路设计有限公司 缓存管理方法、缓存控制器及处理器、存储介质
CN110888732A (zh) * 2018-09-10 2020-03-17 中国移动通信集团黑龙江有限公司 一种资源配置方法、设备、装置和计算机可读存储介质
CN110908795A (zh) * 2019-11-04 2020-03-24 深圳先进技术研究院 云计算集群混部作业调度方法、装置、服务器及存储装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021441A (zh) * 2016-11-03 2018-05-11 中国移动通信集团广东有限公司 一种基于云计算的虚拟机资源配置方法及装置
CN110888732A (zh) * 2018-09-10 2020-03-17 中国移动通信集团黑龙江有限公司 一种资源配置方法、设备、装置和计算机可读存储介质
CN110795221A (zh) * 2019-04-19 2020-02-14 成都海光集成电路设计有限公司 缓存管理方法、缓存控制器及处理器、存储介质
CN110515739A (zh) * 2019-10-23 2019-11-29 上海燧原智能科技有限公司 深度学习神经网络模型负载计算方法、装置、设备及介质
CN110908795A (zh) * 2019-11-04 2020-03-24 深圳先进技术研究院 云计算集群混部作业调度方法、装置、服务器及存储装置

Also Published As

Publication number Publication date
CN111858070A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN110727512B (zh) 集群资源调度方法、装置、设备及储存介质
US10558498B2 (en) Method for scheduling data flow task and apparatus
US8869160B2 (en) Goal oriented performance management of workload utilizing accelerators
US9311376B2 (en) Performance service level agreements in multi-tenant database systems
US8631410B2 (en) Scheduling jobs in a cluster having multiple computing nodes by constructing multiple sub-cluster based on entry and exit rules
US8375228B2 (en) Multiple-node system power utilization management
JP6241300B2 (ja) ジョブスケジューリング装置、ジョブスケジューリング方法、およびジョブスケジューリングプログラム
Di et al. Characterizing and modeling cloud applications/jobs on a Google data center
US20120131593A1 (en) System and method for computing workload metadata generation, analysis, and utilization
US9588813B1 (en) Determining cost of service call
CN107070709B (zh) 一种基于底层numa感知的nfv实现方法
Jiang et al. Characterizing co-located workloads in alibaba cloud datacenters
JP5385912B2 (ja) 算出装置、システム管理装置、算出方法およびプログラム
CN113010576A (zh) 云计算系统容量评估的方法、装置、设备和存储介质
KR20130068685A (ko) 하이브리드 주메모리 시스템 및 이를 위한 태스크 스케줄링 방법
CN102339233A (zh) 云计算集中管理平台
US8819239B2 (en) Distributed resource management systems and methods for resource management thereof
CN111858070B (zh) 计算资源配置方法、装置、设备以及存储介质
Tang et al. Towards economic fairness for big data processing in pay-as-you-go cloud computing
CN110489418B (zh) 一种数据聚合方法和系统
Lin et al. Exploring characteristics of inter-cluster machines and cloud applications on google clusters
US7958510B2 (en) Device, system and method of managing a resource request
CN107194712B (zh) 共享账户变动信息记录方法及装置、内部账户补账方法及系统
CN111324454A (zh) 多核cpu分配方法、装置、电子设备及存储介质
US11941450B2 (en) Automatic placement decisions for running incoming workloads on a datacenter infrastructure

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant