CN116775271A - 一种处理器的调节方法、装置、电子设备和存储介质 - Google Patents
一种处理器的调节方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN116775271A CN116775271A CN202211656884.7A CN202211656884A CN116775271A CN 116775271 A CN116775271 A CN 116775271A CN 202211656884 A CN202211656884 A CN 202211656884A CN 116775271 A CN116775271 A CN 116775271A
- Authority
- CN
- China
- Prior art keywords
- processor
- ccd
- cores
- virtually
- fusing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000001444 catalytic combustion detection Methods 0.000 claims abstract description 199
- 230000004927 fusion Effects 0.000 claims abstract description 91
- 230000005540 biological transmission Effects 0.000 claims abstract description 50
- 238000004590 computer program Methods 0.000 claims description 17
- 230000001105 regulatory effect Effects 0.000 claims description 9
- 230000003750 conditioning effect Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 20
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 101000857682 Homo sapiens Runt-related transcription factor 2 Proteins 0.000 description 1
- 102100025368 Runt-related transcription factor 2 Human genes 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229910021421 monocrystalline silicon Inorganic materials 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012536 packaging technology Methods 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
Abstract
本发明实施例提供了一种处理器的调节方法、装置、电子设备和可读存储介质,所述方法包括:检测所述处理器的运行状态,并根据所述运行状态确定是否对处于同一个CCD的内核进行虚拟融合,或,根据所述运行状态确定是否对处于不同CCD的内核进行虚拟融合;若所述处理器处于第一运行状态,则对处于同一个CCD的内核进行虚拟融合;若所述处理器处于第二运行状态,则对处于不同CCD的内核进行虚拟融合;采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。通过采用上述方法,基于处理器的运行状态可以采用CCD内部多核虚拟融合技术或跨CCD内核虚拟超级融合技术进行内核虚拟融合,使得高速率网卡的传输速率可以达到或尽量接近标称速率。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种处理器的调节方法、一种处理器的调节装置、一种电子设备和一种计算机可读存储介质。
背景技术
现如今伴随着5G网络、云计算和物联网技术的发展,对网卡的网速和带宽有了越来越高的要求。近年来,行业也一直不断地推出新的网卡,以满足不同的以太网需求,如百兆网卡、千兆网卡、万兆网卡、25G网卡以及100G网卡等。数据中心正以前所未有的速度扩展,推动了服务器与交换机之间连接趋于更高带宽的发展。如今,数据中心正从10G向100G升级,其中25G网卡作为连接25G服务器与100G交换机的中间设备已然成为了主流。随着数据中心趋于400G发展,服务器与交换机之间的连接将趋于100G发展,高吞吐、低延迟、低CPU利用率和高消息速率成为对当前网卡的硬性要求,故在网卡本身能实现此要求基础上,还需要充分利用CPU的资源来支持网卡达到当前的性能瓶颈。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种处理器的调节方法和相应的一种处理器的调节装置、一种电子设备,以及一种计算机可读存储介质。
本发明实施例公开了一种处理器的调节方法,其特征在于,所述处理器内包含有CCD,所述CCD内包含有CCX,所述CCX内包含有内核,所述处理器为多核处理器,所述处理器用于为高速率网卡提供数据传输服务,所述方法包括:
检测所述处理器的运行状态,并根据所述运行状态确定是否对处于同一个CCD的内核进行虚拟融合,或,根据所述运行状态确定是否对处于不同CCD的内核进行虚拟融合;
若所述处理器处于第一运行状态,则对处于同一个CCD的内核进行虚拟融合;
若所述处理器处于第二运行状态,则对处于不同CCD的内核进行虚拟融合;
采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。
可选地,所述第一运行状态为低占用状态,所述若所述处理器处于第一运行状态,则对处于同一个CCD的内核进行虚拟融合,包括:
若所述处理器的内核占用率不大于预设的第一占用率阈值,则确定所述处理器处于所述低占用状态;
在所述处理器处于所述低占用状态的情况下,对处于同一个CCD的内核进行虚拟融合。
可选地,所述对处于同一个CCD的内核进行虚拟融合,包括:
从所述处理器所包含的CCD中选出目标CCD;
从所述目标CCD所包含的内核中选出目标内核;
对处于同一个CCD的所述目标内核进行虚拟融合。
可选地,所述对处于同一个CCD的所述目标内核进行虚拟融合,包括:
对处于同一个CCD且处于同一个CCX的所述目标内核进行虚拟融合。
可选地,所述第二运行状态为高占用状态,所述若所述处理器处于第二运行状态,则对处于不同CCD的内核进行虚拟融合,包括:
若所述处理器的内核占用率大于预设的第二占用率阈值,则确定所述处理器处于所述高占用状态;
在所述处理器处于所述高占用状态的情况下,对处于不同CCD的内核进行虚拟融合。
可选地,所述对处于不同CCD的内核进行虚拟融合,包括:
创建CCD调控单元,并通过所述CCD调控单元建立所述处理器中各个CCD之间的连接;
基于建立的连接对处于不同CCD的内核进行虚拟融合。
可选地,所述处理器内还包含有IOD,所述基于建立的连接对处于不同CCD的内核进行虚拟融合之后,还包括:
各个CCD之间的数据传输由原来的经过所述IOD转换为不经过所述IOD。
本发明实施例还公开了一种处理器的调节装置,所述处理器内包含有CCD,所述CCD内包含有CCX,所述CCX内包含有内核,所述处理器为多核处理器,所述处理器用于为高速率网卡提供数据传输服务,所述装置包括:
检测及确定模块,用于检测所述处理器的运行状态,并根据所述运行状态确定是否对处于同一个CCD的内核进行虚拟融合,或,根据所述运行状态确定是否对处于不同CCD的内核进行虚拟融合;
第一虚拟融合模块,用于若所述处理器处于第一运行状态,则对处于同一个CCD的内核进行虚拟融合;
第二虚拟融合模块,用于若所述处理器处于第二运行状态,则对处于不同CCD的内核进行虚拟融合;
第一数据传输模块,用于采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。
可选地,所述第一运行状态为低占用状态,所述第一虚拟融合模块,包括:
第一确定子模块,用于若所述处理器的内核占用率不大于预设的第一占用率阈值,则确定所述处理器处于所述低占用状态;
第一虚拟融合子模块,用于在所述处理器处于所述低占用状态的情况下,对处于同一个CCD的内核进行虚拟融合。
可选地,所述第一虚拟融合子模块,包括:
第一选择单元,用于从所述处理器所包含的CCD中选出目标CCD;
第二选择单元,用于从所述目标CCD所包含的内核中选出目标内核;
第一虚拟融合单元,用于对处于同一个CCD的所述目标内核进行虚拟融合。
可选地,所述第一虚拟融合单元,包括:
虚拟融合子单元,用于对处于同一个CCD且处于同一个CCX的所述目标内核进行虚拟融合。
可选地,所述第二运行状态为高占用状态,所述第二虚拟融合模块,包括:
第二确定子模块,用于若所述处理器的内核占用率大于预设的第二占用率阈值,则确定所述处理器处于所述高占用状态;
第二虚拟融合子模块,用于在所述处理器处于所述高占用状态的情况下,对处于不同CCD的内核进行虚拟融合。
可选地,所述第二虚拟融合子模块,包括:
创建及建立单元,用于创建CCD调控单元,并通过所述CCD调控单元建立所述处理器中各个CCD之间的连接;
第二虚拟融合单元,用于基于建立的连接对处于不同CCD的内核进行虚拟融合。
可选地,所述处理器内还包含有IOD,所述装置还包括:
第二数据传输模块,用于各个CCD之间的数据传输由原来的经过所述IOD转换为不经过所述IOD。
本发明实施例还公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述一种处理器的调节方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述一种处理器的调节方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,处理器内包含有CCD,CCD内包含有CCX,CCX内包含有内核,该处理器为多核处理器,可以检测处理器的运行状态,并根据运行状态决定是否对处于同一个CCD的内核进行虚拟融合,或者,根据运行状态决定是否对处于不同CCD的内核进行虚拟融合,可以采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。通过采用上述方法,当需要为高速率网卡提供数据传输服务时,基于处理器的运行状态可以采用CCD内部多核虚拟融合技术或跨CCD内核虚拟超级融合技术进行内核虚拟融合,虚拟融合之后的各个内核共同提供内核资源为网卡提供数据传输服务,从根本上突破高速率网卡性能瓶颈问题,使得高速率网卡的传输速率可以达到或尽量接近标称速率。
附图说明
图1是本发明实施例的一种处理器的结构示意图;
图2是本发明实施例提供的一种处理器的调节方法的步骤流程图;
图3是本发明实施例提供的另一种处理器的调节方法的步骤流程图;
图4是本发明实施例的一种虚拟融合过程示意图;
图5是本发明实施例的另一种虚拟融合过程示意图;
图6是本发明实施例提供的一种处理器的调节装置的结构框图;
图7是本发明实施例提供的一种电子设备的结构框图;
图8是本发明实施例提供的一种计算机可读存储介质的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其它实施例,都属于本发明保护的范围。
中央处理器(central processing unit,简称CPU)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。
CPU由若干CCD(Core Chiplet Die,核心复合晶片)与一个IOD(IO-Die,I/O控制晶片)构成,而CCD最核心的部分就是CCXs,CCXs内部由多个物理核心与超大的L3缓存构成,CCXs与其外部的IF(Infinity Fabric)总线、SMU、测试模块合起来统称为CCD;IOD部分主要就包含IF总线、内存控制器、IO控制器等等。多个CCD和IOD封装在同一个基板上,这样组成了一个完整的处理器。参照图1所示,为本发明实施例的一种处理器的结构示意图。该处理器中包含有四个CCD和一个IOD,每个CCD中包含有两个CCXs。
CCD:CCD是Core Chiplet Die的缩写。CCD的主要作用是计算核心,CCD中包含多个CCXs,例如Rome 7452CPU,一个CCD里面包含有两个CCX,每个CCX有四个内核,故每个CCD为8核16线程构造。
CCX:CCX是CPU Complex的缩写。它是CPU最基本的组成单元,内有多个核心,且每个核心有独立的L1与L2缓存,且多个核心是可以单独关闭的,并可共享L3缓存。
IO-Die:IOD的作用是通信,它承载着CPU的数据输入输出功能,扮演着CCD、内存、IO之间通过Infinity Fabric互连的角色。
它们之间具有如下数量关系:
Part Buildout=(Number of CCDs)x(Number of CCXs)x(Number of Cores perCCX)
例如AMD的Rome 7452CPU,Number of CCDs表示为CCD数量为4;Number of CCXs表示为每个CCD内CCX的数量为2;Number of Cores per CCX表示为每个CCX内核心的数量为4;故Rome 7452CPU包含有4*2*4=32个核心。
通过上述CPU构造及各部件的关系了解到,基于Zen架构的CPU把计算核心CCD和I/O通信核心分开这样的设计原理跟南北桥主板芯片组架构类似,CCD只负责计算,而通信都交给IOD,然后通过MCM(Multi-Chip Module,将多块半导体裸芯片组装在一块布线基板上的一种封装)封装技术把CPU和北桥封装到一块PCB板上。这种设计存在一个问题,两个CCD里的内核之间的数据交换需要经过CCD1→I/O通信核心→CCD2流程,那么必定会导致延迟增大,降低CPU的性能,从而无法给网卡提供更快的速率。
网卡是一块被设计用来允许计算机在计算机网络上进行通讯的计算机硬件。网卡的首要性能指标就是速度,即它所能提供的带宽。
目前已知一种技术方案(CN201610457865.X,一种基于中断绑定的多队列网卡性能调优方法),其实现方式如下:
首先通过脚本命令查看网卡是否支持多队列;然后打开网卡多队列;通过脚本命令查看是否已成功打开网卡多队列,每个网卡队列对应不同中断;进行中断亲和纠正,将同一个队列中的tx与rx中断绑定到一个核上。该一种基于中断绑定的多队列网卡性能调优方法可提高网卡性能测试的准确度,更易发现网卡当前的性能瓶颈,加之该方法简单易操作,可大大提升测试效率,实用性强,易于推广。
但是此方法存在以下不足:
1、此方法对于低于25G速率的网卡调优效果明显,但当网卡是100G甚至更高时,具有更高的吞吐量、更大的CPU占用率等,对网卡速率提升效果甚微。
2、遇到与网卡标称速率差距过大时,调优提升效果不明显。即当100G网卡实际测试速率只能达到标称速率的一半甚至更低时,无法通过该方法调优激活网卡最高速率达到标称速率的90%以上。
3、当同一队列中tx与rx中断绑定到一个核上后,如果该核在系统下有其它进程占用时,还会影响网卡速率,无法达到网卡最高性能瓶颈。
4、服务器中CPU资源进行高性能占用时,会成倍降低网卡速率。
为了解决以上问题,本发明拟提供一种克服上述问题或者至少部分地解决上述问题的一种处理器的调节方法和相应的一种处理器的调节装置、一种电子设备,以及一种计算机可读存储介质。
本发明实施例的核心构思之一在于,处理器内包含有CCD,CCD内包含有CCX,CCX内包含有内核,该处理器为多核处理器,可以检测处理器的运行状态,并根据运行状态决定是否对处于同一个CCD的内核进行虚拟融合,或者,根据运行状态决定是否对处于不同CCD的内核进行虚拟融合,可以采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。通过采用上述方法,当需要为高速率网卡提供数据传输服务时,基于处理器的运行状态可以采用CCD内部多核虚拟融合技术或跨CCD内核虚拟超级融合技术进行内核虚拟融合,虚拟融合之后的各个内核共同提供内核资源为网卡提供数据传输服务,从根本上突破高速率网卡性能瓶颈问题,使得高速率网卡的传输速率可以达到或尽量接近标称速率。
参照图2,示出了本发明实施例提供的一种处理器的调节方法的步骤流程图,处理器内包含有CCD,CCD内包含有CCX,CCX内包含有内核,处理器为多核处理器,处理器用于为高速率网卡提供数据传输服务,具体可以包括如下步骤:
步骤201,检测所述处理器的运行状态,并根据所述运行状态确定是否对处于同一个CCD的内核进行虚拟融合,或,根据所述运行状态确定是否对处于不同CCD的内核进行虚拟融合。
在本发明实施例中,处理器中可以有多个CCD,CCD中可以有一个或多个CCX,CCX中可以有一个或多个内核。内核即核心(Core),是CPU最重要的组成部分。CPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,CPU所有的计算、接受/存储命令、处理数据都由核心执行。
可以检测处理器当前的运行状态,并基于处理器的运行状态确定是否对处于同一个CCD内的内核进行虚拟融合,或者基于处理器的运行状态确定是否对处于不同CCD内的内核进行虚拟融合。
其中,虚拟融合是指各个内核之间的资源虚拟化共享,通过资源充分共享提升利用率,实现动态按需分配内核资源。
步骤202,若所述处理器处于第一运行状态,则对处于同一个CCD的内核进行虚拟融合。
在本发明实施例中,如果处理器处于第一运行状态,则可以对处于同一个CCD内的内核进行虚拟融合。
步骤203,若所述处理器处于第二运行状态,则对处于不同CCD的内核进行虚拟融合。
在本发明实施例中,如果处理器处于第二运行状态,则可以对处于不同CCD内的内核进行虚拟融合。
步骤204,采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。
对内核进行虚拟融合之后,即可以采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。
综上,在本发明实施例中,处理器内包含有CCD,CCD内包含有CCX,CCX内包含有内核,该处理器为多核处理器,可以检测处理器的运行状态,
并根据运行状态决定是否对处于同一个CCD的内核进行虚拟融合,或者,5根据运行状态决定是否对处于不同CCD的内核进行虚拟融合,可以采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。通过采用上述方法,当需要为高速率网卡提供数据传输服务时,基于处理器的运行状态可以采用CCD内部多核虚拟融合技术或跨CCD内核虚拟超级融合技术进行内核虚拟
融合,虚拟融合之后的各个内核共同提供内核资源为网卡提供数据传输服0务,从根本上突破高速率网卡性能瓶颈问题,使得高速率网卡的传输速率可
以达到或尽量接近标称速率。
参照图3,示出了本发明实施例提供的另一种处理器的调节方法的步骤流程图,处理器内包含有CCD,CCD内包含有CCX,CCX内包含有内核,处理器为多核处理器,具体可以包括如下步骤:5步骤301,检测所述处理器的运行状态,并根据所述运行状态确定是否对处于同一个CCD的内核进行虚拟融合,或,根据所述运行状态确定是否对处于不同CCD的内核进行虚拟融合。
在本发明实施例中,可以检测处理器当前的运行状态,并基于处理器的运行状态确定是否对处于同一个CCD内的内核进行虚拟融合,或者基于处0理器的运行状态确定是否对处于不同CCD内的内核进行虚拟融合。
其中,虚拟融合是指各个内核之间的资源虚拟化共享,通过资源充分共享提升利用率,实现动态按需分配内核资源。
在本发明实施例中,第一运行状态为低占用状态,低占用状态描述的是处理器中内核的占用情况,低占用状态表示占用率较低,内核占用率为衡量5处理器中内核占用与空闲状态的一种衡量指标。
步骤302,若所述处理器的内核占用率不大于预设的第一占用率阈值,则确定所述处理器处于所述低占用状态。
如果处理器的内核占用率不大于预设的第一占用率阈值,则可以确定处理器处于低占用状态。
步骤303,在所述处理器处于所述低占用状态的情况下,对处于同一个CCD的内核进行虚拟融合。
在处理器处于低占用状态的情况下,可以对处于同一个CCD内的内核5进行虚拟融合。
在本发明一种可选的实施例中,步骤303中对处于同一个CCD的内核进行虚拟融合,具体可以包括如下子步骤:
子步骤S11,从所述处理器所包含的CCD中选出目标CCD。
子步骤S12,从所述目标CCD所包含的内核中选出目标内核。
0子步骤S13,对处于同一个CCD的所述目标内核进行虚拟融合。
在本发明实施例中,可以是从处理器所包含的CCD中选取处于空闲状态的CCD作为目标CCD;可以是从目标CCD所包含的内核中选取处于空闲状态的内核作为目标内核;可以是对处于同一个CCD内的目标内核进行虚拟融合。
5在本发明一种可选的实施例中,子步骤S13中对处于同一个CCD的所述目标内核进行虚拟融合,具体可以包括如下子步骤:
对处于同一个CCD且处于同一个CCX的所述目标内核进行虚拟融合。
在本发明实施例中,可以是对处于同一个CCD内且处于同一个CCX内的目标内核进行虚拟融合,即对CCX内部的多个内核进行虚拟融合。
0参照图4所示,为本发明实施例的一种虚拟融合过程示意图。在CPU处于空闲状态(例如低占用状态)的情况下,对于高速率网卡在进行数据传输过程中,相较于网卡这种小核心业务,只需要查找出处于空闲状态的CCD,并确定该CCD中的内核占用与空闲状态,根据内核占用与空闲状态进行智
能分配,将CCD内部处于空闲状态的内核进行虚拟融合,将多个小核融合5成一颗大核,形成更宽的数据通道,减少不必要的延迟。在此种情况下,单个CCD即可满足网卡的性能需求,此种方法可以使处理器提供尽量多的内核资源供网卡使用。
在本发明实施例中,第二运行状态为高占用状态,高占用状态描述的是处理器中的内核的占用情况,高占用状态表示占用率较高。
步骤304,若所述处理器的内核占用率大于预设的第二占用率阈值,则确定所述处理器处于所述高占用状态。
如果处理器的内核占用率大于预设的第二占用率阈值,则可以确定处理器处于高占用状态。其中,预设的第二占用率阈值大于预设的第一占用率阈值。
步骤305,在所述处理器处于所述高占用状态的情况下,对处于不同CCD的内核进行虚拟融合。
在处理器处于高占用状态的情况下,可以对处于不同CCD内的内核进行虚拟融合。
在本发明一种可选的实施例中,步骤305中对处于不同CCD的内核进行虚拟融合,具体可以包括如下子步骤:
子步骤S21,创建CCD调控单元,并通过所述CCD调控单元建立所述处理器中各个CCD之间的连接;
子步骤S22,基于建立的连接对处于不同CCD的内核进行虚拟融合。
在本发明实施例中,可以创建CCD调控单元,并通过CCD调控单元建立处理器中各个CCD之间的连接,之后可以基于建立的连接对处于不同CCD内的内核进行虚拟融合。
在本发明一种可选的实施例中,处理器内还包含有IOD,执行子步骤S22之后,具体还可以执行如下步骤:
各个CCD之间的数据传输由原来的经过所述IOD转换为不经过所述IOD。
基于建立的连接对处于不同CCD内的内核进行虚拟融合之后,各个CCD之间的数据传输由原来的经过IOD转换为不经过IOD。
参照图5所示,为本发明实施例的另一种虚拟融合过程示意图。在CPU处于高压状态(例如高占用状态)的情况下,处理器中内核占用率可能达到90%以上,此时可以创建CCD调控单元,假设为CCD-X,CCD-X可以让处理器中所有的CCD之间互相连接,控制所有的CCD合理调用自身内部资源,相当于把处理器中所有小核共同组成一个超级大核,该大核不仅可以满足高压下CPU的使用需求,还可以给高速率网卡预留足够资源进行数据传输。
步骤306,采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。
对内核进行虚拟融合之后,即可以采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。
综上,在本发明实施例中,处理器内包含有CCD,CCD内包含有CCX,CCX内包含有内核,该处理器为多核处理器,可以检测处理器的运行状态,并根据运行状态决定是否对处于同一个CCD的内核进行虚拟融合,或者,根据运行状态决定是否对处于不同CCD的内核进行虚拟融合,可以采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。通过采用上述方法,当需要为高速率网卡提供数据传输服务时,基于处理器的运行状态可以采用CCD内部多核虚拟融合技术或跨CCD内核虚拟超级融合技术进行内核虚拟融合,虚拟融合之后的各个内核共同提供内核资源为网卡提供数据传输服务,从根本上突破高速率网卡性能瓶颈问题,使得高速率网卡的传输速率可以达到或尽量接近标称速率。
本发明采用CCD-X智能调控技术,减少CCD→I/O→CCD之间的通信延迟,并应用核心空闲分配技术,突破高速率网卡性能瓶颈问题,使高速率网卡的传输速率可以稳定维持在标称速率的99%以上。CPU处于高压状态的情况下在保证对其它任务进行处理的同时保证高速率网卡的高速率传输。本发明采用了CCD之间高速互联通信技术,CCX内部多核虚拟融合技术,跨CCD内核虚拟超级融合技术以及智能识别内核占用状态进行资源分配技术。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图6,示出了本发明实施例提供的一种处理器的调节装置的结构框图,所述处理器内包含有CCD,所述CCD内包含有CCX,所述CCX内包含有内核,所述处理器为多核处理器,所述处理器用于为高速率网卡提供数据传输服务,具体可以包括如下模块:
检测及确定模块601,用于检测所述处理器的运行状态,并根据所述运行状态确定是否对处于同一个CCD的内核进行虚拟融合,或,根据所述运行状态确定是否对处于不同CCD的内核进行虚拟融合;
第一虚拟融合模块602,用于若所述处理器处于第一运行状态,则对处于同一个CCD的内核进行虚拟融合;
第二虚拟融合模块603,用于若所述处理器处于第二运行状态,则对处于不同CCD的内核进行虚拟融合;
第一数据传输模块604,用于采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。
在本发明实施例中,所述第一运行状态为低占用状态,所述第一虚拟融合模块,包括:
第一确定子模块,用于若所述处理器的内核占用率不大于预设的第一占用率阈值,则确定所述处理器处于所述低占用状态;
第一虚拟融合子模块,用于在所述处理器处于所述低占用状态的情况下,对处于同一个CCD的内核进行虚拟融合。
在本发明实施例中,所述第一虚拟融合子模块,包括:
第一选择单元,用于从所述处理器所包含的CCD中选出目标CCD;
第二选择单元,用于从所述目标CCD所包含的内核中选出目标内核;
第一虚拟融合单元,用于对处于同一个CCD的所述目标内核进行虚拟融合。
在本发明实施例中,所述第一虚拟融合单元,包括:
虚拟融合子单元,用于对处于同一个CCD且处于同一个CCX的所述目标内核进行虚拟融合。
在本发明实施例中,所述第二运行状态为高占用状态,所述第二虚拟融合模块,包括:
第二确定子模块,用于若所述处理器的内核占用率大于预设的第二占用率阈值,则确定所述处理器处于所述高占用状态;
第二虚拟融合子模块,用于在所述处理器处于所述高占用状态的情况下,对处于不同CCD的内核进行虚拟融合。
在本发明实施例中,所述第二虚拟融合子模块,包括:
创建及建立单元,用于创建CCD调控单元,并通过所述CCD调控单元建立所述处理器中各个CCD之间的连接;
第二虚拟融合单元,用于基于建立的连接对处于不同CCD的内核进行虚拟融合。
在本发明实施例中,所述处理器内还包含有IOD,所述装置还包括:
第二数据传输模块,用于各个CCD之间的数据传输由原来的经过所述IOD转换为不经过所述IOD。
综上,在本发明实施例中,处理器内包含有CCD,CCD内包含有CCX,CCX内包含有内核,该处理器为多核处理器,可以检测处理器的运行状态,并根据运行状态决定是否对处于同一个CCD的内核进行虚拟融合,或者,根据运行状态决定是否对处于不同CCD的内核进行虚拟融合,可以采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。通过采用上述方法,当需要为高速率网卡提供数据传输服务时,基于处理器的运行状态可以采用CCD内部多核虚拟融合技术或跨CCD内核虚拟超级融合技术进行内核虚拟融合,虚拟融合之后的各个内核共同提供内核资源为网卡提供数据传输服务,从根本上突破高速率网卡性能瓶颈问题,使得高速率网卡的传输速率可以达到或尽量接近标称速率。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种电子设备,如图7所示,包括:处理器701、存储器702及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述一种处理器的调节方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,如图8所示,计算机可读存储介质上存储计算机程序801,所述计算机程序被处理器执行时实现上述一种处理器的调节方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其它可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理终端设备上,使得在计算机或其它可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种处理器的调节方法和一种处理器的调节装置、一种电子设备和一种计算机可读存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种处理器的调节方法,其特征在于,所述处理器内包含有CCD,所述CCD内包含有CCX,所述CCX内包含有内核,所述处理器为多核处理器,所述处理器用于为高速率网卡提供数据传输服务,所述方法包括:
检测所述处理器的运行状态,并根据所述运行状态确定是否对处于同一个CCD的内核进行虚拟融合,或,根据所述运行状态确定是否对处于不同CCD的内核进行虚拟融合;
若所述处理器处于第一运行状态,则对处于同一个CCD的内核进行虚拟融合;
若所述处理器处于第二运行状态,则对处于不同CCD的内核进行虚拟融合;
采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。
2.根据权利要求1所述的方法,其特征在于,所述第一运行状态为低占用状态,所述若所述处理器处于第一运行状态,则对处于同一个CCD的内核进行虚拟融合,包括:
若所述处理器的内核占用率不大于预设的第一占用率阈值,则确定所述处理器处于所述低占用状态;
在所述处理器处于所述低占用状态的情况下,对处于同一个CCD的内核进行虚拟融合。
3.根据权利要求1或2所述的方法,其特征在于,所述对处于同一个CCD的内核进行虚拟融合,包括:
从所述处理器所包含的CCD中选出目标CCD;
从所述目标CCD所包含的内核中选出目标内核;
对处于同一个CCD的所述目标内核进行虚拟融合。
4.根据权利要求3所述的方法,其特征在于,所述对处于同一个CCD的所述目标内核进行虚拟融合,包括:
对处于同一个CCD且处于同一个CCX的所述目标内核进行虚拟融合。
5.根据权利要求1所述的方法,其特征在于,所述第二运行状态为高占用状态,所述若所述处理器处于第二运行状态,则对处于不同CCD的内核进行虚拟融合,包括:
若所述处理器的内核占用率大于预设的第二占用率阈值,则确定所述处理器处于所述高占用状态;
在所述处理器处于所述高占用状态的情况下,对处于不同CCD的内核进行虚拟融合。
6.根据权利要求1或5所述的方法,其特征在于,所述对处于不同CCD的内核进行虚拟融合,包括:
创建CCD调控单元,并通过所述CCD调控单元建立所述处理器中各个CCD之间的连接;
基于建立的连接对处于不同CCD的内核进行虚拟融合。
7.根据权利要求6所述的方法,其特征在于,所述处理器内还包含有IOD,所述基于建立的连接对处于不同CCD的内核进行虚拟融合之后,还包括:
各个CCD之间的数据传输由原来的经过所述IOD转换为不经过所述IOD。
8.一种处理器的调节装置,其特征在于,所述处理器内包含有CCD,所述CCD内包含有CCX,所述CCX内包含有内核,所述处理器为多核处理器,所述处理器用于为高速率网卡提供数据传输服务,所述装置包括:
检测及确定模块,用于检测所述处理器的运行状态,并根据所述运行状态确定是否对处于同一个CCD的内核进行虚拟融合,或,根据所述运行状态确定是否对处于不同CCD的内核进行虚拟融合;
第一虚拟融合模块,用于若所述处理器处于第一运行状态,则对处于同一个CCD的内核进行虚拟融合;
第二虚拟融合模块,用于若所述处理器处于第二运行状态,则对处于不同CCD的内核进行虚拟融合;
第一数据传输模块,用于采用虚拟融合后的各个内核为高速率网卡提供数据传输服务。
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述一种处理器的调节方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述一种处理器的调节方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211656884.7A CN116775271A (zh) | 2022-12-22 | 2022-12-22 | 一种处理器的调节方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211656884.7A CN116775271A (zh) | 2022-12-22 | 2022-12-22 | 一种处理器的调节方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116775271A true CN116775271A (zh) | 2023-09-19 |
Family
ID=87993712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211656884.7A Pending CN116775271A (zh) | 2022-12-22 | 2022-12-22 | 一种处理器的调节方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116775271A (zh) |
-
2022
- 2022-12-22 CN CN202211656884.7A patent/CN116775271A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10592298B2 (en) | Method for distributing load in a multi-core system | |
US11249779B2 (en) | Accelerator interconnect assignments for virtual environments | |
US11669372B2 (en) | Flexible allocation of compute resources | |
EP4136532A1 (en) | Storage transactions with predictable latency | |
US20080086575A1 (en) | Network interface techniques | |
WO2022225639A1 (en) | Service mesh offload to network devices | |
US20190280991A1 (en) | Quality of service traffic management in high-speed packet processing systems | |
US9390036B2 (en) | Processing data packets from a receive queue in a remote direct memory access device | |
CN106664290A (zh) | 一种光电混合网络的数据传输方法及装置 | |
CN112769905B (zh) | 一种基于numa架构的飞腾平台下高性能网卡性能优化方法 | |
US11750418B2 (en) | Cross network bridging | |
CN114490499A (zh) | 用于流送输入/输出数据的系统、装置和方法 | |
CN105164980A (zh) | 众核下网络数据的分发方法及系统 | |
CN107786458B (zh) | 基于dpdk的多端口准入准出的方法 | |
CN116132287A (zh) | 基于dpu的高性能网络加速方法及系统 | |
WO2020263658A1 (en) | Interconnect address based qos regulation | |
CN104834566A (zh) | 调整转发处理线程的交换端口的方法和相关装置 | |
CN116775271A (zh) | 一种处理器的调节方法、装置、电子设备和存储介质 | |
CN107239407B (zh) | 一种内存的无线访问方法和装置 | |
CN115913952B (zh) | 基于cpu+dpu平台的多目标服务功能链的高效并行化和部署方法 | |
CN114490458B (zh) | 数据传输方法、芯片、服务器以及存储介质 | |
CN108762922A (zh) | 一种Linux下通过改善网卡亲和性提升性能的方法及系统 | |
WO2022139922A1 (en) | Prioritizing booting of virtual execution environments | |
CN109840147A (zh) | 一种实现多队列网卡绑定cpu的方法及系统 | |
CN116382854B (zh) | 一种可编程虚拟网卡、代码运行方法及云系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |