CN110806924B - 一种基于cpu占用率的网络处理方法及装置 - Google Patents
一种基于cpu占用率的网络处理方法及装置 Download PDFInfo
- Publication number
- CN110806924B CN110806924B CN201810885271.8A CN201810885271A CN110806924B CN 110806924 B CN110806924 B CN 110806924B CN 201810885271 A CN201810885271 A CN 201810885271A CN 110806924 B CN110806924 B CN 110806924B
- Authority
- CN
- China
- Prior art keywords
- occupancy rate
- cpu
- current
- cpu occupancy
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 140
- 238000012545 processing Methods 0.000 claims abstract description 48
- 238000001514 detection method Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012423 maintenance Methods 0.000 abstract description 8
- 206010033799 Paralysis Diseases 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 11
- 230000002159 abnormal effect Effects 0.000 description 9
- 238000011084 recovery Methods 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/485—Task life-cycle, e.g. stopping, restarting, resuming execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明实施例公开了一种基于CPU占用率的网络处理方法及装置,方法包括:获取当前的第一CPU占用率,若当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1;若全局计数器的计数大于预设计数值,且CPU的控制开关为打开状态,则生成告警信息;若当前进程的第二CPU占用率大于第二阈值,且全局变量为预设值,则对当前进程执行丢包处理。通过判断CPU占用率更新全局计时器,通过判断全局计时器的计数生成告警信息,供维护人员进行分析使用;并通过判断当前进程的第二CPU占用率来确定对当前进程执行丢包处理,可以解决在CPU负荷短期高的情况下,设备能够在用户体验降质的情况下仍然持续稳定运行,不会因为进程重启而导致大面积的网络瘫痪。
Description
技术领域
本发明实施例涉及网络技术领域,具体涉及一种基于CPU占用率的网络处理方法及装置。
背景技术
目前EPC(Evolved Packet Core,演进的分组核心网)系统在内部资源选择时,有可能出现一个进程或者一个处理器均处于特别忙的状态,但是资源选择时往往会继续选择该进程或者该处理资源,导致该处理点上的状况进一步恶化,最终软件平台连续且较长时间检测到该进程或者该处理资源的CPU(Central Processing Unit,中央处理单元)占用率过高,误以为异常,而触发恢复处理流程,即将进程杀掉。
平台将进程杀掉,会导致该时间内的业务大范围故障;且在某些临时性业务量剧增的时间(如新年、突发事件等)或场所(如比赛、大型活动现场等),当前的平台恢复策略机制很可能引发由于进程频繁被杀而业务瘫痪的情况。
目前平台采用的检测及恢复策略有两种情况:第一种情况如图1所示,针对进程,平台会每3秒钟检测一次该进程的CPU占用率,当CPU占用率超过90%后,并且连续4次都超过该异常处理门限,那么即会kill(杀死)该进程,然后重新初始化;第二种情况如图2所示,针对处理器,平台会每5秒钟计算一次该处理器的系统内核CPU占用率,当内核的CPU占用率超过70%,且连续25次都超过该异常处理门限,那么即会kill该处理器上CPU占用率最高的一个进程,然后重新拉起。
现有技术通过杀掉高CPU占用率进程的方式来实现平台的快速恢复,可能出现因短暂性业务量暴增被误判异常,进程频繁被杀而导致业务瘫痪的情况;并且当预先已知业务量暴增场景可能出现时,现有技术仍缺乏规避方法。
发明内容
由于现有方法存在上述问题,本发明实施例提出一种基于CPU占用率的网络处理方法及装置。
第一方面,本发明实施例提出一种基于CPU占用率的网络处理方法,包括:
通过平台检测或资源上报或进程采集的方式获取当前的第一CPU占用率,若判断获知当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1;
若判断获知所述全局计数器的计数大于预设计数值,且CPU的控制开关为打开状态,则生成告警信息并判断当前进程的第二CPU占用率;
若判断获知当前的第二CPU占用率大于第二阈值,且全局变量为预设值,则对当前进程执行丢包处理,否则不执行丢包处理;
其中,所述CPU的控制开关的状态根据预设表中的预设参数的参数值确定,所述全局变量用于标记是否执行丢包处理。
可选地,所述方法还包括:
判断获知当前的第一CPU占用率小于所述第一阈值,则将所述全局计数器的计数清零;
若判断获知存在告警信息,则将所述告警信息添加至日志文件中,并等待预设时间后重新通过平台检测或资源上报或应用程序采集的方式获取当前的CPU占用率。
可选地,所述方法还包括:
若判断获知所述全局计数器的计数小于等于所述预设计数值,则等待预设时间后重新通过平台检测或资源上报或应用程序采集的方式获取当前的CPU占用率。
可选地,所述通过平台检测或资源上报或进程采集的方式获取当前的第一CPU占用率,若判断获知当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1,具体包括:
通过平台检测或资源上报或进程采集的方式获取当前进程的进程CPU占用率和处理器的处理器CPU占用率,若判断获知当前的进程CPU占用率大于第三阈值且所述处理器CPU占用率大于第四阈值,则将全局计数器的计数增加1。
可选地,所述第三阈值和所述第四阈值均根据预设的衰减表的衰减率计算得到。
可选地,平台检测、资源上报和进程采集的周期均相同。
第二方面,本发明实施例还提出一种基于CPU占用率的网络处理装置,包括:
占用率获取模块,用于通过平台检测或资源上报或进程采集的方式获取当前的第一CPU占用率,若判断获知当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1;
占用率判断模块,用于若判断获知所述全局计数器的计数大于预设计数值,且CPU的控制开关为打开状态,则生成告警信息并判断当前进程的第二CPU占用率;
进程处理模块,用于若判断获知当前的第二CPU占用率大于第二阈值,且全局变量为预设值,则对当前进程执行丢包处理,否则不执行丢包处理;
其中,所述CPU的控制开关的状态根据预设表中的预设参数的参数值确定,所述全局变量用于标记是否执行丢包处理。
可选地,所述装置还包括:
计数清零模块,用于判断获知当前的第一CPU占用率小于所述第一阈值,则将所述全局计数器的计数清零;
日志添加模块,用于若判断获知存在告警信息,则将所述告警信息添加至日志文件中,并等待预设时间后重新通过平台检测或资源上报或应用程序采集的方式获取当前的CPU占用率。
第三方面,本发明实施例还提出一种电子设备,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述方法。
第四方面,本发明实施例还提出一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述方法。
由上述技术方案可知,本发明实施例通过判断CPU占用率大于等于第一阈值时更新全局计时器,通过判断全局计时器的计数大于预设计数值时生成告警信息,供维护人员进行分析使用;并通过判断当前进程的第二CPU占用率来确定对当前进程执行丢包处理,可以解决在CPU负荷短期高的情况下,设备能够在用户体验降质的情况下仍然持续稳定运行,不会因为进程重启而导致大面积的网络瘫痪。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
图1为现有技术提供的一种进程处理方法的流程示意图;
图2为现有技术提供的另一种进程处理方法的流程示意图;
图3为本发明一实施例提供的一种基于CPU占用率的网络处理方法的流程示意图;
图4为本发明另一实施例提供的一种基于CPU占用率的网络处理方法的流程示意图;
图5为本发明一实施例提供的一种基于CPU占用率的网络处理装置的结构示意图;
图6为本发明一实施例提供的电子设备的逻辑框图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
图3示出了本实施例提供的一种基于CPU占用率的网络处理方法的流程示意图,包括:
S301、通过平台检测或资源上报或进程采集的方式获取当前的第一CPU占用率,若判断获知当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1。
其中,平台检测、资源上报和进程采集的周期均相同。
所述第一CPU占用率为平台检测到的或资源上报的或进程采集到的当前的CPU占用率。
所述第一阈值为用于判断第一CPU占用率的阈值。
所述全局计数器为用于对CPU占用率超过第一阈值的次数进行统计的计数器。具体地,通过引入全局变量g_ulSnlPacketDropFlag,即全局计数器,并通过此变量的赋值决定是否采用CPU降质的方式来保证进程可靠运行。
S302、若判断获知所述全局计数器的计数大于预设计数值,且CPU的控制开关为打开状态,则生成告警信息并判断当前进程的第二CPU占用率。
其中,所述预设计数值为判断全局计数器的计数的门限值,引入超过异常门限的连续次数(pulCount),即预设计数值,各进程根据该值判断是否启动自我保护机制;pulCount通过新增计数器来统计,如果计数器增加的结果大于定义的范围则取范围的最大值,则启动自我保护机制。
本实施例引入CPU控制开关,即epsSystemOptionCfgTable(表)的epsSystemOptionCfgFlag字段的bit10为CPU控制开关,该参数支持在线修改和生效,所述CPU的控制开关的状态根据预设表中的预设参数的参数值确定。
S303、若判断获知当前的第二CPU占用率大于第二阈值,且全局变量为预设值,则对当前进程执行丢包处理,否则不执行丢包处理。
其中,所述第二CPU占用率为重新获取的当前的CPU占用率。
所述全局变量为一个标记量,用于标记是否执行丢包处理,一般设置两个值,例如0和1,当为1时对当前进程执行丢包处理,当为0时不对当前进程执行丢包处理。
本实施例通过判断CPU占用率大于等于第一阈值时更新全局计时器,通过判断全局计时器的计数大于预设计数值时生成告警信息,供维护人员进行分析使用;并通过判断当前进程的第二CPU占用率来确定对当前进程执行丢包处理,可以解决在CPU负荷短期高的情况下,设备能够在用户体验降质的情况下仍然持续稳定运行,不会因为进程重启而导致大面积的网络瘫痪。
进一步地,在上述方法实施例的基础上,所述方法还包括:
S304、判断获知当前的第一CPU占用率小于所述第一阈值,则将所述全局计数器的计数清零。
S305、若判断获知存在告警信息,则将所述告警信息添加至日志文件中,并等待预设时间后重新通过平台检测或资源上报或应用程序采集的方式获取当前的CPU占用率。
为了统计CPU占用率大于等于所述第一阈值的连续次数,因此当第一CPU占用率小于第一阈值时需要将所述全局计数器的计数清零。
具体地,提出了一种可控的自我保护机制,通过CPU降质来保障设备稳定性的方案,由维护人员根据实际情况设置是否通过CPU降质来保障设备稳定运行,可以解决在CPU负荷短期高的情况下,设备能够在用户体验降质的情况下仍然持续稳定运行,不会因为进程重启而导致大面积的网络瘫痪。
进一步地,在上述方法实施例的基础上,所述方法还包括:
S306、若判断获知所述全局计数器的计数小于等于所述预设计数值,则等待预设时间后重新通过平台检测或资源上报或应用程序采集的方式获取当前的CPU占用率。
为了统计CPU占用率大于等于所述第一阈值的连续次数,因此当全局计数器的计数小于等于预设计数值时,不满足本实施例的自我保护机制,因此需要等待预设时间后,重新执行本实施例。
进一步地,在上述方法实施例的基础上,S301具体包括:
通过平台检测或资源上报或进程采集的方式获取当前进程的进程CPU占用率和处理器的处理器CPU占用率,若判断获知当前的进程CPU占用率大于第三阈值且所述处理器CPU占用率大于第四阈值,则将全局计数器的计数增加1。
其中,所述第三阈值和所述第四阈值均根据预设的衰减表的衰减率计算得到。
本实施例通过引入进程使用门限衰减因子和CPU使用门限衰减因子:epsSystemOptionCfgTable(表)的epsSystemOptionProcRate为进程使用门限的衰减因子来计算进程控制门限;通过epsSystemOptionCPURate的CPU使用门限的衰减因子来计算处理器控制门限。如果epsSystemOptionProcRate为10;则各子系统判断控制门限(EPS_APP_PROC_CPU_USAGE_THRESHOLD)为90%,则控制门限-10%=80%;如果epsSystemOptionCPURate为20,则各子系统判断CPU异常门限值为70%,则控制门限-20%=50%,该数据可配,且动态生效。
各子系统初始化时同步获取epsSystemOptionCfgType=2(neValue|私有特征)表记录里的epsSystemOptionCfgFlag字段的bit10和epsSystemOptionProcRate,epsSystemOptionCPURate值。epsSystemOptionCfgType=2的表项必须配置,如果epsSystemOptionCfgType=2的表项不存在,则默认CPU使用量的控制开关关闭。如果epsSystemOptionProcRate,如果epsSystemOptionCPURate值没有配置,按照默认值10来设置。
在本实施例中,相关控制门限可通过设定衰减因子来灵活配置。进程启动自我保护机制后,进程会进行相关告警并记录日志,方便维护人员后续分析及优化。
具体地,结合上述实施例,本实施例的详细执行过程参见图4,从获取CPU占用率到调用upagent函数丢弃数据量。其中,为了尽可能保证各进程在平台的恢复策略机制之前启动自我保护,且尽可能减少受CPU使用率瞬间波动的影响,取各进程采集的CPU占用率和超过异常门限的次数需要与资源上报的周期一致(即定时器T307),且各进程的资源上报周期与平台的检测周期一致,取值为3秒。CPU控制功能开关打开或关闭,各进程在资源上报时,由主线程通过cpss_proc_get_CPUusage获取CPU占用率和超过异常门限的连续次数(pulCount,如果计数器增加的结果大于定义的范围则取范围的最大值),各进程据此判断是否启动自我保护机制。具体处理策略如下:
第一,增加一个全局计数器(g_UPCpuExceedVolumeNum,默认值为0,如果计数器增加的结果大于定义的范围则取范围的最大值),用于记录CPU占用率超过阈值门限的连续次数;
第二,在资源上报时,通过平台提供的接口cpss_kw_get_CPUinfo获取CPU占用率,当CPU占用率大于等于RESOURCE_CPU_USAGE_THRESHOLD时,该计数器的值加1;而CPU占用率小于RESOURCE_CPU_USAGE_THRESHOLD时,该计数器的值清0;
第三,判断CPU控制功能开关是否打开,CPU控制功能开关关闭时,则按照现有技术处理;CPU控制功能开关打开时,进程和进程_asrd进程检测各自进程CPU占用率连续大于异常门限的次数达到EPS_APP_PROC_CPU_USAGE_TO_THRESHOLD_SERIES_NUM时需要进程告警处理并记录log,不用进行丢消息处理;
第四,产生告警后,当CPU占用率第一次小于异常门限时,需要做log记录;
第五,各进程检测各自CPU占用率连续大于异常门限的次数达到EPS_APP_PROC_CPU_USAGE_TO_THRESHOLD_SERIES_NUM的情况下,需要调用回调函数指示进程agent是否需要丢数据包(把全局变量g_ulSnlPacketDropFlag置为1;如果进程的CPU占用率恢复信令会再次调用回调函数把全局变量g_ulSnlPacketDropFlag置为0;默认值为0);
第六,进程接收到数据包时,判断本地的全局变量g_ulSnlPacketDropFlag,如果为1丢弃数据包并统计丢弃数据包的个数,如果为0按照原有流程处理。
本实施例涉及的进程CPU占用率是否正常由进程调用函数进程_gtpc_message_rx_control_switch判断,如果正常按照现有技术处理,如果不正常则丢弃数据包并添加计数器统计。第二方面,本实施例涉及的CPU控制功能开关由进程同步epsSystemOptionCfgTable表,epsSystemOptionCfgFlag字段的bit10,如果不需要进行控制,则按照现有技术处理;如果需要进行控制,资源上报的时候调用平台的cpss_proc_get_CPUusage函数,如果超过异常门限的次数大于EPS_APP_PROC_CPU_USAGE_TO_THRESHOLD_SERIES_NUM表示CPU占用率异常,添加打印,并上报事件告警。如果CPU恢复需要添加打印,并上报事件告警清除。第三方面,本实施例涉及的CPU占用率超过阈值门限的连续次数由进程_linux新增计数器统计,资源上报的时候,需要调用cpss_kw_get_CPUinfo获取处理器CPU占用率,如果CPU占用率大于等于RESOURCE_CPU_USAGE_THRESHOLD时,该计数器的值加1,而CPU占用率小于RESOURCE_CPU_USAGE_THRESHOLD时,该计数器的值清0。在资源上报aucResourceData[63]字段中赋值该计数器的当前值。当该计数器的值大于等于RESOURCE_CPU_USAGE_TO_THRESHOLD_SERIES_NUM时,以及检测发现该计数器的值又恢复为小于该门限时的第一次,对应进程需要触发记录log,并上报该进程所在CPU占用率达到阈值的事件告警。
本实施例通过引入开关,使用户可根据具体场景选择是否直接启用平台恢复机制;结合告警和日志,为维护人员网络规划完善提供手段;通过CPU降质保障设备稳定性的方案,在业务量剧增但需要通信保障的特殊场景下,可以确保设备性能稳定;通过引入CPU控制功能开关衰减因子,使是否直接进行平台恢复机制及何时启动自我保护机制用户可选;同时,在业务量剧增的特殊场景下,通过CPU降质保障设备稳定性能;通过增加CPU占有率高告警及log保存,便于维护人员进一步完善网络规划。
图5示出了本实施例提供的一种基于CPU占用率的网络处理装置的结构示意图,所述装置包括:占用率获取模块501、占用率判断模块502和进程处理模块503,其中:
所述占用率获取模块501用于通过平台检测或资源上报或进程采集的方式获取当前的第一CPU占用率,若判断获知当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1;
所述占用率判断模块502用于若判断获知所述全局计数器的计数大于预设计数值,且CPU的控制开关为打开状态,则生成告警信息并判断当前进程的第二CPU占用率;
所述进程处理模块503用于若判断获知当前的第二CPU占用率大于第二阈值,且全局变量为预设值,则对当前进程执行丢包处理,否则不执行丢包处理;
其中,所述CPU的控制开关的状态根据预设表中的预设参数的参数值确定,所述全局变量用于标记是否执行丢包处理。
具体地,所述占用率获取模块501通过平台检测或资源上报或进程采集的方式获取当前的第一CPU占用率,若判断获知当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1;所述占用率判断模块502若判断获知所述全局计数器的计数大于预设计数值,且CPU的控制开关为打开状态,则生成告警信息并判断当前进程的第二CPU占用率;所述进程处理模块503若判断获知当前的第二CPU占用率大于第二阈值,且全局变量为预设值,则对当前进程执行丢包处理。
本实施例通过判断CPU占用率大于等于第一阈值时更新全局计时器,通过判断全局计时器的计数大于预设计数值时生成告警信息,供维护人员进行分析使用;并通过判断当前进程的第二CPU占用率来确定对当前进程执行丢包处理,可以解决在CPU负荷短期高的情况下,设备能够在用户体验降质的情况下仍然持续稳定运行,不会因为进程重启而导致大面积的网络瘫痪。
进一步地,在上述装置实施例的基础上,所述装置还包括:
计数清零模块,用于判断获知当前的第一CPU占用率小于所述第一阈值,则将所述全局计数器的计数清零;
日志添加模块,用于若判断获知存在告警信息,则将所述告警信息添加至日志文件中,并等待预设时间后重新通过平台检测或资源上报或应用程序采集的方式获取当前的CPU占用率。
本实施例所述的基于CPU占用率的网络处理装置可以用于执行上述方法实施例,其原理和技术效果类似,此处不再赘述。
参照图6,所述电子设备,包括:处理器(processor)601、存储器(memory)602和总线603;
其中,
所述处理器601和存储器602通过所述总线603完成相互间的通信;
所述处理器601用于调用所述存储器602中的程序指令,以执行上述各方法实施例所提供的方法。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于CPU占用率的网络处理方法,其特征在于,包括:
通过平台检测或资源上报或进程采集的方式获取当前的第一中央处理器CPU占用率,若判断获知当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1;
若判断获知所述全局计数器的计数大于预设计数值,且CPU的控制开关为打开状态,则生成告警信息并判断当前进程的第二CPU占用率;
若判断获知当前进程的第二CPU占用率大于第二阈值,且全局变量为预设值,则对当前进程执行丢包处理,否则不执行丢包处理;
其中,所述CPU的控制开关的状态根据预设表中的预设参数的参数值确定,所述全局变量用于标记是否执行丢包处理。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断获知当前的第一CPU占用率小于所述第一阈值,则将所述全局计数器的计数清零;
若判断获知存在告警信息,则将所述告警信息添加至日志文件中,并等待预设时间后重新通过平台检测或资源上报或应用程序采集的方式获取当前的CPU占用率。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若判断获知所述全局计数器的计数小于等于所述预设计数值,则等待预设时间后重新通过平台检测或资源上报或应用程序采集的方式获取当前的CPU占用率。
4.根据权利要求1所述的方法,其特征在于,所述通过平台检测或资源上报或进程采集的方式获取当前的第一CPU占用率,若判断获知当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1,具体包括:
通过平台检测或资源上报或进程采集的方式获取当前进程的进程CPU占用率和处理器的处理器CPU占用率,若判断获知当前的进程CPU占用率大于第三阈值且所述处理器CPU占用率大于第四阈值,则将全局计数器的计数增加1。
5.根据权利要求4所述的方法,其特征在于,所述第三阈值和所述第四阈值均根据预设的衰减表的衰减率计算得到。
6.根据权利要求1-5任一项所述的方法,其特征在于,平台检测、资源上报和进程采集的周期均相同。
7.一种基于CPU占用率的网络处理装置,其特征在于,包括:
占用率获取模块,用于通过平台检测或资源上报或进程采集的方式获取当前的第一CPU占用率,若判断获知当前的第一CPU占用率大于等于第一阈值,则将全局计数器的计数增加1;
占用率判断模块,用于若判断获知所述全局计数器的计数大于预设计数值,且CPU的控制开关为打开状态,则生成告警信息并判断当前进程的第二CPU占用率;
进程处理模块,用于若判断获知当前的第二CPU占用率大于第二阈值,且全局变量为预设值,则对当前进程执行丢包处理,否则不执行丢包处理;
其中,所述CPU的控制开关的状态根据预设表中的预设参数的参数值确定,所述全局变量用于标记是否执行丢包处理。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
计数清零模块,用于判断获知当前的第一CPU占用率小于所述第一阈值,则将所述全局计数器的计数清零;
日志添加模块,用于若判断获知存在告警信息,则将所述告警信息添加至日志文件中,并等待预设时间后重新通过平台检测或资源上报或应用程序采集的方式获取当前的CPU占用率。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至6任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行如权利要求1至6任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810885271.8A CN110806924B (zh) | 2018-08-06 | 2018-08-06 | 一种基于cpu占用率的网络处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810885271.8A CN110806924B (zh) | 2018-08-06 | 2018-08-06 | 一种基于cpu占用率的网络处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110806924A CN110806924A (zh) | 2020-02-18 |
CN110806924B true CN110806924B (zh) | 2022-06-07 |
Family
ID=69487168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810885271.8A Active CN110806924B (zh) | 2018-08-06 | 2018-08-06 | 一种基于cpu占用率的网络处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110806924B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112084031B (zh) * | 2020-09-14 | 2022-07-08 | 成都海光微电子技术有限公司 | 一种进程分配方法、并行处理器及电子设备 |
CN113783796A (zh) * | 2021-07-22 | 2021-12-10 | 许继集团有限公司 | 一种用于换流系统的通信方法及装置 |
CN114347848B (zh) * | 2022-03-18 | 2022-05-17 | 蔚来汽车科技(安徽)有限公司 | 用于管理换电车辆的方法、计算机系统及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106506392A (zh) * | 2016-12-19 | 2017-03-15 | 深圳创维数字技术有限公司 | 一种网络拥塞处理方法及装置 |
CN107872401A (zh) * | 2017-12-22 | 2018-04-03 | 成都飞鱼星科技股份有限公司 | 一种网络关键业务保障方法及装置 |
CN108134748A (zh) * | 2017-12-11 | 2018-06-08 | 杭州迪普科技股份有限公司 | 一种基于快速转发表项的丢包方法和装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1528808A3 (en) * | 2003-10-27 | 2008-03-26 | Matsushita Electric Industrial Co., Ltd. | Apparatus for receiving a broadcast signal |
US10225136B2 (en) * | 2013-04-30 | 2019-03-05 | Splunk Inc. | Processing of log data and performance data obtained via an application programming interface (API) |
US9686180B2 (en) * | 2013-11-05 | 2017-06-20 | Cisco Technology, Inc. | Managing routing information for tunnel endpoints in overlay networks |
CN107894919A (zh) * | 2017-11-30 | 2018-04-10 | 中国平安财产保险股份有限公司 | 定时任务触发方法、装置、设备及可读存储介质 |
CN108040019B (zh) * | 2017-12-21 | 2021-12-24 | 杭州迪普科技股份有限公司 | 报文转发的方法及装置 |
-
2018
- 2018-08-06 CN CN201810885271.8A patent/CN110806924B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106506392A (zh) * | 2016-12-19 | 2017-03-15 | 深圳创维数字技术有限公司 | 一种网络拥塞处理方法及装置 |
CN108134748A (zh) * | 2017-12-11 | 2018-06-08 | 杭州迪普科技股份有限公司 | 一种基于快速转发表项的丢包方法和装置 |
CN107872401A (zh) * | 2017-12-22 | 2018-04-03 | 成都飞鱼星科技股份有限公司 | 一种网络关键业务保障方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110806924A (zh) | 2020-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107515796B (zh) | 一种设备异常监控处理方法及装置 | |
CN110806924B (zh) | 一种基于cpu占用率的网络处理方法及装置 | |
EP2800024B1 (en) | System and methods for identifying applications in mobile networks | |
EP3160081A1 (en) | Alert data processing method and network management device | |
CN109450691B (zh) | 服务网关监控方法、设备及计算机可读存储介质 | |
US11770199B2 (en) | Traffic data self-recovery processing method, readable storage medium, server and apparatus | |
EP3439237A1 (en) | Exception monitoring and alarming method and device | |
CN110650060A (zh) | 流量告警的处理方法、设备及存储介质 | |
CN111130821B (zh) | 一种掉电告警的方法、处理方法及装置 | |
CN102547807A (zh) | 一种移动通讯设备故障的检测方法及系统 | |
CN114448774B (zh) | 告警处理方法、装置和存储介质 | |
CN110730087A (zh) | 一种告警风暴的处理方法及装置 | |
CN106487612A (zh) | 一种服务器节点监控方法、监控服务器及系统 | |
CN106911675B (zh) | 一种手机恶意软件预警方法和装置 | |
CN109783311A (zh) | 断点行为的监控处理方法、装置、设备及可读存储介质 | |
CN106211227A (zh) | 流量预警方法和网络设备 | |
US10135671B2 (en) | Policy-based M2M terminal device monitoring and control method and device | |
CN103824017A (zh) | 监控恶意程序的方法和监控平台 | |
CN110198224A (zh) | 一种报警处理方法、装置及系统 | |
CN115001989A (zh) | 一种设备预警方法、装置、设备及可读存储介质 | |
CN111404740A (zh) | 故障分析方法、装置、电子设备及计算机可读存储介质 | |
CN113381884B (zh) | 用于监控告警系统的全链路监控方法及装置 | |
CN111614630A (zh) | 一种网络安全监控方法、装置及云端web应用防火墙 | |
WO2014040470A1 (zh) | 告警消息的处理方法及装置 | |
CN113411828B (zh) | 通话质量的感知方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |