CN109766243A - 一种基于幂函数的多核主机性能监控方法 - Google Patents

一种基于幂函数的多核主机性能监控方法 Download PDF

Info

Publication number
CN109766243A
CN109766243A CN201910002409.XA CN201910002409A CN109766243A CN 109766243 A CN109766243 A CN 109766243A CN 201910002409 A CN201910002409 A CN 201910002409A CN 109766243 A CN109766243 A CN 109766243A
Authority
CN
China
Prior art keywords
cpu
performance
host
busy percentage
critical value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910002409.XA
Other languages
English (en)
Other versions
CN109766243B (zh
Inventor
李威
姜学峰
李健俊
王正敏
董惠良
杜旋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Tobacco Zhejiang Industrial Co Ltd
Original Assignee
China Tobacco Zhejiang Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Tobacco Zhejiang Industrial Co Ltd filed Critical China Tobacco Zhejiang Industrial Co Ltd
Priority to CN201910002409.XA priority Critical patent/CN109766243B/zh
Publication of CN109766243A publication Critical patent/CN109766243A/zh
Application granted granted Critical
Publication of CN109766243B publication Critical patent/CN109766243B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明采用幂函数提供了一种基于幂函数的多核主机性能监控方法,对采集到的每个CPU利用率进行幂函数计算,得到每个CPU的性能指标,再计算出主机中所有CPU的总体性能指标。该指标反映主机CPU的运行状态,可得到主机性能异常告警。

Description

一种基于幂函数的多核主机性能监控方法
技术领域
本发明属于信息技术领域,具体涉及一种针对多核主机的性能分析方法。
背景技术
目前,主机都已采用多核CPU,少则4核CPU,多则64核CPU。CPU利用率是主机性能分析的主要依据,通过CPU利用率的高低来反映CPU运行的繁忙程度,同时反映该主机运行的繁忙程度。以往主机只有单核CPU,通过一个CPU的利用率能够反映出主机的运行情况。但主机多核情况下,每个核都有各自的CPU利用率,因此无法通过一个核的CPU利用率来反映主机的运行情况。多核情况下,每个CPU都代表该主机的一部分运算能力,一个或者部分CPU利用率高,并不能表示该主机运行繁忙,因为该主机还有其它利用率低的CPU,可以提供运算能力。所以需要检查所有CPU利用率情况才能判断主机的运行情况。
现在已有的网络管理系统实现对主机单核CPU性能进行分析与监控,通过SNMP获取主机每核CPU的运行参数,因为不能全面反映所有CPU的运行情况,所以这种算法往往带来很大偏差。本发明提供一种方法,采用幂函数计算多核CPU利用率,得到主机CPU综合性能指标,来准确反映CPU的运行状态,从而提高对主机性能状态的分析监控能力。
发明内容
本发明采用幂函数提供了一种多核主机的性能监控方法,它根据主机每核CPU的利用率计算出主机性能的影响,从而得到主机的CPU综合性能指标,克服了现有的网络管理系统或主机性能监控系统只针对单核CPU进行评估,不能对多核CPU进行总体评估的缺陷。
本发明的基于幂函数的多核主机性能监控实现方法,包括主机性能指标采集子系统,它对主机各种性能指标进行采集,对采集到的每个CPU利用率进行幂函数计算,得到每个CPU的性能指标,再计算出主机中所有CPU的总体性能指标。该指标反映主机CPU的运行状态,可得到主机性能异常告警。主机资产管理子系统进行设备资产信息的管理(如设备名称、IP地址、网段、管理员等),同时根据主机所运行的应用服务,从数据库、应用中间件两个方面定义主机的性能属性,主机CPU性能指标和资产信息将提供给性能分析管理子系统进行分析。主机性能预警子系统对主机的运行情况进行监控和分析,产生性能事件。主机性能分析系统随时计算主机性能对应用服务运行状态的影响。
本发明的基于幂函数分析方法,包括以下步骤:
一种基于幂函数的多核主机性能监控方法,其特征在于该方法包括以下的步骤:
1)假设多核主机有n个CPU,定期获取主机中每个核CPU的利用率,CPU利用率值分别为x1,x2,....,xn
2)设CPU利用率的临界值为x0,超过该临界值,表示CPU利用率值过高,该CPU性能异常;
3)对于每核CPU,计算幂函数性能影响因子:其中m≥2;则CPU利用率小于临界值时,性能影响因子小于1/n;CPU利用率大于临界值时,性能影响因子为1;
4)令多核CPU总的性能因子y=f(x1)+…+f(xn),则CPU利用率全部小于临界值时,总的性能因子小于1,当有一个CPU利用率大于临界值时,总的性能因子大于等于1;
5)定义多核CPU性能指数其中,C1,C2为常数项且C1+C2=100;则CPU性能指数W满足:CPU利用率全部正常时,CPU性能指数高于C2;CPU利用率存在一个异常时,CPU性能指数低于C2;并且随着CPU利用率异常数量增长,分数由C2降低,直至降低到0;
6)根据CPU性能指数判断主机性能状态,当CPU性能指数小于C2时,表示主机性能恶化,产生性能事件并进行性能告警。
在本发明一些实施方式中,所述C1为常数20,则C2为常数80。
在本发明另一些实施方式中,所述C1为常数40,则C2为常数60。
在本发明的再一些实施方式中,所述m为5或者6。
本发明另一方面提供一种多核主机性能监控设备,该设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
1)假设多核主机有n个CPU,定期获取主机中每个核CPU的利用率,CPU利用率值分别为x1,x2,....,xn
2)设CPU利用率的临界值为x0,超过该临界值,表示CPU利用率值过高,该CPU性能异常;
3)对于每核CPU,计算幂函数性能影响因子:其中m≥2;则CPU利用率小于临界值时,性能影响因子小于1/n;CPU利用率大于临界值时,性能影响因子为1;
4)令多核CPU总的性能因子y=f(x1)+…+f(xn),则CPU利用率全部小于临界值时,总的性能因子小于1,当有一个CPU利用率大于临界值时,总的性能因子大于等于1;
5)定义多核CPU性能指数其中,C1,C2为常数项且C1+C2=100;则CPU性能指数W满足:CPU利用率全部正常时,CPU性能指数高于C2;CPU利用率存在一个异常时,CPU性能指数低于C2;并且随着CPU利用率异常数量增长,分数由C2降低,直至降低到0;
6)根据CPU性能指数判断主机性能状态,当CPU性能指数小于C2时,表示主机性能恶化,产生性能事件并进行性能告警。
本发明再一方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下所述方法的步骤:
11)假设多核主机有n个CPU,定期获取主机中每个核CPU的利用率,CPU利用率值分别为x1,x2,....,xn
2)设CPU利用率的临界值为x0,超过该临界值,表示CPU利用率值过高,该CPU性能异常;
3)对于每核CPU,计算幂函数性能影响因子:其中m≥2;则CPU利用率小于临界值时,性能影响因子小于1/n;CPU利用率大于临界值时,性能影响因子为1;
4)令多核CPU总的性能因子y=f(x1)+…+f(xn),则CPU利用率全部小于临界值时,总的性能因子小于1,当有一个CPU利用率大于临界值时,总的性能因子大于等于1;
5)定义多核CPU性能指数其中,C1,C2为常数项且C1+C2=100;则CPU性能指数W满足:CPU利用率全部正常时,CPU性能指数高于C2;CPU利用率存在一个异常时,CPU性能指数低于C2;并且随着CPU利用率异常数量增长,分数由C2降低,直至降低到0;
6)根据CPU性能指数判断主机性能状态,当CPU性能指数小于C2时,表示主机性能恶化,产生性能事件并进行性能告警。
本发明的基于幂函数的多核主机性能监控方法,主机各种CPU利用率指标进行采集,对采集到的每个CPU利用率进行幂函数计算,得到每个CPU的性能指标,再计算出主机中所有CPU的总体性能指标。该指标反映主机CPU的运行状态,可得到主机性能异常告警。
多核CPU性能指数对主机的性能状态有很大的影响,其值越低,表明主机性能越差。通过CPU性能指数一个参数,就能体现多个CPU的综合性能状态。为管理员判断主机性能提供直观、简单的判断依据。
附图说明
图1为本发明的框架结构图;
图2为本发明的流程图。
具体实施方式
本发明是一种使用在主机管理领域的主机性能分析系统和分析方法。下面以具体实施例对本发明做出具体说明。
如图1所示,本发明的主机性能分析系统1运行在服务器上,在CPU性能分析子系统2中进行CPU数据采集与分析。CPU性能分析子系统中的CPU性能数据采集模块3定期采集主机的CPU数据,并存储在数据库中,通过CPU性能计算模块4对采集到的CPU数据进行计算处理,并通过CPU性能评估模块5判定CPU性能的好、坏状况。
主机管理子系统6中的主机资产信息管理模块7负责主机的设备资产属性、设备安全属性的管理,通过主机应用管理模块8对主机的应用范围进行管理,同时维护主机的资产信息表,包括设备名称、类型、IP地址、用途等。
主机性能预警子系统9对主机的性能与故障进行监控分析,通过性能监控模块10定期获取主机的性能数据,根据性能数据分析各主机的性能状况,产生性能事件。同时通过事件预警模块11对性能数据进行进一步分析,产生故障事件。
如图2所示,是本发明的分析系统的分析流程图:
1)假设多核主机有n个CPU,定期获取主机中每个核CPU的利用率,CPU利用率值分别为x1,x2,....,xn
2)设CPU利用率的临界值为x0,超过该临界值,表示CPU利用率值过高,该CPU性能异常;
3)对于每核CPU,计算幂函数性能影响因子:其中m≥2;则CPU利用率小于临界值时,性能影响因子小于1/n;CPU利用率大于临界值时,性能影响因子为1;
4)令多核CPU总的性能因子y=f(x1)+…+f(xn),则CPU利用率全部小于临界值时,总的性能因子小于1,当有一个CPU利用率大于临界值时,总的性能因子大于等于1;
5)定义多核CPU性能指数其中,C1,C2为常数项且C1+C2=100;则CPU性能指数W满足:CPU利用率全部正常时,CPU性能指数高于C2;CPU利用率存在一个异常时,CPU性能指数低于C2;并且随着CPU利用率异常数量增长,分数由C2降低,直至降低到0;
6)根据CPU性能指数判断主机性能状态,当CPU性能指数小于C2时,表示主机性能恶化,产生性能事件并进行性能告警。
在本发明其中一个实施例中,所述幂函数性能影响因子:所述的多核CPU性能指数则CPU性能指数W满足,CPU利用率全部正常时,CPU性能指数高于60;CPU利用率存在一个异常时(大于临界值),CPU性能指数低于60。并且随着CPU利用率异常数量增长,分数由60降低,直至降低到0;根据CPU性能指数判断主机性能状态,当CPU性能指数小于60时,表示主机性能恶化,产生性能事件并进行性能告警。
在本发明另一个实施例中,幂函数性能影响因子:所述多核CPU性能指数则CPU性能指数W满足,CPU利用率全部正常时,CPU性能指数高于80;CPU利用率存在一个异常时(大于临界值),CPU性能指数低于80。并且随着CPU利用率异常数量增长,分数由80降低,直至降低到0;根据CPU性能指数判断主机性能状态,当CPU性能指数小于80时,表示主机性能恶化,产生性能事件并进行性能告警。
本说明书中所描述的以上内容仅仅是对本发明所作的举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明说明书的内容或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (5)

1.一种基于幂函数的多核主机性能监控方法,其特征在于该方法包括以下的步骤:
1)假设多核主机有n个CPU,定期获取主机中每个核CPU的利用率,CPU利用率值分别为x1,x2,….,xn
2)设CPU利用率的临界值为x0,超过该临界值,表示CPU利用率值过高,该CPU性能异常;
3)对于每核CPU,计算幂函数性能影响因子:其中m≥2;则CPU利用率小于临界值时,性能影响因子小于1/n;CPU利用率大于临界值时,性能影响因子为1;
4)令多核CPU总的性能因子y=f(x1)+…+f(xn),则CPU利用率全部小于临界值时,总的性能因子小于1,当有一个CPU利用率大于临界值时,总的性能因子大于等于1;
5)定义多核CPU性能指数其中,C1,C2为常数项且C1+C2=100;则CPU性能指数W满足:CPU利用率全部正常时,CPU性能指数高于C2;CPU利用率存在一个异常时,CPU性能指数低于C2;并且随着CPU利用率异常数量增长,分数由C2降低,直至降低到0;
6)根据CPU性能指数判断主机性能状态,当CPU性能指数小于C2时,表示主机性能恶化,产生性能事件并进行性能告警。
2.根据权利要求1所述的基于幂函数的多核主机性能监控方法,其特征在于:所述C1为常数20,则C2为常数80,或所述C1为常数40,则C2为常数60。
3.根据权利要求1所述的基于幂函数的多核主机性能监控方法,其特征在于:所述的m为5或者6。
4.一种多核主机性能监控设备,其特征在于:该设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
1)假设多核主机有n个CPU,定期获取主机中每个核CPU的利用率,CPU利用率值分别为x1,x2,….,xn
2)设CPU利用率的临界值为x0,超过该临界值,表示CPU利用率值过高,该CPU性能异常;
3)对于每核CPU,计算幂函数性能影响因子:其中m≥2;则CPU利用率小于临界值时,性能影响因子小于1/n;CPU利用率大于临界值时,性能影响因子为1;
4)令多核CPU总的性能因子y=f(x1)+…+f(xn),则CPU利用率全部小于临界值时,总的性能因子小于1,当有一个CPU利用率大于临界值时,总的性能因子大于等于1;
5)定义多核CPU性能指数其中,C1,C2为常数项且C1+C2=100;则CPU性能指数W满足:CPU利用率全部正常时,CPU性能指数高于C2;CPU利用率存在一个异常时,CPU性能指数低于C2;并且随着CPU利用率异常数量增长,分数由C2降低,直至降低到0;
6)根据CPU性能指数判断主机性能状态,当CPU性能指数小于C2时,表示主机性能恶化,产生性能事件并进行性能告警。
5.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述方法的步骤。
CN201910002409.XA 2019-01-02 2019-01-02 一种基于幂函数的多核主机性能监控方法 Active CN109766243B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910002409.XA CN109766243B (zh) 2019-01-02 2019-01-02 一种基于幂函数的多核主机性能监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910002409.XA CN109766243B (zh) 2019-01-02 2019-01-02 一种基于幂函数的多核主机性能监控方法

Publications (2)

Publication Number Publication Date
CN109766243A true CN109766243A (zh) 2019-05-17
CN109766243B CN109766243B (zh) 2022-05-27

Family

ID=66452677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910002409.XA Active CN109766243B (zh) 2019-01-02 2019-01-02 一种基于幂函数的多核主机性能监控方法

Country Status (1)

Country Link
CN (1) CN109766243B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113886196A (zh) * 2021-12-07 2022-01-04 上海燧原科技有限公司 片上功耗管理方法、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140201357A1 (en) * 2011-05-27 2014-07-17 Transoft (Shanghai), Inc. Framework and method for monitoring performance of virtualized systems based on hardware base tool
CN103955398A (zh) * 2014-04-28 2014-07-30 浙江大学 一种基于处理器性能监控的虚拟机共生调度方法
CN104125217A (zh) * 2014-06-30 2014-10-29 复旦大学 一种基于主机日志分析的云数据中心实时风险评估方法
CN106250306A (zh) * 2016-08-18 2016-12-21 电子科技大学 一种适用于企业级运维自动化平台的性能预测方法
CN106407088A (zh) * 2016-09-08 2017-02-15 努比亚技术有限公司 一种对多核cpu进行检测的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140201357A1 (en) * 2011-05-27 2014-07-17 Transoft (Shanghai), Inc. Framework and method for monitoring performance of virtualized systems based on hardware base tool
CN103955398A (zh) * 2014-04-28 2014-07-30 浙江大学 一种基于处理器性能监控的虚拟机共生调度方法
CN104125217A (zh) * 2014-06-30 2014-10-29 复旦大学 一种基于主机日志分析的云数据中心实时风险评估方法
CN106250306A (zh) * 2016-08-18 2016-12-21 电子科技大学 一种适用于企业级运维自动化平台的性能预测方法
CN106407088A (zh) * 2016-09-08 2017-02-15 努比亚技术有限公司 一种对多核cpu进行检测的方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113886196A (zh) * 2021-12-07 2022-01-04 上海燧原科技有限公司 片上功耗管理方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN109766243B (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
US11748227B2 (en) Proactive information technology infrastructure management
US9672085B2 (en) Adaptive fault diagnosis
CN103491354B (zh) 一种系统运行监控可视化平台
JP5267684B2 (ja) 運用管理装置、運用管理方法、及びプログラム記憶媒体
CN103580934B (zh) 一种云业务监测方法和装置
CN112491805B (zh) 一种应用于云平台的网络安全设备管理系统
US8874642B2 (en) System and method for managing the performance of an enterprise application
CN105808415A (zh) 一种基于云计算环境的业务运行状态评估方法及其装置
CN106383760A (zh) 一种计算机故障管理方法及装置
CN104796273A (zh) 一种网络故障根源诊断的方法和装置
CN112162907A (zh) 基于监控指标数据的健康度评估方法
CN105516130A (zh) 一种数据处理方法和装置
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN108924084A (zh) 一种网络设备安全评估方法及装置
CN113505044B (zh) 数据库告警方法、装置、设备和存储介质
CN112699007A (zh) 监控机器性能的方法、系统、网络设备及存储介质
CN109240863A (zh) 一种cpu故障定位方法、装置、设备及存储介质
CN109032904A (zh) 被监控、管理服务器及数据获取、分析方法和管理系统
CN108596436A (zh) 基于计算机的经济指标实时监控分析方法
CN109766243A (zh) 一种基于幂函数的多核主机性能监控方法
CN107590008B (zh) 一种通过加权熵判断分布式集群可靠度的方法和系统
US11113364B2 (en) Time series data analysis control method and analysis control device
CN106649034B (zh) 一种可视化智能运维方法及平台
KR20190002280A (ko) 5g 분산 클라우드 시스템의 빅 데이터를 이용하여 장애를 관리하는 장치 및 방법
CN117391675A (zh) 一种数据中心基础设施运维管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant