CN108280012A - 一种监控服务器系统进程的方法及装置 - Google Patents

一种监控服务器系统进程的方法及装置 Download PDF

Info

Publication number
CN108280012A
CN108280012A CN201810073283.0A CN201810073283A CN108280012A CN 108280012 A CN108280012 A CN 108280012A CN 201810073283 A CN201810073283 A CN 201810073283A CN 108280012 A CN108280012 A CN 108280012A
Authority
CN
China
Prior art keywords
progress information
server
file
server system
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810073283.0A
Other languages
English (en)
Inventor
张晓庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810073283.0A priority Critical patent/CN108280012A/zh
Publication of CN108280012A publication Critical patent/CN108280012A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例公开了一种监控服务器系统进程的方法及装置,所述方法包括基板管理控制器BMC接收服务器系统上配置的进程监控代理写入的进程信息,生成临时文件,所述进程信息为服务器开机后,所述进程监控代理监控到的进程信息;当接收到所述进程监控代理发送的写中止指令时,复制所述临时文件,生成中间文件;当接收到PC发送的进程显示指令时,复制所述中间文件生成显示文件;读取所述显示文件的进程信息进行显示。采用本申请实施例所提供的技术方案,用户只需要在PC端登录服务器的BMC的IP,就可以对服务器系统进程进行监控,实现服务器系统进程的集中监控。

Description

一种监控服务器系统进程的方法及装置
技术领域
本申请涉及服务器技术领域,特别是涉及一种监控服务器系统进程的方法及装置。
背景技术
进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。进程可以实时反映操作系统的运行状态,运维人员通过进程信息分析计算机当前的运行状态,进而及时有效地进行决策,例如对系统上正在运行进程进行关闭、保留或者挂起操作。
现有的操作系统进程监控技术是在操作系统上运行一个第三方的进程监控代理(agent),agent可以实时监控系统当前运行的进程,维护人员可以在系统上查看进程信息。但是,随着互联网行业的迅速发展,作为互联网行业的底层硬件基础逐渐演变为规模庞大的服务器集群,服务器集群中服务器的规模庞大,如果采用在系统上查看进程信息的方式,那么运维人员需要逐台查看每台服务器上的进行信息,工作量较大。
发明内容
本申请实施例中提供了一种监控服务器系统进程的方法及装置,以解决现有技术中运维人员需要逐台查看每台服务器上的进行信息,工作量较大的问题。
第一方面,本申请实施例提供了一种监控服务器系统进程的方法,包括:
基板管理控制器BMC接收服务器系统上配置的进程监控代理写入的进程信息,生成临时文件,所述进程信息为服务器开机后,所述进程监控代理监控到的进程信息;
当接收到所述进程监控代理发送的写中止指令时,复制所述临时文件,生成中间文件;
当接收到PC发送的进程显示指令时,复制所述中间文件生成显示文件;
读取所述显示文件的进程信息进行显示。
可选地,所述接收服务器系统上配置的进程监控代理写入的进程信息,包括:接收服务器系统上配置的进程监控代理通过IPMI接口写入的进程信息。
可选地,所述读取所述显示文件的进程信息进行显示,包括:读取所述显示文件的进程信息在web界面中进行显示。
第二方面,本申请实施例提供了一种监控服务器系统进程的装置,包括:
接收模块,用于接收服务器系统上配置的进程监控代理写入的进程信息,生成临时文件,所述进程信息为服务器开机后,所述进程监控代理监控到的进程信息;
第一复制模块,用于当接收到所述进程监控代理发送的写中止指令时,复制所述临时文件,生成中间文件;
第二复制模块,用于当接收到PC发送的进程显示指令时,复制所述中间文件生成显示文件;
读取模块,用于读取所述显示文件的进程信息进行显示。
可选地,所述接收模块,具体用于:接收服务器系统上配置的进程监控代理通过IPM I接口写入的进程信息。
可选地,所述读取模块,具体用于:读取所述显示文件的进程信息在web界面中进行显示。
第三方面,本申请实施例提供了一种基板管理控制器,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行上述第一方面任一项所述的方法。
第四方面,本申请实施例提供了一种服务器,所述服务器包括上述第三方面所述的基板管理控制器,所述服务器系统上配置有进程监控代理。
第五方面,本申请实施例提供了一种服务器进程监控系统,包括PC机和至少一个上述第四方面所述的服务器,所述PC机与至少一个所述服务器的基板管理控制器通信连接。
在本申请实施例中,通过服务器的基板管理控制器BMC对服务器的系统进程进行监控,用户只需要在PC端登录服务器的BMC的I P,就可以对服务器系统进程进行监控,实现服务器系统进程的集中监控。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种监控服务器系统进程的方法流程示意图;
图2为本申请实施例提供的一种监控服务器系统进程的装置结构示意图;
图3为本申请实施例提供的一种服务器进程监控系统结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
在服务器集群中,服务器的规模庞大,部分服务器的物理空间距离较远,如果运维人员逐台在服务器的系统中查看每台服务器系统进程,工作量较大。基于此,本申请实施例提供了一种服务器系统进程监控方案,在本申请实施例中,通过服务器的基板管理控制器BMC对服务器的系统进程进行监控,用户只需要在PC端登录服务器的BMC的I P,就可以对服务器系统进程进行监控,实现服务器系统进程的集中监控。以下进行详细说明。
图1为本申请实施例提供的一种监控服务器系统进程的方法流程示意图,如图1所示,该方法主要包括以下步骤。
步骤S101:基板管理控制器BMC接收服务器系统上配置的进程监控代理写入的进程信息,生成临时文件,所述进程信息为服务器开机后,所述进程监控代理监控到的进程信息。
在本申请实施例中,服务器系统上配置进程监控代理agent,服务器开机后,agent实时监控当前系统进程,并通过与BMC预先定义好的IPMI接口将进程信息发送给BMC,写入BMC的临时文件。
需要指出的是,服务器系统进程信息是动态变化的,那么agent监控到的进程信息,以及写入临时文件内的进程信息也是动态变化的。
步骤S102:当接收到所述进程监控代理发送的写中止指令时,复制所述临时文件,生成中间文件。
当agent在临时文件内写完进程信息后,会向BMC发送写中止指令,此时,BMC复制临时文件获得中间文件,中间文件内包含完整的进程信息。
步骤S103:当接收到PC发送的进程显示指令时,复制所述中间文件生成显示文件。
若用户需要查看该服务器的进程信息,用户可以通过PC登录BMC的I P,向BMC发送进程显示指令,此时,BMC复制中间文件生成显示文件。
步骤S104:读取所述显示文件的进程信息进行显示。
具体为,BMC从显示文件内读取进行信息,然后在BMC的web页面中进行显示。
在本申请实施例中,由于临时文件内的进程信息是实时变化的,因此,如果BMC直接从临时文件内读取进程信息进行显示可能会产生一些问题。例如,agent在临时文件内写入进程信息还未写完时,BMC直接从临时文件内读取进行信息进行显示可能会导致显示的进程信息不完整。
另外,当web页面中显示的进程信息出现错误时,还可以通过分析临时文件、中间文件和显示文件内进程信息的状态,确定进程信息出错的原因。
采用本申请实施例所提供的方法,用户只需要在PC端登录服务器的BMC的I P,就可以对服务器系统进程进行监控,实现服务器系统进程的集中监控。
在上述方法实施例的基础上,本申请还提供的一种监控服务器系统进程的装置。图2为本申请实施例提供的一种监控服务器系统进程的装置结构示意图,如图2所示,该装置主要包括以下模块。
接收模块201,用于接收服务器系统上配置的进程监控代理写入的进程信息,生成临时文件,所述进程信息为服务器开机后,所述进程监控代理监控到的进程信息;
第一复制模块202,用于当接收到所述进程监控代理发送的写中止指令时,复制所述临时文件,生成中间文件;
第二复制模块203,用于当接收到PC发送的进程显示指令时,复制所述中间文件生成显示文件;
读取模块204,用于读取所述显示文件的进程信息进行显示。
在一种可选实施例中,所述接收模块201,具体用于:接收服务器系统上配置的进程监控代理通过IPMI接口写入的进程信息。
在一种可选实施例中,所述读取模块204,具体用于:读取所述显示文件的进程信息在web界面中进行显示。
采用本申请实施例所提供的装置,用户只需要在PC端登录服务器的BMC的IP,就可以对服务器系统进程进行监控,实现服务器系统进程的集中监控。
在上述实施例的基础上,本申请还提供了一种基板管理控制器,所述基板管理控制器包括处理器和用于存储处理器的执行指令的存储器。当存储器中的执行指令由处理器执行时,使得基板管理控制器能够执行以下方法:
接收服务器系统上配置的进程监控代理写入的进程信息,生成临时文件,所述进程信息为服务器开机后,所述进程监控代理监控到的进程信息;
当接收到所述进程监控代理发送的写中止指令时,复制所述临时文件,生成中间文件;
当接收到PC发送的进程显示指令时,复制所述中间文件生成显示文件;
读取所述显示文件的进程信息进行显示。
在上述实施例的基础上,本申请还提供了一种服务器,该服务器包括上述实施例中的基板管理控制器,且该服务器系统上配置有进程监控代理。
在上述实施例的基础上,本申请还提供了一种服务器进程监控系统。图3为本申请实施例提供的一种服务器进程监控系统结构示意图,如图3所示,该系统包括PC机和至少一个上述实施例中的服务器,在图3中示出了N个服务器,分别为服务器1、服务器2、……、服务器N。PC机和该N个服务器通信连接,用户可以通过PC机登录任意一个服务器的BMC,进而查看服务器系统进程。例如,当用户需要查看服务器1的系统进程时,在PC机上登录服务器1的BMC的I P,通过该BMC的web界面查看服务器1的系统进程,进而实现对服务器集群中系统进程的集中监控。
本领域的技术人员可以清楚地了解到本申请实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本申请实施方式并不构成对本申请保护范围的限定。

Claims (9)

1.一种监控服务器系统进程的方法,其特征在于,包括:
基板管理控制器BMC接收服务器系统上配置的进程监控代理写入的进程信息,生成临时文件,所述进程信息为服务器开机后,所述进程监控代理监控到的进程信息;
当接收到所述进程监控代理发送的写中止指令时,复制所述临时文件,生成中间文件;
当接收到PC发送的进程显示指令时,复制所述中间文件生成显示文件;
读取所述显示文件的进程信息进行显示。
2.根据权利要求1所述的方法,其特征在于,所述接收服务器系统上配置的进程监控代理写入的进程信息,包括:
接收服务器系统上配置的进程监控代理通过IPMI接口写入的进程信息。
3.根据权利要求1所述的方法,其特征在于,所述读取所述显示文件的进程信息进行显示,包括:
读取所述显示文件的进程信息在web界面中进行显示。
4.一种监控服务器系统进程的装置,其特征在于,包括:
接收模块,用于接收服务器系统上配置的进程监控代理写入的进程信息,生成临时文件,所述进程信息为服务器开机后,所述进程监控代理监控到的进程信息;
第一复制模块,用于当接收到所述进程监控代理发送的写中止指令时,复制所述临时文件,生成中间文件;
第二复制模块,用于当接收到PC发送的进程显示指令时,复制所述中间文件生成显示文件;
读取模块,用于读取所述显示文件的进程信息进行显示。
5.根据权利要求4所述的装置,其特征在于,所述接收模块,具体用于:
接收服务器系统上配置的进程监控代理通过IPMI接口写入的进程信息。
6.根据权利要求4所述的装置,其特征在于,所述读取模块,具体用于:
读取所述显示文件的进程信息在web界面中进行显示。
7.一种基板管理控制器,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-3任一项所述的方法。
8.一种服务器,其特征在于,所述服务器包括权利要求7所述的基板管理控制器,所述服务器系统上配置有进程监控代理。
9.一种服务器进程监控系统,其特征在于,包括PC机和至少一个权利要求8所述的服务器,所述PC机与至少一个所述服务器的基板管理控制器通信连接。
CN201810073283.0A 2018-01-25 2018-01-25 一种监控服务器系统进程的方法及装置 Pending CN108280012A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810073283.0A CN108280012A (zh) 2018-01-25 2018-01-25 一种监控服务器系统进程的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810073283.0A CN108280012A (zh) 2018-01-25 2018-01-25 一种监控服务器系统进程的方法及装置

Publications (1)

Publication Number Publication Date
CN108280012A true CN108280012A (zh) 2018-07-13

Family

ID=62805048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810073283.0A Pending CN108280012A (zh) 2018-01-25 2018-01-25 一种监控服务器系统进程的方法及装置

Country Status (1)

Country Link
CN (1) CN108280012A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783015A (zh) * 2018-12-24 2019-05-21 新华三技术有限公司 文件传输方法、装置、服务器及存储介质
CN110943855A (zh) * 2019-11-19 2020-03-31 山东超越数控电子股份有限公司 一种通过bmc实现服务器宕机后状态恢复的方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101577698A (zh) * 2008-05-09 2009-11-11 中兴通讯股份有限公司 带外智能管理服务器系统及监控服务器和处理命令方法
CN102200941A (zh) * 2010-03-25 2011-09-28 杭州华三通信技术有限公司 进程状态监控方法及单元
CN102323905A (zh) * 2011-07-21 2012-01-18 曙光信息产业股份有限公司 一种龙芯主板的远程监控系统
CN103984616A (zh) * 2014-05-23 2014-08-13 浪潮(北京)电子信息产业有限公司 一种服务器监控方法及服务器
CN104104725A (zh) * 2014-07-23 2014-10-15 浪潮集团有限公司 一种应用于云计算的分层异构结构的服务器管理系统
CN105224436A (zh) * 2015-10-29 2016-01-06 曙光信息产业股份有限公司 一种服务器运行状态监控方法及装置
US20160182130A1 (en) * 2014-12-23 2016-06-23 Dell Products L.P. Information Handling System with Multi-Purpose NFC Antenna
CN106161145A (zh) * 2016-07-25 2016-11-23 天脉聚源(北京)传媒科技有限公司 一种服务器系统运行状态信息的监控方法和系统
CN106776212A (zh) * 2016-12-09 2017-05-31 中电科华云信息技术有限公司 容器集群部署多进程应用的监管系统及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101577698A (zh) * 2008-05-09 2009-11-11 中兴通讯股份有限公司 带外智能管理服务器系统及监控服务器和处理命令方法
CN102200941A (zh) * 2010-03-25 2011-09-28 杭州华三通信技术有限公司 进程状态监控方法及单元
CN102323905A (zh) * 2011-07-21 2012-01-18 曙光信息产业股份有限公司 一种龙芯主板的远程监控系统
CN103984616A (zh) * 2014-05-23 2014-08-13 浪潮(北京)电子信息产业有限公司 一种服务器监控方法及服务器
CN104104725A (zh) * 2014-07-23 2014-10-15 浪潮集团有限公司 一种应用于云计算的分层异构结构的服务器管理系统
US20160182130A1 (en) * 2014-12-23 2016-06-23 Dell Products L.P. Information Handling System with Multi-Purpose NFC Antenna
CN105224436A (zh) * 2015-10-29 2016-01-06 曙光信息产业股份有限公司 一种服务器运行状态监控方法及装置
CN106161145A (zh) * 2016-07-25 2016-11-23 天脉聚源(北京)传媒科技有限公司 一种服务器系统运行状态信息的监控方法和系统
CN106776212A (zh) * 2016-12-09 2017-05-31 中电科华云信息技术有限公司 容器集群部署多进程应用的监管系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SILIAMPAN: "服务器状态监控之snmp&ipmi-silianpan", 《HTTPS://WWW.CNBLOGS.COM/PANLIU/P/4664196.HTML》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783015A (zh) * 2018-12-24 2019-05-21 新华三技术有限公司 文件传输方法、装置、服务器及存储介质
CN110943855A (zh) * 2019-11-19 2020-03-31 山东超越数控电子股份有限公司 一种通过bmc实现服务器宕机后状态恢复的方法

Similar Documents

Publication Publication Date Title
Liu et al. FogWorkflowSim: An automated simulation toolkit for workflow performance evaluation in fog computing
DE112020002987B4 (de) Bereitstellen von mikrodiensten über eine dienstinfrastruktur hinweg
CN100578455C (zh) 提交给网格环境的网格作业使用前的资源功能性验证
CN107368365A (zh) 云平台自动运维方法、系统、设备及存储介质
CN103369054B (zh) 一种采集任务管理方法及系统
CN106161145A (zh) 一种服务器系统运行状态信息的监控方法和系统
CN112527647B (zh) 基于NS-3的Raft共识算法测试系统
US11743155B2 (en) Systems and methods of monitoring and controlling remote assets
CN106919485A (zh) 一种基于服务器上配置硬件测试工具的系统
US11301362B1 (en) Control system for distributed load generation
Beckman et al. Exascale operating systems and runtime software report
CN207731148U (zh) 基于虚拟技术的工业控制系统
CN108280012A (zh) 一种监控服务器系统进程的方法及装置
Meng et al. Service-oriented reliability modeling and autonomous optimization of reliability for public cloud computing systems
US20050198614A1 (en) Management platform and evironment
US11372702B2 (en) Optimized high availability management using cluster-wide view
CN117349014A (zh) 基于集群资源的模型训练方法、装置、电子设备及介质
CN114579250A (zh) 一种构建虚拟集群的方法、装置及存储介质
CN107544830A (zh) 一种自动安装数据库的方法及装置
US8438271B2 (en) Performing services in a network data processing system
US7490326B2 (en) Gathering operational metrics within a grid environment using ghost agents
CN113204460A (zh) U盾测试方法、装置、设备和介质
CN109450686B (zh) 一种基于普适网络的网络资源管理系统及方法
Al-Ghuwairi et al. Optimizing Clustering Approaches in Cloud Environments.
Basa et al. Automation Process of Telecommunication Networks Deployment in Microsoft Azure Cloud Technology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180713