CN110928739A - 一种进程监控方法、装置以及计算设备 - Google Patents

一种进程监控方法、装置以及计算设备 Download PDF

Info

Publication number
CN110928739A
CN110928739A CN201811096552.1A CN201811096552A CN110928739A CN 110928739 A CN110928739 A CN 110928739A CN 201811096552 A CN201811096552 A CN 201811096552A CN 110928739 A CN110928739 A CN 110928739A
Authority
CN
China
Prior art keywords
node
resource occupation
data
resource
occupancy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811096552.1A
Other languages
English (en)
Other versions
CN110928739B (zh
Inventor
孙相征
何万青
贺荣徽
李临川
田永军
余洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811096552.1A priority Critical patent/CN110928739B/zh
Publication of CN110928739A publication Critical patent/CN110928739A/zh
Application granted granted Critical
Publication of CN110928739B publication Critical patent/CN110928739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/323Visualisation of programs or trace data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种进程监控方法、装置以及计算设备。所述方法包括:获取各节点的进程信息采集模块采集的各进程的资源占用数据;根据目标节点在目标时间段内各进程的资源占用数据,在显示界面中展示反映资源占用数据随时间变化的曲线图形。根据本发明,能够直观显示进程对资源数据占用率随时间的变化规律和异常变化。

Description

一种进程监控方法、装置以及计算设备
技术领域
本发明涉及集群监控领域,具体涉及一种对集群中节点的进程监控方法、装置以及计算设备。
背景技术
计算机集群简称”集群”,是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来,高度紧密地协作完成计算工作。集群系统中的单个计算机通常称为节点,每个集群节点都是运行其自己进程的一个独立计算设备。
在应用程序运行过程中,需要有效监控集群系统的进程信息,并能够直观的显示,以便于了解系统资源的使用状况,尽早发现进程异常并做出相应的响应操作,避免计算资源的浪费。
现有的进程监控工具通常以命令行或图形窗口形式显示系统当前进程的信息,但有以下不足:
(1)主要适用于单节点采集,采集结果多为数值类型,当数值过多时很难发现变化规律和突发异常,需要单独做可视化的处理,尤其在多节点环境下,还需要考虑结果汇总以及多节点多监控指标的可视化展现。
(2)由于集群中每个节点运行多个进程,每个进程信息有多种,如进程号、进程名称、CPU占用率和内存占用率等,而现有监控工具多是显示节点当前实时的进程性能数据,导致无法直观的展现节点进程的历史信息和变化规律。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的进程监控方案。
根据本发明的一个方面,提供了一种进程监控方法,适于对计算机集群中节点的进程进行监控,所述计算机集群包括至少两个节点,每个节点运行至少一个进程,且各节点中布置有进程信息采集模块,所述进程信息采集模块适于采集节点的各进程的资源占用数据,所述方法包括:
获取各节点的进程信息采集模块采集的各进程的资源占用数据;
根据目标节点在目标时间段内各进程的资源占用数据,在显示界面中展示反映资源占用数据随时间变化的曲线图形。
可选地,在根据本发明的进程监控方法中,所述资源占用数据包括至少一个资源占用指标,所述在显示界面中展示反映资源占用数据随时间变化的曲线图形,包括:确定所述资源占用数据中待展示的资源占用指标;对于目标时间段内的每个采集时间点,按照从大到小的顺序获取N个资源占用指标值,其中,N≥1;在显示界面中绘制N条曲线图形,且第i条曲线图形的每个点对应于,N个资源占用指标值中第i大的资源占用指标值,其中,1≤i≤N。
可选地,在根据本发明的进程监控方法中,在任一时间点处,相邻的两条曲线图形之间的距离为,位于上方的曲线图形在该时间点处的资源占用指标值,且位于最下方的曲线图形与时间轴之间的距离为,该曲线图形在该时间点处的资源占用值。
可选地,在根据本发明的进程监控方法中,相邻的两条曲线图形之间、以及位于最下方的曲线图形与时间轴之间,分别以不同的颜色填充。
可选地,根据本发明的进程监控方法,还包括:确定预定时间点处,所述N个资源占用指标值分别对应的N个进程;在显示界面显示所述曲线图形的区域下方,展示所述N个进程的进程信息。
可选地,在根据本发明的进程监控方法中,所述进程信息包括进程号、进程名称和资源占用数据。
可选地,在根据本发明的进程监控方法中,所述资源占用数据包括如下的资源占用指标:CPU占用率和内存占用率。
根据本发明的另一个方面,提供了一种进程监控装置,适于对服务器集群中节点的进程进行监控,所述服务器集群包括至少两个节点,每个节点运行至少一个进程,且各节点中布置有进程信息采集模块,所述进程信息采集模块适于采集节点的各进程的资源占用数据,所述装置包括:
数据获取模块,适于获取各节点的进程信息采集模块采集的各进程的资源占用数据;
展示模块,适于根据目标节点在目标时间段内各进程的资源占用数据,在显示界面中展示反映资源占用数据随时间变化的曲线图形。
根据本发明的另一个方面,提供了一种计算设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据上述进程监控方法中的任一方法的指令。
根据本发明的另一个方面,一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由移动终端执行时,使得所述移动终端执行根据上述进程监控方法中的任一方法。
根据本发明的进程监控方案,能够自动采集、保存、显示集群各节点的进程信息,展示指标取值前N个进程的指定信息随时间的变化曲线,同时还可以列出N个进程的详细信息。由于系统负载动态变化,前N个进程的信息在不同时间点也不尽相同,从而能够直观显示进程对资源数据占用率随时间的变化规律和异常变化。
根据本发明的进程监控方案,还能够根据时间显示历史进程,将进程的历史信息详情进行呈现,相比现有工具的实时信息显示,本发明无需时刻监视进程的动态变化信息也不会出现信息遗漏,更直观显示出了进程详细信息的阶段性变化特征。并且,还可以根据历史数据,查找异常信息,便于客户确认进程曾经发生过的异常。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的进程监控系统的结构图;
图2示出了根据本发明一个实施例的进程监控方法的流程图;
图3示出了本发明实施例中的一种监控界面示意图;
图4示出了本发明实施例中的另一种监控界面示意图;
图5示出了根据本发明一个实施例的进程监控装置的结构图;
图6示出了布置为实现根据本发明的进程监控方法的示例计算设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的进程监控系统100的结构图。如图1所示,系统100包括进程信息存储设备110、用于对集群节点的进程进行监控的计算设备120和至少两个节点130-1、130-2...130-N,且节点130-1、130-2...130-N属于一个集群,或者,也可以属于多个集群。每个节点可以是一个独立的计算实体(例如一台高性能计算机或者云网络中一台服务器实体),每个节点可以运行至少一个进程。
为了进行进程监控,可以在各节点中布置进程信息采集模块,进程信息采集模块可以采集关于节点的各进程的进程信息,进程信息例如包括进程号、进程名称和资源占用数据。资源占用数据例如包括CPU占用率和内存占用率,但不限于此。
在根据本发明一个实施例中,进程信息采集模块可以被配置为通过调用该节点的操作系统(例如Linux或Windows server等)提供的标准接口(API)来获取节点中当前运行的进程的进程信息。另外,进程信息采集模块还可以是公知的各种可以收集节点进程信息的应用,这里不再赘述。
例如,在Linux系统中,系统对进程的统计信息记录在/proc/[进程ID]目录下,进程信息采集模块可以通过解析相应的文件字段获取进程信息。如果需要获取进程ID为2的进程的CPU利用率相关信息,则可以截取/proc/2/stat的信息,示例性代码如下:
$cat/proc/2/stat
2(kthreadd)S 0 0 0 0-1 2138176 0 0 0 0 0 6 0 0 20 0 1 0 5 0 0184467440737095516150 0 0 0 0 0 0 2147483647 0 18446744073709551615 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0
进程信息采集模块按照一定的频率采集进程信息,例如每1秒采集一次,然后将采集的进程信息发送给进程信息存储设备110,由进程信息存储设备110进行汇总和保存,以便计算设备120对进程的历史信息进行查询,并对查询到的进程信息进行图形化展示。在进程信息存储设备110中,进程信息可以通过关系型数据库进行存储,也可以采用no-sql数据库的键值对(key-value)方式存储。
在此基础上,计算设备120可以提取节点的进程信息,以便对节点中的进程运行情况进行监控。下面结合图2对计算设备120所执行的进程监控方法的流程进行示例性说明。
图2示出了根据本发明一个实施例的进程监控方法200的流程图。方法200在计算设备120中执行,适于对计算机集群中节点的进程进行监控,计算机集群包括至少两个节点,每个节点运行至少一个进程,且各节点中布置有进程信息采集模块。
参照图2,方法200始于步骤S210,在步骤S210中,获取各节点的进程信息采集模块所采集的各进程的资源占用数据。如前所述,进程信息存储设备110存储有集群中所有节点的进程信息,计算设备120通过进程信息存储设备110提供的数据访问控制接口,可以获取到其所需要的进程信息,并从获取到的进程信息中提取资源占用数据,例如CPU占用率和内存占用率。
在步骤S220中,根据目标节点在目标时间段内各进程的资源占用数据,在显示界面中展示反映资源占用数据随时间变化的曲线图形。
在监控过程中,将用户在计算设备120中输入或选择的待监控节点,作为目标节点,将用户在计算设备120中输入或选择的监控时间段,作为目标时间段。对目标节点在目标数据段内各进程的资源占用数据进行统计,并根据统计结果在计算设备120的显示界面中绘制各种曲线图形,该曲线图形可以反映出资源占用数据在这一时间段内的变化情况。
在本发明实施例中,所述资源占用数据包括CPU占用率和内存占用率两个资源占用指标,可以根据用户选择,来确定在计算设备120中绘制关于CPU占用率随时间的变化曲线,或者,绘制关于内存占用率随时间的变化曲线。
在一种实现方式中,在计算设备120的显示界面中展示反映资源占用数据随时间变化的曲线图形,包括:
首先,对于目标时间段内的每个采集时间点,按照从大到小的顺序获取N个资源占用指标值,其中,N≥1。N可以根据具体应用场景进行设置,例如N取值为5。
以待展示的资源占用指标为CPU占用率为例,在t1时刻,排名前5的CPU占用率值为:a1,a2,a3,a4,a5;对应的进程为:进程1,进程2,进程3,进程4,进程5。在t2时刻,排名前5的CPU占用率值为:b1,b2,b3,b4,b5;对应的进程为:进程2,进程3,进程1,进程4,进程5。假设目标时间段包括100个采集时间点,则共获取到100组数据。
然后,在显示界面中绘制N条曲线图形,且第i条曲线图形的每个点对应于,N个资源占用指标值中第i大的资源占用指标值,其中,1≤i≤N。
仍然以上述数据为例,第1条曲线图形中的每个点均对应于相应时刻的最大的CPU占用率值,即其包括的点为:(a1,t1)(b1,t2),……,共100个点。第2条曲线图形中的每个点均对应于相应时刻的第2大的CPU占用率值,即其包括的点为:(a2,t1)(b2,t2),……,共100个点。
这样,通过建立一xy坐标系,以x轴为时间轴,y轴为资源占用指标值(例如CPU占用率),将各时间点上的资源占用指标值进行连接,将连接得到的图形做平滑处理,并得到相应的曲线图形。
可以看出,同一条曲线中的各点不一定是属于同一个进程,也就是说,同一条曲线并非对应一个进程。相比于同一条曲线对应同一个进程,本发明实施例的展示方案能够更清晰和直观的反映出节点的整体运行状况。
在一种实现方式中,所展示的N条曲线图形,在任一时间点处,相邻的两条曲线图形之间的距离为,位于上方的曲线图形在该时间点处的资源占用指标值,且位于最下方的曲线图形与时间轴之间的距离为,该曲线图形在该时间点处的资源占用值。进一步,还可以在相邻的两条曲线图形之间、以及位于最下方的曲线图形与时间轴之间,分别以不同的颜色填充。
图3示出了本发明实施例中的一种监控界面示意图。在图3中,节点名称为coumpte25,从上到下共展示出5条曲线,最上面的曲线为CPU占用率最大值对应的曲线,第2条曲线为CPU占用率次大值对应的曲线,…,最下面的曲线为CPU占用率排名第5对应的曲线,并分别填充有蓝、绿、黄、灰、紫5种颜色。
本发明实施例的进程监控方法,还可以在显示界面中展示N个进程的详细信息。具体包括:确定预定时间点处,所述N个资源占用指标值分别对应的N个进程;在显示界面显示所述曲线图形的区域下方,展示所述N个进程的进程信息,例如,以表格方式展示。
例如,在图3中,预定时间点为18:48:02,在曲线区域下方展示了5个进程的进程信息,按照CPU占用率从高到低如下:
CPU占用率:3.15%,内存占用率:0.40%,进程PID:001,进程名:"abc.exe";
CPU占用率:3.15%,内存占用率:0.40%,进程PID:002,进程名:"abc.exe";
CPU占用率:3.12%,内存占用率:0.40%,进程PID:003,进程名:"abc.exe";
CPU占用率:3.12%,内存占用率:0.40%,进程PID:004,进程名:"abc.exe";
CPU占用率:3.12%,内存占用率:0.39%,进程PID:005,进程名:"abc.exe"。
然后,根据用户选择,改变要显示具体信息的时间。在图4中,预定时间点为18:51:15,在曲线区域下方展示了5个进程的进程信息,按照CPU占用率从高到低如下:
CPU占用率:3.16%,内存占用率:0.40%,进程PID:006,进程名:"abc.exe";
CPU占用率:3.16%,内存占用率:0.40%,进程PID:007,进程名:"abc.exe";
CPU占用率:3.13%,内存占用率:0.40%,进程PID:008,进程名:"abc.exe";
CPU占用率:3.13%,内存占用率:0.40%,进程PID:009,进程名:"abc.exe";
CPU占用率:3.13%,内存占用率:0.40%,进程PID:010,进程名:"abc.exe"。
可见,在上述两个时间点,CPU占用率排名第一的进程发生了变化。
综上所述,本发明实施例的进程监控方案能够自动采集、保存、显示集群各节点的进程信息,显示指标取值前N个进程的指定信息随时间的变化曲线,同时还可以列出N个进程的详细信息。由于系统负载动态变化,前N个进程的信息在不同时间点也不尽相同,从而能够直观显示进程对资源数据占用率随时间的变化规律和异常变化。
并且,通过监控进程级别的资源占用率信息,可以详细记录运行过程中资源占用高的历史日志信息,从而便于排查进程或系统异常。如,当集群被非法入侵后,进程级别采集可以记录CPU资源使用的进程名,并以此判断是否是用户有用的进程,进而识别非法进程的信息;在多进程应用运行过程中,观测每个进程的资源使用占比,能够筛选资源使用异常的进程,作为分析应用运行行为的依据。
图5示出了根据本发明一个实施例的进程监控装置300的结构图。装置300驻留在计算设备120中,适于对服务器集群中节点的进程进行监控,服务器集群包括至少两个节点,每个节点运行至少一个进程,且各节点中布置有进程信息采集模块,所述进程信息采集模块适于采集节点的各进程的资源占用数据。这里,计算设备例如可以被实现为桌面计算机或笔记本计算机配置的个人计算机。计算设备也可以被实现为服务器设备或者移动终端(例如手机、个人数字设备或者可穿戴智能设备等),这里不再赘述。
参照图5,装置300包括:
数据获取模块310,适于获取各节点的进程信息采集模块采集的各进程的资源占用数据;
展示模块320,适于根据目标节点在目标时间段内各进程的资源占用数据,在显示界面中展示反映资源占用数据随时间变化的曲线图形。
需要说明的是,数据获取模块310所执行的处理与步骤S210所执行的处理相同,展示模块320所执行的处理与步骤S220所执行的处理相同,具体可参照上文的描述,这里不做赘述。
图6是布置为实现根据本发明的节点监控方法的示例计算设备900的框图。在基本的配置902中,计算设备900典型地包括系统存储器906和一个或者多个处理器904。存储器总线908可以用于在处理器904和系统存储器906之间的通信。
取决于期望的配置,处理器904可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器904可以包括诸如一级高速缓存910和二级高速缓存912之类的一个或者多个级别的高速缓存、处理器核心914和寄存器916。示例的处理器核心914可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器918可以与处理器904一起使用,或者在一些实现中,存储器控制器918可以是处理器904的一个内部部分。
取决于期望的配置,系统存储器906可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器906可以包括操作系统920、一个或者多个程序922以及程序数据924。程序数据924可以包括可用于如此处所述的进程信息928。在一些实施方式中,程序922可以布置为在操作系统上利用程序数据924进行操作。
计算设备900还可以包括有助于从各种接口设备(例如,输出设备942、外围接口944和通信设备946)到基本配置902经由总线/接口控制器930的通信的接口总线940。示例的输出设备942包括图形处理单元948和音频处理单元950。它们可以被配置为有助于经由一个或者多个A/V端口952与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外围接口944可以包括串行接口控制器954和并行接口控制器956,它们可以被配置为有助于经由一个或者多个I/O端口958和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备946可以包括网络控制器960,其可以被布置为便于经由一个或者多个通信端口964与一个或者多个其他计算设备962通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备900可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备900还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的节点监控装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种进程监控方法,适于对计算机集群中节点的进程进行监控,所述计算机集群包括至少两个节点,每个节点运行至少一个进程,且各节点中布置有进程信息采集模块,所述进程信息采集模块适于采集节点的各进程的资源占用数据,所述方法包括:
获取各节点的进程信息采集模块采集的各进程的资源占用数据;
根据目标节点在目标时间段内各进程的资源占用数据,在显示界面中展示反映资源占用数据随时间变化的曲线图形。
2.如权利要求1所述的方法,其中,所述资源占用数据包括至少一个资源占用指标,所述在显示界面中展示反映资源占用数据随时间变化的曲线图形,包括:
确定所述资源占用数据中待展示的资源占用指标;
对于目标时间段内的每个采集时间点,按照从大到小的顺序获取N个资源占用指标值,其中,N≥1;
在显示界面中绘制N条曲线图形,且第i条曲线图形的每个点对应于,N个资源占用指标值中第i大的资源占用指标值,其中,1≤i≤N。
3.如权利要求2所述的方法,其中,在任一时间点处,相邻的两条曲线图形之间的距离为,位于上方的曲线图形在该时间点处的资源占用指标值,且位于最下方的曲线图形与时间轴之间的距离为,该曲线图形在该时间点处的资源占用值。
4.如权利要求3所述的方法,其中,相邻的两条曲线图形之间、以及位于最下方的曲线图形与时间轴之间,分别以不同的颜色填充。
5.如权利要求2至4中任一项所述的方法,还包括:
确定预定时间点处,所述N个资源占用指标值分别对应的N个进程;
在显示界面显示所述曲线图形的区域下方,展示所述N个进程的进程信息。
6.如权利要求5所述的方法,其中,所述进程信息包括进程号、进程名称和资源占用数据。
7.如权利要求1或6所述的方法,其中,所述资源占用数据包括如下的资源占用指标:CPU占用率和内存占用率。
8.一种进程监控装置,适于对服务器集群中节点的进程进行监控,所述服务器集群包括至少两个节点,每个节点运行至少一个进程,且各节点中布置有进程信息采集模块,所述进程信息采集模块适于采集节点的各进程的资源占用数据,所述装置包括:
数据获取模块,适于获取各节点的进程信息采集模块采集的各进程的资源占用数据;
展示模块,适于根据目标节点在目标时间段内各进程的资源占用数据,在显示界面中展示反映资源占用数据随时间变化的曲线图形。
9.一种计算设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-7中所述的方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由移动终端执行时,使得所述移动终端执行根据权利要求1-8中所述的方法中的任一方法。
CN201811096552.1A 2018-09-19 2018-09-19 一种进程监控方法、装置以及计算设备 Active CN110928739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811096552.1A CN110928739B (zh) 2018-09-19 2018-09-19 一种进程监控方法、装置以及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811096552.1A CN110928739B (zh) 2018-09-19 2018-09-19 一种进程监控方法、装置以及计算设备

Publications (2)

Publication Number Publication Date
CN110928739A true CN110928739A (zh) 2020-03-27
CN110928739B CN110928739B (zh) 2024-03-26

Family

ID=69855299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811096552.1A Active CN110928739B (zh) 2018-09-19 2018-09-19 一种进程监控方法、装置以及计算设备

Country Status (1)

Country Link
CN (1) CN110928739B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639006A (zh) * 2020-05-29 2020-09-08 深圳前海微众银行股份有限公司 一种集群的进程管理方法及装置
CN111767188A (zh) * 2020-05-25 2020-10-13 云知声智能科技股份有限公司 一种训练任务监控方法及装置
CN112052142A (zh) * 2020-09-08 2020-12-08 深圳创维-Rgb电子有限公司 性能的监控方法、设备、装置及计算机可读存储介质
CN112328446A (zh) * 2020-10-28 2021-02-05 成都安易迅科技有限公司 程序进程的监控方法、装置及计算机设备
CN113535514A (zh) * 2021-07-02 2021-10-22 中科曙光国际信息产业有限公司 作业跟踪方法、装置、计算机设备和存储介质
CN113934475A (zh) * 2021-08-10 2022-01-14 荣耀终端有限公司 应用调用的分析方法及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011085687A1 (zh) * 2010-01-14 2011-07-21 华为技术有限公司 休眠定时器控制方法和装置及通讯系统
US20130097601A1 (en) * 2011-10-12 2013-04-18 International Business Machines Corporation Optimizing virtual machines placement in cloud computing environments
CN105429813A (zh) * 2014-09-17 2016-03-23 北京奇虎科技有限公司 docker的监控方法及客户端
CN106201819A (zh) * 2016-06-28 2016-12-07 乐视控股(北京)有限公司 应用容器引擎的系统资源占用量监控方法和装置
CN108153587A (zh) * 2017-12-26 2018-06-12 北京航空航天大学 一种针对大数据平台的慢任务原因检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011085687A1 (zh) * 2010-01-14 2011-07-21 华为技术有限公司 休眠定时器控制方法和装置及通讯系统
US20130097601A1 (en) * 2011-10-12 2013-04-18 International Business Machines Corporation Optimizing virtual machines placement in cloud computing environments
CN105429813A (zh) * 2014-09-17 2016-03-23 北京奇虎科技有限公司 docker的监控方法及客户端
CN106201819A (zh) * 2016-06-28 2016-12-07 乐视控股(北京)有限公司 应用容器引擎的系统资源占用量监控方法和装置
CN108153587A (zh) * 2017-12-26 2018-06-12 北京航空航天大学 一种针对大数据平台的慢任务原因检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑国勋;张华;张晓贤;赵亮;王若金;: "基于VB.NET语言的双纵轴多曲线平面曲线控件", 长春工程学院学报(自然科学版), no. 04, 15 December 2014 (2014-12-15) *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767188A (zh) * 2020-05-25 2020-10-13 云知声智能科技股份有限公司 一种训练任务监控方法及装置
CN111767188B (zh) * 2020-05-25 2023-12-19 云知声智能科技股份有限公司 一种训练任务监控方法及装置
CN111639006A (zh) * 2020-05-29 2020-09-08 深圳前海微众银行股份有限公司 一种集群的进程管理方法及装置
CN112052142A (zh) * 2020-09-08 2020-12-08 深圳创维-Rgb电子有限公司 性能的监控方法、设备、装置及计算机可读存储介质
CN112328446A (zh) * 2020-10-28 2021-02-05 成都安易迅科技有限公司 程序进程的监控方法、装置及计算机设备
CN112328446B (zh) * 2020-10-28 2024-04-30 成都安易迅科技有限公司 程序进程的监控方法、装置及计算机设备
CN113535514A (zh) * 2021-07-02 2021-10-22 中科曙光国际信息产业有限公司 作业跟踪方法、装置、计算机设备和存储介质
CN113934475A (zh) * 2021-08-10 2022-01-14 荣耀终端有限公司 应用调用的分析方法及电子设备

Also Published As

Publication number Publication date
CN110928739B (zh) 2024-03-26

Similar Documents

Publication Publication Date Title
CN110928739B (zh) 一种进程监控方法、装置以及计算设备
CN102968338A (zh) 用于电子设备的应用程序分类的方法、装置及电子设备
US9218177B2 (en) Techniques to optimize upgrade tasks
US10223397B1 (en) Social graph based co-location of network users
CN107748691B (zh) 虚拟机部署方法、装置、设备及计算机可读存储介质
CN111277274B (zh) 数据压缩方法、装置、设备及存储介质
CN111078556B (zh) 应用测试方法及装置
CN114090838B (zh) 大数据可视化展示的方法、系统、电子装置和存储介质
US9721362B2 (en) Auto-completion of partial line pattern
US20150161123A1 (en) Techniques to diagnose live services
CN115190010A (zh) 基于软件服务依赖关系的分布推荐方法和装置
CN108062401B (zh) 应用推荐方法、装置及存储介质
CN115794245B (zh) 数据加载方法及装置、电子设备、存储介质
CN110767264B (zh) 一种数据处理方法、装置和计算机可读存储介质
CN114816389B (zh) 一种基于元模型的管理系统搭建方法、装置、设备及介质
CN116168403A (zh) 医疗数据分类模型训练方法、分类方法、装置及相关介质
CN113392010B (zh) 公共组件测试方法、装置、电子设备及存储介质
CN114996369A (zh) 一种数据仓库指标库的构建方法和装置
CN114048847A (zh) 一种图神经网络数据缓存方法、装置、设备及存储介质
CN112667682A (zh) 数据处理方法、装置、计算机设备和存储介质
CN117332153B (zh) 一种基于区间矩阵的标签选择方法、系统、设备及介质
CN110825696B (zh) 处理方法及处理装置
WO2014176181A1 (en) Searching of line pattern representations using gestures
CN110601890B (zh) 一种网络性能分析方法、装置、设备及可读存储介质
TWI443524B (zh) 使用者行為追蹤及記錄系統與方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40026847

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant