CN113051124A - 设备监控方法、装置、服务器及存储介质 - Google Patents

设备监控方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN113051124A
CN113051124A CN201911379517.5A CN201911379517A CN113051124A CN 113051124 A CN113051124 A CN 113051124A CN 201911379517 A CN201911379517 A CN 201911379517A CN 113051124 A CN113051124 A CN 113051124A
Authority
CN
China
Prior art keywords
performance
monitoring
equipment
data
performance information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911379517.5A
Other languages
English (en)
Inventor
郑印
李可飞
郭建楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Suzhou Software Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201911379517.5A priority Critical patent/CN113051124A/zh
Publication of CN113051124A publication Critical patent/CN113051124A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例公开了设备监控方法、装置、服务器及存储介质,方法包括:添加针对设备的性能监控项;基于所述性能监控项,获取所述设备的性能数据;基于所述设备的性能数据,确定所述设备的性能信息。如此,解决了如何监控集群中各个设备的性能信息的问题。

Description

设备监控方法、装置、服务器及存储介质
技术领域
本申请涉及云计算技术领域,尤其涉及一种设备监控方法、装置、服务器及存储介质。
背景技术
Ceph是一个统一的分布式存储系统,它的设计目标是构建一个大规模、具有高可用性,高扩展性和高性能的分布式存储系统。
目前,Ceph能够对集群或者集群中的某个存储池进行监控。具体地,管理器每隔一段时间调用Ceph提供的命令“ceph osd pool stats”,从而获得集群或者某个存储池的性能监控信息。如此,上述性能监控的方法,只能针对集群或者某个存储池的进行性能监控,监控粒度粗,并且性能监控信息只能反映总体的性能情况。因此,如何监控集群中各个设备的性能信息,已经成为Ceph对集群进行监控时需要面对的难题。
发明内容
本申请实施例提供一种设备监控方法、装置、服务器及存储介质,能够监控集群中各个设备的性能信息。
为达到上述目的,本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供一种设备监控方法,设备监控方法包括:
添加针对设备的性能监控项;
基于性能监控项,获取设备的性能数据;
基于设备的性能数据,确定设备的性能信息。
在一些实施例中,所述设备包括以下至少之一:块设备和客户端。
在一些实施例中,添加针对设备的性能监控项,包括:
获取命令行界面输入的注册监控项命令;
根据注册监控项命令,设置性能监控项。
在一些实施例中,基于性能监控项,获取设备的性能数据,包括:
获取第一上报周期内每个操作对应的操作数据;
将操作对应的设备的全部操作数据进行统计,得到设备的性能数据。
在一些实施例中,基于设备的性能数据,确定设备的性能信息,包括:
性能信息包括读写延迟,基于设备的性能数据中请求发起的时间和处理请求结束的时间,确定设备的性能信息的读写延迟。
在一些实施例中,基于设备的性能数据,确定设备的性能信息,包括:
性能信息包括读写带宽,基于设备的性能数据中操作数据的大小和第一上报周期,确定设备的性能信息的读写带宽。
在一些实施例中,基于设备的性能数据,确定设备的性能信息,包括:
性能信息包括每秒读写次数,基于设备的性能数据中操作个数和第一上报周期,确定设备的每秒读写次数。
在一些实施例中,在设备为块设备的情况下,设备监控方法还包括:
基于块设备的性能信息,确定块设备对应的客户端的性能信息。
第二方面,本申请实施例提供一种设备监控装置,装置包括:添加模块、获取模块和第一确定模块;
添加模块,用于添加针对设备的性能监控项;
获取模块,用于基于性能监控项,获取设备的性能数据;
第一确定模块,用于基于设备的性能数据,确定设备的性能信息。
第三方面,本申请实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时以实现以如本申请任一实施例所提供的设备监控方法的步骤。
第四方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质上存储有设备监控程序,所述设备监控程序被处理器执行时实现本申请任一实施例所提供的设备监控方法的步骤。
上述实施例所提供的设备监控方法,设备监控方法包括:添加针对设备的性能监控项;基于性能监控项,获取设备的性能数据;基于设备的性能数据,确定设备的性能信息。如此,通过添加针对设备的性能监控项,设备监控装置能够对集群中的各个设备进行性能监控,确定出集群中各个设备的性能信息,从而解决了如何监控集群中各个设备的性能信息的问题。
附图说明
图1为现有技术中块存储写数据的处理流程示意图;
图2为本申请一实施例中设备监控方法的处理流程示意图;
图3为本申请一实施中添加针对设备的性能监控项的处理流程示意图;
图4为本申请一实施中添加针对设备的性能监控项的函数调用示意图;
图5为本申请一实施中获取设备的性能数据的函数调用示意图;
图6为本申请一实施例中Ceph的部署架构;
图7为本申请一实施例中基于设备的性能数据确定设备的性能信息的处理流程示意图;
图8为本申请一实施例中基于设备的性能数据确定设备的性能信息的函数调用示意图;
图9为本申请一实施例中设备监控装置的结构示意图;
图10为本申请一实施中服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对申请的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
在对本申请实施例提供一种设备监控方法进行详细描述之前,首先对本申请涉及技术术语进行简要介绍。
Ceph核心组件至少包括OSD(Object Storage Device,对象存储设备)、Object(对象)、PG(Placement Grouops,放置组)和块设备。其中,各组件的概念如下:
OSD通常是一个物理的存储设备,例如磁盘。也可以是逻辑的存储设备,例如磁盘上的某个文件夹。在一个Ceph集群包含多个OSD。
Object是Ceph最底层的存储单元,每个Object包含元数据和原始数据。
PG是一个逻辑的概念。当集群收到数据存储请求时,将数据分解成一组对象。基于hash(哈希)算法和PG总数,对象映射到PG。基于crush(controlled scalabledecentralized placement of replicated data,可控的、可扩展的、分布式的副本数据放置算法)算法,对应的PG数据会被复制并分发到多个OSD上。可以将PG看成是一个逻辑容器,这个逻辑容器包含多个对象,同时这个逻辑容器被映射到多个OSD上。
块设备是指对其信息的存取以“块”为单位,如光盘、硬磁盘、软磁盘、磁带等,块长取固定长度的字节。Ceph中将块设备的对象以分布式模式存储在集群中。块设备是精简配置的、大小可调且将数据条带化存储到集群内的多个OSD。
客户端通过接口进行集群的访问。在客户端的程序中调用接口,从而集成集群的存储功能。此外,一个客户端上有一个及以上的块设备。
Ceph是分布式存储系统,提供块存储功能。以写数据为例说明Ceph块存储原理,图1为现有技术中块存储写数据的处理流程示意图,请参见图1,数据会被切分成多个4M(Megabyte,兆字节)Object,Object的大小可以调整,Object通过hash算法,映射到PG,PG通过crush算法映射到OSD,最终对象在OSD上完成数据的落盘操作。在部署Ceph时,在一个Ceph存储集群中至少需要一个监控器、Ceph-mgr和Ceph-osd。其中,Ceph-mgr和Ceph-osd介绍如下:
Ceph-mgr(Ceph Manager Daemom,Ceph管理器守护进程)负责跟踪运行时指标和Ceph集群的当前状态,包括存储利用率,当前性能指标和系统负载。
Ceph-osd(Ceph Object Storage Device Daemom,Ceph对象存储守护进程)对OSD进行管理,用于实现存储数据,处理数据复制,恢复和重新平衡。
需要说明的是,本申请应用于分布式存储系统。在本申请实施例中主要以Ceph系统为例进行说明,但是其它的分布式存储系统也应在本申请保护范围之内。本申请实施例中,IO(Input Output,输入输出)代表读写数据,读写数据是指读取数据和写入数据。
本申请实施例提供一种设备监控方法,图2为本申请一实施例中设备监控方法的处理流程示意图,请参见图2,设备监控方法包括:
步骤201,添加针对设备的性能监控项。
这里,设备监控装置添加针对设备的性能监控项。其中,设备监控装置添加性能监控项的方式有多种,如通过获取命令行界面的命令来执行添加性能监控项的操作,或者接收用户输入的性能监控项,直接将性能监控项添加在程序中等。
在一些实施例中,设备包括以下至少之一:块设备和客户端。性能监控项包括以下至少之一:块设备的性能监控项和客户端的性能监控项。
步骤202,基于性能监控项,获取设备的性能数据。
这里,设备监控装置根据性能监控项,获取设备的性能数据。具体地,在设备进行读写操作时,设备监控装置根据性能监控项,采集设备的操作数据,统计设备的操作数据,获取设备的性能数据。
步骤203,基于设备的性能数据,确定设备的性能信息。
这里,设备监控装置对性能数据进行处理,确定出设备的性能信息。其中,性能数据包括以下至少之一:请求处理的时间、操作数据的大小和操作个数。请求处理时间包括:请求发起的时间和处理请求结束的时间。性能信息包括以下至少之一:读写延迟、读写带宽和每秒读写次数。
在上述实施例中,通过添加针对设备的性能监控项,设备监控装置能够对集群中的设备进行性能监控,确定出集群中设备的性能信息,从而解决了如何监控集群中各个设备的性能信息的问题。
在一些实施例中,步骤201,添加针对设备的性能监控项,包括:
获取命令行界面输入的注册监控项命令。
这里,设备监控装置获取命令行界面输入的注册监控项命令。例如,获取在CLI(Command-Line Interface,命令行界面)输入的注册监控项命令“osd perfquery addrbd_image_id”。
根据注册监控项命令,设置性能监控项。
这里,设备监控装置解析注册监控项命令,执行注册监控项的操作,在函数中设置性能监控项。
在上述实施例中,设备监控装置获取命令行界面输入的注册监控项命令,并且根据注册监控项命令,设置性能监控项。如此,设备监控装置通过执行命令行界面输入的注册监控项命令,能快速地配置性能监控项。
为了进一步说明添加针对设备的性能监控项的过程,以Ceph系统为例进行说明。图3为本申请一实施中添加针对设备的性能监控项的处理流程示意图,图4为本申请一实施中添加针对设备的性能监控项的函数调用示意图,请参见图3和图4,添加针对设备的性能监控项,包括:
步骤301,设备监控装置获取在CLI输入注册监控项命令。
这里,设备监控装置根据注册监控项命令“osd perf query add rbd_image_id”,执行注册监控项的操作。并且设备监控装置会让Ceph-mgr根据注册监控项收集对应的性能信息。
步骤302,设备监控装置通过handle_command函数对注册监控项命令进行处理。
这里,设备监控装置调用osd_perf_query/mudule.py文件中handle_command函数,执行对注册监控项命令处理操作。handle_command函数定义为“bool handle_command(MCommand*m)”。
步骤303,设备监控装置利用Ceph-mgr将注册的性能监控项设置在MgrClient类。
这里,设备监控装置调用Ceph-mgr中DaemonServer类的add_osd_perf_query函数,执行在OSDPerfMetricCollector类的add_query函数中注册监控项的操作。设备监控装置调用add_query函数,执行保存注册的性能监控项的操作。如此,通过上述函数调用过程,性能监控项将配置到管理器中。
步骤304,设备监控装置调用OSD类的set_perf_queries方法,执行在OSD类中设置性能监控项的操作。
这里,设备监控装置首先调用Ceph-mgr中DaemonServer类的_send_configure函数,执行向Ceph-osd发送Ceph-mgr配置更改消息的操作。然后,设备监控装置调用MgrClient类中handle_mgr_configure函数,将配置更改信息发送给MMgrConfigure.h头文件中osd_perf_metric_queries函数。最后,设备监控装置调用OSD类的set_perf_queries方法,执行在OSD类中添加性能监控项的操作。如此,通过上述函数的调用,OSD获取到注册的性能监控项。
步骤305,设备监控装置调用PrimaryLogPG类的set_dynamic_pery_stats_queries,执行在PG类添加性能监控项的操作。
这里,设备监控装置在Ceph-mgr中调用PrimaryLogPG类的set_dynamic_pery_stats_Queries,执行在PG类添加性能监控项的操作。其中,一个PG类包含一个PG的所有信息。如此,通过上述函数的调用,设备监控装置通过OSD向PG发送性能监控项,并在PG中设置了性能监控项,从而使得PG根据性能监控项收集设备性能数据。
在一些实施例中,步骤202,基于性能监控项,获取设备的性能数据,包括:
设备监控装置获取第一上报周期内每个操作对应的操作数据。
这里,操作包括读写操作,简称op(operation,操作)。一个op对应一个对象的读写操作。在一次op完成后,设备监控装置采集一个op的操作数据。一个op的操作数据至少包括:请求发起的时间、处理请求结束的时间和读写数据的大小。其中,第一上报周期根据需要任意设置,例如5秒。此外,op数据还包含与op对应的设备ID(Identification,身份识别号),例如,操作为对象的读写操作,设备ID为发起op请求的客户端的客户端ID和与对象对应的块设备名称。
例如,以Ceph系统为例进行说明。图5为本申请一实施中获取设备的性能数据的函数调用示意图。请参见图5,在集群进行操作时,设备监控装置调用PrimaryLogPG类的log_op_stats函数,执行获取操作对应的操作数据的操作。
设备监控装置将操作对应的设备的全部操作数据进行统计,得到设备的性能数据。
这里,一个操作对应一个设备ID。设备监控装置统计第一上报周期内的操作数据,将具有相同设备ID的操作数据进行统计,得到设备的性能数据。例如,设备监控装置将具有相同设备ID的全部操作数据中读写数据进行累加,得到设备性能数据的操作数据大小。又例如,设备监控装置将具有相同设备ID的操作数据的个数进行累加,得到设备的性能数据中操作个数。以Ceph系统为例进行说明。请参见图5,设备监控装置调用DynamicPerfStats类的add函数,执行将操作对应的设备的全部操作数据进行累加的操作。
此外,设备监控装置统计第一上报周期内具有相同设备ID的请求发起的时间和处理请求结束的时间。
在上述实施例中,设备监控装置将第一周期内操作对应的设备的全部操作数据进行统计,如此,可以获取到第一周期内设备的性能数据,从而使得设备监控装置根据操作数据,可以达到监控设备的性能的目的。
在一些实施例中,步骤203,基于设备的性能数据,确定设备的性能信息,包括:
性能信息包括读写延迟,基于设备的性能数据中请求发起的时间和处理请求结束的时间,确定设备的性能信息的读写延迟。
这里,性能数据包括所有操作的请求发起的时间和所有操作的处理所述请求结束的时间。设备监控装置将每一个操作的处理所述请求结束的时间和请求发起的时间相减,得到每一个操作的延迟时间,统计所有操作的延迟时间,获取到设备的读写延迟。
在一些实施例中,步骤203,基于设备的性能数据,确定设备的性能信息,包括:
性能信息包括读写带宽,基于设备的性能数据中操作数据的大小和第一上报周期,确定设备的性能信息的读写带宽。
这里,根据步骤202,设备监控装置获取到第一上报周期内设备的操作数据的大小。设备监控装置将操作数据的大小除以第一上报周期,确定设备的读写带宽。
在一些实施例中,步骤203,基于设备的性能数据,确定设备的性能信息,包括:
性能信息包括每秒读写次数,基于设备的性能数据中操作个数和第一上报周期,确定设备的每秒读写次数。
这里,根据步骤202,设备监控装置获取到第一上报周期内设备的操作个数。设备监控装置将操作个数除以第一上报周期,确定设备的每秒读写次数。
在一些实施例中,设备监控装置获取第一上报周期内每个操作对应的操作数据,包括:
性能监控项包括性能参数,设备监控装置基于性能监控项,确定出计算性能参数所需要的操作数据。
设备监控装置获取第一上报周期内每个操作对应的计算性能参数所需要的操作数据。
这里,性能监控项包括至少一种性能参数,设备监控装置根据性能监控项,确定出计算性能参数所需要的操作数据。因此,在设备进行操作时,设备监控装置采集设备的操作数据,其中,操作数据是根据性能参数确定的。如此,设备监控装置采集计算性能参数所需要的操作数据,过滤掉无关的数据,从而减少了采集的数据量,节约计算资源,提高了获取设备操作数据的速度。
在一些实施例中,步骤203,基于设备的性能数据,确定设备的性能信息,包括:
设备监控装置基于设备的性能数据与性能监控项,确定设备的性能信息。
这里,设备监控装置根据设备的性能数据,可以确定出多种性能参数。在性能监控项中,设置至少一种性能参数,其中,设置在性能监控项的性能参数可以根据需求设定。例如,设备监控装置根据设备的性能数据,可以确定出M种性能参数。在性能监控项中,设置至少一种属于M种的性能参数。设备监控装置基于性能监控项,确定至少一种性能参数。设备监控装置根据性能参数,对设备的性能数据进行处理,确定设备的性能信息。如此,减少了与性能监控项无关的性能参数的计算,节约了计算资源,提高了获取设备的性能信息的速度。
在一些实施例中,在设备为块设备的情况下,设备监控方法还包括:
基于所述块设备的性能信息,确定块设备对应的客户端的性能信息。
这里,设备包括块设备和客户端时,由于客户端对应一个及以上的块设备。因此,设备监控装置可以确定每个客户端对应的全部块设备。设备监控装置将每个客户端对应的全部块设备的性能信息相加,确定客户端的性能设备。
在上述实施例中,设备监控装置根据块设备的性能信息,确定对应的客户端设备信息,从而无需另外统计客户端的性能数据,节省了计算资源,提高监控设备性能的效率。
在一些实施例中,设备监控方法还包括:
设备监控装置根据设备的性能信息与设定条件进行比较,判断设备是否性能过高。
这里,设备监控装置根据设备的性能信息与设定条件进行比较,当设备的性能信息高于这个设定条件时,则判断设备的性能过高。例如,设定条件包括单个设备的每秒读写次数不超过集群的每秒读写次数的30%,当一个集群中每秒读写次数为1000,一个设备的每秒读写次数为500时,单个设备的每秒读写次数占集群每秒读写系数的一半,超过设定条件,则设备监控装置判断出设备的性能过高。
当设备性能过高时,设备监控装置对设备进行QoS(Quality of Service,服务质量)限速,从而避免了性能过高的设备对集群中其它设备产生影响,保证了集群中各个设备都能够良好的运行。
为了进一步说明基于设备的性能数据,确定设备的性能信息的过程,以Ceph系统为例进行说明。图6为本申请一实施例中Ceph的部署架构。图7为本申请一实施例中基于设备的性能数据确定设备的性能信息的处理流程示意图。图8为本申请一实施例中基于设备的性能数据确定设备的性能信息的函数调用示意图。请参见图6、图7和图8,基于设备的性能数据,确定设备的性能信息,包括:
步骤401,PG采集并统计op数据,确定每个PG包含设备的性能信息,并将性能信息上报给Ceph-osd。
步骤402,Ceph-osd接收到PG上报的性能信息后,主动上报给Ceph-mgr。
这里,Ceph-osd接收到PG上报的性能信息后,合并具有相同设备ID的性能信息。设备监控装置调用MgrClient类中_send_report函数,执行Ceph-osd定时上报性能信息的功能。具体地,设备监控装置调用OSD类中get_perf_reports方法,执行向Ceph-mgr上报的功能。并且设备监控装置调用DynamicPerStats类的merge函数,执行Ceph-osd对PG上报的性能信息进行合并。
步骤403,Ceph-mgr处理分析Ceph-osd上报的性能信息,获取到设备的监控项性能信息。
这里,设备监控装置调用MgrClient类中_send_report函数,执行向Ceph-mgr定时发送Ceph-osd上报的性能信息。设备监控装置调用DaemonServer类的handle_report函数,执行对Ceph-osd上报的性能信息进行处理的操作。设备监控装置调用OSDPerfMetricCollector类的process_reports函数,执行获取设备的监控项性能信息的操作。
在上述实施例中,设备监控装置将同一个块设备所有op的数据进行汇总处理,就可以得到块设备的性能信息。以及每个op包含客户端的ID,设备监控装置将同一个客户端发起读写的所有op数据进行处理,就可以得到客户端的性能信息。
本申请实施例再一方面,还提供一种设备监控装置,应用于服务器集群中,图9为本申请一实施例中设备监控装置的结构示意图,请参见图9,设备监控装置500包括:添加模块501、获取模块502和第一确定模块503。
添加模块501,用于添加针对设备的性能监控项。
获取模块502,用于基于性能监控项,获取设备的性能数据。
第一确定模块503,用于基于设备的性能数据,确定设备的性能信息。
在一些实施例中,设备包括以下至少之一:块设备和客户端。
在一些实施例中,添加模块501包括命令获取单元和设置单元。
命令获取单元,用于获取命令行界面输入的注册监控项命令。
设置单元,用于根据注册监控项命令,设置性能监控项。
在一些实施例中,获取模块502包括:操作数据获取单元和性能数据得到单元。
操作数据获取单元,用于获取第一上报周期内每个操作对应的操作数据。
性能数据得到单元,用于将操作对应的设备的全部操作数据进行统计,得到设备的性能数据。
在一些实施例中,第一确定模块503,还用于在设备为块设备的情况下,基于块设备的性能信息,确定块设备对应的客户端的性能信息。
在一些实施例中,第一确定模块503,具体用于当性能信息包括读写延迟时,基于设备的性能数据中请求发起的时间和处理请求结束的时间,确定设备的性能信息的读写延迟。
在一些实施例中,第一确定模块503,具体用于当性能信息包括读写带宽时,基于设备的性能数据中操作数据的大小和第一上报周期,确定设备的性能信息的读写带宽。
在一些实施例中,第一确定模块503,具体用于当性能信息包括每秒读写次数时,基于设备的性能数据中操作个数和第一上报周期,确定设备的每秒读写次数。
本申请实施例再一方面,还提供一种服务器,图10为本申请一实施例中服务器的结构示意图,如图10所示,服务器至少包括至少一个处理器601和至少一个存储器602。其中,存储器602用于存储能够在处理器601上运行的计算机程序,处理器601用于运行所述计算机程序时,执行:一种设备监控方法,设备监控方法包括:
添加针对设备的性能监控项;
基于性能监控项,获取设备的性能数据;
基于设备的性能数据,确定设备的性能信息。
处理器601还用于运行所述计算机程序时,执行:设备包括以下至少之一:块设备和客户端。
处理器601还用于运行所述计算机程序时,执行:添加针对设备的性能监控项,包括:
获取命令行界面输入的注册监控项命令;
根据注册监控项命令,设置性能监控项。
处理器601还用于运行所述计算机程序时,执行:
基于性能监控项,获取设备的性能数据,包括:
获取第一上报周期内每个操作对应的操作数据;
将操作对应的设备的全部操作数据进行统计,得到设备的性能数据。
处理器601还用于运行所述计算机程序时,执行:在设备为块设备的情况下,设备监控方法还包括:
基于块设备的性能信息,确定块设备对应的客户端的性能信息。
处理器601还用于运行所述计算机程序时,执行:基于设备的性能数据,确定设备的性能信息,包括:
性能信息包括读写延迟,基于设备的性能数据中请求发起的时间和处理请求结束的时间,确定设备的性能信息的读写延迟。
处理器601还用于运行所述计算机程序时,执行:基于设备的性能数据,确定设备的性能信息,包括:
性能信息包括读写带宽,基于设备的性能数据中操作数据的大小和第一上报周期,确定设备的性能信息的读写带宽。
处理器601还用于运行所述计算机程序时,执行:基于设备的性能数据,确定设备的性能信息,包括:
性能信息包括每秒读写次数,基于设备的性能数据中操作个数和第一上报周期,确定设备的每秒读写次数。
在一些实施例中,所述服务器还包括系统总线603和通信接口604。其中,系统总线603配置为实现这些组件之间的连接通信,通信接口604可以包括标准的有线接口和无线接口。
本申请实施例再一方面,一种计算机存储介质,所述计算机存储介质上存储有设备监控程序,所述设备监控程序被处理器执行时实现本申请任一实施例所提供的设备监控方法的步骤。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。本申请的保护范围应以所述权利要求的保护范围以准。

Claims (11)

1.一种设备监控方法,其特征在于,所述方法包括:
添加针对设备的性能监控项;
基于所述性能监控项,获取所述设备的性能数据;
基于所述设备的性能数据,确定所述设备的性能信息。
2.根据权利要求1所述设备监控方法,其特征在于,所述设备包括以下至少之一:块设备和客户端。
3.根据权利要求1所述设备监控方法,其特征在于,所述添加针对设备的性能监控项,包括:
获取命令行界面输入的注册监控项命令;
根据所述注册监控项命令,设置所述性能监控项。
4.根据权利要求1所述设备监控方法,其特征在于,所述基于所述性能监控项,获取所述设备的性能数据,包括:
获取第一上报周期内每个操作对应的操作数据;
将所述操作对应的所述设备的全部操作数据进行统计,得到所述设备的性能数据。
5.根据权利要求3所述设备监控方法,其特征在于,所述基于所述设备的性能数据,确定所述设备的性能信息,包括:
所述性能信息包括读写延迟,基于所述设备的性能数据中请求发起的时间和处理所述请求结束的时间,确定所述设备的性能信息的读写延迟。
6.根据权利要求3所述设备监控方法,其特征在于,所述基于所述设备的性能数据,确定所述设备的性能信息,包括:
所述性能信息包括读写带宽,基于所述设备的性能数据中操作数据的大小和所述第一上报周期,确定所述设备的性能信息的读写带宽。
7.根据权利要求3所述设备监控方法,其特征在于,所述基于所述设备的性能数据,确定所述设备的性能信息,包括:
所述性能信息包括每秒读写次数,基于所述设备的性能数据中操作个数和所述第一上报周期,确定所述设备的每秒读写次数。
8.根据权利要求2所述设备监控方法,其特征在于,在所述设备为块设备的情况下,所述方法还包括:
基于所述块设备的性能信息,确定所述块设备对应的客户端的性能信息。
9.一种设备监控装置,其特征在于,所述装置包括:添加模块、获取模块和第一确定模块;
所述添加模块,用于添加针对设备的性能监控项;
所述获取模块,用于基于所述性能监控项,获取所述设备的性能数据;
所述第一确定模块,用于基于所述设备的性能数据,确定所述设备的性能信息。
10.一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以如权利要求1至8中任一项所述的设备监控方法的步骤。
11.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有设备监控程序,所述设备监控程序被处理器执行时实现如权利要求1至8中任一所述设备监控方法的步骤。
CN201911379517.5A 2019-12-27 2019-12-27 设备监控方法、装置、服务器及存储介质 Pending CN113051124A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911379517.5A CN113051124A (zh) 2019-12-27 2019-12-27 设备监控方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911379517.5A CN113051124A (zh) 2019-12-27 2019-12-27 设备监控方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN113051124A true CN113051124A (zh) 2021-06-29

Family

ID=76506698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911379517.5A Pending CN113051124A (zh) 2019-12-27 2019-12-27 设备监控方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113051124A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160330281A1 (en) * 2015-05-07 2016-11-10 Dell Products L.P. Systems and methods to improve read/write performance in object storage applications
CN108848134A (zh) * 2018-05-29 2018-11-20 郑州云海信息技术有限公司 一种服务器监控信息采集方法及装置
CN109408341A (zh) * 2018-11-13 2019-03-01 郑州云海信息技术有限公司 分布式存储系统性能监控方法、装置、设备及可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160330281A1 (en) * 2015-05-07 2016-11-10 Dell Products L.P. Systems and methods to improve read/write performance in object storage applications
CN108848134A (zh) * 2018-05-29 2018-11-20 郑州云海信息技术有限公司 一种服务器监控信息采集方法及装置
CN109408341A (zh) * 2018-11-13 2019-03-01 郑州云海信息技术有限公司 分布式存储系统性能监控方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
US10484326B2 (en) Distributed message queue stream verification
CN108683720B (zh) 一种容器集群服务配置方法及装置
CN107241281B (zh) 一种数据处理方法及其装置
CN112311617A (zh) 一种配置化数据监控告警方法及系统
CN111966289B (zh) 基于Kafka集群的分区优化方法和系统
CN109271363B (zh) 一种文件存储的方法及设备
WO2021093365A1 (zh) 一种gpu显存管理控制方法及相关装置
CN111666184B (zh) 固态驱动器ssd硬盘测试方法、装置及电子设备
CN111078651A (zh) 统计对象存储的使用量的方法及装置
CN111339466A (zh) 接口管理方法、装置、电子设备及可读存储介质
US9893972B1 (en) Managing I/O requests
CN114070755B (zh) 虚拟机网络流量确定方法、装置、电子设备和存储介质
CN111352899A (zh) 路径聚合方法、访问方法及通信设备、存储介质
CN110717130A (zh) 打点方法、装置、终端及存储介质
CN109286532B (zh) 云计算系统中告警信息的管理方法和装置
CN113051124A (zh) 设备监控方法、装置、服务器及存储介质
CN115525603A (zh) 存储统计方法、装置、计算机可读存储介质与ai设备
CN111376255A (zh) 机器人数据采集方法、装置及终端设备
CN112566096B (zh) Lte用户位置变更信息获取的方法、装置及设备
CN111159244B (zh) 数据查询方法及装置
CN115114316A (zh) 一种高并发数据的处理方法、装置、集群和存储介质
CN113645585A (zh) 一种物联网数据采集方法
CN108829563B (zh) 一种告警方法和告警装置
CN112667465A (zh) 一种多集群运行监控方法、装置、系统及可读存储介质
CN107506283B (zh) 一种主机向san存储推送信息的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210629

RJ01 Rejection of invention patent application after publication