CN107888437B - 云监控方法及设备 - Google Patents

云监控方法及设备 Download PDF

Info

Publication number
CN107888437B
CN107888437B CN201610867869.5A CN201610867869A CN107888437B CN 107888437 B CN107888437 B CN 107888437B CN 201610867869 A CN201610867869 A CN 201610867869A CN 107888437 B CN107888437 B CN 107888437B
Authority
CN
China
Prior art keywords
virtual machine
target server
target
target virtual
monitoring data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610867869.5A
Other languages
English (en)
Other versions
CN107888437A (zh
Inventor
邹冉冉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610867869.5A priority Critical patent/CN107888437B/zh
Publication of CN107888437A publication Critical patent/CN107888437A/zh
Application granted granted Critical
Publication of CN107888437B publication Critical patent/CN107888437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0246Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
    • H04L41/0253Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols using browsers or web-pages for accessing management information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本申请提供一种云监控方法及设备,该云监控方法包括:在Web页面配置目标服务器和目标虚拟机的身份信息;获取目标服务器和所述目标虚拟机的当前运行状态监控数据;获取所述目标虚拟机的当前存储空间监控数据;将当前监控数据进行聚合;将聚合结果以Web页面的形式进行展示。提高了对云监控的监控效率,实现了对云平台的综合监控,能够将监控数据以可视化的方式进行展示,并且通过Web页面配置目标服务器和目标虚拟机的身份信息,并以Web页面对聚合结果进行展示,使用户对监控结果的查看更加便利。

Description

云监控方法及设备
技术领域
本申请涉及云计算技术领域,尤其涉及一种云监控方法及设备。
背景技术
云计算是一种网络应用模式,将大量用网络连接的计算资源统一管理和调度,构成一个计算资源池向用户按需服务。虚拟机技术是一种有效管理和充分共享物理资源的重要手段,能够在计算机系统的软、硬件之间引入抽象层,为上层应用提供独立运行环境,且实现软硬件资源的共享复用。虚拟机技术作为云计算应用的关键技术,特别是云计算提供的平台即服务,必须有虚拟机做基础。
由于Java语言的一个非常重要的特点就是与平台的无关性,所以java虚拟机(Java Virtual Machine,简称JVM)被广泛地用于服务器上。为了保证云平台中服务器及虚拟机的性能稳定,云监控技术应运而生。云监控技术是对云平台的性能监视与检测的技术。
现有技术中,云监控的方法主要为jdk命令或jconsole分析工具等。jdk命令的方式只能单独的监测服务器中的虚拟机的某一数据,例如jstack命令用于打印目标虚拟机的堆栈信息、jinfo命令用于打印出目标虚拟机的配置信息、jmap命令用于展示目标虚拟机的内存映射信息等。jconsole分析工具只能通过JMX连接一个正在本地系统运行的目标虚拟机来访问该目标虚拟机,并对该目标虚拟机进行监控。其中,JMX为Java管理扩展,它是一个为应用程序、设备、系统等植入管理功能的框架。
所以现有技术中的云监控方法单独对服务器中的虚拟机进行监控的方法。使现有技术不能对云平台进行综合监控,导致监控效率较低。
并且现有技术中的云监控方法,jdk命令或jconsole分析工具均需要部署在目标服务器上,在本地对目标服务器中的目标虚拟机进行监控,并将监控数据在本地进行输出,使用户对监控结果的查看不便利。
而且,现有技术中的云监控的方法,在单独对服务器中的虚拟机进行监控后,直接输出该时刻的监控数据,不能对监控的数据以可视化的方式进行展示。
再者,现有技术中的云监控的方法,获取到监控的数据后,不能对监控的数据进行智能化地分析,只能人工对监控的数据进行分析后,找到出现故障的目标服务器或虚拟机,降低了对故障问题的处理速度。
发明内容
本申请提供一种云监控方法及设备,解决了现有技术中的云监控方法只能单独对服务器中的虚拟机进行监控,不能对云平台进行综合监控,导致监控效率较低的技术问题,同时也解决了现有技术中的云监控方法不能对监控数据以可视化的方式进行展示的技术问题。
一个方面,本申请提供一种云监控方法,包括:
在Web页面配置目标服务器和目标虚拟机的身份信息;
获取所述目标服务器和所述目标虚拟机的当前运行状态监控数据;
获取所述目标虚拟机的当前存储空间监控数据;
将当前监控数据进行聚合;
将聚合结果以Web页面的形式进行展示。
该方法中,通过同时对目标服务器和目标虚拟机的身份信息进行配置,通过触发目标服务器获取当前监控数据的方式同时获取目标服务器和目标虚拟机的当前监控数据,并将当前监控数据进行聚合,将聚合结果以Web页面的形式进行展示,提高了对云监控的监控效率,实现了对云平台的综合监控。能够将监控数据以可视化的方式进行展示,并且通过Web页面配置目标服务器和目标虚拟机的身份信息,并以Web页面对聚合结果进行展示,使用户对监控结果的查看更加便利。
结合第一方面,在第一方面的第一种实施方式中,所述获取所述目标服务器和所述目标虚拟机的当前运行状态监控数据,包括:
根据所述目标服务器的IP地址,向所述目标服务器发送监控指令,所述监控指令中携带目标虚拟机的进程序列号,以使所述目标服务器根据所述监控指令,从所述目标服务器的操作系统中获取所述目标服务器的当前运行状态监控数据,并根据所述目标虚拟机的进程序列号,查找所述目标虚拟机对应的进程,从对应的进程中获取所述目标虚拟机的当前运行状态监控数据;
接收所述目标服务器发送的所述目标服务器和所述目标虚拟机的当前运行状态监控数据。
结合第一方面,在第一方面的第二种实施方式中,所述获取所述目标服务器和所述目标虚拟机的当前存储空间监控数据,包括:
根据所述目标服务器的IP地址,向所述目标服务器发送GC日志生成指令,所述GC日志生成指令中携带目标虚拟机的进程序列号,以使所述目标服务器根据所述GC日志生成指令生成GC日志,并根据所述GC日志计算当前存储空间监控数据;
接收所述目标服务器发送的当前存储空间监控数据。
该方法中,当需要获取目标服务器和目标虚拟机的当前运行状态监控数据和目标虚拟机的当前存储空间监控数据时,触发目标服务器获取当前运行状态监控数据和当前存储空间监控数据,并接收目标服务器发送的所述当前运行状态监控数据和所述当前存储空间监控数据,能够实现对获取当前监控数据的通道的随开随关,主动从目标服务器中获取当前监控数据。
结合第一方面或第一方面的第一种实现方式或第一方面的第二种实现方式在第一方面的第三种实施方式中,在将聚合结果以Web页面的形式进行展示之后,所述方法还包括:
识别所述目标服务器和/或所述目标虚拟机是否存在故障问题;
若识别所述目标服务器和/或所述目标虚拟机存在故障问题,则输出故障问题类型和对应的故障问题解决方案。
该方法中,通过对当前监控数据进行分析,识别目标服务器和/或虚拟机是否存在故障问题,过存在故障问题,则直接输出故障问题类型和对应的故障解决方案,由于不需要人工分析排查故障问题类型,可直接按照故障问题解决方案解决故障,加速了对故障问题的处理速度。
结合第一方面的第三种实施方式,在第一方面的第四种实施方式中,所述识别所述目标服务器和/或所述目标虚拟机是否存在故障问题,包括:
对所述当前监控数据进行特征提取,以获取特征数据;
将所述特征数据输入到故障问题识别模型中,输出所述目标服务器和/或目标虚拟机是否存在问题。
结合第一方面的第四种实施方式,在第一方面的第五种实施方式中,
将所述特征数据输入到故障问题识别模型中,输出所述目标服务器和/或目标虚拟机是否存在问题之前,还包括:
采用历史监控数据对初始模型进行训练,以获得所述故障问题模型。
该方法中,通过对当前监控数据进行特征提取,以获取特征数据;将所述特征数据输入到故障问题识别模型中,输出所述目标服务器和/或目标虚拟机是否存在问题,由于故障问题模型是采用历史监控数据对初始模型进行训练获得的,所以使识别结果更准确。
第二方面,本申请提供一种云监控设备,包括:
配置模块,用于在Web页面配置目标服务器和目标虚拟机的身份信息;
获取模块,用于获取所述目标服务器和所述目标虚拟机的当前运行状态监控数据;
所述获取模块,还用于所述目标虚拟机的当前存储空间监控数据;
聚合模块,用于将当前监控数据进行聚合;
展示模块,用于将聚合结果以Web页面的形式进行展示。
该设备中,通过配置模块同时对目标服务器和目标虚拟机的身份信息进行配置,通过触发目标服务器获取当前监控数据的方式使获取模块同时获取目标服务器和目标虚拟机的当前监控数据,并由聚合模块将当前监控数据进行聚合,展示模块将聚合结果以Web页面的形式进行展示,提高了对云监控的监控效率,实现了对云平台的综合监控。能够将将监控数据以可视化的方式进行展示。
第三方面,本申请提供一种云监控设备,包括:输入设备、处理器和显示屏;
所述输入设备,用于在Web页面配置目标服务器和目标虚拟机的身份信息;
所述处理器,用于获取所述目标服务器和所述目标虚拟机的当前运行状态监控数据,获取所述目标虚拟机的当前存储空间监控数据;将当前监控数据进行聚合;
所述显示器,用于将聚合结果以Web页面的形式进行展示。
该设备中,通过输入设备同时对目标服务器和目标虚拟机的身份信息进行配置,能够使处理器通过触发目标服务器获取当前监控数据的方式同时获取目标服务器和目标虚拟机的当前监控数据,将当前监控数据进行聚合,显示器将聚合结果以Web页面的形式进行展示,提高了对云监控的监控效率,实现了对云平台的综合监控。能够将将监控数据以可视化的方式进行展示。并且通过Web页面配置目标服务器和目标虚拟机的身份信息,并以Web页面对聚合结果进行展示,使用户对监控结果的查看更加便利。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请的一种可选的云平台的示意图;
图2为本申请实施例一提供的一种云监控方法的流程图;
图3为本申请实施例二提供的一种云监控方法的流程图;
图4为为当前监控数据聚合结果展示示意图;
图5为本申请实施例三提供的一种云监控方法的流程图;
图6为本申请实施例四提供的一种云监控方法的流程图;
图7为本申请实施例五提供的一种云监控设备的结构示意图;
图8为本申请实施例六提供的一种云监控设备的结构示意图;
图9为本申请实施例七提供的一种云监控设备的结构示意图;
图10为本申请实施例八提供的一种云监控设备的结构示意图;
图11为本申请实施例九提供的一种云监控设备的结构示意图;
图12为本申请实施例十提供的一种云监控设备的结构示意图;
图13为本申请实施例十一提供的一种云监控设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与本发明的一些方面相一致的设备和方法的例子。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例所使用的单数形式的“一种”、“”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的商品或者系统中还存在另外的相同要素。
本申请所涉及的“至少一个”包括两种情况:一个或者多个的情况。
为了清楚起见,首先说明本发明使用的特定词或短语的定义。
目标服务器:是指对云平台中进行监控的服务器。
目标虚拟机:是指安装在云平台的目标服务器中进行监控的虚拟机。
运行状态监控数据:包括目标服务器的运行状态监控数据和目标虚拟机的运行状态监控数据。目标服务器的运行状态监控数据是对目标服务器的系统运行状态进行监控的数据。目标服务器的运行状态监控数据主要包括:目标服务器的操作系统名称、CPU占有率、操作系统进程数、应用线程数。其中,CPU占用率越高,说明目标服务器的CPU处理运算量的任务越多;操作系统进程数为目标服务器中正在运行的程序实例数,由于操作系统会为每个进程分配相应的运行空间,所以操作系统进程数越多,所分配的运行空间越多。应用线程数为进程中实际运行的实例。
目标虚拟机的运行状态监控数据为对目标虚拟机的运行状态进行监控的数据。目标虚拟机的运行状态监控数据包括:加载类数量、堆内存使用量、非堆内存使用量、目标虚拟机启动参数。其中,加载类数量为目标虚拟机运行时,加载的类的数量。堆内存使用量为目标虚拟机分配使用的内存大小。非堆内存使用量为对目标虚拟机管理堆之外所使用的内存大小。目标虚拟机启动参数为目标虚拟机启动的基本参数,包括:配置的目标虚拟机的应用内存大小,堆内存分布及回收策略等。
存储空间监控数据:是目标虚拟机进行内存回收时释放那些不再使用的对象所占用的内存的监控数据。包括:内存回收类型、年轻态回收数据、老年态回收数据、目标虚拟机回收数据、perm区回收数据、耗时数据。
基于背景技术中提到的现有技术中的一个问题或结合多个问题,提出本申请的技术方案,能够解决现有技术中的每个问题或同时解决多个问题。
本申请提供的云监控方法及设备,可适用于云平台,图1为本申请的一种可选的云平台的示意图,如图1所示,该云平台包括:多个客户端11、至少一个服务器12以及各个客户端11与服务器12之间的代理机13。其中,在每个服务器上设置有至少一台虚拟机121。进一步地,该云平台还包括:至少一个云监控设备13,该云监控设备13以网页应用的形式部署在至少一个服务器上。在图1中所示的云平台中,云监控设备13部署在一个服务器12上,而该部署云监控设备13的服务器可以为目标服务器,当部署云监控设备13的服务器不是目标服务器时,各服务器12之间通过通信连接,使云监控设备对目标服务器和目标服务器上的目标虚拟机进行远程监控。
需要说明的是,如上图1所示的云平台仅为一种实例,本申请并不以此作为限制。例如:可在每个服务器12上均部署有云监控设备13,该云监控设备13仅对所属的服务器和服务器上的目标虚拟机进行本地监控。
本申请提供的云监控方法,将云监控设备13以网页应用的形式部署在目标服务器上,通过网页应用的工具包可实现对目标服务器的直接访问,触发目标服务器生成当前监控数据。其中,目标虚拟机在目标服务器中以进程的形式存在。具体地,对目标服务器和目标服务器上的目标虚拟机进行监控时,可进行本地监控,接收用户在Web页面配置目标服务器和目标虚拟机的身份信息,该目标服务器的身份信息为目标服务器的IP地址,目标虚拟机的身份信息为目标虚拟机在目标服务器中对应的进程序列号。根据目标服务器的IP地址,分别向目标服务器发送监控指令和GC日志生成指令,监控指令和GC日志生成指令中分别携带目标虚拟机的进程序列号,以使目标服务器根据监控指令,从目标服务器的操作系统中获取目标服务器的当前运行状态监控数据,并根据目标虚拟机的进程序列号,查找目标虚拟机对应的进程,从对应的进程中获取目标虚拟机的当前运行状态监控数据。并根据GC日志生成指令生成GC日志,根据GC日志计算当前存储空间监控数据。接收目标服务器发送的当前运行状态监控数据和当前存储空间监控数据。根据上述方法实现了对目标服务器和目标服务器中的虚拟机的同时监控。其中,当前运行状态监控数据至少包括以下数据:操作系统名称、操作系统进程数、CPU占用率、应用线程数、加载类数量、堆内存使用量、非堆内存使用量、jdk版本、目标虚拟机启动参数。当前存储空间监控数据至少包括以下数据:内存回收类型、年轻态回收数据、老年态回收数据、目标虚拟机回收数据、perm区回收数据、耗时数据。在接收到当前运行状态监控数据和当前存储空间监控数据后,将当前监控数据以获取时间的顺序进行分类聚合,并以HTML5页面进行展示。根据展示的监控数据,识别目标服务器和/或目标虚拟机是否存在故障问题;若识别目标服务器和/或目标虚拟机存在故障问题,则输出故障问题类型和对应的故障问题解决方案。
为了解决现有技术中的云监控方法用户对监控结果的查看不便利的问题,本申请提供的云监控方法,采用java语言编写实现,形成一个内置Servlet容器的网页应用,该云监控方法形成一个工具压缩包,即tool,jar。在工具压缩包中具有访问目标服务器和进程序列号对应的目标虚拟机的相关类。将工具压缩包部署在服务器上,用户通过Web网页来配置需要监控的目标服务器和目标虚拟机,由工具压缩包来获取目标服务器和目标欧虚拟机的当前监控数据,用户通过Web页面来查看监控数据的结果。而非像现有技术中的云监控方法,只能在目标服务器上来配置需要监控的目标虚拟机,并在本地来查看监控数据的结果,本申请提供的云监控方法使用户对监控结果的查看更加便利。
为了解决现有技术中的云监控方法只能单独对虚拟机进行监控,不能进行综合监控,导致监控效率较低的技术问题,本申请的云监控方法通过在Web页面同时配置目标服务器和目标虚拟机的身份信息;触发目标服务器生成自身和目标虚拟机的当前监控数据。具体地,根据目标服务器的IP地址,分别向目标服务器发送监控指令和GC日志生成指令,监控指令和GC日志生成指令中分别携带目标虚拟机的进程序列号,以使目标服务器根据监控指令,获取当前运行状态监控数据,并根据GC日志生成指令生成GC日志,根据GC日志计算当前存储空间监控数据。接收目标服务器发送的当前运行状态监控数据和当前存储空间监控数据。其中,当前运行状态监控数据中包括目标服务器的当前监控数据,也包括目标虚拟机的当前监控数据。当前存储空间监控数据为目标虚拟机的监控数据。所以本申请的云监控方法是直接与目标服务器进行通信,目标虚拟机作为目标服务器中的一个进程,触发目标服务器来生成监控数据。而不是像现有技术中的云监控方法,启动一个jdk指令或jconsole分析工具,实现对目标虚拟机的某一个或几个参数进行监控。所以,本申请的云监控方法能够同时获取目标服务器和目标虚拟机的当前监控数据,从而提高了对云监控的监控效率,实现了对云平台的综合监控。。
为了解决现有技术中的云监控方法不能对监控的数据以可视化的方式进行展示的技术问题,本申请提供的云监控方法,将当前监控数据以数据库的形式进行存储,以获取时间的顺序进行分类聚合,并以HTML5页面进行展示,能够以可视化的形式展现当前监控期内的每类监控数据的变化趋势,而不是像现有技术中的云监控方法只能对当前时刻的监控数据进行输出。
为了解决现有技术中的云监控方法不能对监控的数据进行智能化地分析,只能人工对监控的数据进行分析后,找到出现故障的目标服务器或虚拟机,降低了对故障问题的处理速度的技术问题,本申请提供的云监控方法采用历史监控数据对初始模型进行训练,以获得故障问题模型,对当前监控数据进行特征提取,以获取特征数据;将特征数据输入到故障问题识别模型中,输出目标服务器和/或目标虚拟机是否存在故障问题,若识别目标服务器和/或目标虚拟机存在故障问题,则根据预先关联存储的故障问题类型与解决故障问题方案,查找与识别出的故障问题类型对应的故障问题解决方案,输出识别出的故障问题类型和对应的故障问题解决方案。实现了对监控的数据的智能化分析,提高了对故障问题的处理速度。
实施例一
图2为本申请实施例一提供的一种云监控方法的流程图,如图2所示,该方法包括如下步骤:
步骤201:在Web页面配置目标服务器和目标虚拟机的身份信息。
本实施例中,该云监控设备可形成一个网页应用,部署在目标服务器或与目标服务器相连的其它服务器上。当云监控设备对目标服务器和目标虚拟机的监控进行本地监控时,该云监控设备对应的网页应用部署在该目标服务器上,当进行远程监控时,该云监控设备部署在其他服务器上,其他服务器与目标服务器进行通信,以对目标服务器和目标服务器上的目标虚拟机进行监控。在对目标服务器和目标虚拟机进行本地监控时,可同时对该一个目标服务器和在该目标服务器中的至少一个目标虚拟机进行监控。在对目标服务器和目标虚拟机进行远程监控时,云监控设备可对至少一个目标服务器和在目标服务器中的至少一个目标虚拟机进行监控。
本实施例中,在对目标服务器和目标虚拟机进行监控前,在Web页面配置目标服务器和目标虚拟机的身份信息。
其中,目标服务器的身份信息可以为目标服务器的IP地址,也可以为其他标识目标服务器的身份信息。目标虚拟机的身份信息可以为目标虚拟机在目标服务器中对应的进程序列号,也可以为其他标识目标虚拟机的身份信息。本实施例中,对目标服务器和目标虚拟机的身份信息的具体类型不做限定。
本实施例中,目标服务器的虚拟机可以为Java虚拟机,也可以为其他类型的虚拟机,本实施例中对此不做限定。
本实施例中,该方法的实现方式可以采用java语言编写实现,也可采用c语言或其他语言编写实现,本实施例中对此不做限定。
步骤202:获取目标服务器和目标虚拟机的当前运行状态监控数据。
步骤203,获取目标虚拟机的当前存储空间监控数据。
结合步骤202和步骤203进行说明,本实施例中,云监控设备可每隔预设时间段获取目标服务器和目标虚拟机的监控数据。在当前时间段获取的目标服务器和目标虚拟机的监控数据为当前监控数据。相应的,在当前时间段之前的时间段获取的目标服务器和目标虚拟机的监控数据为历史监控数据。
具体地,本实施例中,云监控设备在配置目标服务器和目标虚拟机的身份信息,与目标服务器连接后,可触发目标服务器获取当前运行状态监控数据和当前存储空间监控数据,并接收目标服务器发送的当前运行状态监控数据和当前存储空间监控数据。其中,触发目标服务器获取当前运行状态监控数据和当前存储空间监控数据的方式可以不同。
本实施例中,目标服务器和目标虚拟机的当前运行状态监控数据可以包括以下数据:操作系统名称、操作系统进程数、CPU占用率、应用线程数、加载类数量、堆内存使用量、非堆内存使用量、jdk版本、目标虚拟机启动参数。其中,目标服务器的当前运行状态监控数据可以包括以下数据:操作系统名称、操作系统进程数、CPU占用率。目标虚拟机的当前运行状态监控数据可以包括以下数据:应用线程数、加载类数量、堆内存使用量、非堆内存使用量、jdk版本、目标虚拟机启动参数。
本实施例中,目标虚拟机的当前存储空间监控数据可以包括以下数据:内存回收类型、年轻态回收数据、老年态回收数据、目标虚拟机回收数据、perm区回收数据、耗时数据。
本实施例中,目标服务器和目标虚拟机的当前运行状态监控数据还可以包括目标服务器和目标虚拟机的其他监控数据,同理,目标虚拟机的当前存储空间监控数据还可以包括目标虚拟机的其他监控数据,本实施例中对此不做限定。
步骤204,将当前监控数据进行聚合。
步骤205,将聚合结果以Web页面的形式进行展示。
结合步骤204和步骤205进行说明,本实施例中,对当前监控数据聚合的方式不做限定。对当前监控数据聚合的方式可以为:按照当前监控数据的类型,对每类当前监控数据依次进行聚合。即对目标服务器的当前运行状态监控数据中的每类监控数据、目标虚拟机的当前运行状态监控数据中的每类监控数据、目标虚拟机的当前存储空间监控数据中的每类数据依次进行聚合。
本实施例中,对每类当前监控数据的聚合方式不做限定。如可以为以目标服务器的本地时间为自变量,对当前时间段内的当前监控数据进行聚合。对每类当前监控数据的聚合方式也可以为其他方式。
本实施例中,对当前监控数据聚合的方式也可以为其他方式,本实施例中对此不做限定。
本实施例中,在对聚合结果进行展示时,可在Web页面中以图表的形式进行展示,以获得以目标服务器的本地时间为自变量的每类监控数据的变化趋势图,能够更形象的对每类监控数据进行展示,也可以采用其他方式,本实施例中对此不做限定。
需要说明的是,在用户获取目标服务器或目标虚拟机的当前监控数据时,可以输入目标服务器或目标虚拟机对应的网址,以获取到目标服务器或目标虚拟机的对应的当前监控数据的聚合结果。
本申请实施例所提供的云监控方法,通过同时对目标服务器和目标虚拟机的身份信息进行配置,通过触发目标服务器获取当前监控数据的方式同时获取目标服务器和目标虚拟机的当前监控数据,并将当前监控数据进行聚合,将聚合结果以Web页面的形式进行展示,提高了对云监控的监控效率,实现了对云平台的综合监控。能够将监控数据以可视化的方式进行展示,并且通过Web页面配置目标服务器和目标虚拟机的身份信息,并以Web页面对聚合结果进行展示,使用户对监控结果的查看更加便利。
实施例二
图3为本申请实施例二提供的一种云监控方法的流程图。如图3所示,本实施例在实施例一的基础上,在步骤201之前还包括步骤301和步骤302,并对步骤304和步骤305的进行进一步细化。则该方法包括如下步骤:
步骤301,判断监控类型是否为远程监控,若是,则执行步骤302,否则执行步骤303。
本实施实例中,由于云监控设备可对目标服务器进行本地监控也可进行远程监控,所以对监控类型进行判断。对监控类型的判断方法本实施例中不做限定。如可根据用户输入的监控类型的标识信息判断是否为远程监控。
步骤302,对目标服务器的远程监控的端口号进行配置。
本实施例中,若监控类型为远程监控,则需要对目标服务器的远程监控的端口号进行配置,以将云监控设备与目标服务器进行远程监控的连接。
执行完步骤302后,执行步骤303。
步骤303,在Web页面配置目标服务器和目标虚拟机的身份信息。
进一步地,若监控类型不是远程监控,则确定云监控设备对目标服务器和目标虚拟机进行本地监控。本实施例中,无论为监控类型为远程监控还是本地监控,均需要配置目标服务器和目标虚拟机的身份信息,以根据身份信息确定具体哪个服务器和虚拟机为目标服务器和虚拟机,将云监控设备与目标服务器建立通信通道。
优选地,本实施例中,目标服务器的身份信息为目标服务器的IP地址,目标虚拟机的身份信息为目标虚拟机在目标服务器中对应的进程序列号。
步骤304,获取目标服务器和目标虚拟机的当前运行状态监控数据。
步骤305,获取目标虚拟机的当前存储空间监控数据。
进一步地,本实施例中,获取目标服务器和目标虚拟机的当前运行状态监控数据,包括:
根据目标服务器的IP地址,向目标服务器发送监控指令,监控指令中携带目标虚拟机的进程序列号,以使目标服务器根据监控指令,从所述目标服务器的操作系统中获取所述目标服务器的当前运行状态监控数据,并根据所述目标虚拟机的进程序列号,查找所述目标虚拟机对应的进程,从对应的进程中获取所述目标虚拟机的当前运行状态监控数据;接收所述目标服务器发送的所述目标服务器和所述目标虚拟机的当前运行状态监控数据。
具体地,本实施例中,在获取当前运行状态监控数据时,根据目标服务器的的IP地址,向该目标服务器发送监控指令,在监控指令中携带目标虚拟机的进程序列号,还可以携带运行状态监控数据信息,以使目标服务器根据目标虚拟机的进程序列号,从目标虚拟机对应的进程中获取目标虚拟机的当前运行状态监控数据,也从自身的操作系统中获取自身的当前运行状态监控数据。其中,获取的当前运行状态监控数据的具体包括的数据类型可根据运行状态监控数据信息确定。
进一步地,本实施例中,获取目标虚拟机的当前存储空间监控数据,包括:
根据目标服务器的IP地址,向目标服务器发送GC日志生成指令,GC日志生成指令中携带目标虚拟机的进程序列号,以使目标服务器根据GC日志生成指令生成GC日志,并根据GC日志计算当前存储空间监控数据;接收目标服务器发送的当前存储空间监控数据。
具体地,本实施例中,由于当前存储空间监控数据主要为内存回收方面的数据,不能通过获取当前运行状态监控数据的方式获取,所以本实施例中,根据目标服务器的IP地址,向目标服务器发送GC日志生成指令,GC日志生成指令中携带目标虚拟机的进程序列号,以使目标服务器生成关于目标虚拟机的GC日志,并根据GC日志计算当前存储空间监控数据。
需要说明的是,本实施例中,在获取目标服务器和目标虚拟机的当前运行状态监控数据和目标虚拟机的当前存储空间监控数据后,对目标服务器和目标虚拟机的当前监控数据进行分类存储。进一步地,可根据预设策略,采用数据库或文本文件对当前监控数据进行分类存储。具体地,可判断当前监控数据的大小是否大于预设门限值;若当前监控数据的大小大于预设门限值,则采用数据库对当前监控数据进行分类存储;若监控数据的数量不大于预设门限值,则采用文本文件对当前监控数据进行分类存储。其中,该数据库为MongoDB数据库,文本文件可以为Log文本文件。
步骤306,将当前监控数据进行聚合。
步骤307,将聚合结果以Web页面的形式进行展示。
进一步地,将当前监控数据进行聚合,包括:
将各所述当前监控数据以所述目标服务器的本地时间的顺序分别进行聚合。
具体地,本实施例中,将每类当前监控数据以目标服务器的本地时间的顺序进行聚合,可获得以目标服务器的本地时间为变量的每类监控数据的变化趋势图,将聚合结果以Web页面的形式进行展示,能够更形象的对每类监控数据进行展示,并且使用户更便利的获取到聚合结果。
优选地,Web页面为HTML5页面。
图4为当前监控数据聚合结果展示示意图,在图4中对每类监控数据的聚合结果按照目标服务器的本地时间的顺序进行了展示。其中,目标服务器的本地时间段包括:10:00-10:10。在图4中,只是示意性的给出了当前监控数据中堆内存使用量、应用线程数、加载类数量、及CPU占用率的聚合结果。
本申请实施例所提供的云监控方法,获取目标服务器生成当前运行状态监控数据时,根据目标服务器的IP地址,向目标服务器发送监控指令,监控指令中携带目标虚拟机的进程序列号,以使目标服务器根据监控指令,生成从目标服务器的操作系统中获取目标服务器的当前运行状态监控数据,并根据目标虚拟机的进程序列号,查找目标虚拟机对应的进程,从对应的进程中获取目标虚拟机的当前运行状态监控数据当前运行状态监控数据。获取目标服务器生成当前存储空间监控数据时,根据目标服务器的IP地址,向目标服务器发送GC日志生成指令,GC日志生成指令中携带目标虚拟机的进程序列号,以使目标服务器生成GC日志,并根据GC日志计算当前存储空间监控数据。能够实现对获取当前监控数据的通道的随开随关,主动从目标服务器中获取当前监控数据,并且能够使云监控设备对目标服务器和目标虚拟机进行更加全面的监控,能够准确地找到故障问题。并且将当前监控数据以获取时间的顺序进行分类聚合,能够更形象的对每类监控数据进行以可视化的方式进行展示。
实施例三
图5为本申请实施例三提供的一种云监控方法的流程图。如图5所示,本实施例在实施例二的基础上,在步骤307之后,还包括:识别目标服务器和/或目标虚拟机是否存在故障问题;若识别目标服务器和/或目标虚拟机存在故障问题,则输出故障问题类型和对应的故障问题解决方案的步骤。则该方法包括如下步骤。
步骤501,判断监控类型是否为远程监控,若是,则执行步骤502,否则执行步骤503。
步骤502,对目标服务器的远程监控的端口号进行配置。
执行完步骤502后执行步骤503。
步骤503,在Web页面配置目标服务器和目标虚拟机的身份信息。
步骤504,获取目标服务器和目标虚拟机的当前运行状态监控数据。
步骤505,获取目标虚拟机的当前存储空间监控数据。
步骤506,将当前监控数据进行聚合。
步骤507,将聚合结果以Web页面的形式进行展示。
本实施例中,步骤501-步骤507的实现方式与本发明实施例二的实现方式相同,在此不再一一赘述。
步骤508,识别目标服务器和/或目标虚拟机是否存在故障问题,若是,则执行步骤509,否则,返回并执行步骤504。
本实施例中,对识别目标服务器和/或目标虚拟机是否存在故障问题的方法本实施例中不做限定。如可以为将当前监控数据与问题故障数据进行匹配,根据匹配度识别目标服务器和/或目标虚拟机是否存在故障问题。也可以为对当前监控数据进行特征提取,以获取特征数据,将特征数据输入到故障问题识别模型中,输出目标服务器和/或目标虚拟机是否存在故障问题。
本实施例中,在识别出目标服务器和/或目标虚拟机不存在故障问题时,执行步骤504,继续获取目标服务器和目标虚拟机的当前运行状态监控数据和目标虚拟机的当前存储空间监控数据。
步骤509,输出故障问题类型和对应的故障问题解决方案。
进一步地,本实施例中,可预先关联存储故障问题类型与解决故障问题方案。在识别出目标服务器和/或目标虚拟机存在故障问题时,根据识别出的故障问题类型,查找该识别出的故障问题类型对应的故障问题解决方案,将该识别出的故障问题类型和对应的故障问题解决方案一并输出。也可采用其他方式确定故障问题类型对应的故障问题解决方案,本实施例中对此不做限定。
云监控方法,通过识别目标服务器和/或目标虚拟机是否存在故障问题,若识别目标服务器和/或目标虚拟机存在故障问题,则输出故障问题类型和对应的故障问题解决方案。由于不需要人工分析排查故障问题类型,可直接按照故障问题解决方案解决故障,加速了对故障问题的处理速度。实施例四
图6为本申请实施例四提供的一种云监控方法的流程图。如图6所示,本实施例在实施例三的基础上,对实施例三中的步骤508和步骤509进行进一步的细化。则该方法包括如下步骤:
步骤601,判断监控类型是否为远程监控,若是,则执行步骤602,否则执行步骤603。
步骤602,对目标服务器的远程监控的端口号进行配置。
步骤603,在Web页面配置目标服务器和目标虚拟机的身份信息。
步骤604,获取目标服务器和目标虚拟机的当前运行状态监控数据。
步骤605,获取目标虚拟机的当前存储空间监控数据。
步骤606,将当前监控数据进行聚合。
步骤607,将聚合结果以Web页面的形式进行展示。
本实施例中,步骤601-步骤607的实现方式与本申请实施例三中的步骤501-步骤507的实现方式相同,在此不再一一赘述。
步骤608,对当前监控数据进行特征提取,以获取特征数据,将特征数据输入到故障问题识别模型中,输出目标服务器和/或目标虚拟机是否存在故障问题,若是,则执行步骤609,否则返回并执行步骤604。
本实施例中,步骤608是对步骤508实现方式的进一步细化。
优选地,本实施例中,将特征数据输入到故障问题识别模型中,输出目标服务器和/或目标虚拟机是否存在问题之前,还包括:
采用历史监控数据对初始模型进行训练,以获得故障问题模型。
具体地,本实施例中,通过对当前监控数据进行特征提取,将特征数据输入到故障问题识别模型中,由于故障问题识别模型是采用历史监控数据对初始模型进行训练得到的,所以该故障问题识别模型对当前监控数据进行识别,使识别结果更准确。
步骤609,根据预先关联存储的故障问题类型与解决故障问题方案,查找与识别出的故障问题类型对应的故障问题解决方案,输出识别出的故障问题类型和对应的故障问题解决方案。
进一步地,本实施例中,预先关联存储故障问题类型与解决故障问题方案。在识别出目标服务器和/或目标虚拟机存在故障问题时,根据识别出的故障问题类型,查找该识别出的故障问题类型对应的故障问题解决方案,将该识别出的故障问题类型和对应的故障问题解决方案一并输出。
本申请实施例所提供的云监控方法,通过采用历史监控数据对初始模型进行训练,以获得故障问题模型,对当前监控数据进行特征提取,以获取特征数据,将特征数据输入到故障问题识别模型中,输出目标服务器和/或目标虚拟机是否存在故障问题,使识别结果更准确。
以下将详细描述根据本申请的一个或多个实施例的云监控设备。本领域技术人员可以理解,这些云监控设备均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。例如,处理器组件(或处理模块、处理单元)可以使用来自德州仪器公司、英特尔公司、ARM公司、等企业的单片机、微控制器、微处理器等组件。
实施例六
本实施例提供一种云监控设备。图7为本申请实施例六提供的一种云监控设备的结构示意图,如图7所示,该云监控设备包括:配置模块701、获取模块702、聚合模块703、展示模块704。
其中,配置模块701,用于在Web页面配置目标服务器和目标虚拟机的身份信息。获取模块702,用于获取目标服务器和目标虚拟机的当前运行状态监控数据。获取模块703,还用于获取所述目标虚拟机的当前存储空间监控数据。聚合模块703,用于将当前监控数据进行聚合。展示模块704,用于将聚合结果以Web页面的形式进行展示。
其中,目标服务器的身份信息为目标服务器的IP地址,目标虚拟机的身份信息为目标虚拟机在目标服务器中对应的进程序列号。
进一步地,目标服务器和所述目标虚拟机的当前运行状态监控数据至少包括以下数据:操作系统名称、操作系统进程数、CPU占用率。目标虚拟机的大年运行状态监控数据至少包括以下数据:应用线程数、加载类数量、堆内存使用量、非堆内存使用量、jdk版本、目标虚拟机启动参数。
当前存储空间监控数据至少包括以下数据:内存回收类型、年轻态回收数据、老年态回收数据、目标虚拟机回收数据、perm区回收数据、耗时数据。
本申请实施例六提供的云监控设备,可用于执行图2所示的云监控方法,其具体的实现过程及有益效果与上述实施例类似,在此不再赘述。
实施例七
图8为本申请实施例七提供的一种云监控设备的结构示意图,如图8所示,本实施例在实施例六的基础上,获取单元702包括:第一获取单元702a和第二获取单元702b。
进一步地,若监控类型为远程监控,则配置模块701,还用于对目标服务器的远程监控的端口号进行配置。
进一步地,第一获取单元702a,用于根据目标服务器的IP地址,向目标服务器发送监控指令,监控指令中携带目标虚拟机的进程序列号,以使目标服务器根据监控指令,从目标服务器的操作系统中获取目标服务器的当前运行状态监控数据,并根据目标虚拟机的进程序列号,查找目标虚拟机对应的进程,从对应的进程中获取目标虚拟机的当前运行状态监控数据;接收目标服务器发送的目标服务器和目标虚拟机的当前运行状态监控数据。第二获取单元702b,用于根据目标服务器的IP地址,向目标服务器发送GC日志生成指令,GC日志生成指令中携带目标虚拟机的进程序列号,以使目标服务器根据GC日志生成指令生成GC日志,并根据GC日志计算当前存储空间监控数据;接收目标服务器发送的当前存储空间监控数据。
进一步地,聚合模块703,还用于将各当前监控数据以目标服务器的本地时间的顺序分别进行聚合。
其中,Web页面为HTML5页面。
本申请实施例七提供的云监控设备,可用于执行图3所示的云监控方法,其具体的实现过程及有益效果与上述实施例类似,在此不再赘述。
实施例八
图9为本申请实施例八提供的一种云监控设备的结构示意图,如图9所示,本实施例在实施例七的基础上,还包括:识别模块901和输出模块902。
进一步地,识别模块901,用于识别目标服务器和/或目标虚拟机是否存在故障问题。若识别目标服务器和/或目标虚拟机存在故障问题,则输出模块902,用于输出故障问题类型和对应的故障问题解决方案。
本申请实施例八提供的云监控设备,可用于执行图5所示的云监控方法,其具体的实现过程及有益效果与上述实施例类似,在此不再赘述。
实施例九
图10为本申请实施例九提供的一种云监控设备的结构示意图,如图10所示,本实施例在实施例八的基础上,还包括:查找模块1001和训练模块1002。
进一步地,识别模块901,具体用于:对当前监控数据进行特征提取,以获取特征数据;将特征数据输入到故障问题识别模型中,输出目标服务器和/或目标虚拟机是否存在故障问题。
若识别目标服务器和/或目标虚拟机存在故障问题,则查找模块1001用于根据预先关联存储的故障问题类型与解决故障问题方案,查找与识别出的故障问题类型对应的故障问题解决方案。输出模块902,具体用于输出识别出的故障问题类型和对应的故障问题解决方案。
进一步地,训练模块1002,用于采用历史监控数据对初始模型进行训练,以获得故障问题模型。
本申请实施例九提供的云监控设备,可用于执行图6所示的云监控方法,其具体的实现过程及有益效果与上述实施例类似,在此不再赘述。
实施例十
本实施例提供一种云监控设备。图11为本申请实施例十提供的一种云监控设备的结构示意图,如图11所示,该云监控设备包括:输入设备1101、处理器1102和显示屏1103。
其中,输入设备1101,用于在Web页面配置目标服务器和目标虚拟机的身份信息。处理器1102,用于获取目标服务器和目标虚拟机的当前运行状态监控数据,获取目标虚拟机的当前存储空间监控数据,将当前监控数据进行聚合。显示器1103,用于将聚合结果以Web页面的形式进行展示。
进一步地,目标服务器和所述目标虚拟机的当前运行状态监控数据至少包括以下数据:操作系统名称、操作系统进程数、CPU占用率。目标虚拟机的大年运行状态监控数据至少包括以下数据:应用线程数、加载类数量、堆内存使用量、非堆内存使用量、jdk版本、目标虚拟机启动参数。
当前存储空间监控数据至少包括以下数据:内存回收类型、年轻态回收数据、老年态回收数据、目标虚拟机回收数据、perm区回收数据、耗时数据。
其中,目标服务器的身份信息为目标服务器的IP地址,目标虚拟机的身份信息为目标虚拟机在目标服务器中对应的进程序列号。
本申请实施例十提供的云监控设备,可用于执行图2所示的云监控方法,其具体的实现过程及有益效果与上述实施例类似,在此不再赘述。
实施例十一
图12为本申请实施例十一提供的一种云监控设备的结构示意图,如图12所示,本实施例提供的云监控设备在实施例十一提供的云监控设备的基础上,还包括:收发器1201。
进一步地,若监控类型为远程监控,则输入设备1101,还用于对目标服务器的远程监控的端口号进行配置。
进一步地,收发器1201,具体用于:根据目标服务器的IP地址,向目标服务器发送监控指令,监控指令中携带目标虚拟机的进程序列号,以使目标服务器根据监控指令,从所述目标服务器的操作系统中获取所述目标服务器的当前运行状态监控数据,并根据所述目标虚拟机的进程序列号,查找所述目标虚拟机对应的进程,从对应的进程中获取所述目标虚拟机的当前运行状态监控数据;接收所述目标服务器发送的所述目标服务器和所述目标虚拟机的当前运行状态监控数据。
进一步地,收发器1201,具体用于:根据目标服务器的IP地址,向目标服务器发送GC日志生成指令,GC日志生成指令中携带目标虚拟机的进程序列号,以使目标服务器根据GC日志生成指令生成GC日志,并根据GC日志计算当前存储空间监控数据;接收目标服务器发送的当前存储空间监控数据。
进一步地,处理器1102,具体用于:将各所述当前监控数据以所述目标服务器的本地时间的顺序分别进行聚合。
其中,Web页面为HTML5页面。
本申请实施例十一提供的云监控设备,可用于执行图5所示的云监控方法,其具体的实现过程及有益效果与上述实施例类似,在此不再赘述。
实施例十二
图13为本申请实施例十二提供的一种云监控设备的结构示意图,如图13所示,本实施例提供的云监控设备在实施例十一的基础上,还包括:输出设备1301。
进一步地,处理器1102,还用于:识别目标服务器和/或目标虚拟机是否存在故障问题。若识别目标服务器和/或目标虚拟机存在故障问题,则输出设备1301,用于输出故障问题类型和对应的故障问题解决方案。
进一步地,处理器1102,具体用于:对当前监控数据进行特征提取,以获取特征数据;将特征数据输入到故障问题识别模型中,输出目标服务器和/或目标虚拟机是否存在故障问题。
若识别目标服务器和/或目标虚拟机存在故障问题,则处理器1102具体用于:根据预先关联存储的故障问题类型与解决故障问题方案,查找与识别出的故障问题类型对应的故障问题解决方案。输出设备1301,具体用于输出识别出的故障问题类型和对应的故障问题解决方案。
进一步地,处理器1102,还用于采用历史监控数据对初始模型进行训练,以获得故障问题模型。
本申请实施例十二提供的云监控设备,可用于执行图6所示的云监控方法,其具体的实现过程及有益效果与上述实施例类似,在此不再赘述。
实施例十三
本申请实施例十三还提供一种处理器可读存储介质。该存储介质中存储有程序指令,该程序指令用于使处理器执行上述任一实施例的云监控方法。
上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (28)

1.一种云监控方法,其特征在于,包括:
在Web页面配置目标服务器和目标虚拟机的身份信息,所述目标虚拟机为所述目标服务器中的至少一个虚拟机;
获取所述目标服务器和所述目标虚拟机的当前运行状态监控数据;
获取所述目标虚拟机的当前存储空间监控数据;
将当前监控数据进行聚合;
将聚合结果以Web页面的形式进行展示;
其中,所述目标服务器的身份信息为所述目标服务器的IP地址,所述目标虚拟机的身份信息为所述目标虚拟机在所述目标服务器中对应的进程序列号。
2.根据权利要求1所述的方法,其特征在于,若监控类型为远程监控,则获取所述目标服务器和所述目标虚拟机的当前运行状态监控数据和所述目标虚拟机的当前存储空间监控数据之前,还包括:
对所述目标服务器的远程监控的端口号进行配置。
3.根据权利要求1所述的方法,其特征在于,所述获取所述目标服务器和所述目标虚拟机的当前运行状态监控数据,包括:
根据所述目标服务器的IP地址,向所述目标服务器发送监控指令,所述监控指令中携带目标虚拟机的进程序列号,以使所述目标服务器根据所述监控指令,从所述目标服务器的操作系统中获取所述目标服务器的当前运行状态监控数据,并根据所述目标虚拟机的进程序列号,查找所述目标虚拟机对应的进程,从对应的进程中获取所述目标虚拟机的当前运行状态监控数据;
接收所述目标服务器发送的所述目标服务器和所述目标虚拟机的当前运行状态监控数据。
4.根据权利要求1所述的方法,其特征在于,所述获取所述目标服务器和所述目标虚拟机的当前存储空间监控数据,包括:
根据所述目标服务器的IP地址,向所述目标服务器发送GC日志生成指令,所述GC日志生成指令中携带目标虚拟机的进程序列号,以使所述目标服务器根据所述GC日志生成指令生成GC日志,并根据所述GC日志计算当前存储空间监控数据;
接收所述目标服务器发送的当前存储空间监控数据。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述将当前监控数据进行聚合,包括:
将各所述当前监控数据以所述目标服务器的本地时间的顺序分别进行聚合。
6.根据权利要求5所述的方法,其特征在于,所述Web页面为HTML5页面。
7.根据权利要求6所述的方法,其特征在于,在将聚合结果以Web页面的形式进行展示之后,所述方法还包括:
识别所述目标服务器和/或所述目标虚拟机是否存在故障问题;
若识别所述目标服务器和/或所述目标虚拟机存在故障问题,则输出故障问题类型和对应的故障问题解决方案。
8.根据权利要求7所述的方法,其特征在于,所述识别所述目标服务器和/或所述目标虚拟机是否存在故障问题,包括:
对所述当前监控数据进行特征提取,以获取特征数据;
将所述特征数据输入到故障问题识别模型中,输出所述目标服务器和/或目标虚拟机是否存在故障问题。
9.根据权利要求8所述的方法,其特征在于,所述若识别所述目标服务器和/或所述目标虚拟机存在故障问题,则输出故障问题类型和对应的故障问题解决方案,包括:
若识别所述目标服务器和/或所述目标虚拟机存在故障问题,则根据预先关联存储的故障问题类型与解决故障问题方案,查找与识别出的故障问题类型对应的故障问题解决方案;
输出识别出的故障问题类型和对应的故障问题解决方案。
10.根据权利要求9所述的方法,其特征在于,将所述特征数据输入到故障问题识别模型中,输出所述目标服务器和/或目标虚拟机是否存在问题之前,还包括:
采用历史监控数据对初始模型进行训练,以获得所述故障问题识别模型。
11.根据权利要求10所述的方法,其特征在于,所述目标服务器和所述目标虚拟机的当前运行状态监控数据至少包括以下数据:
操作系统名称、操作系统进程数、CPU占用率、应用线程数、加载类数量、堆内存使用量、非堆内存使用量、jdk版本、目标虚拟机启动参数。
12.根据权利要求11所述的方法,其特征在于,所述当前存储空间监控数据至少包括以下数据:
内存回收类型、年轻态回收数据、老年态回收数据、目标虚拟机回收数据、perm区回收数据、耗时数据。
13.一种云监控设备,其特征在于,包括:
配置模块,用于在Web页面配置目标服务器和目标虚拟机的身份信息,所述目标虚拟机为所述目标服务器中的至少一个虚拟机;
获取模块,用于获取所述目标服务器和所述目标虚拟机的当前运行状态监控数据;
所述获取模块,还用于获取所述目标虚拟机的当前存储空间监控数据;
聚合模块,用于将当前监控数据进行聚合;
展示模块,用于将聚合结果以Web页面的形式进行展示;
其中,所述目标服务器的身份信息为所述目标服务器的IP地址,所述目标虚拟机的身份信息为所述目标虚拟机在所述目标服务器中对应的进程序列号。
14.根据权利要求13所述的设备,其特征在于,所述获取模块包括:
第一获取单元,用于根据所述目标服务器的IP地址,向所述目标服务器发送监控指令,所述监控指令中携带目标虚拟机的进程序列号,以使所述目标服务器根据所述监控指令,从所述目标服务器的操作系统中获取所述目标服务器的当前运行状态监控数据,并根据所述目标虚拟机的进程序列号,查找所述目标虚拟机对应的进程,从对应的进程中获取所述目标虚拟机的当前运行状态监控数据;接收所述目标服务器发送的所述目标服务器和所述目标虚拟机的当前运行状态监控数据。
15.根据权利要求13所述的设备,其特征在于,所述获取模块还包括:
第二获取单元,用于根据所述目标服务器的IP地址,向所述目标服务器发送GC日志生成指令,所述GC日志生成指令中携带目标虚拟机的进程序列号,以使所述目标服务器根据所述GC日志生成指令生成GC日志,并根据所述GC日志计算当前存储空间监控数据;接收所述目标服务器发送的当前存储空间监控数据。
16.根据权利要求13-15任一项所述的设备,其特征在于,还包括:
识别模块,用于识别所述目标服务器和/或所述目标虚拟机是否存在故障问题;
若识别所述目标服务器和/或所述目标虚拟机存在故障问题,则输出模块,用于输出故障问题类型和对应的故障问题解决方案。
17.一种云监控设备,其特征在于,包括:输入设备、处理器和显示屏;
所述输入设备,用于在Web页面配置目标服务器和目标虚拟机的身份信息,所述目标虚拟机为所述目标服务器中的至少一个虚拟机;
所述处理器,用于获取所述目标服务器和所述目标虚拟机的当前运行状态监控数据,获取所述目标虚拟机的当前存储空间监控数据;将当前监控数据进行聚合;
所述显示屏,用于将聚合结果以Web页面的形式进行展示;
其中,所述目标服务器的身份信息为所述目标服务器的IP地址,所述目标虚拟机的身份信息为所述目标虚拟机在所述目标服务器中对应的进程序列号。
18.根据权利要求17所述的设备,其特征在于,若监控类型为远程监控,则所述输入设备,还用于对所述目标服务器的远程监控的端口号进行配置。
19.根据权利要求17所述的设备,其特征在于,还包括:收发器,具体用于:
根据所述目标服务器的IP地址,向所述目标服务器发送监控指令,所述监控指令中携带目标虚拟机的进程序列号,以使所述目标服务器根据所述监控指令,从所述目标服务器的操作系统中获取所述目标服务器的当前运行状态监控数据,并根据所述目标虚拟机的进程序列号,查找所述目标虚拟机对应的进程,从对应的进程中获取所述目标虚拟机的当前运行状态监控数据;接收所述目标服务器发送的所述目标服务器和所述目标虚拟机的当前运行状态监控数据。
20.根据权利要求17所述的设备,其特征在于,还包括:收发器,具体用于:
根据所述目标服务器的IP地址,向所述目标服务器发送GC日志生成指令,所述GC日志生成指令中携带目标虚拟机的进程序列号,以使所述目标服务器根据所述GC日志生成指令生成GC日志,并根据所述GC日志计算当前存储空间监控数据;接收所述目标服务器发送的当前存储空间监控数据。
21.根据权利要求17-20任一项所述的设备,其特征在于,所述处理器,具体用于:
将各所述当前监控数据以所述目标服务器的本地时间的顺序分别进行聚合。
22.根据权利要求21所述的设备,其特征在于,所述Web页面为HTML5页面。
23.根据权利要求22所述的设备,其特征在于,还包括:输出设备;
所述处理器,还用于:识别所述目标服务器和/或所述目标虚拟机是否存在故障问题;
若识别所述目标服务器和/或所述目标虚拟机存在故障问题,则所述输出设备,用于输出故障问题类型和对应的故障问题解决方案。
24.根据权利要求23所述的设备,其特征在于,所述处理器,具体用于:
对所述当前监控数据进行特征提取,以获取特征数据;将所述特征数据输入到故障问题识别模型中,输出所述目标服务器和/或目标虚拟机是否存在故障问题。
25.根据权利要求24所述的设备,其特征在于,所述若识别所述目标服务器和/或所述目标虚拟机存在故障问题,则处理器具体用于:
根据预先关联存储的故障问题类型与解决故障问题方案,查找与识别出的故障问题类型对应的故障问题解决方案;
所述输出设备,具体用于输出识别出的故障问题类型和对应的故障问题解决方案。
26.根据权利要求25所述的设备,其特征在于,
所述处理器,还用于采用历史监控数据对初始模型进行训练,以获得所述故障问题识别模型。
27.根据权利要求26所述的设备,其特征在于,所述目标服务器和所述目标虚拟机的当前运行状态监控数据至少包括以下数据:
操作系统名称、操作系统进程数、CPU占用率、应用线程数、加载类数量、堆内存使用量、非堆内存使用量、jdk版本、目标虚拟机启动参数。
28.根据权利要求27所述的设备,其特征在于,所述当前存储空间监控数据至少包括以下数据:
内存回收类型、年轻态回收数据、老年态回收数据、目标虚拟机回收数据、perm区回收数据、耗时数据。
CN201610867869.5A 2016-09-29 2016-09-29 云监控方法及设备 Active CN107888437B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610867869.5A CN107888437B (zh) 2016-09-29 2016-09-29 云监控方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610867869.5A CN107888437B (zh) 2016-09-29 2016-09-29 云监控方法及设备

Publications (2)

Publication Number Publication Date
CN107888437A CN107888437A (zh) 2018-04-06
CN107888437B true CN107888437B (zh) 2021-11-02

Family

ID=61769110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610867869.5A Active CN107888437B (zh) 2016-09-29 2016-09-29 云监控方法及设备

Country Status (1)

Country Link
CN (1) CN107888437B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108768790A (zh) * 2018-06-29 2018-11-06 北京奇虎科技有限公司 分布式搜索集群监控方法及装置、计算设备、存储介质
CN109471698B (zh) * 2018-10-19 2021-03-05 中电莱斯信息系统有限公司 云环境下虚拟机异常行为检测系统和方法
CN109726082A (zh) * 2019-01-03 2019-05-07 中国银行股份有限公司 一种预警处理方法及系统
CN110955718A (zh) * 2019-12-04 2020-04-03 深圳市网心科技有限公司 数据可视化配置方法、服务器、系统及介质
CN111694706A (zh) * 2020-05-08 2020-09-22 广州微算互联信息技术有限公司 一种云手机故障处理方法、系统和存储介质
CN111698131B (zh) * 2020-06-10 2021-10-08 中国工商银行股份有限公司 信息处理方法、装置、电子设备和介质
CN112835981A (zh) * 2021-02-22 2021-05-25 北京金山云网络技术有限公司 一种云监控数据的展示方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811141A (zh) * 2011-06-01 2012-12-05 鸿富锦精密工业(深圳)有限公司 虚拟机运行监测系统及方法
CN103338135A (zh) * 2013-07-05 2013-10-02 山东大学 一种集群存储容量的实时监控方法
CN203466840U (zh) * 2013-04-16 2014-03-05 北京天云融创科技有限公司 云服务监控系统
CN103812699A (zh) * 2014-02-17 2014-05-21 无锡华云数据技术服务有限公司 基于云计算的监控管理系统
CN104298339A (zh) * 2014-10-11 2015-01-21 东北大学 一种面向最小能耗的服务器整合方法
CN104301389A (zh) * 2014-09-19 2015-01-21 华侨大学 一种云计算系统的能效监控和管理方法与系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8341280B2 (en) * 2008-12-30 2012-12-25 Ebay Inc. Request and response decoupling via pluggable transports in a service oriented pipeline architecture for a request response message exchange pattern
CN102096461B (zh) * 2011-01-13 2013-06-19 浙江大学 基于虚拟机迁移和负载感知整合的云数据中心节能方法
US8812434B2 (en) * 2012-10-12 2014-08-19 Ca, Inc. Data structure for efficiently identifying transactions
CN102946433B (zh) * 2012-11-22 2015-07-29 合肥华云通信技术有限公司 云公共服务平台下的大规模计算机资源的监控和调度方法
CN103973741B (zh) * 2013-01-31 2018-02-09 国际商业机器公司 用于在云系统中进行远程调试的方法和装置
US10572466B2 (en) * 2013-02-27 2020-02-25 Hitachi Vantara Corporation Multiple collections of user-defined metadata for self-describing objects
CN103220364B (zh) * 2013-04-27 2017-03-29 清华大学 一种基于云的系统管理训练平台架构
CN104639626B (zh) * 2015-01-28 2018-04-17 华侨大学 一种多级负载预测与云资源弹性配置方法与监控配置系统
CN105262801A (zh) * 2015-09-24 2016-01-20 广东亿迅科技有限公司 一种云平台消息分发的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811141A (zh) * 2011-06-01 2012-12-05 鸿富锦精密工业(深圳)有限公司 虚拟机运行监测系统及方法
CN203466840U (zh) * 2013-04-16 2014-03-05 北京天云融创科技有限公司 云服务监控系统
CN103338135A (zh) * 2013-07-05 2013-10-02 山东大学 一种集群存储容量的实时监控方法
CN103812699A (zh) * 2014-02-17 2014-05-21 无锡华云数据技术服务有限公司 基于云计算的监控管理系统
CN104301389A (zh) * 2014-09-19 2015-01-21 华侨大学 一种云计算系统的能效监控和管理方法与系统
CN104298339A (zh) * 2014-10-11 2015-01-21 东北大学 一种面向最小能耗的服务器整合方法

Also Published As

Publication number Publication date
CN107888437A (zh) 2018-04-06

Similar Documents

Publication Publication Date Title
CN107888437B (zh) 云监控方法及设备
EP3882773B1 (en) Method and system for automatic real-time causality analysis of end user impacting system anomalies using causality rules and topological understanding of the system to effectively filter relevant monitoring data
CN106027328B (zh) 一种基于应用容器部署的集群监控的方法及系统
US9215142B1 (en) Community analysis of computing performance
US20150339210A1 (en) Method And System For Resource Monitoring Of Large-Scale, Orchestrated, Multi Process Job Execution Environments
US9811356B2 (en) Automated software configuration management
CN109885624B (zh) 数据处理方法、装置、计算机设备和存储介质
KR102001898B1 (ko) 알람 정보 처리 방법, 관련 디바이스 및 시스템
CN106708700B (zh) 一种应用于服务端的运维监控方法和装置
US8661456B2 (en) Extendable event processing through services
CN113094674B (zh) 页面展示方法、装置、电子设备及存储介质
US11171835B2 (en) Automated generation of an information technology asset ontology
CN106411970B (zh) 一种基于服务调用的故障处理方法、装置和系统
US11449488B2 (en) System and method for processing logs
US20150293801A1 (en) Apparatus, system and method for application log data processing
CN105740042B (zh) 虚拟机内存的管理方法和管理系统
US9191285B1 (en) Automatic web service monitoring
CN111209325A (zh) 业务系统接口识别方法、装置及存储介质
US10565636B2 (en) Electronic device, system, and method
US9929921B2 (en) Techniques for workload toxic mapping
US9542171B2 (en) Managing an application modification process
CN106375372B (zh) 一种大数据资源分配方法和装置
US20220335045A1 (en) Composite event estimation through temporal logic
WO2021096346A1 (en) A computer-implemented system for management of container logs and its method thereof
CN110134433A (zh) 一种微服务状态获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant