CN107046581A - 一种服务运行状态的监测方法、装置及服务器 - Google Patents

一种服务运行状态的监测方法、装置及服务器 Download PDF

Info

Publication number
CN107046581A
CN107046581A CN201710357143.1A CN201710357143A CN107046581A CN 107046581 A CN107046581 A CN 107046581A CN 201710357143 A CN201710357143 A CN 201710357143A CN 107046581 A CN107046581 A CN 107046581A
Authority
CN
China
Prior art keywords
state information
service
object instance
server
operation state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710357143.1A
Other languages
English (en)
Inventor
杜洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201710357143.1A priority Critical patent/CN107046581A/zh
Publication of CN107046581A publication Critical patent/CN107046581A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/133Protocols for remote procedure calls [RPC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例提供了一种服务运行状态的监测方法、装置及服务器,应用于服务器,所述方法包括:通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;获取所述目标实例的目标运行状态信息。在本发明实施例提供的方案中,通过将服务监测进程内置于在线服务的实例中,可以对在线服务进行监测,从而可以更全面地获取在线服务的运行状态信息。

Description

一种服务运行状态的监测方法、装置及服务器
技术领域
本发明涉及互联网技术领域,特别是涉及一种服务运行状态的监测方法、装置及服务器。
背景技术
在线服务被广泛应用,例如网页浏览、在线视频、即时通信等等,提供在线服务的服务器往往需要运行很长时间,并且在运行期间服务器内部的运行状态是不清楚的,运维人员很难全面地获得服务器的运行状态信息以及内存中的数据。而对于运维人员来说,需要实时了解服务器的运行状态,以便对出现故障或者负载压力过大等问题的服务器及时进行调整。
现有技术中,运维人员只能根据一些时间纬度的监控和日志来了解在线服务的服务器运行状态,但是仅仅根据时间纬度的监控和日志是很难表示出在线服务的服务器运行状态。目前采用的监控服务,例如分布式监控解决方案zabbix,只能根据在线服务的日志和固有参数对在线服务进行监控。
发明人在实现本发明的过程中发现,现有技术至少存在以下问题:虽然现有技术中的监控服务可以收集到部分运行状态信息,但所收集到的信息并不全面,在线服务的服务器内部的运行状态仍然是不清楚的;并且,当监控服务出问题时,运维人员往往就会失去对在线服务的运行状态的监测。因此,如何更全面地获取在线服务的运行状态信息是亟需解决的问题。
发明内容
本发明实施例的目的在于提供一种服务运行状态的监测方法、装置及服务器,以实现更全面地获取在线服务的运行状态信息。具体技术方案如下:
第一方面,本发明实施例提供了一种服务运行状态的监测方法,应用于服务器,所述方法包括:
通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;
获取所述目标实例的目标运行状态信息。
可选地,所述目标运行状态信息包括以下中的至少一种:工作状态信息、远程过程调用协议RPC服务的运行状态信息、性能状态信息。
可选地,所述工作状态信息包括所述目标实例的当前进程的状态信息和/或进程私有堆栈的数据;
所述获取所述目标实例的目标运行状态信息的步骤,包括:
获取所述目标实例的所述工作状态信息。
可选地,所述RPC服务的运行状态信息包括以下中的至少一种:所述RPC服务连接的客户端和服务器各自所对应的IP和端口号、所述RPC服务连接的服务器的每秒查询率统计信息、所述RPC服务的请求成功率;
所述获取所述目标实例的目标运行状态信息的步骤,包括:
获取所述目标实例的RPC服务的运行状态信息。
可选地,所述获取所述目标实例的目标运行状态信息的步骤,包括:
获取所述目标实例的性能状态信息;
对所述性能状态信息进行分析,并得到分析结果;
根据所述分析结果,对所述目标实例进行性能调优。
可选地,所述方法还包括:
将所述目标运行状态信息存储至管理后台,根据所述管理后台中存储的运行状态信息对所述服务运行状态进行监测。
第二方面,本发明实施例提供了一种服务运行状态的监测装置,应用于服务器,所述装置包括:
访问模块,用于通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;
获取模块,用于获取所述目标实例的目标运行状态信息。
可选地,所述目标运行状态信息包括以下中的至少一种:工作状态信息、远程过程调用协议RPC服务的运行状态信息、性能状态信息。
可选地,所述工作状态信息包括所述目标实例的当前进程的状态信息和/或进程私有堆栈的数据;
所述获取模块包括:
第一获取子模块,用于获取所述目标实例的所述工作状态信息。
可选地,所述RPC服务的运行状态信息包括以下中的至少一种:所述RPC服务连接的客户端和服务器各自所对应的IP和端口号、所述RPC服务连接的服务器的每秒查询率统计信息、所述RPC服务的请求成功率;
所述获取模块包括:
第二获取子模块,用于获取所述目标实例的RPC服务的运行状态信息。
可选地,所述获取模块包括:
第三获取子模块,用于获取所述目标实例的性能状态信息;
分析子模块,用于对所述性能状态信息进行分析,并得到分析结果;
性能调优模块,用于根据所述分析结果,对所述目标实例进行性能调优。
可选地,所述装置还包括:
存储模块,用于将所述目标运行状态信息存储至管理后台,根据所述管理后台中存储的运行状态信息对所述服务运行状态进行监测。
第三方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的服务运行状态的监测方法。
第四方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的服务运行状态的监测方法。
本发明实施例提供的技术方案中,通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;获取所述目标实例的目标运行状态信息。在本发明实施例提供的方案中,通过将服务监测进程内置于在线服务的实例中,可以对在线服务进行监测,从而可以更全面地获取在线服务的运行状态信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种服务运行状态的监测方法的一种流程图;
图2为本发明实施例提供的一种服务运行状态的监测方法的另一种流程图;
图3为本发明实施例提供的一种服务运行状态的监测装置的一种结构示意图;
图4为本发明实施例提供的一种服务运行状态的监测装置的另一种结构示意图;
图5为本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了能够更全面地获取在线服务的运行状态信息,本发明实施例提供了一种服务运行状态的监测方法、装置及服务器。
下面首先对一种服务运行状态的监测方法进行介绍。
本发明实施例提供的一种服务运行状态的监测方法应用于在线服务系统,以对在线服务的运行状态进行监测,并获取在线服务的运行状态信息。其中,在线服务为通过互联网向用户提供线上服务的方式,例如,web浏览、电子邮件、论坛、即时通信、在线视频等。需要说明的是,本发明实施例提供的一种服务运行状态的监测方法具体应用于在线服务系统的服务器,该服务器可以用于对在线服务系统的运行状态进行监测并提供相应的运行状态信息。
当然,本发明实施例提供的一种服务运行状态的监测方法还可以应用于其他的服务系统,对相应服务的运行状态进行全面地监测。
另外,本发明实施例提供的一种服务运行状态的监测方法采用一种侵入式方式,在线服务系统作为一个系统框架,并将执行该方法的进程的代码嵌入该系统框架中,这样的侵入式方式可以将嵌入的进程与系统框架更好的结合,并且能够充分地利用该系统框架所提供的各种功能。
如图1所示,本发明实施例提供的一种服务运行状态的监测方法,包括如下步骤:
S101,通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中。
实例为可以支撑数据库运行的数据库程序,并且拥有动态内存,因此可以有状态的存储运行结果。一个目标服务可以包括一个或者多个实例,其中,在包括多个实例的情况下,各个实例独立运行。
目标服务监测进程为用于对相应的服务进行访问实现对该服务的服务运行状态进行监测的进程,并且可以内置于相应服务的各个实例中。这样,通过内置的方式,有利于目标服务监测进程实时地对目标实例进行访问、监测,获取更全面的运行状态信息,并且,对目标实例的监测是实时的,能即时的获取到目标实例的运行状态信息。
示例地,目标服务监测进程可以为网页服务进程http server,http server可以内置于在线服务的各个实例中,即在在线服务的每一个实例中内置一个http server,这样,每一个http server都可以对相应的实例进行访问并监测,比如,某一在线服务中,包括实例A、实例B和实例C,可以在实例A中内置http server1,在实例B中内置http server2以及在实例C中内置http server3,那么,http server1就可以对实例A进行访问,httpserver2就可以对实例B进行访问,http server3就可以对实例C进行访问。
在一种实施方式中,在通过目标服务监测进程对目标实例进行访问时,需要根据服务器的IP和目标实例的端口号,通过目标服务监测进程对目标实例进行访问,这样,可以有针对性的进行访问。示例地,该服务器的IP为118.186.8.122,目标实例的端口号为80,那么,当通过目标服务监测进程对目标实例进行访问时,则访问IP为118.186.8.122、端口号为80所对应的目标实例。
在一种实施方式中,由于在线服务支持http协议,因此,可以通过目标服务监测进程,以浏览器的方式对目标实例进行访问。其中,在以浏览器的方式对目标实例进行访问时,在浏览器中输入对应服务器的IP和目标实例的端口号,这样,便可以访问对应的目标实例。具体地,浏览器根据运维人员的访问请求,向服务器的IP和端口号所对应的目标实例发送http请求,目标实例收到http请求后会返回相应的应答信息,这样,浏览器便可以对目标实例进行访问。
当然,可以理解的是,对目标实例进行访问的方式除了浏览器的方式,还可以为其他的合理的方式,例如,磁盘访问方式,客户端访问方式等。
S102,获取所述目标实例的目标运行状态信息。
目标运行状态信息为目标实例运行过程中的状态信息,在线服务中的各实例的运行状态信息共同组成了在线服务的运行状态信息。目标运行状态信息大体上可以包括三种类型:工作状态信息、RPC(Remote Procedure Call Protocol,远程过程调用协议)服务的运行状态信息以及性能状态信息。当然,目标运行状态信息并不仅仅包括上述三类信息,还可以包括其他相关的运行信息,例如,连续运行时间等。以下就三种类型的运行状态信息的实施方式分别进行介绍。
一种实施方式中,获取所述目标实例的所述工作状态信息。其中,工作状态信息为针对于目标实例中的各线程的运行状态,其中,每个实例中可以包含多个线程,工作状态信息可以包括两种类型的信息:当前进程的状态信息和进程私有堆栈的数据。以下分别进行具体介绍:
其一,当前进程的状态信息可以包括当前运行过程中的进程所占的CPU资源、内存资源、网卡信息、工作线程栈等。示例地,在linux系统中,可以通过linux系统提供的/proc文件系统获得CPU资源、内存资源、网卡信息、工作线程栈信息等信息,并进行一定的换算,即可读取所获取的相关信息。
其二,进程私有堆栈的数据为每个线程所对应的堆栈中的数据,其中,每个进程都会存在专属的私有堆栈,用来存储该进程运行过程中的相关数据;示例地,搜索引擎进行搜索过程中,相应的进程可以将索引数据存储在各自所对应的私有堆栈中。
当然,可以理解的是,工作状态信息可以同时包括当前进程的状态信息和进程私有堆栈的数据,还可以是仅包括一项信息:当前进程的状态信息或者进程私有堆栈的数据。
一种实施方式中,获取所述目标实例的RPC服务的运行状态信息。其中,RPC服务是一种通过网络从远程计算机程序上请求的服务,通常采用客户机/服务器模式,请求程序可以是一个客户端,而服务提供程序可以是一个服务器。RPC服务的运行状态信息即是在客户端向服务器远程请求的过程中产生的相关运行状态信息。
RPC服务的运行状态信息可以包括:RPC服务连接的客户端和服务器各自所对应的IP和端口号,RPC服务连接的服务器的每秒查询率统计信息,RPC服务的请求成功率。当然,还可以包括RPC服务中其他的信息。以下分别进行具体介绍:
其一,RPC服务连接的客户端即为请求服务的客户端,连接的服务器即为提供服务的服务器,客户端和服务器各自有相对应的IP地址和端口号。示例地,客户端所对应的IP地址为118.186.8.112,端口号为82;服务器所对应的IP地址为118.186.8.102,端口号为85,那么,此时RPC服务的运行状态信息可以包括:RPC服务连接的客户端的IP地址为118.186.8.112,端口号为82;服务器的IP地址为118.186.8.102,端口号为85。
其二,RPC服务连接的服务器的每秒查询率统计信息,即为服务器的每秒响应请求数,每秒查询率统计信息可以表示出服务器的吞吐能力。例如,若服务器的每秒响应请求数为30,那么,服务器的每秒查询率为30。在一种具体实现方式中,每秒查询率统计信息可以是统计的每个时间点的查询率;还可以是预设时间段内的平均查询率,此时预设时间段可以是运维人员自定义设定的;还可以是随机选取的若干个时间点的平均查询率。当然,每秒查询率统计信息还可以是其他合理的方式统计的查询率。
其三,RPC服务的请求成功率是统计出的客户端向服务器请求成功所占的比率。例如,根据统计的请求数据,客户端向服务器发出请求服务的次数为100次,而在这100次的请求中,服务器返回的请求应答信息为85次,即请求成功的次数为85次,那么,这种情况下RPC服务的请求成功率为85%。在一种具体实现方式中,RPC服务的请求成功率可以是统计预设时间段内的请求成功率,其中,预设时间段可以是运维人员自定义设定的;还可以是随机选取的若干请求中得到的请求成功率。当然,RPC服务的请求成功率可以是其他合理的方式统计出来请求成功率。
可以理解的是,因为客户端可以是不定时的向服务器发出请求,因此,RPC服务的请求成功率是根据实时统计的请求而得到的。
一种实施方式中,获取所述目标实例的性能状态信息。其中,性能状态信息可以是目标实例在运行过程中,CPU占用比的相关信息;CPU占用比在一定程度上可以反应出目标实例的性能状态,例如,目标实例中的哪部分消耗资源最多等。具体地,CPU占用比大的部分即为资源消耗量大的部分,因此可以定义为性能热点;其中,目标实例中的部分可以是运行的进程或者应用程序等。当然,性能状态信息还可以包括内存占用比信息、程序故障率信息等等,此时,性能状态信息可以将CPU占用比信息、内存占用比信息和程序故障信息结合起来表示出目标实例的性能状态。
另外,在获取所述目标实例的性能状态信息之后,对所述性能状态信息进行分析,并得到分析结果;根据所述分析结果,对所述目标实例进行性能调优。
其中,分析结果具体可以为目标实例中的性能热点,进行性能调优的具体操作可以是将在性能热点上运行的任务转移到非性能热点上运行,从而平衡目标实例各部分的CPU占用比。
示例地,当获取到的性能状态信息是CPU占用比的信息,并得到的分析结果为:进程1占用CPU50%、进程2占用CPU20%、进程3占用CPU12%,那么,对目标实例可以进行性能调优时可以对进程1进行调整,以使得进程1占用CPU的百分比减小。
示例地,当获取到的性能状态信息是程序故障率信息时,得到的分析结果可以为:故障类型、发生故障的应用程序或者进程信息等,那么,根据分析结果,可以进行相对应的排除故障的操作。
对于上述三种实施方式,可以分别进行实施,具体地,获取目标实例的目标运行状态信息可以仅包括一种运行状态信息:工作状态信息,或者,RPC服务的运行状态信息,或者,性能状态信息。
当然,可以理解的是,还可以将上述三种实施方式结合,具体地,第一种情况,可以获取两种类型的运行状态信息:工作状态信息和RPC服务的运行状态信息,或者,RPC服务的运行状态信息和性能状态信息,或者,性能状态信息和工作状态信息;第二种情况,还可以获取全部类型的运行状态信息:工作状态信息、RPC服务的运行状态信息和性能状态信息。
其中,在一种具体实施方式中,因为工作状态信息可以包括两种类型的信息:当前进程的状态信息、进程私有堆栈的数据。因此,当获取工作状态信息时,可以仅获取一种信息:当前进程的状态信息或者进程私有堆栈的数据,还可以同时获取两种信息:当前进程的状态信息和进程私有堆栈的数据。上述具体的获取方式可以自定义设定。
在一种具体实施方式中,因为RPC服务的运行状态信息还可以分为3种类型:RPC服务连接的客户端和服务器各自所对应的IP和端口号,RPC服务连接的服务器的每秒查询率统计信息,RPC服务的请求成功率。当获取RPC服务的运行状态信息时,可以分为以下三种情况:
第一种情况,获取的RPC服务的运行状态信息可以仅包括一种类型信息:RPC服务连接的客户端和服务器各自所对应的IP和端口号,或者,RPC服务连接的服务器的每秒查询率统计信息,或者,RPC服务的请求成功率;
第二种情况,获取的RPC服务的运行状态信息可以包括两种类型信息,例如,RPC服务连接的服务器的每秒查询率统计信息和RPC服务的请求成功率;
第三种情况,获取的RPC服务的运行状态信息可以包括全部的三种类型信息:RPC服务连接的客户端和服务器各自所对应的IP和端口号、RPC服务连接的服务器的每秒查询率统计信息和RPC服务的请求成功率。
本发明实施例提供的技术方案中,通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;获取所述目标实例的目标运行状态信息。在本发明实施例提供的方案中,通过将服务监测进程内置于在线服务的实例中,可以对在线服务进行监测,从而可以更全面地获取在线服务的运行状态信息。
为了能够更全面地获取在线服务的运行状态信息,本发明实施例还提供以下具体实现方式。
如图2所示,本发明实施例提供的一种服务运行状态的监测方法,可以包括如下步骤:
S201,通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中。
S202,获取所述目标实例的目标运行状态信息。
本实施例中,S201、S202与上述实施例的S101、S102相同,在此不做赘述。
S203,将所述目标运行状态信息存储至管理后台,并根据所述管理后台中存储的运行状态信息对所述服务运行状态进行监测。
其中,管理后台用于存储所获取的目标运行状态信息,这样以便对运行状态信息进行集中管理。其中,管理后台可以是基于python flask框架上开发得到的。管理后台与服务器通信连接,服务器可以从管理后台直接获取所需的运行状态信息,从而实现对在线服务运行状态的监测。
在一种具体实施方式中,可以对存储于管理后台的目标运行状态信息进行分类管理,分类方式可以是按照运行状态信息类型进行分类存储,还可以按照时间先后顺序存储,以及合理的其他分类方式。这样,有利于服务器更方便地从管理后台获取所需的相应运行状态信息。
另外,在一种实施方式中,运维人员可以向服务器请求相关的运行状态信息,服务器接收到请求后将相应的运行状态信息发送给运维人员,这样,运维人员可获取到所需的运行状态信息。具体地,服务器可以将相应的运行状态信息发送至终端上,并在终端的显示器上显示出,以便运维人员更方便查阅。
本发明实施例提供的技术方案中,通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;获取所述目标实例的目标运行状态信息。在本发明实施例提供的方案中,通过将服务监测进程内置于在线服务的实例中,可以对在线服务进行监测,从而可以更全面地获取在线服务的运行状态信息。
相应于上述提供的方法实施例,本发明实施例还提供一种服务运行状态的监测装置,应用于服务器,如图3所示,所述装置包括:
访问模块310,用于通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;
获取模块320,用于获取所述目标实例的目标运行状态信息。
所述目标运行状态信息包括以下中的至少一种:工作状态信息、远程过程调用协议RPC服务的运行状态信息、性能状态信息。
可选地,在一种实施方式中,所述工作状态信息包括所述目标实例的当前进程的状态信息和/或进程私有堆栈的数据;
所述获取模块320包括:
第一获取子模块,用于获取所述目标实例的所述工作状态信息。
可选地,在一种实施方式中,所述RPC服务的运行状态信息包括以下中的至少一种:所述RPC服务连接的客户端和服务器各自所对应的IP和端口号、所述RPC服务连接的服务器的每秒查询率统计信息、所述RPC服务的请求成功率;
所述获取模块320包括:
第二获取子模块,用于获取所述目标实例的RPC服务的运行状态信息。
可选地,在一种实施方式中,所述获取模块320包括:
第三获取子模块,用于获取所述目标实例的性能状态信息;
分析子模块,用于对所述性能状态信息进行分析,并得到分析结果;
性能调优模块,用于根据所述分析结果,对所述目标实例进行性能调优。
本发明实施例提供的技术方案中,通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;获取所述目标实例的目标运行状态信息。在本发明实施例提供的方案中,通过将服务监测进程内置于在线服务的实例中,可以对在线服务进行监测,从而可以更全面地获取在线服务的运行状态信息。
如图4所示,本发明实施例提供的一种服务运行状态的监测装置,在图3的基础上,所述装置还可以包括:
存储模块330,用于将所述目标运行状态信息存储至管理后台,根据所述管理后台中存储的运行状态信息对所述服务运行状态进行监测。
本发明实施例提供的技术方案中,通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;获取所述目标实例的目标运行状态信息。在本发明实施例提供的方案中,通过将服务监测进程内置于在线服务的实例中,可以对在线服务进行监测,从而可以更全面地获取在线服务的运行状态信息。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述地比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供一种电子设备,如图5所示,包括处理器510、通信接口520、存储器530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信,
存储器530,用于存放计算机程序;
处理器510,用于执行存储器530上所存放的程序时,实现如下步骤:
通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;
获取所述目标实例的目标运行状态信息。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是现场可编程门阵列(Field-Programmable Gate Array,FPGA)、数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的服务运行状态的监测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的服务运行状态的监测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (13)

1.一种服务运行状态的监测方法,其特征在于,应用于服务器,所述方法包括:
通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;
获取所述目标实例的目标运行状态信息。
2.根据权利要求1所述的方法,其特征在于,所述目标运行状态信息包括以下中的至少一种:工作状态信息、远程过程调用协议RPC服务的运行状态信息、性能状态信息。
3.根据权利要求2所述的方法,其特征在于,所述工作状态信息包括所述目标实例的当前进程的状态信息和/或进程私有堆栈的数据;
所述获取所述目标实例的目标运行状态信息的步骤,包括:
获取所述目标实例的所述工作状态信息。
4.根据权利要求2所述的方法,其特征在于,所述RPC服务的运行状态信息包括以下中的至少一种:所述RPC服务连接的客户端和服务器各自所对应的IP和端口号、所述RPC服务连接的服务器的每秒查询率统计信息、所述RPC服务的请求成功率;
所述获取所述目标实例的目标运行状态信息的步骤,包括:
获取所述目标实例的RPC服务的运行状态信息。
5.根据权利要求2所述的方法,其特征在于,所述获取所述目标实例的目标运行状态信息的步骤,包括:
获取所述目标实例的性能状态信息;
对所述性能状态信息进行分析,并得到分析结果;
根据所述分析结果,对所述目标实例进行性能调优。
6.根据权利1所述的方法,其特征在于,所述方法还包括:
将所述目标运行状态信息存储至管理后台,根据所述管理后台中存储的运行状态信息对所述服务运行状态进行监测。
7.一种服务运行状态的监测装置,其特征在于,应用于服务器,所述装置包括:
访问模块,用于通过目标服务监测进程对目标服务的目标实例进行访问,其中,所述目标服务监测进程内置于所述目标实例中;
获取模块,用于获取所述目标实例的目标运行状态信息。
8.根据权利要求7所述的装置,其特征在于,所述目标运行状态信息包括以下中的至少一种:工作状态信息、远程过程调用协议RPC服务的运行状态信息、性能状态信息。
9.根据权利要求8所述的装置,其特征在于,所述工作状态信息包括所述目标实例的当前进程的状态信息和/或进程私有堆栈的数据;
所述获取模块包括:
第一获取子模块,用于获取所述目标实例的所述工作状态信息。
10.根据权利要求8所述的装置,其特征在于,所述RPC服务的运行状态信息包括以下中的至少一种:所述RPC服务连接的客户端和服务器各自所对应的IP和端口号、所述RPC服务连接的服务器的每秒查询率统计信息、所述RPC服务的请求成功率;
所述获取模块包括:
第二获取子模块,用于获取所述目标实例的RPC服务的运行状态信息。
11.根据权利要求8所述的装置,其特征在于,所述获取模块包括:
第三获取子模块,用于获取所述目标实例的性能状态信息;
分析子模块,用于对所述性能状态信息进行分析,并得到分析结果;
性能调优模块,用于根据所述分析结果,对所述目标实例进行性能调优。
12.根据权利7所述的装置,其特征在于,所述装置还包括:
存储模块,用于将所述目标运行状态信息存储至管理后台,根据所述管理后台中存储的运行状态信息对所述服务运行状态进行监测。
13.一种服务器,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
CN201710357143.1A 2017-05-19 2017-05-19 一种服务运行状态的监测方法、装置及服务器 Pending CN107046581A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710357143.1A CN107046581A (zh) 2017-05-19 2017-05-19 一种服务运行状态的监测方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710357143.1A CN107046581A (zh) 2017-05-19 2017-05-19 一种服务运行状态的监测方法、装置及服务器

Publications (1)

Publication Number Publication Date
CN107046581A true CN107046581A (zh) 2017-08-15

Family

ID=59546502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710357143.1A Pending CN107046581A (zh) 2017-05-19 2017-05-19 一种服务运行状态的监测方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN107046581A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107733726A (zh) * 2017-11-29 2018-02-23 新华三云计算技术有限公司 一种服务请求的处理方法及装置
CN109408302A (zh) * 2017-08-16 2019-03-01 阿里巴巴集团控股有限公司 一种故障检测方法、装置及电子设备
CN110007981A (zh) * 2019-02-28 2019-07-12 Oppo广东移动通信有限公司 启动应用程序的方法、装置、电子设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090106739A1 (en) * 2007-10-19 2009-04-23 Paul Allan Weatherbee Systems and methods for debugging multiple workflow instances
CN102591765A (zh) * 2011-12-31 2012-07-18 珠海市君天电子科技有限公司 一种进程自动管理系统
CN103942135A (zh) * 2014-04-10 2014-07-23 国家电网公司 一种基于sap平台的性能监控方法
CN106470219A (zh) * 2015-08-17 2017-03-01 阿里巴巴集团控股有限公司 计算机集群的扩容和缩容方法及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090106739A1 (en) * 2007-10-19 2009-04-23 Paul Allan Weatherbee Systems and methods for debugging multiple workflow instances
CN102591765A (zh) * 2011-12-31 2012-07-18 珠海市君天电子科技有限公司 一种进程自动管理系统
CN103942135A (zh) * 2014-04-10 2014-07-23 国家电网公司 一种基于sap平台的性能监控方法
CN106470219A (zh) * 2015-08-17 2017-03-01 阿里巴巴集团控股有限公司 计算机集群的扩容和缩容方法及设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408302A (zh) * 2017-08-16 2019-03-01 阿里巴巴集团控股有限公司 一种故障检测方法、装置及电子设备
CN109408302B (zh) * 2017-08-16 2022-07-05 阿里巴巴集团控股有限公司 一种故障检测方法、装置及电子设备
CN107733726A (zh) * 2017-11-29 2018-02-23 新华三云计算技术有限公司 一种服务请求的处理方法及装置
CN107733726B (zh) * 2017-11-29 2021-07-06 新华三云计算技术有限公司 一种服务请求的处理方法及装置
CN110007981A (zh) * 2019-02-28 2019-07-12 Oppo广东移动通信有限公司 启动应用程序的方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
US10855545B2 (en) Centralized resource usage visualization service for large-scale network topologies
US10560465B2 (en) Real time anomaly detection for data streams
CN111861140B (zh) 一种业务处理方法、装置、存储介质和电子装置
US9647904B2 (en) Customer-directed networking limits in distributed systems
US9654928B2 (en) Tracking information technology (IT) assets
CN110266716B (zh) 电网统一服务平台系统
US20150170070A1 (en) Method, apparatus, and system for monitoring website
CN104168333B (zh) Proxzone服务平台的工作方法
CN111124670A (zh) 一种面向战术云的微服务平台
CN109995859A (zh) 一种调度方法、调度服务器及计算机可读存储介质
US9420562B1 (en) Tracking information technology (IT) assets
US20020129127A1 (en) Apparatus and method for routing a transaction to a partitioned server
CN103607424B (zh) 一种服务器连接方法及服务器系统
CN109271243B (zh) 一种集群任务管理系统
CA2931524A1 (en) Customer-directed networking limits in distributed systems
CN108696400A (zh) 网络监测方法和装置
CN108880943A (zh) 一种异构云平台的监控系统
US10554701B1 (en) Real-time call tracing in a service-oriented system
CN112965879A (zh) 数据处理方法、装置、电子设备及可读存储介质
US20120078946A1 (en) Systems and methods for monitoring files in cloud-based networks
US20140289847A1 (en) Systems and methods for scalable network monitoring
CN107046581A (zh) 一种服务运行状态的监测方法、装置及服务器
US20190253488A1 (en) Transaction process management by dynamic transaction aggregation
CN114338684B (zh) 一种能源管理系统及方法
CN110430070A (zh) 一种服务状态分析方法、装置、服务器、数据分析设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170815

RJ01 Rejection of invention patent application after publication