CN103825785B - 一种服务节点的监测方法及装置 - Google Patents

一种服务节点的监测方法及装置 Download PDF

Info

Publication number
CN103825785B
CN103825785B CN201410111381.0A CN201410111381A CN103825785B CN 103825785 B CN103825785 B CN 103825785B CN 201410111381 A CN201410111381 A CN 201410111381A CN 103825785 B CN103825785 B CN 103825785B
Authority
CN
China
Prior art keywords
service node
service
node
warning message
default
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410111381.0A
Other languages
English (en)
Other versions
CN103825785A (zh
Inventor
杨永艳
徐宏志
张辉
桂胜
赵潇潇
刘刚
罗连杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Beijing China Power Information Technology Co Ltd
Original Assignee
State Grid Corp of China SGCC
Beijing China Power Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Beijing China Power Information Technology Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201410111381.0A priority Critical patent/CN103825785B/zh
Publication of CN103825785A publication Critical patent/CN103825785A/zh
Application granted granted Critical
Publication of CN103825785B publication Critical patent/CN103825785B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种服务节点的监测方法及装置,应用于服务集群,所述服务集群中包含有至少一个服务节点,该方法具体包括:建立与服务节点的通信连接,获取所述服务节点上的堆空闲百分比及待处理线程数,当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,则生成与所述服务节点对应的报警信息,从而实现了对所述服务集群中服务节点的监测。

Description

一种服务节点的监测方法及装置
技术领域
本申请涉及网络监控技术领域,尤其是一种服务节点的监测方法及装置。
背景技术
服务器,用于接收用户的数据处理请求,并依据该请求作出相应的处理动作。目前,基于云计算技术,可将服务与资源从实体服务器的底层框架中抽象出来,在多台物理机上部署所述中间件服务,则每台所述物理机可以认为是一个服务节点,将多个服务节点集中管理从而形成一个服务集群。该服务集群中的各个服务节点均可以对用户提供数据处理服务。
由于该服务集群部署在互联网中,需要面对众多的网络用户。当所述集群中的服务节点在某一时间段接收的用户数据请求过多时,导致服务节点运行状态的异常,不能及时地作出响应动作。因此,亟需一种对所述服务节点的监测方案。
发明内容
有鉴于此,本申请提供了一种服务节点的监测方法及装置,用以实现对服务节点的监测。本申请提供的技术方案如下:
一种服务节点的监测方法,应用于服务集群,所述服务集群中包含有至少一个服务节点,该方法包括:
建立与服务节点的通信连接;
获取所述服务节点上的堆空闲百分比及待处理线程数;
当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息。
上述方法,优选的,所述服务集群中设置有监管服务节点;
其中,所述建立与服务节点的通信连接包括:
建立与监管服务节点的通信连接;其中,所述监管服务节点上设置有监听地址、与所述监听地址对应的监听端口,所述监听端口包括堆空闲百分比监听端口及待处理线程数监听端口;
相应的,所述获取所述服务节点上的堆空闲百分比及待处理线程数包括:
依据所述监听地址,确定与所述监听地址对应的受管服务节点;
依据所述监听端口,获取所述受管服务节点上的堆空闲百分比及待处理线程数。
上述方法,优选的,还包括:
当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配。
上述方法,优选的,所述当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配,包括:
当接收到所述报警信息时,新建服务节点,并将所述新建的服务节点加入到所述服务集群中;
将所述目标服务节点上预设数目的用户数据请求分配至所述新建的服务节点。
上述方法,优选的,所述当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配,包括:
当接收到所述报警信息时,获取预先建立的服务节点,并将所述预先建立的服务节点加入到所述服务集群中;
将所述目标服务节点上预设数目的用户数据请求分配至所述预先建立的服务节点。
上述方法,优选的,在当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配之后,还包括:
判断所述目标服务节点上的堆空闲百分比是否未达到预设空闲阈值且所述待处理线程数是否未超过预设线程数目阈值;
若两者的判断的结果均为是,删除所述预设的服务节点。
本申请还提供了一种服务节点的监测装置,应用于服务集群,所述服务集群中包含有至少一个服务节点,该装置包括:
通信连接建立单元,用于建立与服务节点的通信连接;
目标数据获取单元,用于获取所述服务节点上的堆空闲百分比及待处理线程数;
报警信息生成单元,用于当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息。
上述装置,优选的,所述服务集群中设置有监管服务节点;其中,所述通信连接建立单元包括:
连接建立子单元,用于建立与监管服务节点的通信连接;其中,所述监管服务节点上设置有监听地址、与所述监听地址对应的监听端口,所述监听端口包括堆空闲百分比监听端口及待处理线程数监听端口;
相应的,所述目标数据获取单元包括:
服务节点确定子单元,用于依据所述监听地址,确定与所述监听地址对应的受管服务节点;
目标数据获取子单元,用于依据所述监听端口,获取所述受管服务节点上的堆空闲百分比及待处理线程数。
上述装置,优选的,还包括:
负载分配单元,用于当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配;
节点删除单元,用于判断所述目标服务节点上的堆空闲百分比是否未达到预设空闲阈值且所述待处理线程数是否未超过预设线程数目阈值,若两者的判断的结果均为是,删除所述预设的服务节点。
上述装置,优选的,所述负载分配单元包括:
第一负载分配子单元,用于当接收到所述报警信息时,新建服务节点,将所述新建的服务节点加入到所述服务集群中,并将所述目标服务节点上预设数目的用户数据请求分配至所述新建的服务节点;
第二负载分配子单元,用于当接收到所述报警信息时,获取预先建立的服务节点,将所述预先建立的服务节点加入到所述服务集群中,并将所述目标服务节点上预设数目的用户数据请求分配至所述预先建立的服务节点。
由以上的技术方案可知,本申请提供了一种服务节点的监测方法及装置,应用于服务集群,所述服务集群中包含有至少一个服务节点,该方法具体包括:建立与服务节点的通信连接,获取所述服务节点上的堆空闲百分比及待处理线程数,当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,则生成与所述服务节点对应的报警信息,从而实现了对所述服务集群中服务节点的监测。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的服务集群的一种实际架构图;
图2为本申请提供的一种服务节点的监测方法实施例一的流程图;
图3为本申请提供的一种服务节点的监测方法实施例二的流程图;
图4为本申请提供的服务集群的另一实际架构图;
图5为本申请提供的一种服务节点的监测方法实施例三的流程图;
图6为本申请提供的一种服务节点的监测方法实施例三的一具体流程图;
图7为本申请提供的一种服务节点的监测方法实施例三的另一具体流程图;
图8为本申请提供的一种服务节点的监测方法实施例四的流程图;
图9为本申请提供的实验结果的一个示例图;
图10为本申请提供的一种服务节点的监测装置实施例一的结构示意图;
图11为本申请提供的一种服务节点的监测装置实施例二的结构示意图;
图12为本申请提供的一种服务节点的监测装置实施例三的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,其示出了本申请提供的服务集群的一种实际架构图,该实际架构图中包含有四台物理机,即物理机1、物理机2、物理机3及物理机4,所述四台物理机中各自安装有虚拟机程序如WebLogic,所述WebLogic是用于开发、部署及管理大型分布式Web应用、网络应用和数据库应用的Java应用服务器。安装有虚拟机的物理机可作为服务节点,在所述服务节点中部署有服务及资源,可满足用户的数据请求,其中,所述数据请求可以是应用服务请求,也可以是获取资源请求。当然,本架构图只是对服务集群的一个示例,现有技术中其他形式的服务集群也在本申请的保护范围内。
请参阅图2,其示出了本申请提供的一种服务节点的监测方法实施例一的流程图,应用但不限定于上述图1所示的服务集群,所述服务集群中包含有至少一个服务节点,本实施例包括:
步骤101:建立与服务节点的通信连接。
其中,所述通信连接为执行本实施例的装置与所述服务集群中服务节点之间的通信连接。
步骤102:获取所述服务节点上的堆空闲百分比及待处理线程数。
利用所述通信连接,获取所述服务节点上的堆空闲百分比及待处理线程数。其中,获取所述堆空闲百分比的过程可以是,获取所述服务节点上的当前空闲堆的值及当前占用堆的值,将所述当前空闲堆的值与所述当前占用堆的和值确定为当前堆的总值,再将所述当前空闲堆的值除以所述当前堆的总值,从而获得所述堆空闲百分比。例如,当前空闲堆的值为40,当前占用堆的值为60,则堆空闲百分比为40/(40+60),即40%。
其中,所述待处理线程可以认为是用户的数据请求线程,所述服务节点需要处理所述各个数据请求线程。而所述服务节点上部署的服务与资源的总量是有限的,因此,当数据请求线程的数目过多时,所述服务节点会依据一定的顺序依次处理各个数据请求线程,则还处于等待处理状态的线程为待处理线程。
步骤103:当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息。
其中,步骤102中获取到堆空闲百分比及待处理线程数,需要将所述两者与各自对应的阈值进行比较。具体的,可以是同时判断,也可以是以预设的先后顺序进行判断。当两者之中的某一个超过与其对应的阈值时,则生成报警信息。需要说明的是,所述报警信息是与服务节点对应的。
需要说明的是,本实施例中的所述服务节点的个数为至少一个,若所述服务节点的个数为多个,可以对所述各个服务节点进行轮询监测,即依据预设的监测顺序,依次判断服务节点上的堆空闲百分比是否超过预设空闲阈值或待处理线程数是否超过预设线程数目阈值,若两者的判断结果有任意一个为是,则生成与所述服务节点对应的报警信息。
需要说明的是,所述报警信息只是一个提示信息或者标识信息,用以表明该服务节点上的用户数据请求过多,该服务节点上部署的服务及资源并不能满足所述各个用户数据请求。
由以上的技术方案可知,本实施例提供了一种服务节点的监测方法,应用于服务集群,所述服务集群中包含有至少一个服务节点,具体包括:建立与服务节点的通信连接,获取所述服务节点上的堆空闲百分比及待处理线程数,当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,则生成与所述服务节点对应的报警信息,从而实现了对所述服务集群中服务节点的监测。
请参阅图3,其示出了本申请提供的一种服务节点的监测方法实施例二的流程图,本实施应用于服务集群,该服务集群中设置有监管服务节点,用于对该服务集群中的各个服务节点进行监控,如图4所示,图中设备1为执行本实施例的装置,设备2为监管服务节点,设备3及设备4为服务节点。本实施例可以通过以下方式实现:
步骤201:建立与监管服务节点的通信连接;其中,所述监管服务节点上设置有监听地址、与所述监听地址对应的监听端口,所述监听端口包括堆空闲百分比监听端口及待处理线程数监听端口。
其中,建立所述通信连接的过程可以是依据所述监听地址,构建连接对象,所述连接对象中包含有服务节点的地址、名称及密码。另外,所述通信连接使用的通信协议可以是T3、T3s、HTTP、HTTPS、IIOP及IIOPS协议中的任意一种。另外,当需要与监管服务节点进行连接时,建立通信连接;当监管完毕后,关闭所述通信连接。
步骤202:依据所述监听地址,确定与所述监听地址对应的受管服务节点。
其中,所述监管服务节点上设置有监听地址如服务节点的网络地址,用以标识监管的服务节点。所述监听地址为至少一个,则若监听地址为多个时,通过所述监听地址,可以确定具体的服务节点。例如,与监听地址1对应的服务节点是图4中的设备3,与监听地址2对应的服务节点是图4中的设备4。
步骤203:依据所述监听端口,获取所述受管服务节点上的堆空闲百分比及待处理线程数。
其中,所述监管服务节点上设置有与监听地址对应的监听端口,用于监听服务节点上的具体数据。具体的,所述监听端口包括堆空闲百分比监听端口及待处理线程数监听端口,分别用于监听服务节点上的堆空闲百分比及待处理线程数目。例如,监听地址1对应的监听端口为Port1及Port2,分别用于监听设备3上的堆空闲百分比及待处理线程数目。
步骤204:当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息。
本步骤与上一方法实施例中的步骤103相同,在此不做赘述。
请参阅图5,其示出了本申请提供的一种服务节点的监测方法实施例三的流程图,应用于服务集群,所述服务集群中包含有至少一个服务节点,本实施例可以包括:
步骤301:建立与服务节点的通信连接。
步骤302:获取所述服务节点上的堆空闲百分比及待处理线程数。
步骤303:当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息。
其中,步骤301至步骤303与方法实施例一相同,在此不做赘述。
步骤304:当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配。
其中,当接收到报警信息时,可以获知与所述报警信息对应的目标服务节点上的用户数据请求已经超过了服务节点预设的承载能力,需要将用户数据请求进行分配。其中,分配的方式可以是向预设的服务节点进行分配。所述预设的服务节点指的是在分配前设置好的服务节点。具体地,请参见以下两种分配方式:
请参阅图6,本步骤的一种实现方式可以为:
步骤401:当接收到所述报警信息时,新建服务节点,并将所述新建的服务节点加入到所述服务集群中。
其中,在本方式中,新建服务节点的时间点为接收到所述报警信息时。在将服务节点建立完毕后,需要加入到所述服务集群中,进而分担所述目标服务节点上的负载压力。
步骤402:将所述目标服务节点上预设数目的用户数据请求分配至所述新建的服务节点。
具体的,在所述目标服务节点上获取预设数目的用户数据请求,并将获取到的用户数据请求分配至所述新建的服务节点上。其中,可以应用WLST(WebLogic ScriptingTool)进行服务节点的建立。所述WLST,是一种命令行解释器,系统管理员和操作员可以应用所述命令行解释器对服务节点及服务集群进行管理。具体的,WLST可以使用脚本模式、嵌入式模式或者交互模式中的任意一种方式。
请参阅图7,本步骤的另一实现方式可以为:
步骤501:当接收到所述报警信息时,获取预先建立的服务节点,并将所述预先建立的服务节点加入到所述服务集群中。
其中,所述预先建立的服务节点,是在接收到报警信息前已经预先建立的服务节点。
步骤502:将所述目标服务节点上预设数目的用户数据请求分配至所述预先建立的服务节点。
需要说明的是,图6所示的方案与图7所示的方案中,服务节点的建立时间点是不同的,即图6的服务节点是在接收到报警信息时建立的,图7的服务节点在接收到报警信息前已经建立。第一种方式,不需要预先建立多余的服务节点,可以实现最低的能源消耗,而由于服务节点的建立需要时间如5到10分钟,如果在接收报警信息时才进行建立,可能导致报警的服务节点上的负载不能及时得到分配,或者建立服务节点本的过程出现异常;第二种方式,可以预先设置至少一个服务节点,当接收到报警信息时,则获取所述预先建立的服务节点进行负载分配,分配效率高。
需要说明的是,第二种方式中预先设置的服务节点的个数可以与时间相关,即根据用户访问服务节点的情况设置经验值,在用户访问量较多的日期预先设置较多的服务节点,在用户访问量较少的日期预先设置较少的服务节点。当监测到所述服务集群中某个服务节点生成报警信息时,可以将预先设置的服务节点加入到所述服务集群中进行负载分配。其中,所述日期可以是一个月的某些天,或者可以进一步是某天中具体的时间段。当然,第二种方式中预先设置服务节点的个数可以不与时间相关,即每天预先设置相同数量的服务节点。
请参阅图8,其示出了本申请提供的一种服务节点的监测方法实施例四的流程图。具体的,在上述方法实施例三的基础上,还可以包括:
步骤305:判断所述目标服务节点上的堆空闲百分比是否未达到预设空闲阈值且所述待处理线程数是否未超过预设线程数目阈值;若两者的判断的结果均为是,执行步骤306。
其中,所述判断过程可以是实时的,但当所述目标服务节点的个数为多个时,可以是对所述多个目标服务节点采用轮询的方式,即依照一定的次序对所述多个目标服务节点进行判断。当然,判断的内容包括两部分:堆空闲百分比是否未达到预设空闲阈值及待处理线程数是否未超过预设线程数目阈值。若两者的判断结果均为是,说明所述目标服务节点上的用户数据请求数目已经处于较低的数值,则执行步骤306。
步骤306:删除所述预设的服务节点。
其中,所述删除为收回所述预设的服务节点的服务及资源,从而可以减少资源消耗。
请参阅图9,其示出了本申请的一个实验结果示例图。图a)、b)、c)及d)中,曲线代表服务节点上的待处理线程数变化情况,饼图中的颜色较浅的部分代表服务节点上的堆空闲百分比。通过图a)、b)、c)及d)中曲线及饼图的变化情况可知服务集群中各个服务节点上的压力变化情况(用户数据处理数目的变化情况)。
具体的,测试开始时,默认在服务集群中开启两个服务节点,则待处理线程数均为0且堆空闲百分比为100%。经过一段时间后,所述两个服务节点的压力情况如图a)所示,待处理线程数逐渐增大,堆空闲百分比逐渐减小。当某个服务节点的待处理线程数超过预设线程数目阈值或堆空闲百分比超过预设空闲阈值,则将预先设置的服务节点加入所述服务集群中进行负载分配,如图b)所示,在该图中出现了一条新的曲线及饼图。接下来,三个服务节点的待处理线程数及堆空闲百分比趋向均衡,如图c)所示。当该服务节点的待处理线程数未超过预设线程数目阈值且堆空闲百分比未超过预设空闲阈值时,将预设的服务节点进行删除,即收回所述预设服务节点上的资源,如图d)所示,服务集群中两个服务节点的压力值逐渐降低。
对应上述方法实施例一,本申请还提供了一种装置实施例。具体的,请参阅图10,其示出了本申请提供的一种服务节点的监测装置实施例一的结构示意图,应用于服务集群,所述服务集群中包含有至少一个服务节点,本实施例可以包括:
通信连接建立单元601,用于建立与服务节点的通信连接;
目标数据获取单元602,用于获取所述服务节点上的堆空闲百分比及待处理线程数;
报警信息生成单元603,用于当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息。
对应上述方法实施例二,本申请还提供了另一装置实施例。具体的,请参阅图11,其示出了本申请提供的一种服务节点的监测装置实施例二的结构示意图,应用于服务集群,所述服务集群中包含有至少一个服务节点,本实施例可以包括:
连接建立子单元701,用于建立与监管服务节点的通信连接;其中,所述监管服务节点上设置有监听地址、与所述监听地址对应的监听端口,所述监听端口包括堆空闲百分比监听端口及待处理线程数监听端口;
服务节点确定子单元702,用于依据所述监听地址,确定与所述监听地址对应的受管服务节点;
目标数据获取子单元703,用于依据所述监听端口,获取所述受管服务节点上的堆空闲百分比及待处理线程数;
报警信息生成单元704,用于当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息。
对应上述方法实施例三及方法实施例四,本申请提供了又一装置实施例的结构示意图。具体的,请参阅图12,其示出了本申请提供的一种服务节点的监测装置实施例三的结构示意图,应用于服务集群,所述服务集群中包含有至少一个服务节点,本实施例可以包括:
通信连接建立单元801,用于建立与服务节点的通信连接;
目标数据获取单元802,用于获取所述服务节点上的堆空闲百分比及待处理线程数;
报警信息生成单元803,用于当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息;
负载分配单元804,用于当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配;
节点删除单元805,用于判断所述目标服务节点上的堆空闲百分比是否未达到预设空闲阈值且所述待处理线程数是否未超过预设线程数目阈值,若两者的判断的结果均为是,删除所述预设的服务节点。
需要说明的是,本装置实施例可以利用单元801至804执行上述方法实施例三的动作,也可利用单元801至805执行上述方法实施例四的动作。
具体的,上述装置实施例中的负载分配单元可以具体通过以下方式实现:
第一负载分配子单元,用于当接收到所述报警信息时,新建服务节点,将所述新建的服务节点加入到所述服务集群中,并将所述目标服务节点上预设数目的用户数据请求分配至所述新建的服务节点;
第二负载分配子单元,用于当接收到所述报警信息时,获取预先建立的服务节点,将所述预先建立的服务节点加入到所述服务集群中,并将所述目标服务节点上预设数目的用户数据请求分配至所述预先建立的服务节点。
需要说明的是,所述第一负载分配子单元与所述第二负载分配子单元并不同时执行动作,即可以依据预先设置服务节点的方式来决定执行动作的是第一负载分配子单元还是第二负载分配子单元。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种服务节点的监测方法,其特征在于,应用于服务集群,所述服务集群中包含有至少一个服务节点,该方法包括:
建立与服务节点的通信连接;
获取所述服务节点上的堆空闲百分比及待处理线程数;
当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息;
还包括:
当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配;
在当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配之后,还包括:
判断所述目标服务节点上的堆空闲百分比是否未达到预设空闲阈值且所述待处理线程数是否未超过预设线程数目阈值;
若两者的判断的结果均为是,删除所述预设的服务节点。
2.根据权利要求1所述的方法,其特征在于,所述服务集群中设置有监管服务节点;
其中,所述建立与服务节点的通信连接包括:
建立与监管服务节点的通信连接;其中,所述监管服务节点上设置有监听地址、与所述监听地址对应的监听端口,所述监听端口包括堆空闲百分比监听端口及待处理线程数监听端口;
相应的,所述获取所述服务节点上的堆空闲百分比及待处理线程数包括:
依据所述监听地址,确定与所述监听地址对应的受管服务节点;
依据所述监听端口,获取所述受管服务节点上的堆空闲百分比及待处理线程数。
3.根据权利要求1所述的方法,其特征在于,所述当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配,包括:
当接收到所述报警信息时,新建服务节点,并将所述新建的服务节点加入到所述服务集群中;
将所述目标服务节点上预设数目的用户数据请求分配至所述新建的服务节点。
4.根据权利要求1所述的方法,其特征在于,所述当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配,包括:
当接收到所述报警信息时,获取预先建立的服务节点,并将所述预先建立的服务节点加入到所述服务集群中;
将所述目标服务节点上预设数目的用户数据请求分配至所述预先建立的服务节点。
5.一种服务节点的监测装置,其特征在于,应用于服务集群,所述服务集群中包含有至少一个服务节点,该装置包括:
通信连接建立单元,用于建立与服务节点的通信连接;
目标数据获取单元,用于获取所述服务节点上的堆空闲百分比及待处理线程数;
报警信息生成单元,用于当所述堆空闲百分比超过预设空闲阈值或所述待处理线程数超过预设线程数目阈值时,生成与所述服务节点对应的报警信息;
还包括:
负载分配单元,用于当接收到所述报警信息时,将与所述报警信息对应的目标服务节点上的用户数据请求向预设的服务节点进行分配;
节点删除单元,用于判断所述目标服务节点上的堆空闲百分比是否未达到预设空闲阈值且所述待处理线程数是否未超过预设线程数目阈值,若两者的判断的结果均为是,删除所述预设的服务节点。
6.根据权利要求5所述的装置,其特征在于,所述服务集群中设置有监管服务节点;其中,所述通信连接建立单元包括:
连接建立子单元,用于建立与监管服务节点的通信连接;其中,所述监管服务节点上设置有监听地址、与所述监听地址对应的监听端口,所述监听端口包括堆空闲百分比监听端口及待处理线程数监听端口;
相应的,所述目标数据获取单元包括:
服务节点确定子单元,用于依据所述监听地址,确定与所述监听地址对应的受管服务节点;
目标数据获取子单元,用于依据所述监听端口,获取所述受管服务节点上的堆空闲百分比及待处理线程数。
7.根据权利要求5所述的装置,其特征在于,所述负载分配单元包括:
第一负载分配子单元,用于当接收到所述报警信息时,新建服务节点,将所述新建的服务节点加入到所述服务集群中,并将所述目标服务节点上预设数目的用户数据请求分配至所述新建的服务节点;
第二负载分配子单元,用于当接收到所述报警信息时,获取预先建立的服务节点,将所述预先建立的服务节点加入到所述服务集群中,并将所述目标服务节点上预设数目的用户数据请求分配至所述预先建立的服务节点。
CN201410111381.0A 2014-03-24 2014-03-24 一种服务节点的监测方法及装置 Active CN103825785B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410111381.0A CN103825785B (zh) 2014-03-24 2014-03-24 一种服务节点的监测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410111381.0A CN103825785B (zh) 2014-03-24 2014-03-24 一种服务节点的监测方法及装置

Publications (2)

Publication Number Publication Date
CN103825785A CN103825785A (zh) 2014-05-28
CN103825785B true CN103825785B (zh) 2017-05-10

Family

ID=50760630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410111381.0A Active CN103825785B (zh) 2014-03-24 2014-03-24 一种服务节点的监测方法及装置

Country Status (1)

Country Link
CN (1) CN103825785B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106027286A (zh) * 2016-05-05 2016-10-12 北京思特奇信息技术股份有限公司 一种通信系统中节点的监控方法及系统
CN105933433A (zh) * 2016-06-07 2016-09-07 中国建设银行股份有限公司 用于银行应用的配置方法和装置
CN106385341B (zh) * 2016-08-31 2021-03-26 福建天晴数码有限公司 客户端监控线程的方法及其系统
CN107911230B (zh) * 2017-10-24 2020-08-28 丹露成都网络技术有限公司 基于metaq集群的自动监控恢复方法
CN110138732B (zh) * 2019-04-03 2022-03-29 平安科技(深圳)有限公司 访问请求的响应方法、装置、设备及存储介质
CN111614747B (zh) * 2020-05-18 2023-03-10 北京奇艺世纪科技有限公司 一种信息处理方法及装置
CN111813556B (zh) * 2020-07-21 2021-04-09 北京东方通软件有限公司 云计算环境下的虚拟集群的弹性伸缩方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101707632A (zh) * 2009-10-28 2010-05-12 浪潮电子信息产业股份有限公司 一种动态监控服务器集群性能并实时报警的方法
CN101710339A (zh) * 2009-11-20 2010-05-19 中国科学院计算技术研究所 控制机群文件系统中数据存储方法和系统及创建文件方法
CN103036994A (zh) * 2012-12-18 2013-04-10 曙光信息产业(北京)有限公司 实现负载均衡的云存储系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101707632A (zh) * 2009-10-28 2010-05-12 浪潮电子信息产业股份有限公司 一种动态监控服务器集群性能并实时报警的方法
CN101710339A (zh) * 2009-11-20 2010-05-19 中国科学院计算技术研究所 控制机群文件系统中数据存储方法和系统及创建文件方法
CN103036994A (zh) * 2012-12-18 2013-04-10 曙光信息产业(北京)有限公司 实现负载均衡的云存储系统

Also Published As

Publication number Publication date
CN103825785A (zh) 2014-05-28

Similar Documents

Publication Publication Date Title
CN103825785B (zh) 一种服务节点的监测方法及装置
CN103812823B (zh) 虚拟机热迁移时配置信息迁移的方法、设备及系统
CN103197952B (zh) 基于云基础设施的针对应用系统维护部署的管理系统和方法
JP2004187296A5 (zh)
CN107135279A (zh) 一种处理长连接建立请求的方法和装置
CN106814975A (zh) 一种用于多类型存储设备的存储管理方法及其系统
CN107544837A (zh) 云服务设备性能数据采集系统、方法和装置
CN105187781A (zh) 一种自动添加监控设备的方法和装置
CN108243222A (zh) 服务器网络架构方法及装置
CN105554099A (zh) 一种采集服务器负载均衡的方法及装置
WO2020249345A1 (de) Verfahren zur bereitstellung von steuerungsanwendungen und konfigurationssteuerungseinrichtung
CN109617966A (zh) 一种基于Openstack的云管平台部署系统及方法
CN114070707A (zh) 一种互联网性能监控方法及系统
CN105847352A (zh) 基于分布式缓存系统的扩容方法、装置及分布式缓存系统
CN108282526A (zh) 双集群间服务器动态分配方法及系统
CN105354128B (zh) 一种计算机资源监控方法、装置及系统
CN104601378A (zh) 结合应用性能指标监控数据的虚拟资源弹性调度实现方法
CN104731660B (zh) 数据分配方法、装置和系统
CN105681266B (zh) 一种多媒体电话MMTel的通讯集群方法及装置
CN106878117A (zh) 一种数据处理方法及装置
CN109379205A (zh) 一种会议延时的处理方法和装置
CN105357222B (zh) 一种分布式Session管理中间件
CN108259639A (zh) Ip地址分配方法及装置
CN107729435A (zh) 分布式文件系统任务分派的方法、装置、设备和存储介质
CN107888683A (zh) 一种客户端交互方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant