CN109586952B - 服务器扩容方法、装置 - Google Patents

服务器扩容方法、装置 Download PDF

Info

Publication number
CN109586952B
CN109586952B CN201811321594.0A CN201811321594A CN109586952B CN 109586952 B CN109586952 B CN 109586952B CN 201811321594 A CN201811321594 A CN 201811321594A CN 109586952 B CN109586952 B CN 109586952B
Authority
CN
China
Prior art keywords
capacity expansion
host
service process
service
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811321594.0A
Other languages
English (en)
Other versions
CN109586952A (zh
Inventor
刘文旭
何嘉俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Information Technology Co Ltd
Original Assignee
Guangzhou Huya Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Information Technology Co Ltd filed Critical Guangzhou Huya Information Technology Co Ltd
Priority to CN201811321594.0A priority Critical patent/CN109586952B/zh
Publication of CN109586952A publication Critical patent/CN109586952A/zh
Application granted granted Critical
Publication of CN109586952B publication Critical patent/CN109586952B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes

Abstract

本发明属于计算机网络领域,其提供一种服务器扩容方法、装置,其中一种服务器扩容方法包括以下步骤:接收扩容请求指令,获取服务器系统中各个主机的基础数据和业务数据;根据所述基础数据和业务数据进行匹配运算,获取可进行扩容的主机当前的可用资源量,根据可用资源量确定扩容的目标主机;根据需要扩容的业务容量在所述目标主机进行扩容。该方法具备自动决策能力,能提高扩容的效率。

Description

服务器扩容方法、装置
技术领域
本发明涉及服务器资源分配领域,尤其涉及一种服务器扩容方法、装置。
背景技术
在互联网中,由于用户数量和用户的业务请求是变动的,因此,相关的服务器资源需及时的调整,否则,会影响运营效率,降低用户的体验度。
目前的网络资源调整方法,一般会包括监控系统,主要是用于监控基础数据,如CPU、内存、磁盘、网卡带宽的负载情况。但缺乏相关的业务数据和自动决策能力,所得到的扩容方案比较低效。
发明内容
本发明的目的旨在提供一种服务器扩容方法、装置,以解决传统扩容方法低效的问题。
为了实现上述目的,本发明提供以下技术方案:
第一方面,本发明提供了一种服务器扩容方法,其包括:
接收扩容请求指令,获取服务器系统中各个主机的基础数据和业务数据;
根据所述基础数据和业务数据进行匹配运算,获取可进行扩容的主机当前的可用资源量,根据可用资源量确定扩容的目标主机;
根据需要扩容的业务容量在所述目标主机进行扩容。
在一个实施例中,接收扩容请求指令的步骤之前,还包括:以下触发扩容请求指令方式的任意一种:
获取监控中心的监测结果,当监测结果为主机出现异常时,触发扩容请求指令;
获取服务器系统中各个主机的实时基础数据和实时业务数据,根据实时基础数据和实时业务数据判断各个主机的运行状态;当有主机出现异常时,触发扩容请求指令;
当接收用户输入的扩容参数,触发扩容请求指令。
在一个实施例中,当监测结果为主机出现异常时,还包括:
通知所述监控中心对所述服务器系统的各个主机进行巡检,对产生异常的主机发出自愈指令,使得对应主机启动自愈程序进行自愈;
将出现异常的主机上的业务数据迁移至正常的主机上。
在一个实施例中,所述业务数据包括服务进程资源信息和在线用户数信息。
在一个实施例中,所述根据所述基础数据和所述业务数据进行匹配运算,获取可进行扩容的主机当前的可用资源量的步骤包括:
利用所述各服务进程资源信息求取各服务进程的运算资源的依赖度,获得各服务进程的运算资源的依赖度排名;
根据所述各服务进程的运算资源的依赖度排名,进行权重计算,得到各服务进程的运算资源的权重值;
利用所述各服务进程的运算资源的权重值得到可进行扩容主机的扩容权重,并根据所述扩容权重确定可进行扩容的主机当前的可用资源量。
在一个实施例中,所述利用所述各服务进程资源信息求取各服务进程的运算资源的依赖度的表达式为:
Figure BDA0001857650230000021
其中,Yi是各服务进程对运算资源的依赖度,i为对应的服务进程;
Figure BDA0001857650230000022
是高峰时段运算资源设定分位值平均值,Zm是中位服务器的总运算资源值。
在一个实施例中,所述根据所述各服务进程的运算资源的依赖度排名,进行权重计算,得到各服务进程的运算资源的权重值的表达式为:
Figure BDA0001857650230000031
其中,Qi是各服务进程的运算资源权重,i为对应的服务进程;n为对应服务进程对运算资源的依赖度的排名,I为总服务进程数。
在一个实施例中,所述利用所述各服务进程的运算资源的权重值得到可进行扩容主机的扩容权重的表达式:
Figure BDA0001857650230000032
Qx是对应主机的扩容权重,i为对应的服务进程,Zik是第i个服务进程的资源空闲量,Zig是高峰期的第i个服务进程的资源占用量,Ziy是第i个服务进程在对应主机资源阈值,Qi是各服务进程的运算资源权重。
在一个实施例中,所述根据需要扩容的业务容量在所述目标主机进行扩容的步骤包括:
判断当前服务器系统是否有足够可进行扩容的主机;
若否,发出新增主机的申请请求,等待新增的扩容主机;
待新增扩容的主机后,监控扩容的主机的负载信息,若所述扩容的主机的负载超出预估范围,重新进行所述匹配运算,确定所述扩容的目标主机。
第二方面,本发明提供了一种服务器扩容装置,其包括:
获取模块,用于接收扩容请求指令,获取服务器系统中各个主机的基础数据和业务数据;
运算模块,用于根据所述基础数据和业务数据进行匹配运算,获取可进行扩容的主机当前的可用资源量,根据可用资源量确定扩容的目标主机;
扩容模块,用于根据需要扩容的业务量,利用所述目标主机进行扩容。
第三方面,本发明提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述服务器扩容方法。
第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述服务器扩容方法的步骤。
相比现有技术,本发明的方案具有以下优点:
本发明提供的一种服务器扩容方法,通过对基础数据和业务数据进行监测,排除故障或高载的主机;通过匹配运算得到可进行扩容的主机的当前的可用资源量,最终确定目标主机进行扩容。该方法完全以服务器系统的数据为判断是否需要扩容的依据,通过计算自动得到进行扩容的目标主机,实现了快速决策扩容和进行扩容,提高了扩容效率,解决了传统扩容方法缺乏自动决策能力,扩容低效的问题。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明提供实施例中的服务器扩容方法的流程图;
图2为本发明提供实施例中的服务器扩容方法的运行架构示意图;
图3为本发明提供实施例中的服务器扩容方法的监控过程的流程框图;
图4为本发明提供实施例中的服务器扩容方法的匹配运算的流程图;
图5为本发明提供实施例中的服务器扩容方法的判定扩容的流程框图;
图6为本发明提供实施例中的服务器扩容装置的结构示意图;
图7为本发明提供实施例中的计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本领域技术人员应当理解,本申请所称的“应用”、“应用程序”、“应用软件”以及类似表述的概念,是业内技术人员所公知的相同概念,是指由一系列计算机指令及相关数据资源有机构造的适于电子运行的计算机软件。除非特别指定,这种命名本身不受编程语言种类、级别,也不受其赖以运行的操作系统或平台所限制。理所当然地,此类概念也不受任何形式的终端所限制。
本领域技术人员应当理解,本申请所称的用户界面、显示界面泛指能够用于向智能终端发送所述控制指令的显示界面,例如,可以是Android/IOS/Windows Phone系统的设置页面中的一个选项(或按键,由所述应用程序添加其中,下同),也可以是从桌面呼出的通知栏或者交互页面中的一个选项,还可以是所述应用程序的一个活动组件所构造的页面中的一个选项。
传统的服务器扩容方法,一般更多关注硬件资源的可用性,但往往忽略业务资源的可用性,使得以此指定扩容方案会因考虑不周全而不能完全发挥应有的扩容效果。
基于此,本发明提供一种服务器扩容方法,以解决现有技术的服务器扩容方法低效扩容的问题。本公开实施例通过接收扩容请求指令,获取服务器系统中各个主机的基础数据和业务数据;根据所述基础数据和业务数据进行匹配运算,获取可进行扩容的主机当前的可用资源量,根据可用资源量确定扩容的目标主机;根据需要扩容的业务容量在所述目标主机进行扩容。
下面,对本公开实施例所提供的方案进行详细说明。
如图1所示,图1是本发明公开根据一实施例示出的一种服务器扩容方法的流程图。
在本实施例中,可以参考图2所示的运行架构示意图对运行所述服务器扩容方法,在本实施例中,该服务器扩容方法可以在图2中的决策中心230上运行。但该示意图只是用于更好地陈述上述服务器扩容方法,并不用于限定该方法的使用场景。
在步骤S120中,接收扩容请求指令,获取服务器系统中各个主机的基础数据和业务数据。
此步骤中,可以接收来自维护人员或者是其他装置所发送的扩容请求,所述扩容请求为连接的服务器系统中所要扩容的主机数量。当接收到扩容请求后,向服务器系统的各个主机发送获取其各自的基础数据和业务数据的请求,其中基础数据为关于硬件资源的数据,如CPU(Central Processing Unit,中央处理器)、内存、磁盘、网卡带宽等硬件负载,所述业务数据包括关于服务数据、占用量等评价主机服务质量的指标,具体可以包括单位时间服务总访问量、单位时间服务调用总成功流程、单位时间服务单机服务调用量、单位时间服务单机服务调用成功率、使用服务用户数等关键业务信息等信息。
所述业务数据可以根据服务性质的不同,将上述数据通过环比、同比、趋势预测和及其学习等办法检测出关于业务数据的异常点。
作为一种实施例,在步骤S120的接收扩容请求指令的步骤之前,可以包括:
步骤S111:获取监控中心210的监测结果,当监测结果为为主机出现异常时,触发扩容请求指令。
所述异常可以是通过监控中心210通过获取所述基础数据和业务数据后,再经过监测得出的异常结果。
作为实施例,该监测过程如图3所示:
当监控中心210确认与从各个主机所连接的监控代理所上报的关于基础数据是正确后,便开始检测上报的数据是否存在异常。
若监控代理所上报的关于基础数据是不正确,则监控中心210主动探测主机状态是否异常。如果主机状态为异常状态,再进一步确认是否为网络波动,若是,则发出网络报警。
在本实施例中,所述异常分别可以为基础监控异常、业务数据异常和接口测试异常。
对于当监测发现基础监控异常时,可通过通知监控中心210向对应的主机发送指令,尝试停止其非核心的业务,并对各个主机进行巡检。对产生异常的主机发送自愈指令,对应主机启动自愈程序通进行自愈;若自愈失败,发出核心级报警,表示对应主机的硬件基础出现问题,很大程度上会影响正常使用;若自愈成功,可通过监控中心210记录自愈信息,然后发出通知级报警。
对于当监控发现业务数据异常和接口测试异常时,根据对获取的数据进行分析。所述业务数据并非包括所有的业务数据,而是主要关于对应主机接口的业务数据,如接口的连接成功率是否达到设定的指标等。若监控中心210发现上述的异常情况达到严重的程度,或者是该异常长度超过所设定的监控时间阈值,即认定为持续时间长,得出对应的主机可能存在故障的情况,为了不影响服务,首先把对应的主机进行迁移流量的处理,将其服务转移至正常的其他主机上进行。然后,发出扩容判断请求,以保证后续的服务不受影响。
发出扩容判断请求后,为进一步评估可能出现故障对服务的影响程度,监控中心210对被迁移流量的主机对应的服务等级进行确认。若该服务等级为核心业务时,并发出核心报警;若该服务等级为非核心业务时,并发出重要级报警。
在本实施例中,监控中心210同时也对网络进行监控。若接收到网络报警时,监控中心210便会主动对主机网络端口进行扫描,探测主机的状态是否异常。若是,则推断是网络波动,若否,推断出现异常的主机的监控代理可能出现异常,向对应的主机发出指令,对监控代理进行重启。对于网络波动的推断,如果推断是正确的,依然维持网络报警,等待维护人员处理;如果推断是错误的,则将该网络报警进行屏蔽,以免其干扰正常运行和维护。如果不能对该报警进行屏蔽,发出核心级报警。根据上述内容,所述服务器扩容方法的报警至少包括核心级报警、通知级报警和重要级报警等对报警分为不同的级别,目的是以便维护人员能通过报警的级别区分服务器系统网络中哪一部分出现问题和指引待处理异常的紧急程度,以便维护人员作出及时且正确的处理。
作为一种实施例,在步骤S120的接收扩容请求指令的步骤之前,还可以包括:
步骤S112:获取服务器系统中各个主机的实时基础数据和实时业务数据,根据实时基础数据和实时业务数据判断各个主机的运行状态;当有主机出现异常时,触发扩容请求指令。
在本实施例中,先获取各个主机的实时业务数据并对其进行检测,如果业务数据出现问题时,再获取各个主机的实时基础数据,以便对所述服务器系统中的各个主机的运行状态进行实时检测。当检测到由主机出现异常时,触发扩容请求指令。这样避免了因同时对大量的数据进行检测,拖慢了对运行效率。所述实时业务数据和所述实时基础数据可以存于大数据存储220中,当需要进行检测时,从其中直接拉取数据。这时,所述实时基础数据可以是原始的基础数据,也可以是由监控中心210得出的最近一次的监控结果。
作为一种实施例,在步骤S120的中的所述接收扩容请求指令的步骤可以包括:
步骤S121:当接收用户输入的扩容参数时,触发扩容请求指令。
在本实施例中,无需以基础数据和/或业务数据的异常为前提,运维或研发的人员250只需根据需求,输入扩容的参数,扩容节点数量、扩容分组等信息,所述决策中心230根据所述扩容参数,触发扩容请求指令。根据上述扩容参数计算需要扩容的业务数据量,以便进行匹配运算,达到给各个主机合理分配业务数据量的目的。
在步骤S130中,根据所述基础数据和业务数据进行匹配运算,获取可进行扩容的主机当前的可用资源量,根据可用资源量确定扩容的目标主机。
其中,可能资源量为当前可用主机的数量,根据上述监测得到的异常结果,排除可能故障或故障的主机。进行排除后,原来的服务器系统的余下的主机在扩容状态时依然可用,即得到可进行扩容的主机。扩容的依据是业务数据,该业务数据包括在所述服务器系统下运行或是将要运行的服务进程资源信息和在线用户。如图4所示,在本是是实施例中,所述匹配运算包括以下几个步骤:
步骤S410:利用所述各服务进程资源信息求取各服务进程的运算资源的依赖度,获得各服务进程的运算资源的依赖度排名;
步骤S420:根据所述各服务进程的运算资源的依赖度排名,进行权重计算,得到各服务进程的运算资源的权重值;
步骤S430:利用所述各服务进程的运算资源的权重值得到可进行扩容主机的扩容权重。
具体的,可如图5的判定扩容的流程图所示:
通过获取基础数据和业务数据,并对其监测,得到可能存在故障或高载的主机,对其进行排除或屏蔽,剩下可正常工作且空闲率较高的主机作为扩容主机的考虑对象。
对于步骤S410,针对各个服务进程资源信息的高峰时段的所设定的某运算量的分位值的平均值作为统计对象,以保证实施的扩容可以保证每个服务进程任何时段的顺畅运行。
在本实施例中,所述运算资源为服务系统中的CPU的运算能力,所述设定的某运算量的分位置的平均值为所述服务器系统可处理某服务进程的运算能力。如设定该平均值为95,即服务器系统可运行比如其中的A服务进程的95%运算能力。
根据上述得到的高峰时段的所设定的某运算量的分位值的平均值结合上述服务器系统中的中位主机的总运算资源值,得到各服务进程的运算资源的依赖度。所述中位主机的总运算资源值为服务器系统中的处理量位于中位的主机的总运算资源值。在本实施例中,所述总运算资源值可以为对应主机的总CPU运算能力值。
所述各服务进程的运算资源的依赖度的表达式为:
Figure BDA0001857650230000101
其中,Yi是各服务进程对运算资源的依赖度,i为对应的服务进程;
Figure BDA0001857650230000102
是高峰时段运算资源设定分位值平均值,Zm是中位主机的总运算资源值。
根据公式(1)对上述服务器系统的各个服务进程对运算资源的依赖度,具体可理解为对CPU运算的依赖度,然后对其进行排名。
然后,进行步骤S420,根据得到的依赖度排名,进行权重计算,求取对应服务进程的运算资源的权重值,该权重计算的表达式为:
Figure BDA0001857650230000103
其中,Qi是各服务进程的运算资源权重,i为对应的服务进程;n为对应服务进程对运算资源的依赖度的排名,I为总服务进程数。
该步骤是对每个时间段对应的服务进程对于运算资源的权重,权重越高意味着在该服务进程是更加需要对应资源的,以便在扩容中,可针对不同服务进程合理配置相应的资源,该资源可包括基础资源和业务资源。
根据公式(2)得到的对应服务进程的运算资源的权重值,确定扩容的目标主机。具体,可进行步骤S430得到。
由于不能主机的运算能力不同、运算能力不同、当前的资源占用量不同,因此,进行扩容时,需考虑考虑到应将如何部署至哪台主机上。对应该问题,可以通过求取可进行扩容主机的扩容权重,然后对该权重进行排名,以便得到不同主机对扩容请求的优选扩容次序。求取对应主机的服务器扩容权重的表达式为:
Figure BDA0001857650230000104
Qx是对应主机的扩容权重,i为对应的服务进程,Zik是第i个服务进程的资源空闲量,Zig是高峰期的第i个服务进程的资源占用量,Ziy是第i个服务进程在对应主机资源阈值,Qi是各服务进程的运算资源权重。
公式(3)得到的对应主机的扩容权重Qx是用于评价对应主机的空闲率,若得到的扩容权重Qx越高,就代表对应主机当前的空闲率越高,即可以在优先扩容次序中排名越前,在扩容时优先成为扩容的目标主机。
对于步骤S140,根据需要扩容的业务量,利用上述得到的对各个主机的扩容权重Qx所确定的目标主机进行扩容。
具体地,对各个主机的扩容权重Qx进行排名,筛选出空闲率较高的主机作为最适合主机,即目标主机。
根据可用资源量确定扩容的目标主机的步骤之前,在本实施例中,所述可用资源量体现为上述求得的扩容权重。若当前的服务器系统中可进行扩容的主机数量时足够的,在本实施例中,可根据所述扩容权重由高至低的顺序向需要扩容数量对应的主机发出请求,以获得业务数据的迁移权限。当获得该权限时,部署服务器系统的服务进程。在本实施例中,该部署具体可为发布平台240向目标主机的扩容节点下发程序包并安装启动。服务进程自动发现对应扩容的主机以及向对应主机发出注册请求。若请求正常,则进一步确认请求是否均衡,若请求均衡,扩容流程结束。若请求不正常,则停止相应的服务进程,并发出重要级警告。若上述的请求不均衡,也可触发重要级报警。
对应待扩容的业务量所需要的主机数量大于当前可进行扩容的主机数量,即当前可用扩容的主机数量不足时,发出新主机的请求,向维护人员所使用的系统邮箱发送邮件提示,以便提醒维护人员及时了解情况,并等待候补的主机到位。
所述服务器扩容方法还包括:待新增扩容的主机后,监控扩容的服务器的负载信息,若所述扩容的主机的负载超出预估范围,重新进行所述运算匹配,确定所述扩容的目标主机。
在扩容流程结束后,为了保证扩容后能稳定运行,对扩容的主机进行负载信息的监控,若扩容的主机的负载超出预估范围,则重新触发扩容请求,对所述基础数据和所述业务数据进行匹配运算,确认扩容的目标主机。
本发明提供的一种服务器扩容方法,通过对基础数据和业务数据进行检测,排除故障或高载的主机;进一步通过匹配运算得到可进行扩容的主机的当前的可用资源量,最终确定目标主机进行扩容。该方法完全以服务器系统的数据为判断是否需要扩容的依据,通过计算自动得到进行扩容的目标主机。该方法的扩容方案具备自动决策能力,能提高扩容的效率。同时,该方法通过结合基础数据和业务数据进行检测,避免了传统的扩容方法评估不全面的问题。由该方法得到的扩容方案可以同时考虑基础数据和业务数据,对当前的服务器运行的评估更为全面,由此得到的扩容方案可以发挥应有的扩容效果。
如图6所示,本发明还提供了一种服务器扩容装置,该装置包括:
获取模块620,用于接收扩容请求指令,获取服务器系统中各个主机的基础数据和业务数据;
运算模块630,用于根据所述基础数据和业务数据进行匹配运算,获取可进行扩容的主机当前的可用资源量,根据可用资源量确定扩容的目标主机;
扩容模块640,用于根据需要扩容的业务量,利用所述目标主机进行扩容。
所述获取模块620接收到扩容请求指令后,触发获取服务器系统中关于各主机的基础数据和业务数据,并根据所述基础数据和业务数据得到可能存在故障或高载的主机,以便对其进行排除和屏蔽。
所述运算模块630根据由获取模块620得到的所述基础数据和业务数据进行匹配运算,得到可用于扩容主机的可用资源量,并对其进行可用资源量的排名,以便利用优先扩容次序来确定扩容的目标主机。
所述扩容模块640根据需要扩容的业务量和得到的目标主机,确定最终需要扩容主机的数量,实现扩容。
为了判断是否需要扩容,本发明中的服务器扩容装置还可以包括监控模块611。所述监控模块611,用于获取监控中心的监测结果,当监测结果为主机出现异常时,触发扩容请求指令。
另一实施例中,所述监控模块611还可以用于获取服务器系统中各个主机的实时基础数据和实时业务数据,根据实时基础数据和实时业务数据判断各个主机的运行状态;当有主机出现异常时,触发扩容请求指令。
另一实施例中,本发明中的服务器扩容装置还可以包括设定模块612。所述设定模块612,用于当接收用户输入的扩容参数时,触发扩容请求指令。
请参考图7,图7为本发明提供的一个实施例中的计算机设备的内部结构示意图。如图7所示,该计算机设备包括通过系统总线连接的处理器710、存储介质720、存储器730和网络接口740。其中,该计算机设备的存储介质720存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器710执行时,可使得处理器710实现一种服务器扩容方法,处理器710能实现图6所示实施例中的一种服务器扩容装置中的获取模块620、运算模块630和扩容模块640的功能。该计算机设备的处理器710用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器730中可存储有计算机可读指令,该计算机可读指令被处理器710执行时,可使得处理器710执行一种服务器扩容方法。该计算机设备的网络接口740用于与终端连接通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述任一项所述的方法。
通过本发明实现了对基础数据和业务数据运用匹配运算进行评估,使得可自动决策扩容,提高了扩容的效率。
此外,在本发明各个实施例中的各功能部分可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
本领域普通技术人员可以理解,上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
应该理解的是,在本发明各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种服务器扩容方法,其特征在于,包括:
接收扩容请求指令,获取服务器系统中各个主机的基础数据和业务数据;
利用所述业务数据中的各服务进程资源信息求取各服务进程的运算资源的依赖度,并进行排名得到各服务进程的运算资源的依赖度排名;根据所述依赖度排名计算各服务进程的运算资源的权重值,根据该权重值得到可进行扩容主机的扩容权重,根据所述扩容权重确定可进行扩容的主机当前的可用资源量,根据可用资源量确定扩容的目标主机;
根据需要扩容的业务容量在所述目标主机进行扩容;
其中,各服务进程的运算资源的权重值的表达式为:
Figure FDA0003488550540000011
其中,Qi是各服务进程的运算资源权重,i为对应的服务进程;n为对应服务进程对运算资源的依赖度的排名,I为总服务进程数。
2.根据权利要求1所述的服务器扩容方法,其特征在于,接收扩容请求指令的步骤之前,还包括以下触发扩容请求指令方式的任意一种:
获取监控中心的监测结果,当监测结果为主机出现异常时,触发扩容请求指令;
获取服务器系统中各个主机的实时基础数据和实时业务数据,根据实时基础数据和实时业务数据判断各个主机的运行状态;当有主机出现异常时,触发扩容请求指令;
当接收用户输入的扩容参数时,触发扩容请求指令。
3.根据权利要求2所述的服务器扩容方法,其特征在于,当监测结果为主机出现异常时,还包括:
通知所述监控中心对所述服务器系统的各个主机进行巡检,对产生异常的主机发出自愈指令,使得对应主机启动自愈程序进行自愈;
将出现异常的主机上的业务数据迁移至正常的主机上。
4.根据权利要求1所述的服务器扩容方法,其特征在于,所述业务数据还包括在线用户数信息。
5.根据权利要求1所述的服务器扩容方法,其特征在于,所述利用所述各服务进程资源信息求取各服务进程的运算资源的依赖度的表达式为:
Figure FDA0003488550540000021
其中,Yi是各服务进程对运算资源的依赖度,i为对应的服务进程;
Figure FDA0003488550540000022
是高峰时段运算资源设定分位值平均值,Zm是中位服务器的总运算资源值。
6.根据权利要求1所述的服务器扩容方法,其特征在于,所述根据 所述各服务进程的运算资源的权重值得到可进行扩容主机的扩容权重的表达式:
Figure FDA0003488550540000023
Qx是对应主机的扩容权重,i为对应的服务进程,Zik是第i个服务进程的资源空闲量,Zig是高峰期的第i个服务进程的资源占用量,Ziy是第i个服务进程在对应主机资源阈值,Qi是各服务进程的运算资源权重。
7.根据权利要求1所述的服务器扩容方法,其特征在于,所述根据需要扩容的业务容量在所述目标主机进行扩容的步骤包括:
判断当前服务器系统是否有足够可进行扩容的主机;
若否,发出新增主机的申请请求,等待新增的扩容主机;
待新增扩容的主机后,监控扩容的主机的负载信息,若所述扩容的主机的负载超出预估范围,重新进行匹配运算并确定所述扩容的目标主机。
8.一种服务器扩容装置,其特征在于,包括:
获取模块,用于接收扩容请求指令,获取服务器系统中各个主机的基础数据和业务数据;
运算模块,用于利用所述业务数据中的各服务进程资源信息求取各服务进程的运算资源的依赖度,并进行排名得到各服务进程的运算资源的依赖度排名;根据所述依赖度排名计算各服务进程的运算资源的权重值,根据该权重值得到可进行扩容主机的扩容权重,根据所述扩容权重确定可进行扩容的主机当前的可用资源量,根据可用资源量确定扩容的目标主机;
扩容模块,用于根据需要扩容的业务量,利用所述目标主机进行扩容;
其中,所述运算模块中的各服务进程的运算资源的权重值的表达式为:
Figure FDA0003488550540000031
其中,Qi是各服务进程的运算资源权重,i为对应的服务进程;n为对应服务进程对运算资源的依赖度的排名,I为总服务进程数。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至7中任意一项所述的服务器扩容方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至7中任一项所述的服务器扩容方法的步骤。
CN201811321594.0A 2018-11-07 2018-11-07 服务器扩容方法、装置 Active CN109586952B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811321594.0A CN109586952B (zh) 2018-11-07 2018-11-07 服务器扩容方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811321594.0A CN109586952B (zh) 2018-11-07 2018-11-07 服务器扩容方法、装置

Publications (2)

Publication Number Publication Date
CN109586952A CN109586952A (zh) 2019-04-05
CN109586952B true CN109586952B (zh) 2022-04-12

Family

ID=65921729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811321594.0A Active CN109586952B (zh) 2018-11-07 2018-11-07 服务器扩容方法、装置

Country Status (1)

Country Link
CN (1) CN109586952B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112134715B (zh) * 2019-06-24 2022-06-10 腾讯科技(深圳)有限公司 一种扩容结果检测方法、装置、服务器及存储介质
CN110784420B (zh) * 2019-09-20 2023-07-07 腾讯科技(深圳)有限公司 车联网系统的资源管理方法、装置
CN111178844B (zh) * 2019-12-30 2023-09-05 中国移动通信集团黑龙江有限公司 一种自动生成带宽网络扩容方案的方法和系统
CN111352733A (zh) * 2020-02-26 2020-06-30 北京奇艺世纪科技有限公司 一种扩缩容状态的预测方法和装置
CN111478796B (zh) * 2020-03-08 2022-12-16 苏州浪潮智能科技有限公司 一种ai平台的集群扩容异常处理方法
CN111464616A (zh) * 2020-03-30 2020-07-28 招商局金融科技有限公司 自动调节应用负载服务数量的方法、服务器及存储介质
CN111625195B (zh) * 2020-05-26 2023-11-07 北京百度网讯科技有限公司 用于服务器扩容的方法及装置
CN113568706B (zh) * 2021-07-27 2024-01-19 北京百度网讯科技有限公司 针对业务的容器调整方法、装置、电子设备和存储介质
CN114022971B (zh) * 2021-10-08 2023-09-05 中移(杭州)信息技术有限公司 宽带质量巡检系统、方法、装置、设备及可读存储介质
CN115022173B (zh) * 2022-05-10 2023-05-26 度小满科技(北京)有限公司 一种服务扩容的方法、装置、设备及存储介质
CN114996351A (zh) * 2022-05-18 2022-09-02 聚好看科技股份有限公司 数据库弹性方法、数据库弹性装置及数据库弹性服务系统
CN117082068B (zh) * 2023-08-25 2024-03-29 北京神州云合数据科技发展有限公司 报税服务器弹性扩容方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820630A (zh) * 2015-05-22 2015-08-05 上海新炬网络信息技术有限公司 基于业务变化量的系统资源监控装置
CN105162859A (zh) * 2015-08-20 2015-12-16 湖南亿谷科技发展股份有限公司 服务器动态扩容系统及方法
CN106095533A (zh) * 2016-06-14 2016-11-09 中国联合网络通信集团有限公司 服务器扩容方法及装置
CN106970839A (zh) * 2017-02-22 2017-07-21 广东网金控股股份有限公司 一种自动化的扩容方法及其装置
CN108234356A (zh) * 2017-11-29 2018-06-29 中电科华云信息技术有限公司 基于应用关系网络的最优化应用资源分布策略
CN108536525A (zh) * 2017-03-02 2018-09-14 北京金山云网络技术有限公司 一种宿主机调度方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150244796A1 (en) * 2014-02-27 2015-08-27 Ncr Corporation Extensible Self-Service Terminal (SST) Server

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104820630A (zh) * 2015-05-22 2015-08-05 上海新炬网络信息技术有限公司 基于业务变化量的系统资源监控装置
CN105162859A (zh) * 2015-08-20 2015-12-16 湖南亿谷科技发展股份有限公司 服务器动态扩容系统及方法
CN106095533A (zh) * 2016-06-14 2016-11-09 中国联合网络通信集团有限公司 服务器扩容方法及装置
CN106970839A (zh) * 2017-02-22 2017-07-21 广东网金控股股份有限公司 一种自动化的扩容方法及其装置
CN108536525A (zh) * 2017-03-02 2018-09-14 北京金山云网络技术有限公司 一种宿主机调度方法及装置
CN108234356A (zh) * 2017-11-29 2018-06-29 中电科华云信息技术有限公司 基于应用关系网络的最优化应用资源分布策略

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
虚拟环境下Web服务器集群技术研究与实现;刘胜楠;《国防科学技术大学工程硕士学位论文》;20141201;40-49 *

Also Published As

Publication number Publication date
CN109586952A (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
CN109586952B (zh) 服务器扩容方法、装置
CN106933650B (zh) 云应用系统的负载管理方法及系统
CN110378487B (zh) 横向联邦学习中模型参数验证方法、装置、设备及介质
US7890297B2 (en) Predictive monitoring method and system
US20180052711A1 (en) Method and system for scheduling video analysis tasks
CN108092836A (zh) 一种服务器的监控方法及装置
US7181651B2 (en) Detecting and correcting a failure sequence in a computer system before a failure occurs
CN109739527B (zh) 一种客户端灰度发布的方法、装置、服务器和存储介质
CN112241350B (zh) 微服务评估方法、装置、计算设备及微服务检测系统
CN114356557B (zh) 一种集群扩容方法及装置
US20050096877A1 (en) System and method for determination of load monitoring condition and load monitoring program
CN110933178B (zh) 调整集群系统内的节点配置的方法及服务器
CN110674149B (zh) 业务数据处理方法、装置、计算机设备和存储介质
Di Sanzo et al. Machine learning for achieving self-* properties and seamless execution of applications in the cloud
CN106294364B (zh) 实现网络爬虫抓取网页的方法和装置
CN108255703B (zh) 一种sql脚本的故障修复方法及其终端
CN106506278B (zh) 一种服务可用性监控方法及装置
JP7038629B2 (ja) 機器状態監視装置及びプログラム
CN113992378B (zh) 一种安全监测方法、装置、电子设备及存储介质
CN107368355B (zh) 虚拟机的动态调度方法和装置
CN113886196B (zh) 片上功耗管理方法、电子设备及存储介质
CN110069382A (zh) 软件监控方法、服务器、终端设备、计算机设备及介质
CN115543577A (zh) 基于协变量的Kubernetes资源调度优化方法、存储介质及设备
CN114385498A (zh) 性能测试方法、系统、计算机设备及可读存储介质
CN115934479B (zh) 接口服务的控制方法、装置、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant