CN115086340A - 服务器资源的配置方法、装置、存储介质及处理器 - Google Patents
服务器资源的配置方法、装置、存储介质及处理器 Download PDFInfo
- Publication number
- CN115086340A CN115086340A CN202210725355.1A CN202210725355A CN115086340A CN 115086340 A CN115086340 A CN 115086340A CN 202210725355 A CN202210725355 A CN 202210725355A CN 115086340 A CN115086340 A CN 115086340A
- Authority
- CN
- China
- Prior art keywords
- server
- service
- configuration information
- server cluster
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1044—Group management mechanisms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0668—Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种服务器资源的配置方法、装置、存储介质及处理器,涉及金融科技领域或其他相关领域,该方法包括:在上线业务机器人的情况下,获取业务机器人的在线模块的业务配置信息;从分布式存储系统获取各个服务器集群的服务器配置信息,其中,分布式存储系统存储的服务器配置信息基于各个服务器集群的运行情况进行更新;根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群,并从目标服务器集群中确定目标服务器;将业务机器人路由至目标服务器,以支持待承载的业务量。通过本申请,解决了相关技术中服务器集群难以满足上线的业务机器人的业务承载需求的问题。
Description
技术领域
本申请涉及金融科技领域或其他相关领域,具体而言,涉及一种服务器资源的配置方法、装置、存储介质及处理器。
背景技术
BOT是“robot”的简称,也既智能机器人,是以人工智能技术、自然语义理解和深度学习算法为基础、为客户提供的一套智能机器人子系统,一个BOT对应一个算法模型,BOT可以运用在智能交互系统。具体的,以BOT引擎为基础,使用业务机构、底层数据、交互知识库、客户轨迹行为信息等数据平台为支撑,提供主动、被动、单轮以及多轮场景下的交互能力,实现智能客服场景的闭环处理,达到技术及业务目标。
需要说明的是,为提高智能交互响应时间,上线BOT模型均加载至服务器内存,导致内存消耗较大,例如,生产环境单园区部署32C32G的传统虚拟机服务器集群,若BOT版本部署初始化内存21G,稳定运行预留4G,那么每上线一个BOT,模型占用内存800M,即该集群仅能上线8个BOT,而对于业务规模大的业务机构,8个BOT无法满足业务需求。例如,对银行来说,银行存在多个分行,各个分行分不同业务条线,不同分行不同业务条线需要以BOT为单位进行业务权限隔离,随着智能交互推广范围不断扩大,分行业务需求持续攀升,8个BOT无法有效承载银行的智能交互需求。
为了解决上述问题,相关技术中对服务器集群进行纵向扩容,例如,将服务器集群的内存从32G纵向扩容服务器内存至64G,但是,纵向扩容很容易受宿主机服务器规格限制,触及容量天花板,同时存在扩容难、扩容慢诸多痛点,影响智能交互业务推广。
针对相关技术中服务器集群难以满足上线的业务机器人的业务承载需求的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供一种服务器资源的配置方法、装置、存储介质及处理器,以解决相关技术中服务器集群难以满足上线的业务机器人的业务承载需求的问题。
根据本申请的一个方面,提供了一种服务器资源的配置方法。该方法包括:在上线业务机器人的情况下,获取业务机器人的在线模块的业务配置信息,其中,业务配置信息用于指示在线模块待承载的业务量;从分布式存储系统获取各个服务器集群的服务器配置信息,其中,服务器配置信息包括服务器集群中的服务器的数量以及服务器的业务承载量,分布式存储系统存储的服务器配置信息基于各个服务器集群的运行情况进行更新;根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群,并从目标服务器集群中确定目标服务器;将业务机器人路由至目标服务器,以支持待承载的业务量。
可选地,根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群包括:确定业务机器人对应的预设服务器集群,并判断预设服务器集群的业务承载量是否大于等于待承载的业务量;在预设服务器集群的业务承载量大于等于待承载的业务量的情况下,将预设服务器集群确定为目标服务器集群;在预设服务器集群的业务承载量小于待承载的业务量的情况下,从各个服务器集群中确定业务承载量中确定大于业务机器人待承载的业务量的服务器集群,得到至少一个第一服务器集群;从至少一个第一服务器集群中选择目标服务器集群。
可选地,每个服务器集群包括多个服务器组,从目标服务器集群中确定目标服务器包括:从目标服务器集群的服务器配置信息中获取各个服务器组的业务承载量,并从各个服务器组中确定业务承载量中确定大于业务机器人待承载的业务量的服务器组,得到至少一个第一服务器组;从至少一个第一服务器组中选择目标服务器组,并将目标服务器组中的服务器确定为目标服务器。
可选地,在将业务机器人路由至目标服务器,以支持待承载的业务量之后,该方法还包括:在目标服务器集群出现故障的情况下,从分布式存储系统中获取关联服务器集群的服务器配置信息,其中,关联服务器集群是与目标服务器集群位于同一服务区域的服务器集群;根据业务配置信息和关联服务器集群的服务器配置信息将业务机器人路由至关联服务器集群中的服务器,以支持待承载的业务量。
可选地,在将业务机器人路由至目标服务器集群中的目标服务器,以支持待承载的业务量之后,该方法还包括:在至少一个服务器集群中增加服务器的情况下,在分布式存储系统中更新服务器配置信息;在再次上线业务机器人的情况下,根据再次上线业务机器人的业务配置信息和更新后的服务器配置信息确定更新后的目标服务器集群,并从更新后的目标服务器集群中确定更新后的目标服务器;将再次上线业务机器人路由至更新后的目标服务器,以支持再次上线业务机器人的待承载的业务量。
可选地,从分布式存储系统获取各个服务器集群的服务器配置信息包括:通过定时任务从分布式存储系统获取各个服务器集群的服务器配置信息;和/或在至少一个服务器集群的服务器配置信息更新的情况下,接收分布式存储系统推送的各个服务器集群的服务器配置信息。
可选地,按照预设时间间隔探测各个服务器集群中的服务器是否处于活跃状态,并在存在不活跃的服务器的情况下,将不活跃的服务器从对应的服务器集群中移除。
根据本申请的另一方面,提供了一种服务器资源的配置装置。该装置包括:第一获取单元,用于在上线业务机器人的情况下,获取业务机器人的在线模块的业务配置信息,其中,业务配置信息用于指示在线模块待承载的业务量;第二获取单元,用于从分布式存储系统获取各个服务器集群的服务器配置信息,其中,服务器配置信息包括服务器集群中的服务器的数量以及服务器的业务承载量,分布式存储系统存储的服务器配置信息基于各个服务器集群的运行情况进行更新;第一确定单元,用于根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群,并从目标服务器集群中确定目标服务器;第一路由单元,用于将业务机器人路由至目标服务器,以支持待承载的业务量。
根据本发明实施例的另一方面,还提供了一种计算机存储介质,计算机存储介质用于存储程序,其中,程序运行时控制计算机存储介质所在的设备执行一种服务器资源的配置方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种服务器资源的配置方法。
通过本申请,采用以下步骤:在上线业务机器人的情况下,获取业务机器人的在线模块的业务配置信息,其中,业务配置信息用于指示在线模块待承载的业务量;从分布式存储系统获取各个服务器集群的服务器配置信息,其中,服务器配置信息包括服务器集群中的服务器的数量以及服务器的业务承载量,分布式存储系统存储的服务器配置信息基于各个服务器集群的运行情况进行更新;根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群,并从目标服务器集群中确定目标服务器;将业务机器人路由至目标服务器,以支持待承载的业务量,解决了相关技术中服务器集群难以满足上线的业务机器人的业务承载需求的问题。通过根据业务配置信息将上线的业务机器人路由至多个服务器集群中的路由至目标服务器,进而达到了灵活地满足业务机器人的业务承载需求的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的服务器资源的配置方法的流程图;
图2是根据本申请实施例提供的可选的服务器集群的示意图;
图3是根据本申请实施例提供的可选的同一服务区域的服务器集群的部署示意图;
图4是根据本申请实施例提供的服务器资源的配置装置的示意图;
图5是根据本申请实施例提供的电子装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
纵向扩容:在硬件层面上的容量扩展策略,通过增加CPU数量、内存大小及磁盘容量,提高服务器集群的处理能力。
横向扩容:软件层面和硬件层面结合的扩展策略,横向增加同类型节点服务器数量,上层通过负载路由策略分流,提升节点服务器的处理能力,需对全量数据进行重分布,更新路由信息,再对外提供服务。
OSS:Operation Support Systems,即操作支持系统,是业务开展和运营时所需的支撑平台,用于机器人的联机在线服务的业务管理、机器人的配置管理、服务器集群的路由管理及服务器的探活监控。
ETCD:是一款高性能的开源的分布式key-value分布式存储系统,可以用于配制共享和服务的注册于发现等功能。
根据本申请的实施例,提供了一种服务器资源的配置方法。
图1是根据本申请实施例的服务器资源的配置方法的流程图。如图1所示,该方法包括以下步骤:
步骤S102,在上线业务机器人的情况下,获取业务机器人的在线模块的业务配置信息,其中,业务配置信息用于指示在线模块待承载的业务量。
具体的,接收业务机构的工作流请求,根据业务的需要创建业务机器人,例如,对于银行机构来说,需要智能客服机器人处理业务,业务机器人可以为智能客服机器人,银行机构存在多个分行,每个分行包含不同业务条线,不同分行不同业务条线的业务以智能客服机器人为单位进行业务权限隔离,在某个分行开展某项业务时,需要根据业务量上线多个智能客服机器人,以完成待开展的业务。
需要说明的是,业务机器人包含离线模块和在线模块,也即联机在线模块,联机在线模块在处理业务时需要服务器实时提供支持,为了确定所需服务器的数量,需要获取联机在线模块的业务配置信息以及基础配置信息,业务配置信息即为需要承载多少业务量,基础配置信息即为需要实时生效的配置信息,偏向于运维相关的信息,比如在线模块的ip地址,业务机器人的算法库的版本信息等。为了统一管理,可以将联机在线模块的业务配置信息以及基础配置信息存储在分布式存储系统中。
步骤S104,从分布式存储系统获取各个服务器集群的服务器配置信息,其中,服务器配置信息包括服务器集群中的服务器的数量以及服务器的业务承载量,分布式存储系统存储的服务器配置信息基于各个服务器集群的运行情况进行更新。
需要说明的是,独立于服务器集群之外建立分布式存储系统,例如ETCD,可以存储各个服务器集群的服务器配置信息,各个服务器集群中的服务器更新后,同时更新分布式存储系统中的服务器配置信息,同时还可以存储联机在线模块的业务配置信息以及基础配置信息,实现配置信息的外置、离线,确保获取到的配置信息的一致性。
步骤S106,根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群,并从目标服务器集群中确定目标服务器。
需要说明的是,每个服务器集群设置一个虚拟互联网数据中心,(Internet DateCenter,简称IDC),IDC负责联机在线交易模块的软负载和路由,在获取联机在线模块的业务配置信息以及基础配置信息的同时,从分布式存储系统获取各个服务器集群的服务器配置信息,建立业务机器人的联机在线模块和服务器集群之间的路由配置信息,也即,业务的流量运行在哪些服务器集群的哪些服务器,在线模块和服务器的上下游关系,从而为用户与业务机器人的智能交互奠定数据基础。
步骤S108,将业务机器人路由至目标服务器,以支持待承载的业务量。
具体的,根据建立的路由配置信息将业务机器人路由至对应的目标服务器,可以保证业务机器人的业务可以被有效承载。
本申请实施例提供的服务器资源的配置方法,通过在上线业务机器人的情况下,获取业务机器人的在线模块的业务配置信息,其中,业务配置信息用于指示在线模块待承载的业务量;从分布式存储系统获取各个服务器集群的服务器配置信息,其中,服务器配置信息包括服务器集群中的服务器的数量以及服务器的业务承载量,分布式存储系统存储的服务器配置信息基于各个服务器集群的运行情况进行更新;根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群,并从目标服务器集群中确定目标服务器;将业务机器人路由至目标服务器,以支持待承载的业务量,解决了相关技术中服务器集群难以满足上线的业务机器人的业务承载需求的问题。通过根据业务配置信息将上线的业务机器人路由至多个服务器集群中的路由至目标服务器,进而达到了灵活地满足业务机器人的业务承载需求的效果。
根据服务器集群的业务承载量为业务机器人确定目标服务器集群,可选地,在本申请实施例提供的服务器资源的配置方法中,根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群包括:确定业务机器人对应的预设服务器集群,并判断预设服务器集群的业务承载量是否大于等于待承载的业务量;在预设服务器集群的业务承载量大于等于待承载的业务量的情况下,将预设服务器集群确定为目标服务器集群;在预设服务器集群的业务承载量小于待承载的业务量的情况下,从各个服务器集群中确定业务承载量中确定大于业务机器人待承载的业务量的服务器集群,得到至少一个第一服务器集群;从至少一个第一服务器集群中选择目标服务器集群。
具体的,业务机器人可以默认设置预设服务器集群,在预设服务器集群的业务承载量大于等于业务机器人待承载的业务量,可以不改变路由配置关系,将业务机器人路由至预设服务器集群即可,而当预设服务器集群的业务承载量小于业务机器人待承载的业务量,说明不满足业务机器人的业务承载需求,则从大于业务机器人待承载的业务量的服务器集群中选择一个目标服务器集群,通过目标服务器集群支持业务机器人的业务。本实施例通过为业务机器人设置预设服务器集群,并根据预设服务器集群的业务承载量确定是否更换支持业务机器人的服务器集群,达到了灵活满足业务机器人的业务需求的效果。
同一个服务器集群可以支持不同的业务,可选地,在本申请实施例提供的服务器资源的配置方法中,每个服务器集群包括多个服务器组,从目标服务器集群中确定目标服务器包括:从目标服务器集群的服务器配置信息中获取各个服务器组的业务承载量,并从各个服务器组中确定业务承载量中确定大于业务机器人待承载的业务量的服务器组,得到至少一个第一服务器组;从至少一个第一服务器组中选择目标服务器组,并将目标服务器组中的服务器确定为目标服务器。
需要说明的是,在服务器集群的IDC配置管理中心下,可以为服务器集群划分服务器组,也即节点组,如图2所示,服务器集群包含5个节点组,每个节点组可以包含相同数量的服务器,也可以包含不同数量的服务器数量,从而满足不同业务量需求。每个节点组为独立集群,可以从目标服务器集群中确定业务承载量中大于业务机器人待承载的业务量的服务器组,从而承载业务机器人的业务流量。本实施例通过对服务器集群内部进行分组,避免整个服务器集群仅支持一类业务,在业务种类较多的情况下,无法满足业务需求的问题。
在服务器集群容量不够的情况下,可以进行扩容,可选地,在本申请实施例提供的服务器资源的配置方法中,在将业务机器人路由至目标服务器集群中的目标服务器,以支持待承载的业务量之后,该方法还包括:在至少一个服务器集群中增加服务器的情况下,在分布式存储系统中更新服务器配置信息;在再次上线业务机器人的情况下,根据再次上线业务机器人的业务配置信息和更新后的服务器配置信息确定更新后的目标服务器集群,并从更新后的目标服务器集群中确定更新后的目标服务器;将再次上线业务机器人路由至更新后的目标服务器,以支持再次上线业务机器人的待承载的业务量。
需要说明的是,纵向扩容服务器可上线更多业务机器人,横向扩容服务器支持业务机器人更多的业务量,当纵向内存无法扩展时,可以横向扩容,具体的,在服务器集群中增加服务器,在服务器集群内部分组的情况下,节点组也支持横向扩容,单组服务器承接新的业务,具体的,每个分组可承载业务量为分组在线计算数量*单机在线计算承载业务量。
在服务器集群中增加服务器的同时,实时更新分布式存储系统中更新服务器配置信息,并在更新服务器配置信息,再将增加的服务器投入业务支持,从而实现了业务机器人的不停机扩容,解决了在物理机服务器或传统虚拟服务器容量不足时,在不中断服务的前提下,可快速进行弹性伸缩,有效应对智能化场景建设业务量或数据量突发变化等情况。
获取服务器配置信息的方式既可以为主动形式也可以为被动形式,可选地,在本申请实施例提供的服务器资源的配置方法中,从分布式存储系统获取各个服务器集群的服务器配置信息包括:通过定时任务从分布式存储系统获取各个服务器集群的服务器配置信息;和/或在至少一个服务器集群的服务器配置信息更新的情况下,接收分布式存储系统推送的各个服务器集群的服务器配置信息。
具体的,IDC配置管理中心通过定时任务将服务器配置信息推送至在线联机交易节点,当业务机器人的流量接入时,读取服务器配置信息,将流量路由到对应的服务器集群;同时,当分布式存储系统中的服务器配置信息发生修改时,会自动将服务器配置路由信息推送至IDC配置管理中心。通过本实施例,可以在业务机器人上线时,获取服务器集群的最新配置信息,从而将业务机器人路由至合适的服务器集群,提高了服务器集群对业务的支持度。
为了在服务器集群整体出现故障的情况下不中断业务支持,可选地,在本申请实施例提供的服务器资源的配置方法中,在将业务机器人路由至目标服务器,以支持待承载的业务量之后,该方法还包括:在目标服务器集群出现故障的情况下,从分布式存储系统中获取关联服务器集群的服务器配置信息,其中,关联服务器集群是与目标服务器集群位于同一服务区域的服务器集群;根据业务配置信息和关联服务器集群的服务器配置信息将业务机器人路由至关联服务器集群中的服务器,以支持待承载的业务量。
具体的,同一服务区域可以为同一园区,同一园区可以部署多个服务器集群,每个服务器集群具有相应的IDC配置管理中心,同一园区的多个服务器可做多活可用部署,也即,同一园区可以共享服务器集群,在园区的一个服务器集群出现故障的情况下,可以将其承载的业务机器人路由至同园区的其他服务器集群,从而达到了在单园区故障时不中断业务支持的效果。
图3是本实施例提供的可选的同一服务区域的服务器集群的部署示意图,如图3所示,同一区域可以部署2个服务器集群,每个服务器集群具有对应的配置管理中心IDC1和IDC2,第一个服务器集群具有2个基点组,每个节点组分别具有3台物理服务器,也即主机,其中,节点组1中的3个主机为端口1和端口2接入的机器人提供业务支持,节点组2中的主机为端口3接出的机器人提供业务支持,实现了同一个服务器集群为不同的业务提供支持的目的。在第一个服务器集群整体出现故障的情况下,还可以通过第二个服务器集群接管第一个服务器集群的机器人,具体的,通过IDC将端口1、端口2和端口3接出的机器人分配给第二个服务器集群中的主机。
除了服务器集群整体出现故障,服务器集群中的单个服务器也可能出现故障,可选地,在本申请实施例提供的服务器资源的配置方法中,按照预设时间间隔探测各个服务器集群中的服务器是否处于活跃状态,并在存在不活跃的服务器的情况下,将不活跃的服务器从对应的服务器集群中移除。
需要说明的是,服务器集群规模不断增大,任何节点都可能随时出现宕机,或网络等基础设施等问题,可以通过Ping-Pong服务(服务器根据客户端的请求“Ping”响应“Pong”,可以用去确定某个服务器是否在线)探活各个服务器的服务状态,实时从服务器集群中剔除异常的模块,完成故障节点的自隔离,避免了故障节点影响业务的问题,具有短时间内快速恢复业务的服务能力,从而保证了生产的稳定运行。
综上,本实施例采用软硬件策略融合的智能交互系统的扩容方法,通过业务管理、配置管理、路由管理,动态配置硬件资源,缩短了扩容周期,实现了可支持弹性伸缩且不中断对外服务的扩容方法,并且确保联机服务在扩容过程中提供连续性、可靠性、及灾备应急数据不丢失等能力,其实现简单,通用性、灵活性、扩展性较强。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种服务器资源的配置装置,需要说明的是,本申请实施例的服务器资源的配置装置可以用于执行本申请实施例所提供的用于服务器资源的配置方法。以下对本申请实施例提供的服务器资源的配置装置进行介绍。
图4是根据本申请实施例的服务器资源的配置装置的示意图。如图4所示,该装置包括:第一获取单元10、第二获取单元20、第一确定单元30和第一路由单元40。
具体地,第一获取单元10,用于在上线业务机器人的情况下,获取业务机器人的在线模块的业务配置信息,其中,业务配置信息用于指示在线模块待承载的业务量;
第二获取单元20,用于从分布式存储系统获取各个服务器集群的服务器配置信息,其中,服务器配置信息包括服务器集群中的服务器的数量以及服务器的业务承载量,分布式存储系统存储的服务器配置信息基于各个服务器集群的运行情况进行更新;
第一确定单元30,用于根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群,并从目标服务器集群中确定目标服务器;
第一路由单元40,用于将业务机器人路由至目标服务器,以支持待承载的业务量。
本申请实施例提供的服务器资源的配置装置,通过第一获取单元10在上线业务机器人的情况下,获取业务机器人的在线模块的业务配置信息,其中,业务配置信息用于指示在线模块待承载的业务量;第二获取单元20从分布式存储系统获取各个服务器集群的服务器配置信息,其中,服务器配置信息包括服务器集群中的服务器的数量以及服务器的业务承载量,分布式存储系统存储的服务器配置信息基于各个服务器集群的运行情况进行更新;第一确定单元30根据业务配置信息和服务器配置信息从各个服务器集群确定目标服务器集群,并从目标服务器集群中确定目标服务器;第一路由单元40将业务机器人路由至目标服务器,以支持待承载的业务量,解决了相关技术中服务器集群难以满足上线的业务机器人的业务承载需求的问题,通过根据业务配置信息将上线的业务机器人路由至多个服务器集群中的路由至目标服务器,进而达到了灵活地满足业务机器人的业务承载需求的效果。
可选地,在本申请实施例提供的服务器资源的配置装置中,第一确定单元30包括:第一确定模块,用于确定业务机器人对应的预设服务器集群,并判断预设服务器集群的业务承载量是否大于等于待承载的业务量;第二确定模块,用于在预设服务器集群的业务承载量大于等于待承载的业务量的情况下,将预设服务器集群确定为目标服务器集群;第三确定模块,用于在预设服务器集群的业务承载量小于待承载的业务量的情况下,从各个服务器集群中确定业务承载量中确定大于业务机器人待承载的业务量的服务器集群,得到至少一个第一服务器集群;第一选择模块,用于从至少一个第一服务器集群中选择目标服务器集群。
可选地,在本申请实施例提供的服务器资源的配置装置中,每个服务器集群包括多个服务器组,第一确定单元30还包括:第一获取模块,用于从目标服务器集群的服务器配置信息中获取各个服务器组的业务承载量,并从各个服务器组中确定业务承载量中确定大于业务机器人待承载的业务量的服务器组,得到至少一个第一服务器组;第二选择模块,用于从至少一个第一服务器组中选择目标服务器组,并将目标服务器组中的服务器确定为目标服务器。
可选地,在本申请实施例提供的服务器资源的配置装置中,该方法还包括:第三获取单元,用于在将业务机器人路由至目标服务器,以支持待承载的业务量之后,在目标服务器集群出现故障的情况下,从分布式存储系统中获取关联服务器集群的服务器配置信息,其中,关联服务器集群是与目标服务器集群位于同一服务区域的服务器集群;第二路由单元,用于根据业务配置信息和关联服务器集群的服务器配置信息将业务机器人路由至关联服务器集群中的服务器,以支持待承载的业务量。
可选地,在本申请实施例提供的服务器资源的配置装置中,该方法还包括:更新单元,用于在将业务机器人路由至目标服务器集群中的目标服务器,以支持待承载的业务量之后,在至少一个服务器集群中增加服务器的情况下,在分布式存储系统中更新服务器配置信息;第二确定单元,用于在再次上线业务机器人的情况下,根据再次上线业务机器人的业务配置信息和更新后的服务器配置信息确定更新后的目标服务器集群,并从更新后的目标服务器集群中确定更新后的目标服务器;第三路由单元,用于将再次上线业务机器人路由至更新后的目标服务器,以支持再次上线业务机器人的待承载的业务量。
可选地,在本申请实施例提供的服务器资源的配置装置中,第二获取单元20包括:第二获取模块,用于通过定时任务从分布式存储系统获取各个服务器集群的服务器配置信息;和/或接收模块,用于在至少一个服务器集群的服务器配置信息更新的情况下,接收分布式存储系统推送的各个服务器集群的服务器配置信息。
可选地,在本申请实施例提供的服务器资源的配置装置中,按照预设时间间隔探测各个服务器集群中的服务器是否处于活跃状态,并在存在不活跃的服务器的情况下,将不活跃的服务器从对应的服务器集群中移除。
上述服务器资源的配置装置包括处理器和存储器,上述第一获取单元10、第二获取单元20、第一确定单元30和第一路由单元40等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决相关技术中服务器集群难以满足上线的业务机器人的业务承载需求的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请实施例还提供了一种计算机存储介质,计算机存储介质用于存储程序,其中,程序运行时控制计算机存储介质所在的设备执行一种服务器资源的配置方法。
如图5所示,本申请实施例还提供了一种电子装置,电子装置501包含处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种服务器资源的配置方法。本文中的电子装置可以是服务器、PC、PAD、手机等。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种服务器资源的配置方法,其特征在于,包括:
在上线业务机器人的情况下,获取所述业务机器人的在线模块的业务配置信息,其中,所述业务配置信息用于指示所述在线模块待承载的业务量;
从分布式存储系统获取各个服务器集群的服务器配置信息,其中,所述服务器配置信息包括服务器集群中的服务器的数量以及服务器的业务承载量,所述分布式存储系统存储的服务器配置信息基于各个所述服务器集群的运行情况进行更新;
根据所述业务配置信息和所述服务器配置信息从各个所述服务器集群确定目标服务器集群,并从所述目标服务器集群中确定目标服务器;
将所述业务机器人路由至所述目标服务器,以支持所述待承载的业务量。
2.根据权利要求1所述的方法,其特征在于,根据所述业务配置信息和所述服务器配置信息从各个所述服务器集群确定目标服务器集群包括:
确定所述业务机器人对应的预设服务器集群,并判断所述预设服务器集群的业务承载量是否大于等于所述待承载的业务量;
在所述预设服务器集群的业务承载量大于等于所述待承载的业务量的情况下,将所述预设服务器集群确定为所述目标服务器集群;
在所述预设服务器集群的业务承载量小于所述待承载的业务量的情况下,从各个所述服务器集群中确定业务承载量中确定大于所述业务机器人待承载的业务量的服务器集群,得到至少一个第一服务器集群;
从所述至少一个第一服务器集群中选择所述目标服务器集群。
3.根据权利要求1所述的方法,其特征在于,每个所述服务器集群包括多个服务器组,从所述目标服务器集群中确定目标服务器包括:
从所述目标服务器集群的服务器配置信息中获取各个服务器组的业务承载量,并从各个所述服务器组中确定业务承载量中确定大于所述业务机器人待承载的业务量的服务器组,得到至少一个第一服务器组;
从所述至少一个第一服务器组中选择目标服务器组,并将所述目标服务器组中的服务器确定为所述目标服务器。
4.根据权利要求1所述的方法,其特征在于,在将所述业务机器人路由至所述目标服务器,以支持所述待承载的业务量之后,所述方法还包括:
在所述目标服务器集群出现故障的情况下,从所述分布式存储系统中获取关联服务器集群的服务器配置信息,其中,所述关联服务器集群是与所述目标服务器集群位于同一服务区域的服务器集群;
根据所述业务配置信息和所述关联服务器集群的服务器配置信息将所述业务机器人路由至所述关联服务器集群中的服务器,以支持所述待承载的业务量。
5.根据权利要求1所述的方法,其特征在于,在将所述业务机器人路由至所述目标服务器集群中的所述目标服务器,以支持所述待承载的业务量之后,所述方法还包括:
在至少一个服务器集群中增加服务器的情况下,在所述分布式存储系统中更新服务器配置信息;
在再次上线业务机器人的情况下,根据所述再次上线业务机器人的业务配置信息和更新后的服务器配置信息确定更新后的目标服务器集群,并从所述更新后的目标服务器集群中确定更新后的目标服务器;
将所述再次上线业务机器人路由至所述更新后的目标服务器,以支持所述再次上线业务机器人的待承载的业务量。
6.根据权利要求1所述的方法,其特征在于,从分布式存储系统获取各个服务器集群的服务器配置信息包括:
通过定时任务从所述分布式存储系统获取各个所述服务器集群的服务器配置信息;和/或
在至少一个服务器集群的服务器配置信息更新的情况下,接收所述分布式存储系统推送的各个所述服务器集群的服务器配置信息。
7.根据权利要求1所述的方法,其特征在于,按照预设时间间隔探测各个所述服务器集群中的服务器是否处于活跃状态,并在存在不活跃的服务器的情况下,将所述不活跃的服务器从对应的服务器集群中移除。
8.一种服务器资源的配置装置,其特征在于,包括:
第一获取单元,用于在上线业务机器人的情况下,获取所述业务机器人的在线模块的业务配置信息,其中,所述业务配置信息用于指示所述在线模块待承载的业务量;
第二获取单元,用于从分布式存储系统获取各个服务器集群的服务器配置信息,其中,所述服务器配置信息包括服务器集群中的服务器的数量以及服务器的业务承载量,所述分布式存储系统存储的服务器配置信息基于各个所述服务器集群的运行情况进行更新;
第一确定单元,用于根据所述业务配置信息和所述服务器配置信息从各个所述服务器集群确定目标服务器集群,并从所述目标服务器集群中确定目标服务器;
第一路由单元,用于将所述业务机器人路由至所述目标服务器,以支持所述待承载的业务量。
9.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序,其中,所述程序运行时控制所述计算机存储介质所在的设备执行权利要求1至7中任意一项所述的服务器资源的配置方法。
10.一种电子装置,其特征在于,包含处理器和存储器,所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行权利要求1至7中任意一项所述的服务器资源的配置方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210725355.1A CN115086340A (zh) | 2022-06-24 | 2022-06-24 | 服务器资源的配置方法、装置、存储介质及处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210725355.1A CN115086340A (zh) | 2022-06-24 | 2022-06-24 | 服务器资源的配置方法、装置、存储介质及处理器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115086340A true CN115086340A (zh) | 2022-09-20 |
Family
ID=83256212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210725355.1A Pending CN115086340A (zh) | 2022-06-24 | 2022-06-24 | 服务器资源的配置方法、装置、存储介质及处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115086340A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111190718A (zh) * | 2020-01-07 | 2020-05-22 | 第四范式(北京)技术有限公司 | 实现任务调度的方法、装置及系统 |
CN112506619A (zh) * | 2020-12-18 | 2021-03-16 | 北京百度网讯科技有限公司 | 作业处理方法、装置、电子设备、存储介质和程序产品 |
CN113391901A (zh) * | 2021-06-22 | 2021-09-14 | 未鲲(上海)科技服务有限公司 | Rpa机器人的管理方法、装置、设备及存储介质 |
CN113867968A (zh) * | 2021-10-18 | 2021-12-31 | 深圳追一科技有限公司 | 一种服务器管理方法、装置、电子设备及计算机存储介质 |
CN114090265A (zh) * | 2021-11-30 | 2022-02-25 | 度小满科技(北京)有限公司 | 数据处理方法、装置、存储介质以及计算机终端 |
-
2022
- 2022-06-24 CN CN202210725355.1A patent/CN115086340A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111190718A (zh) * | 2020-01-07 | 2020-05-22 | 第四范式(北京)技术有限公司 | 实现任务调度的方法、装置及系统 |
CN112506619A (zh) * | 2020-12-18 | 2021-03-16 | 北京百度网讯科技有限公司 | 作业处理方法、装置、电子设备、存储介质和程序产品 |
CN113391901A (zh) * | 2021-06-22 | 2021-09-14 | 未鲲(上海)科技服务有限公司 | Rpa机器人的管理方法、装置、设备及存储介质 |
CN113867968A (zh) * | 2021-10-18 | 2021-12-31 | 深圳追一科技有限公司 | 一种服务器管理方法、装置、电子设备及计算机存储介质 |
CN114090265A (zh) * | 2021-11-30 | 2022-02-25 | 度小满科技(北京)有限公司 | 数据处理方法、装置、存储介质以及计算机终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10104010B2 (en) | Method and apparatus for allocating resources | |
US9667750B2 (en) | Client-initiated leader election in distributed client-server systems | |
US10387179B1 (en) | Environment aware scheduling | |
EP3353952B1 (en) | Managing groups of servers | |
US10356150B1 (en) | Automated repartitioning of streaming data | |
US20150263983A1 (en) | System and Method for Allocating Resources and Managing a Cloud Based Computer System | |
CN109218100A (zh) | 分布式对象存储集群及其请求响应方法、系统和存储介质 | |
US11016819B2 (en) | Optimizing clustered applications in a clustered infrastructure | |
CN104615606A (zh) | 一种Hadoop分布式文件系统及其管理方法 | |
EP3442201B1 (en) | Cloud platform construction method and cloud platform | |
CN111935238A (zh) | 一种云平台负载均衡管理系统、方法、设备及介质 | |
US10880367B2 (en) | Load balancing stretched clusters in a distributed network | |
CN113204353B (zh) | 一种大数据平台组件部署方法及装置 | |
US10761869B2 (en) | Cloud platform construction method and cloud platform storing image files in storage backend cluster according to image file type | |
US9148430B2 (en) | Method of managing usage rights in a share group of servers | |
CN111866210A (zh) | 一种虚拟ip均衡分配方法、系统、终端及存储介质 | |
CN115225642A (zh) | 超融合系统的弹性负载均衡方法及系统 | |
US9106676B1 (en) | Grid-based server messaging infrastructure | |
US11886926B1 (en) | Migrating workloads between computing platforms according to resource utilization | |
CN107943615B (zh) | 基于分布式集群的数据处理方法与系统 | |
CN115086340A (zh) | 服务器资源的配置方法、装置、存储介质及处理器 | |
US11632299B1 (en) | Cell management for services implemented at cloud computing environments | |
Vu et al. | A framework for big data as a service | |
CN114172917B (zh) | 一种分布式缓存系统及其部署的方法 | |
CN113630317B (zh) | 一种数据传输方法、装置、非易失性存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |