CN111800514B - 一种基于应用和位置感知的云管理系统 - Google Patents
一种基于应用和位置感知的云管理系统 Download PDFInfo
- Publication number
- CN111800514B CN111800514B CN202010669740.XA CN202010669740A CN111800514B CN 111800514 B CN111800514 B CN 111800514B CN 202010669740 A CN202010669740 A CN 202010669740A CN 111800514 B CN111800514 B CN 111800514B
- Authority
- CN
- China
- Prior art keywords
- long
- cloud application
- application
- term
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1008—Server selection for load balancing based on parameters of servers, e.g. available memory or workload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/51—Discovery or management thereof, e.g. service location protocol [SLP] or web services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/52—Network services specially adapted for the location of the user terminal
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种基于应用和位置感知的云管理系统,包括:云资源采集和分析子系统、长时云应用资源需求采集子系统、长时云应用管理子系统和短时云应用管理子系统;其中,云资源池由服务器集群组成,包括计算服务器、数据服务器和文件服务器;云应用包括长时云应用和短时云应用;所述长时云应用对计算资源的即时可用性要求高,需要保持固定的计算资源;所述短时云应用,是指用户交互短暂迅速,并且容许中断切换和允许失败重新操作的应用。优点为:本发明提供的一种基于应用和位置感知的云管理系统,实现云应用的高效性,云资源的高利用率,提升了云应用的服务质量,从而满足人们日益增长的数据请求高效处理的需求。
Description
技术领域
本发明属于云资源管理技术领域,具体涉及一种基于应用和位置感知的云管理系统。
背景技术
云计算(cloud computing)是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的服务器集群,处理和分析各个小程序,得到结果并返回给用户。因此,通过云计算,可以在很短的时间内,完成对数以万计的数据请求的处理,从而达到强大的网络服务。
然而,发明人在实现本发明的过程中发现,现有技术中的云计算方法,具有云计算效率有限以及云资源利用率有限的问题,从而无法满足人们日益增长的数据请求高效处理的需求。
发明内容
针对现有技术存在的缺陷,本发明提供一种基于应用和位置感知的云管理系统,可有效解决上述问题。
本发明采用的技术方案如下:
本发明提供一种基于应用和位置感知的云管理系统,包括:云资源采集和分析子系统、长时云应用资源需求采集子系统、长时云应用管理子系统和短时云应用管理子系统;其中,云资源池由服务器集群组成,包括计算服务器、数据服务器和文件服务器;云应用包括长时云应用和短时云应用;所述长时云应用对计算资源的即时可用性要求高,需要保持固定的计算资源;所述短时云应用,是指用户交互短暂迅速,并且容许中断切换和允许失败重新操作的应用;
所述云资源采集和分析子系统,包括计算服务器资源采集模块、数据服务器资源采集模块、文件服务器资源采集模块和服务器网络距离分析模块;
所述计算服务器资源采集模块,用于采集并记录计算服务器的总计算资源,得到计算服务器资源列表;其中,所述计算服务器的总计算资源包括计算服务器的型号,每种型号的计算服务器的数量,以及每种型号的计算服务器的CPU核心数和内存容量;
所述数据服务器资源采集模块,用于采集并记录数据服务器的总计算资源,得到数据服务器资源列表;其中,所述数据服务器的总计算资源包括数据服务器的数量,每台数据服务器的IP地址,每台数据服务器所运行的数据库名;
所述文件服务器资源采集模块,用于采集并记录文件服务器的总计算资源,得到文件服务器资源列表;其中,所述文件服务器的总计算资源包括文件服务器的数量,每台文件服务器的IP地址,每台文件服务器所运行的文件系统名;
所述服务器网络距离分析模块,用于分析并记录云资源池中任意两台服务器之间的服务器网络距离,形成服务器网络距离矩阵D;
所述长时云应用资源需求采集子系统,包括单长时云应用资源配置采集模块、并发应用数量采集模块、长时云应用类型特征采集模块和长时云应用工作时段采集模块;
所述单长时云应用资源配置采集模块,用于采集单个长时云应用的资源配置信息,包括单个长时云应用运行所需的CPU核心数和内存容量;
所述并发应用数量采集模块,用于采集长时云应用的并发应用运行数量;
所述长时云应用类型特征采集模块,用于采集长时云应用的类型特征信息,所述长时云应用的类型特征信息包括:长时云应用的类型、长时云应用的优先级以及长时云应用需要访问的数据库名或文件系统名;
其中,所述长时云应用的类型包括数据应用类和文件应用类;如果为数据应用类长时云应用,则进一步采集需要访问的数据库名以及数据处理优先级;如果为文件应用类长时云应用,则进一步采集需要访问的文件系统名以及文件处理优先级;
所述长时云应用工作时段采集模块,用于采集长时云应用的工作时段信息;
所述长时云应用管理子系统,包括长时云应用主控模块、长时云应用部署模块和长时云应用销毁模块;
所述长时云应用主控模块,用于周期性将当前时间和所述长时云应用工作时段采集模块采集到的各个长时云应用的工作时段信息进行匹配;
对于某个未部署的长时云应用,如果当前时间位于该未部署的长时云应用的工作时段信息内时,则将该长时云应用及其最少并发应用数量,放入待部署长时云应用队列,并提交给长时云应用部署模块;
对于某个已部署的长时云应用,如果当前时间位于该已部署的长时云应用的工作时段信息外时,则将该长时云应用放入待销毁云应用队列,并提交给长时云应用销毁模块;
所述长时云应用部署模块,用于从待部署长时云应用队列中逐个取出待部署长时云应用,然后,根据所述长时云应用类型特征采集模块采集到的长时云应用的类型特征信息,得到待部署长时云应用的类型、待部署长时云应用的优先级以及长时云应用需要访问的数据库名或文件系统名;然后,根据长时云应用的类型特征信息,按照资源部署策略,得到最佳计算服务器,并将待部署长时云应用部署到所述最佳计算服务器,并对部署情况进行记录,得到部署情况记录表;
所述长时云应用销毁模块,用于从待销毁云应用队列中,逐个取出待销毁长时云应用,根据部署情况记录表,找到需要销毁的长时云应用所部署的计算服务器,并向该计算服务器发送销毁命令,计算服务器接收到销毁命令之后,销毁对应的长时云应用,并释放物理资源,然后向长时云应用销毁模块发送销毁完毕信号;
所述短时云应用管理子系统,采用超负荷调度方法对短时云应用进行管理,包括短时云应用主控模块、利用率监控模块和短时云应用部署模块;
所述利用率监控模块,用于实时采集计算服务器的资源利用率,包括CPU利用率和内存利用率;
所述短时云应用主控模块,用于实时接收用户发送的短时云应用请求,并将用户请求的短时云应用加入到待部署云应用队列;然后,周期性向运行在各个计算服务器上的利用率监控模块发送资源利用率采集命令,并接收所述利用率监控模块返回的计算服务器的利用率数据;
当某台计算服务器的利用率数据低于满负荷阈值时,表明该台计算服务器所部署的长时云应用并没有占用所有资源或部分长时云应用处于等待状态,因此,根据当前计算服务器的利用率数据,计算得到可部署的短时云应用数量,并提交给所述短时云应用部署模块;
所述短时云应用部署模块,用于接收所述短时云应用主控模块发送的可部署的短时云应用数量,从待部署云应用队列取出相应数量的短时云应用,并在对应的计算服务器上部署相应数量的短时云应用;
而当监测到计算服务器中,长时云应用占用的资源利用率提升时,则在本台计算服务器已部署的短时云应用执行完毕之后,不继续增量部署短时云应用,从而释放短时云应用所占用的计算资源,保障长时云应用的服务质量。
优选的,所述服务器网络距离分析模块,具体用于:
所述服务器网络距离分析模块具体用于:
将任意两台服务器之间数据通信过程中数据需要经过的交换机和路由器的数量,设置为两台服务器之间的服务器网络距离。
优选的,所述长时云应用部署模块,根据长时云应用的类型特征信息,按照资源部署策略,得到最佳计算服务器,具体为:
所述资源部署策略为网络位置感知实现资源就近部署的策略,方法为:
如果待部署长时云应用的类型为数据应用类长时云应用,则根据其需要访问的数据库名,查找到具有对应数据库的数据服务器A;再根据服务器网络距离矩阵D,得到数据服务器A与其他各个计算资源满足需求的计算服务器的网络距离;将优先级越高的长时云应用,部署到距离数据服务器A的网络距离越小的计算服务器上面;
如果待部署长时云应用的类型为文件应用类长时云应用,则根据其需要访问的文件系统名,查找到具有对应文件系统的文件服务器B;再根据服务器网络距离矩阵D,得到文件服务器B与其他各个计算资源满足需求的计算服务器的网络距离;将优先级越高的长时云应用,部署到距离文件服务器B的网络距离越小的计算服务器上面。
优选的,在通过网络位置感知实现资源就近部署时,对于并发应用数量大于1的长时云应用,将各个并发应用分别部署到网络距离相等的多台计算服务器上。
优选的,在通过网络位置感知实现资源就近部署时,还融合采用资源抢占部署策略,具体为:
步骤1)假设当前需要部署的长时云应用为文件应用类长时云应用F;根据其需要访问的文件系统名,查找到具有对应文件系统的文件服务器F1;
步骤2)按照服务器网络距离矩阵D,在云资源池中,首先查找到距离文件服务器F1最近的计算服务器,设为计算服务器S;
步骤3)判断计算服务器S的空闲计算资源是否满足文件应用类长时云应用F的资源需求;其中,计算服务器S的空闲计算资源=计算服务器S的总计算资源-已分配给长时云应用的计算资源;
如果满足,则直接将文件应用类长时云应用F部署到计算服务器S;如果不满足,则执行步骤4)
步骤4)判断计算服务器S是否已部署满足以下条件的长时云应用H:
条件1:长时云应用H的优先级低于文件应用类长时云应用F的优先级;
条件2:经过计算,销毁长时云应用H后获得的空闲资源,满足文件应用类长时云应用F的使用需求;
如果没有,则忽略计算服务器S,以云资源池中剩余的计算服务器为检查范围,返回步骤2);如果有,则执行步骤5);
步骤5)将长时云应用H放入待销毁云应用队列,并提交给长时云应用销毁模块;
当长时云应用部署模块接收到长时云应用销毁模块反馈的将长时云应用H销毁完毕信号时,则在计算服务器S上部署文件应用类长时云应用F,然后将低优先级的长时云应用H加入到待部署云应用队列中。
优选的,所述短时云应用主控模块,采用以下方法,计算可部署的短时云应用数量:
1)所述利用率监控模块返回的计算服务器的利用率数据,为CPU利用率和内存利用率;
2)由于各种类型的短时云应用通常为轻量级云应用,所以其运行所需CPU核数统一配置为1,内存容量统一配置为1G;
按下式,得到可部署的短时云应用数量:
可部署的短时云应用数量N=min{计算服务器CPU总核数*(1-CPU利用率)/短时云应用CPU核数,计算服务器内存总容量*(1-内存利用率)/短时云应用内存容量}。
本发明提供的基于应用和位置感知的云管理系统具有以下优点:
本发明提供的一种基于应用和位置感知的云管理系统,实现云应用的高效性,云资源的高利用率,提升了云应用的服务质量,从而满足人们日益增长的数据请求高效处理的需求。
附图说明
图1为本发明提供的基于应用和位置感知的云管理系统的结构示意图。
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于应用和位置感知的云管理系统,可以实现云应用的高效性和云资源的高利用率,从而满足人们日益增长的数据请求高效处理的需求。
本发明具有以下特点:
第一:通过应用感知的方法,充分挖掘“单应用资源配置,并发应用数量,类型特征,工作时段”等云应用的各种特征信息,进行高效的云资源管理。
第二:在云应用部署时,为了提升云资源利用率,通过资源位置感知实现云应用就近部署;为了提升云应用的服务质量,通过设置优先级实现云应用抢占部署;为了提升云应用的可用性,通过服务器位置感知实现云应用分布部署。
第三:深度挖掘计算服务器的空闲资源利用率。本申请将云应用分为两类,第一类是长时云应用,长时云应用对计算资源的即时可用性要求比较高,需要保持固定的计算资源;第二类是短时云应用,短时云应用对计算资源的即时可用性要求较低,可以在长时云应用分配的计算资源空闲时,将短时云应用部署上去,充分利用空闲计算资源。在这个过程中,可以达到使用一份物理资源,运行两份甚至更多的云应用,使资源利用率达到最高。
参考图1,本发明提供的一种基于应用和位置感知的云管理系统,包括:云资源采集和分析子系统、长时云应用资源需求采集子系统、长时云应用管理子系统和短时云应用管理子系统。
本发明中,云资源池由服务器集群组成,主要包括三类服务器,分别为计算服务器、数据服务器和文件服务器。
本发明中,云应用区分为长时云应用和短时云应用;所述长时云应用对计算资源的即时可用性要求高,需要保持固定的计算资源;具体的,长时云应用通常是事务性处理,服务可用性和处理效率要求较高,但有较多IO等待和用户交互等待,所以预先部署的云资源大部分时间是闲置的。
所述短时云应用,通常是查询和查阅性应用,是指用户交互短暂迅速,并且容许中断切换和允许失败重新操作的应用。
下面对本发明各个子系统分别详细介绍:
(一)云资源采集和分析子系统
所述云资源采集和分析子系统,包括计算服务器资源采集模块、数据服务器资源采集模块、文件服务器资源采集模块和服务器网络距离分析模块。
(1.1)计算服务器资源采集模块
所述计算服务器资源采集模块,用于采集并记录计算服务器的总计算资源,得到计算服务器资源列表;其中,所述计算服务器的总计算资源包括计算服务器的型号,每种型号的计算服务器的数量,以及每种型号的计算服务器的CPU核心数和内存容量。
例如,云资源池配置10台华为FusionServer计算服务器,每台FusionServer计算服务器包括12个CPU核心,1TB的内存容量。云资源池还配置5台新华三R6900计算服务器,每台R6900计算服务器包括14个CPU核心,2TB的内存容量。
(1.2)数据服务器资源采集模块
所述数据服务器资源采集模块,用于采集并记录数据服务器的总计算资源,得到数据服务器资源列表;其中,所述数据服务器的总计算资源包括数据服务器的数量,每台数据服务器的IP地址,每台数据服务器所运行的数据库名。
(1.3)文件服务器资源采集模块
所述文件服务器资源采集模块,用于采集并记录文件服务器的总计算资源,得到文件服务器资源列表;其中,所述文件服务器的总计算资源包括文件服务器的数量,每台文件服务器的IP地址,每台文件服务器所运行的文件系统名。
(1.4)服务器网络距离分析模块
所述服务器网络距离分析模块,用于分析并记录云资源池中任意两台服务器之间的服务器网络距离,形成服务器网络距离矩阵D;
在具体实现上,服务器网络距离分析模块,具体用于:将任意两台服务器之间数据通信过程中数据需要经过的交换机和路由器的数量,设置为两台服务器之间的服务器网络距离。
例如,若服务器A和服务器B直接接入到同一个交换机或路由器,则距离矩阵中,服务器A和服务器B的网络距离D(A,B)=1。
若服务器C和服务器D直接接入的交换机或路由器,不是直接相连而是通过另一个交换机或路由器相连,例如,服务器C依次通过交换机H1和路由器H2后,再连接到服务器D。则距离矩阵中服务器C和服务器D的网络距离为D(C,D)=2。
(二)长时云应用资源需求采集子系统
长时云应用,是指对计算资源的即时可用性要求比较高,需要保持固定的计算资源的云应用。所以,长时云应用资源需求采集子系统,用于为每个长时云应用采集到各种特征信息,从而可以通过应用感知的方法,进行集约化云资源管理。
所述长时云应用资源需求采集子系统,包括单长时云应用资源配置采集模块、并发应用数量采集模块、长时云应用类型特征采集模块和长时云应用工作时段采集模块。
(2.1)单长时云应用资源配置采集模块
所述单长时云应用资源配置采集模块,用于采集单个长时云应用的资源配置信息,包括单个长时云应用运行所需的CPU核心数和内存容量。
例如,单长时云应用的默认资源配置为:具有1个CPU核心和10G内存。实际应用中,用户可以根据具体长时云应用的特点增加资源数量,例如,交通管理长时云应用需要处理的数据量比较大,可以为交通管理长时云应用配置为1个CPU核心和20G内存。
(2.2)并发应用数量采集模块
所述并发应用数量采集模块,用于采集单个长时云应用的并发应用运行数量。
例如,政务云中,医保业务长时云应用的数据操作负载大,可以设置医保业务长时云应用的并发应用数量为10;环保业务长时云应用的数据操作频率较低且总量较少,可以设置环保业务长时云应用的并发应用数量为2。
(2.3)长时云应用类型特征采集模块
所述长时云应用类型特征采集模块,用于采集长时云应用的类型特征信息,所述长时云应用的类型特征信息包括:长时云应用的类型、长时云应用的优先级以及长时云应用需要访问的数据库名或文件系统名;
其中,所述长时云应用的类型包括数据应用类和文件应用类;如果为数据应用类长时云应用,则进一步采集需要访问的数据库名以及数据处理优先级;如果为文件应用类长时云应用,则进一步采集需要访问的文件系统名以及文件处理优先级。
进一步的,数据处理优先级和具体的云应用有关,例如,政务云中,财政数据操作优先级为第1优先等级,医保数据操作优先级为第2优先等级,交通数据操作优先级为第3优先等级,环保数据操作优先级为第4优先等级等。
文件处理优先级和具体的云应用有关,例如,政务云中,中央公文文件处理优先级为第1优先等级,省级公文文件处理优先级为第2优先等级,市级公文文件处理优先级为第3优先等级等。
(2.4)长时云应用工作时段采集模块
所述长时云应用工作时段采集模块,用于采集长时云应用的工作时段信息。其中,工作时段信息包括全天24小时,以及定制工作时间段,如,[8:00,17:00]为一天中的工作时段,或者,[8:00,12:00]和[15:00,16:00]组成一天中的工作时段。
(三)长时云应用管理子系统
所述长时云应用管理子系统,包括长时云应用主控模块、长时云应用部署模块和长时云应用销毁模块。
(3.1)长时云应用主控模块
所述长时云应用主控模块,用于周期性(例如每5分钟)将当前时间和所述长时云应用工作时段采集模块采集到的各个长时云应用的工作时段信息进行匹配;
对于某个未部署的长时云应用,如果当前时间位于该未部署的长时云应用的工作时段信息内时,表明该长时云应用的工作时间满足,需要进行部署。因此,将该长时云应用及其最少并发应用数量,放入待部署长时云应用队列,并提交给长时云应用部署模块;
对于某个已部署的长时云应用,如果当前时间位于该已部署的长时云应用的工作时段信息外时,表明该长时云应用的工作时间已不满足,则将该长时云应用放入待销毁云应用队列,并提交给长时云应用销毁模块。
(3.2)长时云应用部署模块
所述长时云应用部署模块,用于从待部署长时云应用队列中逐个取出待部署长时云应用,然后,根据所述长时云应用类型特征采集模块采集到的长时云应用的类型特征信息,得到待部署长时云应用的类型、待部署长时云应用的优先级以及长时云应用需要访问的数据库名或文件系统名;然后,根据长时云应用的类型特征信息,按照资源部署策略,得到最佳计算服务器,并将待部署长时云应用部署到所述最佳计算服务器,并对部署情况进行记录,得到部署情况记录表;
所述长时云应用部署模块,根据长时云应用的类型特征信息,按照资源部署策略,得到最佳计算服务器,具体为:
为了提升资源利用率,所述资源部署策略为网络位置感知实现资源就近部署的策略,方法为:
如果待部署长时云应用的类型为数据应用类长时云应用,则根据其需要访问的数据库名,查找到具有对应数据库的数据服务器A;再根据服务器网络距离矩阵D,得到数据服务器A与其他各个计算资源满足需求的计算服务器的网络距离;将优先级越高的长时云应用,部署到距离数据服务器A的网络距离越小的计算服务器上面;
如果待部署长时云应用的类型为文件应用类长时云应用,则根据其需要访问的文件系统名,查找到具有对应文件系统的文件服务器B;再根据服务器网络距离矩阵D,得到文件服务器B与其他各个计算资源满足需求的计算服务器的网络距离;将优先级越高的长时云应用,部署到距离文件服务器B的网络距离越小的计算服务器上面。
例如,中央公文文件处理长时云应用的优先级为第1优先等级,则中央公文文件处理长时云应用,通常会部署到与存储中央公文文件系统的文件服务器的网络距离为1的计算服务器中。
省级公文文件处理长时云应用的优先级为第2优先等级,则省级公文文件处理长时云应用,首先考虑部署到与存储省级公文文件系统的文件服务器的网络距离为1的计算服务器中。若存储省级公文文件系统的文件服务器A和存储中央公文文件系统的文件服务器B是同一个文件服务器,而与文件服务器的网络距离为1的计算服务器C的计算资源均已被中央公文文件处理长时云应用所占用,则将省级公文文件处理长时云应用,部署到与存储省级公文文件系统的文件服务器A的网络距离为2的计算服务器中。
另外,按照资源就近部署策略,容易将单个云应用的所有并发应用部署到同一台物理服务器中,导致云应用的可用性降低,即当单个物理服务器发生故障之后,云应用无法进一步提供服务。由于在云计算环境下,具有相同网络距离的服务器数量往往大于1,所以为了提升云应用的可用性,通过计算服务器位置感知实现资源分布部署,即:对于并发应用数量大于1的长时云应用,将各个并发应用分别部署到网络距离相等的多台计算服务器上。
例如:
中央公文文件处理长时云应用的并发应用数量为5。存储中央公文文件系统的文件服务器表示为C1。
若与文件服务器C1的网络距离为1的计算服务器共有5台,则每一台计算服务器各部署1套中央公文文件处理长时云应用。
若与文件服务器C1的网络距离为1的计算服务器共有2台,则根据负载均摊的原则,一台计算服务器部署2套中央公文文件处理长时云应用,1台计算服务器部署3套中央公文文件处理长时云应用。
显然,由于采用了定时部署原则,如果一个高优先级云应用的部署时间较晚,则会出现计算服务器资源被先部署的低优先级云应用占用的情况。所以,为了提升云应用的服务质量,通过优先级实现资源抢占部署。
因此,在通过网络位置感知实现资源就近部署时,还融合采用资源抢占部署策略,具体为:
步骤1)假设当前需要部署的长时云应用为文件应用类长时云应用F;根据其需要访问的文件系统名,查找到具有对应文件系统的文件服务器F1;
步骤2)按照服务器网络距离矩阵D,在云资源池中,按从近到远的原则,首先查找到距离文件服务器F1最近的计算服务器,设为计算服务器S;
步骤3)判断计算服务器S的空闲计算资源是否满足文件应用类长时云应用F的资源需求;其中,计算服务器S的空闲计算资源=计算服务器S的总计算资源-已分配给长时云应用的计算资源;
如果满足,则直接将文件应用类长时云应用F部署到计算服务器S;如果不满足,则执行步骤4)
步骤4)判断计算服务器S是否已部署满足以下条件的长时云应用H:
条件1:长时云应用H的优先级低于文件应用类长时云应用F的优先级;
条件2:经过计算,销毁长时云应用H后获得的空闲资源,满足文件应用类长时云应用F的使用需求;
如果没有,则忽略计算服务器S,以云资源池中剩余的计算服务器为检查范围,返回步骤2);如果有,则执行步骤5);
步骤5)将长时云应用H放入待销毁云应用队列,并提交给长时云应用销毁模块;
当长时云应用部署模块接收到长时云应用销毁模块反馈的将长时云应用H销毁完毕信号时,则在计算服务器S上部署文件应用类长时云应用F,然后将低优先级的长时云应用H加入到待部署云应用队列中。
(3.3)长时云应用销毁模块
所述长时云应用销毁模块,用于从待销毁云应用队列中,逐个取出待销毁长时云应用,根据部署情况记录表,找到需要销毁的长时云应用所部署的计算服务器,并向该计算服务器发送销毁命令,计算服务器接收到销毁命令之后,销毁对应的长时云应用,并释放物理资源,然后向长时云应用销毁模块发送销毁完毕信号;
(四)短时云应用管理子系统
为了充分利用云资源,本发明针对短时云应用的特点,采用超负荷调度的方法进行短时云应用管理。基本思想是:
在长时云应用管理子系统部署长时云应用时,长时云应用可以将计算服务器上的计算资源占满。比如,某台计算服务器有10个核心数,100G内存。当部署10个长时云应用时,可以将这10个长时云应用均部署到这台计算服务器上,每个长时云应用分配1个核心数和10G内存。然后,实时监控计算服务器上的计算资源利用率,当长时云应用由于IO等待或用户交互等待,导致监测到计算服务器的计算资源利用率较低时,则可以在该长时云应用等待时间段,向本台计算服务器逐步增量部署短时云应用,使计算服务器的资源利用率提高。而当监测到计算服务器中,长时云应用占用的资源利用率提升时,则可以在本台计算服务器已部署的短时云应用执行完毕之后不继续增量部署,从而释放短时云应用所占用的计算资源,保障长时云应用的服务质量。
所述短时云应用管理子系统,采用超负荷调度方法对短时云应用进行管理,包括短时云应用主控模块、利用率监控模块和短时云应用部署模块。
(4.1)利用率监控模块
所述利用率监控模块,用于实时采集计算服务器的资源利用率,包括CPU利用率和内存利用率;
(4.2)短时云应用主控模块
所述短时云应用主控模块,用于实时接收用户发送的短时云应用请求,并将用户请求的短时云应用加入到待部署云应用队列;然后,周期性(例如每5分钟)向运行在各个计算服务器上的利用率监控模块发送资源利用率采集命令,并接收所述利用率监控模块返回的计算服务器的利用率数据;
当某台计算服务器的利用率数据低于满负荷阈值时,表明该台计算服务器所部署的长时云应用处于并没有占用所有资源或部分长时云应用处于等待状态,例如,长时云应用由于IO等待或用户交互等待,因此,长时云应用的CPU利用率和内存利用率较低,因此,根据当前计算服务器的利用率数据,计算得到可部署的短时云应用数量,并提交给所述短时云应用部署模块;
其中,作为一种具体实现方式,所述短时云应用主控模块,采用以下方法,计算可部署的短时云应用数量:
1)所述利用率监控模块返回的计算服务器的利用率数据,为CPU利用率和内存利用率;
2)由于各种类型的短时云应用通常为轻量级云应用,所以其运行所需CPU核数统一配置为1,内存容量统一配置为1G;
按下式,得到可部署的短时云应用数量:
可部署的短时云应用数量N=min{计算服务器CPU总核数*(1-CPU利用率)/短时云应用CPU核数,计算服务器内存总容量*(1-内存利用率)/短时云应用内存容量}。
当然,如果短时云应用的CPU核数和内存容量不相等,只要基于同一原理,根据每个短时云应用的CPU核数和内存容量,即可计算出可部署的各种短时云应用及对应数量。
(4.3)短时云应用部署模块
所述短时云应用部署模块,用于接收所述短时云应用主控模块发送的可部署的短时云应用数量,从待部署云应用队列取出相应数量的短时云应用,并在对应的计算服务器上部署相应数量的短时云应用;
而当监测到计算服务器中,长时云应用占用的资源利用率提升时,则在本台计算服务器已部署的短时云应用执行完毕之后,不继续增量部署短时云应用,从而释放短时云应用所占用的计算资源,保障长时云应用的服务质量。
本发明提供的一种基于应用和位置感知的云管理系统,具有以下特点:
针对云应用的特点,将云应用划分为长时云应用和短时云应用两种类型;
对于长时云应用,当其进入工作时段时,按照网络位置感知实现资源就近部署的策略,将其部署到能满足其资源需求的距离最近的计算服务器,实现对长时云应用的快速部署;另外,也可以采用基于优先级的资源抢占部署方案,即,首先将距离最近的计算服务器的低优先级长时云应用销毁,然后将本次部署的高优先级的长时云应用部署到该计算服务器,实现高优先级的长时云应用部署到最近的计算服务器,优先满足高优先级的长时云应用的快速部署,从而提高其响应速度;对于已销毁的低优先级的长时云应用,再重新部署。
通过以上方法,在长时云应用部署时,为了提升云资源利用率,通过资源位置感知实现云应用就近部署;为了提升云应用的服务质量,通过设置优先级实现云应用抢占部署;为了提升云应用的可用性,通过服务器位置感知实现云应用分布部署。
而对于短时云应用,其对计算资源的即时可用性要求较低,并且,短时云应用运行时间非常短,因此,可采用以下任意一种方式部署短时云应用:第一种,如果距离短时云应用较近的计算服务器存在没有占用的资源,可直接将短时云应用布置到对应的计算服务器;第二种,如果计算服务器所部署的部分长时云应用为等待状态,则充分利用长时云应用等待时所释放的计算资源,将短时云应用布置到对应的计算服务器,由于短时云应用的运行时间非常短,因此,运行时间迅速执行完毕,并释放所占用的计算资源,从而不会影响到长时云应用被唤醒后的运行。因此,本发明既保证了长时云应用和短时云应用的服务质量,又实现了对计算资源的充分利用。
因此,本发明深度挖掘计算服务器的空闲资源利用率,充分利用长时云应用分配的计算资源,当长时云应用分配的计算资源空闲时,将短时云应用部署到计算服务器;当长时云应用需要更多计算资源时,停止增量部署短时云应用。在此过程中,可以达到充分使用一份物理资源的效果,同一物理资源可以运行两份甚至更多的云应用,使资源利用率达到最高。
因此,本发明提供的一种基于应用和位置感知的云管理系统,实现云应用的高效性,云资源的高利用率,提升了云应用的服务质量,从而满足人们日益增长的数据请求高效处理的需求。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
Claims (6)
1.一种基于应用和位置感知的云管理系统,其特征在于,包括:云资源采集和分析子系统、长时云应用资源需求采集子系统、长时云应用管理子系统和短时云应用管理子系统;其中,云资源池由服务器集群组成,包括计算服务器、数据服务器和文件服务器;云应用包括长时云应用和短时云应用;所述长时云应用对计算资源的即时可用性要求高,需要保持固定的计算资源;所述短时云应用,是指用户交互短暂迅速,并且容许中断切换和允许失败重新操作的应用;
所述云资源采集和分析子系统,包括计算服务器资源采集模块、数据服务器资源采集模块、文件服务器资源采集模块和服务器网络距离分析模块;
所述计算服务器资源采集模块,用于采集并记录计算服务器的总计算资源,得到计算服务器资源列表;其中,所述计算服务器的总计算资源包括计算服务器的型号,每种型号的计算服务器的数量,以及每种型号的计算服务器的CPU核心数和内存容量;
所述数据服务器资源采集模块,用于采集并记录数据服务器的总计算资源,得到数据服务器资源列表;其中,所述数据服务器的总计算资源包括数据服务器的数量,每台数据服务器的IP地址,每台数据服务器所运行的数据库名;
所述文件服务器资源采集模块,用于采集并记录文件服务器的总计算资源,得到文件服务器资源列表;其中,所述文件服务器的总计算资源包括文件服务器的数量,每台文件服务器的IP地址,每台文件服务器所运行的文件系统名;
所述服务器网络距离分析模块,用于分析并记录云资源池中任意两台服务器之间的服务器网络距离,形成服务器网络距离矩阵D;
所述长时云应用资源需求采集子系统,包括单长时云应用资源配置采集模块、并发应用数量采集模块、长时云应用类型特征采集模块和长时云应用工作时段采集模块;
所述单长时云应用资源配置采集模块,用于采集单个长时云应用的资源配置信息,包括单个长时云应用运行所需的CPU核心数和内存容量;
所述并发应用数量采集模块,用于采集长时云应用的并发应用运行数量;
所述长时云应用类型特征采集模块,用于采集长时云应用的类型特征信息,所述长时云应用的类型特征信息包括:长时云应用的类型、长时云应用的优先级以及长时云应用需要访问的数据库名或文件系统名;
其中,所述长时云应用的类型包括数据应用类和文件应用类;如果为数据应用类长时云应用,则进一步采集需要访问的数据库名以及数据处理优先级;如果为文件应用类长时云应用,则进一步采集需要访问的文件系统名以及文件处理优先级;
所述长时云应用工作时段采集模块,用于采集长时云应用的工作时段信息;
所述长时云应用管理子系统,包括长时云应用主控模块、长时云应用部署模块和长时云应用销毁模块;
所述长时云应用主控模块,用于周期性将当前时间和所述长时云应用工作时段采集模块采集到的各个长时云应用的工作时段信息进行匹配;
对于某个未部署的长时云应用,如果当前时间位于该未部署的长时云应用的工作时段信息内时,则将该长时云应用及其最少并发应用数量,放入待部署长时云应用队列,并提交给长时云应用部署模块;
对于某个已部署的长时云应用,如果当前时间位于该已部署的长时云应用的工作时段信息外时,则将该长时云应用放入待销毁云应用队列,并提交给长时云应用销毁模块;
所述长时云应用部署模块,用于从待部署长时云应用队列中逐个取出待部署长时云应用,然后,根据所述长时云应用类型特征采集模块采集到的长时云应用的类型特征信息,得到待部署长时云应用的类型、待部署长时云应用的优先级以及长时云应用需要访问的数据库名或文件系统名;然后,根据长时云应用的类型特征信息,按照资源部署策略,得到最佳计算服务器,并将待部署长时云应用部署到所述最佳计算服务器,并对部署情况进行记录,得到部署情况记录表;
所述长时云应用销毁模块,用于从待销毁云应用队列中,逐个取出待销毁长时云应用,根据部署情况记录表,找到需要销毁的长时云应用所部署的计算服务器,并向该计算服务器发送销毁命令,计算服务器接收到销毁命令之后,销毁对应的长时云应用,并释放物理资源,然后向长时云应用销毁模块发送销毁完毕信号;
所述短时云应用管理子系统,采用超负荷调度方法对短时云应用进行管理,包括短时云应用主控模块、利用率监控模块和短时云应用部署模块;
所述利用率监控模块,用于实时采集计算服务器的资源利用率,包括CPU利用率和内存利用率;
所述短时云应用主控模块,用于实时接收用户发送的短时云应用请求,并将用户请求的短时云应用加入到待部署云应用队列;然后,周期性向运行在各个计算服务器上的利用率监控模块发送资源利用率采集命令,并接收所述利用率监控模块返回的计算服务器的利用率数据;
当某台计算服务器的利用率数据低于满负荷阈值时,表明该台计算服务器所部署的长时云应用并没有占用所有资源或部分长时云应用处于等待状态,因此,根据当前计算服务器的利用率数据,计算得到可部署的短时云应用数量,并提交给所述短时云应用部署模块;
所述短时云应用部署模块,用于接收所述短时云应用主控模块发送的可部署的短时云应用数量,从待部署云应用队列取出相应数量的短时云应用,并在对应的计算服务器上部署相应数量的短时云应用;
而当监测到计算服务器中,长时云应用占用的资源利用率提升时,则在本台计算服务器已部署的短时云应用执行完毕之后,不继续增量部署短时云应用,从而释放短时云应用所占用的计算资源,保障长时云应用的服务质量。
2.根据权利要求1所述的基于应用和位置感知的云管理系统,其特征在于,所述服务器网络距离分析模块,具体用于:
所述服务器网络距离分析模块具体用于:
将任意两台服务器之间数据通信过程中数据需要经过的交换机和路由器的数量,设置为两台服务器之间的服务器网络距离。
3.根据权利要求1所述的基于应用和位置感知的云管理系统,其特征在于,所述长时云应用部署模块,根据长时云应用的类型特征信息,按照资源部署策略,得到最佳计算服务器,具体为:
所述资源部署策略为网络位置感知实现资源就近部署的策略,方法为:
如果待部署长时云应用的类型为数据应用类长时云应用,则根据其需要访问的数据库名,查找到具有对应数据库的数据服务器A;再根据服务器网络距离矩阵D,得到数据服务器A与其他各个计算资源满足需求的计算服务器的网络距离;将优先级越高的长时云应用,部署到距离数据服务器A的网络距离越小的计算服务器上面;
如果待部署长时云应用的类型为文件应用类长时云应用,则根据其需要访问的文件系统名,查找到具有对应文件系统的文件服务器B;再根据服务器网络距离矩阵D,得到文件服务器B与其他各个计算资源满足需求的计算服务器的网络距离;将优先级越高的长时云应用,部署到距离文件服务器B的网络距离越小的计算服务器上面。
4.根据权利要求3所述的基于应用和位置感知的云管理系统,其特征在于,在通过网络位置感知实现资源就近部署时,对于并发应用数量大于1的长时云应用,将各个并发应用分别部署到网络距离相等的多台计算服务器上。
5.根据权利要求3所述的基于应用和位置感知的云管理系统,其特征在于,在通过网络位置感知实现资源就近部署时,还融合采用资源抢占部署策略,具体为:
步骤1)假设当前需要部署的长时云应用为文件应用类长时云应用F;根据其需要访问的文件系统名,查找到具有对应文件系统的文件服务器F1;
步骤2)按照服务器网络距离矩阵D,在云资源池中,首先查找到距离文件服务器F1最近的计算服务器,设为计算服务器S;
步骤3)判断计算服务器S的空闲计算资源是否满足文件应用类长时云应用F的资源需求;其中,计算服务器S的空闲计算资源=计算服务器S的总计算资源-已分配给长时云应用的计算资源;
如果满足,则直接将文件应用类长时云应用F部署到计算服务器S;如果不满足,则执行步骤4);
步骤4)判断计算服务器S是否已部署满足以下条件的长时云应用H:
条件1:长时云应用H的优先级低于文件应用类长时云应用F的优先级;
条件2:经过计算,销毁长时云应用H后获得的空闲资源,满足文件应用类长时云应用F的使用需求;
如果没有,则忽略计算服务器S,以云资源池中剩余的计算服务器为检查范围,返回步骤2);如果有,则执行步骤5);
步骤5)将长时云应用H放入待销毁云应用队列,并提交给长时云应用销毁模块;
当长时云应用部署模块接收到长时云应用销毁模块反馈的将长时云应用H销毁完毕信号时,则在计算服务器S上部署文件应用类长时云应用F,然后将低优先级的长时云应用H加入到待部署云应用队列中。
6.根据权利要求1所述的基于应用和位置感知的云管理系统,其特征在于,所述短时云应用主控模块,采用以下方法,计算可部署的短时云应用数量:
1)所述利用率监控模块返回的计算服务器的利用率数据,为CPU利用率和内存利用率;
2)由于各种类型的短时云应用通常为轻量级云应用,所以其运行所需CPU核数统一配置为1,内存容量统一配置为1G;
按下式,得到可部署的短时云应用数量:
可部署的短时云应用数量N=min{计算服务器CPU总核数*(1-CPU利用率)/短时云应用CPU核数,计算服务器内存总容量*(1-内存利用率)/短时云应用内存容量}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010669740.XA CN111800514B (zh) | 2020-07-13 | 2020-07-13 | 一种基于应用和位置感知的云管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010669740.XA CN111800514B (zh) | 2020-07-13 | 2020-07-13 | 一种基于应用和位置感知的云管理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111800514A CN111800514A (zh) | 2020-10-20 |
CN111800514B true CN111800514B (zh) | 2022-04-15 |
Family
ID=72808432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010669740.XA Active CN111800514B (zh) | 2020-07-13 | 2020-07-13 | 一种基于应用和位置感知的云管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111800514B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572289A (zh) * | 2013-10-10 | 2015-04-29 | 中国电信股份有限公司 | 基于虚拟化的服务器配置测算处理方法与装置 |
CN104618693A (zh) * | 2015-02-09 | 2015-05-13 | 北京邮电大学 | 一种基于云计算的监控视频在线处理任务管理方法及系统 |
CN110012108A (zh) * | 2019-04-15 | 2019-07-12 | 深圳市网心科技有限公司 | 数据副本存储方法、下载方法、云存储系统及相关装置 |
EP3560146A4 (en) * | 2016-12-26 | 2020-01-01 | Morgan Stanley Services Group Inc. | PREDICTIVE STOCK OPTIMIZATION FOR COMPUTER RESOURCES |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9081610B2 (en) * | 2012-06-18 | 2015-07-14 | Hitachi, Ltd. | Method and apparatus to maximize return on investment in hybrid cloud environment |
-
2020
- 2020-07-13 CN CN202010669740.XA patent/CN111800514B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572289A (zh) * | 2013-10-10 | 2015-04-29 | 中国电信股份有限公司 | 基于虚拟化的服务器配置测算处理方法与装置 |
CN104618693A (zh) * | 2015-02-09 | 2015-05-13 | 北京邮电大学 | 一种基于云计算的监控视频在线处理任务管理方法及系统 |
EP3560146A4 (en) * | 2016-12-26 | 2020-01-01 | Morgan Stanley Services Group Inc. | PREDICTIVE STOCK OPTIMIZATION FOR COMPUTER RESOURCES |
CN110012108A (zh) * | 2019-04-15 | 2019-07-12 | 深圳市网心科技有限公司 | 数据副本存储方法、下载方法、云存储系统及相关装置 |
Non-Patent Citations (2)
Title |
---|
"智慧校园"云平台的关键模块设计与实现;吴细花;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20151015;全文 * |
基于自动网络加速器的云计算能耗降低的方法研究;吴国芳;《计算机测量与控制》;20141225(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111800514A (zh) | 2020-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3073374B1 (en) | Thread creation method, service request processing method and related device | |
EP3335120B1 (en) | Method and system for resource scheduling | |
US20190163371A1 (en) | Next generation storage controller in hybrid environments | |
CN112199194A (zh) | 基于容器集群的资源调度方法、装置、设备和存储介质 | |
US10142195B1 (en) | Partitioned performance tracking core resource consumption independently | |
CN103942098A (zh) | 一种任务处理系统和方法 | |
US10148531B1 (en) | Partitioned performance: adaptive predicted impact | |
WO2024016596A1 (zh) | 容器集群调度的方法、装置、设备及存储介质 | |
CN103491024A (zh) | 一种面向流式数据的作业调度方法及装置 | |
CN112073532B (zh) | 一种资源分配的方法及装置 | |
CN109002364B (zh) | 进程间通信的优化方法、电子装置以及可读存储介质 | |
US10033620B1 (en) | Partitioned performance adaptive policies and leases | |
CN114928579A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN113672335A (zh) | 容器调度方法、装置、电子装置和存储介质 | |
CN110838987B (zh) | 队列限流方法、存储介质 | |
CN101853185B (zh) | 刀片服务器的业务调度方法和刀片服务器 | |
US11861386B1 (en) | Application gateways in an on-demand network code execution system | |
CN116450328A (zh) | 内存分配方法、装置、计算机设备和存储介质 | |
CN111800514B (zh) | 一种基于应用和位置感知的云管理系统 | |
KR101890046B1 (ko) | 전력 소비 감소를 위한 동시적 네트워크 애플리케이션 스케줄링 | |
CN110109986B (zh) | 任务处理方法、系统、服务器及任务调度系统 | |
CN108243225B (zh) | 一种分布式系统、管理方法及访问方法 | |
CN111435319A (zh) | 一种集群的管理方法及装置 | |
CN113553361A (zh) | 资源管理方法及装置 | |
CN115878309A (zh) | 资源分配方法、装置、处理核、设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |