CN111104226B - 一种多租户服务资源的智能管理系统及方法 - Google Patents

一种多租户服务资源的智能管理系统及方法 Download PDF

Info

Publication number
CN111104226B
CN111104226B CN201911354225.6A CN201911354225A CN111104226B CN 111104226 B CN111104226 B CN 111104226B CN 201911354225 A CN201911354225 A CN 201911354225A CN 111104226 B CN111104226 B CN 111104226B
Authority
CN
China
Prior art keywords
tenant
service
cloud platform
service resource
resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911354225.6A
Other languages
English (en)
Other versions
CN111104226A (zh
Inventor
冯朝路
赵大哲
栗伟
杨金柱
覃文军
曹鹏
Original Assignee
东北大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 东北大学 filed Critical 东北大学
Priority to CN201911354225.6A priority Critical patent/CN111104226B/zh
Publication of CN111104226A publication Critical patent/CN111104226A/zh
Application granted granted Critical
Publication of CN111104226B publication Critical patent/CN111104226B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0645Rental transactions; Leasing transactions

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种多租户服务资源的智能管理系统及方法,涉及计算机技术技术领域。该系统及方法通过服务资源登记模块初始化云平台可用资源数量,服务资源分配模块结合新增租户等级、具体需求、其他当前相似租户的服务需求、以及云平台当前运行状态,为新增租户分配服务资源;由服务资源监测模块实时监测所有活动租户的实时需求,以及云平台当前运行状态,并实时记录平台运行状态到日志文件;由服务资源调节模块结合云平台运行状态调整租户服务资源;由服务资源回收模块收回服务资源;由云平台日志登记与回滚模块根据日志文件重启并回滚崩溃前的租户任务。本系统及方法实现了对云平台基础设施、平台使用权、软件运行权等服务资源的动态实时管理。

Description

一种多租户服务资源的智能管理系统及方法
技术领域
本发明涉及计算机技术技术领域,尤其涉及一种多租户服务资源的智能管理系统及方法。
背景技术
随着信息技术的进步与发展,人们的日常生活与数据、计算联系越来越紧密。例如,出行路径、饮食习惯、关注的新闻热点等,均可以被收纳、整理、分析、利用,从而为我们的日常生活提供更多的便利。这正是大数据、人工智能时代推动人类数字智能化生活的典型示例。另一个典型示例是科技文献资源、计算资源、会议日程、成果展示、重大进展报告等科技资源云平台需求。这些需求不是云计算、云存储等云平台相关技术产生的根本原因,却对相关技术的发展提出极大挑战。根据为用户提供服务的方式不同,当前的云技术划分为基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)。通常地,服务是需要付费的,所以用户又称为“租户”。为保证购买服务租户的不同需求,合理有效地管理云平台的存储、计算等有限基础设施资源、为数不多却需付费购买的平台资源使用权、种类繁杂的工具软件的安装、调试、运行,成为亟需解决的问题。专利[2015110303819]提供“多租户资源管理的方法及系统”为用户提供专属的预设资源算法用于分配物理资源。专利[2016100820207]提供“一种多租户资源共享的方法及系统”通过中央处理器(CPU)管理分配器预估用户对CPU核的平均使用率,并与预先设定期望阈值对比决定为租户增加或移除一个计算核心。以上发明方法存在的缺陷是:一方面对租户服务需求的动态实时性变化考虑不足;另一方面,并未考虑除基础设施以外的平台使用权、软件运行权等非物理性服务资源。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种多租户服务资源的智能管理系统及方法,实现对云平台基础设施,以及平台使用权、软件运行权等非物理性服务资源的动态实时管理,为租户提供个性化服务,并提升云平台服务性能。
为解决上述技术问题,本发明所采取的技术方案是:一方面,本发明提供一种多租户服务资源的智能管理系统,包括服务资源登记模块、服务资源分配模块、服务资源监测模块、服务资源预测模块、服务资源调节模块、服务资源回收模块以及云平台日志登记与回滚模块;
所述服务资源登记模块,用于云平台初始启动时依据平台的物理性及非物理性可用服务资源的数量,对云平台服务资源的标识变量进行初始化;
所述服务资源分配模块,用于当云平台有新增租户时,为新增租户分配满足其需求的服务资源;
所述服务资源监测模块,用于监测所有活动租户的实时需求,以及云平台当前运行状态,并将监测结果写入云平台的日志记录文件;
所述服务资源预测模块,用于根据租户服务资源历史使用数据,构造租户服务资源使用曲线,提前估计出租户对服务资源的实时需求;
所述服务资源调节模块,用于当租户实时需求发生改变时,结合云平台运行状态调整租户服务资源使用情况;
所述服务资源回收模块,用于当有租户退出或维持云平台运行的保障性资源触发临界值时,将已分配给租户的全部服务资源或部分服务资源收回;
所述云平台日志登记与回滚模块,用于在云平台运行过程中,实时记录云平台运行状态到日志记录文件,以及当不可拒外力引起云平台崩溃时,根据日志记录文件重启云平台并回滚崩溃前的租户任务。
优选地,所述云平台服务资源的标识变量中存储的是当前云平台对应服务资源的可用余量,服务资源标识变量在云平台运行过程中其数量值随着租户数量及其需求的变化而动态改变。
优选地,当云平台有新增租户时,服务资源分配模块根据其付费情况将其划分为不同等级,等级越高对同一资源的优先占用或使用权更高;所述服务资源分配模块为新增租户分配满足其需求的服务资源时,还需考虑新增租户的服务资源优先级及云平台服务资源使用情况。
优选地,所述服务资源监测模块每隔一定时间间隔将监测结果写入云平台的日志记录文件;所述服务资源监测模块监测的活动租户的实时需求具体为当前租户实际正在使用的资源情况;所述云平台当前运行状态,包括云平台资源余量、由所述服务资源分配模块已完成分配的资源的占用情况及新增租户的排队数据。
优选地,所述租户服务资源历史使用数据,包括云平台所能提供的、被租户所独占,以及正在排队申请使用的物理资源和非物理资源;所述租户服务资源历史使用数据以一定时间间隔为单位,服务资源预测模块对租户服务资源的实时需求预测也是以同样时间间隔为单位;
所述租户服务资源使用曲线由服务资源历史使用数据,采用聚类拟合算法得到服务资源历史使用规律;
所述构造的租户服务资源使用曲线,针对单一租户或针对同等服务资源需求水平等级的多租户或针对二者的结合。
优选地,所述调整租户服务资源使用情况,包括分配更多地服务资源,回收部分已分配服务资源;
所述租户实时需求为确实存在的租户对资源服务需求提出的明确改变,或服务资源预测模块根据租户服务资源历史使用规律实时预测的结果;
所述服务资源调节模块根据云平台空闲可用服务资源余量进行操作。
优选地,所述维持云平台运行的保障性资源在对云平台服务资源的标识变量进行初始化时,由服务资源登记模块预留。
优选地,所述实时记录平台运行状态,每间隔特定时间段进行一次;所述回滚崩溃前的租户任务,需要云平台重启后,云平台日志登记与回滚模块正常运行时完成。
另一方面,本发明还提供一种多租户服务资源的智能管理方法,包括以下步骤:
步骤1:云平台初始启动时,根据其物理性非物理性服务资源规模,由服务资源登记模块初始化云平台可用资源数量;
步骤2:当有新增租户时,服务资源分配模块结合新增租户等级、具体需求、其他当前相似租户的服务需求、以及云平台当前运行状态,为新增租户分配服务资源;
当云平台空闲服务资源充足,且能满足当前新增租户需求时,服务资源分配模块为新增租户分配独占资源。
若云平台空闲服务资源不足以满足当前新增租户独占需求时,服务资源分配模块根据所有活动租户已分配独占资源的空闲情况,将当前新增租户按等级优先级次序放入空闲资源请求使用队列;
步骤3:云平台运行过程中,由服务资源监测模块实时监测所有活动租户的实时需求,以及云平台当前运行状态,并由云平台日志登记与回滚模块实时记录平台运行状态到日志文件;
步骤4:当租户实时需求发生改变时,包括租户实时需求提升或降低,由服务资源调节模块结合云平台运行状态调整租户服务资源;
步骤5:当有租户退出或维持云平台运行保障性资源触发临界值时,由服务资源回收模块收回服务资源;
当云平台运行保障性资源触发临界值时,依租户优先级逆序回收部分或全部租户的独占部分服务资源;租户服务资源回收后,应保证其基本服务需求,对租户服务资源的回收量,以维持云平台基本运行保障为判别依据;
步骤6:当不可拒外力引起云服务平台崩溃时,云平台日志登记与回滚模块根据日志文件重启并回滚崩溃前的租户任务。
采用上述技术方案所产生的有益效果在于:本发明提供的一种多租户服务资源的智能管理系统及方法,实现对云平台基础设施、平台使用权、软件运行权等服务资源的动态实时管理。为租户提供个性化服务的同时,应用该方法能够提升云平台服务性能。
附图说明
图1为本发明实施例提供的科技资源云平台的示意图;
图2为本发明实施例提供的多租户云平台服务资源智能管理的系统框架示意图;
图3为本发明实施例提供的一种多租户服务资源的智能管理系统的结构框图;
图4为本发明实施例提供的一种多租户服务资源的智能管理方法的流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例以如图1所示的科技资源云平台为例,使用本发明的一种多租户服务资源的智能管理系统及方法对该云平台进行智能管理。
长期的科研积累,不同学术组织、机构、团队积累了文献资源、算法工具、软件平台等多种资源。但是这些资源之间,特别是不同组织、不同机构、不同团队之间的资源基本处于完全孤立状态。因此,构建如图1所示的科技资源云平台显得十分必要。对该科技资源云平台有服务需求的租户包括:科研人员、学生、针对特定需求的软件开发人员等。
本发明实施例中,多租户云平台服务资源智能管理的系统框架如图2所示。该系统框架包括:资源实体层、资源管理层、多租户应用层三个层次。其中,资源实体层对应科技云平台的软硬件资源,多租户应用层对应应用该科技云平台的多个租户,资源管理层的功能由本发明提出的多租户云平台服务资源智能管理系统及方法实现。
一种多租户服务资源的智能管理系统,如图3所示,包括服务资源登记模块、服务资源分配模块、服务资源监测模块、服务资源预测模块、服务资源调节模块、服务资源回收模块以及云平台日志登记与回滚模块;
所述服务资源登记模块,用于云平台初始启动时依据平台的物理性及非物理性可用服务资源的数量,对云平台服务资源的标识变量进行初始化;
所述云平台服务资源的标识变量中存储的是当前云平台对应服务资源的可用余量,服务资源标识变量在云平台运行过程中其数量值随着租户数量及其需求的变化而动态改变。
云平台的物理性资源,包括存储空间、内存、处理器核心,其预设规模分别为S、M、C。非物理性资源包括云平台中软件平台和软件工具;云平台中软件平台使用权由二元组<Sid,SN>表示,其中,Sid代表软件平台标识,SN代表软件平台授权总数。云平台中软件工具使用权由二元组<Tid,TN>表示,其中,Tid代表软件工具标识,TN代表软件工具授权总数。
所述服务资源分配模块,用于当云平台有新增租户时,为新增租户分配满足其需求的服务资源;同时,服务资源分配模块为新增租户分配满足其需求的服务资源时,还需考虑新增租户的服务资源优先级及云平台服务资源使用情况;当云平台有新增租户时,根据其付费情况将其划分为不同等级,等级越高对同一资源的优先占用或使用权更高;
本实施例中,根据租户服务需求及付费情况将其划分为试用租户l1、普通租户l2、VIP租户l3、超级租户l4、管理租户l5五个等级,其对同一资源的优先使用权依次增高。每个租户有一个云平台全局唯一的标识Uid
租户服务需求是一个由租户全局唯一标识Uid、租户服务等级U_level、存储空间Us、内存大小Um、计算能力Uc、软件平台使用权Up、软件运行权Uo构成的七元组UR=<Uid,U_level,Us,Um,Uc,Up,Uo>。具体地,Us、Um、Uc是标量分别对应需求的以GB为单位的存储空间大小、以MB为单位的内存大小、处理核心个数;Up与Uo是由布尔型值构成的向量,其长度与软件平台数目、软件工具要求数目相等。租户对软件平台或软件工具有需求时对应位置的布尔值为1,否则为0。特别地,若云平台可提供服务的软件平台数目、软件工具数目发生改变时,布尔型向量Up与Uo长度对应更新。
云平台当前运行状态是一个六元组PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>,代表其所提供服务的资源的使用情况。
其中:Ps_list表用于记录以GB为单位的存储空间的使用情况。其结点Ps是以GB为单位的存储空间的使用情况构成的四元组Ps=<Ps_id,Ps_sgn,Ps_uid,Ps_ulist>。Ps_id是当前存储空间的标号,Ps_sgn是当前存储空间是否被占用标识,Ps_ulist当前存储空间潜在租户列表。当Ps_sgn=1时,表示当前存储空间被租户Ps_uid占用,Ps_ulist为空;当Ps_sgn=0时,表示当前存储空间空闲,Ps_ulist中存储的是对当前存储空间有使用需求的潜在租户列表;具体地,服务资源分配模块将当前结点对应的存储空间分配给当前存储空间潜在租户列表Ps_ulist中的某一租户时,Ps_sgn由0变为1,Ps_uid赋值为该租户标识,并将该租户从租户列表Ps_ulist中移除;当服务资回收模块将结点对应的存储空间收回时,Ps_sgn由1变为0,服务资源分配模块后续对存储空间有需求的租户标识Uid放入潜在租户列表。
Pm_list用于记录以MB为单位的内存空间的使用情况。其结点Pm是以MB为单位的内存空间的使用情况构成的四元组Pm=<Pm_id,Pm_sgn,Pm_uid,Pm_ulist>。Pm_id是当前内存空间的标号,Pm_sgn是当前内存空间是否被占用标识,Pm_ulist当前内存空间潜在租户列表。当Pm_sgn=1时,表示当前内存空间被租户Pm_uid占用,Pm_ulist为空。当Pm_sgn=0时,表示当前内存空间空闲,Pm_ulist中存储的是对当前内存空间有使用需求的潜在租户列表;具体地,服务资源分配模块将当前结点对应的内存空间分配给当前内存空间潜在租户列表Pm_ulist中的某一租户时,Pm_sgn由0变为1,Pm_uid赋值为该租户标识,并将该租户从租户列表Pm_ulist中移除;服务资源回收模块将结点对应的内存空间收回时,Pm_sgn由1变为0,服务资源分配模块后续对内存空间有需求的租户标识Uid放入潜在租户列表。
Pc是以单个处理器核心为单位的计算资源使用情况构成的四元组Pc=<Pc_id,Pc_sgn,Pc_uid,Pc_ulist>。Pc_id是当前处理器核心的标号,Pc_sgn是当前处理器核心是否被占用标识,Pc_ulist当前处理器核心潜在租户列表。当Pc_sgn=1时,表示当前处理器核心被租户Pc_uid占用,Pc_ulist为空。当Pc_sgn=0时,表示当前处理器核心空闲,Pc_ulist中存储的是对当前处理器核心有使用需求的潜在租户列表;具体地,服务资源分配模块将当前结点对应的处理器核心分配给当前处理器核心潜在租户列表Pc_ulist中的某一租户时,Pc_sgn由0变为1,Pc_uid赋值为该租户标识,并将该租户从租户列表Pc_ulist中移除;服务资源回收模块将结点对应的处理器核心收回时,Pc_sgn由1变为0,服务资源分配模块后续对处理器核心有需求的租户标识Uid放入潜在租户列表。
Pp是以单个软件平台为单位的软件平台资源使用情况构成的四元组Pp=<Pp_id,Pp_sgn,Pp_uid_list,Pp_ulist>。Pp_id是当前软件平台的标号,Pp_sgn是当前软件平台使用权是否被占用标识,Pp_ulist当前软件平台使用权潜在租户列表。当Pp_sgn=1时,表示当前软件平台使用权被租户表Pp_uid_list中的租户占用。当软件平台使用权全部被占用时,Ps_ulist为空。Pp_sgn=0时,表示当前软件平台空闲,Pp_ulist中存储的是对当前软件平台有使用需求的潜在租户列表;具体地,服务资源分配模块将当前结点对应的软件平台使用授权分配给当前软件平台潜在租户列表Pp_ulist中的某一租户时,Pp_sgn由0变为1,将该租户标识加入Pp_uid_list表,并将该租户从租户列表Pp_ulist中移除;服务资源回收模块将结点对应的软件平台使用授权从租户Uid收回时,删除Pp_uid_list表中对应的租户标识。若删除后Pp_uid_list为空,Pp_sgn由1变为0,服务资源分配模块后续对软件平台使用权有需求的租户标识Uid放入潜在租户列表。
Po是以单个软件工具为单位的软件工具资源使用情况构成的四元组Po=<Po_id,Po_sgn,Po_uid_list,Po_ulist>。其中,Po_id是当前软件工具的标号,Po_sgn是当前软件工具使用权是否被占用标识,Po_ulist是当前软件工具使用权潜在租户列表。当Po_sgn=1时,表示当前算法工具使用权被租户表Po_uid_list中的租户占用;当软件平台使用权全部被占用时,Po_ulist为空。当Po_sgn=0时,表示当前算法工具空闲,Po_ulist中存储的是对当前算法工具有使用需求的潜在租户列表;具体地,服务资源分配模块将当前结点对应的软件工具使用授权分配给当前软件平台潜在租户列表Po_ulist中的某一租户时,Po_sgn由0变为1,将该租户标识加入Po_uid_list表,并将该租户从租户列表Po_ulist中移除;服务资源回收模块将结点对应的算法工具使用授权从租户Uid收回时,删除Po_uid_list表中对应的租户标识。若删除后Po_uid_list为空,Po_sgn由1变为0,服务资源分配模块续对算法工具使用权有需求的租户标识Uid放入潜在租户列表。
所述服务资源监测模块,用于监测所有活动租户的实时需求,以及云平台当前运行状态,并将监测结果写入云平台的日志记录文件;服务资源监测模块每隔一定时间间隔将监测结果写入云平台的日志记录文件;所述活动租户的实时需求具体为当前租户实际正在使用的资源情况;所述云平台当前运行状态,包括云平台资源余量、由所述服务资源分配模块已完成分配的资源的占用情况及新增租户的排队数据。
本实施例中,云平台运行过程中,由服务资源监测模块实时监测所有活动租户的实时需求,更新UR=<Uid,U_level,Us,Um,Uc,Up,Uo>。云平台运行过程中,服务资源监测模块每隔S_inter秒将资源信息、租户服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>、云平台运行状态信息PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>写入日志文件F。
所述服务资源预测模块,用于根据租户服务资源历史使用数据,构造租户服务资源使用曲线,提前估计出租户对服务资源的实时需求;
所述租户服务资源历史使用数据,包括云平台所能提供的、被租户所独占,以及正在排队申请使用的物理资源和非物理资源;所述租户服务资源历史使用数据以一定时间间隔为单位,所述服务资源预测模块对租户服务资源的实时需求预测也是以同样时间间隔为单位;
所述租户服务资源使用曲线由服务资源历史使用数据,采用无监督学习方法发现服务资源历史使用规律;所述构造的租户服务资源使用曲线,针对单一租户或针对同等服务资源需求水平等级的多租户或针对二者的结合。
本实施例中,服务资源预测模块,用于根据科技资源云平台租户历史服务资源使用情况监测数据,即由租户服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>构成的集合,由无监督线性回归方法,针对存储空间、内存、处理器核心个数、软件平台使用权限、软件法工具使用权限分别构造科技资源云平台租户服务资源使用曲线。依据曲线走势,估计租户对科技资源云平台所能提供服务的实时存储空间、内存、处理器核心个数、软件平台使用权限、软件工具使用权限需求。本实施例中,租户服务资源历史使用情况监测数据包括科技资源云平台所提供的、被租户独占的,以及租户排队申请使用的存储空间、内存、处理器核心个数、软件平台使用权限、软件工具使用权限。
所述服务资源调节模块,用于当租户实时需求发生改变时,结合云平台运行状态调整租户服务资源使用情况;所述服务资源调节模块根据云平台空闲可用服务资源余量进行操作;
所述租户实时需求为确实存在的租户对资源服务需求提出的明确改变,或服务资源预测模块根据租户服务资源历史使用规律实时预测的结果;
所述调整租户服务资源使用情况,包括分配更多地服务资源,回收部分已分配服务资源;
本实施例中,当服务资源预测模块预测到科技资源云平台租户实时需求发生改变或者该租户原始需求发生改变时,服务资源调节模块实时调整该租户的科技资源云平台服务资源。若是核减对应租户科技资源云平台服务资源数量,直接更新租户服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>、科技资源云平台的运行状态PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>、服务资源余量S、M、C、<Sid,SN>、<Tid,TN>。若对应租户科技资源云平台服务资源需求增加,且云平台空闲服务资源不足以满足当前新增租户独占需求时,服务资源分配模块根据所有活动租户已分配独占资源的空闲情况,将当前新增租户按等级优先级次序放入空闲资源请求使用队列,更新租户服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>、科技资源云平台的运行状态PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>、服务资源余量S、M、C、<Sid,SN>、<Tid,TN>。
所述服务资源回收模块,用于当有租户退出或维持云平台运行的保障性资源触发临界值时,将已分配给租户的全部服务资源或部分服务资源收回;
所述维持云平台运行的保障性资源在对云平台服务资源的标识变量进行初始化时,由服务资源登记模块预留;
本实施例中,当有租户退出或维持科技资源云平台运行保障性资源触发临界值时,服务资源回收模块依租户优先级逆序回收部分或全部租户的独占且当前空间部分服务资源。租户服务资源回收后,应保证其基本服务需求。租户服务资源的回收量,以维持云服务平台基本运行保障为判别依据。更新租户服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>、科技资源云平台的运行状态PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>、服务资源余量S、M、C、<Sid,SN>、<Tid,TN>。
所述云平台日志登记与回滚模块,用于在云平台运行过程中,实时记录云平台运行状态到日志记录文件,以及当不可拒外力引起云平台崩溃时,根据日志记录文件重启云平台并回滚崩溃前的租户任务。
所述实时记录平台运行状态,每间隔特定时间段进行一次;所述回滚崩溃前的租户任务,需要云平台重启后,云平台日志登记与回滚模块正常运行时完成。
本实施例中,云平台运行过程中,云平台日志登记与回滚模块每隔10分钟实时记录科技资源云平台各租户服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>、科技资源云平台的运行状态PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>、服务资源余量S、M、C、<Sid,SN>、<Tid,TN>到日志文件,以及当不可拒外力引起科技资源云服务平台崩溃重启时,根据日志文件记录的服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>、科技资源云平台的运行状态PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>、服务资源余量S、M、C、<Sid,SN>、<Tid,TN>重启并回滚崩溃前的租户任务。
一种多租户服务资源的智能管理方法,如图4所示,包括以下步骤:
步骤1:云平台初始启动时,根据其物理性非物理性服务资源规模,由服务资源登记模块初始化云平台可用资源数量;
本实施例中,当科技资源云平台启动时,服务资源登记模块依据云平台可用存储空间、内存、处理器核心个数,以及软件平台、软件工具授权许可数目,对云平台服务资源对应变量,S、M、C、<Sid,SN>、<Tid,TN>进行初始赋值。
步骤2:当有新增租户时,服务资源分配模块结合新增租户等级、具体需求、其他当前相似租户的服务需求、以及云平台当前运行状态,为新增租户分配服务资源;
当云平台空闲服务资源充足,且能满足当前新增租户服务需求时,服务资源分配模块为新增租户分配独占资源。
若云平台空闲服务资源不足以满足当前新增租户独占需求时,服务资源分配模块根据所有活动租户已分配独占资源的空闲情况,将当前新增租户按等级优先级次序放入空闲资源请求使用队列;
本实施例中,当科技资源云平台有新增租户时,服务资源分配模块根据其付费情况将租户划分为不同等级,将新增租户服务需求写入服务需求七元组UR=<Uid,U_level,Us,Um,Uc,Up,Uo>。将新增用户服务需求与当科技资源云平台资源余量S、M、C、<Sid,SN>、<Tid,TN>依次比较,若后者充足,且能满足新增租户需求,则为其分配独占服务资源,更新S、M、C、<Sid,SN>、<Tid,TN>,以及科技资源云平台当前运行状态PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>。若当科技资源云平台资源余量不足以满足新增租户独占需求,服务资源分配模块将依据已分配活动租户独占资源的空闲情况,将当前新增租户按优先级次序放入对应资源的请求使用队列,并更新科技资源云平台当前运行状态PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>。
步骤3:云平台运行过程中,由服务资源监测模块实时监测所有活动租户的实时需求,以及云平台当前运行状态,并由云平台日志登记与回滚模块实时记录平台运行状态到日志文件;
本实施例中,在云平台运行过程中,服务资源监测模块监测科技资源云平台所有活动用户的所需求服务资源的实际使用情况,以及科技资源云平台的运行状态PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>、服务资源余量S、M、C、<Sid,SN>、<Tid,TN>、租户服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>,并每隔10分钟将监测结果写入日志文件F。
步骤4:当租户实时需求发生改变时,包括租户实时需求提升或降低,由服务资源调节模块结合云平台运行状态调整租户服务资源;
当租户实时需求发生改变时,服务资源调节模块结合云平台运行状态PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>调整租户服务资源;
步骤5:当有租户退出或维持云平台运行保障性资源触发临界值时,由服务资源回收模块收回服务资源;
当云平台运行保障性资源触发临界值时,依租户优先级逆序回收部分或全部租户的独占部分服务资源;租户服务资源回收后,应保证其基本服务需求,对租户服务资源的回收量,以维持云平台基本运行保障为判别依据;
本实施例中,当租户退出Uid时,由服务资源回收模块收回服务资源,删除退出租户的服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>,更新云平台运行状态信息PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>,更新存储空间S、内存M、处理器核心个数C、软件平台使用权二元组<Sid,SN>和软件工具使用权二元组<Tid,TN>。
当维持云平台运行保障性资源触发临界值时,由服务资源回收模块收回服务资源,更新租户实时服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>、云平台运行状态信息PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>,更新存储空间S、内存M、处理器核心个数C、软件平台使用权二元组<Sid,SN>和软件工具使用权二元组<Tid,TN>。
步骤6:当不可拒外力引起云服务平台崩溃时,云平台日志登记与回滚模块根据日志文件重启并回滚崩溃前的租户任务。
本实施例中,当不可拒外力引起云服务平台崩溃时,根据日志文件重启并回滚崩溃前的租户任务。回滚数量包括:存储空间S、内存M、处理器核心个数C、软件平台使用权二元组<Sid,SN>、软件工具使用权二元组<Tid,TN>、租户服务需求UR=<Uid,U_level,Us,Um,Uc,Up,Uo>及云平台运行状态信息PR=<Ps_list,Pm_list,Pc_list,Pp_list,Po_list,Pu>。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (7)

1.一种多租户服务资源的智能管理系统,其特征在于:包括服务资源登记模块、服务资源分配模块、服务资源监测模块、服务资源预测模块、服务资源调节模块、服务资源回收模块以及云平台日志登记与回滚模块;
所述服务资源登记模块,用于云平台初始启动时依据平台的物理性及非物理性可用服务资源的数量,对云平台服务资源的标识变量进行初始化;所述云平台服务资源的标识变量中存储的是当前云平台对应服务资源的可用余量,服务资源标识变量在云平台运行过程中其数量值随着租户数量及其需求的变化而动态改变;所述云平台的物理性资源,包括存储空间、内存、处理器核心,其预设规模分别为S、M、C;非物理性资源包括云平台中软件平台和软件工具;云平台中软件平台使用权由二元组<Sid,SN>表示,其中,Sid代表软件平台标识,SN代表软件平台授权总数;云平台中软件工具使用权由二元组<Tid,TN>表示,其中,Tid代表软件工具标识,TN代表软件工具授权总数;
所述服务资源分配模块,用于当云平台有新增租户时,为新增租户分配满足其需求的服务资源;
所述服务资源监测模块,用于监测所有活动租户的实时需求,以及云平台当前运行状态,并将监测结果写入云平台的日志记录文件;
所述服务资源预测模块,用于根据租户服务资源历史使用数据,构造租户服务资源使用曲线,提前估计出租户对服务资源的实时需求;所述租户服务资源历史使用数据,包括云平台所能提供的、被租户所独占,以及正在排队申请使用的物理资源和非物理资源;所述租户服务资源历史使用数据以一定时间间隔为单位,服务资源预测模块对租户服务资源的实时需求预测也是以同样时间间隔为单位;
所述租户服务资源使用曲线由服务资源历史使用数据,采用聚类拟合算法得到服务资源历史使用规律;
所述构造的租户服务资源使用曲线,针对单一租户或针对同等服务资源需求水平等级的多租户或针对二者的结合;
所述服务资源调节模块,用于当租户实时需求发生改变时,结合云平台运行状态调整租户服务资源使用情况;
所述服务资源回收模块,用于当有租户退出或维持云平台运行的保障性资源触发临界值时,将已分配给租户的全部服务资源或部分服务资源收回;
所述云平台日志登记与回滚模块,用于在云平台运行过程中,实时记录云平台运行状态到日志记录文件,以及当不可拒外力引起云平台崩溃时,根据日志记录文件重启云平台并回滚崩溃前的租户任务。
2.根据权利要求1所述的一种多租户服务资源的智能管理系统,其特征在于:当云平台有新增租户时,服务资源分配模块根据其付费情况将其划分为不同等级,等级越高对同一资源的优先占用或使用权更高;所述服务资源分配模块为新增租户分配满足其需求的服务资源时,还需考虑新增租户的服务资源优先级及云平台服务资源使用情况。
3.根据权利要求1所述的一种多租户服务资源的智能管理系统,其特征在于:所述服务资源监测模块每隔一定时间间隔将监测结果写入云平台的日志记录文件;所述服务资源监测模块监测的活动租户的实时需求具体为当前租户实际正在使用的资源情况;所述云平台当前运行状态,包括云平台资源余量、由所述服务资源分配模块已完成分配的资源的占用情况及新增租户的排队数据。
4.根据权利要求1所述的一种多租户服务资源的智能管理系统,其特征在于:所述调整租户服务资源使用情况,包括分配更多地服务资源,回收部分已分配服务资源;
所述租户实时需求为确实存在的租户对资源服务需求提出的明确改变,或服务资源预测模块根据租户服务资源历史使用规律实时预测的结果;
所述服务资源调节模块根据云平台空闲可用服务资源余量进行操作。
5.根据权利要求1所述的一种多租户服务资源的智能管理系统,其特征在于:所述维持云平台运行的保障性资源在对云平台服务资源的标识变量进行初始化时,由服务资源登记模块预留。
6.根据权利要求1所述的一种多租户服务资源的智能管理系统,其特征在于:实时记录平台运行状态,每间隔特定时间段进行一次;所述回滚崩溃前的租户任务,需要云平台重启后,云平台日志登记与回滚模块正常运行时完成。
7.一种多租户服务资源的智能管理方法,采用权利要求1所述智能管理系统实现,其特征在于:包括以下步骤:
步骤1:云平台初始启动时,根据其物理性非物理性服务资源规模,由服务资源登记模块初始化云平台可用资源数量;
步骤2:当有新增租户时,服务资源分配模块结合新增租户等级、具体需求、其他当前相似租户的服务需求、以及云平台当前运行状态,为新增租户分配服务资源;
当云平台空闲服务资源充足,且能满足当前新增租户需求时,服务资源分配模块为新增租户分配独占资源;
若云平台空闲服务资源不足以满足当前新增租户独占需求时,服务资源分配模块根据所有活动租户已分配独占资源的空闲情况,将当前新增租户按等级优先级次序放入空闲资源请求使用队列;
步骤3:云平台运行过程中,由服务资源监测模块实时监测所有活动租户的实时需求,以及云平台当前运行状态,并由云平台日志登记与回滚模块实时记录平台运行状态到日志文件;
步骤4:当租户实时需求发生改变时,包括租户实时需求提升或降低,由服务资源调节模块结合云平台运行状态调整租户服务资源;
步骤5:当有租户退出或维持云平台运行保障性资源触发临界值时,由服务资源回收模块收回服务资源;
当云平台运行保障性资源触发临界值时,依租户优先级逆序回收部分或全部租户的独占部分服务资源;租户服务资源回收后,应保证其基本服务需求,对租户服务资源的回收量,以维持云平台基本运行保障为判别依据;
步骤6:当不可拒外力引起云服务平台崩溃时,云平台日志登记与回滚模块根据日志文件重启并回滚崩溃前的租户任务。
CN201911354225.6A 2019-12-25 2019-12-25 一种多租户服务资源的智能管理系统及方法 Active CN111104226B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911354225.6A CN111104226B (zh) 2019-12-25 2019-12-25 一种多租户服务资源的智能管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911354225.6A CN111104226B (zh) 2019-12-25 2019-12-25 一种多租户服务资源的智能管理系统及方法

Publications (2)

Publication Number Publication Date
CN111104226A CN111104226A (zh) 2020-05-05
CN111104226B true CN111104226B (zh) 2024-01-26

Family

ID=70424498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911354225.6A Active CN111104226B (zh) 2019-12-25 2019-12-25 一种多租户服务资源的智能管理系统及方法

Country Status (1)

Country Link
CN (1) CN111104226B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111741097B (zh) * 2020-06-15 2021-04-02 星环信息科技(上海)股份有限公司 一种租户独占节点的方法、计算机设备及存储介质
CN111988412A (zh) * 2020-08-25 2020-11-24 东北大学 一种多租户服务资源需求智能预测系统及方法
CN112311804B (zh) * 2020-11-06 2021-08-24 东北大学 一种多租户服务资源动态访问授权与认证系统及方法
CN115617468A (zh) * 2021-07-14 2023-01-17 华为技术有限公司 一种租户的资源管理方法及租户管理系统
CN115145736B (zh) * 2022-09-05 2022-12-06 中国人寿保险股份有限公司上海数据中心 基于Spark分布式计算的云平台配额智能分配系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391777A (zh) * 2014-11-12 2015-03-04 中标软件有限公司 基于Linux操作系统的云平台及其运行监控方法和装置
CN107357688A (zh) * 2017-07-28 2017-11-17 广东神马搜索科技有限公司 分布式系统及其故障恢复方法和装置
CN107404523A (zh) * 2017-07-21 2017-11-28 中国石油大学(华东) 云平台自适应资源调度系统和方法
CN108055292A (zh) * 2017-10-30 2018-05-18 中国人民解放军空军工程大学 一种虚拟机向物理机映射的优化方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10476938B2 (en) * 2014-01-21 2019-11-12 Oracle International Corporation System and method for multitenancy store in a multitenant application server environment
US9912529B2 (en) * 2014-08-20 2018-03-06 International Business Machines Corporation Tenant-specific log for events related to a cloud-based service

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391777A (zh) * 2014-11-12 2015-03-04 中标软件有限公司 基于Linux操作系统的云平台及其运行监控方法和装置
CN107404523A (zh) * 2017-07-21 2017-11-28 中国石油大学(华东) 云平台自适应资源调度系统和方法
CN107357688A (zh) * 2017-07-28 2017-11-17 广东神马搜索科技有限公司 分布式系统及其故障恢复方法和装置
CN108055292A (zh) * 2017-10-30 2018-05-18 中国人民解放军空军工程大学 一种虚拟机向物理机映射的优化方法

Also Published As

Publication number Publication date
CN111104226A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN111104226B (zh) 一种多租户服务资源的智能管理系统及方法
US20210081383A1 (en) Lifecycle support for storage objects
Peng et al. Optimus: an efficient dynamic resource scheduler for deep learning clusters
US10831387B1 (en) Snapshot reservations in a distributed storage system
Harlap et al. Proteus: agile ml elasticity through tiered reliability in dynamic resource markets
US11880712B1 (en) Resource tolerations and taints
US9355060B1 (en) Storage service lifecycle policy transition management
US8892780B2 (en) Management of shared storage I/O resources
US9727522B1 (en) Multi-tenant storage service object lifecycle management using transition job objects
CN102708067B (zh) 组合具有相同内容的存储器页面
US7716177B2 (en) Proactive space allocation in a database system
US10817380B2 (en) Implementing affinity and anti-affinity constraints in a bundled application
Ahn et al. Improving {I/O} Resource Sharing of Linux Cgroup for {NVMe}{SSDs} on Multi-core Systems
US20100274762A1 (en) Dynamic placement of replica data
CN110888714A (zh) 容器的调度方法、装置和计算机可读存储介质
US11194815B1 (en) Constrained query execution
CN1906598B (zh) 信息处理设备及存储区管理方法
US9274847B2 (en) Resource management platform
US12008266B2 (en) Efficient read by reconstruction
CA2912691C (en) Input-output prioritization for database workload
US11449241B2 (en) Customizable lock management for distributed resources
WO2022164490A1 (en) Optimizing storage device access based on latency
US20140115599A1 (en) Submitting operations to a shared resource based on busy-to-success ratios
CN116909739A (zh) 一种Kubernetes集群中资源超分提升资源利用率的方法及系统
US20200364211A1 (en) Predictive database index modification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant