CN104683406A - 云端系统 - Google Patents

云端系统 Download PDF

Info

Publication number
CN104683406A
CN104683406A CN201310629903.1A CN201310629903A CN104683406A CN 104683406 A CN104683406 A CN 104683406A CN 201310629903 A CN201310629903 A CN 201310629903A CN 104683406 A CN104683406 A CN 104683406A
Authority
CN
China
Prior art keywords
resource
module
control module
unit
clouds
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310629903.1A
Other languages
English (en)
Inventor
卢盈志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Pudong Technology Corp
Inventec Corp
Original Assignee
Inventec Pudong Technology Corp
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Pudong Technology Corp, Inventec Corp filed Critical Inventec Pudong Technology Corp
Priority to CN201310629903.1A priority Critical patent/CN104683406A/zh
Priority to US14/246,929 priority patent/US20150156095A1/en
Publication of CN104683406A publication Critical patent/CN104683406A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0895Configuration of virtualised networks or elements, e.g. virtualised network function or OpenFlow elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0833Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability for reduction of network energy consumption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0836Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/78Architectures of resource allocation
    • H04L47/781Centralised allocation of resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/501Performance criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Mathematical Physics (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)

Abstract

依据本发明的一种云端系统包含资源模块、控制模块与监控模块。资源模块用以提供云端资源。控制模块,电性连接至资源模块,用以依据测量参数与资源请求指令控制资源模块调整云端资源。监控模块,分别电性连接至资源模块与控制模块,用以检测资源模块以产生前述测量参数。云端系统可以更包含环境模块及/或电源模块。电源模块可以受控于控制模块而对资源模块中的一个或多个单元提供电能。而环境模块可以监测及控制一个或多个环境测量参数。而控制模块可以更依据环境测量参数控制资源模块调整云端资源。

Description

云端系统
技术领域
本发明关于一种云端系统,特别关于一种能依需求自动调整提供服务的装置数量与电源消耗的云端系统。
背景技术
随着资讯科技高速发展的时代,企业电子化已成为了一种趋势,使得一般的个人电脑已不能满足企业于商场上的需求。因此,便有具有高运算功能的服务器诞生,以满足现今各企业进行电子化的需求。并且,随着市场的需要,单一服务器已逐渐发展成具有多个单一服务器的大型的服务器系统(例如机柜式数据中心﹔Container Data Center)。并且每一个单一服务器的主机将被放置于一机架系统中,由系统管理终端透过机架系统内的机架管理控制器来统一管理﹐再者在机柜式数据中心的服务器系统中则另有一机柜管理控制器用来统一管理所有机柜内的所有机架管理控制器。
因此,如何调配与控制多个服务器中被致能来提供服务的服务器的数量以提高资源使用率是一个待解决的问题。
发明内容
有鉴于以上的问题,本发明提出一种云端系统,可以依据资源请求指令控制所提供云端资源的量,以达成节能的效果。同时可以使用判断当前或一定时间内云端资源的量是否足以供应可能收到的资源请求指令的需求。
依据本发明一实施例的一种云端系统包含资源模块、控制模块与监控模块。资源模块用以提供云端资源。控制模块,电性连接至资源模块,用以依据测量参数(Metrics Parameters)与资源请求指令控制资源模块调整云端资源。监控模块,分别电性连接至资源模块与控制模块,用以检测资源模块以产生前述测量参数。
于本发明一个或多个实施例中,该控制模块依据该测量参数决定该云端资源是否满足该资源请求指令,以控制该资源模块调整该云端资源。
于本发明一个或多个实施例中,该资源模块包含:多个运算单元,电性连接至该控制模块,每一该运算单元用以在被致能时提供一运算资源;多个储存单元,电性连接至该控制模块,每一该储存单元用以在被致能时提供一储存资源;以及多个通讯单元,电性连接至该控制模块,每一该通讯单元用以在被致能时提供一通讯资源;其中,该云端资源包含该运算资源、该储存资源与该通讯资源。
于本发明一个或多个实施例中,该控制模块在该云端资源不满足该资源请求指令时,调整该资源模块中该些运算单元、该些储存单元与该些通信单元被致能的数量,以使该云端资源满足该资源请求指令。
于本发明一个或多个实施例中,该控制模块更将该资源模块中该些运算单元、该些储存单元与该些通信单元被致能的数量与该资源请求指令的关系纪录为一资源对照表。
于本发明一个或多个实施例中,该控制模块更依据该资源对照表决定在一预设时间后该云端资源是否满足该资源请求指令。
于本发明一个或多个实施例中,还包含一电源模块,分别电性连接至该资源模块与该控制模块,该电源模块包含:多个电源单元,每一该电源单元分别电性连接至由该些运算单元、该些储存单元与该些通讯单元所组成的群组其中至少之一与该控制模块,用以受控于该控制模块以提供电源。
于本发明一个或多个实施例中,该控制模块更依据该资源模块中该些运算单元、该些储存单元与该些通信单元被致能的数量决定控制该些电源单元中用以提供电源的该电源单元的数量。
于本发明一个或多个实施例中,还包含一环境模块,电性连接至该控制模块,用以监测及控制一个或多个环境测量参数,该控制模块更依据该环境测量参数控制该资源模块调整该云端资源。
于本发明一个或多个实施例中,该资源模块、该控制模块与该监控模块其中至少之一运行于一运算装置的一常驻程序。
依据本发明的云端系统可以包含资源模块、控制模块与监控模块。依据监控模块所得到的资源模块测量参数,控制模块可以判断资源模块所提供的云端资源是否可以满足一个资源请求指令。控制模块也可以根据前述数据判断并避免瓶颈事件(也就是云端资源无法满足资源请求指令)与故障事件发生。
以上的关于本发明内容的说明及以下的实施方式的说明用以示范与解释本发明的精神与原理,并且提供本发明的专利申请范围更进一步的解释。
附图说明
图1为依据本发明一实施例的云端系统功能方块图;
图2A为依据本发明一实施例的控制模块功能方块图;
图2B为依据本发明一实施例的自动云端提供模块功能方块图;
图2C为依据本发明一实施例的云端服务提供模块功能方块图;
图2D为依据本发明一实施例中的虚拟资源提供模块功能方块图;
图3为依据本发明一实施例的监控模块功能方块图。
其中,附图标记:
1    云端系统              11   资源模块
13   控制模块              131  自动云端提供模块
1311 节点自动检测单元      1312 节点提供单元
1313 节点管理单元          1314 最小云端配置单元
1315 动态云端配置单元      1316 实体系统配置单元
1317 逻辑系统结构单元      132  云端服务提供模块
1321 识别建立单元          1322 云端服务计算单元
1323 虚拟机映像单元        1324 虚拟机容量单元
1325 虚拟机映像数据库      1326 云端系统网络单元
133  虚拟资源提供模块      1331 虚拟资源配置单元
1333 虚拟负载平衡单元      1335 虚拟机配置单元
1337 虚拟资源调节单元      1339 虚拟机管理单元
134  虚拟机转换模块        135  服务终止模块
136  错误控制模块          137  瓶颈控制模块
138  维护控制模块          139  电源管理模块
13A  资源使用最佳化模块    15   监控模块
151  实体效能测量监控单元  152  虚拟效能测量监控单元
153  即时服务监控单元      154  实体节点监控单元
155  实体网络设备监控单元  156  一般监控单元
17   电源模块              19   环境模块
具体实施方式
以下在实施方式中详细叙述本发明的详细特征以及优点,其内容足以使任何本领域技术人员了解本发明的技术内容并据以实施,且根据本说明书所揭露的内容、申请专利范围及附图,任何本领域技术人员可轻易地理解本发明相关的目的及优点。以下的实施例进一步详细说明本发明的观点,但非以任何观点限制本发明的范畴。
关于本发明一实施例中的云端系统,请参考图1,其依据本发明一实施例的云端系统功能方块图。如图1所示,云端系统1包含资源模块11、控制模块13以及监控模块15。三个模块彼此互相电性连接。
资源模块11用以提供云端资源。举例来说,云端资源可以包含运算资源、储存资源以及通信资源。在实体装置上,资源模块11可以包含一个或多个运算单元、一个或多个储存单元与一个或多个通信单元。每个运算单元可以提供一定的运算资源,所谓运算资源可以用“每秒多少个指令”来衡量。每个储存单元可以提供一定的储存资源,所谓的储存资源可以用“几百万个位元组”(million byte,MB)或者类似的衡量单位来衡量。每个通信单元可以提供一定的通信资源,所谓的通信资源可以用“每秒几千个位元组的传输量”(kilo-Byte persecond,kBps)来衡量。
更明确地说,运算单元可以是特殊应用集成电路(application-specificintegrated circuit,ASIC)、进阶精简指令集机器(advanced RISC machine,ARM)、中央处理单元(central processing unit,CPU)、单芯片控制器或其他包含前述元件的设备,本实施例在此不加以限制。储存单元可以是闪存(flash memory)、硬盘、电子抹除式可复写唯读存储器或其他包含前述多种元件的电子装置,并不以此实施例为限。
更进一步,于本发明一实施例中,运算单元、储存单元与通信单元更分别被分为不同的多种单元。举例来说,运算单元可以被细分为浮点运算单元、算术逻辑单元甚至是专用于坐标转换或是图形运算的运算单元。而储存单元可以被细分为读写速度较慢的非挥发性储存单元(例如硬盘与闪存)与读写速度较快的挥发性储存单元(静态随机存取存储器与动态随机存取存储器)。
于另一实施例中,资源模块11中的多个单元中的每个单元都可以提供不只一种资源。举例来说,第一个单元可以同时提供每秒一百万次浮点运算、五兆位元组的非挥发性存储器与二十亿位元组的挥发性存储器,而第二个单元可以同时提供每秒八十万次浮点运算、十万次整数运算、两兆位元组的非挥发性存储器与三十亿位元组的挥发性存储器。假设第一个单元与第二个单元所消耗的能源(例如消耗的功率)相同,当需要浮点运算时会优先选择第一个单元,而当需要整数运算时会优先选择第二个单元。
控制模块13用以依据测量参数(Metrics Parameters)与资源请求指令控制资源模块11调整云端资源;此测量参数是广义的测量值﹐例如效能测量值﹑储存空间测量值﹑网络频宽测量值﹑实体机运转的环境参数测量值(电压﹑电流﹑湿度﹑温度…)﹑错误测量值(可更正的错误﹑不可更正的错误…)﹑软件运作的测量值…。举例来说,当控制模块13接收到一个资源请求指令时,控制模块13会计算这个资源请求指令所对应的云端资源的总量。而后控制模块13会依据测量参数判断资源模块11所提供的云端资源是否能满足资源请求指令。更进一步,控制模块13可以依据测量参数与资源请求指令决定资源模块11中多个用以提供云端资源的单元(例如运算单元、储存单元与通信单元)应该被致能多少个以满足资源请求指令。控制模块13及其中的一个或多个模块/单元可以是特殊应用集成电路(application-specific integrated circuit,ASIC)、进阶精简指令集机器(advanced RISC machine,ARM)、中央处理单元(central processing unit,CPU)、单芯片控制器或其他包含前述元件的设备,也可以是运行于一个实体运算装置中的多个软件,本实施例在此不加以限制。
于一个实施例中,如果在某个时间点控制模块13收到一个资源请求指令,且控制模块13依据当时的测量参数判断资源模块11所提供的云端资源不能满足此资源请求指令,则控制模块13会判断一个“瓶颈事件”(bottleneck event)发生。同时,控制模块13会将一个瓶颈事件发生时所收到的资源请求指令记录下来,如此一来当下次遇到同样的资源请求指令时,控制模块13就可以判断可能又会发生瓶颈事件。
此外,于另一个实施例中,控制模块13会把瓶颈事件发生前最后收到的多个资源请求指令记录下来。用来当作的后判断是否可能发生瓶颈事件的依据。举例来说,控制模块13会把一个瓶颈事件发生前所收到的最后十个资源请求指令依照收到的顺序排列。如此一来,当控制模块13未来收到五个资源请求指令,并且这五个资源请求指令与的前发生瓶颈事件时所收到的最后十个资源请求指令中的前五个相同,控制模块13就可以判断云端系统1可能再次发生瓶颈事件。并控制资源模块11以提供更多的云端资源,避免瓶颈事件的发生。
监控模块15用以检测资源模块11以产生测量参数。更明确地说,监控模块15会监控资源模块11中多个用来提供云端资源的单元的各种测量,并将的量化。并将每个单元的测量的数据传送给控制模块13,因此控制模块13可以依据这些单元的测量来管理与控制资源模块11中的每个单元。举例来说,如果资源模块11中有一个单元的运算能力突然下降,因为监控模块15会将这个单元的测量的数据传送给控制模块13,所以控制模块13可以判断这个单元可能发生了“故障事件”(failure event)。由于发生故障事件的单元能力下降,所以继续使用这样的单元来提供云端服务的话单位成本会上升,因此控制模块13可以控制资源模块11使用另一个单元来取代发生故障事件的单元。同时,维护者可以由控制模块13的纪录知道资源模块中的某个或某些单元发生故障事件,便可即时维修或更换。
于另一实施例中,云端系统1中可以更包含电源模块17,分别电性连接至该资源模块与该控制模块,电源模块17包含多个电源单元,每个电源单元分别电性连接置资源模块11中的一个或多个运算单元、储存单元或通信单元,同时也电性连接至控制模块13,用以受控于控制模块13以提供电源给资源模块中的一个或多个单元。并且监控模块15也会监控这些电源单元,并将每个电源单元的测量数据化以传送给控制模块13。
于再一个实施例中,云端系统1可以更包含一个环境模块19,电性连接至控制模块13,用以监测及控制一个或多个环境参数。举例来说,环境参数可以包含但是不限于资源模块11及/或电源模块17所处的环境的温度、湿度、电流、电压以及系统入侵。于这个实施例中,控制模块13可以在前述瓶颈事件或是前述故障事件发生的时候把环境参数记录下来。因此可以更进一步利用环境参数来判断是否会发生瓶颈事件或是故障事件。
举例来说,一般使用者使用云端系统1时所发出的资源请求指令往往具有周期性,因此瓶颈事件可能也会具有周期性。控制模块13因此可以利用时间来判断瓶颈事件是否具有周期性以及下一次发生同样的瓶颈事件可能的时间点。又举例来说,由于资源模块11中的多个单元是由电子元件所构成,电子元件在高温高湿的环境下效率可能下降,甚至发生故障事件。因此控制模块13可以记录多次故障事件发生时的温度与湿度,并以统计法来判断可能发生故障事件的温度与湿度。或者更进一步,控制模块13会定时或是不定时地记录资源模块11中每个单元的测量以及当时的温度湿度,因此控制模块13可以利用统计法或是数据分析(data mining)来判断环境因素(温度、湿度)与每个单元的测量的关系。借此,控制模块13可以依据温度湿度来调整资源模块11中用来提供云端资源的单元的数量,从而更降低瓶颈事件发生的可能性。再者﹐当控制模块13收到来至环境模块19的测量参数有异样或临界正常值边缘时﹐其将试着下命令给环境模块19来控制测量参数回到正常值范围﹐或者下命令给资源模块11及电源模块17试着改善测量参数或结束某些资源功能。
关于前述控制模块13,请参照图2A,其依据本发明一实施例的控制模块功能方块图。如图2A所示,控制模块13包含自动云端提供模块131(auto cloudprovision module,ACP)、云端服务提供模块132(cloud service provision module,CSP)、虚拟资源提供模块133(virtual resource provision module,VRP)、虚拟机转换模块134(virtual machine converter module,VMC)、服务终止模块135(service termination module,ST)、错误控制模块136(failure handling module,FH)、瓶颈控制模块137(bottleneck handling module,BH)、维护控制模块138(maintenance handling module,MH)、电源管理模块139(power managementmodule,PWM)与资源使用最佳化模块13A(resource utilization optimizationmodule,RUO)。
关于自动云端提供模块131,请参照图2B,其依据本发明一实施例的自动云端提供模块功能方块图。如图2B所示,自动云端提供模块131包含节点自动检测单元1311(node auto discovery unit,NAD)、节点提供单元1312(nodeprovision unit,NP)、节点管理单元1313(node manager unit,NM)、最小云端配置单元1314(minimum cloud deployment unit,MCD)、动态云端配置单元1315(dynamic cloud deployment/on-demand cloud deployment unit,DCD)、实体系统配置单元1316(physical system layout unit,PSL)与逻辑系统结构单元1317(logical system topology unit,LST)。
其中,节点自动检测单元1311自动检测资源模块11中的一个或多个用以提供云端资源的单元,并启动被检测到的单元,以取得被检测到的单元的硬件数据,而后对被检测到的单元进行分类。举例来说,被检测到的单元可以被节点自动检测单元1311分为储存单元、运算单元、通信单元等等。同时,节点自动检测单元1311将前述被检测到的单元的数据提供给节点提供单元1312、实体系统配置单元1316与逻辑系统结构单元1317。
节点提供单元1312从节点自动检测单元1311取得资源模块11中用以提供云端资源的多个单元的数据后,选择性的控制前述多个单元的组态(执行状态),以取得最高的资源运用效率。而节点管理单元1313则负责控制资源模块11中用以提供云端资源的多个单元是否必须被执行诸如启动、关闭、重开机、重置、重新安装、被隔离等动作。
最小云端配置单元1314用以控制节点提供单元1312,以将资源模块11中一定数量的运算单元、储存单元与通信单元用以常态性地被用以提供云端服务。借此,云端系统1可以随时至少提供最基本的云端服务。而动态云端配置模块1315则依据测量参数与资源请求指令,来决定资源模块11中需要用以提供云端服务的单元的数量,并控制节点提供单元1312,以使资源模块11提供对应数量的各种单元。
实体系统配置单元1316从节点自动检测单元1311取得关于资源模块11中每个单元的物理地址(例如在机柜式数据中心的实体机及网络设备等装置的实际位子,像是机柜位子﹑机架位子﹑插槽位子﹑装置位子)等数据,而逻辑系统结构单元1317从节点自动检测单元1311取得关于资源模块11中每个单元连接至输入/输出路由器的路径。借此,最小云端配置单元1314与动态云端配置模块1315在决定资源模块11中哪一个单元要被用来提供云端资源时,更可以依据实体系统配置单元1316与逻辑系统结构单元1317中所记录的关于资源模块11中每个单元的物理地址与连接至输入/输出路由器的路径,来决定要以哪一个单元提供云端服务。
云端服务提供模块132用以提供一个应用程序界面让使用者易于操作,以从云端系统1中取得所需要的云端资源,并且云端服务提供模块132依据使用者的类别(正常使用者或测试者)来快速地向云端系统1取得对应的云端资源。关于云端服务提供模块132,请参照图2C,其依据本发明一实施例的云端服务提供模块功能方块图。如图2C所示,云端服务提供模块132包含识别建立单元1321(identity unit)、云端服务计算单元1322(compute unit)、虚拟机映像单元1323(image unit)、虚拟机容量单元1324(volume unit)、虚拟机映像数据库1325(object store unit)与云端系统网络单元1326(network unit)。
识别建立单元1321用以对使用者进行授权并建立使用者及租赁者(tenant)的数据。举例来说,当有新的租赁者要使用云端系统1的时候,其数据必须被识别建立单元1321所建立,而后属于此租赁者的使用者在第一次对云端系统1进行存取时,识别建立单元1321会依据使用者的属性(一般使用者或测试者)及其所属的租赁者的属性,初步决定如何配置对应的虚拟机映像及云端资源。
当一个使用者进入云端系统1的时候,云端服务计算单元1322依据此使用者的虚拟机存取金钥,给予此使用者对应的虚拟机的大小(虚拟CPU数目﹑存储器大小)﹑虚拟机对应的映像与虚拟机对应的储存空间(storage space)。此使用者的虚拟机存取金钥记录了使用者的属性及使用者所属的租赁者的属性,例如部门、主要业务、常用云端服务等等。因此云端服务计算单元可以依据这些资讯赋予使用者对应的虚拟机的大小﹑虚拟机对应的映像与虚拟机对应的储存空间大小。再者,云端服务计算单元1322从资源模块11中的多个单元中配置对应的的虚拟主机。
虚拟机映像单元1323与虚拟机容量单元1324用以从云端服务计算单元1322得知一个使用者对应的虚拟机对应的映像档案与虚拟机对应的储存空间,并从虚拟机映像数据库1325中取得映像档案以及从资源模块11中的多个单元中配置对应的储存单元,以符合前述使用者被赋予的对应的虚拟机的映像与虚拟机对应的储存空间。而后云端系统网络单元1326建立此使用者的虚拟机的防火墙,并赋予此虚拟机一个广域网际网络协定位址与一个私用网际网络协定位址。
虚拟资源提供模块133用以管理诸如虚拟机、虚拟丛集(virtual cluster)、虚拟数据中心(virtual data center)等虚拟资源。关于虚拟资源提供模块133,请参照图2D,其依据本发明一实施例中的虚拟资源提供模块功能方块图。如图2D所示,虚拟资源提供模块133包含一个用来从云端系统1的各模块中取得虚拟资源的虚拟资源配置单元1331(virtual resource allocation unit,VRA)、一个用以平衡虚拟丛集中多个虚拟机负载的虚拟负载平衡单元1333(virtual load balanceunit,VLB)、一个依据虚拟丛集策略(例如安全优先、上传优先、下载优先、高效率计算优先等策略)及/或虚拟机策略来决定每个虚拟机要配置在那一个实体单元(实体主机)上运行的虚拟机配置单元1335(VC/VM placement unit,VMP)、一个用来动态调整虚拟机、虚拟丛集及虚拟数据中心大小的虚拟资源调节单元1337(VM/VC/VDC auto scaling unit,VAS)与一个用来管理每个虚拟机的虚拟机管理单元1339(VM manager unit,VMM)。
虚拟机转换模块134用以将不同格式的虚拟机映像及其对应的组态档转换成适于在云端系统运行的格式及组态档。举例来说,云端系统1中包含多个不同类型的云端,每个云端可以运行不同类型(格式)的虚拟机,因此当一个虚拟机要被运行时,虚拟机转换模块134找出适用于此虚拟机的云端来运行此虚拟机。另一种实施方式中,虚拟机转换模块134依据一个虚拟机的格式与其组态档,将虚拟机转换成可以在当前云端系统1运行的虚拟机格式。
服务终止模块135则是当一个虚拟机要中止运行或是当一个使用者停止使用云端服务时,要将之前被此虚拟机或被此使用者所占用的云端资源(例如虚拟机、虚拟丛集等)释放给云端系统1。
错误控制模块136从监控模块15得知有一个实体机、一个虚拟机、一个网络设备、一个非资讯设备(Non IT device)、一个软件服务或一个电源发生故障事件时,错误控制模块136会通过重置或移除发生错误的硬件单元或软件,以试图使云端系统1恢复正常。
瓶颈控制模块137用以纪录、判断是否发生瓶颈事件(例如实体装置﹑实体装置池﹑虚拟装置或虚拟装置池的运算﹑储存空间或网络频宽等瓶颈事件)或是预测即将会发生瓶颈事件﹐并在瓶颈事件发生时做适当的动作以排除之。并且在即将会发生瓶颈事件时,通知维护控制模块138来控制云端系统1的资源配置,以避免瓶颈事件的发生。维护控制模块138另外也依据云端系统1的运行纪录来判断是否已发生或即将发生故障事件,解决已发生的故障事件,并适当的增加云端资源、移除即将发生故障事件的云端资源,以避免云端系统1在使用者使用的时候发生故障事件。
电源管理模块139会依据电源策略来节省云端系统1的耗电﹐例如装置的效能还未被完全使用或其处于待机(idle state)时可使用将装置的电源关掉或降低其运作的频率(例如控制CPU的功率-效能(Power-Performance)及终端节流(Terminal-Throttling)的等级)、限制装置电源最大使用量(power budget)、实体机内及实体机间的负载平衡(physical machine load balance)、降低云端系统1的电源使用效率系数(power usage efficiency﹐PUE)。
资源使用最佳化模块13A来处理云端系统1内的资源做更有效率的使用﹐例如使用过量使用(over-commit,OC)的技术﹔若虚拟资源(例如虚拟机、虚拟机丛聚、虚拟数据中心)超过实体资源(例如实体机、计算池、储存池、网络池、数据中心)的能力﹐但此虚拟资源却能在不影响其规定的能力下正常运作﹐也就是其符合服务等级协议(service level agreement,SLA)的规定下运作﹐称此为over-commit技术之所以能over-commit是虚拟资源的行为能被预期到﹐且此些虚拟资源不会同一时间一起以其最大规定效能运作﹔资源使用最佳化模块13A从监控模块15取得虚拟资源运作的历史数据﹐并通过数据探索(datamining)的方法分析虚拟资源运作的未来一段时间的行为﹐进而可事先安排虚拟资源至适当的实体上运作﹐且其符合其SLA的规范。
关于本发明一实施例中的监控模块15,请参照图3,其依据本发明一实施例的监控模块功能方块图。如图3所示,监控模块15包含实体效能测量监控单元151(physical performance monitor,PPM)、虚拟效能测量监控单元152(virtualperformance monitor,VPM)、即时服务监控单元153(service alive monitor,SAM)、实体节点监控单元154(physical node monitor,PNM)、实体网络设备监控单元155(physical network device monitor,PNDM)与一般监控单元(non-ITdevice monitor,NIM)。
其中,实体效能测量监控单元151与虚拟效能测量监控单元152以取样流程(sampling flow,sflow)协定标准分别取得实体单元(运算单元、储存单元、通信单元等等)与虚拟机的测量参数。借以提供给瓶颈控制模块137判断是否发生或即将发生瓶颈事件。即时服务监控单元153则是取得云端服务的测量参数,以提供给维护控制模块138来判断云端软件服务是否正常。实体节点监控单元154与实体网络设备监控单元155分别用以取得实体单元与实体网络设备的测量参数,以提供错误控制模块136判断是否有实体单元或实体网络设备发生或即将发生故障事件。一般监控单元156用以取得其他单元(例如电源模块17中的多个电源单元及环境模块19)的测量参数,以提供给控制模块13判断是否有电源单元发生故障事件。
前述的图2A﹑图2B﹑图2C﹑图2D及图3上的每一个功能区块(模块或单元)除了可以如前述为实体的运算装置以外,也可以是运行在运算装置上的一个独立的常驻程序(Daemon)。每个常驻程序都有自己输出(export)的一组应用程序界面(Application Programming Interface,API),可供其它常驻程序呼叫,每个常驻程序应用程序界面的实作可为传输控制协定与网络协定套接字(transfercontrol protocol and internet protocol socket,TCP IP Socket)或使用者定义协定与网络协定套接字(user defined protocol and internet protocol socket,UDP IPSocket),每个常驻程序的套接字皆有一个端口(port)编号,且此常驻程序能放于不同的实体机或虚拟机上执行。常驻程序间的通信是透过常驻程序套接字应用程序界面(Daemon Socket API),以达到远端呼叫(remote procedure call,RPC)。云端系统1的功能运作可以由一个或多个功能区块(模块或单元)以常驻程序的方式透过常驻程序应用界面一起合作完成的。云端系统1的功能运作需要一个节点锁机制(Node Lock Mechanism),以解决结点间操作(nodeoperations)的相冲(conflict)问题。
前述关于控制模块13及监控模块15中的多个模块及单元,个别可以是实体的运算装置(例如电脑、服务器),也可以是运行于一个实体运算装置中的多个软件,本发明不加以限制。
综上所述,依据本发明的云端系统可以包含资源模块、控制模块、监控模块、电源模块甚至环境模块。依据监控模块所得到的资源模块与电源模块的测量参数以及环境模块所得到的环境测量参数,控制模块可以判断资源模块所提供的云端资源是否可以满足一个资源请求指令。控制模块也可以根据前述数据判断并避免瓶颈事件(也就是云端资源无法满足资源请求指令)与故障事件发生。

Claims (10)

1.一种云端系统,其特征在于,包含:
一资源模块,用以提供一云端资源;
一控制模块,电性连接至该资源模块,用以依据一量测参数与一资源请求指令控制该资源模块调整该云端资源;以及
一监控模块,分别电性连接至该资源模块与该控制模块,用以检测该资源模块以产生该量测参数。
2.如权利要求1所述的云端系统,其特征在于,该控制模块依据该测量参数决定该云端资源是否满足该资源请求指令,以控制该资源模块调整该云端资源。
3.如权利要求2所述的云端系统,其特征在于,该资源模块包含:
多个运算单元,电性连接至该控制模块,每一该运算单元用以在被致能时提供一运算资源;
多个储存单元,电性连接至该控制模块,每一该储存单元用以在被致能时提供一储存资源;以及
多个通讯单元,电性连接至该控制模块,每一该通讯单元用以在被致能时提供一通讯资源;
其中,该云端资源包含该运算资源、该储存资源与该通讯资源。
4.如权利要求3所述的云端系统,其特征在于,该控制模块在该云端资源不满足该资源请求指令时,调整该资源模块中该些运算单元、该些储存单元与该些通信单元被致能的数量,以使该云端资源满足该资源请求指令。
5.如权利要求4所述的云端系统,其特征在于,该控制模块更将该资源模块中该些运算单元、该些储存单元与该些通信单元被致能的数量与该资源请求指令的关系纪录为一资源对照表。
6.如权利要求5所述的云端系统,其特征在于,该控制模块更依据该资源对照表决定在一预设时间后该云端资源是否满足该资源请求指令。
7.如权利要求3所述的云端系统,其特征在于,还包含一电源模块,分别电性连接至该资源模块与该控制模块,该电源模块包含:
多个电源单元,每一该电源单元分别电性连接至由该些运算单元、该些储存单元与该些通讯单元所组成的群组其中至少之一与该控制模块,用以受控于该控制模块以提供电源。
8.如权利要求7所述的云端系统,其特征在于,该控制模块更依据该资源模块中该些运算单元、该些储存单元与该些通信单元被致能的数量决定控制该些电源单元中用以提供电源的该电源单元的数量。
9.如权利要求1所述的云端系统,其特征在于,还包含一环境模块,电性连接至该控制模块,用以监测及控制一个或多个环境测量参数,该控制模块更依据该环境测量参数控制该资源模块调整该云端资源。
10.如权利要求1所述的云端系统,其特征在于,该资源模块、该控制模块与该监控模块其中至少之一运行于一运算装置的一常驻程序。
CN201310629903.1A 2013-11-29 2013-11-29 云端系统 Pending CN104683406A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310629903.1A CN104683406A (zh) 2013-11-29 2013-11-29 云端系统
US14/246,929 US20150156095A1 (en) 2013-11-29 2014-04-07 Cloud system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310629903.1A CN104683406A (zh) 2013-11-29 2013-11-29 云端系统

Publications (1)

Publication Number Publication Date
CN104683406A true CN104683406A (zh) 2015-06-03

Family

ID=53266247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310629903.1A Pending CN104683406A (zh) 2013-11-29 2013-11-29 云端系统

Country Status (2)

Country Link
US (1) US20150156095A1 (zh)
CN (1) CN104683406A (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10129112B2 (en) * 2014-08-14 2018-11-13 At&T Intellectual Property I, L.P. Workflow-based resource management
US10210107B2 (en) * 2014-10-29 2019-02-19 Hewlett Packard Enterprise Development Lp Trans-fabric instruction set for a communication fabric
US20160179582A1 (en) * 2014-12-23 2016-06-23 Intel Corporation Techniques to dynamically allocate resources for local service chains of configurable computing resources
US9946573B2 (en) * 2015-05-20 2018-04-17 Oracle International Corporation Optimizing virtual machine memory sizing for cloud-scale application deployments
CN106920092A (zh) * 2016-12-23 2017-07-04 阿里巴巴集团控股有限公司 一种虚拟资源分配方法、客户端及服务器
US20180183858A1 (en) * 2016-12-28 2018-06-28 BeBop Technology LLC Method and System for Managing Cloud Based Operations
US10965566B2 (en) * 2017-11-03 2021-03-30 International Business Machines Corporation System and method for detecting changes in cloud service up-time
US10966073B2 (en) 2017-11-22 2021-03-30 Charter Communications Operating, Llc Apparatus and methods for premises device existence and capability determination
US11129171B2 (en) 2019-02-27 2021-09-21 Charter Communications Operating, Llc Methods and apparatus for wireless signal maximization and management in a quasi-licensed wireless system
US11374779B2 (en) 2019-06-30 2022-06-28 Charter Communications Operating, Llc Wireless enabled distributed data apparatus and methods
US11182222B2 (en) * 2019-07-26 2021-11-23 Charter Communications Operating, Llc Methods and apparatus for multi-processor device software development and operation
US11368552B2 (en) 2019-09-17 2022-06-21 Charter Communications Operating, Llc Methods and apparatus for supporting platform and application development and operation
US11026205B2 (en) 2019-10-23 2021-06-01 Charter Communications Operating, Llc Methods and apparatus for device registration in a quasi-licensed wireless system
US11457485B2 (en) 2019-11-06 2022-09-27 Charter Communications Operating, Llc Methods and apparatus for enhancing coverage in quasi-licensed wireless systems
US11363466B2 (en) 2020-01-22 2022-06-14 Charter Communications Operating, Llc Methods and apparatus for antenna optimization in a quasi-licensed wireless system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102739798A (zh) * 2012-07-05 2012-10-17 成都国腾实业集团有限公司 具有网络感知功能的云平台资源调度方法
US20130238805A1 (en) * 2010-11-22 2013-09-12 Telefonaktiebolaget L M Ericsson (Publ) Technique for resource creation in a cloud computing system
CN103377407A (zh) * 2012-04-25 2013-10-30 华为技术有限公司 云业务处理方法及相关装置和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9842004B2 (en) * 2008-08-22 2017-12-12 Red Hat, Inc. Adjusting resource usage for cloud-based networks
CN104303175B (zh) * 2012-02-10 2018-06-12 甲骨文国际公司 云计算服务框架
US9292060B1 (en) * 2012-06-28 2016-03-22 Amazon Technologies, Inc. Allowing clients to limited control on power consumed by the cloud while executing the client's tasks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130238805A1 (en) * 2010-11-22 2013-09-12 Telefonaktiebolaget L M Ericsson (Publ) Technique for resource creation in a cloud computing system
CN103377407A (zh) * 2012-04-25 2013-10-30 华为技术有限公司 云业务处理方法及相关装置和系统
CN102739798A (zh) * 2012-07-05 2012-10-17 成都国腾实业集团有限公司 具有网络感知功能的云平台资源调度方法

Also Published As

Publication number Publication date
US20150156095A1 (en) 2015-06-04

Similar Documents

Publication Publication Date Title
CN104683406A (zh) 云端系统
CN106339058B (zh) 动态管理电力供应的方法和系统
US20220368645A1 (en) Cloud compute scheduling using a heuristic contention model
US10429914B2 (en) Multi-level data center using consolidated power control
US8635484B2 (en) Event based correlation of power events
US9954758B2 (en) Virtual network function resource allocation and management system
US9800087B2 (en) Multi-level data center consolidated power control
US20090125737A1 (en) Power Management of an Electronic System
CN103229125A (zh) 机箱内的刀片服务器之间的动态功率平衡
CN103188277A (zh) 负载能耗管理系统、方法和服务器
US11379264B2 (en) Advanced cloud architectures for power outage mitigation and flexible resource use
EP3201717A1 (en) Monitoring of shared server set power supply units
Tang et al. Zero-cost, fine-grained power monitoring of datacenters using non-intrusive power disaggregation
Ahmed et al. A novel reliability index to assess the computational resource adequacy in data centers
CN113885794B (zh) 基于多云存储的数据访问方法、装置、计算机设备及介质
CN113204429A (zh) 一种数据中心的资源调度方法及系统、调度设备、介质
US11126255B1 (en) Power throttling based on input voltage monitoring
US20230315183A1 (en) Power management system
US20200133367A1 (en) Power management for workload offload engines
EP4198728A1 (en) Method and apparatus to perform workload management in a disaggregated computing system
TW201525706A (zh) 雲端系統
CN107247674B (zh) 内存块类型处理方法、装置、电子设备及可读存储介质
US20230153121A1 (en) Accelerator usage prediction for improved accelerator readiness
Leivadeas et al. Going green with the networked cloud: methodologies and assessment
WO2024012267A1 (zh) 一种碳排放量的确定方法、装置及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150603