CN112073499A - 一种多机型云物理服务器的动态服务方法 - Google Patents

一种多机型云物理服务器的动态服务方法 Download PDF

Info

Publication number
CN112073499A
CN112073499A CN202010907663.7A CN202010907663A CN112073499A CN 112073499 A CN112073499 A CN 112073499A CN 202010907663 A CN202010907663 A CN 202010907663A CN 112073499 A CN112073499 A CN 112073499A
Authority
CN
China
Prior art keywords
physical server
cloud
monitoring
network
cloud physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010907663.7A
Other languages
English (en)
Inventor
陶锐哲
蒋善坤
于昊
田雨
许舒宇
孙思清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cloud Information Technology Co Ltd
Original Assignee
Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cloud Information Technology Co Ltd filed Critical Inspur Cloud Information Technology Co Ltd
Priority to CN202010907663.7A priority Critical patent/CN112073499A/zh
Publication of CN112073499A publication Critical patent/CN112073499A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services

Abstract

本发明涉及云计算服务技术领域,具体提供了一种多机型云物理服务器的动态服务方法,基于OpenStack搭建的云计算服务平台,用于为用户提供多种计算服务,包括提供多种机型的云物理服务器,机型主要根据用户需求进行设计而划分。与现有技术相比,本发明的一种多机型云物理服务器的动态服务方法,针对性给出定制或优化方案,并采取脚本的方式,灵活地实现优化配置,从而提供动态灵活可持续的云计算服务,具有良好的推广价值。

Description

一种多机型云物理服务器的动态服务方法
技术领域
本发明涉及云计算服务技术领域,具体提供一种多机型云物理服务器的动态服务方法。
背景技术
云计算是分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡和热备冗余等传统计算机和网络技术发展融合的产物。通过云计算,可以在短时间内完成海量的数据处理,实现强大的网络服务。通常具有大规模分布式、虚拟化、高可用拓展和按需配置以及安全等五大特性。
云物理服务器提供高性能、资源独享和安全隔离的专属物理主机,满足核心应用对高性能及可靠性的需求,并提供完整的设备管理权限及自动运维服务。物理主机同时具备云主机的敏感性、灵活性与高可用。
如何设计服务策略,从而进行定制化开发部署,成为云计算服务商需要关注的重点。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的多机型云物理服务器的动态服务方法。
本发明解决其技术问题所采用的技术方案是:
一种多机型云物理服务器的动态服务方法,基于OpenStack搭建的云计算服务平台,用于为用户提供多种计算服务,包括提供多种机型的云物理服务器,机型主要根据用户需求进行设计而划分。
进一步的,搭建的云计算服务平台为IAAS平台,将云计算服务平台分为高性能计算型和高性能网络型;
所述高性能计算型用于提供基础计算能力,与裸机的CPU/RAM/DISK资源大小保持相同,选择单网卡或多网卡多IP的方式;
所述高性能网络型需进行网卡绑定Bonding或Teaming技术,从物理层进行负载均衡或容错备份。
进一步的,基于OpenStack平台的云物理服务器的部署交付过程分为上架、管理、纳管和部署四步。
进一步的,上架是将裸机的IPMI信息、裸机的资源信息、部署镜像信息上传,并注册为OpenStack中的节点node;
管理过程需要将裸机的PXE网卡以及其他需要添加的网卡信息注册到节点node中,实现mode4 802.3ad动态链路聚合模式,从而实现多张网卡的负载均衡,通过脚本设计,从而完成物理层的网络高可用功能,区分云物理服务器的机型;
纳管是在完成上架和管理之后,将节点node纳管到OpenStack平台,从而能被hypervisor发现,成为可调度的裸机资源;
部署过程中,用户使用自己指定的系统与VPC网络,创建实例从而完成云物理服务器的部署,这个环节中设计脚本,添加网卡Bonding的监控配置,或改变Bonding模式。
进一步的,平台的管理者需要对被纳管的云物理服务器进行全链路跟踪监控,
对于高性能计算型云物理服务器,对CPU/RAM/磁盘/网络的使用状态以及工作情况进行监控,后台拉取监控数据进行监控;
对于高性能网络型云物理服务器,不仅需要以上的技术对云服务器进行监控,还需要对网卡绑定的情况进行跟踪检查健康状态。
进一步的,对于高性能计算型云物理服务器,使用SNMP协议、Zabbix工具包或/和Prometheus组件来进行监控;
对于高性能网络型云物理服务器,使用MII监控或ARP监控,实现全链路跟踪监控。
进一步的,SNMP协议获取实例的CPU、RAM、磁盘和网络信息,为云物理服务器默认安装SNMP服务,通过SNMP协议发送报文,将监控信息上传;
Zabbix工具包和Prometheus开源组件集成到IAAS平台中作为监控中间件来使用。
进一步的,云计算服务与监控服务在云平台中的服务方式是相通的,监控服务用于任意阶段提供参考数据和定制化进行服务优化。
本发明的一种多机型云物理服务器的动态服务方法和现有技术相比,具有以下突出的有益效果:
基于动态服务策略,云服务厂商可以针对用户需求提供多种机型的云物理服务器。同时在交付运维后,仍然能根据用户需求以及监控获取的参数,针对性给出定制或优化方案,并采取脚本的方式,灵活地实现优化配置,从而提供动态灵活可持续的云计算服务。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种多机型云物理服务器的动态服务方法的流程示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1所示,本实施例中的一种多机型云物理服务器的动态服务方法,基于OpenStack搭建的IAAS平台,能够为用户提供多种计算服务,如虚拟云服务器、虚拟云物理服务器、GPU型云服务器等。这里以云物理服务器为例,来说明如何对计算服务进行定制设计,从而达到提供多种机型同时供用户选择的目的。
通常根据使用目的的划分,将云物理服务器划分为高性能计算型、高性能网络型、存储型等多种机型。高性能计算型是为用户提供基础计算能力的,适用于需要大量计算的科研、渲染场景,对本地计算能力要求高,一般与裸机的CPU/RAM/DISK资源大小保持相同,对网络要求较低,因此可以选择单网卡或多网卡多IP的方式;而高性能网络型针对的是网络服务能力要求较高的场景,如生产环境数据库、网站后台服务器等,这种对于网络能力要求高的场景,需要对网络进行特殊考虑,如进行网卡绑定Bonding或Teaming技术,从物理层进行负载均衡或容错备份。
因此,这里需要对云物理服务器的完整部署交付过程进行描述。基于OpenStack平台的云物理服务器的部署交付过程分为四步:上架、管理、纳管、部署。
a)上架是将裸机的IPMI信息、裸机的资源信息、部署镜像信息上传,并注册为OpenStack中的节点node
b)管理过程需要将裸机的PXE网卡以及其他需要添加的网卡信息注册到节点node中,这里对于高性能网络型的云物理服务器需要单独进行定制。网卡Bonding技术一共有7种模式,根据用户需求进行定制化设置,可以通过脚本在管理过程中进行设置,也可以在实例部署完成后在meta-data中设置。Bonding的常用定制化场景如:快速部署且要求网络高可用的现场环境,使用mode1 active-backup主备模式;银行股票等金融场景,要求网卡在出现问题时不存在任何丢包问题,则需要绑定多张网卡并且使用mode3broadcast广播模式,实现网络极高稳定性;网络带宽较小从而要求有负载均衡能力的中小型企业后台服务场景,需要实现mode4 802.3ad动态链路聚合模式,从而实现多张网卡的负载均衡。这一步可以通过脚本设计,从而完成物理层的网络高可用功能,区分云物理服务器的机型。
c)纳管是在完成以上步骤后,将节点node纳管到OpenStack平台,从而能被hypervisor发现,成为可调度的裸机资源。
d)部署过程是用户能够接触到的环节,用户使用自己指定的系统与VPC网络,创建实例从而完成云物理服务器的部署。这个环节中可以设计脚本,添加网卡Bonding的监控配置,或改变Bonding模式。
作为云平台服务管理者,通常需要对被纳管的云物理服务器进行全链路跟踪监控。对于高性能计算型云物理服务器,一般需要对CPU/RAM/磁盘/网络的使用状态以及工作情况进行监控,后台拉取监控数据进行监控,如CPU空闲率、内存使用率、磁盘IO速率、网络上行下行速率等,目前有多种方法能够实现该监控目的,如SNMP协议、Zabbix工具包、Prometheus组件等;对于高性能网络型云物理服务器,不仅需要以上的技术对云服务器进行监控,还需要对网卡绑定的情况进行跟踪检查健康状态,如MII监控或ARP监控,实现全链路跟踪监控。
a)SNMP协议可以获取实例的CPU/RAM/磁盘/网络等信息,需要为云物理服务器默认安装SNMP服务,通过SNMP协议发送报文,将监控信息上传。
b)Zabbix等开源工具包可独立完成多种监控,如硬件监控、网络监控、性能监控等,也可以集成SNMP协议完成系统监控。由于应用范围广,可以集成到IAAS平台中作为监控中间件来使用。
c)Prometheus开源组件主要以拉取exporter的方式,获取指定exporter的监控信息,监控范围随exporter而定,因此使用灵活,更适合于IAAS平台的监控中间件。
d)MII/ARP监控是作为网卡Bonding技术的默认监控方式存在,MII监控能够为网卡到路由器之间的连接状态提供监控,如果单个网卡发生故障,MII监控方式能够检测到网卡到路由器之间的连接出现故障,如果在mode1主备模式下就能进行故障网卡的自动切换。ARP监控从当前工作网卡向指定IP地址发送ARP请求,检测数据包是否正常发送,然后从链路状态为UP或BACK的各网卡选择其中一个作为活动网卡。这里优先选择ARP监控。
云计算服务与监控服务在云平台中的服务方式通常是相辅相成。监控服务作为监控云物理主机服务器状态的工具,也可以在任意阶段提供参考数据,从而定制化地进行服务优化。例如在资源即将不足时,进行弹性扩容;在网络连接状态不稳定或网络负载很高的情况,提供动态链路聚合服务,都可以在任意阶段通过脚本完成。从而实现云平台服务的动态优化。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种多机型云物理服务器的动态服务方法权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种多机型云物理服务器的动态服务方法,其特征在于,基于OpenStack搭建的云计算服务平台,用于为用户提供多种计算服务,包括提供多种机型的云物理服务器,机型主要根据用户需求进行设计而划分。
2.根据权利要求1所述的一种多机型云物理服务器的动态服务方法,其特征在于,搭建的云计算服务平台为IAAS平台,将云计算服务平台分为高性能计算型和高性能网络型;
所述高性能计算型用于提供基础计算能力,与裸机的CPU/RAM/DISK资源大小保持相同,选择单网卡或多网卡多IP的方式;
所述高性能网络型需进行网卡绑定Bonding或Teaming技术,从物理层进行负载均衡或容错备份。
3.根据权利要求1所述的一种多机型云物理服务器的动态服务方法,其特征在于,基于OpenStack平台的云物理服务器的部署交付过程分为上架、管理、纳管和部署四步。
4.根据权利要求3所述的一种多机型云物理服务器的动态服务方法,其特征在于,上架是将裸机的IPMI信息、裸机的资源信息、部署镜像信息上传,并注册为OpenStack中的节点node;
管理过程需要将裸机的PXE网卡以及其他需要添加的网卡信息注册到节点node中,实现mode4 802.3ad动态链路聚合模式,从而实现多张网卡的负载均衡,通过脚本设计,从而完成物理层的网络高可用功能,区分云物理服务器的机型;
纳管是在完成上架和管理之后,将节点node纳管到OpenStack平台,从而能被hypervisor发现,成为可调度的裸机资源;
部署过程中,用户使用自己指定的系统与VPC网络,创建实例从而完成云物理服务器的部署,这个环节中设计脚本,添加网卡Bonding的监控配置,或改变Bonding模式。
5.根据权利要求4所述的一种多机型云物理服务器的动态服务方法,其特征在于,平台的管理者需要对被纳管的云物理服务器进行全链路跟踪监控,
对于高性能计算型云物理服务器,对CPU/RAM/磁盘/网络的使用状态以及工作情况进行监控,后台拉取监控数据进行监控;
对于高性能网络型云物理服务器,不仅需要以上的技术对云服务器进行监控,还需要对网卡绑定的情况进行跟踪检查健康状态。
6.根据权利要求5所述的一种多机型云物理服务器的动态服务方法,其特征在于,对于高性能计算型云物理服务器,使用SNMP协议、Zabbix工具包或/和Prometheus组件来进行监控;
对于高性能网络型云物理服务器,使用MII监控或ARP监控,实现全链路跟踪监控。
7.根据权利要求6所述的一种多机型云物理服务器的动态服务方法,其特征在于,SNMP协议获取实例的CPU、RAM、磁盘和网络信息,为云物理服务器默认安装SNMP服务,通过SNMP协议发送报文,将监控信息上传;
Zabbix工具包和Prometheus开源组件集成到IAAS平台中作为监控中间件来使用。
8.根据权利要求7所述的一种多机型云物理服务器的动态服务方法,其特征在于,云计算服务与监控服务在云平台中的服务方式是相通的,监控服务用于任意阶段提供参考数据和定制化进行服务优化。
CN202010907663.7A 2020-09-02 2020-09-02 一种多机型云物理服务器的动态服务方法 Pending CN112073499A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010907663.7A CN112073499A (zh) 2020-09-02 2020-09-02 一种多机型云物理服务器的动态服务方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010907663.7A CN112073499A (zh) 2020-09-02 2020-09-02 一种多机型云物理服务器的动态服务方法

Publications (1)

Publication Number Publication Date
CN112073499A true CN112073499A (zh) 2020-12-11

Family

ID=73665792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010907663.7A Pending CN112073499A (zh) 2020-09-02 2020-09-02 一种多机型云物理服务器的动态服务方法

Country Status (1)

Country Link
CN (1) CN112073499A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113778790A (zh) * 2021-08-19 2021-12-10 北京仿真中心 一种基于Zabbix的计算系统状态监控的方法和系统
CN117056060A (zh) * 2023-10-12 2023-11-14 北京优特捷信息技术有限公司 一种基于深度学习的大数据信息处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140282944A1 (en) * 2013-03-12 2014-09-18 Stackinsider Technology LLC Methods and systems of deploying cloud computing platforms
CN105183561A (zh) * 2015-09-02 2015-12-23 浪潮(北京)电子信息产业有限公司 一种资源分配方法和系统
CN108055327A (zh) * 2017-12-15 2018-05-18 佛山三维二次方科技有限公司 基于OpenStack的云计算实验平台
CN110011861A (zh) * 2019-04-16 2019-07-12 苏州浪潮智能科技有限公司 一种网卡绑定方法、系统及电子设备和存储介质
CN110753093A (zh) * 2019-09-29 2020-02-04 苏州浪潮智能科技有限公司 云计算系统中设备的管理方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140282944A1 (en) * 2013-03-12 2014-09-18 Stackinsider Technology LLC Methods and systems of deploying cloud computing platforms
CN105183561A (zh) * 2015-09-02 2015-12-23 浪潮(北京)电子信息产业有限公司 一种资源分配方法和系统
CN108055327A (zh) * 2017-12-15 2018-05-18 佛山三维二次方科技有限公司 基于OpenStack的云计算实验平台
CN110011861A (zh) * 2019-04-16 2019-07-12 苏州浪潮智能科技有限公司 一种网卡绑定方法、系统及电子设备和存储介质
CN110753093A (zh) * 2019-09-29 2020-02-04 苏州浪潮智能科技有限公司 云计算系统中设备的管理方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MIANMIANGUNDONG: "Openstack裸机部署--horizon篇", 《百度》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113778790A (zh) * 2021-08-19 2021-12-10 北京仿真中心 一种基于Zabbix的计算系统状态监控的方法和系统
CN117056060A (zh) * 2023-10-12 2023-11-14 北京优特捷信息技术有限公司 一种基于深度学习的大数据信息处理方法
CN117056060B (zh) * 2023-10-12 2024-01-09 北京优特捷信息技术有限公司 一种基于深度学习的大数据信息处理方法

Similar Documents

Publication Publication Date Title
US10048996B1 (en) Predicting infrastructure failures in a data center for hosted service mitigation actions
US10445197B1 (en) Detecting failover events at secondary nodes
US9350682B1 (en) Compute instance migrations across availability zones of a provider network
CN108200124B (zh) 一种高可用应用程序架构及构建方法
US20180295029A1 (en) Managing groups of servers
US10230567B2 (en) Management of a plurality of system control networks
CN107666493B (zh) 一种数据库配置方法及其设备
CN110008005B (zh) 基于云平台的电网通信资源虚拟机迁移系统及方法
US10992526B1 (en) Hyper-converged infrastructure networking configuration system
CN111064626B (zh) 配置更新方法、装置、服务器及可读存储介质
CN113032085A (zh) 云操作系统的管理方法、装置、服务器、管理系统及介质
JP2018116680A (ja) 電源ユニット(psu)管理
US11601360B2 (en) Automated link aggregation group configuration system
CN106452836B (zh) 主节点设置方法及装置
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
CN108268305A (zh) 用于虚拟机自动扩缩容的系统和方法
CN109873714B (zh) 云计算节点配置更新方法及终端设备
Handoko et al. High availability analysis with database cluster, load balancer and virtual router redudancy protocol
CN112073499A (zh) 一种多机型云物理服务器的动态服务方法
CN103577122A (zh) 分布式应用系统在平台间迁移的实现方法及装置
US8995424B2 (en) Network infrastructure provisioning with automated channel assignment
US11431652B2 (en) Automated multi-fabric link aggregation system
CN112698992A (zh) 一种云集群的容灾管理方法以及相关装置
CN115766405B (zh) 一种故障处理方法、装置、设备和存储介质
EP3349416B1 (en) Relationship chain processing method and system, and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201211