CN111597012A - 一种云环境设备自动发现的系统及方法 - Google Patents

一种云环境设备自动发现的系统及方法 Download PDF

Info

Publication number
CN111597012A
CN111597012A CN202010417718.6A CN202010417718A CN111597012A CN 111597012 A CN111597012 A CN 111597012A CN 202010417718 A CN202010417718 A CN 202010417718A CN 111597012 A CN111597012 A CN 111597012A
Authority
CN
China
Prior art keywords
server
discovery
network
equipment
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010417718.6A
Other languages
English (en)
Inventor
张目飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Huimao Electronic Port Co Ltd
Original Assignee
Shandong Huimao Electronic Port Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Huimao Electronic Port Co Ltd filed Critical Shandong Huimao Electronic Port Co Ltd
Priority to CN202010417718.6A priority Critical patent/CN111597012A/zh
Publication of CN111597012A publication Critical patent/CN111597012A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种云环境设备自动发现的系统及方法,属于云的运维技术领域。本发明的设备发现管理旨在为云数据中心提供自动化的物理资源自动发现、运行状态监控、物理设备连接拓扑及状态显示等方面的能力,具体包括新上线的自动发现、设备的配置和状态变更发现、设备运行状态的监控,设备连接关系及状态可视化、设备资产管理等。本专利能满足多设备种类的管理需求,覆盖所有相关物理/虚拟化设备,主要提供计算、存储、网络设备等不同类型设备的上下线自动发现、设备软硬件配置变更自动发现等,主要包括物理服务器发现和网络设备发现。还能满足不同设备种类不同的设备发现方式,包含不仅限于数据链路层、网络层、应用层等方式。

Description

一种云环境设备自动发现的系统及方法
技术领域
本专利涉及云的运维技术领域,具体的说,是一种云环境设备自动发现的系统及方法。
背景技术
以虚拟化和资源池化为基础的云计算技术大量应用于政府、企业、互联网等各行各业的数据中心,提供对计算、网络、存储等各种物理资源的灵活在线管理,大幅降低了资源的浪费,提高了资源的利用效率。传统数据中心的业务一般属于静态部署模式,一次部署长期使用,除非业务故障、业务升级或业务周期结束才需要进行人工干预进行资产、资源的维护和配置,然而这种需要大量人工干预的传统资产、资源管理模式对于现代云数据中心的需求则难以胜任。
云计算技术具有如下特点:
灵活性:云计算业务的灵活且在线的分配与回收必然要求云数据中心提供在线的设备监控和管理能力,云上业务的部署将依据实际物理资源的使用情况进行灵活调度,可保证在满足业务需求的情况下最大限度提高云数据中心物理资源利用效率。
动态性:云数据中心的业务复杂多变,不同业务对资源的需求不同且可能动态变化,业务持续的时间不同,业务访问模型也不同,这就要求云数据中心能够根据业务的需求曲线模型对云上业务提供物理资源的动态分配与回收能力。
可扩展性:随着业务需求和业务规模的不断增长,云数据中心的规模也需要进行相应的扩展,大量旧的设备升级或者新的设备上线,传统的基于人工的资源和资产信息维护手段难以满足云数据中心的需求,需要一套资产、资源等信息自动、在线的维护机制,为云数据中心管理系统提供实时的资产、资源信息查询、配置和管理能力。
在云中心中有大量的设备,日常维护中需要对这些设备进行生命周期的管理,并且为了对设备的变更有记录可审计,满足云数据中心对于资产、资源管理的灵活性、动态性、扩展性等需求,提供资源的自动化管理能力,迫切需要一套针对数据中心内计算、存储、网络等物理资源的在线自动管理系统,提供诸如新上线设备的自动发现、旧设备的升级、设备运行状态的监控、设备配置管理等等功能。
发明内容
本发明的技术任务是解决现有技术的不足,提供一种云环境设备自动发现的系统及方法。
本发明解决其技术问题所采用的技术方案是:
1、本发明提供一种云环境设备自动发现的系统,该系统位于物理基础设施层以上、云管理和云平台层以下,对各层开放接口,各层通过相应接口获取服务器和网络设备的软硬件配置信息和运行状态信息,基于以上信息进行相关业务或流程的优化;
其内部结构包括:设备发现模块、设备状态监控模块、设备可视化模块、设备资产映射模块;
其中设备发现模块提供计算、存储、网络设备不同类型设备的上下线自动发现、设备软硬件配置变更自动发现;
其中设备状态监控模块是用于搜集与设备运行相关的配置参数和运行数据,包括服务器状态监控和网络设备状态监控;
其中设备可视化模块用于查看云数据中心的设备情况和运行情况,包括服务器和网络设备基本配置信息可视化、云数据中心网络设备与服务器的连接关系可视化(网络物理拓扑连接关系)、服务器和网络设备当前运行状态查看与历史运行状态可视化、服务器和网络设备历史事件可视化(如设备或服务器上、下线事件);
其中设备资产映射模块是从另一个维度对数据中心设备资源进行跟踪和管理的一种方式,与资源管理不同的是,设备资产管理一般不参与云数据中心的实际资源管理(如分配与回收),而是作为设备资产在生命周期内使用轨迹进行跟踪的一种手段;
上述设备发现模块、设备状态监控模块分别与DDM数据库相连,设备发现模块、设备状态监控模块与DDM数据库通过北向接口连接设备资产映射模块,北向接口还与设备可视化模块、ICP/CMS相连。
可选地,所述设备发现模块包括物理服务器发现和网络设备发现,对于网络设备中的非连接性设备在实现时根据各自的具体情况分别对待;
其中物理服务器包括计算节点服务器、存储节点服务器、网络节点服务器;
其中网络设备包括交换机、路由器、物理防火墙、物理负载均衡器、物理VPN网关;
其中所述非连接性设备包括物理防火墙、物理负载均衡器、物理VPN网关。
可选地,所述服务器发现具体分以下两个阶段:
第一阶段是云环境部署阶段的服务器发现,这个阶段主要是在云环境正式部署之前进行服务器基本信息的搜集,可为云环境部署提供优化的部署方案参考,通过对服务器物理配置信息的搜集可以很容易的得出哪些服务器适合部署计算节点、哪些适合部署存储节点、哪些适合部署网络节点或控制节点,从而可实现云环境的最佳部署;
第二个阶段是云环境运行阶段的服务器软硬件配置变更发现,这个阶段主要是通过某种策略,如轮询或消息通知机制,将服务器的软硬件配置变化信息通告给相关模块,以便重新进行数据中心资源的重新配置或优化,并将变更后的软硬件配置信息更新到相关数据库中。
可选地,所述服务器发现分为以下几种场景:
a)云环境部署阶段服务器信息搜集
云环境部署阶段,部署模块首先通过PXE向服务器注入包含服务器配置信息搜集模块的微内核,部署模块根据搜集到的服务器硬件配置信息列表决策出合理的部署方案进行部署;
b)服务器物理配置变更
随着云数据中心业务发展,有时需要对已有物理服务器硬件设备进行相关更换、升级或扩展,以满足新的业务需求,需要实时监测数据中心各服务器的软硬件配置信息变化,及时更新和同步到相关数据库中;
c)服务器上线
云数据中心运行过程中,由于业务需求的上升或数据中心规模的扩展,经常会有新服务器上线运行或旧的服务器重新开机,需要监测新服务器的上线行为以及原有离线服务器的重新上线行为,并将上线服务器的相关软硬件配置信息写入数据库中;
d)服务器下线
云数据中心运行过程中,由于业务需求的下降或是其它某种原因(如虚机迁移的节能降耗、线上云服务的潮汐资源需求、陈旧设备淘汰等),经常需要人为下线部分服务器,还有些服务器可能由于软硬件故障等原因而被动下线,需要有效监控到服务器的下线行为,并更新相关数据库信息,向周边相关模块触发服务器下线通知。
可选地,所述网络设备发现分为以下三种场景,一是网络设备上线,二是网络设备离线,三是网络设备连接状态发生变化;
a)网络新设备上线
新机架的上线运行或原有网络设备的重新上电运行都会触发网络设备的上线行为,因此需要自动发现新上线的网络设备,并更新相关数据库中的信息;
b)网络设备离线
网络设备运维、升级或设备故障,会出发网络设备的离线行为,需要及时发现离线的网络设备,更新相关数据库中的信息,并向周边模块触发网络设备离线通知;
c)网络设备连接状态变化
网络设备的连接关系(物理拓扑连接关系)在云数据中心运营过程中可能也会经常变化,如服务器的上线和下线就会带来网络端口连接关系的建立和拆除行为,需要监测网络设备的连接状态变化,掌握数据中心网络的全局连接情况,为后续优化和自动化故障定位奠定基础。
可选地,所述设备状态监控模块分为以下几种场景:
a)服务器状态监控
主要监控服务器的CPU、内存、磁盘、网卡等资源的配置情况,以及在运行过程中这些资源的实际使用情况和运行状态,并将监控结果写入相关数据库中;
b)网络设备状态监控
主要监控网络设备的CPU、内存、磁盘、网络接口资源和一些辅助资源(如风扇、电源)的配置信息,以及在运行过程中这些资源的实际使用情况和运行状态,并将监控结果写入相关数据库中。
2、本发明另提供一种云环境设备自动发现的方法,基于以上系统,云数据中心提供自动化的物理资源自动发现、运行状态监控、物理设备连接拓扑及状态显示等方面的能力,具体包括新上线的自动发现、设备的配置和状态变更发现、设备运行状态的监控,设备连接关系及状态可视化、设备资产管理等,并将相关数据写入永久数据库以便后续与云平台其它组件相结合进行云计算系统的多目标组合优化。
可选地,其主要实现步骤为:
a)设备发现主要提供计算、存储、网络设备等不同类型设备的上下线自动发现、设备软硬件配置变更自动发现等,主要包括物理服务器发现(如计算节点服务器、存储节点服务器、网络节点服务器等)和网络设备发现(如交换机、路由器、物理防火墙、物理负载均衡器、物理VPN网关等),对于网络设备中的非连接性设备(如物理防火墙、物理负载均衡器、物理VPN网关)在实现时可根据各自的具体情况分别对待;
b)网络设备的发现分为三种场景,一是网络设备上线,二是网络设备离线,三是网络设备连接状态发生变化;
c))搜集与设备运行相关的配置参数和运行数据,包括服务器状态监控和网络设备状态监控;
d))查看云数据中心的设备情况和运行情况,提供设备可视化能力,包括服务器和网络设备基本配置信息可视化、云数据中心网络设备与服务器的连接关系可视化(网络物理拓扑连接关系)、服务器和网络设备当前运行状态查看与历史运行状态可视化、服务器和网络设备历史事件可视化(如设备或服务器上、下线事件等);
e)数据中心物理资源的使用情况与资产管理系统结合起来,跟踪数据中心内资产的使用轨迹。
本发明的一种云环境设备自动发现的系统及方法与现有技术相比所产生的有益效果是:
本发明的设备发现管理旨在为云数据中心提供自动化的物理资源自动发现、运行状态监控、物理设备连接拓扑及状态显示等方面的能力,具体包括新上线的自动发现、设备的配置和状态变更发现、设备运行状态的监控,设备连接关系及状态可视化、设备资产管理等。
其一,本专利能满足多设备种类的管理需求,覆盖所有相关物理/虚拟化设备,主要提供计算、存储、网络设备等不同类型设备的上下线自动发现、设备软硬件配置变更自动发现等,主要包括物理服务器发现(如计算节点服务器、存储节点服务器、网络节点服务器等)和网络设备发现(如交换机、路由器、物理防火墙、物理负载均衡器、物理VPN网关等)。
其二,本专利能满足不同设备种类不同的设备发现方式,包含不仅限于数据链路层、网络层、应用层等ICMP、TCP、UDP、HTTP等方式。
其三,本专利结合云环境中的其他使用需求,把自动发现管理与其他运维系统和运维工作体系结合起来,作为人机交互的统一执行层,发挥更大的价值。
附图说明
为了更清楚地描述本发明一种云环境设备自动发现的系统及方法的工作原理,下面将附上简图作进一步说明。
附图1设备发现与云平台的关系示意图;
附图2内部结构及模块关系示意图;
附图3服务器发现基本流程图;
附图4网络设备发现基本流程图。
具体实施方式
下面将结合本发明实施例中的附图1-4,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的一种云环境设备自动发现的系统,整体架构与云平台及相关系统的逻辑结构关系如附图1所示。
本系统位于物理基础设施层以上、云管理和云平台层以下,对各层开放接口。各层可通过相应接口获取服务器和网络设备的软硬件配置信息和运行状态信息,利用这些信息进行相关业务或流程的优化,提高云数据中心的使用和运行效率。
设备自动发现DDM(Device Discovery Management)旨在为云数据中心提供自动化的物理资源自动发现、运行状态监控、物理设备连接拓扑及状态显示等方面的能力,具体包括新上线的自动发现、设备的配置和状态变更发现、设备运行状态的监控,设备连接关系及状态可视化、设备资产管理等,并将相关数据写入永久数据库以便后续与云平台其它组件相结合进行云计算系统的多目标组合优化。
设备自动发现内部结构及子模块关系如附图2所示,包括服务器发现模块、网络设备发现模块、服务器状态监控模块、网络设备状态监控模块、设备可视化模块、设备资产映射模块等模块,设备发现模块、设备状态监控模块分别与DDM数据库相连,设备发现模块、设备状态监控模块与DDM数据库通过北向接口连接设备资产映射模块,北向接口还与设备可视化模块、ICP/CMS相连。
a)服务器发现模块
服务器发现模块负责在ICP部署阶段搜集服务器基本硬件配置情况以及部署完成后的服务器上下线监测与配置变更发现等。服务器发现模块的基本功能可拆分为三个子模块;
1)集成了服务器配置搜集功能的PXE微内核;
2)服务器端配置发现代理子模块;
3)DDM服务后端的服务器发现子模块。
部署阶段可由PXE微内核直接搜集服务器相关信息给ICP部署模块使用,在后期运行阶段,则由服务器端配置发现代理子模块周期性将服务器端配置信息上报给DDM服务后端的服务器发现子模块,这样DDM后端就可以监测服务器的配置变更以及服务器上下线等事件,及时作出响应。
服务器发现模块承担服务器发现动态发现、以及将发现的服务器基本信息写入DDM数据的服务器基本配置表、CPU基本配置表、磁盘基本配置表、网卡基本配置表中。服务器发现模块分为两部分实现,一部分是位于DDM服务后端的服务器发现子模块,另一部分是位于服务器端的DDM服务器发现代理子模块。服务器代理将服务器的基本配置信息上报到DDM服务后端的服务器发现子模块,服务器发现子模块根据收到的消息将服务器基本配置数据写入相关数据库表中,同时将相关事件(如服务器上线、下线、配置变更等行为)记入事件表(如附图3所示)。
PXE启动阶段的服务发现发现是通过在PXE加载操作系统之前首先加载一个包含服务器配置发现代理的微内核,将服务器基本配置信息上报给DDM服务后端的服务器发现子模块,基本处理过程与运行阶段的服务器发现类似。
b)网络设备发现模块
网络设备发现模块负责发现和跟踪交换机、路由器等网络设备的上、下线和连接状态变更等行为。网络设备发现模块主要由三个子模块构成:1)网络设备扫描发现子模块;2)网络设备上、下线监测子模块;3)网络设备连接状态变更监测子模块。网络设备扫描发现子模块周期性扫描指定网段,获取该网络的网络设备列表。网络设备上、下线监测子模块利用周期性扫描到的网络设备列表进行差分运算,分别计算出上线和下线的设备列表。网络设备连接状态变更监测子模块周期性通过SNMP获取网络设备的LLDP邻居关系信息,通过差分运算计算邻居关系变更列表。
网络设备发现模块是通过SNMP协议扫描发现在线的网络设备和LLDP协议发现网络设备连接关系,因此支持网络设备自动发现的前提是:在网络设备上开启SNMP读权限、使能LLDP协议。网络设备发现模块通过SNMP扫描获得在线网络设备地址列表,根据该地址列表周期性轮询各设备的基本配置信息和LLDP邻居关系,将结果写入相关DDM数据库。根据前后两次轮询结果的比较,可以发现哪些设备新上线、哪些设备已下线、哪些设备的连接关系发生变化,并将相应事件记入DDM事件数据库中(如附图4所示)。
由于SNMP协议本身的不可靠以及其承载协议UDP也不可靠,SNMP取到的信息可能也是不可靠的,在代码实现是需要尽量消除不可靠的因素,丢弃不可靠的数据,具体实现方法是:1)对同一数据获取两次以上,若数据是收敛的,则认为可靠,否则不可靠;2)对于变化的数据,需要待其变化收敛后再取其值,否则放弃本周期的轮询值。
c)服务器监控模块
服务器监控模块负责在运行阶段采集服务器的实际运行状态。服务器监控模块包括两个子模块:1)服务器端的运行状态采集代理子模块;2)DDM服务后台的运行状态采集子模块。服务器端的运行状态采集代理子模块安装部署在服务器上,周期性采集当前服务器的实际运行状态,并上报给DDM服务器后台的运行状态采集子模块,由后者将数据记入DDM数据库的相应表中,并根据配置策略决定是否触发相应事件(如CPU告警、磁盘告警等)。
服务器监控模块也是包含DDM后端与服务器侧代理两个部分,服务器侧代理周期性搜集服务器的运行状态信息,上报给DDM服务器监控后端进行处理,并将处理结果写入DDM数据库中。
服务器侧监控代理与服务器发现代理可统一打包部署在服务器侧,或者直接在一个进程里面开启两个线程服务,实现两种代理的功能,具体实现方式在编码时可根据实际情况灵活掌握。
d)网络设备监控模块
网络设备监控模块负责在运行阶段采集网络设备的实际运行状态。网络设备监控模块通过SNMP协议周期性采集远端网络设备的运行状态数据,并记入DDM数据库的相应表中,并根据配置策略决定是否触发相应事件(如CPU告警、带宽告警等)。
网络设备监控模块通过SNMP协议周期性获取各网络设备对的运行状态,并记入DDM数据库的相应表中。由于SNMP协议本身的不可靠性以及其承载协议UDP的不可靠性,网络设备监控数据的获取也不一定可靠,有是可能获取不完整。由于网络设备运行状态时刻在发生变化,无法通过差分方式获取收敛的运行状态数据,网络设备监控数据需要巡检校对。
e)设备可视化模块
设备可视化模块负责从DDM数据库中获取服务器、网络设备的可视化数据,如拓扑连接关系数据、运行状态数据、基本配置数据等,在前端界面呈现给用户。设备可视化模块通过REST API远程调用DDM北向接口获取相关数据,因此其部署位置可与DDM后端服务独立,理论上可部署在任意节点上或已有平台的可视化节点上(如ICP平台的前端组件中)。
f)设备资产映射模块
设备资产映射模块负责将设备的资源属性与资产属性关联起来,当新的服务器或网络设备上线时,设备资产映射模块根据设备序列号从外部资产数据库中读取该设备的资产编号等信息,记入DDM数据库的相关表中,保持服务器、网络设备等资产在生命周期内的有效跟踪。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种云环境设备自动发现的系统,其特征在于,该系统位于物理基础设施层以上、云管理和云平台层以下,对各层开放接口,各层通过相应接口获取服务器和网络设备的软硬件配置信息和运行状态信息,基于以上信息进行相关业务或流程的优化;
其内部结构包括:设备发现模块、设备状态监控模块、设备可视化模块、设备资产映射模块;
其中设备发现模块提供计算、存储、网络设备不同类型设备的上下线自动发现、设备软硬件配置变更自动发现;
其中设备状态监控模块是用于搜集与设备运行相关的配置参数和运行数据,包括服务器状态监控和网络设备状态监控;
其中设备可视化模块用于查看云数据中心的设备情况和运行情况,包括服务器和网络设备基本配置信息可视化、云数据中心网络设备与服务器的连接关系可视化、服务器和网络设备当前运行状态查看与历史运行状态可视化、服务器和网络设备历史事件可视化;
其中设备资产映射模块是从另一个维度对数据中心设备资源进行跟踪和管理的一种方式,与资源管理不同的是,设备资产管理一般不参与云数据中心的实际资源管理,而是作为设备资产在生命周期内使用轨迹进行跟踪的一种手段;
上述设备发现模块、设备状态监控模块分别与DDM数据库相连,设备发现模块、设备状态监控模块与DDM数据库通过北向接口连接设备资产映射模块,北向接口还与设备可视化模块、ICP/CMS相连。
2.根据权利要求1所述的一种云环境设备自动发现的系统,其特征在于,所述设备发现模块包括物理服务器发现和网络设备发现,对于网络设备中的非连接性设备在实现时根据各自的具体情况分别对待;
其中物理服务器包括计算节点服务器、存储节点服务器、网络节点服务器;
其中网络设备包括交换机、路由器、物理防火墙、物理负载均衡器、物理VPN网关;
其中所述非连接性设备包括物理防火墙、物理负载均衡器、物理VPN网关。
3.根据权利要求1所述的一种云环境设备自动发现的系统,其特征在于,所述服务器发现具体分以下两个阶段:
第一阶段是云环境部署阶段的服务器发现,这个阶段主要是在云环境正式部署之前进行服务器基本信息的搜集,可为云环境部署提供优化的部署方案参考,通过对服务器物理配置信息的搜集可以很容易的得出哪些服务器适合部署计算节点、哪些适合部署存储节点、哪些适合部署网络节点或控制节点,从而可实现云环境的最佳部署;
第二个阶段是云环境运行阶段的服务器软硬件配置变更发现,这个阶段主要是通过某种策略,将服务器的软硬件配置变化信息通告给相关模块,以便重新进行数据中心资源的重新配置或优化,并将变更后的软硬件配置信息更新到相关数据库中。
4.根据权利要求1所述的一种云环境设备自动发现的系统,其特征在于,所述服务器发现分为以下几种场景:
a)云环境部署阶段服务器信息搜集
云环境部署阶段,部署模块首先通过PXE向服务器注入包含服务器配置信息搜集模块的微内核,部署模块根据搜集到的服务器硬件配置信息列表决策出合理的部署方案进行部署;
b)服务器物理配置变更
随着云数据中心业务发展,有时需要对已有物理服务器硬件设备进行相关更换、升级或扩展,以满足新的业务需求,需要实时监测数据中心各服务器的软硬件配置信息变化,及时更新和同步到相关数据库中;
c)服务器上线
云数据中心运行过程中,由于业务需求的上升或数据中心规模的扩展,经常会有新服务器上线运行或旧的服务器重新开机,需要监测新服务器的上线行为以及原有离线服务器的重新上线行为,并将上线服务器的相关软硬件配置信息写入数据库中;
d)服务器下线
云数据中心运行过程中,由于业务需求的下降或是其它某种原因,经常需要人为下线部分服务器,还有些服务器可能由于软硬件故障等原因而被动下线,需要有效监控到服务器的下线行为,并更新相关数据库信息,向周边相关模块触发服务器下线通知。
5.根据权利要求1所述的一种云环境设备自动发现的系统,其特征在于,所述网络设备发现分为以下三种场景,一是网络设备上线,二是网络设备离线,三是网络设备连接状态发生变化;
a)网络新设备上线
新机架的上线运行或原有网络设备的重新上电运行都会触发网络设备的上线行为,因此需要自动发现新上线的网络设备,并更新相关数据库中的信息;
b)网络设备离线
网络设备运维、升级或设备故障,会出发网络设备的离线行为,需要及时发现离线的网络设备,更新相关数据库中的信息,并向周边模块触发网络设备离线通知;
c)网络设备连接状态变化
网络设备的连接关系(物理拓扑连接关系)在云数据中心运营过程中可能也会经常变化,如服务器的上线和下线就会带来网络端口连接关系的建立和拆除行为,需要监测网络设备的连接状态变化,掌握数据中心网络的全局连接情况,为后续优化和自动化故障定位奠定基础。
6.根据权利要求1所述的一种云环境设备自动发现的系统,其特征在于,所述设备状态监控模块分为以下几种场景:
a)服务器状态监控
主要监控服务器的CPU、内存、磁盘、网卡等资源的配置情况,以及在运行过程中这些资源的实际使用情况和运行状态,并将监控结果写入相关数据库中;
b)网络设备状态监控
主要监控网络设备的CPU、内存、磁盘、网络接口资源和一些辅助资源的配置信息,以及在运行过程中这些资源的实际使用情况和运行状态,并将监控结果写入相关数据库中。
7.根据权利要求1所述的一种云环境设备自动发现的方法,其特征在于,基于权利要求1所述的系统,云数据中心提供自动化的物理资源自动发现、运行状态监控、物理设备连接拓扑及状态显示等方面的能力,具体包括新上线的自动发现、设备的配置和状态变更发现、设备运行状态的监控,设备连接关系及状态可视化、设备资产管理等,并将相关数据写入永久数据库以便后续与云平台其它组件相结合进行云计算系统的多目标组合优化。
8.根据权利要求1所述的一种云环境设备自动发现的方法,其特征在于,其主要实现步骤为:
a)设备发现主要提供计算、存储、网络设备等不同类型设备的上下线自动发现、设备软硬件配置变更自动发现等,主要包括物理服务器发现和网络设备发现,对于网络设备中的非连接性设备在实现时可根据各自的具体情况分别对待;
b)网络设备的发现分为三种场景,一是网络设备上线,二是网络设备离线,三是网络设备连接状态发生变化;
c))搜集与设备运行相关的配置参数和运行数据,包括服务器状态监控和网络设备状态监控;
d))查看云数据中心的设备情况和运行情况,提供设备可视化能力,包括服务器和网络设备基本配置信息可视化、云数据中心网络设备与服务器的连接关系可视化、服务器和网络设备当前运行状态查看与历史运行状态可视化、服务器和网络设备历史事件可视化;
e)数据中心物理资源的使用情况与资产管理系统结合起来,跟踪数据中心内资产的使用轨迹。
CN202010417718.6A 2020-05-18 2020-05-18 一种云环境设备自动发现的系统及方法 Pending CN111597012A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010417718.6A CN111597012A (zh) 2020-05-18 2020-05-18 一种云环境设备自动发现的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010417718.6A CN111597012A (zh) 2020-05-18 2020-05-18 一种云环境设备自动发现的系统及方法

Publications (1)

Publication Number Publication Date
CN111597012A true CN111597012A (zh) 2020-08-28

Family

ID=72185716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010417718.6A Pending CN111597012A (zh) 2020-05-18 2020-05-18 一种云环境设备自动发现的系统及方法

Country Status (1)

Country Link
CN (1) CN111597012A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112383430A (zh) * 2020-11-12 2021-02-19 重庆远臻科技有限公司 一种优化拓扑性能结构的混构聚合图显装置
CN112508533A (zh) * 2020-12-17 2021-03-16 北京华胜天成科技股份有限公司 一种it资源设备在线盘点系统
CN112822293A (zh) * 2021-02-24 2021-05-18 紫光云技术有限公司 一种公有云网络设备的连接信息同步方法
CN113411378A (zh) * 2021-05-26 2021-09-17 深圳万物安全科技有限公司 基于事件触发的资产管理方法、系统及计算机可读介质
CN113708961A (zh) * 2021-08-20 2021-11-26 珠海格力电器股份有限公司 迁移设备的方法、装置、系统及存储介质
CN114124989A (zh) * 2021-09-28 2022-03-01 山东中创软件商用中间件股份有限公司 一种设备监控方法、装置、设备及存储介质
CN114844821A (zh) * 2022-05-07 2022-08-02 深圳市智象科技有限公司 网络自动发现方法、装置、设备及存储介质
US11412044B1 (en) 2021-12-14 2022-08-09 Micro Focus Llc Discovery of resources in a virtual private cloud
CN116089392A (zh) * 2022-09-17 2023-05-09 新疆维吾尔自治区信息中心 一种信息系统评估建库系统及方法
CN116541261A (zh) * 2023-07-06 2023-08-04 成都睿的欧科技有限公司 一种基于云资源监测的资源管理方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105227397A (zh) * 2015-09-02 2016-01-06 广东欧珀移动通信有限公司 设备发现方法、主设备、从设备及相应系统
US20160182302A1 (en) * 2014-12-23 2016-06-23 Intel Corporation Device discovery using discovery nodes
CN106506717A (zh) * 2016-10-24 2017-03-15 杭州华为数字技术有限公司 一种自动发现方法及设备
US9742639B1 (en) * 2013-08-20 2017-08-22 Cavirin Systems, Inc. Intelligent network resource discovery and monitoring
CN107294764A (zh) * 2017-04-26 2017-10-24 中国科学院信息工程研究所 智能监管方法和智能监管系统
CN107566165A (zh) * 2017-08-18 2018-01-09 国网山东省电力公司信息通信公司 一种发现及部署电力云数据中心可用资源的方法及系统
CN108400915A (zh) * 2018-03-20 2018-08-14 四川长虹电器股份有限公司 一种智能家居设备管理系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9742639B1 (en) * 2013-08-20 2017-08-22 Cavirin Systems, Inc. Intelligent network resource discovery and monitoring
US20160182302A1 (en) * 2014-12-23 2016-06-23 Intel Corporation Device discovery using discovery nodes
CN105227397A (zh) * 2015-09-02 2016-01-06 广东欧珀移动通信有限公司 设备发现方法、主设备、从设备及相应系统
CN106506717A (zh) * 2016-10-24 2017-03-15 杭州华为数字技术有限公司 一种自动发现方法及设备
CN107294764A (zh) * 2017-04-26 2017-10-24 中国科学院信息工程研究所 智能监管方法和智能监管系统
CN107566165A (zh) * 2017-08-18 2018-01-09 国网山东省电力公司信息通信公司 一种发现及部署电力云数据中心可用资源的方法及系统
CN108400915A (zh) * 2018-03-20 2018-08-14 四川长虹电器股份有限公司 一种智能家居设备管理系统及方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112383430A (zh) * 2020-11-12 2021-02-19 重庆远臻科技有限公司 一种优化拓扑性能结构的混构聚合图显装置
CN112508533A (zh) * 2020-12-17 2021-03-16 北京华胜天成科技股份有限公司 一种it资源设备在线盘点系统
CN112822293A (zh) * 2021-02-24 2021-05-18 紫光云技术有限公司 一种公有云网络设备的连接信息同步方法
CN113411378A (zh) * 2021-05-26 2021-09-17 深圳万物安全科技有限公司 基于事件触发的资产管理方法、系统及计算机可读介质
CN113708961A (zh) * 2021-08-20 2021-11-26 珠海格力电器股份有限公司 迁移设备的方法、装置、系统及存储介质
CN114124989A (zh) * 2021-09-28 2022-03-01 山东中创软件商用中间件股份有限公司 一种设备监控方法、装置、设备及存储介质
US11412044B1 (en) 2021-12-14 2022-08-09 Micro Focus Llc Discovery of resources in a virtual private cloud
CN114844821A (zh) * 2022-05-07 2022-08-02 深圳市智象科技有限公司 网络自动发现方法、装置、设备及存储介质
CN114844821B (zh) * 2022-05-07 2023-10-31 深圳市智象科技有限公司 网络自动发现方法、装置、设备及存储介质
CN116089392A (zh) * 2022-09-17 2023-05-09 新疆维吾尔自治区信息中心 一种信息系统评估建库系统及方法
CN116089392B (zh) * 2022-09-17 2024-03-08 新疆维吾尔自治区信息中心 一种信息系统评估建库系统及方法
CN116541261A (zh) * 2023-07-06 2023-08-04 成都睿的欧科技有限公司 一种基于云资源监测的资源管理方法及系统
CN116541261B (zh) * 2023-07-06 2023-09-05 成都睿的欧科技有限公司 一种基于云资源监测的资源管理方法及系统

Similar Documents

Publication Publication Date Title
CN111597012A (zh) 一种云环境设备自动发现的系统及方法
CN105933448B (zh) 一种自管理的微服务架构及其服务方法
KR101513408B1 (ko) 통신 환경에서의 동적 신뢰도 및 보안 제공
CN107959588A (zh) 数据中心的云资源管理方法、云资源管理平台和管理系统
CN107070726A (zh) 一种基于mdc的综合管理方法
US20220052923A1 (en) Data processing method and device, storage medium and electronic device
US7974211B2 (en) Methods and apparatus for network configuration baselining and restoration
EP3477894A1 (en) Method and device for controlling virtualized broadband remote access server (vbras), and communication system
CN109379217A (zh) 一种城域网异厂家业务编排器
CN114518934A (zh) 一种统一运维平台架构系统
CN110580198A (zh) OpenStack计算节点自适应切换为控制节点的方法及装置
CN109495501B (zh) 网络安全动态资产管理系统
CN117389830A (zh) 集群日志采集方法、装置、计算机设备及存储介质
CN114338670B (zh) 一种边缘云平台和具有其的网联交通三级云控平台
CN114510391A (zh) 一种融合基础架构监控管理系统
CN104601378A (zh) 结合应用性能指标监控数据的虚拟资源弹性调度实现方法
CN109981377A (zh) 一种分布式数据中心链路监控方法及系统
CN112671586B (zh) 一种业务配置自动迁移和保障方法及装置
CN110196721B (zh) 一种互联网数据中心管理方法、系统及介质
CN116723077A (zh) 一种分布式it自动化运维系统
CN113824801B (zh) 一种智能融合终端统一接入管理组件系统
CN110221929A (zh) 一种服务化软件系统架构及其应用方法
CN113472849A (zh) 一种节点的管理方法、系统、设备以及介质
CN109150941B (zh) 一种数据中心物理资源浮动方法
CN106452971B (zh) 一种基于分布式集群系统的监控网口检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200828

RJ01 Rejection of invention patent application after publication