CN112214377B - 一种设备管理方法及系统 - Google Patents

一种设备管理方法及系统 Download PDF

Info

Publication number
CN112214377B
CN112214377B CN202011135441.4A CN202011135441A CN112214377B CN 112214377 B CN112214377 B CN 112214377B CN 202011135441 A CN202011135441 A CN 202011135441A CN 112214377 B CN112214377 B CN 112214377B
Authority
CN
China
Prior art keywords
node
equipment
state
slave
local
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011135441.4A
Other languages
English (en)
Other versions
CN112214377A (zh
Inventor
奚冰青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Security Technologies Co Ltd
Original Assignee
New H3C Security Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Security Technologies Co Ltd filed Critical New H3C Security Technologies Co Ltd
Priority to CN202011135441.4A priority Critical patent/CN112214377B/zh
Publication of CN112214377A publication Critical patent/CN112214377A/zh
Application granted granted Critical
Publication of CN112214377B publication Critical patent/CN112214377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs

Abstract

本发明公开了一种设备管理方法及系统方法包括:集群系统中的主节点接收控制器的下发配置请求后,将配置信息和设备标识存储到集群系统上;主节点或从节点监听到集群系统中有与各自连接设备的设备标识对应的配置信息时,在集群系统上标记监听到的配置信息的状态为正在下发,并在将配置信息成功下发到对应的设备后,在集群系统中删除配置信息。通过在控制器与设备之间增加一个集群系统,以解决控制器与设备的耦合性问题,并且集群系统中的主节点将设备的配置存储在集群系统中,同时配置下发会标记状态,即使中途节点故障,配置信息仍然存储在集群系统中,通过查询标记状态即可获取到,因此不会出现配置丢失的问题,增强了整体的高可用性。

Description

一种设备管理方法及系统
技术领域
本发明涉及通信技术领域,具体涉及一种设备管理方法及系统。
背景技术
传统的设备管理方式是由运维人员通过终端登录到设备,以命令行或图形界面的方式进行管理,随着互联网和软件定义网络的发展,有越来越多的网络设备需要管理,传统方式已无法满足用户的需求,因此通过控制器来远程管理设备越来越成为智能运维的首先方式。
目前,控制器与各个设备建立远程连接,该远程连接一般为基于TCP的长连接,从而控制器直接调用设备提供的配置接口,并通过该远程连接向设备下发配置,当该远程连接断开后,控制器会不断的重试与设备建立连接,此时如果有配置正在下发,那么将会导致配置无法下发到设备而丢失的问题,并且控制器直接调用设备提供的配置接口进行配置下发,与设备的耦合性比较大。
发明内容
本发明的目的是针对上述现有技术的不足提出的一种设备管理方法及系统,该目的是通过以下技术方案实现的。
本发明的第一方面提出了一种设备管理方法,应用于控制器和设备之间的集群系统,所述集群系统包括主节点和从节点,所述方法包括:
所述主节点接收控制器的下发配置请求后,将所述下发配置请求携带的第一配置信息和设备标识存储到本地和所述从节点上;
所述主节点在监听到本地存在与自身连接设备的设备标识对应的第二配置信息时,在本地和所述从节点上标记所述第二配置信息的状态为正在下发,并在将第二配置信息成功下发到对应的设备上后,从本地和所述从节点中删除所述第二配置信息和对应的状态;
所述从节点在监听到本地存在与自身连接设备的设备标识对应的第三配置信息时,在本地和所述主节点上标记所述第三配置信息的状态为正在下发,并在将第三配置信息成功下发到对应的设备上后,从本地和所述主节点中删除第三配置信息和对应的状态。
本发明的第二方面提出了一种设备管理系统,所述系统包括:
控制器,用于向集群系统发送下发配置请求;
所述集群系统中的主节点,用于将接收到的下发配置请求携带的第一配置信息和设备标识存储到本地和所述集群系统中的从节点上;
所述主节点,用于在监听到本地存在与自身连接设备的设备标识对应的第二配置信息时,在本地和所述从节点上标记所述第二配置信息的状态为正在下发,并在将第二配置信息成功下发到对应的设备上后,从本地和所述从节点中删除所述第二配置信息和对应的状态;
所述从节点,用于在监听到本地存在与自身连接设备的设备标识对应的第三配置信息时,在本地和所述主节点上标记所述第三配置信息的状态为正在下发,并在将第三配置信息成功下发到对应的设备上后,从本地和所述主节点中删除第三配置信息和对应的状态。
基于上述第一方面和第二方面所述的设备管理方法及系统,本发明具有的有益效果如下:
通过在控制器与设备之间增加一个集群系统,控制器针对设备的所有配置在这个集群系统中统一处理,以解决控制器与设备之间的耦合性问题,并且集群系统中的主节点将设备的配置存储在集群系统中各个节点上,同时配置下发会标记状态,即使中途节点故障,配置信息仍然存储在集群系统中,通过查询标记状态即可获取到,因此不会出现配置丢失的问题,增强了整体的高可用性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明根据一示例性实施例示出的一种设备管理系统结构示意图;
图2为本发明根据一示例性实施例示出的一种设备管理方法的实施例流程图;
图3为本发明根据一示例性实施例示出的另一种设备管理系统结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的系统和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
目前,控制器的单个计算节点与设备建立远程连接,当设备与控制器处于连接状态时,控制器通过该连接给设备下发配置;当连接断开后,控制器会不断的重试与设备建立连接,如果此时有配置正在下发且还没有成功下发到设备上,将会导致配置丢失,并且控制器直接调用设备提供的配置接口进行配置下发,与设备的耦合性比较大,而不同厂商提供的配置接口往往是不同的,因而控制器需要直接适配不同的厂商提供的配置接口。
为解决上述技术问题,本申请提出一种改进的设备管理系统,如图1所示,控制器通过一个集群系统与设备连接,以解决控制器与设备之间的耦合性问题,该集群系统即为一种设备管理中间件,控制器针对设备的所有配置在这个中间件中统一处理,并且也便于做配置的审计和订阅分析。
在本申请中,控制器与设备之间的集群系统为使用一致性算法(例如Paxos算法)构建的一种分布式存储集群系统,其中包括有由一致性算法选举的主节点(master节点),其余节点为从节点(slave节点),由于一致性算法的选举原则为一半以上通过,为了避免出现选举冲突,集群系统中的节点个数为奇数,集群系统中的这些节点指的是具有中央处理器、内存、硬盘、网卡等组件的计算机节点,具有计算、网络通信和存储能力的计算机或专用服务器。另外,控制器指的是运行在管理设备上的具有设备管理能力的管理系统。
集群系统中的主节点用于接收控制器的下发配置请求,并将下发配置请求中的第一配置信息和设备标识存储到本地和从节点上,从而,主节点实时监听是否存在与自身连接设备的设备标识对应的第二配置信息,如果有,则在本地和从节点上先标记第二配置信息的状态为正在下发,并在将第二配置信息成功下发到对应的设备上后,从本地和从节点中删除第二配置信息和对应的状态,同理,从节点也实时监听是否存在与自身连接设备的设备标识对应的第三配置信息,如果有,则在本地和主节点上先标记第三配置信息的状态为正在下发,并在将第三配置信息成功下发到对应的设备上后,从本地和主节点中删除第三配置信息和对应的状态。这样即使配置中途节点故障,配置信息仍然存储在集群系统中,不会因为一个节点故障而导致配置丢失,从而解决了配置丢失问题,增强了整体的高可用性。
其中,控制器管理的设备均属于网络基础设施中的网络设备,例如防火墙、交换机、路由器、负载均衡器等,这些网络设备一般使用支持netconf协议、openflow协议和restful API协议等进行配置管理。本申请中所涉及的配置信息指的是控制器要下发到网络设备的命令,用于指示这些设备进行接口管理、流量转发、报文检测等。
在一些实施例中,集群系统中的主节点还用于接收控制器的添加设备请求时,从本地存储的各个节点的设备连接数中选取一个设备连接数最小的节点,并将选取的节点的节点标识和添加设备请求中的第一设备连接信息存储到本地和从节点上,并标记第一设备连接信息的状态为待连接;从而,主节点在监听到本地存在与自身节点标识对应的状态为待连接的第二设备连接信息时,利用第二设备连接信息与待添加设备建立连接,并在本地和从节点上更新第二设备连接信息的状态为已连接,同理,从节点也在监听到本地存在与自身节点标识对应的状态为待连接的第三设备连接信息时,利用第三设备连接信息与待添加设备建立连接,并在本地和主节点上更新第三设备连接信息的状态为已连接。
由此可见,通过在集群系统中存储所有节点的设备连接数,在为设备分配管理的节点时通过负载均衡法,使得相对平均的将设备分配给各个节点,提高了系统节点的利用率,解决了单个计算节点的负载大的问题。
可以理解的是,对于主节点或从节点在利用设备连接信息与设备建立连接时,可以启动一个线程,进而通过该线程利用该设备连接信息与待添加设备建立连接,并将线程编号对应设备连接信息存储到集群系统的各个节点上。从而由集群系统中各个节点分配的线程适配设备提供的配置接口,可以解除控制器与设备之间的耦合性。
示例性的,上述所描述的第一设备连接信息至第三设备连接信息可以包括设备的管理IP(Internet Protocol,网际互连协议)地址、用户名、密码、MAC(Media AccessControl Address,媒体存取控制位址)地址等信息,在为其分配节点并建立连接后,集群系统各个节点中还会存储与设备连接信息对应的节点标识和线程编号。
其中,本申请涉及的设备标识指的是设备的唯一标识,其可以是设备的管理IP地址,也可以是设备的MAC地址,本申请对此并不限定。
需要说明的是,集群系统各个节点上存储的节点标识和线程编号为临时数据,如果线程异常退出或整个节点故障,设备连接信息仍然存储在集群系统各个节点中,而节点标识和线程编号均会被删除,同时设备连接信息的状态也会变为待连接。
在一些实施例中,集群系统中的主节点还用于接收控制器的删除设备请求时,获取删除设备请求携带的设备标识,并将本地和从节点上存储的设备标识对应的第四设备连接信息的状态标记为待删除,从而,主节点在监听到本地存在与自身节点标识对应的状态为待删除的第五设备连接信息时,根据第五设备连接信息断开与待删除设备的连接,同理,从节点在监听到本地存在与自身节点标识对应的状态为待删除的第六设备连接信息时,根据第六设备连接信息断开与待删除设备的连接。
基于上述添加设备的过程描述,可以理解的是,对于主节点或从节点在利用设备连接信息断开与设备的连接时,可以通过获取设备连接信息对应的线程编号,并通过、线程编号对应的线程关闭与待删除设备的连接后,关闭线程。
在一些实施例中,集群系统中的主节点还用于接收控制器的查询请求后,在本地查找与查询请求携带的设备标识对应的节点标识,若查找到的节点标识为主节点的节点标识,则查询与设备标识对应的设备的相关信息;若查找到的节点标识不是主节点的节点标识,则将查询请求发送到查找到的节点标识对应的从节点上,从而由从节点查询与查询请求携带的设备标识对应的设备的相关信息。
基于上述添加设备的过程描述,可以理解的是,无论是主节点查询还是从节点查询,均可以在本地查找与查询请求中设备标识对应的线程编号,并通过该线程编号对应的线程查询所连接的设备的相关信息。
示例性的,查询的设备的相关信息可以是设备的配置信息、连接状态等。
需要说明的是,无论是从节点还是主节点查询到设备的相关信息,均可以按照接收查询请求的路径返回给控制器。
在一些实施例中,在集群系统中有节点故障时,如果是集群系统中的主节点故障,集群系统中的各个节点使用一致性算法选举一个新的主节点,新的主节点为与故障节点连接的设备重新分配节点,并将分配节点的节点标识和该设备的第七设备连接信息存储到本地和从节点上上,并标记第七设备连接信息的状态为待连接。从而,新的主节点在监听到本地存在与自身节点标识对应的状态为待连接的第八设备连接信息时,利用第八设备连接信息与待添加设备建立连接,并在本地和所述从节点上更新所述第八设备连接信息的状态为已连接,同理,从节点在监听到本地存在与自身节点标识对应的状态为待连接的第九设备连接信息时,利用第九设备连接信息与待添加设备建立连接,并在本地和新的主节点上更新所述第九设备连接信息的状态为已连接。
然后,新的主节点优先监听本地存在与自身连接设备的设备标识对应的状态为正在下发的第四配置信息时,将第四配置信息成功下发到对应的设备上后,在本地和所述从节点中删除第四配置信息和对应的状态,同理,从节点也优先监听本地存在与自身连接设备的设备标识对应的状态为正在下发的第五配置信息时,将第五配置信息成功下发到对应的设备上后,在本地和新的主节点中删除第五配置信息和对应的状态。
由此可见,即使集群系统中有节点故障,由于未成功下发的配置信息还在集群系统上存储着,因此可以重新下发未成功下发的配置信息。
其中,与故障节点连接的设备指的是集群系统中存储的没有节点标识和线程编号的设备连接信息对应的设备。
本领域技术人员可以理解的是,集群系统中的节点故障的检测过程可以由集群系统使用的一致性算法实现检测,本申请不再详述。
值得注意的是,如果是集群系统中的某从节点故障,按照上述重新分配原理,主节点可以直接为与故障节点连接的设备重新分配节点。
与前述设备管理系统的实施例相对应,本发明还提供了设备管理方法的实施例。
图2为本发明根据一示例性实施例示出的一种设备管理方法的实施例流程图,该设备管理方法应用于上述图1所示的集群系统,如图2所示,该设备管理方法包括如下步骤:
步骤201:集群系统中的主节点接收控制器的下发配置请求后,将下发配置请求携带的第一配置信息和设备标识存储到本地和从节点上。
可以理解的是,对于主节点将设备标识和第一配置信息存储到从节点的过程为复制设备标识和第一配置信息到各个从节点上,以保证配置的一致性,在各个从节点返回存储成功响应后,集群系统中的每个节点都可以查询到该配置信息。
步骤202:主节点在监听到本地存在与自身连接设备的设备标识对应的第二配置信息时,在本地和从节点上标记第二配置信息的状态为正在下发,并在将第二配置信息成功下发到对应的设备上后,从本地和从节点中删除第二配置信息和对应的状态。
步骤203:从节点在监听到本地存在与自身连接设备的设备标识对应的第三配置信息时,在本地和所述主节点上标记第三配置信息的状态为正在下发,并在将第三配置信息成功下发到对应的设备上后,从本地和主节点中删除第三配置信息和对应的状态。
其中,主节点或从节点监听到存在与各自连接设备的设备标识对应的配置信息时,可以批量获取监听到的配置信息并将获取的配置信息下发到对应的设备上。
需要说明的是,下发配置信息的主节点或从节点如果因配置信息的问题导致配置下发失败,可以将失败标记对应下发失败的配置信息存储在集群系统各个节点中,从将失败标记和配置信息写到日志文件中后,从各个节点中删除该配置信息和失败标记。
针对添加设备、删除设备、查询设备、节点故障的处理流程,可以参见上述图1所示的设备管理系统实施例的相关描述,本申请在此不再详述。
值得注意的是,本申请对步骤202和步骤203的执行顺序不进行限定。
至此,完成上述图2所示的设备管理流程,通过在控制器与设备之间增加一个集群系统,控制器针对设备的所有配置在这个集群系统中统一处理,以解决控制器与设备之间的耦合性问题,并且集群系统中的主节点将设备的配置存储在集群系统中各个节点上,同时配置下发会标记状态,即使中途节点故障,配置信息仍然存储在集群系统中,通过查询标记状态即可获取到,因此不会出现配置丢失的问题,增强了整体的高可用性。
在上述图1所示的设备管理系统结构基础上,图3为本发明根据一示例性实施例示出的另一种设备管理系统结构示意图,集群系统中的每个节点均包括代理模块、集群模块和线程管理模块。
其中,代理模块负责控制器下发的用于管理设备的请求,包括下发配置请求、添加设备请求、删除设备请求、查询请求。集群模块负责使用一致性算法(如Paxos算法)实现存储,在同一时刻集群中有一个主节点,其他节点均为从节点。线程管理模块负责为设备分配线程,由线程实现与设备的连接和配置下发。
需要说明的是,控制器的请求由集群系统中的主节点代理模块处理,如果从节点代理模块接收到请求,会查询本节点是否为主节点,如果不是,从节点代理模块会将请求重定向给主节点的代理模块。
下面对上述实施例描述的下发配置的过程、添加设备的过程、删除设备的过程、查询设备的过程及故障处理的过程分别进行阐述。
(1)下发配置的过程
主节点代理模块接收到来自控制器的下发配置请求时,解析出下发配置请求中的第一配置信息和设备标识并发送至主节点集群模块,主节点集群模块将第一配置信息和设备标识存储到本地和从节点上,也即主节点集群模块复制配置信息和设备标识到从节点上。
主节点线程管理模块在监听到本地存在与自身连接设备的设备标识对应的第二配置信息时,在本地和从节点上标记第二配置信息的状态为正在下发,并在将第二配置信息成功下发到对应的设备上后,从本地和从节点中所述第二配置信息和对应的状态。
从节点线程管理模块在监听到本地存在与自身连接设备的设备标识对应的第三配置信息时,在本地和主节点上标记第三配置信息的状态为正在下发,并在将第三配置信息成功下发到对应的设备上后,从本地和主节点中删除第三配置信息和对应的状态。
(2)添加设备的过程
主节点代理模块接收到来自控制器的添加设备请求时,解析添加设备请求中的第一设备连接信息后发送给主节点集群模块,主节点集群模块选择设备连接数最小的节点,并将选择节点的节点标识和第一设备连接信息存储到本地和从节点上,并标记第一设备连接信息的状态为待连接。
主节点线程管理模块在监听到本地存在与自身节点标识对应的状态为待连接的第二设备连接信息时,建立一个线程,并通过该线程利用第二设备连接信息与待添加设备建立连接后,将线程编号对应第二设备连接信息存储到本地和从节点上,同时更新第二设备连接信息的状态为已连接。
从节点线程管理模块在监听到本地存在与自身节点标识对应的状态为待连接的第三设备连接信息时,启动一个线程,并通过该线程利用第三设备连接信息与待添加设备建立连接后,将线程编号对应第三设备连接信息存储到本地和主节点上,同时更新第三设备连接信息的状态为已连接。
(3)删除设备的过程
主节点代理模块接收到来自控制器的删除设备请求时,获取删除设备请求中的设备标识,并将本地和从节点上存储的该设备标识对应的第四设备连接信息的状态标记为待删除。
主节点线程管理模块在监听到本地存在与自身节点标识对应的状态为待删除的第五设备连接信息时,通过第五设备连接信息对应的线程断开与待删除设备的连接,并关闭线程。
从节点线程管理模块在监听到本地存在与自身节点标识对应的状态为待删除的第六设备连接信息时,通过第六设备连接信息对应的线程断开与待删除设备的连接,并关闭线程。
(4)查询设备的过程
主节点代理模块接收到来自控制器的查询请求时,解析查询请求中的设备标识后发送给主节点集群模块,主节点集群模块在本地查找与设备标识对应的节点标识,若查找到的节点标识为主节点的节点标识,则由主节点线程管理模块中对应线程查询与设备标识对应的设备的相关信息;若查找到的节点标识不是主节点的节点标识,则由主节点代理模块将查询请求发送到节点标识对应的从节点上,由从节点代理模块将查询请求发送到从节点线程管理模块,从节点线程管理模块中对应线程查询与查询请求中设备标识对应的设备的相关信息。
(5)故障处理的过程
当集群系统中有节点故障时,如果故障节点为主节点,则各个节点的集群模块会通过一致性算法选举新的主节点,新的主节点集群模块为与故障节点连接的设备重新分配节点,并将分配节点的节点标识和该设备的第七设备连接信息存储到本地和从节点上,并标记该第七设备连接信息的状态为待连接。
新的主节点线程管理模块在监听到本地存在与自身节点标识对应的状态为待连接的第八设备连接信息时,启动一个线程,并通过线程利用第八设备连接信息与待添加设备建立连接,并将线程编号对应第八设备连接信息存储到本地和从节点上,并更新第八设备连接信息的状态为已连接。
从节点线程管理模块在监听到本地存在与自身节点标识对应的状态为待连接的第九设备连接信息时,启动一个线程,并通过线程利用监听到的第九设备连接信息与待添加设备建立连接,并将线程编号对应第九设备连接信息存储到本地和新的主节点上,并更新第九设备连接信息的状态为已连接。
然后,主节点线程管理模块优先监听本地存在与自身连接设备的设备标识对应的状态为正在下发的第四配置信息时,将第四配置信息成功下发到对应的设备上后,在本地和所述从节点中删除第四配置信息和对应的状态。
从节点线程管理模块也优先监听本地存在与自身连接设备的设备标识对应的状态为正在下发的第五配置信息时,将第五配置信息成功下发到对应的设备上后,在本地和新的主节点中删除第五配置信息和对应的状态。
如果故障节点为从节点,主节点按照上述重新分配原理直接为与故障节点连接的设备重新分配节点。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种设备管理方法,其特征在于,应用于控制器和设备之间的集群系统,所述集群系统包括主节点和从节点,所述方法包括:
所述主节点接收控制器的下发配置请求后,将所述下发配置请求携带的第一配置信息和设备标识存储到本地和所述从节点上;
所述主节点在监听到本地存在与自身连接设备的设备标识对应的第二配置信息时,在本地和所述从节点上标记所述第二配置信息的状态为正在下发,并在将第二配置信息成功下发到对应的设备上后,从本地和所述从节点中删除所述第二配置信息和对应的状态;
所述从节点在监听到本地存在与自身连接设备的设备标识对应的第三配置信息时,在本地和所述主节点上标记所述第三配置信息的状态为正在下发,并在将第三配置信息成功下发到对应的设备上后,从本地和所述主节点中删除第三配置信息和对应的状态。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述主节点接收控制器的添加设备请求后,从本地存储的各个节点的设备连接数中选取一个设备连接数最小的节点,并将选取的节点的节点标识和所述添加设备请求携带的第一设备连接信息存储到本地和所述从节点上,并标记该第一设备连接信息的状态为待连接;
所述主节点在监听到本地存在与自身节点标识对应的状态为待连接的第二设备连接信息时,利用第二设备连接信息与待添加设备建立连接,并在本地和所述从节点上更新所述第二设备连接信息的状态为已连接;
所述从节点在监听到本地存在与自身节点标识对应的状态为待连接的第三设备连接信息时,利用第三设备连接信息与待添加设备建立连接,并在本地和所述主节点上更新所述第三设备连接信息的状态为已连接。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述主节点接收控制器的删除设备请求后,获取所述删除设备请求携带的设备标识,并将本地和所述从节点上存储的所述设备标识对应的第四设备连接信息的状态标记为待删除;
所述主节点在监听到本地存在与自身节点标识对应的状态为待删除的第五设备连接信息时,根据第五设备连接信息断开与待删除设备的连接;
所述从节点在监听到本地存在与自身节点标识对应的状态为待删除的第六设备连接信息时,根据第六设备连接信息断开与待删除设备的连接。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述主节点接收控制器的查询请求后,在本地查找与所述查询请求携带的设备标识对应的节点标识,若查找到的节点标识为所述主节点的节点标识,则查询与所述设备标识对应的设备的相关信息;若查找到的节点标识不是所述主节点的节点标识,则将所述查询请求发送到查找到的节点标识对应的从节点上;
所述从节点查询与所述设备标识对应的设备的相关信息。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述集群系统中的主节点故障,所述集群系统中的各个节点选举一个新的主节点;
新的主节点为与故障节点连接的设备重新分配节点,并将分配节点的节点标识和该设备的第七设备连接信息存储到本地和从节点上,并标记该第七设备连接信息的状态为待连接;
新的主节点在监听到本地存在与自身节点标识对应的状态为待连接的第八设备连接信息时,利用第八设备连接信息与待添加设备建立连接,并在本地和所述从节点上更新所述第八设备连接信息的状态为已连接;
所述从节点在监听到本地存在与自身节点标识对应的状态为待连接的第九设备连接信息时,利用第九设备连接信息与待添加设备建立连接,并在本地和新的主节点上更新所述第九设备连接信息的状态为已连接;
新的主节点在监听到本地存在与自身连接设备的设备标识对应的状态为正在下发的第四配置信息时,将第四配置信息成功下发到对应的设备上后,在本地和所述从节点中删除第四配置信息和对应的状态;
所述从节点在监听到本地存在与自身连接设备的设备标识对应的状态为正在下发的第五配置信息时,将第五配置信息成功下发到对应的设备上后,在本地和新的主节点中删除第五配置信息和对应的状态。
6.一种设备管理系统,其特征在于,所述系统包括:
控制器,用于向集群系统发送下发配置请求;
所述集群系统中的主节点,用于将接收到的下发配置请求携带的第一配置信息和设备标识存储到本地和所述集群系统中的从节点上;
所述主节点,用于在监听到本地存在与自身连接设备的设备标识对应的第二配置信息时,在本地和所述从节点上标记所述第二配置信息的状态为正在下发,并在将第二配置信息成功下发到对应的设备上后,从本地和所述从节点中删除所述第二配置信息和对应的状态;
所述从节点,用于在监听到本地存在与自身连接设备的设备标识对应的第三配置信息时,在本地和所述主节点上标记所述第三配置信息的状态为正在下发,并在将第三配置信息成功下发到对应的设备上后,从本地和所述主节点中删除第三配置信息和对应的状态。
7.根据权利要求6所述的系统,其特征在于,
所述主节点,还用于接收控制器的添加设备请求后,从本地存储的各个节点的设备连接数中选取一个设备连接数最小的节点,并将选取的节点的节点标识和所述添加设备请求携带的第一设备连接信息存储到本地和所述从节点上,并标记该第一设备连接信息的状态为待连接;
所述主节点,还用于在监听到本地存在与自身节点标识对应的状态为待连接的第二设备连接信息时,利用第二设备连接信息与待添加设备建立连接,并在本地和所述从节点上更新所述第二设备连接信息的状态为已连接;
所述从节点,还用于在监听到本地存在与自身节点标识对应的状态为待连接的第三设备连接信息时,利用第三设备连接信息与待添加设备建立连接,并在本地和所述主节点上更新所述第三设备连接信息的状态为已连接。
8.根据权利要求6所述的系统,其特征在于,
所述主节点,还用于接收控制器的删除设备请求后,获取所述删除设备请求携带的设备标识,并将本地和所述从节点上存储的所述设备标识对应的第四设备连接信息的状态标记为待删除;
所述主节点,还用于在监听到本地存在与自身节点标识对应的状态为待删除的第五设备连接信息时,根据第五设备连接信息断开与待删除设备的连接;
所述从节点,还用于在监听到本地存在与自身节点标识对应的状态为待删除的第六设备连接信息时,根据第六设备连接信息断开与待删除设备的连接。
9.根据权利要求6所述的系统,其特征在于,
所述主节点,还用于接收控制器的查询请求后,在本地查找与所述查询请求携带的设备标识对应的节点标识,若查找到的节点标识为所述主节点的节点标识,则查询与所述设备标识对应的设备的相关信息;若查找到的节点标识不是所述主节点的节点标识,则将所述查询请求发送到查找到的节点标识对应的从节点上;
所述从节点,还用于查询与所述设备标识对应的设备的相关信息。
10.根据权利要求6所述的系统,其特征在于,如果所述集群系统中的主节点故障,所述集群系统中的各个节点选举一个新的主节点;
新的主节点,用于为与故障节点连接的设备重新分配节点,并将分配节点的节点标识和该设备的第七设备连接信息存储到本地和从节点上,并标记该第七设备连接信息的状态为待连接;
新的主节点,还用于在监听到本地存在与自身节点标识对应的状态为待连接的第八设备连接信息时,利用第八设备连接信息与待添加设备建立连接,并在本地和所述从节点上更新所述第八设备连接信息的状态为已连接;
所述从节点,用于在监听到本地存在与自身节点标识对应的状态为待连接的第九设备连接信息时,利用第九设备连接信息与待添加设备建立连接,并在本地和新的主节点上更新所述第九设备连接信息的状态为已连接;
新的主节点,还用于在监听到本地存在与自身连接设备的设备标识对应的状态为正在下发的第四配置信息时,将第四配置信息成功下发到对应的设备上后,在本地和所述从节点中删除第四配置信息和对应的状态;
所述从节点,还用于在监听到本地存在与自身连接设备的设备标识对应的状态为正在下发的第五配置信息时,将第五配置信息成功下发到对应的设备上后,在本地和新的主节点中删除第五配置信息和对应的状态。
CN202011135441.4A 2020-10-21 2020-10-21 一种设备管理方法及系统 Active CN112214377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011135441.4A CN112214377B (zh) 2020-10-21 2020-10-21 一种设备管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011135441.4A CN112214377B (zh) 2020-10-21 2020-10-21 一种设备管理方法及系统

Publications (2)

Publication Number Publication Date
CN112214377A CN112214377A (zh) 2021-01-12
CN112214377B true CN112214377B (zh) 2022-09-27

Family

ID=74056365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011135441.4A Active CN112214377B (zh) 2020-10-21 2020-10-21 一种设备管理方法及系统

Country Status (1)

Country Link
CN (1) CN112214377B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115001960B (zh) * 2021-03-02 2024-04-05 浙江宇视科技有限公司 一种设备自动配置部署方法及装置
CN114168603A (zh) * 2021-11-01 2022-03-11 山东有人物联网股份有限公司 一种物联网设备状态同步方法、系统、装置及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024065A (zh) * 2012-12-25 2013-04-03 曙光信息产业(北京)有限公司 用于云存储系统的系统配置管理方法
CN105138441A (zh) * 2015-06-30 2015-12-09 中标软件有限公司 高可用集群系统及基于该系统的告警方法、告警系统
CN107239342A (zh) * 2017-05-31 2017-10-10 郑州云海信息技术有限公司 一种存储集群任务管理方法及装置
WO2018036148A1 (zh) * 2016-08-23 2018-03-01 东方网力科技股份有限公司 一种服务器集群系统
CN109495523A (zh) * 2017-09-11 2019-03-19 北京金山云网络技术有限公司 管理指令下发方法、装置、电子设备及存储介质
CN109960212A (zh) * 2017-12-25 2019-07-02 北京京东尚科信息技术有限公司 任务发送方法和装置
CN110635944A (zh) * 2019-09-03 2019-12-31 苏州浪潮智能科技有限公司 一种集群网络配置方法、装置及电子设备和存储介质
CN111399982A (zh) * 2020-03-17 2020-07-10 中国建设银行股份有限公司 一种支持多环境的命令远程执行装置及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024065A (zh) * 2012-12-25 2013-04-03 曙光信息产业(北京)有限公司 用于云存储系统的系统配置管理方法
CN105138441A (zh) * 2015-06-30 2015-12-09 中标软件有限公司 高可用集群系统及基于该系统的告警方法、告警系统
WO2018036148A1 (zh) * 2016-08-23 2018-03-01 东方网力科技股份有限公司 一种服务器集群系统
CN107239342A (zh) * 2017-05-31 2017-10-10 郑州云海信息技术有限公司 一种存储集群任务管理方法及装置
CN109495523A (zh) * 2017-09-11 2019-03-19 北京金山云网络技术有限公司 管理指令下发方法、装置、电子设备及存储介质
CN109960212A (zh) * 2017-12-25 2019-07-02 北京京东尚科信息技术有限公司 任务发送方法和装置
CN110635944A (zh) * 2019-09-03 2019-12-31 苏州浪潮智能科技有限公司 一种集群网络配置方法、装置及电子设备和存储介质
CN111399982A (zh) * 2020-03-17 2020-07-10 中国建设银行股份有限公司 一种支持多环境的命令远程执行装置及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于Bully算法的Redis集群选举方案优化;王芬等;《计算机科学》;20171015(第10期);全文 *
基于物联网的室内数据采集监控系统;任克强等;《液晶与显示》;20200215(第02期);全文 *

Also Published As

Publication number Publication date
CN112214377A (zh) 2021-01-12

Similar Documents

Publication Publication Date Title
US8838703B2 (en) Method and system for message processing
US6295558B1 (en) Automatic status polling failover or devices in a distributed network management hierarchy
CN111615066B (zh) 一种基于广播的分布式微服务注册及调用方法
US20160308960A1 (en) Connection management system, and a method for linking connection management server in thin client system
US20020099787A1 (en) Distributed configuration management on a network
US7940758B2 (en) Data distribution in a distributed telecommunications network
CN112214377B (zh) 一种设备管理方法及系统
JP2012528382A (ja) キャッシュクラスタを構成可能モードで用いるキャッシュデータ処理
CN111901705B (zh) 一种olt设备的omci功能虚拟化系统
CN107404509B (zh) 分布式服务配置系统及信息管理方法
CN109547875B (zh) 一种fc交换网络任意端口接入设计方法
CN103581276A (zh) 集群管理装置、系统、业务客户端及相应方法
CN106850747B (zh) 一种分布式实时转码系统的转码节点管理系统及方法
CN100563263C (zh) 在网络存储业务中实现系统高可用性的方法和系统
CN112100004A (zh) Redis集群节点的管理方法、存储介质
EP3570169B1 (en) Method and system for processing device failure
US6324572B1 (en) Communication network method and apparatus
US10904327B2 (en) Method, electronic device and computer program product for searching for node
US8041671B2 (en) Method and system for providing a homogeneous view of a distributed common information model (CIM) within a heterogeneous virtual system environment
CN114422335A (zh) 通信方法、装置、服务器及存储介质
CN114090342A (zh) 存储容灾的链路管理方法及消息执行节点、存储控制集群
KR100970212B1 (ko) 이기종간 db 쿼리의 동적 전환을 이용하여 장애에대처하는 인증 서비스 이중화 방법 및 시스템
CN113890875B (zh) 任务分配方法及装置
US20020184243A1 (en) Base host-switching database-management system
CN116455920A (zh) 一种数据存储方法、系统、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant