CN116248465A - 一种基于Arm阵列式服务器BMC集群管理安卓卡的方法 - Google Patents

一种基于Arm阵列式服务器BMC集群管理安卓卡的方法 Download PDF

Info

Publication number
CN116248465A
CN116248465A CN202310208209.6A CN202310208209A CN116248465A CN 116248465 A CN116248465 A CN 116248465A CN 202310208209 A CN202310208209 A CN 202310208209A CN 116248465 A CN116248465 A CN 116248465A
Authority
CN
China
Prior art keywords
bmc
server
message
client
card
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310208209.6A
Other languages
English (en)
Inventor
刘毅
温杨
赖如金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Vclusters Information Technology Co ltd
Original Assignee
Shenzhen Vclusters Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Vclusters Information Technology Co ltd filed Critical Shenzhen Vclusters Information Technology Co ltd
Priority to CN202310208209.6A priority Critical patent/CN116248465A/zh
Publication of CN116248465A publication Critical patent/CN116248465A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0246Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种基于Arm阵列式服务器BMC集群管理安卓卡的方法,包括以下步骤:BMC‑Client和Card‑Server通讯,两者之间通讯专有的一套协议;发送数据时,将数据根据协议格式进行加密发送,接收数据时,根据协议格式,将数据解码,协议字段数据结构采用十六进制大端序,格式包含:帧头、帧长度、帧类型、帧数据、帧尾;BMC‑Client发送的一条完整的消息Message,Card‑Server收到后,根据定义的帧类型返回Message给BMC‑Client;Card‑Server收到BMC‑Client的Message后,将开始处理请求中的业务,然后将结果数据根据协议定义的格式打包生成一条Message,发送给BMC‑Client;BMC‑Client和Card‑Server采取一问一答模式,即请求的接口和回复的接口一一对应。本发明具备所有的接口请求可以直接在页面中简单操作,达到高效、智能的效果,节省了人力和维护成本的优点。

Description

一种基于Arm阵列式服务器BMC集群管理安卓卡的方法
技术领域
本发明涉及云服务器领域,尤其涉及一种基于Arm阵列式服务器BMC集群管理安卓卡的方法。
背景技术
当前随着互联网+,5G,云时代的到来,各行各业都将业务系统放到云端,各种云服务层出不断,有云手机、云存储等等,所有的云服务,其实都是依赖于硬件设备,只不过这些硬件设备存放在机房里;如云存储,是把数据存储在机房的硬件设备中,取代平常的软件数据存储在自身设备的磁盘里。
请参阅图1,图1为一个BMC安卓卡的关系构造图,一个完整的BMC中一般有12个刀片,每个刀片中有5张安卓卡,每个安卓卡之间互不影响,依靠唯一标识Sn,辨别区分每个安卓卡;这些安卓卡平时都是24小时不断电长期运转,刀片卡座中有指示灯,显示了安卓卡的运行状态,可以根据灯亮/灯灭,或者灯的颜色,判断安卓卡是否在正常运行。
因为是云服务,并且是长期运行,因此设备的正常运行显得十分关键,当设备出现异常时,需要第一时间发现;在现实生活中,机房中的设备远不止几十台或者几百台,往往都是数量非常庞大,而在设备数量巨大的情况下,想要监控设备的运行状态,只依靠硬件设备上的指示灯,很明显不现实。
对于长期运行的硬件设备,除了检查设备是否在正常运行外,对设备的各种参数进行监控上报,也非常关键,如设备cpu使用率、内存使用率、存储使用率、cpu温度等参数,通过这些详细的参数值,实时了解设备的运行状态,提前发现和处理设备可能发生的故障;然而,很多云服务设备中,设备的管理和监控并不是很完善,甚至需要升级系统的时候,有些还有去机房插线升级。
因此,可以批量的纳管和监控每个安卓卡设备,智能的监测设备存在的问题,及时处理,保障设备的正常运行,显得尤为重要。
发明内容
本发明提供了一种基于Arm阵列式服务器BMC集群管理安卓卡的方法,具备所有的接口请求可以直接在页面中简单操作,达到高效、智能的效果,节省了人力和维护成本的优点,解决了现有的设备管理和监控不完善的问题。
根据本申请实施例提供的一种基于Arm阵列式服务器BMC集群管理安卓卡的方法,包括如下步骤:
BMC-Client和Card-Server通讯,两者之间通讯专有的一套协议;
发送数据时,将数据根据协议格式进行加密发送,接收数据时,根据协议格式,将数据解码,协议字段数据结构采用十六进制大端序,格式包含:帧头、帧长度、帧类型、帧数据、帧尾;
BMC-Client发送的一条完整的消息Message,Card-Server收到后,根据定义的帧类型返回Message给BMC-Client;
Card-Server收到BMC-Client的Message后,将开始处理请求中的业务,然后将结果数据根据协议定义的格式打包生成一条Message,发送给BMC-Client;BMC-Client和Card-Server采取一问一答模式,即请求的接口和回复的接口一一对应。
优选地,包括如下步骤:Message中增加一个CallbackKey字段,该字段值由实时生成的UUID值组成,由于UUID值是唯一的,因此可以根据每个Message的CallbackKey字段,辨别Message。
优选地,BMC-Client和Card-Server建立Tcp连接后,如果间隔一段时间没有发送Message,根据Tcp的连接机制,会断开连接,解决方法包括如下步骤:当BMC-Client和Card-Server建立Tcp连接后,BMC-Clien开启一个定时任务,定时对已经建立连接的对端(Card-Server)发送一个心跳Message,Card-Server收到该心跳Message后,返回一个心跳应答Message;如果在超时时间内没有收到Card-Server的应答Message,则重发心跳请求Message,如果Card-Server持续多次没有响应,BMC-Client则可以认为该TCP连接不可用,主动断开连接。
优选地,包括如下步骤:Card-Server中启动一个定时器,定时读取安卓卡cpu使用率、内存使用率、存储使用率、cpu温度等参数发送给BMC-Client,BMC-Client可以收集到每个安卓卡的具体运行状态和使用情况。
优选地,BMC-Client大批量发送Message,而Card-Server一直未返回Message时,容易因不断创建Message,未完成消息闭环释放内存,导致Message堆积引起内存问题,解决方法包括如下步骤:对于常规接口请求,BMC-Client发送Message时,启动一个定时器,设置一个超时时间,如果在规定时间范围内Card-Server还没返回Message,视为超时,BMC-Client主动结束和释放该Message相关内存。
本申请实施例提供的技术方案可以包括以下有益效果:
随着云技术的发展,设备的数量越来越庞大,智能的监测和管控设备,也越来越重要;本方法实现的集群管理方式,既能实时监测安卓卡的运行状态,又可以批量操作安卓卡,所有的接口请求可以直接在页面中简单操作,达到高效、智能的效果,节省了人力和维护成本。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个BMC安卓卡的关系构造图;
图2为本发明BMC-Client和Card-Server通讯原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
基于BMC中众多安卓卡情况,本发明设计了一种基于Arm阵列式服务器BMC集群管理安卓卡的方法,BMC中开发一个程序,作为客户端(以下简称BMC-Client),安卓卡中开发一个二进制文件程序,作为服务端(以下简称Card-Server),BMC-Client和Card-Server通过TCP实现长连接通讯,安卓卡Card-Server端负责计算和主动定时上报安卓卡中的内存使用率、CPU使用率、磁盘使用率、CPU温度等一些详细参数。
另外,BMC-Client也可以向Card-Server下发一些请求,对安卓卡进行设置和系统升级等操作;由于TCP连接支持一对多,即一个客户端BMC-Client可以连接多个Card-Server,同时发送消息给不同的安卓卡,进而完成集群管理安卓卡。BMC-Client和Card-Server之间通讯通过发送消息(以下简称Message)进行。
请参阅图2,BMC-Client和Card-Server通讯原理图。
详细功能设计实现
1、通讯协议
BMC-Client和Card-Server通讯,为了防止被外界程序访问和实现不功能接口请求,这里设计了两者之间通讯专有的一套协议,发送数据时,将数据根据协议格式进行加密发送,接收数据时,根据协议格式,将数据解码。协议字段数据结构采用十六进制大端序,格式包含:帧头、帧长度、帧类型、帧数据、帧尾。即一条完整的请求必须包含这五项:
帧头:一条消息(Message)的开头标识;
帧长度:一条消息(Message)从帧头到帧尾的长度;
帧类型:Message的类型;
帧数据:Message内容;
帧尾:一条消息(Message)的结尾标识。
协议的详细定义如下:
Figure BDA0004111679490000041
备注:上面的帧头0xC8、帧尾0xC9、字节数为示范数据,实践时可根据实际调整。
2、BMC-Client发送数据帧类型定义
因为有很多不同的接口,因此需要定义不同的帧类型,一个请求即为一条完整的消息Message,BMC-Client发送的消息,Card-Server收到后,根据定义的帧类型返回Message给BMC-Client,如下为BMC-ClientMessage发送帧类型示例:
BMC-Client发送帧类型
接口请求1 接口请求2 接口请求3 接口请求4 接口请求××..
0x21 0x22 0x23 0x24 0xxx..
3、Card-Server发送帧类型定义
Card-Server收到BMC-Client的Message后,将开始处理请求中的业务,然后将结果数据根据协议定义的格式打包生成一条Message,发送给BMC-Client;BMC-Client和Card-Server采取一问一答模式,即请求的接口和回复的接口一一对应,如下为Card-Server端的示例帧类型:
Card-Server发送帧类型
回复接口请求1 回复接口请求2 回复接口请求3 回复接口请求4 回复接口请求xx..
0x51 0x52 0x53 0x54 0xxx..
4、Message的唯一性设计
场景分析:
现实场景中,BMC-Client并不止发送一条Message,可能同时发送多个Message给同一张卡或者不同的卡,不同接口的业务逻辑不一样,处理和返回Message的速度也不一样,针对高并发情况,这时候,制定Message的唯一性显得很重要;例如,BMC-Client发送了同一个接口类型MessageA、MessageB给Card-Server端,Card-Server可能接收到了MessageA和MessageB,由于丢包或其他异常,也可能只接收到了MessageA或者MessageB,这种情况,如果Message没有唯一标识,定位问题时,就不知道是哪个Message没有接收到。
期望效果:BMC-Client发送MessageA、MessageB,收到消息时根据某一个标识判断返回的是MessageA还是MessageB。
Message唯一性设计:
Message中增加一个CallbackKey字段,该字段值由实时生成的UUID值组成,因为UUID值是唯一的,因此可以根据每个Message的CallbackKey字段,辨别Message。
Figure BDA0004111679490000061
5、BMC-Client和Card-Server长连接保活机制设计
存在问题:BMC-Client和Card-Server建立Tcp连接后,如果间隔一段时间没有发送Message,根据Tcp的连接机制,会断开连接。
实现方法:使用心跳(heartbeat)机制来主动检测。具体做法:当TCP连接建立成功后,BMC-Clien开启一个定时任务,定时对已经建立连接的对端(Card-Server)发送一个心跳Message,Card-Server收到该心跳Message后,返回一个心跳应答Message。如果在超时时间内没有收到Card-Server的应答Message,则重发心跳请求Message,如果Card-Server持续多次没有响应,BMC-Client则可以认为该TCP连接不可用,主动断开连接。因此,可以根据连接状态,判断安卓卡是否正常,如果断开了连接,则表明安卓卡的网络出现了问题或者安卓卡存在卡死等问题导致通讯异常,由此判断安卓卡异常了。
6、Card-Server(安卓卡)主动上报机制
Card-Server中启动一个定时器,定时读取安卓卡cpu使用率、内存使用率、存储使用率、cpu温度等参数发送给BMC-Client,从而BMC-Client可以收集到每个安卓卡的具体运行状态和使用情况。
7、BMC-Client超时机制设计
场景分析:BMC-Client大批量发送Message,而Card-Server一直未返回Message时,容易因不断创建Message,未完成消息闭环释放内存,导致Message堆积引起内存问题。
解决方法:对于常规接口请求,BMC-Client发送Message时,启动一个定时器,设置一个超时时间(例如30秒,这个时间可以根据实际场景调整),如果在规定时间范围内Card-Server还没返回Message,视为超时,BMC-Client主动结束和释放该Message相关内存。
8、请求下发和信息展示设计
根据一个BMC中有60张安卓卡,每个安卓卡有唯一的SN标识关系,设计BMC列表页、安卓卡列表页、安卓卡信息详情页等页面,在页面中查看安卓卡在线状态、运行情况,以及操作下发请求。
安卓卡主动上报的信息数据,BMC-Client接收到后,存储到数据库,用于页面展示。
本申请实施例提供的技术方案可以包括以下有益效果:
随着云技术的发展,设备的数量越来越庞大,智能的监测和管控设备,也越来越重要;本方法实现的集群管理方式,既能实时监测安卓卡的运行状态,又可以批量操作安卓卡,所有的接口请求可以直接在页面中简单操作,达到高效、智能的效果,节省了人力和维护成本。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (5)

1.一种基于Arm阵列式服务器BMC集群管理安卓卡的方法,其特征在于,包括如下步骤:
BMC-Client和Card-Server通讯,两者之间通讯专有的一套协议;
发送数据时,将数据根据协议格式进行加密发送,接收数据时,根据协议格式,将数据解码,协议字段数据结构采用十六进制大端序,格式包含:帧头、帧长度、帧类型、帧数据、帧尾;
BMC-Client发送的一条完整的消息Message,Card-Server收到后,根据定义的帧类型返回Message给BMC-Client;
Card-Server收到BMC-Client的Message后,将开始处理请求中的业务,然后将结果数据根据协议定义的格式打包生成一条Message,发送给BMC-Client;BMC-Client和Card-Server采取一问一答模式,即请求的接口和回复的接口一一对应。
2.根据权利要求1所述的一种基于Arm阵列式服务器BMC集群管理安卓卡的方法,其特征在于,包括如下步骤:Message中增加一个CallbackKey字段,该字段值由实时生成的UUID值组成,由于UUID值是唯一的,因此可以根据每个Message的CallbackKey字段,辨别Message。
3.根据权利要求1所述的一种基于Arm阵列式服务器BMC集群管理安卓卡的方法,其特征在于,BMC-Client和Card-Server建立Tcp连接后,如果间隔一段时间没有发送Message,根据Tcp的连接机制,会断开连接,解决方法包括如下步骤:当BMC-Client和Card-Server建立Tcp连接后,BMC-Clien开启一个定时任务,定时对已经建立连接的对端(Card-Server)发送一个心跳Message,Card-Server收到该心跳Message后,返回一个心跳应答Message;如果在超时时间内没有收到Card-Server的应答Message,则重发心跳请求Message,如果Card-Server持续多次没有响应,BMC-Client则可以认为该TCP连接不可用,主动断开连接。
4.根据权利要求3所述的一种基于Arm阵列式服务器BMC集群管理安卓卡的方法,其特征在于,包括如下步骤:Card-Server中启动一个定时器,定时读取安卓卡cpu使用率、内存使用率、存储使用率、cpu温度等参数发送给BMC-Client,BMC-Client可以收集到每个安卓卡的具体运行状态和使用情况。
5.根据权利要求3所述的一种基于Arm阵列式服务器BMC集群管理安卓卡的方法,其特征在于,BMC-Client大批量发送Message,而Card-Server一直未返回Message时,容易因不断创建Message,未完成消息闭环释放内存,导致Message堆积引起内存问题,解决方法包括如下步骤:对于常规接口请求,BMC-Client发送Message时,启动一个定时器,设置一个超时时间,如果在规定时间范围内Card-Server还没返回Message,视为超时,BMC-Client主动结束和释放该Message相关内存。
CN202310208209.6A 2023-02-27 2023-02-27 一种基于Arm阵列式服务器BMC集群管理安卓卡的方法 Pending CN116248465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310208209.6A CN116248465A (zh) 2023-02-27 2023-02-27 一种基于Arm阵列式服务器BMC集群管理安卓卡的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310208209.6A CN116248465A (zh) 2023-02-27 2023-02-27 一种基于Arm阵列式服务器BMC集群管理安卓卡的方法

Publications (1)

Publication Number Publication Date
CN116248465A true CN116248465A (zh) 2023-06-09

Family

ID=86627563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310208209.6A Pending CN116248465A (zh) 2023-02-27 2023-02-27 一种基于Arm阵列式服务器BMC集群管理安卓卡的方法

Country Status (1)

Country Link
CN (1) CN116248465A (zh)

Similar Documents

Publication Publication Date Title
CN112422684B (zh) 目标消息的处理方法及装置、存储介质、电子装置
US9237077B2 (en) Monitoring persistent client connection status in a distributed server environment
EP3258653A1 (en) Message pushing method and device
CN106993043B (zh) 基于代理的数据通信系统和方法
CN111711697A (zh) 消息推送方法、装置、设备及存储介质
CN112422497B (zh) 消息传递方法、装置及计算机设备
CN113179304B (zh) 消息下发方法、系统、设备及存储介质
US10931529B2 (en) Terminal device management method, server, and terminal device for managing terminal devices in local area network
US9026839B2 (en) Client based high availability method for message delivery
CN112630557A (zh) 设备状态检测方法、装置、设备及介质
CN107508916B (zh) 用于智能机器人的服务器链接管理方法
CN110333916B (zh) 请求消息处理方法、装置、计算机系统及可读存储介质
CN114679463B (zh) 一种实现pcdn资源管理的方法和装置
CN116319732A (zh) 一种基于RabbitMQ的消息队列集中配置管理系统及方法
CN110572315A (zh) 一种信息交互的方法及装置、机器人、存储介质
CN112068963B (zh) 一种嵌入式系统分布式调度系统
CN117729239A (zh) 一种用于物联网中台的设备自动注册和数据通讯协议
CN112995321A (zh) 基于mqtt协议远程即时更新客户端的方法
CN113434281A (zh) 设备调度方法及云平台
CN109040286B (zh) 一种基于内存数据库的客户端在线状态维护方法
CN109039427B (zh) 一种船舶监控管理装置
CN116248465A (zh) 一种基于Arm阵列式服务器BMC集群管理安卓卡的方法
CN115378841B (zh) 设备接入云平台状态的检测方法及装置、存储介质、终端
US11425632B2 (en) Mechanism to provide updates to NB-IoT devices
CN113965447B (zh) 一种在线云诊断方法、装置、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination