CN107391340A - 一种整机柜服务器节点热拔插系统和控制方法 - Google Patents

一种整机柜服务器节点热拔插系统和控制方法 Download PDF

Info

Publication number
CN107391340A
CN107391340A CN201710601278.8A CN201710601278A CN107391340A CN 107391340 A CN107391340 A CN 107391340A CN 201710601278 A CN201710601278 A CN 201710601278A CN 107391340 A CN107391340 A CN 107391340A
Authority
CN
China
Prior art keywords
node
mechanical arm
module
state
plug
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710601278.8A
Other languages
English (en)
Other versions
CN107391340B (zh
Inventor
刘智刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710601278.8A priority Critical patent/CN107391340B/zh
Publication of CN107391340A publication Critical patent/CN107391340A/zh
Application granted granted Critical
Publication of CN107391340B publication Critical patent/CN107391340B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/1653Programme controls characterised by the control loop parameters identification, estimation, stiffness, accuracy, error analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4063Device-to-bus coupling
    • G06F13/4068Electrical coupling
    • G06F13/4081Live connection to bus, e.g. hot-plugging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Manipulator (AREA)
  • Safety Devices In Control Systems (AREA)

Abstract

本发明公开了一种整机柜服务器节点热拔插系统,包括节点状态判断模块,根据连接节点电压状况判断节点处于开机状态或关机状态;节点在位判断模块,根据RMC与节点的通信情况判断节点是否正常插回机柜内部;机械臂动作控制模块,根据节点状态和节点在位状态控制机械臂动作;指令时间设定模块,完成对机械臂发送指令时间间隔的设定;拔插状态设定模块,设定机械臂对节点拔插状态为正常节点拔插状态或非正常节点拔插状态;测试次数设定模块,设定机械臂对节点拔插次数;异常告警模块,机械臂对节点拔插异常时发出报警信息。本发明还提供一种整机柜服务器节点热拔插控制方法,适用于大批量节点测试工作,提升工作效率,节省人力成本,具有很高的可靠性。

Description

一种整机柜服务器节点热拔插系统和控制方法
技术领域
本发明涉及服务器技术领域,尤其是一种整机柜服务器节点热拔插系统和控制方法。
背景技术
在整机柜服务器领域中,节点以高密度的形式插在机柜中,通过PCIE X1接口给RACK节点中板供电,同时提供相关的管理线路。取电接口为2个皇冠夹从铜排上热拔插取电。在这种供电及管理的模块下,节点在正常的维护时,节点从机柜拔出,维护完成后,节点插入导轨并连接铜排,整个过程由于结构的特点,节点会偶尔会出现一些异常,比如说,节点上电异常,不能够正常开机、节点插入异常,RMC管理模块不能够正常检测到节点信息,以及模拟节点在高负载情况下,节点被异常拔出时,对高速运转的CPU/MEM/HDD等造成的非可预见性影响都将影响到服务器的质量,因此在服务器出厂前,对服务器模拟正常情况及异常情况下的拔插,是有重大意义的。
在当前的测试环境中,服务器的热拔插基本上采用人工拔插形式,这种反复重复的形式,操作单一,效率低,远远不能满足大批量节点测试的需求。
发明内容
本发明的目的是提供一种整机柜服务器节点热拔插系统和控制方法,替代人工完成节点热拔插的工作,提升了工作效率。
为实现上述目的,本发明采用下述技术方案:
一种整机柜服务器节点热拔插系统,包括节点状态判断模块,根据连接节点电压状况判断节点处于开机状态或关机状态;节点在位判断模块,根据RMC与节点的通信情况判断节点是否正常插回机柜内部;机械臂动作控制模块,根据节点状态和节点在位状态控制机械臂动作;指令时间设定模块,完成对机械臂发送指令时间间隔的设定;拔插状态设定模块,设定机械臂对节点拔插状态,所述机械臂对节点拔插状态包括正常节点拔插状态,机械臂动作控制模块根据检测的节点状态和节点在位状态控制机械臂动作;非正常节点拔插扎状态,机械臂动作控制模块不检测节点状态和节点在位状态,以随机或固定时间间隔控制机械臂动作;测试次数设定模块,设定机械臂对节点拔插次数;异常告警模块,机械臂对节点拔插异常时发出报警信息。
进一步地,该系统还包括机械臂校准模块,根据第一次手动完成机械臂拔插动作测试结果记录机械臂轨迹数据,所述机械臂轨迹数据包括轨迹最大距离数值和最小距离数值。
进一步地,该系统还包括机械臂动作阈值设定模块,根据所述机械臂校准模块记录的机械臂移动轨迹的最大距离和最小距离设定为机械臂轨迹阈值。
一种整机柜服务器节点热拔插控制方法,包括以下步骤:
S1、初始化步骤:测试次数设定模块设定测试次数,拔插状态设定模块设定机械臂对节点拔插状态,若是正常节点拔插,跳转到步骤S2;若是非正常节点拔插,跳转到步骤S3;
S2、指令时间设定模块对指令发送时间间隔进行设定,机械臂动作控制模块接收节点状态判断模块、节点在位判断模块的返回结果,机械臂动作控制模块根据返回结果发送控制指令到机械臂;
S3、指令时间设定模块设定指令时间无效或对指令发送时间进行设定,机械臂动作控制模块不接收节点状态判断模块、节点在位判断模块的返回结果,机械臂动作控制模块根据指令时间设定模块的设定值以随机或等时间间隔对机械臂发送指令;
S4、判断是否完成全部测试次数测试,是,机械臂停止工作;否。跳转到步骤S1。
进一步地,所述初始化步骤之前还包括以下步骤:机械臂校准模块完成对机械臂轨迹结果记录,机械臂动作阈值设定模块根据所述机械臂校准模块记录的机械臂移动轨迹的最大距离和最小距离设定为机械臂轨迹阈值。
进一步地,所述机械臂动作控制模块根据返回结果发送控制指令到机械臂具体包括以下:机械臂动作控制模块检测到连接节点上电正常且RMC与节点通信正常,发送机械臂停止插入指令;若机械臂动作控制模块检测到节点上电异常和/或RMC与节点通信异常,发送机械臂继续插入指令,机械臂达到轨迹最大距离时停止工作。
本发明的有益效果是,
本发明实现了机柜装置替代人工完成节点热拔插的工作,适用于大批量节点测试工作,能够提升工作效率,节省人力成本,具有很高的可靠性。
附图说明
图1是本发明整机柜服务器节点热拔插系统结构框图;
图2是本发明整机柜服务器节点热拔插控制方法流程图。
具体实施方式
如图1所示,一种整机柜服务器节点热拔插系统,包括节点状态判断模块,根据连接节点电压状况判断节点处于开机状态或关机状态;节点在位判断模块,根据RMC与节点的通信情况判断节点是否正常插回机柜内部;机械臂动作控制模块,根据节点状态和节点在位状态控制机械臂动作;指令时间设定模块,完成对机械臂发送指令时间间隔的设定;拔插状态设定模块,设定机械臂对节点拔插状态,机械臂对节点拔插状态包括正常节点拔插状态,机械臂动作控制模块根据检测的节点状态和节点在位状态控制机械臂动作;非正常节点拔插扎状态,机械臂动作控制模块不检测节点状态和节点在位状态,以随机或固定时间间隔控制机械臂动作;测试次数设定模块,设定机械臂对节点拔插次数;异常告警模块,机械臂对节点拔插异常时发出报警信息。
该系统还包括机械臂校准模块,根据第一次手动完成机械臂拔插动作测试结果记录机械臂轨迹数据,机械臂轨迹数据包括轨迹最大距离数值和最小距离数值。
该系统还包括机械臂动作阈值设定模块,根据机械臂校准模块记录的机械臂移动轨迹的最大距离和最小距离设定为机械臂轨迹阈值。
在执行本发明步骤之前还需经过以下步骤:机械臂校准模块完成对机械臂轨迹结果记录,机械臂动作阈值设定模块根据所述机械臂校准模块记录的机械臂移动轨迹的最大距离和最小距离设定为机械臂轨迹阈值。
如图2所示,一种整机柜服务器节点热拔插控制方法,包括以下步骤:
S1、初始化步骤:测试次数设定模块设定测试次数,拔插状态设定模块设定机械臂对节点拔插状态,若是正常节点拔插,跳转到步骤S2;若是非正常节点拔插,跳转到步骤S3;
S2、指令时间设定模块对指令发送时间间隔进行设定,机械臂动作控制模块接收节点状态判断模块、节点在位判断模块的返回结果,机械臂动作控制模块根据返回结果发送控制指令到机械臂;
S3、指令时间设定模块设定指令时间无效或对指令发送时间进行设定,机械臂动作控制模块不接收节点状态判断模块、节点在位判断模块的返回结果,机械臂动作控制模块根据指令时间设定模块的设定值以随机或等时间间隔对机械臂发送指令;
S4、判断是否完成全部测试次数测试,是,机械臂停止工作;否。跳转到步骤S1。
连接节点12V供电接口,节点为开机状态时,12V电压在位,节点状态判断模块返回结果为power高电平;节点关机状态时,12V电压不在位,控节点状态判断模块返回结果为power低电平;
连接RMC,当节点正常插回机柜内,与节点中板正常通信后,节点返回RMC一个在位状态,节点在位判断模块返回health高电平;当节点异常插回机柜内,与节点中板正常通信失败时,节点返回RMC一个不在位状态,节点在位判断模块返回health低电平;机械臂动作控制模块检测到连接节点上电正常且RMC与节点通信正常,发送机械臂停止插入指令;若机械臂动作控制模块检测到节点上电异常和/或RMC与节点通信异常,发送机械臂继续插入指令,机械臂达到轨迹最大距离时停止工作。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (6)

1.一种整机柜服务器节点热拔插系统,其特征是,包括节点状态判断模块,根据连接节点电压状况判断节点处于开机状态或关机状态;节点在位判断模块,根据RMC与节点的通信情况判断节点是否正常插回机柜内部;机械臂动作控制模块,根据节点状态和节点在位状态控制机械臂动作;指令时间设定模块,完成对机械臂发送指令时间间隔的设定;拔插状态设定模块,设定机械臂对节点拔插状态,所述机械臂对节点拔插状态包括正常节点拔插状态,机械臂动作控制模块根据检测的节点状态和节点在位状态控制机械臂动作;非正常节点拔插扎状态,机械臂动作控制模块不检测节点状态和节点在位状态,以随机或固定时间间隔控制机械臂动作;测试次数设定模块,设定机械臂对节点拔插次数;异常告警模块,机械臂对节点拔插异常时发出报警信息。
2.如权利要求1所述的一种整机柜服务器节点热拔插系统,其特征是,该系统还包括机械臂校准模块,根据第一次手动完成机械臂拔插动作测试结果记录机械臂轨迹数据,所述机械臂轨迹数据包括轨迹最大距离数值和最小距离数值。
3.如权利要求2所述的一种整机柜服务器节点热拔插系统,其特征是,该系统还包括机械臂动作阈值设定模块,根据所述机械臂校准模块记录的机械臂移动轨迹的最大距离和最小距离设定为机械臂轨迹阈值。
4.一种整机柜服务器节点热拔插控制方法,采用权利要求1至3任一项权利要求所述系统,其特征是,包括以下步骤:
S1、初始化步骤:测试次数设定模块设定测试次数,拔插状态设定模块设定机械臂对节点拔插状态,若是正常节点拔插,跳转到步骤S2;若是非正常节点拔插,跳转到步骤S3;
S2、指令时间设定模块对指令发送时间间隔进行设定,机械臂动作控制模块接收节点状态判断模块、节点在位判断模块的返回结果,机械臂动作控制模块根据返回结果发送控制指令到机械臂;
S3、指令时间设定模块设定指令时间无效或对指令发送时间进行设定,机械臂动作控制模块不接收节点状态判断模块、节点在位判断模块的返回结果,机械臂动作控制模块根据指令时间设定模块的设定值以随机或等时间间隔对机械臂发送指令;
S4、判断是否完成全部测试次数测试,是,机械臂停止工作;否。跳转到步骤S1。
5.如权利要求4所述的一种整机柜服务器节点热拔插控制方法,其特征是,所述初始化步骤之前还包括以下步骤:机械臂校准模块完成对机械臂轨迹结果记录,机械臂动作阈值设定模块根据所述机械臂校准模块记录的机械臂移动轨迹的最大距离和最小距离设定为机械臂轨迹阈值。
6.如权利要求4所述的一种整机柜服务器节点热拔插控制方法,其特征是,所述机械臂动作控制模块根据返回结果发送控制指令到机械臂具体包括以下:机械臂动作控制模块检测到连接节点上电正常且RMC与节点通信正常,发送机械臂停止插入指令;若机械臂动作控制模块检测到节点上电异常和/或RMC与节点通信异常,发送机械臂继续插入指令,机械臂达到轨迹最大距离时停止工作。
CN201710601278.8A 2017-07-21 2017-07-21 一种整机柜服务器节点热拔插系统和控制方法 Active CN107391340B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710601278.8A CN107391340B (zh) 2017-07-21 2017-07-21 一种整机柜服务器节点热拔插系统和控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710601278.8A CN107391340B (zh) 2017-07-21 2017-07-21 一种整机柜服务器节点热拔插系统和控制方法

Publications (2)

Publication Number Publication Date
CN107391340A true CN107391340A (zh) 2017-11-24
CN107391340B CN107391340B (zh) 2020-10-20

Family

ID=60337471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710601278.8A Active CN107391340B (zh) 2017-07-21 2017-07-21 一种整机柜服务器节点热拔插系统和控制方法

Country Status (1)

Country Link
CN (1) CN107391340B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116168347A (zh) * 2023-04-21 2023-05-26 四川华鲲振宇智能科技有限责任公司 一种芯片暴力热插拔自动监测保护系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263387B1 (en) * 1997-10-01 2001-07-17 Micron Electronics, Inc. System for automatically configuring a server after hot add of a device
CN105260274A (zh) * 2015-10-23 2016-01-20 浪潮电子信息产业股份有限公司 一种基于linux下的硬盘随机热拔插稳定性检测方法
US20160163281A1 (en) * 2014-12-08 2016-06-09 Intel Corporation Filtering hot plug detect signals
CN105868065A (zh) * 2016-04-25 2016-08-17 浪潮电子信息产业股份有限公司 一种SmartRack整机柜热插拔部件测试方法
WO2017033352A1 (ja) * 2015-08-25 2017-03-02 川崎重工業株式会社 産業用遠隔操作ロボットシステム
CN106541419A (zh) * 2016-10-13 2017-03-29 同济大学 一种机器人轨迹误差的测量方法
CN106598794A (zh) * 2016-12-15 2017-04-26 郑州云海信息技术有限公司 一种存储系统硬盘的测试系统及测试方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263387B1 (en) * 1997-10-01 2001-07-17 Micron Electronics, Inc. System for automatically configuring a server after hot add of a device
US20160163281A1 (en) * 2014-12-08 2016-06-09 Intel Corporation Filtering hot plug detect signals
WO2017033352A1 (ja) * 2015-08-25 2017-03-02 川崎重工業株式会社 産業用遠隔操作ロボットシステム
CN105260274A (zh) * 2015-10-23 2016-01-20 浪潮电子信息产业股份有限公司 一种基于linux下的硬盘随机热拔插稳定性检测方法
CN105868065A (zh) * 2016-04-25 2016-08-17 浪潮电子信息产业股份有限公司 一种SmartRack整机柜热插拔部件测试方法
CN106541419A (zh) * 2016-10-13 2017-03-29 同济大学 一种机器人轨迹误差的测量方法
CN106598794A (zh) * 2016-12-15 2017-04-26 郑州云海信息技术有限公司 一种存储系统硬盘的测试系统及测试方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116168347A (zh) * 2023-04-21 2023-05-26 四川华鲲振宇智能科技有限责任公司 一种芯片暴力热插拔自动监测保护系统及方法
CN116168347B (zh) * 2023-04-21 2023-07-14 四川华鲲振宇智能科技有限责任公司 一种芯片暴力热插拔自动监测保护系统及方法

Also Published As

Publication number Publication date
CN107391340B (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN107678356B (zh) 基于fpga芯片平台的柔性直流输电系统仿真实验装置及方法
CN103163398B (zh) 核电站贝雷板件可靠性检测系统和方法
CN110739661B (zh) 一种过流保护装置及板卡
CN105323017A (zh) 通信异常检测装置、通信异常检测方法以及程序
CN106646099A (zh) 一种高压直流输电ttm板卡故障定位系统及其故障定位方法
CN104122507A (zh) 一种小功率电源模块可程控在线检测系统
CN107391340A (zh) 一种整机柜服务器节点热拔插系统和控制方法
CN113487182B (zh) 设备健康状态评估方法、装置、计算机设备和介质
CN108009063A (zh) 一种电子设备故障阈值检测的方法
CN202421448U (zh) 核电站继电器检测装置
CN112463479B (zh) 一种检测vr异常掉电定位功能自动化测试方法与系统
CN203479939U (zh) 一种变压器监控系统
CN100507587C (zh) 用于对电子电路进行放电的系统
CN111707966A (zh) 一种cpld的漏电检测方法及装置
CN108762237B (zh) 分布式控制系统的备件检测系统
CN108735309B (zh) 反应堆保护系统在役检验装置
CN113589092B (zh) 疲劳机、设备上下电测试系统及上下电测试方法
CN113534004B (zh) 一种自动化配电器检测系统
CN109541453B (zh) 一种高压断路器机械特性在线监测更新式系统
CN106814266A (zh) 一种安全仪控系统机柜电容性能检测方法
CN106970607B (zh) 一种变流器控制系统的测试方法及系统
CN101881815B (zh) 一种磁体监控单元测试系统以及一种磁体仿真模拟器
CN101728818A (zh) 多驱动放大器系统及其过电流检测方法
CN220356405U (zh) 一种iepe型传感器状态检查系统及电路
CN211453856U (zh) 一种升压板老化系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200921

Address after: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province

Applicant after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: 450018 Henan province Zheng Dong New District of Zhengzhou City Xinyi Road No. 278 16 floor room 1601

Applicant before: ZHENGZHOU YUNHAI INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant