CN107045467A - 一种整机柜远程监控节点系统测试状态的方法 - Google Patents

一种整机柜远程监控节点系统测试状态的方法 Download PDF

Info

Publication number
CN107045467A
CN107045467A CN201710066930.0A CN201710066930A CN107045467A CN 107045467 A CN107045467 A CN 107045467A CN 201710066930 A CN201710066930 A CN 201710066930A CN 107045467 A CN107045467 A CN 107045467A
Authority
CN
China
Prior art keywords
node
calculate node
band
log
whole machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710066930.0A
Other languages
English (en)
Inventor
赵盛
刘东伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710066930.0A priority Critical patent/CN107045467A/zh
Publication of CN107045467A publication Critical patent/CN107045467A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种整机柜远程监控节点系统测试状态的方法,涉及节点系统管理领域;选取整机柜存储服务器中的某一个计算节点作为测试控制节点,连接外网,同时配置各个计算节点之间的无密码访问,确认各个计算节点能够相互通信,将计算节点的带内系统IP导入测试脚本中;测试过程中,远程访问计算节点带内系统,查看各个计算节点带内系统下相关log;一旦log中出现报错,将报错信息上传到控制节点,控制节点将报错信息发送到远程终端设备;利用本发明方法在测试过程中,远程终端会立即收到报错的提示,特别适合计算节点较多的整机柜,能够实现实时不间断的监控整机柜中计算节点带内系统状态。

Description

一种整机柜远程监控节点系统测试状态的方法
技术领域
本发明公开一种监控节点系统测试状态的方法,涉及节点系统管理领域,具体的说是一种整机柜远程监控节点系统测试状态的方法。
背景技术
机柜用来存放计算机和相关控制设备的物件,可以提供对存放设备的保护,屏蔽电磁干扰,有序、整齐地排列设备,方便以后维护设备。整机柜上计算节点较多,通常情况下,在测试计算节点过程中,计算节点带内系统很容易出现报错,一旦计算节点在系统下出现error、fail等报错就表明测试存在问题,一旦节点出现某种比较严重的测试error, 那么实时上报测试fail就显得很有必要。然而不间断的现场监控消耗大量人力资源,本发明提供一种整机柜远程监控节点系统测试状态的方法,在测试过程中,远程终端会立即收到报错的提示,特别适合计算节点较多的整机柜,能够实现实时不间断的监控整机柜中计算节点带内系统状态。
iptux是一款采用GTK+ 编写的开源局域网即时通讯与文件分享软件,iptux兼容Windows平台下的飞鸽传书协议,具有自动识别编码字符集的功能。另外还实现文件夹共享的功能,更加方便局域网好友之间的数据分享。
SSH 为 Secure Shell 的缩写,由 IETF 的网络工作小组(Network WorkingGroup)所制定;SSH为建立在应用层和传输层基础上的安全协议。SSH 是目前较可靠,专为远程登录会话和其他网络服务提供安全性的协议。利用 SSH 协议可以有效防止远程管理过程中的信息泄露问题。SSH最初是UNIX系统上的一个程序,后来又迅速扩展到其他操作平台。SSH在正确使用时可弥补网络中的漏洞。SSH客户端适用于多种平台。几乎所有UNIX平台-包括HP-UX、Linux、AIX、Solaris、Digital UNIX、Irix,以及其他平台,都可运行SSH。
发明内容
本发明针对目前整机柜中大量的计算节点带内系统,没有实时不间断对计算节点带内系统测试状态进行长时间远程监控的方法,提供一种整机柜远程监控节点系统测试状态的方法。
一种整机柜远程监控节点系统测试状态的方法,选取整机柜存储服务器中的某一个计算节点作为测试控制节点,连接外网,同时配置各个计算节点之间的无密码访问,确认各个计算节点能够相互通信,将计算节点的带内系统IP导入测试脚本中;
测试过程中,远程访问计算节点带内系统,查看各个计算节点带内系统下相关log;
一旦log中出现报错,将报错信息上传到控制节点,控制节点将报错信息发送到远程终端设备。
所述确认各个计算节点能够相互通信是指整机柜内各个计算节点带内IP与测试控制节点IP在同一个网段,能够互相ping通。
测试过程中,计算节点后台不间断抓取带内系统log,若计算节点带内系统的log无任何报错,继续后台不间断抓取计算节点带内系统的log,若计算节点带内系统的log一旦出现报错,将报错信息上传至测试控制节点,控制节点将报错信息发送到远程终端设备。
通过ssh服务远程访问计算节点带内系统,查看各个计算节点带内系统下相关log。
控制节点将报错信息通过实时通讯工具iptux发送到终端设备以便监控。
所述终端设备为手机、平板电脑、智能手表。
本发明与现有技术相比具有的有益效果是:
本发明提供一种整机柜远程监控节点系统测试状态的方法,选取整机柜存储服务器中的某一个计算节点作为测试控制节点,连接外网,同时配置各个计算节点之间的无密码访问,确认各个计算节点能够相互通信,将计算节点的带内系统IP导入测试脚本中;测试过程中,远程访问计算节点带内系统,查看各个计算节点带内系统下相关log;一旦log中出现报错,将报错信息上传到控制节点,控制节点将报错信息发送到远程终端设备,在测试过程中,远程终端会立即收到报错的提示,特别适合计算节点较多的整机柜,能够实现实时不间断的监控整机柜中计算节点带内系统状态。
附图说明
图1本发明方法的流程示意图。
具体实施方式
一种整机柜远程监控节点系统测试状态的方法,选取整机柜存储服务器中的某一个计算节点作为测试控制节点,连接外网,同时配置各个计算节点之间的无密码访问,确认各个计算节点能够相互通信,将计算节点的带内系统IP导入测试脚本中;
测试过程中,远程访问计算节点带内系统,查看各个计算节点带内系统下相关log;
一旦log中出现报错,将报错信息上传到控制节点,控制节点将报错信息发送到远程终端设备。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本发明进一步详细说明。
利用本发明方法准备测试环境:使用整机柜的某个计算节点或另外选取一台服务器节点作为测试控制节点,连接外网,并配置好各个计算节点之间的无密码访问,确认各个计算节点能够相互通信,需要将计算节点的带内系统IP导入测试脚本程序中的iplist中,其中执行的相关脚本log_minitor.sh主要内容如下:
iplist="
192.168.1.1
192.168.1.2
192.168.1.3
192.168.1.4
192.168.1.5
192.168.1.6
192.168.1.7
192.168.1.8
192.168.1.9…
" //将整机柜中每个计算节点的带内系统ip地址写入变量iplist中//
while ://死循环//
do
for ip in $iplist ;
do
echo $ip //打印调用的IP地址//
ssh $ip /root/error_check.sh //计算节点执行程序error_check.sh//
(error_check.sh具体内容如下:
#!/bin/sh
for word in {error fail warning}
do
cat /var/log/messages|grep -i $word|tee -a /root/error.log //若节点messages中出现error等报错,将报错信息写入error.log中//
if [ -s /root/error.log ];then
tar czvf /root/errorlog.tgz /root/error.log//若error.log不为空,将该文件打包//
else
echo “testing is ok”//若error.log为空,则表明测试正常//
)
done
mkdir -p /root/errorinfo/$ip
scp -r $ip:/root/errorlog.tgz /root/errorinfo/$ip //将每个计算节点的错误log复制到控制节点errorinfo目录下//
if [ -s /root/errorinfo/$ip/errorlog.tgz];then
tar czvf /root/errorinfo/$ip.tgz /root/errorinfo/$ip/errorlog.tgz //将控制节点下的报错log压缩
done
done程序结束
上述过程中,计算节点后台不间断抓取带内系统log,若计算节点带内系统的log无任何报错,继续后台不间断抓取计算节点带内系统的log,若计算节点带内系统的log一旦出现报错,将报错信息打包上传至测试控制节点;
控制节点设置不断上传errorlog.tgz到实时通讯软件iptux并指定手机终端上的账户,手机终端只要后台打开iptux就能实时获取控制节点端所收到的报错信息。远程终端设备还可以是平板电脑或者智能手表。
利用本发明方法对整机柜的计算节点测试工作提供实时监控,简单实用,更加高效。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式。

Claims (6)

1.一种整机柜远程监控节点系统测试状态的方法,其特征在于选取整机柜存储服务器中的某一个计算节点作为测试控制节点,连接外网,同时配置各个计算节点之间的无密码访问,确认各个计算节点能够相互通信,将计算节点的带内系统IP导入测试脚本中;
测试过程中,远程访问计算节点带内系统,查看各个计算节点带内系统下相关log;
一旦log中出现报错,将报错信息上传到控制节点,控制节点将报错信息发送到远程终端设备。
2.根据权利要求1所述的方法,其特征在于所述确认各个计算节点能够相互通信是指整机柜内各个计算节点带内IP与测试控制节点IP在同一个网段,能够互相ping通。
3.根据权利要求1或2所述的方法,其特征在于测试过程中,计算节点后台不间断抓取带内系统log,若计算节点带内系统的log无任何报错,继续后台不间断抓取计算节点带内系统的log,若计算节点带内系统的log一旦出现报错,将报错信息上传至测试控制节点,控制节点将报错信息发送到远程终端设备。
4.根据权利要求3所述的方法,其特征在于通过ssh服务远程访问计算节点带内系统,查看各个计算节点带内系统下相关log。
5.根据权利要求4所述的方法,其特征在于控制节点将报错信息通过实时通讯工具iptux发送到终端设备以便监控。
6.根据权利要求5所述的方法,其特征在于所述终端设备为手机、平板电脑、智能手表。
CN201710066930.0A 2017-02-07 2017-02-07 一种整机柜远程监控节点系统测试状态的方法 Pending CN107045467A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710066930.0A CN107045467A (zh) 2017-02-07 2017-02-07 一种整机柜远程监控节点系统测试状态的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710066930.0A CN107045467A (zh) 2017-02-07 2017-02-07 一种整机柜远程监控节点系统测试状态的方法

Publications (1)

Publication Number Publication Date
CN107045467A true CN107045467A (zh) 2017-08-15

Family

ID=59545153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710066930.0A Pending CN107045467A (zh) 2017-02-07 2017-02-07 一种整机柜远程监控节点系统测试状态的方法

Country Status (1)

Country Link
CN (1) CN107045467A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108063822A (zh) * 2017-12-20 2018-05-22 郑州云海信息技术有限公司 一种整机柜服务器系统下自动更新kernel的方法
CN108304292A (zh) * 2018-01-17 2018-07-20 郑州云海信息技术有限公司 一种节点检测硬盘盘序的方法及系统
CN108984419A (zh) * 2018-08-23 2018-12-11 郑州云海信息技术有限公司 一种存储软件测试方法、装置及设备
CN109586994A (zh) * 2018-11-01 2019-04-05 郑州云海信息技术有限公司 一种整机柜服务器老化测试监控方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW484053B (en) * 2001-01-08 2002-04-21 Pac Interactive Technology Inc Remote monitoring method and system
CN104468810A (zh) * 2014-12-18 2015-03-25 山东超越数控电子有限公司 一种基于龙芯平台的高性能计算资源监控实现方法
CN104809041A (zh) * 2015-05-07 2015-07-29 浪潮电子信息产业股份有限公司 一种整机柜服务器电源的批量测试方法
CN104954189A (zh) * 2015-07-07 2015-09-30 上海斐讯数据通信技术有限公司 一种服务器集群的自动检测方法和系统
CN105389242A (zh) * 2015-10-14 2016-03-09 浪潮电子信息产业股份有限公司 一种实现批量获取整机柜服务器信息的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW484053B (en) * 2001-01-08 2002-04-21 Pac Interactive Technology Inc Remote monitoring method and system
CN104468810A (zh) * 2014-12-18 2015-03-25 山东超越数控电子有限公司 一种基于龙芯平台的高性能计算资源监控实现方法
CN104809041A (zh) * 2015-05-07 2015-07-29 浪潮电子信息产业股份有限公司 一种整机柜服务器电源的批量测试方法
CN104954189A (zh) * 2015-07-07 2015-09-30 上海斐讯数据通信技术有限公司 一种服务器集群的自动检测方法和系统
CN105389242A (zh) * 2015-10-14 2016-03-09 浪潮电子信息产业股份有限公司 一种实现批量获取整机柜服务器信息的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108063822A (zh) * 2017-12-20 2018-05-22 郑州云海信息技术有限公司 一种整机柜服务器系统下自动更新kernel的方法
CN108304292A (zh) * 2018-01-17 2018-07-20 郑州云海信息技术有限公司 一种节点检测硬盘盘序的方法及系统
CN108984419A (zh) * 2018-08-23 2018-12-11 郑州云海信息技术有限公司 一种存储软件测试方法、装置及设备
CN109586994A (zh) * 2018-11-01 2019-04-05 郑州云海信息技术有限公司 一种整机柜服务器老化测试监控方法及系统

Similar Documents

Publication Publication Date Title
CN107045467A (zh) 一种整机柜远程监控节点系统测试状态的方法
US11075821B2 (en) Method and apparatus for managing field device based on cloud server
CN105933888B (zh) 一种基于NFC的eSIM卡烧录方法及装置
CN109922073A (zh) 网络安全监控装置、方法和系统
CN110365793A (zh) 违规外联监测方法、装置、系统及存储介质
CN101227343B (zh) 一种TCPv6和/或UDPv6测试设备及方法
CN100479394C (zh) 业务处理网元的模拟测试系统及方法
CN104125307A (zh) 一种数据流量分享方法和装置
CN102497427B (zh) 实现可再生能源监测系统数据采集服务的方法和装置
CN105827624B (zh) 一种身份验证系统
CN105005521A (zh) 测试方法及装置
CN103747076B (zh) 云平台的访问方法和装置
CN103929746A (zh) 物联网设备上网配置的方法、物联网设备和用户设备
CN114422201B (zh) 一种网络靶场大规模用户远程接入方法和系统
CN109819053A (zh) 应用于混合云环境下的跳板机系统及其控制方法
CN105490872A (zh) 一种网络即时通讯数据信息实时监控系统及监控方法
CN107819649A (zh) 一种基于海量终端的卫星通信网络的私有协议测试方法
CN108540479A (zh) 基于云服务器的智能充电桩管理系统及其工作方法
CN109246704A (zh) 用于远程连接的安全审计系统及方法
CN108512860A (zh) 基于云服务器的智能充电桩管理系统及其工作方法
CN105518693A (zh) 一种安全防护方法,及装置
CN102075588B (zh) 一种实现网络地址转换nat穿越的方法、系统和设备
CN103475533B (zh) 监控前端接入方法、装置及系统
CN105721274A (zh) 一种多种即时通讯的融合方法及装置
CN102123305B (zh) 一种实现网络传输故障排查的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170815

RJ01 Rejection of invention patent application after publication