CN107465569A - 一种SAS Switch整机柜抓取节点phy error count的方法及系统 - Google Patents
一种SAS Switch整机柜抓取节点phy error count的方法及系统 Download PDFInfo
- Publication number
- CN107465569A CN107465569A CN201710561630.XA CN201710561630A CN107465569A CN 107465569 A CN107465569 A CN 107465569A CN 201710561630 A CN201710561630 A CN 201710561630A CN 107465569 A CN107465569 A CN 107465569A
- Authority
- CN
- China
- Prior art keywords
- node
- whole machine
- error count
- phy
- sas switch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
- H04L43/0847—Transmission error
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明公开了一种SAS Switch整机柜抓取节点phy error count的方法及系统,包括以下步骤:首先在SAS Switch整机柜中搭建测试系统,配置各个计算节点之间的通信方式;将HBA管理工具lsiutil安装至整机柜存储服务器中各个计算节点下的root目录;远程访问各个计算节点,打开并进入HBA卡lsiutil管理工具;通过lsiutil工具依次输入指令,查询当前节点phy count信息;利用后台抓取节点的phy error count信息。针对存在大量计算节点的phy error count信息,能够实现长时间连续的监测和抓取,用以提高SAS Switch整机柜的测试效率。
Description
技术领域
本发明涉及一种服务器节点信息的检测方法,属于计算机通信领域,尤其涉及一种SAS Switch整机柜抓取节点phy error count的方法及系统。
背景技术
SAS Switch整机柜中计算节点较多,在测试过程中,计算节点通过HBA卡与SASSwitch节点进行通信。通常情况下,一旦计算节点与其子节点之间的通信链路出现故障,此时计算节点就会产生大量的phy error,因此在测试过程中对计算节点的HBA卡与SASSwitch节点链路之间产生的phy error count进行统计就显得很有必要。
如中国专利(申请公布号CN106445791A)公开了了“一种SAS Switch整机柜上抓取SAS Switch寄存器数据的方法”,对SAS Switch端口各个PHY值对应的中断寄存器及中断事件寄存器进行中断向量的清除;对SAS Switch端口各个PHY值对应的中断寄存器及中断事件寄存器写入1来读取当前寄存器的数据,并加入循环反复读取,在多次读取数据之后写入0xffffffff清除寄存器中的中断向量,实现定时读取。该SAS Switch整机柜上抓取SASSwitch寄存器数据的方法,能够快速简便的利用Telnet访问SAS Switch命令行并同时进行大量的反复读取,能够实现对SAS Switch节点各个端口的PHY值的反复自动化读取和对对应的寄存器的长时间监控,从而确保了测试效率,为SAS Switch的工作监控也提供了便捷,具有较强的实用性。虽然该方法能够提高抓取SAS Switch寄存器数据的效率,但过程较为复杂且也没有对节点phy error count信息进行有效统计,不便于进行SAS Switch整机柜的测试,因而存在不足。
发明内容
本发明提供一种SAS Switch整机柜抓取节点phy error count的方法及系统,尤其是对于计算节点较多的整机柜,本方法对计算节点phy error count信息能够实现长时间连续的监测和抓取,能提高SAS Switch整机柜的测试效率。
本发明通过以下技术方案予以实现:
一种SAS Switch整机柜抓取节点phy error count的方法,包括以下步骤:
S1.首先在SAS Switch整机柜中搭建测试系统,选取整机柜存储服务器或外部的服务器中的某一个计算节点作为测试控制节点,配置各个计算节点之间的通信方式;
S2.将HBA管理工具lsiutil安装至整机柜存储服务器中各个计算节点下的 root目录;
S3.远程访问各个计算节点,打开并进入HBA卡lsiutil管理工具;
S4.通过lsiutil工具依次输入指令,查询当前节点phy count信息;
S5.利用后台抓取节点的phy error count信息。
所述步骤S1中各个计算节点之间采用Telnet协议进行无密码访问。
所述步骤S5中所抓取出的节点phy error count信息存放在寄存器的log 文件内。
所述步骤S5中设置有在后台可循环执行的脚本,同时将打印的phy error count信息导入到log文件中,以实现对phy error count信息的实时连续抓取。
一种SAS Switch整机柜抓取节点phy error count的系统,所述系统包括 SASSwitch整机柜、自动安装模块、自动查询模块和自动抓取模块;所述SAS Switch整机柜包括存储服务器,用于在存储服务器或外部的服务器中的某一个计算节点作为测试控制节点,并实现各个计算节点之间的通信;所述自动安装模块,用于将HBA管理工具lsiutil安装至整机柜存储服务器中各个计算节点下的root目录内;所述自动查询模块,用于远程访问各个计算节点,通过lsiutil 工具查询当前节点phy count信息;所述自动抓取模块,用于抓取节点的phy error count信息。
进一步的,所述自动抓取模块中设置有log文件保存模块,用于保存抓取的节点phy count信息,并将phy error count信息保存为log文件。
更进一步的,所述log文件保存模块由安装在SAS Switch整机柜中的循环执行脚本模块控制,实时连续的将phy error count信息写入到log文件。
与现有技术相比,本发明的优点是:
本发明适合于有大量计算节点的整机柜管理使用,针对大量的计算节点能够有效的对phy error count信息进行实时连续抓取,为SAS Switch整机柜的计算节点通信链路监控提供了便捷、高效的管理途径,简单实用,从而有利于提高服务器的运行效率、方便管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍。
图1是本发明的流程图
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
如图1所示,本实施例一种SAS Switch整机柜抓取节点phy error count 的方法,整体上可以分为测试系统的搭建和远程访问节点获取phy error count 信息。
首先在SAS Switch整机柜中搭建测试系统,使用SAS Switch整机柜的某个计算节点或另外选取一台服务器节点作为测试控制节点,并配置好各个节点之间的无密码访问,各个节点之间的通信采用Telnet协议方式。
然后将HBA管理工具lsiutil安装至整机柜存储服务器中各个计算节点下的root目录;远程访问各个计算节点,打开并进入HBA卡lsiutil管理工具;再通过lsiutil工具依次输入指令,查询当前节点phy count信息;然后利用后台抓取节点的phy error count信息。
具体各个计算节点下的root中执行的相关脚本phy_minitor.sh主要为以下内容:
/root/lsitool/Source/lsiutil/lsiutil-e<<…//自动执行lsiutil 工具//
1//选择设备//
20//拓展卡fw下载//
12//展示phy计数器,可查看phy error count//
0//退出当前环境//
0//退出当前环境//
0//退出lsiutil工具//
<<…
对于多个计算节点(以cu1…cu10为例),加入循环并后台执行脚本 phy_minitor.sh,同时将打印的phy error count导入到本地文件中,控制节点操作如下:
while:
do
for i in{1..10};
do
ssh cu$i
/root/phy_minitor.sh|tee–a/root/phy.log 2>&1
done
done
所抓取的phy error count均在phy.log文件中,可根据实际测试情况将相应延迟加入该循环中,以实现对phy error count信息的实时连续抓取。
本发明提供了一种SAS Switch整机柜抓取节点phy error count的系统,包括SASSwitch整机柜、自动安装模块、自动查询模块和自动抓取模块;
SAS Switch整机柜包括存储服务器,用于在存储服务器或外部的服务器中的某一个计算节点作为测试控制节点,并实现各个计算节点之间的通信;
自动安装模块,用于将HBA管理工具lsiutil安装至整机柜存储服务器中各个计算节点下的root目录内;
自动查询模块,用于远程访问各个计算节点,通过lsiutil工具查询当前节点phycount信息;
自动抓取模块,用于抓取和存储节点的phy error count信息。在自动抓取模块中设置有log文件保存模块,用于保存抓取的节点phy count信息,并将phy error count信息保存为log文件。
更进一步的,由安装在SAS Switch整机柜中的循环执行脚本模块控制log 文件保存模块,可以实时连续的将phy error count信息写入到log文件。
本方法可以高效、不间断对SAS Switch整机柜的计算节点phy error count 进行长时间监控,因而,能够对大量计算节点之间的通信链路监控提供了便捷、简单实用的管理方式,有效提高服务器的运行效率。
本发明未详尽描述的技术内容均为公知技术。
Claims (7)
1.一种SAS Switch整机柜抓取节点phy error count的方法,其特征在于,包括以下步骤:
S1.首先在SAS Switch整机柜中搭建测试系统,选取整机柜存储服务器或外部的服务器中的某一个计算节点作为测试控制节点,配置各个计算节点之间的通信方式;
S2.将HBA管理工具lsiutil安装至整机柜存储服务器中各个计算节点下的root目录;
S3.远程访问各个计算节点,打开并进入HBA卡lsiutil管理工具;
S4.通过lsiutil工具依次输入指令,查询当前节点phy count信息;
S5.利用后台抓取节点的phy error count信息。
2.根据权利要求1所述的一种SAS Switch整机柜抓取节点phy error count的方法,其特征在于,所述步骤S1中各个计算节点之间采用Telnet协议进行无密码访问。
3.根据权利要求1所述的一种SAS Switch整机柜抓取节点phy error count的方法,其特征在于,所述步骤S5中所抓取出的节点phy error count信息存放在寄存器的log文件内。
4.根据权利要求1所述的一种SAS Switch整机柜抓取节点phy error count的方法,其特征在于,所述步骤S5中设置有在后台可循环执行的脚本,同时将打印的phy error count信息导入到log文件中,以实现对phy error count信息的实时连续抓取。
5.根据权利要求1所述的一种SAS Switch整机柜抓取节点phy error count的系统,其特征在于,所述系统包括SAS Switch整机柜、自动安装模块、自动查询模块和自动抓取模块;
所述SAS Switch整机柜包括存储服务器,用于在存储服务器或外部的服务器中的某一个计算节点作为测试控制节点,并实现各个计算节点之间的通信;
所述自动安装模块,用于将HBA管理工具lsiutil安装至整机柜存储服务器中各个计算节点下的root目录内;
所述自动查询模块,用于远程访问各个计算节点,通过lsiutil工具查询当前节点phycount信息;
所述自动抓取模块,用于抓取节点的phy error count信息。
6.根据权利要求5所述的一种SAS Switch整机柜抓取节点phy error count的系统,其特征在于,所述自动抓取模块中设置有log文件保存模块,用于保存抓取的节点phy count信息,并将phy error count信息保存为log文件。
7.根据权利要求6所述的一种SAS Switch整机柜抓取节点phy error count的系统,其特征在于,所述log文件保存模块由安装在SAS Switch整机柜中的循环执行脚本模块控制,实时连续的将phy error count信息写入到log文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710561630.XA CN107465569A (zh) | 2017-07-11 | 2017-07-11 | 一种SAS Switch整机柜抓取节点phy error count的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710561630.XA CN107465569A (zh) | 2017-07-11 | 2017-07-11 | 一种SAS Switch整机柜抓取节点phy error count的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107465569A true CN107465569A (zh) | 2017-12-12 |
Family
ID=60543988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710561630.XA Pending CN107465569A (zh) | 2017-07-11 | 2017-07-11 | 一种SAS Switch整机柜抓取节点phy error count的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107465569A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109586994A (zh) * | 2018-11-01 | 2019-04-05 | 郑州云海信息技术有限公司 | 一种整机柜服务器老化测试监控方法及系统 |
CN111223516A (zh) * | 2019-12-26 | 2020-06-02 | 曙光信息产业(北京)有限公司 | Raid卡检测方法以及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132782A1 (en) * | 2011-11-22 | 2013-05-23 | Lsi Corporation | Method to improve i/o reliability on a degraded wide port connection |
CN104102571A (zh) * | 2013-04-08 | 2014-10-15 | 鸿富锦精密工业(深圳)有限公司 | Sas端口监测方法及系统 |
CN105516359A (zh) * | 2016-01-19 | 2016-04-20 | 浪潮电子信息产业股份有限公司 | 利用telnet协议对SAS Switch JBOD进行管理操作的方法 |
CN106445791A (zh) * | 2016-10-25 | 2017-02-22 | 广东浪潮大数据研究有限公司 | 一种SAS Switch整机柜上抓取SAS Switch寄存器数据的方法 |
-
2017
- 2017-07-11 CN CN201710561630.XA patent/CN107465569A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132782A1 (en) * | 2011-11-22 | 2013-05-23 | Lsi Corporation | Method to improve i/o reliability on a degraded wide port connection |
CN104102571A (zh) * | 2013-04-08 | 2014-10-15 | 鸿富锦精密工业(深圳)有限公司 | Sas端口监测方法及系统 |
CN105516359A (zh) * | 2016-01-19 | 2016-04-20 | 浪潮电子信息产业股份有限公司 | 利用telnet协议对SAS Switch JBOD进行管理操作的方法 |
CN106445791A (zh) * | 2016-10-25 | 2017-02-22 | 广东浪潮大数据研究有限公司 | 一种SAS Switch整机柜上抓取SAS Switch寄存器数据的方法 |
Non-Patent Citations (2)
Title |
---|
USER’S GUIDE: "LSIUtil Configuration Utility", 《USER’S GUIDE》 * |
李光亚: "智慧城市大数据", 《智慧城市大数据》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109586994A (zh) * | 2018-11-01 | 2019-04-05 | 郑州云海信息技术有限公司 | 一种整机柜服务器老化测试监控方法及系统 |
CN111223516A (zh) * | 2019-12-26 | 2020-06-02 | 曙光信息产业(北京)有限公司 | Raid卡检测方法以及装置 |
CN111223516B (zh) * | 2019-12-26 | 2021-09-07 | 曙光信息产业(北京)有限公司 | Raid卡检测方法以及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101563908B (zh) | 分析网络流的装置和方法 | |
CN102929613B (zh) | 操作系统的调优装置和方法 | |
CN103812726A (zh) | 一种数据通信设备的自动化测试方法及装置 | |
CN103593271A (zh) | 一种片上系统芯片追踪调试的方法及装置 | |
CN107015896B (zh) | 一种嵌入式设备cpu及其外设状态实时监测方法、系统 | |
CN102438010B (zh) | 用于流送数据剖析的方法和装置 | |
RU2007101287A (ru) | Усовершенствованное устройство обработки сетевой статистики | |
CN105809942A (zh) | 一种用电信息采集系统的数据处理方法及装置 | |
CN104182345A (zh) | 一种计算机软件测试系统 | |
CN103106364A (zh) | 程序分析系统和方法 | |
CN108009065A (zh) | 监控axi总线的方法和装置 | |
CN105405221A (zh) | 一种自动化测试的方法及装置 | |
CN113028603A (zh) | 一种应用于中央空调系统的设备监测系统 | |
CN107465569A (zh) | 一种SAS Switch整机柜抓取节点phy error count的方法及系统 | |
CN110493085A (zh) | IPv6活跃用户数的统计方法、系统、电子设备及介质 | |
CN105786693A (zh) | 一种自测试执行系统及方法以及移动终端 | |
CN102426548A (zh) | 嵌入式系统的调试方法、调试器和调试系统 | |
CN103077080B (zh) | 基于高性能平台的并行程序性能数据采集方法及装置 | |
CN108009086B (zh) | 基于用例分解和功能学习的系统自动化测试方法 | |
CN104821959A (zh) | 一种智能云计算管理系统 | |
CN103902590B (zh) | 终端自动化测试方法及其装置 | |
CN104318283A (zh) | 移动终端式试验仪器管理系统及方法 | |
CN116647490A (zh) | 一种航空afdx网络数据检测系统 | |
CN107888457A (zh) | 端口丢包检测方法、装置及通信设备 | |
CN109407655A (zh) | 一种调试芯片的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171212 |
|
RJ01 | Rejection of invention patent application after publication |