CN104050065A - 一种针对服务器开关机测试中故障定位的方法 - Google Patents
一种针对服务器开关机测试中故障定位的方法 Download PDFInfo
- Publication number
- CN104050065A CN104050065A CN201410263517.XA CN201410263517A CN104050065A CN 104050065 A CN104050065 A CN 104050065A CN 201410263517 A CN201410263517 A CN 201410263517A CN 104050065 A CN104050065 A CN 104050065A
- Authority
- CN
- China
- Prior art keywords
- server
- chip microcomputer
- serial ports
- test
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种针对服务器开关机测试中故障定位的方法,涉及服务器测试技术领域,本发明服务器进行正常的开关机或重启等测试时,服务器内部串口实时向外部设计的单片机电路输出信息,单片机电路将串口输出的信息转换为并行数据,并递交给代码显示电路,代码显示电路将读取到的数据进行串并转换后,实时显示在LED数码管上。
Description
技术领域
本发明涉及服务器测试技术领域,具体地说是一种针对服务器开关机测试中故障定位的方法。
背景技术
随着服务器行业的快速发展,越来越多的客户开始偏向于购买大批量的服务器作为自己的核心应用,所以除了对服务器的稳定性、可靠性也提出了更高的要求。而服务器能否保持正常的运转,已经成为了客户应用能否稳定运行的前提。
服务器CPU、Raid卡、硬盘、内存等都处于高速运转状态时,突然掉电情况下系统和数据的安全性得不到保障,测试过程中依靠工程师手如果一直观察待测服务器,不仅故障排查的时间较长,而且极大的消耗了工程师的精力,十分浪费测试资源。
发明内容
本专利改进了服务器测试过程中对故障定位的手段。
一般通用服务器上没有集成可以显示Boot Code值的数码管,但都集成了可以用于BMC调试的COM口,因此本方法可以适用于大多数通用服务器。
当服务器出现故障时,服务器系统会宕机并停止boot,此时微处理器判定启动超时,自动记录BootCode值、启动次数、统计故障发生频率等,为研发人员分析问题提供可靠的第一手资料。研发人员可以根据Boot Code代码,快速定位服务器系统出现的问题。
本设计的实现方法为,服务器进行正常的开关机或重启等测试时,服务器内部串口实时向外部设计的单片机电路输出信息,单片机电路将串口输出的信息转换为并行数据,并递交给代码显示电路,代码显示电路将读取到的数据进行串并转换后,实时显示在LED数码管上。
本测试方法采用的试程序由汇编语言编写。整个测试程序分为AT89C51单片机信号处理及MX232信号的串并转换、服务器电源控制3个部分组成。
使用微处理器和串口MX232换芯片,读取服务器主板上的BMC专用或复用的COM口数据,并外置数码管实时显示当前的Boot Code值,来定位服务器故障。并且在启动超时的时候记录Boot Code值、启动次数等,接着进入下一轮重启。
本发明在服务器测试过程中对故障定位的手段的具体操作步骤为
1)、准备一台待测服务器系统;
2)、安装完成后,以管理员身份(Administrator)登录到操作系统中;
3)、将单片机系统的串口,通过标准串口钱连接至待测试服务器的串口,并将单片机的输出与LED显示线路相连;
4)、在待测试服务器系统上,将串口发包工具设置为系统登录后自动运行;
5)、运行首次测试时,手动将服务器开机;
6)、系统启动进入OS后,串口将自动发送数据至单片机,单片机根据延时设定,进行系统下断电操作;
7)、断电后,单片机根据延时设定,给服务器AC通电,并执行开机动作;
8)、系统启动后,将进入循环自动断电测试。
9)、当服务器出现故障停止Boot时,查看LED显示电路的代码,对应BIOS Boot Code排查故障原因。
本发明的有益效果是:
使用微处理器与服务器的BMC调试串口进行通信,通过实时读取Boot Code代码来定位服务器故障。
本方法可以适用于大多数通用服务器,通过借助串口工具,在系统启动过程中可实时查看串口输出的数据,当服务器测试过程中出现宕机等现象时,可通过串口的输出并转换为可显示的代码,快速的查看到故障信息,并快速的定为故障,大大节省了故障排查的时间和工程师的精力。
附图说明
图1是测试流程图;
图2是单电机电路图;
图3是MX232电路设计图;
图4是服务器串口示意;
图5是数码管显示电路设计图;
图6是测试系统线路图;
图7待测试系统接口示意图(服务器后视图)。
具体实施方式
服务器进行正常的开关机或重启等测试时,服务器内部串口实时向外部设计的单片机电路输出信息,单片机电路将串口输出的信息转换为并行数据,并递交给代码显示电路,代码显示电路将读取到的数据进行串并转换后,实时显示在LED数码管上。
本测试方法采用的试程序由汇编语言编写。整个测试程序分为AT89C51单片机信号处理及MX232信号的串并转换、服务器电源控制3个部分组成。
使用微处理器和串口MX232换芯片,读取服务器主板上的BMC专用或复用的COM口数据,并外置数码管实时显示当前的Boot Code值,来定位服务器故障。并且在启动超时的时候记录Boot Code值、启动次数等,接着进入下一轮重启。
一.操作步骤及说明
1. 准备一台待测服务器系统——最好是多路配置较复杂的服务器,如Windows 2008 R2操作系统或其他Windows/Linux操作系统;
2. 安装完成后,以管理员身份(Administrator)登录到操作系统中;
3. 将单片机系统的串口,通过标准串口钱连接至待测试服务器的串口,并将单片机的输出与LED显示线路相连。
4. 在待测试服务器系统上,将串口发包工具设置为系统登录后自动运行;
5. 运行首次测试时,手动将服务器开机;
6. 系统启动进入OS后,串口将自动发送数据至单片机,单片机根据延时设定,进行系统下断电操作;
7. 断电后,单片机根据延时设定,给服务器AC通电,并执行开机动作;
8. 系统启动后,将进入循环自动断电测试。
9. 当服务器出现故障停止Boot时,查看LED显示电路的代码,对应BIOS Boot Code排查故障原因。
二.注意事项
一台运行Windows Server 2008 R2的服务器,默认情况下在非正常关机后,再次开机时总是出现一个关机事件询问对话框。执行该项测试测试时,需要按图4提示,将Windows系统的事件跟踪器关闭。
打开【组策略编辑器】窗口,在左窗格中依次展开【计算机配置】à【管理模板】目录,单击选中【系统】选项,在右窗格中双击【显示关闭事件追踪程序】选项,在打开的对话框中选中【已禁用】单选框,并单击【确定】按钮使设置生效。
三.设计结论
本服务器开关机测试中故障定位的方法在多款通用服务器产品:NF5240M3、NF5280M3、NF8560M2、NP5540M3,及多种Windows操作系统:Windows XP、Windows Server 2003、Windows Server 2003、Windows Server 2008、Windows Server 2008 R2上均有做过测试,此方法表现良好,很好的完成了测试任务。该测试方法操作简单,具有较好的易用性,能够通过查看Boot Code,快速定位系统故障,大大节省了测试时间,提高了测试效率。
Claims (5)
1.一种针对服务器开关机测试中故障定位的方法,其特征在于
服务器进行正常的开关机或重启等测试时,服务器内部串口实时向外部设计的单片机电路输出信息,单片机电路将串口输出的信息转换为并行数据,并递交给代码显示电路,代码显示电路将读取到的数据进行串并转换后,实时显示在LED数码管上。
2.根据权利要求1所述的方法,其特征在于本测试方法采用的试程序由汇编语言编写;整个测试程序分为AT89C51单片机信号处理及MX232信号的串并转换、服务器电源控制3个部分组成;
使用微处理器和串口MX232换芯片,读取服务器主板上的BMC专用或复用的COM口数据,并外置数码管实时显示当前的Boot Code值,来定位服务器故障;并且在启动超时的时候记录Boot Code值、启动次数等,接着进入下一轮重启。
3.根据权利要求2所述的方法,其特征在于单片机采用AT89C51,通过简单的电源供应时钟产生电路及可以正常工作;晶振及电容的大小,可以根据实际需要自行调节。
4.根据权利要求2所述的方法,其特征在于MX232芯片负责将待测试服务器产生的串口信号转换为并行型号,并送至单片机处理。
5.根据权利要求1所述的方法,其特征在于
具体操作步骤为
1)、准备一台待测服务器系统;
2)、安装完成后,以管理员身份(Administrator)登录到操作系统中;
3)、将单片机系统的串口,通过标准串口钱连接至待测试服务器的串口,并将单片机的输出与LED显示线路相连;
4)、在待测试服务器系统上,将串口发包工具设置为系统登录后自动运行;
5)、运行首次测试时,手动将服务器开机;
6)、系统启动进入OS后,串口将自动发送数据至单片机,单片机根据延时设定,进行系统下断电操作;
7)、断电后,单片机根据延时设定,给服务器AC通电,并执行开机动作;
8)、系统启动后,将进入循环自动断电测试;
9)、当服务器出现故障停止Boot时,查看LED显示电路的代码,对应BIOS Boot Code排查故障原因。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410263517.XA CN104050065A (zh) | 2014-06-13 | 2014-06-13 | 一种针对服务器开关机测试中故障定位的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410263517.XA CN104050065A (zh) | 2014-06-13 | 2014-06-13 | 一种针对服务器开关机测试中故障定位的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104050065A true CN104050065A (zh) | 2014-09-17 |
Family
ID=51502954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410263517.XA Pending CN104050065A (zh) | 2014-06-13 | 2014-06-13 | 一种针对服务器开关机测试中故障定位的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104050065A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776242A (zh) * | 2016-12-06 | 2017-05-31 | 郑州云海信息技术有限公司 | 一种用于存储系统的背板led控制系统 |
CN106909277A (zh) * | 2017-02-28 | 2017-06-30 | 郑州云海信息技术有限公司 | 一种基于linux平台控制服务器重启和实时显示串口输出信息的方法 |
CN107480052A (zh) * | 2017-07-21 | 2017-12-15 | 广东虹勤通讯技术有限公司 | 一种定位宕机时bios代码的方法及装置 |
CN109271287A (zh) * | 2018-10-08 | 2019-01-25 | 郑州云海信息技术有限公司 | 一种服务器串口信息的获取装置及方法 |
CN109634796A (zh) * | 2018-12-14 | 2019-04-16 | 郑州云海信息技术有限公司 | 一种计算机的故障诊断方法、装置及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030204790A1 (en) * | 2002-04-30 | 2003-10-30 | Via Technologies, Inc. | Computer main board on/off testing device, method and system |
CN1484147A (zh) * | 2002-09-20 | 2004-03-24 | 联想(北京)有限公司 | 实现自动开关机测试的系统及方法 |
US20080098263A1 (en) * | 2006-10-18 | 2008-04-24 | Asustek Computer Inc. | Test apparatus and method for testing booting and shutdown process of computer system |
CN101364197A (zh) * | 2008-10-17 | 2009-02-11 | 华硕电脑股份有限公司 | 应用于计算机系统的外接式开机自测装置与其计算机系统 |
CN102388371A (zh) * | 2011-09-21 | 2012-03-21 | 华为技术有限公司 | 一种主板设备检测方法、装置和系统 |
CN102521105A (zh) * | 2011-11-21 | 2012-06-27 | 华为技术有限公司 | 一种开机自检信息输出方法、虚拟机管理器和处理器 |
-
2014
- 2014-06-13 CN CN201410263517.XA patent/CN104050065A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030204790A1 (en) * | 2002-04-30 | 2003-10-30 | Via Technologies, Inc. | Computer main board on/off testing device, method and system |
CN1484147A (zh) * | 2002-09-20 | 2004-03-24 | 联想(北京)有限公司 | 实现自动开关机测试的系统及方法 |
US20080098263A1 (en) * | 2006-10-18 | 2008-04-24 | Asustek Computer Inc. | Test apparatus and method for testing booting and shutdown process of computer system |
CN101364197A (zh) * | 2008-10-17 | 2009-02-11 | 华硕电脑股份有限公司 | 应用于计算机系统的外接式开机自测装置与其计算机系统 |
CN102388371A (zh) * | 2011-09-21 | 2012-03-21 | 华为技术有限公司 | 一种主板设备检测方法、装置和系统 |
CN102521105A (zh) * | 2011-11-21 | 2012-06-27 | 华为技术有限公司 | 一种开机自检信息输出方法、虚拟机管理器和处理器 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776242A (zh) * | 2016-12-06 | 2017-05-31 | 郑州云海信息技术有限公司 | 一种用于存储系统的背板led控制系统 |
CN106909277A (zh) * | 2017-02-28 | 2017-06-30 | 郑州云海信息技术有限公司 | 一种基于linux平台控制服务器重启和实时显示串口输出信息的方法 |
CN107480052A (zh) * | 2017-07-21 | 2017-12-15 | 广东虹勤通讯技术有限公司 | 一种定位宕机时bios代码的方法及装置 |
CN107480052B (zh) * | 2017-07-21 | 2020-11-13 | 广东虹勤通讯技术有限公司 | 一种定位宕机时bios代码的方法及装置 |
CN109271287A (zh) * | 2018-10-08 | 2019-01-25 | 郑州云海信息技术有限公司 | 一种服务器串口信息的获取装置及方法 |
CN109634796A (zh) * | 2018-12-14 | 2019-04-16 | 郑州云海信息技术有限公司 | 一种计算机的故障诊断方法、装置及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104050065A (zh) | 一种针对服务器开关机测试中故障定位的方法 | |
EP3511831A1 (en) | System and method for remote system recovery | |
US8510587B2 (en) | Time synchronization system and server using a baseboard management controller acquiring time signals to record occurrence time of system logs before than host system | |
CN104850485A (zh) | 一种基于bmc远程诊断服务器开机故障的方法及系统 | |
CN102244591A (zh) | 客户端服务器及对其功能测试全程监测的方法 | |
CN107122321A (zh) | 硬件修复方法、硬件修复系统以及计算机可读取存储装置 | |
CN104375910A (zh) | 一种自动化开关机测试方法 | |
CN103729221A (zh) | 一种将bios调试信息放入到硬盘中的方法及装置 | |
CN103257922B (zh) | 一种快速测试bios与os接口代码可靠性的方法 | |
CN104391780A (zh) | 一种自动检验服务器电源冗余功能稳定性的方法 | |
US11403202B2 (en) | Power monitoring system for virtual platform simulation | |
US8495626B1 (en) | Automated operating system installation | |
CN104410554A (zh) | 一种测试服务器wol功能的测试方法 | |
CN103744769A (zh) | 一种基于逻辑芯片cpld的快速定位服务器电源故障的方法 | |
CN110377136A (zh) | 一种psu原始值日志记录方法及装置 | |
CN104750600B (zh) | 设备状态记录方法和系统 | |
CN104424086B (zh) | 电脑检错模块和方法 | |
CN110886716B (zh) | 一种监控服务器风扇运行状态的测试方法和系统 | |
CN105260280A (zh) | 一种检测服务器中传感器的方法及装置 | |
CN112579366B (zh) | 硬盘在位检测系统 | |
CN105975382B (zh) | 一种硬件配置变动的报警方法 | |
CN102081564A (zh) | 系统除错的方法及具有除错功能的系统 | |
CN113742166B (zh) | 一种服务器系统器件日志记录方法、装置及系统 | |
CN105204999A (zh) | 一种实现CPU VR Static LL测试自动化测试的方法 | |
CN105607977A (zh) | 电源状态测试系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140917 |