CN105893196A - 一种服务器调试辅助工具及系统 - Google Patents

一种服务器调试辅助工具及系统 Download PDF

Info

Publication number
CN105893196A
CN105893196A CN201610204351.3A CN201610204351A CN105893196A CN 105893196 A CN105893196 A CN 105893196A CN 201610204351 A CN201610204351 A CN 201610204351A CN 105893196 A CN105893196 A CN 105893196A
Authority
CN
China
Prior art keywords
information
test
server
test point
fpga
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610204351.3A
Other languages
English (en)
Inventor
李然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201610204351.3A priority Critical patent/CN105893196A/zh
Publication of CN105893196A publication Critical patent/CN105893196A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种服务器调试辅助工具及系统,该服务器辅助工具包括管理模块和信息提供装置,其中,管理模块和信息提供装置相连。管理模块通过线路与每一个FPGA相连,在接收到输入的控制指令时,将控制指令发送给与该控制指令相对应的FPGA;然后接收由该FPGA反馈的与该FPGA相对应的每一个测试点的测试信息,并将接收到的测试信息发送给信息提供装置。由于信息提供装置向外部提供的测试信息中可以包含任一测试点的相关记录信息,故通过查看该测试信息,可以判别任一测试点是否存在异常。因此,本方案能够对出现异常的位置进行准确定位。

Description

一种服务器调试辅助工具及系统
技术领域
本发明涉及计算机技术领域,特别涉及一种服务器调试辅助工具及系统。
背景技术
随着科学技术的飞速发展,各行业机构对服务器性能的需求日益提高,高性能服务器,如刀片服务器,其应用范围也越来越广泛。
目前,在对服务器进行调试的过程中,当出现异常情况时,需要工作人员根据经验去判断或猜测问题所在处,再针对该位置进行问题的排查。
由于需要人为的根据经验去判别异常情况,故现有的服务器调试方式不能对出现异常的位置进行准确定位。
发明内容
本发明提供了一种服务器调试辅助工具及系统,能够对出现异常的位置进行准确定位。
为了达到上述目的,本发明是通过如下技术方案实现的:
一方面,本发明提供了一种服务器调试辅助工具,包括:
管理模块和信息提供装置,其中,
所述管理模块和所述信息提供装置相连;
所述管理模块,通过第一线路与至少一个现场可编程门阵列FPGA相连;用于接收输入的控制指令,并将所述控制指令发送给与所述控制指令相对应的目标FPGA;以及接收由所述目标FPGA反馈的与所述目标FPGA相对应的每一个测试点的测试信息,将接收到的每一个测试点的测试信息发送给所述信息提供装置;
所述信息提供装置,用于向外部提供每一个测试点的测试信息。
进一步地,所述信息提供装置包括:可拆卸存储介质,其中,
所述可拆卸存储介质通过第二线路与所述管理模块相连;
所述可拆卸存储介质,用于存储每一个测试点的测试信息,向外部的读取设备提供每一个测试点的测试信息。
进一步地,所述可拆卸存储介质包括:msata固态硬盘,和/或,电可擦可编程只读存储器EEPROM。
进一步地,所述第二线路包括:I2C、串行外设接口SPI和串行连接SCSI接口SAS中的任意一种或多种。
进一步地,所述信息提供装置包括:
信息发送接口,用于向外部的输出设备发送每一个测试点的测试信息。
进一步地,所述信息发送接口包括:
串口,用于向外部的个人计算机PC发送每一个测试点的测试信息;和/或,
VGA接口,用于向外部的显示设备发送每一个测试点的测试信息。
进一步地,所述第一线路包括:I2C,和/或,通用输入/输出GPIO。
进一步地,所述测试点包括:CPU、集成南桥PCH、硬盘、PCIE卡中的任意一种或多种。
进一步地,所述控制指令包括:开机、关机、重启、信号切断中的任意一种或多种。
进一步地,所述测试信息包括:测试点的开机时序、测试点的在位信号、测试点的工作状态、硬盘温度、CPU温度、CPU风扇转速、CPU的error信号、CPU的thermtrip信号中的任意一种或多种。
另一方面,本发明提供了一种服务器调试系统,包括:
上述任一服务器调试辅助工具、至少一个FPGA以及至少一个测试点,其中,
所述服务器调试辅助工具与每一个所述FPGA相连;
所述FPGA和与自身对应的每一个测试点相连;
所述FPGA,用于接收所述服务器调试辅助工具中的管理模块发来的控制指令,将所述控制指令发送给与自身对应的每一个测试点;获取对应的每一个测试点的测试信息,将每一个测试点的测试信息发送给所述服务器调试辅助工具中的管理模块;
所述测试点,用于在接收到所述FPGA发来的所述控制指令时,执行所述控制指令,得到所述测试信息,将所述测试信息发送给所述FPGA。
进一步地,所述FPGA和与自身对应的每一个测试点集成在一个计算节点中。
进一步地,所述计算节点包括刀片服务器。
本发明提供了一种服务器调试辅助工具及系统,该服务器辅助工具包括管理模块和信息提供装置,其中,管理模块和信息提供装置相连。管理模块通过线路与每一个FPGA相连,在接收到输入的控制指令时,将控制指令发送给与该控制指令相对应的FPGA;然后接收由该FPGA反馈的与该FPGA相对应的每一个测试点的测试信息,并将接收到的测试信息发送给信息提供装置。由于信息提供装置向外部提供的测试信息中可以包含任一测试点的相关记录信息,故通过查看该测试信息,可以判别任一测试点是否存在异常。因此,本发明能够对出现异常的位置进行准确定位。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种服务器调试辅助工具的示意图;
图2是本发明一实施例提供的另一种服务器调试辅助工具的示意图;
图3是本发明一实施例提供的又一种服务器调试辅助工具的示意图;
图4是本发明一实施例提供的再一种服务器调试辅助工具的示意图;
图5是本发明一实施例提供的一种服务器调试系统的示意图;
图6是本发明一实施例提供的一种服务器调试方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种服务器调试辅助工具,可以包括:
管理模块101和信息提供装置102,其中,
所述管理模块101和所述信息提供装置102相连;
所述管理模块101,通过第一线路与至少一个FPGA(Field-ProgrammableGate Array,现场可编程门阵列)相连;用于接收输入的控制指令,并将所述控制指令发送给与所述控制指令相对应的目标FPGA;以及接收由所述目标FPGA反馈的与所述目标FPGA相对应的每一个测试点的测试信息,将接收到的每一个测试点的测试信息发送给所述信息提供装置102;
所述信息提供装置102,用于向外部提供每一个测试点的测试信息。
本发明实施例提供了一种服务器调试辅助工具,可以包括管理模块和信息提供装置,其中,管理模块和信息提供装置相连。管理模块通过线路与每一个FPGA相连,在接收到输入的控制指令时,将控制指令发送给与该控制指令相对应的FPGA;然后接收由该FPGA反馈的与该FPGA相对应的每一个测试点的测试信息,并将接收到的测试信息发送给信息提供装置。由于信息提供装置向外部提供的测试信息中可以包含任一测试点的相关记录信息,故通过查看该测试信息,可以判别任一测试点是否存在异常。因此,本发明实施例能够对出现异常的位置进行准确定位。
在本发明一个实施例中,所述管理模块101和所述信息提供装置102相连,且均安装在服务器调试辅助工具上。例如,服务器调试辅助工具可以为安装有所述管理模块101和所述信息提供装置102的一块板卡。
在本发明一个实施例中,所述第一线路可以包括I2C(Inter-IntegratedCircuit),和/或,GPIO(General Purpose Input Output,通用输入/输出)。例如,管理模块101可以通过GPIO与每一个FPGA相连。
在本发明一个实施例中,所述测试点可以包括CPU、PCH(PlatformController Hub,集成南桥)、硬盘、PCIE卡中的任意一种或多种。例如,可以将服务器中的CPU、PCH、硬盘和PCIE卡均设定为测试点,那么,在该服务器的调试过程中,可以通过服务器调试辅助工具来获取每一个测试点的测试信息。工作人员根据服务器调试辅助工具提供的测试信息,可以判断每一个测试点是否存在异常情况,以及了解每一个测试点的运行状况。
在本发明一个实施例中,所述测试信息可以包括测试点的开机时序、测试点的在位信号、测试点的工作状态、硬盘温度、CPU温度、CPU风扇转速、CPU的error信号、CPU的thermtrip信号中的任意一种或多种。
由于服务器在开机过程中易表现出异常问题,故可以对服务器中的各测试点的开机时序、在位信号及工作状态进行记录,并将记录信息发送给服务器调试辅助工具。通过记录信息的查看,可以确定各测试点是否正常、是否处于正常工作状态,以及各测试点甚至各服务器的在位情况。例如,当服务器调试辅助工具没有接收到某一FPGA的记录信息时,说明该FPGA对应的服务器可能处于移除状态。
在服务器正常运行过程中,同样可以将测试点的主要表征信息,如CPU温度、CPU风扇转速、硬盘温度等,发送给服务器调试辅助工具。此外,服务器调试辅助工具还可以接收到CPU温度过高时用于报警提示的thermtrip信号,以及CPU自身异常时的error信号。
在本发明一个实施例中,所述控制指令可以包括开机、关机、重启、信号切断中的任意一种或多种。
一个服务器中通常包含一个BMC(Baseboard Management Controller,基板管理控制器),其中,BMC对服务器起管理功能。例如,BMC可以进行本地和远程诊断、控制台支持、配置管理、硬件管理和故障排除等。此外,一个外部BMC也可以同时管理多个服务器。
本实施例中的管理模块,可以接收由每一个FPGA发送的相应测试点的测试信息,并将测试信息进行输出,以便于工作人员通过查看测试信息来调试服务器。此外,在能够输出测试信息的同时,管理模块还可以获取输入的控制指令,并将控制指令发送给相应的FPGA,以使与FPGA对应的服务器执行该控制指令,从而起到类似于BMC管理服务器的管理功能。由于可以对多个服务器进行统一管理,故可以无需在服务器中安装BMC,同样可以达到相应的服务器管理控制功能。
详细地,管理模块对服务器的管理功能可以通过如下方式得以实现。例如,服务器调试辅助工具的管理模块中可以包含一颗可编程芯片。通过对芯片编程以及利用软件系统,可以将预先设定好的控制指令通过GPIO发送给与管理模块相连的每一个FPGA,以使与FPGA对应的服务器执行该控制指令,从而对服务器进行管理控制。例如,可以自动控制与管理模块相对应的每一个服务器的开关机操作,无需人为机械式的按开机键。
此外,针对一些常见问题,可以预先设置相应的解决方式,如针对CPU温度过高以对相应的服务器进行强制关机重启操作。故在获取到CPU温度超过设定阈值的测试信息时,可以自动将相应的控制指令发送给相应的FPGA,以重启相应的服务器。
通过这一实现方式,服务器调试辅助工具不仅可以获取与之相连的各服务器的测试信息,还可以对各服务器进行管理和控制。由于通过服务器调试辅助工具,可以对各服务器进行监控、管理和控制,故可以无需额外配置用于管理服务器的BMC这一功能模块,从而减少了BMC的使用,节省了服务器调试的成本投入。
此外,在本发明实施例中,工作人员可以根据服务器调试辅助工具,查看任一测试点的测试信息,以及对出现异常的测试点进行快速、准确定位。由于刀片服务器的体积小且结构紧凑,故本发明实施例所提供的服务器调试辅助工具尤其适用于对多个刀片服务器进行集中调试的应用场景。
在本发明的实施例中,信息提供装置102可以有多种实现方式,也就是说,可以使用多种方式来将测试点的测试信息提供给外部,比如可以包括如下两种方式:
方式A:信息提供装置包括可拆卸存储介质。
在该方式A下,利用可拆卸存储介质来存储测试信息,在后续过程中,利用外部的可读取设备非实时地读出测试信息。
方式B:信息提供装置包括信息发送接口。
在该方式B下,利用信息发送接口实时地将测试信息传输给外部,比如,传输给外部的显示设备等。
下面则通过不同的实施例来说明上述两种方式下服务器调试辅助工具的具体实现。
如图2所示,对应于上述方式A,本发明实施例提供了另一种服务器调试辅助工具,可以包括:
管理模块201和可拆卸存储介质202,其中,
所述管理模块201和所述可拆卸存储介质202通过第二线路相连;
所述管理模块201,通过第一线路与至少一个FPGA相连;用于接收输入的控制指令,并将所述控制指令发送给与所述控制指令相对应的目标FPGA;以及接收由所述目标FPGA反馈的与所述目标FPGA相对应的每一个测试点的测试信息,将接收到的每一个测试点的测试信息发送给所述可拆卸存储介质202;
所述可拆卸存储介质202,用于存储每一个测试点的测试信息,向外部的读取设备提供每一个测试点的测试信息。
在本发明一个实施例中,所述第二线路包括:I2C、SPI(Serial PeripheralInterface,串行外设接口)和SAS(Serial Attached SCSI,串行连接SCSI接口)中的任意一种或多种。
在本发明一个实施例中,可拆卸存储介质202可以包括msata固态硬盘,和/或,EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)。
可拆卸存储介质202可以作为一种信息提供装置,以向外部提供每一个测试点的测试信息。详细地,可拆卸存储介质202可以存储每一个测试点的测试信息,由于可拆卸,故可以将其放到相应的任一读取设备中,故工作人员可以通过读取设备以查看其中所存储的测试信息。
例如,对于已卖给客户的服务器,可以仅将保存有服务器测试信息的存储介质送回本部分析即可。此外,工作人员可以查看测试信息,并将提出的解决方案写入该存储介质中,故管理模块在读取到该存储介质中的解决方案后,可以对服务器进行异常情况的解除。
通过这一实现方式,可以将服务器调试信息进行存储,并将保存有测试信息的可拆卸存储介质拆卸后,放置于任何地理位置处的读取设备进行读取。这一实现方式解决了测试环境无法带走,需要测试人员现场分析调试服务器的弊端,故可以为测试人员的工作提供便利。
如图3所示,对应于上述方式B,本发明实施例提供了又一种服务器调试辅助工具,可以包括:
管理模块301和信息发送接口302,其中,
所述管理模块301和所述信息发送接口302相连;
所述管理模块301,通过第一线路与至少一个FPGA相连;用于接收输入的控制指令,并将所述控制指令发送给与所述控制指令相对应的目标FPGA;以及接收由所述目标FPGA反馈的与所述目标FPGA相对应的每一个测试点的测试信息,将接收到的每一个测试点的测试信息发送给所述信息发送接口302;
所述信息发送接口302,用于向外部的输出设备发送每一个测试点的测试信息。
在本发明一个实施例中,所述信息发送接口302可以包括串口,和/或,VGA接口。所述输出设备可以包括PC(personal computer,个人计算机),和/或,显示设备。
详细地,信息发送接口302可以通过串口与外部的PC相连,并向PC发送每一个测试点的测试信息;信息发送接口302还可以通过VGA接口与外部的显示设备,如显示器,发送每一个测试点的测试信息。
信息发送接口302可以作为一种信息提供装置,以向外部提供每一个测试点的测试信息。例如,当通过VGA接口向显示器发送测试信息时,显示器可以通过屏幕以显示该测试信息;当通过串口向PC发送测试信息时,PC在接收到该测试信息后,可以利用自身预先安装的相关软件对该测试信息进行转化,从而将转化后的益于工作人员查看和分析的版本进行显示。明显地,服务器调试辅助工具中的信息发送接口同样可以包含串口和VGA接口两种接口,从而可以通过显示器和PC同时显示测试信息。
通过这一实现方式,可以实时输出并显示服务器调试的相关测试信息。由于该测试信息中包含每一个测试点的测试信息,故工作人员根据查看到的测试信息,可以及时、准确的判断出异常测试点,并进行异常测试点的准确定位,从而进行有针对性的处理操作。
当然,上述方式A和方式B只是信息提供装置的两个实现方式,在实际的业务实现中,信息提供装置也可以由其他的实现方式,比如同时包括可拆卸存储介质和信息发送接口。此种情况下,如图4所示,本发明实施例提供了再一种服务器调试辅助工具,可以包括:
管理模块401、可拆卸存储介质402和信息发送接口403,其中,
所述管理模块401分别与所述可拆卸存储介质402和所述信息发送接口403相连;
所述管理模块401,通过第一线路与至少一个FPGA相连;用于接收输入的控制指令,并将所述控制指令发送给与所述控制指令相对应的目标FPGA;以及接收由所述目标FPGA反馈的与所述目标FPGA相对应的每一个测试点的测试信息,将接收到的每一个测试点的测试信息分别发送给所述可拆卸存储介质402和所述信息发送接口403;
所述可拆卸存储介质402,用于存储每一个测试点的测试信息,向外部的读取设备提供每一个测试点的测试信息;
所述信息发送接口403,用于向外部的输出设备发送每一个测试点的测试信息。
在本发明的一个实施例中,所述可拆卸存储介质402可以通过I2C、SPI和SAS中的任意一种或多种线路,与所述管理模块401相连,且所述可拆卸存储介质402可以包括msata固态硬盘,和/或,EEPROM。
在本发明的一个实施例中,所述信息发送接口403可以包括串口,和/或,VGA接口。详细地,服务器调试辅助工具可以通过串口向外部的PC发送每一个测试点的测试信息,以及可以通过VGA接口向外部的显示设备发送每一个测试点的测试信息。PC和显示设备在接收到每一个测试点的测试信息时,可以对测试信息进行显示,以便于工作人员进行查看。
由于信息发送接口仅将测试信息输出给外部设备,以便于外部设备实时准确的显示测试信息,但并没有对测试信息进行保存。而可拆卸存储介质是将测试信息进行存储,以便于工作人员不在测试现场时,仍可在他处查看测试信息,但当工作人员当场调试服务器时,不能实时获取测试信息。因此,在本实施例中,服务器调试辅助工具可以既包含信息发送接口,以便于测试信息的实时准确显示,还包含可拆卸存储介质,以便于带走测试环境,以及保存测试信息。这一方式可以使工作人员在不同情况下,均能对服务器进行调试处理。
如图5所示,本发明实施例提供了一种服务器调试系统,可以包括:
上述任一服务器调试辅助工具50、至少一个FPGA60以及至少一个测试点70,其中,
所述服务器调试辅助工具50与每一个所述FPGA60相连;
所述FPGA60和与自身对应的每一个测试点70相连;
所述FPGA60,用于接收所述服务器调试辅助工具50中的管理模块发来的控制指令,将所述控制指令发送给与自身对应的每一个测试点70;获取对应的每一个测试点70的测试信息,将每一个测试点70的测试信息发送给所述服务器调试辅助工具50中的管理模块;
所述测试点70,用于在接收到所述FPGA60发来的所述控制指令时,执行所述控制指令,得到所述测试信息,将所述测试信息发送给所述FPGA60。
在本发明的一个实施例中,所述FPGA60和与自身对应的每一个测试点70集成在一个计算节点中,且该计算节点可以为刀片服务器。
在本发明的一个实施例中,FPGA和相应的多个测试点集成在同一个刀片服务器中。针对该刀片服务器,可以将多个该刀片服务器安装在背板的一侧,同时将服务器调试辅助工具安装在背板的另一侧,从而可以通过背板以建立服务器调试辅助工具中的管理模块和每一个刀片服务器中的FPGA的连接关系,从而实现服务器调试辅助工具对多个刀片服务器的调试操作。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图及具体实施例对本发明作进一步地详细描述。
如图6所示,本发明一个实施例提供了服务器调试方法,该方法可以包括以下步骤:
步骤801:服务器调试辅助工具中的管理模块接收工作人员输入的开机控制指令。
举例来说,现有1个服务器调试辅助工具和4个刀片服务器,且该服务器调试服务工具中包含管理模块、可拆卸存储介质和VGA接口,每一个刀片服务器中均包含两个CPU、PCH和FPGA。
详细地,在服务器调试辅助工具中,可以将管理模块和VGA接口相连,同时通过I2C线路将管理模块与可拆卸存储介质相连。在刀片服务器中,可以将两个CPU通过QPI(Quick Path Interconnect,快速通道互联)总线接口相连,FPGA通过pin分别与两个CPU和PCH相连,PCH通过pin与这两个CPU中的主要CPU相连。此外,将每一个FPGA通过GPIO线路与管理模块进行连接。在这一连接基础之上,可以实现服务器调试辅助工具对每一个刀片服务器的调试操作。此外,可以预先设定每一个刀片服务器中的两个CPU和PCH均为测试点。
在一种可能的实现方式中,所述开机控制指令同样可以为关机控制指令、重启控制指令或信号切断控制指令。
在本实施例中,所述开机控制指令的输入可以是人为输入的,也可以是系统软件根据实际测试需求所自动输入的。
步骤802:管理模块将开机控制指令发送给每一个刀片服务器中的FPGA。
详细地,管理模块和FPGA之间的连接通信,除了通过GPIO线路外,还可以通过I2C线路。
步骤803:针对每一个刀片服务器中的FPGA,均执行:将开机控制指令分别发送给与自身相连的两个CPU和PCH。
步骤804:两个CPU和PCH分别接收并执行开机控制指令,生成相应的开机测试信息。
步骤805:两个CPU和PCH分别将相应的开机测试信息发送给FPGA。
在一种可能的实现方式中,除了测试点将执行控制指令后生成的相应测试信息反馈给FPGA之外,也可以设定每一个测试点定期将自身的基本测试信息主动发送给相应的FPGA,以使工作人员对该基本测试信息进行查看。例如,CPU的基本测试信息可以为CPU温度、CPU的工作状态、CPU的在位信息等。
相应的,若在刀片服务器调试过程中,检测到刀片服务器1的主要CPU温度超过设定阈值时,系统软件可以将针对刀片服务器1的重启控制指令发送给管理模块,管理模块接收该重启控制指令,并将其发送给与刀片服务器1相对应的FPGA1,以及继续执行后续操作,以对刀片服务器1执行重启操作。当然,FPGA1在获取到各测试点生成相应的重启测试信息时,可以将重启测试信息发送给管理模块,如此循环,以对4个刀片服务器进行实时调试。
步骤806:FPGA将接收到的开机测试信息发送给管理模块。
步骤807:管理模块将开机测试信息分别发送给服务器调试辅助工具中的可拆卸存储模块和VGA接口。
在本实施例中,可拆卸存储模块可以用于存储测试信息,VGA接口用于通过外接显示器实时准确地显示测试信息。前者由于可拆卸,故可以应用于工作人员不在服务器调试现场的应用场景,后者可以应用于工作人员在测试现场进行实时调试。
步骤808:VGA接口接收由FPGA发送的开机测试信息,并向预先连接好的显示器输出开机测试信息。
由于外接显示器是直接显示测试信息,故若服务器调试辅助工具存在串口,还可以通过串口连接外部PC。通过这一方式,可以在PC中预置转换软件,从而可以将获取到的测试信息进行转换后进行显示。通过转换后的测试信息,工作人员可以更清晰的对测试信息进行查看、对比、处理等。
根据显示器的显示内容,工作人员可以查看任一测试点的测试信息。当工作人员发现错误信息时,可以对错误信息的类型进行判断,如错误类型可以包括软件编程问题、FPGA编程问题、器件问题或损坏问题等。相应的,对应软件或FPGA编程问题,可以通过控制服务器调试辅助工具中的管理模块,以对软件或FPGA代码进行更新处理。详细地,对于FPGA芯片编程问题,可以通过I2C线路或JTAG(Joint Test Action Group;联合测试工作组)线路对相应代码进行更新。对于器件问题或人为损坏问题,可以通过更换相应芯片或板卡等方式来使服务器恢复正常工作。
步骤809:可拆卸存储模块接收并存储由管理模块发送的开机测试信息。
在本实施例中,可拆卸存储模块可以存储与服务器调试相关的全部测试信息,以便于工作人员根据实际需求在调试之后进行查看。此外,由于其可拆卸,故可以将其与任何读取设备相连,这一方式可用于工作人员不在服务器调试现场的应用场景,为工作人员提供便利。
步骤810:当外部的读取设备需要读取测试信息时,从可拆卸存储模块中读取开机测试信息。
综上所述,本发明的各个实施例至少具有如下有益效果:
1、本发明实施例中,服务器调试辅助工具可以包括管理模块和信息提供装置,其中,管理模块和信息提供装置相连。管理模块通过线路与每一个FPGA相连,在接收到输入的控制指令时,将控制指令发送给与该控制指令相对应的FPGA;然后接收由该FPGA反馈的与该FPGA相对应的每一个测试点的测试信息,并将接收到的测试信息发送给信息提供装置。由于信息提供装置向外部提供的测试信息中可以包含任一测试点的相关记录信息,故通过查看该测试信息,可以判别任一测试点是否存在异常。因此,本发明实施例能够对出现异常的位置进行准确定位。
2、本发明实施例中,服务器调试辅助工具不仅可以获取与之相连的各服务器的测试信息,还可以对各服务器进行管理和控制。由于通过服务器调试辅助工具,可以对各服务器进行监控、管理和控制,故可以无需额外配置用于管理服务器的BMC这一功能模块,从而减少了BMC的使用,节省了服务器调试的成本投入。
3、本发明实施例中,工作人员可以根据服务器调试辅助工具,查看任一测试点的测试信息,以及对出现异常的测试点进行快速、准确定位。由于刀片服务器的体积小且结构紧凑,故本发明实施例所提供的服务器调试辅助工具尤其适用于对多个刀片服务器进行集中调试的应用场景。
4、本发明实施例中,可以将服务器调试信息进行存储,并将保存有测试信息的可拆卸存储介质拆卸后,放置于任何地理位置处的读取设备进行读取。这一实现方式解决了测试环境无法带走,需要测试人员现场分析调试服务器的弊端,故可以为测试人员的工作提供便利。
5、本发明实施例中,可以实时输出并显示服务器调试的相关测试信息。由于该测试信息中包含每一个测试点的测试信息,故工作人员根据查看到的测试信息,可以及时、准确的判断出异常测试点,并进行异常测试点的准确定位,从而进行有针对性的处理操作。
6、本发明实施例中,服务器调试辅助工具可以既包含信息发送接口,以便于测试信息的实时准确显示,还包含可拆卸存储介质,以便于带走测试环境,以及保存测试信息。这一方式可以使工作人员在不同情况下,均能对服务器进行调试处理。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个〃·····”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种服务器调试辅助工具,其特征在于,包括:
管理模块和信息提供装置,其中,
所述管理模块和所述信息提供装置相连;
所述管理模块,通过第一线路与至少一个现场可编程门阵列FPGA相连;用于接收输入的控制指令,并将所述控制指令发送给与所述控制指令相对应的目标FPGA;以及接收由所述目标FPGA反馈的与所述目标FPGA相对应的每一个测试点的测试信息,将接收到的每一个测试点的测试信息发送给所述信息提供装置;
所述信息提供装置,用于向外部提供每一个测试点的测试信息。
2.根据权利要求1所述的服务器调试辅助工具,其特征在于,所述信息提供装置包括:可拆卸存储介质,其中,
所述可拆卸存储介质通过第二线路与所述管理模块相连;
所述可拆卸存储介质,用于存储每一个测试点的测试信息,向外部的读取设备提供每一个测试点的测试信息。
3.根据权利要求2所述的服务器调试辅助工具,其特征在于,
所述可拆卸存储介质包括:msata固态硬盘,和/或,电可擦可编程只读存储器EEPROM;
和/或,
所述第二线路包括:I2C、串行外设接口SPI和串行连接SCSI接口SAS中的任意一种或多种。
4.根据权利要求1至3中任一所述的服务器调试辅助工具,其特征在于,所述信息提供装置包括:
信息发送接口,用于向外部的输出设备发送每一个测试点的测试信息。
5.根据权利要求4所述的服务器调试辅助工具,其特征在于,所述信息发送接口包括:
串口,用于向外部的个人计算机PC发送每一个测试点的测试信息;和/或,
VGA接口,用于向外部的显示设备发送每一个测试点的测试信息。
6.根据权利要求1所述的服务器调试辅助工具,其特征在于,
所述第一线路包括:I2C,和/或,通用输入/输出GPIO。
7.根据权利要求1所述的服务器调试辅助工具,其特征在于,
所述测试点包括:CPU、集成南桥PCH、硬盘、PCIE卡中的任意一种或多种;
和/或,
所述控制指令包括:开机、关机、重启、信号切断中的任意一种或多种;
和/或,
所述测试信息包括:测试点的开机时序、测试点的在位信号、测试点的工作状态、硬盘温度、CPU温度、CPU风扇转速、CPU的error信号、CPU的thermtrip信号中的任意一种或多种。
8.一种服务器调试系统,其特征在于,包括:
如权利要求1至7中任一所述服务器调试辅助工具、至少一个FPGA以及至少一个测试点,其中,
所述服务器调试辅助工具与每一个所述FPGA相连;
所述FPGA和与自身对应的每一个测试点相连;
所述FPGA,用于接收所述服务器调试辅助工具中的管理模块发来的控制指令,将所述控制指令发送给与自身对应的每一个测试点;获取对应的每一个测试点的测试信息,将每一个测试点的测试信息发送给所述服务器调试辅助工具中的管理模块;
所述测试点,用于在接收到所述FPGA发来的所述控制指令时,执行所述控制指令,得到所述测试信息,将所述测试信息发送给所述FPGA。
9.根据权利要求8所述的服务器调试系统,其特征在于,所述FPGA和与自身对应的每一个测试点集成在一个计算节点中。
10.根据权利要求8和9中任一所述的服务器调试系统,其特征在于,所述计算节点包括刀片服务器。
CN201610204351.3A 2016-04-05 2016-04-05 一种服务器调试辅助工具及系统 Pending CN105893196A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610204351.3A CN105893196A (zh) 2016-04-05 2016-04-05 一种服务器调试辅助工具及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610204351.3A CN105893196A (zh) 2016-04-05 2016-04-05 一种服务器调试辅助工具及系统

Publications (1)

Publication Number Publication Date
CN105893196A true CN105893196A (zh) 2016-08-24

Family

ID=57013314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610204351.3A Pending CN105893196A (zh) 2016-04-05 2016-04-05 一种服务器调试辅助工具及系统

Country Status (1)

Country Link
CN (1) CN105893196A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096125A (zh) * 2018-01-30 2019-08-06 广达电脑股份有限公司 用于保存存储器数据的计算机实施方法及计算机系统
CN112015607A (zh) * 2020-08-06 2020-12-01 百富计算机技术(深圳)有限公司 一种开关机测试方法、被测试设备及工具设备
CN114637549A (zh) * 2022-02-22 2022-06-17 阿里巴巴(中国)有限公司 基于服务网格的应用的数据处理方法、系统和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1592238A (zh) * 2004-04-16 2005-03-09 港湾网络有限公司 宽带设备故障定位请求的处理方法与装置
US20100017629A1 (en) * 2008-07-17 2010-01-21 Hitachi, Ltd. File sharing apparatus and file sharing system
CN104021054A (zh) * 2014-06-11 2014-09-03 浪潮(北京)电子信息产业有限公司 服务器故障可视化侦测及处理方法、系统及可编程芯片
CN104320308A (zh) * 2014-11-12 2015-01-28 浪潮(北京)电子信息产业有限公司 一种服务器异常检测的方法及装置
CN104461809A (zh) * 2014-11-13 2015-03-25 浪潮(北京)电子信息产业有限公司 一种故障信息管理方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1592238A (zh) * 2004-04-16 2005-03-09 港湾网络有限公司 宽带设备故障定位请求的处理方法与装置
US20100017629A1 (en) * 2008-07-17 2010-01-21 Hitachi, Ltd. File sharing apparatus and file sharing system
CN104021054A (zh) * 2014-06-11 2014-09-03 浪潮(北京)电子信息产业有限公司 服务器故障可视化侦测及处理方法、系统及可编程芯片
CN104320308A (zh) * 2014-11-12 2015-01-28 浪潮(北京)电子信息产业有限公司 一种服务器异常检测的方法及装置
CN104461809A (zh) * 2014-11-13 2015-03-25 浪潮(北京)电子信息产业有限公司 一种故障信息管理方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096125A (zh) * 2018-01-30 2019-08-06 广达电脑股份有限公司 用于保存存储器数据的计算机实施方法及计算机系统
US10872018B2 (en) 2018-01-30 2020-12-22 Quanta Computer Inc. Memory data preservation solution
CN110096125B (zh) * 2018-01-30 2021-02-26 广达电脑股份有限公司 用于保存存储器数据的计算机实施方法及计算机系统
CN112015607A (zh) * 2020-08-06 2020-12-01 百富计算机技术(深圳)有限公司 一种开关机测试方法、被测试设备及工具设备
CN112015607B (zh) * 2020-08-06 2024-03-19 百富计算机技术(深圳)有限公司 一种开关机测试方法、被测试设备及工具设备
CN114637549A (zh) * 2022-02-22 2022-06-17 阿里巴巴(中国)有限公司 基于服务网格的应用的数据处理方法、系统和存储介质

Similar Documents

Publication Publication Date Title
US10055296B2 (en) System and method for selective BIOS restoration
US10127032B2 (en) System and method for unified firmware management
US9645815B2 (en) Dynamically recommending changes to an association between an operating system image and an update group
US7386761B2 (en) Diagnostic repair system and method for computing systems
TWI595364B (zh) 自動修復映像檔的方法及伺服器系統
US20070055793A1 (en) System of managing peripheral interfaces in IPMI architecture and method thereof
EP3349118B1 (en) Bus hang detection and find out
EP3690653A1 (en) Bios recovery and update
US10922071B2 (en) Centralized off-board flash memory for server devices
TW201417536A (zh) 伺服器自動管理方法及系統
US20190042520A1 (en) Out-of-band management of data drives
CN105893196A (zh) 一种服务器调试辅助工具及系统
CN101471820B (zh) 基板管理控制器的测试方法
CN117251333A (zh) 一种硬盘信息获取方法、装置、设备及存储介质
CN110704228A (zh) 一种固态硬盘异常处理方法及系统
EP2909726B1 (en) System and method for remotely diagnosing and repairing a computing device
US7805734B2 (en) Platform management of high-availability computer systems
US20080201609A1 (en) Method and system for automatically diagnosing disability of computer peripheral devices
CN111176958B (zh) 信息监测方法、系统和存储介质
US20140019646A1 (en) Service Channel For Connecting A Host Computer To Peripheral Devices
WO2017072904A1 (ja) 計算機システム、及び、障害検知方法
US20200110678A1 (en) Monitoring system and method
TWI615718B (zh) 電腦系統
TW202242655A (zh) 儲存有限狀態機之狀態資料的方法、電腦系統、及電腦程式產品
CN110909378A (zh) 自动化检测方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160824

RJ01 Rejection of invention patent application after publication