发明内容
因此,本发明的目的在于提供一种服务器监控方法,能够实时的对服务器的测试流程进行控管。
本发明的一实施方式是在提供一种服务器监控方法,用于服务器监控系统,用以监控服务器,包含下列步骤:由监控主机传送测试信号至服务器;根据服务器的响应判断服务器的平台事件过滤器功能是否正常;当平台事件过滤器功能不正常,起始服务器的测试流程;根据服务器的状况,更新各服务器的基板管理控制器的系统事件记录;通过监控主机撷取各基板管理控制器的系统事件记录;判断系统事件记录是否出现异常记录,当系统事件记录出现异常记录,以产生错误通知信息至远程主机;以及根据错误通知信息进一步藉由远程主机进行错误分析。
根据本发明的一实施例,服务器监控方法还包含:根据系统事件记录判断测试流程是否结束,当测试流程结束,产生测试结束通知信息至该远程主机。
根据本发明的另一实施例,还包含根据错误通知信息终止测试流程的步骤。
根据本发明的又一实施例,测试流程为压力测试。
根据本发明的再一实施例,还包含:判断服务器的网络功能是否正常;当网络功能正常,监控主机通过网络功能撷取各基板管理控制器的之系统事件记录;当网络功能不正常,监控主机通过直接联机路径撷取各基板管理控制器的系统事件记录。
本发明的另一实施方式是在提供一种服务器监控方法,用以监控服务器,包含下列步骤:由监控主机传送测试信号至服务器;根据服务器的响应判断服务器的平台事件过滤器功能是否正常;当平台事件过滤器功能正常,判断服务器的网络功能是否正常;当网络功能不正常,将平台事件过滤器功能的目标设定为监控主机,及将平台事件过滤器功能的传输路径设定为服务器及监控主机间的直接联机路径;起始服务器的测试流程;当服务器的基板管理控制器侦测到系统异常,通过平台事件过滤器功能产生错误通知信息,并通过直接联机路径传送至监控主机,再通过监控主机传送错误通知信息至远程主机;以及根据错误通知信息进一步通过远程主机进行错误分析。
根据本发明的一实施例,当网络功能正常,服务器监控方法还包含:起始服务器的测试流程;当服务器的基板管理控制器侦测到系统异常,通过平台事件过滤器功能产生错误通知信息,以透过网络功能传送错误通知信息至远程主机;以及根据错误通知信息进一步通过远程主机进行错误分析。
根据本发明的另一实施例,平台事件过滤器功能产生的错误通知信息包含警示方式字段、通知地址字段以及传输路径字段。
根据本发明的又一实施例,其中网络功能为局域网络(Local AreaNetwork;LAN)功能。
根据本发明的再一实施例,其中直接联机路径为串行端口(Serial Port)或I2C接口。
应用本发明的优点在于通过判断服务器的平台事件过滤器功能的网络功能是否运作正常,以因应各种服务器的情况,决定产生错误通知信息的方式,并且实时地通知远程主机以进行分析与除错,而轻易地达到上述的目的。
具体实施方式
请参照图1,为本发明的一实施例的服务器监控系统1的一方块图。服务器监控系统1包含:服务器10、监控主机12以及远程主机14。须注意的是,图1中绘示三个服务器10,然而在其它实施例中,可因应不同的情况设置不同数目的服务器10。
本实施例的服务器监控系统1,可在服务器10有异常的事件发生时,在不同的情形下经由不同的方式产生错误通知信息13、17或19实时地使远程主机14可以进行错误分析,甚或终止测试流程的进行,以针对测试流程中,发生错误的关键点进行除错。
服务器10包含:基板管理控制器100以及通讯接口(未绘示)。在开发服务器10的阶段中,必需对服务器10及其上的基板管理控制器100进行测试流程。在一实施例中,测试流程为压力测试,用以测试装置在长时间运作的情形下,是否能正常地工作。
基板管理控制器100是一种设置于服务器10内的主机板(未绘示)上,以对服务器10的系统进行控管的装置,具有使系统管理软件与装置硬件相沟通的作用。基板管理控制器100可以根据服务器10内的各种侦测器(未绘示),掌握服务器10内的各种情况,如温度、风扇转速、电源模式、操作系统状态等等。
一般正常运作的基板管理控制器100提供了平台事件过滤器的功能。平台事件过滤器功能是一项事件处理的功能,能在系统产生事件时经由网络发出警示通知。然而如果在进行测试的服务器10中,基板管理控制器100并未提供这项功能,或是这项功能已经损坏,亦或网络的功能失效,则无法通过基板管理控制器100直接于服务器10发生事件时产生警示通知。
请同时参照图2,为本发明的一实施例的服务器监控方法的流程图。服务器监控方法可应用于如图1绘示的服务器监控系统1。服务器监控方法包含下列步骤:在步骤201,由监控主机12传送测试信号121至服务器10。接着在步骤202,根据服务器10的响应(未绘示)判断服务器的平台事件过滤器功能是否正常。
当平台事件过滤器功能不正常时,在图1中,以最左侧的服务器10为例,执行步骤203,起始服务器的测试流程。继续执行步骤204,根据服务器10的状况,更新服务器10的基板管理控制器100的系统事件记录11。基板管理控制器100在测试流程中,根据服务器10在的状况,包含上述如温度、风扇转速、电源模式、操作系统状态等等的状况,来持续更新系统事件记录11。系统事件记录11则以数据来对上述的状况进行记录。
接着在步骤205,判断服务器10的网络功能是否正常。当网络功能正常,执行步骤206,通过监控主机12经由网络功能撷取基板管理控制器100的系统事件记录11。其中网络功能在一实施例中,为局域网络接口。而当网络功能不正常,执行步骤207,通过监控主机12经由服务器10与监控主机12间的直接联机路径撷取基板管理控制器100的系统事件记录11。直接联机路径在一实施例中,为I2C或串行端口的通讯接口。
步骤206或207结束后,执行步骤208,根据系统事件记录11判断测试流程是否结束。当测试流程已经结束,即进行步骤209,产生测试结束通知信息13至远程主机14。而当测试流程依然在进行,则执行步骤210,判断系统事件记录11是否出现异常的记录。所谓的异常,举例来说,可为服务器10的温度过高、风扇转速未达到所设定的标准、电源供应不足或是操作系统产生错误等等。当系统事件记录11未出现异常的记录,则将回到步骤204,以随着测试流程继续更新系统事件记录11。
当系统事件记录11出现异常的记录时,则将执行步骤211,产生错误通知信息15至远程主机14,远程主机14将根据错误通知信息15进一步进行错误分析。因此,进行测试的人员不需要随时地在服务器10旁边观察,而可以在远程主机14远程地且实时地得知服务器10的状况。在一实施例中,远程主机14可在接收到错误通知信息13后,根据错误通知信息13,传递指令(未绘示)而终止测试流程,避免测试流程继续进行时,无法厘清错误状况发生的原因及时间点。
因此,上述实施例中的服务器监控方法,可以在平台事件过滤器功能不正常的情形下,由监控主机12侦测服务器10在测试过程中产生的错误,并通过错误通知信息13通知远程主机14,以进行错误分析。
在另一实施例中,当图2中的步骤202,根据服务器10的响应判断服务器的平台事件过滤器功能是否正常的判断结果,显示平台事件过滤器功能是正常的,则执行步骤A。步骤A详细绘示于图3中。
请参照图3,为本发明一实施例中,当平台事件过滤器功能正常时的服务器监控方法的流程图。在步骤202判断平台事件过滤器功能正常后,执行步骤301,判断服务器10的网络功能是否正常。当网络功能不正常,在图1中,是以中间的服务器10为例,执行步骤302,将平台事件过滤器功能的目标设定为监控主机12,及将平台事件过滤器功能的传输路径设定为服务器10及监控主机12间的直接联机路径。如上所述,直接联机路径在一实施例中,为I2C或串行端口的通讯接口。
接着在步骤303,起始服务器10的测试流程。接着在步骤304,判断基板管理控制器100是否侦测到系统异常。当基板管理控制器100未侦测到系统异常,重复执行步骤304,以侦测测试流程是否具有异常。而当基板管理控制器100侦测到系统异常,执行步骤305,通过平台事件过滤器功能产生错误通知信息17,并通过直接联机路径传送至监控主机12,再通过监控主机12传送错误通知信息17至远程主机14,以使远程主机14根据错误通知信息17进一步进行错误分析。
在一实施例中,平台事件过滤器功能产生的错误通知信息17包含警示方式字段、通知地址字段以及传输路径字段。其中警示方式字段表示以字符串或是其它形式来产生。通知地址字段在本实施例中则由于传输对象为监控主机12,而为监控主机12的地址。传输路径字段在本实施例中则为直接联机路径。
因此,上述实施例中的服务器监控方法,可以在平台事件过滤器功能正常,但网络功能不正常的情形下,由服务器10本身产生错误通知信息17,并通过监控主机12传送至远程主机14,以进行错误分析。
而当步骤301中,判断服务器10的网络功能是否正常的判断结果系显示网络功能正常,在图1中,是以最右侧的服务器10为例,执行步骤306,起始服务器的测试流程。
接着在步骤307,判断基板管理控制器100是否侦测到系统异常。当基板管理控制器100未侦测到系统异常,重复执行步骤307,以侦测测试流程是否具有异常。而当基板管理控制器100侦测到系统异常,执行步骤308,通过平台事件过滤器功能产生错误通知信息19,并通过网络传送至远程主机14,而不需再经由监控主机12,以使远程主机14根据错误通知信息17进一步进行错误分析。
在一实施例中,平台事件过滤器功能产生的错误通知信息19包含警示方式字段、通知地址字段以及传输路径字段。其中警示方式字段表示以字符串或是其它形式来产生。通知地址字段在本实施例中则由于传输对象为远程主机14,而为远程主机14的地址。传输路径字段在本实施例中则为网络。
因此,上述实施例中的服务器监控方法,可以在平台事件过滤器功能正常,并且网络功能亦正常的情形下,由服务器10本身产生错误通知信息19,并通过网络传送至远程主机14,以进行错误分析。(应了解到,在本实施方式中所提及的步骤,除特别叙明其顺序者外,均可依实际需要调整其前后顺序,甚至可同时或部分同时执行)。
由上述本发明实施方式可知,应用本发明的优点在于通过检测基板管理控制器的系统事件记录,判断是否具有异常,并实时地通知远程主机以进行分析与除错。
虽然本发明已以实施方式揭露如上,然其并非用以限定本发明,任何熟悉此技术的人员,在不脱离本发明的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视权利要求书所界定的范围为准。