CN109032877A - 一种基于pcie的机箱监控方法及装置 - Google Patents

一种基于pcie的机箱监控方法及装置 Download PDF

Info

Publication number
CN109032877A
CN109032877A CN201811012953.4A CN201811012953A CN109032877A CN 109032877 A CN109032877 A CN 109032877A CN 201811012953 A CN201811012953 A CN 201811012953A CN 109032877 A CN109032877 A CN 109032877A
Authority
CN
China
Prior art keywords
cabinet equipment
monitoring
status information
pcie
chassis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811012953.4A
Other languages
English (en)
Inventor
黄玉龙
姜怡坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811012953.4A priority Critical patent/CN109032877A/zh
Publication of CN109032877A publication Critical patent/CN109032877A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2247Verification or detection of system hardware configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于PCIE的机箱监控方法及装置,其中所述方法包括:应用程序编程接口API从各个总线接口读取机箱设备的状态信息;所述机箱设备至少包括以下几种:电源、风扇、插槽和LED;将读取的机箱设备的状态信息发送给应用层;以使监控系统从所述应用层读取所述机箱设备的状态信息。利用本发明提供的方法,可以通过软件及时监控硬件问题,防止因硬件异常而导致数据丢失。

Description

一种基于PCIE的机箱监控方法及装置
技术领域
本发明涉及计算机硬件监控技术领域,尤其涉及一种基于PCIE的机箱监控方法及装置。
背景技术
在存储数据时,为了保证数据的可靠性与完整性,需要软件系统和硬件系统的共同支持,但在计算机实际运行的物理环境中,物理硬件往往会出现各种各样的问题,例如:电源电压不稳定、风扇停止转动、硬件插槽阻塞或短路、机箱温度过高等,当发生严重的物理硬件问题时可能会使系统损坏,导致数据的丢失。所以对硬件系统进行监测,及时发现其异常是至关重要的。
发明内容
为了解决现有技术中存在的技术问题,本申请提供了提供一种基于PCIE的机箱监控方法,可以通过上层软件及时监控硬件问题,防止因硬件异常而导致数据丢失。
本申请提供了一种基于PCIE的机箱监控方法,所述方法包括:
应用程序编程接口API从各个总线接口读取机箱设备的状态信息;
所述机箱设备至少包括以下几种:电源、风扇、插槽和LED;
将读取的机箱设备的状态信息发送给应用层;以使监控系统从所述应用层读取所述机箱设备的状态信息。
可选的,所述状态信息包括:电源的电压、机箱温度、风扇转速、插槽使用情况和LED亮灭状态。
可选的,所述方法还包括:利用硬件层为每个所述机箱设备分配对应地址。
可选的,所述方法还包括:利用管理层调整每个所述机箱设备监测周期以及监测时段。
可选的,所述方法还包括:
利用所述管理层记录每个所述机箱设备在所述监测周期以及所述监测时段的状态信息。
本申请实施例还提供了一种基于PCIE的机箱监控装置,所述装置包括:
信息读取单元,用于从各个总线接口读取机箱设备的状态信息;
所述机箱设备至少包括以下几种:电源、风扇、插槽和LED;
信息发送单元,用于将读取的机箱设备的状态信息发送给应用层;以使监控系统从所述应用层读取所述机箱设备的状态信息。
可选的,所述状态信息包括:电源的电压、机箱温度、风扇转速、插槽使用情况和LED亮灭状态。
可选的,所述装置还包括:地址分配子单元,用于利用硬件层为每个所述机箱设备分配对应地址。
可选的,所述装置还包括:监测调整子单元,用于利用管理层调整每个所述机箱设备监测周期以及监测时段。
可选的,所述装置还包括:信息记录子单元,用于利用所述管理层记录每个所述机箱设备在所述监测周期以及所述监测时段的状态信息。
本申请通过应用程序编程接口API从各个总线接口读取机箱设备的状态信息,其中机箱设备至少包括了电源、风扇、插槽和LED等,再将读取的机箱设备的状态信息发送给应用层,实现了通过上层的应用软件获取硬件的状态信息。监控系统从所述应用层读取所述机箱设备的状态信息,通过监控系统就可以及时发现硬件的异常,便于及时做出相应的处理,防止因硬件异常而导致数据丢失,从而提高了系统的稳定性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例一提供的一种基于PCIE的机箱监控方法的流程图;
图2为本申请实施例二提供的一种基于PCIE的机箱监控方法的流程图;
图3为本申请实施例三提供的一种基于PCIE的机箱监控装置的示意图;
图4为本申请实施例四提供的一种基于PCIE的机箱监控装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
参见图1,该图为本申请实施例一提供的一种基于PCIE的机箱监控方法的流程图。
本实施例所述方法包括以下步骤:
S101:应用程序编程接口API从各个总线接口读取机箱设备的状态信息。
本申请方法基于的PCI-Express(peripheral component interconnectexpress)是一种高速串行计算机扩展总线标准,属于点对点双通道高带宽传输,为所连接的设备分配独享的通道带宽,各设备之间不共享总线带宽,可以稳定可靠支持本发明实施例中对各项硬件的监控以及数据的传输和保护,并且PCI-Express支持热插拔功能,即允许在不关闭系统,不切断电源的情况下取出和更换损坏的硬盘、电源或风扇等硬件,从而提高了系统对故障的及时恢复能力、扩展性和灵活性。
所述API(Application Programming Interface,应用程序编程接口)是一组包括函数定义、程序及协议的集合,通过API能够实现计算机软件之间的相互通信。本实施例中API可以从各个总线接口读取机箱设备的状态信息,也可以使应用层具有访问各个机箱设备的能力。
随着计算机硬件技术的发展,机箱设备种类不断增多,为了方便说明,本实施例所述机箱设备至少包括以下几种:电源、风扇、插槽和LED,需要注意的是这并不是对机箱设备的限定。
本实施例所述状态信息包括:电源的电压、机箱温度、风扇转速、插槽使用情况和LED亮灭状态等。
电源的电压决定机箱设备能否正常工作,负责电源的硬件出现短路可能会严重损坏机箱设备,出现断路会使机箱设备停止工作。
机箱温度能够反映出机箱设备的使用情况,一般来说,设备长时间不间断使用、满负荷或超负荷使用时其温度会逐渐升高,温度过高时可能会烧坏该设备。
风扇用于为机箱设备降温,一般机箱中的风扇都设置有不同的转数等级,对应不同的温度等级,即温度较高时,风扇转数也较快,这样可以快速为机箱设备散热,当风扇故障时,散热效果骤降,设备可能会因为散热不良而故障。
插槽是机箱硬件中负责连接主板与某些外部设备的接口,常用的接口方式有引脚式、卡式、触点式、针脚式等。插槽可能因为插拔磨损,灰尘阻塞等因素出现连接功能异常的情况。
机箱的LED灯可以用来提示开机,提示机箱硬件设备的工作情况,例如机箱电源键上一般附带LED灯在开机后会始终亮着,来提示此时机箱处于开机的状态。
S102:将读取的机箱设备的状态信息发送给应用层;以使监控系统从所述应用层读取所述机箱设备的状态信息。
所述应用层,负责直接和应用程序相连并提供应用服务,本申请实施例的监控系统位于应用层中,监控系统读取所述机箱设备的状态信息,实现对机箱硬件的监控,通过监控系统可以及时发现硬件的异常。
本申请实施例通过API从各个总线接口读取机箱设备的状态信息,再将读取的机箱设备的状态信息发送给应用层,实现了通过上层的应用软件获取硬件的状态信息。监控系统从所述应用层读取所述机箱设备的状态信息,通过监控系统就可以及时发现硬件的异常,便于及时做出相应的处理,防止因硬件异常而导致数据丢失,从而提高了系统的稳定性。
实施例二:
上述实施例介绍了基于PCIE的机箱监控方法,所述方法还包括为机箱硬件进行分配地址、设置监控具体的业务内容等操作,下面结合附图具体说明。
参见图2,该图为本申请实施例二提供的一种基于PCIE的机箱监控方法的流程图。
本实施例所述方法包括以下步骤:
S201:利用硬件层为每个所述机箱设备分配对应地址。
硬件层包含所述的电源、风扇、插槽和LED等各种机箱设备,为机箱设备分配地址后,API才能读取各个机箱设备的状态信息并且与机箱设备对应起来。
S202:利用管理层调整每个所述机箱设备监测周期以及监测时段。
管理层可以为机箱设备分别设置不同的检测周期及检测时段,例如可以将对电源的监测周期设置为5秒,即每隔5秒获取依次电源的状态信息,监测时间段设置为8:00-20:00,即只在该时间段内进行监测。
检测周期以及监测时段的操作可以由管理层自行根据机箱设备的使用情况进行调整,也可以人为调整,通过调整监测周期以及监测时段可以避免过度监测带来的大量无价值的状态信息。
S203:利用所述管理层记录每个所述机箱设备在所述监测周期以及所述监测时段的状态信息。
记录所述机箱设备的状态信息可以通过异步执行的方式,在线程中并行记录多个状态信息。例如从监测时段为8:00-10:00,电源的监测周期为1小时,即在8:00、9:00、10:00时记录电源的状态信息,同时风扇的检测周期为30分钟,即在8:00、8:30、9:00、9:30、10:00时记录风扇的状态信息,对于电源的风扇状态信息并行记录,互不影响。
需要注意的是,本实施例的上述方法实施步骤不构成对于本申请的限定,本申请只具体说明了其中的一种情况,可以根据实际需求进行调整,例如在S203后可以再次执行S202来调整每个所述机箱设备监测周期以及监测时段。
利用本申请实施例提供的方法,可以为每个所述机箱设备分配对应地址,便于API读取机箱设备的状态信息;调整每个所述机箱设备监测周期以及监测时段,同时利用所述管理层记录每个机箱设备在所述监测周期以及所述监测时段的状态信息,记录的状态信息可以用于技术分析以及对硬件设备的改进提升。
实施例三:
根据上述实施例提供的基于PCIE的机箱监控方法,本申请实施例还提供了一种基于PCIE的机箱监控装置,下面结合附图进行具体说明。
参见图3,该图为本申请实施例三提供的一种基于PCIE的机箱监控装置的示意图。
本实施例所述装置包括:信息读取单元301和信息发送单元302。
信息读取单元301,用于从各个总线接口读取机箱设备的状态信息;所述机箱设备至少包括以下几种:电源、风扇、插槽和LED;
信息发送单元302,用于将读取的机箱设备的状态信息发送给应用层;以使监控系统从所述应用层读取所述机箱设备的状态信息。
本申请实施例提供的基于PCIE的机箱监控装置,可以通过API从各个总线接口读取机箱设备的状态信息,再将读取的机箱设备的状态信息发送给应用层,实现了通过上层的应用软件获取硬件的状态信息。监控系统从所述应用层读取所述机箱设备的状态信息,通过监控系统就可以及时发现硬件的异常,便于及时做出相应的处理,防止因硬件异常而导致数据丢失,从而提高了系统的稳定性。
实施例四:
参见图4,该图为本申请实施例四提供的另一种基于PCIE的机箱监控装置的示意图。
本实施例所述的装置包括:地址分配子单元401、监测调整子单元402和信息记录子单元403。
地址分配子单元401,用于利用硬件层为每个所述机箱设备分配对应地址。
监测调整子单元402,用于利用管理层调整每个所述机箱设备监测周期以及监测时段。
信息记录子单元403,用于利用所述管理层记录每个所述机箱设备在所述监测周期以及所述监测时段的状态信息。
需要注意的是,本实施例的上述子单元的连接关系不构成对于本申请的限定,本申请只是具体说明了其中的一种连接关系,可以根据实际需求进行调整。
利用本申请实施例提供的装置,可以为每个所述机箱设备分配对应地址,便于API读取机箱设备的状态信息;调整每个所述机箱设备监测周期以及监测时段,同时利用所述管理层记录每个机箱设备在所述监测周期以及所述监测时段的状态信息,记录的状态信息可以用于技术分析以及对硬件设备的改进提升。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (10)

1.一种基于PCIE的机箱监控方法,其特征在于,包括:
应用程序编程接口API从各个总线接口读取机箱设备的状态信息;所述机箱设备至少包括以下几种:电源、风扇、插槽和LED;
将读取的机箱设备的状态信息发送给应用层;以使监控系统从所述应用层读取所述机箱设备的状态信息。
2.根据权利要求1所述的基于PCIE的机箱监控方法,其特征在于,所述状态信息包括:电源的电压、机箱温度、风扇转速、插槽使用情况和LED亮灭状态。
3.根据权利要求1所述的基于PCIE的机箱监控方法,其特征在于,还包括:
利用硬件层为每个所述机箱设备分配对应地址。
4.根据权利要求1所述的基于PCIE的机箱监控方法,其特征在于,还包括:利用管理层调整每个所述机箱设备监测周期以及监测时段。
5.根据权利要求1所述的基于PCIE的机箱监控方法,其特征在于,还包括:
利用所述管理层记录每个所述机箱设备在所述监测周期以及所述监测时段的状态信息。
6.一种基于PCIE的机箱监控装置,其特征在于,包括:
信息读取单元,用于从各个总线接口读取机箱设备的状态信息;所述机箱设备至少包括以下几种:电源、风扇、插槽和LED;
信息发送单元,用于将读取的机箱设备的状态信息发送给应用层;以使监控系统从所述应用层读取所述机箱设备的状态信息。
7.根据权利要求6所述的基于PCIE的机箱监控装置,其特征在于,所述状态信息包括:电源的电压、机箱温度、风扇转速、插槽使用情况和LED亮灭状态。
8.根据权利要求6所述的基于PCIE的机箱监控装置,其特征在于,还包括:地址分配子单元,用于利用硬件层为每个所述机箱设备分配对应地址。
9.根据权利要求6所述的基于PCIE的机箱监控装置,其特征在于,还包括:监测调整子单元,用于利用管理层调整每个所述机箱设备监测周期以及监测时段。
10.根据权利要求6所述的基于PCIE的机箱监控装置,其特征在于,还包括:信息记录子单元,用于利用所述管理层记录每个所述机箱设备在所述监测周期以及所述监测时段的状态信息。
CN201811012953.4A 2018-08-31 2018-08-31 一种基于pcie的机箱监控方法及装置 Pending CN109032877A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811012953.4A CN109032877A (zh) 2018-08-31 2018-08-31 一种基于pcie的机箱监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811012953.4A CN109032877A (zh) 2018-08-31 2018-08-31 一种基于pcie的机箱监控方法及装置

Publications (1)

Publication Number Publication Date
CN109032877A true CN109032877A (zh) 2018-12-18

Family

ID=64622705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811012953.4A Pending CN109032877A (zh) 2018-08-31 2018-08-31 一种基于pcie的机箱监控方法及装置

Country Status (1)

Country Link
CN (1) CN109032877A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515438A (zh) * 2019-08-28 2019-11-29 浪潮商用机器有限公司 Tmc中的风扇数据监测方法、装置、设备及存储介质
CN112559564A (zh) * 2020-11-19 2021-03-26 山东云海国创云计算装备产业创新中心有限公司 一种应用层状态信息的存取方法、装置和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1609817A (zh) * 2004-10-13 2005-04-27 李�诚 监控PCI Express板卡的方法及其装置
CN1617105A (zh) * 2004-08-17 2005-05-18 李谦 用系统管理总线芯片监控电脑机箱的方法及其装置
CN1658165A (zh) * 2005-03-18 2005-08-24 李谦 监控电脑机箱和电源的装置和程序

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1617105A (zh) * 2004-08-17 2005-05-18 李谦 用系统管理总线芯片监控电脑机箱的方法及其装置
CN1609817A (zh) * 2004-10-13 2005-04-27 李�诚 监控PCI Express板卡的方法及其装置
CN1658165A (zh) * 2005-03-18 2005-08-24 李谦 监控电脑机箱和电源的装置和程序

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515438A (zh) * 2019-08-28 2019-11-29 浪潮商用机器有限公司 Tmc中的风扇数据监测方法、装置、设备及存储介质
CN112559564A (zh) * 2020-11-19 2021-03-26 山东云海国创云计算装备产业创新中心有限公司 一种应用层状态信息的存取方法、装置和介质
CN112559564B (zh) * 2020-11-19 2022-08-12 山东云海国创云计算装备产业创新中心有限公司 一种应用层状态信息的存取方法、装置和介质

Similar Documents

Publication Publication Date Title
US9880602B2 (en) Power characteristics in a system of disparate storage drives
CN102223394B (zh) 用于提供远程直接存储设备访问的方法、服务器
US7716334B2 (en) Computer system with dynamically configurable capacity
US7707456B2 (en) Storage system
US7437585B2 (en) Storage system and power control method therefor, adapter and power control method therefor, and storage controller and control method therefor
US20070101059A1 (en) Storage control system and control method for storage control which suppress the amount of power consumed by the storage control system
US11210430B2 (en) System and method to negotiate encryption responsibilities between an encryption capable controller and a self encrypting drive
CN101796494A (zh) 可缩放且可维护的固态驱动器
US9575671B1 (en) Read distribution in a three-dimensional stacked memory based on thermal profiles
US20070094531A1 (en) Expandable storage apparatus for blade server system
CN101178634A (zh) 刀片服务器及其应用的存储实现方法
US11585351B2 (en) Fan failure compensation
CN109032877A (zh) 一种基于pcie的机箱监控方法及装置
TWI468922B (zh) 電子裝置及其管理方法與機櫃伺服系統
US7177782B2 (en) Methods and arrangements for capturing runtime information
US20070294600A1 (en) Method of detecting heartbeats and device thereof
US11720256B2 (en) Maximizing power savings using IO monitoring
US20110231674A1 (en) Independent drive power control
US11126486B2 (en) Prediction of power shutdown and outage incidents
CN102650933A (zh) 一种用于数字化变电站网络通信记录装置的存储系统
KR20070029358A (ko) 고속 메모리 기반의 스토리지 시스템 및 그 제어방법
US11221952B1 (en) Aggregated cache supporting dynamic ratios in a vSAN architecture
CN113609036A (zh) 一种基于u.3接口的硬盘背板
US20080147933A1 (en) Dual-Channel Network Storage Management Device And Method
US9423863B2 (en) Server system with power distribution board and storage control method thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218

RJ01 Rejection of invention patent application after publication