CN113127308B - 一种基于bmc的设备监控方法、装置、系统及存储介质 - Google Patents

一种基于bmc的设备监控方法、装置、系统及存储介质 Download PDF

Info

Publication number
CN113127308B
CN113127308B CN202110454434.9A CN202110454434A CN113127308B CN 113127308 B CN113127308 B CN 113127308B CN 202110454434 A CN202110454434 A CN 202110454434A CN 113127308 B CN113127308 B CN 113127308B
Authority
CN
China
Prior art keywords
target
information
bus
monitoring
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110454434.9A
Other languages
English (en)
Other versions
CN113127308A (zh
Inventor
候志立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yingxin Computer Technology Co Ltd
Original Assignee
Shandong Yingxin Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yingxin Computer Technology Co Ltd filed Critical Shandong Yingxin Computer Technology Co Ltd
Priority to CN202110454434.9A priority Critical patent/CN113127308B/zh
Publication of CN113127308A publication Critical patent/CN113127308A/zh
Application granted granted Critical
Publication of CN113127308B publication Critical patent/CN113127308B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3027Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0016Inter-integrated circuit (I2C)

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种基于BMC的设备监控方法、装置、系统及计算机可读存储介质,该方法包括:预先为硬件服务器的i2c总线的每个线程分配一个逻辑标识,并建立与硬件服务器的i2c总线使用信息及扩展信息对应的i2c拓扑关系;根据当前硬件服务器及当前逻辑标识确定出目标i2c总线及目标i2c拓扑关系;依据目标i2c拓扑关系控制目标i2c总线切换至与当前逻辑标识对应的目标通道上;通过与当前逻辑标识对应的目标线程对目标通道上的待监控设备进行监控、获取监控信息;在使用过程中扩展性强,能够保证信息获取的实时性,有利于提高服务器性能及提高信息获取的准确性。

Description

一种基于BMC的设备监控方法、装置、系统及存储介质
技术领域
本发明实施例涉及计算机技术领域,特别是涉及一种基于BMC的设备监控方法、装置、系统及计算机可读存储介质。
背景技术
BMC(基板管理控制器)属于独立于服务器系统的一个用于管理和控制的子系统,可以实现对服务器各设备(如PCIE设备,GPU,PSU等)进行监控,也可以监控服务器各监测点的温度、电压、电流等相关信息,并根据检测到的温度、电压进行散热调控或根据设定的阈值实现报警和故障上报。另外,BMC还可以实现针对故障或宕机状态下收集CPU相关寄存器的数值并进行故障分析,故障定位和故障上报功能。
目前,在基于BMC实现设备监控时,主要是通过i2c实现的物理连接,因此以i2c通道作为设备监控单元,每个i2c总线通过一个线程对多个通道对应的设备进行监控,并且每个通道可能对应多个设备,因为不同的i2c总线下所接的设备不同,同一种i2c设备下不同配置的服务器所接的设备也多种多样,也即一个i2c总线通过一个线程对其下所接多个设备进行监控,因此需要在一个i2c总线的线程中兼容多种部件的监控逻辑,并且当新增一个设备需要监控的时候,现有技术要在该i2c总线的线程中增加针对该设备的信息获取逻辑代码,每增加一个设备就需要对线程的逻辑代码进行一次改动,针对一个线程代码的频繁改动,会影响该i2c总线上所有类型设备的信息获取逻辑,导致稳定性差,扩展性差;另外,对于一个i2c总线下接pca9548进行扩展时,需要对扩展通道上的不同设备进行读取,由于不同类型设备的读取逻辑都集中在一个线程中,因此当一个设备需要延迟读取的时候,会影响其余部件信息获取的实时性,严重的会影响服务器性能,以及一个设备切换通道信息读取完成后需要关闭当前通道,以避免对其他设备的信息读取造成影响,如果当前通道没有关闭,或会引入设备地址冲突的情况,导致读取信息的准确性比较差。
鉴于此,如何提供一种解决上述技术问题的基于BMC的设备监控方法、装置、系统及计算机可读存储介质成为本领域技术人员需要解决的问题。
发明内容
本发明实施例的目的是提供一种基于BMC的设备监控方法、装置、系统及计算机可读存储介质,在使用过程中扩展性强,能够保证信息获取的实时性,有利于提高服务器性能及提高信息获取的准确性。
为解决上述技术问题,本发明实施例提供了一种基于BMC的设备监控方法,包括:
预先为硬件服务器的i2c总线的每个线程分配一个逻辑标识,并建立与所述硬件服务器的i2c总线使用信息及扩展信息对应的i2c拓扑关系;
根据当前硬件服务器及当前逻辑标识确定出目标i2c总线及目标i2c拓扑关系;
依据所述目标i2c拓扑关系控制所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上;
通过与所述当前逻辑标识对应的目标线程对所述目标通道上的待监控设备进行监控、获取监控信息。
可选的,所述i2c拓扑关系包括i2c总线信息、i2c总线使用情况、扩展器信息及每个线程各自的逻辑标识。
可选的,还包括:
预先基于所述i2c拓扑关系建立与每个所述逻辑ID各自对应的通道切换实现过程;
则,所述依据所述目标i2c拓扑关系控制所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上的过程为:
根据目标i2c拓扑关系获取各个逻辑标识,以及与每个所述逻辑标识各自对应的通道切换实现过程;
依据当前逻辑标识从与每个所述逻辑标识各自对应的通道切换实现过程中,确定出与所述当前逻辑标识对应的目标通道切换实现过程;
根据所述目标通道切换实现过程,将所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上。
可选的,在所述通过与所述当前逻辑标识对应的目标线程对所述目标通道上的待监控设备进行监控、获取监控信息之前,还包括:
获取所述目标通道上与所述当前逻辑标识对应的待监控设备的设备类型;
依据所述设备类型及预先建立的设备类型与监控信息标识的对应关系,确定出对应的各个目标监控信息标识。
可选的,所述通过与所述当前逻辑标识对应的目标线程对所述目标通道上的待监控设备进行监控、获取监控信息的过程为:
预先建立与每个设备类型对应的动态链接库,所述动态链接库包括监控交互协议及信息表,所述信息表为基于监控信息标识及对应的信息获取函数建立的;
采用与所述当前逻辑标识对应的目标线程、依据所述设备类型从各个所述动态链接库中匹配出目标动态链接库;
根据各个所述目标监控信息标识从所述目标动态链接库中,确定出与每个所述目标监控信息标识各自对应的目标信息获取函数;
通过各个所述目标获取函数获取所述待监控设备的各个监控信息。
可选的,所述获取所述目标通道上与所述当前逻辑标识对应的待监控设备的设备类型的过程为:
接收BIOS发送的、与所述目标通道及所述当前逻辑ID对应的待监控设备的设备信息,以及获取BMC扫描得到的设备地址信息和设备标识信息;
根据所述设备信息、所述设备地址信息和所述设备标识信息确定出所述待监控设备的设备类型。
本发明实施例还提供了一种基于BMC的设备监控装置,包括:
第一建立模块,用于预先为硬件服务器的i2c总线的每个线程分配一个逻辑标识,并建立与所述硬件服务器的i2c总线使用信息及扩展信息对应的i2c拓扑关系;
确定模块,用于根据当前硬件服务器及当前逻辑标识确定出目标i2c总线及目标i2c拓扑关系;
切换模块,用于依据所述目标i2c拓扑关系控制所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上;
监控模块,用于通过与所述当前逻辑标识对应的目标线程对所述目标通道上的待监控设备进行监控、获取监控信息。
可选的,还包括:
第二建立模块,用于预先基于所述i2c拓扑关系建立与每个所述逻辑ID各自对应的通道切换实现过程;
则,所述切换模块包括:
获取单元,用于根据目标i2c拓扑关系获取各个逻辑标识,以及与每个所述逻辑标识各自对应的通道切换实现过程;
确定单元,用于依据当前逻辑标识从与每个所述逻辑标识各自对应的通道切换实现过程中,确定出与所述当前逻辑标识对应的目标通道切换实现过程;
切换单元,用于根据所述目标通道切换实现过程,将所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上。
本发明实施例还提供了一种基于BMC的设备监控系统,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述所述的基于BMC的设备监控方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的基于BMC的设备监控方法的步骤。
本发明实施例中提供了一种基于BMC的设备监控方法、装置、系统及计算机可读存储介质,该方法针对硬件服务器的i2c总线的每个线程分配一个逻辑标识以及建立与硬件服务器的i2c总线使用信息和扩展信息对应的i2c拓扑关系,在对硬件服务器上的设备进行监控时,根据当前硬件服务器及当前逻辑标识能够自动确定出目标i2c总线及目标i2c拓扑关系,然后再根据该i2c拓扑关系进一步控制该目标i2c总线切换至与当前逻辑标识对应的目标通道上,并通过与该当前逻辑标识对应的目标线程对目标通道上的待监控设备进行监控及获取监控信息;本发明是一个线程只对接入的一个设备进行监控,并且i2c总线可以根据当前逻辑标识进行通道切换,然后通过与目标逻辑标识对应的目标线程对待监控设备进行监控,在新增一个设备需要监控时,可以增加一个线程并确定与该线程对应的逻辑标识,并通过该新的线程对新增设备进行监控,扩展性强能够保证信息获取的实时性,有利于提高服务器性能及信息获取的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于BMC的设备监控方法的流程示意图;
图2为本发明实施例提供的一种基于BMC的设备监控装置的结构示意图。
具体实施方式
本发明实施例提供了一种基于BMC的设备监控方法、装置、系统及计算机可读存储介质,在使用过程中扩展性强,能够保证信息获取的实时性,有利于提高服务器性能及提高信息获取的准确性。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,图1为本发明实施例提供的一种基于BMC的设备监控方法的流程示意图。该方法包括:
S110:预先为硬件服务器的i2c总线的每个线程分配一个逻辑标识,并建立与硬件服务器的i2c总线使用信息及扩展信息对应的i2c拓扑关系;
需要说明的是,本发明实施中的i2c总线对应多个线程,其中,不同的硬件服务器的i2c总线的具体使用情况可能不同,i2c总线对应的通道数量不同,每个通道中的线程数量也可能不同,本发明实施例中针对一个硬件服务器,预先根据该硬件服务器的i2c总线整体情况为每个线程分配一个逻辑标识,该逻辑标识具体可以为逻辑ID,不同的线程的逻辑标识不同,也即每个线程的逻辑标识唯一。
另外,由于不同的硬件服务器的i2c总线的具体使用情况可能不同,并且i2c总线的扩展情况也会有差异,因此本发明实施例中针对一个硬件服务器,还预先根据该硬件服务器的i2c总线使用信息以及i2c总线的扩展信息建立与该硬件服务器对应的i2c拓扑关系,具体可以建立i2c拓扑关系表,其具体形式本发明实施例不作特殊限定。其中,根据该i2c拓扑关系可以确定出该硬件服务器的i2c总线是否被启动使用,并且在启动使用的情况下是否存在扩展,不存在扩展时有一条通道,该通道内每个线程的具体逻辑标识;存在扩展时,具体扩展为几条通道,并且确定出每条通道内每个线程的逻辑标识。
S120:根据当前硬件服务器及当前逻辑标识确定出目标i2c总线及目标i2c拓扑关系;
具体的,在对当前硬件服务器下的设备进行监控时,可以根据当前逻辑标识确定出该当前硬件服务器下的目标i2c总线及与该目标i2c总线对应的目标i2c拓扑关系,其中,目标i2c总线可能为多个,并且一个目标i2c总线对应一个i2c拓扑关系,其确定出的目标i2c总线的具体数量根据实际情况确定,本发明实施例以一个目标i2c总线为例进行说明。
S130:依据目标i2c拓扑关系控制目标i2c总线切换至与当前逻辑标识对应的目标通道上;
具体的,根据目标i2c拓扑关系即可确定出目标i2c总线下的各条目标通道以及确定出每条目标通道下的各个线程及逻辑标识,因此可以根据目标i2c拓扑关系控制目标i2c总线切换至与当前逻辑标识对应的的目标通道上,也即切换至与当前逻辑标识对应的目标线程所在的目标通道上。
S140:通过与当前逻辑标识对应的目标线程对目标通道上的待监控设备进行监控、获取监控信息。
可以理解的是,在将i2c总线切换至目标通道上后,即可通过与该当前逻辑标识对应的目标线程对目标通道上的待监控设备进行监控及获取该待监控设备的监控信息,其中,本发明实施例中每个线程对应一个逻辑标识,并通过一个线程对一个待监控设备进行监控,由于硬件服务器确定时,其所对应的各个待监控设备也是确定的,因此,本发明实施例在增加新的待监控设备时,只需要增加新的线程并确定出该新增线程的逻辑标识,并通过该新增线程来对新增设备进行监控即可,由于本发明实施例中一个线程仅用于监控一个设备,因此不会涉及到对已有线程的逻辑进行更改的问题,因此本发明实施例具有较强的扩展性及稳定性,能够保证信息获取的实时性,并且所获取的信息的准确性较高,有利于提高服务器性能。
另外,在实际应用中可以根据当前硬件服务器的i2c拓扑关系确定出每个逻辑标识,并且对每个逻辑标识进行轮询,以确定出逐个对每个逻辑标识对应的通道上的待监控设备进行监控和获取监控信息,或者在控制目标i2c总线切换至与当前逻辑标识对应的目标通道上后,再根据该目标通道内的各个线程确定出与每个线程对应的逻辑标识,并同时通过与各个逻辑标识分别对应的线程来对该通道下的各个待监控设备进行监控和获取监控信息,其中一个线程对应监控一个待监控设备。
进一步的,本发明实施例中的i2c拓扑关系包括i2c总线信息、i2c总线使用情况、扩展器信息及每个线程各自的逻辑标识。
需要说明的是,本发明实施例中的i2c总线信息可以包括i2c总线标识和/或i2c总线名称等,以便根据该i2c总线信息可以唯一确定一个i2c总线;i2c总线使用情况具体可以为i2c总线的启用禁用情况,也即i2c总是是启动使用,还是禁止使用;扩展器信息具体可以包括是否存在扩展,并且在存在扩展时扩展器名称和/或扩展器标识,其中,扩展器具体可以为PCA9548;每个线程各自的逻辑标识具体可以包括i2c总线下所有通道中每个线程各自的逻辑标识。
更进一步的,该方法还可以包括:
预先基于i2c拓扑关系建立与每个逻辑ID各自对应的通道切换实现过程;
具体的,为了便于后续将目标i2c总线快速切换至对应的目标通道上,提高整体监控效率,本发明实施例可以预先基于i2c拓扑关系,确定出每个逻辑标识所对应的通道的通道切换实现过程,也即,根据建立好的i2c拓扑关系,确定出对应的i2c总线下的所有通道,然后在确定出将i2c总线切换至每个逻辑标识对应的通道时的通道切换实现过程,具体的当i2c总线没有被扩展(也即没有扩展器)时,则i2c总线下只有一条通道,此时无需切换,当i2c总线存在被扩展(也即存在扩展器)时,例如对于PCA9548扩展器,可以将i2c总线扩展至0至7共8条通道,根据每个通道实际线程情况确定出每个通道的逻辑标识,则根据第0条通道中的逻辑标识,可以预先确定出将i2c总线切换至第0条通道时的通道切换实现过程,根据第1条通道中的逻辑标识,确定出i2c总线切换至第1条通道时的通道切换实现过程,等等直至根据第7条通道中的逻辑标识,确定出i2c总线切换至第7条通道时的通道切换实现过程,并建立各个逻辑标识及通道切换实现过程的对应关系。其中,每个通道切换实现过程包括i2c总线的地址设置等功能,以便根据该通道切换实现过程能够将对应的i2c总线切换至对应的通道上。
则,上述S130中依据目标i2c拓扑关系控制目标i2c总线切换至与当前逻辑标识对应的目标通道上的过程,具体可以为:
根据目标i2c拓扑关系获取各个逻辑标识,以及与每个逻辑标识各自对应的通道切换实现过程;
依据当前逻辑标识从与每个逻辑标识各自对应的通道切换实现过程中,确定出与当前逻辑标识对应的目标通道切换实现过程;
根据目标通道切换实现过程,将目标i2c总线切换至与当前逻辑标识对应的目标通道上。
具体的,当对当前硬件服务器上的设备进行监控时,并且在根据当前逻辑标识确定出目标i2c总线及目标i2c拓扑关系后,即可从该目标i2c拓扑关系中获取出每个逻辑标识,然后根据预先建立的逻辑标识与通道切换实现过程的对应关系,匹配出与每个逻辑标识各自对应的通道切换实现过程,然后再进一步获取与该当前逻辑标识对应的目标通道切换实现过程,并根据该目标通道实现过程将目标i2c总线切换至对应的目标通道上,具体的当存在扩展器时,可以将目标i2c总线的地址根据扩展器的地址信息进行设置,然后在将目标i2c总线切换至与当前逻辑标识对应的目标通道上。
更进一步的,在通过与当前逻辑标识对应的目标线程对目标通道上的待监控设备进行监控、获取监控信息之前,该方法还可以包括:
获取目标通道上与当前逻辑标识对应的待监控设备的设备类型;
依据设备类型及预先建立的设备类型与监控信息标识的对应关系,确定出对应的各个目标监控信息标识。
需要说明的是,针对一个硬件服务器其所接的设备基本上是确定的,也即设备类型确定,并且针对一个设备其所需要监控的监控信息(如温度、电压、功耗、厂商信息等)也是确定的,因此本发明实施例中可以预先对每个监控信息确定一个监控信息标识,并针对一个硬件服务器下的各个设备的设备类型,建立设备类型与监控信息标识的对应关系。其中,本发明实施例中的设备类型也即设备的具体类型,可以包括设备类别及设备子类型,例如设备类别为GPU,设备子类型为英伟达的GPU,因此可确定出设备类型为英伟达GPU。
具体的,本发明实施例中在将目标i2c总线切换至与当前逻辑标识对应的目标通道上后,可以先获取待监控设备的设备类型(如英伟达GPU或寒武纪GPU、RAID卡、网卡、PSU等设备类型),具体可以根据BIOS发送的、与目标通道及当前逻辑ID对应的待监控设备的设备信息、以及BMC扫描得到的设备地址信息和设备标识信息进一步确定出待监控设备的设备类型,并且在确定出待监控设备的设备类型后,即可根据预先建立的设备类型与监控信息标识的对应关系,确定出与待监控设备的设备类型对应的各个目标监控信息标识,获取各个目标监控信息标识后即可确定出需要获取哪些监控信息,然后再通过与当前逻辑标识对应的目标线程对目标通道上的待监控设备进行监控、获取各个监控信息。
进一步的,上述S140中通过与当前逻辑标识对应的目标线程对目标通道上的待监控设备进行监控、获取监控信息的过程,具体可以为:
预先建立与每个设备类型对应的动态链接库,动态链接库包括监控交互协议及信息表,信息表为基于监控信息标识及对应的信息获取函数建立的;
采用与当前逻辑标识对应的目标线程、依据设备类型从各个动态链接库中匹配出目标动态链接库;
根据各个目标监控信息标识从目标动态链接库中,确定出与每个目标监控信息标识各自对应的目标信息获取函数;
通过各个目标获取函数获取待监控设备的各个监控信息。
具体的,由于针对一个硬件服务器其所接的设备基本上是确定的,也即设备类型确定,设备类型确定则与该设备对应的监控交互协议也便确定,例如设备类型为英伟达GPU则可确定出与该英伟达GPU对应的监控交互协议,设备类为寒武纪GPU则可确定出与其对应的监控交互协议,并且同一个监控信息在不同的监控交互协议下,获取过程不同。因此,为了快速获取对应的监控信息,本发明实施例中可以预先根据与设备类型对应的各个监控信息标识建立信息表,该信息表中具体可以包括各个监控信息标识及与每个监控信息标识各自对应的信息获取函数,然后再进一步根据与设备类型对应的监控交互协议及信息表,建立与该设备类型对应的动态链接库,以便在针对一个待监控设备进行监控时,通过与当前逻辑标识对应的目标线程来根据该设备类型从各个动态链接库中匹配出目标动态链接库,然后进一步根据目标监控信息标识从目标动态链接库中确定出信息表,并进一步从信息表中获取与每个目标监控信息标识各自对应的目标信息获取函数,然后再通过各个目标获取函数获取待监控设备的各个监控信息,本发明实施例中无需线程中编写代码逻辑,只需要通过线程来获取并执行相应的目标信息获取函数即可,从而可以避免在存在新增设备进行监控时更改线程中的逻辑代码,只需要增加与该新增设备对应的设备类型对应的动态链接库即可。
可见,该方法针对硬件服务器的i2c总线的每个线程分配一个逻辑标识以及建立与硬件服务器的i2c总线使用信息和扩展信息对应的i2c拓扑关系,在对硬件服务器上的设备进行监控时,根据当前硬件服务器及当前逻辑标识能够自动确定出目标i2c总线及目标i2c拓扑关系,然后再根据该i2c拓扑关系进一步控制该目标i2c总线切换至与当前逻辑标识对应的目标通道上,并通过与该当前逻辑标识对应的目标线程对目标通道上的待监控设备进行监控及获取监控信息;本发明是一个线程只对接入的一个设备进行监控,并且i2c总线可以根据当前逻辑标识进行通道切换,然后通过与目标逻辑标识对应的目标线程对待监控设备进行监控,在新增一个设备需要监控时,可以增加一个线程并确定与该线程对应的逻辑标识,无需对其他已有线程的进行更改,扩展性强,能够保证信息获取的实时性,有利于提高监控效率和服务器性能,以及提高信息获取的准确性。
在上述实施例的基础上,本发明实施例还提供了一种基于BMC的设备监控装置,具体请参照图2。该装置包括:
第一建立模块21,用于预先为硬件服务器的i2c总线的每个线程分配一个逻辑标识,并建立与硬件服务器的i2c总线使用信息及扩展信息对应的i2c拓扑关系;
确定模块22,用于根据当前硬件服务器及当前逻辑标识确定出目标i2c总线及目标i2c拓扑关系;
切换模块23,用于依据目标i2c拓扑关系控制目标i2c总线切换至与当前逻辑标识对应的目标通道上;
监控模块24,用于通过与当前逻辑标识对应的目标线程对目标通道上的待监控设备进行监控、获取监控信息。
进一步,该装置还包括:
第二建立模块,用于预先基于i2c拓扑关系建立与每个逻辑ID各自对应的通道切换实现过程;
则,该切换模块23包括:
获取单元,用于根据目标i2c拓扑关系获取各个逻辑标识,以及与每个逻辑标识各自对应的通道切换实现过程;
确定单元,用于依据当前逻辑标识从与每个逻辑标识各自对应的通道切换实现过程中,确定出与当前逻辑标识对应的目标通道切换实现过程;
切换单元,用于根据目标通道切换实现过程,将目标i2c总线切换至与当前逻辑标识对应的目标通道上。
需要说明的是,本发明实施例中提供的基于BMC的设备监控装置具有与上述实施例中所提供的基于BMC的设备监控方法相同的有益效果,对于本发明实施例中的涉及到的基于BMC的设备监控方法的具体介绍请参照上述方法实施例,本发明在此不再赘述。
在上述实施例的基础上,本发明实施例还提供了一种基于BMC的设备监控系统,该系统包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述的基于BMC的设备监控方法的步骤。
在上述实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的基于BMC的设备监控方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于BMC的设备监控方法,其特征在于,包括:
预先为硬件服务器的i2c总线的每个线程分配一个逻辑标识,并建立与所述硬件服务器的i2c总线使用信息及扩展信息对应的i2c拓扑关系,其中,一个线程对应监控一个待监控设备;若存在新增的待监控设备,增加与所述新增的待监控设备对应的线程,并为所述与所述新增的待监控设备对应的线程分配一个逻辑标识,并建立与所述硬件服务器的i2c总线使用信息及扩展信息对应的i2c拓扑关系;
根据当前硬件服务器及当前逻辑标识确定出目标i2c总线及目标i2c拓扑关系;
依据所述目标i2c拓扑关系控制所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上;
通过与所述当前逻辑标识对应的目标线程对所述目标通道上的待监控设备进行监控、获取监控信息。
2.根据权利要求1所述的基于BMC的设备监控方法,其特征在于,所述i2c拓扑关系包括i2c总线信息、i2c总线使用情况、扩展器信息及每个线程各自的逻辑标识。
3.根据权利要求1所述的基于BMC的设备监控方法,其特征在于,还包括:
预先基于所述i2c拓扑关系建立与每个所述逻辑标识各自对应的通道切换实现过程,所述通道切换实现过程用于将所述目标i2c总线切换至对应的通道上;
则,所述依据所述目标i2c拓扑关系控制所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上的过程为:
根据目标i2c拓扑关系获取各个逻辑标识,以及与每个所述逻辑标识各自对应的通道切换实现过程;
依据当前逻辑标识从与每个所述逻辑标识各自对应的通道切换实现过程中,确定出与所述当前逻辑标识对应的目标通道切换实现过程;
根据所述目标通道切换实现过程,将所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上。
4.根据权利要求2所述的基于BMC的设备监控方法,其特征在于,在所述通过与所述当前逻辑标识对应的目标线程对所述目标通道上的待监控设备进行监控、获取监控信息之前,还包括:
获取所述目标通道上与所述当前逻辑标识对应的待监控设备的设备类型;
依据所述设备类型及预先建立的设备类型与监控信息标识的对应关系,确定出对应的各个目标监控信息标识。
5.根据权利要求4所述的基于BMC的设备监控方法,其特征在于,所述通过与所述当前逻辑标识对应的目标线程对所述目标通道上的待监控设备进行监控、获取监控信息的过程为:
预先建立与每个设备类型对应的动态链接库,所述动态链接库包括监控交互协议及信息表,所述信息表为基于监控信息标识及对应的信息获取函数建立的;
采用与所述当前逻辑标识对应的目标线程、依据所述设备类型从各个所述动态链接库中匹配出目标动态链接库;
根据各个所述目标监控信息标识从所述目标动态链接库中,确定出与每个所述目标监控信息标识各自对应的目标信息获取函数;
通过各个所述目标信息获取函数获取所述待监控设备的各个监控信息。
6.根据权利要求4所述的基于BMC的设备监控方法,其特征在于,所述获取所述目标通道上与所述当前逻辑标识对应的待监控设备的设备类型的过程为:
接收BIOS发送的、与所述目标通道及所述当前逻辑标识对应的待监控设备的设备信息,以及获取BMC扫描得到的设备地址信息和设备标识信息;
根据所述设备信息、所述设备地址信息和所述设备标识信息确定出所述待监控设备的设备类型。
7.一种基于BMC的设备监控装置,其特征在于,包括:
第一建立模块,用于预先为硬件服务器的i2c总线的每个线程分配一个逻辑标识,并建立与所述硬件服务器的i2c总线使用信息及扩展信息对应的i2c拓扑关系,其中,一个线程对应监控一个待监控设备;若存在新增的待监控设备,增加与所述新增的待监控设备对应的线程,并为所述与所述新增的待监控设备对应的线程分配一个逻辑标识,并建立与所述硬件服务器的i2c总线使用信息及扩展信息对应的i2c拓扑关系;
确定模块,用于根据当前硬件服务器及当前逻辑标识确定出目标i2c总线及目标i2c拓扑关系;
切换模块,用于依据所述目标i2c拓扑关系控制所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上;
监控模块,用于通过与所述当前逻辑标识对应的目标线程对所述目标通道上的待监控设备进行监控、获取监控信息。
8.根据权利要求7所述的基于BMC的设备监控装置,其特征在于,还包括:
第二建立模块,用于预先基于所述i2c拓扑关系建立与每个所述逻辑标识各自对应的通道切换实现过程,所述通道切换实现过程用于将所述目标i2c总线切换至对应的通道上;
则,所述切换模块包括:
获取单元,用于根据目标i2c拓扑关系获取各个逻辑标识,以及与每个所述逻辑标识各自对应的通道切换实现过程;
确定单元,用于依据当前逻辑标识从与每个所述逻辑标识各自对应的通道切换实现过程中,确定出与所述当前逻辑标识对应的目标通道切换实现过程;
切换单元,用于根据所述目标通道切换实现过程,将所述目标i2c总线切换至与所述当前逻辑标识对应的目标通道上。
9.一种基于BMC的设备监控系统,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述基于BMC的设备监控方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于BMC的设备监控方法的步骤。
CN202110454434.9A 2021-04-26 2021-04-26 一种基于bmc的设备监控方法、装置、系统及存储介质 Active CN113127308B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110454434.9A CN113127308B (zh) 2021-04-26 2021-04-26 一种基于bmc的设备监控方法、装置、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110454434.9A CN113127308B (zh) 2021-04-26 2021-04-26 一种基于bmc的设备监控方法、装置、系统及存储介质

Publications (2)

Publication Number Publication Date
CN113127308A CN113127308A (zh) 2021-07-16
CN113127308B true CN113127308B (zh) 2022-11-11

Family

ID=76780023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110454434.9A Active CN113127308B (zh) 2021-04-26 2021-04-26 一种基于bmc的设备监控方法、装置、系统及存储介质

Country Status (1)

Country Link
CN (1) CN113127308B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484250B (zh) * 2014-11-28 2018-04-27 英业达科技有限公司 快速通道互联总线的压力测试方法和压力测试装置
CN106506256B (zh) * 2016-09-28 2019-04-09 中国电子科技集团公司第五十四研究所 一种基于平台+插件的设备监控系统及方法
CN108170579A (zh) * 2018-01-24 2018-06-15 郑州云海信息技术有限公司 Rack机柜服务器的电源监控方法、装置及存储介质
CN108614759A (zh) * 2018-04-28 2018-10-02 云宏信息科技股份有限公司 对物理机硬件进行监控的方法及装置
CN112035239A (zh) * 2020-09-25 2020-12-04 深圳云天励飞技术股份有限公司 任务调度方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
CN113127308A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN108810100B (zh) 一种主节点的选举方法、装置及设备
CN111752776B (zh) 一种服务器的循环上下电测试方法和系统
US9842003B2 (en) Master baseboard management controller election and replacement sub-system enabling decentralized resource management control
US10333771B2 (en) Diagnostic monitoring techniques for server systems
US20130110926A1 (en) Method for Controlling Rack System
US10846186B2 (en) Central processing unit CPU hot-remove method and apparatus, and central processing unit CPU hot-add method and apparatus
CN106888100B (zh) 以太网供电交换机及其供电方法
US20170235519A1 (en) Device Management Method, Device, and Device Management Controller
US8533300B2 (en) Storage device, controller, and address management method
CN111352779A (zh) 一种moc卡的ac电源的开关机测试方法及相关组件
CN115904520B (zh) 基于pcie拓扑状态变更的配置保存方法及相关设备
CN111176952A (zh) 一种i2c通道的监测方法、监测系统及相关装置
CN105549696B (zh) 具有机箱管理功能的机架式服务器系统
CN113127308B (zh) 一种基于bmc的设备监控方法、装置、系统及存储介质
CN114168071B (zh) 一种分布式集群扩容方法、分布式集群扩容装置及介质
CN115113987A (zh) 一种非一致内存访问资源分配方法、装置、设备及介质
CN104780062A (zh) 一种快速获取bmc管理网口ip地址的方法
US20240107647A1 (en) Control method, control device and lighting system
CN115543872A (zh) 一种设备管理方法、装置及计算机存储介质
CN112398738B (zh) 连接关系的获取方法及装置、设备、计算机可读存储介质
US9081614B2 (en) Managing shared resources in a multi-computer system with failover support
US20150006661A1 (en) Discovering devices in a network
CN114978871B (zh) 业务系统的节点切换方法及节点切换装置、电子设备
CN113239059B (zh) 一种分布式锁的切换方法、装置、服务器和存储介质
CN115643163A (zh) 故障设备定位方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant