CN115904888A - 一种告警方法、计算设备及存储介质 - Google Patents
一种告警方法、计算设备及存储介质 Download PDFInfo
- Publication number
- CN115904888A CN115904888A CN202211183373.8A CN202211183373A CN115904888A CN 115904888 A CN115904888 A CN 115904888A CN 202211183373 A CN202211183373 A CN 202211183373A CN 115904888 A CN115904888 A CN 115904888A
- Authority
- CN
- China
- Prior art keywords
- management unit
- alarm
- interrupt
- alarm information
- protocol interface
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 112
- 230000002159 abnormal effect Effects 0.000 claims abstract description 13
- 230000008030 elimination Effects 0.000 claims description 34
- 238000003379 elimination reaction Methods 0.000 claims description 34
- 230000004044 response Effects 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 9
- 230000000977 initiatory effect Effects 0.000 claims description 7
- 230000002093 peripheral effect Effects 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 abstract description 29
- 230000005856 abnormality Effects 0.000 abstract description 24
- 238000004891 communication Methods 0.000 abstract description 12
- 238000007726 management method Methods 0.000 description 143
- 230000006870 function Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 3
- 101000741965 Homo sapiens Inactive tyrosine-protein kinase PRAG1 Proteins 0.000 description 2
- 102100038659 Inactive tyrosine-protein kinase PRAG1 Human genes 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/20—Handling requests for interconnection or transfer for access to input/output bus
- G06F13/24—Handling requests for interconnection or transfer for access to input/output bus using interrupt
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/42—Bus transfer protocol, e.g. handshake; Synchronisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请公开了一种告警方法、计算设备及存储介质,涉及通信领域。该方法包括:当PCIE设备发生异常时,该PCIE设备生成告警信息,并向设备管理单元发送告警信息。后续,设备管理单元可以通过输出设备输出该告警信息,以提示运维人员,PCIE设备发生异常,从而提高PCIE设备的运维效率。其中,该PCIE设备可以通过I3C协议接口向设备管理单元发送告警信息。该告警信息可以包括异常发生的原因、异常的严重程度、异常发生的位置和/或异常发生的时间等。
Description
技术领域
本申请涉及通信领域,尤其涉及一种告警方法、计算设备及存储介质。
背景技术
快速外设组件互连(peripheral component interconnect express,PCIE)设备(例如网卡、显卡等设备)作为计算设备的外设设备,可以实现网络连接、图像处理等功能。随着技术的发展,应用场景的多样化,PCIE设备的功能也越来越多,内部结构也越来越复杂,这导致PCIE设备出现问题的概率也变大。为及时获取并解决PCIE设备出现的问题,计算设备需要对PCIE设备进行监控管理。
传统技术中,当PCIE设备在运行过程中出现异常时,通常会在日志中记录事件,例如当前温度60℃。运维人员只能通过设备管理单元主动查询PCIE设备的当前工作状态或日志,例如:依次查询PCIE设备的传感器参数来获取PCIE设备的当前工作状态或日志,并基于所查询到的当前工作状态或日志,确定PCIE设备发生异常。该方法效率低下,耗费大量人力资源,对PCIE设备的运维带来极大的不便。
发明内容
本申请提供了一种告警方法、计算设备及存储介质,能够生成告警信息并向设备管理单元上报,提高PCIE设备的运维效率。
为实现上述技术目的,本申请采用如下技术方案:
第一方面,本申请提供了一种告警方法,应用于PCIE设备,PCIE设备通过I3C协议接口与设备管理单元连接,方法包括:当PCIE设备发生异常时,生成告警信息;通过I3C协议接口向设备管理单元发送告警信息。
可以理解的是,PCIE设备在发生异常时自动生成告警信息,并发送给设备管理单元,便于运维人员通过设备管理单元及时获取告警信息,展开相关处理工作,该方法相比传统技术中运维人员只能通过设备管理单元查看PCIE设备的当前工作状态或日志,从而确定PCIE设备发生异常的方法而言,能够提高PCIE设备运维效率,减少人力资源的浪费。另外,该方法中,PCIE设备通过I3C协议接口向设备管理单元发送告警信息,由于I3C协议支持从节点向主节点发送数据,且该协议可以直接复用I2C协议接口的物理通道,实现成本低,因此可以优先选择I3C协议接口向设备管理单元发送告警信息的方法。同时,I3C协议接口相比I2C协议接口带宽更大,因此,通过I3C协议接口通信,可以提高传输告警信息的速率。
在另一种可能的实现方式中,上述PCIE设备还可以通过其他协议接口向设备管理单元发送告警信息,例如:PLDM over MCTP over SMBus。
在另一种可能的实现方式中,在通过I3C协议接口向设备管理单元发送告警信息之前,方法还包括:通过I3C协议接口向设备管理单元发起第一中断请求;接收设备管理单元针对第一中断请求的第一响应消息。
在另一种可能的实现方式中,上述通过I3C协议接口向设备管理单元发送告警信息,包括:在接收到第一响应消息后,通过I3C协议接口向设备管理单元发送第一中断数据内容,第一中断数据内容包括告警信息。
可以理解的是,在传统技术中,PCIE设备中没有设置向设备管理单元直接发送告警信息的接口,无法直接向设备管理单元发送告警信息,而I3C协议的中断操作中支持从节点主动向主节点发送数据,且该协议可以直接复用I2C协议接口的物理通道,实现成本低,因此本申请实施例中选择I3C中断操作命令的方式,使得PCIE设备主动向设备管理单元发送告警信息,提高了运维效率。
在另一种可能的实现方式中,在接收到第一响应消息后,且在发送告警信息之前,方法还包括:通过I3C协议接口向设备管理单元发送第一预设的中断组号和第一预设的中断号;第一预设的中断组号和第一预设的中断号用于指示第一中断数据内容为告警信息。
可以理解的是,I3C协议规范中保留了中断组号和中断号用于扩展功能,本申请实施例中通过设置第一预设的中断组号和第一预设的中断号来指示第一中断数据内容,使得设备管理单元识别和处理告警信息。该方法中使用I3C协议规范中保留的中断组号和中断号进行功能扩展来实现指示告警信息的功能,成本较低,实现难度较小。
在另一种可能的实现方式中,方法还包括:当异常恢复正常后,生成告警消除信息;通过I3C协议接口向设备管理单元发送告警消除信息。
可以理解的是,告警消除信息是与告警信息对应的信息,该信息用于及时提醒运维人员异常已经恢复正常,减少运维人员的维护成本。
在另一种可能的实现方式中,在通过I3C协议接口向设备管理单元发送告警消除信息之前,方法还包括:通过I3C协议接口向设备管理单元发起第二中断请求;接收设备管理单元针对第二中断请求的第二响应消息。
在另一种可能的实现方式中,上述通过I3C协议接口向设备管理单元发送告警消除信息,包括:在接收到第二响应消息后,通过I3C协议接口向设备管理单元发送第二中断数据内容,第二中断数据内容包括告警消除信息。
可以理解的是,I3C协议接口支持通过中断操作的方式,使得PCIE设备可以将告警消除信息发送至设备管理单元,提升PCIE设备的运维效率,降低运维成本。
在另一种可能的实现方式中,在接收到第二响应消息后,且在发送告警消除信息之前,方法还包括:通过I3C协议接口向设备管理单元发送第二预设的中断组号和第二预设的中断号;第二预设的中断组号和第二预设的中断号用于指示第二中断数据内容为告警消除信息。
可以理解的是,I3C协议规范中保留了中断组号和中断号用于扩展功能,本申请实施例中通过设置第二预设的中断组号和第二预设的中断号来指示第二中断数据内容,使得设备管理单元识别和处理告警消除信息。该方法中使用I3C协议规范中保留的中断组号和中断号进行功能扩展来实现指示告警信息的功能,成本较低,实现难度较小。
在另一种可能的实现方式中,上述通过I3C协议接口向设备管理单元发送告警信息,包括:响应设备管理单元发送的读操作命令,如果确定存在告警信息,则通过I3C协议接口向设备管理单元发送第一数据内容;其中,第一数据内容包括告警信息;读操作命令用于查询告警信息。
可以理解的是,由于I3C协议规范中的读操作命令支持主节点读取从节点数据的功能,因此,本申请中设备管理单元向PCIE设备发起读操作命令,用以读取告警信息,该方法解决了传统技术中只能通过人工操作获取PCIE设备告警信息的问题,减少人力资源,提高运维效率。同时,该方法在I2C协议物理通道的基础上使用I3C协议,并对其进行功能扩展,软件实现难度较小,成本较低。
在另一种可能的实现方式中,上述方法还包括:响应设备管理单元发送的读操作命令,如果确定不存在告警信息,则通过I3C协议接口向设备管理单元发送第二数据内容;其中,第二数据内容包括的内容用于表征不存在告警信息。
可以理解的是,PCIE设备向设备管理单元发送第二数据内容用以表征不存在告警信息,使得设备管理单元及时感知PCIE设备的状态,提高PCIE设备的运维效率。
在另一种可能的实现方式中,上述读操作命令中包括预设命令字;预设命令字用于指示读操作命令中读取的数据内容为告警信息。
可以理解的是,I3C协议规范的读操作命令中保留的命令字,用于扩展功能,本申请实施例中通过设置预设命令字来指示I3C读操作命令中的数据内容,使得设备管理单元识别和处理告警信息。该方法中使用I3C协议规范中保留的命令字进行功能扩展来实现指示读取告警信息的功能,成本较低,实现难度较小。
在另一种可能的实现方式中,I3C协议接口与I2C协议接口共用物理通道。
可以理解的是,本申请实施例在I2C物理通道的基础上采用I3C协议,以最小的改进方式实现告警信息上报功能,降低实现成本,提高可行性。
在另一种可能的实现方式中,告警信息包括:异常发生的原因、异常的严重程度、异常发生的位置和/或异常发生的时间。
可以理解的是,在告警信息中设置异常发生的原因、异常的严重程度、异常发生的位置和/或异常发生的时间,有利于运维人员直接感知产生告警的异常的严重程度、其发生的原因、位置和/或时间,及时采取对应处理措施。
第二方面,本申请实施例提供了一种告警方法,应用于设备管理单元,方法包括:接收PCIE设备发送的告警信息。
在一种可能的实现方式中,在接收PCIE设备发送的告警信息之前,上述方法还包括:向PCIE设备发送读操作命令,读操作命令用于查询告警信息。
在另一种可能的实现方式中,上述向PCIE设备发送读操作命令包括:每隔预设时间段,通过I3C协议接口向PCIE设备发送读操作命令。
在另一种可能的实现方式中,上述接收PCIE设备发送的告警信息包括:通过I3C协议接口接收PCIE设备发送的第一中断数据内容,第一中断数据内容包括告警信息。
在另一种可能的实现方式中,上述接收PCIE设备发送的告警信息包括:通过I3C协议接口接收PCIE设备发送的第二中断数据内容,第二中断数据内容包括告警消除信息。
在另一种可能的实现方式中,上述接收PCIE设备发送的告警信息包括:通过I3C协议接口接收PCIE设备发送的第一数据内容,第一数据内容包括告警信息。
在另一种可能的实现方式中,上述接收PCIE设备发送的告警信息包括:通过I3C协议接口接收PCIE设备发送的第二数据内容,第二数据内容包括的内容用于表征不存在告警信息。
上述第二方面及其各种实现方式的具体描述,可以参考第一方面及其各种实现方式中的详细描述。
第三方面,本申请实施例提供一种计算设备,包括PCIE设备和设备管理单元,其中PCIE设备应用于第一方面或第一方面中任一种可能的实现方式的告警方法的各个模块;其中设备管理单元应用于第二方面或第二方面中任一种可能的实现方式的告警方法的各个模块。
第四方面,本申请实施例提供一种告警装置,包括存储器和处理器。存储器和处理器耦合;存储器用于存储计算机程序代码,计算机程序代码包括计算机指令。当处理器执行该计算机指令时,使得该告警装置执行如第一方面及其任一种可能的实现方式的告警方法;或者,当处理器执行该计算机指令时,使得该告警装置执行如第二方面及其任一种可能的实现方式的告警方法。
第五方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质包括计算机指令。其中,当计算机指令在告警装置上运行时,使得该告警装置执行如第一方面及其任一种可能的实现方式的告警方法;或者,当计算机指令在告警装置上运行时,使得该告警装置执行如第二方面及其任一种可能的实现方式的告警方法。
第六方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机指令。其中,当计算机指令在告警装置上运行时,使得该告警装置执行如第一方面及其任一种可能的实现方式的告警方法;或者,当计算机指令在告警装置上运行时,使得该告警装置执行如第二方面及其任一种可能的实现方式的告警方法。
本申请中第三方面到第六方面的告警装置在执行如第一方面及其任一种可能的实现方式的告警方法时,可以是PCIE设备;本申请中第三方面到第六方面的告警装置在执行如第一方面及其任一种可能的实现方式的告警方法时,可以是设备管理装置。
本申请中第三方面到第六方面及其各种实现方式的具体描述,可以参考第一方面或第二方面及其各种实现方式中的详细描述;并且,第三方面到第六方面及其各种实现方式的有益效果,可以参考第一方面或第二方面及其各种实现方式中的有益效果分析,此处不再赘述。
本申请的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
图1为本申请实施例提供的一种I3C中断操作命令时序图;
图2为本申请实施例提供的一种I3C读操作命令时序图;
图3为本申请实施例提供的一种计算设备的示意图;
图4为本申请实施例提供的另一种计算设备的示意图;
图5为本申请实施例提供的一种告警方法的流程图;
图6为本申请实施例提供的一种告警信息格式示意图;
图7为本申请实施例提供的另一种告警方法的流程图;
图8为本申请实施例提供的一种数据格式示意图;
图9为本申请实施例提供的一种设备管理单元启动I3C中断操作命令时序图;
图10为本申请实施例提供的另一种告警方法的流程图;
图11为本申请实施例提供的另一种I3C读操作命令时序图;
图12为本申请实施例提供的另一种I3C读操作命令时序图;
图13为本申请实施例提供的一种PCIE设备的结构示意图;
图14为本申请实施例提供的一种设备管理单元的结构示意图。
具体实施方式
为了方便理解,以下先对本申请实施例中涉及的相关术语进行简单介绍:
(1)管理组件传输协议(management component transport protocol,MCTP):它是一个管理协议框架,下层支持承载的物理接口支持PCIE、系统管理总线(systemmanagement bus,SMBus)、通用异步收发器(universal asynchronous receivertransmitter,UART)和通用串行总线(universal serial bus,USB)等。
(2)平台级数据模型(platform level data model,PLDM),PLDM可以通过MCTP来承载,即PLDM over MCTP。PCIE规范定义,PCIE设备与计算设备的接口主要是PCIE和SMBus。因此,可以使用的协议接口为PLDM over MCTP over PCIE或PLDM over MCTP over SMBus。
(3)集成电路总线(inter-integrated circuit,I2C),两线制同步串行总线,主从通信机制,使用串行时钟线(serial clock line,SCL)和数据信号线(serial data,SDA)进行通信,支持多个节点共总线连接,通过物理地址区分节点。
(4)改进型集成电路总线(improved inter integrated circuit,I3C),是I2C的改进型,物理形态与I2C一致,使用SCL和SDA进行通信,可向下兼容I2C协议。相对于I2C,I3C数据速率大幅度提升,支持动态地址分配以支持多个相同物理地址的节点共总线连接,支持中断机制以支持从节点主动向主节点发送数据。I3C协议规范中定义了中断操作、读操作、写操作,其中,执行中断操作命令时序图如图1所示,执行读操作命令时序图如图2所示。
请参考图1,图1示出I3C中断操作命令时序图。本申请实施例中,主节点对应设备管理单元,从节点对应PCIE设备。
S:起始位,Start,表示命令时序启动。
Target Address:PCIE设备的I3C物理地址,7bit。
R/W:读/写位,0x1表示读,0x0表示写。此处为R,表示读。
A:确认位,0x0表示确认,即ACK,Acknowledge,0x1表示否定确认,即NACK,Negative-Acknowledge。
“Target MDB”字段表示I3C中断操作中的必须数据字节,用于PCIE设备向设备管理单元传送中断组号和中断号,不同的中断组号和中断号表示不同的中断类型和内容。I3C规范中定义了一些保留的中断组号和保留的中断号,保留的中断组号取值3’b000,保留的中断号取值5’h00-5’h1f,即5’00000-5’11111。该保留的中断组号和中断号可用于扩展功能使用。
T:Transition位,转换位,读操作中使用。T为1表示后续还有数据,T为0表示后续没有数据,可以停止读取数据。
Target IBI Data1-Target IBI DataN:I3C中断数据内容,即I3C中断操作时PCIE设备向设备管理单元传送的数据内容。
P:停止位,Stop,表示命令时序结束,结束通信。
请参考图2,图2示出I3C读操作命令时序图。本申请实施例中,主节点对应设备管理单元,从节点对应PCIE设备。
S:起始位,Start,表示命令时序启动。
I3C Reserved Address:广播地址,按照I3C规范定义取值7’h7E。
R/W:读/写位,0x1表示读,0x0表示写。
A:确认位,0x0表示确认,即ACK,Acknowledge,0x1表示否定确认,即NACK,Negative-Acknowledge。
I3C Directed CCC:I3C直接通信(点对点)的公共命令字(common commandcodes,CCC),按照规范定义,使用不同的命令字表示不同的功能。规范中定义了一些保留命令字,取值范围0xE0-0xFE,作为厂家扩展(vendor extension)使用。
Par:Parity位,奇偶校验位,写操作中使用。
Sr:重复起始位,repeated Start,表示命令时序重新启动。在I2C/I3C的一个命令时序(从Start到Stop的过程)中,会分为多个阶段,每个阶段的开始都会使用Sr来表示重新启动。
Target Address:表示PCIE设备的I3C地址。
Data1-DataN:I3C传送的数据内容(payload),以字节为单位传送。
P:停止位,Stop,表示命令时序结束。
(5)带外和带内:本申请实施例中所述的带外通信,指通过PCIE设备的带外接口协议实现的通信。“带外”是相对于业务接口PCIE(一般称为“带内”)的描述,即不使用原生的PCIE通信方式,例如访问PCIE设备的PCIE配置空间。带外接口协议包括但不限于SMBus(I2C)、I3C、NC-SI(over RBT)等。
(6)术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
随着技术的发展,应用场景的多样化,PCIE设备的功能也越来越多,内部结构也越来越复杂,这导致PCIE设备出现问题的概率也变大。为及时获取并解决PCIE设备出现的问题,计算设备需要对PCIE设备进行监控管理。传统技术中,当PCIE设备在运行过程中出现问题时,通常只会在日志中记录事件,例如温度阈值50℃,当前温度60℃。运维人员只能通过设备管理单元主动查询PCIE设备的当前工作状态或日志,并基于所查询到的当前工作状态或日志,例如:依次查询PCIE设备的传感器参数来获取PCIE设备的当前工作状态或日志,确定PCIE设备发生异常。该方法效率低下,耗费大量人力资源,对PCIE设备的运维带来极大的不便。
基于此,本申请实施例提供了一种告警方法,该方法应用于PCIE设备,该方法中PCIE设备在发生异常时,生成告警信息,并向设备管理单元发送告警信息。可以理解的是,该方法中,PCIE设备在发生异常时可以直接生成告警信息,并发送给设备管理单元,便于运维人员及时获取告警信息,展开相关处理工作,该方法相比传统技术中运维人员只能通过设备管理单元查看PCIE设备的当前工作状态或日志的方法而言,能够提高PCIE设备运维效率,减少人力资源的浪费。
下面将结合附图对本申请实施例的实施方式进行详细描述。
请参考图3,其示出本申请实施例提供的一种计算设备100的示意图。如图3所示,该实施环境可以包括:设备管理单元110和PCIE设备120。
设备管理单元110,在计算设备100里执行部件管理、资产管理功能,例如上下电控制、风扇调速、电子标签管理等。计算设备100可以是如服务器、平板电脑、桌面型、膝上型、笔记本电脑和上网本等设备。在本申请实施例中,该设备管理单元110用于获取PCIE设备120的告警信息。
不同的计算设备厂家对设备管理单元有不同的称呼,例如在超聚变服务器中称为基板管理控制器(baseboard management controller,BMC),HPE服务器中称为远程管理端口(integrated ligths-out,iLO),DELL服务器中称为集成戴尔远程控制卡(integrateddell remote access controller,iDRAC)。
PCIE设备120,计算设备中支持PCIE接口的设备可以称为PCIE设备。本申请实施例中,PCIE设备120在运行过程中发生异常时,生成告警信息,并向设备管理单元发送告警信息。
示例性的,PCIE设备120可以是网卡、显卡、声卡、视频采集卡及固态硬盘等设备。
在一个示例中,设备管理单元110与PCIE设备120通过I3C连接,其通信协议为I3C协议。
可选的,如图4所示,计算设备还包括中央处理器(central processing unit,CPU)130,该CPU可以为单核CPU(single-CPU)或多核CPU(multi-CPU)。CPU作为计算设备的运算和控制核心,是信息处理、程序运行的最终执行单元。CPU130与PCIE设备通过PCIE接口通信,传输业务数据。
在一个示例中,如图4所示,计算设备还包括输出设备140,输出设备140用于输出设备管理单元110发送的告警信息,使得运维人员及时得知该告警信息。示例性的,输出设备140可以是声光报警器、联动触发器、显示屏等。
在另一个示例中,计算设备与输出设备140连接。输出设备140用于输出设备管理单元110发送的告警信息,使得运维人员及时得知该告警信息。该情况下,输出设备140可以是手机、平板电脑、桌面型、膝上型、笔记本电脑和上网本等终端设备。
可选的,计算设备100中还可以包括存储器和网络接口。
存储器包括但不限于是随机存取存储器(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmable read-only memory,EPROM)、快闪存储器、或光存储器等。
网络接口,网络接口包括多个物理端口,用于与其他设备或通信网络通信,可以是有线接口(端口),例如光纤分布式数据接口(fiber distributed data interface,FDDI)、千兆以太网接口(gigabit ethernet,GE)。或者,网络接口是无线接口。
上述设备管理单元110、PCIE设备120、CPU130和输出设备140的数量分别可以是一个或多个,本申请实施例对此不做限定。
下文对本申请实施例提供的告警方法进行说明:
请参考图5,为本申请实施例提供的一种告警方法的流程图,如图5所示,该方法可以包括S101-S106。
S101:当PCIE设备发生异常时,该PCIE设备生成告警信息。
PCIE设备发生异常,包括:温度异常(如温度超过阈值),端口异常(如端口异常关闭),缓存异常(如缓存溢出)。
在一个示例中,PCIE设备的温度阈值设为50℃,若PCIE设备检测到PCIE设备的当前温度超过50℃时,PCIE设备对于该温度异常生成告警信息。
本申请实施例对告警信息的格式和其中包括的具体内容和不做限定。可选的,如图6所示,告警信息包括头部区域、数据区域及校验和区域。
头部区域包括但不限于告警号(Alarm ID)、告警码(Alarm Code)、状态(Status)、级别(异常的严重程度)(Level)、长度(Length)、下一条标志(Next)和校验和(Checksum)等。告警号(Alarm ID)是顺序号,可以从“1”开始递增。告警码(Alarm Code)是该条告警的标识。状态(Status)用于指示该告警信息为产生告警。级别(异常的严重程度)(Level)可以分为致命、严重、一般。长度(Length)指告警数据区域的长度。下一条标志(Next)表示是否还有下一条告警,例如取“1”值表示还有下一条告警信息,而“0”值表示没有更多告警了。
数据区域是告警信息的具体内容(Alarm Description),其中描述了异常发生的原因、异常发生的时间、发生异常的模块和告警内容的详细描述等。
在一个示例中,数据区域包括的内容为,异常发生的时间:xxxx年xx月xx日,xx时xx分xx秒,发生异常的模块:温度传感器,告警内容的详细描述包括:当前温度60℃,阈值温度50℃,超过阈值10℃。
校验和区域(Checksum)是对所有告警信息(一条或者多条)的校验和,算法可以是零和校验或者是其它算法,本申请实施例对此不做限定。
S102:PCIE设备向设备管理单元发送告警信息。
可选的,PCIE设备通过I3C协议接口与设备管理单元连接,通过I3C协议接口向设备管理单元发送告警信息。
可选的,上述I3C协议接口与I2C协议接口共用物理通道。
上述PCIE设备向设备管理单元发送告警信息的方式可以有多种,其中,通过I3C协议接口向设备管理单元发送告警信息的方法中,由于I3C协议支持从节点向主节点发送数据,且该协议可以直接复用I2C协议接口的物理通道,实现成本低,因此可以优先选择I3C协议接口向设备管理单元发送告警信息的方法。
S103(可选的):设备管理单元通过输出设备输出告警信息。
可选的,设备管理单元接收到告警信息后,还可以由运维人员主动查询设备管理单元中接收的告警信息。本申请实施例对于如何查看告警信息的方式不做限定。
上述设备管理单元将告警信息通过输出设备输出后,运维人员可以及时感知PCIE设备的异常,了解异常发生的位置、严重程度等,并根据需要及时采取相关措施,提高运维效率。
S104:当PCIE设备的异常恢复正常后,生成告警消除信息。
S105:PCIE设备向设备管理单元发送告警消除信息。
具体的,PCIE设备通过I3C协议接口与设备管理单元连接,通过I3C协议接口向设备管理单元发送告警消除信息。
由于告警消除信息是与告警信息一一对应的信息,因此,告警消除信息中至少包括告警信息中的告警号、告警码等告警的标识相关的信息,另外,告警消除信息的状态为消除告警。
告警消除信息包括的内容中,状态一项设置为消除告警,其余内容均可以与对应的告警信息一致。
S106(可选的):设备管理单元通过输出设备输出告警消除信息。
可选的,设备管理单元接收到告警消除信息后,还可以由运维人员主动查询寻设备管理单元中接收的告警消除信息。本申请实施例对于如何查看告警消除信息的方式不做限定。
告警消除信息是与告警信息对应的信息,通过输出设备输出告警消除信息,可以及时提醒运维人员异常已经恢复正常,减少运维人员的维护成本。
上述S101-S106是本申请实施例提供的一种告警方法,以下提出两种具体可能的实现方式,包括S201-S212和S301-S306。
请参考图7,图7为本申请实施例提供的一种告警方法的具体实现方式,包括S201-S212。
S201:当PCIE设备发生异常时,生成告警信息。
请参考S101中相关描述。
S202:PCIE设备通过I3C协议接口向设备管理单元发起第一中断请求。
第一中断请求用于通知设备管理单元准备接收告警信息。
PCIE设备向设备管理单元发起第一中断请求的触发条件有多种,在一个示例中,PCIE设备可以在生成告警信息后,触发向设备管理单元发起第一中断请求。在另一个示例中,当PCIE设备生成的告警信息的级别为一般时,不触发向设备管理单元发起第一中断请求,当PCIE设备生成的告警信息的级别为致命或严重时,触发向设备管理单元发起第一中断请求,后续,PCIE设备向设备管理单元发送的第一中断数据内容中包含所有的告警信息。
本申请实施例对PCIE设备何时触发发起第一中断请求方式不做限定。
S203:设备管理单元接收到第一中断请求后,响应第一中断请求,发送第一响应消息。
设备管理单元发送第一响应消息对应图1中的S,即设备管理单元启动中断操作时序。
S204:PCIE设备在接收到第一响应消息后,通过I3C协议接口向设备管理单元发送第一预设的中断组号和第一预设的中断号。第一预设的中断组号和第一预设的中断号用于指示第一中断数据内容为告警信息。
第一预设的中断组号和第一预设的中断号对应图1中的Target MDB,第一中断数据内容对应图1中的Target IBI Data1-Target IBI DataN内容。
在一个示例中,在I3C协议规范中中断操作命令定义了一些保留的中断组号和保留的中断号,保留的中断组号取值3’b000,保留的中断号取值5’h00-5’h1F。
在一个示例中,如图8所示,图8示出Target MDB字段的数据格式示意图。TargetMDB由中断组号和中断号组成。在本申请实施例中,Target MDB取值0x0F,用0x0F代表Alarm,即,0x0F表示后续发送的中断数据为告警信息。上述第一预设的中断组号取值3’b000,第一中断号取值5’h0F仅为示例,实际上,第一中断号可以取5’h00-5’h1F范围中任意值用以代表Alarm。
上述Target MDB字段使用了I3C协议规范中保留的字段作为传送告警信息的标识。本申请实施例通过对I3C协议规范中的中断操作命令进行扩展,来实现设备管理单元识别和处理告警信息的功能。
上述方法中通过保留的中断组号和中断号来指示中断数据的内容为告警信息,该方法仅为一种实现方式,实际实现时还可以有其他实现方式,例如:对I3C协议进行改造,设置新的字段来指示中断数据的内容为告警信息。本申请实施例对此不做限定。
本申请实施例中对I3C协议规范中保留的字段进行扩展是一种较容易实现的方式,且该方式实现成本较低。
S205:PCIE设备通过I3C协议接口向设备管理单元发送第一中断数据内容,第一中断数据内容包括告警信息。
第一中断数据内容是I3C中断操作命令中的中断数据内容,对应图1中的TargetIBI Data1-Target IBI DataN内容,即,Target IBI Data1-Target IBI DataN具体内容为告警信息。
S206(可选的):设备管理单元通过输出设备输出告警信息。
请参考S103中相关描述。
在一个示例中,如图9所示,图9示出一种设备管理单元启动I3C中断操作时中断操作命令时序图。
从图9的命令时序图中可以看出,在本申请实施例中,R为1,A为0,Target MDB取值为0x0F,0x0F表征Alarm,Target IBI Data1-Target IBI DataN处的数据内容为告警信息。T为1时表明还有下一个字节需要传送,T为0表明后续没有字节。
S207:当PCIE设备异常恢复正常后,生成告警消除信息。
告警消除信息是与告警信息对应的信息,该信息用于及时提醒运维人员异常已经恢复正常,减少运维人员的维护成本。
S208:PCIE设备通过I3C协议接口向设备管理单元发起第二中断请求。
S209:设备管理单元接收到中断请求后,响应中断请求,发送第二响应消息。
设备管理单元发送第二响应消息响应中断请求的具体表现为启动I3C中断操作命令。
S210:PCIE设备在接收到第二响应消息后,通过I3C协议接口向设备管理单元发送第二预设的中断组号和第二预设的中断号。
第二预设的中断组号和第二预设的中断号用于指示第二中断数据内容为告警消除信息。
第二预设的中断组号和第二预设的中断号对应图1中的Target MDB,第二中断数据内容对应图1中的Target IBI Data1-Target IBI DataN内容。
第二预设的中断组号和第二预设的中断号可以与第一预设的中断组号和第一预设的中断号一样,也可以不一样。
在本申请实施例中第一预设的中断组号和第一预设的中断号是与告警相关,第二预设的中断组号和第二预设的中断号是与消除告警相关,告警和消除告警的区别在于中断数据内容中包括的具体信息,因此第一预设的中断组号和第一预设的中断号可以与第二预设的中断组号和第二预设的中断号一样,均设置为0x0F,用以指示中断数据内容为告警信息,具体是生成告警还是消除告警,由中断数据内容决定。或者,第一预设的中断组号和第一预设的中断号可以与第二预设的中断组号和第二预设的中断号不一样,直接由中断组号和中断号对生成告警和消除告警进行区分。
本申请实施例对第一预设的中断组号和第一预设的中断号的取值与第二预设的中断组号和第二预设的中断号取值是否一样不做限定。
S211:PCIE设备通过I3C协议接口向设备管理单元发送第二中断数据内容,第二中断数据内容包括告警消除信息。
第二中断数据内容是I3C中断操作命令中的中断数据内容,对应图1中的TargetIBI Data1-Target IBI DataN内容,即,Target IBI Data1-Target IBI DataN具体内容为告警消除信息。
S212(可选的):设备管理单元通过输出设备输出告警消除信息。
请参考S106中相关描述。
S207-S212中相关内容详细描述请参考S201-S206。
在传统技术中,PCIE设备中没有设置向设备管理单元直接发送告警信息的接口,无法直接向设备管理单元发送告警信息,而I3C协议的中断操作中支持从节点主动向主节点发送数据,且该协议可以直接复用I2C协议接口的物理通道,实现成本低,因此本申请实施例中选择I3C中断操作命令的方式,使得PCIE设备主动向设备管理单元发送告警信息,提高了运维效率。
请参考图10,图10为本申请实施例提供的一种告警方法的具体实现方式,包括S301-S306。
S301:当PCIE设备发生异常时,生成告警信息。
请参考S101中相关描述。
S302:设备管理单元向PCIE设备发送读操作命令。其中,读操作命令用于查询PCIE设备的告警信息。
可选的,每隔预设时间段,设备管理单元通过I3C协议接口向PCIE设备发送查询告警信息的命令。
预设时间段是在设备管理单元中提前设置好的一个时间段,该时间段可以根据需要自行设置。
设备管理单元可以周期性的向PCIE设备发送读操作命令,也可以根据需要自行设置读操作命令的时间,本申请实施例对此不做限定。
设备管理单元发送的读操作命令中包括预设命令字,预设命令字用于指示读操作查询命令查询的数据内容为告警信息。
预设命令字对应图2中的I3C Directed CCC。
I3C Directed CCC表示公共命令字,I3C协议规范中读操作命令还定义了一些保留的命令字,保留的命令字取值范围为0xE0-0xFE,该保留命令字可作为扩展功能使用。因此,本申请实施例在保留的命令字中取一个作为预设的命令字,用于指示告警信息查询命令查询的数据内容为告警信息。
在一个示例中,预设命令字取值0xFA,用0xFA代表Get Alarm,即,0xFA表示告警信息查询。此处0xFA的取值仅为示例,实际上,预设命令字可以取0xE0-0xFE中任意值用以代表Get Alarm。
上述预设命令字为I3C协议规范中保留的命令字,用于扩展功能。本申请实施例中通过设置预设命令字来指示I3C读操作命令中的数据内容,使得设备管理单元识别和处理告警信息。该方法中使用I3C协议规范中的保留命令字作为功能扩展来实现指示读取告警信息的功能,成本较低,实现难度较小。
S303:PCIE设备响应设备管理单元发送的读操作命令,确定是否存在告警信息。
如果存在告警信息,执行S304;
如果不存在告警信息,执行S306。
S304:PCIE设备通过I3C协议接口向设备管理单元发送第一数据内容,第一数据内容包括告警信息。
第一数据内容是I3C读操作命令中的数据内容,对应图2中的Data1-DataN内容,即,Data1-DataN具体内容为告警信息。
在一个示例中,图11是设备管理单元启动的I3C读操作命令时序图,从图11可以看出,在本申请实施例中,W、A取值为0,R取值为1,Data1-DataN为告警信息,T为1时表明还有下一个字节需要传送,T为0表明后续没有字节。
S305(可选的):设备管理单元通过输出设备输出告警信息。
请参考S103中相关描述。
S305结束后,本流程结束。
S306:PCIE设备通过I3C协议接口向设备管理单元发送第二数据内容,第二数据内容包括的内容用于表征不存在告警信息。
第二数据内容是I3C读操作命令中的数据内容,对应图2中的Data1-DataN内容,即,Data1-DataN具体内容表征不存在告警信息。
在一个示例中,图12是设备管理单元启动的I3C读操作命令时序图,从图12可以看出,在本申请实施例中,W、A取值为0,R取值为1,Data1-DataN设置为0,0表示不存在告警信息,T为1时表明还有下一个字节需要传送,T为0表明后续没有字节。
本申请实施例中,由于I3C协议规范中的读操作命令支持主节点读取从节点数据的功能,因此,本申请中设备管理单元向PCIE设备发起读操作命令,用以读取告警信息,该方法解决了传统技术中只能通过人工操作获取PCIE设备告警信息的问题,减少人力资源,提高运维效率。同时,该方法在I2C协议物理通道的基础上使用I3C协议,并对其进行功能扩展,软件实现难度较小,成本较低。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术目标应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术目标可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例还提供一种PCIE设备200。如图13所示,为本申请实施例提供的一种PCIE设备200的结构示意图。
其中,PCIE设备200包括:生成单元201,用于当PCIE设备发生异常时,生成告警信息;发送单元202,用于向设备管理单元发送告警信息。例如,结合图5,生成单元201用于方法实施例中的S101,发送单元202用于方法实施例中的S102。
可选的,PCIE设备通过I3C协议接口与设备管理单元连接,发送单元202具体用于,通过I3C协议接口向设备管理单元发送告警信息。例如,结合图7,发送单元202用于方法实施例中的S205。
可选的,在通过I3C协议接口向设备管理单元发送告警信息之前,发送单元202还用于:通过I3C协议接口向设备管理单元发起第一中断请求;PCIE设备200还包括接收单元203,用于接收设备管理单元针对第一中断请求的第一响应消息。例如,结合图7,发送单元202用于方法实施例中的S202,接收单元203用于方法实施例中的S203。
可选的,发送单元202具体用于,在接收到第一响应消息后,通过I3C协议接口向设备管理单元发送第一中断数据内容,第一中断数据内容包括告警信息。例如,结合图7,发送单元202用于方法实施例中的S205。
可选的,在接收到第一响应消息后,且在发送告警信息之前,发送单元202还用于,通过I3C协议接口向设备管理单元发送第一预设的中断组号和第一预设的中断号;第一预设的中断组号和第一预设的中断号用于指示第一中断数据内容为告警信息。例如,结合图7,发送单元202用于方法实施例中的S204。
可选的,生成单元201还用于,当异常恢复正常后,生成告警消除信息;发送单元202还用于,通过I3C协议接口向设备管理单元发送告警消除信息。例如,结合图7,发送单元202用于方法实施例中的S211。
可选的,在通过I3C协议接口向设备管理单元发送告警消除信息之前,发送单元202还用于,通过I3C协议接口向设备管理单元发起第二中断请求;接收单元203还用于,接收设备管理单元针对第二中断请求的第二响应消息。例如,结合图7,发送单元202用于方法实施例中的S208,接收单元203用于方法实施例中的S209。
可选的,发送单元202具体用于,在接收到第二响应消息后,通过I3C协议接口向设备管理单元发送第二中断数据内容,第二中断数据内容包括告警消除信息。例如,结合图7,发送单元202用于方法实施例中的S211。
可选的,在接收到第二响应消息后,且在发送告警消除信息之前,发送单元202还用于,通过I3C协议接口向设备管理单元发送第二预设的中断组号和第二预设的中断号;第二预设的中断组号和第二预设的中断号用于指示第二中断数据内容为告警消除信息。例如,结合图7,发送单元202用于方法实施例中的S210。
可选的,发送单元202具体用于,响应设备管理单元发送的读操作命令,如果确定存在告警信息,则通过I3C协议接口向设备管理单元发送第一数据内容;其中,第一数据内容包括告警信息;读操作命令用于查询告警信息。例如,结合图10,发送单元202用于方法实施例中的S304。
可选的,发送单元202还用于,响应设备管理单元发送的读操作命令,如果确定不存在告警信息,则通过I3C协议接口向设备管理单元发送第二数据内容;其中,第二数据内容包括的内容用于表征不存在告警信息。例如,结合图10,发送单元202用于方法实施例中的S306。
可选的,读操作命令中包括预设命令字;预设命令字用于指示读操作命令中读取的数据内容为告警信息。
可选的,I3C协议接口与I2C协议接口共用物理通道。
可选的,告警信息包括:异常发生的原因、异常的严重程度、异常发生的位置和/或异常发生的时间。
当然,本申请实施例提供的PCIE设备200包括但不限于上述单元。
本申请实施例还提供一种设备管理单元300。如图14所示,为本申请实施例提供的一种设备管理单元300的结构示意图。
其中,设备管理单元300包括:接收单元301,用于接收PCIE设备发送的告警信息。
可选的,设备管理单元300还包括发送单元302,用于在接收PCIE设备发送的告警信息之前,向PCIE设备发送读操作命令,读操作命令用于查询告警信息。
可选的,发送单元302具体用于,每隔预设时间段,通过I3C协议接口向PCIE设备发送读操作命令。
可选的,接收单元301具体用于,通过I3C协议接口接收PCIE设备发送的第一中断数据内容,第一中断数据内容包括告警信息。
可选的,接收单元301具体用于,通过I3C协议接口接收PCIE设备发送的第二中断数据内容,第二中断数据内容包括告警消除信息。
可选的,接收单元301具体用于,通过I3C协议接口接收PCIE设备发送的第一数据内容,第一数据内容包括告警信息。
可选的,接收单元301具体用于,通过I3C协议接口接收PCIE设备发送的第二数据内容,第二数据内容包括的内容用于表征不存在告警信息。
当然,本申请实施例提供的设备管理单元300包括但不限于上述单元。
本申请另一实施例还提供一种告警装置,包括存储器和处理器。存储器和处理器耦合;存储器用于存储计算机程序代码,计算机程序代码包括计算机指令。其中,当处理器执行该计算机指令时,使得该告警装置执行上述方法实施例所示的告警方法的各个步骤。
本申请另一实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当计算机指令在告警装置上运行时,使得告警装置执行上述方法实施例所示的告警方法流程中告警装置执行的各个步骤。
在实际实现时,PCIE设备200中的生成单元201、发送单元202和接收单元203,以及设备管理单元300中的接收单元301和发送单元302可以由处理器执行存储器中的计算机程序代码来实现。其具体的执行过程可参考上述方法部分的描述,这里不再赘述。
本申请另一实施例还提供一种芯片系统,该芯片系统应用于告警装置。该芯片系统包括一个或多个接口电路,以及一个或多个处理器。接口电路和处理器通过线路互联。接口电路用于从告警装置的存储器接收信号,并向处理器发送信号,信号包括存储器中存储的计算机指令。当告警装置处理器执行计算机指令时,告警装置执行上述方法实施例所示的告警方法流程中告警装置执行的各个步骤。
在本申请另一实施例中还提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在告警装置上运行时,使得告警装置执行上述方法实施例所示的告警方法流程中告警装置执行的各个步骤。
上述实施例可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,上述实施例可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、服务器或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
以上所述,仅为本申请的具体实施方式。熟悉本技术领域的技术人员根据本申请提供的具体实施方式,可想到变化或替换,都应涵盖在本申请的保护范围之内。
Claims (16)
1.一种告警方法,其特征在于,应用于快速外设组件互连PCIE设备,所述PCIE设备通过I3C协议接口与设备管理单元连接,所述方法包括:
当所述PCIE设备发生异常时,生成告警信息;
通过所述I3C协议接口向设备管理单元发送所述告警信息。
2.根据权利要求1所述的方法,其特征在于,在所述通过所述I3C协议接口向所述设备管理单元发送所述告警信息之前,所述方法还包括:
通过所述I3C协议接口向所述设备管理单元发起第一中断请求;
接收所述设备管理单元针对所述第一中断请求的第一响应消息。
3.根据权利要求2所述的方法,其特征在于,所述通过所述I3C协议接口向所述设备管理单元发送所述告警信息,包括:
在接收到所述第一响应消息后,通过所述I3C协议接口向所述设备管理单元发送第一中断数据内容,所述第一中断数据内容包括所述告警信息。
4.根据权利要求2所述的方法,其特征在于,在接收到所述第一响应消息后,且在发送所述告警信息之前,所述方法还包括:
通过所述I3C协议接口向设备管理单元发送第一预设的中断组号和第一预设的中断号;所述第一预设的中断组号和所述第一预设的中断号用于指示所述第一中断数据内容为所述告警信息。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
当所述异常恢复正常后,生成告警消除信息;
通过所述I3C协议接口向所述设备管理单元发送所述告警消除信息。
6.根据权利要求5所述的方法,其特征在于,在所述通过所述I3C协议接口向所述设备管理单元发送所述告警消除信息之前,所述方法还包括:
通过所述I3C协议接口向所述设备管理单元发起第二中断请求;
接收所述设备管理单元针对所述第二中断请求的第二响应消息。
7.根据权利要求6所述的方法,其特征在于,所述通过所述I3C协议接口向所述设备管理单元发送所述告警消除信息,包括:
在接收到所述第二响应消息后,通过所述I3C协议接口向所述设备管理单元发送第二中断数据内容,所述第二中断数据内容包括所述告警消除信息。
8.根据权利要求7所述的方法,其特征在于,在接收到所述第二响应消息后,且在发送所述告警消除信息之前,所述方法还包括:
通过所述I3C协议接口向设备管理单元发送第二预设的中断组号和第二预设的中断号;所述第二预设的中断组号和所述第二预设的中断号用于指示所述第二中断数据内容为所述告警消除信息。
9.根据权利要求1所述的方法,其特征在于,所述通过所述I3C协议接口向所述设备管理单元发送所述告警信息,包括:
响应所述设备管理单元发送的读操作命令,如果确定存在所述告警信息,则通过所述I3C协议接口向所述设备管理单元发送第一数据内容;其中,所述第一数据内容包括所述告警信息;所述读操作命令用于查询所述告警信息。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
响应所述设备管理单元发送的读操作命令,如果确定不存在所述告警信息,则通过所述I3C协议接口向所述设备管理单元发送第二数据内容;其中,所述第二数据内容包括的内容用于表征不存在所述告警信息。
11.根据权利要求9或10所述的方法,其特征在于,所述读操作命令包括预设命令字;所述预设命令字用于指示所述读操作命令中读取的数据内容为所述告警信息。
12.根据权利要求1至11中任一项所述的方法,其特征在于,所述I3C协议接口与I2C协议接口共用物理通道。
13.根据权利要求1至12中任一项所述的方法,其特征在于,所述告警信息包括:所述异常发生的原因、所述异常的严重程度、所述异常发生的位置和/或所述异常发生的时间。
14.一种计算设备,其特征在于,包括PCIE设备和设备管理单元;所述PCIE设备用于执行如权利要求1-13中任一项所述的方法。
15.一种计算设备,其特征在于,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述计算设备执行如权利要求1-13中任一项所述的方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令;其中,当所述计算机指令在计算设备上运行时,使得所述计算设备执行如权利要求1-13中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211183373.8A CN115904888A (zh) | 2022-09-27 | 2022-09-27 | 一种告警方法、计算设备及存储介质 |
PCT/CN2023/098137 WO2024066444A1 (zh) | 2022-09-27 | 2023-06-02 | 一种告警方法、计算设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211183373.8A CN115904888A (zh) | 2022-09-27 | 2022-09-27 | 一种告警方法、计算设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115904888A true CN115904888A (zh) | 2023-04-04 |
Family
ID=86496298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211183373.8A Pending CN115904888A (zh) | 2022-09-27 | 2022-09-27 | 一种告警方法、计算设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115904888A (zh) |
WO (1) | WO2024066444A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024066444A1 (zh) * | 2022-09-27 | 2024-04-04 | 超聚变数字技术有限公司 | 一种告警方法、计算设备及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6026354A (en) * | 1998-08-10 | 2000-02-15 | Hewlett-Packard Company | Device monitoring system with dedicated bus and processor |
US20180357199A1 (en) * | 2017-06-12 | 2018-12-13 | Qualcomm Incorporated | Slave-to-slave communication in i3c bus topology |
CN109039733A (zh) * | 2018-07-26 | 2018-12-18 | 郑州云海信息技术有限公司 | 一种告警方法、系统及电子设备和存储介质 |
US10853289B2 (en) * | 2018-12-17 | 2020-12-01 | Intel Corporation | System, apparatus and method for hardware-based bi-directional communication via reliable high performance half-duplex link |
CN112653516B (zh) * | 2020-12-04 | 2022-05-13 | 苏州浪潮智能科技有限公司 | 一种服务器中访问dimm的方法、系统、设备及介质 |
CN113872796B (zh) * | 2021-08-26 | 2024-04-23 | 浪潮电子信息产业股份有限公司 | 服务器及其节点设备信息获取方法、装置、设备、介质 |
CN114090379A (zh) * | 2021-11-19 | 2022-02-25 | 苏州浪潮智能科技有限公司 | 服务器总线故障定位方法、装置、电子设备及存储介质 |
CN114816947B (zh) * | 2022-05-30 | 2024-10-15 | 苏州浪潮智能科技有限公司 | 一种服务器状态显示系统、方法、装置及可读存储介质 |
CN115904888A (zh) * | 2022-09-27 | 2023-04-04 | 超聚变数字技术有限公司 | 一种告警方法、计算设备及存储介质 |
-
2022
- 2022-09-27 CN CN202211183373.8A patent/CN115904888A/zh active Pending
-
2023
- 2023-06-02 WO PCT/CN2023/098137 patent/WO2024066444A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024066444A1 (zh) * | 2022-09-27 | 2024-04-04 | 超聚变数字技术有限公司 | 一种告警方法、计算设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2024066444A1 (zh) | 2024-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11403227B2 (en) | Data storage method and apparatus, and server | |
CN107547589B (zh) | 一种数据采集处理方法以及装置 | |
US10042583B2 (en) | Device management method, device, and device management controller | |
CN106959935B (zh) | 一种兼容i2c通信与ipmb通信的方法 | |
US20130290763A1 (en) | Information processing system, management apparatus, and management method of information processing apparatus | |
CN113992473A (zh) | 一种通信方法、装置及电子设备和存储介质 | |
CN111061587A (zh) | 一种i2c总线的通信控制方法、装置、设备及存储介质 | |
WO2024066444A1 (zh) | 一种告警方法、计算设备及存储介质 | |
TWI845960B (zh) | 複雜可程式設計邏輯器件及其與基板管理控制器通訊方法 | |
CN108196617B (zh) | Bmc时间设置方法、装置、系统及可读存储介质 | |
CN112214437B (zh) | 一种存储设备及通信方法、装置、计算机可读存储介质 | |
CN115098342A (zh) | 系统日志收集方法、系统、终端及存储介质 | |
CN113900718A (zh) | 一种bmc与bios资产信息的解耦方法、系统及装置 | |
CN103984657A (zh) | 接口控制器、外接式电子装置及其控制方法 | |
US20190286599A1 (en) | Dual way communication method, system, and master device thereof | |
CN111159088A (zh) | 一种基于异构多核处理器的iic总线通信方法及系统 | |
CN117407343B (zh) | 集成电路总线透传模式下时钟延展的处理方法及装置 | |
CN115941436A (zh) | 一种告警方法、计算设备及存储介质 | |
CN114817100B (zh) | 一种用于单板的数据读取方法和装置 | |
CN116860327A (zh) | 传感器数据的获取方法及装置、存储介质及电子装置 | |
JP3819177B2 (ja) | バックアップメモリ構成方式および通信伝送システム | |
CN109981660B (zh) | 一种信息处理方法、电子设备 | |
CN113900890B (zh) | 服务器组件信息收集方法、装置、设备及介质 | |
TWI766572B (zh) | 監控管理系統及方法 | |
CN113254209B (zh) | 一种容量管理方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |