CN116192681A - 一种板卡监控结合算力的网络设备健康评估方法 - Google Patents
一种板卡监控结合算力的网络设备健康评估方法 Download PDFInfo
- Publication number
- CN116192681A CN116192681A CN202211546624.4A CN202211546624A CN116192681A CN 116192681 A CN116192681 A CN 116192681A CN 202211546624 A CN202211546624 A CN 202211546624A CN 116192681 A CN116192681 A CN 116192681A
- Authority
- CN
- China
- Prior art keywords
- board
- monitoring
- index
- prediction result
- network equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种板卡监控结合算力的网络设备健康评估方法,包括:根据DCRMS中网络设备的板卡,设置监测指标,并将监测指标关系映射生成监控标记;根据生成监控标记中的板卡IP解析监控标记,并通过故障预测模型分别对监测指标进行故障预测,得到监控指标预测结果;根据监控指标预测结果,分别计算各项监控指标预测结果的得分,并将得分汇总,得到网络设备的综合健康评估得分;当综合健康评估得分为1‑3分时,网络设备为不健康状态;当综合健康评估得分为3‑6分时,网络设备为亚健康状态;当综合健康评估得分为6‑9分时,网络设备为健康状态。本发明对DCRMS中的网络设备通过板卡算力指标监测结合板卡寿命指标,预测网络设备的健康程度。
Description
技术领域
本发明属于绿色机房技术领域,具体地,涉及一种板卡监控结合算力的网络设备健康评估方法。
背景技术
数据中心机房监控系统(Datacenter computer room monitoring systen,DCRMS)是网络设备运行基础环境,基础环境是否正常,直接影响机房内网络设备的正常运行,网络设备主要由多板卡组成,每个板卡包括独立的CPU、内存等,目前主要通过CPU、内存、风扇使用率和温度等进行DCRMS的评估,没有考虑网络设备的老旧、算力不足等情况。
网络设备的年限、算力等健康度指标,是评估网络设备健康重要度指标,网络设备使用时间比较长和高算力长时间运转,直接影响网络设备的整体性能。
发明内容
针对现有技术中存在的问题,本发明提供了一种板卡监控结合算力的网络设备健康评估方法,对DCRMS中的网络设备通过板卡算力指标监测结合板卡寿命指标,预测网络设备的健康程度。
为实现上述技术目的,本发明采用如下技术方案:一种板卡监控结合算力的网络设备健康评估方法,具体包括如下步骤:
步骤1、根据DCRMS中网络设备的板卡,设置监测指标,并将监测指标关系映射生成监控标记;
步骤2、根据生成监控标记中的板卡IP解析监控标记,并通过故障预测模型分别对监测指标进行故障预测,得到监控指标预测结果;
步骤3、根据监控指标预测结果,分别计算各项监控指标预测结果的得分,并将得分汇总,得到综合健康评估得分;当综合健康评估得分为1-3分时,所述网络设备为不健康状态;当综合健康评估得分为3-6分时,所述网络设备为亚健康状态;当综合健康评估得分为6-9分时,所述网络设备为健康状态。
进一步地,所述监控指标包括:板卡基础指标、板卡算力指标、板卡寿命指标;所述板卡基础指标包括:CPU、内存、硬盘三个维度。
进一步地,所述板卡算力指标中算力的计算过程为:
其中,Cbr为分布式组网内各地方边缘点的算力节点的总算力需求,n为逻辑运算芯片数量,i为n的索引,f(ai)为逻辑运算的映射函数,αi为第i个逻辑运算芯片的映射比例系数,q1(TOPS)为逻辑运算的冗余算力;m为并行计算芯片数量,j为m的索引,f(bj)为并行计算的映射函数,βj为第j个并行计算芯片的映射比例系数,q2(FLOPS)为并行计算的冗余算力;p为神经网络加速芯片的数量,k为p的索引,f(ck)为神经网络加速的映射函数,γk为第k个神经网络加速芯片的映射比例系数,q3(FLOPS)为神经网络加速的冗余算力。
进一步地,所述监控标记格式为:板卡IP###板卡板卡基础指标###板卡寿命指标###板卡算力指标###关联板卡。
进一步地,所述故障预测模型为:
Y(t)=F(u(t),a(t))
其中,Y(t)为监控指标预测结果,u(t)为监测指标,a(t)为各种不明因素,t为时间,F()为故障预测的变化函数。
进一步地,所述监控指标预测结果中若板卡基础指标预测结果的三个维度均正常,则板卡基础指标预测结果得3分;若板卡基础指标预测结果的三个维度中的任意1个或2个出现异常,则板卡基础指标预测结果得分2分;若板卡基础指标预测结果的三个维度均异常,则板卡基础指标预测结果得分1分。
进一步地,所述监控指标预测结果中若板卡寿命指标预测结果在一年内,则板卡寿命指标预测结果得分为2分;若板卡寿命指标预测结果在一年到两年之间,则板卡寿命指标预测结果得分为3分;若板卡寿命指标预测结果在两年到三年之间,则板卡寿命指标预测结果得分为1分。
进一步地,所述监控指标预测结果中若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中出现异常的超过1个,或本次多块板卡预测的算力均与上一次多块板卡预测的算力之差不超过50%,则板卡算力指标预测结果得分为1分;若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中未出现异常,则板卡算力指标预测结果得分为3分;若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中只有1个异常,则板卡算力指标预测结果得分为2分。
进一步地,本发明还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序使计算机执行所述的板卡监控结合算力的网络设备健康评估方法。
进一步地,本发明还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时,实现所述的板卡监控结合算力的网络设备健康评估方法。
与现有技术相比,本发明具有如下有益效果:本发明网络设备健康评估方法通过根据DCRMS中网络设备的板卡,设置监测指标,并生成监控标记,通过监控标记可以快速了解各监控指标评分情况;本发明通过板卡算力指标预测结果代替传统软件监控和硬件关注质保设置不同阈值避免误报部分对设备进行监控预警,从而避免了现有技术过多关注网络,业务应用软件健康程度,而忽略硬件健康的情况。
附图说明
图1为本发明板卡监控结合算力的网络设备健康评估方法的流程图;
图2为本发明中对监测指标进行故障预测的流程图。
具体实施方式
下面将结合本发明的附图,对本发明中的技术方案进行清楚、完整的描述,显然,所描述仅仅是本发明一部分,而不是全部。基于本发明中的具体实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1为本发明板卡监控结合算力的网络设备健康评估方法,具体包括如下步骤:
步骤1、根据DCRMS中网络设备的板卡,设置监测指标,并将监测指标关系映射生成监控标记,本发明中监控标记格式为:板卡IP###板卡板卡基础指标###板卡寿命指标###板卡算力指标###关联板卡,现有技术中的各指标的评分情况需要逐条查询数据库获取,通过生成监控标记可通过监测指标一次性查询得到评分结果,避免反复查询数据库造成的资源消耗。
本发明中监控指标包括:板卡基础指标、板卡算力指标、板卡寿命指标,全方面了解网络设备的健康情况,由于现有技术注重软件健康度,本发明从板卡监控指标出发,更加细颗粒度地了解网络设备的健康情况;同时,准确判断网络设备处于不健康状态时,危害程度是否造成网络设备瘫痪。板卡基础指标包括:CPU、内存、硬盘三个维度;本发明中板卡算力指标中算力的计算过程为:
其中,Cbr为分布式组网内各地方边缘点的算力节点的总算力需求,n为逻辑运算芯片数量,i为n的索引,f(ai)为逻辑运算的映射函数,αi为第i个逻辑运算芯片的映射比例系数,q1(TOPS)为逻辑运算的冗余算力;m为并行计算芯片数量,j为m的索引,f(bj)为并行计算的映射函数,βj为第j个并行计算芯片的映射比例系数,q2(FLOPS)为并行计算的冗余算力;p为神经网络加速芯片的数量,k为p的索引,f(ck)为神经网络加速的映射函数,γk为第k个神经网络加速芯片的映射比例系数,q3(FLOPS)为神经网络加速的冗余算力。
步骤2、如图2,根据生成监控标记中的板卡IP解析监控标记,并通过预测模型分别对监测指标进行监控指标预测,得到监控指标预测结果,通过网络设备在运行过程中的不明因素对监控指标的未来情况进行预测,使得监控指标结果更为准确,使得网络设备的健康评估结果更为准确。
本发明中故障预测模型为:
Y(t)=F'(u(t),a(t))
其中,Y(t)为监控指标预测结果,u(t)为监测指标,a(t)为各种不明因素,t为时间,F()为故障预测的变化函数。
步骤3、根据监控指标预测结果,分别计算各项监控指标预测结果的得分,并将得分汇总,得到综合健康评估得分;当综合健康评估得分为1-3分时,该网络设备为不健康状态,需通知技术人员重点关注,并对网络设备上部署的业务进行配分和迁移;当综合健康评估得分为3-6分时,该网络设备为亚健康状态,需通知技术人员关注;当综合健康评估得分为6-9分时,该网络设备为健康状态。
具体地,监控指标预测结果中若板卡基础指标预测结果的三个维度均正常,则板卡基础指标预测结果得3分;若板卡基础指标预测结果的三个维度中的任意1个或2个出现异常,则板卡基础指标预测结果得分2分;若板卡基础指标预测结果的三个维度均异常,则板卡基础指标预测结果得分1分;通过对板卡基础指标预测结果进行评分,实现板卡监测的网络化管理,从而为故障发生时快速定位提供帮助。监控指标预测结果中若板卡寿命指标预测结果在一年内,则板卡寿命指标预测结果得分为2分;若板卡寿命指标预测结果在一年到两年之间,则板卡寿命指标预测结果得分为3分;若板卡寿命指标预测结果在两年到三年之间,则板卡寿命指标预测结果得分为1分;通过考虑板卡的寿命对网络设备及部署的应用可能造成的影响,通过评分更加直观了解板卡健康情况,同时,为发生故障时,结合板卡寿命可优先排除板卡问题再进行分析,可以过滤掉大部分误报情况。由于一台网络设备上存在多个板卡,即使有一个板卡故障,网络设备仍然可以运行,因此,监控指标预测结果的得分设置如下:若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中出现异常的超过1个,或本次多块板卡预测的算力均与上一次多块板卡预测的算力之差不超过50%,则板卡算力指标预测结果得分为1分;若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中未出现异常,则板卡算力指标预测结果得分为3分;若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中只有1个异常,则板卡算力指标预测结果得分为2分。通过监控指标预测结果监测网络设备的健康状况,当该网络设备不健康时,可快速定位故障板卡,可精确知道故障到板卡维度,而不是现有技术只做到设备故障的维度,且在网络设备发生异常时,能快速了解异常危害性是否会造成设备不可用。
本发明板卡监控结合算力的网络设备健康评估方法通过板卡算力指标预测结果代替传统软件监控和硬件关注质保设置不同阈值避免误报部分对设备进行监控预警,从而避免了现有技术过多关注网络,业务应用软件健康程度,而忽略硬件健康的情况。
在本申请所公开的实施例中,计算机存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合使用的程序。计算机存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。计算机存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
本领域普通技术人员可以意识到,结合本申请所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施方式,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (10)
1.一种板卡监控结合算力的网络设备健康评估方法,其特征在于,具体包括如下步骤:
步骤1、根据DCRMS中网络设备的板卡,设置监测指标,并将监测指标关系映射生成监控标记;
步骤2、根据生成监控标记中的板卡IP解析监控标记,并通过故障预测模型分别对监测指标进行故障预测,得到监控指标预测结果;
步骤3、根据监控指标预测结果,分别计算各项监控指标预测结果的得分,并将得分汇总,得到所述网络设备的综合健康评估得分;当综合健康评估得分为1-3分时,所述网络设备为不健康状态;当综合健康评估得分为3-6分时,所述网络设备为亚健康状态;当综合健康评估得分为6-9分时,所述网络设备为健康状态。
2.根据权利要求1所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述监控指标包括:板卡基础指标、板卡算力指标、板卡寿命指标;所述板卡基础指标包括:CPU、内存、硬盘三个维度。
3.根据权利要求2所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述板卡算力指标中算力的计算过程为:
其中,Cbr为分布式组网内各地方边缘点的算力节点的总算力需求,n为逻辑运算芯片数量,i为n的索引,f(ai)为逻辑运算的映射函数,αi为第i个逻辑运算芯片的映射比例系数,q1(TOPS)为逻辑运算的冗余算力;m为并行计算芯片数量,j为m的索引,f(bj)为并行计算的映射函数,βj为第j个并行计算芯片的映射比例系数,q2(FLOPS)为并行计算的冗余算力;p为神经网络加速芯片的数量,k为p的索引,f(ck)为神经网络加速的映射函数,γk为第k个神经网络加速芯片的映射比例系数,q3(FLOPS)为神经网络加速的冗余算力。
4.根据权利要求1所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述监控标记格式为:板卡IP###板卡板卡基础指标###板卡寿命指标###板卡算力指标###关联板卡。
5.根据权利要求1所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述故障预测模型为:
Y(t)=F(u(t),a(t))
其中,Y(t)为监控指标预测结果,u(t)为监测指标,a(t)为各种不明因素,t为时间,F()为故障预测的变化函数。
6.根据权利要求1所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述监控指标预测结果中若板卡基础指标预测结果的三个维度均正常,则板卡基础指标预测结果得3分;若板卡基础指标预测结果的三个维度中的任意1个或2个出现异常,则板卡基础指标预测结果得分2分;若板卡基础指标预测结果的三个维度均异常,则板卡基础指标预测结果得分1分。
7.根据权利要求1所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述监控指标预测结果中若板卡寿命指标预测结果在一年内,则板卡寿命指标预测结果得分为2分;若板卡寿命指标预测结果在一年到两年之间,则板卡寿命指标预测结果得分为3分;若板卡寿命指标预测结果在两年到三年之间,则板卡寿命指标预测结果得分为1分。
8.根据权利要求1所述的一种板卡监控结合算力的网络设备健康评估方法,其特征在于,所述监控指标预测结果中若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中出现异常的超过1个,或本次多块板卡预测的算力均与上一次多块板卡预测的算力之差不超过50%,则板卡算力指标预测结果得分为1分;若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中未出现异常,则板卡算力指标预测结果得分为3分;若板卡算力指标预测结果显示本次多块板卡预测的算力均比上一次多块板卡预测的算力增加50%以上,且板卡基础指标预测结果中只有1个异常,则板卡算力指标预测结果得分为2分。
9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序使计算机执行如权利要求1-8任一项所述的板卡监控结合算力的网络设备健康评估方法。
10.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时,实现如权利要求1-8任一项所述的板卡监控结合算力的网络设备健康评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211546624.4A CN116192681A (zh) | 2022-12-05 | 2022-12-05 | 一种板卡监控结合算力的网络设备健康评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211546624.4A CN116192681A (zh) | 2022-12-05 | 2022-12-05 | 一种板卡监控结合算力的网络设备健康评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116192681A true CN116192681A (zh) | 2023-05-30 |
Family
ID=86437248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211546624.4A Pending CN116192681A (zh) | 2022-12-05 | 2022-12-05 | 一种板卡监控结合算力的网络设备健康评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116192681A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117889919A (zh) * | 2024-03-15 | 2024-04-16 | 中铁电气化局集团有限公司 | 一种基础网拉线预配状态检测方法 |
-
2022
- 2022-12-05 CN CN202211546624.4A patent/CN116192681A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117889919A (zh) * | 2024-03-15 | 2024-04-16 | 中铁电气化局集团有限公司 | 一种基础网拉线预配状态检测方法 |
CN117889919B (zh) * | 2024-03-15 | 2024-05-14 | 中铁电气化局集团有限公司 | 一种基础网拉线预配状态检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111209131B (zh) | 一种基于机器学习确定异构系统的故障的方法和系统 | |
CN108388489B (zh) | 一种服务器故障诊断方法、系统、设备及存储介质 | |
WO2022089202A1 (zh) | 故障识别模型训练方法、故障识别方法、装置及电子设备 | |
US9547545B2 (en) | Apparatus and program for detecting abnormality of a system | |
CN110750377A (zh) | 一种故障定位方法及装置 | |
CN111010291A (zh) | 业务流程异常告警方法、装置、电子设备及存储介质 | |
CN114036826A (zh) | 模型训练方法、根因确定方法、装置、设备及存储介质 | |
CN116192681A (zh) | 一种板卡监控结合算力的网络设备健康评估方法 | |
CN112380089A (zh) | 一种数据中心监控预警方法及系统 | |
CN112596975A (zh) | 对网络设备进行监控处理的方法、系统、设备和存储介质 | |
CN116502166B (zh) | 一种对目标设备故障预测的方法、装置、设备和介质 | |
JP6482743B1 (ja) | リスク評価装置、リスク評価システム、リスク評価方法、及び、リスク評価プログラム | |
CN113438110A (zh) | 一种集群性能的评价方法、装置、设备及存储介质 | |
Ghiasvand et al. | Anomaly detection in high performance computers: A vicinity perspective | |
CN115794588A (zh) | 内存故障预测方法、装置、系统及监测服务器 | |
CN113505044A (zh) | 数据库告警方法、装置、设备和存储介质 | |
CN111611097A (zh) | 故障检测方法、装置、设备及存储介质 | |
CN107943654A (zh) | 一种快速判定服务器环境温度监控异常原因的方法 | |
CN110069382B (zh) | 软件监控方法、服务器、终端设备、计算机设备及介质 | |
CN117331790A (zh) | 一种用于数据中心的机房故障检测方法及装置 | |
CN116501705A (zh) | 基于ras的内存信息收集解析方法、系统、设备及介质 | |
CN113608959B (zh) | 故障硬盘定位方法、系统、终端及存储介质 | |
CN114598621B (zh) | 一种电力通信网络可靠性评估系统 | |
JP2020035297A (ja) | 機器状態監視装置及びプログラム | |
CN109754490A (zh) | 电力机车制动系统的健康管理方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |