CN116185748A - 一种主板状态检测系统、方法、电子设备和存储介质 - Google Patents
一种主板状态检测系统、方法、电子设备和存储介质 Download PDFInfo
- Publication number
- CN116185748A CN116185748A CN202211710429.0A CN202211710429A CN116185748A CN 116185748 A CN116185748 A CN 116185748A CN 202211710429 A CN202211710429 A CN 202211710429A CN 116185748 A CN116185748 A CN 116185748A
- Authority
- CN
- China
- Prior art keywords
- detected
- area
- sensor
- main board
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 42
- 238000007405 data analysis Methods 0.000 claims abstract description 41
- 230000002093 peripheral effect Effects 0.000 claims abstract description 26
- 230000036541 health Effects 0.000 claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 238000004891 communication Methods 0.000 claims abstract description 13
- 238000004590 computer program Methods 0.000 claims description 16
- 230000003862 health status Effects 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000009434 installation Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000013500 data storage Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000009423 ventilation Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000017525 heat dissipation Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 210000001503 joint Anatomy 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000020169 heat generation Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/26—Functional testing
- G06F11/267—Reconfiguring circuits for testing, e.g. LSSD, partitioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种主板状态检测系统、方法、电子设备和存储介质,该系统包括:上位机和多个传感器模块;传感器模块安装于待检测主板上的多个待检测区域,用于采集各待检测区域的状态数据,待检测区域包括主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种;传感器模块通过通讯线将状态数据上传至上位机;上位机中设置有计算模块,用于根据各个数据分析模型输出的分析结果,生成待检测主板的健康状态结果,数据分析模型用于根据对应区域的状态数据和历史状态数据,得到分析结果。本发明通过传感器模块采集主板的状态数据,并进行分析,实现了对主板健康状态的即使反馈和告警,避免出现主板瞬时失效等问题。
Description
技术领域
本发明涉及计算机技术领域,特别是一种主板状态检测系统、方法、电子设备和存储介质。
背景技术
主板是构成复杂电子系统例如电子计算机的中心或者主电路板。一般为矩形电路板,上面安装了组成计算机的主要电路系统,一般有BIOS芯片、I/O控制芯片、键盘和面板控制开关接口、指示灯插接件、扩充插槽、主板及插卡的直流电源供电接插件等元件。
在服务器的日常工作与运行过程中,由于本身工作环境较为恶劣,工作温度较高,风扇震动严重,主板本身作为线路板卡,自身体积较大,且主板上安装的电子元器件较多,容易出现主板变形或者震动使元器件掉落的情况。目前,对主板上硬件部件的检测主要是依据主板内各个部件的模块自己主动上报完成的,如果该部件本身出现问题或无法上报信息,则会导致检测失灵,无法及时获取主板状态信息。
因此,需要一种主板状态检测系统,以实现对主板状态的及时检测和告警。
发明内容
鉴于上述问题,本发明实施例提供了一种主板状态检测系统、方法、电子设备和存储介质,以便克服上述问题或者至少部分地解决上述问题。
本发明实施例的第一方面提供了一种主板状态检测系统,该系统包括:上位机和多个传感器模块;
所述传感器模块安装于待检测主板上的多个待检测区域,用于采集各个所述待检测区域的状态数据,所述待检测区域至少包括所述待检测主板的主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种;
所述传感器模块通过所述通讯线将多个所述待检测区域的状态数据上传至所述上位机;
所述上位机中设置有计算模块,所述计算模块用于根据各个数据分析模型输出的分析结果,生成所述待检测主板的健康状态结果,各个所述数据分析模型用于根据接收到的对应的所述待检测区域的状态数据和该待检测区域的历史状态数据,得到所述分析结果。
可选地,所述传感器模块的组成为电压传感器,电流传感器,温度传感器,风量传感器,陀螺仪传感器,震动传感器中的一种或多种,所述传感器模块的组成,是根据该传感器模块所在的所述待检测区域的位置和功能确定的。
可选地,在所述待检测区域为所述主板边角区域或所述主板延伸区域的情况下,所述传感器模块至少包括:所述陀螺仪传感器和所述温度传感器;
在所述待检测区域为所述风扇震动中心区域的情况下,所述传感器模块至少包括:所述电压传感器,所述电流传感器,所述风量传感器和所述震动传感器;
在所述待检测区域为所述重点功耗器件外围区域的情况下,所述传感器模块至少包括:所述电压传感器,所述电流传感器,所述温度传感器和所述陀螺仪传感器。
可选地,所述待检测区域包括为所述传感器模块预留的安装位置和检测端口;所述检测端口用于获取布设在所述安装位置的所述传感器模块采集的数据。
可选地,所述传感器模块包括单独的供电模块和控制芯片,所述控制芯片用于独立控制所述传感器模块的数据采集、传输、存储。
可选地,所述上位机还包括报警模块,所述报警模块用于在所述健康状态结果为主板状态异常的情况下,发送报警信息至相关工作人员的终端。
可选地,所述上位机还包括:
数据存储模块,用于将多个所述传感器模块上传的所述待检测区域的状态数据,分别存储为对应的所述待检测区域的历史状态数据;
模型训练模块,用于利用所述待检测区域的历史状态数据和所述健康状态结果,对该待检测区域所对应的数据分析模型进行训练。
本实施例第二方面还提供了一种主板状态检测方法,所述方法包括:
通过安装于待检测主板上的多个待检测区域的传感器模块,获取各个所述待检测区域的状态数据;所述待检测区域至少包括所述待检测主板的主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种;
将各个所述待检测区域的状态数据和该待检测区域的历史状态数据,输入该待检测区域对应的数据分析模型,得到各个所述待检测区域的分析结果;
根据各个所述待检测区域的分析结果,确定所述待检测主板的健康状态结果。
可选地,所述方法还包括:根据所述传感器模块所在的所述待检测区域的位置和功能确定所述传感器模块的组成,所述传感器的组成为电压传感器,电流传感器,温度传感器,风量传感器,陀螺仪传感器,震动传感器中的一种或多种。
可选地,所述根据所述传感器模块所在的所述待检测区域的位置和功能确定所述传感器模块的组成,包括:
在所述待检测区域为所述主板边角区域或所述主板延伸区域的情况下,将所述传感器模块的组成确定为:所述陀螺仪传感器和所述温度传感器;
在所述待检测区域为所述风扇震动中心区域的情况下,将所述传感器模块的组成确定为:所述电压传感器,所述电流传感器,所述风量传感器和所述震动传感器;
在所述待检测区域为所述重点功耗器件外围区域的情况下,将所述传感器模块的组成确定为:所述电压传感器,所述电流传感器,所述温度传感器和所述陀螺仪传感器。
可选地,所述待检测区域包括为所述传感器模块预留的安装位置和检测端口,获取各个所述待检测区域的状态数据,包括:
通过所述检测端口获取布设在所述安装位置的所述传感器模块采集的数据。
可选地,在所述健康状态结果为主板状态异常的情况下,发送报警信息至相关工作人员的终端。
可选地,所述方法还包括:将多个所述传感器模块上传的所述待检测区域的状态数据,分别存储为对应的所述待检测区域的历史状态数据;
利用所述待检测区域的历史状态数据和所述健康状态结果,对该待检测区域所对应的数据分析模型进行训练。
本发明实施例第三方面还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,所述处理器执行所述计算机程序以实现本发明实施例第二方面所述的主板状态监测方法中的步骤。
本发明实施例第四方面还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现本发明实施例第二方面所述的主板状态监测方法中的步骤。
本发明实施例提供了一种主板状态检测系统,该系统包括:上位机和多个传感器模块;所述传感器模块安装于待检测主板上的多个待检测区域,用于采集各个所述待检测区域的状态数据,所述待检测区域至少包括所述待检测主板的主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种;所述传感器模块通过所述通讯线将多个所述待检测区域的状态数据上传至所述上位机;所述上位机中设置有计算模块,所述计算模块用于根据各个数据分析模型输出的分析结果,生成所述待检测主板的健康状态结果,各个所述数据分析模型用于根据接收到的对应的所述待检测区域的状态数据和该待检测区域的历史状态数据,得到所述分析结果。
具体的有益效果如下:
(1)本发明提出的主板状态检测系统更加稳定。相比于之前依赖主板上的硬件部件自身上传状态信息,本发明利用额外的传感器模块对主板进行监测,该传感器模块能够及时获取各个检测区域的状态数据,不受主板硬件自身状态的影响,使得该检测系统更加稳定,受干扰的因素较少。
(2)本发明提出的主板状态检测系统检测应用广泛。本发明通过在多个待检测区域设置传感器模块,可以实现灵活选择待检测区域,例如,对主板边角区域和主板延伸区域等容易变形的位置,以及风扇震动中心和功耗器件外围等容易产生异常的高风险位置,均能够通过传感器模块实现状态检测,可以应用于各类主板,不受主板的结构品类的限制,应用广泛。
(3)本发明提出的主板状态检测系统更加智能准确。本发明通过针对不同的待检测区域,设置不同的数据分析模型,由此数据分析模型根据该区域的状态数据和历史状态数据进行分析,输出分析结果,再由计算模块综合各个数据分析模型输出的分析结果,得到主板的健康状态结果。由此,通过设置专区数据分析模型,对每个待检测区域的状态进行更加准确,更具有针对性的分析,再综合分析结果,使得到的主板整体的健康状态结果更加准确智能。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种主板状态检测系统的结构示意图;
图2是本发明实施例提供的一种数据处理的结构示意图;
图3是本发明实施例提供的一种传感器模块的结构示意图;
图4是本发明实施例提供的一种主板的待检测区域的分布示意图;
图5是本发明实施例提供的一种主板状态检测方法的步骤流程图;
图6是本发明实施例提供的一种电子设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种主板状态检测系统,参照图1,图1为本发明实施例提供的一种主板状态检测系统的结构示意图,如图1所示,该系统包括:上位机和多个传感器模块;
所述传感器模块安装于待检测主板上的多个待检测区域,用于采集各个所述待检测区域的状态数据,所述待检测区域至少包括所述待检测主板的主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种;
在本实施例中提出的所述待检测主板指代一般计算机所用主板,又称主机板、系统板、逻辑板、母板、底板等,是构成复杂电子系统例如电子计算机的中心或者主电路板。主板能提供一系列接合点,供处理器、显卡、声效卡、硬盘、存储器、对外设备等设备接合。它们通常直接插入有关插槽,或用线路连接。
在服务器日常工作与运行过程中,主板本身的工作环境较为恶劣,一方面,主板上的风扇运行造成的震动较大,容易对主板上其余的电子元器件产生影响,甚至使部分元器件松动、掉落;另一方面,主板上部分硬件设备功耗大,散热较多,导致主板的工作温度较高,对电源等元器件的使用寿命影响较大。此外,主板本身作为线路板卡,体积较大,硬度较弱,容易出现变形的情况。上述种种原因均会对服务器的正常运行造成影响。为了及时监控主板的运行状态,本实施例提出在待检测区域设置传感器模块,从而利用传感器模块实时采集对应的待检测区域的状态数据,再进行分析,以得到实时的主板的状态结果。
在本实施例中,提出了待检测主板的待检测区域至少包括主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种。具体的,主板一般为矩形板,主板边角区域是指主板的四个直角区域,因为主板材质受限,硬度不足,边角区域更容易因为碰撞等发生形变;由于各类主板品类不同、型号不同,在结构上存在差异的等原因,主板在一般矩形的基础上,可能设计有延伸区域,形成不规则图形,主板延伸区域即是指此类延伸区域,和主板边角区域类似,主板延伸区域容易产生形变;风扇震动中心区域是指,主板上安装的风扇的震动中心位置,由于风扇震动幅度过大容易导致主板上其余元器件松动甚至脱落,所以需要监测风扇震动中心位置的状态,避免风扇震动幅度过大;功耗器件外围区域是指主板上安装的功耗较大的电子元器件的外围区域,例如CPU和显卡等元器件,此类元器件由于功耗大,散热多,周围温度较高,同样容易使主板产生形变等问题。
本实施例通过在上述待检测区域设置传感器模块,可以实现对主板上风险较高区域的实时检测,需要知道的是,本实施例中的待检测区域可以理解为主板上风险较高,需要进行检测的位置区域,通过对各种主板结构进行具体分析,可以依据实际情况,针对主板的多个位置布设传感器模块,实现对主板全方位的检测,避免存在检测盲区。此外,本实施例可以灵活应用于各种主板结构中,不受主板型号品类的限制,应用范围广泛。
所述传感器模块通过所述通讯线将多个所述待检测区域的状态数据上传至所述上位机;
具体的,为每个传感器模块在机箱内设置单独的走线,可以通过带有屏蔽网的线缆将通讯数据汇总到服务器一端的出口模块,通过该出口模块将各个传感器模块采集到的状态数据上传至上位机电脑。该上位机可以为待检测主板工作对应的计算机电脑,也可以是任意设定的一台计算机。
所述上位机中设置有计算模块,所述计算模块用于根据各个数据分析模型输出的分析结果,生成所述待检测主板的健康状态结果,各个所述数据分析模型用于根据接收到的对应的所述待检测区域的状态数据和该待检测区域的历史状态数据,得到所述分析结果。
在本实施例中,上位机在接收到了上传的状态数据后,利用自身内部设置的计算模块,对状态数据进行分析,从而得到待检测主板的健康状态结果。该健康状态结果表征待检测主板的整体健康状态,包含电源等各项指标的状态信息,以及对主板的剩余使用寿命的预估结果。计算模块中包括各个待检测区域的数据分析模块,每个数据分析模型用于单独分析该区域的状态数据,然后再由计算模块综合各个模型输出的分析结果,生成该主板的健康状态结果。示例性的,在主板边角区域采集到的状态数据,由对应的主板边角数据分析模型进行处理,从而可以得到主板边角形变程度等分析结果;在风扇震动中心区域采集到的状态数据,由对应的风扇震动中心数据分析模型进行处理,从而可以得到风扇震动中心的震动幅度等分析结果;在主板延伸区域采集到的状态数据,由对应的主板延伸区域数据分析模型进行处理,从而得到主板延伸区域形变程度分析结果;在功耗器件外围区域采集到的状态数据,由对应的功耗器件外围数据分析模型进行处理,从而可以得到该外围区域的温度分析结果。最后由计算模块综合各个分析结果,具体可以由计算模块中的综合子模块执行这一步骤,即预估主板的剩余使用寿命,生成主板整体的健康状态结果。
具体的,参照图2,图2示出了一种数据处理的结构示意图,如图2所示,由计算模块中的数据分析模型根据接收到的对应的传感器模块的状态数据,进行处理得到分析结果,该分析结果可以表征当前时刻各项数据指标(温度、电压、电流、风量、震动和形变程度)是否属于正常数值范围,所检测的待检测区域是否属于正常工作状态,该待检测区域中的目标元器件的剩余使用寿命。在数据分析模型的数据处理过程中,数据分析模型根据接收到的对应的待检测区域的状态数据,生成各个数据指标随时间的变化曲线,再按照设定的阈值,判断该曲线是否是在正常波动的范围内,从而确定当前时刻该数据指标是否属于正常数值范围,示例性的,分析结果可以表示为:CPU外围区域-温度-正常状态,或,电源外围区域-温度-异常状态:温度偏高,超出预设阈值。此外,针对待检测区域中设置有目标元器件的情况,不同的元器件在不同的工作环境下的使用寿命不同,对应的数据分析模型可以通过生成的数据指标随时间的变化曲线图,判断是否属于该目标元器件可承受范围的数值波动,结合该元器件本身的设计寿命,计算得到该目标元器件在当前使用环境下的剩余使用寿命。示例性的,当目标元器件为电源模块,其本身的设计使用寿命为5000小时,但根据状态数据分析得到温度随时间变化的曲线中,该区域的温度长期处于70度以上,由此数据分析模型根据实时采集环境与工作状态进行预估与评判,分析确定电源模块的实际使用寿命只有2000小时,在生成该待检测区域的分析结果时,输出对应的电源模块剩余使用寿命评估结果。在分析结果判定待检测区域是否正常时,一方面分析各项数据指标是否超越了预设阈值,例如是否超出了额定电压或额定电流,另一方面分析该环境下目标元器件的实际使用寿命是否受到了严重影响。然后,如图2所示,由计算模块中的综合子模块综合专区数据分析模型输出的分析结果,得到主板的健康状态结果,该健康状态结果还包括根据各项指标预估的主板的剩余使用寿命。计算模块综合所述分析结果中各个目标元器件的衰减情况和待检测区域的运行工况,形变程度等,预估得到主板整体的剩余使用寿命。
本发明实施例提出的主板状态检测系统包括:上位机和多个传感器模块;传感器模块安装于待检测主板上的多个待检测区域,用于采集各待检测区域的状态数据,待检测区域包括主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种;传感器模块通过通讯线将状态数据上传至上位机;上位机中设置有计算模块,用于根据各个数据分析模型输出的分析结果,生成待检测主板的健康状态结果,数据分析模型用于根据对应区域的状态数据和历史状态数据,得到分析结果。本实施例提出的主板状态检测系统检测通过在多个待检测区域设置传感器模块,可以实现灵活选择待检测区域,可以应用于各类主板,不受主板的结构品类的限制,应用广泛。并且,通过设置专区数据分析模型,对每个待检测区域的状态进行更加准确,更具有针对性的分析,再综合分析结果,使得到的主板整体的健康状态结果更加准确智能。
在一种实施例中,所述传感器模块的组成为电压传感器,电流传感器,温度传感器,风量传感器,陀螺仪传感器,震动传感器中的一种或多种,所述传感器模块的组成,是根据该传感器模块所在的所述待检测区域的位置和功能确定的。
在本实施例中,每个传感器模块在硬件构成上采用了集成电路模块化设计,每个传感器模块包括了一个或多个传感器,即,可以根据实际需求单独配备不同的传感器,将这些传感器通过通讯线集成在一起,同时将采集得到的状态数据进行上传,形成了模块化的主板状态检测系统。根据待检测区域的位置和功能来选择对应的传感器模块的组成。示例性的,风扇震动中心位置由于该位置的震动较为强烈且风量较大,所以对应地,需要设置震动传感器和风量传感器。在本实施例中,电压传感器为可以检测连接的检测端口的电压数值的传感器,电流传感器为可以检测连接的检测端口的电流数值的传感器,风量传感器指代可以检测该位置风量大小的传感器,陀螺仪传感器为可以检测该检测位置水平移动程度或者说形变程度的传感器,震动传感器为检测该检测位置的震动强度的传感器。在本实施例中,不对上述传感器的类型和种类进行限制。
在一般的服务器系统中,可以由BMC(Baseboard Management Controller,基板管理控制器)负责服务器的硬件部件的状态检测、部件通讯与调控。但是BMC的控制是纯软件控制的,缺乏额外的传感器和硬件接口系统。换句话说,BMC对主板上的硬件部件的检测主要依据主板内各个部件主动上报的状态数据,如果该部件本身出现问题或无法上报信息,或BMC出现异常或失效,则无法获取到真实的主板状态数据,不仅会造成无法完成部件检测,还会造成服务器系统内相关部件失去控制。这是因为,硬件设计往往有自己的应急机制,例如,在CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件)或者BIOS(Basic Input Output System,基本输入输出系统)硬件控制逻辑中,如果BMC对风扇失去控制,则会直接将风扇转速拉满。相比于BMC控制系统,本实施例提出了在主板上安装独立的传感器模块,从而利用额外的传感器对主板的各项状态进行检测,避免了因为主板上硬件模块自身失效,无法上传数据,导致检测系统直接失灵的问题。
在一种实施例中,在所述待检测区域为所述主板边角区域或所述主板延伸区域的情况下,所述传感器模块至少包括:所述陀螺仪传感器和所述温度传感器;
在本实施例中,在待检测区域为主板边角区域或主板延伸区域时,容易因为碰撞等原因产生形变,所以需要利用陀螺仪传感器检测该区域的形变程度,此外,由于边角区域和延伸区域为主板的边缘位置,往往是主板中温度较低的区域,本实施例提出利用温度传感器检测该区域的温度高低,当该区域的温度较高时,表示主板整体的温度偏高。
在所述待检测区域为所述风扇震动中心区域的情况下,所述传感器模块至少包括:所述电压传感器,所述电流传感器,所述风量传感器和所述震动传感器;
在本实施例中,在待检测区域为风扇震动中心区域时,该区域因为靠近风扇,通风量较大,需要利用风量传感器检测通风量的大小,避免风扇损坏导致主板内通风变差,温度升高。该区域受到风扇震动的影响较大,还需要安装震动传感器,检测风扇震动情况,避免风扇出现异常震动,导致主板中元器件松动。该区域靠近风扇位置,可以利用电压传感器和电流传感器检测风扇的电压电流与稳压电容的稳定性情况,避免电压和电流出现异常波动,超出额定限值等情况。
在所述待检测区域为所述重点功耗器件外围区域的情况下,所述传感器模块至少包括:所述电压传感器,所述电流传感器,所述温度传感器和所述陀螺仪传感器。
在本实施例中,在待检测区域为重点功耗器件外围区域时,该区域因为设置有CPU等功耗器件,该器件的电流较大,使得主板的覆铜流通电流较大,温度较高,同样容易造成主板形变,所以需要通过陀螺仪传感器检测主板的形变状态,以及需要温度传感器检测该区域的温度变化。此外,还可以利用电压传感器和电流传感器通过该功耗器件的端口检测该器件的工作电压和工作电流,避免电压电流出现异常,超出额定值。
在一种实施例中,所述待检测区域包括为所述传感器模块预留的安装位置和检测端口;所述检测端口用于获取布设在所述安装位置的所述传感器模块采集的数据。
在本实施例中,为了将传感器模块嵌入待检测主板中,需要在待检测主板的设计阶段,需要预先为各个传感器模块预留对应的安装位置和检测端口。具体的,需要确定每个待检测区域的传感器模块的组成,从而通过预先的模块化嵌入设计,确定为该传感器模块预留的位置和传感器接口。此外,根据该传感器模块包括的传感器,确定需要为该传感器模块预留的检测端口。示例性的,该传感器模块中设置有电压传感器,用于检测CPU的电压值,则在该待检测区域,为模块预留对应的CPU电压端口,以对接电压传感器,便于布设的该电压传感器获取CPU的电压数值。又或者,该传感器模块中设置有电流传感器,用于检测风扇的电流,则在该待检测区域,为模块预留对应的风扇电流端口,以对接电流传感器,便于布设的该电流传感器获取风扇的电流数值。
在一种实施例中,所述传感器模块包括单独的供电模块和控制芯片,所述控制芯片用于独立控制所述传感器模块的数据采集、传输、存储。
在本实施例中,为每个传感器模块提供单独的供电模块,由此使得传感器模块是独立于待检测主板的,不需要由该待检测主板为其提供电能,则该模块不会受到主板的影响,当主板异常导致服务器宕机时,本实施例提出的检测系统仍然能够正常运行,保证了检测系统的稳定性。此外,所述传感器模块还包括控制芯片,具体的,可以为一颗小型的MSP430芯片,用于控制该传感器模块的数据采集、存储、以及与上位机的通讯和数据传输。参照图3,图3示出了一种传感器模块的结构示意图,如图3所示,每个传感器模块中包括一个或多个传感器,用于采集该区域的状态数据,然后由控制芯片,控制传感器模块中的通讯模块,将采集得到的数据上传至上位机,控制传感器模块中的存储模块,将采集得到的数据进行暂时存储。此外,由独立的供电模块为各个传感器进行供电。
在一种实施例中,所述上位机还包括报警模块,所述报警模块用于在所述健康状态结果为主板状态异常的情况下,发送报警信息至相关工作人员的终端。
在本实施例中,上位机得到健康状态结果后,可以直接在该计算机上进行显示,便于相关工作人员了解主板的状态。因为主板的工作状况较为恶劣,影响主板寿命主要是因为运行过程中的风扇震动,部件的高温,器件的大电压,大电流的影响,对主板的形变,部件老化与线路板的寿命产生影响。根据上述实施例中的状态数据采集,通过上位机中的计算模块分析,得到待检测主板的健康状态结果,该健康状态结果包括主板上的关键器件的工作状态是否稳定,以及对该主板的剩余使用寿命的预估。在健康状态结果为主板状态异常时,可以通过上位机中的报警模块,向相关工作人员的终端发送报警信息,以提示对该主板进行检修,起到预警的作用。具体的,该报警信息可以包括待检测位置以及具体的异常原因和情况,示例性的,报警信息为:主板边角1区域-轻微变形-陀螺仪传感器采集到的数值;又或者,可以为:CPU外围区域-温度过高-温度传感器采集到的温度值。
在一种实施例中,所述上位机还包括:
数据存储模块,用于将多个所述传感器模块上传的所述待检测区域的状态数据,分别存储为对应的所述待检测区域的历史状态数据;
模型训练模块,用于利用所述待检测区域的历史状态数据和所述健康状态结果,对该待检测区域所对应的数据分析模型进行训练。
在本实施例中,对于上位机中的数据分析模型,是利用采集到的实际状态数据训练得到的。在完成本次主板状态检测后,可以将采集到的状态数据和生成的健康状态结果存储为历史状态数据,作为数据分析模型训练的样本数据。这样,在实际应用中,还能够利用历史状态数据,实现对数据分析模型的不断优化,使得该模型能够输出更加准确的状态评估结果。
以下通过一个示例对本实施例提出的主板状态检测系统进行说明。
参照图4,图4示出了一种主板的待检测区域的分布示意图,图4中的位置A,B,C,E,F,G,H,I表示多个待检测区域,传感器模块分别重点监控与采集对应的待检测区域的主板信息以及数据;
图4中的待检测区域A,B均位于主板的上测靠近风扇测,该位置同时处于主板的边角,该位置下的主板通风量较大,对应的,该待检测区域放置的传感器模块中包括:温度传感器,风量传感器,陀螺仪传感器,电压传感器、和电流传感器,以重点采集该位置的风扇的风速,风量,风扇的电压,电流,以及主板该位置边角的形变,震动与偏移。
图4中的待检测区域F,G位于出风测的CPU位置,对应的,该待检测区域放置的传感器模块中包括:温度传感器,陀螺仪传感器,电压传感器、和电流传感器,以检测CPU的电压,电流,和外围温度。在该区域,由于CPU的电流较大,主板的覆铜流通电流较大,主板的温度较大,同样易产生形变,所以通过陀螺仪传感器检测CPU外围主板的形变状态。
图4中的待检测区域C,位于主板一角与OCP 3.0板卡的插卡处,该待检测区域的传感器模块包括:温度传感器和陀螺仪传感器,主要收集该区域的温度,并监控该板卡角落的形变。
图4中的待检测区域E,位于电源PSU的输入口,该待检测区域放置的传感器模块主要包括:陀螺仪传感器、温度传感器、电压传感器和电流传感器,以检测该位置的温度、形变、电源的输出电压以及电流。
图4中的待检测区域H与I,位于主板的边缘一侧,该待检测区域的:传感器模块主要包括陀螺仪传感器、风量传感器与温度传感器,用于检测该区域的形变、出风量与出风口温度。
各个传感器模块分别采集对应的待检测区域的主板状态数据,并通过通讯线上传至上位机,由上位机根据汇总的数据,利用数据分析模型和计算模块进行分析,判断主板的状态并预估主板的剩余使用寿命。
根据在待检测区域A,B采集的状态数据:风扇端口的电压,电流,温度信息,稳定性,确定当前风扇端口主板供电以及状况的稳定性。根据陀螺仪传感器以及震动传感器采集的状态数据,确定主板该区域的位移情况,以及主板是否处于稳定震动状态,通过与初始震动状态进行对比,绘制其变换状态曲线。
根据在待检测区域F,G采集的状态数据:CPU端口的电压,电流,温度信息,确定主板对于该CPU的供电稳定性,通过在该区域设置的陀螺仪传感器采集的状态数据,确定当前主板该区域的水平形变状况,与受温度的影响状况。
根据在待检测区域C采集的状态数据:OCP卡外围区域的温度,边角的形变状态数据与震动的状态数据,评估主板的形变寿命,绘制对应的形变-使用寿命曲线。
根据在待检测区域E采集的状态数据:电源PSU的输出电压和电流,从而收集主板的整体的电流输入信息以及电压的输入稳定性监控,通过温度传感器采集到的电源入风口的温度数据,来预判该区域的电源模块本身是否具有散热的风险,通过陀螺仪传感器采集的状态数据,确定该区域的电源模块本身是否对主板造成形变影响。
根据在待检测区域H与I采集到的状态数据:出风口温度与出风量,绘制该主板整体的散热状况与工况分析,与入风口对比,形成主板的产热与散热状况的评估,同时根据陀螺仪传感器采集的状态数据,对待区域的主板的形变进行预警。
对应的数据分析模型根据采集得到的状态数据,进行处理得到分析结果,确定所检测的待检测区域是否属于正常工作状态,以及该待检测区域中的目标元器件的剩余使用寿命。然后,由计算模块综合分析结果,得到主板的健康状态结果,预估的主板的剩余使用寿命。
本实施例还提供了一种主板状态检测方法,参照图5,图5示出了一种主板状态检测方法的步骤流程图,如图5所示,所述方法包括:
步骤S101,通过安装于待检测主板上的多个待检测区域的传感器模块,获取各个所述待检测区域的状态数据;所述待检测区域至少包括所述待检测主板的主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种;
步骤S102,将各个所述待检测区域的状态数据和该待检测区域的历史状态数据,输入该待检测区域对应的数据分析模型,得到各个所述待检测区域的分析结果;
步骤S103,根据各个所述待检测区域的分析结果,确定所述待检测主板的健康状态结果。
在一种实施例中,所述方法还包括:根据所述传感器模块所在的所述待检测区域的位置和功能确定所述传感器模块的组成,所述传感器的组成为电压传感器,电流传感器,温度传感器,风量传感器,陀螺仪传感器,震动传感器中的一种或多种。
在一种实施例中,所述根据所述传感器模块所在的所述待检测区域的位置和功能确定所述传感器模块的组成,包括:
在所述待检测区域为所述主板边角区域或所述主板延伸区域的情况下,将所述传感器模块的组成确定为:所述陀螺仪传感器和所述温度传感器;
在所述待检测区域为所述风扇震动中心区域的情况下,将所述传感器模块的组成确定为:所述电压传感器,所述电流传感器,所述风量传感器和所述震动传感器;
在所述待检测区域为所述重点功耗器件外围区域的情况下,将所述传感器模块的组成确定为:所述电压传感器,所述电流传感器,所述温度传感器和所述陀螺仪传感器。
在一种实施例中,所述待检测区域包括为所述传感器模块预留的安装位置和检测端口,获取各个所述待检测区域的状态数据,包括:
通过所述检测端口获取布设在所述安装位置的所述传感器模块采集的数据。
在一种实施例中,在所述健康状态结果为主板状态异常的情况下,发送报警信息至相关工作人员的终端。
在一种实施例中,所述方法还包括:将多个所述传感器模块上传的所述待检测区域的状态数据,分别存储为对应的所述待检测区域的历史状态数据;
利用所述待检测区域的历史状态数据和所述健康状态结果,对该待检测区域所对应的数据分析模型进行训练。
本发明实施例还提供了一种电子设备,参照图6,图6是本申请实施例提出的电子设备的示意图。如图6所示,电子设备100包括:存储器110和处理器120,存储器110与处理器120之间通过总线通信连接,存储器110中存储有计算机程序,该计算机程序可在处理器120上运行,进而实现本发明实施例公开的一种主板状态检测方法中的步骤。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现如本发明实施例公开的一种主板状态检测方法中的步骤。
本发明实施例还提供了一种计算机程序产品,所述计算机程序产品在电子设备上运行时,使处理器执行时实现本发明实施例公开的一种主板状态检测方法中的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、装置、电子设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种主板状态检测系统、方法、电子设备和存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种主板状态检测系统,其特征在于,该系统包括:上位机和多个传感器模块;
所述传感器模块安装于待检测主板上的多个待检测区域,用于采集各个所述待检测区域的状态数据,所述待检测区域至少包括所述待检测主板的主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种;
所述传感器模块通过所述通讯线将多个所述待检测区域的状态数据上传至所述上位机;
所述上位机中设置有计算模块,所述计算模块用于根据各个数据分析模型输出的分析结果,生成所述待检测主板的健康状态结果,各个所述数据分析模型用于根据接收到的对应的所述待检测区域的状态数据和该待检测区域的历史状态数据,得到所述分析结果。
2.根据权利要求1所述的主板状态检测系统,其特征在于,所述传感器模块的组成为电压传感器,电流传感器,温度传感器,风量传感器,陀螺仪传感器,震动传感器中的一种或多种,所述传感器模块的组成,是根据该传感器模块所在的所述待检测区域的位置和功能确定的。
3.根据权利要求1所述的主板状态检测系统,其特征在于,在所述待检测区域为所述主板边角区域或所述主板延伸区域的情况下,所述传感器模块至少包括:所述陀螺仪传感器和所述温度传感器;
在所述待检测区域为所述风扇震动中心区域的情况下,所述传感器模块至少包括:所述电压传感器,所述电流传感器,所述风量传感器和所述震动传感器;
在所述待检测区域为所述重点功耗器件外围区域的情况下,所述传感器模块至少包括:所述电压传感器,所述电流传感器,所述温度传感器和所述陀螺仪传感器。
4.根据权利要求1所述的主板状态检测系统,其特征在于,所述待检测区域包括为所述传感器模块预留的安装位置和检测端口;所述检测端口用于获取布设在所述安装位置的所述传感器模块采集的数据。
5.根据权利要求1所述的主板状态检测系统,其特征在于,所述传感器模块包括单独的供电模块和控制芯片,所述控制芯片用于独立控制所述传感器模块的数据采集、传输、存储。
6.根据权利要求1所述的主板状态检测系统,其特征在于,所述上位机还包括报警模块,所述报警模块用于在所述健康状态结果为主板状态异常的情况下,发送报警信息至相关工作人员的终端。
7.根据权利要求1所述的主板状态检测系统,其特征在于,所述上位机还包括:
数据存储模块,用于将多个所述传感器模块上传的所述待检测区域的状态数据,分别存储为对应的所述待检测区域的历史状态数据;
模型训练模块,用于利用所述待检测区域的历史状态数据和所述健康状态结果,对该待检测区域所对应的数据分析模型进行训练。
8.一种主板状态检测方法,其特征在于,所述方法包括:
通过安装于待检测主板上的多个待检测区域的传感器模块,获取各个所述待检测区域的状态数据;所述待检测区域至少包括所述待检测主板的主板边角区域、风扇震动中心区域、主板延伸区域,功耗器件外围区域中的一种或多种;
将各个所述待检测区域的状态数据和该待检测区域的历史状态数据,输入该待检测区域对应的数据分析模型,得到各个所述待检测区域的分析结果;
根据各个所述待检测区域的分析结果,确定所述待检测主板的健康状态结果。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求8所述的主板状态检测方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求8所述的主板状态检测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211710429.0A CN116185748A (zh) | 2022-12-29 | 2022-12-29 | 一种主板状态检测系统、方法、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211710429.0A CN116185748A (zh) | 2022-12-29 | 2022-12-29 | 一种主板状态检测系统、方法、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116185748A true CN116185748A (zh) | 2023-05-30 |
Family
ID=86435662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211710429.0A Pending CN116185748A (zh) | 2022-12-29 | 2022-12-29 | 一种主板状态检测系统、方法、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116185748A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117675986A (zh) * | 2023-12-21 | 2024-03-08 | 上海大帜信息技术有限公司 | 一种用于智能手机主板的测试方法及测试系统 |
-
2022
- 2022-12-29 CN CN202211710429.0A patent/CN116185748A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117675986A (zh) * | 2023-12-21 | 2024-03-08 | 上海大帜信息技术有限公司 | 一种用于智能手机主板的测试方法及测试系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5079878B2 (ja) | 遠隔監視装置 | |
US6928560B1 (en) | Distributed power control system | |
US9355010B2 (en) | Deriving an operational state of a data center using a predictive computer analysis model | |
CN112286709B (zh) | 一种服务器硬件故障的诊断方法、诊断装置及诊断设备 | |
CN110119128B (zh) | 一种用于实验室用电设备的监控管理系统 | |
US20180120914A1 (en) | Unified power device management and analyzer | |
JP2018139104A (ja) | 物理ベース及びデータ駆動型モデルを使用した、ビークルからの妨害的異常表示の削減 | |
CN116185748A (zh) | 一种主板状态检测系统、方法、电子设备和存储介质 | |
CN112069035A (zh) | 用于机箱的ipmi板卡健康管理系统以及健康监控方法 | |
CN111124827A (zh) | 一种设备风扇的监控装置及监控方法 | |
CN104660440A (zh) | 一种刀片服务器管理系统及其控制方法 | |
CN112667470A (zh) | 一种服务器功率评估及检测的系统、方法及介质 | |
JP5584253B2 (ja) | 遠隔監視装置 | |
CN116424096A (zh) | 资源动态优化配置的新能源汽车电池采集总成方法及系统 | |
CN107943654A (zh) | 一种快速判定服务器环境温度监控异常原因的方法 | |
KR101889739B1 (ko) | Smt 생산라인 설비 이상 진단 시스템의 최적 배치 시스템 및 방법 | |
Zhang et al. | On demand cooling with real time thermal information | |
CN115237719A (zh) | 一种服务器电源可靠性的预警方法及系统 | |
Zhang et al. | Real time thermal management controller for data center | |
CN114265324A (zh) | 设备运行状态的监测方法、装置及终端设备 | |
CN117493129B (zh) | 一种计算机控制设备的运行功率监测系统 | |
CN115865634B (zh) | 功能模块的控制方法及装置、服务器 | |
KR102587617B1 (ko) | 선박의 모터 부하를 모니터링하는 시스템 및 방법 | |
KR20240070066A (ko) | 지능형 비엠씨의 센서 데이터 예측을 통한 서버 이상 감지 시스템 및 방법 | |
CN114116395B (zh) | 一种老化室供电线路功率过载防护方法、系统及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |