CN111966555A - 一种基于热成像技术的服务器智能调温与故障检测系统和方法 - Google Patents
一种基于热成像技术的服务器智能调温与故障检测系统和方法 Download PDFInfo
- Publication number
- CN111966555A CN111966555A CN202010909364.7A CN202010909364A CN111966555A CN 111966555 A CN111966555 A CN 111966555A CN 202010909364 A CN202010909364 A CN 202010909364A CN 111966555 A CN111966555 A CN 111966555A
- Authority
- CN
- China
- Prior art keywords
- server
- temperature
- fault
- heat dissipation
- processing chip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001931 thermography Methods 0.000 title claims abstract description 31
- 238000001514 detection method Methods 0.000 title claims abstract description 30
- 238000005516 engineering process Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 82
- 230000017525 heat dissipation Effects 0.000 claims abstract description 50
- 238000003384 imaging method Methods 0.000 claims abstract description 31
- 230000033228 biological regulation Effects 0.000 claims abstract description 20
- 230000005855 radiation Effects 0.000 claims abstract description 19
- 238000013024 troubleshooting Methods 0.000 claims abstract description 9
- 238000001816 cooling Methods 0.000 claims description 13
- 239000007788 liquid Substances 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims 1
- 230000026676 system process Effects 0.000 claims 1
- 238000012544 monitoring process Methods 0.000 abstract description 11
- 238000013461 design Methods 0.000 abstract description 5
- 206010063385 Intellectualisation Diseases 0.000 abstract 1
- 230000002159 abnormal effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009529 body temperature measurement Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003331 infrared imaging Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012634 optical imaging Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J5/00—Radiation pyrometry, e.g. infrared or optical thermometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/28—Testing of electronic circuits, e.g. by signal tracer
- G01R31/2851—Testing of integrated circuits [IC]
- G01R31/2855—Environmental, reliability or burn-in testing
- G01R31/2856—Internal circuit aspects, e.g. built-in test features; Test chips; Measuring material aspects, e.g. electro migration [EM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2273—Test methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J5/00—Radiation pyrometry, e.g. infrared or optical thermometry
- G01J2005/0077—Imaging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Environmental & Geological Engineering (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Radiation Pyrometers (AREA)
Abstract
本发明公开了一种基于热成像技术的服务器智能调温与故障检测系统和方法,涉及服务器系统设计领域。所述系统包括服务器、红外探测器及成像设备;服务器包括主板和FPGA处理芯片,FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;红外探测器安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片及成像设备;成像设备用于显示服务器的红外热像图进行故障排查。本发明将热成像技术应用在服务器温度控制领域,把服务器散热系统和故障检测系统结合为一体,从而将温度监控覆盖到整个服务器,实现服务器故障检测和调温散热的智能化,提升了监控效率,节约了资源。
Description
技术领域
本发明实施例涉及服务器系统设计领域,具体来说涉及一种基于热成像技术的服务器智能调温与故障检测系统和方法。
背景技术
随着服务器行业及相关技术的发展,其设计越来越复杂,集成度也越来越高,服务器中需运行更多更复杂的程序及存储海量的数据,高速运行的CPU及PCH等模块也需要更高效的散热系统,这就要求更完善的服务器故障检测和调温系统。热成像技术是利用红外探测器和光学成像物镜接收被测目标的红外辐射能量分布图形反射到红外探测器的光敏器件上,由此产生红外热像图将不可见变为可见,从而根据热图像上的不同颜色显示被测物体的不同温度。随着红外成像技术的发展,红外热像仪的灵敏度和热分辨率越来越高,可以对目标进行远距离热状态成像和测温并实现智能分析。目前热成像技术已应用在电路故障检测领域,实现对故障元器件进行精准定位。当线路短路或开路时,元器件的能耗发生变化,这会直接影响元器件的温度,与正常状态下的红外热像图进行对比就能分辨出故障器件和线路。
目前,服务器硬件故障诊断使用的方法是通过BMC web抓取各类报错信息,再针对这些报错采取相应的接触式测量,获取信号质量及状态信息以具体排查硬件方面的错误。而在温度监控方面,在服务器设计过程中应用多种温度传感器以全面监测各部分温度,用户可以在BMC web上读取各类温度,风扇也会根据BMC抓取到的温度调整速度以散热并实现温度的调控。但其还存在以下不足之处:
1)在故障检测方面,首先,BMC告警只能监测到服务器发生了某一类故障,例如某个电的电平异常及系统异常掉电等,提醒工程师服务器发生的故障现象,但不能将其定位在具体的器件上,工程师仍然需要针对现象目测电路板是否有撞件现象,用万用表进行电压量测或者使用示波器进行波形抓取。这种接触式的测量无法远程对客户机房中发生的问题进行分析,同时需要工程师具有较高的专业知识并对服务器电路图的设计充分把握。其次,这种方式只能在故障发生之后处理,无法对其进行预判,有些硬件线路问题在上电开机后可能会烧坏整块主板,需要在上电前排查这类问题,而BMC无法对其进行检测。
2)在温度调控方面,当前技术的缺点主要体现在以下几个方面:使用BMC实时显示从服务器各处的温度传感器抓取到的温度,轮询速度为秒级,存在很大延时;在服务器主板及其他板卡上布局一定的温度传感器,反映服务器各个重要模块的温度,主要包括入风口、出风口、背板等,只能笼统的反映当前的系统温度,主要需要CPU及内存等部件自带的温度传感器监测具体位置的温度,无法覆盖到服务器各个位置;服务器的散热系统有自动调速功能,针对温度传感器获取的温度进行判断,当达到设定的温度阈值时会加大散热效率,当温度回落后将减小散热效率,散热系统针对服务器温度变化采取的散热措施存在延时,无法精确进行散热方案的调整。
3)故障检测和温度调控分属两个不同的系统,增大了设计的复杂度。
发明内容
本发明实施例提供了一种基于热成像技术的服务器智能调温与故障检测系统和方法,解决服务器硬件线路故障检测不全面、温度监控覆盖面小及散热方案调整不及时的问题,并将故障检测和温度调控系统合并,提升监控效率。
为实现上述目的,本发明公开了如下技术方案:
一方面,本发明提供一种基于热成像技术的服务器智能调温与故障检测系统,所述系统包括服务器、红外探测器及成像设备;
服务器包括主板和FPGA处理芯片,FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;
红外探测器安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片及成像设备;
成像设备用于显示服务器的红外热像图。
基于上述方案,进一步的,所述服务器还包括BMC及散热系统,FPGA处理芯片接收服务器各器件的温度信息,然后提供相应的调温方案或故障解决方案给散热系统,并将各器件温度信息及故障器件信息传递给BMC。
进一步的,所述散热系统包括风扇或液冷装置。
进一步的,所述系统还包括终端,终端用于接收BMC传递的各器件温度信息及故障器件信息,并将处理意见反馈至BMC。
如上所述的系统,当服务器某器件温度异常升高时,FPGA处理芯片提供相应的故障解决方案给散热系统,散热系统通知服务器各个模块器件保存正在运行的程序和数据,有序进行故障处理,并将故障器件的脚位或线路信息通过BMC传递给终端,一方面给设备提供充分的缓冲时间保存数据,防止异常断电造成数据丢失,最小化减少损失,另一方面给用户提供反应时间,及时进行故障处理。当服务器各器件温度正常升高时,FPGA处理芯片制定合适的散热方案传递给散热系统,散热系统针对不同的器件进行散热处理,保证各模块温度均衡且保持在稳定的范围内,同时FPGA处理芯片将各器件温度信息传递给BMC。
进一步的,如上所述的系统,在服务器上电前,通过成像设备观察服务器的红外热像图进行故障排查,服务器上电后,通过FPGA处理芯片进行温度信息分析处理。
另一方面,本发明提供一种基于热成像技术的服务器智能调温与故障检测方法,所述方法包括以下步骤:
采用红外探测器吸收服务器各器件的红外辐射,将其转换为电信号后传输给FPGA处理芯片及成像设备;
通过成像设备观察服务器的红外热像图进行服务器故障排查;
FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理。
基于上述方法,进一步的,所述FPGA处理芯片进行调温或故障处理,包括提供相应的调温方案或故障解决方案给散热系统,并将各器件温度信息及故障器件信息传递给BMC,具体包括下述步骤:
当服务器某器件温度异常升高时,FPGA处理芯片提供相应的故障解决方案给散热系统,散热系统通知服务器各个模块器件保存正在运行的程序和数据,有序进行故障处理,并将故障器件的脚位或线路信息通过BMC传递给终端;
当服务器各器件温度正常升高时,FPGA处理芯片制定合适的散温方案传递给散热系统,散热系统针对不同的器件进行散热处理,同时FPGA处理芯片将各器件温度信息传递给BMC。
如上所述的方法,还包括下述步骤:
终端接收BMC传递的各器件温度信息及故障器件信息,并将处理意见反馈至BMC。
进一步的,如上所述的方法,在服务器上电前,通过成像设备观察服务器的红外热像图进行故障排查,服务器上电后,通过FPGA处理芯片进行温度信息分析处理。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本申请实施例提供的一种基于热成像技术的服务器智能调温与故障检测系统,系统包括服务器、红外探测器及成像设备;服务器包括主板和FPGA处理芯片,FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;红外探测器安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片及成像设备;成像设备用于显示服务器的红外热像图进行故障排查。本方案将热成像技术应用在服务器温度控制领域,改进了服务器获取各部件温度的方式,将服务器散热系统和故障检测系统结合为一体,从而将温度监控覆盖到整个服务器,实现服务器故障检测和调温散热的智能化,提高了温度检测的灵敏度以及故障定位的及时性和准确性,提升了监控效率,节约了资源。本方案还可设计为将红外热像图的输出与BMC web结合,实现从BMC web上直接观察服务器的红外热像图。
本申请实施例提供的一种基于热成像技术的服务器智能调温与故障检测方法,可采用所述的基于热成像技术的服务器智能调温与故障检测系统,并取得上文所述的技术效果。
附图说明
此处的附图被并入说明书中并构成说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的一种基于热成像技术的服务器智能调温与故障检测系统结构示意图;
图2为图1中服务器的内部信号传输关系示意图;
图3为本申请实施例提供的一种基于热成像技术的服务器智能调温与故障检测方法流程示意图;
附图标记:
1-服务器,11-FPGA处理芯片,12-BMC,13-BIOS散热系统,2-红外探测器,3-成像设备,4-终端。
具体实施方式
为使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
为了方便对实施例的理解,下面对实施例中涉及的缩略词和关键术语予以解释和说明。
BMC:Baseboard Manager Controller,基板管理控制器;
PCH:Platform Controller Hub,平台控制器中心;
BIOS:Basic Input Output System,基本输入输出系统;
FPGA:Field Programmable Gate Array,现场可编程逻辑门阵列。
图1示出了本发明实施例一种基于热成像技术的服务器智能调温与故障检测系统结构示意图,图2示出了图1中服务器的内部信号传输关系示意图。
参照图1、图2,本实施例的基于热成像技术的服务器智能调温与故障检测系统,包括服务器1、红外探测器2及成像设备3;
服务器1包括主板和FPGA处理芯片11,FPGA处理芯片11接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;
红外探测器2安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片11及成像设备3;
成像设备3用于显示服务器的红外热像图。
具体的,如图2所示,服务器1还包括BMC12及BIOS散热系统13,FPGA处理芯片11接收服务器各器件的温度信息,然后提供相应的调温方案或故障解决方案给BIOS散热系统13,并将各器件温度信息及故障器件信息传递给BMC12。散热系统13具体包括风扇或液冷装置。
进一步的,所述系统还包括终端4,终端4用于接收BMC12传递的各器件温度信息及故障器件信息,并将处理意见反馈至BMC12,BMC12进一步将用户指示传递给BIOS散热系统13。
本实施例系统工作时,红外探测器2中的红外吸收层吸收服务器器件发出的红外辐射后发生温度变化,引起其内部热敏电阻的阻值变化,再通过CMOS读出电路将阻值变化转变为差分电流并放大,然后成像设备3对放大后的差分电流进行采样,得到红外热像图中各个像元的灰度值进行成像,进而显示服务器1的红外热像图。在服务器上电前,通过成像设备3观察服务器的红外热像图,排查服务器1是否有撞件、短路等异常现象,防止上电后烧坏板卡造成损失。
服务器上电前,可通过成像设备3观察服务器的红外热像图,排查服务器1是否有撞件、短路等异常现象,防止上电后烧坏板卡造成损失。
服务器上电后,红外探测器2通过模数转换电路将形成的各器件温度信息转换为数字信号后,通过线缆传递给服务器上的FPGA处理芯片11。FPGA处理芯片接收红各器件的温度信息,并与提前录入的各坐标器件信息、器件正常工作状态下的温度和能够正常工作的温度阈值进行对比。当检测到某器件的信息异常时,根据温度的高低判断出现的故障问题,并提供相应的故障解决方案给散热系统,散热系统通知服务器各个模块器件保存正在运行的程序和数据,有序进行故障处理,并将故障器件的脚位或线路信息通过BMC传递给终端,一方面给设备提供充分的缓冲时间保存数据,防止异常断电造成数据丢失,最小化减少损失,另一方面给用户提供反应时间,及时进行故障处理。
FPGA处理芯片11将各坐标的温度整合成模块温度信息,当器件温度升高且升温速度在正常范围之内时,及时根据各模块温度差异进行分析,制定合适的散热方案传递给散热系统13,散热系统1针对不同的器件进行散热处理,保证各模块温度均衡且保持在稳定的范围内,同时FPGA处理芯片将各器件温度信息传递给BMC。
作为本实施例系统的一种改进方案,服务器开始使用后,由于机房内服务器节点数量较多,且随着环境变化和使用情况的变化,正常工作时的热像图也会不断发生变化,如果仍然使用提前录入的热像图作为对比数据来判断服务器是否发生故障或散热方案是否需要变更,很有可能发生误判而影响机器正常使用。为了解决这一问题,可以将机房内同时监测到的服务器温度状态进行对比,互相作为对比验证的样本,统计出状态不同的小概率事件作为异常项再进行处理,将大大提高该系统的容错性。
图3示出了本发明实施例提供的一种基于热成像技术的服务器智能调温与故障检测方法流程示意图。
参照图3,本实施例的基于热成像技术的服务器智能调温与故障检测方法,包括以下步骤:
S1、采用红外探测器吸收服务器各器件的红外辐射,将其转换为电信号后传输给FPGA处理芯片及成像设备;
S2、通过成像设备观察服务器的红外热像图进行服务器故障排查;
S3、FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理。
进一步的,所述FPGA处理芯片进行调温或故障处理,包括提供相应的调温方案或故障解决方案给散热系统,并将各器件温度信息及故障器件信息传递给BMC,具体包括下述步骤:
当服务器某器件温度异常升高时,FPGA处理芯片提供相应的故障解决方案给散热系统,散热系统通知服务器各个模块器件保存正在运行的程序和数据,有序进行故障处理,并将故障器件的脚位或线路信息通过BMC传递给终端;
当服务器各器件温度正常升高时,FPGA处理芯片制定合适的散温方案传递给散热系统,散热系统针对不同的器件进行散热处理,同时FPGA处理芯片将各器件温度信息传递给BMC。
进一步的,本实施例的方法,还包括下述步骤:
终端接收BMC传递的各器件温度信息及故障器件信息,并将处理意见反馈至BMC,BMC进一步将用户指示传递给BIOS散热系统13。
进一步的,上述方法在服务器上电前,通过成像设备观察服务器的红外热像图进行故障排查,在服务器上电后,通过FPGA处理芯片进行温度信息分析处理。
本申请实施例提供的一种基于热成像技术的服务器智能调温与故障检测方法中未详述的内容,可参照上述实施例中提供的基于热成像技术的服务器智能调温与故障检测系统,在此不再赘述。
本申请实施例提供的一种基于热成像技术的服务器智能调温与故障检测方法及系统,将热成像技术与服务器的监控系统相结合,把温度监控覆盖到整个服务器,实现了服务器故障检测和调温散热的智能化,解决了服务器硬件线路故障监控不全面、不及时、温度监控覆盖面小以及散热方案调整不及时的问题,避免了因机箱内温度过高导致功耗增大的情况,且减少了因服务器线路故障造成的损失。
以上所述仅为本发明的较佳实施例而已,并不用以限定本发明,对于本技术领域的技术人员来说,在不脱离本发明原理的前提下所作的任何修改、改进和等同替换等,均包含在本发明的保护范围内。
Claims (10)
1.一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,包括服务器、红外探测器及成像设备;
服务器包括主板和FPGA处理芯片,FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理;
红外探测器安装在服务器主板上,用于吸收服务器各器件的红外辐射并将其转换为电信号后传输给FPGA处理芯片及成像设备;
成像设备用于显示服务器的红外热像图。
2.根据权利要求1所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,所述服务器还包括BMC及散热系统,FPGA处理芯片接收服务器各器件的温度信息,然后提供相应的调温方案或故障解决方案给散热系统,并将各器件温度信息及故障器件信息传递给BMC。
3.根据权利要求2所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,所述散热系统包括风扇或液冷装置。
4.根据权利要求2所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,所述系统还包括终端,终端用于接收BMC传递的各器件温度信息及故障器件信息,并将处理意见反馈至BMC。
5.根据权利要求4所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,当服务器某器件温度异常升高时,FPGA处理芯片提供相应的故障解决方案给散热系统,散热系统通知服务器各个模块器件保存正在运行的程序和数据,有序进行故障处理,并将故障器件的脚位或线路信息通过BMC传递给终端。
6.根据权利要求2所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,当服务器各器件温度正常升高时,FPGA处理芯片制定合适的散热方案传递给散热系统,散热系统针对不同的器件进行散热处理,同时FPGA处理芯片将各器件温度信息传递给BMC。
7.根据权利要求1所述的一种基于热成像技术的服务器智能调温与故障检测系统,其特征在于,服务器上电前,通过成像设备观察服务器的红外热像图进行故障排查,服务器上电后,通过FPGA处理芯片进行温度信息分析处理。
8.一种基于热成像技术的服务器智能调温与故障检测方法,其特征在于,包括以下步骤:
采用红外探测器吸收服务器各器件的红外辐射,将其转换为电信号后传输给FPGA处理芯片及成像设备;
通过成像设备观察服务器的红外热像图进行服务器故障排查;
FPGA处理芯片接收红外探测器发送的服务器各器件的温度信息,并进行调温或故障处理。
9.根据权利要求8所述的一种基于热成像技术的服务器智能调温与故障检测方法,其特征在于,所述FPGA处理芯片进行调温或故障处理,包括提供相应的调温方案或故障解决方案给散热系统,并将各器件温度信息及故障器件信息传递给BMC。
10.根据权利要求9所述的一种基于热成像技术的服务器智能调温与故障检测方法,其特征在于,还包括下述步骤:
终端接收BMC传递的各器件温度信息及故障器件信息,并将处理意见反馈至BMC。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010909364.7A CN111966555A (zh) | 2020-09-02 | 2020-09-02 | 一种基于热成像技术的服务器智能调温与故障检测系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010909364.7A CN111966555A (zh) | 2020-09-02 | 2020-09-02 | 一种基于热成像技术的服务器智能调温与故障检测系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111966555A true CN111966555A (zh) | 2020-11-20 |
Family
ID=73392700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010909364.7A Withdrawn CN111966555A (zh) | 2020-09-02 | 2020-09-02 | 一种基于热成像技术的服务器智能调温与故障检测系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111966555A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114326999A (zh) * | 2021-12-30 | 2022-04-12 | 苏州浪潮智能科技有限公司 | 一种基于热成像散热调控的方法、系统、设备和存储介质 |
CN114403733A (zh) * | 2022-02-14 | 2022-04-29 | 向道全 | 一种基于红外故障检测的智能纸巾机 |
CN114563444A (zh) * | 2022-03-02 | 2022-05-31 | 湖南博匠信息科技有限公司 | 一种vpx设备散热性能测试方法及系统 |
CN115022162A (zh) * | 2022-05-23 | 2022-09-06 | 安徽英福泰克信息科技有限公司 | 一种云服务器故障查漏系统及方法 |
CN115047953A (zh) * | 2022-04-30 | 2022-09-13 | 苏州浪潮智能科技有限公司 | 一种服务器散热方法、系统、装置及介质 |
-
2020
- 2020-09-02 CN CN202010909364.7A patent/CN111966555A/zh not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114326999A (zh) * | 2021-12-30 | 2022-04-12 | 苏州浪潮智能科技有限公司 | 一种基于热成像散热调控的方法、系统、设备和存储介质 |
CN114326999B (zh) * | 2021-12-30 | 2023-07-14 | 苏州浪潮智能科技有限公司 | 一种基于热成像散热调控的方法、系统、设备和存储介质 |
CN114403733A (zh) * | 2022-02-14 | 2022-04-29 | 向道全 | 一种基于红外故障检测的智能纸巾机 |
CN114563444A (zh) * | 2022-03-02 | 2022-05-31 | 湖南博匠信息科技有限公司 | 一种vpx设备散热性能测试方法及系统 |
CN115047953A (zh) * | 2022-04-30 | 2022-09-13 | 苏州浪潮智能科技有限公司 | 一种服务器散热方法、系统、装置及介质 |
CN115047953B (zh) * | 2022-04-30 | 2023-08-08 | 苏州浪潮智能科技有限公司 | 一种服务器散热方法、系统、装置及介质 |
CN115022162A (zh) * | 2022-05-23 | 2022-09-06 | 安徽英福泰克信息科技有限公司 | 一种云服务器故障查漏系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111966555A (zh) | 一种基于热成像技术的服务器智能调温与故障检测系统和方法 | |
EP3408175B1 (en) | Utilising uavs for detecting defects in solar panel arrays | |
US11415464B2 (en) | Infrared thermal monitoring system for industrial application | |
CN113551775B (zh) | 基于红外热成像的设备故障在线监测报警方法和系统 | |
EP2804382B1 (en) | Reliability determination of camera fault detection tests | |
CN109781268A (zh) | 一种基于低成本红外热视技术的开关柜内重点部位温度监测系统 | |
WO2018221046A1 (ja) | 自動点検システムおよび自動点検システムの制御方法 | |
CN101809454A (zh) | 检测接触臂的接触部异常的异常检测装置 | |
CN101661658A (zh) | 红外图像探测报警装置 | |
CN103674286A (zh) | 一种基于红外图像的站内通信设备故障诊断方法 | |
WO2018061326A1 (ja) | 自動点検システム、自動点検システム用点検対象読取り装置および自動点検システムの制御方法 | |
US9158646B2 (en) | Abnormal information output system for a computer system | |
CN109698945A (zh) | 投影系统及其监控方法与显示系统及其监控方法 | |
CN109682481A (zh) | 一种基于红外热成像技术的监测设备与分析系统 | |
CN112798109A (zh) | 一种主板质量的检测评价装置 | |
Dumpert | Infrared techniques for printed circuit board (PCB) evaluation | |
US20110102190A1 (en) | Facilitating power supply unit management using telemetry data analysis | |
US7085681B1 (en) | Symbiotic interrupt/polling approach for monitoring physical sensors | |
JP5024966B2 (ja) | 電子装置の障害監視装置、障害監視方法および障害監視プログラム | |
KR102659945B1 (ko) | Gis 부분방전 검출 장치 및 시스템 | |
CN110058979A (zh) | 一种温度读取失败故障的监控方法、bmc及存储介质 | |
RU58245U1 (ru) | Терминал самообслуживания | |
KR101490632B1 (ko) | 열전 발전 시스템 점검 장치 및 점검 방법 | |
CN112543310A (zh) | 一种可视化双融合在线测温系统 | |
KR20230089894A (ko) | 테스트 신호를 이용한 빅데이터 기반의 엘이디 디스플레이 장치의 모니터링 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201120 |