CN116304956B - 一种芯片温度异常在线检测方法 - Google Patents

一种芯片温度异常在线检测方法 Download PDF

Info

Publication number
CN116304956B
CN116304956B CN202310538707.7A CN202310538707A CN116304956B CN 116304956 B CN116304956 B CN 116304956B CN 202310538707 A CN202310538707 A CN 202310538707A CN 116304956 B CN116304956 B CN 116304956B
Authority
CN
China
Prior art keywords
sensor
temperature
single core
radiation
sensors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310538707.7A
Other languages
English (en)
Other versions
CN116304956A (zh
Inventor
高新愿
杨新光
魏涛
金忠
邓伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jining Institute Of Quality Measurement Inspection And Testing Jining Semiconductor And Display Product Quality Supervision And Inspection Center Jining Fiber Quality Monitoring Center
Original Assignee
Jining Institute Of Quality Measurement Inspection And Testing Jining Semiconductor And Display Product Quality Supervision And Inspection Center Jining Fiber Quality Monitoring Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jining Institute Of Quality Measurement Inspection And Testing Jining Semiconductor And Display Product Quality Supervision And Inspection Center Jining Fiber Quality Monitoring Center filed Critical Jining Institute Of Quality Measurement Inspection And Testing Jining Semiconductor And Display Product Quality Supervision And Inspection Center Jining Fiber Quality Monitoring Center
Priority to CN202310538707.7A priority Critical patent/CN116304956B/zh
Publication of CN116304956A publication Critical patent/CN116304956A/zh
Application granted granted Critical
Publication of CN116304956B publication Critical patent/CN116304956B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01KMEASURING TEMPERATURE; MEASURING QUANTITY OF HEAT; THERMALLY-SENSITIVE ELEMENTS NOT OTHERWISE PROVIDED FOR
    • G01K15/00Testing or calibrating of thermometers
    • G01K15/007Testing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本发明涉及数据处理技术领域,提出了一种芯片温度异常在线检测方法,包括:采集芯片内部的温度数据及功耗数据;根据同一时刻每个传感器的温度数据获取每个传感器每个时刻的第一温度异常特征,根据温度数据及功耗数据获取每个传感器受其他传感器影响的辐射比例,根据温度数据及传感器分布获取每个辐射比例对应的调整系数;根据辐射比例及调整系数获取每个传感器每个时刻的理论温度数据,获取每个传感器每个时刻的第二温度异常特征,得到每个传感器每个时刻的综合温度异常特征;根据温度数据通过综合温度异常特征选取自适应K邻域范围,完成温度数据的异常检测。本发明旨在解决芯片温度受运行功耗影响而导致异常检测结果不准确的问题。

Description

一种芯片温度异常在线检测方法
技术领域
本发明涉及数据处理技术领域,具体涉及一种芯片温度异常在线检测方法。
背景技术
芯片在使用过程中因功耗相对应的会产生热量,而芯片温度过高,则会影响芯片运行时的性能,甚至导致芯片内零件烧毁;通过散热器降低芯片温度的过程中,无论是散热过度导致温度过低,或是散热不够导致温度过高,都会影响芯片的性能,因此对芯片温度进行实时监测,通过对异常温度进行检测并进行实时调节是十分有必要的。
现有技术中通常采用COF局部离群算法来进行异常数据的检测,常规的COF局部离群因子检测是设定一个固定的K邻域范围并进行检测;然而设定的K邻域范围过大时,会导致异常特征较弱的数据无法检测到;而当K邻域范围过小时,又会导致范围过小,容易误将正常数据识别为异常数据;因此固定的K邻域范围并不能达到较好的效果,需要进行K邻域范围自适应选取;同时芯片中有多个单核及背景部分,各单核运行功耗存在差异,温度表现存在差异,互相之间存在温度影响,因此需要获取各单核及背景部分的温度异常特征,进而根据温度异常特征获取自适应的K邻域范围,从而提高异常检测结果的准确性。
发明内容
本发明提供一种芯片温度异常在线检测方法,以解决现有的芯片温度受运行功耗影响而导致异常检测结果不准确的问题,所采用的技术方案具体如下:
本发明一个实施例提供了一种芯片温度异常在线检测方法,该方法包括以下步骤:
采集芯片内部每个传感器所有时刻的温度数据、每个传感器的标准温度数据、每个单核每个时刻的功耗数据及额定功耗数据;
根据同一时刻的温度数据获取每个传感器每个时刻的第一温度异常特征,根据功耗数据获取每个单核上的传感器的单一工作时刻,根据单一工作时刻的温度数据,获取每个单核上的传感器对于其他每个传感器的辐射比例,对每个单核上的传感器分别与其他每个传感器进行连线,根据连线获取每个单核上的传感器对于其他每个传感器的辐射干扰传感器,根据功耗数据获取每个单核上的传感器与辐射干扰传感器的双重工作时刻,根据双重工作时刻的温度数据及连线,获取每个单核上的传感器对于其他每个传感器的辐射比例对应的调整系数;
根据标准温度数据、辐射比例及调整系数,获取每个传感器每个时刻的理论温度数据,根据理论温度数据及采集的温度数据,获取每个传感器每个时刻的第二温度异常特征,根据第一温度异常特征及第二温度异常特征得到每个传感器每个时刻的综合温度异常特征;
根据温度数据通过综合温度异常特征选取自适应K邻域范围,完成温度数据的异常检测。
可选的,所述根据同一时刻的温度数据获取每个传感器每个时刻的第一温度异常特征,包括的具体方法为:
以任意一个时刻为目标时刻,获取目标时刻下所有温度数据的均值,将目标时刻下每个传感器的温度数据与温度数据均值的差值绝对值,作为目标时刻下每个传感器的第一温度异常特征;
获取每个传感器每个时刻的第一温度异常特征。
可选的,所述根据功耗数据获取每个单核上的传感器的单一工作时刻,包括的具体方法为:
以任意一个单核为目标单核,目标单核上的传感器为目标传感器,获取所有时刻中仅目标单核的功耗数据不等于额定功耗数据,而其他单核均为额定功耗数据的若干时刻,记为目标单核上的传感器的单一工作时刻;
获取每个单核上的传感器的单一工作时刻。
可选的,所述获取每个单核上的传感器对于其他每个传感器的辐射比例,包括的具体方法为:
以单核上的传感器的任意一个单一工作时刻为目标单一工作时刻,单核上的传 感器在目标单一工作时刻对于第个传感器的温度影响系数的计算方法为:
其中,表示目标单一工作时刻下单核上的传感器的温度变化值,表示目标 单一工作时刻下第个传感器的温度变化值,表示求绝对值;所述温度变化值表示目标单 一时刻下的温度数据与标准温度数据的差值绝对值;
获取单核上的传感器在每个单一工作时刻对于第个传感器的温度影响系数,将 所有温度影响系数的均值作为单核上的传感器对于第个传感器的辐射比例;
获取每个单核上的传感器对于其他每个传感器的辐射比例。
可选的,所述根据连线获取每个单核上的传感器对于其他每个传感器的辐射干扰传感器,包括的具体方法为:
将两个传感器之间的欧式距离作为两个传感器的连线长度,以单核上的传感器 为参考传感器,获取除参考传感器其他每个单核上的传感器与第个传感器的连线,提取其 中连线长度小于等于参考传感器与第个传感器的连线长度的单核上的传感器,将得到的 传感器记为参考传感器对于第个传感器的辐射干扰传感器;
获取每个单核上的传感器对于其他每个传感器的辐射干扰传感器。
可选的,所述根据功耗数据获取每个单核上的传感器与辐射干扰传感器的双重工作时刻,包括的具体方法为:
以单核上的传感器为参考传感器,将参考传感器对于第个传感器的任意一个辐 射干扰传感器作为目标干扰传感器,获取所有时刻中仅参考传感器对应单核的功耗数据, 以及目标干扰传感器对应单核的功耗数据分别与额定功耗数据不相等的若干时刻,记为参 考传感器与目标干扰传感器的双重工作时刻;
获取每个单核上的传感器与辐射干扰传感器的双重工作时刻。
可选的,所述获取每个单核上的传感器对于其他每个传感器的辐射比例对应的调整系数,包括的具体方法为:
以单核上的传感器与单核上的传感器对于第个传感器的第个辐射干扰传感器 的任意一个双重工作时刻为目标双重工作时刻,单核上的传感器对于第个传感器的第 个辐射干扰传感器在目标双重工作时刻下的辐射干扰系数的计算方法为:
其中,表示单核上的传感器与第个辐射干扰传感器对于第个传感器的连线 夹角,表示夹角参数,表示目标双重工作时刻下单核上的传感器的温度数据, 表示目标双重工作时刻下第个传感器的温度数据,表示目标双重工作时刻下单核上 的传感器对于第个传感器的第个辐射干扰传感器的温度数据,表示预设干扰夹角;
作为单核上的传感器对于第个传感器的第个辐射干扰传感器在 目标双重工作时刻下的辐射调整系数,获取单核上的传感器对于第个传感器的第个辐 射干扰传感器在所有双重工作时刻下的辐射调整系数均值,得到的结果记为单核上的传感 器对于第个传感器的第个辐射干扰传感器的辐射调整参数;
获取单核上的传感器对于第个传感器的每个辐射干扰传感器的辐射调整参数, 将所有辐射调整参数之和作为单核上的传感器对于第个传感器的辐射比例对应的调整 系数。
可选的,所述获取每个传感器每个时刻的理论温度数据,包括的具体方法为:
其中,表示第个传感器在第个时刻的理论温度数据,表示第个传感器 的标准温度数据,表示对第个传感器造成辐射影响的其他单核上的传感器数量,表 示对第个传感器造成辐射影响的第个传感器对于第个传感器的辐射比例,表示对 第个传感器造成辐射影响的第个传感器对于第个传感器的辐射比例的调整系数, 表示对第个传感器造成辐射影响的第个传感器在第个时刻的温度数据,表示第个 传感器在第个时刻的温度数据。
可选的,所述获取每个传感器每个时刻的第二温度异常特征,包括的具体方法为:
将每个传感器每个时刻的理论温度数据与采集的温度数据的差值绝对值,作为每个传感器每个时刻的第二温度异常特征。
本发明的有益效果是:本发明通过对芯片内部得到的多个传感器的温度数据,根据同一时刻下温度数据与温度数据均值的差异得到第一温度异常特征;再通过传感器之间温度数据变化获取传感器之间的辐射比例以及辐射比例的调整系数,并根据传感器对应的标准温度数据结合辐射比例及调整进行修正,使得得到的理论温度数据可以考虑相应时刻下每个传感器受到其他传感器的热辐射温度影响,进而根据理论温度数据与实际采集的温度数据获取第二温度异常特征,使得第二温度异常特征更加准确反映温度数据的异常表现;基于第一温度异常特征与第二温度异常特征得到综合温度异常特征,并根据综合温度异常特征自适应获取K邻域范围,提高每个时刻每个传感器的异常因子的获取准确性,避免范围过大导致离群特征较低或范围过小导致离群特征过大的问题,使得最终的温度数据异常检测结果更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的一种芯片温度异常在线检测方法流程示意图;
图2为芯片上温度传感器分布示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明一个实施例所提供的一种芯片温度异常在线检测方法流程图,该方法包括以下步骤:
步骤S001、采集芯片内部的温度数据及功耗数据,获取额定功耗数据及标准温度数据。
本实施例的目的是根据芯片内部每个单核及背景部分的温度数据进行异常温度检测,因此首先需要获取芯片内部的温度数据;本实施例通过温度传感器进行温度数据的采集,以SA8155P芯片为例,请参阅图2,其示出了芯片上一共16个温度传感器的分布示意图,图2中每个小黑点代表了一个温度传感器,黑点中的数字ID表示温度传感器的序号,即图2中包含了16个片上温度传感器。图2中白色部分的黑点即为监测芯片内背景部分温度的温度传感器,灰色方框内的黑点如1、7、9、10、11、12、13、14、15以及16号温度传感器,则是监测芯片内单核温度的温度传感器;通过温度传感器采集到芯片内部的温度数据,其中温度数据为时序序列数据,包括了当前温度数据及所有历史温度数据;若温度传感器监测单核温度,同时获取对应单核每个时刻的功耗数据。
进一步的,芯片内部每个单核都有额定功耗数据,同时获取每个传感器的标准温度数据,背景部分的传感器的标准温度数据为芯片不工作情况下的温度数据,单核上的传感器的标准温度数据为芯片仅有该单核工作时传感器的温度数据,标准温度数据及额定功耗数据为芯片固有参数。
至此,获取到了芯片内部的温度数据及功耗数据。
步骤S002、根据同一时刻每个传感器的温度数据获取每个传感器每个时刻的第一温度异常特征,根据温度数据及功耗数据获取每个传感器受其他传感器影响的辐射比例,根据温度数据及传感器分布获取每个辐射比例对应的调整系数。
需要说明的是,在同一时刻下,各个传感器的温度数据在正常工作情况下应该是相近的,则如果某个传感器温度数据在对应时刻下离群程度较大,其发生异常的可能性越大,因此通过同一时刻每个传感器的温度数据之间的差异来获取第一温度异常特征;同时传感器之间存在热辐射情况,即温度扩散,某个传感器范围内的升温通常会带动附近其他传感器范围的温度上升,则通过传感器对应单核的功耗数据以及温度数据的差异,获取传感器之间的辐射比例;同时多个传感器的热辐射影响反映到同一个传感器上时,多个传感器根据分布关系热辐射会互相影响,根据分布情况获取调整系数。
具体的,以任意一个时刻下每个传感器的温度数据为例,获取该时刻下所有温度数据的均值,将该时刻下每个传感器的温度数据与温度数据均值的差值绝对值,作为该时刻下每个传感器的第一温度异常特征;按照上述方法获取每个传感器每个时刻的第一温度异常特征。
进一步需要说明的是,在实际的芯片内部中,单核之间的距离有的较近,有的较远;而温度较高的单核,其自身会呈现一个热源的特征,即会导致热量产生辐射,使得每一个单核,其温度特征往往与实际的标定参数并不相同,都会偏高一些,因此需要根据实际的芯片内部单核之间的距离,温度大小等特征的影响下,获取每个单核对应时刻受到的其余单核所给予的热量影响,来对当前的温度指标来进行调整;当某一热源向外辐射热量时,其辐射的热量随着距离的增加,途中会不断被消耗掉,因此当传感器之间的距离越远,此时即使两个传感器之间存在较高的温度差,但是温度较高的对较低的产生辐射影响时,其辐射的热量随着距离的增加,逐渐减弱,对应的,造成的温度影响也越来越弱。
具体的,对于任意一个单核上的传感器,从所有温度数据中,获取仅该传感器对应单核功耗数据改变,而其他单核功耗数据均未改变的时刻;需要说明的是,所有温度数据中存在一个或多个这种时刻,这种时刻的数量不影响后续计算;将这种时刻记为该传感器的单一工作时刻,单一工作时刻下,其他每个传感器的温度变化均由该传感器的单核工作引起,因此可以量化获取该传感器对于其他传感器的辐射比例。
进一步的,以单核上的传感器为例,其对于第个传感器()的辐射比例的计算 方法为:
其中,表示单核上的传感器在任意一个单一工作时刻对于第个传感器的温度 影响系数,表示该单一工作时刻下单核上的传感器的温度变化值,温度变化值即是对 应时刻下的温度数据与标准温度数据的差值绝对值;表示该单一工作时刻下第个传感 器的温度变化值,表示求绝对值;按照上述方法获取单核上的传感器在每个单一工作时 刻对于第个传感器的温度影响系数,将所有温度影响系数的均值作为单核上的传感器对 于第个传感器的辐射比例;通过单一工作时刻下温度变化值的差异来量化辐射比例,温差 越大则辐射比例越大,进而通过辐射比例来保证后续第二温度异常特征及综合温度异常特 征的准确性;按照上述方法获取每个单核上的传感器对于其他每个传感器的辐射比例。
进一步需要说明的是,由于热辐射影响不是单一累加,例如两个不同的单核,两个单核分别对一个传感器造成热辐射影响,而两个单核及该传感器越趋近于直线,即该传感器为顶点,两个单核与该传感器连线为两条边形成的夹角越小,两个单核对于该传感器的热辐射互相的影响就会越大,因此需要获取对于辐射比例的调整系数,进而使得热辐射影响的结果更加准确。
具体的,首先对任意一个单核上的传感器与其他每个传感器进行连线,两个传感 器之间的欧式距离作为连线长度,以单核上的传感器与第个传感器()的连线为例, 获取其他每个单核上的传感器与第个传感器的连线(其他单核上的传感器不包括第个传 感器),提取其中连线长度小于等于单核上的传感器与第个传感器的连线长度的单核上 的传感器,将这些传感器记为单核上的传感器对于第个传感器的辐射干扰传感器;将所 有温度数据中仅有单核上的传感器及任意一个辐射干扰传感器的功耗数据发生变化的时 刻,记为单核上的传感器与该辐射干扰传感器的双重工作时刻;则单核上的传感器对于 第个传感器的调整系数的计算方法为:
其中,表示单核上的传感器对于第个传感器的第个辐射干扰传感器在任 意一个双重工作时刻下的辐射干扰系数,表示单核上的传感器与第个辐射干扰传感 器对于第个传感器的连线夹角,表示夹角参数,表示该双重工作时刻下单核上的 传感器的温度数据,表示该双重工作时刻下第个传感器的温度数据,表示该双重工 作时刻下单核上的传感器对于第个传感器的第个辐射干扰传感器的温度数据,表示 预设干扰夹角,本实施例采用进行叙述;大于等于预设干扰夹角则认为不会造成 辐射干扰,小于预设干扰夹角的情况下,连线夹角越小,温度干扰影响越大,辐射干扰系数 越大;同时通过三个传感器的温度数据差值来进行温度上的辐射干扰量化,辐射干扰传感 器与第个传感器的温差越接近单核上的传感器与第个传感器的温差,造成的温度干扰影 响就会越大,越会减弱单核上的传感器所造成的温度影响;将作为单核上的传 感器对于第个传感器的第个辐射干扰传感器在该双重工作时刻下的辐射调整系数,需 要说明的是,若辐射调整系数小于0,则按0进行后续计算;按照上述方法获取单核上的传感 器对于第个传感器的第个辐射干扰传感器在所有双重工作时刻下的辐射调整系数,并 计算辐射调整系数均值,记为辐射调整参数;按照上述方法获取单核上的传感器对于第 个传感器的每个辐射干扰传感器的辐射调整参数,将所有辐射调整参数之和作为单核上的 传感器对于第个传感器的辐射比例对应的调整系数;按照上述方法获取每个辐射比例对 应的调整系数。
至此,获取到了每个传感器每个时刻的第一温度异常特征,并得到了传感器之间的辐射比例以及辐射比例的调整系数。
步骤S003、根据辐射比例及调整系数获取每个传感器每个时刻的理论温度数据,根据理论温度数据获取每个传感器每个时刻的第二温度异常特征,根据第一温度异常特征及第二温度异常特征获取每个传感器每个时刻的综合温度异常特征。
需要说明的是,获取到辐射比例及调整系数后,则基于标准温度数据构建每个传感器每个时刻的理论温度数据,根据理论温度数据与温度数据获取每个时刻的第二温度异常特征,结合第一温度异常特征得到综合温度异常特征。
具体的,以第个传感器在第个时刻为例,其理论温度数据的计算方法为:
其中,表示第个传感器的标准温度数据,表示对第个传感器造成辐射影 响的其他单核上的传感器数量,表示对第个传感器造成辐射影响的第个传感器对于 第个传感器的辐射比例,表示对第个传感器造成辐射影响的第个传感器对于第个 传感器的辐射比例的调整系数,表示对第个传感器造成辐射影响的第个传感器在第个时刻的温度数据,表示第个传感器在第个时刻的温度数据;通过辐射比例及温度 系数对标准温度数据进行修正获取理论温度数据,考虑其他传感器热辐射的影响,提高后 续第二温度异常特征的准确性;按照上述方法获取每个传感器每个时刻的理论温度数据。
进一步的,将每个传感器每个时刻的理论温度数据与采集到的温度数据的差值绝对值,作为每个传感器每个时刻的第二温度异常特征;将第二温度异常特征与第一温度异常特征之和作为每个传感器每个时刻的综合温度异常特征。
至此,获取到了每个传感器每个时刻的综合温度异常特征,用于后续量化自适应的K邻域范围进而完成温度数据的异常检测。
步骤S004、根据温度数据通过综合温度异常特征选取自适应K邻域范围,完成温度数据的异常检测。
需要说明的是,常规的COF算法是通过固定每一个数据的K邻域范围,进行离群点检测;但是当K邻域范围过大时,会导致其中出现异常特征的数据,引起异常程度较小,从而进行离群检测时未检测出来;而当K邻域范围过小时,则会导致部分正常数据误被检测为异常数据;因此需要结合每个传感器每个时刻的综合温度异常特征,使得每个传感器每个时刻具有自适应的K邻域范围,进而根据温度数据得到异常因子,根据异常因子判断温度异常,使得最终的温度异常检测结果更加准确。
在步骤S003中获取到每个传感器每个时刻的综合温度异常特征后,对所有时刻的所有传感器的综合温度异常特征进行线性归一化,得到的结果记为每个时刻每个传感器的综合异常率;由于综合异常率越大,对应传感器的温度数据异常的可能性越大,越需要更小的K邻域范围来保证局部离群因子检测的准确性;因此本实施例设置K邻域范围为10进行叙述,将1减去综合异常率的结果记为每个时刻每个传感器的邻域选取程度,将K值与邻域选取程度的乘积并向上取整得到的结果作为每个时刻每个传感器的K邻域范围;对于任意一个传感器的温度数据,包括该传感器每个时刻的温度数据,通过COF算法及该传感器每个时刻的K邻域范围,输出该传感器每个时刻的异常因子,对所有异常因子进行线性归一化,若该传感器当前时刻的异常因子的归一化值大于等于预设第一阈值,本实施例预设第一阈值采用0.8进行计算,表明该传感器当前时刻的温度发生异常;若该传感器当前时刻的异常因子的归一化值小于预设第一阈值,该传感器当前时刻的温度正常;按照上述方法获取当前时刻每个传感器的温度异常检测结果。
进一步的,若当前时刻芯片内存在发生温度异常的传感器,则进行芯片温度异常报警,表明当前芯片温度异常,需要增大散热器功率来保证芯片温度回归正常;若当前时刻芯片内不存在发生温度异常的传感器,表明当前芯片温度正常,散热器继续正常工作,无需调整。
至此,完成了对于芯片温度异常的实时检测及调节。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种芯片温度异常在线检测方法,其特征在于,该方法包括以下步骤:
采集芯片内部每个传感器所有时刻的温度数据、每个传感器的标准温度数据、每个单核每个时刻的功耗数据及额定功耗数据;
根据同一时刻的温度数据获取每个传感器每个时刻的第一温度异常特征,根据功耗数据获取每个单核上的传感器的单一工作时刻,根据单一工作时刻的温度数据,获取每个单核上的传感器对于其他每个传感器的辐射比例,对每个单核上的传感器分别与其他每个传感器进行连线,根据连线获取每个单核上的传感器对于其他每个传感器的辐射干扰传感器,根据功耗数据获取每个单核上的传感器与辐射干扰传感器的双重工作时刻,根据双重工作时刻的温度数据及连线,获取每个单核上的传感器对于其他每个传感器的辐射比例对应的调整系数;
根据标准温度数据、辐射比例及调整系数,获取每个传感器每个时刻的理论温度数据,根据理论温度数据及采集的温度数据,获取每个传感器每个时刻的第二温度异常特征,根据第一温度异常特征及第二温度异常特征得到每个传感器每个时刻的综合温度异常特征;
根据温度数据通过综合温度异常特征选取自适应K邻域范围,完成温度数据的异常检测;
所述根据同一时刻的温度数据获取每个传感器每个时刻的第一温度异常特征,包括的具体方法为:
以任意一个时刻为目标时刻,获取目标时刻下所有温度数据的均值,将目标时刻下每个传感器的温度数据与温度数据均值的差值绝对值,作为目标时刻下每个传感器的第一温度异常特征;
获取每个传感器每个时刻的第一温度异常特征;
所述获取每个传感器每个时刻的第二温度异常特征,包括的具体方法为:
将每个传感器每个时刻的理论温度数据与采集的温度数据的差值绝对值,作为每个传感器每个时刻的第二温度异常特征。
2.根据权利要求1所述的一种芯片温度异常在线检测方法,其特征在于,所述根据功耗数据获取每个单核上的传感器的单一工作时刻,包括的具体方法为:
以任意一个单核为目标单核,目标单核上的传感器为目标传感器,获取所有时刻中仅目标单核的功耗数据不等于额定功耗数据,而其他单核均为额定功耗数据的若干时刻,记为目标单核上的传感器的单一工作时刻;
获取每个单核上的传感器的单一工作时刻。
3.根据权利要求1所述的一种芯片温度异常在线检测方法,其特征在于,所述获取每个单核上的传感器对于其他每个传感器的辐射比例,包括的具体方法为:
以单核上的传感器的任意一个单一工作时刻为目标单一工作时刻,单核上的传感器/>在目标单一工作时刻对于第/>个传感器的温度影响系数/>的计算方法为:
其中,表示目标单一工作时刻下单核上的传感器/>的温度变化值,/>表示目标单一工作时刻下第/>个传感器的温度变化值,/>表示求绝对值;所述温度变化值表示目标单一时刻下的温度数据与标准温度数据的差值绝对值;
获取单核上的传感器在每个单一工作时刻对于第/>个传感器的温度影响系数,将所有温度影响系数的均值作为单核上的传感器/>对于第/>个传感器的辐射比例;
获取每个单核上的传感器对于其他每个传感器的辐射比例。
4.根据权利要求1所述的一种芯片温度异常在线检测方法,其特征在于,所述根据连线获取每个单核上的传感器对于其他每个传感器的辐射干扰传感器,包括的具体方法为:
将两个传感器之间的欧式距离作为两个传感器的连线长度,以单核上的传感器为参考传感器,获取除参考传感器其他每个单核上的传感器与第/>个传感器的连线,提取其中连线长度小于等于参考传感器与第/>个传感器的连线长度的单核上的传感器,将得到的传感器记为参考传感器对于第/>个传感器的辐射干扰传感器;
获取每个单核上的传感器对于其他每个传感器的辐射干扰传感器。
5.根据权利要求4所述的一种芯片温度异常在线检测方法,其特征在于,所述根据功耗数据获取每个单核上的传感器与辐射干扰传感器的双重工作时刻,包括的具体方法为:
以单核上的传感器为参考传感器,将参考传感器对于第/>个传感器的任意一个辐射干扰传感器作为目标干扰传感器,获取所有时刻中仅参考传感器对应单核的功耗数据,以及目标干扰传感器对应单核的功耗数据分别与额定功耗数据不相等的若干时刻,记为参考传感器与目标干扰传感器的双重工作时刻;
获取每个单核上的传感器与辐射干扰传感器的双重工作时刻。
6.根据权利要求1所述的一种芯片温度异常在线检测方法,其特征在于,所述获取每个单核上的传感器对于其他每个传感器的辐射比例对应的调整系数,包括的具体方法为:
以单核上的传感器与单核上的传感器/>对于第/>个传感器的第/>个辐射干扰传感器的任意一个双重工作时刻为目标双重工作时刻,单核上的传感器/>对于第/>个传感器的第/>个辐射干扰传感器在目标双重工作时刻下的辐射干扰系数/>的计算方法为:
其中,表示单核上的传感器/>与第/>个辐射干扰传感器对于第/>个传感器的连线夹角,/>表示夹角参数,/>表示目标双重工作时刻下单核上的传感器/>的温度数据,/>表示目标双重工作时刻下第/>个传感器的温度数据,/>表示目标双重工作时刻下单核上的传感器/>对于第/>个传感器的第/>个辐射干扰传感器的温度数据,/>表示预设干扰夹角;
作为单核上的传感器/>对于第/>个传感器的第/>个辐射干扰传感器在目标双重工作时刻下的辐射调整系数,获取单核上的传感器/>对于第/>个传感器的第/>个辐射干扰传感器在所有双重工作时刻下的辐射调整系数均值,得到的结果记为单核上的传感器/>对于第/>个传感器的第/>个辐射干扰传感器的辐射调整参数;
获取单核上的传感器对于第/>个传感器的每个辐射干扰传感器的辐射调整参数,将所有辐射调整参数之和作为单核上的传感器/>对于第/>个传感器的辐射比例对应的调整系数。
7.根据权利要求1所述的一种芯片温度异常在线检测方法,其特征在于,所述获取每个传感器每个时刻的理论温度数据,包括的具体方法为:
其中,表示第/>个传感器在第/>个时刻的理论温度数据,/>表示第/>个传感器的标准温度数据,/>表示对第/>个传感器造成辐射影响的其他单核上的传感器数量,/>表示对第个传感器造成辐射影响的第/>个传感器对于第/>个传感器的辐射比例,/>表示对第/>个传感器造成辐射影响的第/>个传感器对于第/>个传感器的辐射比例的调整系数,/>表示对第/>个传感器造成辐射影响的第/>个传感器在第/>个时刻的温度数据,/>表示第/>个传感器在第/>个时刻的温度数据。
CN202310538707.7A 2023-05-15 2023-05-15 一种芯片温度异常在线检测方法 Active CN116304956B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310538707.7A CN116304956B (zh) 2023-05-15 2023-05-15 一种芯片温度异常在线检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310538707.7A CN116304956B (zh) 2023-05-15 2023-05-15 一种芯片温度异常在线检测方法

Publications (2)

Publication Number Publication Date
CN116304956A CN116304956A (zh) 2023-06-23
CN116304956B true CN116304956B (zh) 2023-08-15

Family

ID=86817057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310538707.7A Active CN116304956B (zh) 2023-05-15 2023-05-15 一种芯片温度异常在线检测方法

Country Status (1)

Country Link
CN (1) CN116304956B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116494493B (zh) * 2023-06-25 2023-08-22 天津市全福车业有限公司 一种注塑集中供料系统智能监测方法
CN117168558B (zh) * 2023-11-03 2024-01-16 山东奥斯登房车有限公司 一种高端智能房车油耗实时监测方法
CN117435874B (zh) * 2023-12-21 2024-03-12 河北雄安睿天科技有限公司 一种供排水设备异常数据检测方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020064209A (ko) * 2001-02-01 2002-08-07 캐논 가부시끼가이샤 이상검지방법 및 보호장치
WO2005119402A1 (ja) * 2004-06-04 2005-12-15 Sony Computer Entertainment Inc. プロセッサ、プロセッサシステム、温度推定装置、情報処理装置および温度推定方法
CN110702273A (zh) * 2019-10-15 2020-01-17 苏州伟创电气科技股份有限公司 变频器温度传感器异常检测方法、变频器及存储介质
WO2020090261A1 (ja) * 2018-10-31 2020-05-07 オムロン株式会社 温度異常検知システム、温度異常検知方法、およびプログラム
WO2021179213A1 (zh) * 2020-03-11 2021-09-16 华为技术有限公司 修复存储芯片的方法和装置
WO2021232266A1 (zh) * 2020-05-20 2021-11-25 华为技术有限公司 芯片的控制方法和控制装置
CN114003458A (zh) * 2020-07-28 2022-02-01 北京比特大陆科技有限公司 基于多个芯片的温度监测方法及相关产品
EP3961168A1 (en) * 2020-08-27 2022-03-02 Yokogawa Electric Corporation Abnormal temperature detection device, abnormal temperature detection method, and storage medium
WO2022041198A1 (zh) * 2020-08-31 2022-03-03 深圳大学 一种三维堆叠存储芯片的温度变化计算方法
CN116111727A (zh) * 2023-04-13 2023-05-12 盛锋电力科技有限公司 基于动态温度阈值的综合配电箱异常监测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7168853B2 (en) * 2003-01-10 2007-01-30 International Business Machines Corporation Digital measuring system and method for integrated circuit chip operating parameters
US8376611B2 (en) * 2009-04-14 2013-02-19 O2Micro International Limited Circuits and methods for temperature detection

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020064209A (ko) * 2001-02-01 2002-08-07 캐논 가부시끼가이샤 이상검지방법 및 보호장치
WO2005119402A1 (ja) * 2004-06-04 2005-12-15 Sony Computer Entertainment Inc. プロセッサ、プロセッサシステム、温度推定装置、情報処理装置および温度推定方法
WO2020090261A1 (ja) * 2018-10-31 2020-05-07 オムロン株式会社 温度異常検知システム、温度異常検知方法、およびプログラム
CN110702273A (zh) * 2019-10-15 2020-01-17 苏州伟创电气科技股份有限公司 变频器温度传感器异常检测方法、变频器及存储介质
WO2021179213A1 (zh) * 2020-03-11 2021-09-16 华为技术有限公司 修复存储芯片的方法和装置
WO2021232266A1 (zh) * 2020-05-20 2021-11-25 华为技术有限公司 芯片的控制方法和控制装置
CN114003458A (zh) * 2020-07-28 2022-02-01 北京比特大陆科技有限公司 基于多个芯片的温度监测方法及相关产品
EP3961168A1 (en) * 2020-08-27 2022-03-02 Yokogawa Electric Corporation Abnormal temperature detection device, abnormal temperature detection method, and storage medium
WO2022041198A1 (zh) * 2020-08-31 2022-03-03 深圳大学 一种三维堆叠存储芯片的温度变化计算方法
CN116111727A (zh) * 2023-04-13 2023-05-12 盛锋电力科技有限公司 基于动态温度阈值的综合配电箱异常监测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SenseBench: Toward an Accurate Evaluation of Sensor Network Processors;L Nazhandali 等;《IEEE International Workload Characterization》;全文 *

Also Published As

Publication number Publication date
CN116304956A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN116304956B (zh) 一种芯片温度异常在线检测方法
CN117093879B (zh) 一种数据中心智能化运营管理方法及系统
CN115950557B (zh) 一种基于压力变送器的温度智能补偿方法
CN110470414B (zh) 一种体温测量系统以及用于体温测量系统的校正方法
CN116111727B (zh) 基于动态温度阈值的综合配电箱异常监测方法
CN107609308B (zh) 电缆接头连接管处等效电阻的测量方法及装置
CN117195007B (zh) 一种换热器性能预测方法及系统
CN116243097A (zh) 基于大数据的电能质量检测方法
CN115283509A (zh) 一种弯管成型检测方法及检测系统
CN117520103B (zh) 基于热成像的数据中心机房温度监控方法
CN106325258B (zh) 一种基于在线监测信息的继电保护装置状态评估方法
CN116503633A (zh) 基于图像识别的开关柜状态智能检测控制方法
CN112968931A (zh) 一种基于多传感器的农作物环境温度数据融合系统及方法
JP6129508B2 (ja) 異常検出前処理装置および方法ならびにプログラム、それを備えた異常検出装置
CN115099291B (zh) 一种建筑节能监测方法
CN116880601A (zh) 熔融态黄磷恒温输送控制系统
CN115841446A (zh) 一种太阳能集热场故障风险快速检测系统及方法
CN113704323A (zh) 一种基于htm改进的时序异常检测算法
CN109712729B (zh) 一种核电站报警方法、饱和裕度的计算方法及系统
CN117288348B (zh) 一种母线槽测温方法及系统
CN115291652B (zh) 一种评估集中器cpu体质的动态评估方法
CN114093149B (zh) 配电变压器监控报警方法及装置
CN117571107B (zh) 一种智能化无人值守地磅异常监测系统
CN117878927B (zh) 基于时序分析的电力系统负荷趋势分析方法
CN117848438B (zh) 一种气体流量高精度测量方法及热式气体质量流量计

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant