CN118258514A - 温度监控方法及装置、电子设备与存储介质 - Google Patents
温度监控方法及装置、电子设备与存储介质 Download PDFInfo
- Publication number
- CN118258514A CN118258514A CN202410251009.3A CN202410251009A CN118258514A CN 118258514 A CN118258514 A CN 118258514A CN 202410251009 A CN202410251009 A CN 202410251009A CN 118258514 A CN118258514 A CN 118258514A
- Authority
- CN
- China
- Prior art keywords
- temperature
- module
- control signal
- control unit
- operation module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims abstract description 70
- 230000004044 response Effects 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims description 36
- 238000012806 monitoring device Methods 0.000 claims description 24
- 238000011144 upstream manufacturing Methods 0.000 claims description 17
- 230000009191 jumping Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 4
- 230000002035 prolonged effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 238000001816 cooling Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013021 overheating Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01K—MEASURING TEMPERATURE; MEASURING QUANTITY OF HEAT; THERMALLY-SENSITIVE ELEMENTS NOT OTHERWISE PROVIDED FOR
- G01K13/00—Thermometers specially adapted for specific purposes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/28—Testing of electronic circuits, e.g. by signal tracer
- G01R31/2851—Testing of integrated circuits [IC]
- G01R31/2855—Environmental, reliability or burn-in testing
- G01R31/2872—Environmental, reliability or burn-in testing related to electrical or environmental aspects, e.g. temperature, humidity, vibration, nuclear radiation
- G01R31/2874—Environmental, reliability or burn-in testing related to electrical or environmental aspects, e.g. temperature, humidity, vibration, nuclear radiation related to temperature
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Environmental & Geological Engineering (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Toxicology (AREA)
- Computer Hardware Design (AREA)
- Microelectronics & Electronic Packaging (AREA)
- General Engineering & Computer Science (AREA)
- Semiconductor Integrated Circuits (AREA)
Abstract
一种用于集成电路的温度监控方法及装置、电子设备与存储介质。该集成电路包括多个运算模块,每个运算模块中设置有温度控制单元和至少一个温度传感器,多个运算模块包括第一运算模块。该温度监控方法包括:响应于第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,第一运算模块的温度控制单元产生第一控制信号;基于第一控制信号,降低第一运算模块的工作负荷。该温度监控方法通过在集成电路内每个运算模块中设置温度控制单元,每个温度控制单元可以对对应的运算模块单独地进行控制,实现了对集成电路内部分布式地温度监控,提高了芯片的性能,延长了芯片使用寿命。
Description
技术领域
本公开的实施例涉及一种温度监控方法及装置、电子设备与存储介质。
背景技术
芯片的片内温度是芯片运行的一个重要指标。对于超大规模集成电路,需要时刻监控芯片内部的温度。当芯片内部温度达到预警温度时,需要及时进行干预,避免芯片温度进一步升高。如果干预延时或干预不当,则会导致芯片内部温度继续升高。当芯片片内温度达到死亡温度时,需要对芯片进行断电处理,以防止片内温度过高导致的芯片损坏。
发明内容
本公开至少一实施例提供一种用于集成电路的温度监控方法,其中,所述集成电路包括多个运算模块,所述多个运算模块中的每个运算模块中设置有温度控制单元和至少一个温度传感器,所述多个运算模块包括第一运算模块,所述温度监控方法包括:响应于所述第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,所述第一运算模块的温度控制单元产生第一控制信号;基于所述第一控制信号,降低所述第一运算模块的工作负荷。
例如,在本公开至少一实施例提供的用于集成电路的温度监控方法中,基于所述第一控制信号,降低所述第一运算模块的工作负荷,包括:使用所述第一控制信号改变所述第一运算模块的全局时钟,以使所述第一运算模块的工作负荷降低。
例如,在本公开至少一实施例提供的用于集成电路的温度监控方法中,所述每个运算模块被划分为多个温度感测区,所述多个温度感测区中的每个温度感测区中设置有所述温度传感器和数据流接口模块,响应于所述第一运算模块的至少一个温度传感器检测的温度超过所述第一温度阈值,所述第一运算模块的温度控制单元产生所述第一控制信号,包括:响应于所述第一运算模块中多个温度感测区中的第一温度感测区的温度传感器检测的温度超过所述第一温度阈值,所述第一运算模块的温度控制单元产生第一控制信号,基于所述第一控制信号,降低所述第一运算模块的工作负荷,包括:使用所述第一控制信号控制所述第一温度感测区的数据流接口模块,减少经过所述数据流接口模块的数据流,以降低所述第一温度感测区的工作负荷。
例如,在本公开至少一实施例提供的用于集成电路的温度监控方法中,响应于所述第一运算模块的至少一个温度传感器检测的温度超过所述第一温度阈值,所述第一运算模块的温度控制单元产生所述第一控制信号,包括:响应于所述第一运算模块的至少一个温度传感器检测的温度超过所述第一温度阈值,所述第一运算模块的温度控制单元中的分频使能信号由关闭电平跳转至开启电平;响应于所述第一运算模块的温度控制单元中的分频使能信号由所述关闭电平跳转至所述开启电平,开启分频操作并产生所述第一控制信号。
例如,在本公开至少一实施例提供的用于集成电路的温度监控方法中,所述分频操作为M/Num分频,M表示循环周期数量,Num表示有效信号的数量,M/Num表示在M个循环周期中所产生的有效信号的数量为Num,M为正整数,Num为小于M的正整数,响应于所述第一运算模块的温度控制单元中的分频使能信号由所述关闭电平跳转至所述开启电平,开启分频操作并产生所述第一控制信号,包括:响应于所述第一运算模块的温度控制单元中的分频使能信号由所述关闭电平跳转至所述开启电平,将第一计数值赋值为-Num;响应于所述第一计数值小于0,产生所述第一控制信号,并将所述第一计数值加(M-Num);响应于所述第一计数值大于或等于0,将所述第一计数值减Num。
例如,在本公开至少一实施例提供的用于集成电路的温度监控方法中,所述第一运算模块的温度控制单元包括第一寄存器,所述第一计数值表示所述第一寄存器的计数值,所述第一寄存器包括目标比特位,当所述目标比特位的值为第一值时,所述温度控制单元产生所述第一控制信号。
例如,本公开至少一实施例提供的用于集成电路的温度监控方法,还包括:响应于所述第一运算模块的温度恢复至小于第二温度阈值,所述第一运算模块的温度控制单元中的分频使能信号由开启电平跳转至关闭电平;响应于所述第一运算模块的温度控制单元中的分频使能信号由开启电平跳转至关闭电平,逐步减少所述第一控制信号的频率,以逐步关闭所述分频操作。
例如,在本公开至少一实施例提供的用于集成电路的温度监控方法中,所述分频操作为M/Num分频,M表示循环周期数量,Num表示有效信号的数量,M/Num表示在M个循环周期中所产生的有效信号的数量为Num,M为正整数,Num为小于M的正整数,响应于所述第一运算模块的温度控制单元中的分频使能信号由所述开启电平跳转至所述关闭电平,逐步减少所述第一控制信号的频率,以逐步关闭所述分频操作,包括:响应于所述第一运算模块的温度控制单元中的分频使能信号为所述开启电平,将所述有效信号的数量Num赋值为N,其中,N为正整数;响应于所述第一运算模块的温度控制单元中的分频使能信号由开启电平跳转至关闭电平,每当第二计数值计数至Num并且所述第一控制信号为产生状态时,将Num的值减1,并将所述第二计数值从0开始计数,直至Num的值减少至0。
例如,在本公开至少一实施例提供的用于集成电路的温度监控方法中,将所述第二计数值从0开始计数,包括:响应于所述第二计数值为Num并且所述第一控制信号为产生状态,将所述第二计数值置0;每当判断所述第二计数值不为Num并且所述第一控制信号为产生状态,将所述第二计数值加1,直至所述第二计数值增加至Num。
例如,本公开至少一实施例提供的用于集成电路的温度监控方法,还包括:响应于所述第一运算模块的至少一个温度传感器检测的温度超过第三温度阈值,所述第一运算模块的温度控制单元产生第二控制信号,其中,所述第三温度阈值大于所述第一温度阈值;基于所述第二控制信号,切断所述第一运算模块的工作负荷。
本公开至少一实施例还提供一种用于集成电路的温度监控装置,其中,所述集成电路包括多个运算模块,所述多个运算模块中的每个运算模块中设置有至少一个温度传感器,所述多个运算模块包括第一运算模块,所述温度监控装置包括:多个温度控制单元,其中,所述每个运算模块中设置有所述多个温度控制单元中的至少一个温度控制单元,所述第一运算模块中的温度控制单元与所述第一运算模块中的温度传感器连接,所述第一运算模块的温度控制单元配置为,响应于所述第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,产生第一控制信号,所述第一运算模块的温度控制单元还配置为,基于所述第一控制信号,降低所述第一运算模块的工作负荷。
例如,在本公开至少一实施例提供的用于集成电路的温度监控装置中,所述第一运算模块的温度控制单元还配置为,响应于所述第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,开启分频操作并产生所述第一控制信号。
例如,在本公开至少一实施例提供的用于集成电路的温度监控装置中,所述多个温度控制单元中的每个温度控制单元还包括全局时钟控制模块,所述第一运算模块中的全局时钟控制模块配置为,使用所述第一控制信号改变所述第一运算模块的全局时钟,以使所述第一运算模块的工作负荷降低。
例如,在本公开至少一实施例提供的用于集成电路的温度监控装置中,所述每个运算模块被划分为多个温度感测区,所述多个温度感测区中的每个温度感测区中设置有所述温度传感器和数据流接口模块,所述第一运算模块的温度控制单元配置为:响应于所述第一运算模块中多个温度感测区中的第一温度感测区的温度传感器检测的温度超过所述第一温度阈值,产生第一控制信号,以及使用所述第一控制信号控制所述第一温度感测区的数据流接口模块,减少经过所述数据流接口模块的数据流,以降低所述第一温度感测区的工作负荷。
例如,在本公开至少一实施例提供的用于集成电路的温度监控装置中,所述数据流接口模块包括:取反单元,配置为将所述第一控制信号进行取反处理;第一与门单元,配置为将取反后的第一控制信号和来自数据通道上游模块的状态信号进行第一与运算,将所述第一与运算的结果发送至数据通道下游模块;第二与门单元,配置为将所述取反后的第一控制信号和来自所述数据通道下游模块的状态信号进行第二与运算,将所述第二与运算的结果发送至所述数据通道上游模块。
例如,在本公开至少一实施例提供的用于集成电路的温度监控装置中,所述第一运算模块的温度控制单元包括配置子模块、测量子模块和控制子模块,所述配置子模块配置为,基于接收的配置信息,配置所述温度控制单元中至少一个寄存器的值;所述测量子模块与所述第一运算模块的温度传感器连接,配置为读取所述第一运算模块的至少一个温度传感器检测的温度;所述控制子模块配置为,响应于所述第一运算模块的至少一个温度传感器检测的温度超过所述第一温度阈值,基于所述配置子模块配置的所述至少一个寄存器的值,产生所述第一控制信号。
例如,在本公开至少一实施例提供的用于集成电路的温度监控装置中,所述第一运算模块的温度控制单元还配置为,响应于所述第一运算模块的至少一个温度传感器检测的温度超过第三温度阈值,产生第二控制信号。
例如,在本公开至少一实施例提供的用于集成电路的温度监控装置中,所述温度监控装置还包括处理模块和供电模块,所述供电模块与所述处理模块通信连接,配置为为所述多个运算模块提供电压,所述处理模块与所述多个温度控制单元通信连接,配置为基于所述第二控制信号,控制所述供电模块切断所述第一运算模块的电压。
本公开至少一实施例还提供一种电子设备。该电子设备包括:处理器;存储器,包括一个或多个计算机程序模块;其中,所述一个或多个计算机程序模块被存储在所述存储器中并被配置为由所述处理器执行,所述一个或多个计算机程序模块用于实现本公开任一实施例提供的用于集成电路的温度监控方法。
本公开至少一实施例还提供一种存储介质,存储有非暂时性计算机可读指令,当所述非暂时性计算机可读指令由计算机执行时实现本公开任一实施例提供的用于集成电路的温度监控方法。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
图1A为一种芯片内部温度监控的示意图;
图1B为一种芯片温度监控系统的示意图;
图2为本公开至少一实施例提供的用于集成电路的温度监控装置的一个示例的示意图;
图3为本公开至少一实施例提供的用于集成电路的温度监控方法的示例性流程图;
图4为本公开至少一实施例提供的用于集成电路的温度监控方法的一个示例的示意图;
图5为本公开至少一实施例提供的第一运算模块和温度控制单元的一个示例的示意图;
图6A为本公开至少一实施例提供的数据流接口模块的一个示例的示意图;
图6B为本公开至少一实施例提供的数据流接口模块的另一个示例的示意图;
图7为本公开至少一实施例提供的分频使能信号的一个示例的示意图;
图8为本公开至少一实施例提供的用于集成电路的温度监控方法的另一示例性流程图;
图9为本公开至少一实施例提供的用于集成电路的温度监控方法的又一示例性流程图;
图10为本公开的至少一实施例提供的一种电子设备的示意框图;
图11为本公开的至少一实施例提供的另一种电子设备的示意框图;以及
图12为本公开的至少一实施例提供的一种存储介质的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”、“一”或者“该”等类似词语也不表示数量限制,而是表示存在至少一个。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
下面通过几个具体的实施例对本公开进行说明。为了保持本公开实施例的以下说明清楚且简明,可省略已知功能和已知部件的详细说明。当本公开实施例的任一部件在一个以上的附图中出现时,该部件在每个附图中由相同或类似的参考标号表示。
随着半导体工艺的不断发展,芯片的集成度越来越高。对于高度集成的芯片,如果芯片在工作过程中内部的热耗急剧增加,则会导致芯片温度过高,甚至会直接导致芯片烧毁。因此,芯片内部通常提供高精度的温度传感器以监测过热问题。为了解决芯片内部过热问题,需要设计相应的温度控制模块来执行过热处理。
图1A为一种芯片内部温度监控的示意图。
例如,如图1A所示,芯片内部有至少一个温度监控模块(Tmon0、Tmon1、Tmon2、Tmon3),每个温度监控模块连接到多个温度传感器(例如32个,如图1A中六边形块所示),所有温度监控模块的温度传感器均匀分布在芯片上。例如,芯片内部有多个电压域时,功耗较高的电压域中温度传感器的分布密度相比功耗低的电压域更高。例如,温度监控模块所属的温度传感器在满足设计要求(比如距离要求)的情况下会进行间插,以便在某一温度监控模块损坏的情况下,芯片还能继续使用,但是,这种情况下温度测试的准确性会有所降低。
图1B为一种芯片温度监控系统的示意图。
例如,如图1B所示,芯片温度监控系统包括芯片外部的供电模块VR以及芯片内部的用于处理温度的处理器、多个温度监控模块(例如,温度监控模块Tmon0、Tmon1、Tmon2、Tmon3)、时钟发生器PLL等。例如,温度监控系统通过供电模块VR对芯片供电,处理器通过温度监控模块读取其对应的温度传感器的温度,以在超过特定温度阈值时控制时钟发生器PLL和外部供电模块VR进行温度控制。
例如,整个温度控制流程是通过芯片内的处理器通过软件的形式完成。处理器读取温度监控模块对应的温度传感器的温度,一旦发现所有监控的电压域中有温度超过预警温度,即进入警戒温度处理程序。在警戒温度处理程序中,处理器会去控制时钟发生器PLL对时钟频率进行处理,以使温度回归到正常,然后继续进行温度监控;待温度回归到正常后,警戒温度处理程序再进行预警解除对时钟控制进行撤销。例如,如果在完成警戒处理后,芯片上的温度仍然没有下降,而是继续升高到死亡温度,则会进入过热处理程序,处理器会控制芯片的外部供电模块VR进行断电处理。
例如,在芯片温度监控系统中,对于温度预警的处理只考虑了芯片内部的最高温度,一旦芯片内部的某一个电压域中有温度超过了预警温度,则会发出高温预警,即使芯片其余部分没有出现温度过热,也会对整个芯片进行时钟频率处理,从而导致没有出现温度过热的部分的性能损失。对于超大规模芯片,经常会发生高温预警的情况,因而频繁地进行时钟频率处理,甚至会进行断电处理,从而降低了芯片的性能,缩短了芯片使用寿命。
本公开至少一实施例提供一种用于集成电路的温度监控方法,其中,该集成电路包括多个运算模块,每个运算模块中设置有温度控制单元和至少一个温度传感器,多个运算模块包括第一运算模块。该温度监控方法包括:响应于第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,第一运算模块的温度控制单元产生第一控制信号;基于第一控制信号,降低第一运算模块的工作负荷。
本公开的至少一实施例还提供一种用于集成电路的温度监控装置、电子设备与存储介质,用于实现上述实施例的用于集成电路的温度监控方法。
本公开至少一实施例提供的方法、装置、电子设备以及存储介质,通过在集成电路内每个运算模块中设置温度控制单元,每个温度控制单元可以对对应的运算模块单独地进行控制,实现了对集成电路内部分布式地温度监控,解决了集中温度控制导致的芯片性能下降的问题;对于出现温度异常的运算模块,通过减少该运算模块的负荷来实现局部降温,而不会影响集成电路内其他运算模块部分的性能,从而提高了芯片的性能,延长了芯片使用寿命。
下面,将参考附图详细地说明本公开至少一实施例。应当注意的是,不同的附图中相同的附图标记将用于指代已描述的相同的元件。
图2为本公开至少一实施例提供的用于集成电路的温度监控装置的一个示例的示意图。
例如,如图2所示,集成电路100包括多个运算模块110;对于集成电路100(例如,通用多核处理器),其温度(或功耗)较高部分主要为多个运算模块110(即虚线包含部分)所在区域。例如,每个运算模块110中设置有至少一个温度传感器(图中未示出)。例如,温度传感器为可独立计算温度的温度传感器,如数字温度传感器等,本公开的实施例对此不作限制。
例如,如图2所示,温度监控装置200包括多个温度控制单元210,每个运算模块110中设置有至少一个温度控制单元210。例如,每个温度控制单元210连接到其所在的运算模块110中的所有温度传感器。
例如,选取多个运算模块中的一个作为第一运算模块110,即作为当前的描述对象,对于选择多个运算模块中哪个作为第一运算模块没有限制,其他类似情况不再赘述。第一运算模块110中的温度控制单元210与第一运算模块110中的温度传感器连接。例如,第一运算模块110的温度控制单元210配置为,响应于第一运算模块110的温度传感器检测的温度超过第一温度阈值(例如,预警温度),产生第一控制信号;以及,基于第一控制信号,降低第一运算模块110的工作负荷,从而降低第一运算模块110的温度。在一些示例中,第一运算模块110的温度控制单元210可以通过开启分频操作来产生第一控制信号。
例如,如图2所示,温度监控装置200还包括处理模块220和供电模块230。供电模块230与处理模块220通信连接,处理模块220与多个温度控制单元210通信连接。供电模块230配置为为多个运算模块110提供电压。处理模块220可以通过菊花链或行星总线等方式广播配置每个温度控制单元210中的寄存器。
例如,例如,第一运算模块110的温度控制单元210还配置为,响应于第一运算模块110的温度传感器检测的温度超过第三温度阈值(例如,死亡温度),产生第二控制信号;处理模块220可以基于第二控制信号,控制供电模块230对第一运算模块110进行掉电处理(例如,切断第一运算模块110的电压),以切断第一运算模块110的工作负荷,从而降低第一运算模块110的温度。
例如,本公开至少一实施例提供的集成电路可以指代系统级芯片(System-on-Chip,SoC)等,具体可以为通用多核处理器,也可以为其他类型的电子器件或部件,本公开的实施例对此不作限制。
例如,本公开至少一实施例提供的运算模块可以为通用多核处理器中的计算单元(compute unit),每个计算单元例如包括多个单指令多数据(Single InstructionMultiple Data,SIMD)运算单元或多指令多数据(Multiple Instruction Multiple Data,MIMD)运算单元等;也可以根据实际需要选择其他类型的处理单元作为运算模块,本公开的实施例对此不作限制。
需要说明的是,图2所示的温度监控装置仅为一个示例,本公开至少一实施例提供的温度监控装置也可以设计为其他结构,具体可以根据实际需要进行选择,本公开的实施例对此不作限制。
此外,以上参照图2描述的用于集成电路的温度监控装置200并不限于包括以上描述的模块,而是还可以根据需要增加一些其它模块(例如,读取模块、控制模块、共享存储模块、局域存储模块等),或者以上模块也可被组合。
图3为本公开至少一实施例提供的用于集成电路的温度监控方法的示例性流程图。例如,图3所示的方法可以利用图2所示的温度监控装置来实现,也可以使用其他结构类型的温度监控装置,本公开的实施例对此不作限制。
例如,图3所示的温度监控方法所适用的集成电路包括多个运算模块,每个运算模块中设置有温度控制单元和至少一个温度传感器,多个运算模块包括第一运算模块。例如,该温度监控方法可以包括以下步骤S110~S120。
步骤S110:响应于第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,第一运算模块的温度控制单元产生第一控制信号;
步骤S120:基于第一控制信号,降低第一运算模块的工作负荷。
例如,在步骤S110中,第一温度阈值可以为预警温度;对于第一运算模块,当其内部温度超过第一温度阈值,其温度控制单元可以产生第一控制信号。在一些示例中,温度控制单元可以通过开启分频操作来产生第一控制信号。
例如,在步骤S120中,第一运算模块的温度控制单元可以基于第一控制信号,对第一运算模块单独地进行干预,通过降低第一运算模块的工作负荷的方式实现局部降温。
在本公开至少一实施例中,对于集成电路中的每个运算模块,都可以采用图3所示的温度监控方法对运算模块的温度进行单独控制,从而实现了对集成电路内部的分布式地温度监控;对于出现温度异常的运算模块,通过减少该运算模块的负荷来实现局部降温,而不会影响集成电路内其他运算模块部分的性能,从而提高了芯片的性能,延长了芯片使用寿命。
在一些示例中,本公开至少一实施例提供的用于集成电路的温度监控方法还可以包括步骤S130~S140(图中未示出):
步骤S130:响应于第一运算模块的至少一个温度传感器检测的温度超过第三温度阈值,第一运算模块的温度控制单元产生第二控制信号;
步骤S140:基于第二控制信号,切断第一运算模块的工作负荷。
例如,在步骤S130中,第三温度阈值大于第一温度阈值,第三温度阈值可以为死亡温度;对于第一运算模块,当其内部温度超过第三温度阈值,其温度控制单元可以产生第二控制信号。
例如,在步骤S140中,温度控制单元可以向处理模块发送第二控制信号,处理模块收到第二控制信号后,发送命令掉电命令给供电模块进行掉电处理(例如,切断第一运算模块的电压),从而切断第一运算模块的工作负荷,以防止芯片内部温度过高导致的芯片损坏。
图4为本公开至少一实施例提供的用于集成电路的温度监控方法的一个示例的示意图。例如,图4为如上描述的步骤S110~S140的一个具体示例。
例如,如图4所示,整个温度监控流程通过软硬件结合的形式对集成电路进行分布式控制,也即是,通过结合处理模块配置寄存器等软件(例如微码)处理方式,温度控制单元可以单独地对对应的运算模块进行控制。
例如,如图4所示,芯片启动后,温度控制单元通过温度传感器对所对应的运算模块的内部温度进行监测,如果温度正常,则持续进行温度监测;当第一运算模块内部温度超过第一温度阈值,第一运算模块的温度控制单元可以产生第一控制信号(即执行步骤S110);进一步地,该温度控制单元基于第一控制信号,降低第一运算模块的工作负荷,从而降低第一运算模块内部的温度(即执行步骤S120);待温度回归到正常后,该温度控制单元通过关闭第一控制信号,逐步恢复第一运算模块的工作负荷。
例如,如图4所示,如果第一运算模块的至少一个温度传感器检测的温度超过第三温度阈值,则第一运算模块的温度控制单元产生第二控制信号(即执行步骤S130);该温度控制单元可以向处理模块发送第二控制信号,处理模块收到第二控制信号后,发送命令掉电命令给供电模块进行掉电处理(例如,切断第一运算模块的电压),从而切断第一运算模块的工作负荷,以防止片内温度过高导致的芯片损坏。
本公开至少一实施例提供的温度监控方法,通过在集成电路内每个运算模块中设置温度控制单元,每个温度控制单元可以对对应的运算模块单独地进行控制,将温度软件集中控制改变软硬件结合的分布式温度监控;对于内部温度超过预警温度的运算模块,该运算模块的温度控制单元通过减少本地负荷来实现局部降温,而不会影响集成电路内其他运算模块部分的性能,从而提高了芯片的性能,延长了芯片使用寿命。
在一些示例中,第一控制信号可以通过多种方式来降低第一运算模块的工作负荷。例如,每个温度控制单元还包括全局时钟控制模块,图3的步骤S120可以包括:使用第一控制信号改变第一运算模块的全局时钟,以使第一运算模块的工作负荷降低。
又例如,每个运算模块被划分为多个温度感测区,多个温度感测区中的每个温度感测区中设置有温度传感器和数据流接口模块;图3的步骤S110可以包括:响应于第一运算模块中多个温度感测区中的第一温度感测区的温度传感器检测的温度超过第一温度阈值,第一运算模块的温度控制单元产生第一控制信号;相应地,图3的步骤S120还可以包括:使用第一控制信号控制第一温度感测区的数据流接口模块,减少经过数据流接口模块的数据流,以降低第一温度感测区的工作负荷。
图5为本公开至少一实施例提供的第一运算模块和温度控制单元的一个示例的示意图。例如,图5所示的第一运算模块和温度控制单元可以为图2所示的温度监控装置中第一运算模块和温度控制单元的一个具体示例。
例如,如图5所示,第一运算模块110中设置有温度控制单元210,该温度控制单元210包括配置子模块211、测量子模块212和控制子模块213。例如,配置子模块211配置为,基于接收的配置信息,配置温度控制单元210中至少一个寄存器的值;测量子模块212与第一运算模块110的温度传感器216连接,配置为读取第一运算模块的至少一个温度传感器检测的温度;控制子模块213配置为,响应于第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,基于配置子模块211配置的至少一个寄存器的值,产生第一控制信号。
例如,温度控制单元210中的每个寄存器包括多个比特位,配置子模块211可以用于配置每个寄存器的多个比特位,从而配置该寄存器的值。
例如,如图5所示,配置子模块212可以通过菊花链或行星总线等方式与其他温度控制单元的配置子模块相连接,最终连接到处理模块。例如,配置子模块211用于配置温度控制单元中至少一个寄存器的值,并将配置的值发送到测量子模块212和控制子模块213。例如,配置子模块211还可以用于当第一运算模块的温度超过第三温度阈值时,将第二控制信号发送至处理模块。
例如,如图5所示,测量子模块212可以通过行星总线或菊花链等方式连接到各个温度传感器216上,用于校正和读取温度传感器检测的温度。例如,控制子模块213接收测量子模块212传来的温度,该温度超过第一温度阈值,基于配置子模块211配置的至少一个寄存器的值,产生第一控制信号。例如,控制子模块213可以通过开启分频操作来产生第一控制信号。
在一些示例中,第一控制信号可以通过控制全局时钟或者控制数据流接口的方式来降低第一运算模块的工作负荷。例如,具体的控制方式可以通过配置寄存器进行选择。
例如,如图5所示,对于控制全局时钟的方式,温度控制单元210还包括全局时钟控制模块214。例如,全局时钟控制模块214可以配置为,使用第一控制信号改变第一运算模块110的全局时钟,以使第一运算模块110的工作负荷降低。
例如,如图5所示,对于控制数据流接口的方式,第一运算模块110被划分为多个温度感测区(例如温度感测区A、B和C),每个温度感测区中设置有温度传感器216和数据流接口模块215。例如,如果第一运算模块中的第一温度感测区(例如图5中的温度感测区A)的温度传感器216检测的温度超过第一温度阈值,则温度控制单元210的控制子模块213产生第一控制信号;进一步地,温度控制单元210使用第一控制信号控制第一温度感测区A的数据流接口模块215,减少经过该数据流接口模块215的数据流,以降低第一温度感测区A的工作负荷。
例如,对于控制数据流接口的方式,如果第一温度感测区A的温度超过第一温度阈值,可以仅控制第一温度感测区A内的数据流接口模块215,而不影响其它温度感测区B和C。因此,相比控制全局时钟的方式,控制数据流接口的方式可以实现更细颗粒度的控制。
需要说明的是,除了如上描述的控制全局时钟以及控制数据流接口的方式,还可以通过其他方式来降低第一运算模块的工作负荷,具体可以根据实际情况进行选择,本公开的实施例对此不作限制。
在一些示例中,本公开至少一实施例提供的数据流接口模块包括取反单元、第一与门单元和第二与门单元。取反单元配置为将第一控制信号进行取反处理;第一与门单元配置为将取反后的第一控制信号和来自数据通道上游模块的状态信号进行第一与运算,将第一与运算的结果发送至数据通道下游模块;第二与门单元配置为将取反后的第一控制信号和来自数据通道下游模块的状态信号进行第二与运算,将第二与运算的结果发送至数据通道上游模块。
图6A为本公开至少一实施例提供的数据流接口模块的一个示例的示意图;图6B为本公开至少一实施例提供的数据流接口模块的另一个示例的示意图。例如,图6A和图6B所示的数据流接口模块可以为图5所示的第一运算模块中数据流接口的具体示例。
例如,图6A所示,在运算模块的主要的运算数据通道上,将数据流接口模块选取为一组以握手与反压(valid-ready)接口协议的数据通信接口,该数据流接口模块为连接数据通道上游模块和数据通道下游模块的数据通信接口。例如,数据通道上游模块和通道下游模块之间通过valid-ready握手进行数据传输,上游模块产生的有效状态信号(valid)为开启状态时表示当前数据已经准备好,下游模块产生的就绪状态信号(ready)为开启状态时表示可以接收上游模块的数据,也即当valid信号和ready信号同时为开启状态时才能进行有效的数据流的传送。
例如,图6B所示,数据流接口模块215包括取反单元2151、第一与门单元2152和第二与门单元2153。例如,温度控制单元210产生的第一控制信号进入到数据流接口模块215后,首先,取反单元2151对第一控制信号进行取反;然后,第一与门单元2152将取反后的第一控制信号和来自数据通道上游模块的有效状态信号(valid)进行第一与运算,再将第一与运算的结果发送至数据通道下游模块;并且,第二与门单元2153将取反后的第一控制信号和来自数据通道下游模块的就绪状态信号(ready)进行第二与运算,再将第二与运算的结果发送至数据通道上游模块。
例如,当第一控制信号有效(例如值为1)时,取反后的第一控制信号(例如值为0)与来自上游模块的valid信号进行第一与运算之后,最后发送到下游模块的第一与运算的结果为关闭状态(例如值为0),因此,从下游模块来看,上游模块没有准备好有效数据。例如,当第一控制信号有效(例如值为1)时,取反后的第一控制信号(例如值为0)与来自下游模块的ready信号进行第二与运算之后,最后发送到上游模块的第二与运算的结果为关闭状态(例如值为0),因此,从上游模块来看,下游模块没有准备好接收数据。由此,当第一控制信号有效时,数据流接口模块215中的门控电路通过同时“欺骗”上下游模块从而达到暂停内部逻辑工作的目的,从而可以降低第一控制单元的负荷。
需要说明的是,图6A和图6B所示的数据流接口模块仅为一个示例,本公开至少一实施例提供的数据流接口模块也可以设计为其他结构或接口形式,具体可以根据实际需要进行选择,本公开的实施例对此不作限制。
在一些示例中,第一运算模块的温度控制单元可以通过开启分频操作来产生第一控制信号,图3的步骤S110还可以包括步骤S1101和S1102:
步骤S1101:响应于第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,第一运算模块的温度控制单元中的分频使能信号由关闭电平跳转至开启电平;
步骤S1102:响应于第一运算模块的温度控制单元中的分频使能信号由关闭电平跳转至开启电平,开启分频操作并产生第一控制信号。
例如,进一步地,本公开至少一实施例提供的温度监控方法还可以包括步骤S1103和S1104:
步骤S1103:响应于第一运算模块的温度恢复至小于第二温度阈值,第一运算模块的温度控制单元中的分频使能信号由开启电平跳转至关闭电平;
步骤S1104:响应于第一运算模块的温度控制单元中的分频使能信号由开启电平跳转至关闭电平,逐步减少第一控制信号的频率,以逐步关闭分频操作。
在一些示例中,第二温度阈值为可以使运算模块正常工作的温度阈值,第二温度阈值可以小于或等于第一温度阈值。
图7为本公开至少一实施例提供的分频使能信号的一个示例的示意图。例如,图7所示分频使能信号用于如图2所示的温度监控装置以及如图3所示的温度监控方法,具体地,该分频使能信号可以通过开启分频操作来产生第一控制信号,以及通过逐步关闭分频操作来逐步恢复第一运算模块的工作负荷。
例如,如图7所示,对于第一运算模块,阶段A表示第一运算模块的温度正常,其温度控制单元中的分频使能信号处于关闭电平;在步骤S1101中,当第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值时,其温度控制单元中的分频使能信号由关闭电平跳转至开启电平,从而进入了阶段B;在阶段B,执行步骤S1102,分频操作被开启,并且温度控制单元产生第一控制信号,第一运算模块的工作负荷也随之降低,使得第一运算模块的温度向正常状态恢复。
例如,进一步地,如图7所示,在步骤S1103中,当第一运算模块的温度恢复至小于第二温度阈值时(即第一运算模块的温度恢复到正常状态),其温度控制单元中的分频使能信号由开启电平跳转至关闭电平,从而进入了阶段C;在阶段C,分频操作并不会马上停止,而是逐步关闭,可以执行步骤S1104,通过逐步减少第一控制信号的频率来逐步关闭分频操作,直到第一运算模块的工作负荷完全恢复。例如,在阶段C中,分频操作逐步关闭,从而实现了工作负荷的阶梯式逐步恢复。
图8为本公开至少一实施例提供的用于集成电路的温度监控方法的另一示例性流程图。例如,图8所示的温度控制流程使用了如图7所示的分频使能信号来开启或关闭分频操作。
例如,如图8所示,芯片复位后,温度监控装置监控各个运算单元的温度;一旦第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,则在步骤S1101中,第一运算模块的温度控制单元中的分频使能信号由关闭电平跳转至开启电平,从而在步骤S1102中,开启分频操作(例如,进入图7的阶段B),并且产生第一控制信号。例如,第一控制信号通过控制全局时钟或者控制数据流接口等方式降低第一运算模块的工作负荷,使得第一运算模块的温度向正常状态恢复。
例如,进一步地,如图8所示,当第一运算模块的温度恢复正常后(例如恢复至小于第二温度阈值),在步骤S1103中,温度控制单元中的分频使能信号由开启电平跳转至关闭电平,从而在步骤S1104中,逐步减少第一控制信号的频率,以逐步关闭分频操作(例如,进入了图7的阶段C),第一运算模块的工作负荷阶梯式逐步恢复,直到工作负荷完全恢复。
在一些示例中,分频操作为M/Num分频,M表示循环周期数量,Num表示有效信号的数量,有效信号是指M个循环内产生的有效的第一控制信号,M/Num表示在M个循环周期中所产生的有效信号的数量为Num,这里M为正整数,Num为小于M的正整数。
例如,在本公开至少一实施例中,步骤S1102可以进一步包括:响应于第一运算模块的温度控制单元中的分频使能信号由关闭电平跳转至开启电平,将第一计数值赋值为-Num;响应于第一计数值小于0,产生第一控制信号,并将第一计数值加(M-Num);响应于第一计数值大于或等于0,将第一计数值减Num。
例如,第一运算模块的温度控制单元包括第一寄存器,第一计数值表示第一寄存器的计数值。例如,第一寄存器包括目标比特位,当目标比特位的值为第一值时,温度控制单元产生第一控制信号。
例如,在本公开至少一实施例中,步骤S1104可以进一步包括:响应于第一运算模块的温度控制单元中的分频使能信号为开启电平,将有效信号的数量Num赋值为N,这里N为正整数;响应于第一运算模块的温度控制单元中的分频使能信号由开启电平跳转至关闭电平,每当第二计数值计数至Num并且第一控制信号为产生状态时,将Num的值减1,并将第二计数值从0开始计数,直至Num的值减少至0。
例如,进一步地,将第二计数值从0开始计数,包括:响应于第二计数值为Num并且第一控制信号为产生状态,将第二计数值置0;每当判断第二计数值不为Num并且第一控制信号为产生状态,将第二计数值加1,直至第二计数值增加至Num。
图9为本公开至少一实施例提供的用于集成电路的温度监控方法的又一示例性流程图。例如,图9为图8所示的温度控制流程的一个具体示例。
例如,如图9所示,循环A、循环B和循环C三者配合实现分频操作的开启和逐步关闭,并且实现工作负荷的阶梯式逐步恢复(如图7所示的阶段C)。例如,循环A用于产生M/Num分频信号,循环C用于逐渐减少Num的值,循环B用于对循环C中的Num进行计数。
例如,分频操作为M/Num分频,M表示循环周期数量,Num表示有效信号的数量,有效信号是指M个循环内产生的有效的第一控制信号,M/Num表示在M个循环周期中所产生的有效信号的数量为Num,这里M为正整数,Num为小于M的正整数。例如,M和Num为寄存器配置的值,如果将M配置为255,将Num配置为85,则会在255个循环内均匀地产生85个有效的第一控制信号,用于减少第一运算模块的工作负荷。
例如,第一运算模块的温度控制单元包括第一寄存器,第一寄存器包括目标比特位,当目标比特位的值为第一值(例如1)时,温度控制单元产生第一控制信号。例如,第一计数值X表示第一寄存器的计数值,目标比特位可以为X的高位。例如,当第一计数值X为负数时,X的最高位为1。例如,如果X是9比特,可以取最高位X[8]为目标比特位;当第一计数值X为负数时,目标比特位X[8]==1,此时温度控制单元产生第一控制信号。
例如,如图9所示,在循环A中,在起始阶段对第一计数值X进行复位后(A1),第一计数值X被赋值为0(A2);复位完成后,如果分频使能信号由关闭电平跳转至开启电平,并且Num的值不为0(A3),此时分频操作被开启,则将X赋值为0-Num(A4)。例如,X赋值为0-Num后X为负数,从而产生第一控制信号。例如,进一步地,由于此时的第一计数值X为负数,即目标比特位X[8]==1(A5),将第一计数值X加(M-Num),即X变成M-2Num(A6);如果M-2Num大于或等于0,此时第一计数值X大于或等于0,即目标比特位X[8]不等于1(A5),则再将第一计数值X减Num(A7),即X变成M-3Num。例如,按照如上过程进行多次循环,从而持续产生M/Num分频信号。
例如,对于循环A,以将M配置为255且将Num配置为85为例,如果分频使能信号由关闭电平跳转至开启电平(并且Num的值不为0)(A3),X被赋值为0-Num=-85(A4),此时X为负数,从而产生第一控制信号;进一步地,由于此时的第一计数值X为负数,即目标比特位X[8]==1(A5),将第一计数值X加(M-Num=225-85),即X变成85(A6);此时X大于0,即目标比特位X[8]不等于1(A5),则再将第一计数值X减Num(A7),即X变成0;此时X等于0,即目标比特位X[8]不等于1(A5),则再将第一计数值X减Num(A7),即X变成-85;由此,X的值重新回到0-Num,从而继续重复上述循环。在以上循环A的示例中,X按照-85、85、0、-85、85、0……进行多次循环,从而持续产生255/85分频信号。
需要说明的是,Num的值会随着循环B和循环C的过程逐渐减小(具体过程参考后续对循环B和循环C的描述),直至减少至0。例如,当Num的值按照N、N-1…1逐渐变化,循环A持续产生的分频信号按照M/N、M/N-1…M/1分频进行变化,当Num的值减少至0时,循环A不再产生分频信号。例如,上述分频信号按照M/N、M/N-1…M/1分频进行变化,使得分频操作逐步关闭,从而实现了工作负荷的阶梯式逐步恢复(如图7所示的阶段C)。
例如,如图9所示,在循环C中,在起始阶段对Num进行复位后(C1),有效信号的数量Num被赋值为0(C2);复位完成后,如果第一运算模块的温度控制单元中的分频使能信号为开启电平(C3),此时分频操作处于开启状态,第一运算模块的工作负荷被降低并且温度逐渐恢复,则将有效信号的数量Num赋值为N(C4),这里N为正整数。
例如,在循环C中,进一步地,在第一运算模块的温度恢复正常之后,其温度控制单元中的分频使能信号由开启电平跳转至关闭电平(C3);每当第二计数值cnt计数至Num(即cnt==Num)并且第一控制信号为产生状态(即X[8]==1)时(C5),将Num的值减1(C6)。例如,每经过如上的一次循环,Num的值就减一次1,直至Num的值减少至0。
例如,第二计数值cnt用于对有效信号的数量Num进行计数。例如,在循环C的步骤C5中,每当第二计数值cnt计数至Num并且第一控制信号为产生状态,将第二计数值cnt重新从0开始计数。例如,如图9所示,循环B示出了第二计数值cnt的具体计数过程。
例如,如图9所示,在循环B中,在起始阶段对第二计数值cnt进行复位后(B1),cnt被赋值为0(B2);或者,当第一运算模块的温度控制单元中的分频使能信号为开启电平时(B1),分频操作处于开启状态,此时cnt也被赋值为0(B2)。例如,当第二计数值cnt为Num(即cnt==Num)并且第一控制信号为产生状态(即X[8]==1)时(B3),将cnt赋值为0(B4),该过程相当于在循环C的步骤C5中,将第二计数值cnt重新从0开始计数。
例如,在循环B中,进一步地,每当判断第二计数值cnt不为Num(B3)并且第一控制信号为产生状态(即X[8]==1,B5),将第二计数值cnt加1(B6)。例如,每经过如上的一次循环,cnt的值就加一次1,直至cnt的值增加至Num。
由以上过程可知,对于M/Num分频操作,在循环C中Num按照N、N-1…0逐渐变化;Num每一次减1,则执行一次循环B;在每次循环B中,第二计数值cnt从0计数至Num。也即是,在每次循环B中,第二计数值cnt用于对有效信号的数量Num进行计数。
在图9的示例中,通过第一计数值X、第二计数值cnt和有效信号数量Num等中间值的循环变化,实现了当分频操作关闭时,第一运算模块的工作负荷可以逐步阶梯式恢复,而不需要对第一运算模块进行干预。
需要说明的是,图9所示的三种中间值循环的方式仅为一个示例,也可以通过其他方式进行第一运算模块的工作负荷的逐步恢复,本公开的实施例对此不作限制。
在本公开至少一实施例中,可以通过逐步关闭分频操作来逐步恢复第一运算模块的工作负荷,例如实现了工作负荷的阶梯式逐步恢复(如图7所示的阶段C)。例如,如果工作负荷直接恢复直正常,可能会使运算模块中的电流突然增大时,在短时间内电源功率不变的情况下,运算模块中的电流和温度会发生连续跳变,从而会影响芯片的性能,甚至导致芯片失效。本公开至少一实施例提供的温度监控方法实现了运算模块工作负荷的逐步恢复,从而避免了电流突然增大导致的电流和温度连续跳变,从而提高了芯片性能。
本公开的至少一实施例还提供一种电子设备,该电子设备包括处理器和存储器;该存储器包括一个或多个计算机程序模块;该一个或多个计算机程序模块被存储在存储器中并被配置为由处理器执行,一个或多个计算机程序模块包括用于实现上文描述的本公开的实施例提供的用于集成电路的温度监控方法的计算机可执行指令。例如,该处理器可以为单核处理器或多核处理器。
图10为本公开的至少一实施例提供的一种电子设备的示意框图。
例如,如图10所示,该电子设备300包括处理器310和存储器320。例如,存储器320用于存储非暂时性计算机可读指令(例如一个或多个计算机程序模块)。处理器310用于运行非暂时性计算机可读指令,非暂时性计算机可读指令被处理器310运行时可以执行根据上文描述的用于集成电路的温度监控方法的一个或多个步骤。存储器320和处理器310可以通过总线系统和/或其它形式的连接机构(未示出)互连。
例如,处理器310可以是中央处理单元(CPU)、图形处理器(GPU)、通用图形处理器(GPGPU)、数字信号处理器(DSP)或者具有用于集成电路的温度监控能力和/或程序执行能力的其它形式的处理单元,例如现场可编程门阵列(FPGA)等;例如,中央处理单元(CPU)可以为X86、RISC-V或ARM架构等。处理器310可以为通用处理器或专用处理器,可以控制电子设备300中的其它组件以执行期望的功能。
例如,存储器320可以包括一个或多个计算机程序产品的任意组合,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、可擦除可编程只读存储器(EPROM)、便携式光盘只读存储器(CD-ROM)、USB存储器、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序模块,处理器310可以运行一个或多个计算机程序模块,以实现电子设备300的各种功能。在计算机可读存储介质中还可以存储各种应用程序和各种数据以及应用程序使用和/或产生的各种数据等。
需要说明的是,本公开的实施例中,电子设备300的具体功能和技术效果可以参考上文中关于本公开至少一实施例提供的用于集成电路的温度监控方法的描述,此处不再赘述。
图11为本公开的至少一实施例提供的另一种电子设备的示意框图。
例如,如图11所示,该电子设备400例如适于用来实施本公开实施例提供的用于集成电路的温度监控方法。需要注意的是,图11示出的电子设备400仅是一个示例,其不会对本公开实施例的功能和使用范围带来任何限制。
例如,如图11所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)41,其可以根据存储在只读存储器(ROM)42中的程序或者从存储装置48加载到随机访问存储器(RAM)43中的程序而执行各种适当的动作和处理。在RAM 43中,还存储有电子设备400操作所需的各种程序和数据。处理装置41、ROM 42以及RAM 43通过总线44彼此相连。输入/输出(I/O)接口45也连接至总线44。通常,以下装置可以连接至I/O接口45:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置46;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置47;包括例如磁带、硬盘等的存储装置48;以及通信装置49。通信装置49可以允许电子设备400与其他电子设备进行无线或有线通信以交换数据。
虽然图11示出了具有各种装置的电子设备400,但应理解的是,并不要求实施或具备所有示出的装置,电子设备400可以替代地实施或具备更多或更少的装置。
关于电子设备400的详细说明和技术效果,可以参考上文关于用于集成电路的温度监控方法的相关描述,此处不再赘述。
图12为本公开的至少一实施例提供的一种存储介质的示意图。
例如,如图12所示,存储介质500存储有非暂时性计算机可读指令510。例如,当非暂时性计算机可读指令510由计算机执行时执行根据上文描述的用于集成电路的温度监控方法中的一个或多个步骤。
例如,该存储介质500可以应用于图10所示的电子设备300中。例如,存储介质500可以为电子设备300中的存储器320。例如,关于存储介质500的相关说明可以参考图10所示的电子设备300中的存储器320的相应描述,此处不再赘述。
对于本公开,有以下几点需要说明:
(1)本公开实施例附图中,只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计。
(2)在不冲突的情况下,本公开同一实施例及不同实施例中的特征可以相互组合。
以上,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (20)
1.一种用于集成电路的温度监控方法,其中,所述集成电路包括多个运算模块,所述多个运算模块中的每个运算模块中设置有温度控制单元和至少一个温度传感器,所述多个运算模块包括第一运算模块,
所述温度监控方法包括:
响应于所述第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,所述第一运算模块的温度控制单元产生第一控制信号;
基于所述第一控制信号,降低所述第一运算模块的工作负荷。
2.根据权利要求1所述的用于集成电路的温度监控方法,其中,基于所述第一控制信号,降低所述第一运算模块的工作负荷,包括:
使用所述第一控制信号改变所述第一运算模块的全局时钟,以使所述第一运算模块的工作负荷降低。
3.根据权利要求1所述的用于集成电路的温度监控方法,其中,所述每个运算模块被划分为多个温度感测区,所述多个温度感测区中的每个温度感测区中设置有所述温度传感器和数据流接口模块,
响应于所述第一运算模块的至少一个温度传感器检测的温度超过所述第一温度阈值,所述第一运算模块的温度控制单元产生所述第一控制信号,包括:
响应于所述第一运算模块中多个温度感测区中的第一温度感测区的温度传感器检测的温度超过所述第一温度阈值,所述第一运算模块的温度控制单元产生第一控制信号,
基于所述第一控制信号,降低所述第一运算模块的工作负荷,包括:
使用所述第一控制信号控制所述第一温度感测区的数据流接口模块,减少经过所述数据流接口模块的数据流,以降低所述第一温度感测区的工作负荷。
4.根据权利要求1所述的用于集成电路的温度监控方法,其中,响应于所述第一运算模块的至少一个温度传感器检测的温度超过所述第一温度阈值,所述第一运算模块的温度控制单元产生所述第一控制信号,包括:
响应于所述第一运算模块的至少一个温度传感器检测的温度超过所述第一温度阈值,所述第一运算模块的温度控制单元中的分频使能信号由关闭电平跳转至开启电平;
响应于所述第一运算模块的温度控制单元中的分频使能信号由所述关闭电平跳转至所述开启电平,开启分频操作并产生所述第一控制信号。
5.根据权利要求4所述的用于集成电路的温度监控方法,其中,所述分频操作为M/Num分频,M表示循环周期数量,Num表示有效信号的数量,M/Num表示在M个循环周期中所产生的有效信号的数量为Num,M为正整数,Num为小于M的正整数,
响应于所述第一运算模块的温度控制单元中的分频使能信号由所述关闭电平跳转至所述开启电平,开启分频操作并产生所述第一控制信号,包括:
响应于所述第一运算模块的温度控制单元中的分频使能信号由所述关闭电平跳转至所述开启电平,将第一计数值赋值为-Num;
响应于所述第一计数值小于0,产生所述第一控制信号,并将所述第一计数值加(M-Num);
响应于所述第一计数值大于或等于0,将所述第一计数值减Num。
6.根据权利要求5所述的用于集成电路的温度监控方法,其中,所述第一运算模块的温度控制单元包括第一寄存器,所述第一计数值表示所述第一寄存器的计数值,
所述第一寄存器包括目标比特位,当所述目标比特位的值为第一值时,所述温度控制单元产生所述第一控制信号。
7.根据权利要求4所述的用于集成电路的温度监控方法,还包括:
响应于所述第一运算模块的温度恢复至小于第二温度阈值,所述第一运算模块的温度控制单元中的分频使能信号由开启电平跳转至关闭电平;
响应于所述第一运算模块的温度控制单元中的分频使能信号由开启电平跳转至关闭电平,逐步减少所述第一控制信号的频率,以逐步关闭所述分频操作。
8.根据权利要求7所述的用于集成电路的温度监控方法,其中,所述分频操作为M/Num分频,M表示循环周期数量,Num表示有效信号的数量,M/Num表示在M个循环周期中所产生的有效信号的数量为Num,M为正整数,Num为小于M的正整数,
响应于所述第一运算模块的温度控制单元中的分频使能信号由所述开启电平跳转至所述关闭电平,逐步减少所述第一控制信号的频率,以逐步关闭所述分频操作,包括:
响应于所述第一运算模块的温度控制单元中的分频使能信号为所述开启电平,将所述有效信号的数量Num赋值为N,其中,N为正整数;
响应于所述第一运算模块的温度控制单元中的分频使能信号由开启电平跳转至关闭电平,每当第二计数值计数至Num并且所述第一控制信号为产生状态时,将Num的值减1,并将所述第二计数值从0开始计数,直至Num的值减少至0。
9.根据权利要求8所述的用于集成电路的温度监控方法,其中,将所述第二计数值从0开始计数,包括:
响应于所述第二计数值为Num并且所述第一控制信号为产生状态,将所述第二计数值置0;
每当判断所述第二计数值不为Num并且所述第一控制信号为产生状态,将所述第二计数值加1,直至所述第二计数值增加至Num。
10.根据权利要求1所述的用于集成电路的温度监控方法,还包括:
响应于所述第一运算模块的至少一个温度传感器检测的温度超过第三温度阈值,所述第一运算模块的温度控制单元产生第二控制信号,其中,所述第三温度阈值大于所述第一温度阈值;
基于所述第二控制信号,切断所述第一运算模块的工作负荷。
11.一种用于集成电路的温度监控装置,其中,所述集成电路包括多个运算模块,所述多个运算模块中的每个运算模块中设置有至少一个温度传感器,所述多个运算模块包括第一运算模块,
所述温度监控装置包括:
多个温度控制单元,其中,所述每个运算模块中设置有所述多个温度控制单元中的至少一个温度控制单元,所述第一运算模块中的温度控制单元与所述第一运算模块中的温度传感器连接,
所述第一运算模块的温度控制单元配置为,响应于所述第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,产生第一控制信号,
所述第一运算模块的温度控制单元还配置为,基于所述第一控制信号,降低所述第一运算模块的工作负荷。
12.根据权利要求11所述的用于集成电路的温度监控装置,其中,所述第一运算模块的温度控制单元还配置为,响应于所述第一运算模块的至少一个温度传感器检测的温度超过第一温度阈值,开启分频操作并产生所述第一控制信号。
13.根据权利要求11所述的用于集成电路的温度监控装置,其中,所述多个温度控制单元中的每个温度控制单元还包括全局时钟控制模块,
所述第一运算模块中的全局时钟控制模块配置为,使用所述第一控制信号改变所述第一运算模块的全局时钟,以使所述第一运算模块的工作负荷降低。
14.根据权利要求11所述的用于集成电路的温度监控装置,其中,所述每个运算模块被划分为多个温度感测区,所述多个温度感测区中的每个温度感测区中设置有所述温度传感器和数据流接口模块,
所述第一运算模块的温度控制单元配置为:
响应于所述第一运算模块中多个温度感测区中的第一温度感测区的温度传感器检测的温度超过所述第一温度阈值,产生第一控制信号,以及
使用所述第一控制信号控制所述第一温度感测区的数据流接口模块,减少经过所述数据流接口模块的数据流,以降低所述第一温度感测区的工作负荷。
15.根据权利要求14所述的用于集成电路的温度监控装置,其中,所述数据流接口模块包括:
取反单元,配置为将所述第一控制信号进行取反处理;
第一与门单元,配置为将取反后的第一控制信号和来自数据通道上游模块的状态信号进行第一与运算,将所述第一与运算的结果发送至数据通道下游模块;
第二与门单元,配置为将所述取反后的第一控制信号和来自所述数据通道下游模块的状态信号进行第二与运算,将所述第二与运算的结果发送至所述数据通道上游模块。
16.根据权利要求11所述的用于集成电路的温度监控装置,其中,所述第一运算模块的温度控制单元包括配置子模块、测量子模块和控制子模块,
所述配置子模块配置为,基于接收的配置信息,配置所述温度控制单元中至少一个寄存器的值;
所述测量子模块与所述第一运算模块的温度传感器连接,配置为读取所述第一运算模块的至少一个温度传感器检测的温度;
所述控制子模块配置为,响应于所述第一运算模块的至少一个温度传感器检测的温度超过所述第一温度阈值,基于所述配置子模块配置的所述至少一个寄存器的值,产生所述第一控制信号。
17.根据权利要求11所述的用于集成电路的温度监控装置,其中,所述第一运算模块的温度控制单元还配置为,响应于所述第一运算模块的至少一个温度传感器检测的温度超过第三温度阈值,产生第二控制信号。
18.根据权利要求17所述的用于集成电路的温度监控装置,其中,所述温度监控装置还包括处理模块和供电模块,
所述供电模块与所述处理模块通信连接,配置为为所述多个运算模块提供电压,
所述处理模块与所述多个温度控制单元通信连接,配置为基于所述第二控制信号,控制所述供电模块切断所述第一运算模块的电压。
19.一种电子设备,包括:
处理器;
存储器,包括一个或多个计算机程序模块;
其中,所述一个或多个计算机程序模块被存储在所述存储器中并被配置为由所述处理器执行,所述一个或多个计算机程序模块用于实现权利要求1-10任一项所述的用于集成电路的温度监控方法。
20.一种存储介质,存储有非暂时性计算机可读指令,当所述非暂时性计算机可读指令由计算机执行时实现权利要求1-10任一项所述的用于集成电路的温度监控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410251009.3A CN118258514A (zh) | 2024-03-05 | 2024-03-05 | 温度监控方法及装置、电子设备与存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410251009.3A CN118258514A (zh) | 2024-03-05 | 2024-03-05 | 温度监控方法及装置、电子设备与存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118258514A true CN118258514A (zh) | 2024-06-28 |
Family
ID=91604694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410251009.3A Pending CN118258514A (zh) | 2024-03-05 | 2024-03-05 | 温度监控方法及装置、电子设备与存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118258514A (zh) |
-
2024
- 2024-03-05 CN CN202410251009.3A patent/CN118258514A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101526051B1 (ko) | 열적 제어 장치 및 방법론 | |
TWI536158B (zh) | 基於使用中處理器之動態電壓及頻率管理 | |
JP6668346B2 (ja) | ライセンス状態に基づくコア低下緩和のためのシステムおよび方法 | |
US11126246B2 (en) | Apparatus, method, and system for power consumption management of system-on-chip | |
US11079831B2 (en) | Control scheme to temporarily raise supply voltage in response to sudden change in current demand | |
KR102384904B1 (ko) | 집적 회로들을 위한 전력 관리 시스템 | |
JP2021515324A (ja) | 電圧レベル及びドループイベントのオンボードモニタリング | |
US9495239B1 (en) | User-configurable error handling | |
JP2024525376A (ja) | サイクル当たりの命令の低減を介してマルチプロセッサコアシステムにおける電流供給を制御するためのシステム及び方法 | |
JP2008518313A (ja) | 可変のクロックレートを伴うデータ処理システム | |
JP5310819B2 (ja) | マイクロコンピュータ | |
CN118258514A (zh) | 温度监控方法及装置、电子设备与存储介质 | |
JP2014021786A (ja) | コンピュータ・システム | |
US10228882B2 (en) | Semiconductor device and memory access control method | |
JP2018195243A (ja) | 半導体装置、及び半導体装置の制御方法 | |
JP6441166B2 (ja) | 半導体装置 | |
US20170269969A1 (en) | Memory access control device, information processing system, memory access control method, and recording medium stored with program | |
US11960341B2 (en) | Power delivery reduction scheme for SoC |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |