CN117406844A - 一种基于神经网络的显卡风扇控制方法及相关装置 - Google Patents
一种基于神经网络的显卡风扇控制方法及相关装置 Download PDFInfo
- Publication number
- CN117406844A CN117406844A CN202311510233.1A CN202311510233A CN117406844A CN 117406844 A CN117406844 A CN 117406844A CN 202311510233 A CN202311510233 A CN 202311510233A CN 117406844 A CN117406844 A CN 117406844A
- Authority
- CN
- China
- Prior art keywords
- display card
- information
- temperature
- power consumption
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 44
- 230000017525 heat dissipation Effects 0.000 claims abstract description 32
- 238000010438 heat treatment Methods 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims description 74
- 238000012545 processing Methods 0.000 claims description 50
- 230000008859 change Effects 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 37
- 238000001514 detection method Methods 0.000 claims description 35
- 230000033228 biological regulation Effects 0.000 claims description 24
- 238000013468 resource allocation Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 claims description 4
- 238000011217 control strategy Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 21
- 238000004140 cleaning Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 230000035772 mutation Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000011897 real-time detection Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/20—Cooling means
- G06F1/206—Cooling means comprising thermal management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Feedback Control In General (AREA)
Abstract
本申请公开了一种基于神经网络的显卡风扇控制方法及相关装置,该方法包括:通过对显卡内正在执行的线程数量进行统计和记录,以获取显卡运行信息;获取显卡任务调度信息;根据显卡运行信息和显卡任务调度信息,对显卡运行走势分析,确定功耗走势信息;基于功耗走势信息进行显卡高温识别,获得高温识别信息;获取显卡产品信息;当判断设备发热原因为显卡时,获取当前时间点的显卡温度参数和设备气温参数,结合高温识别信息和显卡产品信息,生成风扇控制反馈信息。本申请基于风扇控制反馈信息,调节显卡风扇转速以实现显卡散热;利用风扇控制反馈信息,为后续显卡散热的风扇控制提供更精准的控制,使得显卡风扇控制更具适应性。
Description
技术领域
本申请涉及显卡散热技术领域,尤其涉及一种基于神经网络的显卡风扇控制方法及相关装置。
背景技术
显卡作为计算机的重要组成部分,负责处理图形渲染和计算任务,其性能和稳定性直接影响到计算机的运行效果。为了保证显卡的正常运行,常常需要对显卡进行及时散热。然而,随着数字化时代的到来,显卡的应用范围不断扩大,对显卡的智能散热方式也提出了更高层次的要求。
现有技术中,一方面,有针对显卡风扇控制采用固定频率的方式,这种方式无法根据显卡的实际负载情况动态调整风扇的转速;另一方面,有通过检测显卡的GPU温度来调整风扇的转速,虽然在一定程度上提高了监测的精准性,但是这种监测方式忽略了显卡的其他重要性能指标,如显存使用情况、GPU使用率等,无法全面反映显卡的运行状态,同时也无法较好地应对高温情况。现有技术中,存在针对显卡的实时散热不够及时,精准性不足,进而造成显卡的性能和使用效果不佳,无法根据显卡的运行状态进行有效地控制风扇的技术问题。
发明内容
为了克服现有技术存在的缺陷与不足,本申请提供了一种基于神经网络的显卡风扇控制方法及相关装置。
为了达到上述目的,本申请采用以下技术方案:
根据本申请的一个方面,提供了一种基于神经网络的显卡风扇控制方法,包括如下步骤:
通过对显卡内正在执行的线程数量进行统计和记录,以获取显卡运行信息,所述显卡运行信息包括运行时间信息和显卡资源占用信息;
获取显卡任务调度信息,显卡任务调度信息包括任务ID、显卡资源分配信息、任务预估完成时长以及显卡资源消耗信息,任务ID分别与显卡资源分配信息、显卡资源消耗信息之间具有一一对应关系;
根据显卡运行信息和显卡任务调度信息,对显卡运行走势分析,确定功耗走势信息;
基于功耗走势信息进行显卡高温识别,获得高温识别信息;
获取显卡产品信息;
当判断设备发热原因为显卡时,获取当前时间点的显卡温度参数和设备气温参数,结合高温识别信息和显卡产品信息,生成风扇控制反馈信息;
基于所述风扇控制反馈信息,调节显卡风扇转速以实现显卡散热;
其中,所述显卡资源占用信息包括计算资源点占用数量,所述运行时间信息包括显卡资源占用信息对应的时间参数。
优选地,在根据显卡运行信息和显卡任务调度信息,对显卡运行走势分析,确定功耗走势信息的步骤中,具体包括:
根据显卡运行信息,确定显卡负载率信息;
基于预存的显卡功耗表,根据显卡负载率信息确定功耗信息;
根据显卡任务调度信息,进行资源需求总值、资源已消耗总值分析,确定资源消耗剩余进度;
根据资源消耗剩余进度获取预测功耗时长,根据功耗信息获取预测功耗时长范围内每个时间点对应的预测功耗幅值,基于预测功耗时长、预测功耗时长范围内每个时间点对应的预测功耗幅值构建功耗持续信息;
结合功耗信息和功耗持续信息,构建功耗走势信息;
所述显卡负载率信息包括运行时间信息对应的显卡负载率参数,每个显卡负载率参数具体通过下式获得:
其中δi为第i个时间参数对应的显卡负载率参数,为第i个时间参数对应的计算资源点占用数量,/>为计算资源点总数量。
优选地,在根据显卡任务调度信息,进行资源需求总值、资源已消耗总值分析,确定资源消耗剩余进度的步骤中,具体包括:
统计所有任务的显卡资源分配信息以确定资源需求总值,显卡资源分配信息中每个任务ID具有被分配的GPU资源,将所有任务分配的GPU资源所对应的计算资源点需求值进行累加以得到资源需求总值,表示为:
其中Rtotal表示资源需求总值,表示第k个任务ID被分配的GPU资源所对应的计算资源点需求值,M为任务总数量,1≤k≤M且k的取值为正整数;
统计所有任务的显卡资源消耗信息以确定资源已消耗总值,显卡资源消耗信息中每个任务ID具有对应的显卡资源已消耗值,将所有任务所对应的显卡资源已消耗值进行累加以得到资源已消耗总值,表示为:
其中RC表示资源已消耗总值,表示第k个任务ID对应的显卡资源已消耗值,M为任务总数量,1≤k≤M且k的取值为正整数;
计算资源消耗剩余进度,具体过程为:
其中θ表示资源消耗剩余进度,Rtotal-Rc表示资源消耗剩余需求值,Rtotal表示资源需求总值。
优选地,在构建功耗持续信息中,预测功耗幅值为利用预训练的功耗预测模型得到,所述功耗预测模型的建立过程,包括:
获取指定型号显卡不同时间的历史功耗数据,所述历史功耗数据中包括历史时间参数与历史功耗幅值;
对所述历史功耗数据进行预处理,得到功耗训练集以及功耗验证集;
设置多个候选模型,每个候选模型对应的模型算法不相同;
将功耗训练集导入多个候选模型进行训练,通过比较训练结果与功耗验证集中对应的同类数据,评估候选模型输出预测功耗幅值的准确度;
挑选出输出预测功耗幅值的准确度最高的候选模型作为最终的功耗预测模型,该功耗预测模型用于基于输入的预测时间点进行预测,得到该预测时间点对应的预测功耗幅值;
所述预测功耗时长具体表示为:
Tpre=θ*Ttotal
其中,Tpre表示资源消耗剩余需求值对应的预测功耗时长,Ttotal表示任务预估完成时长。
优选地,在基于功耗走势信息进行显卡高温识别,获得高温识别信息的步骤中,具体包括:
构建高温识别训练数据集,所述高温识别训练数据集包括多组训练数据,每组训练数据包括历史功耗走势信息以及该历史功耗走势信息对应的高温标识信息,该历史功耗走势信息对应的高温标识信息用于判断该历史功耗走势信息是否存在高温风险,高温标识信息包括多个与时间参数对应的标识值,当标识值为真时表示存在高温风险,当标识值为假时表示不存在高温风险;
构建反馈式神经网络结构并设置模型收敛条件;
利用高温识别训练数据集对该反馈式神经网络结构进行训练;
若反馈式神经网络结构的训练结果达到了模型收敛条件时,获得高温识别模型;
将功耗走势信息输入高温识别模型中,获得模型输出结果,模型输出结果为功耗走势信息对应的高温识别信息,功耗走势信息内的每个时间点均对应一个标识值。
优选地,在生成风扇控制反馈信息的过程中,具体包括:
若高温识别信息中当前时间点对应的标识值为假,且未来首个标识值为真的时间点与当前时间点的时间差在预设时间范围内,则从预设的风扇调节规则库中选取目标风扇控制表,根据显卡型号进行匹配对应的目标风扇控制表,在目标风扇控制表中根据当前时间点的显卡温度参数和设备气温参数的组合关系进行确定风扇控制反馈信息;
否则,不做处理,继续保持当前的风扇控制参数进行散热;
当前时间点的显卡温度参数为对应当前时间点设备内显卡的温度参数,当前时间点的设备气温参数为对应当前时间点设备内空气的温度参数,所述风扇调节规则库为用于应对显卡出现高温时采取的风扇控制策略;
所述风扇调节规则库包括与不同型号显卡一一对应的目标风扇控制表,所述目标风扇控制表为用于确定调节参数集合的映射规则,目标风扇控制表包括多个索引信息、多个调节参数集合,所述索引信息为显卡温度参数和设备气温参数的组合关系,每个调节参数集合中包括至少一组参数信息,每组参数信息包含风扇转速参数和持续时间参数的组合关系。
优选地,在当判断设备发热原因为显卡时,获取当前时间点的显卡温度参数和设备气温参数,结合高温识别信息和显卡产品信息,生成风扇控制反馈信息的步骤中,判断设备发热原因为显卡的条件,具体通过以下方式实现:
获取设备气温信息、主板温度信息、显卡温度信息、中央处理器温度信息以及电源温度信息;
计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子并确定影响因子参数最大值;
若影响因子参数最大值为显卡温度影响因子,则设备发热原因为显卡的条件成立,否则设备发热原因为显卡的条件不成立;
在计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子并确定影响因子参数最大值中,包括:
按照时间顺序依次整理运行时间信息,基于整理后的运行时间信息建立N维列向量,以得到设备气温向量、主板温度向量、显卡温度向量、中央处理器温度向量、电源温度向量,每个向量中包含N个时间参数对应的温度参数,N对应为时间序号总数量;
基于影响因子公式进行分别计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子,并通过数值大小进行对比以确定出影响因子参数最大值;
其中,所述设备气温信息包括运行时间信息对应设备内空气的温度参数,所述主板温度信息包括运行时间信息对应设备内主板的温度参数,所述显卡温度信息包括运行时间信息对应设备内显卡的温度参数,所述中央处理器温度信息包括运行时间信息对应设备内中央处理器的温度参数,所述电源温度信息包括运行时间信息对应设备内电源的温度参数。
优选地,计算主板温度影响因子的过程为:
其中θB为主板温度影响因子,ω1为主板温度滞后因子,N为时间序号总数量,Ak为设备气温向量里第k个元素对应的数值,为主板温度向量里第k-ω1个元素对应的数值,N-ω1为第一主板温度影响项中的基准系数;
计算显卡温度影响因子的过程为:
其中θC为显卡温度影响因子,ω2为显卡温度滞后因子,Ak为设备气温向量里第k个元素对应的数值,为显卡温度向量里第k-ω2个元素对应的数值,N-ω2为第一显卡温度影响项中的基准系数;
计算中央处理器温度影响因子的过程为:
其中θD为中央处理器温度影响因子,ω3为中央处理器温度滞后因子,Ak为设备气温向量里第k个元素对应的数值,为中央处理器温度向量里第k-ω3个元素对应的数值,N-ω3为第一中央处理器温度影响项中的基准系数;
计算电源温度影响因子的过程为:
其中θD为电源温度影响因子,ω4为电源温度滞后因子,Ak为设备气温向量里第k个元素对应的数值,为电源温度向量里第k-ω4个元素对应的数值,N-ω4为第一电源温度影响项中的基准系数;
设备气温向量内的元素为运行时间中每个时刻对应设备内空气的温度值,主板温度向量内的元素为运行时间中每个时刻对应的主板温度值,显卡温度向量内的元素为运行时间中每个时刻对应的显卡温度值,中央处理器温度向量内的元素为运行时间中每个时刻对应的中央处理器温度值,电源温度向量内的元素为运行时间中每个时刻对应的电源温度值。
优选地,还包括:在预设检测时间内确定显卡温度变化参数,若显卡温度变化参数大于预设变化阈值,则获取最近使用的风扇控制反馈信息所对应的位置信息,根据该位置信息修正调节参数集合,否则不做处理,所述位置信息为调节参数集合在风扇调节规则库中对应的存储位置;
所述在预设检测时间内确定显卡温度变化参数,具体包括:获取第一检测温度和第二检测温度,将第二检测温度减去第一检测温度以得到显卡温度变化参数,第一检测温度为在调节显卡风扇转速时进行实时检测得到的显卡温度参数,第二检测温度为在预设检测时间后进行实时检测得到的显卡温度参数。
根据本申请的另一个方面,还提供了一种基于神经网络的显卡风扇控制装置,包括:
运行记录模块,用于通过对显卡内正在执行的线程数量进行统计和记录,以获取显卡运行信息;
任务调度模块,用于获显卡任务调度信息包括任务类型、任务ID、显卡资源分配信息、任务预估完成时长以及显卡资源消耗信息,任务ID分别与任务类型、显卡资源分配信息、显卡资源消耗信息之间具有一一对应关系;
功耗走势分析模块,用于根据显卡运行信息和显卡任务调度信息,对显卡运行走势分析,确定功耗走势信息;
显卡高温识别模块,用于基于功耗走势信息进行显卡高温识别,获得高温识别信息;
产品信息模块,用于获取显卡产品信息;
风扇控制反馈模块,用于当判断设备发热原因为显卡时,获取当前时间点的显卡温度参数和设备气温参数,结合高温识别信息和显卡产品信息,生成风扇控制反馈信息;
风扇转速调节模块,用于基于风扇控制反馈信息,调节显卡风扇转速以实现显卡散热;
风扇转速修正模块,用于在预设检测时间内确定显卡温度变化参数,若显卡温度变化参数大于预设变化阈值,则获取最近使用的风扇控制反馈信息所对应的位置信息,根据该位置信息进行修正调节参数集合,否则不做处理;
其中,所述显卡运行信息包括运行时间信息和显卡资源占用信息,所述显卡资源占用信息包括计算资源点占用数量,所述运行时间信息包括显卡资源占用信息对应的时间参数。
本申请与现有技术相比,具有如下优点和有益效果:
(1)通过对显卡运行信息和显卡任务调度信息进行功耗走势分析,获得功耗走势信息,从而提高对显卡进行实时风扇控制的可靠性,并基于功耗走势信息进行显卡高温识别,以对显卡风扇控制进行前置分类,使得后续显卡散热的风扇控制更精准,使得显卡风扇控制更适合实际场景,更具适应性。
(2)利用预设检测时间和预设变化阈值进行验证当前的风扇控制是否具有较好的散热效果,通过及时验证散热效果来更新风扇调节规则库,从而进一步提高后续风扇控制的控制准确性,进一步提高实时散热的适配度和有效性。
附图说明
图1为本申请实施例1提供的基于神经网络的显卡风扇控制方法的流程示意图;
图2为本申请实施例1提供的基于神经网络的显卡风扇控制方法中确定功耗走势信息的步骤示意图;
图3为本申请实施例1提供的基于神经网络的显卡风扇控制方法中对显卡进行高温识别的步骤示意图;
图4为本申请实施例2提供的基于神经网络的显卡风扇控制方法中判断显卡温度变化参数进行修正调节参数集合的步骤示意图;
图5为本申请实施例3提供的基于神经网络的显卡风扇控制装置的结构示意图;
图6为本申请实施例5中提供的一种计算机设备的结构示意图。
具体实施方式
在本公开的描述中,需要说明的是,下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
实施例1
本实施例在此对显卡的运行场景进行说明:显卡(GPU)由多个处理器组成,每个处理器均用于同时执行多个线程,线程是程序执行流的最小单元。一个标准的线程由线程ID、当前指令指针(PC)、寄存器集合和堆栈组成。而线程是进程中的一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。显卡在运行时将所有线程划分至X个网格(Grid)中,其中每个网格包括Y个线程块(Block),每个线程块包括Z个线程,X,Y,Z均为正整数,即所有线程被组织成线程块,线程块是由一组线程构成的集合,网格是由一组线程块构成的集合。每个线程具有唯一的标识ID,即ThreadId,ThreadId为基于该线程所在网格和线程块的划分位置生成,进而每个ThreadId在空间上具有唯一性。相应的,每个线程块具有唯一的标识ID,即BlockId;每个网格具有唯一的标识ID,即GridId;显卡在运行时每个ThreadId则对应一个计算资源点,每个BlockId对应一个计算资源块,每个GridId对应一个计算资源区,进而能够根据显卡运行时执行ThreadId的数量得到此时显卡的使用情况,以构成显卡资源占用信息。此外,本申请应用场景中使用的显卡具体为独立显卡。
参见附图1,本申请提供一种基于神经网络的显卡风扇控制方法,其中,该方法应用于一种基于神经网络的显卡风扇控制装置。该方法具体包括如下步骤:
步骤S100:通过对显卡内正在执行的线程数量进行统计和记录,以获取显卡运行信息;其中,显卡运行信息包括运行时间信息和显卡资源占用信息,显卡资源占用信息包括计算资源点占用数量、计算资源块占用数量以及计算资源区占用数量,运行时间信息包括显卡资源占用信息对应的时间参数。
具体而言,基于预设周期,利用定时器定时触发对显卡设备的查询操作,以检测获得显卡运行信息,即利用现有的cuda编程接口进行查询显卡的设备信息,获得显卡运行信息。计算资源点占用数量是用于表征显卡正在占用的线程数量参数信息,计算资源块占用数量是用于表征显卡正在占用的线程块数量参数信息,计算资源区占用数量是用于表征显卡正在占用的网格数量参数信息。达到了对显卡的运行状态检测,获得显卡运行信息,为后续对显卡进行实时风扇控制奠定基础的技术效果。
步骤S200:获取显卡任务调度信息,显卡任务调度信息包括任务类型、任务ID、显卡资源分配信息、任务预估完成时长以及显卡资源消耗信息,任务ID分别与任务类型、显卡资源分配信息、显卡资源消耗信息之间具有一一对应关系;
在本实施例中,显卡任务调度信息在显卡需求任务发起请求时构建,任务ID为用于区分不同任务的唯一标识码;显卡资源分配信息为基于任务ID分配的GPU资源和显存资源,即针对每个任务从开始到结束整个过程中需要使用的资源需求,进而将该资源需求作为每个任务ID的显卡资源分配信息,还需要说明的是,在任务执行前每个任务ID的显卡资源分配信息为确定的;
而显卡资源消耗信息为基于当前时间点对显卡资源分配信息进行消耗分析的情况,显卡资源消耗信息包括基于任务ID所对应的显卡资源消耗记录,进而可以通过对每个任务ID对应的显卡资源消耗记录进行统计求和以获得每个任务ID对应的显卡资源已消耗值。本步骤中,如何对基于GPU资源和显存资源进行消耗分析和如何获取任务预估完成时长为现有技术,不在本申请的保护范围之内。
示例性的,当在某一t时间点进行获取显卡任务调度信息,此时t对应为当前时间点,第k个任务的显卡资源分配信息中所分配的GPU资源所对应的计算资源点需求值为该值在资源调度请求时确定,在资源调度请求时如何确定每个任务的显卡资源分配信息为现有技术,不在本申请的保护范围之内,例如资源调度请求中一般包括针对作业任务的资源量(如100G的GPU需求值),若一个计算资源点对应预设单位数值的资源量,进而将该资源量在数值上转换为对应的计算资源点需求值。显卡资源消耗信息此时已记录至t时刻,若从第1个时间点开始按(时间点,消耗值)的格式进行举例,那么依次为:(1,yk,1),(2,yk,2),……,(t,yk,t),其中yk,1为第k个任务在第1个时间点对应的消耗值,yk,2为第k个任务在第2个时间点对应的消耗值,yk,t为第k个任务在第t个时间点对应的消耗值,每个消耗值在数值上为对应时间点所消耗的计算资源点,其中,yk,1、yk,2……yk,t为相对前一个时间点新增消耗的计算资源点,通过统计求和得到显卡资源已消耗值,那么此时第k个任务的显卡资源已消耗值/>表示为:/> 若此时第k个任务仍在执行,那么在数值大小上满足:/>应当明白,上述yk,1、yk,2、yk,t等仅用于表示数值大小的示例,在此不做限定。
还需要说明的是,在本实施例中,任务类型包括第一至第五类型。示例性的,第一类型为针对需要图形渲染的任务,例如在需要3D图形渲染的游戏中,显卡的任务是实时渲染图像,通过显卡处理游戏中的每一个物体的渲染,使游戏画面看起来更加真实。第二类型为针对视频播放和编辑的任务,例如在视频播放和编辑中,显卡需要负责对视频帧进行解码和渲染,以提供平滑的播放效果,在进行视频编辑时,显卡通过帮助加速视频的预览和处理,以提高工作效率。第三类型为针对人工智能的任务,在人工智能领域的应用中,例如天气预报、物理模拟、机器学习等应用场景中,通过使用显卡进行并行计算,从而加速大规模数据的处理和分析。第四类型为针对虚拟现实(VR)和增强现实(AR)的任务,例如在虚拟现实和增强现实应用中,需要显卡实时渲染3D图像,为用户提供一个逼真的虚拟环境或增强现实体验。第五类型为针对专业绘图和设计的任务,例如由专业的图形设计和绘图软件触发的显卡应用需求,如Adobe Photoshop、Illustrator、AutoCAD等,显卡可以加速图像的处理和显示,提供更快的响应速度和更佳的视觉效果。
步骤S300:根据显卡运行信息和显卡任务调度信息,对显卡运行走势分析,确定功耗走势信息;
在本实施例中,结合图2所示,步骤S300,具体包括:
步骤S310:根据显卡运行信息,确定显卡负载率信息;其中,显卡负载率信息包括运行时间信息对应的显卡负载率参数,所有运行时间信息对应的显卡负载率参数构成显卡负载率信息,每个显卡负载率参数具体通过将时间参数对应的计算资源点占用数量除以该时间参数对应的计算资源点总数量进行计算得到。针对每个显卡负载率参数:
其中δi为第i个时间参数对应的显卡负载率参数,为第i个时间参数对应的计算资源点占用数量,/>为计算资源点总数量。计算资源点总数量为显卡内预先确定好的数值,优选的,计算资源点总数可通过以下方法设定:一个显卡在运行时将所有线程划分至X个网格(Grid)中,其中每个网格包括Y个线程块(Block),每个线程块包括Z个线程,那么计算资源点总数量则等于X*Y*Z。
步骤S320:基于预存的显卡功耗表,根据显卡负载率信息确定功耗信息;
在本步骤中,显卡功耗表为显卡负载率参数与对应功耗幅值的映射关系表。如何构建显卡功耗表为现有技术,不在本申请的保护范围之内。例如,显卡功耗表可以通过以下方式实现:预先利用多组包含显卡负载率参数、与该显卡负载率参数对应的功耗幅值数据进行映射,以得到显卡负载率参数与对应功耗幅值的映射关系表。功耗信息包括运行时间信息、运行时间信息对应的显卡负载率信息、显卡负载率信息对应显卡的功耗幅值;运行时间信息包括多个时间参数,且每个时间参数分别对应一个显卡负载率参数,进而构成显卡负载率信息。
步骤S330:根据显卡任务调度信息,进行资源需求总值、资源已消耗总值分析,确定资源消耗剩余进度;
在本实施例中,在步骤S330:根据显卡任务调度信息,进行资源需求总值、资源已消耗总值分析,确定资源消耗剩余进度中,具体包括:
步骤S331:统计所有任务的显卡资源分配信息以确定资源需求总值;在本步骤中,显卡资源分配信息中每个任务ID具有被分配的GPU资源,将所有任务分配的GPU资源所对应的计算资源点需求值进行累加以得到资源需求总值,表示为:
其中Rtotal表示资源需求总值,表示第k个任务ID分配的GPU资源所对应的计算资源点需求值,M为任务总数量,1≤k≤M且k的取值为正整数。
步骤S332:统计所有任务的显卡资源消耗信息以确定资源已消耗总值;在本步骤中,显卡资源消耗信息中每个任务ID具有对应的显卡资源已消耗值,将所有任务所对应的显卡资源已消耗值进行累加以得到资源已消耗总值,表示为:
其中RC表示资源已消耗总值,表示第k个任务ID对应的显卡资源已消耗值,M为任务总数量,1≤k≤M且k的取值为正整数;
步骤S333:计算资源消耗剩余进度,具体过程为:
其中θ表示资源消耗剩余进度,Rtotal-Rc表示资源消耗剩余需求值,Rtotal表示资源需求总值,Rc表示资源已消耗总值。
步骤S340:根据资源消耗剩余进度获取预测功耗时长,根据功耗信息获取预测功耗时长范围内每个时间点对应的预测功耗幅值,基于预测功耗时长、预测功耗时长范围内每个时间点对应的预测功耗幅值构建功耗持续信息,功耗持续信息包括预测功耗时长、预测功耗时长范围内每个时间点对应的预测功耗幅值;
实际应用时,在构建功耗持续信息中,包括:
将任务预估完成时长与资源消耗剩余进度相乘以得到预测功耗时长,预测功耗时长具体表示为:
Tpre=θ*Ttotal
其中,Tpre表示资源消耗剩余需求值对应的预测功耗时长,Ttotal表示任务预估完成时长。
在本实施例中,预测功耗幅值可以利用预训练的功耗预测模型得到,其中功耗预测模型的建立过程,包括:
获取指定型号显卡不同时间的历史功耗数据,历史功耗数据中包括历史时间参数与历史功耗幅值;
对历史功耗数据进行预处理,得到功耗训练集以及功耗验证集;对历史功耗数据进行预处理,具体包括:a1:对历史功耗数据进行异常值清洗、重复值清洗和缺失值清洗,得到预处理功耗数据,以消除因数据失真、传输错误等问题导致的原始数据中存在的异常数据。其中,异常值清洗为针对显卡运行状态的筛选清洗处理,即对显卡负载率参数大于预设负载率阈值的情况进行筛选收集,避免后续训练用数据混杂显卡处于空闲状态的干扰数据;重复值清洗包括:基于历史时间参数的时间戳,去除重复数据,即同一型号显卡在同一时刻只有唯一一条数据记录;缺失值清洗包括:若某时刻历史功耗幅值缺失,则利用前后时刻均值填补缺失值;a2:对预处理功耗数据进行划分,得到功耗训练集以及功耗验证集;
设置多个候选模型,每个候选模型对应一个模型算法,每个候选模型对应的模型算法可以设置为相同算法,或者任意预设的不同算法;其中,模型算法均为现有技术,例如可以对任一个候选模型导入自回归模型算法(AR)、移动平均模型算法(MA)、自回归滑动平均模型算法(ARMA)或长短时记忆网络模型算法(LSTM)中的任一种模型算法以完成对候选模型的设置。
将功耗训练集导入多个候选模型进行训练,通过比较训练结果与功耗验证集中对应的同类的数据,评估候选模型输出预测功耗幅值的准确度;示例性的,训练结果与功耗验证集中对应的同类的数据,为针对同一输入的时间参数的时间戳对应的预测值与真实值,通过比较预测值与真实值的差异进行评估候选模型输出预测功耗幅值的准确度。此外,本领域技术人员应当明白,评估所用的评估指标还可以依据实际情况进行调整,本实施例在此不做限定,示例性的,评估指标包括但不限于均方误差、均方根误差、平均绝对误差,均方误差用于衡量模型预测值与真实值之间的平均差异,越接近于0表示模型预测越准确;均方根误差为均方误差的平方根,用于衡量模型预测值与真实值之间的标准差,越接近于0表示模型预测越准确;平均绝对误差用于衡量模型预测值与真实值之间的平均绝对差异,越接近于0表示模型预测越准确。
挑选出输出预测功耗幅值的准确度最高的候选模型作为最终的功耗预测模型,该功耗预测模型用于基于输入的预测时间点进行预测,得到该预测时间点对应的预测功耗幅值;实际应用时,通过获取指定型号显卡不同日期、不同时间段的历史功耗数据(历史时间参数与历史功耗幅值),并基于机器学习的方式,依据这些历史功耗数据可训练出功耗预测模型,以预测指定型号显卡在预测功耗时长范围内每个时间点对应的预测功耗幅值。例如,未来指定时间对应的预测功耗幅值就可由该功耗预测模型预测出来。
将任务预估完成时长与资源消耗剩余进度相乘以得到预测功耗时长,进而确定预测功耗时长所对应的所有时间参数,利用功耗预测模型依次输出得到对应的预测功耗幅值,从而构成功耗持续信息。
由于这个功耗预测模型的依据是大量处于显卡运行时进行精细划分日期和时间段的真实历史数据,因而预测出的预测功耗幅值具有相当的准确性。依此,可以获得各种型号显卡的功耗预测模型。各种型号显卡的功耗预测模型可以由云端服务器在云端进行训练,每种型号显卡对应唯一一个功耗预测模型。
步骤S350:结合功耗信息和功耗持续信息,构建功耗走势信息。
具体而言,根据显卡运行信息,确定显卡负载率信息,并通过预存的显卡功耗表对显卡的功耗情况进行映射,获得功耗信息。进一步,根据显卡负载率信息和显卡任务调度信息,进行资源需求总值、资源已消耗总值分析,确定资源消耗剩余进度,进而通过对显卡的进行功耗时长、功耗幅值预测以确定功耗持续信息,通过结合功耗信息和功耗持续信息,获得任务预估完成时长内的时间信息及每个时间点对应的功耗幅值的映射关系,从而获得功耗走势信息,即功耗走势信息为该映射关系。
功耗持续信息包括资源消耗进度对应的预测功耗时长、预测功耗幅值,功耗走势信息包括对应任务预估完成时长的时间信息及每个时间点对应的功耗幅值。达到了通过对显卡运行信息和显卡任务调度信息进行功耗走势分析,获得功耗走势信息,从而提高对显卡进行实时风扇控制的可靠性的技术效果。
步骤S400:基于功耗走势信息进行显卡高温识别,获得高温识别信息;
进一步的,结合图3所示,本申请步骤S400,具体包括:
步骤S410:构建高温识别训练数据集;本步骤中,高温识别训练数据集包括多组训练数据,每组训练数据包括历史功耗走势信息以及该历史功耗走势信息对应的高温标识信息,该历史功耗走势信息对应的高温标识信息用于判断该历史功耗走势信息是否存在高温风险,高温标识信息包括多个与时间参数对应的标识值,当标识值为真时表示存在高温风险,当标识值为假时表示不存在高温风险;在任一个历史功耗走势信息对应的高温标识信息中,对任一时间参数,均有一个历史功耗幅值与标识值一一对应;步骤S420:构建反馈式神经网络结构并设置模型收敛条件;
步骤S430:利用高温识别训练数据集对该反馈式神经网络结构进行训练;
步骤S440:若反馈式神经网络结构的训练结果达到了模型收敛条件时,获得高温识别模型;本步骤中,模型收敛条件包括预先设置确定的高温识别模型的准确率阈值。反馈式神经网络结构的收敛结果包括高温识别模型的准确率。
步骤S450:将功耗走势信息输入高温识别模型中,获得模型输出结果,模型输出结果为功耗走势信息对应的高温识别信息,高温识别信息包括多个标识值,当标识值为真时表示存在高温风险,当标识值为假时表示不存在高温风险,功耗走势信息内的每个时间点均对应一个标识值。
具体而言,通过高温识别训练数据集对反馈式神经网络结构进行训练、收敛,当反馈式神经网络结构的收敛结果达到模型收敛条件时,获得高温识别模型。进一步,将功耗走势信息作为输入信息,输入高温识别模型,获得模型输出结果。
还需要说明的是,反馈式神经网络结构是一种人工神经网络。反馈神经网络包括输入层、隐含层、输出层和承接层。承接层用于在层内或层间的反馈联结,通过在输入层与隐含层的层间、隐含层与输出层的层间建立反馈联结使得其能够表达输入与输出之间在时间上的延迟,相当于一个延时算子,进而使得网络具有了记忆功能。实际应用时,在反馈式神经网络结构中,各神经元从输入层开始,接收前一级输入,并将接收的前一级输入传输至下一级,经过承接层进行反馈联结以产生网络的反馈作用,得到下一时刻网络的输入信号,再由这个新的输入信号作用于网络,可得到下一时刻网络的输出状态,将该输出反馈到输入层,又形成新的输入信号,如此不断的循环下去。那么经过多次反馈运行,反馈式神经网络结构达到稳态,即由输出层得到网络的稳态输出。示例性的,反馈神经网络例如有Hopfield网络、Elman网络、CG网络、盒中脑(BSB)模型和双向联想记忆(BAM)等,反馈神经网络具有比向前神经网路更强的计算能力,其最突出的优点是很强的联想记忆和优化计算功能。优选的,本申请实施例中的反馈神经网络模型采用Hopfield神经网络模型对是否存在高温风险进行识别。
具体而言,显卡温度过热时会造成显卡性能下降,显卡会自动降频以降低显卡温度。当温度高到一定程度时,显卡会自动关机以防止过热造成损坏。高温识别模型满足反馈式神经网络结构,且高温识别模型具有对输入的功耗走势信息进行智能化分析及显卡高温识别的功能。通过高温识别模型对功耗走势信息进行准确而高效的高温风险识别,获得可靠的高温识别信息,从而及时对显卡进行实时风扇控制,解决了显卡散热不及时的技术问题,提高了显卡的实时散热降温的效果,同时还提高了显卡后续处理任务时进行长期散热的稳定性。
步骤S500:获取显卡产品信息;本步骤中,显卡产品信息包括但不限于显卡型号;本步骤中,显卡产品信息为通过对显卡型号进行产品查询以得到;
步骤S600:当判断设备发热原因为显卡时,获取当前时间点的显卡温度参数和设备气温参数,结合高温识别信息和显卡产品信息,生成风扇控制反馈信息。
步骤S700:基于风扇控制反馈信息,调节显卡风扇转速以实现显卡散热。
进一步的,本申请步骤S600在生成风扇控制反馈信息的过程中,具体包括:
步骤S610:若高温识别信息中当前时间点对应的标识值为假,且未来首个标识值为真的时间点与当前时间点的时间差在预设时间范围内,则从预设的风扇调节规则库中选取目标风扇控制表,根据显卡型号进行匹配对应的目标风扇控制表,在目标风扇控制表中根据当前时间点的显卡温度参数和设备气温参数的组合关系进行确定风扇控制反馈信息;示例性的,高温识别信息中当前时间点对应的标识值为假,且未来首个标识值为真的时间点与当前时间点的时间差在预设时间范围内,表示为:
G(tnow)表示高温识别信息中当前时间点对应的标识值,G(tnow+l)表示高温识别信息中基于当前时间点未来第l个时间点对应的标识值,对应为未来首个标识值为真的时间点所对应的标识值,L1为预设时间范围的左边界值,L2为预设时间范围的右边界值,0<l,G(tnow+1),…,G(tnow+l-1)表示高温识别信息中基于当前时间点未来第1至l-1个时间点对应的标识值。在本步骤中,当前时间点的显卡温度参数为对应当前时间点设备内显卡的温度参数,当前时间点的设备气温参数为对应当前时间点设备内空气的温度参数。
本步骤中,风扇调节规则库为预先设置,风扇调节规则库为用于应对显卡出现高温时采取的风扇控制策略;风扇调节规则库包括与不同型号显卡一一对应的目标风扇控制表,目标风扇控制表为用于确定调节参数集合的映射规则,目标风扇控制表包括多个索引信息、多个调节参数集合,索引信息为显卡温度参数和设备气温参数的组合关系,每个调节参数集合中包括至少一组参数信息,每组参数信息包含风扇转速参数和持续时间参数的组合关系;基于索引信息进行匹配调节参数集合,进而将调节参数集合确定为风扇控制反馈信息。
在本步骤中,若高温识别信息为真时,还包括:获取显卡供电状态信息,根据供电变化判断是否存在显卡异常断电情况,若存在显卡异常断电情况则生成供电异常预警信息,以提醒用户及时检查显卡接口连接情况或电源供应情况,若不存在显卡异常断电情况则不做处理。实际应用时,显卡供电状态信息为通过调取主板的监测数据得到,示例性的,当显卡采用PCI-E供电方式时,此时通过主板的PCI-E插槽获取关于显卡供电的电源数据以作为显卡供电状态信息,当显卡采用外接供电方式时,此时通过在显卡上的额外电源接口获取相应的电源数据以作为显卡供电状态信息。
步骤S620:否则,不做处理,继续保持当前的风扇控制参数进行散热;
具体而言,通过对显卡高温识别,以达到对显卡风扇控制进行前置分类,在温度影响程度不同的场景下使用更适合的风扇控制反馈信息,为后续显卡散热的风扇控制提供更精准的技术效果,通过产生更及时的降温效果以避免显卡发生高温情况,使得显卡风扇控制更适合实际场景,更具适应性。示例性的,若高温识别信息为真,显卡温度参数为90℃,设备气温参数为55℃,那么索引信息则为<显卡温度参数,设备气温参数>,即<90,55>。从预设的风扇调节规则库中选取目标风扇控制表,根据显卡型号进行匹配以获取目标风扇控制表后,进而根据索引信息<90,55>进行匹配以获得调节参数集合,例如[(风扇转速参数a1,持续时间参数a1),(风扇转速参数b1,持续时间参数b1)],其中(风扇转速参数a1,持续时间参数a1)为调节参数集合内的第一项调节参数,当经过持续时间参数a1后,继续按(风扇转速参数b1,持续时间参数b1)进行风扇控制;从而通过调节参数集合使得风扇控制的控制精度更准确,达到了通过显卡风扇控制提高实时散热的适配度和有效性的技术效果。
还需要说明的是,风扇转速参数可以包括转速最大值和PWM占比值,转速最大值和PWM占比值均分别与风扇散热效果成正相关关系,其中转速最大值用于限定风扇转动时的最大转速,PWM占比值用于控制风扇的转速,通过控制风扇输入电压的占空比进行调节风扇的平均转速。
在本实施例中,判断设备发热原因为显卡的条件,具体通过以下方式实现:
步骤S600a:获取设备气温信息、主板温度信息、显卡温度信息、中央处理器温度信息以及电源温度信息;其中,设备气温信息包括运行时间信息对应设备内空气的温度参数,主板温度信息包括运行时间信息对应设备内主板的温度参数,显卡温度信息包括运行时间信息对应设备内显卡的温度参数,中央处理器温度信息包括运行时间信息对应设备内中央处理器的温度参数,电源温度信息包括运行时间信息对应设备内电源的温度参数;
在本步骤中,设备气温信息、主板温度信息、显卡温度信息、中央处理器温度信息以及电源温度信息均可利用温度传感器采集得到,示例性的,主板上的温度传感器用以检测主板自身的温度,进而将采集到的数据发送到管理软件,例如Intel的“温度监视器”等,以便用户了解主板各部件的温度情况;显卡上的温度传感器用以检测显卡的温度,进而将数据发送到管理软件,例如NVIDIA的“GeForce Experience”等;电源的内部温度传感器用以检测电源自身的温度,进而将数据发送到电脑的主板或电源管理芯片以获得温度情况;处理器利用内核中的温度传感器来检测自身的温度,进而将采集的数据发送到管理软件,例如Windows的任务管理器等。
步骤S600b:计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子并确定影响因子参数最大值;
步骤S600c:若影响因子参数最大值为显卡温度影响因子,则设备发热原因为显卡的条件成立,否则设备发热原因为显卡的条件不成立。
在本实施例中,计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子并确定影响因子参数最大值,具体包括:
按照时间顺序依次整理运行时间信息,基于整理后的运行时间信息建立N维列向量,以得到设备气温向量、主板温度向量、显卡温度向量、中央处理器温度向量、电源温度向量,每个向量中包含N个时间参数对应的温度参数,N对应为时间序号总数量;
基于影响因子公式进行分别计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子,并通过数值大小进行对比以确定出影响因子参数最大值。
其中,示例性的,计算主板温度影响因子的过程为:
其中θB为主板温度影响因子,为第一主板温度影响项,为第二主板温度影响项,ω1为主板温度滞后因子,N为时间序号总数量,Ak为设备气温向量里第k个元素对应的数值,/>为主板温度向量里第k-ω1个元素对应的数值,/>表示引入主板温度滞后因子进行排齐后基于第k个序号的温差值,N-ω1为第一主板温度影响项中的基准系数;/>
在本步骤中,A对应设备气温向量,设备气温向量内的元素为运行时间中每个时刻对应设备内空气的温度值,B对应主板温度向量,主板温度向量内的元素为运行时间中每个时刻对应的主板温度值,C对应显卡温度向量,显卡温度向量内的元素为运行时间中每个时刻对应的显卡温度值,D对应中央处理器温度向量,中央处理器温度向量内的元素为运行时间中每个时刻对应的中央处理器温度值,E对应电源温度向量,电源温度向量内的元素为运行时间中每个时刻对应的电源温度值。
相应的,计算显卡温度影响因子的过程为:
其中θC为显卡温度影响因子,为第一显卡温度影响项,为第二显卡温度影响项,N为时间序号总数量,ω2为显卡温度滞后因子,Ak为设备气温向量里第k个元素对应的数值,/>为显卡温度向量里第k-ω2个元素对应的数值,/>表示引入显卡温度滞后因子进行排齐后基于第k个序号的温差值,N-ω2为第一显卡温度影响项中的基准系数;
相应的,计算中央处理器温度影响因子的过程为:
其中θD为中央处理器温度影响因子,为第一中央处理器温度影响项,/>为第二中央处理器温度影响项,N为时间序号总数量,ω3为中央处理器温度滞后因子,Ak为设备气温向量里第k个元素对应的数值,/>为中央处理器温度向量里第k-ω3个元素对应的数值,/>表示引入中央处理器温度滞后因子进行排齐后基于第k个序号的温差值,N-ω3为第一中央处理器温度影响项中的基准系数;
相应的,计算电源温度影响因子的过程为:
其中θD为电源温度影响因子,为第一电源温度影响项,为第二电源温度影响项,N为时间序号总数量,ω4为电源温度滞后因子,Ak为设备气温向量里第k个元素对应的数值,/>为电源温度向量里第k-ω4个元素对应的数值,/>表示引入电源温度滞后因子进行排齐后基于第k个序号的温差值,N-ω4为第一电源温度影响项中的基准系数;在本实施例中,由于温度传导需要时间,对此在计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子时,通过引入对应的温度滞后因子来提高判断设备发热原因为显卡的条件的准确性。
实际应用时,针对主板温度滞后因子ω1、显卡温度滞后因子ω2、央处理器温度滞后因子ω3、电源温度滞后因子ω4,每个温度滞后因子分别为通过温度突变时的间隔差进行确定,以主板温度滞后因子为例:确定设备气温向量A的第一突变序号为j1,将主板温度向量作为目标温度向量,对目标温度向量依次以j1至j1+0.3*N之间的正整数作为序号进行遍历,若当前遍历的序号对应为温度突变的情况时,确定该序号为第二突变序号j2,则此时的温度滞后因子表示为第二突变序号j2与第一突变序号的差值,其中温度突变为同一向量中相邻序号之间的温度差值高于预设温度突变阈值的情况,预设温度突变阈值为本领域技术人员根据实际应用时进行预先设置,在此不做限定,目标温度向量还可以是显卡温度向量、中央处理器温度向量或电源温度向量中的任意一个,进而得到ω1、ω2、ω3和ω4。
实施例2
本实施例2为进一步提高基于神经网络的显卡风扇控制方法在显卡散热效果方面的准确性。结合图4所示,本申请步骤S700之后,还包括:
步骤S800:在预设检测时间内确定显卡温度变化参数,若显卡温度变化参数大于预设变化阈值,则获取最近使用的风扇控制反馈信息所对应的位置信息,根据该位置信息修正调节参数集合,否则不做处理。本步骤中,位置信息为调节参数集合在风扇调节规则库中对应的存储位置;由于最近使用的风扇控制反馈信息为调节参数集合,通过对调节参数集合内的风扇转速参数或持续时间参数进行增大,以更新目标风扇控制表。
在本实施例中,在预设检测时间内确定显卡温度变化参数,包括:获取第一检测温度和第二检测温度,将第二检测温度减去第一检测温度以得到显卡温度变化参数,第一检测温度为在调节显卡风扇转速时进行实时检测得到的显卡温度参数,第二检测温度为在预设检测时间后进行实时检测得到的显卡温度参数;示例性的,预设检测时间可以设置为5秒以上的数值,如5秒、10秒、15秒、30秒等。示例性的,显卡温度变化参数为用于验证散热效果,如果显卡温度变化参数为负数时,则表示当前的风扇控制具有散热效果,显卡温度变化参数的负数的绝对值越大则说明散热效果越好,如果显卡温度变化参数为0或正数时则表示当前的散热效果不佳。预设变化阈值可以根据预设检测时间进行配合设置,例如当预设检测时间为15秒时,可以将预设变化阈值设置为小于-10℃的数值。
实际应用时,利用预设检测时间和预设变化阈值进行验证当前的风扇控制是否具有较好的散热效果,通过及时验证散热效果来更新风扇调节规则库,从而进一步提高后续风扇控制的控制准确性,进一步提高实时散热的适配度和有效性。示例性的,在对风扇转速参数进行增大时,可以通过修改转速最大值或PWM占比值以完成修改,若显卡温度变化参数大于预设变化阈值,此时验证的散热效果不好,则采用增加转速最大值、增加PWM占比值中的任一种或组合形式进行修改;若显卡温度变化参数小于或等于预设变化阈值,此时验证的散热效果好,则不做处理。
实施例3
基于与前述实施例中一种基于神经网络的显卡风扇控制方法,同样发明构思,本申请还提供了一种基于神经网络的显卡风扇控制装置,请参阅附图5,该装置包括:
运行记录模块,用于通过对显卡内正在执行的线程数量进行统计和记录,以获取显卡运行信息;其中,显卡运行信息包括运行时间信息和显卡资源占用信息,显卡资源占用信息包括计算资源点占用数量、计算资源块占用数量以及计算资源区占用数量,运行时间信息包括显卡资源占用信息对应的时间参数。
任务调度模块,用于获显卡任务调度信息包括任务类型、任务ID、显卡资源分配信息、任务预估完成时长以及显卡资源消耗信息,任务ID分别与任务类型、显卡资源分配信息、显卡资源消耗信息之间具有一一对应关系;
功耗走势分析模块,用于根据显卡运行信息和显卡任务调度信息,对显卡运行走势分析,确定功耗走势信息;
显卡高温识别模块,用于基于功耗走势信息进行显卡高温识别,获得高温识别信息;
产品信息模块,用于获取显卡产品信息;
风扇控制反馈模块,用于当判断设备发热原因为显卡时,获取当前时间点的显卡温度参数和设备气温参数,结合高温识别信息和显卡产品信息,生成风扇控制反馈信息。
风扇转速调节模块,用于基于风扇控制反馈信息,调节显卡风扇转速以实现显卡散热。
风扇转速修正模块,用于在预设检测时间内确定显卡温度变化参数,若显卡温度变化参数大于预设变化阈值,则获取最近使用的风扇控制反馈信息所对应的位置信息,根据该位置信息修正调节参数集合,否则不做处理。
本申请实施例3所提供的一种基于神经网络的显卡风扇控制装置可执行本申请任意实施例所提供的一种基于神经网络的显卡风扇控制方法,具备执行方法相应的功能模块和有益效果。所包括的各个模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。
实施例4
本实施例提供了一种终端,包括:至少一个存储器和至少一个处理器;其中,至少一个存储器用于存储程序代码,至少一个处理器用于调用至少一个存储器所存储的程序代码执行上述实施例中的任一种基于神经网络的显卡风扇控制方法。
实施例5
本实施例提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库为物理层用于存储各种数据库。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于神经网络的显卡风扇控制方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
实施例6
本实施例提供了一种存储介质,该存储介质用于存储程序代码,该程序代码用于执行上述的一种基于神经网络的显卡风扇控制方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
上述实施例为本申请较佳的实施方式,但本申请的实施方式并不受上述实施例的限制,其他的任何未背离本申请的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本申请的保护范围之内。
Claims (10)
1.一种基于神经网络的显卡风扇控制方法,其特征在于,包括如下步骤:
通过对显卡内正在执行的线程数量进行统计和记录,以获取显卡运行信息,所述显卡运行信息包括运行时间信息和显卡资源占用信息;
获取显卡任务调度信息,显卡任务调度信息包括任务ID、显卡资源分配信息、任务预估完成时长以及显卡资源消耗信息,任务ID分别与显卡资源分配信息、显卡资源消耗信息之间具有一一对应关系;
根据显卡运行信息和显卡任务调度信息,对显卡运行走势分析,确定功耗走势信息;
基于功耗走势信息进行显卡高温识别,获得高温识别信息;
获取显卡产品信息;
当判断设备发热原因为显卡时,获取当前时间点的显卡温度参数和设备气温参数,结合高温识别信息和显卡产品信息,生成风扇控制反馈信息;
基于所述风扇控制反馈信息,调节显卡风扇转速以实现显卡散热;
其中,所述显卡资源占用信息包括计算资源点占用数量,所述运行时间信息包括显卡资源占用信息对应的时间参数。
2.如权利要求1所述的方法,其特征在于,在根据显卡运行信息和显卡任务调度信息,对显卡运行走势分析,确定功耗走势信息的步骤中,具体包括:
根据显卡运行信息,确定显卡负载率信息;
基于预存的显卡功耗表,根据显卡负载率信息确定功耗信息;
根据显卡任务调度信息,进行资源需求总值、资源已消耗总值分析,确定资源消耗剩余进度;
根据资源消耗剩余进度获取预测功耗时长,根据功耗信息获取预测功耗时长范围内每个时间点对应的预测功耗幅值,基于预测功耗时长、预测功耗时长范围内每个时间点对应的预测功耗幅值构建功耗持续信息;
结合功耗信息和功耗持续信息,构建功耗走势信息;
所述显卡负载率信息包括运行时间信息对应的显卡负载率参数,每个显卡负载率参数具体通过下式获得:
其中δi为第i个时间参数对应的显卡负载率参数,为第i个时间参数对应的计算资源点占用数量,/>为计算资源点总数量。
3.如权利要求2所述的方法,其特征在于,在根据显卡任务调度信息,进行资源需求总值、资源已消耗总值分析,确定资源消耗剩余进度的步骤中,具体包括:
统计所有任务的显卡资源分配信息以确定资源需求总值,显卡资源分配信息中每个任务ID具有被分配的GPU资源,将所有任务分配的GPU资源所对应的计算资源点需求值进行累加以得到资源需求总值,表示为:
其中Rtotal表示资源需求总值,表示第k个任务ID被分配的GPU资源所对应的计算资源点需求值,M为任务总数量,1≤k≤M且k的取值为正整数;
统计所有任务的显卡资源消耗信息以确定资源已消耗总值,显卡资源消耗信息中每个任务ID具有对应的显卡资源已消耗值,将所有任务所对应的显卡资源已消耗值进行累加以得到资源已消耗总值,表示为:
其中RC表示资源已消耗总值,表示第k个任务ID对应的显卡资源已消耗值,M为任务总数量,1≤k≤M且k的取值为正整数;
计算资源消耗剩余进度,具体过程为:
其中θ表示资源消耗剩余进度,Rtotal-Rc表示资源消耗剩余需求值,Rtotal表示资源需求总值。
4.如权利要求3所述的方法,其特征在于,在构建功耗持续信息中,预测功耗幅值为利用预训练的功耗预测模型得到,所述功耗预测模型的建立过程,包括:
获取指定型号显卡不同时间的历史功耗数据,所述历史功耗数据中包括历史时间参数与历史功耗幅值;
对所述历史功耗数据进行预处理,得到功耗训练集以及功耗验证集;
设置多个候选模型,每个候选模型对应的模型算法不相同;
将功耗训练集导入多个候选模型进行训练,通过比较训练结果与功耗验证集中对应的同类数据,评估候选模型输出预测功耗幅值的准确度;
挑选出输出预测功耗幅值的准确度最高的候选模型作为最终的功耗预测模型,该功耗预测模型用于基于输入的预测时间点进行预测,得到该预测时间点对应的预测功耗幅值;
所述预测功耗时长具体表示为:
Tpre=θ*Ttotal
其中,Tpre表示资源消耗剩余需求值对应的预测功耗时长,Ttotal表示任务预估完成时长。
5.如权利要求4所述的方法,其特征在于,在基于功耗走势信息进行显卡高温识别,获得高温识别信息的步骤中,具体包括:
构建高温识别训练数据集,所述高温识别训练数据集包括多组训练数据,每组训练数据包括历史功耗走势信息以及该历史功耗走势信息对应的高温标识信息,该历史功耗走势信息对应的高温标识信息用于判断该历史功耗走势信息是否存在高温风险,高温标识信息包括多个与时间参数对应的标识值,当标识值为真时表示存在高温风险,当标识值为假时表示不存在高温风险;
构建反馈式神经网络结构并设置模型收敛条件;
利用高温识别训练数据集对该反馈式神经网络结构进行训练;
若反馈式神经网络结构的训练结果达到了模型收敛条件时,获得高温识别模型;
将功耗走势信息输入高温识别模型中,获得模型输出结果,模型输出结果为功耗走势信息对应的高温识别信息。
6.如权利要求5所述的方法,其特征在于,在生成风扇控制反馈信息的过程中,具体包括:
若高温识别信息中当前时间点对应的标识值为假,且未来首个标识值为真的时间点与当前时间点的时间差在预设时间范围内,则从预设的风扇调节规则库中选取目标风扇控制表,根据显卡型号进行匹配对应的目标风扇控制表,在目标风扇控制表中根据当前时间点的显卡温度参数和设备气温参数的组合关系进行确定风扇控制反馈信息;
否则,不做处理,继续保持当前的风扇控制参数进行散热;
当前时间点的显卡温度参数为对应当前时间点设备内显卡的温度参数,当前时间点的设备气温参数为对应当前时间点设备内空气的温度参数,所述风扇调节规则库为用于应对显卡出现高温时采取的风扇控制策略;
所述风扇调节规则库包括与不同型号显卡一一对应的目标风扇控制表,所述目标风扇控制表为用于确定调节参数集合的映射规则,目标风扇控制表包括多个索引信息、多个调节参数集合,所述索引信息为显卡温度参数和设备气温参数的组合关系,每个调节参数集合中包括至少一组参数信息,每组参数信息包含风扇转速参数和持续时间参数的组合关系。
7.如权利要求6所述的方法,其特征在于,在当判断设备发热原因为显卡时,获取当前时间点的显卡温度参数和设备气温参数,结合高温识别信息和显卡产品信息,生成风扇控制反馈信息的步骤中,判断设备发热原因为显卡的条件,具体通过以下方式实现:
获取设备气温信息、主板温度信息、显卡温度信息、中央处理器温度信息以及电源温度信息;
计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子并确定影响因子参数最大值;
若影响因子参数最大值为显卡温度影响因子,则设备发热原因为显卡的条件成立,否则设备发热原因为显卡的条件不成立;
在计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子并确定影响因子参数最大值中,包括:
按照时间顺序依次整理运行时间信息,基于整理后的运行时间信息建立N维列向量,以得到设备气温向量、主板温度向量、显卡温度向量、中央处理器温度向量、电源温度向量,每个向量中包含N个时间参数对应的温度参数,N对应为时间序号总数量;
基于影响因子公式进行分别计算主板温度影响因子、显卡温度影响因子、中央处理器温度影响因子、电源温度影响因子,并通过数值大小进行对比以确定出影响因子参数最大值;
其中,所述设备气温信息包括运行时间信息对应设备内空气的温度参数,所述主板温度信息包括运行时间信息对应设备内主板的温度参数,所述显卡温度信息包括运行时间信息对应设备内显卡的温度参数,所述中央处理器温度信息包括运行时间信息对应设备内中央处理器的温度参数,所述电源温度信息包括运行时间信息对应设备内电源的温度参数。
8.如权利要求7所述的方法,其特征在于,计算主板温度影响因子的过程为:
其中θB为主板温度影响因子,ω1为主板温度滞后因子,N为时间序号总数量,Ak为设备气温向量里第k个元素对应的数值,为主板温度向量里第k-ω1个元素对应的数值,N-ω1为第一主板温度影响项中的基准系数;
计算显卡温度影响因子的过程为:
其中θC为显卡温度影响因子,ω2为显卡温度滞后因子,Ak为设备气温向量里第k个元素对应的数值,为显卡温度向量里第k-ω2个元素对应的数值,N-ω2为第一显卡温度影响项中的基准系数;
计算中央处理器温度影响因子的过程为:
其中θD为中央处理器温度影响因子,ω3为中央处理器温度滞后因子,Ak为设备气温向量里第k个元素对应的数值,为中央处理器温度向量里第k-ω3个元素对应的数值,N-ω3为第一中央处理器温度影响项中的基准系数;
计算电源温度影响因子的过程为:
其中θD为电源温度影响因子,ω4为电源温度滞后因子,Ak为设备气温向量里第k个元素对应的数值,为电源温度向量里第k-ω4个元素对应的数值,N-ω4为第一电源温度影响项中的基准系数;
设备气温向量内的元素为运行时间中每个时刻对应设备内空气的温度值,主板温度向量内的元素为运行时间中每个时刻对应的主板温度值,显卡温度向量内的元素为运行时间中每个时刻对应的显卡温度值,中央处理器温度向量内的元素为运行时间中每个时刻对应的中央处理器温度值,电源温度向量内的元素为运行时间中每个时刻对应的电源温度值。
9.如权利要求8所述的方法,其特征在于,还包括:在预设检测时间内确定显卡温度变化参数,若显卡温度变化参数大于预设变化阈值,则获取最近使用的风扇控制反馈信息所对应的位置信息,根据该位置信息修正调节参数集合,否则不做处理,所述位置信息为调节参数集合在风扇调节规则库中对应的存储位置;
所述在预设检测时间内确定显卡温度变化参数,具体包括:获取第一检测温度和第二检测温度,将第二检测温度减去第一检测温度以得到显卡温度变化参数,第一检测温度为在调节显卡风扇转速时进行实时检测得到的显卡温度参数,第二检测温度为在预设检测时间后进行实时检测得到的显卡温度参数。
10.一种基于神经网络的显卡风扇控制装置,其特征在于,包括:
运行记录模块,用于通过对显卡内正在执行的线程数量进行统计和记录,以获取显卡运行信息;
任务调度模块,用于获显卡任务调度信息包括任务类型、任务ID、显卡资源分配信息、任务预估完成时长以及显卡资源消耗信息,任务ID分别与任务类型、显卡资源分配信息、显卡资源消耗信息之间具有一一对应关系;
功耗走势分析模块,用于根据显卡运行信息和显卡任务调度信息,对显卡运行走势分析,确定功耗走势信息;
显卡高温识别模块,用于基于功耗走势信息进行显卡高温识别,获得高温识别信息;
产品信息模块,用于获取显卡产品信息;
风扇控制反馈模块,用于当判断设备发热原因为显卡时,获取当前时间点的显卡温度参数和设备气温参数,结合高温识别信息和显卡产品信息,生成风扇控制反馈信息;
风扇转速调节模块,用于基于风扇控制反馈信息,调节显卡风扇转速以实现显卡散热;
风扇转速修正模块,用于在预设检测时间内确定显卡温度变化参数,若显卡温度变化参数大于预设变化阈值,则获取最近使用的风扇控制反馈信息所对应的位置信息,根据该位置信息进行修正调节参数集合,否则不做处理;
其中,所述显卡运行信息包括运行时间信息和显卡资源占用信息,所述显卡资源占用信息包括计算资源点占用数量,所述运行时间信息包括显卡资源占用信息对应的时间参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311510233.1A CN117406844B (zh) | 2023-11-14 | 2023-11-14 | 一种基于神经网络的显卡风扇控制方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311510233.1A CN117406844B (zh) | 2023-11-14 | 2023-11-14 | 一种基于神经网络的显卡风扇控制方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117406844A true CN117406844A (zh) | 2024-01-16 |
CN117406844B CN117406844B (zh) | 2024-04-19 |
Family
ID=89496038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311510233.1A Active CN117406844B (zh) | 2023-11-14 | 2023-11-14 | 一种基于神经网络的显卡风扇控制方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117406844B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117826966A (zh) * | 2024-03-06 | 2024-04-05 | 北京比格凯特科技有限公司 | 一种双显卡模块的电源控制模块 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109298764A (zh) * | 2018-11-28 | 2019-02-01 | 郑州云海信息技术有限公司 | 一种根据设备功耗智能调节风扇转速的散热方法 |
CN109375994A (zh) * | 2018-09-10 | 2019-02-22 | 西安交通大学 | 基于rbf神经网络的数据中心任务温度预测及调度方法 |
CN110657122A (zh) * | 2019-10-11 | 2020-01-07 | 锐捷网络股份有限公司 | 一种风扇转速检测电路与电子设备 |
CN111949093A (zh) * | 2019-05-15 | 2020-11-17 | 华为技术有限公司 | 一种风扇转速控制方法及电子设备 |
CN113450770A (zh) * | 2021-06-25 | 2021-09-28 | 平安科技(深圳)有限公司 | 基于显卡资源的语音特征提取方法、装置、设备及介质 |
CN113534936A (zh) * | 2021-09-14 | 2021-10-22 | 苏州浪潮智能科技有限公司 | 一种服务器风扇转速控制方法、装置、设备及介质 |
CN215727817U (zh) * | 2021-06-30 | 2022-02-01 | 深圳世宁达科技有限公司 | 一种显卡检测平台 |
CN114330099A (zh) * | 2021-11-30 | 2022-04-12 | 广东浪潮智慧计算技术有限公司 | 一种网卡功耗调整方法、装置、设备及可读存储介质 |
CN114442794A (zh) * | 2022-01-20 | 2022-05-06 | 苏州浪潮智能科技有限公司 | 服务器功耗控制方法、系统、终端及存储介质 |
CN114756105A (zh) * | 2022-01-24 | 2022-07-15 | 紫光计算机科技有限公司 | 一种风扇调速方法、装置、电子设备及存储介质 |
CN115130743A (zh) * | 2022-06-22 | 2022-09-30 | 国网山东省电力公司电力科学研究院 | 一种基于变分推断的风电机组调节速率预测方法及系统 |
CN115827206A (zh) * | 2023-01-18 | 2023-03-21 | 太极计算机股份有限公司 | 一种基于机器学习的显卡任务资源的调度方法及系统 |
CN115915734A (zh) * | 2023-03-02 | 2023-04-04 | 苏州浪潮智能科技有限公司 | 风扇运行控制方法、装置、电子设备及存储介质 |
CN116382439A (zh) * | 2023-03-29 | 2023-07-04 | 新华三信息技术有限公司 | 服务器风扇的控制方法、装置、计算机设备及存储介质 |
CN116560475A (zh) * | 2023-04-27 | 2023-08-08 | 山东云海国创云计算装备产业创新中心有限公司 | 一种服务器风扇控制方法及计算机设备 |
-
2023
- 2023-11-14 CN CN202311510233.1A patent/CN117406844B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109375994A (zh) * | 2018-09-10 | 2019-02-22 | 西安交通大学 | 基于rbf神经网络的数据中心任务温度预测及调度方法 |
CN109298764A (zh) * | 2018-11-28 | 2019-02-01 | 郑州云海信息技术有限公司 | 一种根据设备功耗智能调节风扇转速的散热方法 |
CN111949093A (zh) * | 2019-05-15 | 2020-11-17 | 华为技术有限公司 | 一种风扇转速控制方法及电子设备 |
CN110657122A (zh) * | 2019-10-11 | 2020-01-07 | 锐捷网络股份有限公司 | 一种风扇转速检测电路与电子设备 |
CN113450770A (zh) * | 2021-06-25 | 2021-09-28 | 平安科技(深圳)有限公司 | 基于显卡资源的语音特征提取方法、装置、设备及介质 |
CN215727817U (zh) * | 2021-06-30 | 2022-02-01 | 深圳世宁达科技有限公司 | 一种显卡检测平台 |
CN113534936A (zh) * | 2021-09-14 | 2021-10-22 | 苏州浪潮智能科技有限公司 | 一种服务器风扇转速控制方法、装置、设备及介质 |
CN114330099A (zh) * | 2021-11-30 | 2022-04-12 | 广东浪潮智慧计算技术有限公司 | 一种网卡功耗调整方法、装置、设备及可读存储介质 |
CN114442794A (zh) * | 2022-01-20 | 2022-05-06 | 苏州浪潮智能科技有限公司 | 服务器功耗控制方法、系统、终端及存储介质 |
CN114756105A (zh) * | 2022-01-24 | 2022-07-15 | 紫光计算机科技有限公司 | 一种风扇调速方法、装置、电子设备及存储介质 |
CN115130743A (zh) * | 2022-06-22 | 2022-09-30 | 国网山东省电力公司电力科学研究院 | 一种基于变分推断的风电机组调节速率预测方法及系统 |
CN115827206A (zh) * | 2023-01-18 | 2023-03-21 | 太极计算机股份有限公司 | 一种基于机器学习的显卡任务资源的调度方法及系统 |
CN115915734A (zh) * | 2023-03-02 | 2023-04-04 | 苏州浪潮智能科技有限公司 | 风扇运行控制方法、装置、电子设备及存储介质 |
CN116382439A (zh) * | 2023-03-29 | 2023-07-04 | 新华三信息技术有限公司 | 服务器风扇的控制方法、装置、计算机设备及存储介质 |
CN116560475A (zh) * | 2023-04-27 | 2023-08-08 | 山东云海国创云计算装备产业创新中心有限公司 | 一种服务器风扇控制方法及计算机设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117826966A (zh) * | 2024-03-06 | 2024-04-05 | 北京比格凯特科技有限公司 | 一种双显卡模块的电源控制模块 |
Also Published As
Publication number | Publication date |
---|---|
CN117406844B (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117406844B (zh) | 一种基于神经网络的显卡风扇控制方法及相关装置 | |
CN110413227B (zh) | 一种硬盘设备的剩余使用寿命在线预测方法和系统 | |
CN112052948B (zh) | 一种网络模型压缩方法、装置、存储介质和电子设备 | |
CN111368911B (zh) | 一种图像分类方法、装置和计算机可读存储介质 | |
CN113222403B (zh) | 基于大数据的电力调节方法、装置、存储介质及电子设备 | |
CN116760772B (zh) | 汇聚分流器的管控系统及其方法 | |
CN115576267A (zh) | 一种基于数字孪生的轮毂机加工尺寸误差修正方法 | |
CN115347915A (zh) | 一种电力线载波通信设备运行状态的检测方法及装置 | |
CN115543626A (zh) | 采用异构计算资源负载均衡调度的电力缺陷图像仿真方法 | |
CN117453398A (zh) | 一种提高供电可靠性的算力调度的智能优化方法及系统 | |
CN111275059B (zh) | 一种图像处理方法、装置和计算机可读存储介质 | |
CN116909712A (zh) | 基于机器学习的智能任务调度系统及其方法 | |
CN117011751A (zh) | 使用变换器网络分割视频图像序列 | |
CN113779116B (zh) | 对象排序方法、相关设备及介质 | |
US11762562B2 (en) | Performance analysis apparatus and performance analysis method | |
CN114970357A (zh) | 节能效果评价方法、系统、装置及存储介质 | |
CN109493065A (zh) | 一种基于行为增量更新的欺诈交易检测方法 | |
CN111598390B (zh) | 服务器高可用性评估方法、装置、设备和可读存储介质 | |
CN111027413A (zh) | 远距离多工位物体检测方法、系统及存储介质 | |
CN112965810B (zh) | 一种基于共享网络通道的多内核浏览器数据整合方法 | |
CN117293829B (zh) | 基于5g和4g短共享双网互鉴无线通信的电力调峰方法 | |
CN117075549B (zh) | 基于人工神经网络的厂务控制方法及系统 | |
Hu et al. | Research on intelligent prediction of time-of-use price on power sale | |
CN116934041B (zh) | 一种基于物联网协同的工厂任务管理方法及系统 | |
CN115114983B (zh) | 基于大数据设备电量数据采集分析方法、计算机系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |