CN116225192B - 一种散热系统的控制方法、装置、存储介质及电子设备 - Google Patents

一种散热系统的控制方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN116225192B
CN116225192B CN202310509059.2A CN202310509059A CN116225192B CN 116225192 B CN116225192 B CN 116225192B CN 202310509059 A CN202310509059 A CN 202310509059A CN 116225192 B CN116225192 B CN 116225192B
Authority
CN
China
Prior art keywords
feature
history record
value
history
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310509059.2A
Other languages
English (en)
Other versions
CN116225192A (zh
Inventor
刘懿
吴运翔
程稳
陈�光
曾令仿
李勇
吕波
陈晨
侯瑞峥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202310509059.2A priority Critical patent/CN116225192B/zh
Publication of CN116225192A publication Critical patent/CN116225192A/zh
Application granted granted Critical
Publication of CN116225192B publication Critical patent/CN116225192B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5094Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2200/00Indexing scheme relating to G06F1/04 - G06F1/32
    • G06F2200/20Indexing scheme relating to G06F1/20
    • G06F2200/201Cooling arrangements using cooling fluid
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

本说明书公开了一种散热系统的控制方法、装置、存储介质及电子设备,本说明书实施例先根据历史上散热系统对计算集群散热时的各历史记录中确定出用于控制散热的各策略组合,针对每个策略组合,对各历史记录进行处理,确定在该策略组合下特征向量涉及的至少一个特征维度所对应的特征值范围,作为该策略组合的适用条件。根据每个策略组合的适用条件,构建模型,并通过模型输出的目标策略组合控制散热系统。在此方法中,通过对各历史记录进行分析,确定出采用每个策略组合所适用的条件。当需要控制散热系统时,将当前散热系统和计算集群的状态信息与各条件进行匹配,以确定出匹配上的条件所对应的目标策略组合,以控制散热系统。

Description

一种散热系统的控制方法、装置、存储介质及电子设备
技术领域
本说明书涉及控制散热系统的技术领域,尤其涉及一种散热系统的控制方法、装置、存储介质及电子设备。
背景技术
目前,深度学习技术广泛应用于各个领域。为了解决高复杂的现实问题,深度学习可以通过大型化的模型来解决问题,而大模型需要较大的算力才能正常运行,因此,需要构建为大模型提供算力的计算机集群。
为了满足大模型的算力需求,计算集群普遍部署有高性能的计算芯片,芯片在工作时通常会产生大量热量。为了维持芯片的正常工作温度,计算集群普遍配置有散热系统。其中,散热系统可以包括:风液冷复合式散热系统。但是,风液冷复合式散热系统中各散热器件之间存在相互影响的关系、节能效果依赖散热系统对各散热器件的功率的按需分配,并且散热效率受自然冷源状态、芯片部署物理拓扑、冷却液流速等因素的影响,因此,散热系统的运行需要人工智能模型的控制。其中,各散热器件可以包括:传感器、控制阀、电机等器件。
然而,当前热门的人工智能模型普遍是黑盒模型,这类黑盒模型透明度差、不可被信任,可能存在由于不当的散热控制策略而摧毁昂贵的计算芯片的风险。因此,如何通过白盒模型对散热系统进行散热控制,是亟需解决的问题。
发明内容
本说明书实施例提供一种散热系统的控制方法、装置、存储介质及电子设备,以部分解决上述现有技术存在的问题。
本说明书实施例采用下述技术方案:
本说明书提供的一种散热系统的控制方法,包括:
获取历史上散热系统对计算集群进行散热时所采集到的各历史记录,并从各历史记录中确定出控制所述散热系统的各策略组合,针对所述各策略组合中的任意两个策略组合,这两个策略组合所包含的散热器件相同,这两个策略组合中各散热器件的状态信息不完全相同;针对每个历史记录,该历史记录包含有策略组合和其他记录,所述策略组合包含有所述散热系统中每个电机的档位信息和/或每个控制阀的控制参量,所述其他记录包含有所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的状态信息以及所述计算集群中每个芯片所使用的算力资源,所述散热系统中的各散热器件包括:电机、控制阀、传感器;
对所述各历史记录进行处理,确定出每个策略组合对应的各适用条件,针对同一策略组合对应的每个适用条件,该适用条件包含有特征向量中至少一个特征维度所对应的特征值范围,所述特征向量是对所述历史记录包含的其他记录进行特征提取后所得到的;
根据每个策略组合对应的各适用条件,构建模型;
在接收到针对所述散热系统的散热任务请求时,采集所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的当前状态信息以及所述计算集群中每个芯片所使用的当前算力资源,并对所述其他散热器件的当前状态信息以及所述当前算力资源进行特征提取,得到当前特征向量,将所述当前特征向量输入到所述模型中,以通过所述模型输出目标策略组合,并按照所述目标策略组合,对所述散热系统进行控制。
可选地,对所述各历史记录进行处理,确定出每个策略组合对应的各适用条件,具体包括:
对所述各历史记录中每个历史记录包含的其他记录进行特征提取,得到所述各历史记录中每个历史记录对应的特征向量;
针对适用条件的每次调整,从所述各历史记录中选择部分历史记录,并确定出所述部分历史记录中每个历史记录对应的特征向量;
针对每个策略组合,对所述部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,作为该次调整下该策略组合对应的适用条件;
将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行交叉变异处理,以生成该次调整下的新适用条件;
根据该次调整下的新适用条件以及该次调整下每个策略组合对应的适用条件,确定出该次调整下每个策略组合对应的各适用条件,并保存;
继续执行下一次调整,直到已保存的所有适用条件满足预设条件为止。
可选地,对所述各历史记录中每个历史记录包含的其他记录进行特征提取,得到所述各历史记录中每个历史记录对应的特征向量,具体包括:
根据预设特征数量,以其他记录为叶子节点,以运算符号为父节点,构建用于特征提取的二叉树;
针对所述各历史记录中每个历史记录,基于所述二叉树,对该历史记录包含的其他记录进行特征提取,得到该历史记录对应的初始特征向量,所述初始特征向量的特征维度的数量为所述预设特征数量;
根据所述各历史记录中每个历史记录对应的初始特征向量以及每个历史记录包含的策略组合,确定出初始特征向量中的每个特征维度对应的连续值;其中,针对每个特征维度,该特征维度对应的连续值用于表示所述各历史记录对应的初始特征向量中位于该特征维度的特征值的最大连续程度;
针对所述各历史记录中的每个历史记录,根据每个特征维度对应的连续值,从该历史记录对应的初始特征向量中按照连续值从大到小的顺序依次选择出预设数量的特征维度,并基于选择出的特征维度下的特征值,确定出该历史记录对应的特征向量。
可选地,根据所述各历史记录中每个历史记录对应的初始特征向量以及每个历史记录包含的策略组合,确定出初始特征向量中的每个特征维度对应的连续值,具体包括:
针对初始特征向量中的每个特征维度,根据所述各历史记录中每个历史记录对应的初始特征向量位于该特征维度的特征值,统计出该特征维度下的不同特征值的数量;
若该特征维度下的不同特征值的数量小于数量阈值,则针对该特征维度下的每个特征值,根据该特征值对应的目标历史记录的总数量以及所述目标历史记录涉及的各策略组合,确定出该特征值在所述各策略组合中的每个策略组合下的连续值,并从该特征值在所述各策略组合中的每个策略组合下的连续值中选择出最大的连续值,作为该特征值对应的连续值;从该特征维度下的每个特征值对应的连续值中选择出最大的连续值,作为该特征维度对应的连续值;
若该特征维度下的不同特征值的数量不小于数量阈值,则根据该特征维度下的特征值的大小,对所述各历史记录进行排序,得到该特征维度下的第一排序序列;针对所述各历史记录涉及的每个策略组合,从该特征维度下的第一排序序列中确定出包含有该策略组合的历史记录的连续域,并根据所述连续域内的历史记录的数量以及所述各历史记录中包含有该策略组合的历史记录的数量,确定出该特征维度在该策略组合下的连续值;从该特征维度在每个策略组合下的连续值中选择出最大的连续值,作为该特征维度对应的连续值。
可选地,根据该特征值对应的目标历史记录的总数量以及所述目标历史记录涉及的各策略组合,确定出该特征值在所述各策略组合中的每个策略组合下的连续值,具体包括:
从所述各历史记录中选择出目标历史记录,作为该特征值对应的目标历史记录,以及确定出所述目标历史记录涉及的各策略组合,作为该特征值对应的各策略组合;其中,所述目标历史记录是指包含有该特征值的初始特征向量所对应的历史记录;
针对该特征值对应的每个策略组合,根据所述目标历史记录的总数量以及所述目标历史记录中包含有该策略组合的历史记录的数量,确定该特征值在该策略组合下的连续值。
可选地,针对每个策略组合,对所述部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,具体包括:
根据所述部分历史记录中每个历史记录对应的特征向量中各特征维度的特征值以及每个历史记录包含的策略组合,构建各特征编码块,针对每个特征编码块,该特征编码块至少由特征维度、特征值范围和策略组合构成;
针对每个策略组合,从所述各特征编码块中选择出包含有该策略组合的特征编码块,作为目标特征编码块,并对所述目标特征编码块进行处理,得到在该策略组合下特征向量中至少一个特征维度所对应的特征值范围。
可选地,根据所述部分历史记录中每个历史记录对应的特征向量中各特征维度的特征值以及每个历史记录包含的策略组合,构建各特征编码块,具体包括:
针对特征向量中的每个特征维度,根据所述部分历史记录中每个历史记录对应的特征向量位于该特征维度的特征值,统计出该特征维度下的不同特征值的数量;
若该特征维度下的不同特征值的数量小于数量阈值,则根据所述部分历史记录中每个历史记录对应的特征向量中该特征维度的特征值以及每个历史记录包含的策略组合,确定出特征向量中该特征维度对应的连续值;针对所述部分历史记录中每个历史记录,基于该特征维度、该历史记录对应的特征向量中位于该特征维度下的特征值、该特征维度对应的连续值以及该历史记录包含的策略组合,构建该历史记录在该特征维度下的特征编码块,其中,该历史记录在该特征维度下的特征编码块包含的特征值范围为该历史记录对应的特征向量中位于该特征维度下的特征值。
可选地,所述方法还包括:
若该特征维度下的不同特征值的数量不小于数量阈值,则根据所述部分历史记录中每个历史记录对应的特征向量中位于该特征维度的特征值的大小,对所述部分历史记录进行排序,得到在该特征维度下的第二排序序列;
针对所述部分历史记录涉及的每个策略组合,从在该特征维度下的第二排序序列中确定出包含有该策略组合的历史记录的连续域,并将所述连续域覆盖的各历史记录作为各连续历史记录;
从所述各连续历史记录对应的特征向量中位于该特征维度的特征值中选择出最小的特征值,作为起始值,以及从所述各连续历史记录对应的特征向量中位于该特征维度的特征值中选择出最大的特征值,作为终止值;
基于该特征维度、所述起始值、所述终止值以及该策略组合,构建针对所述连续域的特征编码块,其中,所述起始值与所述终止值之间的取值区间用于表示该特征维度的特征值范围。
可选地,对所述目标特征编码块进行处理,得到在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,具体包括:
从所述目标特征编码块中选择出包含有同一特征维度的各特征编码块,作为各合并特征编码块;
对所述各合并特征编码块包含的特征值范围进行合并,得到合并后特征编码块;
从所述目标特征编码块中除所述各合并特征编码块之外的其他特征编码块中随机选择一个特征编码块,并将所述合并后特征编码块与选择的特征编码块进行拼接,得到拼接后特征编码块组;
判断所述拼接后特征编码块组所覆盖的历史记录是否均包含有该策略组合,若所述拼接后特征编码块组所覆盖的历史记录未均包含有该策略组合,继续从所述其他特征编码块中选择一个特征编码块,并将选择的特征编码块与所述拼接后特征编码块组进行拼接,重新确定出拼接后特征编码块组,直到重新确定的拼接后特征编码块组所覆盖的历史记录均包含有该策略组合为止;
根据最终确定出的拼接后特征编码块组中各特征编码块包含的特征值范围,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围。
可选地,将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行交叉变异处理,以生成该次调整下的新适用条件,具体包括:
从已保存的各适用条件中确定出能够完全覆盖该次调整下的所述部分历史记录的适用条件,作为目标适用条件;
将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行聚合,得到第一适用条件集合;
针对所述第一适用条件集合中任意两个适用条件,将这两个适用条件进行交叉处理,得到交叉后适用条件;
对所述交叉后适用条件进行变异处理,得到交叉后适用条件;
将所述交叉后适用条件和所述交叉后适用条件确定为该次调整下的新适用条件。
可选地,根据该次调整下的新适用条件以及该次调整下每个策略组合对应的适用条件,确定出该次调整下每个策略组合对应的各适用条件,具体包括:
将该次调整下的新适用条件与该次调整下每个策略组合对应的适用条件进行聚合,得到第二适用条件集合;
针对所述第二适用条件集合中的每个适用条件,将该适用条件作为筛选条件,从所述部分历史记录中筛选出满足所述筛选条件的历史记录,作为匹配历史记录以及确定出该适用条件对应的策略组合;
根据该适用条件对应的匹配历史记录和该适用条件对应的策略组合,确定出所述散热系统在所述匹配历史记录包含的其他记录下,采用该适用条件对应的策略组合进行散热控制时所产生的散热指标,作为该适用条件对应的散热指标;其中,所述散热指标包括:散热系数、能耗系数;
根据所述第二适用条件集合中的每个适用条件对应的散热指标,从所述第二适用条件集合中选择出部分适用条件,并根据所述部分适用条件对应的策略组合,确定出该次调整下每个策略组合对应的各适用条件。
本说明书提供的一种散热系统的控制装置,包括:
获取模块,用于获取历史上散热系统对计算集群进行散热时所采集到的各历史记录,并从各历史记录中确定出控制所述散热系统的各策略组合,针对所述各策略组合中的任意两个策略组合,这两个策略组合所包含的散热器件相同,这两个策略组合中各散热器件的状态信息不完全相同;针对每个历史记录,该历史记录包含有策略组合和其他记录,所述策略组合包含有所述散热系统中每个电机的档位信息和/或每个控制阀的控制参量,所述其他记录包含有所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的状态信息以及所述计算集群中每个芯片所使用的算力资源,所述散热系统中的各散热器件包括:电机、控制阀、传感器;
处理模块,用于对所述各历史记录进行处理,确定出每个策略组合对应的各适用条件,针对同一策略组合对应的每个适用条件,该适用条件包含有特征向量中至少一个特征维度所对应的特征值范围,所述特征向量是对所述历史记录包含的其他记录进行特征提取后所得到的;
构建模型模块,用于根据每个策略组合对应的各适用条件,构建模型;
控制模块,用于在接收到针对所述散热系统的散热任务请求时,采集所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的当前状态信息以及所述计算集群中每个芯片所使用的当前算力资源,并对所述其他散热器件的当前状态信息以及所述当前算力资源进行特征提取,得到当前特征向量,将所述当前特征向量输入到所述模型中,以通过所述模型输出目标策略组合,并按照所述目标策略组合,对所述散热系统进行控制。
可选地,所述处理模块,具体用于对所述各历史记录中每个历史记录包含的其他记录进行特征提取,得到所述各历史记录中每个历史记录对应的特征向量;针对适用条件的每次调整,从所述各历史记录中选择部分历史记录,并确定出所述部分历史记录中每个历史记录对应的特征向量;针对每个策略组合,对所述部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,作为该次调整下该策略组合对应的适用条件;将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行交叉变异处理,以生成该次调整下的新适用条件;根据该次调整下的新适用条件以及该次调整下每个策略组合对应的适用条件,确定出该次调整下每个策略组合对应的各适用条件,并保存;继续执行下一次调整,直到已保存的所有适用条件满足预设条件为止。
可选地,所述处理模块,具体用于根据预设特征数量,以其他记录为叶子节点,以运算符号为父节点,构建用于特征提取的二叉树;针对所述各历史记录中每个历史记录,基于所述二叉树,对该历史记录包含的其他记录进行特征提取,得到该历史记录对应的初始特征向量,所述初始特征向量的特征维度的数量为所述预设特征数量;根据所述各历史记录中每个历史记录对应的初始特征向量以及每个历史记录包含的策略组合,确定出初始特征向量中的每个特征维度对应的连续值;其中,针对每个特征维度,该特征维度对应的连续值用于表示所述各历史记录对应的初始特征向量中位于该特征维度的特征值的最大连续程度;针对所述各历史记录中的每个历史记录,根据每个特征维度对应的连续值,从该历史记录对应的初始特征向量中按照连续值从大到小的顺序依次选择出预设数量的特征维度,并基于选择出的特征维度下的特征值,确定出该历史记录对应的特征向量。
本说明书提供的一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的散热系统的控制方法。
本说明书提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的散热系统的控制方法。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
本说明书实施例中先根据历史上散热系统对计算集群散热时的各历史记录中确定出用于控制散热的各策略组合,针对每个策略组合,对各历史记录进行处理,确定在该策略组合下特征向量涉及的至少一个特征维度所对应的特征值范围,作为该策略组合的适用条件。根据每个策略组合的适用条件,构建模型,并通过模型输出的目标策略组合控制散热系统。在此方法中,通过对各历史记录进行分析,确定出采用每个策略组合所适用的条件。当需要控制散热系统时,将当前散热系统和计算集群的状态信息与各条件进行匹配,以确定出匹配上的条件所对应的目标策略组合,以控制散热系统。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书实施例提供的表示风液冷复合式散热系统和计算集群之间的位置关系的示意图;
图2为本说明书实施例提供的散热系统的控制方法的流程示意图;
图3为本说明书实施例提供的二叉树的示意图;
图4为本说明书实施例提供的连续域的示意图;
图5为本说明书实施例提供的散热系统的控制装置结构示意图;
图6为本说明书实施例提供的电子设备的结构示意图。
具体实施方式
以风液冷复合式散热系统为例,对风液冷复合式散热系统的结构以及对风液冷复合式散热系统与计算集群之间的位置关系进行说明。
本说明书实施例中提供一种表示风液冷复合式散热系统和计算集群之间的位置关系的示意图,如图1所示。
在图1中,计算集群位于大型机柜中,计算集群部署有多个芯片,每个芯片在执行计算任务时所使用的算力资源越多,这个芯片执行计算任务时所产生的热量越大。为了到达散热效果,为大型机柜部署风液冷复合式散热系统。风液冷复合式散热系统是由多个传感器、多个控制阀、多个外风机(外风机包含有电机)、多个过滤器、多个套管冷凝器、变频压机、氟泵(氟泵包含有电机)、闭式冷却塔等散热器件连接构成。其中,外风机和闭式冷却塔位于大型机柜外部,风液冷复合式散热系统中除外风机和闭式冷却塔之外的其他器件位于大型机柜内部。其中,传感器可以包含温度传感器和湿度传感器。控制阀可以包括:气体控制阀和液体控制阀。
在风液冷复合式散热系统中,控制阀可以根据计算集群中芯片执行计算任务所产生的热量大小来控制气流或冷却液的流速,因此,控制阀控制散热的散热效果与控制阀的状态信息、芯片的状态信息有关,其中,芯片的状态信息可以是指芯片执行计算任务时所使用的算力资源。另外,外风机和氟泵都包含有电机,电机的转速可以影响能耗大小。所以,在考虑散热系统的散热效果和能耗大小的情况下,需要关注控制阀和电机的状态信息以及芯片执行计算任务时所使用的算力资源。控制阀的状态信息可以是指控制阀的控制参量,电机的状态信息可以是指电机的档位信息。
而本说明书提供的散热系统的控制方法主要是:在考虑散热系统的散热效果或能耗大小的情况下,先从散热系统中确定出与散热效果或能耗大小相关的散热器件,并将确定出的散热器件的状态信息,作为用于控制散热系统进行散热的策略,将其他散热器件和芯片的状态信息,作为采用这个策略所对应的适用条件。在此基础上,对历史上散热系统对计算集群进行散热时的各散热器件的状态信息和芯片的状态信息进行分析处理,确定出每种策略所对应的适用条件范围。在需要控制散热系统进行散热时,可以将其他散热器件和芯片的当前状态信息与每个适用条件范围进行匹配,并将命中的适用条件范围对应的策略,作为目标策略,按照目标策略,对散热系统进行控制。
本说明书提供的散热系统的控制方法主要分为三个部分:第一个部分:对获取到的历史上散热系统对计算集群进行散热时所产生的每个历史记录包含的部分散热器件和芯片的历史状态信息进行特征提取,得到针对每个历史记录的特征向量。第二个部分:基于特征描述范围的具有可解释性的表述方式,对每个历史记录的特征向量以及每个历史记录包含的策略进行编码,构建针对每个策略的适用条件。基于针对每个策略的适用条件,以可解释的方式构成规则,并结合多个规则以构建模型。第三个部分:通过构建的模型输出在部分散热器件和芯片的当前状态信息下所需采用的目标策略,以按照目标策略,对散热系统进行控制。
本说明书提出的散热系统的控制方法虽然采用人工智能技术对散热系统进行控制,但是由于采用可解释人工智能技术,构成的模型具有可解释性,支持细粒度的人工模型干预。
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图2为本说明书实施例提供的散热系统的控制方法的流程示意图,该散热系统的控制方法可以适用于服务器,包括:
S200:获取历史上散热系统对计算集群进行散热时所采集到的各历史记录,并从各历史记录中确定出控制所述散热系统的各策略组合,针对所述各策略组合中的任意两个策略组合,这两个策略组合所包含的散热器件相同,这两个策略组合中各散热器件的状态信息不完全相同;针对每个历史记录,该历史记录包含有策略组合和其他记录,所述策略组合包含有所述散热系统中每个电机的档位信息和/或每个控制阀的控制参量,所述其他记录包含有所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的状态信息以及所述计算集群中每个芯片所使用的算力资源,所述散热系统中的各散热器件包括:电机、控制阀、传感器。
在本说明书实施例中,先对第一个部分的内容进行详细说明。
在本说明书实施例中,可以先获取历史上散热系统对计算集群进行散热时所采集到的各历史记录。
针对每个历史记录,该历史记录包含有散热系统中各散热器件的状态信息以及计算集群中各芯片的状态信息。由于本说明书注重散热系统进行散热时的散热效果和能耗大小,所以,该历史记录包含的各散热器件可以有:电机、控制阀、传感器。其中,电机的状态信息可以是指电机的档位信息,比如:一档、二档、三档等。控制阀的状态信息可以是指控制阀的控制参量,比如:控制阀开启10%、控制阀开启20%、控制阀开启30%等。传感器的状态信息可以是指传感器的采集参数,比如:若传感器是温度传感器,则采集参数为温度;若传感器是湿度传感器,则采集参数为湿度。芯片的状态信息可以是指芯片在执行计算任务时所使用的算力资源,比如:CPU占用率、内存使用率等。
在本说明书中,若以散热系统进行散热时的能耗大小为最高优先级,散热系统进行散热时的散热效果为次优先级,则针对每个历史记录,可以将该历史记录包含的各电机的状态信息作为一个策略组合。若以散热系统进行散热时的散热效果为最高优先级,散热系统进行散热时的能耗大小为次优先级,则针对每个历史记录,可以将该历史记录包含的各控制阀的状态信息作为一个策略组合。若散热系统进行散热时的散热效果和能耗大小为同等优先级,则针对每个历史记录,可以将该历史记录包含的各控制阀的状态信息和各电机的状态信息作为一个策略组合。
因此,针对每个历史记录,该历史记录包含有一个策略组合和一个其他记录。其中,该历史记录包含的策略组合可以是指包含有每个电机的档位信息和/或每个控制阀的控制参量的组合。该历史记录包含的其他记录包含有各散热器件中除策略组合包含的散热器件之外的其他散热器件的状态信息和计算集群中每个芯片执行计算任务时所使用的算力资源。
针对一个历史记录,若策略组合包含有每个电机的档位信息,则其他记录包含有每个控制阀的控制参量、每个传感器的采集参数和每个芯片执行计算任务时所使用的算力资源。若策略组合包含有每个控制阀的控制参量,则其他记录包含有每个电机的档位信息、每个传感器的采集参数和每个芯片执行计算任务时所使用的算力资源。若策略组合包含有每个电机的档位信息和每个控制阀的控制参量,则其他记录包含有每个传感器的采集参数和每个芯片执行计算任务时所使用的算力资源。
在获取到各历史记录之后,可以从各历史记录中确定出控制该散热系统的各策略组合。针对各策略组合中的任意两个策略组合,这两个策略组合所包含的散热器件相同,这两个策略组合包含的各散热器件的状态信息不完全相同。
具体的,针对每个历史记录,确定出该历史记录包含的策略组合,作为该历史记录对应的策略组合,然后,从每个历史记录对应的策略组合中确定出各不相同的策略组合,以得到各策略组合。
以策略组合中包含有电机1、电机2和电机3为例,针对任意两个策略组合,一个策略组合可能为{电机1:1档,电机2:2档,电机3:1档},另一个策略组合可能为{电机1:2档,电机2:2档,电机3:1档}。
在确定出不同的各策略组合之后,可以通过二叉树编码方式,对各历史记录中每个历史记录包含的其他记录进行特征提取,以得到每个历史记录对应的特征向量,即,每个历史记录包含的其他记录对应的特征向量。其中,二叉树编码方式具有可解释性。
具体的,可以先根据预设特征数量,以历史记录包含的其他记录为叶子节点,以运算符号为父节点,构建用于特征提取的二叉树。如图3所示。其中,运算符号可以包括:加、减、乘、除、与、或、非等。针对二叉树的每个叶子节点,该叶子节点对应其他记录包含的一个散热器件的状态信息。预设特征数量可以是指通过该二叉树进行特征提取后所得到的特征数量,即,特征维度的数量。然后,针对各历史记录中每个历史记录,基于二叉树,对该历史记录包含的其他记录进行特征提取,得到该历史记录对应的初始特征向量。其中,初始特征向量的特征数量或特征维度的数量为预设特征数量。
在图3中,以二叉树中第一子树和第二子树为例,第一子树的输出值为一个特征值,第二子树的输出值为一个特征值。
在得到每个历史记录对应的初始特征向量之后,可以直接将每个历史记录对应的初始特征向量作为每个历史记录对应的特征向量。
在本说明书中,为了提高后续对同一策略组合对应的各其他记录进行合并的效率,在得到每个历史记录对应的初始特征向量之后,针对每个历史记录对应的初始特征向量,可以从该初始特征向量包含的各特征中选择出连续域覆盖的历史记录数量较多的特征,最终,根据选择出的特征对应的特征值,确定出该历史记录对应的特征向量。
在对初始特征向量进行特征选择时,可以根据各历史记录中每个历史记录对应的初始特征向量以及每个历史记录包含的策略组合,确定出初始特征向量中的每个特征维度对应的连续值。其中,针对每个特征维度,该特征维度对应的连续值用于表示各历史记录对应的初始特征向量中位于该特征维度的特征值的最大连续程度。该特征维度对应的连续值越大,该特征维度下特征值的取值范围越大。
针对各历史记录中的每个历史记录,根据每个特征维度对应的连续值,从该历史记录对应的初始特征向量中按照连续值从大到小的顺序依次选择出预设数量(或第一预设数量)的特征维度,并基于选择出的特征维度下的特征值,确定出该历史记录对应的特征向量。
在本说明书中将连续值比较大的特征选择出来,可以在提高合并效率的情况下,为每个策略组合找到适用范围比较大的适用条件。
当存在多个服务器对同一批历史记录进行特征提取和特征选择时,针对每个服务器,该服务器执行上述步骤,得到每个历史记录对应的特征向量。考虑到每个服务器执行上述步骤所得到的每个历史记录对应的特征向量的特征维度不一致的问题,可以再次对每个服务器得到的每个历史记录对应的特征向量进行特征选择。
具体的,可以将每个服务器得到的每个历史记录对应的特征向量汇总到一个服务器上,这个服务器可以根据每个历史记录对应的特征向量以及每个历史记录包含的策略组合,确定出特征向量中的每个特征维度对应的连续值。其中,针对每个特征维度,该特征维度对应的连续值用于表示各历史记录对应的特征向量中位于该特征维度的特征值的最大连续程度。该特征维度对应的连续值越大,该特征维度下特征值的取值范围越大。然后,针对每个历史记录,根据每个特征维度对应的连续值,从该历史记录对应的特征向量中按照连续值从大到小的顺序依次选择出第二预设数量的特征维度,并基于选择出的特征维度下的特征值,重新确定出该历史记录对应的特征向量。需要说明的是,在存在多个服务器对同一批历史记录进行特征提取和特征选择的情况下,上述的“预设数量”可以作为第一预设数量,这里的预设数量可以是指第二预设数量。其中,第二预设数量小于第一预设数量。
接下来,对根据各历史记录中每个历史记录对应的初始特征向量以及每个历史记录包含的策略组合,确定每个特征维度对应的连续值的方法进行说明。确定每个特征维度对应的连续值的主要思路是:针对每个特征维度,判断该特征维度下出现的不同特征值的数量,若出现不同特征值的数量小于数量阈值,则说明在这个特征维度下的特征值的连续性比较差(即,这个特征维度下的特征值的取值范围比较小),可以分别计算不同特征值下的连续程度。若出现不同特征值的数量不小于数量阈值,则说明在这个特征维度下的特征值的连续性比较强(即,这个特征维度下的特征值的取值范围比较大),可以确定出针对不同策略组合的连续域,并基于针对不同策略组合的连续域计算出连续程度。
具体的,针对初始特征向量中的每个特征维度,根据各历史记录中每个历史记录对应的初始特征向量位于该特征维度的特征值,统计出该特征维度下的不同特征值的数量。
若该特征维度下的不同特征值的数量小于数量阈值,则针对该特征维度下的每个特征值,根据该特征值对应的目标历史记录的总数量以及目标历史记录涉及的各策略组合,确定出该特征值在各策略组合中的每个策略组合下的连续值,并从该特征值在各策略组合中的每个策略组合下的连续值中选择出最大的连续值,作为该特征值对应的连续值。然后,从该特征维度下的每个特征值对应的连续值中选择出最大的连续值,作为该特征维度对应的连续值。
在确定出该特征值在各策略组合中的每个策略组合下的连续值时,可以从各历史记录中选择出目标历史记录,作为该特征值对应的目标历史记录,以及确定出目标历史记录涉及的各策略组合,作为该特征值对应的各策略组合。其中,目标历史记录是指在该特征维度下,包含有该特征值的初始特征向量所对应的历史记录。然后,针对该特征值对应的每个策略组合,根据目标历史记录的总数量以及目标历史记录中包含有该策略组合的历史记录的数量,确定该特征值在该策略组合下的连续值。
其中,可以确定目标历史记录中包含有该策略组合的历史记录的数量与目标历史记录的总数量之间的比值,作为该特征值在该策略组合下的连续值。计算该特征值在该策略组合下的连续值的公式为:。/>表示特征值/>在策略组合/>下的连续值,/>表示初始特征向量包含有特征值/>的目标历史记录的总数量,/>表示目标历史记录中包含策略组合/>的历史记录的数量。
例如:假设有1000个历史记录,策略组合1和策略组合2,其中,550个历史记录包含有策略组合1,450个历史记录包含有策略组合2。一个历史记录对应的初始特征向量的特征维度数量为200,初始特征向量表示为,数量阈值为10。以第一个特征维度为例,在各历史记录中,若第一个特征维度下出现2种不同的特征值,分别为特征值1和特征值2,第一个特征维度下的特征值为特征值1的历史记录有500个,其中,300个历史记录包含有策略组合1,200个历史记录包含有策略组合2;第一个特征维度下的特征值为特征值2的历史记录有500个,其中,250个历史记录包含有策略组合1,250个历史记录包含有策略组合2。
针对第一个特征维度,在特征值1的情况下,特征值1在策略组合1下的连续值为,特征值1在策略组合2下的连续值为/>。选择出最大的连续值作为特征值1对应的连续值(即,0.6)。在特征值2的情况下,特征值2在策略组合1下的连续值为,特征值2在策略组合2下的连续值为/>。选择出最大的连续值作为特征值2对应的连续值(即,0.5)。最终,从特征值1对应的连续值和特征值2对应的连续值中选择出最大的连续值,作为第一个特征维度对应的连续值,即,0.6。
若该特征维度下的不同特征值的数量不小于数量阈值,则根据该特征维度下的特征值的大小,对各历史记录进行排序,得到该特征维度下的第一排序序列。其中,可以对各历史记录进行升序排序或降序排序。
然后,针对各历史记录涉及的每个策略组合,从该特征维度下的第一排序序列中确定出包含有该策略组合的历史记录的连续域。其中,在第一排序序列中,包含有该策略组合的历史记录的连续域可以是多个。针对包含有该策略组合的历史记录的每个连续域,该连续域内所包含的历史记录的数量大于指定数量,其中,指定数量可以是由各历史记录的总数量的预设百分比所确定的,比如:各历史记录的总数量为1000,预设百分比为1%,则指定数量为10。
在确定包含有该策略组合的历史记录的连续域时,可以将在第一排序序列中连续包含有该策略组合的历史记录的连续区域,作为连续域。
之后,根据连续域内的历史记录的数量以及各历史记录中包含有该策略组合的历史记录的数量,确定出该特征维度在该策略组合下的连续值。其中,可以确定出连续域内的历史记录的数量与各历史记录中包含有该策略组合的历史记录的数量之间的比值,作为该特征维度在该策略组合下的连续值。
当包含有该策略组合的历史记录的连续域存在多个时,可以根据每个连续域内历史记录的数量,确定包含有该策略组合的历史记录的所有连续域内历史记录的总数量,根据所有连续域内历史记录的总数量以及各历史记录中包含有该策略组合的历史记录的数量,确定出该特征维度在该策略组合下的连续值。
其中,可以确定出所有连续域内历史记录的总数量与各历史记录中包含有该策略组合的历史记录的数量之间的比值,作为该特征维度在该策略组合下的连续值。
计算该特征维度在该策略组合下的连续值的公式为:。/>表示该特征维度在策略组合/>下的连续值,/>表示在该特征维度下,连续包含有策略组合/>的历史记录的第/>个连续域内的历史记录的数量,/>表示各历史记录中包含策略组合/>的历史记录的数量。
最后,从该特征维度在每个策略组合下的连续值中选择出最大的连续值,作为该特征维度对应的连续值。
例如:假设有1000个历史记录,策略组合1和策略组合2,其中,550个历史记录包含有策略组合1,450个历史记录包含有策略组合2。一个历史记录对应的初始特征向量的特征维度数量为200,初始特征向量表示为,数量阈值为10。以第二个特征维度为例,在各历史记录中,若第二个特征维度下出现150种不同的特征值。在第二个特征维度下,按照第二个特征维度的特征值大小,对各历史记录进行排序,得到第一排序序列。在第一排序序列中,针对策略组合1的连续域有2个,一个连续域中有30个历史记录,另一个连续域中有70个历史记录,则第二个特征维度在策略组合1下的连续值为/>。在第一排序序列中,针对策略组合2的连续域有3个,每个连续域中有100个历史记录,则第二个特征维度在策略组合2下的连续值为/>。最终,从第二个特征维度在策略组合1下的连续值和第二个特征维度在策略组合2下的连续值中选择最大的连续值,作为第二个特征维度对应的连续值,即,0.67。
基于上述的例子,本说明书实施例中提供一种连续域的示意图,如图4所示。在图4中,策略组合1的两个连续域分别为连续域A和连续域A’,连续域A有70个历史记录,连续域A’有30个历史记录;策略组合2的三个连续域分别为连续域B、连续域B’和连续域B’’。
S202:对所述各历史记录进行处理,确定出每个策略组合对应的各适用条件,针对同一策略组合对应的每个适用条件,该适用条件包含有特征向量中至少一个特征维度所对应的特征值范围,所述特征向量是对所述历史记录包含的其他记录进行特征提取后所得到的。
在本说明书实施例中,在确定出每个历史记录对应的特征向量之后,可以对各历史记录进行处理,确定出各策略组合中的每个策略组合对应的各适用条件。针对同一策略组合对应的各适用条件,该适用条件包含有特征向量中至少一个特征维度所对应的特征值范围。也就是,一个适用条件是由特征向量中至少一个特征维度下的特征值范围所组成的条件组。另外,针对同一策略组对应的任意两个适用条件,这两个适用条件包含的特征向量中各特征维度所对应的特征值范围不完全相同。
例如:针对同一策略组合,该策略组合对应有两个适用条件,一个适用条件为:(特征维度1,5,7)和(特征维度2,9,15),其中,特征维度1所适用的特征取值范围为,特征维度2所适用的特征取值范围为/>。另一个适用条件为:(特征维度1,20,26)和(特征维度3,9,15),其中,特征维度1所适用的特征取值范围为/>,特征维度3所适用的特征取值范围为/>
在对各历史记录进行处理,确定出每个策略组合对应的各适用条件的过程,是一个不断调整每个策略组合对应的适用条件数量和不断调整每个策略组合对应的适用条件包含的各特征维度所对应的特征值范围的迭代过程。
针对适用条件的每次调整,从各历史记录中选择部分历史记录,并确定出部分历史记录中每个历史记录对应的特征向量。然后,针对各策略组合中的每个策略组合,对部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,作为该次调整下该策略组合对应的适用条件。之后,将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行交叉变异处理,以生成该次调整下的新适用条件。最后,根据该次调整下的新适用条件以及该次调整下每个策略组合对应的适用条件,确定出该次调整下的每个策略组合对应的各适用条件,并保存。继续执行下一次调整,直到已保存的所有适用条件满足预设条件为止。其中,预设条件可以是指将已保存的所有适用条件作为筛选条件,基于筛选条件能够将各历史记录筛选出来。也就是,预设条件可以是指已保存的所有适用条件能够覆盖所有历史记录。
接下来,针对每个策略组合,对确定该策略组合对应的适用条件的方法进行说明。
针对每个策略组合,对部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围的方法可以包括:
根据部分历史记录中每个历史记录对应的特征向量中各特征维度的特征值以及每个历史记录包含的策略组合,构建各特征编码块,针对每个特征编码块,该特征编码块至少由特征维度、特征值范围和策略组合构成。然后,针对每个策略组合,从各特征编码块中选择出包含有该策略组合的特征编码块,作为目标特征编码块,并对目标特征编码块进行处理,得到在该策略组合下特征向量中至少一个特征维度所对应的特征值范围。
在构建各特征编码块时,可以根据每个特征维度下的特征值的连续性,采用不同构建特征编码块的方式。其中,构建特征编码块的编码方式具有可解释性。
具体的,针对特征向量中的每个特征维度,根据部分历史记录中每个历史记录对应的特征向量位于该特征维度的特征值,统计出该特征维度下的不同特征值的数量。若该特征维度下的不同特征值的数量小于数量阈值,则说明部分历史记录在该特征维度下的特征值连续性差,若该特征维度下的不同特征值的数量不小于数量阈值,则说明部分历史记录在该特征维度下的特征值连续性强。
若该特征维度下的不同特征值的数量小于数量阈值,则根据部分历史记录中每个历史记录对应的特征向量中该特征维度的特征值以及每个历史记录包含的策略组合,确定出特征向量中该特征维度对应的连续值。然后,针对部分历史记录中每个历史记录,基于该特征维度、该历史记录对应的特征向量中位于该特征维度下的特征值、该特征维度对应的连续值以及该历史记录包含的策略组合,构建该历史记录在该特征维度下的特征编码块。其中,该历史记录在该特征维度下的特征编码块包含的特征值范围为该历史记录对应的特征向量中位于该特征维度下的特征值。
其中,根据部分历史记录中每个历史记录对应的特征向量中该特征维度的特征值以及每个历史记录包含的策略组合,确定出特征向量中该特征维度对应的连续值的方法可以包括:针对该特征维度下的每个特征值,从部分历史记录中选择出包含有该特征值的特征向量所对应的历史记录,作为该特征值对应的目标历史记录,以及确定出目标历史记录涉及的各策略组合,作为该特征值对应的各策略组合。根据该特征值对应的目标历史记录的总数量以及目标历史记录涉及的各策略组合,确定出该特征值在各策略组合中的每个策略组合下的连续值,并从该特征值在各策略组合中的每个策略组合下的连续值中选择出最大的连续值,作为该特征值对应的连续值,然后,从该特征维度下的每个特征值对应的连续值中选择出最大的连续值,作为该特征维度对应的连续值。
在构建该历史记录在该特征维度下的特征编码块时,可以将该特征维度、该历史记录对应的特征向量中位于该特征维度下的特征值、该特征维度对应的连续值以及该历史记录包含的策略组合作为用于构建特征编码块的元素,以生成对应的特征编码块。其中,在该特征维度下的不同特征值的数量小于数量阈值的情况下,特征编码块的表述形式为:(特征维度,特征值,连续值,策略组合)。
例如:假设部分历史记录有历史记录1、历史记录2和历史记录3,部分历史记录涉及2个策略组合,分别为策略组合1和策略组合2。历史记录1和历史记录2包含有策略组合1,历史记录3包含有策略组合2。以历史记录的特征向量中的第一个特征维度为例,历史记录1在第一个特征维度下的特征值为10,历史记录2在第一个特征维度下的特征值为30,历史记录3在第一个特征维度下的特征值为10,第一个特征维度对应的连续值为0.5。针对历史记录1在第一个特征维度下所构建的特征编码块为:(第一个特征维度,10,0.5,策略组合1),针对历史记录2在第一个特征维度下所构建的特征编码块为:(第一个特征维度,30,0.5,策略组合1),针对历史记录3在第一个特征维度下所构建的特征编码块为:(第一个特征维度,10,0.5,策略组合2)。
在另一种情况下,即,若该特征维度下的不同特征值的数量不小于数量阈值,则根据部分历史记录中每个历史记录对应的特征向量中位于该特征维度的特征值的大小,对部分历史记录进行排序,得到在该特征维度下的第二排序序列。然后,针对部分历史记录涉及的每个策略组合,从在该特征维度下的第二排序序列中确定出包含有该策略组合的历史记录的连续域,并将该连续域覆盖的各历史记录作为各连续历史记录。之后,从各连续历史记录对应的特征向量中位于该特征维度的特征值中选择出最小的特征值,作为起始值,以及从各连续历史记录对应的特征向量中位于该特征维度的特征值中选择出最大的特征值,作为终止值。最后,基于该特征维度、起始值、终止值以及该策略组合,构建针对该连续域的特征编码块。其中,起始值与终止值之间的取值区间用于表示该特征维度下的特征值范围。在该特征维度下的不同特征值的数量不小于数量阈值的情况下,特征编码块的表述形式为:(特征维度,起始值,终止值,策略组合)。
例如:假设部分历史记录有500个历史记录,部分历史记录涉及策略组合1和策略组合2,其中,300个历史记录包含有策略组合1,200个历史记录包含有策略组合2。一个历史记录对应的特征向量的特征维度数量为50,特征向量表示为,数量阈值为10。以第二个特征维度为例,在部分历史记录中,若第二个特征维度下出现75种不同的特征值。在第二个特征维度下,按照第二个特征维度的特征值大小,对部分历史记录进行排序,得到第二排序序列。在第二排序序列中,针对策略组合1的连续域有2个,一个连续域中有15个历史记录,这个连续域中在第二个特征维度下的最大特征值(即,终止值)为17,最小特征值(即,起始值)为5。则针对这个连续域所构建的特征编码块为:(第二个特征维度,5,17,策略组合1)。针对策略组合1的另一个连续域中有35个历史记录,这个连续域中在第二个特征维度下的最大特征值(即,终止值)为10,最小特征值(即,起始值)为1。则针对这个连续域所构建的特征编码块为:(第二个特征维度,1,10,策略组合1)。
在根据部分历史记录中每个历史记录对应的特征向量中各特征维度的特征值以及每个历史记录包含的策略组合,构建各特征编码块之后,可以针对每个策略组合,从各特征编码块中选择出包含有该策略组合的特征编码块,作为目标特征编码块,并对目标特征编码块进行处理,得到在该策略组合下特征向量中至少一个特征维度所对应的特征值范围。
在对目标特征编码块进行处理,得到在该策略组合下特征向量中至少一个特征维度所对应的特征值范围时,可以从目标特征编码块中选择出包含有同一特征维度的各特征编码块,作为各合并特征编码块。然后,对各合并特征编码块包含的特征值范围进行合并,得到合并后特征编码块。
在对各合并特征编码块包含的特征值范围进行合并时,可以确定出每个合并特征编码块包含的特征值范围,对每个合并特征编码块包含的特征值范围求并集,以得到合并后特征值范围。然后,基于合并后特征值范围、合并特征编码块包含的特征维度以及该策略组合,确定出合并后特征编码块。
比如:针对策略组合1的目标编码块有:(特征维度1,5,17,策略组合1)、(特征维度1,3,20,策略组合1)、(特征维度2,4,6,策略组合1)。针对特征维度1的合并编码块为:(特征维度1,5,17,策略组合1)、(特征维度1,3,20,策略组合1)。将这两个合并特征编码块进行合并,得到合并后特征编码块为:(特征维度1,3,20,策略组合1)。
在得到合并后特征编码块之后,可以从目标特征编码块中除各合并特征编码块之外的其他特征编码块中随机选择一个特征编码块,并将合并后特征编码块与选择的特征编码块进行拼接,得到拼接后特征编码块组。其中,选择出的特征编码块包含的特征维度与合并后特征编码块包含的特征维度不相同,且选择出的特征编码块包含的策略组合与合并后特征编码块包含的策略组合相同。也就是,拼接后特征编码块组包含有至少一个特征维度下的特征值范围。
另外,拼接后特征编码块组的表述形式为:(特征维度a,起始值,终止值,策略组合b)并且(特征维度c,起始值,终止值,策略组合b)。当选择出的特征编码块的表述形式为(特征维度,特征值,连续值,策略组合)时,拼接后特征编码块组的表述形式为:(特征维度a,起始值,终止值,策略组合b)并且(特征维度c,特征值,连续值,策略组合b)。
将拼接后特征编码块组作为筛选条件,从部分历史记录中确定出满足该筛选条件的历史记录,作为拼接后特征编码块组所覆盖的历史记录。判断拼接后特征编码块组所覆盖的历史记录是否均包含有该策略组合,若拼接后特征编码块组所覆盖的历史记录未均包含有该策略组合,继续从其他特征编码块中选择一个特征编码块,并将选择的特征编码块与拼接后特征编码块组进行拼接,重新确定出拼接后特征编码块组,直到重新确定的拼接后特征编码块组所覆盖的历史记录均包含有该策略组合为止。
根据最终确定出的拼接后特征编码块组中各特征编码块包含的特征值范围,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围。其中,最终确定出的拼接后特征编码块组中每个特征编码块包含的特征维度各不相同,每个特征编码块包含的策略组合相同。
继续沿用上例,将(特征维度2,4,6,策略组合1)与(特征维度1,3,20,策略组合1)进行拼接,得到拼接后特征编码块组。最终确定出的拼接后特征编码块组表述为:(特征维度2,4,6,策略组合1)并且(特征维度1,3,20,策略组合1)。
在针对每个策略组合,对部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,作为该次调整下该策略组合对应的适用条件之后,可以将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行交叉变异处理,以生成该次调整下的新适用条件。其中,已保存的目标适用条件可以是指能够覆盖该次调整下的部分历史记录的适用条件。一个适用条件对应一个策略组合。
具体的,从已保存的各适用条件中确定出能够完全覆盖该次调整下的部分历史记录的适用条件,作为目标适用条件。其中,已保存的各适用条件是指上一次调整下所保存的适用条件。然后,将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行聚合,得到第一适用条件集合。其中,第一适用条件集合中包含有该次调整下每个策略组合对应的适用条件和目标适用条件。之后,针对第一适用条件集合中任意两个适用条件,将这两个适用条件进行交叉处理,得到交叉后适用条件,并对交叉后适用条件进行变异处理,得到交叉后适用条件。最后,将交叉后适用条件和交叉后适用条件确定为该次调整下的新适用条件。
在将这两个适用条件进行交叉处理,得到交叉后适用条件时,将这两个适用条件中的一个适用条件包含的任意一个特征编码块与另一个适用条件包含的与这个特征编码块相匹配的特征编码块进行交叉处理,得到这两个适用条件各自对应的交叉后适用条件。与这个特征编码块相匹配的特征编码块可以是与这个特征编码块包含相同特征维度的特征编码块。
在得到这两个适用条件各自对应的交叉后适用条件之后,对这两个适用条件各自对应的交叉后适用条件包含的特征编码块所包含的特征值范围进行变异处理,得到变异后适用条件。
在生成该次调整下的新适用条件之后,可以根据该次调整下的新适用条件以及该次调整下每个策略组合对应的适用条件,确定出该次调整下每个策略组合对应的各适用条件。
具体的,将该次调整下的新适用条件与该次调整下每个策略组合对应的适用条件进行聚合,得到第二适用条件集合。然后,针对第二适用条件集合中的每个适用条件,将该适用条件作为筛选条件,从部分历史记录中筛选出满足该筛选条件的历史记录,作为匹配历史记录以及确定出该适用条件对应的策略组合。
根据该适用条件对应的匹配历史记录和该适用条件对应的策略组合,确定出散热系统在匹配历史记录包含的其他记录下,采用该适用条件对应的策略组合进行散热控制时所产生的散热指标,作为该适用条件对应的散热指标。其中,所述散热指标包括:散热系数、能耗系数。该适用条件对应的散热系数越小,说明在该适用条件下采用该适用条件对应的策略组合进行散热控制所达到的散热效果越好。该适用条件对应的能耗系数越小,说明在该适用条件下采用该适用条件对应的策略组合进行散热控制的能耗越少。
其中,该适用条件对应的散热系数的方法包括:根据该适用条件对应的匹配历史记录包含的芯片位置的传感器的采集参数和芯片执行计算任务所使用的算力资源,确定出该适用条件对应的散热系数。其中,传感器的采集参数越小,散热系数越小,算力资源越大,散热系数越小。
该适用条件对应的能耗系数的方法包括:根据该适用条件对应的策略组合包含的各电机的档位信息,确定出各电机的转速信息,并根据各电机的转速信息,确定出每个电机的平均功耗,作为该适用条件对应的能耗系数。
在得到每个适用条件对应的散热指标之后,可以根据第二适用条件集合中的每个适用条件对应的散热指标,从第二适用条件集合中选择出部分适用条件,并根据部分适用条件对应的策略组合,确定出该次调整下每个策略组合对应的各适用条件。
在根据第二适用条件集合中的每个适用条件对应的散热指标,从第二适用条件集合中选择出部分适用条件时,可以根据第二适用条件集合中的每个适用条件对应的散热系数,对第二适用条件集合中的每个适用条件按照散热系数从小到大排序,得到第一条件序列。然后,根据第二适用条件集合中的每个适用条件对应的能耗系数,按照能耗系数从小到大的顺序,从第一条件序列中依次选择出设定数量的适用条件,作为部分适用条件。
在根据部分适用条件对应的策略组合,确定出该次调整下每个策略组合对应的各适用条件时,可以针对该次调整下每个策略组合,从部分适用条件中确定出与该策略组合对应的各适用条件。
S204:根据每个策略组合对应的各适用条件,构建模型。
在本说明书实施例中,通过步骤S202确定出每个策略组合对应的各适用条件之后,可以根据每个策略组合对应的各适用条件,构建模型。
具体的,可以采用具有可解释性的表述方法,对每个策略组合对应的各适用条件进行编码,构建出各规则,并基于各规则,构建出模型。其中,构建出的模型包含有各规则。一个规则可以包含一个适用条件和一个策略组合,这个适用条件和这个策略组合具有对应关系。针对任意两个规则,这两个规则包含的策略组合可以不同,也可以相同。
在对每个策略组合对应的各适用条件进行编码,构建出各规则时,针对每个策略组合,确定出该策略组合对应的各适用条件。然后,针对该策略组合对应的每个适用条件,将该适用条件与该策略组合进行编码(或拼接),得到一个规则。其中,一个规则的表述形式为:如果(特征维度a,起始值,终止值)并且(特征维度b,起始值,终止值),那么策略组合c。a、b、c不固定。当规则的适用条件包含有连续值时,一个规则的表述形式为:如果(特征维度a,起始值,终止值)并且(特征维度b,特征值,连续值),那么策略组合c。
需要说明的是,规则的表述形式中适用条件以包含两个特征编码块为例进行规则表述,在实际构建的适用条件的过程中,不限制构成适用条件的特征编码块的数量。
除了上述基于构建的各规则构建模型之外,可以基于每个策略组合对应的各适用条件,建立策略组合与适用条件之间的函数关系,并基于建立的函数关系,构建模型。
除了上述基于构建的各规则构建模型之外,还可以针对每个策略组合,基于该策略组合对应的各适用条件,建立该策略组合与该策略组合对应的各适用条件之间的映射表,作为该策略组合对应的映射表,并根据每个策略组合对应的映射表,构建模型。其中,构建的模型用于表示策略组合与适用条件之间的对应关系或映射关系。
S206:在接收到针对所述散热系统的散热任务请求时,采集所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的当前状态信息以及所述计算集群中每个芯片所使用的当前算力资源,并对所述其他散热器件的当前状态信息以及所述当前算力资源进行特征提取,得到当前特征向量,将所述当前特征向量输入到所述模型中,以通过所述模型输出目标策略组合,并按照所述目标策略组合,对所述散热系统进行控制。
在本说明书实施例中,在接收到针对散热系统的散热任务请求时,可以基于散热任务请求,采集散热系统中除策略组合包含的散热器件之外的其他散热器件的当前状态信息以及计算集群中每个芯片所使用的当前算力资源。
可以通过预先构建的用于特征提取的二叉树,对其他散热器件的当前状态信息以及当前算力资源进行特征提取,得到当前特征向量。然后,将当前特征向量输入到模型中,以通过模型输出目标策略组合,并按照目标策略组合,对散热系统进行控制。其中,用于特征提取的二叉树是根据预设特征数量,以其他记录为叶子节点,以运算符号为父节点所构建的。其中,其他记录可以是指散热系统中除策略组合包含的散热器件之外的其他散热器件的状态信息以及计算集群中每个芯片所使用的算力资源。预设特征数量可以是指预设的特征向量的特征维度的数量。
将当前特征向量输入到模型中,以通过模型输出目标策略组合的方法可以包括:将当前特征向量输入到模型,以通过模型,根据当前特征向量中每个特征维度的特征值,将当前特征向量与已保存的所有适用条件进行匹配,确定出当前特征向量所匹配的适用条件,并将当前特征向量所匹配的适用条件所对应的策略组合,作为目标策略组合。
在根据当前特征向量中每个特征维度的特征值,将当前特征向量与已保存的所有适用条件进行匹配,确定出当前特征向量所匹配的适用条件时,针对所有适用条件中的每个适用条件,从当前特征向量中确定出与该适用条件包含的各特征维度相同的各特征维度,作为各命中特征维度,然后,判断当前特征向量中每个命中特征维度下的特征值是否均位于该适用条件包含的对应特征维度的特征取值范围内。若当前特征向量中每个命中特征维度下的特征值均位于该适用条件包含的对应特征维度的特征取值范围内,则将该适用条件作为当前特征向量所匹配的适用条件。若当前特征向量中任意一个命中特征维度下的特征值未位于该适用条件包含的对应特征维度的特征取值范围内,则不将该适用条件作为当前特征向量所匹配的适用条件。
例如:若已保存2个适用条件,分别为适用条件1:(特征维度1,4,20,策略组合1)并且(特征维度2,1,8,策略组合1);适用条件2:(特征维度3,7,20,策略组合2),当前特征向量为{特征维度1:10,特征维度2:2,特征维度3:6,特征维度4:9}。
将当前特征向量与适用条件1进行匹配,特征维度1和特征维度2为命中特征维度,特征维度1的10位于适用条件1的特征维度1的特征值范围内,特征维度2的2位于适用条件1的特征维度2的特征值范围内,所以,当前特征向量匹配上适用条件1,并将适用条件1对应的策略组合1作为目标策略组合。
将当前特征向量与适用条件2进行匹配,特征维度3为命中特征维度,特征维度3的6不位于适用条件2的特征维度3的特征值范围内,所以,当前特征向量未匹配上适用条件2。
此外,若构建出的模型中包含有各规则,在将当前特征向量输入到模型中,以通过模型输出目标策略组合的方法可以包括:将当前特征向量输入到模型,以通过模型,根据当前特征向量中每个特征维度的特征值,将当前特征向量与已保存的每个规则包含的适用条件进行匹配,确定出当前特征向量所匹配的规则,并将当前特征向量所匹配的规则中的策略组合作为目标策略组合。
在根据当前特征向量中每个特征维度的特征值,将当前特征向量与已保存的每个规则包含的适用条件进行匹配,确定出当前特征向量所匹配的规则时,针对模型包含的每个规则,从当前特征向量中确定出与该规则中适用条件包含的各特征维度相同的各特征维度,作为各命中特征维度,然后,判断当前特征向量中每个命中特征维度下的特征值是否均位于该规则中适用条件包含的对应特征维度的特征取值范围内。若当前特征向量中每个命中特征维度下的特征值均位于该规则中适用条件包含的对应特征维度的特征取值范围内,则将该规则作为当前特征向量所匹配的规则。若当前特征向量中任意一个命中特征维度下的特征值未位于该规则的适用条件包含的对应特征维度的特征取值范围内,则不将该规则作为当前特征向量所匹配的规则。
在按照目标策略组合,对散热系统进行控制时,基于目标策略组合中每个散热器件对应的状态信息,对散热系统中与目标策略组合对应的散热器件的当前状态信息进行调整,即,对散热系统中与目标策略组合对应的散热器件的当前状态信息调整为目标策略组合包含的状态信息。
需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
通过上述图1所示的方法可见,本说明书先根据历史上散热系统对计算集群散热时的各历史记录中确定出用于控制散热的各策略组合,针对每个策略组合,对各历史记录进行处理,确定在该策略组合下特征向量涉及的至少一个特征维度所对应的特征值范围,作为该策略组合的适用条件。其中,对各历史记录进行处理的过程是基于特征描述范围的具有可解释性的方式,对各历史记录的特征向量和各历史记录包含的策略组合进行编码的过程。根据每个策略组合的适用条件,以可解释的方式构成规则,并联合多个规则来构建模型,并通过模型输出的目标策略组合控制散热系统。在此方法中,通过对各历史记录进行分析,确定出采用每个策略组合所适用的条件,并基于每个策略组合所适用的条件,构成规则,一个规则包含有策略组合和适用条件。当需要控制散热系统时,将当前散热系统和计算集群的状态信息与各规则中的条件进行匹配,以确定出匹配上的规则,并将匹配上的规则包含的策略组合,作为目标策略组合,基于目标策略组合来控制散热系统。
以上为本说明书实施例提供的散热系统的控制方法,基于同样的思路,本说明书还提供了相应的装置、存储介质和电子设备。
图5为本说明书实施例提供的一种散热系统的控制装置的结构示意图,所述装置包括:
获取模块501,用于获取历史上散热系统对计算集群进行散热时所采集到的各历史记录,并从各历史记录中确定出控制所述散热系统的各策略组合,针对所述各策略组合中的任意两个策略组合,这两个策略组合所包含的散热器件相同,这两个策略组合中各散热器件的状态信息不完全相同;针对每个历史记录,该历史记录包含有策略组合和其他记录,所述策略组合包含有所述散热系统中每个电机的档位信息和/或每个控制阀的控制参量,所述其他记录包含有所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的状态信息以及所述计算集群中每个芯片所使用的算力资源,所述散热系统中的各散热器件包括:电机、控制阀、传感器;
处理模块502,用于针对每个策略组合,对所述各历史记录进行处理,确定出该策略组合对应的各适用条件,所述特征向量是对所述历史记录包含的其他记录进行特征提取后所得到的;
构建模型模块503,用于根据每个策略组合对应的各适用条件,构建模型;
控制模块504,用于在接收到针对所述散热系统的散热任务请求时,采集所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的当前状态信息以及所述计算集群中每个芯片所使用的当前算力资源,并将所述其他散热器件的当前状态信息以及所述当前算力资源输入到所述模型中,以通过所述模型输出目标策略组合,并按照所述目标策略组合,对所述散热系统进行控制。
可选地,所述处理模块502具体用于,对所述各历史记录中每个历史记录包含的其他记录进行特征提取,得到所述各历史记录中每个历史记录对应的特征向量;针对适用条件的每次调整,从所述各历史记录中选择部分历史记录,并确定出所述部分历史记录中每个历史记录对应的特征向量;针对每个策略组合,对所述部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,作为该次调整下该策略组合对应的适用条件;将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行交叉变异处理,以生成该次调整下的新适用条件;根据该次调整下的新适用条件以及该次调整下每个策略组合对应的适用条件,确定出该次调整下每个策略组合对应的各适用条件,并保存;继续执行下一次调整,直到已保存的所有适用条件满足预设条件为止。
可选地,所述处理模块502具体用于,根据预设特征数量,以其他记录为叶子节点,以运算符号为父节点,构建用于特征提取的二叉树;针对所述各历史记录中每个历史记录,基于所述二叉树,对该历史记录包含的其他记录进行特征提取,得到该历史记录对应的初始特征向量,所述初始特征向量的特征维度的数量为所述预设特征数量;根据所述各历史记录中每个历史记录对应的初始特征向量以及每个历史记录包含的策略组合,确定出初始特征向量中的每个特征维度对应的连续值;其中,针对每个特征维度,该特征维度对应的连续值用于表示所述各历史记录对应的初始特征向量中位于该特征维度的特征值的最大连续程度;针对所述各历史记录中的每个历史记录,根据每个特征维度对应的连续值,从该历史记录对应的初始特征向量中按照连续值从大到小的顺序依次选择出预设数量的特征维度,并基于选择出的特征维度下的特征值,确定出该历史记录对应的特征向量。
可选地,所述处理模块502具体用于,针对初始特征向量中的每个特征维度,根据所述各历史记录中每个历史记录对应的初始特征向量位于该特征维度的特征值,统计出该特征维度下的不同特征值的数量;若该特征维度下的不同特征值的数量小于数量阈值,则针对该特征维度下的每个特征值,根据该特征值对应的目标历史记录的总数量以及所述目标历史记录涉及的各策略组合,确定出该特征值在所述各策略组合中的每个策略组合下的连续值,并从该特征值在所述各策略组合中的每个策略组合下的连续值中选择出最大的连续值,作为该特征值对应的连续值;从该特征维度下的每个特征值对应的连续值中选择出最大的连续值,作为该特征维度对应的连续值;若该特征维度下的不同特征值的数量不小于数量阈值,则根据该特征维度下的特征值的大小,对所述各历史记录进行排序,得到该特征维度下的第一排序序列;针对所述各历史记录涉及的每个策略组合,从该特征维度下的第一排序序列中确定出包含有该策略组合的历史记录的连续域,并根据所述连续域内的历史记录的数量以及所述各历史记录中包含有该策略组合的历史记录的数量,确定出该特征维度在该策略组合下的连续值;从该特征维度在每个策略组合下的连续值中选择出最大的连续值,作为该特征维度对应的连续值。
可选地,所述处理模块502具体用于,从所述各历史记录中选择出目标历史记录,作为该特征值对应的目标历史记录,以及确定出所述目标历史记录涉及的各策略组合,作为该特征值对应的各策略组合;其中,所述目标历史记录是指包含有该特征值的初始特征向量所对应的历史记录;针对该特征值对应的每个策略组合,根据所述目标历史记录的总数量以及所述目标历史记录中包含有该策略组合的历史记录的数量,确定该特征值在该策略组合下的连续值。
可选地,所述处理模块502具体用于,根据所述部分历史记录中每个历史记录对应的特征向量中各特征维度的特征值以及每个历史记录包含的策略组合,构建各特征编码块,针对每个特征编码块,该特征编码块至少由特征维度、特征值范围和策略组合构成;针对每个策略组合,从所述各特征编码块中选择出包含有该策略组合的特征编码块,作为目标特征编码块,并对所述目标特征编码块进行处理,得到在该策略组合下特征向量中至少一个特征维度所对应的特征值范围。
可选地,所述处理模块502具体用于,针对特征向量中的每个特征维度,根据所述部分历史记录中每个历史记录对应的特征向量位于该特征维度的特征值,统计出该特征维度下的不同特征值的数量;若该特征维度下的不同特征值的数量小于数量阈值,则根据所述部分历史记录中每个历史记录对应的特征向量中该特征维度的特征值以及每个历史记录包含的策略组合,确定出特征向量中该特征维度对应的连续值;针对所述部分历史记录中每个历史记录,基于该特征维度、该历史记录对应的特征向量中位于该特征维度下的特征值、该特征维度对应的连续值以及该历史记录包含的策略组合,构建该历史记录在该特征维度下的特征编码块,其中,该历史记录在该特征维度下的特征编码块包含的特征值范围为该历史记录对应的特征向量中位于该特征维度下的特征值。
可选地,所述处理模块502还用于,若该特征维度下的不同特征值的数量不小于数量阈值,则根据所述部分历史记录中每个历史记录对应的特征向量中位于该特征维度的特征值的大小,对所述部分历史记录进行排序,得到在该特征维度下的第二排序序列;针对所述部分历史记录涉及的每个策略组合,从在该特征维度下的第二排序序列中确定出包含有该策略组合的历史记录的连续域,并将所述连续域覆盖的各历史记录作为各连续历史记录;从所述各连续历史记录对应的特征向量中位于该特征维度的特征值中选择出最小的特征值,作为起始值,以及从所述各连续历史记录对应的特征向量中位于该特征维度的特征值中选择出最大的特征值,作为终止值;基于该特征维度、所述起始值、所述终止值以及该策略组合,构建针对所述连续域的特征编码块,其中,所述起始值与所述终止值之间的取值区间用于表示该特征维度的特征值范围。
可选地,所述处理模块502具体用于,从所述目标特征编码块中选择出包含有同一特征维度的各特征编码块,作为各合并特征编码块;对所述各合并特征编码块包含的特征值范围进行合并,得到合并后特征编码块;从所述目标特征编码块中除所述各合并特征编码块之外的其他特征编码块中随机选择一个特征编码块,并将所述合并后特征编码块与选择的特征编码块进行拼接,得到拼接后特征编码块组;判断所述拼接后特征编码块组所覆盖的历史记录是否均包含有该策略组合,若所述拼接后特征编码块组所覆盖的历史记录未均包含有该策略组合,继续从所述其他特征编码块中选择一个特征编码块,并将选择的特征编码块与所述拼接后特征编码块组进行拼接,重新确定出拼接后特征编码块组,直到重新确定的拼接后特征编码块组所覆盖的历史记录均包含有该策略组合为止;根据最终确定出的拼接后特征编码块组中各特征编码块包含的特征值范围,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围。
可选地,所述处理模块502具体用于,从已保存的各适用条件中确定出能够完全覆盖该次调整下的所述部分历史记录的适用条件,作为目标适用条件;将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行聚合,得到第一适用条件集合;针对所述第一适用条件集合中任意两个适用条件,将这两个适用条件进行交叉处理,得到交叉后适用条件;对所述交叉后适用条件进行变异处理,得到交叉后适用条件;将所述交叉后适用条件和所述交叉后适用条件确定为该次调整下的新适用条件。
可选地,所述处理模块502具体用于,将该次调整下的新适用条件与该次调整下每个策略组合对应的适用条件进行聚合,得到第二适用条件集合;针对所述第二适用条件集合中的每个适用条件,将该适用条件作为筛选条件,从所述部分历史记录中筛选出满足所述筛选条件的历史记录,作为匹配历史记录以及确定出该适用条件对应的策略组合;根据该适用条件对应的匹配历史记录和该适用条件对应的策略组合,确定出所述散热系统在所述匹配历史记录包含的其他记录下,采用该适用条件对应的策略组合进行散热控制时所产生的散热指标,作为该适用条件对应的散热指标;其中,所述散热指标包括:散热系数、能耗系数;根据所述第二适用条件集合中的每个适用条件对应的散热指标,从所述第二适用条件集合中选择出部分适用条件,并根据所述部分适用条件对应的策略组合,确定出该次调整下每个策略组合对应的各适用条件。
本说明书还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可用于执行上述图2提供的散热系统的控制方法。
基于图2所示的散热系统的控制方法,本说明书实施例还提供了图6所示的电子设备的结构示意图。如图6,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图2所述的散热系统的控制方法。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device, PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的状态信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (14)

1.一种散热系统的控制方法,其特征在于,包括:
获取历史上散热系统对计算集群进行散热时所采集到的各历史记录,并从各历史记录中确定出控制所述散热系统的各策略组合,针对所述各策略组合中的任意两个策略组合,这两个策略组合所包含的散热器件相同,这两个策略组合中各散热器件的状态信息不完全相同;针对每个历史记录,该历史记录包含有策略组合和其他记录,所述策略组合包含有所述散热系统中每个电机的档位信息和/或每个控制阀的控制参量,所述其他记录包含有所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的状态信息以及所述计算集群中每个芯片所使用的算力资源,所述散热系统中的各散热器件包括:电机、控制阀、传感器;
对所述各历史记录进行处理,确定出每个策略组合对应的各适用条件,针对同一策略组合对应的每个适用条件,该适用条件包含有特征向量中至少一个特征维度所对应的特征值范围,所述特征向量是对所述历史记录包含的其他记录进行特征提取后所得到的,其中,对所述各历史记录中每个历史记录包含的其他记录进行特征提取,得到所述各历史记录中每个历史记录对应的特征向量;针对适用条件的每次调整,从所述各历史记录中选择部分历史记录,并确定出所述部分历史记录中每个历史记录对应的特征向量;针对每个策略组合,对所述部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,作为该次调整下该策略组合对应的适用条件;将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行交叉变异处理,以生成该次调整下的新适用条件;根据该次调整下的新适用条件以及该次调整下每个策略组合对应的适用条件,确定出该次调整下每个策略组合对应的各适用条件,并保存;继续执行下一次调整,直到已保存的所有适用条件满足预设条件为止;
根据每个策略组合对应的各适用条件,构建模型;
在接收到针对所述散热系统的散热任务请求时,采集所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的当前状态信息以及所述计算集群中每个芯片所使用的当前算力资源,并对所述其他散热器件的当前状态信息以及所述当前算力资源进行特征提取,得到当前特征向量,将所述当前特征向量输入到所述模型中,以通过所述模型输出目标策略组合,并按照所述目标策略组合,对所述散热系统进行控制。
2.如权利要求1所述的方法,其特征在于,对所述各历史记录中每个历史记录包含的其他记录进行特征提取,得到所述各历史记录中每个历史记录对应的特征向量,具体包括:
根据预设特征数量,以其他记录为叶子节点,以运算符号为父节点,构建用于特征提取的二叉树;
针对所述各历史记录中每个历史记录,基于所述二叉树,对该历史记录包含的其他记录进行特征提取,得到该历史记录对应的初始特征向量,所述初始特征向量的特征维度的数量为所述预设特征数量;
根据所述各历史记录中每个历史记录对应的初始特征向量以及每个历史记录包含的策略组合,确定出初始特征向量中的每个特征维度对应的连续值;其中,针对每个特征维度,该特征维度对应的连续值用于表示所述各历史记录对应的初始特征向量中位于该特征维度的特征值的最大连续程度;
针对所述各历史记录中的每个历史记录,根据每个特征维度对应的连续值,从该历史记录对应的初始特征向量中按照连续值从大到小的顺序依次选择出预设数量的特征维度,并基于选择出的特征维度下的特征值,确定出该历史记录对应的特征向量。
3.如权利要求2所述的方法,其特征在于,根据所述各历史记录中每个历史记录对应的初始特征向量以及每个历史记录包含的策略组合,确定出初始特征向量中的每个特征维度对应的连续值,具体包括:
针对初始特征向量中的每个特征维度,根据所述各历史记录中每个历史记录对应的初始特征向量位于该特征维度的特征值,统计出该特征维度下的不同特征值的数量;
若该特征维度下的不同特征值的数量小于数量阈值,则针对该特征维度下的每个特征值,根据该特征值对应的目标历史记录的总数量以及所述目标历史记录涉及的各策略组合,确定出该特征值在所述各策略组合中的每个策略组合下的连续值,并从该特征值在所述各策略组合中的每个策略组合下的连续值中选择出最大的连续值,作为该特征值对应的连续值;从该特征维度下的每个特征值对应的连续值中选择出最大的连续值,作为该特征维度对应的连续值;
若该特征维度下的不同特征值的数量不小于数量阈值,则根据该特征维度下的特征值的大小,对所述各历史记录进行排序,得到该特征维度下的第一排序序列;针对所述各历史记录涉及的每个策略组合,从该特征维度下的第一排序序列中确定出包含有该策略组合的历史记录的连续域,并根据所述连续域内的历史记录的数量以及所述各历史记录中包含有该策略组合的历史记录的数量,确定出该特征维度在该策略组合下的连续值;从该特征维度在每个策略组合下的连续值中选择出最大的连续值,作为该特征维度对应的连续值。
4.如权利要求3所述的方法,其特征在于,根据该特征值对应的目标历史记录的总数量以及所述目标历史记录涉及的各策略组合,确定出该特征值在所述各策略组合中的每个策略组合下的连续值,具体包括:
从所述各历史记录中选择出目标历史记录,作为该特征值对应的目标历史记录,以及确定出所述目标历史记录涉及的各策略组合,作为该特征值对应的各策略组合;其中,所述目标历史记录是指包含有该特征值的初始特征向量所对应的历史记录;
针对该特征值对应的每个策略组合,根据所述目标历史记录的总数量以及所述目标历史记录中包含有该策略组合的历史记录的数量,确定该特征值在该策略组合下的连续值。
5.如权利要求1所述的方法,其特征在于,针对每个策略组合,对所述部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,具体包括:
根据所述部分历史记录中每个历史记录对应的特征向量中各特征维度的特征值以及每个历史记录包含的策略组合,构建各特征编码块,针对每个特征编码块,该特征编码块至少由特征维度、特征值范围和策略组合构成;
针对每个策略组合,从所述各特征编码块中选择出包含有该策略组合的特征编码块,作为目标特征编码块,并对所述目标特征编码块进行处理,得到在该策略组合下特征向量中至少一个特征维度所对应的特征值范围。
6.如权利要求5所述的方法,其特征在于,根据所述部分历史记录中每个历史记录对应的特征向量中各特征维度的特征值以及每个历史记录包含的策略组合,构建各特征编码块,具体包括:
针对特征向量中的每个特征维度,根据所述部分历史记录中每个历史记录对应的特征向量位于该特征维度的特征值,统计出该特征维度下的不同特征值的数量;
若该特征维度下的不同特征值的数量小于数量阈值,则根据所述部分历史记录中每个历史记录对应的特征向量中该特征维度的特征值以及每个历史记录包含的策略组合,确定出特征向量中该特征维度对应的连续值;针对所述部分历史记录中每个历史记录,基于该特征维度、该历史记录对应的特征向量中位于该特征维度下的特征值、该特征维度对应的连续值以及该历史记录包含的策略组合,构建该历史记录在该特征维度下的特征编码块,其中,该历史记录在该特征维度下的特征编码块包含的特征值范围为该历史记录对应的特征向量中位于该特征维度下的特征值。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
若该特征维度下的不同特征值的数量不小于数量阈值,则根据所述部分历史记录中每个历史记录对应的特征向量中位于该特征维度的特征值的大小,对所述部分历史记录进行排序,得到在该特征维度下的第二排序序列;
针对所述部分历史记录涉及的每个策略组合,从在该特征维度下的第二排序序列中确定出包含有该策略组合的历史记录的连续域,并将所述连续域覆盖的各历史记录作为各连续历史记录;
从所述各连续历史记录对应的特征向量中位于该特征维度的特征值中选择出最小的特征值,作为起始值,以及从所述各连续历史记录对应的特征向量中位于该特征维度的特征值中选择出最大的特征值,作为终止值;
基于该特征维度、所述起始值、所述终止值以及该策略组合,构建针对所述连续域的特征编码块,其中,所述起始值与所述终止值之间的取值区间用于表示该特征维度的特征值范围。
8.如权利要求5所述的方法,其特征在于,对所述目标特征编码块进行处理,得到在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,具体包括:
从所述目标特征编码块中选择出包含有同一特征维度的各特征编码块,作为各合并特征编码块;
对所述各合并特征编码块包含的特征值范围进行合并,得到合并后特征编码块;
从所述目标特征编码块中除所述各合并特征编码块之外的其他特征编码块中随机选择一个特征编码块,并将所述合并后特征编码块与选择的特征编码块进行拼接,得到拼接后特征编码块组;
判断所述拼接后特征编码块组所覆盖的历史记录是否均包含有该策略组合,若所述拼接后特征编码块组所覆盖的历史记录未均包含有该策略组合,继续从所述其他特征编码块中选择一个特征编码块,并将选择的特征编码块与所述拼接后特征编码块组进行拼接,重新确定出拼接后特征编码块组,直到重新确定的拼接后特征编码块组所覆盖的历史记录均包含有该策略组合为止;
根据最终确定出的拼接后特征编码块组中各特征编码块包含的特征值范围,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围。
9.如权利要求1所述的方法,其特征在于,将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行交叉变异处理,以生成该次调整下的新适用条件,具体包括:
从已保存的各适用条件中确定出能够完全覆盖该次调整下的所述部分历史记录的适用条件,作为目标适用条件;
将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行聚合,得到第一适用条件集合;
针对所述第一适用条件集合中任意两个适用条件,将这两个适用条件进行交叉处理,得到交叉后适用条件;
对所述交叉后适用条件进行变异处理,得到交叉后适用条件;
将所述交叉后适用条件和所述交叉后适用条件确定为该次调整下的新适用条件。
10.如权利要求1所述的方法,其特征在于,根据该次调整下的新适用条件以及该次调整下每个策略组合对应的适用条件,确定出该次调整下每个策略组合对应的各适用条件,具体包括:
将该次调整下的新适用条件与该次调整下每个策略组合对应的适用条件进行聚合,得到第二适用条件集合;
针对所述第二适用条件集合中的每个适用条件,将该适用条件作为筛选条件,从所述部分历史记录中筛选出满足所述筛选条件的历史记录,作为匹配历史记录以及确定出该适用条件对应的策略组合;
根据该适用条件对应的匹配历史记录和该适用条件对应的策略组合,确定出所述散热系统在所述匹配历史记录包含的其他记录下,采用该适用条件对应的策略组合进行散热控制时所产生的散热指标,作为该适用条件对应的散热指标;其中,所述散热指标包括:散热系数、能耗系数;
根据所述第二适用条件集合中的每个适用条件对应的散热指标,从所述第二适用条件集合中选择出部分适用条件,并根据所述部分适用条件对应的策略组合,确定出该次调整下每个策略组合对应的各适用条件。
11.一种散热系统的控制装置,其特征在于,包括:
获取模块,用于获取历史上散热系统对计算集群进行散热时所采集到的各历史记录,并从各历史记录中确定出控制所述散热系统的各策略组合,针对所述各策略组合中的任意两个策略组合,这两个策略组合所包含的散热器件相同,这两个策略组合中各散热器件的状态信息不完全相同;针对每个历史记录,该历史记录包含有策略组合和其他记录,所述策略组合包含有所述散热系统中每个电机的档位信息和/或每个控制阀的控制参量,所述其他记录包含有所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的状态信息以及所述计算集群中每个芯片所使用的算力资源,所述散热系统中的各散热器件包括:电机、控制阀、传感器;
处理模块,用于对所述各历史记录进行处理,确定出每个策略组合对应的各适用条件,针对同一策略组合对应的每个适用条件,该适用条件包含有特征向量中至少一个特征维度所对应的特征值范围,所述特征向量是对所述历史记录包含的其他记录进行特征提取后所得到的,其中,对所述各历史记录中每个历史记录包含的其他记录进行特征提取,得到所述各历史记录中每个历史记录对应的特征向量;针对适用条件的每次调整,从所述各历史记录中选择部分历史记录,并确定出所述部分历史记录中每个历史记录对应的特征向量;针对每个策略组合,对所述部分历史记录中每个历史记录对应的特征向量进行处理,确定出在该策略组合下特征向量中至少一个特征维度所对应的特征值范围,作为该次调整下该策略组合对应的适用条件;将该次调整下每个策略组合对应的适用条件与已保存的目标适用条件进行交叉变异处理,以生成该次调整下的新适用条件;根据该次调整下的新适用条件以及该次调整下每个策略组合对应的适用条件,确定出该次调整下每个策略组合对应的各适用条件,并保存;继续执行下一次调整,直到已保存的所有适用条件满足预设条件为止;
构建模型模块,用于根据每个策略组合对应的各适用条件,构建模型;
控制模块,用于在接收到针对所述散热系统的散热任务请求时,采集所述散热系统中除所述策略组合包含的散热器件之外的其他散热器件的当前状态信息以及所述计算集群中每个芯片所使用的当前算力资源,并对所述其他散热器件的当前状态信息以及所述当前算力资源进行特征提取,得到当前特征向量,将所述当前特征向量输入到所述模型中,以通过所述模型输出目标策略组合,并按照所述目标策略组合,对所述散热系统进行控制。
12.如权利要求11所述的装置,其特征在于,所述处理模块,具体用于根据预设特征数量,以其他记录为叶子节点,以运算符号为父节点,构建用于特征提取的二叉树;针对所述各历史记录中每个历史记录,基于所述二叉树,对该历史记录包含的其他记录进行特征提取,得到该历史记录对应的初始特征向量,所述初始特征向量的特征维度的数量为所述预设特征数量;根据所述各历史记录中每个历史记录对应的初始特征向量以及每个历史记录包含的策略组合,确定出初始特征向量中的每个特征维度对应的连续值;其中,针对每个特征维度,该特征维度对应的连续值用于表示所述各历史记录对应的初始特征向量中位于该特征维度的特征值的最大连续程度;针对所述各历史记录中的每个历史记录,根据每个特征维度对应的连续值,从该历史记录对应的初始特征向量中按照连续值从大到小的顺序依次选择出预设数量的特征维度,并基于选择出的特征维度下的特征值,确定出该历史记录对应的特征向量。
13.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-10任一项所述的方法。
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1-10任一项所述的方法。
CN202310509059.2A 2023-05-08 2023-05-08 一种散热系统的控制方法、装置、存储介质及电子设备 Active CN116225192B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310509059.2A CN116225192B (zh) 2023-05-08 2023-05-08 一种散热系统的控制方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310509059.2A CN116225192B (zh) 2023-05-08 2023-05-08 一种散热系统的控制方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN116225192A CN116225192A (zh) 2023-06-06
CN116225192B true CN116225192B (zh) 2023-08-01

Family

ID=86580921

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310509059.2A Active CN116225192B (zh) 2023-05-08 2023-05-08 一种散热系统的控制方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN116225192B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116661574B (zh) * 2023-07-13 2023-12-12 之江实验室 一种计算设备散热的方法、装置、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109240460A (zh) * 2018-09-04 2019-01-18 深圳市宝德计算机系统有限公司 一种服务器散热方法、装置、设备及计算机存储介质
CN110674150A (zh) * 2019-09-12 2020-01-10 苏州浪潮智能科技有限公司 一种bmc设置策略更新方法和设备
CN114564093A (zh) * 2022-02-21 2022-05-31 苏州浪潮智能科技有限公司 一种设备散热方法、装置、电子设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130271905A1 (en) * 2002-10-22 2013-10-17 Jason A. Sullivan Systems and methods for providing dynamic computing systems
US20120151098A1 (en) * 2002-10-22 2012-06-14 Sullivan Jason A Systems and methods for providing a universal computing system
CN106970662A (zh) * 2016-01-14 2017-07-21 讯凯国际股份有限公司 智能控制方法与装置
CN107357649B (zh) * 2017-05-27 2020-07-03 北京奇艺世纪科技有限公司 系统资源部署策略的确定方法、装置及电子设备
CN112000205A (zh) * 2020-08-27 2020-11-27 苏州浪潮智能科技有限公司 Bmc及其散热策略适配方法、装置、服务器及存储介质
CN114576148B (zh) * 2020-11-30 2024-01-30 华为技术有限公司 液冷系统、应用在液冷系统的控制方法、控制装置及车辆
CN115126711A (zh) * 2021-03-26 2022-09-30 北京比特大陆科技有限公司 风扇转速的调控方法、装置、电子设备及存储介质
CN113359966A (zh) * 2021-07-02 2021-09-07 安徽信息工程学院 一种计算机散热方法、系统
CN115826712A (zh) * 2022-12-09 2023-03-21 苏州浪潮智能科技有限公司 服务器散热控制方法、装置及服务器
CN116027865A (zh) * 2022-12-29 2023-04-28 苏州浪潮智能科技有限公司 一种服务器散热调控方法、装置、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109240460A (zh) * 2018-09-04 2019-01-18 深圳市宝德计算机系统有限公司 一种服务器散热方法、装置、设备及计算机存储介质
CN110674150A (zh) * 2019-09-12 2020-01-10 苏州浪潮智能科技有限公司 一种bmc设置策略更新方法和设备
CN114564093A (zh) * 2022-02-21 2022-05-31 苏州浪潮智能科技有限公司 一种设备散热方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN116225192A (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN108492124A (zh) 店铺信息推荐方法、装置及客户端
CN116225192B (zh) 一种散热系统的控制方法、装置、存储介质及电子设备
CN117009093B (zh) 降低神经网络推理所需内存占用量的重计算方法和系统
CN116757278B (zh) 一种预测模型的训练方法、装置、存储介质及电子设备
CN117036829A (zh) 一种基于原型学习实现标签增强的叶片细粒度识别方法和系统
CN115543945B (zh) 一种模型压缩的方法、装置、存储介质及电子设备
CN115545572B (zh) 一种业务风控的方法、装置、设备及存储介质
CN116150563B (zh) 一种业务执行方法、装置、存储介质及电子设备
CN116304212A (zh) 一种数据处理系统、方法、设备及存储介质
CN111242195B (zh) 模型、保险风控模型训练方法、装置及电子设备
CN115392426A (zh) 一种自组织迁移的业务处理方法、装置以及设备
CN109325127A (zh) 一种风险识别方法和装置
CN116661574B (zh) 一种计算设备散热的方法、装置、存储介质及电子设备
US20210026877A1 (en) Providing approximate top-k nearest neighbours using an inverted list
CN117391150B (zh) 一种基于分层池化图哈希的图数据检索模型训练方法
CN109753351A (zh) 一种限时任务处理方法、装置、设备及介质
CN116109008B (zh) 一种业务执行的方法、装置、存储介质及电子设备
CN116306855B (zh) 一种基于存算一体系统的数据处理方法及装置
Chandra et al. Novel design strategy of multiplier-less low-pass finite impulse response filter using self-organizing random immigrants genetic algorithm
CN116363418A (zh) 一种训练分类模型的方法、装置、存储介质及电子设备
CN116881724B (zh) 一种样本标注方法、装置及设备
CN116187397A (zh) 一种模型的处理方法、装置及设备
CN117635151A (zh) 风险控制策略确定方法、装置、设备及存储介质
CN117973869A (zh) 一种业务风控方法、装置、电子设备及存储介质
CN117391166A (zh) 一种基于冗余消除的超图神经网络更新方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant