CN114860462A - 双路机架式服务器的计算资源智能分配系统及其分配方法 - Google Patents

双路机架式服务器的计算资源智能分配系统及其分配方法 Download PDF

Info

Publication number
CN114860462A
CN114860462A CN202210810557.6A CN202210810557A CN114860462A CN 114860462 A CN114860462 A CN 114860462A CN 202210810557 A CN202210810557 A CN 202210810557A CN 114860462 A CN114860462 A CN 114860462A
Authority
CN
China
Prior art keywords
computing resource
vector
server
feature
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210810557.6A
Other languages
English (en)
Other versions
CN114860462B (zh
Inventor
武旻
刘琦
张一鸣
施铮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Pudao Electronic Technology Co ltd
Original Assignee
Nanjing Pudao Electronic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Pudao Electronic Technology Co ltd filed Critical Nanjing Pudao Electronic Technology Co ltd
Priority to CN202210810557.6A priority Critical patent/CN114860462B/zh
Publication of CN114860462A publication Critical patent/CN114860462A/zh
Application granted granted Critical
Publication of CN114860462B publication Critical patent/CN114860462B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明申请涉及服务器资源智能分配的领域,其具体地公开了一种双路机架式服务器的计算资源智能分配系统及其分配方法,其通过深度神经网络模型分别对于时间维度上的客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量进行隐含的关联特征挖掘,以综合这三者的特征信息融合来进行所述服务器的计算资源分配比例的合理性判断,通过这样的方式,以所述客户端的所需计算资源量的全局和服务器自身的剩余计算资源情况来智能地调整计算资源分配方案,以提高服务器计算资源的分配合理性和利用效率。

Description

双路机架式服务器的计算资源智能分配系统及其分配方法
技术领域
本发明涉及服务器资源智能分配的领域,且更为具体地,涉及一种双路机架式服务器的计算资源智能分配系统及其分配方法。
背景技术
服务器是计算机的一种,它比普通计算机运行更快、负载更高、价格更贵,服务器在网络中为其它客户机(如PC机、智能手机、ATM等终端甚至是火车系统等大型设备)提供计算或者应用服务。目前市场上较流行的服务器架构形态主要就是塔式、机架式和刀片式三种。机架服务器以及变形的机架服务器甚至塔式服务器将继续作为服务器市场的主流。
但是,目前服务器计算资源池化和调度不够完善,造成数据的挤压与丢失,并且不适合调度,影响了数据的稳定与后期的保存,间接的造成了资源的损失。
在现有的服务器的计算资源的方案分配中,其通常基于客户端的计算需求来分配计算资源,通常采用先到者优先分配资源的模式,但这种分配模式会导致其他客户端在共同服务器时,无法得到足够的计算资源,且服务器自身也需要维持正常运行,例如数据传输,数据储存,数据协同等,也就是,在服务器分配计算资源时,除了考虑所有客户端作为整体对于计算资源的需求外,还需要考虑服务器自身的剩余计算资源情况。
因此,期待一种优化的用于服务器的计算资源智能分配方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种双路机架式服务器的计算资源智能分配系统及其分配方法,其通过深度神经网络模型分别对于时间维度上的客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量进行隐含的关联特征挖掘,以综合这三者的特征信息融合来进行所述服务器的计算资源分配比例的合理性判断,通过这样的方式,以所述客户端的所需计算资源量的全局和服务器自身的剩余计算资源情况来智能地调整计算资源分配方案,以提高服务器计算资源的分配合理性和利用效率。
根据本申请的一个方面,提供了一种双路机架式服务器的计算资源智能分配系统,其包括:
客户端计算请求采集模块,用于获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量;
计算请求数据编码模块,用于将各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量输入上下文编码器以得到对应于各个所述预定时间点的全局需求特征向量;
全局均值处理模块,用于计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值;
计算请求时序编码模块,用于将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量;
剩余计算资源量采集模块,用于获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量;
剩余计算资源量编码模块,用于将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量通过包含一维卷积层的第二时序编码器以得到剩余计算资源特征向量;
分配数据采集模块,用于获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量;
分配数据编码模块,用于将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量通过包含一维卷积层的第三时序编码器以得到当前计算资源分配特征向量;
贝叶斯融合模块,用于使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量;以及
分配方案生成模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。
根据本申请的另一方面,一种双路机架式服务器的计算资源智能分配系统的分配方法,其包括:
获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量;
将各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量输入上下文编码器以得到对应于各个所述预定时间点的全局需求特征向量;
计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值;
将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量;
获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量;
将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量通过包含一维卷积层的第二时序编码器以得到剩余计算资源特征向量;
获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量;
将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量通过包含一维卷积层的第三时序编码器以得到当前计算资源分配特征向量;
使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量;以及
将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。
与现有技术相比,本申请提供的双路机架式服务器的计算资源智能分配系统及其分配方法,其通过深度神经网络模型分别对于时间维度上的客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量进行隐含的关联特征挖掘,以综合这三者的特征信息融合来进行所述服务器的计算资源分配比例的合理性判断,并且在特征的融合过程中,通过对特征值及其所属的类条件进行信息规则的结构理解,来避免了特征值集合由于集合的分布外特征值而导致在分类目标域内的决策区域的过度碎片化,进而就实现了各个特征分布到概率化的分类目标的约束,以提高了分类的准确性。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的双路机架式服务器的计算资源智能分配系统的框图。
图2为根据本申请实施例的双路机架式服务器的计算资源智能分配系统中贝叶斯融合模块的框图。
图3为根据本申请实施例的双路机架式服务器的计算资源智能分配系统的分配方法的流程图。
图4为根据本申请实施例的双路机架式服务器的计算资源智能分配系统的分配方法的架构示意图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
如前所述,服务器是计算机的一种,它比普通计算机运行更快、负载更高、价格更贵,服务器在网络中为其它客户机(如PC机、智能手机、ATM等终端甚至是火车系统等大型设备)提供计算或者应用服务。目前市场上较流行的服务器架构形态主要就是塔式、机架式和刀片式三种。机架服务器以及变形的机架服务器甚至塔式服务器将继续作为服务器市场的主流。
但是,目前服务器计算资源池化和调度不够完善,造成数据的挤压与丢失,并且不适合调度,影响了数据的稳定与后期的保存,间接的造成了资源的损失。因此,期待一种优化的用于服务器的计算资源智能分配方案。
相应地,在现有的服务器的计算资源的方案分配中,其通常基于客户端的计算需求来分配计算资源,通常采用先到者优先分配资源的模式,但这种分配模式会导致其他客户端在共同服务器时,无法得到足够的计算资源,且服务器自身也需要维持正常运行,例如数据传输,数据储存,数据协同等,也就是,在服务器分配计算资源时,除了考虑所有客户端作为整体对于计算资源的需求外,还需要考虑服务器自身的剩余计算资源情况。
基于此,本申请发明人考虑从客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量出发,利用深度神经网络模型来进行关联特征的挖掘,再通过分类器进行分类,以获得服务器的计算资源分配比例的合理性。这样,能够在保证所述服务器的计算资源分配合理的情况下避免了资源的损失。
具体地,在本申请的技术方案中,首先,获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量。应可以理解,考虑到所述多个预定时间点的多个客户端的计算资源请求中的所需计算资源量之间存在着关联性,因此,使用上下文编码器,例如基于转换器的Bert模型来对各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量进行编码,以提取出所述各个所需计算资源量之间的基于全局的高维语义特征以更适于表征所述客户端的计算资源需求特征,从而获得多个客户端特征向量。这样,再将所述多个客户端特征向量进行级联,以得到在时间维度上的所述对应于各个所述预定时间点的全局需求特征向量。
进一步地,就可以计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值,以得到具有全局性样本维度关联特征信息的对应于各个所述预定时间点的全局计算需求特征值。然后,考虑到各个所述预定时间点的全局计算需求特征值在时间维度上具有动态性的变化特征,因此,为了提取出这种在时间上的变化特征,进一步将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量,以整合在时间维度上的各个样本的特征信息后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量。在一个示例中,所述时序编码器由交替设置的全连接层和一维卷积层组成,其通过一维卷积编码提取出所述各个全局计算需求特征值在时序维度上的关联和通过全连接编码提取所述各个全局计算需求特征值的高维隐含特征。
应可以理解,在本申请的技术方案中,为了基于客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量三者来对计算资源分配的合理性进行判断,就需要将这三者的关联特征信息进行深层次的特征挖掘,而对于所述服务器的剩余计算资源量以及所述客户端分配的计算资源量,首先,获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量以及所述服务器在所述当前时间点向所述多个客户端分配的计算资源量。然后,考虑到不管是时序维度上的服务器的剩余计算资源量,还是所述服务器在所述当前时间点向所述多个客户端分配的计算资源量,其在时间上都具有着动态性的关联隐含特征信息,因此,采用时序编码器来分别对这两者在时序上的隐含动态关联特征进行提取,从而获得剩余计算资源特征向量以及当前计算资源分配特征向量。
进一步地,考虑到使用所述当前计算资源分配特征向量作为先验概率,在本申请的技术方案的目的是在新的证据,即在有新的所述多个客户端的计算资源请求时,更新先验概率得到后验概率。那么根据贝叶斯公式,后验概率为先验概率乘以事件概率除以证据概率,因此,在本申请的技术方案中,使用贝叶斯概率模型融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量,其中所述当前计算资源分配特征向量作为先验,所述剩余计算资源特征向量作为事件,且所述计算资源需求特征向量作为证据。这样,就可以将所述分类特征向量通过分类器以获得用于表示服务器在当前时间点的计算资源分配比例是否需要调整的分类结果。
但是,考虑到在使用贝叶斯概率模型之前,需要首先将所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量映射到概率空间,而在进行最大值归一化等线性映射时,无法实现对特征向量所表达的特征分布到概率化的分类目标的约束,从而会影响利用贝叶斯概率模型计算得到的后验概率向量的分类效果。
因此,在使用贝叶斯概率模型之前,首先对所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量进行类条件边界约束,具体为:
Figure 858042DEST_PATH_IMAGE001
Figure 182844DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE003
分别是所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量的每个位置的特征值。
由此,通过对特征值及其所属的类条件进行信息规则的结构理解,来避免了特征值集合由于集合的分布外特征值而导致在分类目标域内的决策区域的过度碎片化,使得特征向量的特征值集合所表达的特征分布具有稳健的条件化的类边界,这样,就实现了各个特征分布到概率化的分类目标的约束,提高了贝叶斯概率模型所获得的分类特征向量的分类效果,进而,也提高了对于所述服务器在当前时间点的计算资源分配比例的合理性判断的准确性。
基于此,本申请提出了一种双路机架式服务器的计算资源智能分配系统,其包括:客户端计算请求采集模块,用于获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量;计算请求数据编码模块,用于将各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量输入上下文编码器以得到对应于各个所述预定时间点的全局需求特征向量;全局均值处理模块,用于计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值;计算请求时序编码模块,用于将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量;剩余计算资源量采集模块,用于获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量;剩余计算资源量编码模块,用于将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量通过包含一维卷积层的第二时序编码器以得到剩余计算资源特征向量;分配数据采集模块,用于获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量;分配数据编码模块,用于将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量通过包含一维卷积层的第三时序编码器以得到当前计算资源分配特征向量;贝叶斯融合模块,用于使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量;以及,分配方案生成模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1图示了根据本申请实施例的双路机架式服务器的计算资源智能分配系统的框图。如图1所示,根据本申请实施例的双路机架式服务器的计算资源智能分配系统200,包括:客户端计算请求采集模块210,用于获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量;计算请求数据编码模块220,用于将各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量输入上下文编码器以得到对应于各个所述预定时间点的全局需求特征向量;全局均值处理模块230,用于计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值;计算请求时序编码模块240,用于将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量;剩余计算资源量采集模块250,用于获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量;剩余计算资源量编码模块260,用于将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量通过包含一维卷积层的第二时序编码器以得到剩余计算资源特征向量;分配数据采集模块270,用于获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量;分配数据编码模块280,用于将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量通过包含一维卷积层的第三时序编码器以得到当前计算资源分配特征向量;贝叶斯融合模块290,用于使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量;以及,分配方案生成模块300,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。
具体地,在本申请实施例中,所述客户端计算请求采集模块210和所述计算请求数据编码模块220,用于获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量,并将各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量输入上下文编码器以得到对应于各个所述预定时间点的全局需求特征向量。如前所述,由于在现有的服务器的计算资源的方案分配中,其通常基于客户端的计算需求来分配计算资源,通常采用先到者优先分配资源的模式,但这种分配模式会导致其他客户端在共同服务器时,无法得到足够的计算资源,且服务器自身也需要维持正常运行,例如数据传输,数据储存,数据协同等,也就是,在所述服务器分配计算资源时,除了考虑所有所述客户端作为整体对于计算资源的需求外,还需要考虑所述服务器自身的剩余计算资源情况。因此,在本申请的技术方案中,从客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量出发,利用深度神经网络模型来进行关联特征的挖掘,再通过分类器进行分类,以获得服务器的计算资源分配比例的合理性。这样,能够在保证所述服务器的计算资源分配合理的情况下避免了资源的损失。
也就是,具体地,在本申请的技术方案中,首先,获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量。应可以理解,考虑到所述多个预定时间点的多个客户端的计算资源请求中的所需计算资源量之间存在着关联性,因此,在本申请的技术方案中,使用上下文编码器,例如基于转换器的Bert模型来对各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量进行编码,以提取出所述各个所需计算资源量之间的基于全局的高维语义特征以更适于表征所述客户端的计算资源需求特征,从而获得多个客户端特征向量。这样,再将所述多个客户端特征向量进行级联,以得到在时间维度上的所述对应于各个所述预定时间点的全局需求特征向量。
更具体地,在本申请实施例中,所述计算请求数据编码模块,包括:上下文编码单元,用于使用所述上下文编码器的基于转换器的Bert模型对各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量进行基于全局的上下文语义编码以得到多个客户端特征向量;以及,级联单元,用于所述多个客户端特征向量进行级联以得到所述对应于各个所述预定时间点的全局需求特征向量。
具体地,在本申请实施例中,所述全局均值处理模块230和所述计算请求时序编码模块240,用于计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值,并将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量。也就是,在本申请的技术方案中,进一步地,就可以计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值,以得到具有全局性样本维度关联特征信息的对应于各个所述预定时间点的全局计算需求特征值。然后,考虑到各个所述预定时间点的全局计算需求特征值在时间维度上具有动态性的变化特征,因此,为了提取出这种在时间上的变化特征,进一步将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量,以整合在时间维度上的各个样本的特征信息后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量。相应地,在一个具体示例中,所述时序编码器由交替设置的全连接层和一维卷积层组成,其通过一维卷积编码提取出所述各个全局计算需求特征值在时序维度上的关联和通过全连接编码提取所述各个全局计算需求特征值的高维隐含特征。
更具体地,在本申请实施例中,所述计算请求时序编码模块,包括:第一排列单元,用于将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量;第一全连接编码单元,用于使用所述第一时序编码器的全连接层以如下公式对所述输入向量进行全连接编码以提取出所述输入向量中各个位置的特征值的高维隐含特征,其中,所述公式为:
Figure 552645DEST_PATH_IMAGE004
,其中
Figure 380924DEST_PATH_IMAGE006
是所述输入向量,
Figure DEST_PATH_IMAGE007
是输出向量,
Figure 177979DEST_PATH_IMAGE008
是权重矩阵,
Figure DEST_PATH_IMAGE009
是偏置向量,
Figure 724498DEST_PATH_IMAGE010
表示矩阵乘;第一一维卷积编码单元,用于使用所述第一时序编码器的一维卷积层以如下公式对所述输入向量进行一维卷积编码以提取出所述输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述公式为:
Figure DEST_PATH_IMAGE011
其中,a为卷积核在x方向上的宽度、F为卷积核参数向量、G为与卷积核函数运算的局部向量矩阵,w为卷积核的尺寸。
具体地,在本申请实施例中,所述剩余计算资源量采集模块250和所述剩余计算资源量编码模块260,用于获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量,并将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量通过包含一维卷积层的第二时序编码器以得到剩余计算资源特征向量。应可以理解,在本申请的技术方案中,为了基于客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量三者来对计算资源分配的合理性进行判断,就需要将这三者的关联特征信息进行深层次的特征挖掘,而对于所述服务器的剩余计算资源量,首先,获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量。然后,考虑到在时序维度上的服务器的剩余计算资源量,其在时间上都具有着动态性的关联隐含特征信息,因此,在本申请的技术方案汇总,采用时序编码器来对其在时序上的隐含动态关联特征进行提取,从而获得剩余计算资源特征向量。
更具体地,在本申请实施例中,所述剩余计算资源量编码模块,包括:第二排列单元,用于将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量按照时间维度排列为剩余输入向量;第二全连接编码单元,用于使用所述第二时序编码器的全连接层以如下公式对所述剩余输入向量进行全连接编码以提取出所述剩余输入向量中各个位置的特征值的高维隐含特征,其中,所述公式为:
Figure 507777DEST_PATH_IMAGE012
,其中
Figure 518459DEST_PATH_IMAGE014
是所述输入向量,
Figure 486415DEST_PATH_IMAGE007
是输出向量,
Figure 848126DEST_PATH_IMAGE008
是权重矩阵,
Figure 559730DEST_PATH_IMAGE009
是偏置向量,
Figure 424918DEST_PATH_IMAGE010
表示矩阵乘;第二一维卷积编码单元,用于使用所述第二时序编码器的一维卷积层以如下公式对所述剩余输入向量进行一维卷积编码以提取出所述剩余输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述公式为:
Figure DEST_PATH_IMAGE015
其中,a为卷积核在x方向上的宽度、F为卷积核参数向量、G为与卷积核函数运算的局部向量矩阵,w为卷积核的尺寸。
具体地,在本申请实施例中,所述分配数据采集模块270和所述分配数据编码模块280,用于获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量,并将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量通过包含一维卷积层的第三时序编码器以得到当前计算资源分配特征向量。应可以理解,在本申请的技术方案中,为了基于客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量三者来对计算资源分配的合理性进行判断,就需要将这三者的关联特征信息进行深层次的特征挖掘,而对于所述客户端分配的计算资源量,首先,获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量。然后,考虑到在时序维度上的所述服务器在所述当前时间点向所述多个客户端分配的计算资源量,其在时间上都具有着动态性的关联隐含特征信息,因此,在本申请的技术方案中,采用时序编码器来对其在时序上的隐含动态关联特征进行提取,从而获得当前计算资源分配特征向量。
更具体地,在本申请实施例中,所述分配数据编码模块,包括:第三排列单元,用于将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量按照时间维度排列为分配输入向量;第三全连接编码单元,用于使用所述第三时序编码器的全连接层以如下公式对所述分配输入向量进行全连接编码以提取出所述分配输入向量中各个位置的特征值的高维隐含特征,其中,所述公式为:
Figure 501458DEST_PATH_IMAGE016
,其中
Figure 22569DEST_PATH_IMAGE006
是所述输入向量,
Figure 272285DEST_PATH_IMAGE007
是输出向量,
Figure 257559DEST_PATH_IMAGE008
是权重矩阵,
Figure 505000DEST_PATH_IMAGE009
是偏置向量,
Figure 575724DEST_PATH_IMAGE010
表示矩阵乘;第三一维卷积编码单元,用于使用所述第三时序编码器的一维卷积层以如下公式对所述分配输入向量进行一维卷积编码以提取出所述分配输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述公式为:
Figure DEST_PATH_IMAGE017
其中,a为卷积核在x方向上的宽度、F为卷积核参数向量、G为与卷积核函数运算的局部向量矩阵,w为卷积核的尺寸。
具体地,在本申请实施例中,所述贝叶斯融合模块290,用于使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量。应可以理解,进一步地,考虑到使用所述当前计算资源分配特征向量作为先验概率,在本申请的技术方案的目的是在新的证据,即在有新的所述多个客户端的计算资源请求时,更新先验概率得到后验概率。那么根据贝叶斯公式,后验概率为先验概率乘以事件概率除以证据概率,因此,在本申请的技术方案中,使用贝叶斯概率模型融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量,其中所述当前计算资源分配特征向量作为先验,所述剩余计算资源特征向量作为事件,且所述计算资源需求特征向量作为证据。这样,就可以将所述分类特征向量通过分类器以获得用于表示服务器在当前时间点的计算资源分配比例是否需要调整的分类结果。
更具体地,在本申请的实施例中,所述贝叶斯融合模块,包括:首先,分别对所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量进行基于类条件边界约束以得到校正后计算资源需求特征向量、校正后当前计算资源分配特征向量和校正后剩余计算资源特征向量。应可以理解,考虑到在使用贝叶斯概率模型之前,需要首先将所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量映射到概率空间,而在进行最大值归一化等线性映射时,无法实现对特征向量所表达的特征分布到概率化的分类目标的约束,从而会影响利用贝叶斯概率模型计算得到的后验概率向量的分类效果。因此,在使用所述贝叶斯概率模型之前,首先对所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量进行类条件边界约束,具体为:
Figure 566814DEST_PATH_IMAGE018
其中
Figure DEST_PATH_IMAGE019
Figure 406594DEST_PATH_IMAGE020
分别是所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量的每个位置的特征值。
然后,以所述校正后当前计算资源分配特征向量作为先验概率向量、所述校正后剩余计算资源特征向量作为事件概率向量和所述计算资源需求特征向量作为证据概率向量,计算所述校正后当前计算资源分配特征向量与所述校正后剩余计算资源特征向量的按位置点乘再除以所述计算资源需求特征向量以得到所述分类特征向量。相应地,在一个具体示例中,以如下公式来计算所述校正后当前计算资源分配特征向量与所述校正后剩余计算资源特征向量的按位置点乘再除以所述计算资源需求特征向量以得到所述分类特征向量,其中,所述公式为:
Figure DEST_PATH_IMAGE021
其中
Figure 824937DEST_PATH_IMAGE022
是所述校正后当前计算资源分配特征向量中的每个位置的值,
Figure DEST_PATH_IMAGE023
Figure 55061DEST_PATH_IMAGE024
分别是所述校正后剩余计算资源特征向量和所述计算资源需求特征向量中的每个位置的值,而
Figure DEST_PATH_IMAGE025
是所述分类特征向量中的每个位置的值。
应可以理解,通过对特征值及其所属的类条件进行信息规则的结构理解,来避免了特征值集合由于集合的分布外特征值而导致在分类目标域内的决策区域的过度碎片化,使得所述特征向量的特征值集合所表达的特征分布具有稳健的条件化的类边界,这样,就实现了各个特征分布到概率化的分类目标的约束,提高了所述贝叶斯概率模型所获得的分类特征向量的分类效果,进而,也提高了对于所述所述服务器在当前时间点的计算资源分配比例的合理性判断的准确性。
图2图示了根据本申请实施例的用于六氟丁二烯制备的智能化冷却液循环控制系统中贝叶斯融合模块的框图。如图2所示,所述贝叶斯融合模块290,包括:特征分布校正单元291,用于分别对所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量进行基于类条件边界约束以得到校正后计算资源需求特征向量、校正后当前计算资源分配特征向量和校正后剩余计算资源特征向量;以及,贝叶斯计算单元292,用于以所述校正后当前计算资源分配特征向量作为先验概率向量、所述校正后剩余计算资源特征向量作为事件概率向量和所述计算资源需求特征向量作为证据概率向量,计算所述校正后当前计算资源分配特征向量与所述校正后剩余计算资源特征向量的按位置点乘再除以所述计算资源需求特征向量以得到所述分类特征向量。
具体地,在本申请实施例中,所述分配方案生成模块300,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。在一个具体示例中,所述分配方案生成模块,进一步用于:使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果,其中,所述公式为:
Figure 849842DEST_PATH_IMAGE026
,其中,
Figure DEST_PATH_IMAGE027
Figure 544129DEST_PATH_IMAGE028
为权重矩阵,
Figure DEST_PATH_IMAGE029
Figure 133373DEST_PATH_IMAGE030
为偏置向量,
Figure DEST_PATH_IMAGE031
为所述分类特征向量。
综上,基于本申请实施例的所述双路机架式服务器的计算资源智能分配系统200被阐明,其通过深度神经网络模型分别对于时间维度上的客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量进行隐含的关联特征挖掘,以综合这三者的特征信息融合来进行所述服务器的计算资源分配比例的合理性判断,并且在特征的融合过程中,通过对特征值及其所属的类条件进行信息规则的结构理解,来避免了特征值集合由于集合的分布外特征值而导致在分类目标域内的决策区域的过度碎片化,进而就实现了各个特征分布到概率化的分类目标的约束,以提高了分类的准确性。
如上所述,根据本申请实施例的双路机架式服务器的计算资源智能分配系统200可以实现在各种终端设备中,例如双路机架式服务器的计算资源智能分配算法的服务器等。在一个示例中,根据本申请实施例的双路机架式服务器的计算资源智能分配系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该双路机架式服务器的计算资源智能分配系统200可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该双路机架式服务器的计算资源智能分配系统200同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该双路机架式服务器的计算资源智能分配系统200与该终端设备也可以是分立的设备,并且该双路机架式服务器的计算资源智能分配系统200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性方法
图3图示了双路机架式服务器的计算资源智能分配系统的分配方法的流程图。如图3所示,根据本申请实施例的双路机架式服务器的计算资源智能分配系统的分配方法,包括步骤:S110,获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量;S120,将各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量输入上下文编码器以得到对应于各个所述预定时间点的全局需求特征向量;S130,计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值;S140,将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量;S150,获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量;S160,将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量通过包含一维卷积层的第二时序编码器以得到剩余计算资源特征向量;S170,获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量;S180,将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量通过包含一维卷积层的第三时序编码器以得到当前计算资源分配特征向量;S190,使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量;以及,S200,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。
图4图示了根据本申请实施例的双路机架式服务器的计算资源智能分配系统的分配方法的架构示意图。如图4所示,在所述双路机架式服务器的计算资源智能分配系统的分配方法的网络架构中,首先,将获得的各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量(例如,如图4中所示意的P1)输入上下文编码器(例如,如图4中所示意的E)以得到对应于各个所述预定时间点的全局需求特征向量(例如,如图4中所示意的VF);接着,计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值(例如,如图4中所示意的CV);然后,将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量(例如,如图4中所示意的V)后通过包含一维卷积层的第一时序编码器(例如,如图4中所示意的E1)以得到计算资源需求特征向量(例如,如图4中所示意的VF1);接着,将获得的所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量(例如,如图4中所示意的P2)通过包含一维卷积层的第二时序编码器(例如,如图4中所示意的E2)以得到剩余计算资源特征向量(例如,如图4中所示意的VF2);然后,将获得的所述服务器在所述当前时间点向所述多个客户端分配的计算资源量(例如,如图4中所示意的P3)通过包含一维卷积层的第三时序编码器(例如,如图4中所示意的E3)以得到当前计算资源分配特征向量(例如,如图4中所示意的VF3);接着,使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量(例如,如图4中所示意的VC);以及,最后,将所述分类特征向量通过分类器(例如,如图4中所示意的圈S)以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。
更具体地,在步骤S110和S120中,获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量,并将各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量输入上下文编码器以得到对应于各个所述预定时间点的全局需求特征向量。应可以理解,由于在现有的服务器的计算资源的方案分配中,其通常基于客户端的计算需求来分配计算资源,通常采用先到者优先分配资源的模式,但这种分配模式会导致其他客户端在共同服务器时,无法得到足够的计算资源,且服务器自身也需要维持正常运行,例如数据传输,数据储存,数据协同等,也就是,在所述服务器分配计算资源时,除了考虑所有所述客户端作为整体对于计算资源的需求外,还需要考虑所述服务器自身的剩余计算资源情况。因此,在本申请的技术方案中,从客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量出发,利用深度神经网络模型来进行关联特征的挖掘,再通过分类器进行分类,以获得服务器的计算资源分配比例的合理性。这样,能够在保证所述服务器的计算资源分配合理的情况下避免了资源的损失。
也就是,具体地,在本申请的技术方案中,首先,获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量。应可以理解,考虑到所述多个预定时间点的多个客户端的计算资源请求中的所需计算资源量之间存在着关联性,因此,在本申请的技术方案中,使用上下文编码器,例如基于转换器的Bert模型来对各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量进行编码,以提取出所述各个所需计算资源量之间的基于全局的高维语义特征以更适于表征所述客户端的计算资源需求特征,从而获得多个客户端特征向量。这样,再将所述多个客户端特征向量进行级联,以得到在时间维度上的所述对应于各个所述预定时间点的全局需求特征向量。
更具体地,在步骤S130和S140中,计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值,并将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量。也就是,在本申请的技术方案中,进一步地,就可以计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值,以得到具有全局性样本维度关联特征信息的对应于各个所述预定时间点的全局计算需求特征值。然后,考虑到各个所述预定时间点的全局计算需求特征值在时间维度上具有动态性的变化特征,因此,为了提取出这种在时间上的变化特征,进一步将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量,以整合在时间维度上的各个样本的特征信息后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量。相应地,在一个具体示例中,所述时序编码器由交替设置的全连接层和一维卷积层组成,其通过一维卷积编码提取出所述各个全局计算需求特征值在时序维度上的关联和通过全连接编码提取所述各个全局计算需求特征值的高维隐含特征。
更具体地,在步骤S150和步骤S160中,获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量,并将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量通过包含一维卷积层的第二时序编码器以得到剩余计算资源特征向量。应可以理解,在本申请的技术方案中,为了基于客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量三者来对计算资源分配的合理性进行判断,就需要将这三者的关联特征信息进行深层次的特征挖掘,而对于所述服务器的剩余计算资源量,首先,获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量。然后,考虑到在时序维度上的服务器的剩余计算资源量,其在时间上都具有着动态性的关联隐含特征信息,因此,在本申请的技术方案汇总,采用时序编码器来对其在时序上的隐含动态关联特征进行提取,从而获得剩余计算资源特征向量。
更具体地,在步骤S170和步骤S180中,获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量,并将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量通过包含一维卷积层的第三时序编码器以得到当前计算资源分配特征向量。应可以理解,在本申请的技术方案中,为了基于客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量三者来对计算资源分配的合理性进行判断,就需要将这三者的关联特征信息进行深层次的特征挖掘,而对于所述客户端分配的计算资源量,首先,获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量。然后,考虑到在时序维度上的所述服务器在所述当前时间点向所述多个客户端分配的计算资源量,其在时间上都具有着动态性的关联隐含特征信息,因此,在本申请的技术方案中,采用时序编码器来对其在时序上的隐含动态关联特征进行提取,从而获得当前计算资源分配特征向量。
更具体地,在步骤S190中,使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量。应可以理解,进一步地,考虑到使用所述当前计算资源分配特征向量作为先验概率,在本申请的技术方案的目的是在新的证据,即在有新的所述多个客户端的计算资源请求时,更新先验概率得到后验概率。那么根据贝叶斯公式,后验概率为先验概率乘以事件概率除以证据概率,因此,在本申请的技术方案中,使用贝叶斯概率模型融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量,其中所述当前计算资源分配特征向量作为先验,所述剩余计算资源特征向量作为事件,且所述计算资源需求特征向量作为证据。这样,就可以将所述分类特征向量通过分类器以获得用于表示服务器在当前时间点的计算资源分配比例是否需要调整的分类结果。应可以理解,通过对特征值及其所属的类条件进行信息规则的结构理解,来避免了特征值集合由于集合的分布外特征值而导致在分类目标域内的决策区域的过度碎片化,使得所述特征向量的特征值集合所表达的特征分布具有稳健的条件化的类边界,这样,就实现了各个特征分布到概率化的分类目标的约束,提高了所述贝叶斯概率模型所获得的分类特征向量的分类效果,进而,也提高了对于所述所述服务器在当前时间点的计算资源分配比例的合理性判断的准确性。
更具体地,在步骤S200中,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。
综上,基于本申请实施例的所述双路机架式服务器的计算资源智能分配系统的分配方法被阐明,其通过深度神经网络模型分别对于时间维度上的客户端的所需计算资源量、服务器的剩余计算资源量以及客户端分配的计算资源量进行隐含的关联特征挖掘,以综合这三者的特征信息融合来进行所述服务器的计算资源分配比例的合理性判断,并且在特征的融合过程中,通过对特征值及其所属的类条件进行信息规则的结构理解,来避免了特征值集合由于集合的分布外特征值而导致在分类目标域内的决策区域的过度碎片化,进而就实现了各个特征分布到概率化的分类目标的约束,以提高了分类的准确性。

Claims (10)

1.一种双路机架式服务器的计算资源智能分配系统,其特征在于,包括:
客户端计算请求采集模块,用于获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量;
计算请求数据编码模块,用于将各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量输入上下文编码器以得到对应于各个所述预定时间点的全局需求特征向量;
全局均值处理模块,用于计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值;
计算请求时序编码模块,用于将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量;
剩余计算资源量采集模块,用于获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量;
剩余计算资源量编码模块,用于将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量通过包含一维卷积层的第二时序编码器以得到剩余计算资源特征向量;
分配数据采集模块,用于获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量;
分配数据编码模块,用于将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量通过包含一维卷积层的第三时序编码器以得到当前计算资源分配特征向量;
贝叶斯融合模块,用于使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量;以及
分配方案生成模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。
2.根据权利要求1所述的双路机架式服务器的计算资源智能分配系统,其中,所述计算请求数据编码模块,包括:
上下文编码单元,用于使用所述上下文编码器的基于转换器的Bert模型对各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量进行基于全局的上下文语义编码以得到多个客户端特征向量;以及
级联单元,用于所述多个客户端特征向量进行级联以得到所述对应于各个所述预定时间点的全局需求特征向量。
3.根据权利要求2所述的双路机架式服务器的计算资源智能分配系统,其中,所述计算请求时序编码模块,包括:
第一排列单元,用于将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量;
第一全连接编码单元,用于使用所述第一时序编码器的全连接层以如下公式对所述输入向量进行全连接编码以提取出所述输入向量中各个位置的特征值的高维隐含特征,其中,所述公式为:
Figure 855676DEST_PATH_IMAGE001
,其中
Figure 188568DEST_PATH_IMAGE002
是所述输入向量,
Figure 737361DEST_PATH_IMAGE003
是输出向量,
Figure 825403DEST_PATH_IMAGE004
是权重矩阵,
Figure 30119DEST_PATH_IMAGE005
是偏置向量,
Figure 229020DEST_PATH_IMAGE006
表示矩阵乘;
第一一维卷积编码单元,用于使用所述第一时序编码器的一维卷积层以如下公式对所述输入向量进行一维卷积编码以提取出所述输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述公式为:
Figure 632319DEST_PATH_IMAGE007
其中,a为卷积核在x方向上的宽度、F为卷积核参数向量、G为与卷积核函数运算的局部向量矩阵,w为卷积核的尺寸。
4.根据权利要求3所述的双路机架式服务器的计算资源智能分配系统,其中,所述剩余计算资源量编码模块,包括:
第二排列单元,用于将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量按照时间维度排列为剩余输入向量;
第二全连接编码单元,用于使用所述第二时序编码器的全连接层以如下公式对所述剩余输入向量进行全连接编码以提取出所述剩余输入向量中各个位置的特征值的高维隐含特征,其中,所述公式为:
Figure 828945DEST_PATH_IMAGE008
,其中
Figure 583275DEST_PATH_IMAGE010
是所述输入向量,
Figure 257970DEST_PATH_IMAGE011
是输出向量,
Figure 781355DEST_PATH_IMAGE012
是权重矩阵,
Figure 211199DEST_PATH_IMAGE013
是偏置向量,
Figure 124929DEST_PATH_IMAGE014
表示矩阵乘;
第二一维卷积编码单元,用于使用所述第二时序编码器的一维卷积层以如下公式对所述剩余输入向量进行一维卷积编码以提取出所述剩余输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述公式为:
Figure 665631DEST_PATH_IMAGE015
其中,a为卷积核在x方向上的宽度、F为卷积核参数向量、G为与卷积核函数运算的局部向量矩阵,w为卷积核的尺寸。
5.根据权利要求4所述的双路机架式服务器的计算资源智能分配系统,其中,所述分配数据编码模块,包括:
第三排列单元,用于将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量按照时间维度排列为分配输入向量;
第三全连接编码单元,用于使用所述第三时序编码器的全连接层以如下公式对所述分配输入向量进行全连接编码以提取出所述分配输入向量中各个位置的特征值的高维隐含特征,其中,所述公式为:
Figure 450048DEST_PATH_IMAGE016
,其中
Figure 785214DEST_PATH_IMAGE010
是所述输入向量,
Figure 514136DEST_PATH_IMAGE011
是输出向量,
Figure 327371DEST_PATH_IMAGE017
是权重矩阵,
Figure 825348DEST_PATH_IMAGE013
是偏置向量,
Figure 331416DEST_PATH_IMAGE014
示矩阵乘;
第三一维卷积编码单元,用于使用所述第三时序编码器的一维卷积层以如下公式对所述分配输入向量进行一维卷积编码以提取出所述分配输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述公式为:
Figure 485317DEST_PATH_IMAGE018
其中,a为卷积核在x方向上的宽度、F为卷积核参数向量、G为与卷积核函数运算的局部向量矩阵,w为卷积核的尺寸。
6.根据权利要求5所述的双路机架式服务器的计算资源智能分配系统,其中,所述贝叶斯融合模块,包括:
特征分布校正单元,用于分别对所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量进行基于类条件边界约束以得到校正后计算资源需求特征向量、校正后当前计算资源分配特征向量和校正后剩余计算资源特征向量;以及
贝叶斯计算单元,用于以所述校正后当前计算资源分配特征向量作为先验概率向量、所述校正后剩余计算资源特征向量作为事件概率向量和所述计算资源需求特征向量作为证据概率向量,计算所述校正后当前计算资源分配特征向量与所述校正后剩余计算资源特征向量的按位置点乘再除以所述计算资源需求特征向量以得到所述分类特征向量。
7.根据权利要求6所述的双路机架式服务器的计算资源智能分配系统,其中,所述特征分布校正单元,进一步用于:以如下公式分别对所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量进行基于类条件边界约束以得到所述校正后计算资源需求特征向量、所述校正后当前计算资源分配特征向量和所述校正后剩余计算资源特征向量;
其中,所述公式为:
Figure 367822DEST_PATH_IMAGE019
其中
Figure 657989DEST_PATH_IMAGE020
Figure 600537DEST_PATH_IMAGE021
分别是所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量的每个位置的特征值。
8.根据权利要求7所述的双路机架式服务器的计算资源智能分配系统,其中,所述贝叶斯计算单元,进一步用于:以所述校正后当前计算资源分配特征向量作为先验概率向量、所述校正后剩余计算资源特征向量作为事件概率向量和所述计算资源需求特征向量作为证据概率向量,以如下公式计算所述校正后当前计算资源分配特征向量与所述校正后剩余计算资源特征向量的按位置点乘再除以所述计算资源需求特征向量以得到所述分类特征向量;
其中,所述公式为:
Figure 38472DEST_PATH_IMAGE022
其中
Figure 396772DEST_PATH_IMAGE023
是所述校正后当前计算资源分配特征向量中的每个位置的值,
Figure 869342DEST_PATH_IMAGE024
Figure 717212DEST_PATH_IMAGE025
分别是所述校正后剩余计算资源特征向量和所述计算资源需求特征向量中的每个位置的值,而
Figure 580126DEST_PATH_IMAGE026
是所述分类特征向量中的每个位置的值。
9.根据权利要求8所述的双路机架式服务器的计算资源智能分配系统,其中,所述分配方案生成模块,进一步用于:使用所述分类器以如下公式对所述分类特征向量进行处理以获得所述分类结果,其中,所述公式为:
Figure 804434DEST_PATH_IMAGE027
,其中,
Figure 69193DEST_PATH_IMAGE028
Figure 353544DEST_PATH_IMAGE029
为权重矩阵,
Figure 766071DEST_PATH_IMAGE030
Figure 466173DEST_PATH_IMAGE031
为偏置向量,
Figure 647756DEST_PATH_IMAGE032
为所述分类特征向量。
10.一种双路机架式服务器的计算资源智能分配系统的分配方法,其特征在于,包括:
获取包含当前时间点在内的多个预定时间点的多个客户端的计算资源请求,所述计算资源请求包含所需计算资源量;
将各个所述预定时间点的多个客户端的计算资源请求中的所需计算资源量输入上下文编码器以得到对应于各个所述预定时间点的全局需求特征向量;
计算所述对应于各个所述预定时间点的全局需求特征向量的全局均值以得到对应于各个所述预定时间点的全局计算需求特征值;
将所述对应于各个所述预定时间点的全局计算需求特征值按照时间维度排列为输入向量后通过包含一维卷积层的第一时序编码器以得到计算资源需求特征向量;
获取所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量;
将所述包含当前时间点在内的多个预定时间点的服务器的剩余计算资源量通过包含一维卷积层的第二时序编码器以得到剩余计算资源特征向量;
获取所述服务器在所述当前时间点向所述多个客户端分配的计算资源量;
将所述服务器在所述当前时间点向所述多个客户端分配的计算资源量通过包含一维卷积层的第三时序编码器以得到当前计算资源分配特征向量;
使用贝叶斯概率模型来融合所述计算资源需求特征向量、所述当前计算资源分配特征向量和所述剩余计算资源特征向量以得到分类特征向量;以及
将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示服务器在当前时间点的计算资源分配比例是否需要调整。
CN202210810557.6A 2022-07-11 2022-07-11 双路机架式服务器的计算资源智能分配系统及其分配方法 Active CN114860462B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210810557.6A CN114860462B (zh) 2022-07-11 2022-07-11 双路机架式服务器的计算资源智能分配系统及其分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210810557.6A CN114860462B (zh) 2022-07-11 2022-07-11 双路机架式服务器的计算资源智能分配系统及其分配方法

Publications (2)

Publication Number Publication Date
CN114860462A true CN114860462A (zh) 2022-08-05
CN114860462B CN114860462B (zh) 2022-09-30

Family

ID=82626370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210810557.6A Active CN114860462B (zh) 2022-07-11 2022-07-11 双路机架式服务器的计算资源智能分配系统及其分配方法

Country Status (1)

Country Link
CN (1) CN114860462B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116760772A (zh) * 2023-08-21 2023-09-15 北京中科网芯科技有限公司 汇聚分流器的管控系统及其方法
CN117116498A (zh) * 2023-10-23 2023-11-24 吉林大学 移动查房数据处理系统及其方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068874A (zh) * 2015-08-12 2015-11-18 国家电网公司 一种结合Docker技术的资源按需动态分配方法
CN109376006A (zh) * 2018-09-04 2019-02-22 西安电子科技大学 一种云计算环境下基于用户需求时变特性的资源整合方法
CN110858161A (zh) * 2018-08-24 2020-03-03 阿里巴巴集团控股有限公司 资源分配方法、装置、系统、设备和介质
US11146502B2 (en) * 2019-04-11 2021-10-12 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for allocating resource
CN114677185A (zh) * 2022-05-26 2022-06-28 深圳市虎瑞科技有限公司 智慧大屏广告智能推荐系统及其推荐方法
US20220210028A1 (en) * 2019-05-15 2022-06-30 Fu Zhou University Cloud software service resource allocation method based on qos model self-correctio

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068874A (zh) * 2015-08-12 2015-11-18 国家电网公司 一种结合Docker技术的资源按需动态分配方法
CN110858161A (zh) * 2018-08-24 2020-03-03 阿里巴巴集团控股有限公司 资源分配方法、装置、系统、设备和介质
CN109376006A (zh) * 2018-09-04 2019-02-22 西安电子科技大学 一种云计算环境下基于用户需求时变特性的资源整合方法
US11146502B2 (en) * 2019-04-11 2021-10-12 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for allocating resource
US20220210028A1 (en) * 2019-05-15 2022-06-30 Fu Zhou University Cloud software service resource allocation method based on qos model self-correctio
CN114677185A (zh) * 2022-05-26 2022-06-28 深圳市虎瑞科技有限公司 智慧大屏广告智能推荐系统及其推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JAN R. J. NUNNINK 等: "A Probabilistic Approach to Resource Allocation in Distributed Fusion Systems", 《ACM》 *
孙岩炜等: "基于多选项二次联合背包的态势感知资源分配算法", 《通信学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116760772A (zh) * 2023-08-21 2023-09-15 北京中科网芯科技有限公司 汇聚分流器的管控系统及其方法
CN116760772B (zh) * 2023-08-21 2023-10-27 北京中科网芯科技有限公司 汇聚分流器的管控系统及其方法
CN117116498A (zh) * 2023-10-23 2023-11-24 吉林大学 移动查房数据处理系统及其方法

Also Published As

Publication number Publication date
CN114860462B (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
CN114860462B (zh) 双路机架式服务器的计算资源智能分配系统及其分配方法
CN115373813A (zh) 云计算环境中基于gpu虚拟化的调度方法、系统和电子设备
CN115238568A (zh) 一种数字孪生模型构建方法、装置及终端设备
CN116095089A (zh) 遥感卫星数据处理方法及系统
CN115879542A (zh) 一种面向非独立同分布异构数据的联邦学习方法
CN112488563B (zh) 一种算力参数的确定方法和装置
CN112508408A (zh) 一种边缘计算下无线资源管理指标的映射模型构建方法
CN115412401B (zh) 训练虚拟网络嵌入模型及虚拟网络嵌入的方法和装置
CN116302481A (zh) 基于稀疏知识图谱链接预测的资源分配方法及系统
CN116166444A (zh) 一种面向深度学习分层模型的协同推理方法
CN115861664A (zh) 基于局部特征融合与自注意力机制的特征匹配方法及系统
CN113052629B (zh) 基于cecu体系智能算法模型的网络用户画像方法
CN115936110A (zh) 一种缓解异构性问题的联邦学习方法
CN116070170A (zh) 一种基于深度学习的云边端数据融合处理方法及系统
CN114268625B (zh) 特征选择方法、装置、设备及存储介质
CN114462252A (zh) 基于Lz变换的多状态电网信息物理系统可靠性提高方法
CN113626646A (zh) 智能电表数据压缩方法、装置和电子设备
CN116561696B (zh) 基于多维度的用户可调节负荷快速聚合方法及其系统
CN103645889A (zh) 软件自适应的动态生成方法
CN111429045B (zh) 一种基于区域对称性的能源互联网聚类方法
CN116647874B (zh) 一种5g高性能网络服务器数据优化传输方法及系统
CN116991337B (zh) 一种远程教育系统的教育资源的云存储方法及装置
Wang et al. Multi-granularity decomposition of componentized network applications based on weighted graph clustering
CN115545107A (zh) 一种基于海量电力数据的云计算方法、系统
CN117749636A (zh) 电力业务和通信网络适配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant