CN116962419A

CN116962419A - 服务器分配策略的生成方法及装置、电子设备及存储介质

Info

Publication number: CN116962419A
Application number: CN202310956531.7A
Authority: CN
Inventors: 余剑锋; 成玉龙; 张涛
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2023-07-31
Filing date: 2023-07-31
Publication date: 2023-10-27

Abstract

本发明公开了一种服务器分配策略的生成方法及装置、电子设备及存储介质，涉及人工智能领域及其他相关技术领域，其中，该生成方法包括：接收用户端发送的用户请求，确定发送用户请求的I P地址，并基于I P地址获取请求权重；将用户请求加入至预先设定的时间窗口的任务队列中，并基于请求权重计算服务器的预估负载值；基于蒙特卡洛树模拟任务队列中各用户请求进行任务分配的过程，得到模拟结果；基于服务器的预估负载值和模拟结果生成服务器分配策略。本发明解决了相关技术，在为用户请求分配服务器时，缺乏有效的分配策略，无法将用户请求合理分配至目标集群的服务器的技术问题。

Description

服务器分配策略的生成方法及装置、电子设备及存储介质

技术领域

本发明涉及人工智能领域及其他相关技术领域，具体而言，涉及一种服务器分配策略的生成方法及装置、电子设备及存储介质。

背景技术

近年来，随着移动互联网的发展，用户的数据和请求不断增加,对于企业而言，单一的服务器已经难以适应复杂且繁重的业务环境,因此服务器集群的概念应运而生，集群通过将多台高性能服务器集合为一个整体，负责特定的单一业务。对用户而言，集群本身就是一个超大的服务器，而其中的每台服务器都可以依靠自身配置完整地处理用户请求的业务。集群的出现很大程度上缓解了依赖单一服务器时，服务器过载宕机导致业务流程终止的重大事故，实现了业务的稳定性。对于服务器集群来说，存在两个重要指标：高可用(HighAvailability)和负载均衡(Load Balance)，高可用是指服务器可以长期为用户提供稳定服务，通常利用冗余服务器和故障自动转移，即设置冗余服务器防止整体过载崩溃，同时将故障的服务器中的业务自动转移到功能正常运行的服务器上；而负载均衡是为了保证用户端发送的请求能平均分配到集群中每台服务器上，避免出现部分节点过载，而部分服务器闲置的情况，以实现资源的最优化利用，提高服务器的利用率和可用性。

实现负载均衡是提高服务器利用率和工作效率的主要途径，因此负载均衡对于服务器集群来说尤为重要。

相关技术中，负载均衡的实现方法分为静态负载均衡和动态负载均衡，静态负载均衡算法不考虑服务器本身状态，常见的算法如轮询法和随机法，都是依靠请求的数量作为“均衡负载”的依据，按照顺序或完全随机的方式，让所有请求平均分布到每个服务器上，但现实环境中每个请求的持续时间并不是一样的，有可能先被分配的服务器，其请求持续了很长时间，而后被分配的服务器的请求持续时间很短，在分配之后迅速断开连接，导致后分配的服务器此刻负载量更低，但却被闲置；

而动态均衡算法考虑了服务器本身的状态，比较常见的方式是统计连接数量或响应时间，在此之上对每个服务器加权，以区分它们的性能水平，最常见的算法的就是LC(最小连接数法)，即直接将任务分配给拥有连接数最少的服务器，此方法胜在简单，但没有考虑服务器的性能差异。

上述两种均衡负载算法都存在一定的弊端，导致用户请求无法合理分配至目标集群的各服务器，进而影响服务器的利用率和工作效率。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种服务器分配策略的生成方法及装置、电子设备及存储介质，以至少解决相关技术，在为用户请求分配服务器时，缺乏有效的分配策略，无法将用户请求合理分配至目标集群的服务器的技术问题。

根据本发明实施例的一个方面，提供了一种服务器分配策略的生成方法，包括：接收用户端发送的用户请求，确定发送所述用户请求的IP地址，并基于所述IP地址获取请求权重；将所述用户请求加入至预先设定的时间窗口的任务队列中，并基于所述请求权重计算服务器的预估负载值；基于蒙特卡洛树模拟所述任务队列中各用户请求进行任务分配的过程，得到模拟结果；基于所述服务器的预估负载值和所述模拟结果生成服务器分配策略。

可选地，在接收用户端发送的用户请求之前，还包括：获取目标集群在目标历史时间段内的访问日志，得到所述目标集群的资源占用信息和访问信息；基于所述资源占用信息和所述访问信息对历史用户请求进行分类，并计算每种类型的所述历史用户请求的权重值；基于所述权重值计算每个所述IP地址对应的所述请求权重，并将所述IP地址和所述请求权重以键值对的形式存储至数据库。

可选地，基于蒙特卡洛树模拟所述任务队列中各用户请求进行任务分配的过程的步骤包括：从根节点开始进行拓展，得到所述蒙特卡洛树的子节点，其中，所述子节点用于指示所述用户请求的分配状态；基于拓展的所述子节点模拟对所述任务队列中各用户请求进行任务分配的分配过程；统计模拟过程中的标准差，基于所述标准差进行反向传播，计算所述根节点和所述子节点的模拟得分。

可选地，得到所述蒙特卡洛树的子节点的步骤包括：确定所述任务队列中所有用户请求和目标集群的所有服务器；从所述蒙特卡洛树的根节点出发，选取所述任务队列中的目标用户请求，并基于所述所有服务器确定所述目标用户请求的所有分配结果；为所述目标用户请求的每个所述分配结果创建所述子节点，得到所述蒙特卡洛树的所述子节点。

可选地，计算所述根节点和所述子节点的模拟得分之后，还包括：获取历史时间段内每个所述用户请求的平均分配时长；基于所述模拟得分、每个所述子节点的访问次数和所有节点的总访问次数计算每个所述子节点的置信区间值；基于所述置信区间值进行迭代计算，直至迭代时长大于等于所述平均分配时长，结束迭代计算，并基于根节点下的第一个子节点的访问次数确定所述用户请求的分配状态，得到所述模拟结果。

可选地，基于所述服务器的预估负载值和所述模拟结果生成服务器分配策略的步骤包括：基于所述模拟结果计算服务器的实际负载值；将所述服务器的所述实际负载值和所述预估负载值进行比对，得到比对结果；在所述比对结果指示所述实际负载值小于等于所述预估负载值的情况下，基于所述模拟结果生成所述服务器分配策略。

可选地，所述服务器的预估负载值计算公式为：其中，n表示所述任务队列中所述用户请求的请求数量，w_i表示每个所述用户请求的请求权重，C表示服务器性能权重，所述服务器性能权重是基于服务器运行状态配置的参数。

根据本发明实施例的另一方面，还提供了一种服务器分配策略的生成装置，包括：接收单元，用于接收用户端发送的用户请求，确定发送所述用户请求的IP地址，并基于所述IP地址获取请求权重；计算单元，用于将所述用户请求加入至预先设定的时间窗口的任务队列中，并基于所述请求权重计算服务器的预估负载值；模拟单元，用于基于蒙特卡洛树模拟对所述任务队列中各用户请求进行任务分配，得到模拟结果；生成单元，用于基于所述服务器的预估负载值和所述模拟结果生成服务器分配策略。

可选地，所述服务器分配策略的生成装置还包括：第一获取模块，用于获取目标集群在目标历史时间段内的访问日志，得到所述目标集群的资源占用信息和访问信息；第一分类模块，用于基于所述资源占用信息和所述访问信息对历史用户请求进行分类，并计算每种类型的所述历史用户请求的权重值；第一计算模块，用于基于所述权重值计算每个所述IP地址对应的所述请求权重，并将所述IP地址和所述请求权重以键值对的形式存储至数据库。

可选地，所述模拟单元包括：第一拓展模块，用于从根节点开始进行拓展，得到所述蒙特卡洛树的子节点，其中，所述子节点用于指示所述用户请求的分配状态；第一模拟模块，用于基于拓展的所述子节点模拟对所述任务队列中各用户请求进行任务分配的分配过程；第一统计模块，用于统计模拟过程中的标准差，基于所述标准差进行反向传播，计算所述根节点和所述子节点的模拟得分。

可选地，所述第一拓展模块包括：第一确定子模块，用于确定所述任务队列中所有用户请求和目标集群的所有服务器；第一选取子模块，用于从所述蒙特卡洛树的根节点出发，选取所述任务队列中的目标用户请求，并基于所述所有服务器确定所述目标用户请求的所有分配结果；第一创建子模块，用于为所述目标用户请求的每个所述分配结果创建所述子节点，得到所述蒙特卡洛树的所述子节点。

可选地，所述服务器分配策略的生成装置还包括：第二获取模块，用于获取历史时间段内每个所述用户请求的平均分配时长；第二计算模块，用于基于所述模拟得分、每个所述子节点的访问次数和所有节点的总访问次数计算每个所述子节点的置信区间值；第一迭代模块，用于基于所述置信区间值进行迭代计算，直至迭代时长大于等于所述平均分配时长，结束迭代计算，并基于根节点下的第一个子节点的访问次数确定所述用户请求的分配状态，得到所述模拟结果。

可选地，所述生成单元包括：第三计算模块，用于基于所述模拟结果计算服务器的实际负载值；第一比对模块，用于将所述服务器的所述实际负载值和所述预估负载值进行比对，得到比对结果；第一生成模块，用于在所述比对结果指示所述实际负载值小于等于所述预估负载值的情况下，基于所述模拟结果生成所述服务器分配策略。

根据本发明实施例的另一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项服务器分配策略的生成方法。

根据本发明实施例的另一方面，还提供了一种电子设备，包括一个或多个处理器和存储器，所述存储器用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现上述任意一项服务器分配策略的生成方法。

在本公开中，通过以下步骤：先接收用户端发送的用户请求，确定发送用户请求的IP地址，并基于IP地址获取请求权重；再将用户请求加入至预先设定的时间窗口的任务队列中，并基于请求权重计算服务器的预估负载值；然后基于蒙特卡洛树模拟任务队列中各用户请求进行任务分配的过程，得到模拟结果；最后基于服务器的预估负载值和模拟结果生成服务器分配策略。

在本公开中，在为用户端发送的用户请求分配服务器时，利用IP地址获取该IP来源的请求权重，并基于请求权重预测请求任务的资源消耗，同时利用蒙特卡洛树对用户请求的分配过程进行模拟和计算，使得在有限时间窗口内对用户请求进行合理分配，实现集群的负载均衡，并使得目标集群的负载均衡更加有效和稳定，提高了集群的负载率和可用性，进而解决了相关技术，在为用户请求分配服务器时，缺乏有效的分配策略，无法将用户请求合理分配至目标集群的服务器的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种可选的服务器分配策略的生成方法的流程图；

图2是根据本发明实施例的一种可选的不同资源消耗的访问次数的示意图；

图3(a)是根据本发明实施例的一种可选的基于蒙特卡洛树对用户请求的分配过程进行第一次模拟的示意图；

图3(b)是根据本发明实施例的一种可选的基于蒙特卡洛树对用户请求进行第二次模拟的示意图；

图4是根据本发明实施例的一种可选的服务器分配策略的生成装置的示意图；

图5是根据本发明实施例的一种服务器分配策略的生成方法的电子设备(或移动设备)的硬件结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，本公开中的服务器分配策略的生成方法及其装置可用于人工智能领域在为用户请求分配服务器，生成服务器分配策略的情况下，也可用于除人工智能领域之外的任意领域在为用户请求分配服务器，生成服务器分配策略的的情况下，本公开中对服务器分配策略的生成方法及其装置的应用领域不做限定。

需要说明的是，本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据，并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准，并提供有相应的操作入口，供用户选择授权或者拒绝。例如，本系统和相关用户或机构间设置有接口，在获取相关信息之前，需要通过接口向前述的用户或机构发送获取请求，并在接收到前述的用户或机构反馈的同意信息后，获取相关信息。

本发明下述各实施例可应用于各种服务器分配策略的生成的系统/应用/设备中。本发明考虑到了不同用户请求的连接对服务器CPU的计算资源占用量不同，因此利用IP来源(IP地址)和历史日志分析得出的不同IP地址对应的请求的资源占用信息和访问信息，进而对所有的请求进行评估和分类加权，同时还利用蒙特卡洛树算法对一个时间窗口内的整个任务队列进行分配模拟，寻找到全局最优解，生成用户请求的服务器分配策略，使得集群的负载均衡更加有效和稳定，提高了目标集群的负载率和可用性。

下面结合各个实施例来详细说明本发明。

实施例一

根据本发明实施例，提供了一种服务器分配策略的生成方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的一种可选的服务器分配策略的生成方法的流程图，如图1所示，该方法包括如下步骤：

步骤S101，接收用户端发送的用户请求，确定发送用户请求的IP地址，并基于IP地址获取请求权重；

步骤S102，将用户请求加入至预先设定的时间窗口的任务队列中，基于请求权重计算服务器的预估负载值；

步骤S103，基于蒙特卡洛树模拟任务队列中各用户请求进行任务分配的过程，得到模拟结果；

步骤S104，基于服务器的预估负载值和模拟结果生成服务器分配策略。

通过上述步骤，先接收用户端发送的用户请求，确定发送用户请求的IP地址，并基于IP地址获取请求权重；再将用户请求加入至预先设定的时间窗口的任务队列中，并基于请求权重计算服务器的预估负载值；然后基于蒙特卡洛树模拟任务队列中各用户请求进行任务分配的过程，得到模拟结果；最后基于服务器的预估负载值和模拟结果生成服务器分配策略。

本实施例中，在为用户端发送的用户请求分配服务器时，利用IP地址获取该IP来源的请求权重，并基于请求权重预测请求任务的资源消耗，同时利用蒙特卡洛树对用户请求的分配过程进行模拟和计算，使得在有限时间窗口内对用户请求进行合理分配，实现集群负载均衡，使得目标集群的负载均衡更加有效和稳定，提高了集群的负载率和可用性，进而解决了相关技术，在为用户请求分配服务器时，缺乏有效的分配策略，无法将用户请求合理分配至目标集群的服务器的技术问题。

下面结合上述各步骤对本发明实施例进行详细说明。

需要说明的是，对于用户请求进行合理分配，实现集群的负载均衡，可以提升集群中服务器的利用率，进而提升各服务器的业务处理能力。相关技术中，最常见的负载均衡算法为最小连接数法，是通过直接将任务分配给拥有连接数最少的服务器来实现负载均衡的，最小连接数法存在一个普遍问题：单纯通过连接数来判断服务器CPU的负载状态是不合理的，因为每个请求连接对CPU计算资源的占用量不同，甚至可能相差数倍，例如：性能相同的A、B两个服务器都承载2个请求，而服务器A的两个请求来自对CPU的占用都远大于服务器B的请求，这种情况下服务器A的负载率是大于服务器B的，因此若想实现真正的负载均衡，还需要计算服务器的CPU负载率，但在复杂业务环境下，计算每个服务器CPU负载率需要额外分配计算资源，会造成巨大开销，甚至影响集群性能，同时负载率的更新频率也是难以决策的，计算间隔时间太长则失去时效性，太过频繁则又过于耗费资源，因此相关技术中，缺乏有效的服务器分配策略，难以真正实现集群的负载均衡。

需要说明的是，本发明实施例针对上述问题，利用IP来源加权预测请求任务对于服务器的资源消耗，并利用蒙特卡洛树算法在有限时间窗口内合理分配任务，实现集群负载均衡，本发明实施例的负载均衡方法可以适应复杂的生产环境，无需实时监控服务器CPU负载情况，而只需要统计实时连接加权值，相比于上述计算服务器CPU的负载率而言资源开销更小。

可选地，在接收用户端发送的用户请求之前，还包括：获取目标集群在目标历史时间段内的访问日志，得到目标集群的资源占用信息和访问信息；基于资源占用信息和访问信息对历史用户请求进行分类，并计算每种类型的历史用户请求的权重值；基于权重值计算每个IP地址对应的请求权重，并将IP地址和请求权重以键值对的形式存储至数据库。

需要说明的是，在对用户请求进行分配之前，首先需要根据用户请求的来源IP地址计算请求权重，计算请求权重需要获取目标集群在目标历史时间段内的访问日志，访问日志上记载了IP地址，访问请求占用的计算资源大小等信息，提取出资源占用信息和访问信息，并对历史用户请求进行分类，计算每种类别的访问请求对应的权重，然后根据该权重计算每个IP地址的请求权重，并将IP地址和请求权重以键值对的形式存储，后续通过用户请求的来源IP即可获取该请求的权重值。

本发明实施例通过对服务器集群的在目标历史时间段内的访问日志进行分析，总结来自每个IP地址的用户请求对资源消耗大小的特点，例如来自某些IP地址的请求对CPU资源的消耗格外多，而某些IP地址的消耗较少，对请求来源进行分割和分类。在分类时可以将用户请求分为A，B，C三类，即高能耗组，中能耗组和低能耗组，三类用户请求可能分别来自于数据中心，地方网点和个人终端，然后根据每一类请求的出现频率配置不同的权重，进而计算每个IP地址对应用户请求的请求权重。

具体的，图2是根据本发明实施例的一种可选的不同资源消耗的访问次数的示意图，如图2所示，横坐标表示平均每秒的计算资源占用，纵坐标表示访问次数，以访问次数为依据，可以将其划分为A、B、C三类，计算可得，B类请求的平均耗能是A类请求的两倍，是C类请求的三倍，则A、B、C三类请求的权重比为3:6:2,将权重值分别设为1.5、2和1，基于此对已访问过的IP地址进行权重标记，并将IP地址和每个IP地址的用户请求对应的权重值以键值对的形式存储起来，例如来自61.181.77.142的过往3次访问中，有1次属于A类请求，2次属于C类请求，则来自该IP地址的请求对应的请求权重为1.167。

需要说明的是，当计算出每个IP地址对应请求的权重值后，如果出现来自特定IP的请求，则可以通过查询键值对直接为其分配权重，如果请求来自于陌生IP，则依照各类请求的权重值为其分配一个平均值，而每次访问之后，IP地址对应请求的资源消耗量会在访问日志中进行实时更新，进而更新每个IP地址对应的权重值。

步骤S101，接收用户端发送的用户请求，确定发送用户请求的IP地址，并基于IP地址获取请求权重。

需要说明的是，在接收到用户端发送的用户请求之后，首先需要获取该请求的权重值，通过获取请求的来源IP地址，然后以该IP地址作为检索条件检索数据库，即可得到该IP地址的请求权重，即为该用户请求的请求权重。

步骤S102，将用户请求加入至预先设定的时间窗口的任务队列中，基于请求权重计算服务器的预估负载值。

需要说明的是，在获取到用户请求之后，设定时间窗口，当请求数量较多时，时间窗口可以设定得较小，当请求数量较少时，时间窗口可以设定得较大，在设定好时间窗口之后，将用户请求加入至时间窗口的任务队列中，为用户请求分配服务器。

可选地，服务器的预估负载值计算公式为：其中，n表示任务队列中用户请求的请求数量，w_i表示每个用户请求的请求权重，C表示服务器性能权重，服务器性能权重是基于服务器运行状态配置的参数。

需要说明的是，本发明实施例对于服务队列中记载的服务请求，根据每个用户请求的权重值计算服务器的预估负载值，预估负载值用于衡量服务器的负载情况。

步骤S103，基于蒙特卡洛树模拟任务队列中各用户请求进行任务分配的过程，得到模拟结果。

需要说明的是，实际业务中，请求到来并不是平均的，因此每个时间窗口中到达的请求数量也不一样，若只专注于将每个请求分配给当前的最优服务器，即贪心算法，可能无法保证窗口中所有的请求达到整体最优解，例如：目标集群中存在性能完全一致的6个服务器，节点A的当前负载率为50％,节点B的当前负载率为50％，节点C的当前负载率为45％，节点D的当前负载率为40％，节点E的当前负载率为50％，节点F的当前负载率为45％，按照任务队列FIFO(先进先出)的顺序和最小连接数算法，优先将任务队列中负载需求为5％的任务1分配给节点D，此时节点C,D,F负载均为45％，再将剩余的负载为10％和5％的任务2和任务3同样按照贪心算法分配完毕后，不论如何必然出现4个服务器负载为50％，而剩余两个服务器负载为45％和55％的情况，利用总体标准差公式计算集群的负载，标准差为0.03184，其中，σ为标准差，n表示任务队列中的请求数，x_i表示每个服务器的负载率，/>表示服务器的平均负载率，显而易见的是，如果考虑整体规划，将负载为10％的大任务分配给节点D，而剩余两个负载为5％的分配给C和F，则可以实现标准差为0的完全负载均衡，因此，在对请求来源加权后，分配问题实际上成为了一种在有限时间内的动态规划问题：如何把权重不一的请求分配到性能不同，负载不同的服务器中，最后保证不陷入局部最优的动态负载均衡问题。

需要说明的是，本发明实施例对于上述问题，采用蒙特卡洛树进行模拟和迭代计算，从所有的分配结果中获取最优解，作为模拟结果和生成分配策略的依据。

需要说明的是，对于蒙特卡洛树算法，在计算资源和时间不受限的情况下，通过不断模拟生成的节点UCT函数，来生成下一次迭代时的节点选择策略，并继续扩展和模拟，一棵MCTS(蒙特卡洛)树就会缓缓展开，并随着迭代次数的增加，不断地尝试所有方案，趋近于最优解，直到整棵树被完全展开。

可选地，基于蒙特卡洛树模拟任务队列中各用户请求进行任务分配的过程的步骤包括：从根节点开始进行拓展，得到蒙特卡洛树的子节点，其中，子节点用于指示用户请求的分配状态；基于拓展的子节点模拟对任务队列中各用户请求进行任务分配的分配过程；统计模拟过程中的标准差，基于标准差进行反向传播，计算根节点和子节点的模拟得分。

需要说明的是，基于蒙特卡洛树模拟分配过程时，从树的根节点开始进行拓展，以任务队列中的用户请求分配的可能性为依据，得到树的子节点，重复该过程，不断创建子节点，根据子节点表示的分配状态对分配过程进行模拟，模拟的深度为队列中任务的个数减节点深度,例如队列中有8个任务，任务1的节点深度为1，则继续7次随机模拟：将任务2分配给X服务器，然后将任务3分配给Y服务器......直到模拟完毕，模拟的具体含义是从被扩展的节点出发(大小为n的队列中的第i个任务被分到某个服务器)，于是按顺序将第i+1到第n个任务随机分配给任意服务器，最终统计模拟得到的分数，因此在模拟过程中，需要统计模拟过程中的标准差，然后基于该标准差进行反向传播并计算根节点和每个子节点的模拟得分。

需要说明的是，模拟得分的计算公式为其中，Q表示模拟得分，σ表示标准差，根据公式可知，标准差越小，负载均衡的表现越好，则该节点的模拟得分越高。

可选地，得到蒙特卡洛树的子节点的步骤包括：确定任务队列中所有用户请求和目标集群的所有服务器；从蒙特卡洛树的根节点出发，选取任务队列中的目标用户请求，并基于所有服务器确定目标用户请求的所有分配结果；为目标用户请求的每个分配结果创建子节点，得到蒙特卡洛树的子节点。

需要说明的是，在得到蒙特卡洛树的子节点时，一个子节点代表一个任务的某一可能的分配结果，从根节点出发，探索任务队列中每个任务的可能分配结果，然后为每个可能的结果创建子节点，从而可以得到蒙特卡洛树的所有子节点。

可选地，计算根节点和子节点的模拟得分之后，还包括：获取历史时间段内每个用户请求的平均分配时长；基于模拟得分、每个子节点的访问次数和所有节点的总访问次数计算每个子节点的置信区间值；基于置信区间值进行迭代计算，直至迭代时长大于等于平均分配时长，结束迭代计算，并基于根节点下的第一个子节点的访问次数确定用户请求的分配状态，得到模拟结果。

需要说明的是，对于蒙特卡洛树算法，迭代的次数越多，越能接近最优值，在迭代过程中，通过计算置信区间值，可以由算法在迭代过程中自主选择下一个访问的节点，置信区间值UCT(Upper Confidence Bounds applied to Trees)，是蒙特卡洛树搜索算法中的核心参数，是对探索进行权衡的函数，其公式如下：

其中，UCT的公式由两部分构成，左边的是对已有子节点的评估，本质上是本节点v_i的总得分Q除以这个节点被探索过的次数N得到的平均得分，用于衡量是否继续利用该节点，平均得分越高，则该节点越有探索价值；而加号右边是对未扩展过的未知节点的探索函数，以下称为探索值，这使得算法倾向于探索那些被访问次数少的节点，其中的c是衡量利用与探索的权重指标，N(v)是整个树的总探索次数，即总迭代次数，当某个节点数量较少时，探索值就越大，整个UCT值也越大，该节点被选择的可能性也越大，此处的/>为一个常数，该常数是可以特别小的值，例如0.001，该常数是为了避免节点访问次数为0时，分母为0的情况，基于该UCT值进行迭代计算，直至迭代的时间接近用户请求的平均分配时长，停止迭代，获取根节点下每个子节点的访问次数，将访问次数最多的结果作为服务器分配策略的结果。

图3(a)是根据本发明实施例的一种可选的基于蒙特卡洛树对用户请求的分配过程进行第一次模拟的示意图，如图3(a)所示，任务队列中有任务1、任务2、任务3......等N个任务，每个任务对应一个用户请求，从蒙特卡洛树的根节点进行第一次拓展，可以得到两个子节点，分别为任务1的分配可能性(包括：任务1分配服务器X和任务1分配服务器A),此时，对于任务1分配服务器A这个子节点Q(模拟得分)＝0，N(模拟次数)＝0，UCT(置信区间值)＝无穷大，对该子节点进行第一次模拟，得到下一个子节点(任务i分配服务器j)，模拟深度为N-1，继续进行模拟，直至将任务N均模拟完毕，此时模拟深度为0，经过第一次模拟得到本次模拟的模拟得分为Q＝0.7,然后进行反向传播，得到任务1分配服务器A这个子节点的Q＝0.7,N＝1,UCT＝1.7,根节点的Q＝0.7,N＝1,UCT＝1.7。

图3(b)是根据本发明实施例的一种可选的基于蒙特卡洛树对用户请求进行第二次模拟的示意图，如图3(b)所示，从根节点出发进行第二次拓展，此时对于任务1分配服务器X这个节点Q＝0，N＝0，UCT＝无穷大，对该子节点进行第二次模拟，得到下一个子节点(任务i分配服务器j)，模拟深度为N-1，继续进行模拟，直至将任务N均模拟完毕，此时模拟深度为0，经过第二次模拟得到本次模拟的模拟得分为Q＝0.4,然后进行反向传播，得到任务1分配服务器X这个子节点的Q＝0.4,N＝1,UCT＝0.948,任务1分配服务器A这个子节点的Q＝0.7,N＝1,UCT＝1.248，根节点的Q＝1.1,N＝2,UCT＝0.937。

基于上述步骤，每个子节点的Q、N、UCT值会随着模拟过程实时更新，在对任务的分配过程进行模拟后，对蒙特卡洛树进行迭代计算，在迭代计算过程中，基于根节点下每个子节点的UCT值选择本次迭代需要访问的子节点，在访问结束之后，选择访问次数最多的子节点，将其作为用户请求的最终分配结果。

可选地，基于服务器的预估负载值和模拟结果生成服务器分配策略的步骤包括：基于模拟结果计算服务器的实际负载值；将服务器的实际负载值和预估负载值进行比对，得到比对结果；在比对结果指示实际负载值小于等于预估负载值的情况下，基于模拟结果生成服务器分配策略。

需要说明的是，在通过迭代计算获取任务队列中所有请求的分配结果之后，根据分配策略计算服务器实际的负载值，将预估负载值和实际负载值进行比对，在实际负载值小于等于预估负载值的情况下，生成服务器的分配策略，若实际负载值大于预负载值，则对分配结果进行调整后生成服务器的分配策略。

本发明实施例考虑到了不同用户请求的连接对服务器CPU的计算资源占用量不同，因此利用IP来源(IP地址)和历史日志分析得出的不同IP地址对应的请求的资源占用信息和访问信息，进而对所有的请求进行评估和分类加权，同时还利用蒙特卡洛树算法对一个时间窗口内的整个任务队列进行分配模拟，寻找到全局最优解，生成用户请求的服务器分配策略，使得集群的负载均衡更加有效和稳定，提高了目标集群的负载率和可用性。

下面结合另一实施例进行详细说明。

实施例二

本实施例中提供的一种服务器分配策略的生成装置包含了多个实施单元，每个实施单元对应于上述实施例一中的各个实施步骤。

图4是根据本发明实施例的一种可选的服务器分配策略的生成装置的示意图，如图4所示，该服务器分配策略的生成装置包括：接收单元41、计算单元42、模拟单元43、生成单元44，其中，

接收单元41，用于接收用户端发送的用户请求，确定发送用户请求的IP地址，并基于IP地址获取请求权重；

计算单元42，用于将用户请求加入至预先设定的时间窗口的任务队列中，并基于请求权重计算服务器的预估负载值；

模拟单元43，用于基于蒙特卡洛树模拟对任务队列中各用户请求进行任务分配，得到模拟结果；

生成单元44，用于基于服务器的预估负载值和模拟结果生成服务器分配策略。

上述服务器分配策略的生成装置，通过接收单元41接收用户端发送的用户请求，确定发送用户请求的IP地址，并基于IP地址获取请求权重；通过计算单元42将用户请求加入至预先设定的时间窗口的任务队列中，并基于请求权重计算服务器的预估负载值；通过模拟单元43基于蒙特卡洛树模拟对任务队列中各用户请求进行任务分配，得到模拟结果；通过生成单元44基于服务器的预估负载值和模拟结果生成服务器分配策略。

本实施例中，在为用户端发送的用户请求分配服务器时，利用IP地址获取该IP来源的请求权重，并基于请求权重预测请求任务的资源消耗，并利用蒙特卡洛树对用户请求的分配过程进行模拟和计算，使得在有限时间窗口内对用户请求进行合理分配，实现集群负载均衡，使得目标集群的负载均衡更加有效和稳定，提高了集群的负载率和可用性，进而解决了相关技术，在为用户请求分配服务器时，缺乏有效的分配策略，无法将用户请求合理分配至目标集群的服务器的技术问题。

可选地，服务器分配策略的生成装置还包括：第一获取模块，用于获取目标集群在目标历史时间段内的访问日志，得到目标集群的资源占用信息和访问信息；第一分类模块，用于基于资源占用信息和访问信息对历史用户请求进行分类，并计算每种类型的历史用户请求的权重值；第一计算模块，用于基于权重值计算每个IP地址对应的请求权重，并将IP地址和请求权重以键值对的形式存储至数据库。

可选地，模拟单元包括：第一拓展模块，用于从根节点开始进行拓展，得到蒙特卡洛树的子节点，其中，子节点用于指示用户请求的分配状态；第一模拟模块，用于基于拓展的子节点模拟对任务队列中各用户请求进行任务分配的分配过程；第一统计模块，用于统计模拟过程中的标准差，基于标准差进行反向传播，计算根节点和子节点的模拟得分。

可选地，第一拓展模块包括：第一确定子模块，用于确定任务队列中所有用户请求和目标集群的所有服务器；第一选取子模块，用于从蒙特卡洛树的根节点出发，选取任务队列中的目标用户请求，并基于所有服务器确定目标用户请求的所有分配结果；第一创建子模块，用于为目标用户请求的每个分配结果创建子节点，得到蒙特卡洛树的子节点。

可选地，服务器分配策略的生成装置还包括：第二获取模块，用于获取历史时间段内每个用户请求的平均分配时长；第二计算模块，用于基于模拟得分、每个子节点的访问次数和所有节点的总访问次数计算每个子节点的置信区间值；第一迭代模块，用于基于置信区间值进行迭代计算，直至迭代时长大于等于平均分配时长，结束迭代计算，并基于根节点下的第一个子节点的访问次数确定用户请求的分配状态，得到模拟结果。

可选地，生成单元包括：第三计算模块，用于基于模拟结果计算服务器的实际负载值；第一比对模块，用于将服务器的实际负载值和预估负载值进行比对，得到比对结果；第一生成模块，用于在比对结果指示实际负载值小于等于预估负载值的情况下，基于模拟结果生成服务器分配策略。

上述服务器分配策略的生成装置还可以包括处理器和存储器，上述接收单元41、计算单元42、模拟单元43、生成单元44等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

上述处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来生成服务器分配策略，进而将用户请求分配至对应的服务器。

上述存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。

根据本发明实施例的另一方面，还提供了一种计算机可读存储介质，计算机可读存储介质包括存储的计算机程序，其中，在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项服务器分配策略的生成方法。

根据本发明实施例的另一方面，还提供了一种电子设备，包括一个或多个处理器和存储器，存储器用于存储一个或多个程序，其中，当一个或多个程序被一个或多个处理器执行时，使得一个或多个处理器实现上述任意一项服务器分配策略的生成方法。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序：接收用户端发送的用户请求，确定发送用户请求的IP地址，并基于IP地址获取请求权重；将用户请求加入至预先设定的时间窗口的任务队列中，并基于请求权重计算服务器的预估负载值；基于蒙特卡洛树模拟任务队列中各用户请求进行任务分配的过程，得到模拟结果；基于服务器的预估负载值和模拟结果生成服务器分配策略。

图5是根据本发明实施例的一种服务器分配策略的生成方法的电子设备(或移动设备)的硬件结构框图。如图5所示，电子设备可以包括一个或多个(图5中采用502a、502b，……，502n来示出)处理器502(处理器502可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器504。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、键盘、电源和/或相机。本领域普通技术人员可以理解，图5所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，电子设备还可包括比图5中所示更多或者更少的组件，或者具有与图5所示不同的配置。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-On ly Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种服务器分配策略的生成方法，其特征在于，包括：

接收用户端发送的用户请求，确定发送所述用户请求的IP地址，并基于所述IP地址获取请求权重；

将所述用户请求加入至预先设定的时间窗口的任务队列中，并基于所述请求权重计算服务器的预估负载值；

基于蒙特卡洛树模拟所述任务队列中各用户请求进行任务分配的过程，得到模拟结果；

基于所述服务器的预估负载值和所述模拟结果生成服务器分配策略。

2.根据权利要求1所述的生成方法，其特征在于，在接收用户端发送的用户请求之前，还包括：

获取目标集群在目标历史时间段内的访问日志，得到所述目标集群的资源占用信息和访问信息；

基于所述资源占用信息和所述访问信息对历史用户请求进行分类，并计算每种类型的所述历史用户请求的权重值；

基于所述权重值计算每个所述IP地址对应的所述请求权重，并将所述IP地址和所述请求权重以键值对的形式存储至数据库。

3.根据权利要求1所述的生成方法，其特征在于，基于蒙特卡洛树模拟所述任务队列中各用户请求进行任务分配的过程的步骤包括：

从根节点开始进行拓展，得到所述蒙特卡洛树的子节点，其中，所述子节点用于指示所述用户请求的分配状态；

基于拓展的所述子节点模拟对所述任务队列中各用户请求进行任务分配的分配过程；

统计模拟过程中的标准差，基于所述标准差进行反向传播，计算所述根节点和所述子节点的模拟得分。

4.根据权利要求3所述的生成方法，其特征在于，得到所述蒙特卡洛树的子节点的步骤包括：

确定所述任务队列中所有用户请求和目标集群的所有服务器；

从所述蒙特卡洛树的根节点出发，选取所述任务队列中的目标用户请求，并基于所述所有服务器确定所述目标用户请求的所有分配结果；

为所述目标用户请求的每个所述分配结果创建所述子节点，得到所述蒙特卡洛树的所述子节点。

5.根据权利要求3所述的生成方法，其特征在于，计算所述根节点和所述子节点的模拟得分之后，还包括：

获取历史时间段内每个所述用户请求的平均分配时长；

基于所述模拟得分、每个所述子节点的访问次数和所有节点的总访问次数计算每个所述子节点的置信区间值；

基于所述置信区间值进行迭代计算，直至迭代时长大于等于所述平均分配时长，结束迭代计算，并基于根节点下的第一个子节点的访问次数确定所述用户请求的分配状态，得到所述模拟结果。

6.根据权利要求1所述的生成方法，其特征在于，基于所述服务器的预估负载值和所述模拟结果生成服务器分配策略的步骤包括：

基于所述模拟结果计算服务器的实际负载值；

将所述服务器的所述实际负载值和所述预估负载值进行比对，得到比对结果；

在所述比对结果指示所述实际负载值小于等于所述预估负载值的情况下，基于所述模拟结果生成所述服务器分配策略。

7.根据权利要求1所述的生成方法，其特征在于，所述服务器的预估负载值计算公式为：其中，n表示所述任务队列中所述用户请求的请求数量，w_i表示每个所述用户请求的请求权重，C表示服务器性能权重，所述服务器性能权重是基于服务器运行状态配置的参数。

8.一种服务器分配策略的生成装置，其特征在于，包括：

接收单元，用于接收用户端发送的用户请求，确定发送所述用户请求的IP地址，并基于所述IP地址获取请求权重；

计算单元，用于将所述用户请求加入至预先设定的时间窗口的任务队列中，并基于所述请求权重计算服务器的预估负载值；

模拟单元，用于基于蒙特卡洛树模拟对所述任务队列中各用户请求进行任务分配，得到模拟结果；

生成单元，用于基于所述服务器的预估负载值和所述模拟结果生成服务器分配策略。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的服务器分配策略的生成方法。

10.一种电子设备，其特征在于，包括一个或多个处理器和存储器，所述存储器用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现权利要求1至7中任意一项所述的服务器分配策略的生成方法。