CN109847367A

CN109847367A - 一种游戏胜率的预测方法、模型生成方法和装置

Info

Publication number: CN109847367A
Application number: CN201910168769.7A
Authority: CN
Inventors: 蔡康
Original assignee: Netease Hangzhou Network Co Ltd
Current assignee: Netease Hangzhou Network Co Ltd
Priority date: 2019-03-06
Filing date: 2019-03-06
Publication date: 2019-06-07

Abstract

本发明实施例提供了一种游戏胜率的预测方法、模型生成方法和装置，通过获取实时游戏战斗数据中预测时间点的特征数据，特征数据包括状态实时数据和游戏阵容数据，将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型，其中，分时预测模型具有多个输出节点，获取分时预测模型的多个输出节点输出的多个预测结果，展示多个输出节点输出的多个预测结果。通过预设的分时预测模型对游戏参与各方的胜率进行实时预测，可以实现在游戏进行的过程中，在预设时间点进行动态地对参与方进行胜率预测，提高了用户的游戏体验，在进行观战或赛事直播的时候，通过实时胜率预测，可以方便观战者更好地理解战场局势，提高观战的趣味性。

Description

一种游戏胜率的预测方法、模型生成方法和装置

技术领域

本发明涉及游戏技术领域，特别是涉及一种游戏胜率的预测方法、模型生成方法和装置。

背景技术

受到人工智能(Artificial Intelligence，AI)发展浪潮的推动，近年来游戏AI也进入了发展的高速路上，无论是围棋的alpha go，DOTA2的open AI，都是AI在游戏领域的重大突破，颠覆了以往人们对AI极限的认知。

游戏本身可以与现实世界有一个比较完整的映射关系，解决游戏问题，在一定程度上表明了其解决现实世界问题的能力，所以游戏AI的发展对人类社会的发展也起着重要的、积极的作用。对于游戏AI本身而言，它包含的概念是很广泛的，从辅助工具性质的AI，比如装备推荐、技能加点推荐、商城虚拟物品推荐等，到与玩家对抗的智能AI，AI正全方面地增加游戏体验，其中，游戏胜负预测技术就是其中的一项重要的功能。具体而言，游戏胜率预测可以描述为：在当前游戏世界状态下，对游戏中各阵营取得游戏最终胜利的可能性，即取得胜利的概率。通过对游戏胜率预测，一方面可以作为游戏观战和赛事的辅助工具，另一方面可以作为与玩家对抗AI的局势判断部分。

然而，对游戏胜负预测仅仅只是对游戏的胜负进行预测，其或是非实时预测，或是非战斗内预测，或是只对胜负进行预测，因此，需要一种更加合理、直观效果上体验更优秀的游戏胜负预测方案。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种游戏胜率的预测方法、一种分时预测模型的生成方法和相应的一种游戏胜率的预测装置、一种分时预测模型的生成装置。

为了解决上述问题，本发明实施例公开了一种游戏胜率的预测方法，包括：

获取实时游戏战斗数据中预测时间点的特征数据，所述特征数据包括状态实时数据和游戏阵容数据；

将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型，其中，所述分时预测模型具有多个输出节点；

获取所述分时预测模型的所述多个输出节点输出的多个预测结果；

展示所述多个输出节点输出的多个预测结果。

可选的，所述分时预测模型具有第一输入层和第二输入层、与所述第二输出层连接的预设数目的隐藏层、与所述第一输入层和最后一层隐藏层连接的Softmax层，所述Softmax层分别与所述多个输出节点连接；所述Softmax层用于将所述第一输入层和最后一层隐藏层的输出结果进行转换，并将转换后的输出结果分别输入到所述多个输出节点。

可选的，所述将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型，包括：

通过所述第一输入层将所述游戏阵容数据输入与所述预测时间点对应的分时预测模型；

通过所述第二输入层将所述状态实时数据输入与所述预测时间点对应的分时预测模型。

可选的，所述将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型之前，还包括：

将所述状态实时数据进行向量化，生成预设时间点的实时特征向量；

将所述游戏阵容数据进行向量化，生成预设时间点的阵容特征向量。

可选的，所述分时预测模型通过如下方式生成：

获取训练样本数据以及初始分时预测模型，其中，所述训练样本数据包括训练时间点的特征数据；

采用所述训练样本数据生成训练特征向量；

采用所述训练特征向量以及所述初始分时预测模型进行训练。

可选的，所述方法还包括：

采用所述预测结果，生成所述分时预测模型的预测曲线；

对所述预测曲线进行滤波处理。

本发明实施例还公开了一种分时预测模型的生成方法，包括：

获取训练样本数据以及初始分时预测模型，其中，所述训练样本数据包括训练时间点的特征数据，所述特征数据包括状态实时数据和游戏阵容数据；

采用所述训练样本数据生成训练特征向量；

可选的，所述采用所述训练特征向量以及所述初始分时预测模型进行训练，包括：

将所述训练特征向量输入所述初始分时预测模型，得到输出结果；

根据所述输出结果，计算所述初始分时预测模型的损失函数，生成与所述损失函数对应的梯度值；

根据所述梯度值，训练所述分时预测模型；

当所述梯度值最小化时，停止训练所述初始分时预测模型。

可选的，所述采用所述训练样本数据生成训练特征向量，包括：

获取所述训练样本数据中每分钟的特征数据；

采用每分钟中训练时间点的特征数据，生成与所述训练时间点匹配的训练特征向量。

可选的，所述将所述训练特征向量输入所述初始分时预测模型，得到输出结果，包括：

通过所述第一输入层的每一神经元的激活函数对与所述训练时间点匹配的训练特征向量进行映射；

通过所述预设数目的隐藏层每一神经元的激活函数对与所述训练时间点匹配的训练特征向量逐层进行映射；

将所述第一输入层的输出结果和最后一层隐藏层生成的输出结果传输至所述Softmax层。

可选的，所述根据所述输出结果，计算所述初始分时预测模型的损失函数，生成与所述损失函数对应的梯度值，包括：

通过所述Softmax层根据所述第一输入层的输出结果，计算所述损失函数，生成多个第一梯度值；

通过所述Softmax层根据最后一层隐藏层生成的输出结果，计算所述损失函数，生成多个第二梯度值。

可选的，所述根据所述梯度值，训练所述分时预测模型，包括：

通过所述输出节点判断所述多个第一梯度值和所述多个第二梯度值是否满足预设阈值条件；

若否，则根据所述多个第一梯度值更新所述第一输入层的每一神经元的激活函数的参数以及根据所述多个第二梯度值更新所述预设数目的隐藏层每一神经元的激活函数的参数，继续训练所述分时预测模型。

可选的，所述方法还包括：

获取验证样本数据以及获取多个训练后的分时预测模型，其中，所述验证样本数据包括所述训练时间点的特征数据；

采用所述验证样本数据生成验证特征向量；

将所述验证特征向量输入多个训练后的分时预测模型进行交叉验证，并计算验证后的分时预测模型的多个验证误差值；

根据所述多个验证误差值，确定目标分时预测模型。

可选的，所述根据所述多个验证误差值，确定目标分时预测模型，包括：

判断所述多个验证误差值是否满足预设误差阈值；

若是，将满足所述预设误差阈值的分时预测模型作为所述目标分值预测模型。

本发明实施例还公开了一种游戏胜率的预测装置，包括：

特征数据获取模块，用于获取实时游戏战斗数据中预测时间点的特征数据，所述特征数据包括状态实时数据和游戏阵容数据；

特征数据预测模块，用于将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型，其中，所述分时预测模型具有多个输出节点；

预测结果获取模块，用于获取所述分时预测模型的所述多个输出节点输出的多个预测结果；

预测结果展示模块，用于展示所述多个输出节点输出的多个预测结果。

本发明实施例还公开了一种分时预测模型的生成装置，包括：

训练样本数据获取模块，用于获取训练样本数据以及初始分时预测模型，其中，所述训练样本数据包括训练时间点的特征数据，所述特征数据包括状态实时数据和游戏阵容数据；

训练特征向量生成模块，用于采用所述训练样本数据生成训练特征向量；

模型训练模块，用于采用所述训练特征向量以及所述初始分时预测模型进行训练。

本发明实施例还公开了一种装置，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述装置执行如上所述的游戏胜率的预测方法或分时预测模型的生成方法。

本发明实施例还公开了一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得所述处理器执行如上所述的游戏胜率的预测方法或分时预测模型的生成方法。

本发明实施例包括以下优点：

在本发明实施例中，通过获取实时游戏战斗数据中预测时间点的特征数据，特征数据包括状态实时数据和游戏阵容数据，将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型，其中，分时预测模型具有多个输出节点，获取分时预测模型的多个输出节点输出的多个预测结果，展示多个输出节点输出的多个预测结果。通过预设的分时预测模型对游戏参与各方的胜率进行实时预测，可以实现在游戏进行的过程中，在预设时间点进行动态地对参与方进行胜率预测，提高了用户的游戏体验，在进行观战或赛事直播的时候，通过实时胜率预测，可以方便观战者更好地理解战场局势，提高观战的趣味性。

同时，在本发明实施例中，通过融合稀疏特征的单层线性模型和稠密特征的深度学习模型，获得的分时预测模型，具备良好的拟合和泛化能力，进一步提高了游戏实时胜率预测的稳定性和准确性。

附图说明

图1是本发明的一种游戏胜率的预测方法一实施例的步骤流程图；

图2是本发明的一种游戏胜率的预测方法一实施例提供的分时预测模型的示意图；

图3是本发明的一种游戏胜率的预测方法另一实施例的步骤流程图；

图4是本发明的一种分时预测模型的生成方法一实施例的步骤流程图；

图5是本发明的一种分时预测模型的生成方法另一实施例的步骤流程图；

图6为本发明的一种分时预测模型的生成方法实施例中交叉验证的示意图；

图7是本发明的一种游戏胜率的预测装置实施例的结构框图；

图8是本发明的一种分时预测模型的生成装置的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1，示出了本发明的一种游戏胜率的预测方法一实施例的步骤流程图，具体可以包括如下步骤：

步骤101，获取实时游戏战斗数据中预测时间点的特征数据；

为了方便描述和理解，本发明实施例以多人在线战术竞技游戏(MultiplayerOnline Battle Arena，MOBA)为例进行说明。在MOBA网络游戏场景中，玩家通常被分为两队，两队在分散的游戏地图中互相竞争，在地图中，除了玩家双方选择的虚拟英雄角色外，还有小兵、防御塔、小野怪、特殊野怪等非玩家操控的游戏单位(Non-Player Character，NPC)，每个玩家都通过控制所选的虚拟英雄角色在地图上击杀敌方英雄或中立方单位，获取资源，最终摧毁敌方基地，获取最终胜利。在游戏中，双方玩家的游戏战斗数据时刻在变化，通过获取双方游戏战斗数据中预设时间点的特征数据，并通过分时预测模型对特征数据进行胜率预测，可以得到双方获胜的概率。

需要说明的是，本发明实施例的实时胜率预测还可以应用于其他的游戏胜率预测场景中，如动作类游戏、策略模拟类、即时战略游戏等等，本发明对此不作限制。

在本发明实施例中，游戏参与方在游戏中的实时游戏战斗数据可以包括虚拟英雄当前血量、虚拟英雄当前魔法量、虚拟英雄技能冷却时间、一方总金钱、虚拟英雄等级、击杀敌方英雄值、各路防御塔、虚拟英雄等级、增益加成归属方、特殊增益加成等，在游戏进行的过程中，上述游戏战斗数据可以随时间的变换而发生变化。其次，在游戏开局之前，玩家需要在英雄池中选择一个虚拟英雄参与游戏，在同一阵营中，玩家只能选择不同的虚拟英雄，在不同阵营中，玩家可以选择相同的虚拟英雄，当各参与方的玩家选择了相应的虚拟英雄后，可以形成相应的游戏阵容数据，包括各个参与方的阵容特征。通过在游戏进行的过程中，获取预设时间点的游戏战斗数据，可以动态地对参与方的胜率进行预测。

在具体实现中，在游戏进行的过程中，当游戏开局后，游戏参与方的游戏阵容数据即确定了，在后续的游戏过程中，该游戏阵容数据不会发生变化，则在游戏进行的过程中，可以在预设时间点获取游戏参与方的状态实时数据以及游戏阵容数据，从而根据游戏参与方的状态实时数据以及游戏阵容数据对各方的胜率进行预测。其中，状态实时数据可以包括虚拟金钱总数、虚拟英雄的等级、各路防御塔、大boss增益加成以及小boss增益加成，虚拟金钱总数表示一方所有虚拟英雄的装备价值与未消费虚拟金钱的总和，虚拟英雄的等级表示一方所有虚拟英雄从开局到当前获取获取的经验总数，各路防御塔表示地图中上、中、下路剩余防御塔的数目，大boss增益加成表示虚拟地图中大boss的击杀归属权，小boss增益加成表示虚拟地图中小boss的击杀归属权。

在本发明实施例的一种示例中，假设每分钟对参与方的胜率进行预测，即当游戏时长为1分钟时，获取游戏参与方当前游戏参与方的状态实时数据和游戏阵容数据，当游戏时长为2分钟时，获取游戏参与方当前游戏参与方的状态实时数据和游戏阵容数据，当游戏时长为3分钟时，获取游戏参与方当前游戏参与方的状态实时数据和游戏阵容数据…当游戏时长为N分钟时，获取游戏参与方当前游戏参与方的状态实时数据和游戏阵容数据，直到游戏结束前的最后一分钟，从而可以在游戏进行的过程中，对游戏参与方的胜率进行实时地预测。

步骤102，将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型；

在本发明实施例中，分时预测模型为宽深神经网络模型，结合了单层网络(宽网络部分)和深度神经网路(深网络部分)。将预测时间点的特征数据进行向量化，从而获得预设时间点的特征向量，接着通过将预测时间点的特征向量输入与预测时间点对应的分时预测模型，其中，分时预测模型的宽网络部分处理特征数据中的稀疏特征，深网络部分处理特征数据中的稠密特征。

在具体实现中，游戏阵容数据包括游戏参与方的完整的阵容信息，在游戏开局后保持不变。其中，采用热编码的方式对游戏阵容数据进行处理，在阵容中出现的虚拟英雄对应的标志位设为1，未出现的标志为设为0，则对于游戏中的某一游戏参与方，可以用N维特征标识，其中N表示英雄池中的英雄个数，将游戏所有参与方的N维特征进行拼接，由于该游戏阵容数据大多数维度为0，因此游戏阵容数据可以为稀疏特征。

在本发明实施例的一种示例中，以某MOBA游戏为例进行示例性说明，在游戏中，英雄池中包括55个虚拟英雄，游戏参与方分为白方和黑方，则将双方各55维的特征进行拼接，总维数为110，其中包括10维为1，其它维为0。

在具体实现中，状态实时数据可以虚拟金钱总数、虚拟英雄的等级、各路防御塔、大boss增益加成以及小boss增益加成，在游戏开局后，状态实时数据可以随时间实时的发生一定变化，且状态实时数据在大多数情况下为非0值，因此状态实时数据可以为稠密特征。

在本发明实施例的另一种示例中，以某MOBA游戏为例进行示例性说明，在游戏中，游戏参与方分为白方和黑方，每方各选5个虚拟英雄，可以包括：上单英雄、中单英雄、射手英雄、辅助英雄、打野英雄，每方基地包括上、中、下三路防御塔，地图野区有大boss和小boss，则按照上单英雄、中单英雄、射手英雄、辅助英雄、打野英雄的固定顺序提取一方5个虚拟英雄的虚拟金钱总数和等级特征，维度为10，一方3路防御塔数目特征，维度为3，大boss和小boss的增益加成，维度为2，故一方特征维数为15维，将两方特征拼接，总维数为30维。

在本发明实施例中，如图2所示是本发明的一种游戏胜率的预测方法提供的分时预测模型的示意图，所述分时预测模型具有第一输入层和第二输入层、与所述第二输出层连接的预设数目的隐藏层、与所述第一输入层和最后一层隐藏层连接的Softmax层，所述Softmax层分别与所述多个输出节点连接；所述Softmax层用于将所述第一输入层和最后一层隐藏层的输出结果进行转换，并将转换后的输出结果分别输入到所述多个输出节点。

其中，分时预测模型中深网络部分可以包括3层隐藏层，Softmax层的输出节点根据游戏参与方的数目进行设置，如游戏参与方为两方，则输出节点的个数为2；游戏参与方三方，则输出节点的个数为3。当然，本领域技术人员还可以根据需要设置其他数目的隐藏层，以及设置其他的输出节点数目，本发明实施例对此并不限制。

在本发明实施例的一种优选实施例中，步骤102可以包括如下子步骤：

子步骤S11，通过第一输入层将游戏阵容数据输入与预测时间点对应的分时预测模型；

子步骤S12，通过第二输入层将状态实时数据输入与预测时间点对应的分时预测模型。

在本发明实施例中，可以实时获取游戏参与方双方的特征数据，并将特征数据转换为特征向量，接着将两方的特征向量进行拼接，并输入与预测时间点对应的分时预测模型。

在具体实现中，可以实时获取游戏参与方双方的状态实时数据，以及获取双方的游戏阵容数据，接着将状态实时数据和游戏阵容数据向量化，得到实时特征向量信息和阵容特征向量信息，然后通过第一输入层将阵容特征向量信息输入分时预测模型，由分时预测模型中宽网络部分对阵容特征向量信息进行处理，以获得宽网络部分处理的结果，以及通过第二输入层将实时特征向量信息输入分时预测模型，由分时预测模型中深网络部分对实时特征向量信息进行处理，以获得深网络部分处理的结果。

步骤103，获取分时预测模型的多个输出节点输出的多个预测结果；

步骤104，展示多个输出节点输出的多个预测结果。

在本发明实施例中，通过Softmax层可以将宽网络部分和深网络部分输出的结果向量进行归一化，得到相应的概率值，接着将概率值通过多个输出节点进行输出。

在具体实现中，将阵容特征向量输入分时预测模型的宽网络部分，以及将实时特征向量输入分时预测模型的深网络部分进行处理，接着Softmax层对宽网络部分和深网络部分输出的结果向量进行转换，得到相应的概率值，即游戏参与方获胜的概率，然后对多个预测结果进行展示。

在本发明实施例的一种示例中，可以通过如下公式得到相应的概率值：

其中，表示宽网络部分输出结果的权值参数，表示深网络部分输出结果的权值参数，b表示偏移量，在该公式中，同时将宽网络部分和深网路部分输出结果根据权值参数加权到一起，并加上偏移量，将和值作为Softmax函数的变量，从而得到Softmax函数值作为输出节点的值。

在本发明实施例的一种优选实施例中，分时预测模型可以通过如下方式生成：

获取训练样本数据以及初始分时预测模型；

在具体实现中，训练样本数据包括训练时间点的特征数据，样本数据可以是从游戏录像数据中提取的游戏参与方的状态实时数据以及游戏阵容数据。

采用训练样本数据生成训练特征向量；

在具体实现中，在获取样本数据之后，可以将样本数据中游戏参与方用于胜率预测的特征数据按照唯一ID拼接到一起，生成预测特征数据，并对预测特征数据进行向量化，以生成样本数据的训练特征向量信息。

采用训练特征向量以及初始分时预测模型进行训练。

在具体实现中，在进行模型训练时，将分时预测模型的损失函数作为分时预测模型的监督和指导。

当训练之后的分时预测模型的损失函数都最小化时，停止训练分时预测模型。

在本发明实施例中，可以设置模型训练的停止条件是：分时预测模型的损失函数都最小化，当训练之后的分时预测模型的多个损失函数都最小化时，停止训练分时预测模型。

参照图3，示出了本发明的一种游戏胜率的预测方法另一实施例的步骤流程图，具体可以包括如下步骤：

步骤301，获取实时游戏战斗数据中预测时间点的特征数据；

在具体实现中，在游戏开局之后，可以实时获取游戏战斗数据中预测时间点的特征数据，其中，特征数据包括游戏参与方的状态实时数据和游戏阵容数据。

步骤302，将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型；

在具体实现中，将预测时间点的特征数据进行向量化，从而获得预设时间点的特征向量，接着通过将预测时间点的特征向量输入与预测时间点对应的分时预测模型。

在本发明实施例的一种优选实施例中，步骤302可以包括如下子步骤：

子步骤S21，通过第一输入层将游戏阵容数据输入与预测时间点对应的分时预测模型；

子步骤S22，通过第二输入层将状态实时数据输入与预测时间点对应的分时预测模型。

步骤303，获取分时预测模型的多个输出节点输出的多个预测结果；

步骤304，展示多个输出节点输出的多个预测结果；

步骤305，采用预测结果，生成分时预测模型的预测曲线；

在具体实现中，根据不同预测时间点得到对应的预测结果后，可以采用不同预测时间点的预测结果生成分时预测模型的预测曲线。

步骤306，对预测曲线进行滤波处理。

在本发明实施例中，得到预测曲线后，可以对预测曲线进行平滑滤波处理，从而解决了预测曲线不平滑的问题，从而提高胜率曲线显示的舒适度，为玩家提供更好的游戏体验。

在具体实现中，针对宽深神经网络模型，采用特定较长窗口长度的滑动平均平滑方法对预测曲线进行平滑处理，具体的，对于当前预测时间点，将包括当前预测时间点在内的前6个采样点的预测值的平均值作为当前预测值，其中，两个采样点之间的时间间隔为10秒，总时间窗口为50秒，从而实现通过滑动平均平滑方法对预测曲线进行平滑滤波处理，提高胜率曲线显示的舒适度，为玩家提供更好的游戏体验。

参照图4，示出了本发明的一种分时预测模型的生成方法一实施例的步骤流程图，具体可以包括如下步骤：

步骤401，获取训练样本数据以及初始分时预测模型；

在本发明实施例中，训练样本数据包括训练时间点的特征数据，特征数据包括状态实时数据和游戏阵容数据。其中，样本数据可以是从游戏录像数据中提取的游戏战斗数据，游戏战斗数据可以包括虚拟英雄当前血量、虚拟英雄当前魔法量、虚拟英雄技能冷却时间、一方总金钱、虚拟英雄等级、击杀敌方英雄值、各路防御塔、虚拟英雄等级、增益加成归属方、特殊增益加成等。

在具体实现中，状态实时数据可以虚拟金钱总数、虚拟英雄的等级、各路防御塔、大boss增益加成以及小boss增益加成，在游戏开局后，状态实时数据可以随时间实时发生变化，且状态实时数据在大多数情况下为非0值，因此状态实时数据可以为稠密特征。

在具体实现中，在模型训练的准备阶段，可以获取一初始分时预测模型，以使用样本数据对初始分时预测模型进行训练，生成合适的分时预测模型。

步骤402，采用训练样本数据生成训练特征向量；

在本发明实施例的一种优选实施例中，步骤402可以包括如下子步骤：

子步骤S31，获取所述训练样本数据中每分钟的特征数据；

子步骤S32，采用每分钟中训练时间点的特征数据，生成与所述训练时间点匹配的训练特征向量。

在具体实现中，为了使分时预测模型更有效地包含时间信息，获取样本数据中每一分钟的特征数据，进一步采用每分钟中训练时间点的特征数据，生成与训练时间点匹配的训练特性向量信息。

步骤403，采用训练特征向量以及初始分时预测模型进行训练。

在本发明实施例中，通过训练样本数据，得到每分钟中训练时间点的实时特性向量信息和阵容特征信息后，可以采用实时特性向量信息和阵容特征信息以及初始分时预测模型进行训练，并计算初始分时预测模型的损失函数，通过损失函数对分时预测模型进行监督和指导。

在具体实现中，可以设置训练的停止条件是：分时预测模型的损失函数最小化。当分时预测模型的损失函数最小化时，停止训练分时预测模型。

在本发明实施例中，分时预测模型具有第一输入层和第二输入层、与第二输出层连接的预设数目的隐藏层、与第一输入层和最后一层隐藏层连接的Softmax层，Softmax层分别与多个输出节点连接；Softmax层用于将第一输入层和最后一层隐藏层的输出结果进行转换，并将转换后的输出结果分别输入到多个输出节点。

在本发明实施例的一种优选实施例中，步骤403可以包括如下子步骤：

子步骤S41，将训练特征向量输入初始分时预测模型，得到输出结果；

在深度神经网络中，隐藏层、连接层和输出层的神经元都是拥有激活函数的功能神经元，功能神经元可以对接收的信号进行处理。

在具体实现中，通过第一输入层的每一神经元的激活函数对与训练时间点匹配的训练特征向量进行映射，以及通过预设数目的隐藏层每一神经元的激活函数对与训练时间点匹配的训练特征向量逐层进行映射，从而获得第一输入层的输出结果和最后一层隐藏层生成的输出结果，然后将第一输入层的输出结果和最后一层隐藏层生成的输出结果传输至Softmax层。

子步骤S42，根据输出结果，计算初始分时预测模型的损失函数，生成与损失函数对应的梯度值；

在具体实现中，通过Softmax层根据第一输入层的输出结果，计算损失函数，并生成多个第一梯度值，以及通过Softmax层根据最后一层隐藏层生成的输出结果，计算损失函数，并生成多个第二梯度值。

子步骤S43，根据梯度值，训练分时预测模型；

子步骤S44，当梯度值最小化时，停止训练初始分时预测模型。

在具体实现中，通过输出节点判断多个第一梯度值和多个第二梯度值是否满足预设阈值条件，若否，则根据多个第一梯度值更新第一输入层的每一神经元的激活函数的参数以及根据多个第二梯度值更新预设数目的隐藏层每一神经元的激活函数的参数，继续训练分时预测模型，若是，则表示分时预测模型的预测效果已经达到预期值，可以停止训练分时预测模型。

在进行模型训练时，循环执行以上的操作流程，直到达到预设的停止条件为止。

其中，对激活函数的参数更新，可以是基于梯度下降策略，以目标的负梯度方向对参数进行更新。在具体实现中，可以预设一学习率，控制每一轮训练中参数的更新步长。

在本发明实施例中，通过获取训练样本数据以及初始分时预测模型，采用所述训练样本数据生成训练特征向量，接着采用训练特征向量以及所述初始分时预测模型进行训练，并计算初始分时预测模型的损失函数，生成与损失函数对应的梯度值，当梯度值最小化时，停止训练分时预测模型，在进行训练的过程中以宽网络部分处理稀疏特征、以深网络部分处理稠密特征，得到分时预测模型，充分发挥了宽神经网络和深神经网络的优势，使得具备良好的拟合和泛化能力，提高了模型对实时胜率预测的准确性。

参照图5，示出了本发明的一种分时预测模型的生成方法另一实施例的步骤流程图，具体可以包括如下步骤：

步骤501，获取训练样本数据以及初始分时预测模型；

步骤502，采用训练样本数据生成训练特征向量；

步骤503，采用训练特征向量以及初始分时预测模型进行训练；

在具体实现中，通过样本数据，得到每分钟中训练时间点的训练特征向量信息后，可以采用训练特征向量信息以及初始分时预测模型进行训练，并计算初始分时预测模型的损失函数，通过损失函数对分时预测模型进行监督和指导。

在具体实现中，可以设置训练的停止条件是：分时预测模型的损失函数都最小化。当训练之后的分时预测模型的损失函数最小化时，停止训练分时预测模型。

步骤504，获取验证样本数据以及获取多个训练后的分时预测模型；

在本发明实施例中，验证样本数据包括训练时间点的特征数据，特征数据包括状态实时数据和团队位置数据。

在具体实现中，在模型训练的验证阶段，可以获取多个训练后的分时预测模型，以使用验证样本数据对多个训练后的分时预测模型进行验证，从而可以选取预测效果最优的分时预测模型。

步骤505，采用验证样本数据生成验证特征向量；

在具体实现中，在获取验证样本数据之后，可以将验证样本数据中游戏参与方用于胜率预测的特征数据按照唯一ID拼接到一起，生成验证特征数据，并对验证特征数据进行向量化，以生成验证样本数据的验证特征向量信息。

步骤506，将验证特征向量输入多个训练后的分时预测模型进行交叉验证，并计算验证后的分时预测模型的多个验证误差值；

在本发明实施例中，生成验证样本数据的验证特征向量信息后，可以将验证特征向量输入多个训练后的分时预测模型进行K折交叉验证，并计算验证后的分时预测模型的多个验证误差值，然后根据验证误差值对模型的超参数进行调整，直到达到预期效果为止。

在具体实现中，将验证样本数据分成K份，对多个训练后的每分钟模型进行K折-交叉验证，以及对多个训练后的最后一分钟模型进行K折-交叉验证，并计算验证后的每分钟模型的多个验证误差值和最后一分钟模型的多个验证误差值。通过交叉验证对分时预测模型的超参数进行优化调整，其中，超参数调整可以包括归一化处理、权重初始化处理、Dropout、Batch Size、Batch Normalization以及Regularization等，从而对分时预测模型进行调整优化，提高了分时预测模型的胜率预测准确率。

在本发明实施例的一种示例中，如图6为本发明的一种分时预测模型的生成方法实施例中交叉验证的示意图，采用6折-交叉验证，将验证样本数据分成6份，分别对训练后的每分钟模型和最后一分钟模型进行6折-交叉验证，得到验证后的每分钟模型的多个验证误差值和最后一分钟模型的多个验证误差值。

步骤507，根据多个验证误差值，确定目标分时预测模型。

在本发明实施例中，通过K折-交叉验证，将验证样本数据中的K-1折样本数据进行模型训练，1折样本数据进行模型验证，并计算1折样本数据的验证误差值，从而可以根据多个验证误差值，确定胜率预测效果较好的目标分时预测模型。

在具体实现中，通过K折-交叉验证对训练后的每分钟模型和最后一分钟模型进行验证，可以得到相应的多个验证误差值，根据多个验证误差值，可以确定胜率预测效果较好的每分钟模型和最后一分钟模型。

在本发明实施例的一种优选实施例中，步骤507可以包括如下子步骤：

判断多个验证误差值是否满足预设误差阈值；

若是，将满足预设误差阈值的分时预测模型作为目标分值预测模型。

在本发明实施例中，通过获取与分时预测模型对应的多个验证误差值，可以判断多个验证误差值是否满足预设误差阈值，若是，则将满足预设误差阈值的分时预测模型作为目标分时预测模型；若否，则采用多个验证误差值，对分时预测模型的超参数进行调整优化。

在具体实现中，得到多个训练后的分时预测模型的多个验证误差值，可以将多个验证误差值与预设误差阈值进行比较，判断是否存在验证误差值满足预设误差阈值，若存在，则将满足预设误差阈值的分时预测模型作为目标每分钟模型，当存在多个验证误差值满足预设误差阈值时，则将数值最小的验证误差值对应的分时预测模型作为目标每分钟模型；若不存在满足预设误差阈值的验证误差值，则采用多个验证误差值对分时预测模型的超参数进行调整，直到达到预设的验证误差值为止。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

参照图7，示出了本发明的一种游戏胜率的预测装置实施例的结构框图，具体可以包括如下模块：

特征数据获取模块701，用于获取实时游戏战斗数据中预测时间点的特征数据，所述特征数据包括状态实时数据和游戏阵容数据；

特征数据预测模块702，用于将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型，其中，所述分时预测模型具有多个输出节点；

预测结果获取模块703，用于获取所述分时预测模型的所述多个输出节点输出的多个预测结果；

预测结果展示模块704，用于展示所述多个输出节点输出的多个预测结果。

在本发明实施例的一种优选实施例中，所述分时预测模型具有第一输入层和第二输入层、与所述第二输出层连接的预设数目的隐藏层、与所述第一输入层和最后一层隐藏层连接的Softmax层，所述Softmax层分别与所述多个输出节点连接；所述Softmax层用于将所述第一输入层和最后一层隐藏层的输出结果进行转换，并将转换后的输出结果分别输入到所述多个输出节点。

其中，分时预测模型中深网络部分可以包括3层隐藏层，输出节点根据游戏参与方的数目进行设置，如游戏参与方为两方，则输出节点的个数为2；游戏参与方三方，则输出节点的个数为3。当然，本领域技术人员还可以根据需要设置其他数目的隐藏层，以及设置其他的输出节点数目，本发明实施例对此并不限制。

在本发明实施例的一种优选实施例中，所述特征数据预测模块可以包括：

第一预测模块，用于通过所述第一输入层将所述游戏阵容数据输入与所述预测时间点对应的分时预测模型；

第二预测模块，用于通过所述第二输入层将所述状态实时数据输入与所述预测时间点对应的分时预测模型。

在本发明实施例的一种优选实施例中，所述装置还可以包括：

第一向量生成模块，用于将所述状态实时数据进行向量化，生成预设时间点的实时特征向量；

第二向量生成模块，用于将所述游戏阵容数据进行向量化，生成预设时间点的阵容特征向量。

在本发明实施例的一种优选实施例中，所述分时预测模型通过如下模块生成：

样本数据获取模块，用于获取训练样本数据以及初始分时预测模型，其中，所述训练样本数据包括训练时间点的特征数据；

特征向量生成模块，用于采用所述训练样本数据生成训练特征向量；

预测曲线生成模块，用于采用所述预测结果，生成所述分时预测模型的预测曲线；

滤波处理模块，用于对所述预测曲线进行滤波处理。

参照图8，示出了本发明的一种分时预测模型的生成装置实施例的结构框图，具体可以包括如下模块：

训练样本数据获取模块801，用于获取训练样本数据以及初始分时预测模型，其中，所述训练样本数据包括训练时间点的特征数据，所述特征数据包括状态实时数据和游戏阵容数据；

训练特征向量生成模块802，用于采用所述训练样本数据生成训练特征向量；

模型训练模块803，用于采用所述特征向量以及所述初始分时预测模型进行训练。

在本发明实施例的一种优选实施例中，所述模型训练模块可以包括：

输出结果生成子模块，用于将所述训练特征向量输入所述初始分时预测模型，得到输出结果；

梯度值生成子模块，用于根据所述输出结果，计算所述初始分时预测模型的损失函数，生成与所述损失函数对应的梯度值；

模型参数更新子模块，用于根据所述梯度值，训练所述分时预测模型；

模型训练停止子模块，用于当所述梯度值最小化时，停止训练所述初始分时预测模型。

在本发明实施例的一种优选实施例中，所述训练特征向量生成模块可以包括：

分时特征数据获取子模块，用于获取所述训练样本数据中每分钟的特征数据；

分时特征向量生成子模块，用于采用每分钟中训练时间点的特征数据，生成与所述训练时间点匹配的训练特征向量。

在本发明实施例的一种优选实施例中，所述输出结果生成子模块具体可以用于：

在本发明实施例的一种优选实施例中，所述梯度值生成子模块具体可以用于：

在本发明实施例的一种优选实施例中，所述模型参数更新子模块具体可以用于：

验证样本数据获取模块，用于获取验证样本数据以及获取多个训练后的分时预测模型，其中，所述验证样本数据包括所述训练时间点的特征数据；

验证特征向量生成模块，用于采用所述验证样本数据生成验证特征向量；

模型验证模块，用于将所述验证特征向量输入训练后的分时预测模型进行交叉验证，并计算验证后的分时预测模型的多个验证误差值；

目标模型确定模块，用于根据所述多个验证误差值，确定目标分时预测模型。

在本发明实施例的一种优选实施例中，所述目标模型确定模块可以包括：

误差值比较子模块，用于对所述多个验证误差值进行数值比较，确定数值最小的验证误差值；

目标模型确定子模块，用于将与所述数值最小的验证误差值对应的分时预测模型作为所述目标分时预测模型。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本发明实施例还提供了一种装置，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述装置执行本发明实施例所述的游戏胜率的预测方法或分时预测模型的生成方法。

本发明实施例还提供了一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得所述处理器执行本发明实施例所述的游戏胜率的预测方法或分时预测模型的生成方法。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种游戏胜率的预测方法、一种游戏胜率的预测装置、一种分时预测模型的生成方法以及一种分时预测模型的生成装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种游戏胜率的预测方法，其特征在于，包括：

展示所述多个输出节点输出的多个预测结果。

2.根据权利要求1所述的方法，其特征在于，所述分时预测模型具有第一输入层和第二输入层、与所述第二输出层连接的预设数目的隐藏层、与所述第一输入层和最后一层隐藏层连接的Softmax层，所述Softmax层分别与所述多个输出节点连接；所述Softmax层用于将所述第一输入层和最后一层隐藏层的输出结果进行转换，并将转换后的输出结果分别输入到所述多个输出节点。

3.根据权利要求2所述的方法，其特征在于，所述将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型之前，还包括：

5.根据权利要求1所述的方法，其特征在于，所述分时预测模型通过如下方式生成：

采用所述训练样本数据生成训练特征向量；

6.根据权利要求1至5任一所述的方法，其特征在于，还包括：

采用所述预测结果，生成所述分时预测模型的预测曲线；

对所述预测曲线进行滤波处理。

7.一种分时预测模型的生成方法，其特征在于，包括：

采用所述训练样本数据生成训练特征向量；

8.根据权利要求7所述的方法，其特征在于，所述采用所述训练特征向量以及所述初始分时预测模型进行训练，包括：

根据所述梯度值，训练所述分时预测模型；

当所述梯度值最小化时，停止训练所述初始分时预测模型。

9.根据权利要求7所述的方法，其特征在于，所述采用所述训练样本数据生成训练特征向量，包括：

获取所述训练样本数据中每分钟的特征数据；

10.根据权利要求7所述的方法，其特征在于，所述分时预测模型具有第一输入层和第二输入层、与所述第二输出层连接的预设数目的隐藏层、与所述第一输入层和最后一层隐藏层连接的Softmax层，所述Softmax层分别与所述多个输出节点连接；所述Softmax层用于将所述第一输入层和最后一层隐藏层的输出结果进行转换，并将转换后的输出结果分别输入到所述多个输出节点。

11.根据权利要求10所述的方法，其特征在于，所述将所述训练特征向量输入所述初始分时预测模型，得到输出结果，包括：

12.根据权利要求11所述的方法，其特征在于，所述根据所述输出结果，计算所述初始分时预测模型的损失函数，生成与所述损失函数对应的梯度值，包括：

13.根据权利要求12所述的方法，其特征在于，所述根据所述梯度值，训练所述分时预测模型，包括：

14.根据权利要求7所述的方法，其特征在于，还包括：

采用所述验证样本数据生成验证特征向量；

根据所述多个验证误差值，确定目标分时预测模型。

15.根据权利要求14所述的方法，其特征在于，所述根据所述多个验证误差值，确定目标分时预测模型，包括：

判断所述多个验证误差值是否满足预设误差阈值；

16.一种游戏胜率的预测装置，其特征在于，包括：

17.一种分时预测模型的生成装置，其特征在于，包括：

18.一种装置，其特征在于，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述装置执行如权利要求1-6或7-15所述的一个或多个的方法。

19.一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得所述处理器执行如权利要求1-6或7-15所述的一个或多个的方法。