CN109925717A - 一种游戏胜率的预测方法、模型生成方法和装置 - Google Patents

一种游戏胜率的预测方法、模型生成方法和装置 Download PDF

Info

Publication number
CN109925717A
CN109925717A CN201910168791.1A CN201910168791A CN109925717A CN 109925717 A CN109925717 A CN 109925717A CN 201910168791 A CN201910168791 A CN 201910168791A CN 109925717 A CN109925717 A CN 109925717A
Authority
CN
China
Prior art keywords
model
training
prediction
timesharing
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910168791.1A
Other languages
English (en)
Other versions
CN109925717B (zh
Inventor
蔡康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN201910168791.1A priority Critical patent/CN109925717B/zh
Publication of CN109925717A publication Critical patent/CN109925717A/zh
Application granted granted Critical
Publication of CN109925717B publication Critical patent/CN109925717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种游戏胜率的预测方法、模型生成方法和装置,通过获取实时游戏战斗数据中预测时间点的特征数据,特征数据包括状态实时数据和团队位置数据,将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型,其中,分时预测模型具有多个输出节点,获取分时预测模型的多个输出节点输出的多个预测结果,根据所述多个预测结果,生成胜率预测信息。通过预设的分时预测模型对游戏参与的各方的胜率进行实时预测,可以实现在游戏进行的过程中,在预测时间点进行动态地对参与方进行胜率预测,提高了用户的游戏体验,在进行观战或赛事直播的时候,通过实时胜率预测,可以方便观战者更好地理解战场局势,提高观战的趣味性。

Description

一种游戏胜率的预测方法、模型生成方法和装置
技术领域
本申请涉及游戏技术领域,特别是涉及一种游戏胜率的预测方法、一种分时预测模型生成方法、一种游戏胜率的预测装置以及一种分时预测模型生成装置。
背景技术
受到人工智能(Artificial Intelligence,AI)发展浪潮的推动,近年来游戏AI也进入了发展的高速路上,无论是围棋的alpha go,DOTA2的open AI,都是AI在游戏领域的重大突破,颠覆了以往人们对AI极限的认知。
游戏本身可以与现实世界有一个比较完整的映射关系,解决游戏问题,在一定程度上表明了其解决现实世界问题的能力,所以游戏AI的发展对人类社会的发展也起着重要的、积极的作用。对于游戏AI本身而言,它包含的概念是很广泛的,从辅助工具性质的AI,比如装备推荐、技能加点推荐、商城虚拟物品推荐等,到与玩家对抗的智能AI,AI正全方面地增加游戏体验,其中,游戏胜负预测技术就是其中的一项重要的功能。具体而言,游戏胜负预测在多方面的应用可以发挥重要作用:
1.用于自适应AI的设计。游戏AI在很多情况下策划不会强制要求AI做出怎样的行为,而是希望它在与人类对抗时能打出所谓的“质量局”,然后最终输掉比赛,提高玩家的成就感。现实场景中,很难用固定难度去满足所有玩家的需求,即使通过对玩家实力的评估,来预设不同等级的AI,也难以保证AI在不同比赛中都能够产生足够的对抗性。其中包含两个因素:第一是策划为了保证AI自然地输掉比赛通常会考虑玩家水平的下限,这样也就难以满足高水平玩家的需求;第二是阵容不同、前期发挥不同,会导致中后期的对抗局面完全不同,固定难度的AI根本无法解决这种随机性。因此,当我们知道一场比赛双方的实时胜率,就可以相应地动态提高或降低AI的难度,来满足对抗性。
2.策略层面强化学习的反馈参数。强化学习是游戏AI常用的无监督学习方法,通常强化学习应用在低层次操作上会有意想不到的效果,但在高层次决策上,通常还是采用有监督学习的方法,而很难应用强化学习,一个重要原因在于对于高层次决策,较难对不同决策进行相应的评估。假设知道一场比赛玩家双方的实时胜率,就能直接给出高层次决策影响的胜率变化作为合理的评估。
3.观战和赛事的辅助工具。观战或者赛事直播的时候,游戏胜负预测不仅可以方便新手们更好地理解局势,还可以提高观战的趣味性,例如翻盘局会显得更刺激。
目前,对游戏胜负预测仅仅只是对游戏的胜负进行预测,其或是非实时预测,或是非战斗内预测,或是只对胜负进行预测,因此,需要一种更加合理、直观效果上体验更优秀的游戏胜负预测方案。
发明内容
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种游戏胜率的预测方法、一种分时预测模型生成方法以及相应的一种游戏胜率的预测装置、一种分时预测模型生成装置。
为了解决上述问题,本申请实施例公开了一种游戏胜率的预测方法,包括:
获取实时游戏战斗数据中预测时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型,其中,所述分时预测模型具有多个输出节点;
获取所述分时预测模型的所述多个输出节点输出的多个预测结果;
根据所述多个预测结果,生成胜率预测信息。
可选的,所述预设分时预测模型包括每分钟模型和最后一分钟模型,所述每分钟模型和所述最后一分钟模型具有相同预设数目的输出节点,所述获取所述分时预测模型的所述多个输出节点输出的多个预测结果,包括:
获取所述每分钟模型的多个输出节点输出的第一预测结果;
获取所述最后一分钟模型的多个输出节点输出的第二预测结果。
可选的,所述根据所述多个预测结果,生成胜率预测信息,包括:
确定与所述第一预测结果匹配的第一权重系数,以及确定与所述第二预测结果匹配的第二权重系数;
采用所述第一权重系数、所述第二权重系数、所述第一预测结果以及所述第二预测结果,生成所述胜率预测信息。
可选的,所述将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型之前,还包括:
将所述预测时间点的特征数据进行向量化,生成预测时间点的特征向量。
可选的,所述特征向量包括第一方玩家的特征向量和第二方玩家的特征向量,所述将所述预测时间点的特征数据输入与所述预测时间点对应的分时预测模型,包括:
将所述第一方玩家的特征向量与所述第二方玩家的特征向量正向拼接,得到正向特征向量;
将所述第一方玩家的特征向量与所述第二方玩家的特征向量反向拼接,得到反向特征向量;
将所述预测时间点的正向特征向量输入与所述预测时间点对应的分时预测模型,以及将所述预测时间点的反向特征向量输入与所述预测时间点对应的分时预测模型。
可选的,所述获取所述分时预测模型的所述多个输出节点输出的多个预测结果,包括:
获取所述分时预测模型的所述多个输出节点输出的与所述正向特征向量对应的预测结果;
获取所述分时预测模型的所述多个输出节点输出的与所述反向特征向量对应的预测结果。
可选的,所述根据所述多个预测结果,生成胜率预测信息,包括:
计算与所述正向特征数据对应的预测结果以及与所述反向特征数据对应的预测结果的平均值;
采用所述平均值,生成所述胜率预测信息。
可选的,所述分时预测模型包括每分钟模型和最后一分钟模型,所述每分钟模型和所述最后一分钟模型分别具有预设数目的隐藏层,以及与最后一层隐藏层连接的Softmax层,所述Softmax层分别与所述多个输出节点连接;所述Softmax层用于将所述最后一层隐藏层的输出结果进行转换,并将转换后的输出结果分别输入到所述多个输出节点。
可选的,所述分时预测模型通过如下方式生成:
获取训练样本数据以及初始分时预测模型,其中,所述训练样本数据包括训练时间点的特征数据;
采用所述训练样本数据生成训练特征向量;
采用所述训练特征向量以及所述初始分时预测模型进行训练。
可选的,还包括:
采用所述预测结果,生成所述分时预测模型的预测曲线;
对所述预测曲线进行滤波处理。
本申请实施例还公开了一种分时预测模型的生成方法,包括:
获取训练样本数据以及初始分时预测模型,其中,所述训练样本数据包括训练时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
采用所述训练样本数据生成训练特征向量;
采用所述训练特征向量以及所述初始分时预测模型进行训练。
可选的,所述采用所述训练样本数据生成训练特征向量,包括:
获取所述训练样本数据中每分钟的特征数据;
采用每分钟中训练时间点的特征数据,生成与所述训练时间点匹配的训练特征向量。
可选的,所述初始分时预测模型包括初始每分钟模型和初始最后一分钟模型,所述采用所述训练特征向量以及所述初始分时预测模型进行训练,包括:
采用所述训练样本数据中每分钟与所述训练时间点匹配的训练特征向量以及所述初始每分钟模型进行模型训练;
采用所述训练样本数据中最后一分钟与所述训练时间点匹配的训练特征向量以及所述初始最后一分钟模型进行模型训练。
可选的,所述分时预测模型包括每分钟模型和最后一分钟模型,所述每分钟模型和所述最后一分钟模型分别具有预设数目的隐藏层,以及与最后一层隐藏层连接的Softmax层,所述Softmax层分别与所述多个输出节点连接;所述Softmax层用于将所述最后一层隐藏层的输出结果进行转换,并将转换后的输出结果分别输入到所述多个输出节点。
可选的,所述采用所述训练样本数据中每分钟与所述训练时间点匹配的训练特征向量以及所述初始每分钟模型进行模型训练,包括:
通过所述预设数目的隐藏层每一神经元的激活函数对所述与所述训练时间点匹配的训练特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至所述Softmax层;
通过所述Softmax层根据所述输出结果,计算所述每分钟模型的损失函数,并生成与所述损失函数对应的多个第一梯度值;
通过所述输出节点判断所述多个第一梯度值是否满足预设阈值条件;
若否,则根据所述多个第一梯度值更新所述每一神经元的激活函数的参数,继续训练所述初始每分钟模型;
若是,则得到训练之后的每分钟模型。
可选的,所述采用所述训练样本数据中最后一分钟与所述训练时间点匹配的训练特征向量以及所述初始最后一分钟模型进行模型训练,包括:
通过所述预设数目的隐藏层每一神经元的激活函数对所述最后一分钟与所述训练时间点匹配的训练特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至所述Softmax层;
通过所述Softmax层根据所述输出结果,计算所述初始最后一分钟模型的损失函数,并生成与所述损失函数对应的多个第二梯度值;
通过所述输出节点判断所述多个第二梯度值是否满足预设阈值条件;
若否,则根据所述多个第二梯度值更新所述每一神经元的激活函数的参数,继续训练所述初始最后一分钟模型;
若是,则得到训练后的最后一分钟模型。
可选的,还包括:
获取验证样本数据以及获取多个训练后的分时预测模型,其中,所述验证样本数据包括所述训练时间点的特征数据;
采用所述验证样本数据生成验证特征向量;
将所述验证特征向量输入多个训练后的分时预测模型进行交叉验证,并计算验证后的分时预测模型的多个验证误差值;
根据所述多个验证误差值,确定目标分时预测模型。
可选的,所述根据所述多个验证误差值,确定目标分时预测模型,包括:
判断所述多个验证误差值是否满足预设误差阈值;
若是,将满足所述预设误差阈值的分时预测模型作为所述目标分值预测模型。
本申请实施例还公开了一种游戏胜率的预测装置,包括:
特征数据获取模块,用于获取实时游戏战斗数据中预测时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
特征数据预测模块,用于将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型,其中,所述分时预测模型具有多个输出节点;
预测结果获取模块,用于获取所述分时预测模型的所述多个输出节点输出的多个预测结果;
预测信息生成模块,用于根据所述多个预测结果,生成胜率预测信息。
本申请实施例还公开了一种分时预测模型的生成装置,包括:
训练样本数据获取模块,用于获取训练样本数据以及初始分时预测模型,其中,所述训练样本数据包括训练时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
训练特征向量生成模块,用于采用所述训练样本数据生成训练特征向量;
模型训练模块,用于采用所述训练特征向量以及所述初始分时预测模型进行训练。
本申请实施例还公开了一种装置,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如上所述游戏胜率的预测方法或分时预测模型的生成方法。
本申请实施例还公开了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如上所述游戏胜率的预测方法或分时预测模型的生成方法。
本申请实施例包括以下优点:
在本申请实施例中,通过获取实时游戏战斗数据中预测时间点的特征数据,特征数据包括状态实时数据和团队位置数据,将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型,其中,分时预测模型具有多个输出节点,获取分时预测模型的多个输出节点输出的多个预测结果,根据所述多个预测结果,生成胜率预测信息。通过预设的分时预测模型对游戏参与的各方的胜率进行实时预测,可以实现在游戏进行的过程中,在预测时间点进行动态地对参与方进行胜率预测,提高了用户的游戏体验,在进行观战或赛事直播的时候,通过实时胜率预测,可以方便观战者更好地理解战场局势,提高观战的趣味性。
同时,在游戏胜率预测过程中,采用融合模型的方式,对每分钟模型和最后一分钟模型的输出结果进行加权处理,得到最终的胜率预测信息,使实时胜率预测更加准确,提高了分时预测模型在游戏的判定准确率。
附图说明
图1是本申请的一种游戏胜率的预测方法一实施例的步骤流程图;
图2是本申请的一种游戏胜率的预测方法另一实施例的步骤流程图;
图3是本申请的一种分时预测模型的生成方法一实施例的步骤流程图;
图4是本申请的一种分时预测模型的生成方法另一实施例的步骤流程图;
图5为本申请的一种分时预测模型的生成方法实施例中交叉验证的示意图;
图6是本申请的一种游戏胜率的预测装置实施例的结构框图;
图7是本申请的一种分时预测模型的生成装置的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本申请的一种游戏胜率的预测方法一实施例的步骤流程图,具体可以包括如下步骤:
步骤101,获取实时游戏战斗数据中预测时间点的特征数据;
为了方便描述和理解,本申请实施例以多人在线战术竞技游戏(MultiplayerOnline Battle Arena,MOBA)为例进行说明。在MOBA网络游戏场景中,玩家通常被分为两队,两队在分散的游戏地图中互相竞争,在地图中,除了玩家双方选择的虚拟英雄角色外,还有小兵、防御塔、小野怪、特殊野怪等非玩家操控的游戏单位(Non-Player Character,NPC),每个玩家都通过控制所选的虚拟英雄角色在地图上击杀敌方英雄或中立方单位,获取资源,最终摧毁敌方基地,获取最终胜利。在游戏中,双方玩家的游戏战斗数据时刻在变化,通过获取双方游戏战斗数据中预测时间点的特征数据,并通过分时预测模型对特征数据进行胜率预测,可以得到双方获胜的概率。
需要说明的是,本申请实施例的实时胜率预测还可以应用于其他的游戏胜率预测场景中,如动作类游戏、策略模拟类、即时战略游戏等等,本申请对此不作限制。
在本申请实施例中,游戏参与方在游戏中的实时游戏战斗数据可以包括虚拟英雄当前血量、虚拟英雄当前魔法量、虚拟英雄技能冷却时间、虚拟金钱、虚拟英雄经验值、击杀敌方英雄值、防御塔、虚拟英雄等级、增益加成归属方、特殊增益加成、团队质心、团队一阶矩、团队二阶矩以及团队直径等,在游戏进行的过程中,上述游戏战斗数据可以随时间的变换而发生变化。通过在游戏进行的过程中,获取预测时间点的游戏战斗数据,可以动态地对参与方的胜率进行预测。
在具体实现中,在游戏进行的过程中,可以在预测时间点获取游戏参与方游戏战斗数据中的特征数据。特征数据可以包括状态实时数据和团队位置信息,其中,状态实时数据可以包括虚拟金钱、虚拟英雄经验值、击杀敌方英雄值、防御塔、虚拟英雄等级、增益加成归属方以及特殊增益加成,虚拟金钱表示虚拟英雄的装备价值与未消费虚拟金钱的总和,虚拟英雄经验值表示从开局到当前获取的经验总数,击杀敌方英雄值表示击杀敌方虚拟英雄的数目,防御塔表示地图中上、中、下路剩余防御塔的数目,虚拟英雄等级表示当前虚拟英雄的等级,增益加成归属方表示击杀特殊NPC的增益归属权,特殊增益加成表示击杀特殊NPC的增加加成;团队位置信息可以包括团队质心、团队一阶矩、团队二阶矩以及团队直径,团队质心表示各个成员位置质心的位置,团队一阶矩表示各个成员到团队位置质心的平均距离,团队二阶矩表示各个成员到团队位置质心的标准差,团队直径表示同一阵营中相隔最远队员的距离。
在本申请实施例的一种示例中,假设每分钟对参与方的胜率进行预测,即当游戏时长为1分钟时,获取游戏参与方当前游戏战斗数据中的特征数据,当游戏时长为2分钟时,获取游戏参与方当前游戏战斗数据中的特征数据,当游戏时长为3分钟时,获取游戏参与方当前游戏战斗数据中的特征数据…当游戏时长为N分钟时,获取游戏参与方当前游戏战斗数据中的特征数据,直到游戏结束前的最后一分钟,从而可以在游戏进行的过程中,对游戏参与方的胜率进行实时地预测。
步骤102,将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型;
在本申请实施例中,分时预测模型包括每分钟模型和最后一分钟模型,其中,每分钟模型和最后一分钟模型具有相同数目的输出节点,在游戏过程中,获取预测时间点的特征数据,并对特征数据进行向量化,接着将预测时间点的特征向量分别输入与预测时间点对应的分时预测模型中进行胜率预测。
在具体实现中,将游戏参与方各方预测时间点的特征向量按照一定拼接规则进行拼接,接着将预测时间点的特征向量输入与预测时间点对应的每分钟模型,以及将预测时间点的特征向量输入与预测时间点对应的最后一分钟模型,则每分钟模型和最后一分钟模型的多个输出节点可以根据特征向量的拼接关系输出对应的预测结果。
其中,拼接规则可以为游戏参与方各方的特征向量的组合拼接关系,可以包括游戏参与方的数量阶层种组合拼接关系,如当游戏参与方为两方时,则可以包括2种组合拼接关系;当游戏参与方为三方时,则可以包括6种组合拼接关系;当游戏参与方为四方时,则可以包括24种组合关系等。分时预测模型输出节点输出的预测结果与特征向量的组合拼接关系对应,当特征向量的组合拼接关系变化时,输出节点输出的预测结果的排列顺序也随之改变,预测结果的数值也可以随之改变。
在本申请实施例的一种示例中,可以按照正向拼接或反向拼接对游戏参与方各方的特征向量进行拼接,如游戏参与方包括白方和黑方,以白方在先为正向,黑方在先为反向,则正向拼接的特征向量为“白方特征向量+黑方特征向量”,分时预测模型输出的预测结果对应为“白方胜率+黑方胜率”;反向拼接的特征向量为“黑方特征向量+白方特征向量”,分时预测模型输出的预测结果对应为“黑方胜率+白方胜率”。
此外,在进行胜率预测的过程中,由于按照相同的拼接规则对游戏参与方各方的特征向量进行拼接,然后分别输入每分钟模型和最后一分钟模型,则每分钟模型和最后一分钟模型的输出节点输出的预测结果排列顺序相互对应。
在本申请实施例的另一种示例中,可以按照正向拼接或反向拼接对游戏参与方各方的特征向量进行拼接,然后分别输入每分钟模型和最后一分钟模型,假设游戏参与方包括白方和黑方,以白方为正反,则正向拼接的特征向量为“白方特征向量+黑方特征向量”,每分钟模型输出的预测结果对应为“白方胜率+黑方胜率”,最后一分钟模型输出的预测结果也对应为“白方胜率+黑方胜率”;反向拼接的特征向量为“黑方特征向量+白方特征向量”,每分钟模型输出的预测结果对应为“黑方胜率+白方胜率”,最后一分钟模型输出的预测结果也对应为“黑方胜率+白方胜率”。
步骤103,获取分时预测模型的多个输出节点输出的多个预测结果;
在具体实现中,分时预测模型包括每分钟模型和最后一分钟模型,通过将预测时间点的特征向量输入与预测时间点对应的每分钟模型,可以获得每分钟模型多个输出节点输出的第一预测结果,将预测时间点的特征向量输入与预测时间点对应的最后一分钟模型,可以获得最后一分钟模型多个输出节点输出的第二预测结果。
步骤104,根据多个预测结果,生成胜率预测信息。
在本申请实施例中,采用双模型的胜率预测方式对游戏参与方的胜率进行预测,针对不同预测时间点,动态调整各个模型预测结果的权重系数,充分发挥各模型的预测效果,提高了实时对游戏参与方各方胜率的预测准确度。
在具体实现中,可以获取每分钟模型多个输出节点输出的第一预测结果,以及获取最后一分钟模型多个输出节点输出的第二预测结果,接着确定与第一预测结果匹配的第一权重系数,以及确定与第二预测结果匹配的第二权重系数,然后采用第一预测结果、第二预测结果、第一权重系数以及第二权重系数,计算每分钟模型和最后一分钟模型输出的预测结果的加权值,将加权值作为胜率预测信息。
在本申请实施例的一种示例中,可以通过如下加权公式将每分钟模型和最后一分钟模型的预测结果进行融合,提高对游戏参与方各方胜率的预测准确率。
w=min(max(t-n,0)*0.2,1.0)
其中,t表示游戏进行的分钟数,n表示临界时间值,w是加权值,是每分钟模型的预测结果,是最后一分钟模型的预测结果。则在第n分钟前,胜率完全由每分钟模型预测;在第n分钟后,逐渐提高最后一分钟模型的预测结果权重,在n+5分钟的时候达到1.0,在n+5分钟之后完全由最后一分钟模型预测。
如,当n为11时,表示在第11分钟前,胜率完全由每分钟模型预测,在第11分钟后,逐渐提高最后一分钟模型的预测结果权重,在16分钟的时候达到1.0,即16分钟之后完全由最后一分钟模型预测。
在具体实现中,游戏参与方往往包括至少两方,则每分钟模型和最后一分钟模型输出的预测结果也包括至少两个,此外,输入每分钟模型和最后一分钟模型的特征向量采用相同的拼接规则,则每分钟模型和最后一分钟模型的多个输出节点输出的预测结果的排列顺序相同,可以根据加权公式对每分钟模型和最后一分钟模型的所有预测结果分别进行加权处理,生成胜率预测信息。
在本申请实施例的另一种示例中,以游戏参与方包括白方和黑方为例进行示例性说明,特征向量采用正向拼接方式进行拼接,游戏预测时间点的临界时间点为第11分钟,则当游戏进行到第7分钟时,每分钟模型输出的预测结果为(白方胜率0.6,黑方胜率0.4),最后一分钟模型输出的预测结果为(白方胜率0.8,黑方胜率0.2),根据加权公式,可以确定第7分钟时每分钟模型对应的第一权重系数为1,最后一分钟模型对应的第二权重系数为0,进行加权处理后,可以得到最终的预测结果为(白方胜率0.6,黑方胜率0.4);
当游戏进行到第13分钟时,每分钟模型输出的预测结果为(白方胜率0.65,黑方胜率0.35),最后一分钟模型输出的预测结果为(白方胜率0.85,黑方胜率0.15),根据加权公式,可以确定第13分钟时每分钟模型对应的第一权重系数为0.4,最后一分钟模型对应的第二权重系数为0.6,则对每分钟模型和最后一分钟模型的所有预测结果进行加权处理,其中,白方胜率为:0.65*0.4+0.85*0.6=0.77,黑方胜率为:0.35*0.4+0.15*0.6=0.23;
当游戏进行到第18分钟时,每分钟模型输出的预测结果为(白方胜率0.55,黑方胜率0.45),最后一分钟模型输出的预测结果为(白方胜率0.8,黑方胜率0.2),根据加权公式,可以确定第18分钟时每分钟模型对应的第一权重系数为0,最后一分钟模型对应的第二权重系数为1,进行加权处理后,可以得到最终的预测结果为(白方胜率0.8,黑方胜率0.2)。
需要说明的是,在本申请中临界时间值包括但不限于实施例所描述的数值,在进行游戏时,该数值的设定可以根据游戏的类型、游戏参与方的数量以及游戏实时状态数据等进行设置,本申请对此不作限制。
在本申请实施例中,通过将获取预测时间点的特征数据,并将特征数据进行向量化得到特征向量,接着将特征向量输入分时预测模型,其中,分时预测模型包括每分钟模型和最后一分钟模型;每分钟模型和最后一分钟模型均分别具有预设数目的隐藏层,以及与最后一层隐藏层连接的Softmax层,Softmax层分别与多个输出节点连接,Softmax层用于将最后一层隐藏层的输出结果进行转换,并将转换后的输出结果分别输入到多个输出节点,从而通过多个输出节点输出多个预测结果。
其中,每分钟模型和最后一分钟模型中可以包括3层隐藏层。当然,本领域技术人员还可以根据需要设置其他数目的隐藏层,本申请实施例对此并不限制。
通过Softmax层可以将最后一层隐藏层输出的结果向量进行归一化,得到相应的概率值,接着将概率值通过多个输出节点进行输出。
在具体实现中,将特征向量输入分时预测模型,通过分时预测模型中的若干层隐藏层对特征向量进行处理,接着Softmax层对最后一层隐藏层输出的结果向量进行转换,得到相应的概率值,即游戏参与方获胜的概率,然后对多个预测结果进行展示。
在本申请实施例的一种优选实施例中,分时预测模型可以通过如下步骤生成:
获取训练样本数据以及初始分时预测模型;
在具体实现中,训练样本数据包括训练时间点的特征数据,样本数据可以是从游戏录像数据中提取的游戏参与方的状态实时数据以及团队位置数据。
采用训练样本数据生成训练特征向量;
在具体实现中,在获取样本数据之后,可以将样本数据中游戏参与方用于胜率预测的特征数据按照唯一ID拼接到一起,生成预测特征数据,并对预测特征数据进行向量化,以生成样本数据的训练特征向量信息。
采用训练特征向量以及初始分时预测模型进行训练。
在具体实现中,在进行模型训练时,将分时预测模型的损失函数作为分时预测模型的监督和指导。
在本申请实施例中,可以设置模型训练的停止条件是:分时预测模型的损失函数最小化,当分时预测模型的多个损失函数都最小化时,停止训练分时预测模型。
在本申请实施例中,通过获取实时游戏战斗数据中预测时间点的特征数据,特征数据包括状态实时数据和团队位置数据,将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型,其中,分时预测模型具有多个输出节点,获取分时预测模型的多个输出节点输出的多个预测结果,根据所述多个预测结果,生成胜率预测信息。通过预设的分时预测模型对游戏参与的各方的胜率进行实时预测,可以实现在游戏进行的过程中,在预测时间点进行动态地对参与方进行胜率预测,提高了用户的游戏体验,在进行观战或赛事直播的时候,通过实时胜率预测,可以方便观战者更好地理解战场局势,提高观战的趣味性。
同时,在游戏胜率预测过程中,采用融合模型的方式,对每分钟模型和最后一分钟模型的输出结果进行加权处理,得到最终的胜率预测信息,使实时胜率预测更加准确,提高了分时预测模型在游戏的判定准确率。
参照图2,示出了本申请的一种游戏胜率的预测方法另一实施例的步骤流程图,具体可以包括如下步骤:
步骤201,获取实时游戏战斗数据中预测时间点的特征数据;
在具体实现中,在游戏开局之后,可以实时获取游戏战斗数据中预测时间点的特征数据,其中,特征数据包括游戏参与方的状态实时数据和团队位置数据。
步骤202,将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型;
在本申请实施例中,需要将预测时间点的特征数据进行向量化,从而获得预测时间点的特征向量,以输入分时预测模型进行游戏参与方的胜率预测。
在本申请实施例的一种优选实施例中,步骤202可以包括如下子步骤:
子步骤S11,将第一方玩家的特征向量与第二方玩家的特征向量正向拼接,得到正向特征向量;
子步骤S12,将第一方玩家的特征向量与第二方玩家的特征向量反向拼接,得到反向特征向量;
子步骤S13,将预测时间点的正向特征向量输入与预测时间点对应的分时预测模型,以及将预测时间点的反向特征向量输入与预测时间点对应的分时预测模型。
在具体实现中,可以获取游戏参与方双方的特征数据,并将特征数据转换为特征向量,接着将两方的特征向量进行反转拼接,并输入分时预测模型,进行游戏双方的胜率预测。
其中,将第一方玩家的特征向量与第二方玩家的特征向量进行顺序正向拼接,得到正向特征向量,接着将预测时间点的正向特征向量输入与预测时间点对应的分时预测模型,以获得与正向特征向量对应的预测结果;将第一方玩家的特征向量与第二方玩家的特征向量进行反向拼接,得到反向特征向量,接着将预测时间点的反向特征向量输入与预测时间点对应的分时预测模型,以获得与反向特征向量对应的预测结果。
并且,在进行特征反转拼接的过程中,分时预测模型的多个输出节点输出的预测结果的排列顺序进行对应地反转,以适配输入的特征向量。
步骤203,获取分时预测模型的多个输出节点输出的多个预测结果;
在具体实现中,将正向特征向量和反向特征向量输入分时预测模型,通过分时预测模型中的若干层隐藏层对特征向量进行处理,接着Softmax层对最后一层隐藏层输出的结果向量进行转换,得到相应的概率值,即游戏参与方获胜的概率。
在本申请实施例的一种优选实施例中,步骤203可以包括如下子步骤:
获取分时预测模型的多个输出节点输出的与正向特征向量对应的预测结果;获取分时预测模型的多个输出节点输出的与反向特征向量对应的预测结果。
在具体实现中,对于输入分时预测模型的正向特征向量,可以得到多个输出节点输出的与正向特征向量对应的预测结果,对于输入分时预测模型的反向特征向量,可以得到多个输出节点输出的与反向特征向量对应的预测结果。
步骤204,根据多个预测结果,生成胜率预测信息。
在具体实现中,获得与正向特征向量对应的预测结果以及与反向特征向量对应的预测结果后,可以对预测结果进行加权处理,生成最终的胜率预测信息。
在本申请实施例的一种优选实施例中,步骤204可以包括如下子步骤:
计算与正向特征数据对应的预测结果以及与反向特征数据对应的预测结果的平均值;采用平均值,生成胜率预测信息。
在具体实现中,分时预测模型包括每分钟模型和最后一分钟模型,通过将正向特征向量和反向特征向量分别输出每分钟模型,可以获得每分钟模型输出的正向预测结果和反向预测结果,通过将正向特征向量和反向特征向量分别输出最后一分钟模型,可以获得最后一分钟模型输出的正向预测结果和反向预测结果,接着计算每分钟模型正向预测结果和反向预测结果的平均值,以及计算最后一分钟模型正向预测结果和反向预测结果的平均值,然后根据加权公式对每分钟模型和最后一分钟模型的预测结果的平均值进行加权处理,生成胜率预测信息,从而将获取的预测时间点的特征向量反转进行二次预测,并将预测结果与原始特征预测结果做平均,提高胜率预测的准确性和稳定性。
在本申请实施例的一种示例中,游戏参与方包括白方和黑方,对白方和黑方的特征向量进行正方向拼接,假设当前每分钟模型和最后一分钟模型的权重系数均为0.5,则每分钟模型输出的正向预测结果为(白方胜率0.65,黑方胜率0.35),反向预测结果为(黑方胜率0.45,白方胜率0.55);最后一分钟模型输出的正向预测结果为(白方胜率0.85,黑方胜率0.15),反向预测结果为(黑方胜率0.05,白方胜率为0.95),首先对每分钟模型输出的预测结果进行平均处理得到(白方胜率0.6,黑方胜率0.4),对最后一分钟模型的预测结果进行平均处理得到(白方胜率0.9,黑方胜率0.1),接着对每分钟模型和最后一分钟模型的预测结果进行加权处理,其中,白方胜率为:0.6*0.5+0.9*0.5=0.75,黑方胜率为:0.4*0.5+0.1*0.5=0.25。
需要说明的是,在本申请中预测结果包括但不限于实施例所描述的数值,本申请对此不作限制。
步骤205,采用预测结果,生成分时预测模型的预测曲线;
在具体实现中,根据不同预测时间点得到对应的预测结果后,可以采用不同预测时间点的预测结果生成分时预测模型的预测曲线。
步骤206,对预测曲线进行滤波处理。
在具体实现中,可以通过如下方式对分时预测模型的预测曲线进行滤波处理,提高胜率曲线显示的舒适度,为玩家提供更好的游戏体验。
其中,是当前采样点平滑后的胜率值,yt-1是前一采样点平滑后的胜率值,yt是当前采样点的胜率值,w是平滑权值。具体的,通过每10秒预测一次结果,10倍插值,利用前一帧和当前帧的加权平均值作为平滑后的值,其中,在本实施例中w选取0.85作为平滑权值。
在本申请实施例的一种优选实施例中,分时预测模型可以通过如下步骤生成:
获取训练样本数据以及初始分时预测模型;
在具体实现中,训练样本数据包括训练时间点的特征数据,样本数据可以是从游戏录像数据中提取的游戏参与方的状态实时数据以及团队位置数据。
采用训练样本数据生成特征向量;
在具体实现中,在获取样本数据之后,可以将样本数据中游戏参与方用于胜率预测的特征数据按照唯一ID拼接到一起,生成预测特征数据,并对预测特征数据进行向量化,以生成样本数据的特征向量信息。
采用特征向量以及初始分时预测模型进行训练,并计算训练之后的分时预测模型的损失函数;
在具体实现中,在进行模型训练时,将分时预测模型的损失函数作为分时预测模型的监督和指导。
当训练之后的分时预测模型的损失函数都最小化时,停止训练分时预测模型。
在本申请实施例中,可以设置模型训练的停止条件是:分时预测模型的损失函数都最小化,当训练之后的分时预测模型的多个损失函数都最小化时,停止训练分时预测模型。
在本申请实施例中,通过获取实时游戏战斗数据中预测时间点的特征数据,特征数据包括状态实时数据和团队位置数据,将预测时间点的特征数据输入与预测时间点对应的预设分时预测模型,其中,分时预测模型具有多个输出节点,获取分时预测模型的多个输出节点输出的多个预测结果,根据所述多个预测结果,生成胜率预测信息。通过预设的分时预测模型对游戏参与的各方的胜率进行实时预测,可以实现在游戏进行的过程中,在预测时间点进行动态地对参与方进行胜率预测,提高了用户的游戏体验,在进行观战或赛事直播的时候,通过实时胜率预测,可以方便观战者更好地理解战场局势,提高观战的趣味性。
同时,在游戏胜率预测过程中,采用融合模型的方式,对每分钟模型和最后一分钟模型的输出结果进行加权处理,得到最终的胜率预测信息,使实时胜率预测更加准确,提高了分时预测模型在游戏的判定准确率。
参照图3,示出了本申请的一种分时预测模型的生成方法一实施例的步骤流程图,具体可以包括如下步骤:
步骤301,获取训练样本数据以及初始分时预测模型;
在本申请实施例中,训练样本数据包括训练时间点的特征数据,特征数据包括状态实时数据和团队位置数据。其中,样本数据可以是从游戏录像数据中提取的游戏战斗数据,游戏战斗数据可以包括虚拟英雄当前血量、虚拟英雄当前魔法量、虚拟英雄技能冷却时间、虚拟金钱、虚拟英雄经验值、击杀敌方英雄值、防御塔、虚拟英雄等级、增益加成归属方、特殊增益加成、团队质心、团队一阶矩、团队二阶矩以及团队直径等。
状态实时数据可以包括:虚拟金钱、虚拟英雄经验值、击杀敌方英雄值、防御塔、虚拟英雄等级、增益加成归属方以及特殊增益加成等。
团队位置数据可以包括:团队质心、团队一阶矩、团队二阶矩以及团队直径等。
在具体实现中,在模型训练的准备阶段,可以获取一初始分时预测模型,以使用样本数据对初始分时预测模型进行训练,生成合适的分时预测模型。
步骤302,采用训练样本数据生成训练特征向量;
在具体实现中,在获取样本数据之后,可以将样本数据中游戏参与方用于胜率预测的特征数据按照唯一ID拼接到一起,生成预测特征数据,并对预测特征数据进行向量化,以生成样本数据的训练特征向量信息。
在本申请实施例的一种优选实施例中,步骤302可以包括如下子步骤:
获取训练样本数据中每分钟的特征数据;
采用每分钟中训练时间点的特征数据,生成与训练时间点匹配的特征向量。
在具体实现中,为了使分时预测模型更有效地包含时间信息,获取样本数据中每一分钟的特征数据,进一步采用每分钟中训练时间点的特征数据,生成与训练时间点匹配的训练特性向量信息。
步骤303,采用训练特征向量以及初始分时预测模型进行训练;
在本申请实施例中,通过样本数据,得到每分钟中训练时间点的训练特征向量信息后,可以采用训练特征向量以及初始分时预测模型进行训练,并计算初始分时预测模型的损失函数,通过损失函数对分时预测模型进行监督和指导。
在具体实现中,初始分时预测模型可以包括初始每分钟模型和初始最后一分钟模型,通过将每分钟中与训练时间点对应的训练特征向量信息分别输入初始每分钟模型和初始最后一分钟模型进行训练,可以得到训练后的每分钟模型和最后一分钟模型。
在具体实现中,可以设置训练的停止条件是:分时预测模型的损失函数最小化。当训练之后的分时预测模型的损失函数最小化时,停止训练分时预测模型。
在本申请实施例的一种优选实施例中,分时预测模型包括每分钟模型和最后一分钟模型,其中,每分钟模型和最后一分钟模型分别具有预设数目的隐藏层,以及与最后一层隐藏层连接的Softmax层,Softmax层分别与多个输出节点连接;Softmax层用于将最后一层隐藏层的输出结果进行转换,并将转换后的输出结果分别输入到多个输出节点。
其中,每分钟模型和最后一分钟模型均可以包括3层隐藏层,输出节点根据游戏参与方的数目进行设置,如游戏参与方为两方,则输出节点的个数为2;游戏参与方三方,则输出节点的个数为3。当然,本领域技术人员还可以根据需要设置其他数目的隐藏层,以及设置其他的输出节点数目,本申请实施例对此并不限制。
在本申请实施例的一种优选实施例中,步骤303可以包括如下子步骤:
子步骤S21,采用训练样本数据中每分钟与训练时间点匹配的训练特征向量以及初始每分钟模型进行模型训练;
在具体实现中,通过训练样本数据得到每分钟中训练时间点的特征向量信息后,可以采用每分钟与训练时间点匹配的训练特征向量信息以及初始每分钟模型进行模型训练,从而得到训练后的每分钟模型。
在本申请实施例的一种示例中,子步骤S21可以包括如下步骤:
子步骤S211,通过预设数目的隐藏层每一神经元的激活函数对与训练时间点匹配的训练特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至Softmax层;
子步骤S212,通过Softmax层根据输出结果,计算每分钟模型的损失函数,并生成与损失函数对应的多个第一梯度值;
子步骤S213,通过输出节点判断多个第一梯度值是否满足预设阈值条件;
子步骤S214,若否,则根据多个第一梯度值更新每一神经元的激活函数的参数,继续训练初始每分钟模型;
子步骤S215,若是,则得到训练之后的每分钟模型。
在深度神经网络中,隐藏层、连接层和输出层的神经元都是拥有激活函数的功能神经元,功能神经元可以对接收的信号进行处理。
在本申请实施例中,对每一训练样本数据的训练过程都可以包括如下操作流程:将特征向量信息输入初始每分钟模型的输入层,通过输入层将特征向量信息传递至隐藏层;然后通过隐藏层每一神经元的激活函数对特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至Softmax层;通过Softmax层根据输出结果,计算每分钟模型的损失函数,并生成与损失函数对应的多个梯度值;通过输出节点判断多个梯度值是否满足预设阈值条件;若否,则根据多个梯度值更新每一神经元的激活函数的参数,继续训练初始每分钟模型;若是,则得到训练后的每分钟模型。
在进行模型训练时,循环执行以上的操作流程,直到达到预设的停止条件为止。
其中,对激活函数的参数更新,可以是基于梯度下降策略,以目标的负梯度方向对参数进行更新。在具体实现中,可以预设一学习率,控制每一轮训练中参数的更新步长。
子步骤S22,采用训练样本数据中最后一分钟与训练时间点匹配的训练特征向量以及初始最后一分钟模型进行模型训练。
在具体实现中,通过训练样本数据得到每分钟中训练时间点的训练特征向量信息后,可以采用最后一分钟与训练时间点匹配的训练特征向量信息以及初始最后一分钟模型进行模型训练,从而得到最后一分钟模型。
在本申请实施例的一种示例中,子步骤S22可以包括如下步骤:
子步骤S221,通过预设数目的隐藏层每一神经元的激活函数对最后一分钟与训练时间点匹配的训练特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至Softmax层;
子步骤S222,通过Softmax层根据输出结果,计算初始最后一分钟模型的损失函数,并生成与损失函数对应的多个第二梯度值;
子步骤S223,通过输出节点判断多个第二梯度值是否满足预设阈值条件;
子步骤S224,若否,则根据多个第二梯度值更新每一神经元的激活函数的参数,继续训练初始最后一分钟模型;
子步骤S225,若是,则得到训练后的最后一分钟模型。
在本申请实施例中,对每一训练样本数据的训练过程都可以包括如下操作流程:将特征向量信息输入初始最后一分钟模型的输入层,通过输入层将特征向量信息传递至隐藏层;然后通过隐藏层每一神经元的激活函数对特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至Softmax层;通过Softmax层根据输出结果,计算最后一分钟模型的损失函数,生成与最后一分钟模型对应的多个梯度值;通过输出节点判断多个梯度值是否满足预设阈值条件;若否,则根据多个梯度值更新每一神经元的激活函数的参数,继续训练最后一分钟模型;若是,则得到训练后的最后一分钟模型。
在进行模型训练时,循环执行以上的操作流程,直到达到预设的停止条件为止。
其中,对激活函数的参数更新,可以是基于梯度下降策略,以目标的负梯度方向对参数进行更新。在具体实现中,可以预设一学习率,控制每一轮训练中参数的更新步长。
在本申请实施例中,通过获取训练样本数据以及初始分时预测模型,采用所述训练样本数据生成特征向量,采用所述特征向量以及所述初始分时预测模型进行训练,并计算训练后的分时预测模型的损失函数,当训练之后的分时预测模型的损失函数都最小化时,停止训练所述分时预测模型,在进行训练的过程中以独立模型为基本单元的分时模型组结构,得到每分钟模型和最后一分钟模型,使得分时预测模型有效地结合了时间信息,提高了模型对实时胜率预测的准确性,同时对每分钟模型和最后一分钟模型进行融合,进一步提高了模型的准确率。
参照图4,示出了本申请的一种分时预测模型的生成方法另一实施例的步骤流程图,具体可以包括如下步骤:
步骤401,获取训练样本数据以及初始分时预测模型;
在具体实现中,在模型训练的准备阶段,可以获取一初始分时预测模型,以使用样本数据对初始分时预测模型进行训练,生成合适的分时预测模型。
步骤402,采用训练样本数据生成训练特征向量;
在具体实现中,在获取样本数据之后,可以将样本数据中游戏参与方用于胜率预测的特征数据按照唯一ID拼接到一起,生成预测特征数据,并对预测特征数据进行向量化,以生成样本数据的训练特征向量信息。
步骤403,采用训练特征向量以及初始分时预测模型进行训练;
在具体实现中,通过样本数据,得到每分钟中训练时间点的训练特征向量信息后,可以采用训练特征向量信息以及初始分时预测模型进行训练,并计算初始分时预测模型的损失函数,通过损失函数对分时预测模型进行监督和指导。
在具体实现中,可以设置训练的停止条件是:分时预测模型的损失函数都最小化。当训练之后的分时预测模型的损失函数最小化时,停止训练分时预测模型。
步骤404,获取验证样本数据以及获取多个训练后的分时预测模型;
在本申请实施例中,验证样本数据包括训练时间点的特征数据,特征数据包括状态实时数据和团队位置数据。
在具体实现中,在模型训练的验证阶段,可以获取多个训练后的分时预测模型,以使用验证样本数据对多个训练后的分时预测模型进行验证,从而可以选取预测效果最优的分时预测模型。
步骤405,采用验证样本数据生成验证特征向量;
在具体实现中,在获取验证样本数据之后,可以将验证样本数据中游戏参与方用于胜率预测的特征数据按照唯一ID拼接到一起,生成验证特征数据,并对验证特征数据进行向量化,以生成验证样本数据的验证特征向量信息。
步骤406,将验证特征向量输入多个训练后的分时预测模型进行交叉验证,并计算验证后的分时预测模型的多个验证误差值;
在本申请实施例中,生成验证样本数据的验证特征向量信息后,可以将验证特征向量输入多个训练后的分时预测模型进行K折交叉验证,并计算验证后的分时预测模型的多个验证误差值,然后根据验证误差值对模型的超参数进行调整,直到达到预期效果为止。
在具体实现中,将验证样本数据分成K份,对多个训练后的每分钟模型进行K折-交叉验证,以及对多个训练后的最后一分钟模型进行K折-交叉验证,并计算验证后的每分钟模型的多个验证误差值和最后一分钟模型的多个验证误差值。通过交叉验证对分时预测模型的超参数进行优化调整,其中,超参数调整可以包括归一化处理、权重初始化处理、Dropout、Batch Size、Batch Normalization以及Regularization等,从而对分时预测模型进行调整优化,提高了分时预测模型的胜率预测准确率。
在本申请实施例的一种示例中,如图5为本申请的一种分时预测模型的生成方法实施例中交叉验证的示意图,采用6折-交叉验证,将验证样本数据分成6份,分别对训练后的每分钟模型和最后一分钟模型进行6折-交叉验证,得到验证后的每分钟模型的多个验证误差值和最后一分钟模型的多个验证误差值。
步骤407,根据多个验证误差值,确定目标分时预测模型。
在本申请实施例中,通过K折-交叉验证,将验证样本数据中的K-1折样本数据进行模型训练,1折样本数据进行模型验证,并计算1折样本数据的验证误差值,从而可以根据多个验证误差值,确定胜率预测效果较好的目标分时预测模型。
在具体实现中,通过K折-交叉验证对训练后的每分钟模型和最后一分钟模型进行验证,可以得到相应的多个验证误差值,根据多个验证误差值,可以确定胜率预测效果较好的每分钟模型和最后一分钟模型。
在本申请实施例的一种优选实施例中,步骤407可以包括如下子步骤:
判断多个验证误差值是否满足预设误差阈值;
若是,将满足预设误差阈值的分时预测模型作为目标分值预测模型。
在本申请实施例中,通过获取与每分钟模型和最后一分钟模型对应的多个验证误差值,可以判断多个验证误差值是否满足预设误差阈值,若是,则将满足预设误差阈值的每分钟模型作为目标每分钟模型,或将满足预设误差阈值的最后一分钟模型作为目标最后一分钟模型;若否,则采用多个验证误差值,对每分钟模型和最后一分钟模型的超参数进行调整优化。
在具体实现中,得到多个训练后的每分钟模型的多个验证误差值,可以将多个验证误差值与预设误差阈值进行比较,判断是否存在验证误差值满足预设误差阈值,若存在,则将满足预设误差阈值的每分钟模型作为目标每分钟模型,当存在多个验证误差值满足预设误差阈值时,则将数值最小的验证误差值对应的每分钟模型作为目标每分钟模型;若不存在满足预设误差阈值的验证误差值,则采用多个验证误差值对模型的超参数进行调整,直到达到预设的验证调教为止。同样,目标最后一分钟模型的验证过程与目标每分钟模型相同,在此不再赘述。
在本申请实施例中,通过获取训练样本数据以及初始分时预测模型,采用所述训练样本数据生成特征向量,采用所述特征向量以及所述初始分时预测模型进行训练,并计算训练后的分时预测模型的损失函数,当训练之后的分时预测模型的损失函数都最小化时,停止训练所述分时预测模型,在进行训练的过程中以独立模型为基本单元的分时模型组结构,得到每分钟模型和最后一分钟模型,使得分时预测模型有效地结合了时间信息,提高了模型对实时胜率预测的准确性,同时对每分钟模型和最后一分钟模型进行融合,进一步提高了模型的准确率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
参照图6,示出了本申请的一种游戏胜率的预测装置实施例的结构框图,具体可以包括如下模块:
特征数据获取模块601,用于获取实时游戏战斗数据中预测时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
特征数据预测模块602,用于将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型,其中,所述分时预测模型具有多个输出节点;
预测结果获取模块603,用于获取所述分时预测模型的所述多个输出节点输出的多个预测结果;
预测信息生成模块604,用于根据所述多个预测结果,生成胜率预测信息。
在本申请实施例的一种优选实施例中,所述预设分时预测模型包括每分钟模型和最后一分钟模型,所述每分钟模型和所述最后一分钟模型具有相同预设数目的输出节点,所述预测结果获取模块可以包括:
第一预测结果获取子模块,用于获取所述每分钟模型的多个输出节点输出的第一预测结果;
第二预测结果获取子模块,用于获取所述最后一分钟模型的多个输出节点输出的第二预测结果。
在本申请实施例的一种优选实施例中,所述预测信息生成模块可以包括:
第一权重系数确定子模块,用于确定与所述预测时间点对应的所述第一预测结果匹配的第一权重系数;
第二权重系数确定子模块,用于确定与所述预测时间点对应的所述第二预测结果匹配的第二权重系数;
第一预测信息生成子模块,用于采用所述第一权重系数、所述第二权重系数、所述第一预测结果以及所述第二预测结果,生成所述胜率预测信息。
在本申请实施例的一种优选实施例中,所述装置还包括:
向量化模块,用于将所述预测时间点的特征数据进行向量化,生成预测时间点的特征向量。
在本申请实施例的一种优选实施例中,所述特征数据预测模块还可以包括:
正向拼接子模块,用于将所述第一方玩家的特征向量与所述第二方玩家的特征向量正向拼接,得到正向特征向量;
反向拼接子模块,用于将所述第一方玩家的特征向量与所述第二方玩家的特征向量反向拼接,得到反向特征向量;
特征向量输入子模块,用于将所述预测时间点的正向特征向量输入与所述预测时间点对应的分时预测模型,以及将所述预测时间点的反向特征向量输入与所述预测时间点对应的分时预测模型。
在本申请实施例的一种优选实施例中,所述预测结果获取模块可以包括:
正向结果获取子模块,用于获取所述分时预测模型的所述多个输出节点输出的与所述正向特征向量对应的预测结果;
反向结果获取子模块,用于获取所述分时预测模型的所述多个输出节点输出的与所述反向特征向量对应的预测结果;
在本申请实施例的一种优选实施例中,所述预测信息生成模块可以包括:
平均值计算子模块,用于计算与所述正向特征向量对应的预测结果以及与所述反向特征向量对应的预测结果的平均值;
第二预测信息生成子模块,用于采用所述平均值,生成所述胜率预测信息。
在本申请实施例的一种优选实施例中,所述分时预测模型包括每分钟模型和最后一分钟模型,所述每分钟模型和所述最后一分钟模型分别具有预设数目的隐藏层,以及与最后一层隐藏层连接的Softmax层,所述Softmax层分别与所述多个输出节点连接;所述Softmax层用于将所述最后一层隐藏层的输出结果进行转换,并将转换后的输出结果分别输入到所述多个输出节点。
在本申请实施例的一种优选实施例中,所述分时预测模型可以通过如下方式生成:
样本数据获取模块,用于获取训练样本数据以及初始分时预测模型,其中,所述训练样本数据包括训练时间点的特征数据;
特征向量生成模块,用于采用所述训练样本数据生成特征向量;
模型训练模块,用于采用所述特征向量以及所述初始分时预测模型进行训练,并计算训练之后的分时预测模型的损失函数;
模型训练停止模块,用于当训练之后的分时预测模型的损失函数都最小化时,停止训练所述分时预测模型。
在本申请实施例的一种优选实施例中,所述装置还包括:
预测曲线生成模块,用于采用所述预测结果,生成所述分时预测模型的预测曲线;
滤波处理模块,用于对所述预测曲线进行滤波处理。
参照图7,示出了本申请的一种分时预测模型生成装置实施例的结构框图,具体可以包括如下模块:
训练样本数据获取模块701,用于获取训练样本数据以及初始分时预测模型,其中,所述训练样本数据包括训练时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
训练特征向量生成模块702,用于采用所述训练样本数据生成训练特征向量;
模型训练模块703,用于采用所述训练特征向量以及所述初始分时预测模型进行训练。
在本申请实施例的一种优选实施例中,所述特征向量生成模块可以包括:
分时特征数据获取子模块,用于获取所述训练样本数据中每分钟的特征数据;
分时特征向量生成子模块,用于采用每分钟中训练时间点的特征数据,生成与所述训练时间点匹配的训练特征向量。
在本申请实施例的一种优选实施例中,所述初始分时预测模型包括初始每分钟模型和初始最后一分钟模型,所述模型训练模块可以包括:
第一模型训练子模块,用于采用所述训练样本数据中每分钟与所述训练时间点匹配的训练特征向量以及所述初始每分钟模型进行模型训练;
第二模型训练子模块,用于采用所述训练样本数据中最后一分钟与所述训练时间点匹配的训练特征向量以及所述初始最后一分钟模型进行模型训练。
在本申请实施例的一种优选实施例中,所述分时预测模型包括每分钟模型和最后一分钟模型,所述每分钟模型和所述最后一分钟模型分别具有预设数目的隐藏层,以及与最后一层隐藏层连接的Softmax层,所述Softmax层分别与所述多个输出节点连接;所述Softmax层用于将所述最后一层隐藏层的输出结果进行转换,并将转换后的输出结果分别输入到所述多个输出节点。
在本申请实施例的一种优选实施例中,所述第一模型训练子模块可以包括:
第一特征向量映射单元,用于通过所述预设数目的隐藏层每一神经元的激活函数对所述与所述训练时间点匹配的训练特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至所述Softmax层;
第一梯度值生成单元,用于通过所述Softmax层根据所述输出结果,计算所述每分钟模型的损失函数,并生成与所述损失函数对应的多个第一梯度值;
第一判断单元,用于通过所述输出节点判断所述多个第一梯度值是否满足预设阈值条件;
若否,则根据所述多个第一梯度值更新所述每一神经元的激活函数的参数,继续训练所述初始每分钟模型;
若是,则得到训练之后的每分钟模型。
在本申请实施例的一种优选实施例中,所述第二模型训练子模块可以包括:
第二特征向量映射单元,用于通过所述预设数目的隐藏层每一神经元的激活函数对所述最后一分钟与所述训练时间点匹配的训练特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至所述Softmax层;
第二梯度值生成单元,用于通过所述Softmax层根据所述输出结果,计算所述初始最后一分钟模型的损失函数,并生成与所述损失函数对应的多个第二梯度值;
第二判断单元,用于通过所述输出节点判断所述多个第二梯度值是否满足预设阈值条件;
若否,则根据所述多个第二梯度值更新所述每一神经元的激活函数的参数,继续训练所述初始最后一分钟模型;
若是,则得到训练后的最后一分钟模型。
在本申请实施例的一种优选实施例中,所述装置还可以包括:
验证样本数据获取模块,用于获取验证样本数据以及获取多个训练后的分时预测模型,其中,所述验证样本数据包括所述训练时间点的特征数据;
验证特征向量生成模块,用于采用所述验证样本数据生成验证特征向量;
模型验证模块,用于将所述验证特征向量输入训练后的分时预测模型进行交叉验证,并计算验证后的分时预测模型的多个验证误差值;
目标模型确定模块,用于根据所述多个验证误差值,确定目标分时预测模型。
在本申请实施例的一种优选实施例中,所述目标模型确定模块可以包括:
误差值比较子模块,用于对所述多个验证误差值进行数值比较,确定数值最小的验证误差值;
目标模型确定子模块,用于将与所述数值最小的验证误差值对应的分时预测模型作为所述目标分时预测模型。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例还提供了一种装置,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行本申请实施例所述的游戏胜率的预测方法或分时预测模型的生成方法。
本申请实施例还提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行本申请实施例所述的游戏胜率的预测方法或分时预测模型的生成方法。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种游戏胜率的预测方法、一种分时预测模型的生成方法、一种游戏胜率的预测装置以及一种分时预测模型的生成装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (22)

1.一种游戏胜率的预测方法,其特征在于,包括:
获取实时游戏战斗数据中预测时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型,其中,所述分时预测模型具有多个输出节点;
获取所述分时预测模型的所述多个输出节点输出的多个预测结果;
根据所述多个预测结果,生成胜率预测信息。
2.根据权利要求1所述的方法,其特征在于,所述预设分时预测模型包括每分钟模型和最后一分钟模型,所述每分钟模型和所述最后一分钟模型具有相同预设数目的输出节点,所述获取所述分时预测模型的所述多个输出节点输出的多个预测结果,包括:
获取所述每分钟模型的多个输出节点输出的第一预测结果;
获取所述最后一分钟模型的多个输出节点输出的第二预测结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个预测结果,生成胜率预测信息,包括:
确定与所述第一预测结果匹配的第一权重系数,以及确定与所述第二预测结果匹配的第二权重系数;
采用所述第一权重系数、所述第二权重系数、所述第一预测结果以及所述第二预测结果,生成所述胜率预测信息。
4.根据权利要求1-3任一所述的方法,其特征在于,所述将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型之前,还包括:
将所述预测时间点的特征数据进行向量化,生成预测时间点的特征向量。
5.根据权利要求4所述的方法,其特征在于,所述特征向量包括第一方玩家的特征向量和第二方玩家的特征向量,所述将所述预测时间点的特征数据输入与所述预测时间点对应的分时预测模型,包括:
将所述第一方玩家的特征向量与所述第二方玩家的特征向量正向拼接,得到正向特征向量;
将所述第一方玩家的特征向量与所述第二方玩家的特征向量反向拼接,得到反向特征向量;
将所述预测时间点的正向特征向量输入与所述预测时间点对应的分时预测模型,以及将所述预测时间点的反向特征向量输入与所述预测时间点对应的分时预测模型。
6.根据权利要求5所述的方法,其特征在于,所述获取所述分时预测模型的所述多个输出节点输出的多个预测结果,包括:
获取所述分时预测模型的所述多个输出节点输出的与所述正向特征向量对应的预测结果;
获取所述分时预测模型的所述多个输出节点输出的与所述反向特征向量对应的预测结果。
7.根据权利要求6所述的方法,其特征在于,所述根据所述多个预测结果,生成胜率预测信息,包括:
计算与所述正向特征数据对应的预测结果以及与所述反向特征数据对应的预测结果的平均值;
采用所述平均值,生成所述胜率预测信息。
8.根据权利要求1所述的方法,其特征在于,所述分时预测模型包括每分钟模型和最后一分钟模型,所述每分钟模型和所述最后一分钟模型分别具有预设数目的隐藏层,以及与最后一层隐藏层连接的Softmax层,所述Softmax层分别与所述多个输出节点连接;所述Softmax层用于将所述最后一层隐藏层的输出结果进行转换,并将转换后的输出结果分别输入到所述多个输出节点。
9.根据权利要求1所述的方法,其特征在于,所述分时预测模型通过如下方式生成:
获取训练样本数据以及初始分时预测模型,其中,所述训练样本数据包括训练时间点的特征数据;
采用所述训练样本数据生成训练特征向量;
采用所述训练特征向量以及所述初始分时预测模型进行训练。
10.根据权利要求1-9任一所述的方法,其特征在于,还包括:
采用所述预测结果,生成所述分时预测模型的预测曲线;
对所述预测曲线进行滤波处理。
11.一种分时预测模型的生成方法,其特征在于,包括:
获取训练样本数据以及初始分时预测模型,其中,所述训练样本数据包括训练时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
采用所述训练样本数据生成训练特征向量;
采用所述训练特征向量以及所述初始分时预测模型进行训练。
12.根据权利要求11所述的方法,其特征在于,所述采用所述训练样本数据生成训练特征向量,包括:
获取所述训练样本数据中每分钟的特征数据;
采用每分钟中训练时间点的特征数据,生成与所述训练时间点匹配的训练特征向量。
13.根据权利要求12所述的方法,其特征在于,所述初始分时预测模型包括初始每分钟模型和初始最后一分钟模型,所述采用所述训练特征向量以及所述初始分时预测模型进行训练,包括:
采用所述训练样本数据中每分钟与所述训练时间点匹配的训练特征向量以及所述初始每分钟模型进行模型训练;
采用所述训练样本数据中最后一分钟与所述训练时间点匹配的训练特征向量以及所述初始最后一分钟模型进行模型训练。
14.根据权利要求10所述的方法,其特征在于,所述分时预测模型包括每分钟模型和最后一分钟模型,所述每分钟模型和所述最后一分钟模型分别具有预设数目的隐藏层,以及与最后一层隐藏层连接的Softmax层,所述Softmax层分别与所述多个输出节点连接;所述Softmax层用于将所述最后一层隐藏层的输出结果进行转换,并将转换后的输出结果分别输入到所述多个输出节点。
15.根据权利要求14所述的方法,其特征在于,所述采用所述训练样本数据中每分钟与所述训练时间点匹配的训练特征向量以及所述初始每分钟模型进行模型训练,包括:
通过所述预设数目的隐藏层每一神经元的激活函数对所述与所述训练时间点匹配的训练特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至所述Softmax层;
通过所述Softmax层根据所述输出结果,计算所述每分钟模型的损失函数,并生成与所述损失函数对应的多个第一梯度值;
通过所述输出节点判断所述多个第一梯度值是否满足预设阈值条件;
若否,则根据所述多个第一梯度值更新所述每一神经元的激活函数的参数,继续训练所述初始每分钟模型;
若是,则得到训练之后的每分钟模型。
16.根据权利要求14所述的方法,其特征在于,所述采用所述训练样本数据中最后一分钟与所述训练时间点匹配的训练特征向量以及所述初始最后一分钟模型进行模型训练,包括:
通过所述预设数目的隐藏层每一神经元的激活函数对所述最后一分钟与所述训练时间点匹配的训练特征向量逐层进行映射,并将最后一层隐藏层生成的输出结果传输至所述Softmax层;
通过所述Softmax层根据所述输出结果,计算所述初始最后一分钟模型的损失函数,并生成与所述损失函数对应的多个第二梯度值;
通过所述输出节点判断所述多个第二梯度值是否满足预设阈值条件;
若否,则根据所述多个第二梯度值更新所述每一神经元的激活函数的参数,继续训练所述初始最后一分钟模型;
若是,则得到训练后的最后一分钟模型。
17.根据权利要求11所述的方法,其特征在于,还包括:
获取验证样本数据以及获取多个训练后的分时预测模型,其中,所述验证样本数据包括所述训练时间点的特征数据;
采用所述验证样本数据生成验证特征向量;
将所述验证特征向量输入多个训练后的分时预测模型进行交叉验证,并计算验证后的分时预测模型的多个验证误差值;
根据所述多个验证误差值,确定目标分时预测模型。
18.根据权利要求17所述的方法,其特征在于,所述根据所述多个验证误差值,确定目标分时预测模型,包括:
判断所述多个验证误差值是否满足预设误差阈值;
若是,将满足所述预设误差阈值的分时预测模型作为所述目标分值预测模型。
19.一种游戏胜率的预测装置,其特征在于,包括:
特征数据获取模块,用于获取实时游戏战斗数据中预测时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
特征数据预测模块,用于将所述预测时间点的特征数据输入与所述预测时间点对应的预设分时预测模型,其中,所述分时预测模型具有多个输出节点;
预测结果获取模块,用于获取所述分时预测模型的所述多个输出节点输出的多个预测结果;
预测信息生成模块,用于根据所述多个预测结果,生成胜率预测信息。
20.一种分时预测模型的生成装置,其特征在于,包括:
训练样本数据获取模块,用于获取训练样本数据以及初始分时预测模型,其中,所述训练样本数据包括训练时间点的特征数据,所述特征数据包括状态实时数据和团队位置数据;
训练特征向量生成模块,用于采用所述训练样本数据生成训练特征向量;
模型训练模块,用于采用所述训练特征向量以及所述初始分时预测模型进行训练。
21.一种装置,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如权利要求1-10或11-18所述的一个或多个的方法。
22.一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-10或11-18所述的一个或多个的方法。
CN201910168791.1A 2019-03-06 2019-03-06 一种游戏胜率的预测方法、模型生成方法和装置 Active CN109925717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910168791.1A CN109925717B (zh) 2019-03-06 2019-03-06 一种游戏胜率的预测方法、模型生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910168791.1A CN109925717B (zh) 2019-03-06 2019-03-06 一种游戏胜率的预测方法、模型生成方法和装置

Publications (2)

Publication Number Publication Date
CN109925717A true CN109925717A (zh) 2019-06-25
CN109925717B CN109925717B (zh) 2022-07-12

Family

ID=66986273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910168791.1A Active CN109925717B (zh) 2019-03-06 2019-03-06 一种游戏胜率的预测方法、模型生成方法和装置

Country Status (1)

Country Link
CN (1) CN109925717B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569900A (zh) * 2019-09-05 2019-12-13 苏州大禹网络科技有限公司 游戏ai决策方法及装置
CN111359227A (zh) * 2020-03-08 2020-07-03 北京智明星通科技股份有限公司 一种对战游戏中对战胜负率的预测方法、装置及设备
CN111617478A (zh) * 2020-05-29 2020-09-04 腾讯科技(深圳)有限公司 游戏阵容强度的预测方法、装置、电子设备及存储介质
CN113191379A (zh) * 2020-01-14 2021-07-30 北京地平线机器人技术研发有限公司 一种预测方法及装置
CN113813610A (zh) * 2020-06-19 2021-12-21 北京龙创悦动网络科技有限公司 游戏数据预测模型训练、预测方法、预测装置和预测系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003230738A (ja) * 2001-09-11 2003-08-19 Pa Net Gijutsu Kenkyusho:Kk 遊技機の評価方法及びシステム
CN107679491A (zh) * 2017-09-29 2018-02-09 华中师范大学 一种融合多模态数据的3d卷积神经网络手语识别方法
CN108888947A (zh) * 2018-05-25 2018-11-27 南京邮电大学 用于中国象棋对弈的解说系统
CN109011580A (zh) * 2018-06-29 2018-12-18 腾讯科技(深圳)有限公司 残局牌面获取方法、装置、计算机设备及存储介质
CN109065072A (zh) * 2018-09-30 2018-12-21 中国科学院声学研究所 一种基于深度神经网络的语音质量客观评价方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003230738A (ja) * 2001-09-11 2003-08-19 Pa Net Gijutsu Kenkyusho:Kk 遊技機の評価方法及びシステム
CN107679491A (zh) * 2017-09-29 2018-02-09 华中师范大学 一种融合多模态数据的3d卷积神经网络手语识别方法
CN108888947A (zh) * 2018-05-25 2018-11-27 南京邮电大学 用于中国象棋对弈的解说系统
CN109011580A (zh) * 2018-06-29 2018-12-18 腾讯科技(深圳)有限公司 残局牌面获取方法、装置、计算机设备及存储介质
CN109065072A (zh) * 2018-09-30 2018-12-21 中国科学院声学研究所 一种基于深度神经网络的语音质量客观评价方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569900A (zh) * 2019-09-05 2019-12-13 苏州大禹网络科技有限公司 游戏ai决策方法及装置
CN113191379A (zh) * 2020-01-14 2021-07-30 北京地平线机器人技术研发有限公司 一种预测方法及装置
CN113191379B (zh) * 2020-01-14 2024-05-14 北京地平线机器人技术研发有限公司 一种预测方法及装置
CN111359227A (zh) * 2020-03-08 2020-07-03 北京智明星通科技股份有限公司 一种对战游戏中对战胜负率的预测方法、装置及设备
CN111617478A (zh) * 2020-05-29 2020-09-04 腾讯科技(深圳)有限公司 游戏阵容强度的预测方法、装置、电子设备及存储介质
CN111617478B (zh) * 2020-05-29 2023-03-03 腾讯科技(深圳)有限公司 游戏阵容强度的预测方法、装置、电子设备及存储介质
CN113813610A (zh) * 2020-06-19 2021-12-21 北京龙创悦动网络科技有限公司 游戏数据预测模型训练、预测方法、预测装置和预测系统
CN113813610B (zh) * 2020-06-19 2024-05-14 北京龙创悦动网络科技有限公司 游戏数据预测模型训练、预测方法、预测装置和预测系统

Also Published As

Publication number Publication date
CN109925717B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN109847367A (zh) 一种游戏胜率的预测方法、模型生成方法和装置
CN109925717A (zh) 一种游戏胜率的预测方法、模型生成方法和装置
US20240189718A1 (en) Game character behavior control method and apparatus, storage medium, and electronic device
KR101246938B1 (ko) 가상 현실 환경에서 컴퓨터 제어되는 아바타의 개인화된 동작을 위한 시스템, 방법 및 컴퓨터 판독가능 기록 매체
CN111282267B (zh) 信息处理方法、装置、介质及电子设备
CN111111220B (zh) 多人对战游戏的自对弈模型训练方法、装置和计算机设备
CN109966743A (zh) 一种游戏胜率的预测方法、模型生成方法和装置
CN112402986B (zh) 一种对战游戏中强化学习模型的训练方法及装置
Kartal et al. Terminal prediction as an auxiliary task for deep reinforcement learning
CN112044076B (zh) 一种对象控制方法、装置及计算机可读存储介质
WO2022247791A1 (zh) 一种基于机器学习的棋类自学习方法及装置
CN116956007A (zh) 人工智能模型的预训练方法、装置、设备及存储介质
Nam et al. Generation of diverse stages in turn-based role-playing game using reinforcement learning
Miyake Current status of applying artificial intelligence in digital games
CN114404975A (zh) 决策模型的训练方法、装置、设备、存储介质及程序产品
Santos et al. An improved rolling horizon evolution algorithm with shift buffer for general game playing
Cowley et al. Adaptive artificial intelligence in games: issues, requirements, and a solution through behavlets-based general player modelling
CN115496191A (zh) 一种模型训练方法及相关装置
CN112870722B (zh) 对战格斗类ai游戏模型的生成方法、装置、设备及介质
Mozgovoy et al. Building a believable and effective agent for a 3D boxing simulation game
Liu et al. Comparing two representations for evolving micro in 3d RTS games
Gajurel Neuroevolution for Realtime Strategy Game Micromanagement
Adhikari Co-evolving Distributed Control for Heterogeneous Agents in RTS Games
Smith et al. Continuous and Reinforcement Learning Methods for First-Person Shooter Games
Joypriyanka et al. Checkers Game Therapy to Improve the Mental Ability Of Alzheimer’s Patient using AI Virtual Assistant

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant