CN115671733A - 虚拟对象的行为预测方法、装置、存储介质与电子设备 - Google Patents
虚拟对象的行为预测方法、装置、存储介质与电子设备 Download PDFInfo
- Publication number
- CN115671733A CN115671733A CN202211425300.5A CN202211425300A CN115671733A CN 115671733 A CN115671733 A CN 115671733A CN 202211425300 A CN202211425300 A CN 202211425300A CN 115671733 A CN115671733 A CN 115671733A
- Authority
- CN
- China
- Prior art keywords
- virtual object
- features
- target virtual
- map
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
本公开提供一种虚拟对象的行为预测方法、装置、计算机可读存储介质与电子设备,涉及人工智能技术领域。该虚拟对象的行为预测方法包括:获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及虚拟场景的地图特征;根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到目标虚拟对象对应的第一中间特征;获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征;基于目标虚拟对象对应的第一中间特征和第二中间特征,输出第二时刻下目标虚拟对象的行为预测信息。本公开提高了虚拟对象的行为预测的准确度。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及一种虚拟对象的行为预测方法、虚拟对象的行为预测装置、计算机可读存储介质与电子设备。
背景技术
AI(Artificial Intelligence,人工智能)技术在人类智力活动中的应用越来越广泛。例如,在MOBA(Multiplayer Online Battle Arena,多人在线战术竞技)等类型的游戏中,采用AI模型对游戏中的虚拟对象进行行为预测,可以使AI玩家根据预测结果操控虚拟对象,以实现AI玩家与人类玩家的协作或对抗。
相关技术中,对虚拟对象行为预测的准确度还有待提高,导致AI控制的虚拟对象做出偏离于人类决策的行为,影响用户体验。
发明内容
本公开提供了一种虚拟对象的行为预测方法、虚拟对象的行为预测装置、计算机可读存储介质与电子设备,进而至少在一定程度上改善虚拟对象的行为预测准确度低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种虚拟对象的行为预测方法,包括:获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及所述虚拟场景的地图特征;所述虚拟场景内包括多个虚拟对象,所述多个虚拟对象包括待预测的目标虚拟对象;根据各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征之间的关系,对各所述虚拟对象的基本特征进行加权,得到所述目标虚拟对象对应的第一中间特征;获取所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征;基于所述目标虚拟对象对应的所述第一中间特征和所述第二中间特征,输出第二时刻下所述目标虚拟对象的行为预测信息;所述第二时刻晚于所述第一时刻。
可选的,所述基本特征包括位置信息和状态信息;所述根据各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征之间的关系,对各所述虚拟对象的基本特征进行加权,得到所述目标虚拟对象对应的第一中间特征,包括:根据各所述虚拟对象的位置信息与所述目标虚拟对象的位置信息之间的关系,确定各所述虚拟对象的位置权重;根据各所述虚拟对象的状态信息与所述目标虚拟对象的状态信息之间的关系,确定各所述虚拟对象的状态权重;基于各所述虚拟对象的位置权重与状态权重,确定各所述虚拟对象的关注度;基于各所述虚拟对象的关注度对各所述虚拟对象的基本特征进行加权,以得到所述目标虚拟对象对应的第一中间特征。
可选的,所述根据各所述虚拟对象的位置信息与所述目标虚拟对象的位置信息之间的关系,确定各所述虚拟对象的位置权重,包括:根据任一虚拟对象的位置信息与所述目标虚拟对象的位置信息,确定所述任一虚拟对象与所述目标虚拟对象之间的距离;计算所述距离与所述虚拟场景中的最远距离的比值,根据所述比值确定所述任一虚拟对象的位置权重。
可选的,所述根据各所述虚拟对象的状态信息与所述目标虚拟对象的状态信息之间的关系,确定各所述虚拟对象的状态权重,包括:根据任一虚拟对象的状态信息与所述目标虚拟对象的状态信息的相似度,确定所述任一虚拟对象的状态权重。
可选的,所述地图特征包括:所述虚拟场景的全局地图对应的全局地图特征,以及所述虚拟场景中所述目标虚拟对象所在的局部区域对应的局部地图特征;所述第二中间特征包括全局地图中间特征与局部地图中间特征;所述获取所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征,包括:对所述目标虚拟对象的活动位置进行预测,得到所述位置预测信息;所述位置预测信息包括全局位置预测信息和局部位置预测信息,所述全局位置预测信息用于表示所述目标虚拟对象在所述全局地图中的预测位置,所述局部位置预测信息用于表示所述目标虚拟对象在所述局部区域中的预测位置;根据所述全局位置预测信息确定全局注意力权重,利用所述全局注意力权重对所述全局地图特征进行加权,得到所述全局地图中间特征;根据所述局部位置预测信息确定局部注意力权重,利用所述局部注意力权重对所述局部地图特征进行加权,得到所述局部地图中间特征。
可选的,所述对所述目标虚拟对象的活动位置进行预测,得到所述位置预测信息,包括:根据所述全局地图特征和所述局部地图特征对所述目标虚拟对象的活动位置进行预测,得到所述位置预测信息。
可选的,所述方法还包括:获取预先训练的行为预测模型,所述行为预测模型包括第一特征提取层、第二特征提取层与特征融合层;所述根据各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征之间的关系,对各所述虚拟对象的基本特征进行加权,得到所述目标虚拟对象对应的第一中间特征,包括:通过所述第一特征提取层对各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征进行处理,确定所述目标虚拟对象对各所述虚拟对象的关注度,并基于各所述虚拟对象的关注度对各所述虚拟对象的基本特征进行加权,输出所述目标虚拟对象对应的的第一中间特征;所述获取所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征,包括:通过所述第二特征提取层对所述地图特征进行处理,得到所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征;所述基于所述目标虚拟对象对应的所述第一中间特征和所述第二中间特征,输出第二时刻下所述目标虚拟对象的行为预测信息,包括:通过所述特征融合层将所述目标虚拟对象对应的所述第一中间特征和所述第二中间特征进行特征融合,根据融合后的特征输出所述第二时刻下所述目标虚拟对象的行为预测信息。
根据本公开的第二方面,提供一种虚拟对象的行为预测装置,包括:基本特征与地图特征获取模块,被配置为获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及所述虚拟场景的地图特征;所述虚拟场景内包括多个虚拟对象,所述多个虚拟对象包括待预测的目标虚拟对象;第一中间特征获取模块,被配置为根据各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征之间的关系,对各所述虚拟对象的基本特征进行加权,得到所述目标虚拟对象对应的第一中间特征;第二中间特征获取模块,被配置为获取所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征;行为预测信息输出模块,被配置为基于所述目标虚拟对象对应的所述第一中间特征和所述第二中间特征,输出第二时刻下所述目标虚拟对象的行为预测信息;所述第二时刻晚于所述第一时刻。
根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面的虚拟对象的行为预测方法及其可能的实现方式。
根据本公开的第四方面,提供一种电子设备,包括:处理器;存储器,用于存储所述处理器的可执行指令。其中,所述处理器配置为经由执行所述可执行指令,来执行上述第一方面的虚拟对象的行为预测方法及其可能的实现方式。
本公开的技术方案具有以下有益效果:
一方面,根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到第一中间特征;根据位置预测信息对虚拟场景中不同区域的地图特征进行加权,得到第二中间特征;并基于第一中间特征和第二中间特征输出目标虚拟对象的行为预测信息;对不同的特征施加不同的权重,可以根据权重高的特征进一步预测出虚拟对象的行为,抑制了冗余特征对虚拟对象行为预测的干扰,提高了对虚拟对象行为预测的准确度。另一方面,本方案能够根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,从而得到目标虚拟对象对应的第一中间特征;并对虚拟场景中不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征;使得各虚拟对象的基本特征的权重不同,虚拟场景中不同区域的权重不同;从而使得各虚拟对象的基本特征的重要度不同,虚拟场景中不同区域的重要度不同;即目标虚拟对象的对不同的虚拟对象,与虚拟场景中不同的区域具有不同的关注度,提高了目标虚拟对象的拟人化程度,使得预测结果更加接近于真实行为,从而改善了用户体验,提升了用户的沉浸感。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本示例性实施方式的系统运行架构;
图2示出本示例性实施方式中一种虚拟对象的行为预测方法的流程图;
图3示出本示例性实施方式中一种提取虚拟对象的基本特征的示意图;
图4示出本示例性实施方式中一种获取第一中间特征的方法的流程图;
图5示出本示例性实施方式中一种获取全局地图中间特征和局部地图中间特征的方法的流程图;
图6示出本示例性实施方式中一种虚拟对象的行为预测方法的过程的示意图;
图7示出本示例性实施方式一种通过行为预测模型进行虚拟对象的行为预测的方法的流程图;
图8示出本示例性实施方式中一种虚拟对象的行为预测方法的模型的示意图;
图9示出本示例性实施方式中一种第一特征提取层的模型的示意图;
图10示出本示例性实施方式中一种第二特征提取层的模型的示意图;
图11示出本示例性实施方式中一种虚拟对象的行为预测装置的结构示意图;
图12示出本示例性实施方式中一种电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
相关技术中,通过AI代理对MOBA游戏中的角色的行为进行预测。MOBA游戏中的AI作为一个游戏的智能体,能够在不同的状态下对环境做出与人类类似的操作,与人类玩家或协作或对抗。一个优秀的游戏AI代理能够模仿真实玩家的行为从而给予玩家更为真实沉浸的游戏体验。在5v5的MOBA游戏中,游戏AI代理需要在对局中控制一名角色,与四个队友协作对抗敌方五名英雄,旨在摧毁敌方的核心建筑,即基地。为了达到与人类选手相似的操作,AI代理需要从当前的游戏状态,包括敌友血量,位置,防御塔范围等信息中做出与玩家类似的合理操作,或移动或释放技能。通常AI代理对在虚拟场景中获取到的特征直接进行拼接,根据拼接特征实现角色的行为控制,然而,该方法对虚拟对象行为预测的准确度还有待提高,导致AI控制的虚拟对象做出偏离于人类玩家行为的决策,影响了用户体验。
鉴于上述一个或多个问题,本公开示例性实施方式首先提供一种虚拟对象的行为预测方法。下面结合图1对本示例性实施方式运行环境的系统架构进行说明。
参考图1所示,系统架构100可以包括终端设备110和服务器120。终端设备110可以是智能手机、平板电脑、台式电脑等电子设备,终端设备110可以用于获取各虚拟对象的基本特征和虚拟场景的地图特征。服务器120泛指提供本示例性实施方式中虚拟对象的行为预测相关服务的后台系统,如可以是实现虚拟对象的行为预测方法的服务器。服务器120可以是一台服务器或多台服务器形成的集群,本公开对此不做限定。终端设备110与服务器120之间可以通过有线或无线的通信链路形成连接,以进行数据交互。
在一种实施方式中,可以由终端设备110执行本示例性实施方式中的虚拟对象的行为预测方法。例如,在MOBA游戏场景中,终端设备110可以通过执行本申请的虚拟对象的行为预测方法,根据预测结果控制目标虚拟对象的行为,目标虚拟对象可以是其他虚拟对象的队友或敌方;终端设备110还可以是人类玩家所使用的电脑,目标虚拟对象可以是玩家所控制的虚拟对象,目标虚拟对象可以与游戏场景中的其他虚拟对象进行协作或对抗,若玩家选择了游戏托管,则可以由终端设备110通过执行虚拟对象的行为预测方法,在虚拟场景中根据加权后的各虚拟对象的基本特征以及加权的地图特征,输出目标虚拟对象的行为预测信息,以控制虚拟对象在当前时刻的下一时刻,在虚拟场景中的某个位置作出某种行为。
在一种实施方式中,还可以由终端设备110实时获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及虚拟场景的地图特征,再将该每个虚拟对象的基本特征以及虚拟场景的地图特征上传至服务器120;服务器120在获取到各虚拟对象的基本特征以及虚拟场景的地图特征后,可以根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,以得到目标虚拟对象的第一中间特征;再获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中不同区域的地图特征进行加权,得到目标虚拟对象的第二中间特征;最后基于目标虚拟对象对应的第一中间特征和第二中间特征,输出目标虚拟对象在晚于第一时刻的第二时刻的行为预测信息;终端设备110在接收到服务器120发出的行为预测信息后,可以根据行为预测信息对目标虚拟对象在第二时刻的位置和行为进行控制。
由上可知,本示例性实施方式中的虚拟对象的行为预测方法可以由上述终端设备110或服务器120执行。
下面结合图2对虚拟对象的行为预测方法进行说明。图2示出了虚拟对象的行为预测方法的示例性流程,包括以下步骤S210至S240:
步骤S210,获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及虚拟场景的地图特征;虚拟场景内包括多个虚拟对象,多个虚拟对象包括待预测的目标虚拟对象;
步骤S220,根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到目标虚拟对象对应的第一中间特征;
步骤S230,获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征;
步骤S240,基于目标虚拟对象对应的第一中间特征和第二中间特征,输出第二时刻下目标虚拟对象的行为预测信息;第二时刻晚于第一时刻。
基于上述方法,一方面,根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到第一中间特征;根据位置预测信息对虚拟场景中不同区域的地图特征进行加权,得到第二中间特征;并基于第一中间特征和第二中间特征输出目标虚拟对象的行为预测信息;对不同的特征施加不同的权重,可以根据权重高的特征进一步预测出虚拟对象的行为,抑制了冗余特征对虚拟对象行为预测的干扰,提高了对虚拟对象行为预测的准确度。另一方面,本方案能够根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,从而得到目标虚拟对象对应的第一中间特征;并对虚拟场景中不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征;使得各虚拟对象的基本特征的权重不同,虚拟场景中不同区域的权重不同;从而使得各虚拟对象的基本特征的重要度不同,虚拟场景中不同区域的重要度不同;即目标虚拟对象的对不同的虚拟对象,与虚拟场景中不同的区域具有不同的关注度,提高了目标虚拟对象的拟人化程度,使得预测结果更加接近于真实行为,从而改善了用户体验,提升了用户的沉浸感。
下面对图2中的每个步骤进行具体说明。
参考图2,在步骤S210中,获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及虚拟场景的地图特征;虚拟场景内包括多个虚拟对象,多个虚拟对象包括待预测的目标虚拟对象。
其中,第一时刻可以是当前时刻;虚拟场景可以包括虚拟对象所在的场景,如MOBA游戏场景;虚拟对象可以包括虚拟场景中的各种角色,示例性的,在5v5的MOBA游戏场景中的10个对战的游戏角色可以是虚拟对象;目标虚拟对象可以是通过本方案的虚拟对象的行为预测方法进行行为预测的虚拟对象。
虚拟对象的基本特征可以包括虚拟对象在第一时刻的各种信息,本公开基本特征的具体内容和获取方式不作特殊限定,举例而言,虚拟对象可以是MOBA游戏中的游戏角色,则虚拟对象的基本特征可以包括游戏角色在当前时刻的血量、技能状态、装备、阵营等。
在一种实施方式中,如图3所示,可以实时获取N个虚拟对象的各种信息,通过N深度神经网络对获取到的N个虚拟对象的各种信息进行特征提取,以得到N个虚拟对象的特征向量,再根据N个虚拟对象对应的特征向量得到N个虚拟对象的基本特征。采用N个深度神经网络单独提取N个虚拟对象的基本特征,多个深度神经网络可以并行运行,可以有效提高虚拟对象的基本特征提取效率。
虚拟场景的地图特征可以表征虚拟场景中的地图信息,本公开对虚拟场景的地图特征的具体内容和获取方式不作特殊限定,示例性的,地图特征可以包括虚拟场景中的地图的图像特征、虚拟对象对于目标地点的可达性信息等。
在一种实施方式中,虚拟场景的地图特征可以包括全局地图特征和局部地图特征,可以通过实时获取虚拟场景中的图像帧,将图像帧输入卷积神经网络(ConvolutionalNeural Networks,CNN),以提取全局地图特征和局部地图特征;举例而言,全局地图特征可以包括虚拟对象在当前时刻的虚拟场景的缩略地图中所在位置的图像特征;局部地图特征可以包括当前时刻虚拟对象在虚拟场景中所在区域的图像特征;全局地图可以是虚拟场景中所有区域的地图的缩略图,局部地图可以包括虚拟场景中部分区域的地图。根据全局地图和局部地图的图像帧提取全局地图特征和局部地图特征,可以同时得到地图的梗概信息和细节信息,有利于提高虚拟对象的行为预测方法的准确度。
通过在步骤S210中获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及虚拟场景的地图特征,可以将第一时刻的虚拟场景中的信息进行有效整合和量化,进一步提高对目标虚拟对象的行为预测的准确度。
在获取到第一时刻的虚拟场景中的每个虚拟对象的基本特征以及虚拟场景的地图特征后,可以在步骤S220中,根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到目标虚拟对象对应的第一中间特征。
其中,上述各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系可以包括各虚拟对象与目标虚拟对象的位置关系、生存状态和技能信息的相似度等,本公开对关系的具体内容不作特殊限定,如各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系可以包括目标虚拟对象与各虚拟对象的距离的远近,游戏角色的剩余血量的相似度、技能的相似度等。
在一种实施方式中,上述基本特征包括位置信息和状态信息;上述根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到目标虚拟对象对应的第一中间特征,如图4所示,可以包括步骤S410~S440:
步骤S410,根据各虚拟对象的位置信息与目标虚拟对象的位置信息之间的关系,确定各虚拟对象的位置权重;
步骤S420,根据各虚拟对象的状态信息与目标虚拟对象的状态信息之间的关系,确定各虚拟对象的状态权重;
步骤S430,基于各虚拟对象的位置权重与状态权重,确定各虚拟对象的关注度;
步骤S440,基于各虚拟对象的关注度对各虚拟对象的基本特征进行加权,以得到目标虚拟对象对应的第一中间特征。
其中,上述位置信息可以包括虚拟对象在虚拟场景中的位置坐标,根据任意两个虚拟对象的位置坐标可以计算出任意两个虚拟对象之间的距离;状态信息可以包括虚拟对象的生存状态信息和技能状态信息,例如,在MOBA游戏场景中,虚拟对象的状态信息可以包括虚拟对象的剩余血量,技能信息等。关注度可以表征目标虚拟对象对各虚拟对象的重视程度。第一中间特征可以包括加权后的各虚拟对象的基本特征。
下面对步骤S410中根据各虚拟对象的位置信息与目标虚拟对象的位置信息之间的关系,确定各虚拟对象的位置权重的具体步骤进行说明。
在一种实施方式中,上述根据各虚拟对象的位置信息与目标虚拟对象的位置信息之间的关系,确定各虚拟对象的位置权重,可以包括下述步骤:
根据任一虚拟对象的位置信息与目标虚拟对象的位置信息,确定任一虚拟对象与目标虚拟对象之间的距离;
计算上述距离与虚拟场景中的最远距离的比值,根据该比值确定上述任一虚拟对象的位置权重。
通过任一虚拟对象的位置信息与目标虚拟对象的位置信息计算出该任一虚拟对象与目标虚拟对象之间的距离,再根据该距离与虚拟场景中最远距离的比值计算该任一虚拟对象的位置权重,可以根据各虚拟对象与目标虚拟对象之间距离的不同为各虚拟对象赋予距离权重,以模拟人类玩家在面对与自己操控的游戏角色距离不同的其他游戏角色时,所分配的注意力不同,从而提高目标虚拟对象的拟人化程度。
在一种实施方式中,可以计算上述距离与虚拟场景中最远距离比值的余弦值,根据该余弦值确定上述任一虚拟对象的位置权重;举例而言,当虚拟对象N与目标虚拟对象的距离较近时,则虚拟对象N与目标虚拟对象距离与最远距离的比值较小,该比值对应的余弦值就越大,根据该余弦值为虚拟对象N分配距离权重,可以使距离目标虚拟对象越近的虚拟对象的距离权重值越大,从而实现人类对距离自己越近的对象关注程度越高的效果。
示例性的,在5v5的MOBA游戏场景中,由于大部分英雄所能做出的操作都具有距离限制,当英雄之间彼此远离时,距离较远的两个英雄在一段时间内基本不会存在交互行为。通过下述公式(1)获取两个英雄之间的距离与虚拟场景中最远距离的比值的余弦值,对距离更远的英雄赋予较小的位置权重,而对于距离较近的英雄的赋予较大的位置权重,以基于两个英雄在虚拟场景中的相对位置决定目标英雄对其他英雄的注意力:
其中r表示各英雄与主英雄的相对距离,rmax表示地图上的最远距离。
在一种实施方式中,还可以通过计算任一虚拟对象与目标虚拟对象之间的距离与预设距离最大值的比值的余弦值,根据该余弦值确定上述任一虚拟对象的位置权重。该方法可以省去获取虚拟场景中最远距离的步骤,有利于提高虚拟对象的行为预测方法的整体速度。
下面对步骤S420中获取状态权重的具体步骤进行说明,在一种实施方式中,上述根据各虚拟对象的状态信息与目标虚拟对象的状态信息之间的关系,确定各虚拟对象的状态权重,可以包括下述步骤:
根据任一虚拟对象的状态信息与目标虚拟对象的状态信息的相似度,确定任一虚拟对象的状态权重。
示例性的,可以在MOBA游戏场景中,根据虚拟对象与目标虚拟对象的技能的相似度,以及剩余血量的相似度确定该虚拟对象的状态权重。
在得到个虚拟对象对应的距离权重和状态权重后,在一种实施方式中,上述基于任一虚拟对象对应的距离权重与状态权重的加权和确定任一虚拟对象的关注度,可以包括下述步骤:
可以首先获取任一虚拟对象对应的距离权重与状态权重的加权和:根据目标虚拟对象的生存状态信息和技能信息、目标虚拟对象所处的团队信息、目标虚拟对象的敌方团队信息获取任一虚拟对象的距离权重对应的调整参数;再将该调整参数与距离权重的乘积,与该状态权重相加,以得到任一虚拟对象对应的距离权重与状态权重的加权和;根据该加权和确定任一虚拟对象的关注度。
其中,上述团队信息可以包括团队的战绩信息,如团队金钱,团队经验,团队击杀数等。调整参数可以用于表征距离权重的重要度,在一种实施方式中,可以通过目标虚拟对象的生存状态信息和技能信息、目标虚拟对象所处的团队信息、目标虚拟对象的敌方团队信息等训练深度模型,以获取调整参数。
上述通过距离权重与状态权重的加权和得到任一虚拟对象的关注度,实现了从目标虚拟对象的角度综合考虑个虚拟对象的技能状态,生存状态以及与目标虚拟对象之间的距离,进一步提高了目标虚拟对象的拟人化程度,从而提升对目标虚拟对象的行为预测的准确度。
在一种实施方式中,还可以对任一虚拟对象对应的距离权重与状态权重的加权和进行归一化,根据归一化的结果确定任一虚拟对象的关注度。
举例而言,可以通过sigmoid函数进行归一化,则可以根据下述公式(2)获取任一虚拟对象的关注度:
weight=sigmoid(α×weightr+weights) (2)
其中,weight是任一虚拟对象的关注度,α可以是调整参数,weightr是距离权重,weights可以是状态权重。
本示例性实施方式中,通过对任一虚拟对象对应的距离权重与状态权重的加权和进行归一化,得到任一虚拟对象的关注度,可以规范各虚拟对象的关注度的数值范围,从而有效提高模型的运行效率。
在确定各虚拟对象的关注度后,可以在步骤S440中,基于各虚拟对象的关注度对各虚拟对象的基本特征进行加权融合,以得到目标虚拟对象对应的第一中间特征。
基于步骤S220的方法,通过结合各虚拟对象与目标虚拟对象之间的距离与各虚拟对象当前的状态,为每个虚拟对象赋予了不同的注意力权重值,通过不同的权重值模拟人类对不同虚拟对象的关注程度不同,以根据不同关注度的虚拟对象的基本特征得到第一中间特征,有效提高了虚拟对象的行为预测准确度。
继续参考图2,在步骤S230,获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征。
其中,位置预测信息可以包括虚拟对象的目标移动位置或目标操作位置的信息,如,目标移动位置的坐标。第二中间特征可以包括虚拟场景中带有不同的权重值的各区域的图像特征。
在一种实施方式中,上述地图特征可以包括:虚拟场景的全局地图对应的全局地图特征,以及虚拟场景中目标虚拟对象所在的局部区域对应的局部地图特征;上述第二中间特征可以包括全局地图中间特征与局部地图中间特征;上述获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征,如图5所示,可以包括步骤S510~S530:
步骤S510,对目标虚拟对象的活动位置进行预测,得到位置预测信息;该位置预测信息包括全局位置预测信息和局部位置预测信息,全局位置预测信息用于表示目标虚拟对象在全局地图中的预测位置,局部位置预测信息用于表示目标虚拟对象在局部区域中的预测位置;
步骤S520,根据全局位置预测信息确定全局注意力权重,利用全局注意力权重对全局地图特征进行加权,得到全局地图中间特征;
步骤S530,根据局部位置预测信息确定局部注意力权重,利用局部注意力权重对局部地图特征进行加权,得到局部地图中间特征。
其中,全局地图中间特征可以包括利用全局注意力权重加权后的全局地图特征,局部地图中间特征可以包括利用局部注意力权重加权后的局部地图特征。
举例而言,在MOBA游戏场景中,可以包括小地图信息和局部地图信息,这两种地图信息可以包括区域内是否存在草丛,区域内小兵数量等对目标虚拟对象的行为选择起关键作用的信息。由于直接获取到的地图信息存在大量冗余,且英雄在一定时间段内的活动范围有限,因此可以通过卷积神经网络对小地图信息和局部地图信息进行特征提取,得到全局地图特征和局部地图特征。从而根据全局地图特征和局部地图特征进行目标虚拟对象的活动位置预测,以得到全局位置预测信息和局部位置预测信息。再通过全局位置预测信息确定全局注意力权重,通过局部位置预测信息确定局部注意力权重,利用全局注意力权重对全局地图特征进行加权,利用局部注意力权重对局部地图特征进行加权,以实现目标虚拟对象对虚拟场景中的不同区域具有不同的关注度。
基于图5的方法,得到了包括全局地图中间特征和局部地图中间特征的第二中间特征,为虚拟场景中的不同区域赋予了不同的注意力权重值,也就是说,从目标虚拟对象的角度实现了对虚拟场景中的不同区域的关注程度不同,提高了目标虚拟对象的拟人化程度,从而有利于提高对目标虚拟对象的行为预测的准确度。
在一种实施方式中,上述对目标虚拟对象的活动位置进行预测,得到位置预测信息,包括下述步骤:
根据全局地图特征和局部地图特征对目标虚拟对象的活动位置进行预测,得到位置预测信息。例如,可以通过将全局地图特征和局部地图特征输入深度模型中的分类器,以对目标虚拟对象的活动位置进行预测,根据分类结果确定位置预测信息。
在一种实施方式中,还可以通过全局显著图和局部显著图获取全局地图中间特征和局部地图中间特征:可以根据全局位置预测信息获取全局显著图,根据局部位置预测信息获取局部显著图;其中,全局显著图可以包含全局注意力权重,局部显著图可以包括局部注意力权重;将全局地图特征与全局显著图进行像素点乘,可以得到全局地图中间特征;将局部地图特征与局部显著图进行像素点乘,则可以得到局部地图中间特征。通过获取全局显著图和局部显著图,得到了全局地图和局部地图中不同区域的显著性,根据显著图与地图特征进行像素点乘,以实现图像叠加,从而得到具有不同注意力权重的全局地图和局部地图,使得获取第二中间特征的模型结构简单,运算复杂度较低,有效提高了虚拟对象的行为预测方法的运行效率。
在获取到目标虚拟对象对应的第一中间特征和第二中间特征后,可以在步骤S240中,基于目标虚拟对象对应的第一中间特征和第二中间特征,输出第二时刻下目标虚拟对象的行为预测信息;第二时刻晚于第一时刻。
其中,行为预测信息可以用于表征目标虚拟对象何时在虚拟场景中哪个位置执行什么行为,可以根据行为预测信息控制目标虚拟对象在第二时刻的虚拟场景中的某个位置执行具体操作。
在一种实施方式中,可以将目标虚拟对象对应的第一中间特征和第二中间特征进行特征融合,根据融合后的特征输出第二时刻下目标虚拟对象的行为预测信息。
基于上述方法,通过对各虚拟对象的基本特征进行加权得到的第一中间特征和对虚拟场景的地图特征进行加权得到的第二中间特征,输出第二时刻下目标虚拟对象的行为预测信息,不仅降低了冗余特征对预测结果的干扰,还提高了行为预测结果的拟人化程度,进一步提升了虚拟对象的行为预测方法的准确度,改善了用户体验。
在一种实施方式中,上述虚拟对象的行为预测方法可以应用于MOBA游戏场景中的英雄的行为预测,如图6所示,上述虚拟对象的行为预测方法可以包括离线训练过程和在线预测过程。
在离线训练过程中,可以首先获取大量的5v5MOBA游戏对战录像,以得到包括虚拟对象的基本特征和游戏的地图特征的训练样本对,其中,训练样本对可以包括英雄特征、全局地图特征以及局部地图特征及这三组特征对应的标签;标签可以包括当前时刻英雄的具体操作、以及全局位置预测信息与局部位置预测信息,分别表示英雄在一定时间后做出动作时的所在位置在全局地图与局部地图中的区域。通过对英雄特征、全局地图特征以及局部地图特征进行特征选择和特征提取后,将处理过的英雄特征、全局地图特征以及局部地图特征进行模型训练。
在在线预测过程中,实时获取正在进行比赛的游戏场景的图像帧,根据上述特征提取方法获取处理后的英雄特征,全局地图特征以及局部地图特征,并基于这些特征进行模型预测,从而输出英雄在当前时刻的下一时刻所做出的操作。
在一种实施方式中,图6的模型预测部分可以包括下述步骤S710~S740:
步骤S710,获取预先训练的行为预测模型,该行为预测模型可以包括第一特征提取层、第二特征提取层与特征融合层;
在一种实施方式中,上述行为预测模型可以如图8所示,可以通过对虚拟对象的基本特征、全局地图特征以及局部地图特征使用不同的深度网络进行特征提取,并在虚拟对象的基本特征、全局地图特征以及局部地图特征的深度网络模型添加注意力机制,对虚拟对象的基本特征、全局地图特征以及局部地图特征添加关注度,以得到第一中间特征、全局地图中间特征以及局部地图中间特征;并根据这三组特征的特征融合结果进行虚拟对象的行为预测。通过在特征处理网络与分类网络之间加入了三个注意力机制模块来模拟人类玩家在真实场景下对不同信息给予的不同关注,实现了根据当前时刻的虚拟对象的基本特征以及虚拟场景的地图特征给予不同信息不同关注程度的功能。使得网络能够根据不同的特征输入得到不同的注意力权重,为静态网络提供了一定的自适应能力;且注意力机制模块结构精简,保持了整个模型的预测实时性,同时提高了预测结果的准确性与合理性;注意力机制模块模拟了人类玩家的注意力机制,为行为预测模型提供了一定的可解释性。
继续参考图7,在步骤S720中,上述根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到目标虚拟对象对应的第一中间特征,可以包括:
通过第一特征提取层对各虚拟对象的基本特征与目标虚拟对象的基本特征进行处理,确定目标虚拟对象对各虚拟对象的关注度,并基于各虚拟对象的关注度对各虚拟对象的基本特征进行加权,输出目标虚拟对象对应的的第一中间特征。
在一种实施方式中,如图9所示,第一特征提取层可以包括全连接层和注意力层,可以通过图9所示的第一特征提取层对虚拟对象的特征获取第一中间特征。首先可以通过全连接层根据虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,确定状态权重和位置权重;将团队信息输入全连接层进行训练可以得到调整参数α;将调整参数α与距离权重的乘积,与状态权重的和输入归一化层,根据归一化层的输出结果确定目标虚拟对象对各虚拟对象的关注度;基于各虚拟对象的关注度对各虚拟对象的基本特征进行加权,以得到目标虚拟对象对应的第一中间特征。通过轻量化的网络模型,根据目标虚拟对象与各虚拟对象之间的位置关系,以及目标虚拟对象与各虚拟对象之间的状态关系,为不同虚拟对象的基本特征分配不同的注意力权重,显式建模了不同虚拟对象对当前时刻的目标虚拟对象具体操作的影响程度。
继续参考图7,在步骤S730中,上述获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征,可以包括下述步骤:
通过第二特征提取层对地图特征进行处理,得到目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征。
在一种实施方式中,如图10所示,第二特征提取层可以包括卷积层、全连接层与归一化层,可以将实时获取的全局地图或局部地图输入卷积层,以提取全局地图特征或局部地图特征;将全局位置预测信息或局部位置预测信息输入全连接层和归一化层,以得到带有全局注意力权重或局部注意力权重的全局显著图或局部显著图;将全局显著图与全局地图特征进行像素点乘,或者将局部显著图局部地图特征进行像素点乘;根据像素点乘的结果得到全局地图中间特征或局部地图中间特征。从人类用户的视角出发,模拟了人类用户对地图不同区域不同的关注程度,增加了网络的可解释性,为网络引入了有效的归纳偏置。
继续参考图7,在得到第一中间特征和第二中间特征后,可以在步骤S740中,上述基于目标虚拟对象对应的第一中间特征和第二中间特征,输出第二时刻下目标虚拟对象的行为预测信息,可以包括下述步骤:
通过特征融合层将目标虚拟对象对应的第一中间特征和第二中间特征进行特征融合,根据融合后的特征输出第二时刻下目标虚拟对象的行为预测信息。
在一种实施方式中,相较于现有技术,通过在第一特征提取层和第二特征提取层中,对不同的特征分配注意力权重,使得全局位置预测准确率和局部位置预测准确率分别增长了0.26%和0.02%;目标虚拟对象的行为预测准确率提升了1.18%;位置预测准确率提升了2.37%。有效提高了虚拟对象的行为预测的准确率。
基于图7的方法,通过预先训练的行为预测模型对目标虚拟对象的行为进行预测;通过在第一特征提取层和第二特征提取层中为不同的特征分配注意力权重,降低了冗余特征对预测结果的干扰,改善了实时预测结果;且上述行为预测模型结构简单,计算复杂度低,运行效率高,同时具有较高的可移植性。
本公开的示例性实施方式还提供一种虚拟对象的行为预测装置。如图11所示,该虚拟对象的行为预测装置1100可以包括:
基本特征与地图特征获取模块1110,被配置为获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及虚拟场景的地图特征;虚拟场景内包括多个虚拟对象,多个虚拟对象包括待预测的目标虚拟对象;
第一中间特征获取模块1120,被配置为根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到目标虚拟对象对应的第一中间特征;
第二中间特征获取模块1130,被配置为获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征;
行为预测信息输出模块1140,被配置为基于目标虚拟对象对应的第一中间特征和第二中间特征,输出第二时刻下目标虚拟对象的行为预测信息;第二时刻晚于第一时刻。
在一种实施方式中,上述基本特征包括位置信息和状态信息;根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到目标虚拟对象对应的第一中间特征,可以包括:
根据各虚拟对象的位置信息与目标虚拟对象的位置信息之间的关系,确定各虚拟对象的位置权重;
根据各虚拟对象的状态信息与目标虚拟对象的状态信息之间的关系,确定各虚拟对象的状态权重;
基于各虚拟对象的位置权重与状态权重,确定各虚拟对象的关注度;
基于各虚拟对象的关注度对各虚拟对象的基本特征进行加权,以得到目标虚拟对象对应的第一中间特征。
在一种实施方式中,上述根据各虚拟对象的位置信息与目标虚拟对象的位置信息之间的关系,确定各虚拟对象的位置权重,可以包括:
根据任一虚拟对象的位置信息与目标虚拟对象的位置信息,确定任一虚拟对象与目标虚拟对象之间的距离;
计算距离与虚拟场景中的最远距离的比值,根据比值确定任一虚拟对象的位置权重。
在一种实施方式中,上述根据各虚拟对象的状态信息与目标虚拟对象的状态信息之间的关系,确定各虚拟对象的状态权重,可以包括:
根据任一虚拟对象的状态信息与目标虚拟对象的状态信息的相似度,确定任一虚拟对象的状态权重。
在一种实施方式中,上述地图特征可以包括:虚拟场景的全局地图对应的全局地图特征,以及虚拟场景中目标虚拟对象所在的局部区域对应的局部地图特征;第二中间特征包括全局地图中间特征与局部地图中间特征;上述获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征,可以包括:
对目标虚拟对象的活动位置进行预测,得到位置预测信息;位置预测信息包括全局位置预测信息和局部位置预测信息,全局位置预测信息用于表示目标虚拟对象在全局地图中的预测位置,局部位置预测信息用于表示目标虚拟对象在局部区域中的预测位置;
根据全局位置预测信息确定全局注意力权重,利用全局注意力权重对全局地图特征进行加权,得到全局地图中间特征;
根据局部位置预测信息确定局部注意力权重,利用局部注意力权重对局部地图特征进行加权,得到局部地图中间特征。
在一种实施方式中,上述对目标虚拟对象的活动位置进行预测,得到位置预测信息,包括:
根据全局地图特征和局部地图特征对目标虚拟对象的活动位置进行预测,得到位置预测信息。
在一种实施方式中,上述方法还包括行为预测模型获取模块,被配置为获取预先训练的行为预测模型,行为预测模型包括第一特征提取层、第二特征提取层与特征融合层;
上述根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到目标虚拟对象对应的第一中间特征,包括:
通过第一特征提取层对各虚拟对象的基本特征与目标虚拟对象的基本特征进行处理,确定目标虚拟对象对各虚拟对象的关注度,并基于各虚拟对象的关注度对各虚拟对象的基本特征进行加权,输出目标虚拟对象对应的的第一中间特征;
上述获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征,包括:
通过第二特征提取层对地图特征进行处理,得到目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征;
上述基于目标虚拟对象对应的第一中间特征和第二中间特征,输出第二时刻下目标虚拟对象的行为预测信息,包括:
通过特征融合层将目标虚拟对象对应的第一中间特征和第二中间特征进行特征融合,根据融合后的特征输出第二时刻下目标虚拟对象的行为预测信息。
上述装置中各部分的具体细节在方法部分实施方式中已经详细说明,因而不再赘述。
本公开的示例性实施方式还提供了一种计算机可读存储介质,可以实现为一种程序产品的形式,其包括程序代码,当程序产品在电子设备上运行时,程序代码用于使电子设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。在一种可选的实施方式中,该程序产品可以实现为便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在电子设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本公开的示例性实施方式还提供一种电子设备。该电子设备可以包括处理器与存储器。存储器存储有处理器的可执行指令,如可以是程序代码。处理器通过执行该可执行指令来执行本示例性实施方式中的方法。
下面参考图12,以通用计算设备的形式对电子设备进行示例性说明。应当理解,图12显示的电子设备1200仅仅是一个示例,不应对本公开实施方式的功能和使用范围带来限制。
如图12所示,电子设备1200可以包括:处理器1210、存储器1220、总线1230、I/O(输入/输出)接口1240、网络适配器1250。
处理器1210可以包括一个或多个处理单元,例如:处理器1210可以包括中央处理器(Central Processing Unit,CPU)、AP(Application Processor,应用处理器)、调制解调处理器、显示处理器(Display Process Unit,DPU)、GPU(Graphics Processing Unit,图形处理器)、ISP(Image Signal Processor,图像信号处理器)、控制器、编码器、解码器、DSP(Digital Signal Processor,数字信号处理器)、基带处理器、人工智能处理器等。在一种实施方式中,可以由人工智能处理器获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及虚拟场景的地图特征;再根据各虚拟对象的基本特征与目标虚拟对象的基本特征之间的关系,对各虚拟对象的基本特征进行加权,得到目标虚拟对象对应的第一中间特征;并获取目标虚拟对象的位置预测信息,根据位置预测信息对虚拟场景中的不同区域的地图特征进行加权,得到目标虚拟对象对应的第二中间特征;最后基于目标虚拟对象对应的第一中间特征和第二中间特征,输出第二时刻下目标虚拟对象的行为预测信息;其中,第二时刻晚于第一时刻。
存储器1220可以包括易失性存储器,例如RAM 1221、缓存单元1222,还可以包括非易失性存储器,例如ROM 1223。存储器1220还可以包括一个或多个程序模块1224,这样的程序模块1224包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。例如,程序模块1224可以包括上述装置1100中的各模块。
总线1230用于实现电子设备1200的不同组件之间的连接,可以包括数据总线、地址总线和控制总线。
电子设备1200可以通过I/O接口1240与一个或多个外部设备1300(例如键盘、鼠标、外置控制器等)进行通信。
电子设备1200可以通过网络适配器1250与一个或者多个网络通信,例如网络适配器1250可以提供如3G/4G/5G等移动通信解决方案,或者提供如无线局域网、蓝牙、近场通信等无线通信解决方案。网络适配器1250可以通过总线1230与电子设备1200的其它模块通信。
尽管图12中未示出,还可以在电子设备1200中设置其它硬件和/或软件模块,包括但不限于:显示器、微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方式。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限定。
Claims (10)
1.一种虚拟对象的行为预测方法,其特征在于,包括:
获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及所述虚拟场景的地图特征;所述虚拟场景内包括多个虚拟对象,所述多个虚拟对象包括待预测的目标虚拟对象;
根据各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征之间的关系,对各所述虚拟对象的基本特征进行加权,得到所述目标虚拟对象对应的第一中间特征;
获取所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征;
基于所述目标虚拟对象对应的所述第一中间特征和所述第二中间特征,输出第二时刻下所述目标虚拟对象的行为预测信息;所述第二时刻晚于所述第一时刻。
2.根据权利要求1所述的方法,其特征在于,所述基本特征包括位置信息和状态信息;所述根据各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征之间的关系,对各所述虚拟对象的基本特征进行加权,得到所述目标虚拟对象对应的第一中间特征,包括:
根据各所述虚拟对象的位置信息与所述目标虚拟对象的位置信息之间的关系,确定各所述虚拟对象的位置权重;
根据各所述虚拟对象的状态信息与所述目标虚拟对象的状态信息之间的关系,确定各所述虚拟对象的状态权重;
基于各所述虚拟对象的位置权重与状态权重,确定各所述虚拟对象的关注度;
基于各所述虚拟对象的关注度对各所述虚拟对象的基本特征进行加权,以得到所述目标虚拟对象对应的第一中间特征。
3.根据权利要求2所述的方法,其特征在于,所述根据各所述虚拟对象的位置信息与所述目标虚拟对象的位置信息之间的关系,确定各所述虚拟对象的位置权重,包括:
根据任一虚拟对象的位置信息与所述目标虚拟对象的位置信息,确定所述任一虚拟对象与所述目标虚拟对象之间的距离;
计算所述距离与所述虚拟场景中的最远距离的比值,根据所述比值确定所述任一虚拟对象的位置权重。
4.根据权利要求2所述的方法,其特征在于,所述根据各所述虚拟对象的状态信息与所述目标虚拟对象的状态信息之间的关系,确定各所述虚拟对象的状态权重,包括:
根据任一虚拟对象的状态信息与所述目标虚拟对象的状态信息的相似度,确定所述任一虚拟对象的状态权重。
5.根据权利要求1所述的方法,其特征在于,所述地图特征包括:所述虚拟场景的全局地图对应的全局地图特征,以及所述虚拟场景中所述目标虚拟对象所在的局部区域对应的局部地图特征;所述第二中间特征包括全局地图中间特征与局部地图中间特征;所述获取所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征,包括:
对所述目标虚拟对象的活动位置进行预测,得到所述位置预测信息;所述位置预测信息包括全局位置预测信息和局部位置预测信息,所述全局位置预测信息用于表示所述目标虚拟对象在所述全局地图中的预测位置,所述局部位置预测信息用于表示所述目标虚拟对象在所述局部区域中的预测位置;
根据所述全局位置预测信息确定全局注意力权重,利用所述全局注意力权重对所述全局地图特征进行加权,得到所述全局地图中间特征;
根据所述局部位置预测信息确定局部注意力权重,利用所述局部注意力权重对所述局部地图特征进行加权,得到所述局部地图中间特征。
6.根据权利要求5所述的方法,其特征在于,所述对所述目标虚拟对象的活动位置进行预测,得到所述位置预测信息,包括:
根据所述全局地图特征和所述局部地图特征对所述目标虚拟对象的活动位置进行预测,得到所述位置预测信息。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取预先训练的行为预测模型,所述行为预测模型包括第一特征提取层、第二特征提取层与特征融合层;
所述根据各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征之间的关系,对各所述虚拟对象的基本特征进行加权,得到所述目标虚拟对象对应的第一中间特征,包括:
通过所述第一特征提取层对各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征进行处理,确定所述目标虚拟对象对各所述虚拟对象的关注度,并基于各所述虚拟对象的关注度对各所述虚拟对象的基本特征进行加权,输出所述目标虚拟对象对应的的第一中间特征;
所述获取所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征,包括:
通过所述第二特征提取层对所述地图特征进行处理,得到所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征;
所述基于所述目标虚拟对象对应的所述第一中间特征和所述第二中间特征,输出第二时刻下所述目标虚拟对象的行为预测信息,包括:
通过所述特征融合层将所述目标虚拟对象对应的所述第一中间特征和所述第二中间特征进行特征融合,根据融合后的特征输出所述第二时刻下所述目标虚拟对象的行为预测信息。
8.一种虚拟对象的行为预测装置,其特征在于,包括:
基本特征与地图特征获取模块,被配置为获取第一时刻下虚拟场景中的每个虚拟对象的基本特征以及所述虚拟场景的地图特征;所述虚拟场景内包括多个虚拟对象,所述多个虚拟对象包括待预测的目标虚拟对象;
第一中间特征获取模块,被配置为根据各所述虚拟对象的基本特征与所述目标虚拟对象的基本特征之间的关系,对各所述虚拟对象的基本特征进行加权,得到所述目标虚拟对象对应的第一中间特征;
第二中间特征获取模块,被配置为获取所述目标虚拟对象的位置预测信息,根据所述位置预测信息对所述虚拟场景中的不同区域的所述地图特征进行加权,得到所述目标虚拟对象对应的第二中间特征;
行为预测信息输出模块,被配置为基于所述目标虚拟对象对应的所述第一中间特征和所述第二中间特征,输出第二时刻下所述目标虚拟对象的行为预测信息;所述第二时刻晚于所述第一时刻。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211425300.5A CN115671733A (zh) | 2022-11-14 | 2022-11-14 | 虚拟对象的行为预测方法、装置、存储介质与电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211425300.5A CN115671733A (zh) | 2022-11-14 | 2022-11-14 | 虚拟对象的行为预测方法、装置、存储介质与电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115671733A true CN115671733A (zh) | 2023-02-03 |
Family
ID=85052270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211425300.5A Pending CN115671733A (zh) | 2022-11-14 | 2022-11-14 | 虚拟对象的行为预测方法、装置、存储介质与电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115671733A (zh) |
-
2022
- 2022-11-14 CN CN202211425300.5A patent/CN115671733A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109621422B (zh) | 电子棋牌决策模型训练方法及装置、策略生成方法及装置 | |
US11491400B2 (en) | Method, apparatus, and device for scheduling virtual objects in virtual environment | |
US20240189718A1 (en) | Game character behavior control method and apparatus, storage medium, and electronic device | |
CN111282267B (zh) | 信息处理方法、装置、介质及电子设备 | |
CN111111220B (zh) | 多人对战游戏的自对弈模型训练方法、装置和计算机设备 | |
CN109529338B (zh) | 对象控制方法、装置、电子设计及计算机可读介质 | |
DE102020127706A1 (de) | Inferenz, markenzeichen und tm spielereigniserfassung | |
CN113344184B (zh) | 用户画像预测方法、装置、终端和计算机可读存储介质 | |
CN110325965B (zh) | 虚拟场景中的对象处理方法、设备及存储介质 | |
CN113069769A (zh) | 云游戏界面显示方法、装置、电子设备以及存储介质 | |
CN113230650B (zh) | 一种数据处理方法、装置及计算机可读存储介质 | |
CN117899483A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
US20230311002A1 (en) | Decision model training method and apparatus | |
CN116570929A (zh) | 游戏智能体确定、游戏运行方法、装置、介质和电子设备 | |
CN115671733A (zh) | 虚拟对象的行为预测方法、装置、存储介质与电子设备 | |
CN111443806B (zh) | 交互任务的控制方法、装置、电子设备及存储介质 | |
CN113946604A (zh) | 分阶段围棋教学方法、装置、电子设备及存储介质 | |
CN112870716B (zh) | 游戏数据处理方法、装置、存储介质与电子设备 | |
CN118662905A (zh) | 一种游戏行为动作预测方法、装置、设备及介质 | |
CN113590334B (zh) | 角色模型处理的方法、装置、介质及电子设备 | |
KR102633104B1 (ko) | 리그 오브 레전드 게임의 전장 내의 챔피언을 자동으로 플레이하는 봇의 행동을 결정하는 방법 및 이를 수행하는 컴퓨팅 시스템 | |
US20240165509A1 (en) | Artificial Intelligence (AI) Player Modeling and Training | |
Li et al. | AIBPO: Combine the Intrinsic Reward and Auxiliary Task for 3D Strategy Game | |
CN116966551A (zh) | 解析信息生成方法、装置、设备及计算机可读存储介质 | |
Tyagi et al. | Towards Seamless Integration of AI-Driven Agents in Video Games: Techniques, Challenges, and Implications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |