WO2023024762A1

WO2023024762A1 - 人工智能对象控制方法、装置、设备及存储介质

Info

Publication number: WO2023024762A1
Application number: PCT/CN2022/106330
Authority: WO
Inventors: 张树宝
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2021-08-23
Filing date: 2022-07-18
Publication date: 2023-03-02
Also published as: CN114272599A; US20230293995A1

Abstract

一种人工智能对象控制方法、装置、设备及存储介质，属于人工智能技术领域。该方法包括：终端显示虚拟场景界面(201)，虚拟场景界面显示有本终端的被控虚拟对象；终端通过虚拟场景界面检测控制指令(202)，控制指令用于指示被控虚拟对象的本方阵营中的人工智能对象执行目标操作；终端基于控制指令，控制人工智能对象执行目标操作(203)。

Description

人工智能对象控制方法、装置、设备及存储介质

本申请要求于2021年08月23日提交、申请号为202110969023.3、发明名称为“人工智能对象控制方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及人工智能技术领域，特别涉及一种人工智能对象控制方法、装置、设备及存储介质。

背景技术

随着AI(Artificial Intelligence，人工智能)技术的发展，在游戏、医疗等领域中逐渐出现了人工智能对象。人工智能对象是基于神经网络模型操控的对象，而不是由用户基于终端操控的对象。

发明内容

本申请实施例提供了一种人工智能对象控制方法、装置、设备及存储介质，扩展了人工智能对象的功能，提供了一种操作可控的人工智能对象。所述技术方案如下：

一方面，提供了一种人工智能对象控制方法，所述方法包括：

终端显示虚拟场景界面，所述虚拟场景界面显示有本端的被控虚拟对象；

所述终端通过所述虚拟场景界面检测控制指令，所述控制指令用于指示所述被控虚拟对象的本方阵营中的人工智能对象执行目标操作；

所述终端基于所述控制指令，控制所述人工智能对象执行所述目标操作。

另一方面，提供了一种人工智能对象控制方法，所述方法包括：

服务器接收终端发送的控制指令，所述控制指令用于指示人工智能对象执行目标操作；

所述服务器基于所述控制指令，控制所述人工智能对象执行所述目标操作；

其中，所述人工智能对象属于所述终端的被控虚拟对象的本方阵营。

另一方面，提供了一种人工智能对象控制装置，所述装置包括：

显示模块，用于显示虚拟场景界面，所述虚拟场景界面显示有本端的被控虚拟对象；

检测模块，用于通过所述虚拟场景界面检测控制指令，所述控制指令用于指示所述被控虚拟对象的本方阵营中的人工智能对象执行目标操作；

第一控制模块，用于基于所述控制指令，控制所述人工智能对象执行所述目标操作。

接收模块，用于接收终端发送的控制指令，所述控制指令用于指示人工智能对象执行目标操作；

控制模块，用于基于所述控制指令，控制所述人工智能对象执行所述目标操作；

另一方面，提供了一种终端，所述终端包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的人工智能对象控制方法所执行的操作。

另一方面，提供了一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的人工智能对象控制方法所执行的操作。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行以实现如上述方面所述的人工智能对象控制方法所执行的操作。

另一方面，提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机程序代码，所述计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取所述计算机程序代码，处理器执行所述计算机程序代码，使得所述计算机设备实现如上述方面所述的人工智能对象控制方法所执行的操作。

本申请实施例扩展了人工智能对象的功能，提供了一种操作可控的人工智能对象，用户只需发出控制指令，即可控制与被控虚拟对象属于同一阵营的人工智能对象执行目标操作，实现了对人工智能对象的控制，从而实现了人与人工智能对象之间的协同配合。

附图说明

图1是本申请实施例提供的一种实施环境的示意图。

图2是本申请实施例提供的一种人工智能对象控制方法的流程图。

图3是本申请实施例提供的一种虚拟场景界面的示意图。

图4是本申请实施例提供的另一种虚拟场景界面的示意图。

图5是本申请实施例提供的另一种虚拟场景界面的示意图。

图6是本申请实施例提供的另一种虚拟场景界面的示意图。

图7是本申请实施例提供的另一种虚拟场景界面的示意图。

图8是本申请实施例提供的另一种虚拟场景界面的示意图。

图9是本申请实施例提供的另一种虚拟场景界面的示意图。

图10是本申请实施例提供的另一种虚拟场景界面的示意图。

图11是本申请实施例提供的一种人工智能对象控制方法的流程图。

图12是本申请实施例提供的另一种人工智能对象控制方法的流程图。

图13是本申请实施例提供的一种深度隐变量神经网络模型的示意图。

图14是本申请实施例提供的一种终端与服务器的交互示意图。

图15是本申请实施例提供的一种验证控制指令的方法的流程图。

图16是本申请实施例提供的一种地图网格化示意图。

图17是本申请实施例提供的一种多个时刻的网格的示意图。

图18是本申请实施例提供的一种预测模型的示意图。

图19是本申请实施例提供的另一种深度隐变量神经网络模型的示意图。

图20是本申请实施例提供的一种意图预测模型的示意图。

图21是本申请实施例提供的一种神经网络模型的示意图。

图22是本申请实施例提供的一种共享编码网络的示意图。

图23是本申请实施例提供的一种人工智能对象控制装置的结构示意图。

图24是本申请实施例提供的另一种人工智能对象控制装置的结构示意图。

图25是本申请实施例提供的一种终端的结构示意图。

图26是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

本申请涉及到的虚拟场景用于模拟一个三维虚拟空间，该三维虚拟空间是一个开放空间，该虚拟场景用于模拟现实中的真实环境，例如，该虚拟场景中包括天空、陆地、海洋等，该陆地包括沙漠、城市等环境元素。当然，在该虚拟场景中还可以包括虚拟物品，例如，建筑物、载具、虚拟场景中的虚拟对象用于武装自己或与其他虚拟对象进行战斗所需的兵器等道具。该虚拟场景还可以用于模拟不同天气下的真实环境，例如，晴天、雨天、雾天或黑夜等天气。

用户控制虚拟对象在该虚拟场景中进行移动，该虚拟对象是该虚拟场景中的一个虚拟的用于代表用户的虚拟形象，该虚拟形象是任一种形态，例如，人、动物等，本申请对此不限定。以射击类游戏为例，用户控制虚拟对象在该虚拟场景的天空中自由下落、滑翔或者打开降落伞进行下落等，在陆地上中跑动、跳动、爬行、弯腰前行等，也可以控制虚拟对象在海洋中游泳、漂浮或者下潜等，当然，用户也可以控制虚拟对象乘坐载具在该虚拟场景中进行移动。用户还可以控制虚拟对象在该虚拟场景中进出建筑物，发现并拾取该虚拟场景中的虚拟物品(例如，兵器等道具)，从而通过拾取的虚拟物品与其他虚拟对象进行战斗，例如，该虚拟物品可以是衣物、头盔、防弹衣、医疗品、冷兵器或热兵器等，也可以是其他虚拟对象被淘汰后遗留的虚拟物品。在此仅以上述场景进行举例说明，本申请实施例对此不作具体限定。

本申请实施例以电子游戏场景为例，用户提前在该终端上进行操作，该终端检测到用户的操作后，下载电子游戏的游戏配置文件，该游戏配置文件包括该电子游戏的应用程序、界面显示数据或虚拟场景数据等，以使得该用户在该终端上登录电子游戏时调用该游戏配置文件，对电子游戏界面进行渲染显示。用户在终端上进行触控操作，该终端检测到触控操作后，确定该触控操作所对应的游戏数据，并对该游戏数据进行渲染显示，该游戏数据包括虚拟场景数据、该虚拟场景中虚拟对象的行为数据等。

终端在对虚拟场景进行渲染显示时，全屏显示该虚拟场景，终端还可以在当前显示界面显示虚拟场景的同时，在该当前显示界面的第一预设区域独立显示全局地图，实际应用中，终端也可以在检测到对预设按钮的点击操作时，才对该全局地图进行显示。其中，该全局地图用于显示该虚拟场景的缩略图，该缩略图用于描述该虚拟场景对应的地形、地貌、地理位置等地理特征。当然，终端还可以在当前显示界面显示当前虚拟对象周边一定距离内的虚拟场景的缩略图，在检测到对该全局地图的点击操作时，在终端当前显示界面的第二预设区域显示整体虚拟场景的缩略图，以便于用户不仅可以查看其周围的虚拟场景，也可以查看整体虚拟场景。终端在检测到对该完整缩略图的缩放操作时，也可以对完整缩略图进行缩放显示。该第一预设区域和第二预设区域的具体显示位置和形状可以根据用户操作习惯来设定。例如，为了不对虚拟场景造成过多的遮挡，该第一预设区域可以为该当前显示界面右上角、右下角、左上角或左下角的矩形区域等，该第二预设区域可以为当前显示界面的右边或者左边的正方形区域，当然，该第一预设区域和第二预设区域也可以是圆形区域或其他形状的区域，本申请实施例对该预设区域的具体显示位置和形状不作限定。

为了便于理解本申请实施例，先对本申请实施例涉及到的关键词进行解释：

MOBA(Multiplayer Online Battle Arena，多人在线战术竞技)游戏：是一种在虚拟场景中提供若干个据点，处于不同阵营的用户控制虚拟对象在虚拟场景中对战，占领据点或摧毁敌对阵营据点的游戏。例如，MOBA游戏将用户分成至少两个敌对阵营，分属至少两个敌对阵营的不同虚拟队伍分别占据各自的地图区域，以某一种胜利条件作为目标进行竞技。该胜利条件包括但不限于：占领据点或摧毁敌对阵营据点、击杀敌对阵营的虚拟对象、在指定场景和时间内保证自身的存活、抢夺到某种资源、在指定时间内互动比分超过对方中的至少一种。例如，手机MOBA游戏可将用户分成两个敌对阵营，将用户控制的虚拟对象分散在虚拟场景中互相竞争，以摧毁或占领敌方的全部据点作为胜利条件。

在MOBA游戏中，用户控制虚拟对象释放技能从而与其他虚拟对象进行战斗，例如，该技能的技能类型可以包括攻击技能、防御技能、治疗技能、辅助技能、斩杀技能等，每个虚拟对象都可以具有各自固定的一个或多个技能，而不同的虚拟对象通常具有不同的技能，不同的技能可以产生不同的作用效果。比如，若虚拟对象释放攻击技能击中了敌对虚拟对象，那么会对敌对虚拟对象造成一定的伤害，通常表现为扣除敌对虚拟对象的一部分虚拟生命值，又比如，若虚拟对象释放治疗技能命中了友方虚拟对象，那么会对友方虚拟对象产生一定的治疗，通常表现为回复友方虚拟对象的一部分虚拟生命值，其他各类技能均可以产生相应的作用效果，这里不再一一枚举。

人AI协作：人类和AI在同一个环境中进行协作(共同合作完成某个任务)和交互(互相传递信号比如文字等)。这类AI通常称作协作AI，相对于传统AI智能体的自动化属性，协作AI也强调AI智能体的协作性和交互性。

动作可控制AI智能体：动作策略能够被控制指令改变的AI智能体。有些AI智能体通常只具备自动化属性，即智能体能够自主决策自主行动；但是它的动作不能被控制，即外界发起的控制指令无法改变AI智能体的动作。在人AI协作的场景中，AI智能体除了自动化属性外，也要具备协作性和交互性，即智能体要能够跟其它智能体进行协作交互。动作可控制AI智能体就能够满足这种协作交互的需求，它的动作可以被外部控制指令改变，从而可以完成协作交互。

图1是本申请实施例提供的一种实施环境的结构示意图，如图1所示，该实施环境包括终端101和服务器102。可选地，该终端101是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能电视、智能手表等，但并不局限于此。可选地，该服务器102是独立的物理服务器，或者，该服务器102是多个物理服务器构成的服务器集群或者分布式系统，或者，该服务器102是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端101以及服务器102通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

服务器102为终端101提供虚拟场景，终端101通过服务器102提供的虚拟场景，能够显示虚拟对象、虚拟道具等，并且终端101为用户提供操作环境，来检测用户执行的操作。服务器102能够针对终端检测到的操作，进行后台处理，为终端101提供后台支持。

可选地，终端101安装由服务器102提供服务的游戏应用，通过该游戏应用，终端101与服务器102能够进行交互。终端101运行该游戏应用，为用户提供针对该游戏应用的操作环境，能够检测用户对游戏应用的操作，并向服务器102发送操作指令，由服务器102根据操作指令进行响应，并将响应结果返回给终端101，由终端101进行展示，从而实现人机交互。

本申请实施例提供的方法，可用于多种场景。

例如，竞技游戏场景下：

终端运行竞技游戏，该游戏分为我方阵营和敌方阵营，其中，我方阵营包括终端的被控虚拟对象和人工智能对象。在玩家对我方阵营中的人工智能对象发出控制指令的情况下，终端能够检测到该控制指令，并基于该控制指令控制我方阵营中的人工智能对象执行该控制指令对应的目标操作。例如，该控制指令为集合指令，终端将控制我方阵营的人工智能对象向该终端的被控虚拟对象靠拢，直到完成全员集合，实现了对人工智能对象的控制。

又如，在实战模拟场景下：

玩家在购买新英雄之后，需要进行多局游戏才能熟悉该英雄，而实战模拟很好地满足了玩家训练新英雄的需求。在实战模拟中，将2个人类玩家的英雄搭配3个人工智能对象，组成一队，将5个人工智能对象组成敌方队，由这两个队伍进行对战。则采用本申请实施例提供的方法，玩家不仅可以控制自己的英雄，而且还可以控制同队中的人工智能对象。

图2是本申请实施例提供的一种人工智能对象控制方法的流程图，该方法由终端执行，如图2所示，该方法包括：

201、终端显示虚拟场景界面。

本申请实施例的虚拟场景包括至少两个敌对阵营的虚拟对象，其中每个阵营中既可以包括由终端操控的虚拟对象，也可以包括人工智能对象，另外还可以包括防御塔等对象。其中，人工智能对象是指基于神经网络模型操控的对象，人工智能对象也可称为AI智能体。

而终端显示虚拟场景界面，该虚拟场景界面显示有该终端的被控虚拟对象，另外还可以显示除该被控虚拟对象之外的其他对象，例如该被控虚拟对象的本方阵营中的对象，或者该被控虚拟对象的非本方阵营中的对象。其中，该被控虚拟对象的非本方阵营中的对象包括：该被控虚拟对象的敌方阵营中的对象，以及中立对象，如野怪等。

在一种可能实现方式中，虚拟场景界面以终端的被控虚拟对象的第一人称视角显示虚拟场景，则在虚拟场景界面显示该被控虚拟对象的视角范围内的部分虚拟场景，及位于该部分虚拟场景中的其他对象。

在另一种可能实现方式中，虚拟场景界面以第三人称视角显示虚拟场景，则在虚拟场景界面显示第三人称视角的视角范围内的部分虚拟场景，及位于该部分虚拟场景中的该被控虚拟对象和其他对象。

202、终端通过虚拟场景界面检测控制指令。

本申请实施例提供了一种人与人工智能对象之间交互的方案，用户在虚拟场景界面中触发控制指令，该控制指令用于指示被控虚拟对象的本方阵营中的人工智能对象执行目标操作，后续基于该控制指令，即可控制该人工智能对象执行该目标操作，从而模拟了该人工智能对象按照用户的指示来执行操作的效果，也即是实现了用户与人工智能对象之间的协同配合，也在虚拟场景中营造出了一种被控虚拟对象与人工智能对象之间协同配合的效果。

其中，该控制指令可以通过用户在虚拟场景界面中的至少一种操作触发，如点击某个控件的操作、拖动某个控件的操作、滑动操作或选中某个对象的操作等。

可选地，该控制指令为攻击指令，或者为撤退指令，或者为集合指令，或者是其他控制指令。

以下将对该控制指令进行举例说明：

可选地，该控制指令为攻击指令，该终端通过虚拟场景界面检测攻击指令，该攻击指令用于指示人工智能对象攻击非本方阵营的第一目标虚拟对象。

在一些实施例中，通过虚拟场景界面，检测攻击指令，包括以下方式：

第一种，通过虚拟场景界面检测对攻击控件的触发操作，生成攻击指令，该攻击指令用于指示人工智能对象攻击非本方阵营中与终端的被控虚拟对象距离最近的虚拟对象。

其中，该虚拟场景界面显示有攻击控件，用户触发该攻击控件，即可发起该攻击指令，此时默认本次需攻击的第一目标虚拟对象为：非本方阵营中与终端的被控虚拟对象距离最近的虚拟对象。

另外，该攻击指令还用于指示该被控虚拟对象的本方阵营中的其他虚拟对象，也攻击非本方阵营中与该被控虚拟对象距离最近的虚拟对象。

另外，对攻击控件的触发操作可以为对该攻击控件的点击操作、对该攻击控件的长按操作，或者拖动该攻击控件的操作，或者为对该攻击控件的其他操作。

第二种，通过虚拟场景界面检测将攻击控件拖动至第一目标虚拟对象的对象标识的操作，生成攻击指令，该攻击指令用于指示人工智能对象攻击该对象标识对应的虚拟对象。

其中，该虚拟场景界面显示有攻击控件和虚拟场景中的至少一个对象的对象标识，其中，该对象标识用于确定唯一的对象，可以为虚拟对象的图标或者名称等。

用户将该攻击控件拖动至第一目标虚拟对象的对象标识，即可发起该攻击指令，则本次需攻击的对象即为该对象标识所对应的第一目标虚拟对象。其中，该第一目标虚拟对象可以为非本方阵营中的任一对象，如，第一目标虚拟对象为敌方阵营中的虚拟对象，或者为敌方阵营中的人工智能对象，或者为敌方阵营中的防御塔，或者为野怪，或者为其他虚拟对象。用户将该攻击控件拖动至不同的对象标识，即可指示攻击不同的虚拟对象。

另外，该攻击指令还用于指示该被控虚拟对象的本方阵营中的其他虚拟对象，也攻击该对象标识所对应的第一目标虚拟对象。

如图3所示，该虚拟场景界面显示有虚拟场景的缩略地图，用户点击该缩略地图，将该缩略地图放大，即在该虚拟场景界面中显示虚拟场景的地图以及攻击控件301，并且该地图中显示有各个对象的图标。其中，对象标识302为敌方阵营中的某个英雄的图标。用户将该攻击控件301拖动至对象标识302处，即可生成攻击指令，该攻击指令用于指示本方阵营中的人工智能对象攻击对象标识302对应的英雄。

如图4所示，该虚拟场景界面显示有虚拟场景的缩略地图，用户点击该缩略地图，将该缩略地图放大，即在该虚拟场景界面中显示虚拟场景的地图以及攻击控件401，并且该地图中显示有各个对象的图标。其中，对象标识402为某只野怪的图标。用户将该攻击控件401拖动至对象标识402处，即可生成攻击指令，该攻击指令用于指示本方阵营中的人工智能对象攻击对象标识402对应的野怪。

第三种，通过虚拟场景界面检测对第一目标虚拟对象的对象标识的选中操作，生成攻击指令，该攻击指令用于指示人工智能对象攻击该对象标识对应的虚拟对象。

其中，该虚拟场景界面显示有虚拟场景中的至少一个对象的对象标识，其中，该对象标识用于确定唯一的对象，可以为虚拟对象的图标或者名称等。

用户触发对第一目标虚拟对象的对象标识的选中操作，即可发起该攻击指令，则本次需攻击的对象即为该对象标识所对应的第一目标虚拟对象。其中，该第一目标虚拟对象可以为非本方阵营中的任一对象，如，第一目标虚拟对象为敌方阵营中的虚拟对象，或者为敌方阵营中的人工智能对象，或者为敌方阵营中的防御塔，或者为野怪，或者为其他虚拟对象。用户选中不同的对象标识，即可指示攻击不同的虚拟对象。

另外，该攻击指令还用于指示该被控虚拟对象的本方阵营中的其他虚拟对象，也攻击该对象标识所对应的虚拟对象。

如图5所示，该虚拟场景界面显示有虚拟场景的地图及各个对象的图标，其中对象标识501为敌方阵营中的某个英雄的图标。用户触发对该对象标识501的选中操作，即可生成攻击指令，该攻击指令用于指示人工智能对象攻击该对象标识501对应的英雄。

如图6所示，该虚拟场景界面显示有虚拟场景的地图及各个对象的图标，其中对象标识601为某只野怪的图标。用户触发对该对象标识601的选中操作，即可生成攻击指令，该攻击指令用于指示人工智能对象攻击该对象标识601对应的野怪。

如图7所示，该虚拟场景界面显示有虚拟场景的地图及各个对象的图标，其中对象标识701为敌方阵营中的小兵的图标。用户触发对该对象标识701的选中操作，即可生成攻击指令，该攻击指令用于指示人工智能对象攻击该对象标识701对应的小兵。

在本申请实施例中，用户只需触发攻击指令，即可指示本方阵营中的人工智能对象进行攻击，实现了用户与人工智能对象之间的交互，从而提高了本方阵营的操作效率，增强了本方阵营的团队作战能力，从而有助于本方阵营更好地完成团队任务。

可选地，该控制指令为撤退指令，该终端通过虚拟场景界面检测撤退指令，该撤退指令用于指示人工智能对象撤退至安全位置。

在一些实施例中，通过虚拟场景界面，检测撤退指令，包括以下方式：

第一种，通过虚拟场景界面检测对撤退控件的触发操作，生成撤退指令，该撤退指令用于指示人工智能对象撤退至安全位置。

其中，该虚拟场景界面显示有撤退控件，用户触发该撤退控件，即可发起该撤退指令，指示人工智能对象撤退至安全位置。此时默认该安全位置为距离各个人工智能对象最近的安全位置，或者为本方阵营中距离各个人工智能对象最近的防御塔所在的位置，或者为其他位置等。

另外，该撤退指令还用于指示该被控虚拟对象的本方阵营中的其他虚拟对象，也撤退至安全位置。

另外，对撤退控件的触发操作可以为对该撤退控件的点击操作、对该撤退控件的长按操作，或者拖动该撤退控件的操作，或者为对该撤退控件的其他操作。

第二种，通过虚拟场景界面检测将撤退控件拖动至本方阵营的第三目标虚拟对象的对象标识的操作，生成撤退指令，该撤退指令用于指示人工智能对象撤退至第三目标虚拟对象的位置。

其中，该虚拟场景界面显示有撤退控件和虚拟场景中的至少一个对象的对象标识，其中，该对象标识用于确定唯一的对象，可以为虚拟对象的图标或者名称等。

用户将该撤退控件拖动至第三目标虚拟对象的对象标识，即可发起该撤退指令，则本次人工智能对象需撤退至第三目标虚拟对象所在的位置。其中，该第一目标虚拟对象可以为本方阵营中的任一对象，如，第三目标虚拟对象为本方阵营中的虚拟对象，或者为本方阵营中的人工智能对象，或者为本方阵营中的防御塔。用户将该撤退控件拖动至不同的对象标识，即可指示人工智能对象撤退至不同虚拟对象所在的位置。

另外，该撤退指令还用于指示该被控虚拟对象的本方阵营中的其他虚拟对象，也撤退至该第三目标虚拟对象所在的位置。

如图8所示，该虚拟场景界面显示有虚拟场景的缩略地图，用户点击该缩略地图，将该缩略地图放大，即在该虚拟场景界面中显示虚拟场景的地图以及撤退控件801，并且该地图中显示有各个对象的图标。其中，对象标识802为本方阵营中的某个防御塔的图标。用户将该攻击控件801拖动至对象标识802处，即可生成撤退指令，该撤退指令用于指示人工智能对象撤退至对象标识802所对应的防御塔所在的位置。

第三种，通过虚拟场景界面检测对第三目标虚拟对象的对象标识的选中操作，生成撤退指令，该撤退指令用于指示人工智能对象撤退至第三目标虚拟对象的位置。

用户触发对第三目标虚拟对象的对象标识的选中操作，即可发起该撤退指令，则本次人工智能对象需撤退至第三目标虚拟对象所在的位置。其中，该第一目标虚拟对象可以为本方阵营中的任一对象，如，第三目标虚拟对象为本方阵营中的虚拟对象，或者为本方阵营中的人工智能对象，或者为本方阵营中的防御塔。用户选中不同的对象标识，即可指示人工智能对象撤退至不同虚拟对象所在的位置。

如图9所示，该虚拟场景界面显示有虚拟场景的地图及各个对象的图标，其中对象标识901为本方阵营中的某个防御塔的图标。用户触发对该对象标识901的选中操作，即可生成撤退指令，该撤退指令用于指示人工智能对象撤退至对象标识901对应的防御塔所在的位置。

可选地，该控制指令为集合指令，该终端通过虚拟场景界面检测集合指令，该集合指令用于指示人工智能对象向被控虚拟对象或本方阵营的第二目标虚拟对象的位置移动。

在本申请实施例中，用户只需触发撤退指令，即可指示本方阵营中的人工智能对象撤退至安全位置，实现了用户与人工智能对象之间的交互，从而提高了本方阵营的操作效率，增强了本方阵营的团队作战能力，从而有助于保护本方阵营中的人工智能对象。

在一些实施例中，通过虚拟场景界面，检测集合指令，包括以下方式：

第一种，通过虚拟场景界面检测对集合控件的触发操作，生成集合指令，该集合指令用于指示人工智能对象向被控虚拟对象的位置移动。

其中，该虚拟场景界面显示有集合控件，用户触发该集合控件，即可发起该集合指令，此时默认人工智能对象需到达被控虚拟对象所在位置，从而与本方阵营中的虚拟对象集合，也即是人工智能对象需向该被控虚拟对象所在位置移动。

另外，该集合指令还用于指示该被控虚拟对象的本方阵营中的其他虚拟对象，也向该被控虚拟对象所在位置移动。

另外，对集合控件的触发操作可以为对该集合控件的点击操作、对该集合控件的长按操作，或者拖动该集合控件的操作，或者为对该集合控件的其他操作。

第二种，通过虚拟场景界面检测将集合控件拖动至本方阵营的第二目标虚拟对象的对象标识的操作，生成集合指令，该集合指令用于指示人工智能对象向第二目标虚拟对象的位置移动。

其中，该虚拟场景界面显示有集合控件和虚拟场景中的至少一个对象的对象标识，其中，该对象标识用于确定唯一的对象，可以为虚拟对象的图标或者名称等。

用户将该集合控件拖动至第二目标虚拟对象的对象标识，即可发起该集合指令，指示人工智能对象需前往第二目标虚拟对象所在的位置。其中，该第一目标虚拟对象可以为本方阵营中的任一对象，如，第二目标虚拟对象为本方阵营中的虚拟对象，或者为本方阵营中的人工智能对象，或者为本方阵营中的防御塔。用户将该集合控件拖动至不同虚拟对象的对象标识，即可指示人工智能对象撤退至不同虚拟对象所在的位置。

另外，该集合指令还用于指示该被控虚拟对象的本方阵营中的其他虚拟对象，也向该对象标识对应的第二目标虚拟对象所在的位置移动。

如图10所示，该虚拟场景界面显示有虚拟场景的缩略地图，用户点击该缩略地图，将该缩略地图放大，即在该虚拟场景界面中显示虚拟场景的地图以及集合控件1001，并且该地图中显示有各个对象的图标。其中，对象标识1002为本方阵营中的某个英雄的图标。用户将该集合控件1001拖动至对象标识1002处，即可生成集合指令，该集合指令用于指示人工智能对象向对象标识1002对应的英雄所在位置移动。

第三种，通过虚拟场景界面检测对第三目标虚拟对象的对象标识的选中操作，生成集合指令，该集合指令用于指示人工智能对象向第二目标虚拟对象的位置移动。

用户触发对第二目标虚拟对象的对象标识的选中操作，即可发起该集合指令，指示人工智能对象需向该第二目标虚拟对象所在的位置移动。其中，该第二目标虚拟对象可以为本方阵营中的任一对象，如，第二目标虚拟对象为本方阵营中的虚拟对象，或者为本方阵营中的人工智能对象，或者为本方阵营中的防御塔。

在本申请实施例中，用户只需触发集合指令，即可指示本方阵营中的人工智能对象集合，实现了用户与人工智能对象之间的交互，从而提高了本方阵营的操作效率，增强了本方阵营的团队作战能力，从而有助于本方阵营更好地完成团队任务。

203、终端基于控制指令，控制人工智能对象执行目标操作。

终端检测到控制指令之后，即可基于该控制指令，控制人工智能对象执行目标操作。例如，该控制指令为攻击指令，则基于该控制指令，控制人工智能对象攻击非本方阵营的第一目标虚拟对象。或者，该控制指令为撤退指令，则基于该撤退指令，控制人工智能对象撤退至安全位置。或者，该控制指令为集合指令，则基于该集合指令，控制人工智能对象集合。

可选地，该控制指令携带目标虚拟对象的对象标识，该目标操作为向目标虚拟对象移动的操作，则基于该控制指令，终端即可控制人工智能对象执行向目标虚拟对象移动的操作。例如，上述攻击指令、撤退指令或者集合指令，均可看做是指示人工智能对象向目标虚拟对象移动的操作，因此基于这些指令，即可控制人工智能对象移动。

需要说明的是，在本申请实施例中，基于控制指令控制人工智能对象执行目标操作，是指控制人工智能对象开始执行该目标操作，而不限定人工智能对象是否一定要将该目标操作执行完成。例如，在控制人工智能对象移动的过程中，如果该人工智能对象与非本方阵营中的其他虚拟对象相遇，则该人工智能对象与该其他虚拟对象进行对战操作，此时将不再继续按照控制指令的指示进行移动。待对战完成后，该人工智能对象可以继续按照控制指令的指示进行移动，也可以不再响应该控制指令。

另外，本申请实施例仅是以执行主体为终端为例进行说明，而在另一实施例中，终端与服务器连接，终端上的人工智能对象其实是由服务器基于神经网络模型进行控制，则若要实现对人工智能对象的控制，需要终端与服务器之间进行交互。

可选地，终端检测到控制指令之后，向服务器发送该控制指令，服务器用于基于控制指令，调用神经网络模型确定用于完成目标操作的至少一个子操作，控制人工智能对象执行至少一个子操作。

服务器中设置有神经网络模型，该神经网络模型用于对人工智能对象所需执行的操作进行预测。在每个时刻，服务器获取当前时刻的状态数据，调用该神经网络对该状态数据进行处理，从而预测出人工智能对象所需执行的操作，向人工智能对象对应的终端发送该操作，以使该终端显示该人工智能对象执行该操作的场景，从而实现了控制该人工智能对象执行该操作的效果。

而在本申请实施例中，为了响应控制指令，需要人工智能对象执行目标操作，因此，在每个时刻，服务器会调用神经网络模型确定用于完成该目标操作的子操作，从而控制人工智能对象执行该子操作。其中，任两个相邻的时刻之间的间隔可以为预先设置的目标时长，则服务器每隔该目标时长控制该人工智能对象执行一次子操作，则在至少一次控制之后，该人工智能对象会执行至少一个子操作，以满足该控制指令的要求。因此，子操作可以看做是目标操作的分解操作。

需要说明的是，服务器响应控制指令的详细过程可参见下述图11所示的实施例，在此暂不赘述。

并且，控制指令包括攻击指令、撤退指令、集合指令等多种指令，增强了控制指令的多样性，实现了对人工智能对象的不同类型的控制。

并且，提供了各个控制指令的多种触发方式，为用户提供了多种选择，便于用户的操作。

在上述实施例的基础上，该人工智能对象可以由服务器调用神经网络模型进行控制。以下将结合图11对控制该人工智能对象的过程进行详细说明。

图11是本申请实施例提供的一种人工智能对象控制方法的流程图，该方法由服务器执行，如图11所示，该方法包括：

1101、服务器接收终端发送的控制指令。

在本申请实施例中，服务器与终端连接，终端具有对应的被控虚拟对象，而服务器创建有虚拟场景以及人工智能对象，并且会设置神经网络模型，基于神经网络模型控制人工智能对象执行操作。在虚拟场景中，终端的被控虚拟对象与人工智能对象属于同一阵营，可以配合执行操作。

为了便于与人工智能对象协同配合，用户在终端上触发控制指令，终端向服务器发送该控制指令，该控制指令用于指示人工智能对象执行目标操作。其中，终端获取该控制指令的过程详见上述图2所示的实施例，在此不再赘述。

1102、服务器基于控制指令，控制人工智能对象执行目标操作。

其中，该人工智能对象属于终端的被控虚拟对象的本方阵营。

例如，该控制指令为攻击指令，则基于该控制指令，控制人工智能对象攻击非本方阵营的第一目标虚拟对象。或者，该控制指令为撤退指令，则基于该撤退指令，控制人工智能对象撤退至安全位置。或者，该控制指令为集合指令，则基于该集合指令，控制人工智能对象集合。

可选地，该控制指令携带目标虚拟对象的对象标识，该目标操作为向目标虚拟对象移动的操作，则基于该控制指令，即可控制人工智能对象执行向目标虚拟对象移动的操作。例如，上述攻击指令、撤退指令或者集合指令，均可看作是指示人工智能对象向目标虚拟对象移动的操作，因此基于这些指令，即可控制人工智能对象移动。

图12是本申请实施例提供的一种人工智能对象控制方法的流程图，该方法由服务器执行，该方法对服务器控制人工智能对象执行某一子操作的过程进行详细说明。如图12所示，该方法包括：

1201、服务器接收终端发送的控制指令。

其中，控制指令用于指示人工智能对象执行目标操作。

该步骤1201与上述图2和图11所示实施例同理，在此不再赘述。

服务器在接收到控制指令后，需要调用神经网络模型，控制人工智能对象执行与该控制指令对应的目标操作。但是考虑到虚拟场景中各个对象的情况复杂多变，直接控制该人工智能对象执行目标操作，很可能会与当前的虚拟场景的状态不符，因此，为了保证虚拟场景的真实性，以及保证人工智能对象所执行操作的连续性，该服务器会基于控制指令，调用神经网络模型，确定用于完成目标操作的至少一个子操作，控制人工智能对象执行至少一个子操作，以便满足该控制指令的要求。

例如，在每个时刻，服务器基于该控制指令，调用神经网络模型确定一个子操作，向终端下发该子操作，终端即可控制该人工智能对象执行该子操作，并在显示界面中显示该人工智能对象执行该子操作。之后在下一个时刻，服务器基于该控制指令，调用神经网络模型确定下一个子操作，向终端下发下一个子操作，终端即可控制该人工智能对象执行该下一个子操作。以此类推，即可按照该控制指令的指示，控制人工智能对象执行多个子操作。其中，任两个相邻时刻之间的间隔为预先设置的目标时长，则服务器每隔该目标时长控制该人工智能对象执行一次子操作。

并且，本申请实施例以神经网络模型包括编码网络、融合网络和操作预测网络为例进行说明，调用神经网络模型进行处理的过程详见下述步骤1202-1204。

1202、服务器调用编码网络，对多个虚拟对象的状态数据进行编码，得到多个虚拟对象的编码特征。

其中，该虚拟对象的状态数据用于表示该虚拟对象当前的状态，例如，该虚拟对象的状态数据包括虚拟对象的名称、类型、血量、技能类型等。该编码网络用于对虚拟对象的状态数据进行编码，得到编码特征。则该编码特征也能够反映出该虚拟对象当前的状态，后续对该编码特征进行处理，即可考虑该虚拟对象当前的状态，来确定人工智能对象可以执行的操作。

1203、服务器调用融合网络，基于权重特征，对多个虚拟对象的编码特征进行加权融合，得到融合特征，权重特征包括虚拟场景中的多个虚拟对象的权重参数，且权重特征基于控制指令确定。

该融合网络中包括权重特征，权重特征包括虚拟场景中的多个虚拟对象的权重参数，用于表示在预测人工智能对象需执行的操作时该多个虚拟对象的影响程度，基于权重特征对多个虚拟对象的编码特征进行加权融合，能够考虑到不同虚拟对象的不同影响程度，以保证为人工智能对象确定的操作是与虚拟场景中该多个虚拟对象的当前状态是匹配的，所确定的操作是准确的。而为了控制人工智能对象所执行的操作是与控制指令对应的操作，服务器在预测操作之前，首先基于控制指令来确定融合网络中的权重特征。

在一种可能实现方式中，控制指令包括被控虚拟对象的第一对象标识和目标虚拟对象的第二对象标识，目标操作为向目标虚拟对象移动的操作，也即是控制指令用于指示人工智能对象向目标虚拟对象移动。相应地，基于控制指令，确定融合网络中的权重特征，包括：将多个虚拟对象的编码特征构成编码矩阵，基于编码矩阵与编码矩阵的转置矩阵相乘得到的矩阵，确定第一权重特征，将第一权重特征中的非关联虚拟对象的权重参数设置为负无穷，得到第二权重特征。对第二权重特征进行归一化处理，将归一化处理后的权重特征确定为融合网络中的权重特征。其中，非关联虚拟对象与被控虚拟对象之间的距离，以及非关联虚拟对象与目标虚拟对象之间的距离均不小于距离阈值。

可选地，以下提供一种确定权重特征的操作流程，包括如下步骤：

1、输入

F＝[f ₁；f ₂；...；f _n]；

其中，w_logit表示权重特征，F表示编码矩阵，f _i表示第i个虚拟对象的编码特征，i和n为正整数，n表示虚拟对象的数量，i小于或等于n，

为缩放因子，[·] ₁表示矩阵的第一行向量。

由上述公式可知，输入的权重特征的过程包括：从编码矩阵与编码矩阵的转置矩阵相乘得到的矩阵中提取第一行向量，将此向量与缩放因子的乘积确定为该权重特征。

2、获取选择性注意力集合S，将终端的被控虚拟对象和目标虚拟对象加入到选择性注意力集合S中。

3、如果第i个虚拟对象的编码特征与终端的被控虚拟对象的编码特征之间的距离小于距离阈值，代表第i个虚拟对象为被控虚拟对象的非关联虚拟对象，则将第i个虚拟对象加入到选择性注意力集合S中。

4、如果第i个虚拟对象的编码特征与目标虚拟对象的编码特征之间的距离小于距离阈值，代表第i个虚拟对象为目标虚拟对象的非关联虚拟对象，则将第i个虚拟对象加入到选择性注意力集合S中。由此，可以确定选择性注意力集合S中都包括哪些对象。

5、针对选择性注意力集合S中不包含的对象，将这些对象的权重参数设置为负无穷，保留选择性注意力集合S中包含的对象的权重参数，从而得到更新后的权重特征w_logit’。之后对该权重特征进行归一化处理，即可得到归一化处理后的权重特征softmax(w_logit’)。

采用上述方式确定权重特征，相当于对多个虚拟对象的编码特征采用注意力机制进行处理，能够考虑到重要虚拟对象对目标虚拟对象需执行的操作的影响，而弱化无关虚拟对象对目标虚拟对象需执行的操作的影响，这样确定的操作才更为准确，更符合虚拟场景的当前状态。

在确定该权重特征之后，即可基于该权重特征，对该多个虚拟对象的编码特征进行加权融合，得到融合特征。可选地，基于该权重特征中的每个虚拟对象的权重参数，对该多个虚拟对象的编码特征进行加权求和，得到融合特征。或者，基于该权重特征中的每个虚拟对象的权重参数，对该多个虚拟对象的编码特征进行加权平均，得到融合特征。

1204、服务器调用操作预测网络，对融合特征进行操作预测，得到操作信息。

其中，该操作信息至少包括人工智能对象所需执行的子操作，也即是实现了为人工智能对象预测其要执行的子操作。另外该操作信息还可以包括人工智能对象预计执行该子操作的持续时长，或者还包括提示信息，该提示信息用于展示在终端上，以提示人工智能对象正在执行该子操作，或者还可以包括其他信息。

由于该融合特征能够考虑到该控制指令的指示，也能考虑到多个虚拟对象当前的状态以及影响程度，因此根据该融合特征预测出的操作信息更为准确。

1205、服务器向终端下发该操作信息。

1206、终端接收该操作信息，控制人工智能对象执行该子操作。

本申请实施例仅是以控制一次人工智能对象的过程为例，实际上，在接收到该控制指令之后，可以多次执行本申请实施例中的步骤，从而多次控制人工智能对象执行所确定的子操作。

以下将结合图13和图14，对游戏过程中控制AI智能体的过程进行举例说明，图13提供了一种深度隐变量神经网络模型的示意图，图14提供了一种终端与服务器的交互示意图。

如图13和图14所示，首先，玩家向队友发送控制指令，则玩家所在的终端将控制指令传回服务器，服务器调用深度隐变量神经网络模型，基于控制指令，预测此玩家的AI智能体队友的动作策略(即上述操作信息)。之后服务器将动作策略回传给终端，在终端上AI智能体队友即可根据动作策略执行相应的操作。

并且，该深度隐变量神经网络模型的输入为当前的游戏状态数据，包括当前终端所显示的游戏图像，各个虚拟对象的状态数据，用于表示虚拟场景全局状态的全局信息，以及终端的被控虚拟对象的可用技能等。其中，各个虚拟对象可以包括终端的主英雄、其他英雄、兵线、防御塔、野怪等。

该深度隐变量神经网络模型包括卷积网络、编码网络、融合网络和操作预测网络。其中，卷积网络对图像进行卷积运算，得到图像特征，编码网络对各个虚拟对象的状态数据进行编码，得到多个虚拟对象的编码特征，而融合网络可以看作是一个隐对齐模块，该隐对齐模块对多个虚拟对象的编码特征进行加权融合之后，再将加权融合得到的特征与该图像特征进行融合，得到融合特征，例如采用Concat算子(联结合并多个字符串的算子)将加权融合得到的特征与该图像特征进行融合，得到融合特征。而操作预测网络包括至少一个全连接层和至少一个融合层，从而能够对输入的特征进行全连接或者融合。

该隐对齐模块具有权重特征，该权重特征即为隐对齐模块的隐变量，该权重特征包括多个虚拟对象的权重参数，用来对该多个虚拟对象的编码特征进行加权。本质上，隐对齐模块是一个线性加权求和的算子，且权重向量被限制在一个特殊的隐空间内。隐对齐算子的数学表达式如下所示：

在以上算子中，

是虚拟对象的编码特征，f _fusion∈R ^d是融合后的特征向量，

是第i个虚拟对象的权重参数，

是概率单纯形，||v|| ₀是向量的l ₀范数即非零元素个数。权重特征w∈R ⁿ是一个隐随机变量，计算公式如下：

其中，i和n为正整数，n表示虚拟对象的数量，i小于或等于n，

为缩放因子，[·] ₁表示矩阵的第一行向量。

而该权重特征基于玩家发出的控制指令确定，具体确定方式与上述确定权重特征的操作流程类似，在此不再赘述。

隐对齐成功的关键在于：权重特征w∈R ⁿ是一个隶属于概率单纯形Δ ^n-1内的稀疏向量。权重特征的稀疏性可以理解为是在做虚拟对象的特征选择，即只保留权重参数不为零的虚拟对象的编码特征参与到预测动作策略的过程中，这实际上是在对齐虚拟对象的编码特征与预测的动作策略，所以权重特征w∈R ⁿ也被称作隐对齐变量。这种隐含的特征选择机制是与人类玩家打游戏的直觉相符的：玩家做出的决策只是由少数被重点关注的虚拟对象所决定，这其实是一种选择性注意力机制。如果需要改变预测的动作策略，我们只需要根据接收到的控制指令从概率单纯形Δ ^n-1内采样一个权重特征用于预测相应的动作策略即可。

该操作预测网络的输出为游戏按键，该游戏按键包括移动键和技能键，该移动键用于指示控制AI智能体队友进行移动，该技能键用于指示控制AI智能体队友释放某种技能，如召唤技能、位置型技能、方向型技能、目标型技能等。

本申请实施例提出了一种解决MOBA游戏中人AI协作的深度隐变量神经网络，其原理是基于隐对齐的方法，控制动作可控制的AI智能体。具体地，通过改变神经网络中的隐变量(权重特征)来改变预测的动作策略。在人类玩家与动作可控制的AI智能体队友搭配的游戏中，人类玩家通过发送具有某种目的性的控制指令给AI智能体队友，并让AI智能体队友执行指令从而能够主动配合玩家的意图，进而提升游戏的趣味和玩家的体验。

需要说明的是，上述图12所示的实施例对调用神经网络模型的过程进行了说明，而为了保证神经网络模型的准确性，需要先训练该神经网络模型。

在一种可能实现方式中，该神经网络模型的训练过程包括：获取样本数据，该样本数据包括在任一样本时刻的样本状态数据和样本操作信息，该样本状态数据包括在该样本时刻下，多个虚拟对象的状态数据，该样本操作信息包括在该样本时刻下，该人工智能对象应当执行的操作，则基于该样本数据训练该神经网络模型，也即是基于该神经网络模型对该样本状态数据进行处理，得到预测操作信息，该预测操作信息包括由神经网络模型预测的、在该样本时刻下该人工智能对象应执行的操作，则根据该样本操作信息与该预测操作信息，对该神经网络模型进行训练，以提高该神经网络模型的准确度。在经过一次或多次训练之后，即可得到准确度满足要求的神经网络模型，从而调用训练完成的神经网络模型来预测人工智能对象应执行的操作。

其中，该样本状态数据的具体内容与上述步骤1202中的状态数据类似，该样本操作信息和该预测操作信息的具体内容与上述步骤1204中的操作信息类似。息，而得到该预测操作信息的具体处理过程与上述步骤1202-1204类似，在此不再赘述。

在另一种可能实现方式中，还可以采用强化学习的方式训练该神经网络模型，在训练过程中，如果人工智能对象响应控制指令成功，则会获得奖励，在经过一次或多次训练后，即可使神经网络模型学习到响应控制指令的能力，从而得到更为准确的神经网络模型。

需要说明的另一点是，除该神经网络模型之外，还可以采用其他方式控制人工智能对象。在一个实施例中，该服务器设置有行为树模型，该行为树模型中定义了人工智能对象的操作规则，则该服务器接收到控制指令时，基于该行为树模型的指示，控制该人工智能对象执行目标操作。例如，该控制指令为集合指令，行为树模型中的规则是：一直向集合目标移动，直至到达集合目标附近为止。则基于该行为树模型的指示，即可控制该人工智能模型一直向集合目标移动，直至到达集合目标附近为止。

在上述实施例的基础上，为了便于判断是否控制人工智能对象对该控制指令进行响应，本申请实施例还提供了一种验证控制指令的方法，能够先验证控制指令，判断是否允许响应该控制指令，在允许响应该控制指令的情况下，再基于该控制指令控制人工智能对象。如图15所示，该方法包括：

1501、服务器接收终端发送的控制指令，并将该控制指令解析为服务器支持的格式。

1502、服务器对该控制指令进行验证。

解析该控制指令之后，对解析的控制指令进行验证，判断当前是否需要响应该控制指令，从而筛选出合理的控制指令，以及不合理的控制指令。

可选地，服务器预先确定目标规则，该目标规则可以是人工确定的。该控制指令满足该目标规则，则验证通过，即可执行后续步骤1503，而该控制指令不满足该目标规则，则验证不通过，不再执行后续步骤1504。

可选地，还可以调用意图预测模型来进行验证，筛选出需要响应的控制指令，过滤掉不需要响应的控制指令。其中，该意图预测模型用于基于当前的状态数据，在虚拟场景中，预测人工智能对象在下一时刻将要到达的第一位置，从而根据该第一位置以及该控制指令所指示的第二位置(指示人工智能对象需要到达的位置)，确定是否要响应该控制指令。

可选地，将虚拟场景的地图划分为多个网格，如将地图划分为12*12的网格。根据当前的状态数据，确定该人工智能对象的预测位置信息，该状态数据包含该人工智能对象当前的位置，该预测位置信息包括地图中每个网格对应的概率，该概率表示在下一时刻该人工智能对象到达该网格的概率。则该预测位置信息中网格的概率越大，在下一时刻该人工智能对象越有可能到达该网格。那么，将该预测位置信息中概率最大的前K个网格构成集合，该集合即可表示下一时刻该人工智能对象最有可能到达的K个位置，K为正整数。

之后将该集合与该控制指令所指示的第二位置进行对比，在该第二位置属于该集合的情况下，该控制指令验证通过，表示允许响应该控制指令。而在该第二位置不属于该集合的情况下，该控制指令验证未通过，表示不允许响应该控制指令。

举例来说，如图16所示，为地图中的每个网格按照顺序依次编号，人工智能对象当前在网格121，控制指令要求人工智能对象到达的目标位置在网格89，如果意图预测模型预测的集合P＝{26，27，89，116，117}，该集合中包括网格89，那么人工智能对象可以执行当前的控制指令，从而前往网格89。如果意图预测模型预测的集合P＝{26，27，80，116，117}，该集合中不包括网格89，那么需要拒绝执行当前的控制指令。

1503、在控制指令验证通过的情况下，基于该控制指令预测人工智能对象的动作策略。

1504、服务器将动作策略回传给终端，以便终端接收服务器回传的动作策略，按照该动作策略控制人工智能对象。

可选地，意图预测模型包括编码网络、融合网络和位置预测网络，调用意图预测模型确定人工智能对象的预测位置信息的过程，包括：服务器调用编码网络，对多个虚拟对象的状态数据进行编码，得到多个虚拟对象的编码特征，调用融合网络，基于权重特征，对多个虚拟对象的编码特征进行加权融合，得到融合特征，权重特征包括虚拟场景中的多个虚拟对象的权重参数，服务器调用位置预测网络，对融合特征进行位置预测，得到预测位置信息。

其中，调用编码网络、融合网络和位置预测网络的过程与上述步骤1202-1204的过程类似，区别在于，上述步骤1203中，神经网络模型中的融合网络的权重特征是基于所接收到的控制指令确定的，接收到的控制指令不同，该权重特征可能会发生变化。而在本实施例中，意图预测模型训练完成之后，意图预测模型中的融合网络的权重特征是不变的。

而在调用该意图预测模型，预测控制指令的意图之前，还需要先训练上述意图预测模型。训练意图预测模型的过程包括：获取样本数据，该样本数据包括在样本时刻多个虚拟对象的状态数据以及对应的位置标签，该状态数据至少包括在该样本时刻的图像帧，该状态数据与上述实施例中的状态数据类似，而该位置标签为在该样本时刻的下一个时刻发生进攻、集合、撤退等目标事件的网格的编号。之后即可基于该样本数据对意图预测模型进行训练，从而得到训练完成的意图预测模型。其中，上述事件定义为以下几种类型：1.发生了攻击行为；2.发生了集合行为；3.发生了撤退行为(从危险之处撤退到安全位置)，当然还可以包括其他的事件类型。并且，为了保证训练的准确性，该样本数据可以包括多个样本时刻的状态数据以及对应的位置标签，从而根据连续的多个时刻的状态数据和位置标签训练该意图预测模型。

可选地，可以基于人类玩家的数据训练意图预测模型，也即是，在训练意图预测模型的过程中获取到的样本数据是属于人类玩家的，即样本数据中包括人类玩家的被控虚拟对象的状态数据以及对应的位置标签，这样能够保证意图预测模型能够学习到人类玩家的事件，进而在调用意图预测模型预测控制指令的意图时，能够保证该意图是符合人类玩家的行为的。

如图17所示，某一英雄从t_(s-1)时刻出发，之后在t_s时刻发生了攻击行为，所以将[t_(s-1),t_s)时间段内的图像帧的位置标签标定为t_s时刻的网格编号；同理，该英雄在t_(s+1)时刻发生了撤退行为，则将[t_s,t_(s+1))时间段内的图像帧的位置标签标定为t_(s+1)时刻的网格编号，从而得到了各个时刻的样本数据。

而综合上述神经网络模型和上述意图预测模型，本申请实施例还提供了一种同时训练神经网络模型和意图预测模型的方式，也即是，如图18所示，服务器预先创建一种预测模型，该预测模型包括编码网络1801、融合网络1802和预测网络1803，而预测网络1803包括操作预测网络1831和位置预测网络1832，该操作预测网络1831用于预测人工智能对象的操作信息，以确定人工智能对象要执行的操作，而该位置预测网络1832用于预测人工智能对象的预测位置信息，以确定人工智能对象下一时刻要到达的位置。

在训练该预测模型时，获取样本数据，该样本数据包括在任一样本时刻的样本状态数据和样本操作信息，以及位置标签，该样本状态数据包括在该样本时刻下，多个虚拟对象的状态数据，该样本操作信息包括在该样本时刻下，该人工智能对象应当执行的操作，而该位置标签为在该样本时刻的下一个时刻发生进攻、集合、撤退等事件的网格的编号。则基于该样本数据训练该预测模型，也即是基于该预测模型对该样本状态数据进行处理，得到预测操作信息和预测位置标签，该预测操作信息包括由预测模型预测的、在该样本时刻下该人工智能对象应执行的操作，该预测位置信息包括人工智能对象在下一时刻要到达的位置，则根据该样本操作信息与该预测操作信息，以及该位置标签和该预测位置信息，对该预测模型进行训练，以提高该预测模型的准确度。在经过一次或多次训练之后，即可得到准确度满足要求的预测模型，从而调用训练完成的预测模型来进行预测。

举例来说，从图13和图19可以看出，在图13所示的深度隐变量神经网络模型中增添另一个全连接层，用于预测人工智能对象下一时刻要到达的位置，从而得到图19所示的深度隐变量神经网络模型，训练图19所示的深度隐变量神经网络模型即可。

这种综合训练的方式，能够同时训练出具备操作预测和位置预测功能的预测模型，提高了训练速度，节省了训练时间。

在一种可能实现方式中，在训练完成之后，为了分别实现操作预测功能和位置预测功能，基于已训练好的网络分别构建如图20所示的意图预测模型和如图21所示的神经网络模型。意图预测模型包括编码网络2001、融合网络2002和位置预测网络2003，神经网络模型包括编码网络2101、融合网络2102和操作预测网络2103。其中，编码网络2001和编码网络2101是由图18中的编码网络1801训练得到的，融合网络2002和融合网络2102是由图18中的融合网络1802训练得到的，位置预测网络2003是由图18中的位置预测网络1832训练得到的，操作预测网络2103是由图18中的操作预测网络1831训练得到的。

相应的，在服务器接收到控制指令之后，先调用意图预测模型，基于多个虚拟对象的状态数据确定人工智能对象的预测位置信息，该预测位置信息包括人工智能对象下一时刻可能到达的位置组成的集合，控制指令指示人工智能对象需到达的位置属于该集合的情况下，表示控制指令验证通过。则服务器基于该控制指令，确定融合网络2102中的权重特征，之后调用神经网络模型确定人工智能对象的操作信息。

并且，虽然在调用意图预测模型时，已经基于多个虚拟对象的状态数据确定多个虚拟对象的编码特征，但是后续在调用神经网络模型时，服务器还可以重新基于多个虚拟对象的状态数据确定多个虚拟对象的编码特征，以预测人工智能对象的操作信息。而且服务器可以对该多个虚拟对象的状态数据进行更改，例如，控制指令包括目标虚拟对象的第二对象标识，目标操作为向目标虚拟对象移动的操作，也即是控制指令指示人工智能对象到达该目标虚拟对象所在的位置。但是如果该目标虚拟对象不是该人工智能对象的攻击对象，神经网络模型是不会控制该人工智能对象移动至该目标虚拟对象所在的位置的，因此为了使神经网络模型能够控制该人工智能对象移动至该目标虚拟对象所在的位置，首先将该多个虚拟对象的状态数据中，人工智能对象的攻击对象的位置信息更改为该目标虚拟对象附近的位置信息，例如将该人工智能对象的攻击对象的坐标更改，以使更改后的坐标与该目标虚拟对象的坐标之间的距离小于预设距离，则人工智能对象会误以为攻击对象在该目标虚拟对象附近，因此会向该攻击对象移动，从而实现了向该目标虚拟对象移动的效果。

在另一种可能实现方式中，为了节省处理流程，意图预测模型和神经网络模型可以共享相同的编码网络，如图22所示，编码网络2001和编码网络2101是同一个编码网络，服务器调用编码网络2001，基于多个虚拟对象的状态数据确定多个虚拟对象的编码特征，之后调用融合网络2002和位置预测网络2003确定人工智能对象的预测位置信息，该预测位置信息包括人工智能对象下一时刻可能到达的位置组成的集合，控制指令指示人工智能对象需到达的位置属于该集合的情况下，表示控制指令验证通过。则服务器基于该控制指令，确定融合网络2102中的权重特征，之后调用融合网络2102和操作预测网络2103，对编码网络2001得到的编码特征进行预测，从而确定人工智能对象的操作信息。

图23是本申请实施例提供的一种人工智能对象控制装置的结构示意图。参见图23，该装置包括：

显示模块2301，用于显示虚拟场景界面，虚拟场景界面显示有本端的被控虚拟对象；

检测模块2302，用于通过虚拟场景界面检测控制指令，控制指令用于指示被控虚拟对象的本方阵营中的人工智能对象执行目标操作；

控制模块2303，用于基于控制指令，控制人工智能对象执行目标操作。

本申请实施例提供的人工智能对象控制装置，实现了人与人工智能对象之间的交互，该人工智能对象的操作是可控的，用户只需发出控制指令，即可控制与被控虚拟对象属于同一阵营的人工智能对象执行目标操作，实现了对人工智能对象的控制，从而实现了人与人工智能对象之间的协同配合，扩展了人工智能对象的功能。

可选地，检测模块2302，包括：

第一检测单元，用于通过虚拟场景界面，检测攻击指令，攻击指令用于指示人工智能对象攻击非本方阵营的第一目标虚拟对象；或者，

第二检测单元，用于通过虚拟场景界面，检测撤退指令，撤退指令用于指示人工智能对象撤退至安全位置；或者，

第三检测单元，用于通过虚拟场景界面，检测集合指令，集合指令用于指示人工智能对象向被控虚拟对象或本方阵营的第二目标虚拟对象的位置移动。

可选地，第一检测单元，用于：

通过虚拟场景界面检测对攻击控件的触发操作，生成攻击指令，第一目标虚拟对象为非本方阵营中与被控虚拟对象距离最近的虚拟对象；或者，

通过虚拟场景界面检测将攻击控件拖动至第一目标虚拟对象的对象标识的操作，生成攻击指令；或者，

通过虚拟场景界面检测对第一目标虚拟对象的对象标识的选中操作，生成攻击指令。

可选地，第二检测单元，用于：

通过虚拟场景界面检测对撤退控件的触发操作，生成撤退指令，撤退指令用于指示人工智能对象撤退至安全位置；或者，

通过虚拟场景界面检测将撤退控件拖动至本方阵营的第三目标虚拟对象的对象标识的操作，生成撤退指令，撤退指令用于指示人工智能对象撤退至第三目标虚拟对象的位置；或者，

通过虚拟场景界面检测对第三目标虚拟对象的对象标识的选中操作，生成撤退指令，撤退指令用于指示人工智能对象撤退至第三目标虚拟对象的位置。

可选地，第三检测单元，用于：

通过虚拟场景界面检测对集合控件的触发操作，生成集合指令，集合指令用于指示人工智能对象向被控虚拟对象的位置移动；或者，

通过虚拟场景界面检测将集合控件拖动至本方阵营的第二目标虚拟对象的对象标识的操作，生成集合指令，集合指令用于指示人工智能对象向第二目标虚拟对象的位置移动；或者，

通过虚拟场景界面检测对第三目标虚拟对象的对象标识的选中操作，生成集合指令，集合指令用于指示人工智能对象向第二目标虚拟对象的位置移动。

可选地，控制指令携带目标虚拟对象的对象标识，目标操作为向目标虚拟对象移动的操作；

控制模块2303，包括：

第一控制单元，用于基于控制指令，控制人工智能对象执行向目标虚拟对象移动的操作。

可选地，控制模块2303，包括：

第二控制单元，用于向服务器发送控制指令，服务器用于基于控制指令，调用神经网络模型确定用于完成目标操作的至少一个子操作，控制人工智能对象执行至少一个子操作。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

图24是本申请实施例提供的一种人工智能对象控制装置的结构示意图。参见图24，该装置包括：

接收模块2401，用于接收终端发送的控制指令，该控制指令用于指示人工智能对象执行目标操作；

控制模块2402，用于基于控制指令，控制人工智能对象执行目标操作；

其中，人工智能对象属于终端的被控虚拟对象的本方阵营。

本申请实施例提供的人工智能对象控制装置，实现了终端与服务器之间的交互，服务器在接收到控制指令的情况下，能够控制与终端属于同一阵营的人工智能对象执行相应的目标操作，实现了对人工智能对象的控制，从而实现了人与人工智能对象之间的协同配合，扩展了人工智能对象的功能。

可选地，控制模块2402，包括：

第一控制单元，用于基于控制指令，调用神经网络模型确定用于完成目标操作的至少一个子操作，控制人工智能对象执行至少一个子操作。

可选地，神经网络模型包括编码网络、融合网络和操作预测网络，第一控制单元，包括：

编码子单元，用于调用编码网络，对多个虚拟对象的状态数据进行编码，得到多个虚拟对象的编码特征；

融合子单元，用于调用融合网络，基于权重特征，对多个虚拟对象的编码特征进行加权融合，得到融合特征，权重特征包括虚拟场景中的多个虚拟对象的权重参数，且权重特征基于控制指令确定；

预测子单元，用于调用操作预测网络，对融合特征进行操作预测，得到操作信息，操作信息至少包括人工智能对象所需执行的子操作。

可选地，控制指令包括被控虚拟对象的第一对象标识和目标虚拟对象的第二对象标识，目标操作为向目标虚拟对象移动的操作；

第一控制单元，还包括：

确定子单元，用于：

将多个虚拟对象的编码特征构成编码矩阵；

基于编码矩阵与编码矩阵的转置矩阵相乘得到的矩阵，确定第一权重特征；

将第一权重特征中的非关联虚拟对象的权重参数设置为负无穷，得到第二权重特征，非关联虚拟对象与被控虚拟对象之间的距离，以及非关联虚拟对象与目标虚拟对象之间的距离均不小于距离阈值；

对第二权重特征进行归一化处理，将归一化处理后的权重特征确定为融合网络中的权重特征。

可选地，控制模块2402，包括：

验证单元，用于调用意图预测模型，对控制指令进行验证；

第二控制单元，用于在控制指令验证通过的情况下，基于控制指令，控制人工智能对象执行目标操作。

需要说明的是：上述实施例提供的人工智能对象控制装置在控制人工智能对象执行目标操作时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的人工智能对象控制装置与人工智能对象控制方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图25示出了本申请一个示例性实施例提供的终端2500的结构示意图。终端2500包括有：处理器2501和存储器2502。

处理器2501可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器2501可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。一些实施例中，处理器2501可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器2502可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器2502还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器2502中的非暂态的计算机可读存储介质用于存储至少一条计算机程序，该至少一条计算机程序用于被处理器2501所具有以实现本申请中方法实施例提供的人工智能对象控制方法。

在一些实施例中，终端2500还可选包括有：外围设备接口2503和至少一个外围设备。处理器2501、存储器2502和外围设备接口2503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口2503相连。可选地，外围设备包括：射频电路2504或显示屏2505中的至少一种。另外还可以包括其他组件。

外围设备接口2503可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器2501和存储器2502。在一些实施例中，处理器2501、存储器2502和外围设备接口2503被集成在同一芯片或电路板上；在一些其他实施例中，处理器2501、存储器2502和外围设备接口2503中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路2504用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路2504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路2504将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路2504包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路2504可以通过至少一种无线通信协议来与其它设备进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路2504还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏2505用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏2505是触摸显示屏时，显示屏2505还具有采集在显示屏2505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器2501进行处理。此时，显示屏2505还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。

本领域技术人员可以理解，图25中示出的结构并不构成对终端2500的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图26是本申请实施例提供的一种服务器的结构示意图，该服务器2600可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central Processing Units，CPU)2601和一个或一个以上的存储器2602，其中，所述存储器2602中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器2601加载并执行以实现上述各个方法实施例提供的方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条计算机程序，该至少一条计算机程序由处理器加载并执行，以实现上述实施例的人工智能对象控制方法所执行的操作。

本申请实施例还提供了一种计算机程序产品或计算机程序，计算机程序产品或计算机程序包括计算机程序代码，计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取计算机程序代码，处理器执行计算机程序代码，使得计算机设备实现如上述实施例的人工智能对象控制方法所执行的操作。在一些实施例中，本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行，或者在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请实施例的可选实施例，并不用以限制本申请实施例，凡在本申请实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种人工智能对象控制方法，所述方法包括：

终端显示虚拟场景界面，所述虚拟场景界面显示有所述终端的被控虚拟对象；

所述终端通过所述虚拟场景界面检测控制指令，所述控制指令用于指示所述被控虚拟对象的本方阵营中的人工智能对象执行目标操作；

所述终端基于所述控制指令，控制所述人工智能对象执行所述目标操作。
根据权利要求1所述的方法，其中，所述终端通过所述虚拟场景界面检测控制指令，包括：

所述终端通过所述虚拟场景界面，检测攻击指令，所述攻击指令用于指示所述人工智能对象攻击非本方阵营的第一目标虚拟对象；或者，

所述终端通过所述虚拟场景界面，检测撤退指令，所述撤退指令用于指示所述人工智能对象撤退至安全位置；或者，

所述终端通过所述虚拟场景界面，检测集合指令，所述集合指令用于指示所述人工智能对象向所述被控虚拟对象或本方阵营的第二目标虚拟对象的位置移动。
根据权利要求2所述的方法，其中，所述终端通过所述虚拟场景界面，检测攻击指令，包括：

所述终端通过所述虚拟场景界面检测对攻击控件的触发操作，生成所述攻击指令，所述第一目标虚拟对象为非本方阵营中与所述被控虚拟对象距离最近的虚拟对象；或者，

所述终端通过所述虚拟场景界面检测将所述攻击控件拖动至所述第一目标虚拟对象的对象标识的操作，生成所述攻击指令；或者，

所述终端通过所述虚拟场景界面检测对所述第一目标虚拟对象的对象标识的选中操作，生成所述攻击指令。
根据权利要求2所述的方法，其中，所述终端通过所述虚拟场景界面，检测撤退指令，包括：

所述终端通过所述虚拟场景界面检测对撤退控件的触发操作，生成所述撤退指令，所述撤退指令用于指示所述人工智能对象撤退至安全位置；或者，

所述终端通过所述虚拟场景界面检测将所述撤退控件拖动至本方阵营的第三目标虚拟对象的对象标识的操作，生成所述撤退指令，所述撤退指令用于指示所述人工智能对象撤退至所述第三目标虚拟对象的位置；或者，

所述终端通过所述虚拟场景界面检测对所述第三目标虚拟对象的对象标识的选中操作，生成所述撤退指令，所述撤退指令用于指示所述人工智能对象撤退至所述第三目标虚拟对象的位置。
根据权利要求2所述的方法，其中，所述终端通过所述虚拟场景界面，检测集合指令，包括：

所述终端通过所述虚拟场景界面检测对集合控件的触发操作，生成所述集合指令，所述集合指令用于指示所述人工智能对象向所述被控虚拟对象的位置移动；或者，

所述终端通过所述虚拟场景界面检测将所述集合控件拖动至本方阵营的第二目标虚拟对象的对象标识的操作，生成所述集合指令，所述集合指令用于指示所述人工智能对象向所述第二目标虚拟对象的位置移动；或者，

所述终端通过所述虚拟场景界面检测对所述第三目标虚拟对象的对象标识的选中操作，生成所述集合指令，所述集合指令用于指示所述人工智能对象向所述第二目标虚拟对象的位置移动。
根据权利要求1-5任一项所述的方法，其中，所述控制指令携带目标虚拟对象的对象标识，所述目标操作为向所述目标虚拟对象移动的操作；

所述终端基于所述控制指令，控制所述人工智能对象执行所述目标操作，包括：

所述终端基于所述控制指令，控制所述人工智能对象执行向所述目标虚拟对象移动的操作。
根据权利要求1-5任一项所述方法，其中，所述终端基于所述控制指令，控制所述人工智能对象执行所述目标操作，包括：

所述终端向服务器发送所述控制指令，所述服务器用于基于所述控制指令，调用神经网络模型确定用于完成所述目标操作的至少一个子操作，控制所述人工智能对象执行所述至少一个子操作。
一种人工智能对象控制方法，所述方法包括：

服务器接收终端发送的控制指令，所述控制指令用于指示人工智能对象执行目标操作；

所述服务器基于所述控制指令，控制所述人工智能对象执行所述目标操作；

其中，所述人工智能对象属于所述终端的被控虚拟对象的本方阵营。
根据权利要求8所述的方法，其中，所述服务器基于所述控制指令，控制所述人工智能对象执行所述目标操作，包括：

所述服务器基于所述控制指令，调用神经网络模型确定用于完成所述目标操作的至少一个子操作，控制所述人工智能对象执行所述至少一个子操作。
根据权利要求9所述的方法，其中，所述神经网络模型包括编码网络、融合网络和操作预测网络，所述服务器基于所述控制指令，调用神经网络模型确定用于完成所述目标操作的至少一个子操作，包括：

所述服务器调用所述编码网络，对所述多个虚拟对象的状态数据进行编码，得到所述多个虚拟对象的编码特征；

所述服务器调用所述融合网络，基于权重特征，对所述多个虚拟对象的编码特征进行加权融合，得到融合特征，所述权重特征包括虚拟场景中的多个虚拟对象的权重参数，且所述权重特征基于所述控制指令确定；

所述服务器调用所述操作预测网络，对所述融合特征进行操作预测，得到操作信息，所述操作信息至少包括所述人工智能对象所需执行的子操作。
一种人工智能对象控制装置，所述装置包括：

显示模块，用于显示虚拟场景界面，所述虚拟场景界面显示有本端的被控虚拟对象；

检测模块，用于通过所述虚拟场景界面检测控制指令，所述控制指令用于指示所述被控虚拟对象的本方阵营中的人工智能对象执行目标操作；

控制模块，用于基于所述控制指令，控制所述人工智能对象执行所述目标操作。
一种人工智能对象控制装置，所述装置包括：

接收模块，用于接收终端发送的控制指令，所述控制指令用于指示人工智能对象执行目标操作；

控制模块，用于基于所述控制指令，控制所述人工智能对象执行所述目标操作；

其中，所述人工智能对象属于所述终端的被控虚拟对象的本方阵营。
一种终端，所述终端包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行，以实现如权利要求1至7任一项所述的人工智能对象控制方法所执行的操作。
一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行，以实现如权利要求8至10任一项所述的人工智能对象控制方法所执行的操作。
一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行，以实现如权利要求1至7任一项所述的人工智能对象控制方法所执行的操作，或者以实现如权利要求8至10任一项所述的人工智能对象控制方法所执行的操作。
一种计算机程序产品，所述计算机程序产品包括计算机程序代码，所述计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从所述计算机可读存储介质读取所述计算机程序代码，所述处理器执行所述计算机程序代码，使得所述计算机设备实现如权利要求1至7任一项所述的人工智能对象控制方法所执行的操作，或者以实现如权利要求8至10任一项所述的人工智能对象控制方法所执行的操作。