CN109843401A

CN109843401A - 一种ai对象行为模型优化方法以及装置

Info

Publication number: CN109843401A
Application number: CN201780048483.4A
Authority: CN
Inventors: 姜润知; 李源纯; 黄柳优; 李德元; 王鹏; 魏学峰
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-10-17
Filing date: 2017-10-17
Publication date: 2019-06-04
Anticipated expiration: 2037-10-17
Also published as: WO2019075632A1; CN109843401B

Abstract

一种AI对象的行为模型建立方法以及装置，能够根据环境的实时改变做出相应的决策，提高游戏的灵活性。提供如下技术方案:获取AI对象所处的第一环境的第一实时状态信息(S201)；提取第一实时状态信息的特征信息(S202)；根据特征信息和学习网络的权重值得到AI对象的动作策略(S203)；将动作策略反馈给AI对象，以使得AI对象执行动作策略(S204)；获取AI对象所处的第二环境的第二实时状态信息，第二环境为AI对象执行动作策略之后生成(S205)；根据第二实时状态信息得到动作策略的回报值(S206)；若回报值符合预设条件，则确定学习网络的权重值为学习网络的目标权重值(S208)；根据目标权重值建立AI对象的行为模型(S209)。

Description

PCT国内申请，说明书已公开。

Claims

PCT国内申请，权利要求书已公开。