CN109843401A - 一种ai对象行为模型优化方法以及装置 - Google Patents

一种ai对象行为模型优化方法以及装置 Download PDF

Info

Publication number
CN109843401A
CN109843401A CN201780048483.4A CN201780048483A CN109843401A CN 109843401 A CN109843401 A CN 109843401A CN 201780048483 A CN201780048483 A CN 201780048483A CN 109843401 A CN109843401 A CN 109843401A
Authority
CN
China
Prior art keywords
game
real
environment
value
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780048483.4A
Other languages
English (en)
Other versions
CN109843401B (zh
Inventor
姜润知
李源纯
黄柳优
李德元
王鹏
魏学峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of CN109843401A publication Critical patent/CN109843401A/zh
Application granted granted Critical
Publication of CN109843401B publication Critical patent/CN109843401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

一种AI对象的行为模型建立方法以及装置,能够根据环境的实时改变做出相应的决策,提高游戏的灵活性。提供如下技术方案:获取AI对象所处的第一环境的第一实时状态信息(S201);提取第一实时状态信息的特征信息(S202);根据特征信息和学习网络的权重值得到AI对象的动作策略(S203);将动作策略反馈给AI对象,以使得AI对象执行动作策略(S204);获取AI对象所处的第二环境的第二实时状态信息,第二环境为AI对象执行动作策略之后生成(S205);根据第二实时状态信息得到动作策略的回报值(S206);若回报值符合预设条件,则确定学习网络的权重值为学习网络的目标权重值(S208);根据目标权重值建立AI对象的行为模型(S209)。

Description

PCT国内申请,说明书已公开。

Claims (21)

  1. PCT国内申请,权利要求书已公开。
CN201780048483.4A 2017-10-17 2017-10-17 一种ai对象行为模型优化方法以及装置 Active CN109843401B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/106507 WO2019075632A1 (zh) 2017-10-17 2017-10-17 一种ai对象行为模型优化方法以及装置

Publications (2)

Publication Number Publication Date
CN109843401A true CN109843401A (zh) 2019-06-04
CN109843401B CN109843401B (zh) 2020-11-24

Family

ID=66173024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780048483.4A Active CN109843401B (zh) 2017-10-17 2017-10-17 一种ai对象行为模型优化方法以及装置

Country Status (2)

Country Link
CN (1) CN109843401B (zh)
WO (1) WO2019075632A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110996158A (zh) * 2019-12-26 2020-04-10 广州市百果园信息技术有限公司 一种虚拟物品的显示方法、装置、计算机设备和存储介质
CN111359212A (zh) * 2020-02-20 2020-07-03 网易(杭州)网络有限公司 游戏对象控制、模型训练方法及装置
CN111494959A (zh) * 2020-04-22 2020-08-07 腾讯科技(深圳)有限公司 游戏操控方法、装置、电子设备及计算机可读存储介质
CN111729300A (zh) * 2020-06-24 2020-10-02 贵州大学 基于蒙特卡洛树搜索和卷积神经网络斗地主策略研究方法
CN112044063A (zh) * 2020-09-02 2020-12-08 腾讯科技(深圳)有限公司 游戏对象动态变化方法、装置、设备及存储介质
CN112437690A (zh) * 2020-04-02 2021-03-02 支付宝(杭州)信息技术有限公司 确定执行设备的动作选择方针
CN112619125A (zh) * 2020-12-30 2021-04-09 深圳市创梦天地科技有限公司 游戏人工智能模块的使用方法和电子设备
CN112783781A (zh) * 2021-01-28 2021-05-11 网易(杭州)网络有限公司 游戏测试方法、装置、电子设备及存储介质
CN113209622A (zh) * 2021-05-28 2021-08-06 北京字节跳动网络技术有限公司 动作的确定方法、装置、可读介质和电子设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110327624B (zh) * 2019-07-03 2023-03-17 广州多益网络股份有限公司 一种基于课程强化学习的游戏跟随方法和系统
CN111901146B (zh) * 2020-06-28 2023-07-18 北京可信华泰信息技术有限公司 一种对象访问的控制方法和装置
CN112382151B (zh) * 2020-11-16 2022-11-18 深圳市商汤科技有限公司 一种线上学习方法及装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106422332A (zh) * 2016-09-08 2017-02-22 腾讯科技(深圳)有限公司 应用于游戏的人工智能操作方法和装置
US20170105163A1 (en) * 2015-10-13 2017-04-13 The Board Of Trustees Of The University Of Alabama Artificial intelligence-augmented, ripple-diamond-chain shaped rateless routing in wireless mesh networks with multi-beam directional antennas
CN106970615A (zh) * 2017-03-21 2017-07-21 西北工业大学 一种深度强化学习的实时在线路径规划方法
CN107066553A (zh) * 2017-03-24 2017-08-18 北京工业大学 一种基于卷积神经网络与随机森林的短文本分类方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599198B (zh) * 2016-12-14 2021-04-06 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种多级联结循环神经网络的图像描述方法
CN106777125B (zh) * 2016-12-16 2020-10-23 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于神经网络及图像关注点的图像描述生成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170105163A1 (en) * 2015-10-13 2017-04-13 The Board Of Trustees Of The University Of Alabama Artificial intelligence-augmented, ripple-diamond-chain shaped rateless routing in wireless mesh networks with multi-beam directional antennas
CN106422332A (zh) * 2016-09-08 2017-02-22 腾讯科技(深圳)有限公司 应用于游戏的人工智能操作方法和装置
CN106970615A (zh) * 2017-03-21 2017-07-21 西北工业大学 一种深度强化学习的实时在线路径规划方法
CN107066553A (zh) * 2017-03-24 2017-08-18 北京工业大学 一种基于卷积神经网络与随机森林的短文本分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BAOBLACKCOAL: "《知乎网》", 18 March 2017 *
赵冬斌、邵坤、朱圆恒、李栋、陈亚冉、王海涛、刘德荣、周彤、王成红: ""深度强化学习综述:兼论计算机围棋的发展"", 《控制理论与应用》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110996158A (zh) * 2019-12-26 2020-04-10 广州市百果园信息技术有限公司 一种虚拟物品的显示方法、装置、计算机设备和存储介质
CN110996158B (zh) * 2019-12-26 2021-10-29 广州市百果园信息技术有限公司 一种虚拟物品的显示方法、装置、计算机设备和存储介质
CN111359212A (zh) * 2020-02-20 2020-07-03 网易(杭州)网络有限公司 游戏对象控制、模型训练方法及装置
CN112437690A (zh) * 2020-04-02 2021-03-02 支付宝(杭州)信息技术有限公司 确定执行设备的动作选择方针
CN111494959A (zh) * 2020-04-22 2020-08-07 腾讯科技(深圳)有限公司 游戏操控方法、装置、电子设备及计算机可读存储介质
CN111494959B (zh) * 2020-04-22 2021-11-09 腾讯科技(深圳)有限公司 游戏操控方法、装置、电子设备及计算机可读存储介质
CN111729300A (zh) * 2020-06-24 2020-10-02 贵州大学 基于蒙特卡洛树搜索和卷积神经网络斗地主策略研究方法
CN112044063A (zh) * 2020-09-02 2020-12-08 腾讯科技(深圳)有限公司 游戏对象动态变化方法、装置、设备及存储介质
CN112619125A (zh) * 2020-12-30 2021-04-09 深圳市创梦天地科技有限公司 游戏人工智能模块的使用方法和电子设备
CN112619125B (zh) * 2020-12-30 2023-10-13 深圳市创梦天地科技有限公司 游戏人工智能模块的使用方法和电子设备
CN112783781A (zh) * 2021-01-28 2021-05-11 网易(杭州)网络有限公司 游戏测试方法、装置、电子设备及存储介质
CN113209622A (zh) * 2021-05-28 2021-08-06 北京字节跳动网络技术有限公司 动作的确定方法、装置、可读介质和电子设备

Also Published As

Publication number Publication date
WO2019075632A1 (zh) 2019-04-25
CN109843401B (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
CN109843401B (zh) 一种ai对象行为模型优化方法以及装置
US11875268B2 (en) Object recognition with reduced neural network weight precision
US20230089380A1 (en) Neural network construction method and apparatus
KR102523888B1 (ko) 가상 환경에서 가상 객체를 스케줄링하기 위한 방법, 장치 및 디바이스
JP2020091922A (ja) 畳み込みニューラルネットワークにおける構造学習
CN111176820B (zh) 一种基于深度神经网络的边缘计算任务的分配方法及装置
WO2022068623A1 (zh) 一种模型训练方法及相关设备
US11586903B2 (en) Method and system of controlling computing operations based on early-stop in deep neural network
CN107292352B (zh) 基于卷积神经网络的图像分类方法和装置
JP2019510325A (ja) マルチモーダルデジタル画像を生成する方法及びシステム
JP2018535491A (ja) 画像のセマンティックセグメンテーションのためのシステム及びコンピューター実施方法、並びに非一時的コンピューター可読媒体
CN111105034B (zh) 基于反事实回报的多智能体深度强化学习方法、系统
CN108090561A (zh) 存储介质、电子装置、游戏操作的执行方法和装置
JP7013489B2 (ja) 学習装置、実写画像分類装置の生成システム、実写画像分類装置の生成装置、学習方法及びプログラム
WO2020260862A1 (en) Facial behaviour analysis
WO2022012668A1 (zh) 一种训练集处理方法和装置
CN111931901A (zh) 一种神经网络构建方法以及装置
CN111126254A (zh) 图像识别方法、装置、设备及存储介质
CN115018039A (zh) 一种神经网络蒸馏方法、目标检测方法以及装置
WO2022156475A1 (zh) 神经网络模型的训练方法、数据处理方法及装置
WO2022127603A1 (zh) 一种模型处理方法及相关装置
US20220335293A1 (en) Method of optimizing neural network model that is pre-trained, method of providing a graphical user interface related to optimizing neural network model, and neural network model processing system performing the same
JP2021527859A (ja) 深層領域拡張を使用した画像内の不規則形状のセグメント化
CN113674383A (zh) 生成文本图像的方法及装置
CN114004751A (zh) 一种图像处理方法及其相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant