CN109843401A - 一种ai对象行为模型优化方法以及装置 - Google Patents
一种ai对象行为模型优化方法以及装置 Download PDFInfo
- Publication number
- CN109843401A CN109843401A CN201780048483.4A CN201780048483A CN109843401A CN 109843401 A CN109843401 A CN 109843401A CN 201780048483 A CN201780048483 A CN 201780048483A CN 109843401 A CN109843401 A CN 109843401A
- Authority
- CN
- China
- Prior art keywords
- game
- real
- environment
- value
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
一种AI对象的行为模型建立方法以及装置,能够根据环境的实时改变做出相应的决策,提高游戏的灵活性。提供如下技术方案:获取AI对象所处的第一环境的第一实时状态信息(S201);提取第一实时状态信息的特征信息(S202);根据特征信息和学习网络的权重值得到AI对象的动作策略(S203);将动作策略反馈给AI对象,以使得AI对象执行动作策略(S204);获取AI对象所处的第二环境的第二实时状态信息,第二环境为AI对象执行动作策略之后生成(S205);根据第二实时状态信息得到动作策略的回报值(S206);若回报值符合预设条件,则确定学习网络的权重值为学习网络的目标权重值(S208);根据目标权重值建立AI对象的行为模型(S209)。
Description
PCT国内申请,说明书已公开。
Claims (21)
- PCT国内申请,权利要求书已公开。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2017/106507 WO2019075632A1 (zh) | 2017-10-17 | 2017-10-17 | 一种ai对象行为模型优化方法以及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109843401A true CN109843401A (zh) | 2019-06-04 |
CN109843401B CN109843401B (zh) | 2020-11-24 |
Family
ID=66173024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780048483.4A Active CN109843401B (zh) | 2017-10-17 | 2017-10-17 | 一种ai对象行为模型优化方法以及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109843401B (zh) |
WO (1) | WO2019075632A1 (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110996158A (zh) * | 2019-12-26 | 2020-04-10 | 广州市百果园信息技术有限公司 | 一种虚拟物品的显示方法、装置、计算机设备和存储介质 |
CN111359212A (zh) * | 2020-02-20 | 2020-07-03 | 网易(杭州)网络有限公司 | 游戏对象控制、模型训练方法及装置 |
CN111494959A (zh) * | 2020-04-22 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 游戏操控方法、装置、电子设备及计算机可读存储介质 |
CN111729300A (zh) * | 2020-06-24 | 2020-10-02 | 贵州大学 | 基于蒙特卡洛树搜索和卷积神经网络斗地主策略研究方法 |
CN112044063A (zh) * | 2020-09-02 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 游戏对象动态变化方法、装置、设备及存储介质 |
CN112437690A (zh) * | 2020-04-02 | 2021-03-02 | 支付宝(杭州)信息技术有限公司 | 确定执行设备的动作选择方针 |
CN112619125A (zh) * | 2020-12-30 | 2021-04-09 | 深圳市创梦天地科技有限公司 | 游戏人工智能模块的使用方法和电子设备 |
CN112783781A (zh) * | 2021-01-28 | 2021-05-11 | 网易(杭州)网络有限公司 | 游戏测试方法、装置、电子设备及存储介质 |
CN113209622A (zh) * | 2021-05-28 | 2021-08-06 | 北京字节跳动网络技术有限公司 | 动作的确定方法、装置、可读介质和电子设备 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110327624B (zh) * | 2019-07-03 | 2023-03-17 | 广州多益网络股份有限公司 | 一种基于课程强化学习的游戏跟随方法和系统 |
CN111901146B (zh) * | 2020-06-28 | 2023-07-18 | 北京可信华泰信息技术有限公司 | 一种对象访问的控制方法和装置 |
CN112382151B (zh) * | 2020-11-16 | 2022-11-18 | 深圳市商汤科技有限公司 | 一种线上学习方法及装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106422332A (zh) * | 2016-09-08 | 2017-02-22 | 腾讯科技(深圳)有限公司 | 应用于游戏的人工智能操作方法和装置 |
US20170105163A1 (en) * | 2015-10-13 | 2017-04-13 | The Board Of Trustees Of The University Of Alabama | Artificial intelligence-augmented, ripple-diamond-chain shaped rateless routing in wireless mesh networks with multi-beam directional antennas |
CN106970615A (zh) * | 2017-03-21 | 2017-07-21 | 西北工业大学 | 一种深度强化学习的实时在线路径规划方法 |
CN107066553A (zh) * | 2017-03-24 | 2017-08-18 | 北京工业大学 | 一种基于卷积神经网络与随机森林的短文本分类方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599198B (zh) * | 2016-12-14 | 2021-04-06 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种多级联结循环神经网络的图像描述方法 |
CN106777125B (zh) * | 2016-12-16 | 2020-10-23 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于神经网络及图像关注点的图像描述生成方法 |
-
2017
- 2017-10-17 WO PCT/CN2017/106507 patent/WO2019075632A1/zh active Application Filing
- 2017-10-17 CN CN201780048483.4A patent/CN109843401B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170105163A1 (en) * | 2015-10-13 | 2017-04-13 | The Board Of Trustees Of The University Of Alabama | Artificial intelligence-augmented, ripple-diamond-chain shaped rateless routing in wireless mesh networks with multi-beam directional antennas |
CN106422332A (zh) * | 2016-09-08 | 2017-02-22 | 腾讯科技(深圳)有限公司 | 应用于游戏的人工智能操作方法和装置 |
CN106970615A (zh) * | 2017-03-21 | 2017-07-21 | 西北工业大学 | 一种深度强化学习的实时在线路径规划方法 |
CN107066553A (zh) * | 2017-03-24 | 2017-08-18 | 北京工业大学 | 一种基于卷积神经网络与随机森林的短文本分类方法 |
Non-Patent Citations (2)
Title |
---|
BAOBLACKCOAL: "《知乎网》", 18 March 2017 * |
赵冬斌、邵坤、朱圆恒、李栋、陈亚冉、王海涛、刘德荣、周彤、王成红: ""深度强化学习综述:兼论计算机围棋的发展"", 《控制理论与应用》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110996158A (zh) * | 2019-12-26 | 2020-04-10 | 广州市百果园信息技术有限公司 | 一种虚拟物品的显示方法、装置、计算机设备和存储介质 |
CN110996158B (zh) * | 2019-12-26 | 2021-10-29 | 广州市百果园信息技术有限公司 | 一种虚拟物品的显示方法、装置、计算机设备和存储介质 |
CN111359212A (zh) * | 2020-02-20 | 2020-07-03 | 网易(杭州)网络有限公司 | 游戏对象控制、模型训练方法及装置 |
CN112437690A (zh) * | 2020-04-02 | 2021-03-02 | 支付宝(杭州)信息技术有限公司 | 确定执行设备的动作选择方针 |
CN111494959A (zh) * | 2020-04-22 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 游戏操控方法、装置、电子设备及计算机可读存储介质 |
CN111494959B (zh) * | 2020-04-22 | 2021-11-09 | 腾讯科技(深圳)有限公司 | 游戏操控方法、装置、电子设备及计算机可读存储介质 |
CN111729300A (zh) * | 2020-06-24 | 2020-10-02 | 贵州大学 | 基于蒙特卡洛树搜索和卷积神经网络斗地主策略研究方法 |
CN112044063A (zh) * | 2020-09-02 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 游戏对象动态变化方法、装置、设备及存储介质 |
CN112619125A (zh) * | 2020-12-30 | 2021-04-09 | 深圳市创梦天地科技有限公司 | 游戏人工智能模块的使用方法和电子设备 |
CN112619125B (zh) * | 2020-12-30 | 2023-10-13 | 深圳市创梦天地科技有限公司 | 游戏人工智能模块的使用方法和电子设备 |
CN112783781A (zh) * | 2021-01-28 | 2021-05-11 | 网易(杭州)网络有限公司 | 游戏测试方法、装置、电子设备及存储介质 |
CN113209622A (zh) * | 2021-05-28 | 2021-08-06 | 北京字节跳动网络技术有限公司 | 动作的确定方法、装置、可读介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2019075632A1 (zh) | 2019-04-25 |
CN109843401B (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109843401B (zh) | 一种ai对象行为模型优化方法以及装置 | |
US11875268B2 (en) | Object recognition with reduced neural network weight precision | |
US20230089380A1 (en) | Neural network construction method and apparatus | |
KR102523888B1 (ko) | 가상 환경에서 가상 객체를 스케줄링하기 위한 방법, 장치 및 디바이스 | |
JP2020091922A (ja) | 畳み込みニューラルネットワークにおける構造学習 | |
CN111176820B (zh) | 一种基于深度神经网络的边缘计算任务的分配方法及装置 | |
WO2022068623A1 (zh) | 一种模型训练方法及相关设备 | |
US11586903B2 (en) | Method and system of controlling computing operations based on early-stop in deep neural network | |
CN107292352B (zh) | 基于卷积神经网络的图像分类方法和装置 | |
JP2019510325A (ja) | マルチモーダルデジタル画像を生成する方法及びシステム | |
JP2018535491A (ja) | 画像のセマンティックセグメンテーションのためのシステム及びコンピューター実施方法、並びに非一時的コンピューター可読媒体 | |
CN111105034B (zh) | 基于反事实回报的多智能体深度强化学习方法、系统 | |
CN108090561A (zh) | 存储介质、电子装置、游戏操作的执行方法和装置 | |
JP7013489B2 (ja) | 学習装置、実写画像分類装置の生成システム、実写画像分類装置の生成装置、学習方法及びプログラム | |
WO2020260862A1 (en) | Facial behaviour analysis | |
WO2022012668A1 (zh) | 一种训练集处理方法和装置 | |
CN111931901A (zh) | 一种神经网络构建方法以及装置 | |
CN111126254A (zh) | 图像识别方法、装置、设备及存储介质 | |
CN115018039A (zh) | 一种神经网络蒸馏方法、目标检测方法以及装置 | |
WO2022156475A1 (zh) | 神经网络模型的训练方法、数据处理方法及装置 | |
WO2022127603A1 (zh) | 一种模型处理方法及相关装置 | |
US20220335293A1 (en) | Method of optimizing neural network model that is pre-trained, method of providing a graphical user interface related to optimizing neural network model, and neural network model processing system performing the same | |
JP2021527859A (ja) | 深層領域拡張を使用した画像内の不規則形状のセグメント化 | |
CN113674383A (zh) | 生成文本图像的方法及装置 | |
CN114004751A (zh) | 一种图像处理方法及其相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |