CN111841017A - 一种游戏ai的编程实现方法及装置 - Google Patents
一种游戏ai的编程实现方法及装置 Download PDFInfo
- Publication number
- CN111841017A CN111841017A CN202010478696.4A CN202010478696A CN111841017A CN 111841017 A CN111841017 A CN 111841017A CN 202010478696 A CN202010478696 A CN 202010478696A CN 111841017 A CN111841017 A CN 111841017A
- Authority
- CN
- China
- Prior art keywords
- game
- data
- decision
- programming
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 24
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 description 65
- 239000010410 layer Substances 0.000 description 40
- 230000006870 function Effects 0.000 description 6
- 230000006399 behavior Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009967 tasteless effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/60—Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种游戏AI的编程实现方法及装置,方法包括:获取大量用户的游戏数据,根据游戏数据生成训练样本,所述游戏数据包括游戏操作记录数据和游戏场景数据;根据训练样本对神经网络进行训练,生成AI决策模型;检测到游戏AI调用指令,获取AI角色的特征数据及游戏场景;获取AI决策模型根据AI角色的特征数据及游戏场景作出的决策,并执行所述决策。本发明实施例可通过原始的用户游戏数据训练生成AI决策模型,从而使游戏AI可根据当前游戏场景作出适应当前游戏场景的决策,提高游戏AI的智能程度,而且在编程过程使用图形化编程,减少了编程难度,提升用户体验。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种游戏AI的编程实现方法及装置。
背景技术
现有的编程方法主要为在编程软件界面上输入符合一定逻辑规则的程序代码,然后通过调试和保存得到目标编程文件。这种方式过于传统,对于中小学生、教师或编程初学者等而言,不但枯燥无味,而且由于可读性差,在调试过程中查错极不方便,导致编程效率和学习效率极为低下,严重影响教师、学生以及编程初学者等参与编程教育的积极性。
为了提高学生的编程的积极性,市场上也出现了图形化编程系统。在编程系统中可通过将编程语句嵌入积木中,通过积木的堆叠实现编程。
但现有技术中的图形化编程系统一般是通过用户编写游戏程序,对角色进行控制,无法实现对游戏角色决策能力进行调整,无法实现游戏AI(Artificial Intelligence,人工智能),用户体验差。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种游戏AI的编程实现方法及装置,旨在解决现有技术中图形化编程系统一般是通过用户编写游戏程序,对角色进行控制,无法实现对游戏角色的决策能力进行调整的问题。
本发明的技术方案如下:
一种游戏AI的编程实现方法,应用于图形化编程,所述方法包括:
获取大量用户的游戏数据,根据游戏数据生成训练样本,所述游戏数据包括游戏操作记录数据和游戏场景数据;
根据训练样本对神经网络进行训练,生成AI决策模型;
检测到游戏AI调用指令,获取AI角色的特征数据及游戏场景;
获取AI决策模型根据AI角色的特征数据及游戏场景作出的决策,并执行所述决策。
可选地,所述获取大量用户的游戏数据,根据游戏数据生成训练样本,包括:
记录大量用户在操作游戏中的生成的游戏数据;
对所述游戏数据进行过滤,获取满足预设条件的游戏数据;
根据游戏数据生成训练样本。
可选地,所述获取大量用户的游戏数据,根据游戏数据生成训练样本前,包括:
预先对神经网络的网络结构进行设置。
可选地,所述神经网络包括输入层、隐藏层和输出层;
则预先对神经网络的网络结构进行设置,包括:
预先设置所述输入层用于采集游戏中实时变化的数据;
预先设置所述隐藏层用于将输入层采集的数据进行运算和处理;
预先设置所述输出层用于输出分类结果。
可选地,所述预先设置所述输出层用于输出分类结果后,还包括:
预先设置AI角色的死亡条件。
可选地,所述预先设置AI角色的死亡条件后,还包括:
对输入层和输出层的数量进行设置。
可选地,所述根据训练样本对神经网络进行训练,生成AI决策模型,包括:
根据训练样本对神经网络进行训练,当检测到AI角色死亡时,生成初始AI决策模型;
根据后向传播算法对所述初始AI决策模型进行优化后,生成AI决策模型。
本发明的另一实施例提供了一种游戏AI的编程实现装置,所述装置包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的游戏AI的编程实现方法。
本发明的另一实施例还提供了一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的游戏AI的编程实现方法。
本发明的另一种实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行上述的游戏AI的编程实现方法。
有益效果:本发明公开了一种游戏AI的编程实现方法及装置,相比于现有技术,本发明实施例可通过原始的用户游戏数据训练生成AI决策模型,从而使游戏AI可根据当前游戏场景作出适应当前游戏场景的决策,提高游戏AI的智能程度,而且在编程过程使用图形化编程,减少了编程难度,提升用户体验。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明一种游戏AI的编程实现方法较佳实施例的流程图;
图2为本发明一种游戏AI的编程实现方法较佳实施例的神经网络的结构示意图;
图3为本发明一种游戏AI的编程实现方法较佳实施例的顶部中心设置示意图;
图4为本发明一种游戏AI的编程实现装置的较佳实施例的硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。以下结合附图对本发明实施例进行介绍。
本发明实施例提供了一种游戏AI的编程实现方法。请参阅图1,图1为本发明一种游戏AI的编程实现方法较佳实施例的流程图。如图1所示,其包括步骤:
步骤S100、获取大量用户的游戏数据,根据游戏数据生成训练样本,所述游戏数据包括游戏操作记录数据和游戏场景数据;
步骤S200、根据训练样本对神经网络进行训练,生成AI决策模型;
步骤S300、检测到游戏AI调用指令,获取AI角色的特征数据及游戏场景;
步骤S400、获取AI决策模型根据AI角色的特征数据及游戏场景作出的决策,并执行所述决策。
具体实施时,本发明实施例的游戏AI的编程实现方法应用于图形化编程,可通过程序将AI决策模型写入函数后,生成函数对应的图形,图形可以是积木的形式,将积木放入对应角色的位置,则可直接调用游戏AI。
本发明实施例的采用有监督学习模式对神经网络进行训练,从而得到游戏AI的决策模型。神经网络的结构如图2所示,一般是输入层、隐藏层和输出层组成。输入层用于输入训练样本,隐藏层用于对输入层的训练样本进行运算和处理,输出层用于输出训练结果。例如,输入层负责收集信息,就是游戏中实时变化的数据;比如自己角色的坐标、自己的血量、敌人的坐标、敌人的数量等等;隐藏层用于将收集的信息导入后进行运算和处理;输出层:输出分类结果,就相当于我们玩游戏时做出的决策。比如控制角色移动,控制角色跳跃,控制角色发射子弹等等。
用户预先在玩游戏,生成大量的游戏数据,游戏数据包括游戏场景数据以及用户的操作,以及操作后对应的游戏数据,如角色死亡等。对游戏数据处理后生成训练样本,根据训练样本对神经网络进行训练,生成AI决策模型;
将生成的AI决策模型对应的图形化积木添加至角色积木的位置,角色积木获取当前的游戏场景,根据当前的游戏场景输出决策,并控制角色执行对应的决策。决策是指在游戏中角色的执行的操作,例如行进、跳跃等操作。
进一步的实施例中,获取大量用户的游戏数据,根据游戏数据生成训练样本,包括:
记录大量用户在操作游戏中的生成的游戏数据;
对所述游戏数据进行过滤,获取满足预设条件的游戏数据;
根据游戏数据生成训练样本。
具体地,以下实施例以游戏《Flappy bird》为例进行介绍,记录大量用户在操作游戏中的生成的游戏数据;例如,将小鸟飞和不飞的数据都进行记录,特别要注意的是记录不飞行数据的时候,因为源码编辑器一秒是60帧,不飞的情况比较多帧,数据太多。进一步地,可设置一个限制条件,只选取二十分之一的概率去记录,即有20次不飞的数据帧的时候,我们才记录一帧不飞的数据,并随机选取20次不飞的数据帧进行记录。
在游戏数据生成完毕后,如果训练的数据是你不想要的,可清空上一次的训练数据,从而选取满足用户设置的条件的游戏数据生成训练样本。
在进一步地实施例中,获取大量用户的游戏数据,根据游戏数据生成训练样本前,包括:
预先对神经网络的网络结构进行设置。
具体实施时,以游戏《Flappy bird》为例,选择小鸟为AI角色,初始化一个模型:模型1。其中模型1中的输入层和输出层的数据我们先空着,隐含层可以自己调整,对于Flappybird这个游戏,我们推荐设为隐含层单层4个神经元。
进一步地,神经网络包括输入层、隐藏层和输出层;
则预先对神经网络的网络结构进行设置,包括:
预先设置所述输入层用于采集游戏中实时变化的数据;
预先设置所述隐藏层用于将输入层采集的数据进行运算和处理;
预先设置所述输出层用于输出分类结果。
具体实施时,接上述实施例,确定输入层的信息:我们选择的两个特征是:“小鸟”和“柱子下”角色的Y坐标值,如图3所示,“小鸟”角色的将中心点设置在小鸟中间,“柱子下”角色的中心点为“柱子下”的顶部中心。
确定输出层的信息如下:用户玩这个游戏时,会有两种操作:什么都不做和点击鼠标。对应到GameAI,就是两个输出结果:1、不操作,2、使小鸟飞行。由于机制上的设定,要想调用到AI角色的使用行为,我们必须先用函数积木,将鼠标点击触发的飞行事件封装起来。然后设置AI角色的使用行为积木调用。
进一步地,预先设置所述输出层用于输出分类结果后,还包括:
预先设置AI角色的死亡条件。
具体实施时,可根据游戏的不同对AI角色的死亡条件进行设置。在《Flappy bird》中设置“小鸟”角色的死亡条件,例如“小鸟”角色的X坐标与柱子的X坐标相同时,“小鸟”角色的Y坐标小于“下柱子”的Y坐标,或“小鸟”角色的Y坐标大于“上柱子”的Y坐标,或是未检测到柱子时,“小鸟”角色的Y坐标大于“屏幕”的最大Y坐标,或“小鸟”角色的Y坐标小于“屏幕”的最小Y坐标。
进一步地,预先设置AI角色的死亡条件后,还包括:
对输入层和输出层的数量进行设置。
具体实施时,确认了输入输出信息后,还要记得在初始化模型的位置填入输入层和输出层的数量,完成整个模型的设定。
输入层输入的特征是“小鸟的Y坐标”和“柱子下”的Y坐标,所以是2个;输出层输出的是“不操作”和“飞行”,所以也是2个。
进一步地,根据训练样本对神经网络进行训练,生成AI决策模型,包括:
根据训练样本对神经网络进行训练,当检测到AI角色死亡时,生成初始AI决策模型;
根据后向传播算法对所述初始AI决策模型进行优化后,生成AI决策模型。
具体实施时,当AI角色死亡时,我们可以使用“后向传播算法”继续优化所选用的模型。根据记录的训练数据优化后,模型将会模仿训练数据中的行为继续执行决策。训练完毕后,如果想保留之前的训练结果,将AI决策模型对应的积木替换初始化模型积木后再运行。其中后向传播算法是适合于多层神经元网络的一种学习算法,它建立在梯度下降法的基础上。输入输出关系实质上是一种映射关系:一个n输入m输出的后向传播神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射,这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合,因此具有很强的函数复现能力。
当模型训练好后,我们就可以使用该模型,让AI角色自己做决策,自动进行游戏。例如,将“AI角色做出决策”积木放在AI角色特征积木下方。AI能够基于当前的特征值做出使用行为的决策,即“不操作”或“飞行”,实现AI角色的自动游戏。图形化编程的实现方法也降低了编程难度,提升用户体验。
需要说明的是,在上述各个实施例中,上述各步骤之间并不必然存在一定的先后顺序,本领域普通技术人员,根据本发明实施例的描述可以理解,不同实施例中,上述各步骤可以有不同的执行顺序,亦即,可以并行执行,变可以交换执行等等。
本发明另一实施例提供一种游戏AI的编程实现装置,如图4所示,装置10包括:
一个或多个处理器110以及存储器120,图4中以一个处理器110为例进行介绍,处理器110和存储器120可以通过总线或者其他方式连接,图4中以通过总线连接为例。
处理器110用于完成,装置10的各种控制逻辑,其可以为通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、单片机、ARM(Acorn RISCMachine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。还有,处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP核、或任何其它这种配置。
存储器120作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的游戏AI的编程实现方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元,从而执行装置10的各种功能应用以及数据处理,即实现上述方法实施例中的游戏AI的编程实现方法。
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储根据装置10使用所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至装置10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个单元存储在存储器120中,当被一个或者多个处理器110执行时,执行上述任意方法实施例中的游戏AI的编程实现方法,例如,执行以上描述的图1中的方法步骤S100至步骤S400。
本发明实施例提供了一种非易失性计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1中的方法步骤S100至步骤S400。
作为示例,非易失性存储介质能够包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦ROM(EEPROM)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(RAM)。通过说明丽非限制,RAM可以以诸如同步RAM(SRAM)、动态RAM、(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、Synchlink DRAM(SLDRAM)以及直接Rambus(兰巴斯)RAM(DRRAM)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器组件或存储器旨在包括这些和/或任何其他适合类型的存储器中的一个或多个。
本发明的另一种实施例提供了一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被处理器执行时,使所述处理器执行上述方法实施例的游戏AI的编程实现方法。例如,执行以上描述的图1中的方法步骤S100至步骤S400。
以上所描述的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存在于计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行各个实施例或者实施例的某些部分的方法。
除了其他之外,诸如"能够'、"能"、"可能"或"可以"之类的条件语言除非另外具体地陈述或者在如所使用的上下文内以其他方式理解,否则一般地旨在传达特定实施方式能包括(然而其他实施方式不包括)特定特征、元件和/或操作。因此,这样的条件语言一般地还旨在暗示特征、元件和/或操作对于一个或多个实施方式无论如何都是需要的或者一个或多个实施方式必须包括用于在有或没有输入或提示的情况下判定这些特征、元件和/或操作是否被包括或者将在任何特定实施方式中被执行的逻辑。
已经在本文中在本说明书和附图中描述的内容包括能够提供游戏AI的编程实现方法及装置的示例。当然,不能够出于描述本公开的各种特征的目的来描述元件和/或方法的每个可以想象的组合,但是可以认识到,所公开的特征的许多另外的组合和置换是可能的。因此,显而易见的是,在不脱离本公开的范围或精神的情况下能够对本公开做出各种修改。此外,或在替代方案中,本公开的其他实施例从对本说明书和附图的考虑以及如本文中所呈现的本公开的实践中可能是显而易见的。意图是,本说明书和附图中所提出的示例在所有方面被认为是说明性的而非限制性的。尽管在本文中采用了特定术语,但是它们在通用和描述性意义上被使用并且不用于限制的目的。
Claims (10)
1.一种游戏AI的编程实现方法,其特征在于,应用于图形化编程,所述方法包括:
获取大量用户的游戏数据,根据游戏数据生成训练样本,所述游戏数据包括游戏操作记录数据和游戏场景数据;
根据训练样本对神经网络进行训练,生成AI决策模型;
检测到游戏AI调用指令,获取AI角色的特征数据及游戏场景;
获取AI决策模型根据AI角色的特征数据及游戏场景作出的决策,并执行所述决策。
2.根据权利要求1所述的游戏AI的编程实现方法,其特征在于,所述获取大量用户的游戏数据,根据游戏数据生成训练样本,包括:
记录大量用户在操作游戏中的生成的游戏数据;
对所述游戏数据进行过滤,获取满足预设条件的游戏数据;
根据游戏数据生成训练样本。
3.根据权利要求2所述游戏AI的编程实现方法,其特征在于,所述获取大量用户的游戏数据,根据游戏数据生成训练样本前,包括:
预先对神经网络的网络结构进行设置。
4.根据权利要3所述的游戏AI的编程实现方法,其特征在于,所述神经网络包括输入层、隐藏层和输出层;
则预先对神经网络的网络结构进行设置,包括:
预先设置所述输入层用于采集游戏中实时变化的数据;
预先设置所述隐藏层用于将输入层采集的数据进行运算和处理;
预先设置所述输出层用于输出分类结果。
5.根据权利要求4所述的游戏AI的编程实现方法,其特征在于,所述预先设置所述输出层用于输出分类结果后,还包括:
预先设置AI角色的死亡条件。
6.根据权利要求5所述的游戏AI的编程实现方法,其特征在于,所述预先设置AI角色的死亡条件后,还包括:
对输入层和输出层的数量进行设置。
7.根据权利要求6所述的游戏AI的编程实现方法,其特征在于,所述根据训练样本对神经网络进行训练,生成AI决策模型,包括:
根据训练样本对神经网络进行训练,当检测到AI角色死亡时,生成初始AI决策模型;
根据后向传播算法对所述初始AI决策模型进行优化后,生成AI决策模型。
8.一种游戏AI的编程实现装置,其特征在于,所述装置包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任一项所述的游戏AI的编程实现方法。
9.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-7任一项所述的游戏AI的编程实现方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行权利要求1-7任一项所述的游戏AI的编程实现方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010478696.4A CN111841017A (zh) | 2020-05-29 | 2020-05-29 | 一种游戏ai的编程实现方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010478696.4A CN111841017A (zh) | 2020-05-29 | 2020-05-29 | 一种游戏ai的编程实现方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111841017A true CN111841017A (zh) | 2020-10-30 |
Family
ID=72985682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010478696.4A Pending CN111841017A (zh) | 2020-05-29 | 2020-05-29 | 一种游戏ai的编程实现方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111841017A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102332162A (zh) * | 2011-09-19 | 2012-01-25 | 西安百利信息科技有限公司 | 基于人工神经网络的医学图像兴趣区自动识别和分级压缩方法 |
CN108090443A (zh) * | 2017-12-15 | 2018-05-29 | 华南理工大学 | 基于深度强化学习的场景文本检测方法及系统 |
CN109542422A (zh) * | 2018-11-21 | 2019-03-29 | 成都聚维合科技有限公司 | 一种实现可视图形化编程的方法 |
CN109550252A (zh) * | 2018-11-07 | 2019-04-02 | 广州多益网络股份有限公司 | 一种游戏ai训练方法、装置及系统 |
CN109978000A (zh) * | 2019-02-19 | 2019-07-05 | 深圳点猫科技有限公司 | 一种基于图形化编程工具的分类ai实现方法及电子设备 |
CN110046952A (zh) * | 2019-01-30 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN110368690A (zh) * | 2019-07-31 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 游戏决策模型训练方法、游戏策略生成方法及装置 |
CN110569900A (zh) * | 2019-09-05 | 2019-12-13 | 苏州大禹网络科技有限公司 | 游戏ai决策方法及装置 |
US10576380B1 (en) * | 2018-11-05 | 2020-03-03 | Sony Interactive Entertainment LLC | Artificial intelligence (AI) model training using cloud gaming network |
CN110908648A (zh) * | 2018-09-17 | 2020-03-24 | 北京龙码科技有限公司 | 一种人工智能辅助图形化编程教学方法及系统 |
CN111013152A (zh) * | 2019-12-26 | 2020-04-17 | 北京像素软件科技股份有限公司 | 游戏模型动作的生成方法、装置及电子终端 |
CN111062209A (zh) * | 2019-12-16 | 2020-04-24 | 苏州思必驰信息科技有限公司 | 自然语言处理模型训练方法和自然语言处理模型 |
-
2020
- 2020-05-29 CN CN202010478696.4A patent/CN111841017A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102332162A (zh) * | 2011-09-19 | 2012-01-25 | 西安百利信息科技有限公司 | 基于人工神经网络的医学图像兴趣区自动识别和分级压缩方法 |
CN108090443A (zh) * | 2017-12-15 | 2018-05-29 | 华南理工大学 | 基于深度强化学习的场景文本检测方法及系统 |
CN110908648A (zh) * | 2018-09-17 | 2020-03-24 | 北京龙码科技有限公司 | 一种人工智能辅助图形化编程教学方法及系统 |
US10576380B1 (en) * | 2018-11-05 | 2020-03-03 | Sony Interactive Entertainment LLC | Artificial intelligence (AI) model training using cloud gaming network |
CN109550252A (zh) * | 2018-11-07 | 2019-04-02 | 广州多益网络股份有限公司 | 一种游戏ai训练方法、装置及系统 |
CN109542422A (zh) * | 2018-11-21 | 2019-03-29 | 成都聚维合科技有限公司 | 一种实现可视图形化编程的方法 |
CN110046952A (zh) * | 2019-01-30 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN109978000A (zh) * | 2019-02-19 | 2019-07-05 | 深圳点猫科技有限公司 | 一种基于图形化编程工具的分类ai实现方法及电子设备 |
CN110368690A (zh) * | 2019-07-31 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 游戏决策模型训练方法、游戏策略生成方法及装置 |
CN110569900A (zh) * | 2019-09-05 | 2019-12-13 | 苏州大禹网络科技有限公司 | 游戏ai决策方法及装置 |
CN111062209A (zh) * | 2019-12-16 | 2020-04-24 | 苏州思必驰信息科技有限公司 | 自然语言处理模型训练方法和自然语言处理模型 |
CN111013152A (zh) * | 2019-12-26 | 2020-04-17 | 北京像素软件科技股份有限公司 | 游戏模型动作的生成方法、装置及电子终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109464803B (zh) | 虚拟对象控制、模型训练方法、装置、存储介质和设备 | |
CN108351986A (zh) | 学习系统、学习装置、学习方法、学习程序、训练数据生成装置、训练数据生成方法、训练数据生成程序、终端装置以及阈值变更装置 | |
JP6966654B2 (ja) | 仮想車両操作方法、モデルトレーニング方法、操作デバイス、および記憶媒体 | |
KR102158683B1 (ko) | 외부 메모리로 신경망들 증강 | |
JP6227783B2 (ja) | ニューラルデバイスのトレーニングを調節するための方法および装置 | |
EP3884426B1 (en) | Action classification in video clips using attention-based neural networks | |
CN109886422A (zh) | 模型配置方法、装置、电子设备及可读取存储介质 | |
US11727265B2 (en) | Methods and apparatus to provide machine programmed creative support to a user | |
US11436436B2 (en) | Data augmentation system, data augmentation method, and information storage medium | |
CN109155002A (zh) | 具有外部存储器的增强神经网络 | |
JP7402277B2 (ja) | 情報処理システム、情報処理方法および情報処理装置 | |
JP2019139295A5 (ja) | 情報処理方法、情報処理装置およびプログラム | |
US11321891B2 (en) | Method for generating action according to audio signal and electronic device | |
CN113806512B (zh) | 机器人对话模型的训练方法、装置、设备及存储介质 | |
CN112364737A (zh) | 一种用于网络直播课的人脸表情识别方法、装置及设备 | |
Zhang et al. | Faster and safer training by embedding high-level knowledge into deep reinforcement learning | |
US9020795B2 (en) | Multiple-entity scenario simulation incorporating human interaction | |
CN113589695B (zh) | 基于记忆序列回放机制的机器人行为决策方法及设备 | |
CN111841017A (zh) | 一种游戏ai的编程实现方法及装置 | |
Hilleli et al. | Toward deep reinforcement learning without a simulator: An autonomous steering example | |
CN112905754B (zh) | 基于人工智能的视觉对话方法、装置及电子设备 | |
JP2021163424A (ja) | Aiシステム開発シミュレータ及びハイパーパラメータ最適化方法 | |
CA3087629A1 (en) | System for managing user experience and method therefor | |
KR20230038136A (ko) | 가지치기 기반 심층 신경망 경량화에 특화된 지식 증류 방법 및 시스템 | |
CN111760276B (zh) | 游戏行为控制方法、装置、终端、服务器和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201030 |
|
RJ01 | Rejection of invention patent application after publication |