CN109771944B - 一种游戏音效生成方法、装置、设备和存储介质 - Google Patents

一种游戏音效生成方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN109771944B
CN109771944B CN201811553766.7A CN201811553766A CN109771944B CN 109771944 B CN109771944 B CN 109771944B CN 201811553766 A CN201811553766 A CN 201811553766A CN 109771944 B CN109771944 B CN 109771944B
Authority
CN
China
Prior art keywords
sound effect
sequence model
model
neural network
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811553766.7A
Other languages
English (en)
Other versions
CN109771944A (zh
Inventor
芦振华
杜庆焜
胡文彬
甘靖山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Xishan Yichuang Culture Co ltd
Original Assignee
Wuhan Xishan Yichuang Culture Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Xishan Yichuang Culture Co ltd filed Critical Wuhan Xishan Yichuang Culture Co ltd
Priority to CN201811553766.7A priority Critical patent/CN109771944B/zh
Publication of CN109771944A publication Critical patent/CN109771944A/zh
Application granted granted Critical
Publication of CN109771944B publication Critical patent/CN109771944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本发明公开了一种游戏音效生成方法、装置、设备和存储介质,采用了人工智能中神经网络的深度学习的特性,开发人员只需输入一种音频文件,就能够随机生成这种声音的准确的游戏音效,不需要专门设立音效组,降低的游戏开发成本,缩短了音效开发周期,能够供游戏开发人员直接使用制作任何自己想要的音效。

Description

一种游戏音效生成方法、装置、设备和存储介质
技术领域
本发明涉及游戏音效开发领域,特别是一种游戏音效生成方法、装置、设备和存储介质。
背景技术
人工智能技术这个概念提出很久,但是一直不温不火,处于概念阶段,直到深度学习和神经网络技术的出现,人工智能技术进行了翻天覆地的革新,人工智能技术终于开始进入了实用化的阶段。在云计算,大数据,深度学习,物联网,图形处理,视频处理,人脸识别,声音处理,文本处理,语音翻译领域都得到了极大的提升。
目前的游戏开发团队,一般需要专门设立音效组,由开发人员向该小组提出音效需求,音效组进行制作游戏音效,一方面造成了成本高、难管理和周期长的弊端;另一方面,存在沟通差异的问题,音效组做出来的音效不是开发人员所想要的,而且能够做出来的游戏音效都是固定的几种。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种游戏音效生成方法、装置、设备和存储介质,不需要专门设立音效组,降低了游戏开发成本,缩短了音效开发周期,能够供游戏开发人员直接使用制作任何自己想要的音效。
本发明解决其问题所采用的技术方案是:
第一方面,本发明实施例提供了一种游戏音效生成方法,包括:构建序列模型,并将其激活;
训练所述序列模型,并保持训练好的权重;
输入音频文件至所述序列模型,并生成相应波形图;
构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件。
进一步,所述构建序列模型,并将其激活,包括:构建序列模型,使用DENSE层和使用线性函数将其进行激活。
进一步,所述训练所述序列模型,并保持训练好的权重,包括:训练所述序列模型,使用SAVE_WEIGHTS函数来保持所述序列模型可以进行载入预训练的权重。
进一步,所述构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件,包括:使用Keras API构建并允许SqueezeNet的卷积神经网络模型,并启动所述卷积神经网络模型,将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,得到结果后上传GITHUB并存储于网络服务器,制作HTTP网页入口,模拟发出想要音效的声音,生成音效文件。
第二方面,本发明实施例还提供了一种储存游戏音效生成方法的装置,包括:
构建单元,用于构建序列模型,并将其激活;
训练单元,用于训练所述序列模型,并保持训练好的权重;
输入单元,用于输入音频文件至所述序列模型,并生成相应波形图;对比生成单元,用于构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件。
进一步,所述构建单元执行操作构建序列模型,并将其激活时,包括以下操作:
构建序列模型,使用DENSE层和使用线性函数将其进行激活。
进一步,所述训练单元执行操作训练所述序列模型,并保持训练好的权重时,包括以下操作:
训练所述序列模型,使用SAVE_WEIGHTS函数来保持所述序列模型可以进行载入预训练的权重。
进一步,所述对比生成单元执行操作构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件时,包括以下操作:使用Keras API构建并允许SqueezeNet的卷积神经网络模型,并启动所述卷积神经网络模型,将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,得到结果后上传GITHUB并存储于网络服务器,制作HTTP网页入口,模拟发出想要音效的声音,生成音效文件。
第三方面,本发明实施例还提供了一种游戏音效生成设备,包括至少一个控制处理器和用于与至少一个控制处理器通信连接的存储器;存储器存储有可被至少一个控制处理器执行的指令,指令被至少一个控制处理器执行,以使至少一个控制处理器能够执行如上所述的游戏音效生成方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行如上所述的游戏音效生成方法。
第五方面,本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使计算机执行如上所述的游戏音效生成方法。
本发明的至少一个实施例具有如下的有益效果:一种游戏音效生成方法、装置、设备和存储介质,采用了人工智能中神经网络的深度学习的特性,开发人员只需输入一种音频文件,就能够随机生成这种声音的准确的游戏音效,不需要专门设立音效组,降低的游戏开发成本,缩短了音效开发周期,能够供游戏开发人员直接使用制作任何自己想要的音效。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是本发明实施例提供的一种游戏音效生成方法的流程图;
图2是本发明实施例提供的一种游戏音效生成装置的结构示意图;
图3是本发明实施例提供的一种游戏音效生成设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,如果不冲突,本发明实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于流程图中的顺序执行所示出或描述的步骤。
首先,实现本发明实施例中的游戏音效生成方法,需要根据人工智能开发的需求,列出人工智能开发机的配置列表并采购所需的配件,装配AI人工智能和深度学习的人工智能开发机,安装UBUNTU系统,安装硬件驱动,安装CUDA和CUDNN计算单元,并进行测试;然后为人工智能开发机安装开发环境,安装Anaconda和其所包含的PYTHON并进行测试,安装Tensorflow,安装Keras深度学习框架API,并配置SSH,登录远程服务器,并进行配置,下载代码,并编译相关代码,测试样例,完成调试工作。
参照图1,本发明实施例提供的一种游戏音效生成方法,包括以下步骤:
步骤S1:构建序列模型,使用DENSE层和使用线性函数将其进行激活;
步骤S2:训练所述序列模型,使用SAVE_WEIGHTS函数来保持所述序列模型可以进行载入预训练的权重;
步骤S3:输入音频文件至所述序列模型,并生成相应波形图;
步骤S4:使用Keras API构建并允许SqueezeNet的卷积神经网络模型,并启动所述卷积神经网络模型,将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,得到结果后上传GITHUB并存储于网络服务器,制作HTTP网页入口,模拟发出想要音效的声音,生成音效文件。
参照图2,本发明实施例提供的一种储存游戏音效生成方法的装置,包括:
构建单元,用于构建序列模型,并将其激活;
训练单元,用于训练所述序列模型,并保持训练好的权重;
输入单元,用于输入音频文件至所述序列模型,并生成相应波形图;对比生成单元,用于构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件。
所述构建单元执行操作构建序列模型,并将其激活时,包括以下操作:
构建序列模型,使用DENSE层和使用线性函数将其进行激活。
所述训练单元执行操作训练所述序列模型,并保持训练好的权重时,包括以下操作:
训练所述序列模型,使用SAVE_WEIGHTS函数来保持所述序列模型可以进行载入预训练的权重。
所述对比生成单元执行操作构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件时,包括以下操作:
使用Keras API构建并允许SqueezeNet的卷积神经网络模型,并启动所述卷积神经网络模型,将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,得到结果后上传GITHUB并存储于网络服务器,制作HTTP网页入口,模拟发出想要音效的声音,生成音效文件。
参照图3,本发明实施例还提供了一种游戏音效生成设备,包括至少一个控制处理器100和用于与至少一个控制处理器100通信连接的存储器200;存储器200存储有可被至少一个控制处理器100执行的指令,指令被至少一个控制处理器100执行,以使至少一个控制处理器100能够执行如上所述的游戏音效生成方法。
需要说明的是,由于本实施例中的游戏音效生成设备与上述的游戏音效生成方法基于相同的发明构思,因此,方法实施例中的相应内容同样适用于本装置实施例,此处不再详述。
此外,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行如上所述的游戏音效生成方法。
存储器200作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态性计算机可执行程序以及模块,如本发明实施例中的游戏音效生成方法对应的程序指令/模块。控制处理器100通过运行存储在存储器200中的非暂态软件程序、指令以及模块,从而执行游戏音效生成设备的各种功能应用以及数据处理,即实现上述方法实施例的游戏音效生成方法。
存储器200可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据游戏音效生成设备的使用所创建的数据等。此外,存储器200可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器200可选包括相对于控制处理器100远程设置的存储器,这些远程存储器可以通过网络连接至该游戏音效生成设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器200中,当被所述一个或者多个控制处理器100执行时,执行上述方法实施例中的游戏音效生成方法,例如,执行以上描述的图1中的方法步骤S1至S4。
在本实施例中,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器100执行,例如,被图3中的一个控制处理器100执行,可使得上述一个或多个控制处理器100执行上述方法实施例中的游戏音效生成方法,例如,执行以上描述的图1中的方法步骤S1至S4。
通过以上的实施方式的描述,本领域技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现。本领域技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ReadOnly Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (8)

1.一种游戏音效生成方法,其特征在于:包括:
构建序列模型,并将其激活;
训练所述序列模型,并保持训练好的权重;
输入音频文件至所述序列模型,并生成相应波形图;
构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件;
其中,所述构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件,包括:
使用Keras API构建并允许SqueezeNet的卷积神经网络模型,并启动所述卷积神经网络模型,将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,得到结果后上传GITHUB并存储于网络服务器,制作HTTP网页入口,生成音效文件。
2.根据权利要求1所述的一种游戏音效生成方法,其特征在于:所述构建序列模型,并将其激活,包括:
构建序列模型,使用DENSE层和使用线性函数将其进行激活。
3.根据权利要求1所述的一种游戏音效生成方法,其特征在于:所述训练所述序列模型,并保持训练好的权重,包括:
训练所述序列模型,使用SAVE_WEIGHTS函数来保持所述序列模型可以进行载入预训练的权重。
4.一种储存游戏音效生成方法的装置,其特征在于:包括:
构建单元,用于构建序列模型,并将其激活;
训练单元,用于训练所述序列模型,并保持训练好的权重;
输入单元,用于输入音频文件至所述序列模型,并生成相应波形图;
对比生成单元,用于构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件;
其中,所述对比生成单元执行操作构建卷积神经网络模型,并使用所述卷积神经网络模型将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,生成新的音效文件时,包括以下操作:
使用Keras API构建并允许SqueezeNet的卷积神经网络模型,并启动所述卷积神经网络模型,将所述序列模型生成的波形图与网络相关波形相同的波形图进行对比,得到结果后上传GITHUB并存储于网络服务器,制作HTTP网页入口,生成音效文件。
5.根据权利要求4所述的装置,其特征在于:所述构建单元执行操作构建序列模型,并将其激活时,包括以下操作:
构建序列模型,使用DENSE层和使用线性函数将其进行激活。
6.根据权利要求4所述的装置,其特征在于:所述训练单元执行操作训练所述序列模型,并保持训练好的权重时,包括以下操作:
训练所述序列模型,使用SAVE_WEIGHTS函数来保持所述序列模型可以进行载入预训练的权重。
7.一种游戏音效生成设备,其特征在于:包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1-3任一项所述的游戏音效生成方法。
8.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1-3任一项所述的游戏音效生成方法。
CN201811553766.7A 2018-12-19 2018-12-19 一种游戏音效生成方法、装置、设备和存储介质 Active CN109771944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811553766.7A CN109771944B (zh) 2018-12-19 2018-12-19 一种游戏音效生成方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811553766.7A CN109771944B (zh) 2018-12-19 2018-12-19 一种游戏音效生成方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN109771944A CN109771944A (zh) 2019-05-21
CN109771944B true CN109771944B (zh) 2022-07-12

Family

ID=66497288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811553766.7A Active CN109771944B (zh) 2018-12-19 2018-12-19 一种游戏音效生成方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN109771944B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543126A (zh) * 2010-12-28 2012-07-04 新奥特(北京)视频技术有限公司 一种基于金字塔式多分辨率的音频波形绘制方法
CN106652984A (zh) * 2016-10-11 2017-05-10 张文铂 一种使用计算机自动创作歌曲的方法
WO2018048934A1 (en) * 2016-09-06 2018-03-15 Deepmind Technologies Limited Generating audio using neural networks
CN107871492A (zh) * 2016-12-26 2018-04-03 珠海市杰理科技股份有限公司 音乐合成方法和系统
KR101854706B1 (ko) * 2017-01-20 2018-05-08 한성대학교 산학협력단 인공 신경망을 이용한 자동 작곡 방법 및 그 기록 매체
US10068557B1 (en) * 2017-08-23 2018-09-04 Google Llc Generating music with deep neural networks
CN108597523A (zh) * 2018-03-23 2018-09-28 平安科技(深圳)有限公司 说话人认证方法、服务器及计算机可读存储介质
CN108806657A (zh) * 2018-06-05 2018-11-13 平安科技(深圳)有限公司 音乐模型训练、音乐创作方法、装置、终端及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7330769B2 (en) * 2001-05-15 2008-02-12 Nintendo Software Technology Corporation Parameterized interactive control of multiple wave table sound generation for video games and other applications
US20180276540A1 (en) * 2017-03-22 2018-09-27 NextEv USA, Inc. Modeling of the latent embedding of music using deep neural network

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543126A (zh) * 2010-12-28 2012-07-04 新奥特(北京)视频技术有限公司 一种基于金字塔式多分辨率的音频波形绘制方法
WO2018048934A1 (en) * 2016-09-06 2018-03-15 Deepmind Technologies Limited Generating audio using neural networks
CN106652984A (zh) * 2016-10-11 2017-05-10 张文铂 一种使用计算机自动创作歌曲的方法
CN107871492A (zh) * 2016-12-26 2018-04-03 珠海市杰理科技股份有限公司 音乐合成方法和系统
KR101854706B1 (ko) * 2017-01-20 2018-05-08 한성대학교 산학협력단 인공 신경망을 이용한 자동 작곡 방법 및 그 기록 매체
US10068557B1 (en) * 2017-08-23 2018-09-04 Google Llc Generating music with deep neural networks
CN108597523A (zh) * 2018-03-23 2018-09-28 平安科技(深圳)有限公司 说话人认证方法、服务器及计算机可读存储介质
CN108806657A (zh) * 2018-06-05 2018-11-13 平安科技(深圳)有限公司 音乐模型训练、音乐创作方法、装置、终端及存储介质

Also Published As

Publication number Publication date
CN109771944A (zh) 2019-05-21

Similar Documents

Publication Publication Date Title
KR102532658B1 (ko) 신경 아키텍처 검색
US10713491B2 (en) Object detection using spatio-temporal feature maps
US11741334B2 (en) Data-efficient reinforcement learning for continuous control tasks
CN109146084B (zh) 一种基于云计算的机器学习的方法及装置
Maras Secrets of the JavaScript Ninja
US9595202B2 (en) Programming learning center
JP2018537788A (ja) 外部メモリを用いたニューラルネットワークの拡張
AU2015101951A4 (en) Computer-implemented frameworks and methodologies for enabling adaptive functionality based on a knowledge model
US11755879B2 (en) Low-pass recurrent neural network systems with memory
US20200122039A1 (en) Method and system for a behavior generator using deep learning and an auto planner
US20180204107A1 (en) Cognitive-emotional conversational interaction system
CN109771944B (zh) 一种游戏音效生成方法、装置、设备和存储介质
CN116523052B (zh) 一种快速推理方法、装置及设备
Brawner et al. Architecture and ontology in the generalized intelligent framework for tutoring: 2018 Update
CN109740302B (zh) 一种神经网络的仿真方法和装置
Rahman Science of Selenium: Master Web UI Automation and Create Your Own Test Automation Framework
CN105117243B (zh) 一种获取应用程序的启动时间的方法和装置
Son et al. Concretization of the Structural and Behavioral Models based on model Transformation Paradigm for Heterogeneous Mobile Software
Reiher et al. Ad hoc HLA simulation model derived from a model-based traffic scenario
CN111913712A (zh) 用于在Web端部署神经网络模型的方法和装置
Sun et al. Extending linden scripting language on OpenSim
CN104657191A (zh) 一种将Flash项目转换为Html5项目的方法与装置
US20210125086A1 (en) Multimodal knowledge consumption adaptation through hybrid knowledge representation
US20210042639A1 (en) Converting nonnative skills for conversational computing interfaces
Hunter Aurelia in Action

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant