CN113010137B - 电子装置与音量自动调整方法 - Google Patents
电子装置与音量自动调整方法 Download PDFInfo
- Publication number
- CN113010137B CN113010137B CN201911318538.6A CN201911318538A CN113010137B CN 113010137 B CN113010137 B CN 113010137B CN 201911318538 A CN201911318538 A CN 201911318538A CN 113010137 B CN113010137 B CN 113010137B
- Authority
- CN
- China
- Prior art keywords
- volume
- gain
- audio
- value
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 50
- 238000012360 testing method Methods 0.000 claims description 31
- 238000001514 detection method Methods 0.000 claims description 23
- 238000011156 evaluation Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000006073 displacement reaction Methods 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 8
- 238000004378 air conditioning Methods 0.000 claims 8
- 230000006870 function Effects 0.000 description 33
- 238000000605 extraction Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004880 explosion Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/50—Controlling the output signals based on the game progress
- A63F13/54—Controlling the output signals based on the game progress involving acoustic signals, e.g. for simulating revolutions per minute [RPM] dependent engine sounds in a driving game or reverberation against a virtual wall
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开一种电子装置与音量自动调整方法,音量自动调整方法包含:识别当前游戏的音频数据是否包含多个预定声音类别中的其中之一;于音频数据包含多个预定声音类别中的其中之一时,根据音频数据所包含的预定声音类别得到音量增益;以及根据音量增益调整音频数据的音量。
Description
技术领域
本发明涉及音量调整技术,尤其涉及一种自动调整游戏的音量的电子装置与音量自动调整方法。
背景技术
近年来,随着科技与网络的进步,各式游戏类型的电子游戏亦随之蓬勃发展。在电子游戏中,电子游戏的游戏声音可用以提升游戏的互动性,并营造出相应的游戏氛围而带给玩家极强的临场感。此外,玩家于电子游戏的过程中,甚至可根据是否出现某些游戏声音、某些游戏声音的大小来进行相关反应与判断,以成为游戏赢家。
举例而言,在第一人称射击游戏(First-person shooter,FPS)中,玩家可以通过枪声快速辨别出敌人的关键位置和武器种类,以于第一时间找到敌人的准确方位与距离,并给予反击。因此,在电子游戏中,玩家能否分辨某些类别的声音(例如,枪声、爆炸声等等)是相当重要的一环。
发明内容
本发明的目的在于提供一种电子装置与音量自动调整方法,以解决上述至少一个问题。
本发明的一实施例公开一种音量自动调整方法。音量自动调整方法包含:识别当前游戏的音频数据是否包含多个预定声音类别中的其中之一;于音频数据包含多个预定声音类别中的其中之一时,根据音频数据所包含的预定声音类别得到音量增益;以及根据音量增益调整音频数据的音量。
本发明的一实施例公开一种电子装置。电子装置包含音频识别模块以及音频调整模块。音频识别模块用以识别当前游戏的音频数据是否包含多个预定声音类别中的其中之一。于音频数据包含多个预定声音类别中的其中之一时,音频调整模块用以根据音频数据所包含的预定声音类别得到音量增益,并且根据音量增益调整音频数据的音量。
本发明的有益效果在于,本发明的实施例提供一种音量自动调整方法及其电子装置,其可实时对当前游戏的音频数据进行分析,并于识别到当前游戏的音频数据中包含预定声音类别时,根据所包含的预定声音类别得到相应的音量增益并据此适当调整音频数据的音量,使得用户于游戏过程中对于符合预定声音类别的声音的掌握度可更高,并更优化了使用者的游戏体验。
附图说明
图1为本发明一实施例的电子装置的方块示意图。
图2为本发明一实施例的音量自动调整方法的流程图。
图3为本发明一实施例的音量自动调整方法的流程图。
图4为本发明另一实施例的音量自动调整方法的流程图。
图5为本发明一实施例的音量自动调整方法的流程图。
图6为步骤S60的一实施例的流程示意图。
图7为本发明一实施例的音量自动调整方法的流程图。
图8为步骤S30的一实施例的流程示意图。
附图标记如下:
100 电子装置
110 音频识别模块
120 音频调整模块
130 游戏检测模块
140 数据库
150 效能评估模块
160 预处理模块
A1 选定算法
D1 音频数据
Gcn 自定义增益
S10~S74 步骤
具体实施方式
为使本发明的实施例的上述目的、特征和优点能更明显易懂,下文配合所附附图,作详细说明如下。
必须了解的是,使用于本说明书中的“包含”、“包括”等词,是用以表示存在特定的技术特征、数值、方法步骤、作业处理、组件以及/或组件,但并不排除可加上更多的技术特征、数值、方法步骤、作业处理、组件、组件,或以上的任意组合。
“第一”、“第二”等词是用来修饰组件,并非用来表示之间优先级或先行关系,而仅用来区别具有相同名字的组件。
图1为本发明一实施例的电子装置的方块示意图。值得注意的是,为了清楚阐述本发明,图1为一简化的方块图,其中仅显示出与本发明相关的组件。本领域技术人员应了解系统亦可能包含其他组件,用以提供特定的功能。
请参阅图1,电子装置100可用以运行各种软件、程序,特别是游戏软件。此外,用户可通过电子装置100启动游戏软件来进行游戏,并通过游戏获得视觉、听觉等游戏体验。在一实施例中,电子装置100可包含音频识别模块110以及音频调整模块120,且音频调整模块120耦接于音频识别模块110。电子装置100可执行本发明任一实施例的音量自动调整方法,以自动针对符合预订游戏类型的游戏中的特定声音的音量进行适当调整,使得使用者于听觉上的体验得以受到优化。
图2为本发明一实施例的音量自动调整方法的流程图。请参阅图1与图2,在音量自动调整方法的一实施例中,电子装置100可通过音频识别模块110识别当前游戏的音频数据D1中是否包含多个预定声音类别中的其中之一(步骤S10)。在一些实施例中,多个预定声音类别可包含枪声、爆炸声、引擎声等,但本发明并非仅限于此,预定声音类别可视使用者欲加强的声音类别来进行设定。当音频识别模块110的识别结果为此音频数据D1中包含多个预定声音类别中的其中之一时,电子装置100可通过音频调整模块120根据此音频数据D1中所包含的预定声音类别得到一音量增益(步骤S20),并且通过音频调整模块120根据所得到的音量增益去适度调整音频数据D1的音量(步骤S30)。
如此一来,于当前游戏中符合预定声音类别的声音可被适度调整,例如预定声音类别的声音的音量放大,使得用户于游戏过程中对于符合预定声音类别的声音的掌握度可更高,并且更优化了使用者的游戏体验。
在一些实施例中,当电子装置100中仅运行了一个游戏时,此游戏即为所述的当前游戏。而当电子装置100中运行了多个游戏时,其游戏窗口切换至最上层(Top Most)的游戏即为所述的当前游戏。
在一些实施例中,电子装置100可还包含游戏检测模块130,且游戏检测模块130耦接于音频识别模块110。游戏检测模块130可用以检测电子装置100目前是否运行了任何游戏。在一些实施方式中,游戏检测模块130可自动启用检测功能。在另一些实施方式中,使用者亦可于应用程序编程接口控制游戏检测模块130的检测功能的启用与否。
图3为本发明一实施例的音量自动调整方法的流程图。请参阅图1与图3,在音量自动调整方法的一实施例中,于步骤S10之前,电子装置100可先通过游戏检测模块130判断电子装置100目前是否运行了任何游戏(步骤S40)。当游戏检测模块130判定电子装置100运行了游戏时,音频识别模块110可执行步骤S10以根据电子装置100所运行的游戏(可称为当前游戏)的音频数据D1进行识别,以确认当前游戏的音频数据D1中是否包含预定声音类别中的任一个。但本发明并非以此为限。随着游戏的游戏类型的不同,某些预定声音类别亦可能不会被包含于某些游戏的音频数据中。举例而言,当预定声音类别为枪声、爆炸声及/或引擎声时,且当前游戏的游戏类型为体育类游戏(Sports Game,SPT)时,当前游戏的所有音频数据中便可能不会包含到预定声音类别中的任一个,而无需对其音频数据进行任何识别。而倘若当前游戏的游戏类型为第一人称射击游戏(First-person shooter,FPS)或赛车竞速游戏(Race Car Game,RCG)等时,当前游戏的音频数据便可能包含了预定声音类别而需要进一步的识别。
因此,音量自动调整方法的另一实施例中,如图4所示,当游戏检测模块130于步骤S40中判定电子装置100运行了游戏时,电子装置130可更通过游戏检测模块130取得当前游戏的游戏类型(步骤S51),并且通过游戏检测模块130判断当前游戏的游戏类型是否符合预定游戏类型(步骤S52)。之后,当游戏检测模块130判定游戏类型符合预定游戏类型时,电子装置100再接续执行后续步骤,例如执行步骤S10来利用音频识别模块110根据当前游戏的音频数据D1进行识别,以确认此音频数据D1中是否包含预定声音类别中的任一个。反之,当游戏检测模块130于步骤S52中判定游戏类型不符合预定游戏类型时,电子装置100可不接续执行后续步骤,例如不利用音频识别模块110对当前游戏的音频数据D1进行识别,以避免耗费资源。
在步骤S40的一些实施例中,游戏检测模块130可通过第一提取函式取得电子装置100中的操作窗口的标题,并且通过第二提取函式取得操作窗口的程序名称(processname)。之后,游戏检测模块130便可依据所得的标题以及程序名称和数据库140中的多个预储标题和多个预储程序名称进行比对,以由此判断电子装置100中目前是否运行了任何游戏。
在一些实施例中,数据库140中所储的多个预储标题和多个预储程序名称可为游戏检测模块130于先前通过第一提取函式与第二提取函式所取得并储存的,但本发明并非以此为限,在另一些实施例中,亦可由制造商将常用的多个预储标题和多个预储程序名称预先储存至数据库140中。此外,多个预储标题和多个预储程序名称可以一对一的表格方式储存于数据库140中,如下方表一所示的一范例。
表一
在一些实施方式中,第一提取函数与第二提取函数可为电子装置100的操作系统所支持的动态连接链接库(Dynamic Link Library,DLL)中的函数。举例而言,操作系统为微软操作系统时,第一提取函数可包含GetForegroundWindow函数、GetWindowTextLength函数、GetWindowText函数、其组合或其他任何适用的函数。第二提取函数可包含GetWindowThreadProcessId函数、GetModuleBaseName函数、其组合或其他任何适用的函数。此外,数据库140可以表格方式储存多个预储标题和多个预储程序名称。再者,数据库140可为云端数据库,而以远程联机方式连接至游戏检测模块130。但本发明并非以此为限,数据库140亦可为本地数据库而设置于电子装置100之中。
在步骤S10的一实施例中,音频识别模块110是利用一选定算法A1来对音频数据D1进行识别。在一些实施例中,电子装置100可还包含效能评估模块150,且效能评估模块150耦接于游戏检测模块130与音频识别模块110之间。效能评估模块150可用以评估电子装置100的运算效能,并从默认的多个算法中决定出合适的一算法来作为音频识别模块110所用的选定算法A1,以确保算法的实时性,并避免对游戏声音的输出造成延迟。
因此,在音量自动调整方法的一实施例中,如图5所示,于步骤S10之前,电子装置100可更利用效能评估模块150评估出电子装置100当前的运算效能,并根据评估的结果产生出合适的选定算法A1给音频识别模块110(步骤S60)。
图6为步骤S60的一实施例的流程示意图。请参阅图6,在步骤S60的一实施例中,效能评估模块150可执行第一运算量的第一效能运算以获得第一运算时间(步骤S61),并且执行第二运算量的第二效能以获得第二运算时间(步骤S62)。接续,效能评估模块150可根据第一运算时间与第二运算时间以多个算法中的其中之一作为测试算法(步骤S63),并且执行此测试算法所对应的测试程序以获得一测试时间(步骤S64)。之后,效能评估模块150可将步骤S64所得的测试时间与预定的测试阀值进行比较(步骤S65)。当测试时间小于测试阀值时,表示此测试算法对游戏声音输出的延迟影响还在可容忍范围内,效能评估模块150便可以此测试算法作为选定算法A1并且提供给音频识别模块110(步骤S66)。而当测试时间大于或等于测试阀值时,表示此测试算法对游戏声音输出的延迟影响已超出容忍范围,此时效能评估模块150可返回步骤S63中,以重新选定另一个算法作为测试算法来再次进行测试。依此类推,效能评估模块150可通过步骤的重复循环最终决定出选定算法A1。
在步骤S63的一实施例中,各算法都具有对应的第一效能运算时间阀值以及第二效能运算时间阀值。效能评估模块150可将步骤S61中所得第一运算时间与某一算法的第一效能运算时间阀值进行比较,并且将步骤S62中所得第二运算时间与此算法的第二效能运算时间阀值进行比较,以确认是否以此算法作为测试算法。于此,当效能评估模块150判定第一运算时间与第二运算时间皆小于此算法的第一效能运算时间阀值与第二效能运算时间阀值时,效能评估模块150便以此算法作为测试算法。反之,效能评估模块150则接续以另一算法的第一效能运算时间阀值与第二效能运算时间阀值与第一运算时间与第二运算时间进行比较,以此类推最终决定出测试算法。
在一些实施例中,步骤S61与步骤S62的顺序可互换。第一效能运算可为浮点运算,且第二效能运算可为整数运算。此外,第一运算量可相等于第二运算量,且第一运算量与第二运算量可为使用者或制造商等预设的固定量,但本发明并非以此为限。
在一些实施例中,多个算法的核心技术分别可包含人工智能(例如,深层类神经网络)、统计模型(例如,隐藏式马可夫模型)、集群分析(例如,K-means)等,但本发明并非以此为限。
在步骤S10的一实施例中,音频识别模块110是利用选定算法A1对音频数据D1中的多个音框进行识别。在一些实施例中,电子装置100可还包含预处理模块160,且预处理模块160耦接于音频识别模块110。预处理模块160可用以取得当前游戏的音频数据D1,并且可对音频数据D1进行适当的预处理,以确保所提取的音频数据D1可被有效地分析。
因此,在音量自动调整方法的一实施例中,于步骤S10之前,电子装置100可利用预处理模块160从前端,例如音频驱动程序(Audio driver),取得当前游戏的音频数据D1(步骤S71),并且自音频数据D1提取出多个音框(步骤S72)。之后,预处理模块160便可对此些音框进行适当地预处理以取得各音框的特征系数(步骤S73),并输出经预处理后的各音框的特征系数给音频识别模块110(步骤S74),以便步骤S10的执行。需注意的是,图7中虽未示出步骤S40、步骤S51、步骤S52,但步骤S40、步骤S51、步骤S52实际上亦可组合于图7所示的流程中。
在步骤S72的一实施例中,预处理模块160可每隔一第一数量的取样点从音频数据D1中提取出一第二数量的取样点来作为一个音框(即一个分析单位)。换言之,预处理模块160所提取出的此些音框会依序彼此间隔第一数量的取样点,且各音框包含第二数量的取样点。在一些实施方式中,第一数量可为192,且第二数量可为256,但本发明并非以此为限,第一数量、第二数量可分别为其他合适的任意数值。
在步骤S73的一实施例中,预处理可包含利用傅立叶变换将各音框从时域转换至频域。此外,预处理可还包含利用系数转换,例如梅尔频率倒谱系数(Mel-FrequencyCepstral Coefficients,MFCCs),将已转换至频域的各音框转成具有代表性的特征系数,但本发明并非以此为限。
请参阅图1至图7,在步骤S10的一实施例中,音频识别模块110可将预处理模块160所产生的各音框的特征系数喂入效能评估模块150所决定的选定算法A1,以分别识别音频数据D1中的各个音框是否包含预定声音类别。于此,音频识别模块110可依序以多个音框中的其中之一作为当前音框,并且识别当前音框中是否包含多个预定声音类别中的其中之一。其中,当前音框即为音频识别模块110正在处理的音框。
在步骤S20的一实施例中,于当前音框包含多个预定声音类别中的其中之一时,音频调整模块120可更取得多个先前音框与当前音框的多个预估增益值。其中,先前音框是指早于当前音框出现的音框。此外,此些先前音框与当前音框可分别对应到此些预估增益值中之一,并且分别对应到一增益调整系数。于此,音频调整模块120可通过将各先前音框的预估增益值和各先前音框对应的增益调整系数的乘积以及当前音框的预估增益值和当前音框对应的增益调整系数的乘积全部加总起来,来得到当前音框的音量增益。
在一些实施例中,当前音框的音量增益可以下方的式一来表示:
其中,Gi为当前音框的音量增益,Cj为增益调整系数,Gp(i-j)为第(i-j)个音框的预估增益值。此外,x为列入考虑的音框数量。例如,x=5时,表示由目前处理的当前音框再往前考虑四个先前音框。
在一些实施例中,由于越近期所观测到的数值具有越高的代表性,故此些增益调整系数可为一递增数列(其中,最早出现的先前音框的增益调整系数最小,而当前音框的增益调整系数最大),以通过渐增方式来调整音量。在一些实施方式中,此些增益调整系数的总和可为1。
在一些实施例中,若音框中不包含任一预定声音类别的声音时,则此音框的预估增益值为0。而若音框中包含任一预定声音类别的声音时,则此音框的预估增益值主要相关于其所包含的预定声音类别。其中,各音框的预估增益值的详细取得方式将留待后方介绍。
以下,以五个音框(即四个先前音框与当前音框)的一实施例来说明如何计算出当前音框的音量增益,但音框的数量并非以此为限。在一实施例中,各音框与对应的预估增益值、增益调整系数的一实施例可如下方表二所示。
表二
在本实施例中,音频调整模块120可将表二的数值带入式一中而得到当前音框的音量增益为1.8,其详细计算式如后方所式:2×0.7+2×0.2+0×0.05+0×0.03+0×0.02=1.8。
在一些实施例中,各预定声音类别具有对应的平均辨识率以及自定义增益Gcn。其中,平均辨识率的值可在训练音频识别模块110的算法时,喂入测试数据库(TestDatabase)来求得。各预定声音类别的自定义增益Gcn可为预设的增益数值,且使用者可于应用程序编程接口中设定各预定声音类别的增益数值。此外,各音框可具有对应的信心分数。此信心分数可由音频识别模块110在针对第i个音框做识别时产生。
在一些实施例中,于音框(当前音框或先前音框)中包含任一预定声音类别的声音时,音频调整模块120可先将所包含的预定声音类别的自定义增益Gcn减去1,之后再乘上所包含的预定声音类别的平均辨识率以及此音框的信心分数,最后再加上1来得到此音框的预估增益值。
在一些实施例中,包含任一预定声音类别的音框的预估增益值可以下方的式二来表示:
Gpi=1+Grn×Gdi×(Gcn-1) (式二)
其中,Gpi为第i个音框的预估增益值,Grn为第n个预定声音类别的平均识别率,Gdi为第i个音框的信心分数,Gcn为第n个预定声音类别的自定义增益。
在一些实施例中,音频识别模块110所采用的选定算法A1不一定会自动产生对应的信心分数,例如当选定算法A1为以人工智能或统计模型为核心技术的算法时,针对每次识别结果都会产生相应的信心分数,而当选定算法A1为以集群分析为核心技术的算法时,则默认不会自动产生相应的信心分数。因此,在不会自动产生相应的信心分数的情况下,音频调整模块120可更通过下方一实施例的式三来计算出信心分数:
其中,Gdi为第i个音框的信心分数,D1为音频样本与第1个预定声音类别的欧几里得距离。
在步骤S30的一实施例中,音频调整模块120可利用S函数(Sigmoid())根据当前音框的输入音量值、输入调整系数、音频最大输出值以及步骤S20中所得的音量增益来产生一输出音量值。之后,音频调整模块120便可根据S函数所产生的输出音量值来调整当前音框的音量。其中,音频最大输出值是指音频驱动程序的最大输出值。例如,电子装置100的音频处理器为8位时,其输出范围可为-128到+127,则音频最大输出值可为127。此外,输入调整系数是用以使得S函数的输出范围可更符合所需。在一些实施例中,由于S函数的特性,其输出饱和区约在输入为±0.5的地方,因此,输入调整系数可设为0.2(输出/输入=1/5=0.2)。
图8为步骤S30的一实施例的流程示意图。请参阅图8,在步骤S30的一实施例中,音频调整模块120可先将音量增益与输入音量值的乘积除以输入调整系数与最大输出值的乘积,以得到一S函数输入(步骤S31)。接续,利用S函数根据S函数输入得到一S函数输出(步骤S32)。为了抵销S函数的输出偏移,音频调整模块120可将步骤S32中所得的S函数输出减去一位移值(步骤S33)。之后,音频调整模块120再将减去位移值后的S函数输出和音频输出最大值以及预定常数相乘,以产生输出音量值(步骤S34),并且音频调整模块120再根据步骤S34所得的输出音量值调整当前音框的音量(步骤S35)。
在一些实施方式中,由于S函数的特性,若输入为0时,输出为0.5。因此,步骤S33中的位移值可设定为0.5,以抵销输出偏移。此外,由于S函数输出的最大值为1,并且位移值设定为0.5,因此步骤S34中的预定常数可设定为2。
在一些实施例中,输出音量值可以下方的式四来表示:
其中,Sout为输出音量值,Cm为音频输出最大值,Gi为音量增益,Sin为输入音量值,K为输入调整系数,且Ca为位移值。
以下,以一实施例来说明输出音量值的实例演算。在一实施例中,假设输入音量值为60,音量增益为1.8(可由式二得到),音频最大输出值为127,输入调整系数为0.2且位移值为0.5时,音频调整模块120可以先得到S函式输入为4.25(即,)。接续,音频调整模块120再将4.25带入S函数而可得到S函数输出为0.9859。之后,音频调整模块120便可将0.9859带入至完整的式四中,而求得输出音量值为123.41(即,2×127×(0.9859-0.5)=123.41)。基于此,可知通过本发明一实施例的音量自动调整方法及其电子装置处理后,音量可从原先的60调整至123.41。需注意的是,本案的输出音量值因可利用特殊的计算公式来产生,而更可避免因辨识错误或突然放大而造成使用者体验不佳。
对于本发明任一实施例的音量自动调整方法及其电子装置而言,任一种维度的游戏声音,例如1维(1D)、2维(2D)、三维(3D)等,都可适用。再者,本发明任一实施例的音量自动调整方法及其电子装置的作用时间点可在游戏声音合成之后以及拨放之前作用。此外,本发明任一实施例的音量自动调整方法及其电子装置的调整主要是依据游戏声音中所含的预定声音类别来调整音量的大小。
在一些实施例中,音频识别模块110、音频调整模块120、游戏检测模块130、效能评估模块150以及预处理模块160可通过中央处理器(CPU)及/或图形处理器(GPU)来实现各模块的功能,但本发明并非以此为限。
综上所述,本发明的实施例提供一种音量自动调整方法及其电子装置,其可实时对当前游戏的音频数据进行分析,并于识别到当前游戏的音频数据中包含预定声音类别时,根据所包含的预定声音类别得到相应的音量增益并据此适当调整音频数据的音量,使得用户于游戏过程中对于符合预定声音类别的声音的掌握度可更高,并更优化了使用者的游戏体验。再者,本发明任一实施例的音量自动调整方法及其电子装置可根据电子装置当前的运算效能选择出合适的选定算法来对音频数据进行分析。此外,本发明任一实施例的音量自动调整方法及其电子装置利用特殊的计算公式可避免因辨识错误或突然放大而造成使用者体验不佳。
本发明的实施例公开如上,然其并非用以限定本发明的范围,本领域技术人员在不脱离本发明实施例的精神和范围内,当可做些许的更动与润饰,因此本发明的保护范围当视随附的权利要求所界定为准。
Claims (12)
1.一种音量自动调整方法,包含:
取得当前游戏的音频数据;及
自该音频数据中提取多个音框,其中多个所述音框依序彼此间隔一第一数量的取样点,各该音框包含一第二数量的该取样点;
以多个所述音框中的其中之一作为一当前音框,识别该当前音框是否包含多个预定声音类别中的其中之一;
于该音频数据包含多个所述预定声音类别中的其中之一时,根据该音频数据所包含的该预定声音类别得到一音量增益;及
根据该音量增益调整该音频数据的音量;
其中得到该音量增益的步骤包含:
于该当前音框包含多个所述预定声音类别中的其中之一时,取得多个先前音框与该当前音框的多个预估增益值,其中多个所述先前音框为早于该当前音框的多个所述音框,且多个所述先前音框与该当前音框分别对应到一增益调整系数;及
将各该先前音框的该预估增益值与对应的该增益调整系数的乘积以及该当前音框的该预估增益值与对应的该增益调整系数的乘积加总以得到该当前音框的该音量增益;
其中各该预定声音类别具有对应的一平均辨识率与一自定义增益,且各该音框具有对应的一信心分数,其中包含多个所述预定声音类别中的其中之一的该先前音框的该预估增益值与该当前音框的该预估增益值通过将该自定义增益减1之后乘以该平均辨识率以及该信心分数并且再加上1来产生,其中不包含多个所述预定声音类别中的任一个的该先前音框的该预估增益值为0。
2.如权利要求1所述的音量自动调整方法,还包含:
取得该当前游戏的一游戏类型;及
判断该游戏类型是否符合一预定游戏类型,其中识别该当前游戏的该音频数据的步骤于判断该游戏类型符合该预定游戏类型时执行。
3.如权利要求1所述的音量自动调整方法,还包含:
执行一第一运算量的一第一效能运算,以获得一第一运算时间;
执行一第二运算量的一第二效能运算,以获得一第二运算时间;
根据该第一运算时间与该第二运算时间以多个算法中的其中之一作为一测试算法;
执行该测试算法所对应的一测试程序,以获得一测试时间;及
于该测试时间小于一测试阈值时,以该测试算法作为一选定算法,其中识别该音频数据的步骤利用该选定算法去执行。
4.如权利要求1所述的音量自动调整方法,其中多个所述增益调整系数的总和为1。
5.如权利要求1所述的音量自动调整方法,其中根据该音量增益调整该音频数据的该音量的步骤包含:
利用Sigmoid函数根据该音频数据中的一当前音框的一输入音量值、一输入调整系数、一音频最大输出值与该音量增益产生一输出音量值;及
根据该输出音量值调整该音频数据中的该当前音框的该音量。
6.如权利要求5所述的音量自动调整方法,其中产生该输出音量值的步骤包含:
将该音量增益与该输入音量值的乘积除以该输入调整系数与该音频最大输出值的乘积,以得到一Sigmoid函数输入;
利用该Sigmoid函数根据该Sigmoid函数输入得到一Sigmoid函数输出;
将该Sigmoid函数输出减去一位移值;及
将减去该位移值的该Sigmoid函数输出与该音频最大输出值及一预定常数相乘,以产生该输出音量值。
7.一种电子装置,包含:
一音频识别模块,用以识别一当前游戏的一音频数据是否包含多个预定声音类别中的其中之一;及
一音频调整模块,于该音频数据包含多个所述预定声音类别中的其中之一时,用以根据该音频数据所包含的该预定声音类别得到一音量增益,并根据该音量增益调整该音频数据的音量;
一预处理模块,用以取得该当前游戏的该音频数据,并从该音频数据中提取出多个音框,其中多个所述音框依序彼此间隔一第一数量的取样点,且各该音框包含一第二数量的该取样点,以及其中该音频识别模块以多个所述音框中的其中之一作为一当前音框,并且识别该当前音框是否包含多个所述预定声音类别中的其中之一;
其中于该当前音框包含多个所述预定声音类别中的其中之一时,该音频调整模块更取得多个先前音框与该当前音框的多个预估增益值,其中多个所述先前音框为早于该当前音框的多个所述音框,且多个所述先前音框与该当前音框分别对应到一增益调整系数,以及该音频调整模块将各该先前音框的该预估增益值与对应的该增益调整系数的乘积以及该当前音框的该预估增益值与对应的该增益调整系数的乘积加总起来以得到该当前音框的该音量增益;
其中各该预定声音类别具有对应的一平均辨识率与一自定义增益,且各该音框具有对应的一信心分数,其中包含多个所述预定声音类别中的其中之一的该先前音框的该预估增益值与该当前音框的该预估增益值是该音频调整模块通过将该自定义增益减1之后乘以该平均辨识率以及该信心分数并且再加上1来产生,其中不包含多个所述预定声音类别中的任一个的该先前音框的该预估增益值为0。
8.如权利要求7所述的电子装置,还包含:
一游戏检测模块,用以取得该当前游戏的一游戏类型,并判断该游戏类型是否符合一预定游戏类型,其中该音频识别模块于该游戏检测模块判断该游戏类型符合该预定游戏类型时对该当前游戏的该音频数据进行识别。
9.如权利要求7所述的电子装置,还包含:
一效能评估模块,用以执行一第一运算量的一第一效能运算以获得一第一运算时间,并且执行一第二运算量的一第二效能运算以获得一第二运算时间,该效能评估模块根据该第一运算时间与该第二运算时间以多个算法中的其中之一作为一测试算法,并且执行该测试算法所对应的一测试程序以获得一测试时间,其中该效能评估模块于该测试时间小于该测试阈值时以该测试算法作为一选定算法,其中该音频识别模块利用该选定算法识别该音频数据。
10.如权利要求7所述的电子装置,其中多个所述增益调整系数的总和为1。
11.如权利要求7所述的电子装置,其中该音频调整模块更利用Sigmoid函数根据该音频数据中的一当前音框的一输入音量值、一输入调整系数、一音频最大输出值与该音量增益产生一输出音量值,并且该音频调整模块根据该输出音量值调整该音频数据中的该当前音框的该音量。
12.如权利要求11所述的电子装置,其中该音频调整模块将该音量增益与该输入音量值的乘积除以该输入调整系数与该音频最大输出值的乘积以得到一Sigmoid函数输入,并利用该Sigmoid函数根据该Sigmoid函数输入得到一Sigmoid函数输出,该音频调整模块更将该Sigmoid函数输出减去一位移值,并且将减去该位移值的该Sigmoid函数输出与该音频最大输出值及一预定常数相乘以产生该输出音量值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911318538.6A CN113010137B (zh) | 2019-12-19 | 2019-12-19 | 电子装置与音量自动调整方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911318538.6A CN113010137B (zh) | 2019-12-19 | 2019-12-19 | 电子装置与音量自动调整方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113010137A CN113010137A (zh) | 2021-06-22 |
CN113010137B true CN113010137B (zh) | 2024-01-09 |
Family
ID=76381216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911318538.6A Active CN113010137B (zh) | 2019-12-19 | 2019-12-19 | 电子装置与音量自动调整方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113010137B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101053277A (zh) * | 2004-11-10 | 2007-10-10 | Adc技术株式会社 | 声音电子电路及其音量调节方法 |
CN101060315A (zh) * | 2006-04-21 | 2007-10-24 | 鸿富锦精密工业(深圳)有限公司 | 音量管理系统及方法 |
JP2015226285A (ja) * | 2014-05-29 | 2015-12-14 | オンキヨー株式会社 | 音声信号処理装置およびそのプログラム |
CN109194808A (zh) * | 2018-09-14 | 2019-01-11 | 西安蜂语信息科技有限公司 | 音量调节方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9364750B2 (en) * | 2009-09-11 | 2016-06-14 | Steelseries Aps | Apparatus and method for enhancing a condition in a gaming application |
-
2019
- 2019-12-19 CN CN201911318538.6A patent/CN113010137B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101053277A (zh) * | 2004-11-10 | 2007-10-10 | Adc技术株式会社 | 声音电子电路及其音量调节方法 |
CN101060315A (zh) * | 2006-04-21 | 2007-10-24 | 鸿富锦精密工业(深圳)有限公司 | 音量管理系统及方法 |
JP2015226285A (ja) * | 2014-05-29 | 2015-12-14 | オンキヨー株式会社 | 音声信号処理装置およびそのプログラム |
CN109194808A (zh) * | 2018-09-14 | 2019-01-11 | 西安蜂语信息科技有限公司 | 音量调节方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113010137A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111292764B (zh) | 辨识系统及辨识方法 | |
Wan et al. | Towards audio to scene image synthesis using generative adversarial network | |
CN109862393B (zh) | 视频文件的配乐方法、系统、设备及存储介质 | |
US8407055B2 (en) | Information processing apparatus and method for recognizing a user's emotion | |
US7684986B2 (en) | Method, medium, and apparatus recognizing speech considering similarity between the lengths of phonemes | |
US5869783A (en) | Method and apparatus for interactive music accompaniment | |
JP6908045B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
US11355099B2 (en) | Word extraction device, related conference extraction system, and word extraction method | |
CN102385860A (zh) | 信息处理设备、信息处理方法及程序 | |
CN111445898B (zh) | 语种识别方法、装置、电子设备和存储介质 | |
CN112309365A (zh) | 语音合成模型的训练方法、装置、存储介质以及电子设备 | |
CN111161726B (zh) | 一种智能语音交互方法、设备、介质及系统 | |
CN111986295B (zh) | 舞蹈合成方法、装置及电子设备 | |
CN110493612B (zh) | 弹幕信息的处理方法、服务器及计算机可读存储介质 | |
JP5569228B2 (ja) | テンポ検出装置、テンポ検出方法およびプログラム | |
CN111147871B (zh) | 直播间歌唱识别方法、装置及服务器、存储介质 | |
CN111841007A (zh) | 游戏的控制方法、装置、设备和存储介质 | |
Pandharipande et al. | An unsupervised frame selection technique for robust emotion recognition in noisy speech | |
CN113010137B (zh) | 电子装置与音量自动调整方法 | |
US11521594B2 (en) | Automated pipeline selection for synthesis of audio assets | |
WO2019106758A1 (ja) | 言語処理装置、言語処理システムおよび言語処理方法 | |
JPWO2020003413A1 (ja) | 情報処理装置、制御方法、及びプログラム | |
CN110739006A (zh) | 音频处理方法、装置、存储介质及电子设备 | |
TWI731472B (zh) | 電子裝置與音量自動調整方法 | |
CN115374305A (zh) | 智能音箱的音效调整方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |