CN113707174B

CN113707174B - 一种音频驱动的动画特效的生成方法

Info

Publication number: CN113707174B
Application number: CN202111014335.5A
Authority: CN
Inventors: 杨健
Original assignee: Yeelion Online Network Technology Beijing Co Ltd
Current assignee: Yeelion Online Network Technology Beijing Co Ltd
Priority date: 2021-08-31
Filing date: 2021-08-31
Publication date: 2024-02-09
Anticipated expiration: 2041-08-31
Also published as: CN113707174A

Abstract

本发明涉及一种音频驱动的动画特效的生成方法，当播放音频时，分批次获取当前播放中的音频对应的频谱数据，分奇数次、偶数次缓存于第一、第二缓存区；交替的从两个缓存区获取缓存的频谱数据，并生成频谱动画；并进一步判断下一批次的频谱数据是否已经被缓存；当未被缓存，则基于当前缓存的频谱数据，通过插帧补帧的处理逻辑，得到过渡频谱数据，并缓存于第三缓存区；通知下一批次的频谱数据获取临时改为从第三缓存区获取，并生成频谱动画。本发明，采用插帧补帧的处理逻辑，通过算法提高了帧率，避免刷新频率低于动画标准(一秒24帧)，频谱动画更流畅，降低了动画的卡顿的情况。

Description

一种音频驱动的动画特效的生成方法

技术领域

本发明涉及音频可视化技术领域，具体说是一种音频驱动的动画特效的生成方法。

背景技术

现有的播放器，在播放音频时可同时呈现动画特效以增加用户体验，较为常用的动画特效为频谱动画，现有的频谱动画，在展示界面向用户呈现当前播放中的音频对应的音乐频谱，可以将耳边动听的声音形象化，仿佛眼前可以看到声音一样。但是，呈现频谱动画时，发现部分机型存在动画的卡顿问题，动画不能流畅播放，给用户带来不好的体验，经过初步排查原因，发现是播放器回调频谱数据时数据返回间隔时间过长导致的，因此需要针对这一问题对动画特效进行相应的优化。

公开于该背景技术部分的信息仅仅旨在加深对本发明的总体背景技术的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

发明内容

针对现有技术中存在的缺陷，本发明的目的在于提供一种音频驱动的动画特效的生成方法，采用插帧补帧的处理逻辑，通过算法提高了帧率，避免刷新频率低于动画标准(一秒24帧)，频谱动画更流畅，降低了动画的卡顿的情况。

为达到以上目的，本发明采取的技术方案是：

一种音频驱动的动画特效的生成方法，其特征在于，

当播放音频时，分批次获取当前播放中的音频对应的频谱数据，

将奇数次获取的频谱数据缓存于第一缓存区，

将偶数次获取的频谱数据缓存于第二缓存区；

从第一缓存区开始，交替的从两个缓存区获取缓存的频谱数据，并生成频谱动画；

当从第一缓存区或第二缓存区获取缓存的频谱数据，并生成频谱动画时，进一步判断第二缓存区或第一缓存区中，下一批次的频谱数据是否已经被缓存；

当下一批次的频谱数据已经被缓存，则从第二缓存区或第一缓存区中获取缓存的下一批次的频谱数据，并生成频谱动画；

当下一批次的频谱数据未被缓存，则基于当前缓存的频谱数据，通过插帧补帧的处理逻辑，得到过渡频谱数据，并缓存于第三缓存区；

通知下一批次的频谱数据获取临时改为从第三缓存区获取，并生成频谱动画。

在上述技术方案的基础上，当播放音频时，按128个频谱数据为一批次，分批次获取当前播放中的音频对应的频谱数据。

在上述技术方案的基础上，获取频谱数据的操作通过播放器对音频抽样后返回。

在上述技术方案的基础上，所述播放器默认为ijkMediaPlayer播放器。

在上述技术方案的基础上，所述插帧补帧的处理逻辑，具体步骤如下：

按如下公式计算过渡频谱数据中的128个频谱数据点值，

过渡频谱数据中的第n个点值＝上组频谱数据中的第n个点值-当前频谱数据中的第n个点值*(当前时间-当前频谱数据第一次绘画时间)/(当前频谱数据绘画总时间)+当前频谱数据中的第n个点值，n取值为1-28。

在上述技术方案的基础上，当得到过渡频谱数据中的128个频谱数据点值后，进一步计算128个频谱数据点值的平方均值开方，当计算出的结果小于预设的阈值，则过渡频谱数据中的128个频谱数据点值全部置为0。

在上述技术方案的基础上，所述预设的阈值默认取平方均值开方最大值的百分之五。

在上述技术方案的基础上，预设一最高阈值，当128个频谱数据点值中的某个点值高于最高阈值，则修改该点值为最高阈值。

在上述技术方案的基础上，在生成频谱动画时，运用三阶贝塞尔曲线，在128个频谱数据点值中，基于当前频谱数据点值、之前一个频谱数据点值、之后两个频谱数据点值生成控制点。

在上述技术方案的基础上，当播放音频时，还进一步提取音乐特征矩阵和语音特征矩阵；

所述音乐特征矩阵反映音高信息以及音乐力度信息；

所述语音特征矩阵反映歌词对应的情感信息。

本发明所述的一种音频驱动的动画特效的生成方法，具有以下有益效果：

采用插帧补帧的处理逻辑，通过算法提高了帧率，避免刷新频率低于动画标准(一秒24帧)，频谱动画更流畅，降低了动画的卡顿的情况。

附图说明

本发明有如下附图：

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1本发明所述一种音频驱动的动画特效的生成方法的实施例一的流程图。

具体实施方式

以下结合附图对本发明作进一步详细说明。所述详细说明，为结合本发明的示范性实施例做出的说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

如图1所示，本发明给出了一种音频驱动的动画特效的生成方法，包括以下步骤：

将奇数次获取的频谱数据缓存于第一缓存区，

将偶数次获取的频谱数据缓存于第二缓存区；

在上述技术方案的基础上，当播放音频时，按128个频谱数据为一批次，分批次获取当前播放中的音频对应的频谱数据。即：缓存的每一个批次的频谱数据，其中均包括128个频谱数据点值，一个批次的频谱数据即一个数据数组。

作为可选择的实施方案之一，获取频谱数据的操作通过播放器对音频抽样后返回。

作为可选择的实施方案之一，所述播放器默认为ijkMediaPlayer播放器。

按如下公式计算过渡频谱数据中的128个频谱数据点值，

例如：当前绘画的频谱数据来自于第一缓存区，下一批次的频谱数据未被缓存，则第二缓存区中的数据是上组频谱数据，则需要通过插帧补帧的处理逻辑，得到过渡频谱数据(共需要计算出128个频谱数据点值)，并将过渡频谱数据缓存于第三缓存区，式中所述“过渡频谱数据中的第n个点值”即从第三缓存区获取的频谱数据，式中所述“上组频谱数据中的第n个点值”即从第二缓存区获取的频谱数据，式中所述“当前频谱数据中的第n个点值”即从第一缓存区获取的频谱数据。

这一处理的目的在于过滤极小的数据，经过测试发现，极小的数据绘制出的频谱动画会导致连续频谱动画图案产生粘连，导致频谱动画存在失真，故增加所述阈值滤除影响频谱动画特效的过渡频谱数据。所述预设的阈值默认取平方均值开方最大值的百分之五，此为经验值，经测试频谱动画特效平滑度较佳，无连续频谱动画图案粘连情形，预设的阈值可根据效果自行设定。

这一处理的目的在于防止连续频谱动画中出现尖锐峰值。

所述音乐特征矩阵反映音高信息以及音乐力度信息；

所述语音特征矩阵反映歌词对应的情感信息。

本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

以上所述仅为本发明的较佳实施方式，本发明的保护范围并不以上述实施方式为限，但凡本领域技术人员根据本发明所揭示内容所作的等效修饰或变化，皆应纳入权利要求书中记载的保护范围内。

Claims

1.一种音频驱动的动画特效的生成方法，其特征在于，

将奇数次获取的频谱数据缓存于第一缓存区，

将偶数次获取的频谱数据缓存于第二缓存区；

2.如权利要求1所述的一种音频驱动的动画特效的生成方法，其特征在于，当播放音频时，按128个频谱数据为一批次，分批次获取当前播放中的音频对应的频谱数据。

3.如权利要求2所述的一种音频驱动的动画特效的生成方法，其特征在于，获取频谱数据的操作通过播放器对音频抽样后返回。

4.如权利要求3所述的一种音频驱动的动画特效的生成方法，其特征在于，所述播放器默认为ijkMediaPlayer播放器。

5.如权利要求1所述的一种音频驱动的动画特效的生成方法，其特征在于，所述插帧补帧的处理逻辑，具体步骤如下：

按如下公式计算过渡频谱数据中的128个频谱数据点值，

6.如权利要求5所述的一种音频驱动的动画特效的生成方法，其特征在于，当得到过渡频谱数据中的128个频谱数据点值后，进一步计算128个频谱数据点值的平方均值开方，当计算出的结果小于预设的阈值，则过渡频谱数据中的128个频谱数据点值全部置为0。

7.如权利要求6所述的一种音频驱动的动画特效的生成方法，其特征在于，所述预设的阈值默认取平方均值开方最大值的百分之五。

8.如权利要求5所述的一种音频驱动的动画特效的生成方法，其特征在于，预设一最高阈值，当128个频谱数据点值中的某个点值高于最高阈值，则修改该点值为最高阈值。

9.如权利要求5所述的一种音频驱动的动画特效的生成方法，其特征在于，在生成频谱动画时，运用三阶贝塞尔曲线，在128个频谱数据点值中，基于当前频谱数据点值、之前一个频谱数据点值、之后两个频谱数据点值生成控制点。

10.如权利要求1所述的一种音频驱动的动画特效的生成方法，其特征在于，当播放音频时，还进一步提取音乐特征矩阵和语音特征矩阵；

所述音乐特征矩阵反映音高信息以及音乐力度信息；

所述语音特征矩阵反映歌词对应的情感信息。