CN112885374A

CN112885374A - 一种基于频谱分析的声音音准判断方法及系统

Info

Publication number: CN112885374A
Application number: CN202110107110.8A
Authority: CN
Inventors: 吴怡然
Original assignee: Individual
Current assignee: Individual
Priority date: 2021-01-27
Filing date: 2021-01-27
Publication date: 2021-06-01

Abstract

本发明公开了一种基于频谱分析的声音音准判断方法，包括以下步骤：收录声音；获取收录声音的频谱分析图像；根据频谱分析图像筛选出候选音调；计算候选音调的平均音强，将候选音调中音强大于平均音强的音调的峰值频率作为候选基音；利用最大公因子算法获取候选基音的特征频率；将候选基音的特征频率与国际标准频率进行比对，获取收录声音与国际标准频率的相似度。本发明人声录音音准判断误差仅1.1％，大大提高了声音音准判断的准确性。

Description

一种基于频谱分析的声音音准判断方法及系统

技术领域

本发明涉及声音音准分析技术领域，尤其涉及一种基于频谱分析的声音音准判断方法及系统。

背景技术

民族音乐被称为世界语言，而中国的民乐更是丰富多彩。然而非专业人士在练唱民族音乐时，如果没有专业老师指导，很难准确把握音准。目前市场上有一些音准设备，如钢琴调音器和k歌软件等，钢琴调音器只能测试单音是否与设定音高相符，无法显示实际音高，也无法用于练歌；k歌软件提供练歌模式，但也只是循环播放，对民族声乐练习帮助不大。

发明内容

有鉴于此，本发明提供了一种基于频谱分析的声音音准判断方法及系统，用以解决上述背景技术中存在的问题。

一种基于频谱分析的声音音准判断方法，具体包括以下步骤：

S1，收录声音；

S2，获取收录声音的频谱分析图像；

S3，根据频谱分析图像筛选出设定频段的音调，并将筛选出的音调作为候选音调；

S4，计算候选音调的平均音强，将候选音调中音强大于平均音强的音调的峰值频率作为候选基音；

S5，利用最大公因子算法获取候选基音的特征频率；

S6，将候选基音的特征频率与国际标准频率进行比对，获取收录声音与国际标准频率的相似度。

优选地，还包括步骤S7：根据候选基音的特征频率得到音高。

优选地，步骤S2中获取收录声音的频谱分析图像的具体步骤为：

利用Adobe Audition软件对收录声音进行频谱分析，得到收录声音的频谱分析图像。

优选地，步骤S3中筛选出的候选音调为0-4000Hz频段的音调。

优选地，所述候选基音的特征频率为候选基音的频率f₁、f₂...f_n的最大公约数。

一种基于频谱分析的声音音准判断系统，包括：

录音模块，用于收录声音；

特征提取模块，用于从收录声音中筛选出候选音调，并将候选音调中音强大于平均音强的音调的峰值频率作为候选基音，利用最大公因子算法获取候选基音的特征频率；

音准对比模块，用于将候选基音的特征频率与国际标准频率进行比对，获取收录声音与国际标准频率的相似度。

优选地，所述平均音强为候选音调的平均音强。

本发明的有益效果是：

本发明的方法利用音强筛选出候选基音，然后利用最大公因子算法，将候选基音的诸多谐振频率的最大公因子作为特征频率，将该特征频率与国际标准频率进行比对，来获取收录声音与国际标准频率的相似度，该方法的人声录音音准判断误差仅1.1％，大大提高了声音音准判断的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明的流程图。

具体实施方式

为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。

应当明确，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

下面通过具体的实施例并结合附图对本申请做进一步的详细描述。

音准判断的核心技术就是音高判断。音高由声音的振动频率决定，频率大则音调高。但是声音的频率存在复杂性，根据其峰值频率的多寡可以分为纯音和复音^[3]。若振动频率是单一频率的正弦波，则称为纯音，因此纯音只有单一频率，通过频谱分析可以快速判定其音高。

人声并非简单的纯音，而是有许多不同频率的纯音叠加组成的复音。人声复杂的频谱可能与人体发声机制有关。基音首先由喉部两对声带振动产生，经过人体众多的谐振腔后发出。人体的谐振腔包括喉室、胸腔、鼻腔、头腔等。基音经过这些腔体谐振后，产生基因频率倍数的频率振动，即泛音。歌唱时声音经过的腔体越多，产生的泛音也越多，而泛音的数量、强弱决定了声音的音色。正是这复杂的发声机制导致人声频谱复杂，声音识别困难。

通过将人声与钢琴音音调进行对比可知，两者音调接近。但是不同音色的音所包含的谐振频率不同，如果直接将人声与钢琴音频谱直接对比，会存在很大误差误差。

本发明给出一种基于频谱分析的声音音准判断方法，该方法利用音强筛选出候选基音，然后利用最大公因子算法，将候选基音的诸多谐振频率的最大公因子作为特征频率，将该特征频率与国际标准频率进行比对，来获取收录声音与国际标准频率的相似度，该方法的人声录音音准判断误差仅1.1％，大大提高了声音音准判断的准确性。

具体地，本发明的基于频谱分析的声音音准判断方法，具体包括以下步骤：

S1，收录声音。

S2，获取收录声音的频谱分析图像。

具体地，利用Adobe Audition软件对收录声音进行频谱分析，得到收录声音的频谱分析图像。

S3，根据频谱分析图像筛选出设定频段的音调，并将筛选出的音调作为候选音调。

本实施例中，筛选出的候选音调为0-4000Hz频段的音调。

S4，计算候选音调的平均音强，将候选音调中音强大于平均音强的音调的峰值频率作为候选基音。

假设候选音调中音强大于平均音强的音调有四个，则将这四个音调的峰值频率作为候选基音，可令这四个候选基音为A、B、C、D。

S5，利用最大公因子算法获取候选基音的特征频率，所述候选基音的特征频率为候选基音A、B、C、D的频率f_A、f_B、f_C、f_D的最大公约数。

本发明的基于频谱分析的声音音准判断系统，包括录音模块、特征提取模块和音准对比模块。

录音模块，用于收录声音；

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种基于频谱分析的声音音准判断方法，其特征在于，具体包括以下步骤：

S1，收录声音；

S2，获取收录声音的频谱分析图像；

S5，利用最大公因子算法获取候选基音的特征频率；

2.根据权利要求1所述的基于频谱分析的声音音准判断方法，其特征在于，还包括步骤S7：根据候选基音的特征频率得到音高。

3.根据权利要求1所述的基于频谱分析的声音音准判断方法，其特征在于，步骤S2中获取收录声音的频谱分析图像的具体步骤为：

4.根据权利要求1所述的基于频谱分析的声音音准判断方法，其特征在于，步骤S3中筛选出的候选音调为0-4000Hz频段的音调。

5.根据权利要求1所述的基于频谱分析的声音音准判断方法，其特征在于，所述候选基音的特征频率为候选基音的频率f₁、f₂...f_n的最大公约数。

6.一种基于频谱分析的声音音准判断系统，其特征在于，包括：

录音模块，用于收录声音；

7.根据权利要求6所述的基于频谱分析的声音音准判断方法，其特征在于，所述平均音强为候选音调的平均音强。