CN112885374A - 一种基于频谱分析的声音音准判断方法及系统 - Google Patents

一种基于频谱分析的声音音准判断方法及系统 Download PDF

Info

Publication number
CN112885374A
CN112885374A CN202110107110.8A CN202110107110A CN112885374A CN 112885374 A CN112885374 A CN 112885374A CN 202110107110 A CN202110107110 A CN 202110107110A CN 112885374 A CN112885374 A CN 112885374A
Authority
CN
China
Prior art keywords
tones
candidate
frequency
sound
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110107110.8A
Other languages
English (en)
Inventor
吴怡然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110107110.8A priority Critical patent/CN112885374A/zh
Publication of CN112885374A publication Critical patent/CN112885374A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本发明公开了一种基于频谱分析的声音音准判断方法,包括以下步骤:收录声音;获取收录声音的频谱分析图像;根据频谱分析图像筛选出候选音调;计算候选音调的平均音强,将候选音调中音强大于平均音强的音调的峰值频率作为候选基音;利用最大公因子算法获取候选基音的特征频率;将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。本发明人声录音音准判断误差仅1.1%,大大提高了声音音准判断的准确性。

Description

一种基于频谱分析的声音音准判断方法及系统
技术领域
本发明涉及声音音准分析技术领域,尤其涉及一种基于频谱分析的声音音准判断方法及系统。
背景技术
民族音乐被称为世界语言,而中国的民乐更是丰富多彩。然而非专业人士在练唱民族音乐时,如果没有专业老师指导,很难准确把握音准。目前市场上有一些音准设备,如钢琴调音器和k歌软件等,钢琴调音器只能测试单音是否与设定音高相符,无法显示实际音高,也无法用于练歌;k歌软件提供练歌模式,但也只是循环播放,对民族声乐练习帮助不大。
发明内容
有鉴于此,本发明提供了一种基于频谱分析的声音音准判断方法及系统,用以解决上述背景技术中存在的问题。
一种基于频谱分析的声音音准判断方法,具体包括以下步骤:
S1,收录声音;
S2,获取收录声音的频谱分析图像;
S3,根据频谱分析图像筛选出设定频段的音调,并将筛选出的音调作为候选音调;
S4,计算候选音调的平均音强,将候选音调中音强大于平均音强的音调的峰值频率作为候选基音;
S5,利用最大公因子算法获取候选基音的特征频率;
S6,将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
优选地,还包括步骤S7:根据候选基音的特征频率得到音高。
优选地,步骤S2中获取收录声音的频谱分析图像的具体步骤为:
利用Adobe Audition软件对收录声音进行频谱分析,得到收录声音的频谱分析图像。
优选地,步骤S3中筛选出的候选音调为0-4000Hz频段的音调。
优选地,所述候选基音的特征频率为候选基音的频率f1、f2...fn的最大公约数。
一种基于频谱分析的声音音准判断系统,包括:
录音模块,用于收录声音;
特征提取模块,用于从收录声音中筛选出候选音调,并将候选音调中音强大于平均音强的音调的峰值频率作为候选基音,利用最大公因子算法获取候选基音的特征频率;
音准对比模块,用于将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
优选地,所述平均音强为候选音调的平均音强。
本发明的有益效果是:
本发明的方法利用音强筛选出候选基音,然后利用最大公因子算法,将候选基音的诸多谐振频率的最大公因子作为特征频率,将该特征频率与国际标准频率进行比对,来获取收录声音与国际标准频率的相似度,该方法的人声录音音准判断误差仅1.1%,大大提高了声音音准判断的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的流程图。
具体实施方式
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面通过具体的实施例并结合附图对本申请做进一步的详细描述。
音准判断的核心技术就是音高判断。音高由声音的振动频率决定,频率大则音调高。但是声音的频率存在复杂性,根据其峰值频率的多寡可以分为纯音和复音[3]。若振动频率是单一频率的正弦波,则称为纯音,因此纯音只有单一频率,通过频谱分析可以快速判定其音高。
人声并非简单的纯音,而是有许多不同频率的纯音叠加组成的复音。人声复杂的频谱可能与人体发声机制有关。基音首先由喉部两对声带振动产生,经过人体众多的谐振腔后发出。人体的谐振腔包括喉室、胸腔、鼻腔、头腔等。基音经过这些腔体谐振后,产生基因频率倍数的频率振动,即泛音。歌唱时声音经过的腔体越多,产生的泛音也越多,而泛音的数量、强弱决定了声音的音色。正是这复杂的发声机制导致人声频谱复杂,声音识别困难。
通过将人声与钢琴音音调进行对比可知,两者音调接近。但是不同音色的音所包含的谐振频率不同,如果直接将人声与钢琴音频谱直接对比,会存在很大误差误差。
本发明给出一种基于频谱分析的声音音准判断方法,该方法利用音强筛选出候选基音,然后利用最大公因子算法,将候选基音的诸多谐振频率的最大公因子作为特征频率,将该特征频率与国际标准频率进行比对,来获取收录声音与国际标准频率的相似度,该方法的人声录音音准判断误差仅1.1%,大大提高了声音音准判断的准确性。
具体地,本发明的基于频谱分析的声音音准判断方法,具体包括以下步骤:
S1,收录声音。
S2,获取收录声音的频谱分析图像。
具体地,利用Adobe Audition软件对收录声音进行频谱分析,得到收录声音的频谱分析图像。
S3,根据频谱分析图像筛选出设定频段的音调,并将筛选出的音调作为候选音调。
本实施例中,筛选出的候选音调为0-4000Hz频段的音调。
S4,计算候选音调的平均音强,将候选音调中音强大于平均音强的音调的峰值频率作为候选基音。
假设候选音调中音强大于平均音强的音调有四个,则将这四个音调的峰值频率作为候选基音,可令这四个候选基音为A、B、C、D。
S5,利用最大公因子算法获取候选基音的特征频率,所述候选基音的特征频率为候选基音A、B、C、D的频率fA、fB、fC、fD的最大公约数。
S6,将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
优选地,还包括步骤S7:根据候选基音的特征频率得到音高。
本发明的基于频谱分析的声音音准判断系统,包括录音模块、特征提取模块和音准对比模块。
录音模块,用于收录声音;
特征提取模块,用于从收录声音中筛选出候选音调,并将候选音调中音强大于平均音强的音调的峰值频率作为候选基音,利用最大公因子算法获取候选基音的特征频率;
音准对比模块,用于将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (7)

1.一种基于频谱分析的声音音准判断方法,其特征在于,具体包括以下步骤:
S1,收录声音;
S2,获取收录声音的频谱分析图像;
S3,根据频谱分析图像筛选出设定频段的音调,并将筛选出的音调作为候选音调;
S4,计算候选音调的平均音强,将候选音调中音强大于平均音强的音调的峰值频率作为候选基音;
S5,利用最大公因子算法获取候选基音的特征频率;
S6,将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
2.根据权利要求1所述的基于频谱分析的声音音准判断方法,其特征在于,还包括步骤S7:根据候选基音的特征频率得到音高。
3.根据权利要求1所述的基于频谱分析的声音音准判断方法,其特征在于,步骤S2中获取收录声音的频谱分析图像的具体步骤为:
利用Adobe Audition软件对收录声音进行频谱分析,得到收录声音的频谱分析图像。
4.根据权利要求1所述的基于频谱分析的声音音准判断方法,其特征在于,步骤S3中筛选出的候选音调为0-4000Hz频段的音调。
5.根据权利要求1所述的基于频谱分析的声音音准判断方法,其特征在于,所述候选基音的特征频率为候选基音的频率f1、f2...fn的最大公约数。
6.一种基于频谱分析的声音音准判断系统,其特征在于,包括:
录音模块,用于收录声音;
特征提取模块,用于从收录声音中筛选出候选音调,并将候选音调中音强大于平均音强的音调的峰值频率作为候选基音,利用最大公因子算法获取候选基音的特征频率;
音准对比模块,用于将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
7.根据权利要求6所述的基于频谱分析的声音音准判断方法,其特征在于,所述平均音强为候选音调的平均音强。
CN202110107110.8A 2021-01-27 2021-01-27 一种基于频谱分析的声音音准判断方法及系统 Pending CN112885374A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110107110.8A CN112885374A (zh) 2021-01-27 2021-01-27 一种基于频谱分析的声音音准判断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110107110.8A CN112885374A (zh) 2021-01-27 2021-01-27 一种基于频谱分析的声音音准判断方法及系统

Publications (1)

Publication Number Publication Date
CN112885374A true CN112885374A (zh) 2021-06-01

Family

ID=76052452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110107110.8A Pending CN112885374A (zh) 2021-01-27 2021-01-27 一种基于频谱分析的声音音准判断方法及系统

Country Status (1)

Country Link
CN (1) CN112885374A (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625851A (zh) * 2009-07-31 2010-01-13 肖智健 对所测乐音的频谱曲线的显示方法和设备及将其计算机程序录入计算机可读存储介质的方法
CN101645268A (zh) * 2009-08-19 2010-02-10 李宋 一种演唱和演奏的计算机实时分析系统
US20110268284A1 (en) * 2010-04-07 2011-11-03 Yamaha Corporation Audio analysis apparatus
CN103794222A (zh) * 2012-10-31 2014-05-14 展讯通信(上海)有限公司 语音基音频率检测方法和装置
CN103824555A (zh) * 2012-11-19 2014-05-28 腾讯科技(深圳)有限公司 音频段提取方法及提取装置
US20150043737A1 (en) * 2012-04-18 2015-02-12 Sony Corporation Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program
CN105118523A (zh) * 2015-07-13 2015-12-02 努比亚技术有限公司 音频处理方法和装置
CN106157976A (zh) * 2015-04-10 2016-11-23 科大讯飞股份有限公司 一种唱歌评测方法及系统
CN106504767A (zh) * 2016-10-12 2017-03-15 耿梁宸 借助声音波形的乐器调音和歌曲音高判断方法
CN106935248A (zh) * 2017-02-14 2017-07-07 广州孩教圈信息科技股份有限公司 一种语音相似度检测方法及装置
CN107274913A (zh) * 2017-05-26 2017-10-20 广东美的厨房电器制造有限公司 一种声音识别方法及装置
CN107958672A (zh) * 2017-12-12 2018-04-24 广州酷狗计算机科技有限公司 获取基音波形数据的方法和装置
CN109087669A (zh) * 2018-10-23 2018-12-25 腾讯科技(深圳)有限公司 音频相似度检测方法、装置、存储介质及计算机设备
CN109448754A (zh) * 2018-09-07 2019-03-08 南京光辉互动网络科技股份有限公司 一种多维度演唱评分系统
CN110910895A (zh) * 2019-08-29 2020-03-24 腾讯科技(深圳)有限公司 一种声音处理的方法、装置、设备和介质
CN111613241A (zh) * 2020-05-22 2020-09-01 厦门理工学院 一种高精度高稳定度的弦乐器基波频率检测方法

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625851A (zh) * 2009-07-31 2010-01-13 肖智健 对所测乐音的频谱曲线的显示方法和设备及将其计算机程序录入计算机可读存储介质的方法
CN101645268A (zh) * 2009-08-19 2010-02-10 李宋 一种演唱和演奏的计算机实时分析系统
US20110268284A1 (en) * 2010-04-07 2011-11-03 Yamaha Corporation Audio analysis apparatus
US20150043737A1 (en) * 2012-04-18 2015-02-12 Sony Corporation Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program
CN103794222A (zh) * 2012-10-31 2014-05-14 展讯通信(上海)有限公司 语音基音频率检测方法和装置
CN103824555A (zh) * 2012-11-19 2014-05-28 腾讯科技(深圳)有限公司 音频段提取方法及提取装置
CN106157976A (zh) * 2015-04-10 2016-11-23 科大讯飞股份有限公司 一种唱歌评测方法及系统
CN105118523A (zh) * 2015-07-13 2015-12-02 努比亚技术有限公司 音频处理方法和装置
CN106504767A (zh) * 2016-10-12 2017-03-15 耿梁宸 借助声音波形的乐器调音和歌曲音高判断方法
CN106935248A (zh) * 2017-02-14 2017-07-07 广州孩教圈信息科技股份有限公司 一种语音相似度检测方法及装置
CN107274913A (zh) * 2017-05-26 2017-10-20 广东美的厨房电器制造有限公司 一种声音识别方法及装置
CN107958672A (zh) * 2017-12-12 2018-04-24 广州酷狗计算机科技有限公司 获取基音波形数据的方法和装置
CN109448754A (zh) * 2018-09-07 2019-03-08 南京光辉互动网络科技股份有限公司 一种多维度演唱评分系统
CN109087669A (zh) * 2018-10-23 2018-12-25 腾讯科技(深圳)有限公司 音频相似度检测方法、装置、存储介质及计算机设备
CN110910895A (zh) * 2019-08-29 2020-03-24 腾讯科技(深圳)有限公司 一种声音处理的方法、装置、设备和介质
CN111613241A (zh) * 2020-05-22 2020-09-01 厦门理工学院 一种高精度高稳定度的弦乐器基波频率检测方法

Similar Documents

Publication Publication Date Title
WO2021218138A1 (zh) 歌曲合成方法、装置、设备及存储介质
Salamon et al. Melody extraction from polyphonic music signals using pitch contour characteristics
US6930236B2 (en) Apparatus for analyzing music using sounds of instruments
US6798886B1 (en) Method of signal shredding
Bowling et al. Major and minor music compared to excited and subdued speech
US20230402026A1 (en) Audio processing method and apparatus, and device and medium
US9804818B2 (en) Musical analysis platform
JP4613923B2 (ja) 楽音処理装置およびプログラム
JP4205824B2 (ja) 歌唱評価装置およびカラオケ装置
CN109979488A (zh) 基于重音分析的人声转乐谱系统
WO2023040332A1 (zh) 一种曲谱生成方法、电子设备及可读存储介质
Su et al. Sparse modeling of magnitude and phase-derived spectra for playing technique classification
Stegemöller et al. Music training and vocal production of speech and song
JPH09251044A (ja) 周波数分析方法及び装置並びにこれを用いた複数ピッチ周波数検出方法及び装置
Grosche et al. Automatic transcription of recorded music
Lerch Software-based extraction of objective parameters from music performances
JPH10247099A (ja) 音声信号の符号化方法および音声の記録再生装置
CN112885374A (zh) 一种基于频谱分析的声音音准判断方法及系统
CN113823270B (zh) 节奏评分的确定方法、介质、装置和计算设备
Marolt Automatic transcription of bell chiming recordings
Sundberg The acoustics of different genres of singing
Kirkov et al. Formant analysis of traditional bulgarian singing from rhodope region
JP5810947B2 (ja) 発声区間特定装置、音声パラメータ生成装置、及びプログラム
JP5585320B2 (ja) 歌唱音声評価装置
JP5413380B2 (ja) 楽曲データ修正装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210601