CN112885374A - 一种基于频谱分析的声音音准判断方法及系统 - Google Patents
一种基于频谱分析的声音音准判断方法及系统 Download PDFInfo
- Publication number
- CN112885374A CN112885374A CN202110107110.8A CN202110107110A CN112885374A CN 112885374 A CN112885374 A CN 112885374A CN 202110107110 A CN202110107110 A CN 202110107110A CN 112885374 A CN112885374 A CN 112885374A
- Authority
- CN
- China
- Prior art keywords
- tones
- candidate
- frequency
- sound
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010183 spectrum analysis Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000012216 screening Methods 0.000 claims abstract description 7
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 210000000115 thoracic cavity Anatomy 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
本发明公开了一种基于频谱分析的声音音准判断方法,包括以下步骤:收录声音;获取收录声音的频谱分析图像;根据频谱分析图像筛选出候选音调;计算候选音调的平均音强,将候选音调中音强大于平均音强的音调的峰值频率作为候选基音;利用最大公因子算法获取候选基音的特征频率;将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。本发明人声录音音准判断误差仅1.1%,大大提高了声音音准判断的准确性。
Description
技术领域
本发明涉及声音音准分析技术领域,尤其涉及一种基于频谱分析的声音音准判断方法及系统。
背景技术
民族音乐被称为世界语言,而中国的民乐更是丰富多彩。然而非专业人士在练唱民族音乐时,如果没有专业老师指导,很难准确把握音准。目前市场上有一些音准设备,如钢琴调音器和k歌软件等,钢琴调音器只能测试单音是否与设定音高相符,无法显示实际音高,也无法用于练歌;k歌软件提供练歌模式,但也只是循环播放,对民族声乐练习帮助不大。
发明内容
有鉴于此,本发明提供了一种基于频谱分析的声音音准判断方法及系统,用以解决上述背景技术中存在的问题。
一种基于频谱分析的声音音准判断方法,具体包括以下步骤:
S1,收录声音;
S2,获取收录声音的频谱分析图像;
S3,根据频谱分析图像筛选出设定频段的音调,并将筛选出的音调作为候选音调;
S4,计算候选音调的平均音强,将候选音调中音强大于平均音强的音调的峰值频率作为候选基音;
S5,利用最大公因子算法获取候选基音的特征频率;
S6,将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
优选地,还包括步骤S7:根据候选基音的特征频率得到音高。
优选地,步骤S2中获取收录声音的频谱分析图像的具体步骤为:
利用Adobe Audition软件对收录声音进行频谱分析,得到收录声音的频谱分析图像。
优选地,步骤S3中筛选出的候选音调为0-4000Hz频段的音调。
优选地,所述候选基音的特征频率为候选基音的频率f1、f2...fn的最大公约数。
一种基于频谱分析的声音音准判断系统,包括:
录音模块,用于收录声音;
特征提取模块,用于从收录声音中筛选出候选音调,并将候选音调中音强大于平均音强的音调的峰值频率作为候选基音,利用最大公因子算法获取候选基音的特征频率;
音准对比模块,用于将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
优选地,所述平均音强为候选音调的平均音强。
本发明的有益效果是:
本发明的方法利用音强筛选出候选基音,然后利用最大公因子算法,将候选基音的诸多谐振频率的最大公因子作为特征频率,将该特征频率与国际标准频率进行比对,来获取收录声音与国际标准频率的相似度,该方法的人声录音音准判断误差仅1.1%,大大提高了声音音准判断的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的流程图。
具体实施方式
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面通过具体的实施例并结合附图对本申请做进一步的详细描述。
音准判断的核心技术就是音高判断。音高由声音的振动频率决定,频率大则音调高。但是声音的频率存在复杂性,根据其峰值频率的多寡可以分为纯音和复音[3]。若振动频率是单一频率的正弦波,则称为纯音,因此纯音只有单一频率,通过频谱分析可以快速判定其音高。
人声并非简单的纯音,而是有许多不同频率的纯音叠加组成的复音。人声复杂的频谱可能与人体发声机制有关。基音首先由喉部两对声带振动产生,经过人体众多的谐振腔后发出。人体的谐振腔包括喉室、胸腔、鼻腔、头腔等。基音经过这些腔体谐振后,产生基因频率倍数的频率振动,即泛音。歌唱时声音经过的腔体越多,产生的泛音也越多,而泛音的数量、强弱决定了声音的音色。正是这复杂的发声机制导致人声频谱复杂,声音识别困难。
通过将人声与钢琴音音调进行对比可知,两者音调接近。但是不同音色的音所包含的谐振频率不同,如果直接将人声与钢琴音频谱直接对比,会存在很大误差误差。
本发明给出一种基于频谱分析的声音音准判断方法,该方法利用音强筛选出候选基音,然后利用最大公因子算法,将候选基音的诸多谐振频率的最大公因子作为特征频率,将该特征频率与国际标准频率进行比对,来获取收录声音与国际标准频率的相似度,该方法的人声录音音准判断误差仅1.1%,大大提高了声音音准判断的准确性。
具体地,本发明的基于频谱分析的声音音准判断方法,具体包括以下步骤:
S1,收录声音。
S2,获取收录声音的频谱分析图像。
具体地,利用Adobe Audition软件对收录声音进行频谱分析,得到收录声音的频谱分析图像。
S3,根据频谱分析图像筛选出设定频段的音调,并将筛选出的音调作为候选音调。
本实施例中,筛选出的候选音调为0-4000Hz频段的音调。
S4,计算候选音调的平均音强,将候选音调中音强大于平均音强的音调的峰值频率作为候选基音。
假设候选音调中音强大于平均音强的音调有四个,则将这四个音调的峰值频率作为候选基音,可令这四个候选基音为A、B、C、D。
S5,利用最大公因子算法获取候选基音的特征频率,所述候选基音的特征频率为候选基音A、B、C、D的频率fA、fB、fC、fD的最大公约数。
S6,将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
优选地,还包括步骤S7:根据候选基音的特征频率得到音高。
本发明的基于频谱分析的声音音准判断系统,包括录音模块、特征提取模块和音准对比模块。
录音模块,用于收录声音;
特征提取模块,用于从收录声音中筛选出候选音调,并将候选音调中音强大于平均音强的音调的峰值频率作为候选基音,利用最大公因子算法获取候选基音的特征频率;
音准对比模块,用于将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (7)
1.一种基于频谱分析的声音音准判断方法,其特征在于,具体包括以下步骤:
S1,收录声音;
S2,获取收录声音的频谱分析图像;
S3,根据频谱分析图像筛选出设定频段的音调,并将筛选出的音调作为候选音调;
S4,计算候选音调的平均音强,将候选音调中音强大于平均音强的音调的峰值频率作为候选基音;
S5,利用最大公因子算法获取候选基音的特征频率;
S6,将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
2.根据权利要求1所述的基于频谱分析的声音音准判断方法,其特征在于,还包括步骤S7:根据候选基音的特征频率得到音高。
3.根据权利要求1所述的基于频谱分析的声音音准判断方法,其特征在于,步骤S2中获取收录声音的频谱分析图像的具体步骤为:
利用Adobe Audition软件对收录声音进行频谱分析,得到收录声音的频谱分析图像。
4.根据权利要求1所述的基于频谱分析的声音音准判断方法,其特征在于,步骤S3中筛选出的候选音调为0-4000Hz频段的音调。
5.根据权利要求1所述的基于频谱分析的声音音准判断方法,其特征在于,所述候选基音的特征频率为候选基音的频率f1、f2...fn的最大公约数。
6.一种基于频谱分析的声音音准判断系统,其特征在于,包括:
录音模块,用于收录声音;
特征提取模块,用于从收录声音中筛选出候选音调,并将候选音调中音强大于平均音强的音调的峰值频率作为候选基音,利用最大公因子算法获取候选基音的特征频率;
音准对比模块,用于将候选基音的特征频率与国际标准频率进行比对,获取收录声音与国际标准频率的相似度。
7.根据权利要求6所述的基于频谱分析的声音音准判断方法,其特征在于,所述平均音强为候选音调的平均音强。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110107110.8A CN112885374A (zh) | 2021-01-27 | 2021-01-27 | 一种基于频谱分析的声音音准判断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110107110.8A CN112885374A (zh) | 2021-01-27 | 2021-01-27 | 一种基于频谱分析的声音音准判断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112885374A true CN112885374A (zh) | 2021-06-01 |
Family
ID=76052452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110107110.8A Pending CN112885374A (zh) | 2021-01-27 | 2021-01-27 | 一种基于频谱分析的声音音准判断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112885374A (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101625851A (zh) * | 2009-07-31 | 2010-01-13 | 肖智健 | 对所测乐音的频谱曲线的显示方法和设备及将其计算机程序录入计算机可读存储介质的方法 |
CN101645268A (zh) * | 2009-08-19 | 2010-02-10 | 李宋 | 一种演唱和演奏的计算机实时分析系统 |
US20110268284A1 (en) * | 2010-04-07 | 2011-11-03 | Yamaha Corporation | Audio analysis apparatus |
CN103794222A (zh) * | 2012-10-31 | 2014-05-14 | 展讯通信(上海)有限公司 | 语音基音频率检测方法和装置 |
CN103824555A (zh) * | 2012-11-19 | 2014-05-28 | 腾讯科技(深圳)有限公司 | 音频段提取方法及提取装置 |
US20150043737A1 (en) * | 2012-04-18 | 2015-02-12 | Sony Corporation | Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program |
CN105118523A (zh) * | 2015-07-13 | 2015-12-02 | 努比亚技术有限公司 | 音频处理方法和装置 |
CN106157976A (zh) * | 2015-04-10 | 2016-11-23 | 科大讯飞股份有限公司 | 一种唱歌评测方法及系统 |
CN106504767A (zh) * | 2016-10-12 | 2017-03-15 | 耿梁宸 | 借助声音波形的乐器调音和歌曲音高判断方法 |
CN106935248A (zh) * | 2017-02-14 | 2017-07-07 | 广州孩教圈信息科技股份有限公司 | 一种语音相似度检测方法及装置 |
CN107274913A (zh) * | 2017-05-26 | 2017-10-20 | 广东美的厨房电器制造有限公司 | 一种声音识别方法及装置 |
CN107958672A (zh) * | 2017-12-12 | 2018-04-24 | 广州酷狗计算机科技有限公司 | 获取基音波形数据的方法和装置 |
CN109087669A (zh) * | 2018-10-23 | 2018-12-25 | 腾讯科技(深圳)有限公司 | 音频相似度检测方法、装置、存储介质及计算机设备 |
CN109448754A (zh) * | 2018-09-07 | 2019-03-08 | 南京光辉互动网络科技股份有限公司 | 一种多维度演唱评分系统 |
CN110910895A (zh) * | 2019-08-29 | 2020-03-24 | 腾讯科技(深圳)有限公司 | 一种声音处理的方法、装置、设备和介质 |
CN111613241A (zh) * | 2020-05-22 | 2020-09-01 | 厦门理工学院 | 一种高精度高稳定度的弦乐器基波频率检测方法 |
-
2021
- 2021-01-27 CN CN202110107110.8A patent/CN112885374A/zh active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101625851A (zh) * | 2009-07-31 | 2010-01-13 | 肖智健 | 对所测乐音的频谱曲线的显示方法和设备及将其计算机程序录入计算机可读存储介质的方法 |
CN101645268A (zh) * | 2009-08-19 | 2010-02-10 | 李宋 | 一种演唱和演奏的计算机实时分析系统 |
US20110268284A1 (en) * | 2010-04-07 | 2011-11-03 | Yamaha Corporation | Audio analysis apparatus |
US20150043737A1 (en) * | 2012-04-18 | 2015-02-12 | Sony Corporation | Sound detecting apparatus, sound detecting method, sound feature value detecting apparatus, sound feature value detecting method, sound section detecting apparatus, sound section detecting method, and program |
CN103794222A (zh) * | 2012-10-31 | 2014-05-14 | 展讯通信(上海)有限公司 | 语音基音频率检测方法和装置 |
CN103824555A (zh) * | 2012-11-19 | 2014-05-28 | 腾讯科技(深圳)有限公司 | 音频段提取方法及提取装置 |
CN106157976A (zh) * | 2015-04-10 | 2016-11-23 | 科大讯飞股份有限公司 | 一种唱歌评测方法及系统 |
CN105118523A (zh) * | 2015-07-13 | 2015-12-02 | 努比亚技术有限公司 | 音频处理方法和装置 |
CN106504767A (zh) * | 2016-10-12 | 2017-03-15 | 耿梁宸 | 借助声音波形的乐器调音和歌曲音高判断方法 |
CN106935248A (zh) * | 2017-02-14 | 2017-07-07 | 广州孩教圈信息科技股份有限公司 | 一种语音相似度检测方法及装置 |
CN107274913A (zh) * | 2017-05-26 | 2017-10-20 | 广东美的厨房电器制造有限公司 | 一种声音识别方法及装置 |
CN107958672A (zh) * | 2017-12-12 | 2018-04-24 | 广州酷狗计算机科技有限公司 | 获取基音波形数据的方法和装置 |
CN109448754A (zh) * | 2018-09-07 | 2019-03-08 | 南京光辉互动网络科技股份有限公司 | 一种多维度演唱评分系统 |
CN109087669A (zh) * | 2018-10-23 | 2018-12-25 | 腾讯科技(深圳)有限公司 | 音频相似度检测方法、装置、存储介质及计算机设备 |
CN110910895A (zh) * | 2019-08-29 | 2020-03-24 | 腾讯科技(深圳)有限公司 | 一种声音处理的方法、装置、设备和介质 |
CN111613241A (zh) * | 2020-05-22 | 2020-09-01 | 厦门理工学院 | 一种高精度高稳定度的弦乐器基波频率检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021218138A1 (zh) | 歌曲合成方法、装置、设备及存储介质 | |
Salamon et al. | Melody extraction from polyphonic music signals using pitch contour characteristics | |
US6930236B2 (en) | Apparatus for analyzing music using sounds of instruments | |
US6798886B1 (en) | Method of signal shredding | |
Bowling et al. | Major and minor music compared to excited and subdued speech | |
US20230402026A1 (en) | Audio processing method and apparatus, and device and medium | |
US9804818B2 (en) | Musical analysis platform | |
JP4613923B2 (ja) | 楽音処理装置およびプログラム | |
JP4205824B2 (ja) | 歌唱評価装置およびカラオケ装置 | |
CN109979488A (zh) | 基于重音分析的人声转乐谱系统 | |
WO2023040332A1 (zh) | 一种曲谱生成方法、电子设备及可读存储介质 | |
Su et al. | Sparse modeling of magnitude and phase-derived spectra for playing technique classification | |
Stegemöller et al. | Music training and vocal production of speech and song | |
JPH09251044A (ja) | 周波数分析方法及び装置並びにこれを用いた複数ピッチ周波数検出方法及び装置 | |
Grosche et al. | Automatic transcription of recorded music | |
Lerch | Software-based extraction of objective parameters from music performances | |
JPH10247099A (ja) | 音声信号の符号化方法および音声の記録再生装置 | |
CN112885374A (zh) | 一种基于频谱分析的声音音准判断方法及系统 | |
CN113823270B (zh) | 节奏评分的确定方法、介质、装置和计算设备 | |
Marolt | Automatic transcription of bell chiming recordings | |
Sundberg | The acoustics of different genres of singing | |
Kirkov et al. | Formant analysis of traditional bulgarian singing from rhodope region | |
JP5810947B2 (ja) | 発声区間特定装置、音声パラメータ生成装置、及びプログラム | |
JP5585320B2 (ja) | 歌唱音声評価装置 | |
JP5413380B2 (ja) | 楽曲データ修正装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210601 |