CN108198575A - 一种基于语谱切分的中国民族声乐作品演唱的评测系统 - Google Patents
一种基于语谱切分的中国民族声乐作品演唱的评测系统 Download PDFInfo
- Publication number
- CN108198575A CN108198575A CN201711499529.2A CN201711499529A CN108198575A CN 108198575 A CN108198575 A CN 108198575A CN 201711499529 A CN201711499529 A CN 201711499529A CN 108198575 A CN108198575 A CN 108198575A
- Authority
- CN
- China
- Prior art keywords
- module
- language
- singing
- dialect
- sung
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 25
- 230000001755 vocal effect Effects 0.000 title claims abstract description 21
- 230000011218 segmentation Effects 0.000 title claims abstract description 13
- 238000011156 evaluation Methods 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 241001672694 Citrus reticulata Species 0.000 claims abstract description 6
- 238000006243 chemical reaction Methods 0.000 claims abstract description 3
- 230000033764 rhythmic process Effects 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 abstract description 8
- 230000006870 function Effects 0.000 abstract description 3
- 238000000034 method Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/091—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for performance evaluation, i.e. judging, grading or scoring the musical qualities or faithfulness of a performance, e.g. with respect to pitch, tempo or other timings of a reference performance
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明公开了一种基于语谱切分的中国民族声乐作品演唱的评测系统,包括演唱输入模块、语谱提取模块、演唱评分模块、词曲数据库、少数民族语言及方言转换模块、特征提取模块、演唱评价模块和分数输出模块,所述演唱输入模块、语谱提取模块、演唱评分模块依次连接,所述词曲数据库、少数民族语言及方言转换模块、特征提取模块、演唱评价模块依次连接,所述演唱评价模块、演唱评分模块和分数输出模块依次连接。本发明具有少数民族语言以及方言和普通话转换的功能,并且能实时得出测试的分数,具有准确率高特点,适合推广应用。
Description
技术领域
本发明涉及唱歌领域的语音信号处理系统,具体地说,涉及一种基于语谱切分的中国民族声乐作品演唱的评测系统。
背景技术
目前,在自动唱歌评测系统方面主要有以下几种由简单到复杂的技术方案:
1)、仅考察用户的发音时间和音量:通过比较测试数据帧能量和原唱数据帧能量,将比较得到的一致性程度量化成评分分数,如专利号为9610613.4的发明专利“卡拉OK计分的方法和系统”所记载的评测方法。这种做法只是通过考察用户的音量高低和原唱的音量高低来判断唱歌好坏,而不是分析用户唱歌时的音高、节奏等反映唱歌水平的信息,评分准则与人工评分的考量因素不一致。
2)、仅考察用户唱歌时的音高偏差程度:也即主要考察用户唱歌数据的基频曲线和标准的基频曲线之间的差异程度,这种评测方法通过比较标准基频曲线和唱歌数据基频曲线之间的误差面积,来评价唱歌数据的好坏;误差面积值越大,用户唱歌数据得分越低,反之,则用户唱歌数据得分越高。实际评测时,通过误差面积来评价唱歌数据的好坏存在相当的问题,比如当音高走势相同时,如果用户唱歌的节奏比标准的节奏超前或者滞后,则自动评分系统给出的分数就会很低,也就是说,即便用户的音高与标准的音高走势完全一致,由于用户的音高与标准的音高在时间上的不一致性,用户所得的评分也会较低;用户唱歌的节奏显然比标准的节奏滞后,此时即便用户的音高与标准的音高走势完全一致,用户的评分也会很低。自动评分系统只有有效判断出用户的音高与标准的音高在时间上的不一致性,并进行有效处理,才能得到比较合理的打分结果。
3)、同时考察音高和节奏上的偏差:针对2)中存在的仅考察音高评分导致的不合理性,有人提出基频的动态时间规整(DTW:DynamicTimeWarping)算法,以此来改善测试基频和标准基频之间时间上的对应关系。动态时间规划算法的基本思想是将时间的规整和距离测度规整结合在一起的一种非线性规整技术,通过在允许的时间规整范围内寻找距离测度最小的时间上的规整方式,进而确定输入信号和模板在时间上的对应关系,在一定程度上克服了标准基频和测试基频在时间上不严格对齐时带来的干扰。然而由于这种算法忽略了唱歌数据中的歌词信息而仅仅考虑了基频的相似程度,没有充分利用唱歌数据的信息,使得标准基频和测试基频对齐的准确程度不高,从而导致了评分效果不尽理想。
中国民族声乐是以目前我国音乐院校中民族声乐专业为代表的专业领域,既不同于民歌、说唱、戏曲的演唱,又在继承并发扬了这些传统演唱艺术精华与特点的基础上,借鉴、吸收西欧美声唱法的歌唱理论和优点而形成的独树一帜的,具有科学性、民族性、艺术性和时代精神特征的新民族歌唱艺术。不同民族的不同语言,是声乐艺术不同风格的主要因素。它受到语音、语体、语境、语势、音节以及词素、词汇和词义内部系统的关系等多种因素制约。因此,各民族的不同语言特征,便产生了不同声乐风格色彩。民族声乐风格的地域性体现了共同地域、共同经济生活,以及表现于共同地域文化的共同心理素质和共同审美情趣。在56个民族中,汉族人口最多。汉语是主要语言,但是由于汉语分布广泛,在各地域中形成一系列地方变体——方言。
目前,现有技术中急需一种基于语谱切分的中国民族声乐作品演唱的评测系统。
发明内容
为了克服现有技术中存在的缺陷,本发明提供一种基于语谱切分的中国民族声乐作品演唱的评测系统,该系统具有少数民族语言以及方言和普通话转换的功能,并且能实时得出测试的分数,具有准确率高特点,适合推广应用。
其技术方案如下:
一种基于语谱切分的中国民族声乐作品演唱的评测系统,包括演唱输入模块、语谱提取模块、演唱评分模块、词曲数据库、少数民族语言及方言转换模块、特征提取模块、演唱评价模块和分数输出模块,所述演唱输入模块、语谱提取模块、演唱评分模块依次连接,所述词曲数据库、少数民族语言及方言转换模块、特征提取模块、演唱评价模块依次连接,所述演唱评价模块、演唱评分模块和分数输出模块依次连接;
所述演唱输入模块用于演唱者输入演唱信息,对演唱者的演唱时产生的模拟信号实时转化为计算机能处理的数字信号;
所述语谱提取模块用于对演唱者的演唱信息模块进行语谱特征提取;
所述演唱评分模块用于对演唱者的演唱特征和模型的特征进行比较,根据匹配的程度进行评分;
所述词曲数据库用于提供中国民族声乐作品的歌词文本、乐谱、原唱和伴奏数据;
所述少数民族语言及方言转换模块用于少数民族语言、方言和普通话之间的转换;
所述特征提取模块用于对所选歌曲待的评价音高特征和节奏特征进行提取;
所述演唱评价模块用于将所提取的音高特征和节奏特征形成演唱评价模板;
所述分数输出模块用于输出演唱者的最后得分。
进一步,还包括音基检测模块,用于检测语音信号的基音周期。
再进一步,还包括音基平滑模块,用于避免一个语音片段中,存在的若干个基音周期与正确值之间存在的误差。
本发明的有益效果:
本发明的基于语谱切分的中国民族声乐作品演唱的评测系统具有少数民族语言以及方言和普通话转换的功能,并且能实时得出测试的分数,具有准确率高特点,适合推广应用。
附图说明
图1为本发明的基于语谱切分的中国民族声乐作品演唱的评测系统的结构示意图。
具体实施方式
下面结合附图和具体实施方式对本发明的技术方案作进一步详细地说明。
参照图1,一种基于语谱切分的中国民族声乐作品演唱的评测系统,包括演唱输入模块、语谱提取模块、演唱评分模块、词曲数据库、少数民族语言及方言转换模块、特征提取模块、演唱评价模块和分数输出模块,所述演唱输入模块、语谱提取模块、演唱评分模块依次连接,所述词曲数据库、少数民族语言及方言转换模块、特征提取模块、演唱评价模块依次连接,所述演唱评价模块、演唱评分模块和分数输出模块依次连接;
所述演唱输入模块用于演唱者输入演唱信息,对演唱者的演唱时产生的模拟信号实时转化为计算机能处理的数字信号;
所述语谱提取模块用于对演唱者的演唱信息模块进行语谱特征提取;
所述演唱评分模块用于对演唱者的演唱特征和模型的特征进行比较,根据匹配的程度进行评分;
所述词曲数据库用于提供中国民族声乐作品的歌词文本、乐谱、原唱和伴奏数据;
所述少数民族语言及方言转换模块用于少数民族语言、方言和普通话之间的转换;
所述特征提取模块用于对所选歌曲待的评价音高特征和节奏特征进行提取;
所述演唱评价模块用于将所提取的音高特征和节奏特征形成演唱评价模板;
所述分数输出模块用于输出演唱者的最后得分。
还包括音基检测模块,用于检测语音信号的基音周期。
还包括音基平滑模块,用于避免一个语音片段中,存在的若干个基音周期与正确值之间存在的误差。
以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。
Claims (3)
1.一种基于语谱切分的中国民族声乐作品演唱的评测系统,其特征在于,包括演唱输入模块、语谱提取模块、演唱评分模块、词曲数据库、少数民族语言及方言转换模块、特征提取模块、演唱评价模块和分数输出模块,所述演唱输入模块、语谱提取模块、演唱评分模块依次连接,所述词曲数据库、少数民族语言及方言转换模块、特征提取模块、演唱评价模块依次连接,所述演唱评价模块、演唱评分模块和分数输出模块依次连接;
所述演唱输入模块用于演唱者输入演唱信息,对演唱者的演唱时产生的模拟信号实时转化为计算机能处理的数字信号;
所述语谱提取模块用于对演唱者的演唱信息模块进行语谱特征提取;
所述演唱评分模块用于对演唱者的演唱特征和模型的特征进行比较,根据匹配的程度进行评分;
所述词曲数据库用于提供中国民族声乐作品的歌词文本、乐谱、原唱和伴奏数据;
所述少数民族语言及方言转换模块用于少数民族语言、方言和普通话之间的转换;
所述特征提取模块用于对所选歌曲待的评价音高特征和节奏特征进行提取;
所述演唱评价模块用于将所提取的音高特征和节奏特征形成演唱评价模板;
所述分数输出模块用于输出演唱者的最后得分。
2.根据权利要求1所述的基于语谱切分的中国民族声乐作品演唱的评测系统,其特征在于,还包括音基检测模块,用于检测语音信号的基音周期。
3.根据权利要求2所述的基于语谱切分的中国民族声乐作品演唱的评测系统,其特征在于,还包括音基平滑模块,用于避免一个语音片段中,存在的若干个基音周期与正确值之间存在的误差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711499529.2A CN108198575A (zh) | 2017-12-25 | 2017-12-25 | 一种基于语谱切分的中国民族声乐作品演唱的评测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711499529.2A CN108198575A (zh) | 2017-12-25 | 2017-12-25 | 一种基于语谱切分的中国民族声乐作品演唱的评测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108198575A true CN108198575A (zh) | 2018-06-22 |
Family
ID=62587802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711499529.2A Pending CN108198575A (zh) | 2017-12-25 | 2017-12-25 | 一种基于语谱切分的中国民族声乐作品演唱的评测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108198575A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109273025A (zh) * | 2018-11-02 | 2019-01-25 | 中国地质大学(武汉) | 一种中国民族五声调式情感识别方法及系统 |
CN109920449A (zh) * | 2019-03-18 | 2019-06-21 | 广州市百果园网络科技有限公司 | 节拍分析方法、音频处理方法及装置、设备、介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894552A (zh) * | 2010-07-16 | 2010-11-24 | 安徽科大讯飞信息科技股份有限公司 | 基于语谱切分的唱歌评测系统 |
CN103065621A (zh) * | 2012-11-20 | 2013-04-24 | 高剑青 | 基于音标的声音识别 |
CN104282316A (zh) * | 2013-07-01 | 2015-01-14 | 亿览在线网络技术(北京)有限公司 | 一种基于语音匹配的k歌计分方法和装置 |
-
2017
- 2017-12-25 CN CN201711499529.2A patent/CN108198575A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894552A (zh) * | 2010-07-16 | 2010-11-24 | 安徽科大讯飞信息科技股份有限公司 | 基于语谱切分的唱歌评测系统 |
CN103065621A (zh) * | 2012-11-20 | 2013-04-24 | 高剑青 | 基于音标的声音识别 |
CN104282316A (zh) * | 2013-07-01 | 2015-01-14 | 亿览在线网络技术(北京)有限公司 | 一种基于语音匹配的k歌计分方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109273025A (zh) * | 2018-11-02 | 2019-01-25 | 中国地质大学(武汉) | 一种中国民族五声调式情感识别方法及系统 |
CN109920449A (zh) * | 2019-03-18 | 2019-06-21 | 广州市百果园网络科技有限公司 | 节拍分析方法、音频处理方法及装置、设备、介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gómez et al. | Towards computer-assisted flamenco transcription: An experimental comparison of automatic transcription algorithms as applied to a cappella singing | |
Taylor | Analysis and synthesis of intonation using the tilt model | |
Gómez et al. | Predominant Fundamental Frequency Estimation vs Singing Voice Separation for the Automatic Transcription of Accompanied Flamenco Singing. | |
Papadopoulos et al. | Large-scale study of chord estimation algorithms based on chroma representation and HMM | |
CN105632484B (zh) | 语音合成数据库停顿信息自动标注方法及系统 | |
Nwe et al. | Exploring vibrato-motivated acoustic features for singer identification | |
Wang et al. | An acoustic measure for word prominence in spontaneous speech | |
Molina et al. | SiPTH: Singing transcription based on hysteresis defined on the pitch-time curve | |
Rocamora et al. | Comparing audio descriptors for singing voice detection in music audio files | |
CN102723079B (zh) | 基于稀疏表示的音乐和弦自动识别方法 | |
CN110085257A (zh) | 一种基于国学经典学习的韵律自动评价系统 | |
CN110660383A (zh) | 一种基于歌词歌声对齐的唱歌评分方法 | |
CN110516102B (zh) | 一种基于语谱图识别的歌词时间戳生成方法 | |
CN103366735B (zh) | 语音数据的映射方法和装置 | |
CN106571150A (zh) | 定位音乐人声区的方法和系统 | |
Ganguli et al. | Data-driven exploration of melodic structure in Hindustani music | |
CN108198575A (zh) | 一种基于语谱切分的中国民族声乐作品演唱的评测系统 | |
CN101968958A (zh) | 一种音频数据的比较方法和装置 | |
Gulati et al. | A two-stage approach for tonic identification in Indian art music | |
Dzhambazov et al. | On the use of note onsets for improved lyrics-to-audio alignment in turkish makam music | |
CN105895079B (zh) | 语音数据的处理方法和装置 | |
Pikrakis et al. | Tracking melodic patterns in flamenco singing by analyzing polyphonic music recordings | |
Wong et al. | Automatic lyrics alignment for Cantonese popular music | |
Türk et al. | A comparison of voice conversion methods for transforming voice quality in emotional speech synthesis. | |
Gulati | A tonic identification approach for Indian art music |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180622 |