CN108206027A - 一种音频质量评价方法及系统 - Google Patents
一种音频质量评价方法及系统 Download PDFInfo
- Publication number
- CN108206027A CN108206027A CN201611184259.1A CN201611184259A CN108206027A CN 108206027 A CN108206027 A CN 108206027A CN 201611184259 A CN201611184259 A CN 201611184259A CN 108206027 A CN108206027 A CN 108206027A
- Authority
- CN
- China
- Prior art keywords
- audio quality
- file
- sonograph
- training pattern
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 86
- 238000012360 testing method Methods 0.000 claims abstract description 28
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 238000001303 quality assessment method Methods 0.000 claims description 4
- 235000013399 edible fruits Nutrition 0.000 claims 1
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及一种音频质量评价方法及系统,该方法包括:将测试文件输入至音频质量训练模型,其中音频质量训练模型为对样本文件进行训练获取的模型;利用音频质量训练模型,对测试文件进行训练,获取训练结果;根据训练结果,确定音频文件的音频质量。通过将样本文件转换为声谱图,并对所述声谱图做相应处理后,进行训练。获取音频质量训练模型,利用该音频质量训练模型对测试文件进行测试。将音频识别问题转化为图像识别问题,实现了歌曲主观质量的自动化标注。有效的评价出演唱者的嗓音质量,实现了歌曲主观质量的自动化标注,而且利用声谱图可以很好的识别出演唱者的演唱质量。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种音频质量评价方法及系统。
背景技术
最近来随着经济水平的不断提高,人们对精神层面也越来越关注,经常在家或去KTV等场所进行K歌娱乐,并应用软件对演唱的歌曲进行评价。常见评价歌曲演唱方法是基于唱歌的节拍,即只要节拍对上即可。这并不能很好的评价唱歌者歌唱的到底好不好,只能判断出是否合拍。
发明内容
本发明为了能够有效的评价出演唱者的嗓音质量,提供了一种音频质量评价方法及系统。
一方面,提供了一种音频质量评价方法,包括:将测试文件输入至音频质量训练模型,其中音频质量训练模型为对样本文件进行训练获取的模型;利用音频质量训练模型,对测试文件进行训练,获取训练结果;根据训练结果,确定音频文件的音频质量。
优选地,将测试文件输入至音频质量训练模型之前,方法还包括:制作音频质量训练模型。
进一步优选地,制作音频质量训练模型,具体包括:将样本文件转换为声谱图;对声谱图进行灰度处理,生成与声谱图对应的灰度图;对灰度图进行缩放;并对进行缩放后的灰度图进行训练,获取音频质量训练模型。
优选地,将样本文件转换为声谱图,包括:采用短时傅里叶变换,将样本文件转换为声谱图。
优选地,对进行缩放后的灰度图进行训练,获取音频质量训练模型,具体包括:利用卷积神经网络算法,对进行缩放后的灰度图进行训练,获取音频质量训练模型。
另一方面,提供了一种音频质量评价系统,包括:输入模块,用于将测试文件输入至音频质量训练模型,其中音频质量训练模型为对样本文件进行训练获取的模型;训练模块,用于利用音频质量训练模型,对测试文件进行训练,获取训练结果;质量评价模块,用于根据训练结果,确定音频文件的音频质量。
优选地,训练模块还用于,制作音频质量训练模型。
进一步优选地,训练模块具体用于:将样本文件转换为声谱图;对声谱图进行灰度处理,生成与声谱图对应的灰度图;对灰度图进行缩放;并对进行缩放后的灰度图进行训练,获取音频质量训练模型。
优选地,训练模块具体用于:采用短时傅里叶变换,将样本文件转换为声谱图。
优选地,训练模块具体用于:利用卷积神经网络算法,对进行缩放后的灰度图进行训练,获取音频质量训练模型。
本发明实施例提供的一种音频质量评价方法,通过将样本文件转换为声谱图,并对所述声谱图做相应处理后,进行训练。获取音频质量训练模型,利用该音频质量训练模型对测试文件进行测试。将音频识别问题转化为图像识别问题,实现了歌曲主观质量的自动化标注。有效的评价出演唱者的嗓音质量实现了歌曲主观质量的自动化标注,而且利用声谱图可以很好的识别出演唱者的演唱质量。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为本发明实施例提供的一种音频质量评价方法的流程图;
图2为一种制作音频质量训练模型的方法流程示意图;
图3为本发明实施例提供的一种音频质量评价的系统结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图和实施例,对本发明实施例中的技术方案进行清楚地描述。
当本发明实施例提及“第一”、“第二”等序数词时,除非根据上下文其确实表达顺序之意,应当理解为仅仅起区分的作用。
图1为本发明实施例提供的一种音频质量评价的方法流程示意图,如图1所示,该方法包括:
步骤110,将测试文件输入至音频质量训练模型。
具体的,本文中所述的测试文件为音频测试文件,具体可以为用户上传的音乐文件,或者其他音频文件,这里不做任何限制。而音频质量训练模型为对样本文件进行训练获取的模型。
在步骤110之前,该方法还包括:步骤100,制作音频质量训练模型。
具体制作音频质量训练模型的步骤具体如图2所示,图2为一种制作音频质量训练模型的方法流程示意图。可以包括步骤1001-步骤1004。
步骤1001,将样本文件转换为声谱图。
具体的,样本文件为已知的音频文件。例如,可以从曲库中抽取500首知名歌手的音乐文件,从用户上传的歌曲中抽取500首用户演唱的音乐文件,组成样本文件。
首先需要将样本文件进行预处理,具体可以包括将样本文件中的所有文件进行标注。例如,标注哪些音频文件为知名歌手的音乐文件,哪些音频文件为用户演唱的音乐文件(例如,将知名歌手的音乐文件标注为0,将用户演唱的音乐文件标注为1)。
然后,将这些文件利用短时傅里叶变换算法,转换为声谱图。
这里需要说明的是,声音本身的信息主要包含三个维度:时间、频率、能量。常见的声音可视化表示方式有波形图、频谱图、声谱图。波形图表征音频文件的时域信息,所以损失了频率信息。对应的,频谱图表征音频文件的频域信息,不包含能量信息。然而,声谱图则可以同时表征声音的时间、频率、能量信息。因此,在本申请文件中,优选的将样本文件转换为声谱图。短时傅里叶变换是频谱分析的常用手段。相较于傅里叶变换,短时傅里叶变换引入了窗函数,可以提供频率信号随时间改变的信息。最终生成的声谱图以横轴表征时间、纵轴表征频率、颜色表征能量大小。而具体的采用短时傅里叶变换算法将样本文件转换为声谱图方式是现有技术,这里不再赘述。
步骤1002,对声谱图进行灰度处理,生成与声谱图对应的灰度图。
步骤1003,对所述灰度图进行缩放。
实际应用中需要同时考虑模型准确率和处理速度。提升模型处理速度的手段之一就是图像缩放,本发明采用的缩放策略是双线性插值法,该方法兼顾了像素连续性及计算复杂度。同时,为了尽可能保留足够的音频信息,图片不宜压缩太小。鉴于音频质量评价的应用场景对实时性要求不高,本发明采用256*256的图像尺寸(单位为像素),以最大化音频数据的表达能力,进而保证更高的识别准确率。
步骤1004,对进行缩放后的灰度图进行训练,获取音频质量训练模型。
由于音频文件的有损压缩过程涉及到声音的三个维度,因此,为保证信息表达的完整性,本发明将音频文件的声谱图作为卷积神经网络的输入。
卷积神经网络(Convolutional Neural Network,简称CNN)是一种前馈神经网络,它可以近似模拟人类的视觉认知过程,在图像处理领域有广泛的应用。优选的,本发明采用了卷积神经网络中的AlexNet作为训练模型,该模型的参数数量约为6000万,模型表达能力很强,容易学到更多特征。有利于获取的音频质量训练模型训练测试文件时,更加的精确。
步骤120,利用音频质量训练模型,对测试文件进行训练,获取训练结果。
具体的,将测试文件输入值音频质量训练模型中,对测试文件进行训练,获取的训练结果可以包括与泛音分布是否广阔,或者泛音音量是否很大,等等。
步骤130,根据训练结果,确定音频文件的音频质量。
具体的,如步骤120所述,通过上述音频质量训练模型对测试文件测试,可以确定测试文件的泛音分布是否广阔,或者泛音音量是否很大等等,由此可以确定音频文件的音频质量。
本发明实施例提供的一种音频质量评价方法,通过将样本文件转换为声谱图,并对所述声谱图做相应处理后,进行训练。获取音频质量训练模型,利用该音频质量训练模型对测试文件进行测试。将音频识别问题转化为图像识别问题,实现了歌曲主观质量的自动化标注。有效的评价出演唱者的嗓音质量实现了歌曲主观质量的自动化标注,而且利用声谱图可以很好的识别出演唱者的演唱质量。
与上述方法实施例相对应的,本发明实施例还提供了一种音频质量评价系统,具体如图3所示,该系统包括:输入模块301,训练模块302,质量评价模块303。
输入模块301,用于将测试文件输入至音频质量训练模型,其中所述音频质量训练模型为对所述样本文件进行训练获取的模型。
训练模块302,用于利用所述音频质量训练模型,对所述测试文件进行训练,获取训练结果。
质量评价模块303,用于根据所述训练结果,确定所述音频文件的音频质量。
具体的,训练模块302利用音频质量训练模型,对测试文件进行训练之前,还用于制作音频质量训练模型。
具体的,训练模块302用于将样本文件转换为声谱图,对声谱图进行灰度处理,生成与声谱图对应的灰度图。对灰度图进行缩放,并对进行缩放后的灰度图进行训练,获取音频质量训练模型。其中,将样本文件转换为声谱图时,所采用的是短时傅里叶变换算法。而,对进行缩放后的灰度图进行训练,获取音频质量训练模型时,所采用的是卷积神经网络算法。
本发明实施例提供的上述音频质量评价系统中各部件所执行的功能均已经在上述实施例提供的一种音频质量评价方法中做了详细介绍,这里不再赘述。
本发明实施例提供的一种音频质量评价系统,通过将样本文件转换为声谱图,并对所述声谱图做相应处理后,进行训练。获取音频质量训练模型,利用该音频质量训练模型对测试文件进行测试。将音频识别问题转化为图像识别问题,实现了歌曲主观质量的自动化标注。有效的评价出演唱者的嗓音质量实现了歌曲主观质量的自动化标注,而且利用声谱图可以很好的识别出演唱者的演唱质量。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,的程序可以存储于计算机可读存储介质中,存储介质是非短暂性(non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(magnetic tape),软盘(floppy disk),光盘(optical disc)及其任意组合。以上,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此。
Claims (10)
1.一种音频质量评价方法,其特征在于,包括:
将测试文件输入至音频质量训练模型,其中所述音频质量训练模型为对所述样本文件进行训练获取的模型;
利用所述音频质量训练模型,对所述测试文件进行训练,获取训练结果;
根据所述训练结果,确定所述音频文件的音频质量。
2.根据权利要求1所述的方法,其特征在于,所述将测试文件输入至音频质量训练模型之前,所述方法还包括:制作音频质量训练模型。
3.根据权利要求2所述的方法,其特征在于,所述制作所述音频质量训练模型,具体包括:
将样本文件转换为声谱图;
对所述声谱图进行灰度处理,生成与所述声谱图对应的灰度图;
对所述灰度图进行缩放;
并对所述进行缩放后的灰度图进行训练,获取所述音频质量训练模型。
4.根据权利要求3所述的方法,其特征在于,所述将样本文件转换为声谱图,包括:
采用短时傅里叶变换,将样本文件转换为声谱图。
5.根据权利要求3所述的方法,其特征在于,所述对所述进行缩放后的灰度图进行训练,获取所述音频质量训练模型,具体包括:
利用卷积神经网络算法,对所述进行缩放后的灰度图进行训练,获取所述音频质量训练模型。
6.一种音频质量评价系统,其特征在于,包括:
输入模块,用于将测试文件输入至音频质量训练模型,其中所述音频质量训练模型为对所述样本文件进行训练获取的模型;
训练模块,用于利用所述音频质量训练模型,对所述测试文件进行训练,获取训练结果;
质量评价模块,用于根据所述训练结果,确定所述音频文件的音频质量。
7.根据权利要求6所述的系统,其特征在于,所述训练模块还用于,制作音频质量训练模型。
8.根据权利要求7所述的系统,其特征在于,所述训练模块具体用于:
将样本文件转换为声谱图;
对所述声谱图进行灰度处理,生成与所述声谱图对应的灰度图;
对所述灰度图进行缩放;
并对所述进行缩放后的灰度图进行训练,获取所述音频质量训练模型。
9.根据权利要求8所述的系统,其特征在于,所述训练模块具体用于:
采用短时傅里叶变换,将样本文件转换为声谱图。
10.根据权利要求8所述的系统,其特征在于,所述训练模块具体用于:
利用卷积神经网络算法,对所述进行缩放后的灰度图进行训练,获取所述音频质量训练模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611184259.1A CN108206027A (zh) | 2016-12-20 | 2016-12-20 | 一种音频质量评价方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611184259.1A CN108206027A (zh) | 2016-12-20 | 2016-12-20 | 一种音频质量评价方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108206027A true CN108206027A (zh) | 2018-06-26 |
Family
ID=62604069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611184259.1A Pending CN108206027A (zh) | 2016-12-20 | 2016-12-20 | 一种音频质量评价方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108206027A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109308913A (zh) * | 2018-08-02 | 2019-02-05 | 平安科技(深圳)有限公司 | 音乐质量评价方法、装置、计算机设备及存储介质 |
CN109961802A (zh) * | 2019-03-26 | 2019-07-02 | 北京达佳互联信息技术有限公司 | 音质比较方法、装置、电子设备及存储介质 |
CN112559794A (zh) * | 2019-09-25 | 2021-03-26 | 北京达佳互联信息技术有限公司 | 歌曲质量的识别方法、装置、设备及存储介质 |
CN112634946A (zh) * | 2020-12-25 | 2021-04-09 | 深圳市博瑞得科技有限公司 | 一种语音质量分类预测方法、计算机设备及存储介质 |
CN113010728A (zh) * | 2021-04-06 | 2021-06-22 | 金宝贝网络科技(苏州)有限公司 | 一种歌曲推荐方法、系统、智能设备及存储介质 |
CN113140228A (zh) * | 2021-04-14 | 2021-07-20 | 广东工业大学 | 一种基于图神经网络的声乐打分方法 |
CN114358089A (zh) * | 2022-01-24 | 2022-04-15 | 北京蕴岚科技有限公司 | 基于脑电的语音评估模型的训练方法、装置及电子设备 |
US20220230645A1 (en) * | 2019-05-31 | 2022-07-21 | Tencent Music Entertainment Technology (Shenzhen) Co., Ltd. | Sound quality detection method and device for homologous audio and storage medium |
CN117636900A (zh) * | 2023-12-04 | 2024-03-01 | 广东新裕信息科技有限公司 | 一种基于音频特征形状匹配的乐器演奏质量评价方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102103857A (zh) * | 2009-12-21 | 2011-06-22 | 盛大计算机(上海)有限公司 | 演唱打分系统 |
CN102664016A (zh) * | 2012-04-23 | 2012-09-12 | 安徽科大讯飞信息科技股份有限公司 | 唱歌评测方法及系统 |
CN103957216A (zh) * | 2014-05-09 | 2014-07-30 | 武汉大学 | 基于音频信号特性分类的无参考音频质量评价方法和系统 |
CN104254887A (zh) * | 2012-09-24 | 2014-12-31 | 希特兰布公司 | 用于评估卡拉ok用户的方法和系统 |
CN104616664A (zh) * | 2015-02-02 | 2015-05-13 | 合肥工业大学 | 一种基于声谱图显著性检测的音频识别方法 |
CN105895110A (zh) * | 2016-06-30 | 2016-08-24 | 北京奇艺世纪科技有限公司 | 一种音频文件的分类方法及装置 |
JP6090043B2 (ja) * | 2013-07-31 | 2017-03-08 | ブラザー工業株式会社 | 情報処理装置、及びプログラム |
-
2016
- 2016-12-20 CN CN201611184259.1A patent/CN108206027A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102103857A (zh) * | 2009-12-21 | 2011-06-22 | 盛大计算机(上海)有限公司 | 演唱打分系统 |
CN102664016A (zh) * | 2012-04-23 | 2012-09-12 | 安徽科大讯飞信息科技股份有限公司 | 唱歌评测方法及系统 |
CN104254887A (zh) * | 2012-09-24 | 2014-12-31 | 希特兰布公司 | 用于评估卡拉ok用户的方法和系统 |
JP6090043B2 (ja) * | 2013-07-31 | 2017-03-08 | ブラザー工業株式会社 | 情報処理装置、及びプログラム |
CN103957216A (zh) * | 2014-05-09 | 2014-07-30 | 武汉大学 | 基于音频信号特性分类的无参考音频质量评价方法和系统 |
CN104616664A (zh) * | 2015-02-02 | 2015-05-13 | 合肥工业大学 | 一种基于声谱图显著性检测的音频识别方法 |
CN105895110A (zh) * | 2016-06-30 | 2016-08-24 | 北京奇艺世纪科技有限公司 | 一种音频文件的分类方法及装置 |
Non-Patent Citations (1)
Title |
---|
迷之飞翔: ""caffe深度学习笔记实例薛开宇 基于卷积神经网络CNN的声音识别"", 《HTTPS://WWW.DOCIN.COM/P-1441307242.HTML》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020024556A1 (zh) * | 2018-08-02 | 2020-02-06 | 平安科技(深圳)有限公司 | 音乐质量评价方法、装置、计算机设备及存储介质 |
CN109308913A (zh) * | 2018-08-02 | 2019-02-05 | 平安科技(深圳)有限公司 | 音乐质量评价方法、装置、计算机设备及存储介质 |
CN109961802A (zh) * | 2019-03-26 | 2019-07-02 | 北京达佳互联信息技术有限公司 | 音质比较方法、装置、电子设备及存储介质 |
CN109961802B (zh) * | 2019-03-26 | 2021-05-18 | 北京达佳互联信息技术有限公司 | 音质比较方法、装置、电子设备及存储介质 |
US20220230645A1 (en) * | 2019-05-31 | 2022-07-21 | Tencent Music Entertainment Technology (Shenzhen) Co., Ltd. | Sound quality detection method and device for homologous audio and storage medium |
US11721350B2 (en) * | 2019-05-31 | 2023-08-08 | Tencent Music Entertainment Technology (Shenzhen) Co., Ltd. | Sound quality detection method and device for homologous audio and storage medium |
CN112559794A (zh) * | 2019-09-25 | 2021-03-26 | 北京达佳互联信息技术有限公司 | 歌曲质量的识别方法、装置、设备及存储介质 |
CN112634946A (zh) * | 2020-12-25 | 2021-04-09 | 深圳市博瑞得科技有限公司 | 一种语音质量分类预测方法、计算机设备及存储介质 |
CN112634946B (zh) * | 2020-12-25 | 2022-04-12 | 博瑞得科技有限公司 | 一种语音质量分类预测方法、计算机设备及存储介质 |
CN113010728A (zh) * | 2021-04-06 | 2021-06-22 | 金宝贝网络科技(苏州)有限公司 | 一种歌曲推荐方法、系统、智能设备及存储介质 |
CN113140228A (zh) * | 2021-04-14 | 2021-07-20 | 广东工业大学 | 一种基于图神经网络的声乐打分方法 |
CN114358089A (zh) * | 2022-01-24 | 2022-04-15 | 北京蕴岚科技有限公司 | 基于脑电的语音评估模型的训练方法、装置及电子设备 |
CN117636900A (zh) * | 2023-12-04 | 2024-03-01 | 广东新裕信息科技有限公司 | 一种基于音频特征形状匹配的乐器演奏质量评价方法 |
CN117636900B (zh) * | 2023-12-04 | 2024-05-07 | 广东新裕信息科技有限公司 | 一种基于音频特征形状匹配的乐器演奏质量评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108206027A (zh) | 一种音频质量评价方法及系统 | |
Dean et al. | The QUT-NOISE-TIMIT corpus for evaluation of voice activity detection algorithms | |
CN110457432B (zh) | 面试评分方法、装置、设备及存储介质 | |
CN107316638A (zh) | 一种诗词背诵评测方法及系统、一种终端及存储介质 | |
WO2019210796A1 (zh) | 语音识别方法、装置、存储介质及电子设备 | |
CN104464726B (zh) | 一种相似音频的确定方法及装置 | |
CN107393526A (zh) | 语音静音检测方法、装置、计算机设备和存储介质 | |
CN107888843A (zh) | 用户原创内容的混音方法、装置、存储介质及终端设备 | |
CN106157979B (zh) | 一种获取人声音高数据的方法和装置 | |
CN102723079B (zh) | 基于稀疏表示的音乐和弦自动识别方法 | |
CN107507625B (zh) | 声源距离确定方法及装置 | |
CN107895571A (zh) | 无损音频文件识别方法及装置 | |
CN109741734A (zh) | 一种语音评测方法、装置和可读介质 | |
CN109979486A (zh) | 一种语音质量评估方法及装置 | |
CN115798518B (zh) | 一种模型训练方法、装置、设备及介质 | |
CN113724683B (zh) | 音频生成方法、计算机设备及计算机可读存储介质 | |
CN110019962A (zh) | 一种视频文案信息的生成方法及装置 | |
CN107767850A (zh) | 一种演唱评分方法及系统 | |
CN110580217B (zh) | 软件代码健康度的检测方法、处理方法、装置及电子设备 | |
CN107240394A (zh) | 一种动态自适应语音分析技术以用于人机口语考试的方法及系统 | |
US10522160B2 (en) | Methods and apparatus to identify a source of speech captured at a wearable electronic device | |
CN111402922A (zh) | 基于小样本的音频信号分类方法、装置、设备及存储介质 | |
CN109410946A (zh) | 一种识别语音信号的方法、装置、设备及存储介质 | |
CN107481582A (zh) | 一种声乐学习电子辅助发音系统 | |
CN111833842A (zh) | 合成音模板发现方法、装置以及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180626 |
|
RJ01 | Rejection of invention patent application after publication |