CN107909090A - 基于测度学习半监督的钢琴乐谱难度识别方法 - Google Patents
基于测度学习半监督的钢琴乐谱难度识别方法 Download PDFInfo
- Publication number
- CN107909090A CN107909090A CN201710942785.8A CN201710942785A CN107909090A CN 107909090 A CN107909090 A CN 107909090A CN 201710942785 A CN201710942785 A CN 201710942785A CN 107909090 A CN107909090 A CN 107909090A
- Authority
- CN
- China
- Prior art keywords
- difficulty
- data
- data set
- learning
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2451—Classification techniques relating to the decision surface linear, e.g. hyperplane
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于机器学习、乐谱自动识别技术,为实现具有适应乐谱数据变化的能力,并具有高的识别稳定性和识别准确率,为钢琴教学和学习过程,提供可靠的钢琴难度等级信息。为此,本发明,基于测度学习半监督的钢琴乐谱难度识别方法,包括下列步骤:1)收集具有难度标签的实验数据源即两种不同评价体系下的数据集;2)对提取到的特征数据进行归一化预处理、数据清洗,解决数据不平衡问题,并评估难度相关特征的有效性;3)对其中一个数据集进行基于测度学习理论的有监督算法分类,获到分类正确率;4)现已收集两个评价体系的数据集;5)利用其中一个评价体系下的数据去提升另一个评价体系下的数据集分类正确率。本发明主要应用于乐谱识别场合。
Description
技术领域
本发明属于机器学习领域,尤其涉及半监督算法和测度学习理论去实现钢琴乐谱难度识别方法。
背景技术
钢琴乐谱难度等级识别即用一种算法能够自动识别某一钢琴乐谱的难度等级,给予使用者参考意见。半监督算法即充分利用无标签数据,扩大难度识别的数据库,提高识别准确率。每天有大量的钢琴乐谱被创作出来,并且在音乐历史中已经有大量的钢琴乐谱存在。然而,如何从庞大的钢琴乐谱数据中找到与学习者学习等级匹配的乐谱是一个很大的挑战。对于专业钢琴学习者,一般都有固定进阶教材,但不利于个性化学习以激发学习者的热情和兴趣,有必要对网上海量的乐谱进行难度等级的衡量。对于音乐业余爱好者,选择合适自己的难度等级乐谱,以防学习信心受挫,学习热情降低,有利于自身音乐学习水平更快的提升。判断钢琴乐谱的难度等级是一个相对较复杂的任务。首先,钢琴乐谱难度判断的标准和准则较难完全客观地定义出来,现在绝大部分乐谱难度等级仍然需要专业人士进行主观判断。然而对于现在网络中数以万计的数字乐谱,人为逐个去判断其难度等级将会是一个耗时耗力的巨大工程,是不现实的。再者,影响人为主观判断的因素有很多,尤其对于多类别问题,人为主观感知很难一直准确地把握每一个难度等级之间的区别。不同的人对于同一首乐谱可能会给出不同的难度等级,甚至对于同一首乐谱,同一个人在不同的时间也会给出不同的难度等级。为给网络中共享的海量数字钢琴乐谱提供难度等级标签,同时避免耗费大量人为工作时间以及避免人为主观判断难度等级的不一致性,依据机器学习与模式识别相关理论,设计一种能够自动识别乐谱难度等级的算法将会是一个有效的策略。
数字钢琴乐谱难度等级识别是一个较新但很有潜力和应用前景的技术领域。Shih-Chuan Chiu等人最先开始研究提出钢琴乐谱难度等级识别领域。他们首先定义一些和钢琴难度密切相关的特征,并利用特征选择算法对特征重要程度进行排序,然后考虑用三种回归方法去实现钢琴难度的自动识别。无论是多元线性回归还是逐步回归都是以特征和难度等级之间是线性关系的假设为前提,此模型过于简化特征和难度等级之间的实际关系,而支持向量回归虽可实现非线性拟合,但其拟合效果不令人满意。另外,回归算法更倾向于解释型,即可以较明了地表示特征与难度等级之间的函数关系,建立模型,适合拟合数据,预测定量的输出(即输出是连续值),但对于输出是离散值的分类问题能力有限。
Véronique Sébastien等人根据音乐教学的过程,提出一种基于乐谱分析的方法实现钢琴乐谱难度识别。首先也定义一些难度相关特征,然后利用主成分分析法(PCA)进行降维,将特征投影到二维空间,经过分层聚类(hierarchical clustering)和k均值聚类得到难度类别标签。人主观判断会权衡各个难度准则的重要程度,并且不会受到乐谱题材的影响,而PCA和聚类算法不会权衡特征重要性,并且也会受到音乐题材的影响。聚类算法属于非监督分类算法,虽然能够充分利用特征与难度等级之间的自然分布关系,但无法利用已有的难度等级标签作为先验知识帮助分类。例如实验中,原始乐谱数据是四个类别,经过PCA降维后,应用聚类算法,最终仅得到三个难度类别。
郭龙伟等人将乐谱难度等级识别视为分类问题。为更好地描述数字钢琴乐谱,重新定义了七个难度相关特征,并结合之前的特征总共有25个特征。并利用回归拟合对比实验和ReliefF算法对难度相关特征进行有效性的判断,证明新提出特征的有效性,然后通过散点图分析特征与难度等级的自然分布关系后,决定使用非线性分类算法实现乐谱难度等级识别,首先利用测度学习(Metric Learning)理论改进k最近邻(k nearest neighbors,KNN),即P-KNN算法。基于求解大间隔优化问题,利用KNN算法分类原理实现待定乐谱难度等级的识别。他们也采用了基于测度学习理论,从数据本身有监督地学习到测度DM,并用之改进高斯径向基核函数,对支持向量机(SVM)算法进行改进,提出一种ML-SVM算法,并利用网格搜索算法寻找最优的模型参数组合。本研究基于两个数据集,并且ML-SVM算法在九类难度等级数据集上达到准确率为84.67%。本文实验数据还是比较少的,为了提高算法的适用性和泛化能力,更好的验证算法的性能,应将算法在更大的钢琴乐谱数据库中进行测试。
因此需要一种解决或至少改善现有技术中固有的一个或多个问题的钢琴乐谱难度等级识别方法。
发明内容
为克服现有技术的不足,本发明旨在提出一种基于测度学习的半监督分类算法的钢琴乐谱难度等级识别。该方法面向现存的数以万计的钢琴乐谱,结合现实情况,即带标签的乐谱数量有限且少量,充分利用半监督学习的原理与优势,扩充训练样本,提高学习模型的泛化能力,使用多分类SVM实现乐谱难度等级识别。此方法具有适应乐谱数据变化的能力,并具有高的识别稳定性和识别准确率,为钢琴教学和学习过程,提供可靠的钢琴难度等级信息。为此,本发明采用的技术方案是,基于测度学习半监督的钢琴乐谱难度识别方法,包括下列步骤:
1)收集具有难度标签的实验数据源即两种不同评价体系下的数据集,针对难度等级要求有目的地采集难度相关特征,构成表征难度的特征向量,最后形成难度相关特征空间;
2)对提取到的特征数据进行归一化预处理、数据清洗,解决数据不平衡问题,并评估难度相关特征的有效性;
3)对其中一个数据集进行基于测度学习理论的有监督算法分类,获到分类正确率;
4)现已收集两个评价体系的数据集,不使用其中一个数据集的标签信息,利用此评价体系的数据去提升另一个评价体系下的数据集分类正确率;
5)学习两个评价体系下的数据集间联系,利用其中一个评价体系下的数据去提升另一个评价体系下的数据集分类正确率。
步骤1)具体地,针对乐谱难度等级问题有目的的采集不同难度标签的钢琴乐谱数据集,并根据人为判断乐谱难度等级的准则,并结合数字乐谱相关信息,提取表征难度的特征向量,构成特征空间,并给数据集进行难度等级编号分别为1~m,m为自然数。
步骤2)具体地,用Min-Max归一化方法,公式如下:
将特征向量的值归一化到[0,1]区间,其中min和max分别表示特征xi的最小和最大值,表示特征xi经过归一化处理后的特征;
采用过采样oversampling方法解决数据不平衡问题,即重复利用数据较少的类别,以使得和数据多的类别之间达到平衡。
步骤3)具体地,从每个类别中随机选取80%作为训练样本,其余作为测试样本,将80%的五类难度等级数据集的标签信息根据测度学习有监督的得到新的距离测度DM=(xi-xj)TM(xi-xj),并用新的距离测度改进高斯径向基核函数,求解最优超平面的问题即为求解下列目标函数:
0≤αi≤C,i=1,...,p
其中
其中α是拉格朗日系数,C是错误分类的惩罚参数,KM是改进后的高斯径向基核函数,核函数表达式中的DM(xi,xj)是测度学习得到的距离测度,求解目标函数得到最优解选择α*的一个小于C的正分量并据此计算:并用one-versus-all方法将SVM扩展到多分类,基于网格搜索算法选择最优的核函数参数,建立多分类支持向量机模型,并对于待识别数字乐谱利用训练好的分类模型根据重新构造的决策函数判断出剩余20%待分类数字乐谱所属的难度等级,并得到分类正确率。
步骤4)具体地,在步骤3中学习到多分类支持向量机模型,向此模型中输入NineS数据集的特征,即对NineS数据集进行五类难度等级标签的分类,得到五类难度等级标签的NineS数据集和80%的FiveS数据集的标签信息重复步骤3中的有监督学习过程,重新学习距离测度,建立新的多分类支持向量机模型,最后对20%的FiveS数据集利用新训练好的分类模型根据重新构造的决策函数判断出待分类数字乐谱所属的难度等级,并得到新的分类正确率。
步骤5)具体地,对NineS数据集和FiveS数据集都进行了难度等级特征的提取并进行预处理后命名两个特征空间为M、N,对两个数据集的特征空间进行映射投影学习,即M=PN,学习到映射矩阵P,根据矩阵P对两个数据集中标签进行映射,即将NineS数据集中的九类难度等级标签转换成五类难度等级标签;将通过学习映射矩阵投影后学习到五类难度等级标签的NineS数据集和80%的FiveS数据集根据测度学习有监督的得到新的距离测度DM=(xi-xj)TM(xi-xj),并用新的距离测度改进高斯径向基核函数,并用one-versus-all方法将SVM扩展到多分类,基于网格搜索算法选择最优的核函数参数,建立多分类支持向量机模型,并对于待识别数字乐谱利用训练好的分类模型根据重新构造的决策函数判断出待分类数字乐谱所属的难度等级,并得到分类正确率。
本发明的特点及有益效果是:
本发明基于测度学习半监督算法。根据钢琴乐谱现存实际情况,未标记难度等级的乐谱数量比标记难度等级的乐谱数量多很多,若直接使用传统的监督学习技术构建模型,那么未标记难度等级乐谱所包含信息被浪费,而训练样本不足,学得的模型泛化能力不佳,故要充分根据未标记难度等级乐谱所包含信息提高学习性能,即进行半监督学习。根据数据本身具备的特点,考虑用基于高斯径向基核函数的SVM算法实现钢琴乐谱难度等级,最终实验结果表明本发明能有效提高分类的识别准确率和可信度。
附图说明:
图1本发明方法流程图一:
图2本发明流程图二。
具体实施方式
本发明的实验基于两个不同评价体系的数据集,乐谱数据源从大型音乐网站http://www.ambrosepianotabs.com上收集到,分别是分类较细致的九个难度等级的数据集(NineS数据集),其包含3010首乐谱,另一个分类相对粗糙的五个难度等级的数据集(FiveS数据集),其包含1253首乐谱。实验数据源相较于之前研究者的数据有所增加,使得本发明的可靠性和实用性有所提升,提高数据概率分布,训练样本的增加,能够使分类的可靠性增加。Metric Learning的引入很有必要,特征间存在相关性,使其映射到另一个特征空间,提高分类准确率。本发明所述半监督分类方法和回归算法、聚类算法以及有监督算法进行比较,优势体现在:半监督学习充分利用大量的未标记标签数据,提高学习模型的泛化性,并实现五类和九类难度等级数据的映射,将寻找两个数据集的映射和半监督首次应用于钢琴难度识别领域。
本发明介绍的一种基于测度学习的半监督钢琴乐谱难度识别方法,此方法用半监督分类的思想去实现钢琴乐谱难度等级的自动识别。本发明基于两个数据集,半监督学习充分利用大量的未标记标签数据,提高学习模型的泛化性,并实现五类和九类难度等级数据的映射,将寻找两个数据集的映射和半监督首次应用于钢琴难度识别领域。本发明为钢琴教学和学生学习,提供可靠的钢琴难度信息,同时也大大提高乐谱网站的用户体验。
本发明采用的技术方案是,一种基于测度学习理论的半监督学习钢琴乐谱难度识别方法,包括下列步骤:
1)收集具有难度标签的实验数据源(两种不同评价体系下的数据集),针对难度等级要求有目的地采集难度相关特征,构成表征难度的特征向量,最后形成难度相关特征空间。
2)对提取到的特征数据进行归一化预处理、数据清洗,解决数据不平衡问题,并评估难度相关特征的有效性。
3)对其中一个数据集进行基于测度学习理论的有监督算法分类,获到分类正确率。
4)现已收集两个评价体系的数据集,不使用其中一个数据集的标签信息,利用此评价体系的数据去提升另一个评价体系下的数据集分类正确率。
5)学习两个评价体系下的数据集间联系,利用其中一个评价体系下的数据去提升另一个评价体系下的数据集分类正确率。
本发明基于测度学习半监督算法。根据数据本身具备的特点,考虑用非线性分类KNN算法和基于高斯径向基核函数的SVM算法实现钢琴乐谱难度等级,最终实验结果表明本发明能有效提高识别准确率和可信度。
下面结合附图和具体实例进一步详细说明本发明。
1.特征提取
针对乐谱难度等级问题有目的的采集不同难度标签的钢琴乐谱数据集,并根据人为判断乐谱难度等级的准则,并结合数字乐谱相关信息,提取表征难度的特征向量,构成特征空间。并给数据集进行难度等级编号分别为1~m,m为自然数。从每个类别中随机选取80%作为训练样本,其余作为测试样本。
2.数据预处理
不同特征值范围差别较大,为防止数值较大的特征对整体分类影响,对特征空间进行归一化处理,用Min-Max归一化方法,公式如下:
将特征向量的值归一化到[0,1]区间。其中min和max分别表示特征xi的最小和最大值,表示特征xi经过归一化处理后的特征。
根据收集到的两种不同评价体系的乐谱数据集,FiveS数据集中不同难度等级数据量差别较大,其中难度等级beginner:intermediate的比例约为1:17,而NineS数据集中数据量差别最大的两个难度等级数据比例为1:5,由于NineS数据集中最大的不平衡比率约为1:5,还是比较小的,所以可采用过采样(oversampling)方法解决数据不平衡问题。即重复利用数据较少的类别,以使得和数据多的类别之间达到平衡。对于数据严重不平衡(不平衡比率大于1:10)的FiveS数据集,少数类别过多次重复利用将会出现过拟合问题。故可采用改进的过采样SMOTE方法平衡数据。
向模型中输入九类难度等级数据集NineS,即对NineS数据集进行五类难度等级标签的分类,得到五类难度等级标签的NineS数据集和80%的FiveS数据集的标签信息重复有监督学习过程,重新学习距离测度,建立新的多分类支持向量机模型,最后对20%的FiveS数据集利用新训练好的分类模型根据重新构造的决策函数判断出待分类数字乐谱所属的难度等级,并得到新的分类正确率。
3.测度学习理论
距离度量D(·,·)本质上是一个函数,此函数给出可计算两个样本之间标量距离的大小。一个度量必须满足以下4个性质,对任意的向量:a,b,c,有:
(1)非负性:D(a,b)≥0;
(2)自反性:D(a,b)=0,当且仅当a=b;
(3)对称性:D(a,b)=D(b,a);
(4)三角不等式:D(a,b)+D(b,c)≥D(a,c)。
容易证明,d维空间的欧几里德距离为:
满足上述四个性质。更加广义的距离度量可用下式表示:
通常被称为LK范数。则欧几里德距离就是L2范数,L1范数也称为曼哈顿(Manhattan)距离。引入测度学习理论,充分利用训练数据的先验知识,有监督地从训练数据中得到新的距离测度,提高后续降维或者分类处理的性能。
测度学习(metric learning),即从问题本身的先验知识中有监督地学习到一个距离(distance)或者相似(similarity)测度。对于样本向量x和y的距离式d(x,y)(如欧几里德距离),测度学习即从原始数据样本中得到一个映射(mapping)关系f,建立一个更好的距离测度d(f(x),f(y))。测度学习的过程可以分为两个步骤:首先利用问题和数据本身的先验知识有监督的得到一个映射关系f,然后在投影(映射)后的样本空间,用原始距离测度(比如最常用的欧几里德测度)计算样本距离。
在距离测度学习(Distance Metric Learning,DML)中,通常将样本xi,xj间的距离定义为:
此种形式的距离测度称为马氏距离测度(Mahalanobis distance metric)。距离测度学习算法的主要问题就是从训练数据中得到一个合适的马氏测度矩阵M来计算样本之间的距。M表示任意一个半正定对称矩阵(positive semi-definite matrix),当M为单位矩阵时,上式即为欧几里德距离测度。
由于M为半正定对称矩阵,记M=ATA,A作为样本变换矩阵,则:
最优化马氏距离意义下的测度,即需要最小化同类样本之间距离,同时最大化异类样本之间距离,增加样本之间的类别辨别能力。因此,测度学习等价于通过对样本进行特征变换获取另一种更具类别区分性表示形式的问题。
4.半监督SVM
半监督支持向量机(S3VM)是支持向量机在半监督学习上的推广。在不考虑未标记样本时,支持向量机试图找到最大间隔划分超平面,而考虑未标记样本时,S3VM试图找到能将n类有标记样本分开,且穿过数据低密度区域的划分超平面,这是聚类假设在考虑了线性超平面划分后的推广。
本发明分类主要针对五分类问题,理论基础仍是二分类数学计算,形式化地说,给定Dl={(x1,y1),(x2,y2),…,(xl,yl)}和Du={xl+1,xl+2,…,xl+u},其中yi∈{-1,+1},l<<u,l+u=m。TSVM的学习目标是为Du的样本给出预测标记使得
s.t.yi(wTxi+b)≥1-ξi,i=1,2,…,l,
ξi≥0,i=1,2,…,m,
其中,(w,b)确定了一个划分超平面:ξ为松弛变量,ξi(i=1,2,…,l)对应于有标记样本,ξi(i=l+1,l+2,…,m)对应于未标记样本;Cl与Cu是由用户指定的用于平衡模型复杂度、有标记样本与未标记样本重要程度的折中参数。
在一个实例中,从每个类别中随机选取80%作为训练样本,其余作为测试样本,将80%的五类难度等级数据集(FiveS数据集)的标签信息根据测度学习有监督的得到新的距离测度DM=(xi-xj)TM(xi-xj),并用新的距离测度改进高斯径向基核函数,求解最优超平面的问题即为求解下列目标函数:
0≤αi≤C,i=1,...,p
其中
其中α是拉格朗日系数,C是错误分类的惩罚参数,KM是改进后的高斯径向基核函数,核函数表达式中的DM(xi,xj)是测度学习得到的距离测度。求解目标函数得到最优解选择α*的一个小于C的正分量并据此计算:并用one-versus-all方法将SVM扩展到多分类,基于网格搜索算法选择最优的核函数参数,建立多分类支持向量机模型,并对于待识别数字乐谱(20%的FiveS数据集)利用训练好的分类模型根据重新构造的决策函数判断出待分类数字乐谱所属的难度等级,并得到分类正确率。
具体地,对NineS数据集和FiveS数据集都进行难度等级特征的提取,并对两个特征空间M,N进行归一化处理,并进行数据清洗和数据不平衡化处理。之后根据两个数据集间的特征空间进行映射投影学习,即M=PN,学习到映射矩阵P,根据矩阵P对两个数据集中标签进行映射,即将NineS数据集中的九类难度等级标签转换成五类难度等级标签;将学习到五类难度等级标签的NineS数据集和80%的FiveS数据集根据测度学习有监督的得到新的距离测度DM=(xi-xj)TM(xi-xj),并用新的距离测度改进高斯径向基核函数,并用one-versus-all方法将SVM扩展到多分类,基于网格搜索算法选择最优的核函数参数,建立多分类支持向量机模型,并对于待识别数字乐谱利用训练好的分类模型根据重新构造的决策函数判断出待分类数字乐谱所属的难度等级,并得到分类正确率。
通过步骤4和步骤5的对比,步骤4中并未利用NineS中的九类难度等级标签,直接将其当做无标签数据进行五类难度等级标签的标记,而在步骤5中是根据NineS数据集和FiveS数据集的特征进行两个数据集间的映射,并利用两个特征空间的映射矩阵去实现两个数据集间的标签映射,在步骤5中使用到了NineS数据集的九类难度等级标签。可利用信息的增加和实现两个数据集间的映射会使分类正确有所提升。
Claims (6)
1.一种基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,包括下列步骤:
1)收集具有难度标签的实验数据源即两种不同评价体系下的数据集,针对难度等级要求有目的地采集难度相关特征,构成表征难度的特征向量,最后形成难度相关特征空间;
2)对提取到的特征数据进行归一化预处理、数据清洗,解决数据不平衡问题,并评估难度相关特征的有效性;
3)对其中一个数据集进行基于测度学习理论的有监督算法分类,获到分类正确率;
4)现已收集两个评价体系的数据集,不使用其中一个数据集的标签信息,利用此评价体系的数据去提升另一个评价体系下的数据集分类正确率;
5)学习两个评价体系下的数据集间联系,利用其中一个评价体系下的数据去提升另一个评价体系下的数据集分类正确率。
2.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤1)具体地,针对乐谱难度等级问题有目的的采集不同难度标签的钢琴乐谱数据集,并根据人为判断乐谱难度等级的准则,并结合数字乐谱相关信息,提取表征难度的特征向量,构成特征空间,并给数据集进行难度等级编号分别为1~m,m为自然数。
3.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤2)具体地,用Min-Max归一化方法,公式如下:
<mrow>
<msub>
<msup>
<mi>x</mi>
<mo>*</mo>
</msup>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mo>-</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
</mfrac>
</mrow>
将特征向量的值归一化到[0,1]区间,其中min和max分别表示特征xi的最小和最大值,表示特征xi经过归一化处理后的特征;
采用过采样oversampling方法解决数据不平衡问题,即重复利用数据较少的类别,以使得和数据多的类别之间达到平衡。
4.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤3)具体地,从每个类别中随机选取80%作为训练样本,其余作为测试样本,将80%的五类难度等级数据集的标签信息根据测度学习有监督的得到新的距离测度DM=(xi-xj)TM(xi-xj),并用新的距离测度改进高斯径向基核函数,求解最优超平面的问题即为求解下列目标函数:
<mrow>
<munder>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mi>&alpha;</mi>
</munder>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>&alpha;</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>p</mi>
</munderover>
<msub>
<mi>&alpha;</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>p</mi>
</munderover>
<msub>
<mi>&alpha;</mi>
<mi>i</mi>
</msub>
<msub>
<mi>&alpha;</mi>
<mi>j</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>j</mi>
</msub>
<msub>
<mi>K</mi>
<mi>M</mi>
</msub>
</mrow>
<mfenced open = "" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>s</mi>
<mo>.</mo>
<mi>t</mi>
<mo>.</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>p</mi>
</munderover>
<msub>
<mi>&alpha;</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
0≤αi≤C,i=1,...,p
其中
其中α是拉格朗日系数,C是错误分类的惩罚参数,KM是改进后的高斯径向基核函数,核函数表达式中的DM(xi,xj)是测度学习得到的距离测度,求解目标函数得到最优解选择α*的一个小于C的正分量并据此计算:并用one-versus-all方法将SVM扩展到多分类,基于网格搜索算法选择最优的核函数参数,建立多分类支持向量机模型,并对于待识别数字乐谱利用训练好的分类模型根据重新构造的决策函数判断出剩余20%待分类数字乐谱所属的难度等级,并得到分类正确率。
5.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤4)具体地,在步骤3中学习到多分类支持向量机模型,向此模型中输入NineS数据集的特征,即对NineS数据集进行五类难度等级标签的分类,得到五类难度等级标签的NineS数据集和80%的FiveS数据集的标签信息重复步骤3中的有监督学习过程,重新学习距离测度,建立新的多分类支持向量机模型,最后对20%的FiveS数据集利用新训练好的分类模型根据重新构造的决策函数判断出待分类数字乐谱所属的难度等级,并得到新的分类正确率。
6.如权利要求1所述的基于测度学习半监督的钢琴乐谱难度识别方法,其特征是,步骤5)具体地,对NineS数据集和FiveS数据集都进行了难度等级特征的提取并进行预处理后命名两个特征空间为M、N,对两个数据集的特征空间进行映射投影学习,即M=PN,学习到映射矩阵P,根据矩阵P对两个数据集中标签进行映射,即将NineS数据集中的九类难度等级标签转换成五类难度等级标签;将通过学习映射矩阵投影后学习到五类难度等级标签的NineS数据集和80%的FiveS数据集根据测度学习有监督的得到新的距离测度DM=(xi-xj)TM(xi-xj),并用新的距离测度改进高斯径向基核函数,并用one-versus-all方法将SVM扩展到多分类,基于网格搜索算法选择最优的核函数参数,建立多分类支持向量机模型,并对于待识别数字乐谱利用训练好的分类模型根据重新构造的决策函数判断出待分类数字乐谱所属的难度等级,并得到分类正确率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710942785.8A CN107909090A (zh) | 2017-10-11 | 2017-10-11 | 基于测度学习半监督的钢琴乐谱难度识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710942785.8A CN107909090A (zh) | 2017-10-11 | 2017-10-11 | 基于测度学习半监督的钢琴乐谱难度识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107909090A true CN107909090A (zh) | 2018-04-13 |
Family
ID=61841346
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710942785.8A Pending CN107909090A (zh) | 2017-10-11 | 2017-10-11 | 基于测度学习半监督的钢琴乐谱难度识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107909090A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019232928A1 (zh) * | 2018-06-05 | 2019-12-12 | 平安科技(深圳)有限公司 | 音乐模型训练、音乐创作方法、装置、终端及存储介质 |
CN110852181A (zh) * | 2019-10-18 | 2020-02-28 | 天津大学 | 基于注意力机制卷积神经网络钢琴乐谱难度识别方法 |
CN111737589A (zh) * | 2020-08-25 | 2020-10-02 | 北京圈清文化传媒有限公司 | 一种基于人工智能的推荐方法、装置及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130129202A1 (en) * | 2011-11-21 | 2013-05-23 | Nec Laboratories America, Inc. | Large-scale strongly supervised ensemble metric learning |
CN106529576A (zh) * | 2016-10-20 | 2017-03-22 | 天津大学 | 基于测度学习改进支持向量机的钢琴乐谱难度识别算法 |
-
2017
- 2017-10-11 CN CN201710942785.8A patent/CN107909090A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130129202A1 (en) * | 2011-11-21 | 2013-05-23 | Nec Laboratories America, Inc. | Large-scale strongly supervised ensemble metric learning |
CN106529576A (zh) * | 2016-10-20 | 2017-03-22 | 天津大学 | 基于测度学习改进支持向量机的钢琴乐谱难度识别算法 |
Non-Patent Citations (1)
Title |
---|
郭龙伟等: "基于测度学习支持向量机的钢琴乐谱难度等级识别", 《智能系统学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019232928A1 (zh) * | 2018-06-05 | 2019-12-12 | 平安科技(深圳)有限公司 | 音乐模型训练、音乐创作方法、装置、终端及存储介质 |
CN110852181A (zh) * | 2019-10-18 | 2020-02-28 | 天津大学 | 基于注意力机制卷积神经网络钢琴乐谱难度识别方法 |
CN111737589A (zh) * | 2020-08-25 | 2020-10-02 | 北京圈清文化传媒有限公司 | 一种基于人工智能的推荐方法、装置及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7362892B2 (en) | Self-optimizing classifier | |
Sharma et al. | Classification in pattern recognition: A review | |
US7724961B2 (en) | Method for classifying data using an analytic manifold | |
CN106529576A (zh) | 基于测度学习改进支持向量机的钢琴乐谱难度识别算法 | |
Tang et al. | Multi-label patent categorization with non-local attention-based graph convolutional network | |
CN109063743B (zh) | 基于半监督多任务学习的医疗数据分类模型的构建方法 | |
CN113887643B (zh) | 一种基于伪标签自训练和源域再训练的新对话意图识别方法 | |
CN110245693B (zh) | 结合混合随机森林的关键信息基础设施资产识别方法 | |
CN112529638B (zh) | 基于用户分类和深度学习的服务需求动态预测方法及系统 | |
CN107909090A (zh) | 基于测度学习半监督的钢琴乐谱难度识别方法 | |
CN110852181A (zh) | 基于注意力机制卷积神经网络钢琴乐谱难度识别方法 | |
CN109086794B (zh) | 一种基于t-lda主题模型的驾驶行为模式识方法 | |
CN112884570A (zh) | 一种模型安全性的确定方法、装置和设备 | |
Singh et al. | Speaker specific feature based clustering and its applications in language independent forensic speaker recognition | |
CN116842194A (zh) | 一种电力语义知识图谱系统及方法 | |
CN117151870A (zh) | 一种基于客群画像行为分析方法及系统 | |
Ali et al. | Fake accounts detection on social media using stack ensemble system | |
CN113837266A (zh) | 一种基于特征提取和Stacking集成学习的软件缺陷预测方法 | |
CN113469288A (zh) | 融合多个机器学习算法的高危人员预警方法 | |
Liu et al. | Fuzzy c-mean algorithm based on Mahalanobis distances and better initial values | |
CN111708865A (zh) | 一种基于改进XGBoost算法的技术预见及专利预警分析方法 | |
CN106529585A (zh) | 一种基于大间隔投影空间学习的钢琴乐谱难度识别方法 | |
CN110502669A (zh) | 基于n边dfs子图的轻量级无监督图表示学习方法及装置 | |
Mao et al. | Naive Bayesian algorithm classification model with local attribute weighted based on KNN | |
Ade | Students performance prediction using hybrid classifier technique in incremental learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180413 |