CN109935222B - 一种构建和弦转换向量的方法、装置及计算机可读存储介质 - Google Patents

一种构建和弦转换向量的方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN109935222B
CN109935222B CN201811409175.2A CN201811409175A CN109935222B CN 109935222 B CN109935222 B CN 109935222B CN 201811409175 A CN201811409175 A CN 201811409175A CN 109935222 B CN109935222 B CN 109935222B
Authority
CN
China
Prior art keywords
chord
sample
neural network
network model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811409175.2A
Other languages
English (en)
Other versions
CN109935222A (zh
Inventor
马丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
MIGU Culture Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
MIGU Culture Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, MIGU Culture Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811409175.2A priority Critical patent/CN109935222B/zh
Publication of CN109935222A publication Critical patent/CN109935222A/zh
Application granted granted Critical
Publication of CN109935222B publication Critical patent/CN109935222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种构建和弦转换向量方法、装置及计算机可读存储介质,所述方法包括:获取待分析的和弦样本;对所述待分析的和弦样本进行预处理,得到样本编码数据集;按照所述和弦样本的和弦进行的时序,将所述样本编码数据集输入神经网络模型进行训练,所述神经网络模型的输出为t时刻的预测和弦编码;根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量;获得满足预设训练质量时所述神经网络模型隐藏层的权值,作为和弦转换向量。

Description

一种构建和弦转换向量的方法、装置及计算机可读存储介质
技术领域
本发明涉及机器学习技术领域,尤其涉及一种构建和弦转换向量的方法、装置及计算机可读存储介质。
背景技术
现有技术中,现有的和弦分析都是基于符号形式表达来进行的,是人类在高层面的经验抽象总结。如果用机器来进行和旋数据的分析工作,需要将和弦数据的表达形式转换为数学的向量形式,以方便和弦数据的读取和计算。在智能音乐研究领域,尚没有成熟的技术方案能将和弦数据编码为向量(Vector)表示形式。若是基于人工定义规则的形式分析并处理和弦数据,需要丰富的乐理知识,并且处理效率极低。和弦数据缺乏转换为向量表示形式,在人工智能领域无法从数值分析的角度去处理原生形式为离散的和弦数据,并将其作为机器学习的资源数据。因此现有技术缺乏将不同的和弦转换为实现一种向量表示形式,不利于和弦数据应用于人工智能领域。
发明内容
为解决上述技术问题,本发明实施例提供了一种构建和弦转换向量的方法、装置及计算机可读存储介质。
本发明实施例提供的构建和弦转换向量的方法包括:
获取待分析的和弦样本;
对所述待分析的和弦样本进行预处理,得到样本编码数据集;
按照所述和弦样本的和弦进行的时序,将所述样本编码数据集输入神经网络模型进行训练,所述神经网络模型的输出为t时刻的预测和弦编码;
根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量;
获得满足预设训练质量时所述神经网络模型隐藏层的权值,作为和弦转换向量。
其中,所述对所述待分析的和弦样本进行预处理包括:
确定所述和弦样本的根音;
计算所述根音的频率;
基于所述根音,将所述和弦样本组成的音符进行归一化处理,得到归一化和弦;
基于十二平均律,将所述归一化和弦进行拆分,得到律制和弦;
对所述律制和弦进行独热编码,得到编码和弦;
将所述根音的频率与所述编码和弦组合,得到所述样本编码数据集;
其中,所述样本编码数据集按照预设比例分为样本编码训练集和样本编码验证集。
其中,所述将所述样本编码数据集输入神经网络模型进行训练包括:
将所述样本编码训练集输入所述神经网络模型,作为训练神经网络模型的神经元。
其中,所述将所述样本编码数据集输入神经网络模型进行训练还包括:
每隔预设训练间隔,计算所述神经网络模型在所述样本编码验证集上的和弦样本预测准确率;
当所述和弦样本预测准确率低于第一预测阈值时,判定神经网络模型输出的预测和弦编码的质量不合格;
当所述和弦样本预测准确率高于第二预测阈值时,判定所述预测和弦编码的质量合格。
其中,所述目标函数为:
L=Ε[||chord_predict(t)-chord_ground_truth(t)||2]
其中,chord_predict(t)为t时刻的预测和弦编码,chord_ground_trueth(t)为所述样本编码训练集中t时刻的和弦编码。
其中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量包括:
计算所述目标函数的当前计算值;
当所述目标函数的当前计算值低于第一损失阈值时,判定所述预测和弦编码合格;
当所述目标函数的当前计算值高于第二损失阈值时,判定所述预测和弦编码不合格。
其中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量还包括:
根据所述目标函数的当前计算值以及所述和弦样本预测准确率确定所述神经网络模型输出的预测和弦编码的质量。
本发明实施例提供了一种构建和弦转换向量的装置,所述装置包括:
样本获取模块,用于获取待分析的和弦样本;
预处理模块,用于对所述待分析的和弦样本进行预处理,得到样本编码数据集;
输入模块,用于按照所述和弦样本的和弦进行的时序,将所述样本编码数据集输入神经网络模型进行训练,所述神经网络模型的输出为t时刻的预测和弦编码;
确定模块,用于根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量;
输出模块,用于获得满足预设训练质量时所述神经网络模型隐藏层的权值,作为和弦转换向量。
其中,所述预处理模块中,所述对所述待分析的和弦样本进行预处理包括:
确定所述和弦样本的根音;
计算所述根音的频率;
基于所述根音,将所述和弦样本组成的音符进行归一化处理,得到归一化和弦;
基于十二平均律,将所述归一化和弦进行拆分,得到律制和弦;
对所述律制和弦进行独热编码,得到编码和弦;
将所述根音的频率与所述编码和弦组合,得到所述样本编码数据集;
其中,所述样本编码数据集按照预设比例分为样本编码训练集和样本编码验证集。
其中,所述输入模块中,所述将所述样本编码数据集输入神经网络模型进行训练包括:
将所述样本编码训练集输入所述神经网络模型,作为训练神经网络模型的神经元。
其中,所述输入模块中,所述将所述样本编码数据集输入神经网络模型进行训练还包括:
每隔预设训练间隔,计算所述神经网络模型在所述样本编码验证集上的和弦样本预测准确率;
当所述和弦样本预测准确率低于第一预测阈值时,判定神经网络模型输出的预测和弦编码的质量不合格;
当所述和弦样本预测准确率高于第二预测阈值时,判定所述预测和弦编码的质量合格。
其中,所述确定模块中,所述目标函数为:
L=Ε[||chord_predict(t)-chord_ground_truth(t)||2]
其中,chord_predict(t)为t时刻的预测和弦编码,chord_ground_trueth(t)为所述样本编码训练集中t时刻的和弦编码。
其中,所述确定模块中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量包括:
计算所述目标函数的当前计算值;
当所述目标函数的当前计算值低于第一损失阈值时,判定所述预测和弦编码合格;
当所述目标函数的当前计算值高于第二损失阈值时,判定所述预测和弦编码不合格。
其中,所述确定模块中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量还包括:
根据所述目标函数的当前计算值以及所述和弦样本预测准确率确定所述神经网络模型输出的预测和弦编码的质量。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现前述构建和弦转换向量的方法中任一项步骤。
本发明实施例的技术方案中,获取待分析的和弦样本;对所述待分析的和弦样本进行预处理,得到样本编码数据集;按照所述和弦样本的和弦进行的时序,将所述样本编码数据集输入神经网络模型进行训练,所述神经网络模型的输出为t时刻的预测和弦编码;根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量;获得满足预设训练质量时所述神经网络模型隐藏层的权值,作为和弦转换向量。如此,实现了构建和弦转换向量,让和弦数据用向量形式来表示,有利于将和弦数据应用于人工智能领域。
附图说明
附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例;
图1为本发明实施例的一种和弦转换为向量的映射关系示意图;
图2为本发明实施例的一种构建和弦转换向量的方法的流程示意图;
图3为本发明实施例的一种三层神经网络模型的结构示意图;
图4为本发明实施例的一种构建和弦转换向量的装置的结构示意图;
图5为本发明实施例的一种构建和弦转换向量的装置的结构示意图。
具体实施方式
为了能够更加详尽地了解本发明实施例的特点与技术内容,下面结合附图对本发明实施例的实现进行详细阐述,所附的附图仅供参考说明之用,并非用来限定本发明实施例。
本发明实施例提供了一种构建和弦(chord)转换向量(vector)的方法,利用神经网络的训练,将不同类型的和弦映射到N维向量空间中,每一个和弦视为该空间中的一个点(如图1所示,图1为将三个和弦转换为二维向量的示意图)。
本发明实施例提出一种构建和弦转换向量方法,是将符号表示的和弦(chord)转化为向量(vector)表示,并提供了基于神经网络的切实可行且简单高效的训练方法以实现该嵌入转换。基于深度学习的语言模型生成系统,神经网络可以以黑盒的方式在大量和弦样本中抽取特征信息,调整神经元权值,达到拟合样本的目的。而在该训练过程中,中间隐藏层(Hidden layer)输出的权值即是所需要获取的和弦转换向量。
图2为本发明实施例提供一种构建和弦转换向量的方法的流程示意图,如图2所示,所述方法包括以下步骤:
步骤201,获取待分析的和弦样本。
首先需要采集大量和弦数据作为和弦样本,并且该和弦数据集里的和弦序列需要符合音律规则,即需考虑和弦的和谐性,以及和弦序列走向的合理性。这里获取的来源可以选择现有的MIDI样本,例如公开的MIDI数据集Nottingham。
步骤202,对所述待分析的和弦样本进行预处理,得到样本编码数据集。
为了对和弦模式进行归一化处理便于机器理解,可以对从MIDI样本中采集到的和弦数据做预处理,形成样本编码数据集。
在一个实施例中,对所述待分析的和弦样本进行预处理包括:确定所述和弦样本的根音;计算所述根音的频率;基于所述根音,将所述和弦样本组成的音符进行归一化处理,得到归一化和弦;基于十二平均律,将所述归一化和弦进行拆分,得到律制和弦;对所述律制和弦进行独热编码,得到编码和弦;将所述根音的频率与所述编码和弦组合,得到所述样本编码数据集;其中,所述样本编码数据集按照预设比例分为样本编码训练集和样本编码验证集。具体地,将和弦数据表示为“根音频率”(浮点数,float)+“和弦模式”(独热编码,one-hot Encoding)。
“根音”为该和弦的根音在MIDI标准中的音符代码表达,如对于C调的三级和弦Em,其组成音符为3(咪)5(嗦),7(西),根音为C调的3(咪),则根据MIDI标准,其音符编码为78,根据频率计算公式:
(d-69)/12
f=2*440Hz
通过计算可得,根音为C调的3(咪)的根音频率表示为:739.98Hz。
“和弦模式”将常见的和弦进行模式化,可以归纳为[‘maj’,‘min’,’dim’,’aug’,‘sus2’,…..]等30多种模式。接着,基于这些模式统一将根音归一化为0,其余三音,五音等音符在维持音程不变的基础上做相应的调整,得到统一的模式,如Em小调和弦的组成音符为3(咪)5(嗦),7(西)在归一化后,得到[0,2,4]。再根据音律中的十二平均律进行拆分(考虑半音),得到最后的模式数据为[0,3,7],同理可得同为min和弦的Am和弦归一化后的和弦模式为也是[0,4,7],这样就完成了和弦模式的统一。
编码模式如表1所示:
模式名 数据
0 ‘maj’ [0,4,7]
1 ‘min’ [0,3,7]
2 ‘dim’ [0,3,6]
30 ‘7-13’ [0,4,7,10,20]
表1
为方便模型训练,将以上归一化后的向量进行独热编码(one-hot Encoding)。
结合上述两步,可将一个确切的和弦转化为浮点(float)变量+独热编码的形式进行表示。如Em和弦最终输入神经网络进行机器学习的表达形式为:(739.98,[0,0,0,0,1,….0])。如此。通过预处理得到了样本编码数据集,并将样本编码数据集按照预设比例(例如8:2)分为样本编码训练集和样本编码验证集。
这里虽然对和弦进行了符号化编码,然而该编码仍有缺点,例如:以割裂的个体数据来呈现,无法合理地展示出和弦之间的相关性;采用了浮点数及独热编码两种方式组合表达,缺乏统一性,不利于进一步的计算处理。然而此种编码组合方式具备基本的表义功能,足以让机器正确理解输入的和弦数据,因此可以作为神经网络模型的基础输入数据进行训练,最后抽取出本发明实施例需要得到的具有空间相关性的和弦向量。
步骤203,按照所述和弦样本的和弦进行的时序,将所述样本编码数据集输入神经网络模型进行训练,所述神经网络模型的输出为t时刻的预测和弦编码。
这里的神经网络模型可选用n层(n>=3)神经网络模型,下面仅以三层浅层神经网络举例,如图3所示,神经网络模型分为输入层,隐藏层和输出层。
输入层,简单地接受符号表达的和弦数据集,每次输入的和弦序列需要满足乐理层面的合理性,如:Am->Dm->G->C->Em->C…….或C->Am->G->….等和弦进行的时序进行输入。输入数据的格式为“根音频率+和弦模式”混合模式。如图3所示,输入层输入t-1、t+1、t+2时刻的和弦数据。
隐藏层,不同于自然语言处理,和弦的类别信息相对来说较少,所以这里与语言模型处理不一样:既可以简单地使用向量相加的高效计算方式也可以添加激活函数,对该层的输入数据做非线性变换,增加特征抽取的全面性。而隐藏层神经元的训练后权值即是本发明实施例最后需要得到的和弦向量。
输出层,输出的数据格式与输入层保持一致,输出t时刻的预测和弦编码,其由两个分支构成,一个分支基于回归模型(例如softmax函数)做独热编码的分类操作,另一个分支去拟合根音的浮点变量频率值,并同时参与到后续的目标函数计算中。
在一个实施例中,所述将所述样本编码数据集输入神经网络模型进行训练包括:将所述样本编码训练集输入所述神经网络模型,作为训练神经网络模型的神经元。
在一个实施例中,所述将所述样本编码数据集输入神经网络模型进行训练还包括:每隔预设训练间隔,计算所述神经网络模型在所述样本编码验证集上的和弦样本预测准确率;当所述和弦样本预测准确率低于第一预测阈值时,判定神经网络模型输出的预测和弦编码的质量不合格;当所述和弦样本预测准确率高于第二预测阈值时,判定所述预测和弦编码的质量合格。例如,设定训练每50个循环观察一次神经网络模型在样本编码验证集上的和弦样本预测准确率,少于60%为不合格,大于95%为合格或优秀。
步骤204,根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量。
在一个实施例中,目标函数可选为:
L=Ε[||chord_predict(t)-chord_ground_truth(t)||2]
其中,chord_predict(t)为t时刻的预测和弦编码,chord_ground_trueth(t)为所述样本编码训练集中t时刻的和弦编码。
目标函数或称为损失函数(loss function)其意义为:chord_predict(t)以及chord_ground_trueth(t)两者的L2距离(欧几里德距离)取期望值。
通常情况下,目标函数越接近零值,说明神经网络模型的拟合分布效果越好,隐藏层中抽取的稠密向量越能正确地体现出和弦之间的关系。具体的目标函数的判定阈值受训练集质量、大小、模型复杂度等外部条件影响,需要根据具体的应用场景来做分析。
在一个实施例中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量包括:计算所述目标函数的当前计算值;当所述目标函数的当前计算值低于第一损失阈值时,判定所述预测和弦编码合格;当所述目标函数的当前计算值高于第二损失阈值时,判定所述预测和弦编码不合格。例如,观察目标函数取值,若目标函数取值大于0.5为不合格,若目标函数取值小于0.0001为合格或优秀。
在一个实施例中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量还包括:根据所述目标函数的当前计算值以及所述和弦样本预测准确率确定所述神经网络模型输出的预测和弦编码的质量。
具体地,本发明实施例的样本训练以及训练质量的确定可按步骤S1-S5进行:
步骤S1:将样本编码训练集输入神经网络模型,作为训练神经网络模型的神经元。
步骤S2:每隔一定的训练间隔(例如设定为每50个循环)观察一次神经网络模型在样本编码验证集上的和弦样本预测准确率,少于60%为不合格,大于95%为合格或优秀。
步骤S3:观察目标函数取值,若目标函数取值大于0.5为不合格,若目标函数取值小于0.0001为合格或优秀,其中目标函数取值与神经网络模型的实现以及样本编码数据集的选取相关。
步骤S4:基于和弦样本预测准确率以及目标函数取值,确认神经网络模型的训练时长以及超参数是否合理。
步骤S5:若神经网络模型的训练时长以及超参数不合理,调节超参数的学习率。若和弦样本预测准确率以及目标函数取值震荡较大,则减小学习率;若和弦样本预测准确率以及目标函数取值趋于平滑但总体偏大不再下降,则增大学习率,同时返回步骤S2继续训练,以达到最佳的训练质量。
步骤205,获得满足预设训练质量时所述神经网络模型隐藏层的权值,作为和弦转换向量。
当训练质量达到预设标准时,例如目标函数的当前计算值小于0.0001且神经网络模型在样本编码验证集上和弦样本预测准确率大于95%时,提取此时隐藏层的权值,作为最终得到的和弦转换稠密向量Chord2Vector。
实施例一
1、实验模型:基于前述实施例的神经网络模型架构示意图搭建三层神经网络模型进行测试。
2、数据集:采用公开的MIDI数据集Nottingham作为训练数据,从Nottingham公开数据集中抽取出4000段和弦音轨片段,按照前述实施例中方式进行数据清洗和预编码。
3、关键实验环境设备:OS:Ubuntu 16.04;深度学习框架:tensorflow 1.2.1;显卡:NVIDIA1070ti(显存8G)。
4、训练结果:我们希望经过充分训练后,具备相似性的和弦在向量空间中的距离应该小于差异较大的和弦对应的向量距离,这里相似和弦取Bm和B7(两者可替代性较强),差异和弦取Bm和Am,训练效果如表2所示:
训练时长 Loss Dis_Bm_B7 Dis_Bm_Am
结果1 3小时20分 2.8839 0.7236 0.6668
结果2 8小时15分 1.3611 0.4090 0.7224
结果3 14小时15分 0.8735 0.1042 0.8670
结果4 26小时30分 0.2245 0.3566 0.8252
表2
表2中的第四列记录了神经网络计算出的Bm和弦与B7和弦的向量空间距离,第五列记录了Bm和弦和Am和弦的向量空间距离,实验目标希望前者的值越小越好,同时后者的值越大越好,从训练效果上看,“结果3”这一预期的。在“结果3”中抽取出来的和弦向量可以较为准确地体现和弦之间的关系,并用于进一步的计算训练。
本发明实施例的核心思想为:为了将和弦数据转化为低维、能体现相关性的向量表示,借助于神经网络搭建一个训练模型,该模型的训练输出并不是本发明所关注的重点,训练过程中隐藏层的节点权值构成的矩阵可以最大程度的模拟出需要的和弦向量空间的分布,该矩阵的每一行代表了本发明需要的指定和弦向量,行数则是和弦库的数量大小。本发明还能够通过构建多层神经网络,将和弦序列作为训练数据,逼近预测序列走向。
本发明通过一种构建和弦转换向量方法,将和弦数据转换为向量表示,在低维度连续向量空间中,不同和弦向量之间的距离(视应用场景的不同选择余弦距离,欧式距离等)可以直观地体现和弦数据之间的相关性及差异性,或定量地度量其关系,能简单高效地表征和弦数据之间的关系。基于指定海量乐谱数据库,度量和弦数据之间的相关性,以及从和弦数据的粒度来考察音乐,可以对音乐的旋律框架,情感倾向性等做出全面的分析,为智能谱曲、乐理分析、编曲等工作提供了一种全新的理论依据。
本发明通过一种构建和弦转换向量方法,将具有时序连续性、上下文相关性等特性的和弦进一步转换为向量。由于和弦在一定程度上具有可替换性,并且和弦数量相对于自然语言的语言词汇数量来说相对为小,因此本发明不用构建类似语言模型中常用的哈夫曼树编码和层级softmax(hierarchical softmax)结构,可以更为方便地构建分布稀疏数据的映射。
图4为本发明实施例提供了一种构建和弦转换向量的装置,如图4所示,构建和弦转换向量的装置400包括:
样本获取模块401,用于获取待分析的和弦样本;
预处理模块402,用于对所述待分析的和弦样本进行预处理,得到样本编码数据集;
输入模块403,用于按照所述和弦样本的和弦进行的时序,将所述样本编码数据集输入神经网络模型进行训练,所述神经网络模型的输出为t时刻的预测和弦编码;
确定模块404,用于根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量;
输出模块405,用于获得满足预设训练质量时所述神经网络模型隐藏层的权值,作为和弦转换向量。
在一个实施例中,预处理模块402中,所述对所述待分析的和弦样本进行预处理包括:确定所述和弦样本的根音;计算所述根音的频率;基于所述根音,将所述和弦样本组成的音符进行归一化处理,得到归一化和弦;基于十二平均律,将所述归一化和弦进行拆分,得到律制和弦;对所述律制和弦进行独热编码,得到编码和弦;将所述根音的频率与所述编码和弦组合,得到所述样本编码数据集;其中,所述样本编码数据集按照预设比例分为样本编码训练集和样本编码验证集。
在一个实施例中,输入模块403中,所述将所述样本编码数据集输入神经网络模型进行训练包括:将所述样本编码训练集输入所述神经网络模型,作为训练神经网络模型的神经元。
在一个实施例中,输入模块403中,所述将所述样本编码数据集输入神经网络模型进行训练还包括:每隔预设训练间隔,计算所述神经网络模型在所述样本编码验证集上的和弦样本预测准确率;当所述和弦样本预测准确率低于第一预测阈值时,判定神经网络模型输出的预测和弦编码的质量不合格;当所述和弦样本预测准确率高于第二预测阈值时,判定所述预测和弦编码的质量合格。
在一个实施例中,确定模块404中,所述目标函数为:
L=Ε[||chord_predict(t)-chord_ground_truth(t)||2]
其中,chord_predict(t)为t时刻的预测和弦编码,chord_ground_trueth(t)为所述样本编码训练集中t时刻的和弦编码。
在一个实施例中,确定模块404中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量包括:计算所述目标函数的当前计算值;当所述目标函数的当前计算值低于第一损失阈值时,判定所述预测和弦编码合格;当所述目标函数的当前计算值高于第二损失阈值时,判定所述预测和弦编码不合格。
在一个实施例中,确定模块404中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量还包括:根据所述目标函数的当前计算值以及所述和弦样本预测准确率确定所述神经网络模型输出的预测和弦编码的质量。
本领域技术人员应当理解,图4所示的构建和弦转换向量的装置中的各模块的实现功能可参照前述构建和弦转换向量的方法的相关描述而理解。图4所示的构建和弦转换向量的装置各模块的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
图5是本发明实施例的一种构建和弦转换向量的装置的结构示意图,图5所示的构建和弦转换向量的装置500设置在所述终端上,包括:至少一个处理器501、存储器502、用户接口503、至少一个网络接口504。构建和弦转换向量的装置500中的各个组件通过总线系统505耦合在一起。可理解,总线系统505用于实现这些组件之间的连接通信。总线系统505除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统505。
其中,用户接口503可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
本发明实施例中的存储器502用于存储各种类型的数据以支持构建和弦转换向量的装置500的操作。这些数据的示例包括:用于在构建和弦转换向量的装置500上操作的任何计算机程序,如操作系统5021和应用程序5022;其中,操作系统5021包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序5022可以包含各种应用程序,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序5022中。
上述本发明实施例揭示的方法可以应用于处理器501中,或者由处理器501实现。处理器501可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器501可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器502,处理器501读取存储器502中的信息,结合其硬件完成前述方法的步骤。
可以理解,存储器502可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可评论显示可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可评论显示可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器502旨在包括但不限于这些和任意其它适合类型的存储器。
基于本申请各实施例提供的构建和弦转换向量的方法,本申请还提供一种计算机可读存储介质,参照图5所示,所述计算机可读存储介质可以包括:用于存储计算机程序的存储器502,上述计算机程序可由构建和弦转换向量的装置500的处理器501执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、FlashMemory、磁表面存储器、光盘、或CD-ROM等存储器。
需要说明的是:本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (15)

1.一种构建和弦转换向量的方法,其特征在于,所述方法包括:
获取待分析的和弦样本;
对所述待分析的和弦样本进行预处理,得到样本编码数据集;
按照所述和弦样本的和弦进行的时序,将所述样本编码数据集输入神经网络模型进行训练,所述神经网络模型的输出为t时刻的预测和弦编码;
根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量;
获得满足预设训练质量时所述神经网络模型隐藏层的权值,作为和弦转换向量。
2.根据权利要求1所述的构建和弦转换向量的方法,其特征在于,所述对所述待分析的和弦样本进行预处理包括:
确定所述和弦样本的根音;
计算所述根音的频率;
基于所述根音,将所述和弦样本组成的音符进行归一化处理,得到归一化和弦;
基于十二平均律,将所述归一化和弦进行拆分,得到律制和弦;
对所述律制和弦进行独热编码,得到编码和弦;
将所述根音的频率与所述编码和弦组合,得到所述样本编码数据集;
其中,所述样本编码数据集按照预设比例分为样本编码训练集和样本编码验证集。
3.根据权利要求2所述的构建和弦转换向量的方法,其特征在于,所述将所述样本编码数据集输入神经网络模型进行训练包括:
将所述样本编码训练集输入所述神经网络模型,作为训练神经网络模型的神经元。
4.根据权利要求2所述的构建和弦转换向量的方法,其特征在于,所述将所述样本编码数据集输入神经网络模型进行训练还包括:
每隔预设训练间隔,计算所述神经网络模型在所述样本编码验证集上的和弦样本预测准确率;
当所述和弦样本预测准确率低于第一预测阈值时,判定神经网络模型输出的预测和弦编码的质量不合格;
当所述和弦样本预测准确率高于第二预测阈值时,判定所述预测和弦编码的质量合格。
5.根据权利要求4所述的构建和弦转换向量的方法,其特征在于,所述目标函数为:
L=E[||chord_predict(t)-chord_ground_truth(t)||2]
其中,chord_predict(t)为t时刻的预测和弦编码,chord_ground_trueth(t)为所述样本编码数据集中t时刻的和弦编码;E(X)表示期望函数。
6.根据权利要求5所述的构建和弦转换向量的方法,其特征在于,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量包括:
计算所述目标函数的当前计算值;
当所述目标函数的当前计算值低于第一损失阈值时,判定所述预测和弦编码合格;
当所述目标函数的当前计算值高于第二损失阈值时,判定所述预测和弦编码不合格。
7.根据权利要求4或6所述的构建和弦转换向量的方法,其特征在于,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量还包括:
根据所述目标函数的当前计算值以及所述和弦样本预测准确率确定所述神经网络模型输出的预测和弦编码的质量。
8.一种构建和弦转换向量的装置,其特征在于,所述装置包括:
样本获取模块,用于获取待分析的和弦样本;
预处理模块,用于对所述待分析的和弦样本进行预处理,得到样本编码数据集;
输入模块,用于按照所述和弦样本的和弦进行的时序,将所述样本编码数据集输入神经网络模型进行训练,所述神经网络模型的输出为t时刻的预测和弦编码;
确定模块,用于根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量;
输出模块,用于获得满足预设训练质量时所述神经网络模型隐藏层的权值,作为和弦转换向量。
9.根据权利要求8所述的构建和弦转换向量的装置,其特征在于,所述预处理模块中,所述对所述待分析的和弦样本进行预处理包括:
确定所述和弦样本的根音;
计算所述根音的频率;
基于所述根音,将所述和弦样本组成的音符进行归一化处理,得到归一化和弦;
基于十二平均律,将所述归一化和弦进行拆分,得到律制和弦;
对所述律制和弦进行独热编码,得到编码和弦;
将所述根音的频率与所述编码和弦组合,得到所述样本编码数据集;
其中,所述样本编码数据集按照预设比例分为样本编码训练集和样本编码验证集。
10.根据权利要求9所述的构建和弦转换向量的装置,其特征在于,所述输入模块中,所述将所述样本编码数据集输入神经网络模型进行训练包括:
将所述样本编码训练集输入所述神经网络模型,作为训练神经网络模型的神经元。
11.根据权利要求9所述的构建和弦转换向量的装置,其特征在于,所述输入模块中,所述将所述样本编码数据集输入神经网络模型进行训练还包括:
每隔预设训练间隔,计算所述神经网络模型在所述样本编码验证集上的和弦样本预测准确率;
当所述和弦样本预测准确率低于第一预测阈值时,判定神经网络模型输出的预测和弦编码的质量不合格;
当所述和弦样本预测准确率高于第二预测阈值时,判定所述预测和弦编码的质量合格。
12.根据权利要求11所述的构建和弦转换向量的装置,其特征在于,所述确定模块中,所述目标函数为:
L=E[||chord_predict(t)-chord_ground_truth(t)||2]
其中,chord_predict(t)为t时刻的预测和弦编码,chord_ground_trueth(t)为所述样本编码数据集中t时刻的和弦编码,E(X)表示期望函数。
13.根据权利要求12所述的构建和弦转换向量的装置,其特征在于,所述确定模块中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量包括:
计算所述目标函数的当前计算值;
当所述目标函数的当前计算值低于第一损失阈值时,判定所述预测和弦编码合格;
当所述目标函数的当前计算值高于第二损失阈值时,判定所述预测和弦编码不合格。
14.根据权利要求11或13所述的构建和弦转换向量的装置,其特征在于,所述确定模块中,所述根据所述神经网络模型的目标函数确定所述样本编码数据集的训练质量还包括:
根据所述目标函数的当前计算值以及所述和弦样本预测准确率确定所述神经网络模型输出的预测和弦编码的质量。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述构建和弦转换向量的方法的步骤。
CN201811409175.2A 2018-11-23 2018-11-23 一种构建和弦转换向量的方法、装置及计算机可读存储介质 Active CN109935222B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811409175.2A CN109935222B (zh) 2018-11-23 2018-11-23 一种构建和弦转换向量的方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811409175.2A CN109935222B (zh) 2018-11-23 2018-11-23 一种构建和弦转换向量的方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109935222A CN109935222A (zh) 2019-06-25
CN109935222B true CN109935222B (zh) 2021-05-04

Family

ID=66984657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811409175.2A Active CN109935222B (zh) 2018-11-23 2018-11-23 一种构建和弦转换向量的方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109935222B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539315B (zh) * 2020-04-21 2023-04-18 招商局金融科技有限公司 基于黑盒模型的模型训练方法、装置、电子设备及介质
CN114970651A (zh) * 2021-02-26 2022-08-30 北京达佳互联信息技术有限公司 和弦生成模型的训练方法、和弦生成方法、装置及设备
CN112989107B (zh) * 2021-05-18 2021-07-30 北京世纪好未来教育科技有限公司 音频分类和分离方法、装置、电子设备以及存储介质
CN113571030B (zh) * 2021-07-21 2023-10-20 浙江大学 一种基于听感和谐度评估的midi音乐修正方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1619640A (zh) * 2003-11-21 2005-05-25 先锋株式会社 自动乐曲分类设备与方法
CN101123085A (zh) * 2006-08-09 2008-02-13 株式会社河合乐器制作所 和弦名检测装置以及和弦名检测用程序
CN101473368A (zh) * 2006-07-28 2009-07-01 莫达特公司 用于产生代表具有键盘和弦的乐器的声音的信号的设备
JP4315180B2 (ja) * 2006-10-20 2009-08-19 ソニー株式会社 信号処理装置および方法、プログラム、並びに記録媒体
CN103714806A (zh) * 2014-01-07 2014-04-09 天津大学 一种结合svm和增强型pcp特征的和弦识别方法
CN104395953A (zh) * 2012-04-30 2015-03-04 诺基亚公司 来自音乐音频信号的拍子、和弦和强拍的评估
CN105976800A (zh) * 2015-03-13 2016-09-28 三星电子株式会社 电子装置和在电子装置中识别弦乐器演奏的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9715870B2 (en) * 2015-10-12 2017-07-25 International Business Machines Corporation Cognitive music engine using unsupervised learning

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1619640A (zh) * 2003-11-21 2005-05-25 先锋株式会社 自动乐曲分类设备与方法
CN101473368A (zh) * 2006-07-28 2009-07-01 莫达特公司 用于产生代表具有键盘和弦的乐器的声音的信号的设备
CN101123085A (zh) * 2006-08-09 2008-02-13 株式会社河合乐器制作所 和弦名检测装置以及和弦名检测用程序
JP4315180B2 (ja) * 2006-10-20 2009-08-19 ソニー株式会社 信号処理装置および方法、プログラム、並びに記録媒体
CN104395953A (zh) * 2012-04-30 2015-03-04 诺基亚公司 来自音乐音频信号的拍子、和弦和强拍的评估
CN103714806A (zh) * 2014-01-07 2014-04-09 天津大学 一种结合svm和增强型pcp特征的和弦识别方法
CN105976800A (zh) * 2015-03-13 2016-09-28 三星电子株式会社 电子装置和在电子装置中识别弦乐器演奏的方法

Also Published As

Publication number Publication date
CN109935222A (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
CN109935222B (zh) 一种构建和弦转换向量的方法、装置及计算机可读存储介质
Yu et al. Deep attention based music genre classification
Bretan et al. A unit selection methodology for music generation using deep neural networks
US20210264277A1 (en) Hierarchical system and method for generating intercorrelated datasets
Shi et al. Symmetry in computer-aided music composition system with social network analysis and artificial neural network methods
Micchi et al. A deep learning method for enforcing coherence in Automatic Chord Recognition.
CN115905528A (zh) 具有时序特征的事件多标签分类方法、装置及电子设备
CN110019796A (zh) 一种用户文本信息分析方法及装置
CN112990530B (zh) 区域人口数量预测方法、装置、电子设备和存储介质
Madhavi et al. Multivariate deep causal network for time series forecasting in interdependent networks
Wu et al. The power of fragmentation: a hierarchical transformer model for structural segmentation in symbolic music generation
Arronte Alvarez et al. Distributed vector representations of folksong motifs
Bretan et al. Learning and evaluating musical features with deep autoencoders
Liu [Retracted] Research on Piano Performance Optimization Based on Big Data and BP Neural Network Technology
Fernandes et al. Enhanced deep hierarchal GRU & BILSTM using data augmentation and spatial features for tamil emotional speech recognition
Chang et al. [Retracted] Application of Hidden Markov Model in Financial Time Series Data
Gajjar et al. E-mixup and siamese networks for musical key estimation
CN115762657A (zh) 一种基于化学元素知识图谱与官能团提示的分子性质预测方法
CN109102006A (zh) 一种基于音频特征诱导信息增强的音乐自动标记方法
CN114819392A (zh) 一种基于用户聚类扩展数据的用电预测方法
CN113268628A (zh) 一种基于模块化的加权融合神经网络的音乐情感识别方法
Qin et al. Bar transformer: a hierarchical model for learning long-term structure and generating impressive pop music
Yang et al. Differentiated analysis for music traffic in software defined networks: A method of deep learning
Hao Online piano learning game design method: Piano music style recognition based on CRNNH
Remesh et al. Symbolic domain music generation system based on LSTM architecture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant