CN108805000A

CN108805000A - 电子装置、基于深度学习的乐谱识别方法及存储介质

Info

Publication number: CN108805000A
Application number: CN201810312430.5A
Authority: CN
Inventors: 刘奡智; 王健宗; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-04-09
Filing date: 2018-04-09
Publication date: 2018-11-13
Anticipated expiration: 2038-04-09
Also published as: WO2019196301A1; CN108805000B

Abstract

本发明公开了一种电子装置、基于深度学习的乐谱识别方法及存储介质，通过获取待判别音乐质量的乐谱中的音乐元素，将获取的音乐元素进行预处理，生成对应的音乐特征矩阵；将所述音乐特征矩阵代入预先确定的音乐力度标注模型进行识别，输出标注了音乐力度的乐谱；根据预先确定的音乐识别模型分析标注了音乐力度的乐谱，确定标注了音乐力度的乐谱是否符合预定义的音乐标准；若符合，则确定待判别音乐质量的乐谱合格，或者，若不符合，则确定待判别音乐质量的乐谱不合格。能够准确地识别出音乐作品的质量，且该方法简单灵活实用性强。

Description

电子装置、基于深度学习的乐谱识别方法及存储介质

技术领域

本发明涉及深度学习领域，尤其涉及一种电子装置、基于深度学习的乐谱识别方法及存储介质。

背景技术

目前，分析音乐作品的好坏，需要从专业角度讨论音乐最基本的元素和结构，例如和声、配器、旋律、调式、律动的特点等，这些通常是由专业的音乐人士根据多年积累的经验进行分析的，而对于普通的音乐爱好者或者音乐初学者来说，如何分析自己创作的音乐作品的好坏，存在一定的难度，严重影响学习兴趣以及学习效率。

发明内容

有鉴于此，本发明提出一种电子装置、基于深度学习的乐谱识别方法及存储介质，能够准确地识别出音乐作品的质量，且该方法简单灵活实用性强。

首先，为实现上述目的，本发明提出一种电子装置，所述电子装置包括存储器、及与所述存储器连接的处理器，所述处理器用于执行所述存储器上存储的基于深度学习的乐谱识别程序，所述基于深度学习的乐谱识别程序被所述处理器执行时实现如下步骤：

获取待判别音乐质量的乐谱中的音乐元素，将获取的音乐元素进行预处理，生成对应的音乐特征矩阵；

将所述音乐特征矩阵代入预先确定的音乐力度标注模型进行识别，输出标注了音乐力度的乐谱；

根据预先确定的音乐识别模型分析标注了音乐力度的乐谱，确定标注了音乐力度的乐谱是否符合预定义的音乐标准；

若符合，则确定待判别音乐质量的乐谱合格，或者，若不符合，则确定待判别音乐质量的乐谱不合格。

进一步地，所述音乐元素为音高以及音乐力度，所述将获取的音乐元素进行预处理，生成对应的音乐特征矩阵的步骤，包括：

将获取的音高与预定义的振动频率值进行匹配，匹配出各个音高对应的振动频率值；

将匹配之后的振动频率值用预定义音高标识方式进行标识；

根据预定义的时间间隔周期获取标识了音高的振动频率值，以及分别获取在各个所述预定义的时间间隔周期内的音高的数量；

根据获取的振动频率值以及获取的音高的数量生成二维矩阵，其中，所述二维矩阵的一个维度表示音高的数量及音高的标识，另一个维度表示预定义的时间间隔。

进一步地，所述音乐力度标注模型及所述音乐识别模型均为预先训练完成的生成式对抗网络，所述生成式对抗网络包括生成模型及判别模型；

所述生成模型用于标注音乐力度，所述判别模型用于识别乐谱是否符合音乐标准。

进一步地，所述生成模型为预先训练完成的基于卷积的神经网络，所述判别模型为基于所述卷积的神经网络训练得到的识别模型。

此外，为实现上述目的，本发明还提供一种基于深度学习的乐谱识别方法，该方法包括如下步骤：

将匹配之后的振动频率值用预定义音高标识方式进行标识；

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有基于深度学习的乐谱识别程序，所述基于深度学习的乐谱识别程序可被至少一个处理器执行，以使所述至少一个处理器执行如上述的基于深度学习的乐谱识别方法的步骤。

相较于现有技术，本发明所提出的电子装置、基于深度学习的乐谱识别方法及存储介质，通过获取待判别音乐质量的乐谱中的音乐元素，将获取的音乐元素进行预处理，生成对应的音乐特征矩阵；将所述音乐特征矩阵代入预先确定的音乐力度标注模型进行识别，输出标注了音乐力度的乐谱；根据预先确定的音乐识别模型分析标注了音乐力度的乐谱，确定标注了音乐力度的乐谱是否符合预定义的音乐标准；若符合，则确定待判别音乐质量的乐谱合格，或者，若不符合，则确定待判别音乐质量的乐谱不合格。能够准确地识别出音乐作品的质量，且该方法简单灵活实用性强。

附图说明

图1是本发明提出的电子装置一可选的硬件架构的示意图；

图2是本发明电子装置一实施例中基于深度学习的乐谱识别程序的程序模块示意图；

图3是本发明基于深度学习的乐谱识别方法较佳实施例的实施流程图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本发明中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

参阅图1所示，是本发明提出的电子装置一可选的硬件架构示意图。本实施例中，电子装置10可包括，但不仅限于，可通过通信总线14相互通信连接存储器11、处理器12、网络接口13。需要指出的是，图1仅示出了具有组件11-14的电子装置10，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

其中，存储器11至少包括一种类型的计算机可读存储介质，计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器11可以是电子装置10的内部存储单元，例如电子装置10的硬盘或内存。在另一些实施例中，存储器11也可以是电子装置10的外包存储设备，例如电子装置10上配备的插接式硬盘，智能存储卡(SmartMedia Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器11还可以既包括电子装置10的内部存储单元也包括其外包存储设备。本实施例中，存储器11通常用于存储安装于电子装置10的操作系统和各类应用软件，例如基于深度学习的乐谱识别程序等。此外，存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器12在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。处理器12通常用于控制电子装置10的总体操作。本实施例中，处理器12用于运行存储器11中存储的程序代码或者处理数据，例如运行的基于深度学习的乐谱识别程序等。

网络接口13可包括无线网络接口或有线网络接口，网络接口13通常用于在电子装置10与其他电子设备之间建立通信连接。

通信总线14用于实现组件11-13之间的通信连接。

图1仅示出了具有组件11-14以及基于深度学习的乐谱识别程序的电子装置10，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选地，电子装置10还可以包括用户接口(图1中未示出)，用户接口可以包括显示器、输入单元比如键盘，其中，用户接口还可以包括标准的有线接口、无线接口等。

可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED触摸器等。进一步地，显示器也可称为显示屏或显示单元，用于显示在电子装置10中处理信息以及用于显示可视化的用户界面。

在一实施例中，存储器11中存储的基于深度学习的乐谱识别程序被处理器12执行时，实现如下操作：

在一实施例中，所述音乐元素为音高以及音乐力度，所述将获取的音乐元素进行预处理，生成对应的音乐特征矩阵的步骤包括，将获取的音高与预定义的振动频率值(预定义有128个音高，每个音高均有三种表示方式)进行匹配，匹配出各个音高对应的振动频率值；

将匹配之后的振动频率值用预定义音高标识方式进行标识(例如预定义的音高标识方式为，C1,0,0表示在C1频率段没有音，C1,0,1表示在C1频率段的短促音，C1,1,1表示在C1频率段的延长音)；

在本实施例中，所述音乐力度标注模型及所述音乐识别模型均为预先训练完成的生成式对抗网络(GAN)，所述GAN网络包括生成模型(Generative Model)及判别模型(Discriminative Model)，所述生成模型用于标注音乐力度，所述判别模型用于识别乐谱是否符合音乐标准。

进一步地，在本实施例中，所述生成模型(Generative Model)为基于卷积的神经网络(CNN)，所述判别模型为基于所述卷积的神经网络训练得到的识别模型；

在另本实施例的一种实施方式中，所述生成模型(Generative Model)为LSTM长短记忆神经网络，所述判别模型为基于所述LSTM长短记忆神经网络训练得到的识别模型；

所述识别模型通常输出的值为一个概率函数值，通常该概率函数值符合正态概率分布，则表示识别结果符合预设的标准，该概率函数值不符合正态概率分布，则表示识别结果不符合预设的标准。

在本实施例中，假设以生成音乐为例说明GAN的原理，假设生成模型是一个音乐力度标注网络，它接收一个随机的声音Z，通过这个声音进行音乐力度的标注，记做G(Z)。识别模型是一个判别网络，判别标注的音乐力度是不是“符合演奏场景的”。它输入参数是X，X代表一首标注了音乐力度的音乐，输出D(X)代表X为符合演奏场景的音乐力度的概率，如果是1，就代表100％是真实的符合演奏场景的音乐力度的标注，而输出是0，就代表不可能是真实的符合演奏场景的音乐力度的标注。在训练过程中，生成网络的目标就是尽量生成真实的符合演奏场景的音乐力度的标注去欺骗判别网络。而判别网络的目标就是尽量把生成网络生成的标注了音乐力度的音乐分别出来，这样，生成网络和判别网络构成一个动态的“博弈过程”。在最理性的状态下，生成网络可以标注出以假乱真的音乐力度G(Z)。判别网络难以判定生成网络标注的音乐力度是不是符合真实演奏场景的，此时，D(G(Z))＝0.5，符合正态分布。

由上述事实施例可知，本发明提出的电子装置通过获取待判别音乐质量的乐谱中的音乐元素，将获取的音乐元素进行预处理，生成对应的音乐特征矩阵；将所述音乐特征矩阵代入预先确定的音乐力度标注模型进行识别，输出标注了音乐力度的乐谱；根据预先确定的音乐识别模型分析标注了音乐力度的乐谱，确定标注了音乐力度的乐谱是否符合预定义的音乐标准；若符合，则确定待判别音乐质量的乐谱合格，或者，若不符合，则确定待判别音乐质量的乐谱不合格。能够准确地识别出音乐作品的质量，且该方法简单灵活实用性强。

进一步需要说明的是，本发明的基于深度学习的乐谱识别程序依据其各部分所实现的功能不同，可用具有相同功能的程序模块进行描述。请参阅图2所示，是本发明电子装置一实施例中基于深度学习的乐谱识别程序的程序模块示意图。本实施例中，基于深度学习的乐谱识别程序依据其各部分所实现的功能的不同，可以被分割成获取模块201、识别模块202、分析模块203、确定模块204。由上面的描述可知，本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序更适合于描述基于深度学习的乐谱识别程序在电子装置10中的执行过程。所述模块201-204所实现的功能或操作步骤均与上文类似，此处不再详述，示例性地，例如其中：

获取模块201用于获取待判别音乐质量的乐谱中的音乐元素，将获取的音乐元素进行预处理，生成对应的音乐特征矩阵；

识别模块202用于将所述音乐特征矩阵代入预先确定的音乐力度标注模型进行识别，输出标注了音乐力度的乐谱；

分析模块203用于根据预先确定的音乐识别模型分析标注了音乐力度的乐谱，确定标注了音乐力度的乐谱是否符合预定义的音乐标准；

确定模块204用于确定若标注了音乐力度的乐谱符合预定义的音乐标准，则确定待判别音乐质量的乐谱合格，或者用于确定若标注了音乐力度的乐谱不符合预定义的音乐标准，则确定待判别音乐质量的乐谱不合格。

此外，本发明还提出一种基于深度学习的乐谱识别方法，请参阅图3所示，所述基于深度学习的乐谱识别方法包括如下步骤：

步骤S301，获取待判别音乐质量的乐谱中的音乐元素，将获取的音乐元素进行预处理，生成对应的音乐特征矩阵；

步骤S302，将所述音乐特征矩阵代入预先确定的音乐力度标注模型进行识别，输出标注了音乐力度的乐谱；

步骤S303，根据预先确定的音乐识别模型分析标注了音乐力度的乐谱，确定标注了音乐力度的乐谱是否符合预定义的音乐标准；

步骤S304，若符合，则确定待判别音乐质量的乐谱合格，或者，若不符合，则确定待判别音乐质量的乐谱不合格。

根据获取的振动频率值以及获取的音高的数量生成二维矩阵，其中，所述二维矩阵的一个维度表示音高的数量及音高的标识，另一个维度表示预定义的时间间隔

由上述事实施例可知，本发明提出的基于深度学习的乐谱识别方法通过获取待判别音乐质量的乐谱中的音乐元素，将获取的音乐元素进行预处理，生成对应的音乐特征矩阵；将所述音乐特征矩阵代入预先确定的音乐力度标注模型进行识别，输出标注了音乐力度的乐谱；根据预先确定的音乐识别模型分析标注了音乐力度的乐谱，确定标注了音乐力度的乐谱是否符合预定义的音乐标准；若符合，则确定待判别音乐质量的乐谱合格，或者，若不符合，则确定待判别音乐质量的乐谱不合格。能够准确地识别出音乐作品的质量，且该方法简单灵活实用性强。

此外，本发明还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有基于深度学习的乐谱识别程序，所述基于深度学习的乐谱识别程序被处理器执行时实现如下操作：

本发明计算机可读存储介质具体实施方式与上述电子装置以及基于深度学习的乐谱识别方法各实施例基本相同，在此不作累述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种电子装置，其特征在于，所述电子装置包括存储器、及与所述存储器连接的处理器，所述处理器用于执行所述存储器上存储的基于深度学习的乐谱识别程序，所述基于深度学习的乐谱识别程序被所述处理器执行时实现如下步骤：

2.如权利要求1所述的电子装置，其特征在于，所述音乐元素为音高以及音乐力度，所述将获取的音乐元素进行预处理，生成对应的音乐特征矩阵的步骤，包括：

将匹配之后的振动频率值用预定义音高标识方式进行标识；

3.如权利要求1所述的电子装置，其特征在于，所述音乐力度标注模型及所述音乐识别模型均为预先训练完成的生成式对抗网络；

所述生成式对抗网络包括生成模型及判别模型；

4.如权利要求3所述的电子装置，其特征在于，所述生成模型为预先训练完成的基于卷积的神经网络，所述判别模型为基于所述卷积的神经网络训练得到的识别模型。

5.如权利要求4所述的电子装置，其特征在于，所述生成模型为预先训练完成的LSTM长短记忆神经网络，所述判别模型为基于所述LSTM长短记忆神经网络训练得到的识别模型。

6.一种基于深度学习的乐谱识别方法，其特征在于，所述方法包括如下步骤：

7.如权利要求6所述的基于深度学习的乐谱识别方法，其特征在于，所述音乐元素为音高以及音乐力度，所述将获取的音乐元素进行预处理，生成对应的音乐特征矩阵的步骤，包括：

将匹配之后的振动频率值用预定义音高标识方式进行标识；

8.如权利要求6所述的基于深度学习的乐谱识别方法，其特征在于，所述音乐力度标注模型及所述音乐识别模型均为预先训练完成的生成式对抗网络；

所述生成式对抗网络包括生成模型及判别模型；

9.如权利要求8所述的基于深度学习的乐谱识别方法，其特征在于，所述生成模型为预先训练完成的基于卷积的神经网络，所述判别模型为基于所述卷积的神经网络训练得到的识别模型。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有基于深度学习的乐谱识别程序，所述基于深度学习的乐谱识别程序可被至少一个处理器执行，以使所述至少一个处理器执行如权利要求6-9中任一项所述的基于深度学习的乐谱识别方法的步骤。