CN105956014A

CN105956014A - 一种基于深度学习的音乐播放方法

Info

Publication number: CN105956014A
Application number: CN201610253698.7A
Authority: CN
Inventors: 汤影; 杨林
Original assignee: Chengdu Tuya Technology Co Ltd
Current assignee: Chengdu Tuya Technology Co Ltd
Priority date: 2016-04-22
Filing date: 2016-04-22
Publication date: 2016-09-21

Abstract

本发明公开了一种基于深度学习的音乐播放方法，包括以下步骤：S1.用户输入检索语音；S2.将输入的检索语音转换为文本内容，提取和记录检索语音的音乐旋律；S3.利用文本内容在音乐库中检索对应的歌曲；S4.判断检索得到的歌曲是否唯一；S5.将检索到的歌曲和检索语音的音乐旋律进行匹配，根据匹配程度的高低生成歌曲列表，用户选择目标音乐来进行播放；S6.根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习。本发明将检索语音转换为文本来进行歌曲检索，通过音乐旋律来判断检索到的歌曲匹配程度，提高检索的准确度，方便用户对音乐的选择；根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习，进一步提高了检索的准确性。

Description

一种基于深度学习的音乐播放方法

技术领域

本发明涉及一种基于深度学习的音乐播放方法。

背景技术

音乐是人情感的一种直接表现，在当今环境下，音乐已经成为人们生活必不可缺的一部分，音乐的获取和播放也越来越受到人们的重视。

现有技术中，大多数时候通过文字输入进行音乐搜索的播放，但是很多时候，这种音乐搜索和播放的方式并不方便，例如，开车时手动进行文字输入会影响安全；针对情况，基于语音识别进行音乐搜索的播放的技术也渐渐被研发出来，“听音识曲”成为了一种重要的音乐搜索方式，但现有的语音识别技术仅仅是将语音转换为文本进行搜索，并不涉及音乐旋律的检测，同时不同用户的语音习惯不同，也造成搜索不准确。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于深度学习的音乐播放方法，将检索语音转换为文本内容来进行歌曲检索，通过音乐旋律来判断检索到的歌曲匹配程度，能够显著提高检索的准确度，方便用户对音乐的选择；同时根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习，进一步提高了检索的准确性。

本发明的目的是通过以下技术方案来实现的：一种基于深度学习的音乐播放方法，包括以下步骤：

S1.用户输入检索语音；

S2.将输入的检索语音转换为文本内容，提取和记录检索语音的音乐旋律；

S3.利用文本内容在音乐库中检索对应的歌曲；

S4.判断检索得到的歌曲是否唯一；

（1）如果检索得到的音乐唯一，播放对应音乐；

（2）如果检索得到的音乐不唯一，跳转至步骤S5；

S5.将检索到的歌曲和检索语音的音乐旋律进行匹配，根据匹配程度的高低生成歌曲列表，用户选择目标音乐来进行播放；

S6.根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习。

步骤S1中，用户通过哼唱的方式输入检索语音。

所述的检索语音的持续输入时间不小于5秒。

所述的步骤S2包括以下子步骤：

S21.利用语音端点检测技术对检索语音进行分段，得到分段的检索语音；

S22.根据将分段的检索语音转换为文本内容；

S23.利用音乐旋律提取算法得到并记录检索语音的音乐旋律。

所述的步骤S5包括以下步骤：

S51.基于音乐旋律匹配算法，将检索到的每一首歌曲分别与检索语音进行音乐旋律匹配；

S52.将检索到的歌曲按照匹配程度从高到低的顺序排列，生成歌曲列表；

S53.用户选择目标音乐来进行播放。

所述的步骤S6包括以下子步骤：

S61.提取用户选择的目标音乐歌词中与检索语音对应的目标文本；

S63.将检索语音与目标文本进行匹配，得到用户对目标文本中每个文字发音习惯，并进行深度学习。

本发明的有益效果是：将检索语音转换为文本内容来进行歌曲检索，通过音乐旋律来判断检索到的歌曲匹配程度，能够显著提高检索的准确度，方便用户对音乐的选择；同时根据用户的检索语音和用户选择的目标音乐对用户语音习惯进行深度学习，进一步提高了检索的准确性。

附图说明

图1为本发明的流程图。

具体实施方式

下面结合附图进一步详细描述本发明的技术方案，但本发明的保护范围不局限于以下所述。

如图1所示，一种基于深度学习的音乐播放方法，其特征在于：

S1.用户输入检索语音；

S3.利用文本内容在音乐库中检索对应的歌曲；

S4.判断检索得到的歌曲是否唯一；

（1）如果检索得到的音乐唯一，播放对应音乐；

（2）如果检索得到的音乐不唯一，跳转至步骤S5；

步骤S1中用户通过哼唱的方式输入检索语音。

所述的检索语音的持续输入时间不小于5秒。

所述的步骤S2包括以下子步骤：

S22.根据将分段的检索语音转换为文本内容；

S23.利用音乐旋律提取算法得到并记录检索语音的音乐旋律。

所述的步骤S5包括以下步骤：

S53.用户选择目标音乐来进行播放。

所述的步骤S6包括以下子步骤：

实施例一，本实施例是通过安装于手机上的客户端来实现的，客户端通过无线网络连接到音乐库（音乐库中所有歌曲均具有歌词）；首先，用户进行检索语音输入时，客户端通过调用手机的拾音器件获得检索语音；将检索语音转换为文本内容，并利用音乐旋律提取算法得到并记录检索语音的音乐旋律，

进一步地，如果检索语音不进行分段，转换为的文本内容是一系列的文字，并没有分隔符号，故需要在转换为文本前利用语音端点检测技术对检索语音进行分段，分段后在进行文本转换。

在将检索语音转换为文本后，客户端在音乐库中检索：歌词带有相应文本的歌曲，如果得到的结果唯一，直接自动播放；如果得到的结果不唯一，则客户端通过音乐旋律匹配算法，将检索到的歌曲和检索语音的音乐旋律进行匹配，根据匹配程度的高低生成歌曲列表，用户选择目标音乐来进行播放。

由于不同的用户具有不同的发音习惯，如果按照标准发音进行文本转换，则并不能够很好给出用户需要的音乐，因此，需要对用户自身的发音习惯进行学习，例如，“四”、“十”、“是”这些文字不容易被分辨，在第一次出现时，客户端智能检索出所有可能供用户选择，并根据用户选择来确定用户实际上检索的是包含哪个文字的歌曲，得到用户对相应文字的习惯性发音，并进行深度学习；因此，本发明的方法使用时间越长，检索结果越准确。

Claims

1.一种基于深度学习的音乐播放方法，其特征在于：包括以下步骤：

S1.用户输入检索语音；

S3.利用文本内容在音乐库中检索对应的歌曲；

S4.判断检索得到的歌曲是否唯一；

（1）如果检索得到的音乐唯一，播放对应音乐；

（2）如果检索得到的音乐不唯一，跳转至步骤S5；

2.根据权利要求1所述的一种基于深度学习的音乐播放方法，其特征在于：步骤S1中，用户通过哼唱的方式输入检索语音。

3.根据权利要求2所述的一种基于深度学习的音乐播放方法，其特征在于：所述的检索语音的持续输入时间不小于5秒。

4.根据权利要求1所述的一种基于深度学习的音乐播放方法，其特征在于：所述的步骤S2包括以下子步骤：

S22.根据将分段的检索语音转换为文本内容；

S23.利用音乐旋律提取算法得到并记录检索语音的音乐旋律。

5.根据权利要求1所述的一种基于深度学习的音乐播放方法，其特征在于：所述的步骤S5包括以下步骤：

S53.用户选择目标音乐来进行播放。

6.根据权利要求1所述的一种基于深度学习的音乐播放方法，其特征在于：所述的步骤S6包括以下子步骤：