CN111309959B

CN111309959B - 歌曲推荐方法和装置

Info

Publication number: CN111309959B
Application number: CN202010084450.9A
Authority: CN
Inventors: 陈卓华; 刘红岩
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2020-02-10
Filing date: 2020-02-10
Publication date: 2023-08-18
Anticipated expiration: 2040-02-10
Also published as: CN111309959A

Abstract

本申请提供一种歌曲推荐方法和装置。所述方法包括：获取用户歌唱的N首歌曲的乐器数字接口序列，并根据用户歌唱的N首歌曲的乐器数字接口序列和其对应的每首歌曲的标准乐器数字接口序列，获取用户歌唱能力模型；以及根据歌曲的标准乐器数字接口序列获取N首歌曲中每首歌曲的歌曲演唱能力模型；然后根据所述歌曲演唱能力模型以及用户歌唱能力模型，获取用户对于歌曲的声学匹配度；再根据用户对歌曲的声学匹配度、用户的偏好向量和N首歌曲中每首歌曲的特征向量，获得用户对歌曲的偏好打分模型；最后根据偏好打分模型，获取该用户的未歌唱歌曲的推荐结果，推荐结果与用户的偏好更匹配，提高了歌曲推荐的准确性。

Description

歌曲推荐方法和装置

技术领域

本申请实施例涉及信息处理技术领域，尤其涉及一种歌曲推荐方法和装置。

背景技术

在线唱歌平台是近年来迅速兴起的提供在线唱歌以及后期声音处理工具的平台，平台中有数十万首涵盖各个国家地区各类风格的歌曲可以被用户演唱。在这些平台中为用户提供精准的歌曲推荐，对提升平台歌曲作品发布数量、提高用户对平台的信耐度十分重要。

现有的歌曲推荐方法主要是根据用户的歌唱能力与歌曲匹配度，为用户推荐唱歌歌曲。其中，匹配度的实现主要是通过让用户演唱不同的音调和响度组合，根据声学领域专家的意见构建该用户的声学范围模型；以及通过声学领域专家对歌曲中特定音调和响度组合的出现时长进行分析，对所有歌曲构建演唱能力模型；然后根据用户声学范围模型和歌曲的歌曲演唱能力模型中，提取出每一对音调和响度在歌曲演唱能力模型中出现的频率、在用户声学范围模型中对应的声音质量等特征，将这些特征输入一个排序学习模型，最终确定用户的歌唱能力与歌曲匹配度，根据匹配度确定是否为用户推荐唱歌该歌曲。但是上述方法推荐的歌曲仍然存在不准确的问题。

发明内容

本申请实施例提供一种歌曲推荐方法和装置，以解决现有技术中所述方法推荐的歌曲准确性较低的问题。

第一方面，本申请实施例提供一种歌曲推荐方法，包括：获取用户歌唱的N首歌曲的乐器数字接口序列，N为大于等于1的整数，并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型；获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，其中，所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的；根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述N首歌曲中每首歌曲的声学匹配度；根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获得所述用户对歌曲的偏好打分模型；根据所述用户对歌曲的偏好打分模型，获取所述用户的未歌唱歌曲的推荐结果。

可选地，声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关；所述根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获得所述用户对歌曲的偏好打分模型，包括：获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量；根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量，获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数；根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数，获得所述用户对歌曲的偏好打分模型，其中，所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型，输出为偏好打分。

可选地，根据所述用户对歌曲的偏好打分模型，获取针对所述用户的未歌唱歌曲的推荐结果，包括：根据所述用户对歌曲的偏好打分模型，获取所述用户多首未歌唱的歌曲的偏好打分；将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲，M为大于等于1的整数。

可选地，获取所述N首歌曲中每首歌曲的标准乐器数字接口序列，包括：获取多个不同用户歌唱的同一歌曲的乐器数字接口序列；根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列，获取所述同一歌曲的标准乐器数字接口序列。

可选地，所述获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，包括：根据所述歌曲的标准乐器数字接口序列，确定所述歌曲的演唱情景为K个演唱情景，K为大于等于1的整数；根据所述歌曲的标准乐器数字接口序列，获取K个演唱情景中每个所述演唱情景出现的次数；将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型；其中，所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。

可选地，所述根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型，包括：根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得P个不同的演唱情景中每个演唱情景的平均歌唱误差，所述P个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的，P为大于等于1的整数；将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。

可选地，根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得多个不同的演唱情景中每个演唱情景的平均歌唱误差，包括：根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景，获取所述P个不同的演唱情景中每个演唱情景出现的次数；根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列，确定所述每个演唱情景的总歌唱误差；根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差，获取每个演唱情景的平均歌唱误差。

第二方面，本申请实施例提供一种歌曲推荐装置，包括：

获取模块，用于获取用户歌唱的N首歌曲的乐器数字接口序列，N为大于等于1的整数，并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型；以及获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，其中，所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的；

处理模块，用于根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述N首歌曲中每首歌曲的声学匹配度；以及根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获得所述用户对歌曲的偏好打分模型；

推荐模块，用于根据所述用户对歌曲的偏好打分模型，获取所述用户的未歌唱歌曲的推荐结果。

可选地，声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关；所述处理模块，具体用于：获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量；根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量，获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数；根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数，获得所述用户对歌曲的偏好打分模型，其中，所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型，输出为偏好打分。

可选地，所述推荐模块，具体用于：根据所述用户对歌曲的偏好打分模型，获取所述用户多首未歌唱的歌曲的偏好打分；将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲，M为大于等于1的整数。

可选地，所述获取模块，具体用于：获取多个不同用户歌唱的同一歌曲的乐器数字接口序列；根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列，获取所述同一歌曲的标准乐器数字接口序列。

可选地，所述获取模块，具体用于：根据所述歌曲的标准乐器数字接口序列，确定所述歌曲的演唱情景为K个演唱情景，K为大于等于1的整数；根据所述歌曲的标准乐器数字接口序列，获取K个演唱情景中每个所述演唱情景出现的次数；根据所述K个演唱情景中每个演唱情景的次数，将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型；其中，所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。

可选地，所述获取模块，具体用于：根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得P个不同的演唱情景中每个演唱情景的平均歌唱误差，所述P个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的，P为大于等于1的整数；根据所述多个不同的演唱情景中每个演唱情景的平均歌唱误差，将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。

可选地，所述处理模块，具体用于：根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景，获取所述P个不同的演唱情景中每个演唱情景出现的次数；根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列，确定所述每个演唱情景的总歌唱误差；根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差，获取每个演唱情景的平均歌唱误差。

第三方面，本申请实施例提供一种电子设备，包括：

存储器，用于存储程序指令；

处理器，用于调用并执行所述存储器中的程序指令，执行如本申请第一方面所述的歌曲推荐方法。

第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如本申请第一方面所述的歌曲推荐方法。

第五方面，本申请实施例提供一种程序产品，所述程序产品包括计算机程序，所述计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得电子设备实施如第一方面本申请实施例所述的歌曲推荐方法。

本申请实施例提供的一种歌曲推荐方法和装置，通过获取用户歌唱的N首歌曲的乐器数字接口序列，N为大于等于1的整数，并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型；以及获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，其中，所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的；然后根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述N首歌曲中每首歌曲的声学匹配度；再根据所述用户对所述N首歌曲的声学匹配度与矩阵分解推荐模型，获得所述用户对歌曲的偏好打分模型；最后根据所述用户对歌曲的偏好打分模型，获取针对所述用户的未歌唱歌曲的推荐结果。因此，本实施例是通过确定用户对歌曲的偏好来确定该用户的未歌唱歌曲推荐结果，推荐结果与用户的偏好更匹配，提高了歌曲推荐的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的应用场景示意图；

图2为本申请一实施例提供的歌曲推荐方法的流程示意图；

图3为本申请一实施例提供的歌曲推荐装置的结构示意图；

图4为本申请一实施例提供的电子设备的结构示意图；

图5为本申请另一实施例提供的终端设备的结构示意图；

图6为本申请另一实施例提供的服务器的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

现有技术中的歌曲推荐方法是通过根据用户的歌唱能力与歌曲匹配度为用户推荐唱歌歌曲。其中，匹配度的实现主要是通过让用户演唱不同的音调和响度组合，根据声学领域专家的意见构建该用户的声学范围模型；以及通过声学领域专家对歌曲中特定音调和响度组合的出现时长进行分析，对所有歌曲构建演唱能力模型；然后根据用户声学范围模型和歌曲的歌曲演唱能力模型中，提取出每一对音调和响度在歌曲演唱能力模型中出现的频率、在用户声学范围模型中对应的声音质量等特征，将这些特征输入一个排序学习模型，最终确定用户的歌唱能力与歌曲匹配度，根据匹配度确定是否为用户推荐唱歌该歌曲。但是上述方法推荐的歌曲仍然存在不准确的问题。

基于该技术问题，本申请主要从考虑了用户的歌唱能力与歌曲匹配度以及用户对歌曲的兴趣两方面的影响因素。其中，用户的歌唱能力与歌曲匹配度的实现是通过自动建模的方法来实现，即通过获取用户歌唱歌曲的乐器数字接口序列，并根据所述用户歌唱歌曲的乐器数字接口序列和所述歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型；以及获取所述歌曲中每首歌曲的歌曲演唱能力模型，其中，所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的；再根据所述歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述歌曲中每首歌曲的声学匹配度；然后根据用户对歌曲的声学匹配度与用户对歌曲的兴趣，获得所述用户对歌曲的偏好打分模型；最后根据所述用户对歌曲的偏好打分模型，获取针对所述用户的未歌唱歌曲的推荐结果。因此，该方法通过确定用户对歌曲的偏好来确定该用户的未歌唱歌曲推荐结果，推荐结果与用户的偏好更匹配，提高了歌曲推荐的准确性。

本申请实施例可以应用于服务器中，图1为本申请一实施例提供的应用场景示意图，如图1所示，用户在打开终端设备上安装的有关歌曲推荐的应用程序后，该终端设备会主动显示该用户未歌唱的歌曲的推荐结果，或者，在用户通过操作终端设备需要获取未歌唱的歌曲的推荐结果时，终端设备显示该用户未歌唱的歌曲的推荐结果。其中，该推荐结果是由服务器发送给相应的终端设备，该终端设备接收推荐结果并显示该推荐结果，用户可根据该推荐结果获取其所想要演唱的歌曲。其中，终端设备可以是包括：计算机、手机、平板电脑、可穿戴设备等，对此本申请不做限制。

本申请结合如下几个具体的实施例，对服务器如何获取推荐结果的技术方案进行描述，需要说明的是，在一些实施例中，可以是终端设备通过如下几个实施例来获取推荐结果。

图2为本申请一实施例提供的歌曲推荐方法的流程示意图，如图2所示，本申请实施例的方法可以包括：

S201、获取用户歌唱的N首歌曲的乐器数字接口序列，N为大于等于1的整数，并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型。

根据用户歌唱的N首歌曲，从每一首歌曲对应的音频文件中每间隔一定时间(例如200毫秒)提取演唱该首歌曲的用户的声音频率，并将该频率转换为数字接口，然后将该首歌曲中所有频率所转换的数字接口组成为一个序列，该序列即为该首歌曲对应的乐器数字接口(musical instrument digital interface)序列，依次类推，就可获取用户歌唱的N首歌曲的乐器数字接口序列。

例如，假设在线唱歌平台上用户集合为：用户歌唱的N首歌曲集合为：/>其中n和N分别为用户的个数和用户歌唱的歌曲个数。用户集合/>中的每一个用户u_i已经在上述平台中演唱过若干首歌曲作品。其中，第i个用户所演唱的歌曲集合可以表示为/>演唱过第j首歌曲/>的用户集合可以表示为/>

对某一用户u_i，根据该用户u_i所演唱的歌曲s_j，从歌曲s_j对应的音频文件中每间隔例如200毫秒提取演唱该首歌曲s_j的用户u_i的声音频率，并将该频率转换为数字接口，然后将该首歌曲s_j中所有频率所转换的数字接口组成为一个序列，那么该序列即为歌曲s_j对应的乐器数字接口序列，歌曲s_j对应的乐器数字接口序列可以表示为：M_i,j＝<m_ij1，m_ij2，…,m_ijk，…,m_ijLj>，其中，M_i,j表示用户u_i所演唱的歌曲s_j对应的乐器数字接口序列；L_j表示歌曲s_j的长度，m_ijk表示用户u_i所演唱的歌曲s_j对应的第k个乐器数字接口序列，k＝1，2，…，L_j。

将通过上述方法所获取的用户歌唱的N首歌曲的乐器数字接口序列和N首歌曲中每首歌曲的标准乐器数字接口序列进行对比处理，以获取用户的用户歌唱能力模型。例如，对于用户u_i，将通过上述方法所获取的用户u_i所演唱的歌曲s_j对应的乐器数字接口序列M_i,j以及歌曲s_j对应的标准数字接口序列M_j ^*进行对比处理，可获取到用户u_i的歌唱能力模型PU_i。

S202、获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，其中，所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的。

根据用户所歌唱的N首歌曲中每首歌曲的标准乐器数字接口序列，获取用户所歌唱的N首歌曲中每首歌曲的歌曲演唱能力模型。例如，对于歌曲s_j，可根据用户u_i所歌唱的歌曲s_j对应的标准乐器数字接口序列M_j ^*，获取用户u_i所歌唱的歌曲s_j的歌曲演唱能力模型PS_j。

S203、根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述N首歌曲中每首歌曲的声学匹配度。

该步骤中，可根据S201中所获取的用户的用户歌唱能力模型以及S202中所获取的所述N首歌曲中每首歌曲的歌曲演唱能力模型，并对该两种模型进行相应的处理，以获取用户对所述N首歌曲中每首歌曲的声学匹配度。

例如，根据用户u_i所歌唱的歌曲s_j的歌曲演唱能力模型PS_j以及用户u_i的歌唱能力模型PU_i，可获取用户u_i对所歌唱的歌曲s_j的声学匹配度，该声学匹配度可以用VC_i,j来表示。

S204、根据所述用户对所述N首歌曲的声学匹配度与、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获得所述用户对歌曲的偏好打分模型。

根据S203中所获取的用户对所述N首歌曲中每首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获取所述用户对歌曲的偏好打分模型。其中，用户的偏好向量和所述N首歌曲中每首歌曲的特征向量主要用于表示用户对所歌唱的歌曲的兴趣。

例如，根据S203中所获取的用户u_i对所歌唱的歌曲s_j的声学匹配度VC_i,j、用户的偏好向量U_i和所述N首歌曲中每首歌曲的特征向量V_i，可获取用户u_i对所歌唱的歌曲s_j的偏好打分模型R_ij。即用户u_i对所歌唱的歌曲s_j的偏好打分模型R_ij可以简单的表示为R_ij＝f(声学匹配度VC_i,j，用户的偏好向量U_i，N首歌曲中每首歌曲的特征向量V_i)。

S205、根据所述用户对歌曲的偏好打分模型，获取针对所述用户的未歌唱歌曲的推荐结果。

根据S203中所获取的所述用户对歌曲的偏好打分模型，获取该用户未歌唱过的歌曲的推荐结果。可选的，若上述实施例所述方法的执行主体为服务器，将推荐结果发送给相应的终端设备，由该终端设备显示推荐结果给用户；若上述实施例所述方法的执行主体为终端设备，则可通过该终端设备直接显示推荐结果给用户。其中，所述终端设备可以为电脑、手机、平板电脑、可穿戴设备等，对此，本申请不做限制。

本实施例中，通过获取用户歌唱的N首歌曲的乐器数字接口序列，N为大于等于1的整数，并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型；以及获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，其中，所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的；然后根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述N首歌曲中每首歌曲的声学匹配度；再根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获得所述用户对歌曲的偏好打分模型；最后根据所述用户对歌曲的偏好打分模型，获取针对所述用户的未歌唱歌曲的推荐结果。因此，本实施例是通过确定用户对歌曲的偏好来确定该用户的未歌唱歌曲推荐结果，推荐结果与用户的偏好更匹配，提高了歌曲推荐的准确性。

可选地，上述实施例S201中的所述获取N首歌曲中每首歌曲的标准乐器数字接口序列的一种可能的实现方式包括：S201a-S201b。

S201a、获取多个不同用户歌唱的同一歌曲的乐器数字接口序列。

根据上述实施例中所描述的方法，针对某一首歌曲s_j，可从多个不同用户所歌唱的歌曲s_j的音频文件中每间隔例如200毫秒提取演唱歌曲s_j的多个不同用户的声音频率，然后将该频率转换为数字接口序列，该数字接口序列即为多个不同用户歌唱的同一首歌曲s_j对应的乐器数字接口序列。

S201b、根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列，获取所述同一歌曲的标准乐器数字接口序列。

根据S201a中所获取的多个不同用户歌唱的同一歌曲s_j的乐器数字接口序列，对多个不同用户歌唱的歌曲s_j的乐器数字接口序列中同一位置的乐器数字接口取中位数，从而得到该首歌曲s_j对应的标准乐器数字接口序列。针对用户u_i，用户u_i所歌唱的歌曲s_j会有多个乐器数字接口，多个乐器数字接口就可组成该首歌曲s_j的乐器数字接口序列；那么对于对多个用户，对多个用户所歌唱的歌曲s_j的相同位置处的乐器数字接口进行比较，获取该位置处的多个不同用户歌唱的歌曲s_j的乐器数字接口中中间位置所对应的乐器数字接口作为该首歌曲s_j的相同位置处的乐器数字接口，例如，对多个不同用户所歌唱的歌曲s_j的第一个位置处对应的多个乐器数字接口进行比较，获取第一个位置处对应的多个乐器数字接口中最中间的一个乐器数字接口，并将该乐器数字接口作为该首歌曲s_j的第一个位置处的乐器数字接口；以此类推，可获取多个用户歌唱的歌曲s_j的每一个位置处的乐器数字接口，然后将获取的为中位数的乐器数字接口按照相应的顺序组成一个新的乐器数字接口序列，该乐器数字接口序列即为该首歌曲s_j对应的标准乐器数字接口序列。可选地，上述的中位数可以替换为最小数或最大数或平均数，此处不做限定。

具体地，歌曲s_j的标准乐器数字接口序列M_j ^*可根据如下公式一确定。

公式一中，M_j ^*表示多个不同用户歌唱的同一歌曲s_j的标准乐器数字接口序列；L_j表示歌曲s_j的长度；m_ijk表示用户u_i所演唱的歌曲s_j对应的第k个乐器数字接口序列，k＝1，2，…，L_j；u_i表示第i个用户；表示演唱过第j首歌曲/>的用户集合，且/>

可选地，上述实施例S201中的所述获取N首歌曲中每首歌曲的标准乐器数字接口序列的另一种可能的实现方式为：

可根据同一首歌曲s_j对应的原唱歌曲(原始歌唱人所歌唱的标准歌曲)的乐器数字接口序列，获取N首歌曲中每首歌曲的标准乐器数字接口序列。例如，从原始歌曲的音频文件中每间隔一定时间(例如200毫秒)提取原始歌唱人的声音频率，并将该声音频率转换为数字接口，然后将该首歌曲s_j对应的原唱歌曲中的所有频率所转换的数字接口组成为一个序列，该序列即为该首歌曲s_j对应的标准乐器数字接口序列。

可选地，上述实施例中S202的一种可能的实现方式包括：S202a-S202c。

S202a、根据所述N首歌曲中每首歌曲的标准乐器数字接口序列，确定所述N首歌曲中每首歌曲的演唱情景为K个演唱情景，K为大于等于1的整数；其中，所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。

针对某一首歌曲s_j，根据上述实施例中所获取的所述歌曲的标准乐器数字接口序列，获取歌曲s_j的演唱情景，记为K个演唱情景，K为大于等于1的整数。其中，所述演唱情景可以定义为用户u_i在演唱完第l个乐器数字接口后立刻演唱第k个乐器数字接口，即一个演唱情景由乐器数字接口序列中相邻的两个乐器数字接口确定。例如，若歌曲sj对应有10个乐器数字接口，由于相邻两个乐器数字接口组成一个演唱情景，则该首歌曲sj的演唱情景有9个，若该9个演唱情景中有两个演唱情景相同，则该首歌曲s_j的不同的演唱情景对应有8个。

S202b、根据所述歌曲的标准乐器数字接口序列，获取K个演唱情景中每个所述演唱情景出现的次数。

根据S202a中所获取的歌曲s_j的标准乐器数字接口序列，统计所确定的K个演唱情景中每个演唱情景出现的次数。对于某一首长度为L_j的歌曲s_j，每一个演唱情景<midi_k，midi_l>出现的次数PS_j,k,l可根据公式二及公式三获取。

公式二及公式三中，PS_j,k,l表示长度为L_j的歌曲s_j中每一个演唱情景<midi_k，midi_l>出现的次数；δ(M_j,t ^*＝midi_k∧M_j,t-1 ^*＝midi_l)表示长度为L_j的歌曲s_j中的第t个位置以及第t-1个位置处所对应的乐器数字接口序列出现的次数，即每一个演唱情景<midi_k，midi_l>出现的次数；t表示标准乐器数字接口序列的位置；M_j，t ^*表示第j首歌曲s_j的第t个位置所在的标准数字接口序列；M_j，t-1 ^*表示第j首歌曲s_j中第t-1个位置所在的标准乐器数字接口序列。

S202c、根据所述K个演唱情景中每个演唱情景的次数，获得所述歌曲的歌曲演唱能力模型。

其中，上述S202c的一种可能的实现方式为：将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型。

根据S202b所获取的K个演唱情景中每个演唱情景的次数，针对歌曲s_j，将获取的该首歌曲s_j中每个演唱情景的次数组成一个矩阵，并将该矩阵确定为该矩阵即确定为歌曲s_j的歌曲演唱能力模型PS_j。其中，所述矩阵可以为行矩阵，也可以为列矩阵，对此，本申请不做限制。

可选地，上述实施例中S201的一种可能的实现方式包括：S201a-S201b。

S201a、根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得P个不同的演唱情景中每个演唱情景的平均歌唱误差，所述多个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的，P为大于等于1的整数。

可选地，S201a的一种可能的实现方式包括：a-c。

a、根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景，获取所述P个不同的演唱情景中每个演唱情景出现的次数。

首先，根据上述实施例中所获取的同一歌曲s_j的乐器数字接口序列，获取该首歌曲对应的P个不同的演唱情景。其中，演唱情景可以为用户u_i在演唱完第l个乐器数字接口序列后立刻演唱第k个乐器数字接口序列，即一个演唱情景由乐器数字接口序列中相邻的两个乐器数字接口序列组成，用户所歌唱的N首歌曲中某一首歌曲s_j对应的某一个演唱情景组成可以表示为<midi_k，midi_l>。

根据所获取的P个不同的演唱情景，针对用户u_i，统计该用户歌唱的N首歌曲中每首歌曲对应的P个不同的演唱情景中每个演唱情景出现的次数n_i,k,l，具体计算公式如公式四。

公式四中，n_i,k,l表示用户u_i歌唱的N首歌曲中每首歌曲对应的P个不同的演唱情景中每个演唱情景出现的次数；s_j表示用户u_i歌唱的N首歌曲中的歌曲s_j；表示第i个用户所演唱的歌曲集合；PS_j,k,l表示演唱情景<midi_k，midi_l>在歌曲s_j中出现的次数，其中，次数PS_j,k,l的计算参见步骤S202b中所述，此处不再赘述。

例如，对于用户u_i，若该用户歌唱了3首歌，第一首歌对应有4个不同的演唱情景，记为演唱情景1、演唱情景2及演唱情景3；第二首歌对应4个不同的演唱情景，记为演唱情景1、演唱情景4、演唱情景3及演唱情景5；第三首歌对应有5个不同的演唱情景，记为演唱情景1、演唱情景2、演唱情景3、演唱情景4及演唱情景5；那么这3首歌中的演唱情景1出现了3次，演唱情景2出现了2次，演唱情景3出现了3次，演唱情景4出现了2次，演唱情景5出现了2次。又例如，对于用户u_i，若该用户歌唱了3首歌，第一首歌对应有3个演唱情景，记为演唱情景1、演唱情景2及演唱情景1，其中，有两个演唱情景相同，那么演唱情景1在该首歌曲中出现了两次；第二首歌对应4个演唱情景，记为演唱情景1、演唱情景4、演唱情景3及演唱情景2，其中，4个演唱情景各不相同；第三首歌对应有5个演唱情景，记为演唱情景1、演唱情景2、演唱情景3、演唱情景2及演唱情景5，其中，有两个演唱情景相同，那么演唱情景2在该首歌曲中出现了两次；那么这3首歌中的演唱情景1出现了4次，演唱情景2出现了4次，演唱情景3出现了2次，演唱情景4出现了1次，演唱情景5出现了1次。

b、根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列，确定所述每个演唱情景的总歌唱误差。

将上述实施例中所获取的用户歌唱的N首歌曲的乐器数字接口序列以及所述N首歌曲中每首歌曲的标准乐器数字接口序列中对应的每一个演唱情景进行对比，对比后可得出该用户在歌唱每个演唱情景的时候所产生的误差，然后将该误差求和，就可得到该用户在歌唱每一个演唱情景下的总歌唱误差，具体计算如公式五。

公式五中，d_i,k,l表示用户u_i在歌唱每一个演唱情景<midi_k，midi_l>下的总歌唱误差；s_j表示用户u_i歌唱的N首歌曲中的某一首歌曲；表示第i个用户/>所演唱的歌曲集合；L_j表示歌曲s_j的长度；t表示标准乐器数字接口的位置；M_j，t ^*表示第j首歌曲s_j的第t个位置所在的标准数字接口；M_j，t-1 ^*表示第j首歌曲s_j中第t-1个位置所在的标准乐器数字接口；δ(M_j,t ^*＝midi_k∧M_j,t-1 ^*＝midi_l)表示长度为L_j的歌曲s_j中的第t个位置以及第t-1个位置处所对应的乐器数字接口出现的次数，即每一个演唱情景<midi_k，midi_l>出现的次数；|M_i,j,t-M_j,t) ^*|表示用户u_i所演唱的歌曲s_j对应的第t个位置所在的乐器数字接口序列与其对应的标准乐器数字接口序列的误差值。

c、根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差，获取每个演唱情景的平均歌唱误差。

根据上述步骤a中所获取的每个演唱情景出现的次数以及步骤b中所获取的每个演唱情景的总误差，采用公式六计算每个演唱情景的平均歌唱误差，具体计算如公式六。

PU_i,k,l＝d_i,k,l/n_i,k,l 公式六

公式六中，d_i,k,l表示用户u_i在歌唱每一个演唱情景<midi_k，midi_l>下的总歌唱误差；n_i,k,l表示用户u_i歌唱的N首歌曲中每首歌曲对应的P个不同的演唱情景中每个演唱情景出现的次数；PU_j,k,l表示用户u_i在歌唱每一个演唱情景<midi_k，midi_l>时的平均歌唱误差。

S201b、根据多个不同的演唱情景中每个演唱情景的平均歌唱误差，获得所述用户的用户歌唱能力模型。

其中，上述S201b的一种可能的实现方式为：将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。

根据上述步骤c中所获取的多个不同的演唱情景中每个演唱情景的平均歌唱误差，针对用户u_i，将该用户歌唱的所述N首歌曲中的每个演唱情景的平均歌唱误差组成一个矩阵，并将该矩阵确定为用户u_i的用户歌唱能力模型PU_i。其中，所述矩阵可以为行矩阵，也可以为列矩阵，对此，本申请不做限制。

可选地，上述实施例中S203的一种可能的实现方式为：

根据上述实施例中所建立的N首歌曲中每首歌曲的歌曲演唱能力模型PS_j与用户的用户歌唱能力模型PU_i，计算用户对所述N首歌曲中每首歌曲的声学匹配度。例如，用户u_i对于歌曲s_j的声学匹配度VC_i,j可以简单的表示为VC_i,j＝f(歌曲演唱能力模型PS_j，用户u_i的歌唱能力模型PU_i，α)，其中，α为可学习的声学匹配参数，即用户u_i对于歌曲s_j的声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关。

歌曲演唱能力模型PS_j以及用户u_i的歌唱能力模型PU_i，可通过上述实施例获取，因此，用户u_i对于歌曲s_j的声学匹配度的具体计算如公式七。

公式七中，VC_i,j表示用户u_i对于歌曲s_j的声学匹配度；<midi_k，midi_l>表示用户u_i所歌唱的N首歌曲中某一首歌曲s_j对应的某一个演唱情景；PS_j,k,l表示长度为L_j的歌曲s_j中每一个演唱情景<midi_k，midi_l>出现的次数；PU_j,k,l表示用户u_i在歌唱每一个演唱情景<midi_k，midi_l>时的平均歌唱误差；M_j ^*表示多个不同用户歌唱的同一歌曲s_j的标准乐器数字接口序列的集合；α_k,l表示声学匹配参数。

可选地，上述实施例中S204的一种可能的实现方式包括：S204a-S204c。

S204a、获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量。

根据用户以及用户所歌唱的N首歌曲，获取用户的偏好向量以及N首歌曲中每首歌曲的特征向量。例如，用户u_i的偏好向量为U_i；歌曲s_j的特征向量为V_j。其中，用户u_i的偏好向量U_i以及歌曲s_j的特征向量V_j均是可优化学习的参数。

S204b、根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量，获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数。

由于用户对N首歌曲中每首歌曲的声学匹配度、用户的偏好向量以及N首歌曲中每首歌曲的特征向量满足如下公式八。

公式八中，R_i,j表示用户u_i对于歌曲s_j的偏好打分；VC_i,j表示用户u_i对于歌曲s_j的声学匹配度；U_i表示用户u_i的偏好向量为；V_j表示歌曲s_j的特征向量。

其中，公式八中的VC_i,j即为上述实施例中用户u_i对歌曲s_j的声学匹配度VC_i,j的计算公式七，将其代入公式八可获取具体的偏好打分模型计算公式。

根据上述实施例中所获取的用户对N首歌曲中每首歌曲的声学匹配度、用户的偏好向量以及N首歌曲中每首歌曲的特征向量，通过贝叶斯后验个性化排序算法以及梯度下降算法获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数。其中，贝叶斯后验个性化排序算法以及梯度下降算法如公式九及公式十。在求取目标用户偏好向量U、目标歌曲特征向量V以及目标声学匹配参数α的过程中，使得公式九中的函数值最小时的用户偏好向量U、歌曲特征向量V以及声学匹配参数α值即为所要求取的目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数。贝叶斯后验个性化排序算法以及梯度下降算法均为现有技术，具体原理此处不再赘述。

公式九及公式十中，U表示用户的偏好向量；V表示用户所歌唱的歌曲的特征向量；R_i,j表示用户u_i对于所歌唱过的歌曲s_j的偏好打分；R_i,k表示用户u_i对于未歌唱过的歌曲s_k的偏好打分；λ_U，λ_V是两个超参数，根据实际情况进行调节；‖·‖_F表示求弗罗贝尼乌斯范数(Frobenius norm)。

S204c、根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数，获得所述用户对歌曲的偏好打分模型，其中，所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型，输出为偏好打分。

根据所获取的目标用户偏好向量目标歌曲特征向量/>以及目标声学匹配参数/>获取用户对歌曲的偏好打分模型。将获得的目标用户偏好向量/>目标歌曲特征向量/>以及目标声学匹配参数/>代入上述公式八中，得到的偏好打分模型如公式十一所示。

公式十一中，R_i,q表示用户u_i对于未歌唱的歌曲s_q的偏好打分；<midi_m，midi_n>表示除用户u_i之外的其他用户所歌唱的歌曲s_q中的某一个演唱情景；PS_q,m,n表示除用户u_i之外的其他用户所歌唱的歌曲s_q中的每一个演唱情景<midi_m，midi_n>出现的次数；PU_q,m,n表示除用户u_i之外的其他用户在歌唱歌曲s_q的每一个演唱情景<midi_m，midi_n>时的平均歌唱误差；M_q ^*表示同一歌曲s_q的标准乐器数字接口序列；表示目标声学匹配参数；/>表示目标偏好向量；/>表示目标特征向量。其中，未歌唱歌曲s_q的演唱情景<midi_m，midi_n>、未歌唱的多首歌曲中某一首歌曲s_q中每一个演唱情景<midi_m，midi_n>出现的次数PS_q,m,n、除用户u_i之外的其他用户在歌唱每一个演唱情景<midi_m，midi_n>时的平均歌唱误差PU_q,m,n以及未歌唱的歌曲s_q的标准乐器数字接口序列可参见上述实施例中的方法，此处不再赘述。

可选地，上述实施例中S205的一种可能的实现方式为：

根据所述用户对歌曲的偏好打分模型，获取所述用户多首未歌唱的歌曲的偏好打分；并将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲，M为大于等于1的整数。

根据上述步骤中所获取的用户u_i对于歌曲s_j的偏好打分模型，对于用户u_i，对没有被该用户歌唱的多首歌曲的偏好进行打分，并将所获取的该用户未歌唱的多首歌曲的偏好打分由高到低进行排序，将偏好打分最高的前M首歌曲确定为该用户的推荐歌曲。

或者，对于某一首未歌唱的歌曲，根据打分模型获取所述为歌唱的歌曲的打分结果，如果所获取的该歌曲的打分结果大于某一预设值，则将该歌曲确定为推荐歌曲。

本实施例中，通过获取用户歌唱的N首歌曲的乐器数字接口序列、N首歌曲中每首歌曲的标准乐器数字接口序列以及多个不同用户歌唱的同一歌曲的乐器数字接口序列，N为大于等于1的整数，并根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列，获取所述同一歌曲的标准乐器数字接口序列；然后根据N首歌曲的乐器数字接口序列和N首歌曲中每首歌曲的标准乐器数字接口序列，获得P个不同的演唱情景中每个演唱情景的平均歌唱误差，P为大于等于1的整数；并将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型，其中每个演唱情景的平均歌唱误差可根据每个演唱情景出现的次数以及所述每个演唱情景的总误差来获取；以及根据歌曲的标准乐器数字接口序列，获取K个演唱情景中每个所述演唱情景出现的次数；并将K个演唱情景中每个演唱情景的次数构成的矩阵确定为该歌曲的歌曲演唱能力模型；然后根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述N首歌曲中每首歌曲的声学匹配度；然后根据所获取的用户的偏好向量、N首歌曲中每首歌曲的特征向量以及用户对所述N首歌曲中每首歌曲的声学匹配度，获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数，并根据目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数，获得所述用户对歌曲的偏好打分模型，其中，所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型，输出为偏好打分；最后根据所述用户对歌曲的偏好打分模型，获取所述用户多首未歌唱的歌曲的偏好打分，将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲获取针对所述用户的未歌唱歌曲的推荐结果。由于该方法是通过自动化建模用户的歌唱能力并衡量用户歌唱能力与歌曲的声学匹配度，因此，该方法可以应用于大型在线唱歌平台中；更重要的是该方法是通过确定用户对歌曲的偏好来确定该用户的未歌唱歌曲推荐结果，推荐结果与用户的偏好更匹配，提高了歌曲推荐的准确性。

图3为本申请一实施例提供的歌曲推荐装置的结构示意图，如图3所示，本申请实施例的装置300可以包括：获取模块310，处理模块320，推荐模块330。

获取模块310，用于获取用户歌唱的N首歌曲的乐器数字接口序列，N为大于等于1的整数，并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型；以及获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，其中，所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的。

处理模块320，用于根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述N首歌曲中每首歌曲的声学匹配度；以及根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获得所述用户对歌曲的偏好打分模型。

推荐模块330，还用于根据所述用户对歌曲的偏好打分模型，获取针对所述用户的未歌唱歌曲的推荐结果。

可选地，声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关；所述处理模块320，具体用于：获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量；根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量，获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数；根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数，获得所述用户对歌曲的偏好打分模型，其中，所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型，输出为偏好打分。

可选地，所述推荐模块330，具体用于：根据所述用户对歌曲的偏好打分模型，获取所述用户多首未歌唱的歌曲的偏好打分；将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲，M为大于等于1的整数。

可选地，所述获取模块310，具体用于：获取多个不同用户歌唱的同一歌曲的乐器数字接口序列；根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列，获取所述同一歌曲的标准乐器数字接口序列。

可选地，所述获取模块310，具体用于：根据所述歌曲的标准乐器数字接口序列，确定所述歌曲的演唱情景为K个演唱情景，K为大于等于1的整数；根据所述歌曲的标准乐器数字接口序列，获取K个演唱情景中每个所述演唱情景出现的次数；将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型；其中，所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。

可选地，所述获取模块310，具体用于：根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得P个不同的演唱情景中每个演唱情景的平均歌唱误差，所述多个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的，P为大于等于1的整数；将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。

可选地，所述处理模块320，具体用于：根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景，获取所述P个不同的演唱情景中每个演唱情景出现的次数；根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列，确定所述每个演唱情景的总歌唱误差；根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差，获取每个演唱情景的平均歌唱误差。

本实施例的装置，可以用于执行上述各方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图4为本申请一实施例提供的电子设备的结构示意图，如图4所示，本实施例的电子设备400可以包括：存储器410、处理器420。

存储器410，用于存储程序指令；

处理器420，用于调用并执行所述存储器中的程序指令，执行：

获取用户歌唱的N首歌曲的乐器数字接口序列，N为大于等于1的整数，并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型。

获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，其中，所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的。

根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述N首歌曲中每首歌曲的声学匹配度。

根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获得所述用户对歌曲的偏好打分模型。

根据所述用户对歌曲的偏好打分模型，获取针对所述用户的未歌唱歌曲的推荐结果。

可选地，声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关；所述可选地，所述处理器420，具体用于：获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量；根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量，获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数；根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数，获得所述用户对歌曲的偏好打分模型，其中，所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型，输出为偏好打分。

可选地，可选地，所述处理器420，具体用于：根据所述用户对歌曲的偏好打分模型，获取所述用户多首未歌唱的歌曲的偏好打分；将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲，M为大于等于1的整数。

可选地，可选地，所述处理器420，具体用于：获取多个不同用户歌唱的同一歌曲的乐器数字接口序列；根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列，获取所述同一歌曲的标准乐器数字接口序列。

可选地，可选地，所述处理器420，具体用于：根据所述歌曲的标准乐器数字接口序列，确定所述歌曲的演唱情景为K个演唱情景，K为大于等于1的整数；根据所述歌曲的标准乐器数字接口序列，获取K个演唱情景中每个所述演唱情景出现的次数；将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型；其中，所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。

可选地，所述处理器420，具体用于：根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得P个不同的演唱情景中每个演唱情景的平均歌唱误差，所述多个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的，P为大于等于1的整数；将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。

可选地，可选地，所述处理器420，具体用于：根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景，获取所述P个不同的演唱情景中每个演唱情景出现的次数；根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列，确定所述每个演唱情景的总歌唱误差；根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差，获取每个演唱情景的平均歌唱误差。

本实施例的电子设备，可以用于执行上述各方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图5为本申请另一实施例提供的终端设备的结构示意图，该终端设备可以是移动电话，计算机，平板设备等。

终端设备500可以包括以下一个或多个组件：处理组件502，存储器504，电源组件506，多媒体组件508，音频组件510，输入/输出(I/O)接口512，传感器组件514，以及通信组件516。

处理组件502通常控制终端设备500的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。例如，处理组件502可以包括多媒体模块，以方便多媒体组件508和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在终端设备500的操作。这些数据的示例包括用于在终端设备500上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件506为终端设备500的各种组件提供电力。电源组件506可以包括电源管理系统，一个或多个电源，及其他与为终端设备500生成、管理和分配电力相关联的组件。

多媒体组件508包括在所述终端设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像头和/或后置摄像头。当终端设备500处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括一个麦克风(MIC)，当终端设备500处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中，音频组件510还包括一个扬声器，用于输出音频信号。

I/O接口512为处理组件502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器，用于为终端设备500提供各个方面的状态评估。例如，传感器组件514可以检测到终端设备500的打开/关闭状态，组件的相对定位，例如所述组件为终端设备500的显示器和小键盘，传感器组件514还可以检测终端设备500或终端设备500一个组件的位置改变，用户与终端设备500接触的存在或不存在，终端设备500方位或加速/减速和终端设备500的温度变化。传感器组件514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件516被配置为便于终端设备500和其他设备之间有线或无线方式的通信。终端设备500可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件516还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，终端设备500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器504，上述指令可由终端设备500的处理器520执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当该存储介质中的指令由终端设备的处理器执行时，使得终端设备能够执行上述任一方法实施例中的方案。

图6为本申请另一实施例提供的服务器的结构示意图。参照图6，服务器600包括处理组件622，其进一步包括一个或多个处理器，以及由存储器632所代表的存储器资源，用于存储可由处理组件622的执行的指令，例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件622被配置为执行指令，以执行上述各方法实施例中的方案。

服务器600还可以包括一个电源组件626被配置为执行服务器600的电源管理，一个有线或无线网络接口650被配置为将服务器600连接到网络，和一个输入输出(I/O)接口658。服务器600可以操作基于存储在存储器632的操作系统，例如Windows ServerTM，MacOS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

一种非临时性计算机可读存储介质，当该存储介质中的指令由服务器的处理器执行时，使得服务器能够执行上述任一方法实施例中的方案。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：只读内存(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种歌曲推荐方法，其特征在于，包括：

获取用户歌唱的N首歌曲的乐器数字接口序列，N为大于等于1的整数，并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型；

获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，其中，所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的；

根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型，获取用户对所述N首歌曲中每首歌曲的声学匹配度；

根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获得所述用户对歌曲的偏好打分模型；

根据所述用户对歌曲的偏好打分模型，获取所述用户的未歌唱歌曲的推荐结果；

所述获取所述N首歌曲中每首歌曲的歌曲演唱能力模型，包括：

根据所述歌曲的标准乐器数字接口序列，确定所述歌曲的演唱情景为K个演唱情景，K为大于等于1的整数；

根据所述歌曲的标准乐器数字接口序列，获取K个演唱情景中每个所述演唱情景出现的次数；

将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型；

其中，所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。

2.根据权利要求1所述的方法，其特征在于，声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关；所述根据所述用户对所述N首歌曲的声学匹配度与、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量，获得所述用户对歌曲的偏好打分模型，包括：

获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量；

根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量，获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数；

根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数，获得所述用户对歌曲的偏好打分模型，其中，所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型，输出为偏好打分。

3.根据权利要求1或2所述的方法，其特征在于，根据所述用户对歌曲的偏好打分模型，获取所述用户的未歌唱歌曲的推荐结果，包括：

根据所述用户对歌曲的偏好打分模型，获取所述用户多首未歌唱的歌曲的偏好打分；

将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲，M为大于等于1的整数。

4.根据权利要求1或2所述的方法，其特征在于，获取所述N首歌曲中每首歌曲的标准乐器数字接口序列，包括：

获取多个不同用户歌唱的同一歌曲的乐器数字接口序列；

根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列，获取所述同一歌曲的标准乐器数字接口序列。

5.根据权利要求1或2所述的方法，其特征在于，所述根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得所述用户的用户歌唱能力模型，包括：

根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得P个不同的演唱情景中每个演唱情景的平均歌唱误差，所述P个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的，P为大于等于1的整数；

将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。

6.根据权利要求5所述的方法，其特征在于，根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列，获得多个不同的演唱情景中每个演唱情景的平均歌唱误差，包括：

根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景，获取所述P个不同的演唱情景中每个演唱情景出现的次数；

根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列，确定所述每个演唱情景的总歌唱误差；

根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差，获取每个演唱情景的平均歌唱误差。

7.一种歌曲推荐装置，其特征在于，包括：

推荐模块，用于根据所述用户对歌曲的偏好打分模型，获取所述用户的未歌唱歌曲的推荐结果；

所述获取模块，具体用于：

8.一种电子设备，其特征在于，包括：

存储器，用于存储程序指令；

处理器，用于调用并执行所述存储器中的程序指令，执行如权利要求1至6中任一项所述的歌曲推荐方法。

9.一种计算机可读存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的歌曲推荐方法。