CN111309959B - 歌曲推荐方法和装置 - Google Patents
歌曲推荐方法和装置 Download PDFInfo
- Publication number
- CN111309959B CN111309959B CN202010084450.9A CN202010084450A CN111309959B CN 111309959 B CN111309959 B CN 111309959B CN 202010084450 A CN202010084450 A CN 202010084450A CN 111309959 B CN111309959 B CN 111309959B
- Authority
- CN
- China
- Prior art keywords
- song
- user
- songs
- singing
- digital interface
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Multimedia (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本申请提供一种歌曲推荐方法和装置。所述方法包括:获取用户歌唱的N首歌曲的乐器数字接口序列,并根据用户歌唱的N首歌曲的乐器数字接口序列和其对应的每首歌曲的标准乐器数字接口序列,获取用户歌唱能力模型;以及根据歌曲的标准乐器数字接口序列获取N首歌曲中每首歌曲的歌曲演唱能力模型;然后根据所述歌曲演唱能力模型以及用户歌唱能力模型,获取用户对于歌曲的声学匹配度;再根据用户对歌曲的声学匹配度、用户的偏好向量和N首歌曲中每首歌曲的特征向量,获得用户对歌曲的偏好打分模型;最后根据偏好打分模型,获取该用户的未歌唱歌曲的推荐结果,推荐结果与用户的偏好更匹配,提高了歌曲推荐的准确性。
Description
技术领域
本申请实施例涉及信息处理技术领域,尤其涉及一种歌曲推荐方法和装置。
背景技术
在线唱歌平台是近年来迅速兴起的提供在线唱歌以及后期声音处理工具的平台,平台中有数十万首涵盖各个国家地区各类风格的歌曲可以被用户演唱。在这些平台中为用户提供精准的歌曲推荐,对提升平台歌曲作品发布数量、提高用户对平台的信耐度十分重要。
现有的歌曲推荐方法主要是根据用户的歌唱能力与歌曲匹配度,为用户推荐唱歌歌曲。其中,匹配度的实现主要是通过让用户演唱不同的音调和响度组合,根据声学领域专家的意见构建该用户的声学范围模型;以及通过声学领域专家对歌曲中特定音调和响度组合的出现时长进行分析,对所有歌曲构建演唱能力模型;然后根据用户声学范围模型和歌曲的歌曲演唱能力模型中,提取出每一对音调和响度在歌曲演唱能力模型中出现的频率、在用户声学范围模型中对应的声音质量等特征,将这些特征输入一个排序学习模型,最终确定用户的歌唱能力与歌曲匹配度,根据匹配度确定是否为用户推荐唱歌该歌曲。但是上述方法推荐的歌曲仍然存在不准确的问题。
发明内容
本申请实施例提供一种歌曲推荐方法和装置,以解决现有技术中所述方法推荐的歌曲准确性较低的问题。
第一方面,本申请实施例提供一种歌曲推荐方法,包括:获取用户歌唱的N首歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型;获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的;根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度;根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型;根据所述用户对歌曲的偏好打分模型,获取所述用户的未歌唱歌曲的推荐结果。
可选地,声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关;所述根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型,包括:获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量;根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量,获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数;根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数,获得所述用户对歌曲的偏好打分模型,其中,所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型,输出为偏好打分。
可选地,根据所述用户对歌曲的偏好打分模型,获取针对所述用户的未歌唱歌曲的推荐结果,包括:根据所述用户对歌曲的偏好打分模型,获取所述用户多首未歌唱的歌曲的偏好打分;将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲,M为大于等于1的整数。
可选地,获取所述N首歌曲中每首歌曲的标准乐器数字接口序列,包括:获取多个不同用户歌唱的同一歌曲的乐器数字接口序列;根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列,获取所述同一歌曲的标准乐器数字接口序列。
可选地,所述获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,包括:根据所述歌曲的标准乐器数字接口序列,确定所述歌曲的演唱情景为K个演唱情景,K为大于等于1的整数;根据所述歌曲的标准乐器数字接口序列,获取K个演唱情景中每个所述演唱情景出现的次数;将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型;其中,所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。
可选地,所述根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型,包括:根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得P个不同的演唱情景中每个演唱情景的平均歌唱误差,所述P个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的,P为大于等于1的整数;将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。
可选地,根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得多个不同的演唱情景中每个演唱情景的平均歌唱误差,包括:根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景,获取所述P个不同的演唱情景中每个演唱情景出现的次数;根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列,确定所述每个演唱情景的总歌唱误差;根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差,获取每个演唱情景的平均歌唱误差。
第二方面,本申请实施例提供一种歌曲推荐装置,包括:
获取模块,用于获取用户歌唱的N首歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型;以及获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的;
处理模块,用于根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度;以及根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型;
推荐模块,用于根据所述用户对歌曲的偏好打分模型,获取所述用户的未歌唱歌曲的推荐结果。
可选地,声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关;所述处理模块,具体用于:获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量;根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量,获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数;根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数,获得所述用户对歌曲的偏好打分模型,其中,所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型,输出为偏好打分。
可选地,所述推荐模块,具体用于:根据所述用户对歌曲的偏好打分模型,获取所述用户多首未歌唱的歌曲的偏好打分;将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲,M为大于等于1的整数。
可选地,所述获取模块,具体用于:获取多个不同用户歌唱的同一歌曲的乐器数字接口序列;根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列,获取所述同一歌曲的标准乐器数字接口序列。
可选地,所述获取模块,具体用于:根据所述歌曲的标准乐器数字接口序列,确定所述歌曲的演唱情景为K个演唱情景,K为大于等于1的整数;根据所述歌曲的标准乐器数字接口序列,获取K个演唱情景中每个所述演唱情景出现的次数;根据所述K个演唱情景中每个演唱情景的次数,将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型;其中,所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。
可选地,所述获取模块,具体用于:根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得P个不同的演唱情景中每个演唱情景的平均歌唱误差,所述P个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的,P为大于等于1的整数;根据所述多个不同的演唱情景中每个演唱情景的平均歌唱误差,将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。
可选地,所述处理模块,具体用于:根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景,获取所述P个不同的演唱情景中每个演唱情景出现的次数;根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列,确定所述每个演唱情景的总歌唱误差;根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差,获取每个演唱情景的平均歌唱误差。
第三方面,本申请实施例提供一种电子设备,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,执行如本申请第一方面所述的歌曲推荐方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本申请第一方面所述的歌曲推荐方法。
第五方面,本申请实施例提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备实施如第一方面本申请实施例所述的歌曲推荐方法。
本申请实施例提供的一种歌曲推荐方法和装置,通过获取用户歌唱的N首歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型;以及获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的;然后根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度;再根据所述用户对所述N首歌曲的声学匹配度与矩阵分解推荐模型,获得所述用户对歌曲的偏好打分模型;最后根据所述用户对歌曲的偏好打分模型,获取针对所述用户的未歌唱歌曲的推荐结果。因此,本实施例是通过确定用户对歌曲的偏好来确定该用户的未歌唱歌曲推荐结果,推荐结果与用户的偏好更匹配,提高了歌曲推荐的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的应用场景示意图;
图2为本申请一实施例提供的歌曲推荐方法的流程示意图;
图3为本申请一实施例提供的歌曲推荐装置的结构示意图;
图4为本申请一实施例提供的电子设备的结构示意图;
图5为本申请另一实施例提供的终端设备的结构示意图;
图6为本申请另一实施例提供的服务器的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
现有技术中的歌曲推荐方法是通过根据用户的歌唱能力与歌曲匹配度为用户推荐唱歌歌曲。其中,匹配度的实现主要是通过让用户演唱不同的音调和响度组合,根据声学领域专家的意见构建该用户的声学范围模型;以及通过声学领域专家对歌曲中特定音调和响度组合的出现时长进行分析,对所有歌曲构建演唱能力模型;然后根据用户声学范围模型和歌曲的歌曲演唱能力模型中,提取出每一对音调和响度在歌曲演唱能力模型中出现的频率、在用户声学范围模型中对应的声音质量等特征,将这些特征输入一个排序学习模型,最终确定用户的歌唱能力与歌曲匹配度,根据匹配度确定是否为用户推荐唱歌该歌曲。但是上述方法推荐的歌曲仍然存在不准确的问题。
基于该技术问题,本申请主要从考虑了用户的歌唱能力与歌曲匹配度以及用户对歌曲的兴趣两方面的影响因素。其中,用户的歌唱能力与歌曲匹配度的实现是通过自动建模的方法来实现,即通过获取用户歌唱歌曲的乐器数字接口序列,并根据所述用户歌唱歌曲的乐器数字接口序列和所述歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型;以及获取所述歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的;再根据所述歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述歌曲中每首歌曲的声学匹配度;然后根据用户对歌曲的声学匹配度与用户对歌曲的兴趣,获得所述用户对歌曲的偏好打分模型;最后根据所述用户对歌曲的偏好打分模型,获取针对所述用户的未歌唱歌曲的推荐结果。因此,该方法通过确定用户对歌曲的偏好来确定该用户的未歌唱歌曲推荐结果,推荐结果与用户的偏好更匹配,提高了歌曲推荐的准确性。
本申请实施例可以应用于服务器中,图1为本申请一实施例提供的应用场景示意图,如图1所示,用户在打开终端设备上安装的有关歌曲推荐的应用程序后,该终端设备会主动显示该用户未歌唱的歌曲的推荐结果,或者,在用户通过操作终端设备需要获取未歌唱的歌曲的推荐结果时,终端设备显示该用户未歌唱的歌曲的推荐结果。其中,该推荐结果是由服务器发送给相应的终端设备,该终端设备接收推荐结果并显示该推荐结果,用户可根据该推荐结果获取其所想要演唱的歌曲。其中,终端设备可以是包括:计算机、手机、平板电脑、可穿戴设备等,对此本申请不做限制。
本申请结合如下几个具体的实施例,对服务器如何获取推荐结果的技术方案进行描述,需要说明的是,在一些实施例中,可以是终端设备通过如下几个实施例来获取推荐结果。
图2为本申请一实施例提供的歌曲推荐方法的流程示意图,如图2所示,本申请实施例的方法可以包括:
S201、获取用户歌唱的N首歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型。
根据用户歌唱的N首歌曲,从每一首歌曲对应的音频文件中每间隔一定时间(例如200毫秒)提取演唱该首歌曲的用户的声音频率,并将该频率转换为数字接口,然后将该首歌曲中所有频率所转换的数字接口组成为一个序列,该序列即为该首歌曲对应的乐器数字接口(musical instrument digital interface)序列,依次类推,就可获取用户歌唱的N首歌曲的乐器数字接口序列。
例如,假设在线唱歌平台上用户集合为:用户歌唱的N首歌曲集合为:/>其中n和N分别为用户的个数和用户歌唱的歌曲个数。用户集合/>中的每一个用户ui已经在上述平台中演唱过若干首歌曲作品。其中,第i个用户所演唱的歌曲集合可以表示为/>演唱过第j首歌曲/>的用户集合可以表示为/>
对某一用户ui,根据该用户ui所演唱的歌曲sj,从歌曲sj对应的音频文件中每间隔例如200毫秒提取演唱该首歌曲sj的用户ui的声音频率,并将该频率转换为数字接口,然后将该首歌曲sj中所有频率所转换的数字接口组成为一个序列,那么该序列即为歌曲sj对应的乐器数字接口序列,歌曲sj对应的乐器数字接口序列可以表示为:Mi,j=<mij1,mij2,…,mijk,…,mijLj>,其中,Mi,j表示用户ui所演唱的歌曲sj对应的乐器数字接口序列;Lj表示歌曲sj的长度,mijk表示用户ui所演唱的歌曲sj对应的第k个乐器数字接口序列,k=1,2,…,Lj。
将通过上述方法所获取的用户歌唱的N首歌曲的乐器数字接口序列和N首歌曲中每首歌曲的标准乐器数字接口序列进行对比处理,以获取用户的用户歌唱能力模型。例如,对于用户ui,将通过上述方法所获取的用户ui所演唱的歌曲sj对应的乐器数字接口序列Mi,j以及歌曲sj对应的标准数字接口序列Mj *进行对比处理,可获取到用户ui的歌唱能力模型PUi。
S202、获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的。
根据用户所歌唱的N首歌曲中每首歌曲的标准乐器数字接口序列,获取用户所歌唱的N首歌曲中每首歌曲的歌曲演唱能力模型。例如,对于歌曲sj,可根据用户ui所歌唱的歌曲sj对应的标准乐器数字接口序列Mj *,获取用户ui所歌唱的歌曲sj的歌曲演唱能力模型PSj。
S203、根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度。
该步骤中,可根据S201中所获取的用户的用户歌唱能力模型以及S202中所获取的所述N首歌曲中每首歌曲的歌曲演唱能力模型,并对该两种模型进行相应的处理,以获取用户对所述N首歌曲中每首歌曲的声学匹配度。
例如,根据用户ui所歌唱的歌曲sj的歌曲演唱能力模型PSj以及用户ui的歌唱能力模型PUi,可获取用户ui对所歌唱的歌曲sj的声学匹配度,该声学匹配度可以用VCi,j来表示。
S204、根据所述用户对所述N首歌曲的声学匹配度与、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型。
根据S203中所获取的用户对所述N首歌曲中每首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获取所述用户对歌曲的偏好打分模型。其中,用户的偏好向量和所述N首歌曲中每首歌曲的特征向量主要用于表示用户对所歌唱的歌曲的兴趣。
例如,根据S203中所获取的用户ui对所歌唱的歌曲sj的声学匹配度VCi,j、用户的偏好向量Ui和所述N首歌曲中每首歌曲的特征向量Vi,可获取用户ui对所歌唱的歌曲sj的偏好打分模型Rij。即用户ui对所歌唱的歌曲sj的偏好打分模型Rij可以简单的表示为Rij=f(声学匹配度VCi,j,用户的偏好向量Ui,N首歌曲中每首歌曲的特征向量Vi)。
S205、根据所述用户对歌曲的偏好打分模型,获取针对所述用户的未歌唱歌曲的推荐结果。
根据S203中所获取的所述用户对歌曲的偏好打分模型,获取该用户未歌唱过的歌曲的推荐结果。可选的,若上述实施例所述方法的执行主体为服务器,将推荐结果发送给相应的终端设备,由该终端设备显示推荐结果给用户;若上述实施例所述方法的执行主体为终端设备,则可通过该终端设备直接显示推荐结果给用户。其中,所述终端设备可以为电脑、手机、平板电脑、可穿戴设备等,对此,本申请不做限制。
本实施例中,通过获取用户歌唱的N首歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型;以及获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的;然后根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度;再根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型;最后根据所述用户对歌曲的偏好打分模型,获取针对所述用户的未歌唱歌曲的推荐结果。因此,本实施例是通过确定用户对歌曲的偏好来确定该用户的未歌唱歌曲推荐结果,推荐结果与用户的偏好更匹配,提高了歌曲推荐的准确性。
可选地,上述实施例S201中的所述获取N首歌曲中每首歌曲的标准乐器数字接口序列的一种可能的实现方式包括:S201a-S201b。
S201a、获取多个不同用户歌唱的同一歌曲的乐器数字接口序列。
根据上述实施例中所描述的方法,针对某一首歌曲sj,可从多个不同用户所歌唱的歌曲sj的音频文件中每间隔例如200毫秒提取演唱歌曲sj的多个不同用户的声音频率,然后将该频率转换为数字接口序列,该数字接口序列即为多个不同用户歌唱的同一首歌曲sj对应的乐器数字接口序列。
S201b、根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列,获取所述同一歌曲的标准乐器数字接口序列。
根据S201a中所获取的多个不同用户歌唱的同一歌曲sj的乐器数字接口序列,对多个不同用户歌唱的歌曲sj的乐器数字接口序列中同一位置的乐器数字接口取中位数,从而得到该首歌曲sj对应的标准乐器数字接口序列。针对用户ui,用户ui所歌唱的歌曲sj会有多个乐器数字接口,多个乐器数字接口就可组成该首歌曲sj的乐器数字接口序列;那么对于对多个用户,对多个用户所歌唱的歌曲sj的相同位置处的乐器数字接口进行比较,获取该位置处的多个不同用户歌唱的歌曲sj的乐器数字接口中中间位置所对应的乐器数字接口作为该首歌曲sj的相同位置处的乐器数字接口,例如,对多个不同用户所歌唱的歌曲sj的第一个位置处对应的多个乐器数字接口进行比较,获取第一个位置处对应的多个乐器数字接口中最中间的一个乐器数字接口,并将该乐器数字接口作为该首歌曲sj的第一个位置处的乐器数字接口;以此类推,可获取多个用户歌唱的歌曲sj的每一个位置处的乐器数字接口,然后将获取的为中位数的乐器数字接口按照相应的顺序组成一个新的乐器数字接口序列,该乐器数字接口序列即为该首歌曲sj对应的标准乐器数字接口序列。可选地,上述的中位数可以替换为最小数或最大数或平均数,此处不做限定。
具体地,歌曲sj的标准乐器数字接口序列Mj *可根据如下公式一确定。
公式一中,Mj *表示多个不同用户歌唱的同一歌曲sj的标准乐器数字接口序列;Lj表示歌曲sj的长度;mijk表示用户ui所演唱的歌曲sj对应的第k个乐器数字接口序列,k=1,2,…,Lj;ui表示第i个用户;表示演唱过第j首歌曲/>的用户集合,且/>
可选地,上述实施例S201中的所述获取N首歌曲中每首歌曲的标准乐器数字接口序列的另一种可能的实现方式为:
可根据同一首歌曲sj对应的原唱歌曲(原始歌唱人所歌唱的标准歌曲)的乐器数字接口序列,获取N首歌曲中每首歌曲的标准乐器数字接口序列。例如,从原始歌曲的音频文件中每间隔一定时间(例如200毫秒)提取原始歌唱人的声音频率,并将该声音频率转换为数字接口,然后将该首歌曲sj对应的原唱歌曲中的所有频率所转换的数字接口组成为一个序列,该序列即为该首歌曲sj对应的标准乐器数字接口序列。
可选地,上述实施例中S202的一种可能的实现方式包括:S202a-S202c。
S202a、根据所述N首歌曲中每首歌曲的标准乐器数字接口序列,确定所述N首歌曲中每首歌曲的演唱情景为K个演唱情景,K为大于等于1的整数;其中,所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。
针对某一首歌曲sj,根据上述实施例中所获取的所述歌曲的标准乐器数字接口序列,获取歌曲sj的演唱情景,记为K个演唱情景,K为大于等于1的整数。其中,所述演唱情景可以定义为用户ui在演唱完第l个乐器数字接口后立刻演唱第k个乐器数字接口,即一个演唱情景由乐器数字接口序列中相邻的两个乐器数字接口确定。例如,若歌曲sj对应有10个乐器数字接口,由于相邻两个乐器数字接口组成一个演唱情景,则该首歌曲sj的演唱情景有9个,若该9个演唱情景中有两个演唱情景相同,则该首歌曲sj的不同的演唱情景对应有8个。
S202b、根据所述歌曲的标准乐器数字接口序列,获取K个演唱情景中每个所述演唱情景出现的次数。
根据S202a中所获取的歌曲sj的标准乐器数字接口序列,统计所确定的K个演唱情景中每个演唱情景出现的次数。对于某一首长度为Lj的歌曲sj,每一个演唱情景<midik,midil>出现的次数PSj,k,l可根据公式二及公式三获取。
公式二及公式三中,PSj,k,l表示长度为Lj的歌曲sj中每一个演唱情景<midik,midil>出现的次数;δ(Mj,t *=midik∧Mj,t-1 *=midil)表示长度为Lj的歌曲sj中的第t个位置以及第t-1个位置处所对应的乐器数字接口序列出现的次数,即每一个演唱情景<midik,midil>出现的次数;t表示标准乐器数字接口序列的位置;Mj,t *表示第j首歌曲sj的第t个位置所在的标准数字接口序列;Mj,t-1 *表示第j首歌曲sj中第t-1个位置所在的标准乐器数字接口序列。
S202c、根据所述K个演唱情景中每个演唱情景的次数,获得所述歌曲的歌曲演唱能力模型。
其中,上述S202c的一种可能的实现方式为:将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型。
根据S202b所获取的K个演唱情景中每个演唱情景的次数,针对歌曲sj,将获取的该首歌曲sj中每个演唱情景的次数组成一个矩阵,并将该矩阵确定为该矩阵即确定为歌曲sj的歌曲演唱能力模型PSj。其中,所述矩阵可以为行矩阵,也可以为列矩阵,对此,本申请不做限制。
可选地,上述实施例中S201的一种可能的实现方式包括:S201a-S201b。
S201a、根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得P个不同的演唱情景中每个演唱情景的平均歌唱误差,所述多个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的,P为大于等于1的整数。
可选地,S201a的一种可能的实现方式包括:a-c。
a、根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景,获取所述P个不同的演唱情景中每个演唱情景出现的次数。
首先,根据上述实施例中所获取的同一歌曲sj的乐器数字接口序列,获取该首歌曲对应的P个不同的演唱情景。其中,演唱情景可以为用户ui在演唱完第l个乐器数字接口序列后立刻演唱第k个乐器数字接口序列,即一个演唱情景由乐器数字接口序列中相邻的两个乐器数字接口序列组成,用户所歌唱的N首歌曲中某一首歌曲sj对应的某一个演唱情景组成可以表示为<midik,midil>。
根据所获取的P个不同的演唱情景,针对用户ui,统计该用户歌唱的N首歌曲中每首歌曲对应的P个不同的演唱情景中每个演唱情景出现的次数ni,k,l,具体计算公式如公式四。
公式四中,ni,k,l表示用户ui歌唱的N首歌曲中每首歌曲对应的P个不同的演唱情景中每个演唱情景出现的次数;sj表示用户ui歌唱的N首歌曲中的歌曲sj;表示第i个用户所演唱的歌曲集合;PSj,k,l表示演唱情景<midik,midil>在歌曲sj中出现的次数,其中,次数PSj,k,l的计算参见步骤S202b中所述,此处不再赘述。
例如,对于用户ui,若该用户歌唱了3首歌,第一首歌对应有4个不同的演唱情景,记为演唱情景1、演唱情景2及演唱情景3;第二首歌对应4个不同的演唱情景,记为演唱情景1、演唱情景4、演唱情景3及演唱情景5;第三首歌对应有5个不同的演唱情景,记为演唱情景1、演唱情景2、演唱情景3、演唱情景4及演唱情景5;那么这3首歌中的演唱情景1出现了3次,演唱情景2出现了2次,演唱情景3出现了3次,演唱情景4出现了2次,演唱情景5出现了2次。又例如,对于用户ui,若该用户歌唱了3首歌,第一首歌对应有3个演唱情景,记为演唱情景1、演唱情景2及演唱情景1,其中,有两个演唱情景相同,那么演唱情景1在该首歌曲中出现了两次;第二首歌对应4个演唱情景,记为演唱情景1、演唱情景4、演唱情景3及演唱情景2,其中,4个演唱情景各不相同;第三首歌对应有5个演唱情景,记为演唱情景1、演唱情景2、演唱情景3、演唱情景2及演唱情景5,其中,有两个演唱情景相同,那么演唱情景2在该首歌曲中出现了两次;那么这3首歌中的演唱情景1出现了4次,演唱情景2出现了4次,演唱情景3出现了2次,演唱情景4出现了1次,演唱情景5出现了1次。
b、根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列,确定所述每个演唱情景的总歌唱误差。
将上述实施例中所获取的用户歌唱的N首歌曲的乐器数字接口序列以及所述N首歌曲中每首歌曲的标准乐器数字接口序列中对应的每一个演唱情景进行对比,对比后可得出该用户在歌唱每个演唱情景的时候所产生的误差,然后将该误差求和,就可得到该用户在歌唱每一个演唱情景下的总歌唱误差,具体计算如公式五。
公式五中,di,k,l表示用户ui在歌唱每一个演唱情景<midik,midil>下的总歌唱误差;sj表示用户ui歌唱的N首歌曲中的某一首歌曲;表示第i个用户/>所演唱的歌曲集合;Lj表示歌曲sj的长度;t表示标准乐器数字接口的位置;Mj,t *表示第j首歌曲sj的第t个位置所在的标准数字接口;Mj,t-1 *表示第j首歌曲sj中第t-1个位置所在的标准乐器数字接口;δ(Mj,t *=midik∧Mj,t-1 *=midil)表示长度为Lj的歌曲sj中的第t个位置以及第t-1个位置处所对应的乐器数字接口出现的次数,即每一个演唱情景<midik,midil>出现的次数;|Mi,j,t-Mj,t) *|表示用户ui所演唱的歌曲sj对应的第t个位置所在的乐器数字接口序列与其对应的标准乐器数字接口序列的误差值。
c、根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差,获取每个演唱情景的平均歌唱误差。
根据上述步骤a中所获取的每个演唱情景出现的次数以及步骤b中所获取的每个演唱情景的总误差,采用公式六计算每个演唱情景的平均歌唱误差,具体计算如公式六。
PUi,k,l=di,k,l/ni,k,l 公式六
公式六中,di,k,l表示用户ui在歌唱每一个演唱情景<midik,midil>下的总歌唱误差;ni,k,l表示用户ui歌唱的N首歌曲中每首歌曲对应的P个不同的演唱情景中每个演唱情景出现的次数;PUj,k,l表示用户ui在歌唱每一个演唱情景<midik,midil>时的平均歌唱误差。
S201b、根据多个不同的演唱情景中每个演唱情景的平均歌唱误差,获得所述用户的用户歌唱能力模型。
其中,上述S201b的一种可能的实现方式为:将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。
根据上述步骤c中所获取的多个不同的演唱情景中每个演唱情景的平均歌唱误差,针对用户ui,将该用户歌唱的所述N首歌曲中的每个演唱情景的平均歌唱误差组成一个矩阵,并将该矩阵确定为用户ui的用户歌唱能力模型PUi。其中,所述矩阵可以为行矩阵,也可以为列矩阵,对此,本申请不做限制。
可选地,上述实施例中S203的一种可能的实现方式为:
根据上述实施例中所建立的N首歌曲中每首歌曲的歌曲演唱能力模型PSj与用户的用户歌唱能力模型PUi,计算用户对所述N首歌曲中每首歌曲的声学匹配度。例如,用户ui对于歌曲sj的声学匹配度VCi,j可以简单的表示为VCi,j=f(歌曲演唱能力模型PSj,用户ui的歌唱能力模型PUi,α),其中,α为可学习的声学匹配参数,即用户ui对于歌曲sj的声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关。
歌曲演唱能力模型PSj以及用户ui的歌唱能力模型PUi,可通过上述实施例获取,因此,用户ui对于歌曲sj的声学匹配度的具体计算如公式七。
公式七中,VCi,j表示用户ui对于歌曲sj的声学匹配度;<midik,midil>表示用户ui所歌唱的N首歌曲中某一首歌曲sj对应的某一个演唱情景;PSj,k,l表示长度为Lj的歌曲sj中每一个演唱情景<midik,midil>出现的次数;PUj,k,l表示用户ui在歌唱每一个演唱情景<midik,midil>时的平均歌唱误差;Mj *表示多个不同用户歌唱的同一歌曲sj的标准乐器数字接口序列的集合;αk,l表示声学匹配参数。
可选地,上述实施例中S204的一种可能的实现方式包括:S204a-S204c。
S204a、获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量。
根据用户以及用户所歌唱的N首歌曲,获取用户的偏好向量以及N首歌曲中每首歌曲的特征向量。例如,用户ui的偏好向量为Ui;歌曲sj的特征向量为Vj。其中,用户ui的偏好向量Ui以及歌曲sj的特征向量Vj均是可优化学习的参数。
S204b、根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量,获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数。
由于用户对N首歌曲中每首歌曲的声学匹配度、用户的偏好向量以及N首歌曲中每首歌曲的特征向量满足如下公式八。
公式八中,Ri,j表示用户ui对于歌曲sj的偏好打分;VCi,j表示用户ui对于歌曲sj的声学匹配度;Ui表示用户ui的偏好向量为;Vj表示歌曲sj的特征向量。
其中,公式八中的VCi,j即为上述实施例中用户ui对歌曲sj的声学匹配度VCi,j的计算公式七,将其代入公式八可获取具体的偏好打分模型计算公式。
根据上述实施例中所获取的用户对N首歌曲中每首歌曲的声学匹配度、用户的偏好向量以及N首歌曲中每首歌曲的特征向量,通过贝叶斯后验个性化排序算法以及梯度下降算法获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数。其中,贝叶斯后验个性化排序算法以及梯度下降算法如公式九及公式十。在求取目标用户偏好向量U、目标歌曲特征向量V以及目标声学匹配参数α的过程中,使得公式九中的函数值最小时的用户偏好向量U、歌曲特征向量V以及声学匹配参数α值即为所要求取的目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数。贝叶斯后验个性化排序算法以及梯度下降算法均为现有技术,具体原理此处不再赘述。
公式九及公式十中,U表示用户的偏好向量;V表示用户所歌唱的歌曲的特征向量;Ri,j表示用户ui对于所歌唱过的歌曲sj的偏好打分;Ri,k表示用户ui对于未歌唱过的歌曲sk的偏好打分;λU,λV是两个超参数,根据实际情况进行调节;‖·‖F表示求弗罗贝尼乌斯范数(Frobenius norm)。
S204c、根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数,获得所述用户对歌曲的偏好打分模型,其中,所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型,输出为偏好打分。
根据所获取的目标用户偏好向量目标歌曲特征向量/>以及目标声学匹配参数/>获取用户对歌曲的偏好打分模型。将获得的目标用户偏好向量/>目标歌曲特征向量/>以及目标声学匹配参数/>代入上述公式八中,得到的偏好打分模型如公式十一所示。
公式十一中,Ri,q表示用户ui对于未歌唱的歌曲sq的偏好打分;<midim,midin>表示除用户ui之外的其他用户所歌唱的歌曲sq中的某一个演唱情景;PSq,m,n表示除用户ui之外的其他用户所歌唱的歌曲sq中的每一个演唱情景<midim,midin>出现的次数;PUq,m,n表示除用户ui之外的其他用户在歌唱歌曲sq的每一个演唱情景<midim,midin>时的平均歌唱误差;Mq *表示同一歌曲sq的标准乐器数字接口序列;表示目标声学匹配参数;/>表示目标偏好向量;/>表示目标特征向量。其中,未歌唱歌曲sq的演唱情景<midim,midin>、未歌唱的多首歌曲中某一首歌曲sq中每一个演唱情景<midim,midin>出现的次数PSq,m,n、除用户ui之外的其他用户在歌唱每一个演唱情景<midim,midin>时的平均歌唱误差PUq,m,n以及未歌唱的歌曲sq的标准乐器数字接口序列可参见上述实施例中的方法,此处不再赘述。
可选地,上述实施例中S205的一种可能的实现方式为:
根据所述用户对歌曲的偏好打分模型,获取所述用户多首未歌唱的歌曲的偏好打分;并将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲,M为大于等于1的整数。
根据上述步骤中所获取的用户ui对于歌曲sj的偏好打分模型,对于用户ui,对没有被该用户歌唱的多首歌曲的偏好进行打分,并将所获取的该用户未歌唱的多首歌曲的偏好打分由高到低进行排序,将偏好打分最高的前M首歌曲确定为该用户的推荐歌曲。
或者,对于某一首未歌唱的歌曲,根据打分模型获取所述为歌唱的歌曲的打分结果,如果所获取的该歌曲的打分结果大于某一预设值,则将该歌曲确定为推荐歌曲。
本实施例中,通过获取用户歌唱的N首歌曲的乐器数字接口序列、N首歌曲中每首歌曲的标准乐器数字接口序列以及多个不同用户歌唱的同一歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列,获取所述同一歌曲的标准乐器数字接口序列;然后根据N首歌曲的乐器数字接口序列和N首歌曲中每首歌曲的标准乐器数字接口序列,获得P个不同的演唱情景中每个演唱情景的平均歌唱误差,P为大于等于1的整数;并将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型,其中每个演唱情景的平均歌唱误差可根据每个演唱情景出现的次数以及所述每个演唱情景的总误差来获取;以及根据歌曲的标准乐器数字接口序列,获取K个演唱情景中每个所述演唱情景出现的次数;并将K个演唱情景中每个演唱情景的次数构成的矩阵确定为该歌曲的歌曲演唱能力模型;然后根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度;然后根据所获取的用户的偏好向量、N首歌曲中每首歌曲的特征向量以及用户对所述N首歌曲中每首歌曲的声学匹配度,获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数,并根据目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数,获得所述用户对歌曲的偏好打分模型,其中,所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型,输出为偏好打分;最后根据所述用户对歌曲的偏好打分模型,获取所述用户多首未歌唱的歌曲的偏好打分,将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲获取针对所述用户的未歌唱歌曲的推荐结果。由于该方法是通过自动化建模用户的歌唱能力并衡量用户歌唱能力与歌曲的声学匹配度,因此,该方法可以应用于大型在线唱歌平台中;更重要的是该方法是通过确定用户对歌曲的偏好来确定该用户的未歌唱歌曲推荐结果,推荐结果与用户的偏好更匹配,提高了歌曲推荐的准确性。
图3为本申请一实施例提供的歌曲推荐装置的结构示意图,如图3所示,本申请实施例的装置300可以包括:获取模块310,处理模块320,推荐模块330。
获取模块310,用于获取用户歌唱的N首歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型;以及获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的。
处理模块320,用于根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度;以及根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型。
推荐模块330,还用于根据所述用户对歌曲的偏好打分模型,获取针对所述用户的未歌唱歌曲的推荐结果。
可选地,声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关;所述处理模块320,具体用于:获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量;根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量,获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数;根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数,获得所述用户对歌曲的偏好打分模型,其中,所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型,输出为偏好打分。
可选地,所述推荐模块330,具体用于:根据所述用户对歌曲的偏好打分模型,获取所述用户多首未歌唱的歌曲的偏好打分;将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲,M为大于等于1的整数。
可选地,所述获取模块310,具体用于:获取多个不同用户歌唱的同一歌曲的乐器数字接口序列;根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列,获取所述同一歌曲的标准乐器数字接口序列。
可选地,所述获取模块310,具体用于:根据所述歌曲的标准乐器数字接口序列,确定所述歌曲的演唱情景为K个演唱情景,K为大于等于1的整数;根据所述歌曲的标准乐器数字接口序列,获取K个演唱情景中每个所述演唱情景出现的次数;将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型;其中,所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。
可选地,所述获取模块310,具体用于:根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得P个不同的演唱情景中每个演唱情景的平均歌唱误差,所述多个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的,P为大于等于1的整数;将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。
可选地,所述处理模块320,具体用于:根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景,获取所述P个不同的演唱情景中每个演唱情景出现的次数;根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列,确定所述每个演唱情景的总歌唱误差;根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差,获取每个演唱情景的平均歌唱误差。
本实施例的装置,可以用于执行上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图4为本申请一实施例提供的电子设备的结构示意图,如图4所示,本实施例的电子设备400可以包括:存储器410、处理器420。
存储器410,用于存储程序指令;
处理器420,用于调用并执行所述存储器中的程序指令,执行:
获取用户歌唱的N首歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型。
获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的。
根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度。
根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型。
根据所述用户对歌曲的偏好打分模型,获取针对所述用户的未歌唱歌曲的推荐结果。
可选地,声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关;所述可选地,所述处理器420,具体用于:获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量;根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量,获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数;根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数,获得所述用户对歌曲的偏好打分模型,其中,所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型,输出为偏好打分。
可选地,可选地,所述处理器420,具体用于:根据所述用户对歌曲的偏好打分模型,获取所述用户多首未歌唱的歌曲的偏好打分;将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲,M为大于等于1的整数。
可选地,可选地,所述处理器420,具体用于:获取多个不同用户歌唱的同一歌曲的乐器数字接口序列;根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列,获取所述同一歌曲的标准乐器数字接口序列。
可选地,可选地,所述处理器420,具体用于:根据所述歌曲的标准乐器数字接口序列,确定所述歌曲的演唱情景为K个演唱情景,K为大于等于1的整数;根据所述歌曲的标准乐器数字接口序列,获取K个演唱情景中每个所述演唱情景出现的次数;将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型;其中,所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。
可选地,所述处理器420,具体用于:根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得P个不同的演唱情景中每个演唱情景的平均歌唱误差,所述多个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的,P为大于等于1的整数;将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。
可选地,可选地,所述处理器420,具体用于:根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景,获取所述P个不同的演唱情景中每个演唱情景出现的次数;根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列,确定所述每个演唱情景的总歌唱误差;根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差,获取每个演唱情景的平均歌唱误差。
本实施例的电子设备,可以用于执行上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图5为本申请另一实施例提供的终端设备的结构示意图,该终端设备可以是移动电话,计算机,平板设备等。
终端设备500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入/输出(I/O)接口512,传感器组件514,以及通信组件516。
处理组件502通常控制终端设备500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在终端设备500的操作。这些数据的示例包括用于在终端设备500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件506为终端设备500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为终端设备500生成、管理和分配电力相关联的组件。
多媒体组件508包括在所述终端设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当终端设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当终端设备500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为终端设备500提供各个方面的状态评估。例如,传感器组件514可以检测到终端设备500的打开/关闭状态,组件的相对定位,例如所述组件为终端设备500的显示器和小键盘,传感器组件514还可以检测终端设备500或终端设备500一个组件的位置改变,用户与终端设备500接触的存在或不存在,终端设备500方位或加速/减速和终端设备500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件516被配置为便于终端设备500和其他设备之间有线或无线方式的通信。终端设备500可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件516还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,终端设备500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由终端设备500的处理器520执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当该存储介质中的指令由终端设备的处理器执行时,使得终端设备能够执行上述任一方法实施例中的方案。
图6为本申请另一实施例提供的服务器的结构示意图。参照图6,服务器600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述各方法实施例中的方案。
服务器600还可以包括一个电源组件626被配置为执行服务器600的电源管理,一个有线或无线网络接口650被配置为将服务器600连接到网络,和一个输入输出(I/O)接口658。服务器600可以操作基于存储在存储器632的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
一种非临时性计算机可读存储介质,当该存储介质中的指令由服务器的处理器执行时,使得服务器能够执行上述任一方法实施例中的方案。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读内存(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (9)
1.一种歌曲推荐方法,其特征在于,包括:
获取用户歌唱的N首歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型;
获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的;
根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度;
根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型;
根据所述用户对歌曲的偏好打分模型,获取所述用户的未歌唱歌曲的推荐结果;
所述获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,包括:
根据所述歌曲的标准乐器数字接口序列,确定所述歌曲的演唱情景为K个演唱情景,K为大于等于1的整数;
根据所述歌曲的标准乐器数字接口序列,获取K个演唱情景中每个所述演唱情景出现的次数;
将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型;
其中,所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。
2.根据权利要求1所述的方法,其特征在于,声学匹配度与歌曲演唱能力模型、用户歌唱能力模型以及声学匹配参数有关;所述根据所述用户对所述N首歌曲的声学匹配度与、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型,包括:
获取所述用户的偏好向量和所述N首歌曲中每首歌曲的特征向量;
根据所述用户对所述N首歌曲中每首歌曲的声学匹配度、所述N首歌曲中每首歌曲的特征向量以及所述用户的偏好向量,获取目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数;
根据所述目标用户偏好向量、目标歌曲特征向量以及目标声学匹配参数,获得所述用户对歌曲的偏好打分模型,其中,所述偏好打分模型的输入为歌曲演唱能力模型和用户歌唱能力模型,输出为偏好打分。
3.根据权利要求1或2所述的方法,其特征在于,根据所述用户对歌曲的偏好打分模型,获取所述用户的未歌唱歌曲的推荐结果,包括:
根据所述用户对歌曲的偏好打分模型,获取所述用户多首未歌唱的歌曲的偏好打分;
将偏好打分最高的前M首歌曲确定为所述用户的推荐歌曲,M为大于等于1的整数。
4.根据权利要求1或2所述的方法,其特征在于,获取所述N首歌曲中每首歌曲的标准乐器数字接口序列,包括:
获取多个不同用户歌唱的同一歌曲的乐器数字接口序列;
根据所述多个不同用户歌唱的同一歌曲的乐器数字接口序列,获取所述同一歌曲的标准乐器数字接口序列。
5.根据权利要求1或2所述的方法,其特征在于,所述根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型,包括:
根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得P个不同的演唱情景中每个演唱情景的平均歌唱误差,所述P个不同的演唱情景是由所述N首歌曲的标准乐器数字接口序列确定的,P为大于等于1的整数;
将多个不同的演唱情景中每个演唱情景的平均歌唱误差构成的矩阵确定为所述用户的用户歌唱能力模型。
6.根据权利要求5所述的方法,其特征在于,根据所述N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得多个不同的演唱情景中每个演唱情景的平均歌唱误差,包括:
根据用户歌唱的所述N首歌曲中每首歌曲的乐器数字接口序列以及所述P个不同的演唱情景,获取所述P个不同的演唱情景中每个演唱情景出现的次数;
根据用户歌唱的所述N首歌曲的乐器数字接口序列以及所述N首歌曲的标准乐器数字接口序列,确定所述每个演唱情景的总歌唱误差;
根据所述每个演唱情景出现的次数以及所述每个演唱情景的总误差,获取每个演唱情景的平均歌唱误差。
7.一种歌曲推荐装置,其特征在于,包括:
获取模块,用于获取用户歌唱的N首歌曲的乐器数字接口序列,N为大于等于1的整数,并根据所述用户歌唱的N首歌曲的乐器数字接口序列和所述N首歌曲中每首歌曲的标准乐器数字接口序列,获得所述用户的用户歌唱能力模型;以及获取所述N首歌曲中每首歌曲的歌曲演唱能力模型,其中,所述每首歌曲的歌曲演唱能力模型是根据所述歌曲的标准乐器数字接口序列得到的;
处理模块,用于根据所述N首歌曲中每首歌曲的歌曲演唱能力模型以及所述用户的用户歌唱能力模型,获取用户对所述N首歌曲中每首歌曲的声学匹配度;以及根据所述用户对所述N首歌曲的声学匹配度、用户的偏好向量和所述N首歌曲中每首歌曲的特征向量,获得所述用户对歌曲的偏好打分模型;
推荐模块,用于根据所述用户对歌曲的偏好打分模型,获取所述用户的未歌唱歌曲的推荐结果;
所述获取模块,具体用于:
根据所述歌曲的标准乐器数字接口序列,确定所述歌曲的演唱情景为K个演唱情景,K为大于等于1的整数;
根据所述歌曲的标准乐器数字接口序列,获取K个演唱情景中每个所述演唱情景出现的次数;
将所述K个演唱情景中每个演唱情景的次数构成的矩阵确定为所述歌曲的歌曲演唱能力模型;
其中,所述演唱情景包括所述乐器数字接口序列中相邻的两个数字接口序列。
8.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,执行如权利要求1至6中任一项所述的歌曲推荐方法。
9.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的歌曲推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010084450.9A CN111309959B (zh) | 2020-02-10 | 2020-02-10 | 歌曲推荐方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010084450.9A CN111309959B (zh) | 2020-02-10 | 2020-02-10 | 歌曲推荐方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111309959A CN111309959A (zh) | 2020-06-19 |
CN111309959B true CN111309959B (zh) | 2023-08-18 |
Family
ID=71158306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010084450.9A Active CN111309959B (zh) | 2020-02-10 | 2020-02-10 | 歌曲推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111309959B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091594A (zh) * | 2013-08-16 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 一种音频分类方法及装置 |
CN110096611A (zh) * | 2019-04-24 | 2019-08-06 | 努比亚技术有限公司 | 一种歌曲推荐方法、移动终端及计算机可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203571B (zh) * | 2016-03-18 | 2019-08-06 | 腾讯科技(深圳)有限公司 | 歌曲旋律信息处理方法和装置 |
JP6610715B1 (ja) * | 2018-06-21 | 2019-11-27 | カシオ計算機株式会社 | 電子楽器、電子楽器の制御方法、及びプログラム |
-
2020
- 2020-02-10 CN CN202010084450.9A patent/CN111309959B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091594A (zh) * | 2013-08-16 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 一种音频分类方法及装置 |
CN110096611A (zh) * | 2019-04-24 | 2019-08-06 | 努比亚技术有限公司 | 一种歌曲推荐方法、移动终端及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111309959A (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109800325B (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
CN109871896B (zh) | 数据分类方法、装置、电子设备及存储介质 | |
CN109359056B (zh) | 一种应用程序测试方法及装置 | |
CN106485567B (zh) | 物品推荐方法及装置 | |
CN111898018B (zh) | 一种虚拟资源的发送方法、装置、电子设备及存储介质 | |
CN111210844B (zh) | 语音情感识别模型的确定方法、装置、设备及存储介质 | |
CN110867254A (zh) | 预测方法及装置、电子设备和存储介质 | |
CN112148980B (zh) | 基于用户点击的物品推荐方法、装置、设备和存储介质 | |
CN115100472A (zh) | 展示对象识别模型的训练方法、装置和电子设备 | |
CN112768064A (zh) | 疾病预测装置及设备、症状信息处理方法、装置及设备 | |
CN111242205B (zh) | 图像清晰度检测方法、装置及存储介质 | |
CN110019965B (zh) | 表情图像的推荐方法、装置、电子设备及存储介质 | |
CN111309959B (zh) | 歌曲推荐方法和装置 | |
CN111831132A (zh) | 一种信息推荐方法、装置和电子设备 | |
CN113923517B (zh) | 一种背景音乐生成方法、装置及电子设备 | |
CN107301188B (zh) | 一种获取用户兴趣的方法及电子设备 | |
CN114429599A (zh) | 类目分类方法、装置、电子设备和存储介质 | |
CN114722238B (zh) | 视频推荐方法、装置、电子设备、存储介质及程序产品 | |
CN113946228A (zh) | 语句推荐方法、装置、电子设备和可读存储介质 | |
CN112256892A (zh) | 视频推荐方法、装置、电子设备及存储介质 | |
CN113190725B (zh) | 对象的推荐及模型训练方法和装置、设备、介质和产品 | |
CN112380388B (zh) | 搜索场景下的视频排序方法、装置、电子设备及存储介质 | |
CN117350824B (zh) | 电子元件信息上传及展示方法、装置、介质及设备 | |
CN114201665A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN114328989A (zh) | 媒体信息处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |