CN113672758A - 歌单生成方法、装置、介质和计算设备 - Google Patents

歌单生成方法、装置、介质和计算设备 Download PDF

Info

Publication number
CN113672758A
CN113672758A CN202110963032.1A CN202110963032A CN113672758A CN 113672758 A CN113672758 A CN 113672758A CN 202110963032 A CN202110963032 A CN 202110963032A CN 113672758 A CN113672758 A CN 113672758A
Authority
CN
China
Prior art keywords
song
preference
songs
picture
target user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110963032.1A
Other languages
English (en)
Other versions
CN113672758B (zh
Inventor
龚淑琴
任印涛
肖强
李勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Netease Cloud Music Technology Co Ltd
Original Assignee
Hangzhou Netease Cloud Music Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Netease Cloud Music Technology Co Ltd filed Critical Hangzhou Netease Cloud Music Technology Co Ltd
Priority to CN202110963032.1A priority Critical patent/CN113672758B/zh
Publication of CN113672758A publication Critical patent/CN113672758A/zh
Application granted granted Critical
Publication of CN113672758B publication Critical patent/CN113672758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • G06F16/639Presentation of query results using playlists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施方式提供了一种歌单生成方法、装置、介质和计算设备。该歌单生成方法包括:获取目标用户的偏好歌曲集合,从所述偏好歌曲集合中确定种子歌曲;获取与所述种子歌曲关联的图片集合,计算所述目标用户对所述图片集合中的各个图片的偏好预测评分,根据所述偏好预测评分从所述图片集合中确定种子歌曲图片;基于所述偏好歌曲集合中的各个偏好歌曲召回相似歌曲,将所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲和所述相似歌曲确定为候选歌曲;计算所述目标用户对所述候选歌曲的偏好预测评分,根据所述偏好预测评分生成歌曲列表;基于所述种子歌曲图片和所述歌曲列表生成歌单。本公开可以提高针对用户的歌曲推荐的准确度,提升用户体验。

Description

歌单生成方法、装置、介质和计算设备
技术领域
本公开的实施方式涉及计算机应用领域,更具体地,本公开的实施方式涉及一种歌单生成方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着数字音乐的快速发展和音乐资源的飞速增长,目前主流的音乐应用程序都可以为用户提供海量的歌曲,由用户选择歌曲进行收听,但是也导致歌曲过载的问题日益严重,这就使得如何找到用户可能偏好的歌曲,以针对用户进行个性化的歌曲推荐成为了亟待解决的问题。
发明内容
在本上下文中,本公开的实施方式期望提供一种歌单生成方法、装置、介质和计算设备。
在本公开实施方式的第一方面中,提供了一种歌单生成方法,所述方法包括:
获取目标用户的偏好歌曲集合,从所述偏好歌曲集合中确定种子歌曲;
获取与所述种子歌曲关联的图片集合,计算所述目标用户对所述图片集合中的各个图片的偏好预测评分,根据所述偏好预测评分从所述图片集合中确定种子歌曲图片;
基于所述偏好歌曲集合中的各个偏好歌曲召回相似歌曲,将所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲和所述相似歌曲确定为候选歌曲;
计算所述目标用户对所述候选歌曲的偏好预测评分,根据所述偏好预测评分生成歌曲列表;
基于所述种子歌曲图片和所述歌曲列表生成歌单。
可选地,所述根据所述偏好预测评分生成歌曲列表,包括:
根据所述偏好预测评分将所述候选歌曲展示给所述目标用户,根据所述目标用户选择的候选歌曲生成歌曲列表。
可选地,所述计算所述目标用户对所述候选歌曲的偏好预测评分,包括:
根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,计算所述目标用户对所述候选歌曲的偏好预测评分;
其中,多模态数据用于表征与歌曲对应的音频数据、图片数据和属性数据中的多个的组合数据。
可选地,所述根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,计算所述目标用户对所述候选歌曲的偏好预测评分,包括:
将与所述种子歌曲对应的第一多模态数据、与所述候选歌曲对应的第二多模态数据,以及与所述目标用户的历史播放歌曲对应的第三多模态数据输入歌曲预测模型进行预测计算,得到所述目标用户对所述候选歌曲的偏好预测评分;
其中,所述歌曲预测模型包括:向量转化层、交叉处理层和全连接层;
所述向量转化层用于查找与所述第一多模态数据对应的第一多模态特征向量,查找与所述第二多模态特征对应的第二多模态特征向量,查找与所述第三多模态特征对应的第三多模态特征向量,并将查找结果传输至所述交叉处理层;
所述交叉处理层用于将所述第一多模态特征向量和所述第二多模态特征向量进行交叉处理得到第一交叉特征向量,将所述第三多模态特征向量和所述第二多模态特征向量进行交叉处理得到第二交叉特征向量,并将所述第一多模态特征向量、所述第二多模态特征向量、所述第三多模态特征向量、所述第一交叉特征向量和所述第二交叉特征向量进行拼接处理后得到的拼接特征向量传输至所述全连接层;
所述全连接层用于将所述拼接特征向量映射为偏好预测评分,并输出所述偏好预测评分。
可选地,所述方法还包括:
根据与歌曲数据库中的各个歌曲分别对应的多模态数据,对所述多模态数据进行提取特征向量的预处理,以提取与所述多模态数据对应的多模态特征向量。
可选地,所述方法还包括:
获取所述目标用户的用户画像数据和历史播放行为数据;
所述根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,计算所述目标用户对所述候选歌曲的偏好预测评分,包括:
根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,以及所述目标用户的用户画像数据和历史播放行为数据,计算所述目标用户对所述候选歌曲的偏好预测评分。
可选地,所述从所述偏好歌曲集合中确定种子歌曲,包括:
基于所述目标用户的历史播放行为数据,确定所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度;
将所述偏好歌曲集合中的所述偏好度最高的偏好歌曲确定为所述种子歌曲。
可选地,所述基于所述偏好歌曲集合中的各个偏好歌曲召回相似歌曲,包括:
针对歌曲数据库中的任一目标歌曲,计算所述目标歌曲与所述偏好歌曲集合中的各个偏好歌曲的相似度,并确定所述相似度是否达到预设的第一阈值;
如果所述相似度达到所述第一阈值,将所述目标歌曲确定为相似歌曲。
可选地,所述将所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲和所述相似歌曲确定为候选歌曲,包括:
基于所述目标用户的历史播放行为数据,确定所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度;
基于所述目标歌曲与所述偏好歌曲集合中的各个偏好歌曲的相似度,以及所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度,计算所述目标用户对所述目标歌曲的感兴趣度,并确定所述感兴趣度是否达到预设的第二阈值;
如果所述感兴趣度达到所述第二阈值,将所述感兴趣度达到所述第二阈值的目标歌曲和所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲确定为候选歌曲。
可选地,所述计算所述目标用户对所述图片集合中的各个图片的偏好预测评分,包括:
针对所述图片集合中的任一目标图片,将所述目标图片的图片属性数据和所述目标用户的用户画像数据输入图片预测模型进行预测计算,得到所述目标用户对所述目标图片的偏好预测评分;其中,所述图片预测模型为基于样本用户对样本图片的偏好评分训练出的机器学习模型。
可选地,所述根据所述偏好预测评分从所述图片集合中确定种子歌曲图片,包括:
将所述图片集合中的所述偏好预测评分最高的图片确定为种子歌曲图片。
可选地,所述根据所述偏好预测评分生成歌曲列表,包括:
根据所述偏好预测评分对所述候选歌曲进行排序,并根据所述种子歌曲和排序后的所述候选歌曲生成所述歌曲列表。
在本公开实施方式的第二方面中,提供了一种歌单生成装置,所述装置包括:
第一确定模块,用于获取目标用户的偏好歌曲集合,从所述偏好歌曲集合中确定种子歌曲;
第二确定模块,用于获取与所述种子歌曲关联的图片集合,计算所述目标用户对所述图片集合中的各个图片的偏好预测评分,根据所述偏好预测评分从所述图片集合中确定种子歌曲图片;
第三确定模块,用于基于所述偏好歌曲集合中的各个偏好歌曲召回相似歌曲,将所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲和所述相似歌曲确定为候选歌曲;
计算模块,用于计算所述目标用户对所述候选歌曲的偏好预测评分,根据所述偏好预测评分生成歌曲列表;
生成模块,用于基于所述种子歌曲图片和所述歌曲列表生成歌单。
可选地,所述计算模块具体用于:
根据所述偏好预测评分将所述候选歌曲展示给所述目标用户,根据所述目标用户选择的候选歌曲生成歌曲列表。
可选地,所述计算模块具体用于:
根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,计算所述目标用户对所述候选歌曲的偏好预测评分;
其中,多模态数据用于表征与歌曲对应的音频数据、图片数据和属性数据中的多个的组合数据。
可选地,所述计算模块具体用于:
将与所述种子歌曲对应的第一多模态数据、与所述候选歌曲对应的第二多模态数据,以及与所述目标用户的历史播放歌曲对应的第三多模态数据输入歌曲预测模型进行预测计算,得到所述目标用户对所述候选歌曲的偏好预测评分;
其中,所述歌曲预测模型包括:向量转化层、交叉处理层和全连接层;
所述向量转化层用于查找与所述第一多模态数据对应的第一多模态特征向量,查找与所述第二多模态特征对应的第二多模态特征向量,查找与所述第三多模态特征对应的第三多模态特征向量,并将查找结果传输至所述交叉处理层;
所述交叉处理层用于将所述第一多模态特征向量和所述第二多模态特征向量进行交叉处理得到第一交叉特征向量,将所述第三多模态特征向量和所述第二多模态特征向量进行交叉处理得到第二交叉特征向量,并将所述第一多模态特征向量、所述第二多模态特征向量、所述第三多模态特征向量、所述第一交叉特征向量和所述第二交叉特征向量进行拼接处理后得到的拼接特征向量传输至所述全连接层;
所述全连接层用于将所述拼接特征向量映射为偏好预测评分,并输出所述偏好预测评分。
可选地,所述装置还包括:
预处理模块,用于根据与歌曲数据库中的各个歌曲分别对应的多模态数据,对所述多模态数据进行提取特征向量的预处理,以提取与所述多模态数据对应的多模态特征向量。
可选地,所述装置还包括:
获取模块,用于获取所述目标用户的用户画像数据和历史播放行为数据;
所述计算模块具体用于:
根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,以及所述目标用户的用户画像数据和历史播放行为数据,计算所述目标用户对所述候选歌曲的偏好预测评分。
可选地,所述第一确定模块具体用于:
基于所述目标用户的历史播放行为数据,确定所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度;
将所述偏好歌曲集合中的所述偏好度最高的偏好歌曲确定为所述种子歌曲。
可选地,所述第三确定模块具体用于:
针对歌曲数据库中的任一目标歌曲,计算所述目标歌曲与所述偏好歌曲集合中的各个偏好歌曲的相似度,并确定所述相似度是否达到预设的第一阈值;
如果所述相似度达到所述第一阈值,将所述目标歌曲确定为相似歌曲。
可选地,所述第三确定模块具体用于:
基于所述目标用户的历史播放行为数据,确定所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度;
基于所述目标歌曲与所述偏好歌曲集合中的各个偏好歌曲的相似度,以及所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度,计算所述目标用户对所述目标歌曲的感兴趣度,并确定所述感兴趣度是否达到预设的第二阈值;
如果所述感兴趣度达到所述第二阈值,将所述感兴趣度达到所述第二阈值的目标歌曲和所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲确定为候选歌曲。
可选地,所述第二确定模块具体用于:
针对所述图片集合中的任一目标图片,将所述目标图片的图片属性数据和所述目标用户的用户画像数据输入图片预测模型进行预测计算,得到所述目标用户对所述目标图片的偏好预测评分;其中,所述图片预测模型为基于样本用户对样本图片的偏好评分训练出的机器学习模型。
可选地,所述第二确定模块具体用于:
将所述图片集合中的所述偏好预测评分最高的图片确定为种子歌曲图片。
可选地,所述计算模块具体用于:
根据所述偏好预测评分对所述候选歌曲进行排序,并根据所述种子歌曲和排序后的所述候选歌曲生成所述歌曲列表。
在本公开实施方式的第三方面中,提供了一种介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一歌单生成方法。
在本公开实施方式的第四方面中,提供了一种计算设备,包括:
处理器;
用于存储处理器可执行程序的存储器;
其中,所述处理器通过运行所述可执行程序以实现上述任一歌单生成方法。
根据本公开实施方式,可以先从用户的偏好歌曲集合中确定种子歌曲,并根据该用户对与该种子歌曲关联的图片的偏好预测评分确定种子歌曲图片,以及基于该偏好歌曲集合中的偏好歌曲召回相似歌曲,以将该偏好歌曲集合中除该种子歌曲外的其他偏好歌曲和该相似歌曲确定为候选歌曲,后续可以根据该用户对该候选歌曲的偏好预测评分生成歌曲列表,并根据该种子歌曲图片和该歌曲列表生成歌单。采用这样的方式,可以保证用户对生成的歌单的歌单图片和歌曲列表中的歌曲的偏好程度,从而可以提高针对用户的歌曲推荐的准确度,并提升用户体验。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示意性地示出了根据本公开实施方式的一种歌单生成的应用场景的示意图;
图2A示意性地示出了根据本公开实施方式的一种用户界面的示意图;
图2B示意性地示出了根据本公开实施方式的另一种用户界面的示意图;
图3示意性地示出了根据本公开实施方式的一种歌单生成方法的流程图;
图4示意性地示出了根据本公开实施方式的一种歌曲预测模型的示意图;
图5示意性地示出了根据本公开实施方式的另一种歌曲预测模型的示意图;
图6示意性地示出了根据本公开实施方式的一种歌单的示意图;
图7A示意性地示出了根据本公开实施方式的再一种用户界面的示意图;
图7B示意性地示出了根据本公开实施方式的另一种歌单的示意图;
图8示意性地示出了根据本公开实施方式的一种介质的示意图;
图9示意性地示出了根据本公开实施方式的一种歌单生成装置的框图;
图10示意性地示出了根据本公开实施方式的一种计算设备的示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本公开的实施方式,提出了一种歌单生成方法、装置、介质和计算设备。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
发明概述
通常,在针对用户进行歌曲推荐时,会将包含用户可能偏好的多个歌曲的歌曲列表推送给用户,供用户查看,并从中选择歌曲进行收听。歌曲列表可以采用歌单的形式进行承载。除歌曲列表外,歌单还可以包括歌单图片;其中,歌单图片可以是与歌曲列表中的某一歌曲关联的图片。在将歌单推送给用户时,会先向用户展示歌单中的歌单图片,并在用户进入歌单详情页后,再向用户展示歌单中的歌曲列表。
在相关技术中,通常是仅根据用户历史播放过的歌曲的歌曲风格为用户进行歌曲推荐,推荐维度单一,从而导致针对用户的歌曲推荐的准确度较低。
为了解决上述问题,本公开提出了一种歌单生成的技术方案,可以先从用户的偏好歌曲集合中确定种子歌曲,并根据该用户对与该种子歌曲关联的图片的偏好预测评分确定种子歌曲图片,以及基于该偏好歌曲集合中的偏好歌曲召回相似歌曲,以将该偏好歌曲集合中除该种子歌曲外的其他偏好歌曲和该相似歌曲确定为候选歌曲,后续可以根据该用户对该候选歌曲的偏好预测评分生成歌曲列表,并根据该种子歌曲图片和该歌曲列表生成歌单。采用这样的方式,可以保证用户对生成的歌单的歌单图片和歌曲列表中的歌曲的偏好程度,从而可以提高针对用户的歌曲推荐的准确度,并提升用户体验。
在介绍了本公开的基本原理之后,下面具体介绍本公开的各种非限制性实施方式。
应用场景总览
通常,用户可以在其所使用的电子设备中安装与某种业务活动对应的客户端;其中,该电子设备具体可以是智能手机、平板电脑、笔记本电脑、掌上电脑、智能穿戴设备、智能车载设备或游戏机等终端设备。
在这种情况下,上述客户端可以向用户输出与上述业务活动相关的界面,从而使用户可以在该界面中执行交互操作;而该客户端则可以基于用户在该界面中的交互操作执行与该业务活动相关的业务流程。
首先参考图1,图1示意性地示出了根据本公开实施方式的一种歌单生成的应用场景的示意图。
如图1所示,在歌单生成的应用场景中,可以包括与音乐应用程序对应的服务端,以及接入该服务端的至少一个客户端(例如:客户端1-N);其中,该客户端可以是音乐应用程序,该服务端可以是与该音乐应用程序对应的服务端。
在实际应用中,上述服务端可以与歌曲数据库对接,从而可以将存储在该歌曲数据库中歌曲,通过上述客户端提供给用户。
举例来说,上述服务端可以针对用户进行个性化的歌曲推荐,并将生成的推荐歌单通过上述客户端推送给用户。
具体地,上述客户端可以向用户输出如图2A所示的用户界面。该用户界面中可以展示上述服务端向用户推送的推荐歌单的歌单图片和歌单名称;该推荐歌单中可以包括用户可能偏好的多个歌曲。用户可以在该用户界面中点击该推荐歌单的歌单图片或歌单名称所在的位置,从而使该客户端跳转至如图2B所示的用于展示该推荐歌单的歌单详情的用户界面,供用户查看该推荐歌单中的歌曲,并从中选择歌曲进行收听。
示例性方法
下面结合图1的应用场景,参考图3-5来描述根据本公开示例性实施方式的歌单生成的方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
参考图3,图3示意性地示出了根据本公开实施方式的一种歌单生成方法的流程图。
该歌单生成方法可以应用于上述服务端;该歌单生成方法可以包括以下步骤:
步骤301:获取目标用户的偏好歌曲集合,从所述偏好歌曲集合中确定种子歌曲。
在实际应用中,可以在用户启动上述客户端时,由该客户端向上述服务端发送获取推荐歌单的请求,从而使该服务端响应于该请求,针对该用户进行个性化的歌曲推荐。或者,可以由该用户通过该客户端向该服务端发送获取推荐歌单的请求,例如:由该用户在该客户端上发起新建歌单的请求,以由该客户端向该服务端发送获取推荐歌单的请求,从而使该服务端响应于该请求,针对该用户进行个性化的歌曲推荐。
在本实施例中,为了针对某一用户(称为目标用户)进行个性化的歌曲推荐,可以先获取该目标用户的偏好歌曲集合,并从获取到的偏好歌曲集合中确定种子歌曲。
其中,上述种子歌曲可以是上述偏好歌曲集合中,该目标用户的偏好度最高的歌曲。
在实际应用中,对于某一用户而言,该用户的偏好歌曲可以是该用户在最近一段时间内播放过的歌曲、该用户在最近一段时间内分享过的歌曲、该用户添加至播放列表的歌曲、该用户标记过“喜欢”的歌曲、该用户收藏的歌曲等。因此,可以根据上述目标用户的历史播放记录,获取该目标用户在预设的时间段内播放过的歌曲;根据该目标用户的历史分享记录,获取该目标用户在预设的时间段内分享过的歌曲;根据上述目标用户的播放列表,获取该目标用户添加至播放列表的歌曲;根据该目标用户创建的用于记录该目标用户标记过“喜欢”的歌曲的歌单,获取该目标用户标记过“喜欢”的歌曲;根据该目标用户的创建的用于收藏歌曲的歌单,获取该目标用户收藏的歌曲;后续,可以将获取到的这些歌曲均确定为该目标用户的偏好歌曲,并将确定出的偏好歌曲添加至上述偏好歌曲集合。
步骤302:获取与所述种子歌曲关联的图片集合,计算所述目标用户对所述图片集合中的各个图片的偏好预测评分,根据所述偏好预测评分从所述图片集合中确定种子歌曲图片。
在本实施例中,在确定了上述种子歌曲的情况下,可以获取与该种子歌曲关联的图片集合,并计算上述目标用户对该图片集合中的各个图片的偏好预测评分(即预测出的用户对图片的偏好评分),以根据计算得到的偏好预测评分,从该图片集合中确定种子歌曲图片。
在实际应用中,对于某一歌曲而言,与该歌曲关联的图片可以是该歌曲所属的歌曲专辑的封面图片、演唱该歌曲的艺人的人像图片、与该歌曲的歌曲风格对应的风格图片等。因此,可以获取上述种子歌曲所属的歌曲专辑的封面图片,获取演出该种子歌曲的艺人的人像图片,获取与该种子歌曲的歌曲风格对应的风格图片,并将获取到的图片添加至与该种子歌曲关联的图片集合。
需要说明的是,与歌曲的歌曲风格对应的风格图片可以是由技术人员预先设置的图片。例如,技术人员可以预先挑选一些图片,并为每个图片标注如欢快、伤感、激昂等的风格标签;后续,可以将被标注了欢快的风格标签的图片确定为与歌曲风格为欢快的歌曲对应的风格图片,将被标注了伤感的风格标签的图片确定为与歌曲风格为伤感的歌曲对应的风格图片,将被标注了激昂的风格标签的图片确定为与歌曲风格为激昂的歌曲对应的风格图片,以此类推。
步骤303:基于所述偏好歌曲集合中的各个偏好歌曲召回相似歌曲,将所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲和所述相似歌曲确定为候选歌曲。
在本实施例中,在确定了上述种子歌曲的情况下,还可以基于上述偏好歌曲集合中的各个偏好歌曲,分别召回与各个偏好歌曲相似的相似歌曲,并将召回的相似歌曲,以及该偏好歌曲集合中除该种子歌曲外的其他偏好歌曲,确定为候选歌曲。
步骤304:计算所述目标用户对所述候选歌曲的偏好预测评分,根据所述偏好预测评分生成歌曲列表。
在本实施例中,在确定了上述候选歌曲的情况下,可以计算上述目标用户对其中各个候选歌曲的偏好预测评分(即预测出的用户对歌曲的偏好评分),并根据计算得到的偏好预测评分生成歌曲列表。例如,可以基于偏好预测评分较高的候选歌曲,以及上述种子歌曲,生成歌曲列表。
在一种实施方式中,可以根据与上述种子歌曲、上述候选歌曲和上述目标用户的历史播放歌曲分别对应的多模态数据,计算该目标用户对上述候选歌曲的偏好预测评分。
其中,数据的每一种来源或形式都可以视为一种模态,上述多模态数据可以用于表征与歌曲对应的音频数据、图片数据和属性数据中的多个的组合数据;属性数据可以包括歌曲风格、歌词语种、点击率(如点击该歌曲进行过播放的用户的比率)、播放率(如完整播放过该歌曲的用户的比率)、收藏率(如将该歌曲添加至用于收藏歌曲的歌单的用户的比率)等与歌曲的自身属性或用户属性关联的数据。
在实际应用中,上述目标用户的历史播放歌曲可以包括上述目标用户在最近一段时间内完整播放过的歌曲。
需要说明的是,上述目标用户的历史播放歌曲可以仅包括该目标用户历史播放过的一首歌曲,也可以包括由该目标用户历史播放过的多首歌曲组成的歌曲序列。
步骤305:基于所述种子歌曲图片和所述歌曲列表生成歌单。
在本实施例中,在生成了上述歌曲列表的情况下,可以基于上述种子歌曲图片和生成的歌曲列表生成歌单。
具体地,可以将上述种子歌曲图片作为生成的歌单中的歌单图片,将上述歌曲列表作为生成的歌单中的歌曲列表。
在实际应用中,在生成了上述歌单的情况下,可以将该歌单作为上述目标用户的推荐歌单,通过上述客户端推送给该目标用户,供该目标用户查看,并从中选择歌曲进行收听。
下面从提取特征向量、确定种子歌曲、确定种子歌曲图片、确定候选歌曲、计算用户对候选歌曲的偏好预测评分和生成歌单这些方面对本实施例进行详细说明。
(1)提取特征向量
在一种实施方式中,由于上述服务端对接的歌曲数据库中的歌曲除被删除外,通常不会发生其他变化,因此为了节省提取与歌曲对应的特征向量的时间,可以对该歌曲数据库中的各个歌曲进行预处理,以提取与各个歌曲分别对应的特征向量。
具体地,可以根据与上述歌曲数据库中的各个歌曲分别对应的多模态数据,对各个歌曲进行预处理,以提取与各个歌曲的多模态数据分别对应的多模态特征向量。
在这种情况下,在计算上述目标用户对上述候选歌曲的偏好预测评分时,可以直接查找到通过预处理得到的上述种子歌曲、上述候选歌曲和上述目标用户的历史播放歌曲对应的特征向量,也就无需再对这些歌曲进行特征向量提取,从而可以节省提取与歌曲对应的特征向量的时间,加快计算该目标用户对该候选歌曲的偏好预测评分的速度,以便于快速针对用户进行个性化的歌曲推荐。
在实际应用中,第一方面,可以采用机器学习模型,提取与歌曲的音频数据对应的特征向量。
具体地,可以先获取若干歌曲的样本歌曲,并为这些样本歌曲标注对应的歌曲风格;后续,可以将被标注了歌曲风格的样本歌曲的音频数据输入至机器学习模型(例如:YAMNet模型)进行有监督的训练。在该机器学习模型训练完成后,可以将上述歌曲数据库中的任一歌曲的音频数据输入该机器学习模型进行预测计算。在这种情况下,可以不获取上述机器学习模型的最后一层(即输出层)输出的预测结果,而可以获取该机器学习模型的中间层输出的特征向量;此时,获取到的特征向量即为与该歌曲的音频数据对应的特征向量。
第二方面,可以采用机器学习模型,提取与歌曲的图片数据对应的特征向量。
具体地,可以先获取若干歌曲的样本歌曲,并为这些样本歌曲标注对应的图片类型;后续,可以将被标注了图片类型的样本歌曲的图片数据输入至机器学习模型(例如:基于ImageNet的图片分类模型)进行有监督的训练。在该机器学习模型训练完成后,可以将上述歌曲数据库中的任一歌曲的图片数据输入该机器学习模型进行预测计算。在这种情况下,可以不获取上述机器学习模型的最后一层(即输出层)输出的预测结果,而可以获取该机器学习模型的中间层输出的特征向量;此时,获取到的特征向量即为与该歌曲的图片数据对应的特征向量。
第三方面,可以对歌曲的属性数据进行embedding处理,以提取与歌曲的属性数据对应的特征向量。例如,可以对歌曲的属性数据进行one-hot编码,并将编码得到的向量确定为与歌曲的属性数据对应的特征向量。
(2)确定种子歌曲
在本实施例中,可以从获取到的上述偏好歌曲集合中确定上述种子歌曲。
在一种实施方式中,可以基于上述目标用户的历史播放行为数据,确定该目标用户对上述偏好歌曲集合中的各个偏好歌曲的偏好度,并将该偏好歌曲集合中,确定出的偏好度最高的偏好歌曲,确定为上述种子歌曲。
在实际应用中,可以为用户对歌曲的不同的播放行为设置不同的偏好度。在这种情况下,针对上述偏好歌曲集合中的任一偏好歌曲,可以根据上述目标用户的历史播放行为数据,确定该目标用户对该偏好歌曲的历史播放行为,并计算与确定出的历史播放行为对应的偏好度之和,作为该目标用户对该偏好歌曲的偏好度。
举例来说,假设为用户对歌曲的播放行为设置的偏好度如下表1所示:
表1
播放行为 偏好度
点击歌曲进行过播放,但未完整播放过歌曲 0.4
完整播放过歌曲 0.6
对歌曲标记过“喜欢” 1
收藏歌曲 0.8
将歌曲添加至播放列表 0.8
进一步假设根据上述目标用户的历史播放行为数据,确定该目标用户对某一偏好歌曲的历史播放行为包括:完整播放过歌曲,以及收藏歌曲,则可以确定该目标用户对该偏好歌曲的偏好度为0.6+0.8=1.4。
(3)确定种子歌曲图片
在本实施例中,可以获取与上述种子歌曲关联的图片集合,并计算上述目标用户对该图片集合中的各个图片的偏好预测评分,以根据计算得到的偏好预测评分,从该图片集合中确定上述种子歌曲图片。
在一种实施方式中,可以采用机器学习模型,计算上述目标用户对上述图片集合中的各个图片的偏好度评分。
具体地,可以先获取若干用户作为样本用户,获取若干图片作为样本图片,并将这些样本用户的用户画像数据、这些样本图片的图片属性数据作为特征数据,将这些样本用户对这些样本图片的偏好评分作为预测结果,对作为图片预测模型的机器学习模型进行有监督的训练。在该图片预测模型训练完成后,针对上述图片集合中的任一图片(称为目标图片),可以将上述目标用户的用户画像数据和该目标图片的图片属性数据输入该图片预测模型进行预测计算,得到该目标用户对该目标图片的偏好预测评分。
其中,上述图片属性数据可以包括图片类型(如封面图片、人像图片、风格图片等)、图片风格(如欢快、伤感、激昂等)、图片转化率(如在查看到图片后点击进入与该图片对应的歌单的用户的比率)等数据;上述用户画像数据可以包括用户偏好的图片类型、用户偏好的图片风格等数据。
在实际应用中,上述图片预测模型可以是逻辑回归(Logistic Regression,LR)模型。
进一步地,在一种实施方式中,为了提高用户进入推荐歌单收听歌曲的可能性,在计算得到上述目标用户对上述图片集合中的各个图片的偏好预测评分后,可以将该图片集合中,计算得到的偏好预测评分最高的图片,确定为上述种子歌曲图片。
(4)确定候选歌曲
在本实施例中,可以基于上述偏好歌曲集合中的各个偏好歌曲,分别召回与各个偏好歌曲相似的相似歌曲,并将召回的相似歌曲,以及该偏好歌曲集合中除上述种子歌曲外的其他偏好歌曲,确定为上述候选歌曲。
在一种实施方式中,在召回与上述偏好歌曲集合中的各个偏好歌曲相似的相似歌曲时,针对上述歌曲数据库中的任一歌曲(称为目标歌曲),可以计算该目标歌曲与各个偏好歌曲的相似度,并确定计算得到的相似度是否达到预设的阈值(称为第一阈值)。如果计算得到的相似度达到该第一阈值,则可以将该目标歌曲确定为上述相似歌曲。
具体地,在计算上述目标歌曲与上述偏好歌曲集合中的任一偏好歌曲的相似度时,可以统计既播放过该目标歌曲又播放过该偏好歌曲的用户的数量M,统计播放过该目标歌曲或者播放过该偏好歌曲的用户的数量N;此时,可以采用以下公式,计算该目标歌曲与该偏好歌曲的相似度S:
Figure BDA0003222947180000171
如果上述目标歌曲与上述偏好歌曲集合中的任一偏好歌曲的相似度达到上述第一阈值,则可以将该目标歌曲确定为上述相似歌曲。
进一步地,在一种实施方式中,为了加快生成推荐歌单的速度,可以将对上述相似歌曲进行筛选,以将上述相似歌曲中的部分歌曲,以及上述偏好歌曲集合中除上述种子歌曲外的其他偏好歌曲,确定为上述候选歌曲。
在对上述相似歌曲进行筛选时,可以先基于上述目标用户的历史播放行为数据,确定该目标用户对上述偏好歌曲集合中的各个偏好歌曲的偏好度;这一步骤的具体实现方法可以参考前述的确定种子歌曲中的内容,在此不再赘述。
后续,可以基于上述目标用户对上述偏好歌曲集合中的各个偏好歌曲的偏好度,以及上述目标歌曲与各个偏好歌曲的相似度,计算该目标用户对该目标歌曲的感兴趣度,并确定计算得到的感兴趣度是否达到预设的阈值(称为第二阈值)。如果计算得到的感兴趣度达到该第二阈值,则可以将该目标歌曲确定为上述候选歌曲。也即,可以将上述相似歌曲中该感兴趣度达到该第二阈值的歌曲筛选出来,将这部分歌曲和该偏好歌曲集合中除上述种子歌曲外的其他偏好歌曲确定为上述候选歌曲。
具体地,在计算该上述目标用户对上述目标歌曲的感兴趣度时,可以采用以下公式:
Figure BDA0003222947180000181
其中,I(U,B)表示用户U对歌曲B的感兴趣度,N(U)表示用户U的偏好歌曲集合,M(B,k)表示与歌曲B的相似度最高的k个歌曲,S(B,A)表示歌曲B与歌曲A的相似度,P(U,A)表示用户U对歌曲A的偏好度;k的取值可以由技术人员预先设置。
举例来说,假设用户U的偏好歌曲集合中包括歌曲A1、歌曲A2、歌曲A3和歌曲A4,且与歌曲B的相似度最高的3个歌曲为歌曲A1、歌曲A2、歌曲A3,则用户U对歌曲B的感兴趣度为:
I(U,B)=S(B,A1)P(U,A1)+S(B,A2)P(U,A2)+S(B,A3)P(U,A3)
其中,S(B,A1)表示歌曲B与歌曲A1的相似度,P(U,A1)表示用户U对歌曲A1的偏好度;S(B,A2)表示歌曲B与歌曲A2的相似度,P(U,A2)表示用户U对歌曲A2的偏好度;S(B,A3)表示歌曲B与歌曲A3的相似度,P(U,A3)表示用户U对歌曲A3的偏好度。
(5)计算用户对候选歌曲的偏好预测评分
在本实施例中,可以计算上述目标用户对上述候选歌曲中的各个候选歌曲的偏好预测评分。
具体地,可以根据与上述种子歌曲、上述候选歌曲和上述目标用户的历史播放歌曲分别对应的多模态数据,计算该目标用户对上述候选歌曲的偏好预测评分。
在示出的一种实施方式中,在计算上述目标用户对上述候选歌曲的偏好预测评分时,针对上述候选歌曲中的任一候选歌曲,可以将与上述种子歌曲对应的多模态数据(称为第一多模态数据)、与该候选歌曲对应的多模态数据(称为第二多模态数据),以及与该目标用户的历史播放歌曲对应的多模态数据(称为第三多模态数据),输入歌曲预测模型进行预测计算,得到该目标用户对该候选歌曲的偏好预测评分。
参考图4,图4示意性地示出了根据本公开实施方式的一种歌曲预测模型的示意图。
如图4所示,上述歌曲预测模型可以包括向量转化层、交叉处理层和全连接层。
其中,第一方面,上述向量转化层可以用于查找与上述第一多模态数据对应的第一多模态特征向量,查找与上述第二多模态特征对应的第二多模态特征向量,查找与上述第三多模态特征对应的第三多模态特征向量,并将查找到的该第一多模态特征向量、该第二多模态特征向量和该第三多模态特征向量传输至上述交叉处理层。
需要说明的是,上述第一多模态特征向量可以通过对上述种子歌曲进行提取特征向量的预处理得到,上述第二多模态特征向量可以通过对上述候选歌曲进行提取特征向量的预处理得到,上述第三多模态特征向量可以通过对上述目标用户的历史播放歌曲进行提取特征向量的预处理得到。
其中,在上述目标用户的历史播放歌曲包括由该目标用户历史播放过的多首歌曲组成的歌曲序列的情况下,则上述第三多模态特征向量可以包括由与这多首歌曲的多模态数据分别对应的多模态特征向量组成的多模态特征向量序列。
举例来说,假设该目标用户的历史播放歌曲中的歌曲序列如下表2所示:
表2
歌曲1 歌曲2 …… 歌曲N
则上述第三多模态特征向量可以包括如下表3所示的与音频数据对应的特征向量序列、如下表4所示的与图片数据对应的特征向量序列和如下表5所示的与属性数据对应的特征向量序列:
表3
音频特征向量1 音频特征向量2 …… 音频特征向量N
其中,音频特征向量1为与歌曲1的音频数据对应的特征向量,音频特征向量2为与歌曲2的音频数据对应的特征向量,以此类推。
表4
图片特征向量1 图片特征向量2 …… 图片特征向量N
其中,图片特征向量1为与歌曲1的图片数据对应的特征向量,图片特征向量2为与歌曲2的图片数据对应的特征向量,以此类推。
表5
属性特征向量1 属性特征向量2 …… 属性特征向量N
其中,属性特征向量1为与歌曲1的属性数据对应的特征向量,属性特征向量2为与歌曲2的属性数据对应的特征向量,以此类推。
第二方面,上述交叉处理层可以用于将上述第一多模态特征向量和上述第二多模态特征向量进行交叉处理得到第一交叉特征向量,将上述第三多模态特征向量和上述第二多模态特征向量进行交叉处理得到第二交叉特征向量,并将该第一多模态特征向量、该第二多模态特征向量、该第三多模态特征向量,以及通过交叉处理得到的第一交叉特征向量和第二交叉特征向量,进行拼接处理后得到的拼接特征向量,传输至上述全连接层。
具体地,可以基于余弦(cos)相似度算法,对上述第一多模态特征向量和上述第二多模态特征向量进行交叉处理。
此外,可以基于注意力(Attention)机制,对上述第三多模态特征向量和上述第二多模态特征向量进行交叉处理。以如上表3所示的第三多模态特征向量中的与音频数据对应的特征向量序列为例,可以采用以下公式,对该第三多模态特征向量和该第二多模态特征向量进行交叉处理:
Figure BDA0003222947180000211
其中,VU表示交叉处理得到的向量,VB表示与候选歌曲B对应的多模态特征向量中的音频特征向量,Vi表示上述与音频数据对应的特征向量序列中的第i个音频特征向量,g表示预设函数。
需要说明的是,在对多模态特征向量进行交叉处理时,可以对多模态特征向量中的相同模态的特征向量进行交叉处理。以上述第一多模态特征向量和上述第二多模态特征向量为例,可以对该第一多模态特征向量中的音频特征向量和该第二多模态特征向量中的音频特征向量进行交叉处理,对该第一多模态特征向量中的图片特征向量和该第二多模态特征向量中的图片特征向量进行交叉处理,对该第一多模态特征向量中的属性特征向量和该第二多模态特征向量中的属性特征向量进行交叉处理;以此类推。
第三方面,上述全连接层可以用于将上述拼接特征向量映射为上述目标用户对上述候选歌曲的偏好预测评分,并输出该偏好预测评分。
具体地,上述全连接层可以采用Sigmoid函数,将上述拼接特征向量映射为取值范围为[0,1]的概率值,并输出该概率值,作为上述目标用户对上述候选歌曲的偏好预测评分。
进一步地,在一种实施方式中,为了增加用于预测偏好评分的特征维度,还可以获取上述目标用户的用户画像数据和历史播放行为数据。在这种情况下,可以根据与上述种子歌曲、上述候选歌曲和上述目标用户的历史播放歌曲分别对应的多模态数据,以及该目标用户的用户画像数据和历史播放行为数据,计算该目标用户对该候选歌曲的偏好预测评分。
在实际应用中,上述用户画像数据可以包括年龄、性别、所在城市、设备操作系统,设备运营商等数据;上述历史播放行为数据可以包括根据用户的历史播放行为分析出的用户的语种偏好、风格偏好、发行年代偏好等数据,还可以包括用户在一段时间内完整播放过的歌曲的数量、标记过“喜欢”的歌曲的数量、收藏的歌曲的数量等数据。
参考图5,图5示意性地示出了根据本公开实施方式的另一种歌曲预测模型的示意图。
与如图4所示的歌曲预测模型类似的,上述歌曲预测模型可以包括向量转化层、交叉处理层和全连接层。
其中,第一方面,上述向量转化层可以用于查找与上述第一多模态数据对应的第一多模态特征向量,查找与上述第二多模态特征对应的第二多模态特征向量,查找与上述第三多模态特征对应的第三多模态特征向量,对上述用户画像数据和上述历史播放行为进行特征向量提取,并将查找到的该第一多模态特征向量、该第二多模态特征向量、该第三多模态特征向量、提取出的用户画像特征向量和历史播放行为特征向量传输至上述交叉处理层。
第二方面,上述交叉处理层可以用于将上述第一多模态特征向量和上述第二多模态特征向量进行交叉处理得到第一交叉特征向量,将上述第三多模态特征向量和上述第二多模态特征向量进行交叉处理得到第二交叉特征向量,并将该第一多模态特征向量、该第二多模态特征向量、该第三多模态特征向量、通过交叉处理得到的第一交叉特征向量和第二交叉特征向量,以及上述用户画像特征向量和上述历史播放行为特征向量,进行拼接处理后得到的拼接特征向量,传输至上述全连接层。
第三方面,上述全连接层可以用于将上述拼接特征向量映射为上述目标用户对上述候选歌曲的偏好预测评分,并输出该偏好预测评分。
(6)生成歌单
在本实施例中,可以根据计算得到的上述目标用户对上述候选歌曲中的各个候选歌曲的偏好预测评分,生成歌曲列表,并基于上述种子歌曲图片和生成的歌曲列表生成歌单。
在一种实施方式中,在生成上述歌曲列表时,可以先根据计算得到的上述目标用户对上述候选歌曲中的各个候选歌曲的偏好预测评分,对这些候选歌曲进行排序。例如,可以按照计算得到的偏好预测评分从大到小的顺序,对这些候选歌曲进行排序。
后续,可以根据排序后的候选歌曲,以及上述种子歌曲,生成上述歌曲列表。
具体地,可以将上述种子歌曲排列在排序后的候选歌曲之前,生成歌曲列表。
假设上述种子歌曲为歌曲X,上述候选歌曲包括候选歌曲1、候选歌曲2、候选歌曲3和候选歌曲4,其中,上述目标用户对候选歌曲3的偏好预测评分大于该目标用户对候选歌曲1的偏好预测评分,该目标用户对候选歌曲1的偏好预测评分大于该目标用户对候选歌曲2的偏好预测评分,该目标用户对候选歌曲2的偏好预测评分大于该目标用户对候选歌曲4的偏好预测评分,则可以生成如下表6所示的歌曲列表:
表6
序号 歌曲
1 歌曲X
2 候选歌曲3
3 候选歌曲1
4 候选歌曲2
5 候选歌曲4
此时,可以基于从与歌曲X关联的图片集合中确定出的作为上述种子歌曲图片的图片X,以及如上表6所示的歌曲列表,生成如图6所示的歌单。
在示出的另一种实施方式中,在生成上述歌曲列表时,可以先根据计算得到的上述目标用户对上述候选歌曲中的各个候选歌曲的偏好预测评分,将这些候选歌曲展示给该目标用户。后续,可以由该目标用户从这些候选歌曲中选择部分歌曲,并根据该目标用户选择的这部分歌曲生成上述歌曲列表。
具体地,上述服务端可以根据上述偏好预测评分,将上述候选歌曲发送给上述客户端,由该客户端通过用户界面将这些候选歌曲展示给上述目标用户。该目标用户可以在该用户界面中,从这些候选歌曲中选择部分歌曲,由该客户端将该目标用户选择的这部分歌曲发送给该服务端,从而使该服务端可以根据这部分歌曲生成上述歌曲列表。
在实际应用中,可以先根据计算得到的上述目标用户对上述候选歌曲中的各个候选歌曲的偏好预测评分,对这些候选歌曲进行排序,再将排序后的候选歌曲展示给该目标用户,以便于该目标用户从中进行选择。
需要说明的是,也可以将上述种子歌曲和上述候选歌曲一起展示给上述目标用户,由该目标用户从该种子歌曲和这些候选歌曲中选择部分歌曲,并根据该目标用户选择的这部分歌曲生成上述歌曲列表。
继续以歌曲X、候选歌曲1、候选歌曲2、候选歌曲3和候选歌曲4的上述举例为例,上述服务端可以根据上述目标用户对这些候选歌曲中的各个候选歌曲的偏好预测评分,将这些候选歌曲发送给上述客户端,由该客户端通过如图7A所示的用户界面将这些候选歌曲展示给该目标用户。该目标用户可以在该用户界面中,通过“加入歌单”的选项选择歌曲,并在完成歌曲选择后点击“生成歌单”的按钮,由该客户端响应于针对该按钮的点击操作,将该目标用户选择的候选歌曲3和候选歌曲4发送给上述服务端,从而使上述服务端可以根据歌曲X、候选歌曲3和候选歌曲4生成上述歌曲列表。此时,可以基于图片X,以及该歌曲列表,生成如图7B所示的歌单。
根据本公开实施方式,可以先从用户的偏好歌曲集合中确定种子歌曲,并根据该用户对与该种子歌曲关联的图片的偏好预测评分确定种子歌曲图片,以及基于该偏好歌曲集合中的偏好歌曲召回相似歌曲,以将该偏好歌曲集合中除该种子歌曲外的其他偏好歌曲和该相似歌曲确定为候选歌曲,后续可以根据该用户对该候选歌曲的偏好预测评分生成歌曲列表,并根据该种子歌曲图片和该歌曲列表生成歌单。采用这样的方式,可以保证用户对生成的歌单的歌单图片和歌曲列表中的歌曲的偏好程度,从而可以提高针对用户的歌曲推荐的准确度,并提升用户体验。
示例性介质
在介绍了本公开示例性实施方式的方法之后,接下来,参考图8对本公开示例性实施方式的介质进行说明。
本示例性实施方式中,可以通过程序产品实现上述方法,如可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
该程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RE等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如C语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
示例性装置
在介绍了本公开示例性实施方式的介质之后,接下来,参考图9对本公开示例性实施方式的装置进行说明。
下述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。
图9示意性地示出了根据本公开实施方式的一种歌单生成装置;所述装置包括:
第一确定模块901,用于获取目标用户的偏好歌曲集合,从所述偏好歌曲集合中确定种子歌曲;
第二确定模块902,用于获取与所述种子歌曲关联的图片集合,计算所述目标用户对所述图片集合中的各个图片的偏好预测评分,根据所述偏好预测评分从所述图片集合中确定种子歌曲图片;
第三确定模块903,用于基于所述偏好歌曲集合中的各个偏好歌曲召回相似歌曲,将所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲和所述相似歌曲确定为候选歌曲;
计算模块904,用于计算所述目标用户对所述候选歌曲的偏好预测评分,根据所述偏好预测评分生成歌曲列表;
生成模块905,用于基于所述种子歌曲图片和所述歌曲列表生成歌单。
可选地,所述计算模块904具体用于:
根据所述偏好预测评分将所述候选歌曲展示给所述目标用户,根据所述目标用户选择的候选歌曲生成歌曲列表。
可选地,所述计算模块904具体用于:
根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,计算所述目标用户对所述候选歌曲的偏好预测评分;
其中,多模态数据用于表征与歌曲对应的音频数据、图片数据和属性数据中的多个的组合数据。
可选地,所述计算模块904具体用于:
将与所述种子歌曲对应的第一多模态数据、与所述候选歌曲对应的第二多模态数据,以及与所述目标用户的历史播放歌曲对应的第三多模态数据输入歌曲预测模型进行预测计算,得到所述目标用户对所述候选歌曲的偏好预测评分;
其中,所述歌曲预测模型包括:向量转化层、交叉处理层和全连接层;
所述向量转化层用于查找与所述第一多模态数据对应的第一多模态特征向量,查找与所述第二多模态特征对应的第二多模态特征向量,查找与所述第三多模态特征对应的第三多模态特征向量,并将查找结果传输至所述交叉处理层;
所述交叉处理层用于将所述第一多模态特征向量和所述第二多模态特征向量进行交叉处理得到第一交叉特征向量,将所述第三多模态特征向量和所述第二多模态特征向量进行交叉处理得到第二交叉特征向量,并将所述第一多模态特征向量、所述第二多模态特征向量、所述第三多模态特征向量、所述第一交叉特征向量和所述第二交叉特征向量进行拼接处理后得到的拼接特征向量传输至所述全连接层;
所述全连接层用于将所述拼接特征向量映射为偏好预测评分,并输出所述偏好预测评分。
可选地,所述装置还包括:
预处理模块906,用于根据与歌曲数据库中的各个歌曲分别对应的多模态数据,对所述多模态数据进行提取特征向量的预处理,以提取与所述多模态数据对应的多模态特征向量。
可选地,所述装置还包括:
获取模块907,用于获取所述目标用户的用户画像数据和历史播放行为数据;
所述计算模块904具体用于:
根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,以及所述目标用户的用户画像数据和历史播放行为数据,计算所述目标用户对所述候选歌曲的偏好预测评分。
可选地,所述第一确定模块901具体用于:
基于所述目标用户的历史播放行为数据,确定所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度;
将所述偏好歌曲集合中的所述偏好度最高的偏好歌曲确定为所述种子歌曲。
可选地,所述第三确定模块903具体用于:
针对歌曲数据库中的任一目标歌曲,计算所述目标歌曲与所述偏好歌曲集合中的各个偏好歌曲的相似度,并确定所述相似度是否达到预设的第一阈值;
如果所述相似度达到所述第一阈值,将所述目标歌曲确定为相似歌曲。
可选地,所述第三确定模块903具体用于:
基于所述目标用户的历史播放行为数据,确定所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度;
基于所述目标歌曲与所述偏好歌曲集合中的各个偏好歌曲的相似度,以及所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度,计算所述目标用户对所述目标歌曲的感兴趣度,并确定所述感兴趣度是否达到预设的第二阈值;
如果所述感兴趣度达到所述第二阈值,将所述感兴趣度达到所述第二阈值的目标歌曲和所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲确定为候选歌曲。
可选地,所述第二确定模块902具体用于:
针对所述图片集合中的任一目标图片,将所述目标图片的图片属性数据和所述目标用户的用户画像数据输入图片预测模型进行预测计算,得到所述目标用户对所述目标图片的偏好预测评分;其中,所述图片预测模型为基于样本用户对样本图片的偏好评分训练出的机器学习模型。
可选地,所述第二确定模块902具体用于:
将所述图片集合中的所述偏好预测评分最高的图片确定为种子歌曲图片。
可选地,所述计算模块904具体用于:
根据所述偏好预测评分对所述候选歌曲进行排序,并根据所述种子歌曲和排序后的所述候选歌曲生成所述歌曲列表。
示例性计算设备
在介绍了本公开示例性实施方式的方法、介质和装置之后,接下来,参考图10对本公开示例性实施方式的计算设备进行说明。
图10显示的计算设备1000仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图10所示,计算设备1000以通用计算设备的形式表现。计算设备1000的组件可以包括但不限于:上述至少一个处理单元1001、上述至少一个存储单元1002,连接不同系统组件(包括处理单元1001和存储单元1002)的总线1003。
总线1003包括数据总线、控制总线和地址总线。
存储单元1002可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)10021和/或高速缓存存储器10022,可以进一步包括非易失性存储器形式的可读介质,例如只读存储器(ROM)10023。
存储单元1002还可以包括具有一组(至少一个)程序模块10024的程序/实用工具10025,这样的程序模块10024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备1000也可以与一个或多个外部设备1004(例如键盘、指向设备等)通信。
这种通信可以通过输入/输出(I/O)接口1005进行。并且,计算设备1000还可以通过网络适配器1006与一个或者多个网络(例如局域网LAN,广域网WAN和/或公共网络,例如因特网)通信。如图10所示,网络适配器1006通过总线1003与计算设备1000的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备1000使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了歌单生成装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种歌单生成方法,所述方法包括:
获取目标用户的偏好歌曲集合,从所述偏好歌曲集合中确定种子歌曲;
获取与所述种子歌曲关联的图片集合,计算所述目标用户对所述图片集合中的各个图片的偏好预测评分,根据所述偏好预测评分从所述图片集合中确定种子歌曲图片;
基于所述偏好歌曲集合中的各个偏好歌曲召回相似歌曲,将所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲和所述相似歌曲确定为候选歌曲;
计算所述目标用户对所述候选歌曲的偏好预测评分,根据所述偏好预测评分生成歌曲列表;
基于所述种子歌曲图片和所述歌曲列表生成歌单。
2.根据权利要求1所述的方法,所述根据所述偏好预测评分生成歌曲列表,包括:
根据所述偏好预测评分将所述候选歌曲展示给所述目标用户,根据所述目标用户选择的候选歌曲生成歌曲列表。
3.根据权利要求1所述的方法,所述计算所述目标用户对所述候选歌曲的偏好预测评分,包括:
根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,计算所述目标用户对所述候选歌曲的偏好预测评分;
其中,多模态数据用于表征与歌曲对应的音频数据、图片数据和属性数据中的多个的组合数据。
4.根据权利要求3所述的方法,所述根据与所述种子歌曲、所述候选歌曲和所述目标用户的历史播放歌曲分别对应的多模态数据,计算所述目标用户对所述候选歌曲的偏好预测评分,包括:
将与所述种子歌曲对应的第一多模态数据、与所述候选歌曲对应的第二多模态数据,以及与所述目标用户的历史播放歌曲对应的第三多模态数据输入歌曲预测模型进行预测计算,得到所述目标用户对所述候选歌曲的偏好预测评分;
其中,所述歌曲预测模型包括:向量转化层、交叉处理层和全连接层;
所述向量转化层用于查找与所述第一多模态数据对应的第一多模态特征向量,查找与所述第二多模态特征对应的第二多模态特征向量,查找与所述第三多模态特征对应的第三多模态特征向量,并将查找结果传输至所述交叉处理层;
所述交叉处理层用于将所述第一多模态特征向量和所述第二多模态特征向量进行交叉处理得到第一交叉特征向量,将所述第三多模态特征向量和所述第二多模态特征向量进行交叉处理得到第二交叉特征向量,并将所述第一多模态特征向量、所述第二多模态特征向量、所述第三多模态特征向量、所述第一交叉特征向量和所述第二交叉特征向量进行拼接处理后得到的拼接特征向量传输至所述全连接层;
所述全连接层用于将所述拼接特征向量映射为偏好预测评分,并输出所述偏好预测评分。
5.根据权利要求1所述的方法,所述基于所述偏好歌曲集合中的各个偏好歌曲召回相似歌曲,包括:
针对歌曲数据库中的任一目标歌曲,计算所述目标歌曲与所述偏好歌曲集合中的各个偏好歌曲的相似度,并确定所述相似度是否达到预设的第一阈值;
如果所述相似度达到所述第一阈值,将所述目标歌曲确定为相似歌曲。
6.根据权利要求5所述的方法,所述将所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲和所述相似歌曲确定为候选歌曲,包括:
基于所述目标用户的历史播放行为数据,确定所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度;
基于所述目标歌曲与所述偏好歌曲集合中的各个偏好歌曲的相似度,以及所述目标用户对所述偏好歌曲集合中的各个偏好歌曲的偏好度,计算所述目标用户对所述目标歌曲的感兴趣度,并确定所述感兴趣度是否达到预设的第二阈值;
如果所述感兴趣度达到所述第二阈值,将所述感兴趣度达到所述第二阈值的目标歌曲和所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲确定为候选歌曲。
7.根据权利要求1所述的方法,所述计算所述目标用户对所述图片集合中的各个图片的偏好预测评分,包括:
针对所述图片集合中的任一目标图片,将所述目标图片的图片属性数据和所述目标用户的用户画像数据输入图片预测模型进行预测计算,得到所述目标用户对所述目标图片的偏好预测评分;其中,所述图片预测模型为基于样本用户对样本图片的偏好评分训练出的机器学习模型。
8.一种歌单生成装置,所述装置包括:
第一确定模块,用于获取目标用户的偏好歌曲集合,从所述偏好歌曲集合中确定种子歌曲;
第二确定模块,用于获取与所述种子歌曲关联的图片集合,计算所述目标用户对所述图片集合中的各个图片的偏好预测评分,根据所述偏好预测评分从所述图片集合中确定种子歌曲图片;
第三确定模块,用于基于所述偏好歌曲集合中的各个偏好歌曲召回相似歌曲,将所述偏好歌曲集合中除所述种子歌曲外的其他偏好歌曲和所述相似歌曲确定为候选歌曲;
计算模块,用于计算所述目标用户对所述候选歌曲的偏好预测评分,根据所述偏好预测评分生成歌曲列表;
生成模块,用于基于所述种子歌曲图片和所述歌曲列表生成歌单。
9.一种介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
10.一种计算设备,包括:
处理器;
用于存储处理器可执行程序的存储器;
其中,所述处理器通过运行所述可执行程序以实现如权利要求1-7中任一项所述的方法。
CN202110963032.1A 2021-08-20 2021-08-20 歌单生成方法、装置、介质和计算设备 Active CN113672758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110963032.1A CN113672758B (zh) 2021-08-20 2021-08-20 歌单生成方法、装置、介质和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110963032.1A CN113672758B (zh) 2021-08-20 2021-08-20 歌单生成方法、装置、介质和计算设备

Publications (2)

Publication Number Publication Date
CN113672758A true CN113672758A (zh) 2021-11-19
CN113672758B CN113672758B (zh) 2024-04-12

Family

ID=78544687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110963032.1A Active CN113672758B (zh) 2021-08-20 2021-08-20 歌单生成方法、装置、介质和计算设备

Country Status (1)

Country Link
CN (1) CN113672758B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141746A (ja) * 2007-12-07 2009-06-25 Sony Corp 情報処理装置および方法、並びにプログラム
US20140229828A1 (en) * 2013-02-11 2014-08-14 Google Inc. Creating playlists
US20150356447A1 (en) * 2014-05-29 2015-12-10 Sirius Xm Radio Inc. Systems, methods and apparatus for generating music recommendations based on combining song and user influencers with channel rule characterizations
CN105718566A (zh) * 2016-01-20 2016-06-29 中山大学 一种智能音乐推荐系统
US20180189404A1 (en) * 2017-01-05 2018-07-05 Microsoft Technology Licensing, Llc Identification of documents based on location, usage patterns and content
CN108255840A (zh) * 2016-12-28 2018-07-06 北京酷我科技有限公司 一种歌曲的推荐方法和系统
CN109376265A (zh) * 2018-12-12 2019-02-22 杭州网易云音乐科技有限公司 歌曲推荐列表生成方法、介质、装置和计算设备
WO2020232796A1 (zh) * 2019-05-17 2020-11-26 腾讯音乐娱乐科技(深圳)有限公司 多媒体数据匹配方法、装置和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141746A (ja) * 2007-12-07 2009-06-25 Sony Corp 情報処理装置および方法、並びにプログラム
US20140229828A1 (en) * 2013-02-11 2014-08-14 Google Inc. Creating playlists
US20150356447A1 (en) * 2014-05-29 2015-12-10 Sirius Xm Radio Inc. Systems, methods and apparatus for generating music recommendations based on combining song and user influencers with channel rule characterizations
CN105718566A (zh) * 2016-01-20 2016-06-29 中山大学 一种智能音乐推荐系统
CN108255840A (zh) * 2016-12-28 2018-07-06 北京酷我科技有限公司 一种歌曲的推荐方法和系统
US20180189404A1 (en) * 2017-01-05 2018-07-05 Microsoft Technology Licensing, Llc Identification of documents based on location, usage patterns and content
CN109376265A (zh) * 2018-12-12 2019-02-22 杭州网易云音乐科技有限公司 歌曲推荐列表生成方法、介质、装置和计算设备
WO2020232796A1 (zh) * 2019-05-17 2020-11-26 腾讯音乐娱乐科技(深圳)有限公司 多媒体数据匹配方法、装置和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘祥臻;王红梅;戚成功;徐明泽;张鑫旺;李平武;: "Android环境下车载智能音乐播放APP的开发设计", 林业机械与木工设备, no. 03 *
刘祥臻;王红梅;戚成功;徐明泽;张鑫旺;李平武;: "Android环境下车载智能音乐播放APP的开发设计", 林业机械与木工设备, no. 03, 15 March 2020 (2020-03-15) *

Also Published As

Publication number Publication date
CN113672758B (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
JP7206288B2 (ja) 音楽推薦方法、装置、コンピューティング機器及び媒体
CN108319723B (zh) 一种图片分享方法和装置、终端、存储介质
CN107330023B (zh) 基于关注点的文本内容推荐方法和装置
US10733197B2 (en) Method and apparatus for providing information based on artificial intelligence
US10222942B1 (en) User interface for context labeling of multimedia items
CN112115299A (zh) 视频搜索方法、装置、推荐方法、电子设备及存储介质
CN106971009B (zh) 语音数据库生成方法及装置、存储介质、电子设备
CN109034203B (zh) 表情推荐模型的训练、表情推荐方法、装置、设备及介质
CN109241319B (zh) 一种图片检索方法、装置、服务器和存储介质
CN110110233B (zh) 信息处理方法、装置、介质和计算设备
CN109275047B (zh) 视频信息处理方法及装置、电子设备、存储介质
CN110826302A (zh) 调查问卷创建方法、装置、介质及电子设备
CN108170794B (zh) 信息推荐方法及装置、存储介质和电子设备
CN109857901B (zh) 信息展示方法和装置、以及用于信息搜索的方法和装置
US11817118B2 (en) Enhancing review videos
JP7069802B2 (ja) ユーザ指向トピック選択及びブラウジングのためのシステム及び方法、複数のコンテンツ項目を表示する方法、プログラム、及びコンピューティングデバイス
CN114328996A (zh) 一种发布信息的方法和装置
CN112703495A (zh) 利用实体链接和本体数据推断主题
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN111754278A (zh) 物品推荐方法、装置、计算机存储介质和电子设备
CN109960721A (zh) 基于源内容的多重压缩构造内容
Zhao et al. A new visual navigation system for exploring biomedical Open Educational Resource (OER) videos
US11275777B2 (en) Methods and systems for generating timelines for entities
CN111723235B (zh) 音乐内容识别方法、装置及设备
CN111755090A (zh) 病历查找方法、病历查找装置、存储介质与电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant