CN112732971A - 一种基于标签的协同过滤音乐推荐方法 - Google Patents

一种基于标签的协同过滤音乐推荐方法 Download PDF

Info

Publication number
CN112732971A
CN112732971A CN202110079415.2A CN202110079415A CN112732971A CN 112732971 A CN112732971 A CN 112732971A CN 202110079415 A CN202110079415 A CN 202110079415A CN 112732971 A CN112732971 A CN 112732971A
Authority
CN
China
Prior art keywords
user
music
tag
label
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110079415.2A
Other languages
English (en)
Inventor
蒙子芹
蒋清红
苏珉
莫乔多
吴艺泉
张赫
陆章林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Normal University
Original Assignee
Guangxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Normal University filed Critical Guangxi Normal University
Priority to CN202110079415.2A priority Critical patent/CN112732971A/zh
Publication of CN112732971A publication Critical patent/CN112732971A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于标签的协同过滤音乐推荐方法,包括以下步骤:生成用于喜好音乐标签集合、结合历史数据对标签矩阵进行改进、生成推荐表单。本发明基于协同过滤算法为主的音乐标签和歌单,以用户历史数据为辅,形成推荐歌单,并根据推测用户的喜好度对音乐进行排名,达到了更加准确的推荐效果。

Description

一种基于标签的协同过滤音乐推荐方法
技术领域
本发明涉及互联网大数据应用相关技术领域,具体是一种基于标签的协同过滤音乐推荐方法。
背景技术
随着现代信息技术的发展,各种互联网产品层出不穷,传统的基本应用已经不能满足用户的需求,用户需要的是更加友好且具有个人定制化特性的应用服务。
常用的音乐推荐方法是基于用户历史的推荐方法,具体过程为从所述音乐记录中提取用户最新收听的音乐;获取曲库中的音乐与所述用户最新的音乐之间的音乐距离;根据所述音乐距离生成第一音乐推荐列表。第一音乐推荐列表中的音乐与用户最新的音乐相似度较高,更符合用户习惯,因此能提高音乐推荐的准确度。但是这种方法仅根据用户历史数据来推断用户可能的音乐,所推荐产生的音乐类型比较单一。
协同过滤推荐方法是目前在各音乐平台中基本也十分成熟的推荐方法,通过给定目标与品味相似用户群体的爱好向目标用于作出推荐,但协同过滤推荐算法仅考虑目标用户与音乐类型间的评分矩阵生成包括适合用于喜好的表单供用户选择,但用户并不会自然而然的去评价每一首自己喜好的音乐,且用于对一首音乐的喜好只有确定喜好和确定不喜好,不能根据喜好程度进行区别。
发明内容
本发明的目的在于提供一种基于标签的协同过滤音乐推荐方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于标签的协同过滤音乐推荐方法,包括以下步骤:
(1)、生成用于喜好音乐标签集合:提取目标用户对音乐进行标签标记的行为数据进行提取后,处理形成嵌套结构的数据格式,并搭建数据模型;
(2)、结合历史数据对标签矩阵进行改进:收集用户听音乐的历史记录,将标签和歌单提取出来,构建用户标签矩阵,将该标签矩阵和上述标签集合分别进行相似度的计算,获得两个相似用户群;
(2)、生成推荐表单:对两个相似用户群分别计算,根据两个矩阵获得与目标用户兴趣相似度排名较高的多个用户,将这些用户标记过标签的且未被目标用户标记的歌单提取,再将上述两个相似用户群中提取的歌单进行合并,合并后再根据相似用户的相似度对歌单进行排次,形成推荐表单,推荐给目标用户。
作为本发明进一步的方案:所述步骤1中,将用户对音乐进行标签归类标注的行为数据进行提取,提取的行为数据采用特征变换处理,形成嵌套结构的数据格式,对输出的嵌套格式数据进行计算,采用线性融合标签搭建模型,形成用于的标签集合。
作为本发明进一步的方案:所述步骤2中,目标用户历史数据包括用户标注过的标签、被用户标注标签的歌单。
作为本发明进一步的方案:所述步骤2中,对标签矩阵和标签集合采用欧氏距离相似性算法计算相似度。
作为本发明进一步的方案:所述步骤3中,先找到与目标用户相似度最高的n个用户,将n个用户中未被目标用户标记标签的歌单以及标签都进行提取,形成候选歌单和标签子集,将候选歌单与目标用户的兴趣特征作比较,为用户推荐相关性最大的部分歌单。
作为本发明进一步的方案:对于标签子集,将标签子集按照均匀分布随机划分为训练集和测试集,训练集和测试集中数据量分别为70%和30%,通过训练集中的标签行为数据生成推荐结果,并与测试集中的真实数据进行比较。
与现有技术相比,本发明的有益效果是:本发明基于协同过滤算法为主的音乐标签和歌单,以用户历史数据为辅,形成推荐歌单,并根据推测用户的喜好度对音乐进行排名,达到了更加准确的推荐效果。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于标签的协同过滤音乐推荐方法,包括以下步骤:
(1)、生成用于喜好音乐标签集合:首先对数据进行预处理,将用户对音乐进行标签归类标注的行为数据进行提取,提取的行为数据采用特征变换处理,形成嵌套结构的数据格式,如{user:{music1:{1:set(tag1)}}};对输出的嵌套格式数据进行计算,采用线性融合标签搭建模型,形成用于的标签集合:Zi=(z1,z2,z3,z4,...zn),表示用于i所标记过的标签集合,嵌套格式数据计算的Python实现代码如下:
def Transform(data):
transformedData=dict()/*transformedData is rockmusic*/
for date,userID,url,tag in data:
transformedData.setdefault(userID,dict())
transformedData[userID].setdefault(url,dict())
transformedData[userID][url].setdefault(timeFactor,set())
transformedData[userID][url][timeFactor].add(tag)/*add tag*/
return transformedData;
(2)、结合历史数据对标签矩阵进行改进:收集用户听音乐的历史记录,包括用户标注过的标签、被用户标注标签的歌单,将标签和歌单提取出来,构建用户标签矩阵,将该标签矩阵和上述标签集合分别进行相似度的计算,采用欧氏距离相似性算法计算相似度,在计算出相似度获得两个相似用户群;
(3)、生成推荐表单:对两个相似用户群分别计算,根据两个矩阵获得与目标用户兴趣相似度排名较高的多个用户,将这些用户标记过标签的且未被目标用户标记的歌单提取,再将上述两个相似用户群中提取的歌单进行合并,合并后再根据相似用户的相似度对歌单进行排次,形成推荐表单,推荐给目标用户。
具体的,在对相似用户进行排名时,先找到与目标用户相似度最高的n个用户,将n个用户中未被目标用户标记标签的歌单以及标签都进行提取,形成候选歌单和标签子集,将候选歌单与目标用户的兴趣特征作比较,为用户推荐相关性最大的部分歌单,其算法如下:
Step1;
For i←1to user
For j←1to n
Do
获取目标用户i在第j个相似用户下最感兴趣的n个标签;
End
Step2;
For j←1to n
For i←1to user
Do
为用户i推荐在第j个相似用户下最感兴趣的n个歌单。
对于标签子集,通过传统的机器学习方法进行评测:将标签子集按照均匀分布随机划分为训练集和测试集,训练集和测试集中数据量分别为70%和30%,通过训练集中的标签行为数据生成推荐结果,并与测试集中的真实数据进行比较以评估推荐质量。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (7)

1.一种基于标签的协同过滤音乐推荐方法,其特征在于:包括以下步骤:
(1)、生成用于喜好音乐标签集合:提取目标用户对音乐进行标签标记的行为数据进行提取后,处理形成嵌套结构的数据格式,并搭建数据模型;
(2)结合历史数据对标签矩阵进行改进:收集用户听音乐的历史记录,将标签和歌单提取出来,构建用户标签矩阵,将该标签矩阵和上述标签集合分别进行相似度的计算,获得两个相似用户群;
(3)生成推荐表单:对两个相似用户群分别计算,根据两个矩阵获得与目标用户兴趣相似度排名较高的多个用户,将这些用户标记过标签的且未被目标用户标记的歌单提取,再将上述两个相似用户群中提取的歌单进行合并,合并后再根据相似用户的相似度对歌单进行排次,形成推荐表单,推荐给目标用户。
2.根据权利要求1所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述步骤1中,将用户对音乐进行标签归类标注的行为数据进行提取,提取的行为数据采用特征变换处理,形成嵌套结构的数据格式,对输出的嵌套格式数据进行计算,采用线性融合标签搭建模型,形成用于的标签集合。
3.根据权利要求1所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述步骤2中,目标用户历史数据包括用户标注过的标签、被用户标注标签的歌单。
4.根据权利要求1或3所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述步骤2中,对标签矩阵和标签集合采用欧氏距离相似性算法计算相似度。
5.根据权利要求1所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述步骤3中,先找到与目标用户相似度最高的n个用户,将n个用户中未被目标用户标记标签的歌单以及标签都进行提取,形成候选歌单和标签子集,将候选歌单与目标用户的兴趣特征作比较,为用户推荐相关性最大的部分歌单。
6.根据权利要求5所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:对于标签子集,将标签子集按照均匀分布随机划分为训练集和测试集,通过训练集中的标签行为数据生成推荐结果,并与测试集中的真实数据进行比较。
7.根据权利要求6所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述训练集和测试集中数据量分别为70%和30%。
CN202110079415.2A 2021-01-21 2021-01-21 一种基于标签的协同过滤音乐推荐方法 Pending CN112732971A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110079415.2A CN112732971A (zh) 2021-01-21 2021-01-21 一种基于标签的协同过滤音乐推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110079415.2A CN112732971A (zh) 2021-01-21 2021-01-21 一种基于标签的协同过滤音乐推荐方法

Publications (1)

Publication Number Publication Date
CN112732971A true CN112732971A (zh) 2021-04-30

Family

ID=75594559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110079415.2A Pending CN112732971A (zh) 2021-01-21 2021-01-21 一种基于标签的协同过滤音乐推荐方法

Country Status (1)

Country Link
CN (1) CN112732971A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678635A (zh) * 2013-12-19 2014-03-26 中国传媒大学 基于标签有向图的网络音乐聚合推荐方法
CN104731954A (zh) * 2015-04-01 2015-06-24 天翼爱音乐文化科技有限公司 基于群透视音乐推荐方法与系统
CN106557560A (zh) * 2016-11-11 2017-04-05 天翼爱音乐文化科技有限公司 基于用户兴趣的层次音乐推荐方法
CN107045533A (zh) * 2017-01-20 2017-08-15 广东技术师范学院天河学院 基于标签的教育资源推荐方法及系统
CN107341687A (zh) * 2017-06-01 2017-11-10 华南理工大学 一种基于多维标签与分类排序的推荐算法
CN108038120A (zh) * 2017-11-01 2018-05-15 平安科技(深圳)有限公司 协同过滤推荐方法、电子设备及计算机可读存储介质
CN108334558A (zh) * 2018-01-02 2018-07-27 南京师范大学 一种结合标签和时间因素的协同过滤推荐方法
CN110427567A (zh) * 2019-07-24 2019-11-08 东北大学 一种基于用户偏好相似度加权的协同过滤推荐方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678635A (zh) * 2013-12-19 2014-03-26 中国传媒大学 基于标签有向图的网络音乐聚合推荐方法
CN104731954A (zh) * 2015-04-01 2015-06-24 天翼爱音乐文化科技有限公司 基于群透视音乐推荐方法与系统
CN106557560A (zh) * 2016-11-11 2017-04-05 天翼爱音乐文化科技有限公司 基于用户兴趣的层次音乐推荐方法
CN107045533A (zh) * 2017-01-20 2017-08-15 广东技术师范学院天河学院 基于标签的教育资源推荐方法及系统
CN107341687A (zh) * 2017-06-01 2017-11-10 华南理工大学 一种基于多维标签与分类排序的推荐算法
CN108038120A (zh) * 2017-11-01 2018-05-15 平安科技(深圳)有限公司 协同过滤推荐方法、电子设备及计算机可读存储介质
CN108334558A (zh) * 2018-01-02 2018-07-27 南京师范大学 一种结合标签和时间因素的协同过滤推荐方法
CN110427567A (zh) * 2019-07-24 2019-11-08 东北大学 一种基于用户偏好相似度加权的协同过滤推荐方法

Similar Documents

Publication Publication Date Title
CN104111933B (zh) 获取业务对象标签、建立训练模型的方法及装置
US7745718B2 (en) Music-piece classifying apparatus and method, and related computer program
CN109918563B (zh) 一种基于公开数据的图书推荐的方法
CN102508870B (zh) 一种结合评分数据与标签数据的个性化推荐方法
CN105447730A (zh) 目标用户定向方法及装置
CN110096499B (zh) 一种基于行为时间序列大数据的用户对象识别方法及系统
CN106062730A (zh) 用于主动构成内容以便在连续社交通信中使用的系统和方法
CN111651678B (zh) 一种基于知识图谱的个性化推荐方法
CN111444380B (zh) 音乐搜索排序方法、装置、设备和存储介质
CN108415913A (zh) 基于不确定邻居的人群定向方法
CN110941762B (zh) 一种个性化推荐系统排序结果的改进方法
CN112288471A (zh) 一种基于用户历史行为序列的广告点击率预测方法
CN108921624A (zh) 广告融合方法、装置、存储介质和终端设备
CN116541607B (zh) 基于商品检索数据分析的智能推荐方法
CN111639258A (zh) 一种基于神经网络的新闻推荐方法
CN113761347A (zh) 一种商品推荐方法、装置、存储介质及系统
CN112966103B (zh) 一种基于多任务学习的混合注意力机制文本标题匹配方法
Bischoff et al. Social knowledge-driven music hit prediction
CN108491477A (zh) 基于多维云和用户动态兴趣的神经网络推荐方法
CN106528653A (zh) 一种基于图嵌入模型的上下文感知音乐推荐方法
CN112732971A (zh) 一种基于标签的协同过滤音乐推荐方法
CN101655853A (zh) 建立模型的装置和方法
CN112800270B (zh) 基于音乐标签和时间信息的音乐推荐方法及系统
CN111709819B (zh) 一种点拍网基于图神经网络的产权交易推荐系统及推荐方法
US20230409633A1 (en) Identification of media items for target groups

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210430