CN112732971A - 一种基于标签的协同过滤音乐推荐方法 - Google Patents
一种基于标签的协同过滤音乐推荐方法 Download PDFInfo
- Publication number
- CN112732971A CN112732971A CN202110079415.2A CN202110079415A CN112732971A CN 112732971 A CN112732971 A CN 112732971A CN 202110079415 A CN202110079415 A CN 202110079415A CN 112732971 A CN112732971 A CN 112732971A
- Authority
- CN
- China
- Prior art keywords
- user
- music
- tag
- label
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000001914 filtration Methods 0.000 title claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000009827 uniform distribution Methods 0.000 claims description 3
- 238000013499 data model Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/686—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于标签的协同过滤音乐推荐方法,包括以下步骤:生成用于喜好音乐标签集合、结合历史数据对标签矩阵进行改进、生成推荐表单。本发明基于协同过滤算法为主的音乐标签和歌单,以用户历史数据为辅,形成推荐歌单,并根据推测用户的喜好度对音乐进行排名,达到了更加准确的推荐效果。
Description
技术领域
本发明涉及互联网大数据应用相关技术领域,具体是一种基于标签的协同过滤音乐推荐方法。
背景技术
随着现代信息技术的发展,各种互联网产品层出不穷,传统的基本应用已经不能满足用户的需求,用户需要的是更加友好且具有个人定制化特性的应用服务。
常用的音乐推荐方法是基于用户历史的推荐方法,具体过程为从所述音乐记录中提取用户最新收听的音乐;获取曲库中的音乐与所述用户最新的音乐之间的音乐距离;根据所述音乐距离生成第一音乐推荐列表。第一音乐推荐列表中的音乐与用户最新的音乐相似度较高,更符合用户习惯,因此能提高音乐推荐的准确度。但是这种方法仅根据用户历史数据来推断用户可能的音乐,所推荐产生的音乐类型比较单一。
协同过滤推荐方法是目前在各音乐平台中基本也十分成熟的推荐方法,通过给定目标与品味相似用户群体的爱好向目标用于作出推荐,但协同过滤推荐算法仅考虑目标用户与音乐类型间的评分矩阵生成包括适合用于喜好的表单供用户选择,但用户并不会自然而然的去评价每一首自己喜好的音乐,且用于对一首音乐的喜好只有确定喜好和确定不喜好,不能根据喜好程度进行区别。
发明内容
本发明的目的在于提供一种基于标签的协同过滤音乐推荐方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于标签的协同过滤音乐推荐方法,包括以下步骤:
(1)、生成用于喜好音乐标签集合:提取目标用户对音乐进行标签标记的行为数据进行提取后,处理形成嵌套结构的数据格式,并搭建数据模型;
(2)、结合历史数据对标签矩阵进行改进:收集用户听音乐的历史记录,将标签和歌单提取出来,构建用户标签矩阵,将该标签矩阵和上述标签集合分别进行相似度的计算,获得两个相似用户群;
(2)、生成推荐表单:对两个相似用户群分别计算,根据两个矩阵获得与目标用户兴趣相似度排名较高的多个用户,将这些用户标记过标签的且未被目标用户标记的歌单提取,再将上述两个相似用户群中提取的歌单进行合并,合并后再根据相似用户的相似度对歌单进行排次,形成推荐表单,推荐给目标用户。
作为本发明进一步的方案:所述步骤1中,将用户对音乐进行标签归类标注的行为数据进行提取,提取的行为数据采用特征变换处理,形成嵌套结构的数据格式,对输出的嵌套格式数据进行计算,采用线性融合标签搭建模型,形成用于的标签集合。
作为本发明进一步的方案:所述步骤2中,目标用户历史数据包括用户标注过的标签、被用户标注标签的歌单。
作为本发明进一步的方案:所述步骤2中,对标签矩阵和标签集合采用欧氏距离相似性算法计算相似度。
作为本发明进一步的方案:所述步骤3中,先找到与目标用户相似度最高的n个用户,将n个用户中未被目标用户标记标签的歌单以及标签都进行提取,形成候选歌单和标签子集,将候选歌单与目标用户的兴趣特征作比较,为用户推荐相关性最大的部分歌单。
作为本发明进一步的方案:对于标签子集,将标签子集按照均匀分布随机划分为训练集和测试集,训练集和测试集中数据量分别为70%和30%,通过训练集中的标签行为数据生成推荐结果,并与测试集中的真实数据进行比较。
与现有技术相比,本发明的有益效果是:本发明基于协同过滤算法为主的音乐标签和歌单,以用户历史数据为辅,形成推荐歌单,并根据推测用户的喜好度对音乐进行排名,达到了更加准确的推荐效果。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于标签的协同过滤音乐推荐方法,包括以下步骤:
(1)、生成用于喜好音乐标签集合:首先对数据进行预处理,将用户对音乐进行标签归类标注的行为数据进行提取,提取的行为数据采用特征变换处理,形成嵌套结构的数据格式,如{user:{music1:{1:set(tag1)}}};对输出的嵌套格式数据进行计算,采用线性融合标签搭建模型,形成用于的标签集合:Zi=(z1,z2,z3,z4,...zn),表示用于i所标记过的标签集合,嵌套格式数据计算的Python实现代码如下:
def Transform(data):
transformedData=dict()/*transformedData is rockmusic*/
for date,userID,url,tag in data:
transformedData.setdefault(userID,dict())
transformedData[userID].setdefault(url,dict())
transformedData[userID][url].setdefault(timeFactor,set())
transformedData[userID][url][timeFactor].add(tag)/*add tag*/
return transformedData;
(2)、结合历史数据对标签矩阵进行改进:收集用户听音乐的历史记录,包括用户标注过的标签、被用户标注标签的歌单,将标签和歌单提取出来,构建用户标签矩阵,将该标签矩阵和上述标签集合分别进行相似度的计算,采用欧氏距离相似性算法计算相似度,在计算出相似度获得两个相似用户群;
(3)、生成推荐表单:对两个相似用户群分别计算,根据两个矩阵获得与目标用户兴趣相似度排名较高的多个用户,将这些用户标记过标签的且未被目标用户标记的歌单提取,再将上述两个相似用户群中提取的歌单进行合并,合并后再根据相似用户的相似度对歌单进行排次,形成推荐表单,推荐给目标用户。
具体的,在对相似用户进行排名时,先找到与目标用户相似度最高的n个用户,将n个用户中未被目标用户标记标签的歌单以及标签都进行提取,形成候选歌单和标签子集,将候选歌单与目标用户的兴趣特征作比较,为用户推荐相关性最大的部分歌单,其算法如下:
Step1;
For i←1to user
For j←1to n
Do
获取目标用户i在第j个相似用户下最感兴趣的n个标签;
End
Step2;
For j←1to n
For i←1to user
Do
为用户i推荐在第j个相似用户下最感兴趣的n个歌单。
对于标签子集,通过传统的机器学习方法进行评测:将标签子集按照均匀分布随机划分为训练集和测试集,训练集和测试集中数据量分别为70%和30%,通过训练集中的标签行为数据生成推荐结果,并与测试集中的真实数据进行比较以评估推荐质量。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (7)
1.一种基于标签的协同过滤音乐推荐方法,其特征在于:包括以下步骤:
(1)、生成用于喜好音乐标签集合:提取目标用户对音乐进行标签标记的行为数据进行提取后,处理形成嵌套结构的数据格式,并搭建数据模型;
(2)结合历史数据对标签矩阵进行改进:收集用户听音乐的历史记录,将标签和歌单提取出来,构建用户标签矩阵,将该标签矩阵和上述标签集合分别进行相似度的计算,获得两个相似用户群;
(3)生成推荐表单:对两个相似用户群分别计算,根据两个矩阵获得与目标用户兴趣相似度排名较高的多个用户,将这些用户标记过标签的且未被目标用户标记的歌单提取,再将上述两个相似用户群中提取的歌单进行合并,合并后再根据相似用户的相似度对歌单进行排次,形成推荐表单,推荐给目标用户。
2.根据权利要求1所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述步骤1中,将用户对音乐进行标签归类标注的行为数据进行提取,提取的行为数据采用特征变换处理,形成嵌套结构的数据格式,对输出的嵌套格式数据进行计算,采用线性融合标签搭建模型,形成用于的标签集合。
3.根据权利要求1所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述步骤2中,目标用户历史数据包括用户标注过的标签、被用户标注标签的歌单。
4.根据权利要求1或3所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述步骤2中,对标签矩阵和标签集合采用欧氏距离相似性算法计算相似度。
5.根据权利要求1所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述步骤3中,先找到与目标用户相似度最高的n个用户,将n个用户中未被目标用户标记标签的歌单以及标签都进行提取,形成候选歌单和标签子集,将候选歌单与目标用户的兴趣特征作比较,为用户推荐相关性最大的部分歌单。
6.根据权利要求5所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:对于标签子集,将标签子集按照均匀分布随机划分为训练集和测试集,通过训练集中的标签行为数据生成推荐结果,并与测试集中的真实数据进行比较。
7.根据权利要求6所述的一种基于标签的协同过滤音乐推荐方法,其特征在于:所述训练集和测试集中数据量分别为70%和30%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110079415.2A CN112732971A (zh) | 2021-01-21 | 2021-01-21 | 一种基于标签的协同过滤音乐推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110079415.2A CN112732971A (zh) | 2021-01-21 | 2021-01-21 | 一种基于标签的协同过滤音乐推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112732971A true CN112732971A (zh) | 2021-04-30 |
Family
ID=75594559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110079415.2A Pending CN112732971A (zh) | 2021-01-21 | 2021-01-21 | 一种基于标签的协同过滤音乐推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112732971A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678635A (zh) * | 2013-12-19 | 2014-03-26 | 中国传媒大学 | 基于标签有向图的网络音乐聚合推荐方法 |
CN104731954A (zh) * | 2015-04-01 | 2015-06-24 | 天翼爱音乐文化科技有限公司 | 基于群透视音乐推荐方法与系统 |
CN106557560A (zh) * | 2016-11-11 | 2017-04-05 | 天翼爱音乐文化科技有限公司 | 基于用户兴趣的层次音乐推荐方法 |
CN107045533A (zh) * | 2017-01-20 | 2017-08-15 | 广东技术师范学院天河学院 | 基于标签的教育资源推荐方法及系统 |
CN107341687A (zh) * | 2017-06-01 | 2017-11-10 | 华南理工大学 | 一种基于多维标签与分类排序的推荐算法 |
CN108038120A (zh) * | 2017-11-01 | 2018-05-15 | 平安科技(深圳)有限公司 | 协同过滤推荐方法、电子设备及计算机可读存储介质 |
CN108334558A (zh) * | 2018-01-02 | 2018-07-27 | 南京师范大学 | 一种结合标签和时间因素的协同过滤推荐方法 |
CN110427567A (zh) * | 2019-07-24 | 2019-11-08 | 东北大学 | 一种基于用户偏好相似度加权的协同过滤推荐方法 |
-
2021
- 2021-01-21 CN CN202110079415.2A patent/CN112732971A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678635A (zh) * | 2013-12-19 | 2014-03-26 | 中国传媒大学 | 基于标签有向图的网络音乐聚合推荐方法 |
CN104731954A (zh) * | 2015-04-01 | 2015-06-24 | 天翼爱音乐文化科技有限公司 | 基于群透视音乐推荐方法与系统 |
CN106557560A (zh) * | 2016-11-11 | 2017-04-05 | 天翼爱音乐文化科技有限公司 | 基于用户兴趣的层次音乐推荐方法 |
CN107045533A (zh) * | 2017-01-20 | 2017-08-15 | 广东技术师范学院天河学院 | 基于标签的教育资源推荐方法及系统 |
CN107341687A (zh) * | 2017-06-01 | 2017-11-10 | 华南理工大学 | 一种基于多维标签与分类排序的推荐算法 |
CN108038120A (zh) * | 2017-11-01 | 2018-05-15 | 平安科技(深圳)有限公司 | 协同过滤推荐方法、电子设备及计算机可读存储介质 |
CN108334558A (zh) * | 2018-01-02 | 2018-07-27 | 南京师范大学 | 一种结合标签和时间因素的协同过滤推荐方法 |
CN110427567A (zh) * | 2019-07-24 | 2019-11-08 | 东北大学 | 一种基于用户偏好相似度加权的协同过滤推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shmueli et al. | Care to comment? Recommendations for commenting on news stories | |
Hillard et al. | Improving ad relevance in sponsored search | |
CN104111933B (zh) | 获取业务对象标签、建立训练模型的方法及装置 | |
CN110096499B (zh) | 一种基于行为时间序列大数据的用户对象识别方法及系统 | |
CN112288471A (zh) | 一种基于用户历史行为序列的广告点击率预测方法 | |
CN111444380B (zh) | 音乐搜索排序方法、装置、设备和存储介质 | |
CN108415913A (zh) | 基于不确定邻居的人群定向方法 | |
CN111639258A (zh) | 一种基于神经网络的新闻推荐方法 | |
CN116541607B (zh) | 基于商品检索数据分析的智能推荐方法 | |
CN113761347A (zh) | 一种商品推荐方法、装置、存储介质及系统 | |
Lim et al. | Expertise and dynamics within crowdsourced musical knowledge curation: A case study of the genius platform | |
CN118250516B (zh) | 一种针对用户的分级处理方法 | |
CN112612951A (zh) | 一种面向收益提升的无偏学习排序方法 | |
Liu et al. | Adaptive music recommendation based on user behavior in time slot | |
CN115495654A (zh) | 基于子空间投影神经网络的点击率预估方法和装置 | |
Chen et al. | Multi-dimensional shared representation learning with graph fusion network for session-based recommendation | |
CN112800270B (zh) | 基于音乐标签和时间信息的音乐推荐方法及系统 | |
CN109992694A (zh) | 一种音乐智能推荐方法及系统 | |
CN112967116A (zh) | 一种基于多策略池的线下零售门店用商品推荐方法及系统 | |
CN115470322B (zh) | 一种基于人工智能的关键词生成系统及方法 | |
CN106528653A (zh) | 一种基于图嵌入模型的上下文感知音乐推荐方法 | |
CN112732971A (zh) | 一种基于标签的协同过滤音乐推荐方法 | |
CN101655853A (zh) | 建立模型的装置和方法 | |
Seufitelli et al. | Hit song science: a comprehensive survey and research directions | |
CN116521985A (zh) | 一种内容推荐方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210430 |