CN105447193A - 一种基于机器学习和协同过滤的音乐推荐系统 - Google Patents
一种基于机器学习和协同过滤的音乐推荐系统 Download PDFInfo
- Publication number
- CN105447193A CN105447193A CN201510970387.8A CN201510970387A CN105447193A CN 105447193 A CN105447193 A CN 105447193A CN 201510970387 A CN201510970387 A CN 201510970387A CN 105447193 A CN105447193 A CN 105447193A
- Authority
- CN
- China
- Prior art keywords
- music
- user
- app
- collaborative filtering
- recommend
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了构建一个基于机器学习和协同过滤的音乐推荐模型,主要是为了提供给用户更友好以及个性化的音乐推荐,使用户能够拥有较好和较新颖的产品使用体验。本发明所提出的推荐模型和提供构建方法为:首先从App类型的角度入手,发明了一种基于模型学习的音乐推荐方案;再从用户偏好入手,结合社交关系,提出了一种协同过滤的音乐推荐方案;最后将两种方案结合并以排行榜的方式将给用户推荐音乐,同时也为用户提供反馈机制一边模型能够自动的优化推荐系统。
Description
技术领域
本发明涉及一种基于机器学习与协同过滤相结合的音乐推荐模型,是属于互联网应用领域。
背景技术
随着现代信息技术的发展,各种互联网产品层出不穷,传统的基本应用已经不能满足用户的需求,用户需要的是更加友好且具有个人定制化特性的应用服务。
常用的音乐推荐方法是基于用户历史的推荐方法,具体过程为从所述音乐记录中提取用户最新收听的音乐;获取曲库中的音乐与所述用户最新的音乐之间的音乐距离;根据所述音乐距离生成第一音乐推荐列表。第一音乐推荐列表中的音乐与用户最新的音乐相似度较高,更符合用户习惯,因此能提高音乐推荐的准确度。但是这种方法仅根据用户历史数据来推断用户可能的音乐,所推荐产生的音乐类型比较单一。
机器学习是涉及概率论、统计学等的多领域交叉学科,主要是研究怎样模拟实现人类的学习行为。机器学习算法一般是通过已有数据的归纳与综合,建立一个符合已有数据特性的学习模型,并且可以通过新数据的加入能够不断地自我学习来优化已有模型。音乐虽然是存在已有标签类型,但是如果直接使用这些标签进行音乐的分类,或者是进行音乐与其他物品的匹配,其精度远达不到推荐所需要的要求,因此需要对音乐等物品能够提取较精细的特征向量用于物品之间分类的匹配与识别。结构化支持向量机得机器学习算法的优势在于解决小样本、非线性及高纬模式识别方面。主要是从训练样本中通过核函数实现非概率二元线性分类,将向量映射到高维空间,寻找分类的超平面以及与之平行的两个距离最大化的最大间隔超平面,从而形成分类器。
协同过滤分为基于用户的推荐算法和基于物品的推荐算法(UserCF和ItermCF)。利用用户的历史行为数据,UserCF是计算用户之间的相似度,然后推荐同类用户所匹配的物品;而ItermCF则是计算物品之间的相似度,推荐用户所匹配的物品的相似物品。
发明内容
本发明的目的在于提供一种基于机器学习和协同过滤的音乐推荐系统。此系统是从App偏好角度入手,发明了一种基于模型学习的音乐推荐方案;同时从用户偏好入手,结合社交关系,提出了一种协同过滤的音乐推荐方案;最后以排行榜的方式将给用户推荐音乐,并且为用户提供反馈机制优化推荐系统。
首先,基于模型学习和协同过滤,从App、用户和音乐三方面的特征着手分析关联性,从而为用户和App推荐背景音乐。
基于模型学习的音乐推荐方案:
1)每个类别的App形成训练样本,通过提取标签形成特征向量;
2)每种类别的音乐选取部分优秀作品,通过分析音乐网站中的评论和音乐歌词,获得音乐特征向量;
3)每个类别选取部分优秀有配乐的App,得到App特征向量和音乐特征向量,然后形成训练集。
4)通过模型学习的方法,先对App进行分类,然后匹配音乐。
基于协同过滤的音乐推荐方案:
1)根据用户的收听音乐记录,利用音乐特征生成用户特征向量;
2)基于社交软件计算用户之间的粘度,比如用户都是新浪微博用户,相互关注则粘度最高,用户之间能通过若干个中间人而相互联系起来,粘度则随用户中间人个数的增多而下降。
3)采用协同过滤的方法,计算用户之间的相似度,同时分析用户的社交关系,结合粘度,为用户推荐音乐。
两种推荐方案得出的音乐按照音乐网站的评分排序,推荐给用户。
同时,服务器可以获得所有用户的音乐记录,其中包括用户本地自添加的音乐。做出排行推荐给用户。
有益效果
本发明对比已有的推荐方法,具有以下创新点:
可以提供更友好且具有个性化的音乐推荐方案,满足不同用户的需求。APP加音乐的体验模式同时可以推动不同产品之间的深入结合。
附图说明
附图1是基于机器学习和协同过滤的音乐推荐系统的总体框架模块图。
附图2是基于机器学习和协同过滤的音乐推荐的模型构建具体流程图。
具体的实施方式
下面结合说明书附图和具体实施方式对本发明作进一步的说明。
为解决上述的技术问题,本发明采用的技术方案是:一种基于机器学习和协同过滤的音乐推荐系统,包括以下的步骤:
首先,提取出移动终端的App标签,此标签为分级标签。
一级标签为App类型,如游戏,小说阅读器,杂志阅读器,社交App,办公App等,可直接由应用市场的分类中提取。
二级标签为APP中的各个模块的标签,如小说阅读器中,不同的小说标签不同,比如古代宅斗类,清穿类,武侠类,恐怖悬疑类,轻松类,爆笑类等;社交App中,纯交友类,论坛模式类,学习类,八卦类,闲聊类等;游戏中:竞技类,密室逃脱类等。App的二级标签可直接从安卓市场上的描述和新浪微博等中涉及App的评论中获取,用户也可手动对App添加标签。
由一级和二级标签,提取出App的特征向量A={a1,a2,……,an},特征向量的每个值对应不同权重,构成相应的权重向量W={w1,w2,……,wn}。
然后,从“虾米”等音乐网站上爬虫获取音乐相关信息,从中提取出分类标签,结合从评论中提取出音乐的情感信息标签构成音乐二级标签;对于有歌词的音乐则通过歌词分析提出有用的信息标签,最后形成音乐的特征向量M={m1,m2,……,mn}。
通过已经有配乐的各类App作为训练样本,考虑数量较少,可采用有配乐的网页予以代替,形成推荐模型。最后通过模型学习的方法为App推荐音乐。
分析用户的收听音乐列表提取出用户偏好特征用以计算用户之间的相似度;此外,通过分析用户在社交网站上中间人的个人计算用户之间的粘度,结合二者采用协同过滤的方法向用户推荐音乐。
Claims (3)
1.一种基于机器学习和协同过滤的音乐推荐系统,其特征在于,考虑到APP的众多类型,从App类型角度入手,提出了一种基于模型学习的音乐推荐方案。具体步骤为:
1)每个类别的App形成训练样本,通过提取标签形成特征向量;
2)每种类别的音乐选取部分优秀作品,通过分析音乐网站中的评论和音乐歌词,获得音乐特征向量;
3)每个类别选取部分优秀有配乐的App,得到App特征向量和音乐特征向量,然后形成训练集。
4)通过模型学习的方法,先对App进行分类,然后匹配音乐。
2.根据权利要求1所述的基于机器学习和协同过滤的音乐推荐系统,其特征在于,从用户偏好入手,结合社交关系,提出了一种协同过滤的音乐推荐方案。分析用户的收听音乐列表提取出用户偏好特征用以计算用户之间的相似度;此外,通过分析用户在社交网站上中间人的个人计算用户之间的粘度,结合二者采用协同过滤的方法向用户推荐音乐。
3.根据权利要求1所述的基于机器学习和协同过滤的音乐推荐系统,其特征在于,采集数据时利用爬虫工具获取网络资源,例如音乐文件以及音乐的相关评论等。现今网络资源十分丰富,采集到资源经过数据预处理方案获取系统所需的数据。例如可以根据爬取的分类APP标签以及每个APP的不同模块,提取出不同类型App的特征向量A={a1,a2,……,an},特征向量的每个值对应不同权重,构成相应的权重向量W={w1,w2,……,wn}。对于音乐信息也可以根据其音频曲线和歌词情感等维度进行分析,获得音乐特征向量M={m1,m2,……,mn}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510970387.8A CN105447193A (zh) | 2015-12-22 | 2015-12-22 | 一种基于机器学习和协同过滤的音乐推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510970387.8A CN105447193A (zh) | 2015-12-22 | 2015-12-22 | 一种基于机器学习和协同过滤的音乐推荐系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105447193A true CN105447193A (zh) | 2016-03-30 |
Family
ID=55557369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510970387.8A Pending CN105447193A (zh) | 2015-12-22 | 2015-12-22 | 一种基于机器学习和协同过滤的音乐推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105447193A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018027850A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 根据程序类型推送音乐的方法和推送系统 |
WO2018027838A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 根据标签推送音乐时的信息提示方法和推送系统 |
WO2018027840A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 音乐推荐技术的使用数据反馈方法和推送系统 |
WO2018027851A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 音乐推送技术的权属信息提示方法和推送系统 |
WO2018027837A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 根据游戏推送音乐的方法和推送系统 |
WO2018027852A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 推送音乐时的数据采集方法和推送系统 |
CN108205533A (zh) * | 2016-12-16 | 2018-06-26 | 北京酷我科技有限公司 | 一种基于用户协同的歌曲推荐方法和系统 |
CN108363769A (zh) * | 2018-02-07 | 2018-08-03 | 大连大学 | 基于语义的音乐检索数据集的建立方法 |
CN108549641A (zh) * | 2018-04-26 | 2018-09-18 | 中国联合网络通信集团有限公司 | 歌曲评定方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101720456A (zh) * | 2007-04-05 | 2010-06-02 | 纳珀企业有限责任公司 | 以图形方式关联与用户的社会推荐媒体项目有关的以编程方式生成的媒体项目推荐 |
CN102402534A (zh) * | 2010-09-14 | 2012-04-04 | 盛乐信息技术(上海)有限公司 | 阅读文学作品的背景音乐推荐系统及其实现方法 |
CN103116588A (zh) * | 2011-11-17 | 2013-05-22 | 腾讯科技(深圳)有限公司 | 一种个性化推荐方法及系统 |
CN103279533A (zh) * | 2013-05-31 | 2013-09-04 | 北京华悦博智科技有限责任公司 | 一种社交关系推荐方法及系统 |
CN103440335A (zh) * | 2013-09-06 | 2013-12-11 | 北京奇虎科技有限公司 | 视频推荐方法及装置 |
-
2015
- 2015-12-22 CN CN201510970387.8A patent/CN105447193A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101720456A (zh) * | 2007-04-05 | 2010-06-02 | 纳珀企业有限责任公司 | 以图形方式关联与用户的社会推荐媒体项目有关的以编程方式生成的媒体项目推荐 |
CN102402534A (zh) * | 2010-09-14 | 2012-04-04 | 盛乐信息技术(上海)有限公司 | 阅读文学作品的背景音乐推荐系统及其实现方法 |
CN103116588A (zh) * | 2011-11-17 | 2013-05-22 | 腾讯科技(深圳)有限公司 | 一种个性化推荐方法及系统 |
CN103279533A (zh) * | 2013-05-31 | 2013-09-04 | 北京华悦博智科技有限责任公司 | 一种社交关系推荐方法及系统 |
CN103440335A (zh) * | 2013-09-06 | 2013-12-11 | 北京奇虎科技有限公司 | 视频推荐方法及装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018027850A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 根据程序类型推送音乐的方法和推送系统 |
WO2018027838A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 根据标签推送音乐时的信息提示方法和推送系统 |
WO2018027840A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 音乐推荐技术的使用数据反馈方法和推送系统 |
WO2018027851A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 音乐推送技术的权属信息提示方法和推送系统 |
WO2018027837A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 根据游戏推送音乐的方法和推送系统 |
WO2018027852A1 (zh) * | 2016-08-11 | 2018-02-15 | 张焰焰 | 推送音乐时的数据采集方法和推送系统 |
CN108205533A (zh) * | 2016-12-16 | 2018-06-26 | 北京酷我科技有限公司 | 一种基于用户协同的歌曲推荐方法和系统 |
CN108363769A (zh) * | 2018-02-07 | 2018-08-03 | 大连大学 | 基于语义的音乐检索数据集的建立方法 |
CN108549641A (zh) * | 2018-04-26 | 2018-09-18 | 中国联合网络通信集团有限公司 | 歌曲评定方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105447193A (zh) | 一种基于机器学习和协同过滤的音乐推荐系统 | |
CN109684478B (zh) | 分类模型训练方法、分类方法及装置、设备和介质 | |
CN106126582A (zh) | 推荐方法及装置 | |
CN105718579B (zh) | 一种基于上网日志挖掘和用户活动识别的信息推送方法 | |
CN104751354B (zh) | 一种广告人群筛选方法 | |
CN110532379B (zh) | 一种基于lstm的用户评论情感分析的电子资讯推荐方法 | |
Zhang et al. | Multimodal marketing intent analysis for effective targeted advertising | |
CN111460221B (zh) | 评论信息处理方法、装置及电子设备 | |
CN106062730A (zh) | 用于主动构成内容以便在连续社交通信中使用的系统和方法 | |
CN103577549A (zh) | 一种基于微博标签的人群画像系统和方法 | |
CN106294787A (zh) | 一种推送信息的方法、装置及电子设备 | |
CN107341145A (zh) | 一种基于深度学习的用户情感分析方法 | |
CN108021660B (zh) | 一种基于迁移学习的话题自适应的微博情感分析方法 | |
CN103729360A (zh) | 一种兴趣标签推荐方法及系统 | |
CN105183772A (zh) | 投放信息点击率预估方法及装置 | |
CN102033950A (zh) | 电子产品命名实体自动识别系统的构建方法及识别方法 | |
CN105160545A (zh) | 投放信息样式确定方法及装置 | |
CN112288471A (zh) | 一种基于用户历史行为序列的广告点击率预测方法 | |
KR101804967B1 (ko) | 사용자 맥락, 추천 음악, 이용 행태로 구성된 데이터베이스를 활용한 음악 콘텐츠 추천 방법 및 시스템 | |
CN113111264B (zh) | 界面内容显示方法、装置、电子设备及存储介质 | |
CN108109004A (zh) | 相似人群扩展方法、装置及电子设备 | |
CN106294500A (zh) | 内容项目的推送方法、装置及系统 | |
CN103020712A (zh) | 一种海量微博数据的分布式分类装置及方法 | |
Akram et al. | ChoseAmobile: A web-based recommendation system for mobile phone products | |
Ogudo et al. | Sentiment analysis application and natural language processing for mobile network operators’ support on social media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160330 |