CN112069352B - 一种基于改进的content-based的电视音乐推荐方法 - Google Patents
一种基于改进的content-based的电视音乐推荐方法 Download PDFInfo
- Publication number
- CN112069352B CN112069352B CN202010985139.1A CN202010985139A CN112069352B CN 112069352 B CN112069352 B CN 112069352B CN 202010985139 A CN202010985139 A CN 202010985139A CN 112069352 B CN112069352 B CN 112069352B
- Authority
- CN
- China
- Prior art keywords
- dimension
- user
- recommendation
- interest
- dimensions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
Abstract
本发明涉及个性化推荐技术领域,为解决传统content‑based算法无法对兴趣维度进行扩展推荐的问题,具体是一种基于改进的content‑based的电视音乐推荐方法,包括:S1、获取用户历史数据信息中的维度;S2、获取每个维度对应的用户合集;S3、根据用户合集计算各维度之间对应的杰卡德相似度;S4、对维度进行兴趣评分;S5、获取每个维度下的数据信息并按所有用户的兴趣度排序;S6、选取维度兴趣评分排名前X的维度及其所对应的杰卡德相似度排名前Y的维度构成维度集合;S7、选取维度集合中每个维度排名前Z的数据信息组成候选集M;S8、对用户历史信息采用content‑based算法获取候选集N;S9、合并候选集M与N得到推荐集U。采用上述方法可以拓宽个性化推荐的维度及推荐的多样性。
Description
技术领域
本发明涉及个性化推荐技术领域,具体是一种基于改进的content-based的电视音乐推荐方法。
背景技术
Content-based算法的原理是,根据用户的历史行为,获得用户的兴趣偏好,为用户推荐跟他的兴趣偏好相似的物品,其实现步骤如下:对用户的基础信息与历史行为数据进行挖掘,构建用户特征;对物品的基础信息进行挖掘,构建物品内容信息特征;基于用户特征与物品内容特征的相似度为用户进行推荐。该算法在推荐系统度过冷启动阶段之后,具有一定用户数据时应用较多。但是该算法只能单一地为用户推荐用户历史行为数据中表征出的兴趣维度中包含的物品,而不能为用户基于当前的兴趣拓宽兴趣维度,对不同维度的物品也进行推荐。
发明内容
为了在进行个性化推荐时,根据用户当前兴趣维度推荐相似兴趣维度及相似维度对应的物品,以拓宽个性化推荐所覆盖的维度,使推荐多样化,本发明提供了一种基于改进的content-based的电视音乐推荐方法。
本发明解决上述问题所采用的技术方案是:
一种基于改进的content-based的电视音乐推荐方法,包括:
S1、获取用户历史数据信息中的维度;
S2、获取每个维度对应的用户合集;
S3、根据用户合集计算各维度之间对应的杰卡德相似度;
S4、对维度进行兴趣评分;
S5、获取每个维度下的数据信息并按所有用户的兴趣度排序;
S6、选取维度兴趣评分排名前X的维度及其所对应的杰卡德相似度排名前Y的维度构成维度集合;
S7、选取维度集合中每个维度排名前Z的数据信息组成候选集M;
S8、对用户历史信息采用content-based算法获取候选集N;
S9、合并候选集M与N得到推荐集U。
进一步地,所述步骤S1包括:
S11、对用户历史数据信息进行兴趣度排序;
S12、提取排名前W的所有兴趣信息的维度。
进一步地,还包括步骤S10、去除推荐集U中的重复数据。
进一步地,所述步骤S10还包括去除推荐集U中的用户历史数据。
进一步地,所述步骤S3中计算各维度之间对应的杰卡德相似度的计算公式为:J(A,B)=(A∩B)/(A∪B),其中A和B分别代表一个维度下对应的用户合集。
进一步地,所述步骤S4根据收听歌曲对应的维度的频次与对应收听时长的百分比进行加权求和作为对维度的评分。
本发明相比于现有技术具有的有益效果是:
1、根据用户的历史数据获取数据所属的维度,再对维度进行相似度计算以获取相似维度,在为用户进行个性化推荐时,除了使用content-based算法获取到推荐集N外,还从用户兴趣度高的维度及该维度对应的相似维度的数据中获取推荐集M,最终的推荐集为M与N的合集,采用这种方法拓宽了推荐集的覆盖维度,使推荐更多样。
2、在维度获取时,从用户历史数据兴趣度排名靠前的数据中获取维度可以使推荐的维度更符合用户的兴趣,还可以减少系统的数据运算量,提高运算效率。
3、对推荐集U进行去重处理,不仅去除了推荐集M与N中的重复数据,还去除了推荐集U中属于用户历史数据的部分,使推荐集U对用户来说是全新的,提高了用户体验舒适度。
附图说明
图1为实施例1的结构框图;
图2为实施例1的流程图;
图3为实施例2的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
如图1、图2所示,一种基于改进的content-based的电视音乐推荐方法,包括:
S1、获取用户历史数据信息中的维度;本发明所述的维度可以理解为数据信息的类型。
S2、获取每个维度对应的用户合集;
S3、根据用户合集计算各维度之间对应的杰卡德相似度;计算杰卡德相似度的计算公式为J(A,B)=(A∩B)/(A∪B),其中A和B分别代表一个维度下对应的用户合集。
S4、对维度进行兴趣评分;
S5、获取每个维度下的数据信息并按所有用户的兴趣度排序;
S6、选取维度兴趣评分排名前X的维度及其所对应的杰卡德相似度排名前Y的维度构成维度集合;
S7、选取维度集合中每个维度排名前Z的数据信息组成候选集M;
S8、对用户历史信息采用content-based算法获取候选集N;
S9、合并候选集M与N得到推荐集U。
本发明通过对维度进行杰卡德相似度计算得到各维度间的相似度,通过对维度的兴趣度排序,获取用户最感兴趣的一个或多个维度,将该维度及该维度所对应的一个或多个相似维度合并获得维度集合;在维度集合中,对每个维度中的数据信息进行所有用户兴趣度排序,根据所有用户的兴趣度排名向用户进行推荐;由维度集合得到的推荐集即为候选集M,将候选集M与通过content-based算法获取的候选集N合并得到推荐集U。
在本发明中,维度合集由用户的兴趣度决定,维度合集中所对应的数据由所有用户的兴趣度决定,采用这种方法不仅可以向用户推荐他所喜欢的维度,还可以向其推荐大众感兴趣的数据信息,从而拓宽了个性化推荐的维度及推荐的多样性。
进一步地,所述步骤S1包括:S11、对用户历史数据信息进行兴趣度排序;S12、提取排名前W的所有兴趣信息的维度。从用户历史数据兴趣度排名靠前的数据中获取维度可以使推荐的维度更符合用户的兴趣,还可以减少系统的数据运算量,提高运算效率。
优选地,还包括步骤S10、去除推荐集U中的重复数据。所述步骤S10还包括去除推荐集U中的用户历史数据。对推荐集U进行去重处理,不仅去除了推荐集M与N中的重复数据,还去除了推荐集U中属于用户历史数据的部分,使推荐集U对用户来说是全新的,提高了用户体验舒适度。
实施例2
在实施例1的基础上,如图3所示,在本实施例中以具体音乐推荐为例进行说明。一种基于改进的content-based的电视音乐推荐方法,包括:
S11、对用户历史数据信息进行兴趣度排序;提取近三个月用户历史收听的音乐数据,依据现有数据,采用收听音乐的频次与歌曲收听时长百分比进行加权求和作为用户对歌曲的评分,根据评分进行排序。
S12、提取排名前W的所有兴趣信息的维度;提取用户评分top20的歌曲的所有兴趣维度,兴趣维度的全集是:流行,摇滚,嘻哈,轻音乐,爵士,古典,民谣,电子,R&B,蓝调,乡村,民歌。
S2、获取每个维度对应的用户合集;通过嵌套循环提取每个兴趣维度对应的收听用户的合集。
S3、根据用户合集计算各维度之间对应的杰卡德相似度;计算公式为J(A,B)=(A∩B)/(A∪B),其中A和B分别代表一个维度下对应的用户合集。如下给出了摇滚及各维度与摇滚的相似度:"摇滚":{"流行":0.634,"民谣":0.128,"电子":0.342,"爵士":0.431,"嘻哈":0.864,"R&B":0.769,"轻音乐":0.201,"古典":0.089,"民歌":0.103,"乡村":0.134,"蓝调":0.245}。
S4、对维度进行兴趣评分;采用收听歌曲对应的兴趣维度的频次与对应收听时长的百分比进行加权求和作为对兴趣维度的评分。在本实施例中维度兴趣评分由高到低为摇滚,嘻哈,流行,轻音乐,爵士,古典,民谣,电子,R&B,蓝调,乡村,民歌。
S5、获取每个维度下的数据信息并按所有用户的兴趣度排序;以所有用户的收听频次作为歌曲评分,对摇滚兴趣维度下属歌曲的评分示例如下:
"摇滚":{"Give":134283265,"Take":1326765,"Alida":601875,"Things IThought I Knew":321347,"Im Letting You Win":132195,......}。
S6、选取维度兴趣评分排名前X的维度及其所对应的杰卡德相似度排名前Y的维度构成维度集合;在本实施例中兴趣维度仅选摇滚,相似维度选嘻哈和R&B。
S7、选取维度集合中每个维度排名前Z的数据信息组成候选集M;每个维度选取一首,候选集M:{Give(摇滚),Basket Case(嘻哈),not your average thug(R&B)}。
S8、对用户历史信息采用content-based算法获取候选集N;
S9、合并候选集M与N得到推荐集U;
S10、去除推荐集U中的重复歌曲及用户历史收听过的歌曲。
Claims (5)
1.一种基于改进的content-based的电视音乐推荐方法,其特征在于,包括:
S1、获取用户历史数据信息中的维度;
S2、获取每个维度对应的用户合集;
S3、根据用户合集计算各维度之间对应的杰卡德相似度;
S4、对维度进行兴趣评分,具体为:根据收听歌曲对应的维度的频次与对应收听时长的百分比进行加权求和作为对维度的评分;
S5、获取每个维度下的数据信息并按所有用户的兴趣度排序;
S6、选取维度兴趣评分排名前X的维度及其所对应的杰卡德相似度排名前Y的维度构成维度集合;
S7、选取维度集合中每个维度排名前Z的数据信息组成候选集M;
S8、对用户历史信息采用content-based算法获取候选集N;
S9、合并候选集M与N得到推荐集U。
2.根据权利要求1所述的一种基于改进的content-based的电视音乐推荐方法,其特征在于,所述步骤S1包括:
S11、对用户历史数据信息进行兴趣度排序;
S12、提取排名前W的所有兴趣信息的维度。
3.根据权利要求1所述的一种基于改进的content-based的电视音乐推荐方法,其特征在于,还包括步骤S10、去除推荐集U中的重复数据。
4.根据权利要求3所述的一种基于改进的content-based的电视音乐推荐方法,其特征在于,所述步骤S10还包括去除推荐集U中的用户历史数据。
5.根据权利要求1所述的一种基于改进的content-based的电视音乐推荐方法,其特征在于,所述步骤S3中计算各维度之间对应的杰卡德相似度的计算公式为:J(A,B)=(A∩B)/(A∪B),其中A和B分别代表一个维度下对应的用户合集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010985139.1A CN112069352B (zh) | 2020-09-18 | 2020-09-18 | 一种基于改进的content-based的电视音乐推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010985139.1A CN112069352B (zh) | 2020-09-18 | 2020-09-18 | 一种基于改进的content-based的电视音乐推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112069352A CN112069352A (zh) | 2020-12-11 |
CN112069352B true CN112069352B (zh) | 2022-05-17 |
Family
ID=73680662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010985139.1A Active CN112069352B (zh) | 2020-09-18 | 2020-09-18 | 一种基于改进的content-based的电视音乐推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112069352B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793537A (zh) * | 2014-03-04 | 2014-05-14 | 南京大学 | 一种基于多维时间序列分析的个性化音乐推荐系统及其实现方法 |
CN106326277A (zh) * | 2015-06-30 | 2017-01-11 | 上海证大喜马拉雅网络科技有限公司 | 一种基于用户行为的音频个性化推荐方法和系统 |
CN107885745A (zh) * | 2016-09-29 | 2018-04-06 | 亿览在线网络技术(北京)有限公司 | 一种歌曲推荐方法及装置 |
CN109299366A (zh) * | 2018-09-28 | 2019-02-01 | 西安交通大学深圳研究院 | 一种基于内容相似度实时计算的网络数据分类推荐系统 |
CN110647678A (zh) * | 2019-09-02 | 2020-01-03 | 杭州数理大数据技术有限公司 | 一种基于用户性格标签的推荐方法 |
CN111522889A (zh) * | 2020-04-24 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 用户兴趣标签扩展方法、装置、电子设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7818350B2 (en) * | 2005-02-28 | 2010-10-19 | Yahoo! Inc. | System and method for creating a collaborative playlist |
KR100749045B1 (ko) * | 2006-01-26 | 2007-08-13 | 삼성전자주식회사 | 음악 내용 요약본을 이용한 유사곡 검색 방법 및 그 장치 |
CA3062700A1 (en) * | 2017-05-25 | 2018-11-29 | J. W. Pepper & Son, Inc. | Sheet music search and discovery system |
-
2020
- 2020-09-18 CN CN202010985139.1A patent/CN112069352B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793537A (zh) * | 2014-03-04 | 2014-05-14 | 南京大学 | 一种基于多维时间序列分析的个性化音乐推荐系统及其实现方法 |
CN106326277A (zh) * | 2015-06-30 | 2017-01-11 | 上海证大喜马拉雅网络科技有限公司 | 一种基于用户行为的音频个性化推荐方法和系统 |
CN107885745A (zh) * | 2016-09-29 | 2018-04-06 | 亿览在线网络技术(北京)有限公司 | 一种歌曲推荐方法及装置 |
CN109299366A (zh) * | 2018-09-28 | 2019-02-01 | 西安交通大学深圳研究院 | 一种基于内容相似度实时计算的网络数据分类推荐系统 |
CN110647678A (zh) * | 2019-09-02 | 2020-01-03 | 杭州数理大数据技术有限公司 | 一种基于用户性格标签的推荐方法 |
CN111522889A (zh) * | 2020-04-24 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 用户兴趣标签扩展方法、装置、电子设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
Content-based recommendations via DBpedia and Freebase: a case study in the music domain;Phuong T. Nguyen et al.;《International Semantic Web Conference》;20151231;605-621 * |
Learning Content Similarity for Music Recommendation;Brian McFee et al.;《IEEE Transactions on Audio, Speech, and Language Processing》;20121031;第20卷(第8期);2207-2218 * |
基于内容和用户历史的音乐可视分析;唐磊;《中国博士学位论文全文数据库 信息科技辑》;20121115;I138-17 * |
基于内容的音乐相似计算研究;陈捷 等;《第七届和谐人机环境联合学术会议(HHME2011)》;20110917;1-7 * |
Also Published As
Publication number | Publication date |
---|---|
CN112069352A (zh) | 2020-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299370B (zh) | 多对级个性化推荐方法 | |
US20190278778A1 (en) | Method and device for recommendation of media content | |
CN102609523B (zh) | 基于物品分类和用户分类的协同过滤推荐方法 | |
CN105740268B (zh) | 一种信息推送方法和装置 | |
CN105095219B (zh) | 微博推荐方法和终端 | |
CN106777051A (zh) | 一种基于用户组的多反馈协同过滤推荐方法 | |
US9251525B2 (en) | Device for determining potential future interests to be introduced into profile(s) of user(s) of communication equipment(s) | |
CN103886001A (zh) | 一种个性化商品推荐系统 | |
CN109902235B (zh) | 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法 | |
WO2011034475A1 (en) | Method and apparatus for executing a recommendation | |
Li et al. | Content-based filtering recommendation algorithm using HMM | |
CN109460519B (zh) | 浏览对象推荐方法及装置、存储介质、服务器 | |
CN108009181B (zh) | 一种电台推荐方法及系统 | |
CN106850750A (zh) | 一种实时推送信息的方法和装置 | |
CN109241451B (zh) | 一种内容组合推荐方法、装置及可读存储介质 | |
CN107256513A (zh) | 一种对象的搭配推荐方法及装置 | |
CN110197404A (zh) | 可降低流行度偏差的个性化长尾商品推荐方法和系统 | |
CN104751353A (zh) | 基于聚类和Slope One预测的协同过滤方法 | |
CN112069352B (zh) | 一种基于改进的content-based的电视音乐推荐方法 | |
JP2016509703A (ja) | ラベル付けされた主に非テキストのアイテムを検索するためのシステム及び方法 | |
CN106202517A (zh) | 一种基于大数据的网上商品在网页上的排序方法 | |
CN105740387A (zh) | 一种基于作者频繁模式的科技文献推荐方法 | |
JP5308593B2 (ja) | ジャンル生成装置 | |
CN110110206A (zh) | 物品间关系挖掘及推荐方法、装置、计算设备、存储介质 | |
CN114331621A (zh) | 一种基于区块链共享分析的网络平台购物物品推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |