CN110532330B - 基于hive的协同过滤推荐方法 - Google Patents
基于hive的协同过滤推荐方法 Download PDFInfo
- Publication number
- CN110532330B CN110532330B CN201910830907.3A CN201910830907A CN110532330B CN 110532330 B CN110532330 B CN 110532330B CN 201910830907 A CN201910830907 A CN 201910830907A CN 110532330 B CN110532330 B CN 110532330B
- Authority
- CN
- China
- Prior art keywords
- film
- user
- score
- similarity
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于hive的协同过滤推荐方法,hive是建立在Hadoop集群上的数据仓库工具,底层计算采用MapReduce架构,所以hive能够分布式处理数据量巨大的表,本发明的方法基于hivesql语言,应用矩阵分解的思想,解决了协同过滤推荐系统中的超大矩阵的储存运算等问题,实现了计算用户‑商品(影片)评分、商品与商品相似度矩阵及用户‑推荐商品的数据表的计算,完成了推荐系统中的关键算法部分,特别适合应用于大数据背景下的个性化推荐系统领域。
Description
技术领域
本发明涉及个性化推荐技术领域,尤其涉及基于hive的协同过滤推荐方法。
背景技术
在大数据的时代背景下,只有对数据进行充分的挖掘和分析,才能创造出更多的商业价值。影片推荐系统也是如此,只有充分学习大量用户产生的海量历史观影数据,才能从节目源中准确的挑选出用户喜欢的电影进行推荐,进而提高用户观影行为的数量,最终创造更多的收益。
协同过滤推荐算法是一种经典的个性化推荐算法,大致分为三个步骤:根据用户观影行为求解出各用户对其所观影过的影片评分、根据求解出的用户-影片评分求解影片-影片相似度矩阵、根据用于-影片评分及影片-影片相似度矩阵进行推荐。在上述步骤中存在两个难题,一是如何储存及应用用户-影片评分、影片-影片相似度这两个大矩阵,二是如何根据用户对各影片的观影行为进行建模从而求解出评分。针对第一个问题在构建用户-影片评分、影片-影片相似度矩阵的时候则需要构建一M*N及N*N的影片相似度矩阵,然而在实际生产环境中,N的值一般较大,少则数千,多则数万甚至更高,现有的数据库难以储存成千上万列的数据,那么如何储存应用这个大矩阵则是一个难题。
Hive是建立在经典分布式系统基础架构Hadoop上的数据仓库工具,底层计算采用并行运行的MapReduce架构,所以hive能够分布式处理行数巨大的表格(能够处理上亿级乃至更大的数据量),由于hive在大数据处理方面得天独厚的优势,为寻找协同过滤推荐中的大矩阵储存运算的方案提供了可能。针对第二个问题,在求解评分的时候,需要考虑到观影时长影片时长、影片观看次数以及电影电视剧的区别等多个因素,而现有的建模方式没有考虑到这些因素。
发明内容
针对上述问题,本发明提出了基于hive的协同过滤推荐方法,采用基于hive进行大矩阵分解运算的方法,解决了个性化推荐领域协同过滤算法中的大矩阵运算储存难题。
本发明通过以下技术方案来实现上述目的:
基于hive的协同过滤推荐方法,其特征在于,包括以下步骤:
a.数据仓库的选择及源数据的存储;
由于在大数据工业背景下,数据量可能上千万级甚至更高,所以一般的数据分析工具pandas等难以胜任,需要寻找新的工具来解决大量数据的储存计算问题。hive是建立在Hadoop集群上的数据仓库工具,底层计算采用MapReduce架构,所以hive能够分布式处理数据量巨大的表,经综合考虑,最终选择使用hive作为本系统的数据仓库,hivesq1作为编程语言。选择好数据仓库后,把kafak采集到的数据经过过滤清洗后的用户行为数据储存到hive,以方便之后的计算。
b.用户-影片-评分的计算及结果储存;
想要根据用户观影行为数据得到用户-影片-评分结果,需要考虑两个难题,一是如果设计合理的评分计算公式;而是如何计算储存用户-影片-评分结果。
超大矩阵的分解储存计算:储存及使用到M*N的用户-影片评分表、N*N的影片-影片相似度表两个矩阵,在实际生产环境中,列数量N的取值较大,考虑把大矩阵拆分成MAC,CID,SCORE这样的形式,经过拆分后,表的列数变成固定的3列;
结合实际用户观影行为数据,求解出符合储存要求的用户-影片评分表,包括以下三个小步骤:
(1)清洗过滤相关数据;
(2)根据相应数据计算观影时长并过滤异常数据;
(3)根据设计的公式计算用户-影片-评分公式并进行计算,其中timei表示单次观影时长,timevid表示一集时长(如果是电影,就代表该电影时长),episodes表示集数(电影集数为1),连乘表示对同一cid多次观看的分数进行累成,1是得分基础,用以保证同一cid观看次数越多,得分越高。该公式具有以下优良性质:在相同条件下观影时长越长、观影次数越多、一集时长越短、集数越短,那么得分越高,符合评分的逻辑;
对于计算结果用户-影片-评分的储存,需要储存M*N的用户-影片评分矩阵,其中M为用户(mac)数量,N为影片(cid)的数量,如图1(a)所示,其中的“?”表示该mac未观看过该cid,所以没有评分)需要后续使用算法对该评分进行预估)。在实际生产环境中,列数量N的取值较大,少则几千,多则上万,现有的数据库难以直接储存运算列值巨大的表,经过设计,考虑把大矩阵拆分成MAC,CID,SCORE这样的形式(如图1(b)所示),经过拆分后,表的列数变成固定的3列,并且由于原用户-影片评分矩阵是一个稀疏的矩阵,所以拆分后的矩阵的行数不会剧增,所以最终储存结果是一个P行3列的值,其中P的值较大,但是由于采用的hive进行储存,因此新矩阵的储存及后续运算没有困难,符合生产要求。
c.影片-影片-相似度的计算及结果储存;本步骤也需要考虑到两个难题,一是如何设计影片-影片-相似度计算公式;二是如何计算储存影片-影片相似度结果。
根据用户-影片评分表及大矩阵分解方案,求解影片-影片相似度表,对于相似度计算公式,考虑到hive计算的复杂度,对传统的余弦相似度计算公式作了相应的改进,如下所示:
(2)根据(1)中的公式使用hive中的group by、sum算子具体实现,求得最终影片-影片相似度;
其中的每score1与score2表示同一mac对不同的两部影片cid1,cid2的评分,而score1*score2用以求取变形余弦相似度的分子部分,scorel2,score22用以求取分母部分。该公式与传统余弦相似度不同之处在于计算分母的时候,取的数据是又共同mac评分的数据,这样设计能够减轻hive里面的计算复杂度。
对于计算结果影片-影片-相似度的储存,与用户-影片-评分储存需求类似,需要储存N*N的用户-影片评分矩阵,其中N为影片(cid)的数量,在实际生产环境中,列数量N的取值较大,现有的数据库难以直接储存运算列值巨大的表,结合用户-影片-评分储存方案,最终考虑把大矩阵拆分成CID1,CID2,SIMILARITY这样的形式,经过拆分后,表的列数变成固定的3列,符合生产要求。
d.用户-影片-推荐度数据的计算及结果储存;
在计算用户-影片-推荐度数据的时候,需要使用到上述中的用户-影片-评分表与影片-影片-相似度表。由于用户评分过的影片、影片的相似影片的数量都可能很大,因此不能进行全量计算。经过分析,用户为观影过的最感兴趣的影片应该具有和用户评分高的影片相似度较大的特征,基于此逻辑,那么寻找用户评分最高的K部电影并记录对每部电影的评分score_i,再分别找出与这K部电影的最相似的N部电影作为候选电影,并记录相似度simirity_i_j,最后使用求解score_i*simirity_i_j之和计算用户对影片总的感兴趣程序,最后的结果依然采用多行3列的表进行储存,每列分别储存MAC,REC_CID(推荐影片id),REC_SOCRE(推荐指数),对于某个用户来说,按照推荐指数从高到低对影片id进行排列。
本发明的有益效果在于:
本发明的方法基于hivesq1语言,应用矩阵分解的思想,解决了协同过滤推荐系统中的超大矩阵的储存运算等问题,实现了计算用户-商品(影片)评分、商品与商品相似度矩阵及用户-推荐商品的数据表的计算,完成了推荐系统中的关键算法部分,特别适合应用于大数据背景下的个性化推荐系统领域。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要实用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1(a)原用户-评分大矩阵示意图;
(b)大矩阵分解示意图;
图2为基于hive大矩阵分解运算的协同过滤算法流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
在任一实施例中,如图1-2所示,本发明的基于hive的协同过滤推荐方法,包括:
1求解用户-影片评分表;
(1)清洗过滤源数据。根据现有储存的用户日志的源表standard_actions_video,选择mac,action,action_time,vid字段,其中mac为电视机的MAC地址,具有唯一性,action为用户动作,这里只选择播放start、退出quit两种动作,action_time用动作发生的时间,vid是影片的标志。
(2)计算观影时长。根据上一步清洗得到的数据表,结合hive中的join命令,那么可以求得字段符合以下要求的数据表:mac,vid,action2_time-action1_time,其中action2_time为某mac退出某vid的时间,action1_time为该mac播放该vid的时间,那么action2_time-actionl_time则为该mac观看该vid的时长,单位为分钟,那么由此求得观影时长,在此基础上过滤掉异常数据,得到mac,vid,watchtime表,再结合源数据中的vid-cid对应表,最终得到大矩阵的拆分形式mac,cid,score表。
(3)计算用户-影片评分。在得到观影时长后,使用设计好的公式计算用户对影片的评分,计算公式为其中timei表示单次观影时长,timevid表示一集时长(如果是电影,就代表该电影时长),episodes表示集数(电影集数为1)。最终得到的用户-影片-评分结果如图所示,从左到右每列结果依次是:MAC,CID,SCORE:
**:6c:fd:39:1e:2fx16fkglqliwlouy8.2456
**:6c:fd:39:1e:2fzkbp0mrqhy0x1h1 0.4135
**:6c:fd:39:1e:4c zkbp0mrqhy0x1h1 9.1759
**:6c:fd:39:1e:54 63qp4kyb6xk24s2 0.1429
**:6c:fd:39:1e:54 769cat4mxaze5zs 0.139
**:6c:fd:39:1e:54 zu9dcrzn1prx505 0.1271
**:6c:fd:39:1e:56 z8njm1c1opwgxoa 8.8247;
2求解影片-影片相似度矩阵;
根据改进的余弦相似度公式计算影片与影片相似度,具体公式如下:
(1)用表连接求取mac,cid1,cid2,score1,score2,score1*score2,score12,score22,其中的每score1与score2表示同一mac对不同的两部影片cid1,cid2的评分,而score1*score2用以求取变形余弦相似度的分子部分,score12,score22用以求取分母部分。
(2)使用hive里面的group by sum等算子求解cidi与cidj的相似度。首先根据上一步求解的结果group by cid1,cid2再sum(score1*score2),sum(score12),sum(score22),这样就能把所有求解cid1与cid2相似度的因子都聚合在一起,最终求解出变形后的余弦相似度。
(3)按照求解出来的每部影片的余弦相似度从到到低的顺序进行排列,并注明编号,最终得到的影片-影片-相似度表如图所示,从左到右每列一次是CID1,CID2,SIMILARITY(相似度),ROWNUM(相似度排序):
007lgv06b6f794h t16kd1uxp19t62y 0.0667 47
007lgv06b6f794h voxjcx02ere18uz0.0667 48
007lgv06b6f794h 4c7k8rcyakek6m9 0.0667 49
007lgv06b6f794h o3d1ehesfn5zf8z 0.0667 50
00fbnb23ve0b2pv jqigf6iyhfb7cis 1.0 1
00fbnb23ve0b2pv i4cqpnswrjn6k000.6667 2
00fbnb23ve0b2pv 2zqqa9evbtw2dte 0.6667 3
00fbnb23ve0b2pv q0tw5715ya7071n 0.5 4
00fbnb23ve0b2pv 47v1j5p24ep7g860.5 5;
3求解用户-推荐列表;
(1)求解用户评分最高的K部电影。根据1的结果求解出每个mac评分最高的K部电影,表的形式为mac,cid_topi,score
(2)连接上一部结果表与2求解出的影片-影片相似度表,求解出用户-候选推荐影片,表的形式为mac,cid_topi,score,cid_topi_simcid,similarity
(3)根据用户对影片的感兴趣程序及影片与影片的相似度,最终计算出用户对未观看影片的感兴趣程序,并生成推荐候选集。使用hive中的group by mac,simcid计算sum(score*similarity)求解最终mac对候选cid的感兴趣程度,并按照感兴趣程度从高到低进行排序,得到最终的用户-影片-推荐列表。
最终得到的用户-影片-推荐指数结果如图所示,从左到右每列依次是
MAC,REC_CID(推荐影片id),REC_SOCRE(推荐分数):
**:6c:fd:38:d1:7e 2rfpjgbqfqyt5r6 0.1476
**:6c:fd:38:d1:7e 384cwj141876j4g 0.1476
**:6c:fd:38:d1:7e 50eflqui6qr9ujd 0.1476
**:6c:fd:38:d1:7e exc829cfolnqwj1 0.1476
**:6c:fd:38:d1:7e 5711893cnsdvfi00.1476
**:6c:fd:38:d1:7e cjdhil2m0vy0g97 0.1357
**:6c:fd:38:d1:7e bhptsoz0t1r0xrr 0.0952
**:6c:fd:38:d1:8d hi1g15jmmsxbotc 0.5167
**:6c:fd:38:d1:8d fgqtuu38291hfyw 0.5167
**:6c:fd:38:d1:8d coqnq6i120wojq6 0.4334
**:6c:fd:38:d1:8d 2mmgilh0igrdb3h 0.4334。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
Claims (1)
1.基于hive的协同过滤推荐方法,其特征在于,包括以下步骤:
a.数据仓库的选择及源数据的存储;把kafka采集到的数据经过过滤清洗后的用户行为数据储存到hive,以方便之后的计算;
b.用户-影片-评分的计算及结果储存;
超大矩阵的分解储存计算:储存及使用到M*N的用户-影片评分表、N*N的影片-影片相似度表两个矩阵,在实际生产环境中,列数量N的取值较大,考虑把大矩阵拆分成MAC,CID,SCORE这样的形式,经过拆分后,表的列数变成固定的3列;
结合实际用户观影行为数据,求解出符合储存要求的用户-影片评分表,包括以下三个小步骤:
(1)清洗过滤相关数据;
(2)根据相应数据计算观影时长并过滤异常数据;
c.影片-影片-相似度的计算及结果储存;根据用户-影片评分表及大矩阵分解方案,求解影片-影片相似度表,对于相似度计算公式,考虑到hive计算的复杂度,对传统的余弦相似度计算公式作了相应的改进,如下所示:
其中的scorei_mack与scorej_mack表示同一mac对不同的两部影片cidi,cidj的评分,而scorei_mack*scorej_mack用以求取变形余弦相似度的分子部分,scorei_mack2,scorej_mack2用以求取分母部分;该公式与传统余弦相似度不同之处在于计算分母的时候,取的数据是有共同mac评分的数据,这样设计能够减轻hive里面的计算复杂度;
对于计算结果影片-影片-相似度的储存,与用户-影片-评分储存需求类似,需要储存N*N的用户-影片评分矩阵,其中N为影片的数量,在实际生产环境中,列数量N的取值较大,现有的数据库难以直接储存运算列值巨大的表,结合用户-影片-评分储存方案,最终考虑把大矩阵拆分成CIDi,CIDj,SIMILARITY这样的形式,经过拆分后,表的列数变成固定的3列,符合生产要求;
d.用户-影片-推荐度数据的计算及结果储存;
在计算用户-影片-推荐度数据的时候,需要使用到上述中的用户-影片-评分表与影片-影片-相似度表;由于用户评分过的影片、影片的相似影片的数量都可能很大,因此不能进行全量计算;经过分析,用户为观影过的最感兴趣的影片应该具有和用户评分高的影片相似度较大的特征,基于此逻辑,那么寻找用户评分最高的K部电影并记录对每部电影的评分score_i,再分别找出与这K部电影的最相似的N部电影作为候选电影,并记录相似度simirity_i_j,最后使用score_i*simirity_i_j计算用户对影片总的感兴趣程度,最后的结果依然采用多行3列的表进行储存,每列分别储存MAC,REC_CID,REC_SOCRE,对于某个用户来说,按照用户-影片-推荐度从高到低对影片id进行排列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910830907.3A CN110532330B (zh) | 2019-09-03 | 2019-09-03 | 基于hive的协同过滤推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910830907.3A CN110532330B (zh) | 2019-09-03 | 2019-09-03 | 基于hive的协同过滤推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110532330A CN110532330A (zh) | 2019-12-03 |
CN110532330B true CN110532330B (zh) | 2022-06-03 |
Family
ID=68666573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910830907.3A Active CN110532330B (zh) | 2019-09-03 | 2019-09-03 | 基于hive的协同过滤推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110532330B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886487A (zh) * | 2014-03-28 | 2014-06-25 | 焦点科技股份有限公司 | 基于分布式的b2b平台的个性化推荐方法与系统 |
CN104063481A (zh) * | 2014-07-02 | 2014-09-24 | 山东大学 | 一种基于用户实时兴趣向量的电影个性化推荐方法 |
CN106294288A (zh) * | 2016-07-27 | 2017-01-04 | 中南大学 | 一种分布式非负矩阵分解方法 |
CN107368540A (zh) * | 2017-06-26 | 2017-11-21 | 北京理工大学 | 基于用户自相似度的多模型相结合的电影推荐方法 |
CN108647996A (zh) * | 2018-04-11 | 2018-10-12 | 中山大学 | 一种基于Spark的个性化推荐方法及系统 |
CN108804683A (zh) * | 2018-06-13 | 2018-11-13 | 重庆理工大学 | 结合矩阵分解和协同过滤算法的电影推荐方法 |
CN109670121A (zh) * | 2018-12-18 | 2019-04-23 | 辽宁工程技术大学 | 基于注意力机制的项目级和特征级深度协同过滤推荐算法 |
CN109874032A (zh) * | 2019-03-07 | 2019-06-11 | 四川长虹电器股份有限公司 | 智能电视的节目专题个性化推荐系统与方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140149424A1 (en) * | 2012-11-23 | 2014-05-29 | Mobitv, Inc | Time weighted content recommendation |
CN109190027A (zh) * | 2018-08-22 | 2019-01-11 | 玖富金科控股集团有限责任公司 | 多源推荐方法、终端、服务器、计算机设备、可读介质 |
-
2019
- 2019-09-03 CN CN201910830907.3A patent/CN110532330B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886487A (zh) * | 2014-03-28 | 2014-06-25 | 焦点科技股份有限公司 | 基于分布式的b2b平台的个性化推荐方法与系统 |
CN104063481A (zh) * | 2014-07-02 | 2014-09-24 | 山东大学 | 一种基于用户实时兴趣向量的电影个性化推荐方法 |
CN106294288A (zh) * | 2016-07-27 | 2017-01-04 | 中南大学 | 一种分布式非负矩阵分解方法 |
CN107368540A (zh) * | 2017-06-26 | 2017-11-21 | 北京理工大学 | 基于用户自相似度的多模型相结合的电影推荐方法 |
CN108647996A (zh) * | 2018-04-11 | 2018-10-12 | 中山大学 | 一种基于Spark的个性化推荐方法及系统 |
CN108804683A (zh) * | 2018-06-13 | 2018-11-13 | 重庆理工大学 | 结合矩阵分解和协同过滤算法的电影推荐方法 |
CN109670121A (zh) * | 2018-12-18 | 2019-04-23 | 辽宁工程技术大学 | 基于注意力机制的项目级和特征级深度协同过滤推荐算法 |
CN109874032A (zh) * | 2019-03-07 | 2019-06-11 | 四川长虹电器股份有限公司 | 智能电视的节目专题个性化推荐系统与方法 |
Non-Patent Citations (4)
Title |
---|
Research and Implementation of Hybrid Recommendation Algorithm Based on Collaborative Filtering and Word2Vec;Yao Xiao et al.;《2015 8th International Symposium on Computational Intelligence and Design》;20160512;172-175 * |
基于用户偏好的视频推荐技术研究;唐明;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20140115(第1期);I138-2355 * |
基于评分矩阵填充与用户兴趣的协同过滤推荐算法;韩亚楠 等;《计算机工程》;20160115;第42卷(第1期);36-40 * |
融合注意力机制的深度协同过滤推荐算法;王永贵 等;《计算机工程与应用》;20190418;第55卷(第13期);8-14 * |
Also Published As
Publication number | Publication date |
---|---|
CN110532330A (zh) | 2019-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI702844B (zh) | 用戶特徵的生成方法、裝置、設備及儲存介質 | |
CN107071578B (zh) | Iptv节目推荐方法 | |
Ahmed et al. | Movie recommendation system using clustering and pattern recognition network | |
US10250933B2 (en) | Remote device activity and source metadata processor | |
Dooms et al. | Movietweetings: a movie rating dataset collected from twitter | |
US10331785B2 (en) | Identifying multimedia asset similarity using blended semantic and latent feature analysis | |
US20120246302A1 (en) | System and methodology for creating and using contextual user profiles | |
CN105389590B (zh) | 一种视频聚类推荐方法和装置 | |
CN106570008A (zh) | 推荐方法及装置 | |
JP5843104B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
CN108521586B (zh) | 兼顾时间上下文与隐式反馈的iptv电视节目个性化推荐方法 | |
CN102298650B (zh) | 一种海量数字信息的分布式推荐方法 | |
US20170193531A1 (en) | Intelligent Digital Media Content Creator Influence Assessment | |
US20170270210A1 (en) | Data Infrastructure and Method for Ingesting and Updating A Continuously Evolving Social Network | |
CN104661055A (zh) | 一种业务推荐方法及装置 | |
CN106791964B (zh) | 广播电视节目推荐系统及方法 | |
JP6065907B2 (ja) | 情報処理装置、情報処理方法、および、プログラム | |
CN103688256A (zh) | 基于评论信息确定视频质量参数的方法、装置和系统 | |
CN112653908A (zh) | 一种智能电视媒资实时推荐方法 | |
Gandhi et al. | A survey on recommendation system with collaborative filtering using big data | |
CN110532330B (zh) | 基于hive的协同过滤推荐方法 | |
US12015814B2 (en) | Generating media content keywords based on video-hosting website content | |
JP2024533842A (ja) | ビデオコンテンツとポッドキャストエピソードをマッチングさせること | |
Gandhi et al. | Hybrid recommendation system with collaborative filtering and association rule mining using big data | |
CN109948055A (zh) | 一种基于群体偏好的推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |