CN111159473A - 一种基于深度学习与马尔科夫链的连接的推荐方法 - Google Patents
一种基于深度学习与马尔科夫链的连接的推荐方法 Download PDFInfo
- Publication number
- CN111159473A CN111159473A CN201911356091.1A CN201911356091A CN111159473A CN 111159473 A CN111159473 A CN 111159473A CN 201911356091 A CN201911356091 A CN 201911356091A CN 111159473 A CN111159473 A CN 111159473A
- Authority
- CN
- China
- Prior art keywords
- markov chain
- user
- vector
- videos
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013135 deep learning Methods 0.000 title claims abstract description 16
- 239000013598 vector Substances 0.000 claims abstract description 47
- 230000007704 transition Effects 0.000 claims abstract description 23
- 230000006399 behavior Effects 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000010606 normalization Methods 0.000 claims abstract description 11
- 238000013528 artificial neural network Methods 0.000 claims abstract description 10
- 238000012216 screening Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000012163 sequencing technique Methods 0.000 claims abstract description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000005034 decoration Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 101100460704 Aspergillus sp. (strain MF297-2) notI gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/787—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于深度学习与马尔科夫链的连接的推荐方法,包括步骤:将历史数据分成用户观影历史和标量,对用户的观影历史做嵌入向量处理,利用马尔科夫链计算转移概率,再利用softmax归一化计算最终转换概率,然后计算连接向量,最后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,送入用户观影数据,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。本发明将用户的行为视为马尔科夫链,即将用户的观影历史视为马尔科夫链,计算转移概率,再利用softmax归一化,然后计算连接向量,以降低噪声干扰,进而提升准确率和加速训练时的收敛。
Description
技术领域
本发明涉及人工智能技术领域,特别是涉及一种基于深度学习与马尔科夫链的连接的推荐方法。
背景技术
传统推荐方法包括协同过滤,基于内容的推荐方法和混合推荐方法。其中最经典是协同过滤,比如因子分解,其利用用户与项目之间的交互信息为用户产生推荐。传统方法采用的是浅层模型,需要人为设计特征。
随着互联网数据越来越多,包括视频、音频、图像、文本在内的多元异构数据蕴含着丰富的用户行为信息及个性化需求信息,传统推荐方法已经无法处理,伴随着深度学习发展,人们开始将深度学习引入推荐领域,深度学习可从样本中学习数据集本质特征的能力,另一方面,深度学习通过从多源异构数据中进行自动特征学习,从而将不同数据映射到一个相同的隐空间,能够获得数据的统一表征。
Covington等人通过利用用户信息、情景信息、历史为数据和项目的特征信息等多源异构数据,提出一种深度神经网络模型用于YouTube视频推荐。YouTube视频推荐面临三个方面挑战:可扩展性,新鲜度和数据噪声问题,为了克服这三个挑战,该研究将深度神经网络模型应有到视频推荐系统的两个关键过程:候选集生成和排序。其系统架构如图1所示。
候选集生成,目的是从海量视频库中筛选出和用户相关的几百个视频,利用用户在YouTube上的历史行为数据、用户特征和情景信息建模用户对视频的个性化偏好,核心方法是将推荐问题转化为一个基于深度神经网络的分类问题,寻找与用户向量(神经网络变换后的特征向量)距离最近的N个视频。排序过程是通过进一步考虑更多的视频特征,利用神经网络和逻辑回归模型对每个视频进行打分,并根据打分值对视频进行排序。
该基于MLP的YouTube视频推荐方法,对于用户行为,即观影历史数据之间的关系(embedded video watches)及用户的搜索历史(enbedded search tokens),只是机械加和而没有考虑到其行为之间的关系而导致推荐不能满足要求。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于深度学习与马尔科夫链的连接的推荐方法,将用户的行为,即观影历史数据视为马尔科夫链,计算转移概率,再利用softmax归一化,然后连接向量,以降低噪声的干扰,进而提升准确率和加速训练时的收敛,用于解决类别偏少的情况。
为实现本发明的目的所采用的技术方案是:
一种基于深度学习与马尔科夫链的连接的推荐方法,包括步骤:
将历史数据分成用户观影历史和标量,对用户的观影历史做嵌入向量处理,利用马尔科夫链计算转移概率,再利用softmax归一化计算最终转换概率,然后计算连接向量,最后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,送入用户观影数据,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
其中,对于搜索的推荐,是将搜索到的前n个视频嵌入向量化后,对其求平均做为观影行为的最后一个观影行为,然后再利用马尔科夫链计算连接向量,然后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,根据用户上下文输入,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
本发明将用户的行为视为马尔科夫链,即将用户的观影历史视为马尔科夫链,计算转移概率,再利用softmax归一化,然后计算连接向量,以降低噪声的干扰,进而提升准确率和加速训练时的收敛。
附图说明
图1是基于MLP的YouTube视频推荐方法的架构图;
图2是基于MLP的YouTube视频推荐方法的流程图;
图3是马尔科夫链层与映射层的示意图;
图4是马尔科夫链层与映射层部分的局部示意图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明基于深度学习与马尔科夫链的连接的推荐方法,包括步骤:将历史数据分成用户观影历史和标量,对用户的观影历史做嵌入向量处理,利用马尔科夫链计算连接向量,最后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,送入用户观影数据,模型选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
下面,说明如何利用马尔科夫链计算向量:
1.转移概率,可采用以下三个方法中一种计算:
(1).概率法:设用户是u,设第i个行为ai,i∈[1,2,...,n],如用户观看的电影行为,t时刻的行为是i∈[1,2,...,n],t∈任一时刻,如表示t时刻观看了αi电影;下一时刻的行为是j∈[1,2,...,n],如表示t+1时刻观看了aj电影;如果存在,即t时刻看了ai电影,t+1时刻看了aj电影,则如果不存在,则则转移概率:
令转移概率:pij=dij。
2.利用softmax归一化:
Sij表示行为从i转向j时的归一化值,pij表示上文计算的转移概率,n表嵌入向量数量,则最终转移概率为Pij=Sij。
3.计算连接向量E;
这是n对n的方法,即n个e到n个E,用于解决类别偏少的情况。当前嵌入向量ei乘以当前转移概率Pi(i+1),得到向量Ei=ei·Pi(i+1),逐个连接Ei,最后,连接最后一个时间步的嵌入向量En=en.即E=E1,E2,…,En-1,En,逗号表示连接。
本发明的视频推荐的总体流程如下:
将输入历史数据分成用户观影历史和一些标量,如地理位置,星期几等等,对用户的观影历史做嵌入向量处理,然后利用马尔科夫链计算连接向量,再然后与其它的标量首尾连接,送入神经网络,经过候选、排序训练,待预测时,加载已训练的模型,送入用户观影数据,模型选取前n个概率大的作为候选集,来供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
此外,在网络训练时可使用一些技巧,比如利用Xavier/he对权重初始化,dropout,梯度修剪,BN(Batch Normalization,批规范化)。
另外,对于搜索的推荐,给出一个方法,将搜索到的前n个视频嵌入向量化后,对其求平均做为观影行为的最后一个观影行为,利用马尔科夫链求向量,之后就跟上述一致了。
训练时按照批处理的方式进行;预测时按照用户上下文输入。
本发明将用户的行为视为马尔科夫链,表现为将用户的观影历史视为马尔科夫链,计算转移概率,再利用softmax归一化,然后连接向量,以降低噪声的干扰,进而提升准确率和加速训练时的收敛。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
1.一种基于深度学习与马尔科夫链的连接的推荐方法,其特征在于,包括步骤:将历史数据分成用户观影历史和标量,对用户的观影历史做嵌入向量处理,利用马尔科夫链计算转移概率,再利用softmax归一化计算最终转换概率,然后计算连接向量,最后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,送入用户观影数据,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
2.根据权利要求1所述基于深度学习与马尔科夫链的连接的推荐方法,其特征在于,其中,对于搜索的推荐,是将搜索到的前n个视频嵌入向量化后,对其求平均做为观影行为的最后一个观影行为,然后再利用马尔科夫链计算连接向量,然后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,根据用户上下文输入,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
3.根据权利要求1或2所述基于深度学习与马尔科夫链的连接的推荐方法,其特征在于,所述连接向量计算如下:
E=E1,E2,…,En-1,En,Ei=ei·Pi(i+1),
式中,E表示连接向量,ei表示当前嵌入向量,Pi(i+1)表示当前转移概率,n表嵌入向量数量,i∈[1,2,...,n]。
5.根据权利要求4所述基于深度学习与马尔科夫链的连接的推荐方法,其特征在于,所述归一化前计算的转移概率通过概率法,相似度或距离计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911356091.1A CN111159473A (zh) | 2019-12-25 | 2019-12-25 | 一种基于深度学习与马尔科夫链的连接的推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911356091.1A CN111159473A (zh) | 2019-12-25 | 2019-12-25 | 一种基于深度学习与马尔科夫链的连接的推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111159473A true CN111159473A (zh) | 2020-05-15 |
Family
ID=70558027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911356091.1A Pending CN111159473A (zh) | 2019-12-25 | 2019-12-25 | 一种基于深度学习与马尔科夫链的连接的推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111159473A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112259193A (zh) * | 2020-10-09 | 2021-01-22 | 江苏大学 | 一种基于马尔科夫链的戒毒状态预测方法 |
CN112650884A (zh) * | 2020-12-21 | 2021-04-13 | 四川长虹电器股份有限公司 | 基于深度学习的视频推送方法 |
CN113611389A (zh) * | 2021-08-11 | 2021-11-05 | 东南数字经济发展研究院 | 一种基于梯度策略决策算法的个性化运动推荐方法 |
CN114428803A (zh) * | 2020-10-29 | 2022-05-03 | 上海浦昊节能环保科技有限公司 | 空压站运行优化方法、系统、存储介质及终端 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543112A (zh) * | 2018-11-30 | 2019-03-29 | 苏州大学 | 一种基于循环卷积神经网络的序列推荐方法及装置 |
CN110070239A (zh) * | 2019-03-29 | 2019-07-30 | 北京航空航天大学 | 一种基于a星搜索和深度学习的个性化路线推荐方法 |
CN110097433A (zh) * | 2019-05-14 | 2019-08-06 | 苏州大学 | 基于注意力机制的推荐方法、装置、设备及存储介质 |
CN111400548A (zh) * | 2019-01-02 | 2020-07-10 | 中国移动通信有限公司研究院 | 一种基于深度学习与马尔科夫链的推荐方法及设备 |
CN112307310A (zh) * | 2019-07-29 | 2021-02-02 | 中国移动通信有限公司研究院 | 一种推荐方法及装置、设备、存储介质 |
-
2019
- 2019-12-25 CN CN201911356091.1A patent/CN111159473A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543112A (zh) * | 2018-11-30 | 2019-03-29 | 苏州大学 | 一种基于循环卷积神经网络的序列推荐方法及装置 |
CN111400548A (zh) * | 2019-01-02 | 2020-07-10 | 中国移动通信有限公司研究院 | 一种基于深度学习与马尔科夫链的推荐方法及设备 |
CN110070239A (zh) * | 2019-03-29 | 2019-07-30 | 北京航空航天大学 | 一种基于a星搜索和深度学习的个性化路线推荐方法 |
CN110097433A (zh) * | 2019-05-14 | 2019-08-06 | 苏州大学 | 基于注意力机制的推荐方法、装置、设备及存储介质 |
CN112307310A (zh) * | 2019-07-29 | 2021-02-02 | 中国移动通信有限公司研究院 | 一种推荐方法及装置、设备、存储介质 |
Non-Patent Citations (1)
Title |
---|
PAUL COVINGTON, 《情报学报》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112259193A (zh) * | 2020-10-09 | 2021-01-22 | 江苏大学 | 一种基于马尔科夫链的戒毒状态预测方法 |
CN114428803A (zh) * | 2020-10-29 | 2022-05-03 | 上海浦昊节能环保科技有限公司 | 空压站运行优化方法、系统、存储介质及终端 |
CN114428803B (zh) * | 2020-10-29 | 2023-05-26 | 上海浦昊节能环保科技有限公司 | 空压站运行优化方法、系统、存储介质及终端 |
CN112650884A (zh) * | 2020-12-21 | 2021-04-13 | 四川长虹电器股份有限公司 | 基于深度学习的视频推送方法 |
CN112650884B (zh) * | 2020-12-21 | 2022-04-01 | 四川长虹电器股份有限公司 | 基于深度学习的视频推送方法 |
CN113611389A (zh) * | 2021-08-11 | 2021-11-05 | 东南数字经济发展研究院 | 一种基于梯度策略决策算法的个性化运动推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111159473A (zh) | 一种基于深度学习与马尔科夫链的连接的推荐方法 | |
CN108920641B (zh) | 一种信息融合个性化推荐方法 | |
CN111222332B (zh) | 一种结合注意力网络和用户情感的商品推荐方法 | |
CN112765486B (zh) | 一种融合知识图谱的注意力机制的电影推荐方法 | |
CN113378959B (zh) | 一种基于语义纠错下生成对抗网络的零样本学习方法 | |
CN111310063A (zh) | 基于神经网络的记忆感知门控因子分解机物品推荐方法 | |
CN110210933B (zh) | 一种基于生成对抗网络的隐语义推荐方法 | |
Chen et al. | Joint text embedding for personalized content-based recommendation | |
CN111400548B (zh) | 一种基于深度学习与马尔科夫链的推荐方法及设备 | |
CN112527993B (zh) | 一种跨媒体层次化深度视频问答推理框架 | |
CN113127737B (zh) | 融合注意力机制的个性化搜索方法和搜索系统 | |
CN104462489B (zh) | 一种基于深层模型的跨模态检索方法 | |
CN115270004B (zh) | 一种基于场因子分解的教育资源推荐方法 | |
CN112256965A (zh) | 一种基于lambdaMart的神经协同过滤模型推荐方法 | |
CN113268669A (zh) | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 | |
CN112328908A (zh) | 一种基于协同过滤的个性化推荐方法 | |
CN115618101A (zh) | 基于负反馈的流媒体内容推荐方法、装置及电子设备 | |
Nguyen et al. | A hybrid evolutionary computation approach to inducing transfer classifiers for domain adaptation | |
CN115658936B (zh) | 基于双层注意力模型的个性化节目推荐方法、系统 | |
CN116452293A (zh) | 一种融合物品受众特征的深度学习推荐方法及系统 | |
CN112307310A (zh) | 一种推荐方法及装置、设备、存储介质 | |
CN116189047A (zh) | 一种基于多模态信息聚合的短视频分类方法 | |
CN116403608A (zh) | 基于多标签纠正和时空协同融合的语音情感识别方法 | |
CN111339428B (zh) | 基于受限玻尔兹曼机驱动的交互式个性化搜索方法 | |
CN113076490A (zh) | 一种基于混合节点图的涉案微博对象级情感分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200515 |
|
WD01 | Invention patent application deemed withdrawn after publication |