CN111159473A - 一种基于深度学习与马尔科夫链的连接的推荐方法 - Google Patents

一种基于深度学习与马尔科夫链的连接的推荐方法 Download PDF

Info

Publication number
CN111159473A
CN111159473A CN201911356091.1A CN201911356091A CN111159473A CN 111159473 A CN111159473 A CN 111159473A CN 201911356091 A CN201911356091 A CN 201911356091A CN 111159473 A CN111159473 A CN 111159473A
Authority
CN
China
Prior art keywords
markov chain
user
vector
videos
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911356091.1A
Other languages
English (en)
Inventor
张大朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co ltd
Original Assignee
Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co ltd filed Critical Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co ltd
Priority to CN201911356091.1A priority Critical patent/CN111159473A/zh
Publication of CN111159473A publication Critical patent/CN111159473A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/787Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于深度学习与马尔科夫链的连接的推荐方法,包括步骤:将历史数据分成用户观影历史和标量,对用户的观影历史做嵌入向量处理,利用马尔科夫链计算转移概率,再利用softmax归一化计算最终转换概率,然后计算连接向量,最后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,送入用户观影数据,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。本发明将用户的行为视为马尔科夫链,即将用户的观影历史视为马尔科夫链,计算转移概率,再利用softmax归一化,然后计算连接向量,以降低噪声干扰,进而提升准确率和加速训练时的收敛。

Description

一种基于深度学习与马尔科夫链的连接的推荐方法
技术领域
本发明涉及人工智能技术领域,特别是涉及一种基于深度学习与马尔科夫链的连接的推荐方法。
背景技术
传统推荐方法包括协同过滤,基于内容的推荐方法和混合推荐方法。其中最经典是协同过滤,比如因子分解,其利用用户与项目之间的交互信息为用户产生推荐。传统方法采用的是浅层模型,需要人为设计特征。
随着互联网数据越来越多,包括视频、音频、图像、文本在内的多元异构数据蕴含着丰富的用户行为信息及个性化需求信息,传统推荐方法已经无法处理,伴随着深度学习发展,人们开始将深度学习引入推荐领域,深度学习可从样本中学习数据集本质特征的能力,另一方面,深度学习通过从多源异构数据中进行自动特征学习,从而将不同数据映射到一个相同的隐空间,能够获得数据的统一表征。
Covington等人通过利用用户信息、情景信息、历史为数据和项目的特征信息等多源异构数据,提出一种深度神经网络模型用于YouTube视频推荐。YouTube视频推荐面临三个方面挑战:可扩展性,新鲜度和数据噪声问题,为了克服这三个挑战,该研究将深度神经网络模型应有到视频推荐系统的两个关键过程:候选集生成和排序。其系统架构如图1所示。
候选集生成,目的是从海量视频库中筛选出和用户相关的几百个视频,利用用户在YouTube上的历史行为数据、用户特征和情景信息建模用户对视频的个性化偏好,核心方法是将推荐问题转化为一个基于深度神经网络的分类问题,寻找与用户向量(神经网络变换后的特征向量)距离最近的N个视频。排序过程是通过进一步考虑更多的视频特征,利用神经网络和逻辑回归模型对每个视频进行打分,并根据打分值对视频进行排序。
该基于MLP的YouTube视频推荐方法,对于用户行为,即观影历史数据之间的关系(embedded video watches)及用户的搜索历史(enbedded search tokens),只是机械加和而没有考虑到其行为之间的关系而导致推荐不能满足要求。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于深度学习与马尔科夫链的连接的推荐方法,将用户的行为,即观影历史数据视为马尔科夫链,计算转移概率,再利用softmax归一化,然后连接向量,以降低噪声的干扰,进而提升准确率和加速训练时的收敛,用于解决类别偏少的情况。
为实现本发明的目的所采用的技术方案是:
一种基于深度学习与马尔科夫链的连接的推荐方法,包括步骤:
将历史数据分成用户观影历史和标量,对用户的观影历史做嵌入向量处理,利用马尔科夫链计算转移概率,再利用softmax归一化计算最终转换概率,然后计算连接向量,最后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,送入用户观影数据,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
其中,对于搜索的推荐,是将搜索到的前n个视频嵌入向量化后,对其求平均做为观影行为的最后一个观影行为,然后再利用马尔科夫链计算连接向量,然后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,根据用户上下文输入,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
本发明将用户的行为视为马尔科夫链,即将用户的观影历史视为马尔科夫链,计算转移概率,再利用softmax归一化,然后计算连接向量,以降低噪声的干扰,进而提升准确率和加速训练时的收敛。
附图说明
图1是基于MLP的YouTube视频推荐方法的架构图;
图2是基于MLP的YouTube视频推荐方法的流程图;
图3是马尔科夫链层与映射层的示意图;
图4是马尔科夫链层与映射层部分的局部示意图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明基于深度学习与马尔科夫链的连接的推荐方法,包括步骤:将历史数据分成用户观影历史和标量,对用户的观影历史做嵌入向量处理,利用马尔科夫链计算连接向量,最后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,送入用户观影数据,模型选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
下面,说明如何利用马尔科夫链计算向量:
1.转移概率,可采用以下三个方法中一种计算:
(1).概率法:设用户是u,设第i个行为ai,i∈[1,2,...,n],如用户观看的电影行为,t时刻的行为是
Figure BDA0002335963540000031
i∈[1,2,...,n],t∈任一时刻,如表示t时刻观看了αi电影;下一时刻的行为是
Figure BDA0002335963540000032
j∈[1,2,...,n],如表示t+1时刻观看了aj电影;如果
Figure BDA0002335963540000033
存在,即t时刻看了ai电影,t+1时刻看了aj电影,则
Figure BDA0002335963540000034
如果
Figure BDA0002335963540000035
不存在,则
Figure BDA0002335963540000036
则转移概率:
Figure BDA0002335963540000037
(2).相似度:设当前时刻嵌入向量ei,下一时刻嵌入向量是ej,令其相似度是
Figure BDA0002335963540000041
令转移概率:pij=sij
(3).距离:转移概率也可有空间距离表示比如欧式距离,设当前时刻嵌入向量ei,下一时刻嵌入向量是ej,欧式距离为:
Figure BDA0002335963540000042
令转移概率:pij=dij
2.利用softmax归一化:
Figure BDA0002335963540000043
Sij表示行为从i转向j时的归一化值,pij表示上文计算的转移概率,n表嵌入向量数量,则最终转移概率为Pij=Sij
3.计算连接向量E;
这是n对n的方法,即n个e到n个E,用于解决类别偏少的情况。当前嵌入向量ei乘以当前转移概率Pi(i+1),得到向量Ei=ei·Pi(i+1),逐个连接Ei,最后,连接最后一个时间步的嵌入向量En=en.即E=E1,E2,…,En-1,En,逗号表示连接。
本发明的视频推荐的总体流程如下:
将输入历史数据分成用户观影历史和一些标量,如地理位置,星期几等等,对用户的观影历史做嵌入向量处理,然后利用马尔科夫链计算连接向量,再然后与其它的标量首尾连接,送入神经网络,经过候选、排序训练,待预测时,加载已训练的模型,送入用户观影数据,模型选取前n个概率大的作为候选集,来供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
此外,在网络训练时可使用一些技巧,比如利用Xavier/he对权重初始化,dropout,梯度修剪,BN(Batch Normalization,批规范化)。
另外,对于搜索的推荐,给出一个方法,将搜索到的前n个视频嵌入向量化后,对其求平均做为观影行为的最后一个观影行为,利用马尔科夫链求向量,之后就跟上述一致了。
训练时按照批处理的方式进行;预测时按照用户上下文输入。
本发明将用户的行为视为马尔科夫链,表现为将用户的观影历史视为马尔科夫链,计算转移概率,再利用softmax归一化,然后连接向量,以降低噪声的干扰,进而提升准确率和加速训练时的收敛。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于深度学习与马尔科夫链的连接的推荐方法,其特征在于,包括步骤:将历史数据分成用户观影历史和标量,对用户的观影历史做嵌入向量处理,利用马尔科夫链计算转移概率,再利用softmax归一化计算最终转换概率,然后计算连接向量,最后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,送入用户观影数据,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
2.根据权利要求1所述基于深度学习与马尔科夫链的连接的推荐方法,其特征在于,其中,对于搜索的推荐,是将搜索到的前n个视频嵌入向量化后,对其求平均做为观影行为的最后一个观影行为,然后再利用马尔科夫链计算连接向量,然后与标量首尾连接,送入神经网络经过候选、排序训练;预测时,加载已训练的模型,根据用户上下文输入,选取前n个概率大的视频作为候选集供排序做进一步筛选,最终将筛选出来的视频推荐给用户。
3.根据权利要求1或2所述基于深度学习与马尔科夫链的连接的推荐方法,其特征在于,所述连接向量计算如下:
E=E1,E2,…,En-1,En,Ei=ei·Pi(i+1),
式中,E表示连接向量,ei表示当前嵌入向量,Pi(i+1)表示当前转移概率,n表嵌入向量数量,i∈[1,2,...,n]。
4.根据权利要求3所述基于深度学习与马尔科夫链的连接的推荐方法,其特征在于,其中,所述的最终转移概率计算如下:
Figure FDA0002335963530000011
Pij=Sij,
式中,Sij表示行为从状态i转向j时利用softmax归一化的值,Pij表示最终转移概率,pij表示归一化前计算的转移概率。
5.根据权利要求4所述基于深度学习与马尔科夫链的连接的推荐方法,其特征在于,所述归一化前计算的转移概率通过概率法,相似度或距离计算。
CN201911356091.1A 2019-12-25 2019-12-25 一种基于深度学习与马尔科夫链的连接的推荐方法 Pending CN111159473A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911356091.1A CN111159473A (zh) 2019-12-25 2019-12-25 一种基于深度学习与马尔科夫链的连接的推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911356091.1A CN111159473A (zh) 2019-12-25 2019-12-25 一种基于深度学习与马尔科夫链的连接的推荐方法

Publications (1)

Publication Number Publication Date
CN111159473A true CN111159473A (zh) 2020-05-15

Family

ID=70558027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911356091.1A Pending CN111159473A (zh) 2019-12-25 2019-12-25 一种基于深度学习与马尔科夫链的连接的推荐方法

Country Status (1)

Country Link
CN (1) CN111159473A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112259193A (zh) * 2020-10-09 2021-01-22 江苏大学 一种基于马尔科夫链的戒毒状态预测方法
CN112650884A (zh) * 2020-12-21 2021-04-13 四川长虹电器股份有限公司 基于深度学习的视频推送方法
CN113611389A (zh) * 2021-08-11 2021-11-05 东南数字经济发展研究院 一种基于梯度策略决策算法的个性化运动推荐方法
CN114428803A (zh) * 2020-10-29 2022-05-03 上海浦昊节能环保科技有限公司 空压站运行优化方法、系统、存储介质及终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543112A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于循环卷积神经网络的序列推荐方法及装置
CN110070239A (zh) * 2019-03-29 2019-07-30 北京航空航天大学 一种基于a星搜索和深度学习的个性化路线推荐方法
CN110097433A (zh) * 2019-05-14 2019-08-06 苏州大学 基于注意力机制的推荐方法、装置、设备及存储介质
CN111400548A (zh) * 2019-01-02 2020-07-10 中国移动通信有限公司研究院 一种基于深度学习与马尔科夫链的推荐方法及设备
CN112307310A (zh) * 2019-07-29 2021-02-02 中国移动通信有限公司研究院 一种推荐方法及装置、设备、存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543112A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于循环卷积神经网络的序列推荐方法及装置
CN111400548A (zh) * 2019-01-02 2020-07-10 中国移动通信有限公司研究院 一种基于深度学习与马尔科夫链的推荐方法及设备
CN110070239A (zh) * 2019-03-29 2019-07-30 北京航空航天大学 一种基于a星搜索和深度学习的个性化路线推荐方法
CN110097433A (zh) * 2019-05-14 2019-08-06 苏州大学 基于注意力机制的推荐方法、装置、设备及存储介质
CN112307310A (zh) * 2019-07-29 2021-02-02 中国移动通信有限公司研究院 一种推荐方法及装置、设备、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PAUL COVINGTON, 《情报学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112259193A (zh) * 2020-10-09 2021-01-22 江苏大学 一种基于马尔科夫链的戒毒状态预测方法
CN114428803A (zh) * 2020-10-29 2022-05-03 上海浦昊节能环保科技有限公司 空压站运行优化方法、系统、存储介质及终端
CN114428803B (zh) * 2020-10-29 2023-05-26 上海浦昊节能环保科技有限公司 空压站运行优化方法、系统、存储介质及终端
CN112650884A (zh) * 2020-12-21 2021-04-13 四川长虹电器股份有限公司 基于深度学习的视频推送方法
CN112650884B (zh) * 2020-12-21 2022-04-01 四川长虹电器股份有限公司 基于深度学习的视频推送方法
CN113611389A (zh) * 2021-08-11 2021-11-05 东南数字经济发展研究院 一种基于梯度策略决策算法的个性化运动推荐方法

Similar Documents

Publication Publication Date Title
CN111159473A (zh) 一种基于深度学习与马尔科夫链的连接的推荐方法
CN108920641B (zh) 一种信息融合个性化推荐方法
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN112765486B (zh) 一种融合知识图谱的注意力机制的电影推荐方法
CN113378959B (zh) 一种基于语义纠错下生成对抗网络的零样本学习方法
CN111310063A (zh) 基于神经网络的记忆感知门控因子分解机物品推荐方法
CN110210933B (zh) 一种基于生成对抗网络的隐语义推荐方法
Chen et al. Joint text embedding for personalized content-based recommendation
CN111400548B (zh) 一种基于深度学习与马尔科夫链的推荐方法及设备
CN112527993B (zh) 一种跨媒体层次化深度视频问答推理框架
CN113127737B (zh) 融合注意力机制的个性化搜索方法和搜索系统
CN104462489B (zh) 一种基于深层模型的跨模态检索方法
CN115270004B (zh) 一种基于场因子分解的教育资源推荐方法
CN112256965A (zh) 一种基于lambdaMart的神经协同过滤模型推荐方法
CN113268669A (zh) 基于联合神经网络的面向关系挖掘的兴趣点推荐方法
CN112328908A (zh) 一种基于协同过滤的个性化推荐方法
CN115618101A (zh) 基于负反馈的流媒体内容推荐方法、装置及电子设备
Nguyen et al. A hybrid evolutionary computation approach to inducing transfer classifiers for domain adaptation
CN115658936B (zh) 基于双层注意力模型的个性化节目推荐方法、系统
CN116452293A (zh) 一种融合物品受众特征的深度学习推荐方法及系统
CN112307310A (zh) 一种推荐方法及装置、设备、存储介质
CN116189047A (zh) 一种基于多模态信息聚合的短视频分类方法
CN116403608A (zh) 基于多标签纠正和时空协同融合的语音情感识别方法
CN111339428B (zh) 基于受限玻尔兹曼机驱动的交互式个性化搜索方法
CN113076490A (zh) 一种基于混合节点图的涉案微博对象级情感分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200515

WD01 Invention patent application deemed withdrawn after publication