CN110598130B - 一种融合异构信息网络和深度学习的电影推荐方法 - Google Patents

一种融合异构信息网络和深度学习的电影推荐方法 Download PDF

Info

Publication number
CN110598130B
CN110598130B CN201910947264.0A CN201910947264A CN110598130B CN 110598130 B CN110598130 B CN 110598130B CN 201910947264 A CN201910947264 A CN 201910947264A CN 110598130 B CN110598130 B CN 110598130B
Authority
CN
China
Prior art keywords
movie
user
node
data
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910947264.0A
Other languages
English (en)
Other versions
CN110598130A (zh
Inventor
苏畅
胡宗超
谢显中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910947264.0A priority Critical patent/CN110598130B/zh
Publication of CN110598130A publication Critical patent/CN110598130A/zh
Application granted granted Critical
Publication of CN110598130B publication Critical patent/CN110598130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种融合异构信息网络和深度学习的电影推荐方法,包括S1:获取用户‑电影交互数据,包括用户属性、用户‑电影的交互数据和电影的属性数据;S2:提取关系对,包括用户‑电影交互关系对、电影属性关系对、用户属性关系对;S3:构建异构信息网络;S4:设计元路径,并根据元路径分别以用户和电影为中心提取网络中的结构关系;S5:采用HIN2Vec方法提取网络中的节点特征;S6:构建用户‑电影交互特征矩阵,并根据电影数据集,给特征矩阵标签化;S7:构建卷积神经网络模型,根据S6生成的标签化的特征矩阵,训练卷积神经网络模型;S8:运用训练好的模型进行偏好预测,运用TOP‑K排序,生成用户感兴趣的电影序列。

Description

一种融合异构信息网络和深度学习的电影推荐方法
技术领域
本发明属于电影推荐领域,涉及一种融合异构信息网络和深度学习的电影推荐方法。
背景技术
近年来,推荐系统发展十分迅速,通过预测用户对信息资源的喜好程度来进行信息过滤,根据用户具体需求通过协同过滤等技术进行个性化推荐,从而也推进了电子商务的发展。随着信息技术的快速发展,在推荐系统中用户的信息变得多元化,各种各样的辅助信息可以被利用,从社交网络信息到个人浏览历史信息、从同类物品信息到相似物品信息,从朋友信息到兴趣相投的陌生人信息,这些信息维度随着互联网技术的发展越来越高,从而使得推荐系统能够更加准确的去描述用户的特征,提升用户在信息推荐服务的体验。
在电影推荐领域,有很多研究者在该领域取得不错的效果,从传统的机器学习方法到深度学习方法都占有一席之地。随着电影推荐的迅速发展,从单维评分数据到社交关系再到情感识别,推荐系统考虑的对象逐渐从评分数据转向用户和电影自身的特征,因而推荐系统所需处理多维数据的能力显得尤为重要。大多数推荐系统利用提取到的用户特征和电影特征,通过这些特征预测用户对电影的喜爱程度,因而是否能够准确的提取用户与电影的关系特征是决定推荐系统性能好坏的重要因素。
现如今,有较多研究把异构信息网络运用于推荐系统,通过异构信息网络提取用户与电影的潜在特征,但没有对用户-电影之间的关系进行深入地挖掘,把较多的工作放在了用户和电影的单节点特征提取上,推荐效果不佳。
发明内容
有鉴于此,本发明的目的在于为了更加准确的描述和识别用户与电影的关系,提高推荐性能,提供一种融合异构信息网络和深度学习的电影推荐方法。
为达到上述目的,本发明提供如下技术方案:
一种融合异构信息网络和深度学习的电影推荐方法,包括以下步骤:
S1:获取用户-电影交互数据,包括用户属性、用户-电影的交互数据和电影的属性数据;
S2:提取关系对,包括用户-电影交互关系对、电影属性关系对、用户属性关系对;
S3:构建异构信息网络;
S4:设计元路径,并根据元路径分别以用户和电影为中心提取网络中的结构关系;
S5:采用HIN2Vec方法提取网络中的节点特征;
S6:构建用户-电影交互特征矩阵,并根据电影数据集,给特征矩阵标签化;
S7:构建卷积神经网络模型,根据S6生成的标签化的特征矩阵,训练卷积神经网络模型;
S8:运用训练好的模型进行偏好预测,运用TOP-K排序,生成用户感兴趣的电影序列。
进一步,在步骤S1中,获取的数据包括用户ID数据、用户的性别数据、用户对电影的访问情况数据、电影ID数据、电影的分类数据。
进一步,在步骤S2中,提取的关系对包括{用户:电影,用户:性别,电影:分类}。
进一步,在步骤S3中,根据用户-电影交互数据构建异构信息网络
Figure BDA0002223701770000021
其中V表示所有具有实际意义的节点的集合,E表示节点之间的关系的集合,
Figure BDA0002223701770000022
表示实体节点类型映射函数
Figure BDA0002223701770000023
V→A,θ表示节点间的关系映射函数θ:E→R;任意一个节点v都对应一个节点类型A即
Figure BDA0002223701770000024
任意一条网络中的边都对应一种关系类型r(也称边的类型),即θ(e)∈R。
进一步,在步骤S4中,根据建立的异构信息网络和每个节点之间的逻辑关系(现实中存在的关系,例如用户节点与电影节点代表了一种访问关系和被访问关系),构建S条元路径(M1,M2,M3,…,Ms-1,Ms)用于用户-电影关系特征提取,因而第i条路径
Figure BDA0002223701770000025
Figure BDA0002223701770000026
表示从实体对象类型A1到实体对象类型Am的结构关系(用于描述一个实体节点的周围网络结构),Ri表示相邻节点之间的关系;根据生成的元路径集M与公式(1),对于
Figure BDA0002223701770000027
Figure BDA0002223701770000028
生成h条长度为l的路径,v为起始节点,生成的路径集合用集合D表示,每条路径中每一个节点通过公式(1)确定,公式如下:
Figure BDA0002223701770000029
其中
Figure BDA00022237017700000210
Figure BDA00022237017700000211
表示节点类型为t(t∈R)的邻接节点且类型为t+1的节点个数;
根据上述,每条路径确定的具体步骤如下:
(1)初始化需要生成的路径的长度l,元路径m∈M,异构信息网络g;
(2)根据节点集V,选定一个初始节点,并作为当前节点;
(3)根据g,确定与当前节点相邻的节点集;
(4)根据当前节点的类型,与该节点相邻的节点集,元路径中的节点类型和下一个需要确定的节点类型,由公式(1)确定下一个节点,将此节点加入路径,并作为当前节点;
(5)根据当前的路径长度确定是否要迭代执行步骤(3)(4)。
进一步,在步骤S5中,为了提取节点的特征表示信息,采用已有方法,具体如下,首先给V中的每个节点v随机生成一个k维特征向量用于描述v构成特征集
Figure BDA0002223701770000031
并从每条路径d∈D中提取四元关系组
Figure BDA0002223701770000032
作为训练特征的数据,其中x1,x2是路径d上任意两相邻节点,r(r∈R)表示两节点之间的关系,Is(x1,x2,r)表示x1,x2是否存在关系r,若存在则值为1,不存在则为0,如公式(2)所示:
Figure BDA0002223701770000033
提取好四元组关系后,节点特征更新方法如下:
S51:建立目标损失函数:
F(x1,x2,r)=Is(x1,x2,r)logp(r|x1,x2)+(1-Is(x1,x2,r))log[1-p(r|x1,x2)]
S52:采用随机梯度下降方法最大化目标函数F,并利用数据
Figure BDA00022237017700000315
迭代更新节点特征w∈W,公式如下:
Figure BDA0002223701770000034
Figure BDA0002223701770000035
Figure BDA0002223701770000036
其中W′x1作为节点x1的权重矩阵,
Figure BDA0002223701770000037
是代表x1的初始特征表示。
进一步,在步骤S6中,得到节点集的特征表示后,取出所有代表用户U和电影I的节点集,将用户与电影的交互特征
Figure BDA0002223701770000038
表示如下:
Figure BDA0002223701770000039
其中
Figure BDA00022237017700000310
Figure BDA00022237017700000311
代表矩阵乘法,
Figure BDA00022237017700000312
代表用户的不同元路径的权重,
Figure BDA00022237017700000313
代表电影的不同元路径的权重;在取得用户与电影的交互特征之后,根据数据集提取用户与电影的访问(交互)关系,提取方式如下:
Figure BDA00022237017700000314
进一步,在步骤S7中,构建卷积神经网络,具体步骤如下:
S71:卷积层:
Figure BDA0002223701770000041
其中bat是每次处理的数据量,ω_11为卷积核,
Figure BDA0002223701770000049
代表卷积操作,
Figure BDA0002223701770000042
为偏置,f(.)代表激活函数,采用线性整流函数(Rectified Linear Unit,ReLU);
S72:卷积层:
Figure BDA00022237017700000410
ω_12为卷积核,
Figure BDA0002223701770000043
为偏置,f(.)代表激活函数,采用Relu;
S73:池化层:采用最大池化df_1=max(h_11);
S74:卷积层:
Figure BDA00022237017700000412
ω_21为卷积核,
Figure BDA0002223701770000044
为偏置,f(.)代表激活函数,采用Relu;
S75:卷积层:
Figure BDA00022237017700000411
ω_22为卷积核,
Figure BDA0002223701770000045
为偏置,f(.)代表激活函数,采用Relu;
S76:池化层:采用最大池化df_2=max(h_22);
S77:全连接层:将df_2转化为一维向量F;
S78:输出:f_output=softmax(F);
S79:损失函数:交叉熵损失函数:
Figure BDA0002223701770000046
其中N为样本数,visit(visit∈Visit)代表原始的用户-电影访问关系,f_output为预测的访问关系。
进一步,在步骤S8中,运用构建好的卷积神经网络模型,将
Figure BDA0002223701770000047
与Visitu,i构成二元组
Figure BDA0002223701770000048
作为训练集T送入卷积神经网络中进行训练,利用训练好的模型去预测用户与新的电影的关系,预测结果代表了用户对电影的喜爱程度,将用户最感兴趣的电影推荐给用户。
本发明的有益效果在于:本发明通过分析用户-电影交互关系,充分挖掘其规律,预测用户的偏好,并生成为用户生成其可能感兴趣的电影序列。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为模型流程图;
图2为异构信息网络示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明所提出的基于异构信息网络的电影推荐方法主要分为以下几部分内容:异构信息网络构建、构建用户-电影交互特征矩阵、搭建卷积神经网络、用户偏好预测。
异构信息网络构建:根据用户历史观看电影数据和用户电影本身的属性特征,生成与之对应的异构信息网络模型,并设计相应的符合用户行为语义的元路径,构建异构信息网络是整个模型中的第一步,也是尤为重要的一步。
构建用户-电影交互特征矩阵:基于构建的异构信息网络,本发明采用HIN2vec方法提取每个具有实际意义的节点的特征表示,为了能够更加准确地描述用户与电影的访问关系,将不同元路径下的用户特征和电影特征分别加权组合,将得到的特征进行矩阵乘法操作,生成用户与电影的交互特征矩阵来描述访问关系,并通过数据给这些特征进行标签化。
卷积神经网络的构建:是整个推荐方法的重要组成部分,根据所提取数据的特征,搭建卷积层、池化层、全连接层和输出层。
用户偏好预测:运用提取的带标签的交互特征训练神经网络模型,利用训练好的模型预测未标签的数据,将预测结果进行top-k排序,从而得到最终的电影推荐结果。
下面将结合附图对本方法的具体步骤进行详细的描述。
为了能够更加简洁且清晰的描述,对部分名词使用以下符号代替:
U:用户集合;
I:电影集合;
C:电影类型集合;
M:元路径;
G:异构信息网络;
Figure BDA0002223701770000061
用户-电影交互特征矩阵。
如图1所示,从图中可以看出整个推荐方法主要由用户-电影特征提取模块、交互关系特征构建模块和特征识别模块三个部分顺序构成。特征提取模块包括从电影交互数据提取关系对、利用关系对构建异构信息网络、构造元路径、提取网络节点的结构化关系,和利用HIN2vec方法提取各个节点的表示特征;交互关系特征构建包括从特征矩阵中提取用户和电影的特征表示、特征加权融合和两类节点特征的矩阵操作;特征识别包括交互关系特征标签化、构建神经网络模型、模型训练、偏好预测以及top-k排序,取出用户可能较喜爱的电影推荐给用户。
一种基于异构信息网络和深度学习的电影推荐方法包括以下步骤:
步骤S1:获取用户-电影交互数据,包括用户属性、用户-电影的交互数据和电影的属性数据;
步骤S2:提取关系对,包括用户-电影交互关系对、电影属性关系对和用户属性关系对;
步骤S3:构建异构信息网络;如图2所示;
步骤S4:设计元路径,并根据元路径分别以用户和电影为中心提取网络中的结构关系;
步骤S5:采用HIN2Vec方法提取网络中的节点特征;
步骤S6:构建用户-电影交互特征矩阵,并根据电影数据集,给特征矩阵标签化;
步骤S7:构建卷积神经网络模型,根据S6生成的标签化的特征矩阵,训练卷积神经网络模型;
步骤S8:运用训练好的模型进行偏好预测,运用TOP-K排序,生成用户感兴趣的电影序列。
其中,步骤S1中,获取的数据包括用户ID数据、用户的性别数据、用户对电影的访问情况数据、电影ID数据、电影的分类数据。
其中,步骤S2中,提取的关系对包括{用户:电影,用户:性别,电影:分类}。
其中,步骤S3中,根据用户-电影交互数据构建异构信息网络
Figure BDA0002223701770000071
其中V表示所有具有实际意义的节点的集合,E表示节点之间的关系(构成边)的集合,
Figure BDA0002223701770000072
表示实体节点类型映射函数
Figure BDA0002223701770000073
V→A,θ表示节点间的关系映射函数θ:E→R;任意一个节点v都对应一个节点类型A即
Figure BDA0002223701770000074
任意一条网络中的边都对应一种关系类型r(也称边的类型),即θ(e)∈R。
其中,步骤S4中,根据建立的异构信息网络和每个节点之间的逻辑关系(现实中存在的关系,例如用户节点与电影节点代表了一种访问关系和被访问关系),构建S条元路径(M1,M2,M3,…,Ms-1,Ms)用于用户-电影关系特征提取,因而第i条路径
Figure BDA0002223701770000075
Figure BDA0002223701770000076
表示从实体对象类型A1到实体对象类型Am的结构关系(用于描述一个实体节点的周围网络结构),Ri表示相邻节点之间的关系。根据生成的元路径集M与公式(1),对于
Figure BDA0002223701770000077
Figure BDA0002223701770000078
Figure BDA0002223701770000079
生成h条长度为l的路径,v为起始节点,生成的路径集合用集合D表示,每条路径中每一个节点通过公式(1)确定,公式如下:
Figure BDA00022237017700000710
其中
Figure BDA00022237017700000711
Figure BDA00022237017700000712
表示节点类型为t(t∈R)的邻接节点且类型为t+1的节点个数。
根据上述,每条路径确定的具体步骤如下:
(1)初始化需要生成的路径的长度l,元路径m∈M,异构信息网络g;
(2)根据节点集V,选定一个初始节点,并作为当前节点;
(3)根据g,确定与当前节点相邻的节点集;
(4)根据当前节点的类型,与该节点相邻的节点集,元路径中的节点类型和下一个需要确定的节点类型,由公式(1)确定下一个节点,将此节点加入路径,并作为当前节点;
(5)根据当前的路径长度确定是否要迭代执行步骤(3)(4)。
其中,步骤S5中,为了提取节点的特征表示信息,本发明采用了已有方法HIN2Vec,方法具体如下:首先给V中的每个节点v随机生成一个k维特征向量用于描述v构成特征集
Figure BDA00022237017700000713
并从每条路径d∈D中提取四元关系组
Figure BDA00022237017700000714
作为训练特征的数据,其中x1,x2是路径d上任意两相邻节点,r(r∈R)表示两节点之间的关系,Is(x1,x2,r)表示x1,x2是否存在关系r,若存在则值为1,不存在则为0,如公式(2)所示:
Figure BDA0002223701770000081
提取好四元组关系后,节点特征更新方法如下:
S51:建立目标损失函数:
F(x1,x2,r)=Is(x1,x2,r)logp(r|x1,x2)+(1-Is(x1,x2,r))log[1-p(r|x1,x2)]
S52:采用随机梯度下降方法最大化目标函数F,并利用数据
Figure BDA00022237017700000816
迭代更新节点特征w∈W。
公式如下:
Figure BDA0002223701770000082
Figure BDA0002223701770000083
Figure BDA0002223701770000084
其中W′x1作为节点x1的权重矩阵,
Figure BDA0002223701770000085
是代表x1的初始特征表示。
其中,在步骤S6中,得到节点集的特征表示后,取出所有代表用户U和电影I的节点集,将用户与电影的交互特征
Figure BDA0002223701770000086
表示如下:
Figure BDA0002223701770000087
其中
Figure BDA0002223701770000088
Figure BDA0002223701770000089
代表矩阵乘法,
Figure BDA00022237017700000810
代表用户的不同元路径的权重,
Figure BDA00022237017700000811
代表电影的不同元路径的权重。在取得用户与电影的交互特征之后,根据数据集提取用户与电影的访问(交互)关系,提取方式如下:
Figure BDA00022237017700000812
其中,步骤S7中,构建卷积神经网络,具体步骤如下:
·卷积层:
Figure BDA00022237017700000813
其中bat是每次处理的数据量,ω_11为卷积核,
Figure BDA00022237017700000818
代表卷积操作,
Figure BDA00022237017700000817
为偏置,f(.)代表激活函数,本发明采用线性整流函数(Rectified Linear Unit,ReLU);
·卷积层:
Figure BDA00022237017700000819
ω_12为卷积核,
Figure BDA00022237017700000814
为偏置,f(.)代表激活函数,采用Relu;
·池化层:采用最大池化df_1=max(h_11);
·卷积层:
Figure BDA00022237017700000820
ω_21为卷积核,
Figure BDA00022237017700000815
为偏置,f(.)代表激活函数,采用Relu;
·卷积层:
Figure BDA0002223701770000095
ω_22为卷积核,
Figure BDA0002223701770000091
为偏置,f(.)代表激活函数,采用Relu;
·池化层:采用最大池化df_2=max(h_22);
·全连接层:将df_2转化为一维向量F;
·输出:f_output=softmax(F);
·损失函数:交叉熵损失函数:
Figure BDA0002223701770000092
其中N为样本数,visit(visit∈Visit)代表原始的用户-电影访问关系,f_output为预测的访问关系。
其中,在步骤S8中,运用构建好的卷积神经网络模型,将
Figure BDA0002223701770000093
与Visitu,i构成二元组
Figure BDA0002223701770000094
作为训练集T送入卷积神经网络中进行训练,利用训练好的模型去预测用户与新的电影的关系,预测结果代表了用户对电影的喜爱程度,运用top-k排序为用户生成其感兴趣的电影序列。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种融合异构信息网络和深度学习的电影推荐方法,其特征在于:包括以下步骤:
S1:获取用户-电影交互数据,包括用户属性、用户-电影的交互数据和电影的属性数据;
S2:提取关系对,包括用户-电影交互关系对、电影属性关系对、用户属性关系对;
S3:构建异构信息网络;根据用户-电影交互数据构建异构信息网络
Figure FDA0003642814060000011
其中V表示所有具有实际意义的节点的集合,E表示节点之间的关系的集合,
Figure FDA0003642814060000012
表示实体节点类型映射函数
Figure FDA0003642814060000013
V→A,θ表示节点间的关系映射函数θ:E→R;任意一个节点v都对应一个节点类型A即
Figure FDA0003642814060000014
任意一条网络中的边都对应一种关系类型r,即θ(e)∈R;
S4:设计元路径,并根据元路径分别以用户和电影为中心提取网络中的结构关系;在步骤S4中,根据建立的异构信息网络和每个节点之间的逻辑关系,构建S条元路径(M1,M2,M3,...,Ms-1,Ms)用于用户-电影关系特征提取,因而第i条路径
Figure FDA0003642814060000015
Figure FDA0003642814060000016
表示从实体对象类型A1到实体对象类型Am的结构关系,Ri表示相邻节点之间的关系;根据生成的元路径集M与公式(1),对于
Figure FDA0003642814060000017
Figure FDA0003642814060000018
生成h条长度为l的路径,v为起始节点,生成的路径集合用集合D表示,每条路径中每一个节点通过公式(1)确定,公式如下:
Figure FDA0003642814060000019
其中
Figure FDA00036428140600000110
表示节点类型为t(t∈R)的邻接节点且类型为t+1的节点个数;
根据上述,每条路径确定的具体步骤如下:
(1)初始化需要生成的路径的长度l,元路径m∈M,异构信息网络g;
(2)根据节点集V,选定一个初始节点,并作为当前节点;
(3)根据g,确定与当前节点相邻的节点集;
(4)根据当前节点的类型,与该节点相邻的节点集,元路径中的节点类型和下一个需要确定的节点类型,由公式(1)确定下一个节点,将此节点加入路径,并作为当前节点;
(5)根据当前的路径长度确定是否要迭代执行步骤(3)(4);
S5:采用HIN2Vec方法提取网络中的节点特征;为了提取节点的特征表示信息,采用已有方法HIN2Vec,具体如下,首先给V中的每个节点v随机生成一个k维特征向量用于描述v构成特征集
Figure FDA00036428140600000111
并从每条路径d∈D中提取四元关系组
Figure FDA00036428140600000112
作为训练特征的数据,其中x1,x2是路径d上任意两相邻节点,r(r∈R)表示两节点之间的关系,Is(x1,x2,r)表示x1,x2是否存在关系r,若存在则值为1,不存在则为0,如公式(2)所示:
Figure FDA0003642814060000021
提取好四元组关系后,节点特征更新方法如下:
S51:建立目标损失函数:
F(x1,x2,r)=Is(x1,x2,r)logp(r|x1,x2)+(1-Is(x1,x2,r))log[1-p(r|x1,x2)]
S52:采用随机梯度下降方法最大化目标函数F,并利用数据
Figure FDA0003642814060000022
迭代更新节点特征w∈W,公式如下:
Figure FDA0003642814060000023
Figure FDA0003642814060000024
Figure FDA0003642814060000025
其中W′x1作为节点x1的权重矩阵,
Figure FDA0003642814060000026
是代表x1的初始特征表示;
S6:构建用户-电影交互特征矩阵,并根据电影数据集,给特征矩阵标签化;得到节点集的特征表示后,取出所有代表用户U和电影I的节点集,将用户与电影的交互特征
Figure FDA0003642814060000027
表示如下:
Figure FDA0003642814060000028
其中
Figure FDA0003642814060000029
Figure FDA00036428140600000210
代表矩阵乘法,
Figure FDA00036428140600000211
代表用户的不同元路径的权重,
Figure FDA00036428140600000212
代表电影的不同元路径的权重;在取得用户与电影的交互特征之后,根据数据集提取用户与电影的访问关系,提取方式如下:
Figure FDA00036428140600000213
S7:构建卷积神经网络模型,根据S6生成的标签化的特征矩阵,训练卷积神经网络模型;
S8:运用训练好的模型进行偏好预测,运用TOP-K排序,生成用户感兴趣的电影序列。
2.根据权利要求1所述的融合异构信息网络和深度学习的电影推荐方法,其特征在于:在步骤S1中,获取的数据包括用户ID数据、用户的性别数据、用户对电影的访问情况数据、电影ID数据、电影的分类数据。
3.根据权利要求1所述的融合异构信息网络和深度学习的电影推荐方法,其特征在于:在步骤S2中,提取的关系对包括{用户:电影,用户:性别,电影:分类}。
4.根据权利要求1所述的融合异构信息网络和深度学习的电影推荐方法,其特征在于:在步骤S7中,构建卷积神经网络,具体步骤如下:
S71:卷积层:
Figure FDA0003642814060000031
其中bat是每次处理的数据量,ω_11为卷积核,
Figure FDA0003642814060000032
代表卷积操作,
Figure FDA0003642814060000033
为偏置,f(.)代表激活函数,采用线性整流函数(Rectified Linear Unit,ReLU);
S72:卷积层:
Figure FDA0003642814060000034
ω_12为卷积核,
Figure FDA0003642814060000035
为偏置,f(.)代表激活函数,采用Relu;
S73:池化层:采用最大池化df_1=max(h_11);
S74:卷积层:
Figure FDA0003642814060000036
ω_21为卷积核,b_21∈R为偏置,f(.)代表激活函数,采用Relu;
S75:卷积层:
Figure FDA0003642814060000037
ω_22为卷积核,b_22∈R为偏置,f(.)代表激活函数,采用Relu;
S76:池化层:采用最大池化df_2=max(h_22);
S77:全连接层:将df_2转化为一维向量F;
S78:输出:f_output=softmax(F);
S79:损失函数:交叉熵损失函数:
Figure FDA0003642814060000038
其中N为样本数,visit(visit∈Visit)代表原始的用户-电影访问关系,f_output为预测的访问关系。
5.根据权利要求1所述的融合异构信息网络和深度学习的电影推荐方法,其特征在于:在步骤S8中,运用构建好的卷积神经网络模型,将
Figure FDA0003642814060000039
与Visitu,i构成二元组
Figure FDA00036428140600000310
作为训练集T送入卷积神经网络中进行训练,利用训练好的模型去预测用户与新的电影的关系,预测结果代表了用户对电影的喜爱程度,将用户最感兴趣的电影推荐给用户。
CN201910947264.0A 2019-09-30 2019-09-30 一种融合异构信息网络和深度学习的电影推荐方法 Active CN110598130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910947264.0A CN110598130B (zh) 2019-09-30 2019-09-30 一种融合异构信息网络和深度学习的电影推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910947264.0A CN110598130B (zh) 2019-09-30 2019-09-30 一种融合异构信息网络和深度学习的电影推荐方法

Publications (2)

Publication Number Publication Date
CN110598130A CN110598130A (zh) 2019-12-20
CN110598130B true CN110598130B (zh) 2022-06-24

Family

ID=68865536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910947264.0A Active CN110598130B (zh) 2019-09-30 2019-09-30 一种融合异构信息网络和深度学习的电影推荐方法

Country Status (1)

Country Link
CN (1) CN110598130B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111210233B (zh) * 2020-01-02 2023-12-26 联想(北京)有限公司 用户特征确定方法、装置和电子设备
CN111241311B (zh) * 2020-01-09 2023-02-03 腾讯科技(深圳)有限公司 媒体信息推荐方法、装置、电子设备及存储介质
CN111709819B (zh) * 2020-01-20 2021-03-30 山东佳联电子商务有限公司 一种点拍网基于图神经网络的产权交易推荐系统及推荐方法
CN111310045A (zh) * 2020-02-16 2020-06-19 重庆邮电大学 一种基于元路径的网络嵌入的电影推荐方法
CN111400560A (zh) * 2020-03-10 2020-07-10 支付宝(杭州)信息技术有限公司 一种基于异构图神经网络模型进行预测的方法和系统
CN111832724B (zh) * 2020-07-14 2023-03-28 西北工业大学 一种基于深度神经网络的异构网络推荐方法
CN112214683B (zh) * 2020-09-09 2024-05-14 华南师范大学 基于异构信息网络的混合推荐模型处理方法、系统和介质
CN112149124B (zh) * 2020-11-02 2022-04-29 电子科技大学 一种基于异构信息网络的安卓恶意程序检测的方法和系统
CN112800344B (zh) * 2021-01-29 2022-03-22 重庆邮电大学 一种基于深度神经网络的电影推荐方法
CN112948625B (zh) * 2021-02-01 2022-08-05 重庆邮电大学 一种基于属性异质信息网络嵌入的电影推荐方法
CN112818248B (zh) * 2021-02-26 2023-04-18 西北大学 一种基于情感的物品推荐模型构建、推荐方法及系统
CN113704440B (zh) * 2021-09-06 2022-02-18 中国计量大学 一种基于物品图网络中路径表征的会话推荐方法
CN113837847B (zh) * 2021-10-29 2023-08-29 重庆大学 基于异质多元关系融合的知识密集型服务推荐方法
CN116595157B (zh) * 2023-07-17 2023-09-19 江西财经大学 基于用户意图融合的动态兴趣转移型会话推荐方法与系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002488A (zh) * 2018-06-26 2018-12-14 北京邮电大学 一种基于元路径上下文的推荐模型训练方法及装置
CN109241454A (zh) * 2018-07-18 2019-01-18 广东工业大学 一种将社交网络和图像内容融合的兴趣点推荐方法
CN109635989A (zh) * 2018-08-30 2019-04-16 电子科技大学 一种基于多源异构数据融合的社交网络链路预测方法
CN109871504A (zh) * 2019-01-24 2019-06-11 中国科学院软件研究所 一种基于异构信息网络与深度学习的课程推荐系统
CN109887540A (zh) * 2019-01-15 2019-06-14 中南大学 一种基于异构网络嵌入的药物靶标相互作用预测方法
CN110196946A (zh) * 2019-05-29 2019-09-03 华南理工大学 一种基于深度学习的个性化推荐方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160314404A1 (en) * 2015-04-23 2016-10-27 Rovi Guides, Inc. Systems and methods for improving accuracy in media asset recommendations based on data from multiple data spaces
US20170169351A1 (en) * 2015-12-10 2017-06-15 TCL Research America Inc. Heterogenous network (r-knowledge) for bridging users and apps via relationship learning

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002488A (zh) * 2018-06-26 2018-12-14 北京邮电大学 一种基于元路径上下文的推荐模型训练方法及装置
CN109241454A (zh) * 2018-07-18 2019-01-18 广东工业大学 一种将社交网络和图像内容融合的兴趣点推荐方法
CN109635989A (zh) * 2018-08-30 2019-04-16 电子科技大学 一种基于多源异构数据融合的社交网络链路预测方法
CN109887540A (zh) * 2019-01-15 2019-06-14 中南大学 一种基于异构网络嵌入的药物靶标相互作用预测方法
CN109871504A (zh) * 2019-01-24 2019-06-11 中国科学院软件研究所 一种基于异构信息网络与深度学习的课程推荐系统
CN110196946A (zh) * 2019-05-29 2019-09-03 华南理工大学 一种基于深度学习的个性化推荐方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Deep Collaborative Filtering with Multi-Aspect Information in Heterogeneous Networks;Chuan Shi等;《IEEE Transactions on Knowledge and Data Engineering》;20190917;第1413 - 1425页 *
Leveraging Meta-path based Context for Top-N Recommendation with A Neural Co-Attention Model;Binbin Hu等;《Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining》;20180823;第1531-154-页 *
基于异质信息网络的深度学习推荐算法研究;温玉娇;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190915;I138-1318 *
基于异质信息网络表示学习的推荐算法研究与实现;胡斌斌;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190815;I138-1436 *
异质信息网络中基于表征学习的推荐算法研究;王泽楷;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190915;I138-1243 *

Also Published As

Publication number Publication date
CN110598130A (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
CN110598130B (zh) 一种融合异构信息网络和深度学习的电影推荐方法
Yang et al. Image-text multimodal emotion classification via multi-view attentional network
CN110162706B (zh) 一种基于交互数据聚类的个性化推荐方法及系统
CN112214685B (zh) 一种基于知识图谱的个性化推荐方法
CN112765486B (zh) 一种融合知识图谱的注意力机制的电影推荐方法
Ji et al. Cross-modality microblog sentiment prediction via bi-layer multimodal hypergraph learning
CN111125495A (zh) 一种信息推荐方法、设备及存储介质
Li et al. Adversarial multimodal representation learning for click-through rate prediction
CN102629275A (zh) 面向跨媒体新闻检索的人脸-人名对齐方法及系统
CN105531701A (zh) 个性化趋势图像搜索建议
CN112507246B (zh) 一种融合全局和局部社会兴趣影响的社会推荐方法
CN109947987B (zh) 一种交叉协同过滤推荐方法
CN112115377A (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN113744032B (zh) 一种图书推荐的方法、相关装置、设备及存储介质
CN112417313A (zh) 一种基于知识图卷积网络的模型混合推荐方法
Wang et al. Research on product recommendation based on matrix factorization models fusing user reviews
CN111125540A (zh) 一种融合知识图谱表示学习和偏置矩阵分解的推荐方法
CN113806630A (zh) 基于注意力的多视角特征融合跨域推荐方法及装置
CN108389113B (zh) 一种协同过滤推荐方法和系统
CN107247774A (zh) 一种面向群智多模态数据的处理方法及系统
Yadav et al. A new approach for movie recommender system using K-means Clustering and PCA
Wang et al. An enhanced multi-modal recommendation based on alternate training with knowledge graph representation
Wang et al. Link prediction in heterogeneous collaboration networks
CN113590965B (zh) 一种融合知识图谱与情感分析的视频推荐方法
Feng et al. Recommendations based on comprehensively exploiting the latent factors hidden in items’ ratings and content

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant