CN113139089A - Sddne模型协同过滤模型的电影推荐方法、系统、介质及设备 - Google Patents

Sddne模型协同过滤模型的电影推荐方法、系统、介质及设备 Download PDF

Info

Publication number
CN113139089A
CN113139089A CN202110528820.8A CN202110528820A CN113139089A CN 113139089 A CN113139089 A CN 113139089A CN 202110528820 A CN202110528820 A CN 202110528820A CN 113139089 A CN113139089 A CN 113139089A
Authority
CN
China
Prior art keywords
movie
user
data
model
sddne
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110528820.8A
Other languages
English (en)
Inventor
李智杰
王启辉
李昌华
张颉
介军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Architecture and Technology
Original Assignee
Xian University of Architecture and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Architecture and Technology filed Critical Xian University of Architecture and Technology
Priority to CN202110528820.8A priority Critical patent/CN113139089A/zh
Publication of CN113139089A publication Critical patent/CN113139089A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种SDDNE模型协同过滤模型的电影推荐方法、系统、介质及设备,包括以下步骤:采集测试所需要的用户电影数据集;将数据集输入深度信念网络进行预处理,将得到的处理数据输入SDDNE模型,通过拉普拉斯特征映射和堆叠降噪自编码器联合进行特征提取,得到用户、电影特征向量;将得到的特征向量进行拼接,得到用户‑电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。本发明通过集成学习将SDDNE模型和协同过滤模型有效的结合在一起,从而可以极大的提高对用户喜欢的电影推荐准确度和稳定性。

Description

SDDNE模型协同过滤模型的电影推荐方法、系统、介质及设备
技术领域
本发明属于电影推荐技术领域,特别涉及一种SDDNE模型协同过滤模型的电影推荐方法、系统、介质及设备。
背景技术
在对现有的电影推荐方法模型研究中,最初的研究者主要使用基于物品和用户的协同过滤(Collaborative Filtering recommendation)推荐方法模型,然而随着用户数量的增加以及所要处理的信息复杂程度的提升,导致了推荐结果准确度逐渐降低。之后研究人员采用了基于内容(Content-Based Recommendations)的推荐方法模型,混合推荐方法模型,以及加入了关联规则、效用和知识的推荐方法模型,但是研究人员所提出的模型在处理目前推荐方法所面临的海量用户数据以及数据之间复杂的结构关系,存在着处理过程缓慢以及无法得到很好的推荐效果的问题。现在的用户在面对网络中海量影视资源,无法很好的选择自己喜欢感兴趣的内容,导致了用户的观影体验非常差,降低了用户对现有电影推荐方法的满意度。
发明内容
为了解决现有技术中存在的问题,本发明提出了一种SDDNE模型协同过滤模型的电影推荐方法、系统、介质及设备,解决目前电影推荐方法在进行电影推荐时运行缓慢、推荐结果准确度较低的问题。
为实现上述目的,本发明采用以下技术方案:
一种SDDNE模型协同过滤模型的电影推荐方法,包括以下步骤:
采集电影推荐中影响因子的用户数据集,包括电影数据、评分数据和用户数据;
对用户数据集中相关影响因素数据通过作为深度置信网络DBN的输入,来进行数据预处理;
将预处理之后的数据输入到SDDNE模型中并进行训练,训练完毕得到用户和电影的特征向量;
将得到的特征向量进行拼接,得到用户-电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。
进一步的,电影数据包括电影ID、电影类型和电影名称;评分数据包括用户ID、电影ID、评分时间以及评分分值;用户数据包括性别、年龄、职业和数量。
进一步的,M表示男性,F表示女性,将标示性别的“F”和“M”转换为1和0;将年龄化为七个年龄分段,七个分段转换为0、1、2、3、4、5、6七个整数;电影类别字段使用一位有效编码,将类别字段转化为整数值,用二进制向量来表示整数值;电影名称与电影类别一样创建将文本转化为字符串之后再转化为数字的字典;将转化后的数据作为深度置信网络DBN的输入,来进行数据预处理。
进一步的,DBN的训练过程包含两个阶段:无监督的预训练和有监督的微调阶段;预训练阶段:采用RBM逐层进行预训练,直接将数据输入到最底层RBM的可见层进行训练,从该层输出的数据直接输入到DBN的输入层,作为下一层的输入;直至完成DBN的预训练;微调阶段:有监督的微调训练要前向传播算法得到输出数据和后向传播算法得到偏置值和权重值。
进一步的,将预处理后的数据的邻接矩阵S作为SDDNE模型的输入,初始化参数θ,将S赋值给X,通过随机映射
Figure BDA0003067334720000021
以污染X中部分单元得到被污染的数据
Figure BDA0003067334720000022
基于
Figure BDA0003067334720000023
和θ,通过如下公式得到Y=YK
Figure BDA0003067334720000024
Figure BDA0003067334720000025
式中:参数集为θ={W,b};W是d×d′的权值矩阵;b是维数d′的偏移向量;
通过解码器使用公式
gθ′(y)=s(W′y+b′)
得到重建后的
Figure BDA0003067334720000026
根据如下公式计算重构误差
Figure BDA0003067334720000031
Lmix=αL2nd+βL1st+νLreg
其中,Lreg为防止过拟合的L2范数正则项;
基于公式
Figure BDA0003067334720000032
使用
Figure BDA0003067334720000033
在整个网络中进行反向传播,得到参数θ(i),更新参数W,b;
重复以上过程直至迭代结束,得到网络表示Y=YK
进一步的,用得到的用户和电影特征向量来拟合用户—电影评分矩阵,计算用户、电影特征之间的相关度simuser-item
首先,构建以喜好、浏览记录、评分、收藏为主的用户—电影评分矩阵,用户集合为包含N个用户的集合U={u1,u2,…,uN},电影集合为包含M个电影的集合I={i1,i2,…,i3}。每一位用户ui∈U都对至少一个电影进行了评价,评价结果以分值形式记录为RNM;所构成的用户-电影评分矩阵为:
Figure BDA0003067334720000034
上式中,行ri表示用户所评价电影集合,列rj表示评价这部电影的用户集合,rij为用户评分;
其次,根据用户-电影评分矩阵利用余弦相似度计算用户之间的相似度,余弦相似度就是将矩阵RNM中的第u、v行认定为向量a和b;用户u、v之间的相似度由向量a和b夹角的余弦值来定义;
Figure BDA0003067334720000035
然后,将用户与其他用户的最近邻居KNN通过用户之间的近似度得到,通过KNN设定的选择阈值选择前N个相似度最高的邻居。
进一步的,协同过滤模型接下来对预测进行输出,首先将前N个相似度最高的邻居喜欢的电影进行筛选,并将剩余的电影集合起来,构成电影候选集,接下来通过加权求和的计算方法对用户和电影进行预测评分;加权求和方法就是通过加权的方法对用户和所有与电影集中电影i的电影的评分进行求和来得到目标用户对电影i预测评分,将排序靠前的前几部电影作为推荐项推荐给用户。
进一步的,一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至7任意一项所述的方法。
进一步的,一种计算设备,包括:一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据上述方法中的任一方法的指令。
与现有技术相比,本发明有以下技术效果:
本发明提供了一种SDDNE模型和协同过滤模型的电影推荐方法,通过将采集的数据集输入SDDNE模型中堆叠的降噪自编码器的第一层中,并使用拉普拉斯特征映射对输入数据进行一阶相似度捕获。第一层降噪自编码器通过一定概率将输入数据中的部分元素置零,将通过编码、解码得到的结果作为第二层降噪自编码器的输入,以此类推,SDDNE模型由三层编码器构成。将SDDNE模型输出的电影和用户结构特征向量作为协同过滤算法的输入,经过计算相关度,排序,筛选,为用户推荐用户可能感兴趣的电影内容。本发明通过集成SDDNE模型和协同过滤推荐模型,从而可以极大的提高电影推荐准确度,并且具有很好的稳定性,有助于用户在海量电影中选择真正感兴趣的电影,有利于提高用户对视频播放软件的满意度。
进一步的,在获取所有相关影响因子的数据集后,由于在获取中可能会存在各种原因,获取到的数据也可能会存在着数据缺失以及传输过程中可能出现偏差,包括实际设备的故障等原因都会导致历史数据中出现数据缺失和数据异常现象。数据的准确率直接影响电影推荐方法模型的准确率,因此需要对相关影响因素数据进行数据预处理,能够提高模型的准确率,本发明采用深度置信网络对数据进行预处理。
进一步的,本发明中采用的模型激活函数为线性整流函数(Rectified LinearUnit,ReLU),相较于sigmoid激活函数容易在两端产生饱和神经元,导致权值无法更新,引起梯度消失现象,使深度学习训练时出现节点间区分度较低的问题。,ReLU运行速度较快,并且由于ReLU是分段线性函数,反向传播和梯度下降速率更高,可以很好的避免梯度消失以及爆炸问题。
进一步的,本发明中SDDNE模型中的堆叠降噪自编码器和拉普拉斯特征映射可以同时保持数据集网络的局部和全局结构特征,从而提高特征提取精度。
进一步的,本发明将SDDNE模型与协同过滤模型结合起来,实现对用户的电影推荐功能,提高了电影推荐的准确度和稳定性。
附图说明
图1为本发明的整体流程逻辑图;
图2为DBN模型结构示意图
图3为SDDNE模型结构示意图;
图4为协同过滤模型推荐过程;
图5为在MSE评价指标中不同数据量时本发明推荐结果精度和DLCF模型推荐结果精度的对比图;
图6为在MSE评价指标中不同数据量时本发明推荐结果精度和GraRep模型推荐结果精度的对比图;
图7为在MSE评价指标中不同数据量时本发明推荐结果精度和MERP模型推荐结果精度的对比图;
图8为在RMSE评价指标中不同数据量时本发明推荐结果精度和DLCF模型推荐结果精度的对比图;
图9为在RMSE评价指标中不同数据量时本发明推荐结果精度和GraRep模型推荐结果精度的对比图;
图10为在RMSE评价指标中不同数据量时本发明推荐结果精度和MERP模型推荐结果精度的对比图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步说明:
如图1所示,图中DLCF、GraRep和MERP为本模型的对比模型,本发明提供一种SDDNE和协同过滤推荐系统的电影推荐方法,包括以下步骤:
S1:电影推荐中影响因子的选取;在实际研究中,电影推荐方法的数据在很大程度上决定了推荐结果的精度,用户的个人信息以及留下的历史行为信息例如:观影记录、收藏、评分等。
具体的,本发明的电影推荐方法所采集的数据集中主要包含了用户、电影、用户评分等数据。其中M表示男性,F表示女性;根据年龄分布将年龄分为1、18、25、35、45、50、56+等七个阶段;数据集中的6000余位用户共包括20种职业。电影数据包含电影ID、电影类型、电影名称等信息,其中电影类型包含动作、冒险、动画、儿童等18种类型。评分数据主要包括了用户ID、电影ID、评分时间以及评分分值。其中用户ID范围为1-6040;电影ID范围是1-3952;评分采用五分制,不包括半星;评分时间精确到秒;每一位用户至少进行20次评分。
S2:在获取所有相关多维复杂指标的数据集后,由于获取的过程中大部分数据为手动输入,所以存在数据错误、缺少、不一致的问题,包括实际设备的故障等原因都会导致历史数据中出现数据缺失和数据异常现象。数据的准确率直接影响电影推荐模型的准确率,因此需要对用户信息及相关影响因素数据进行数据预处理。
如图2所示深度置信网络(DBN)模型,将采集到的数据作为DBN的输入,DBN的训练过程包含两个阶段:无监督的预训练和有监督的微调阶段。预训练阶段:采用RBM逐层进行预训练,直接将数据输入到最底层RBM的可见层进行训练,从该层输出的数据直接输入到DBN的输入层,作为下一层的输入。以此类推,完成DBN的预训练。微调阶段:有监督的微调训练需要前向传播算法得到输出数据和后向传播算法得到偏置值和权重值。DBN模型的分类器是有监督学习的BP神经网络,该神经网络的输入数据是由多层RBM网络学习到的特征信息,可以减少调优是收敛所耗费的时间。
S3:选取SDDNE模型如图3所示,将预处理之后的数据输入到SDDNE模型中并进行训练,训练完毕得到用户和电影的特征向量。其中S3是在整个推荐方法的第一部分中,使用SDDNE模型对初步处理好的高度非线性的数据网络结构进行训练,得到特征向量,从而为第二部分模型训练做准备。
本实例中,步骤S3所选取的SDDNE模型是在现有的SDNE模型中加入了DAE,DAE利用随机函数qD以一定的概率擦除原始数据x中的部分单元,即对原始数据中的一些单元置零得到被污染的数据
Figure BDA0003067334720000071
然后通过编码器fθ将其映射为隐藏表示y,通过解码器gθ′得到重建向量z,通过重构误差LH来衡量自编码器学习效果。SDDNE就是将若干个DAE堆叠在一起,通过指定用于每个单独层的随机损坏进行初始的去噪训练,从而得到有效的特征提取器,深层DAE相对于浅层神经网络在特征提取方面和处理高维数据问题上具有明显的优势。其训练过程首先是对每一个DAE进行训练,得到编码函数
Figure BDA0003067334720000072
作为下一级的DAE的输入,用于训练第二级DAE,得到编码函数
Figure BDA0003067334720000073
通过不断的重复得到输出结果,通过梯度下降来微调整个网络。
本实例中,由DAE构成无监督组件,该组件利用二阶相似性来保持全局结构,利用每个顶点的邻域信息来捕获二阶相似性,通过边描述顶点的邻域结构,并提供每个顶点的邻域结构信息来保持网络的全局结构。由LE捕获网络的一阶相似性来保留网络的局部结构。LE利用节点对的相似性来保持网络的性质,具有相似性的节点在网络嵌入过程,被映射到向量空间中的距离很近,就可以在降维后保持原有的网络结构,如果相似的节点对被映射到向量空间中的距离很远,就给予这对节点更大的罚值。基于这一思想,该方法使用如下目标函数来实现节点对的低维映射:
y=∑i≠j(yi-yj)2Sij=2yTLy
式中,L为网络G的拉普拉斯矩阵,S为网络G的邻接矩阵,L=D-S,D为网络G的对角矩阵,D=∑jSij,Dij值越大,yi的嵌入越重要。最小化目标函数为:
Figure BDA0003067334720000081
S4:选取现有的基于物品的协同过滤模型,如图4所示其推荐过程,将处理后的多维数据集作为模型输入进行训练,计算用户和电影之间的相关度,得到排名前K的电影,进行推荐,其中步骤S4是整个电影推荐方法的第二部分,选用协同过滤模型,将处理后的多维数据集对模型进行训练,得到训练结果。
本实例中,协同过滤模型,需要寻找具有相同的偏好,或者有相同的评论的用户,在用户的集体评价反映中,找出反馈较为突出的用户,以此来对用户感兴趣的内容进行筛选,这样就能够更好的满足用户们的需求。在推荐过程中除推荐用户本身感兴趣的产品还会推荐与用户感兴趣的产品相关的产品,例如当推荐的产品A是用户感兴趣的,同时也会推荐与A产品相似的产品B,用户很大概率喜欢B;对于受到广泛喜爱的大众产品,用户也可能会对受到大众普遍喜爱的产品感兴趣。本发明利用基于物品的协同过滤算法来进行电影个性化推荐,具体步骤:
首先,构建以喜好、浏览记录、评分、收藏等为主的用户—电影评分矩阵,这些信息来源于用户的历史行为。用户集合为包含N个用户的集合U={u1,u2,…,uN},电影集合为包含M个电影的集合I={i1,i2,…,i3}。每一位用户ui∈U都对至少一个电影进行了评价,评价结果以分值形式记录为RNM。所构成的用户-电影评分矩阵为:
Figure BDA0003067334720000091
上式中,行ri表示用户所评价电影集合,列rj表示评价这部电影的用户集合,rij为用户评分。其次,根据用户-电影评分矩阵利用余弦相似度计算用户之间的相似度,余弦相似度就是将矩阵RNM中的第u、v行认定为向量a和b。用户u、v之间的相似度由向量a和b夹角的余弦值来定义。
Figure BDA0003067334720000092
然后,将用户与其他用户的最近邻居KNN通过用户之间的近似度得到,通过KNN设定的选择阈值选择前N个相似度最高的邻居。
S5:协同过滤模型接下来对预测进行输出,首先将步骤S4中得到的前N个相似度最高的邻居喜欢的电影进行筛选,并将剩余的电影集合起来,构成电影候选集,接下来通过加权求和的计算方法对用户和电影进行预测评分。加权求和方法就是通过加权的方法对用户和所有与电影集中电影i的电影的评分进行求和来得到目标用户对电影i预测评分,将排序靠前的前几部电影作为推荐项推荐给用户。
测试过程和如上步骤相同,在对比例中,DLCF、GraRep和MERP为本模型的对比模型,评估指标是评估一个推荐方法是否良好的主要标准,为了更好体现本发明模型的预测精度,选取了均方误差(MSE)、均方根误差(RMSE)两种评估来对模型预测精度进行评估。在S2完成后将处理过的数据开始在DLCF、GraRep和MERP中进行训练,待训练完毕分别得到推荐精度。图5、6、7为在MSE评价指标下本发明推荐结果精度与DLCF、GraRep和MERP模型推荐结果精度的对比图及其结果;图8、9、10为在RMSE评价指标下本发明推荐结果精度与DLCF、GraRep和MERP模型推荐结果精度的对比图及其结果。从中可以看出本发明所采用的方法的推荐精度相对其他模型有了一定提高,预测准确率和稳定性更好,便于对用户进行电影推荐,有助于提高用户对视频软件的满意度,提高用户黏性。
本发明再一个实施例中,提供了一种终端设备,该终端设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于电影推荐的操作,包括:
采集测试所需要的用户电影数据集;
将数据集输入深度信念网络进行预处理,将得到的处理数据输入SDDNE模型,通过拉普拉斯特征映射和堆叠降噪自编码器联合进行特征提取,得到用户、电影特征向量;
将得到的特征向量进行拼接,得到用户-电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。
本发明在一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是终端设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括终端设备中的内置存储介质,当然也可以包括终端设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关电影推荐的相应步骤;计算机可读存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:
采集测试所需要的用户电影数据集;
将数据集输入深度信念网络进行预处理,将得到的处理数据输入SDDNE模型,通过拉普拉斯特征映射和堆叠降噪自编码器联合进行特征提取,得到用户、电影特征向量;
将得到的特征向量进行拼接,得到用户-电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求所述的保护范围为准。

Claims (10)

1.SDDNE模型协同过滤模型的电影推荐方法,其特征在于,包括以下步骤:
采集电影推荐中影响因子的用户数据集,包括电影数据、评分数据和用户数据;
对用户数据集中相关影响因素数据通过作为深度置信网络DBN的输入,来进行数据预处理;
将预处理之后的数据输入到SDDNE模型中并进行训练,训练完毕得到用户和电影的特征向量;
将得到的特征向量进行拼接,得到用户-电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。
2.根据权利要求1所述的一种SDDNE模型协同过滤模型的电影推荐方法,其特征在于,电影数据包括电影ID、电影类型和电影名称;评分数据包括用户ID、电影ID、评分时间以及评分分值;用户数据包括性别、年龄、职业和数量。
3.根据权利要求1所述的一种SDDNE模型协同过滤模型的电影推荐方法,其特征在于,M表示男性,F表示女性,将标示性别的“F”和“M”转换为1和0;将年龄化为七个年龄分段,七个分段转换为0、1、2、3、4、5、6七个整数;电影类别字段使用一位有效编码,将类别字段转化为整数值,用二进制向量来表示整数值;电影名称与电影类别一样创建将文本转化为字符串之后再转化为数字的字典;将转化后的数据作为深度置信网络DBN的输入,来进行数据预处理。
4.根据权利要求3所述的一种SDDNE模型协同过滤模型的电影推荐方法,其特征在于,DBN的训练过程包含两个阶段:无监督的预训练和有监督的微调阶段;预训练阶段:采用RBM逐层进行预训练,直接将数据输入到最底层RBM的可见层进行训练,从该层输出的数据直接输入到DBN的输入层,作为下一层的输入;直至完成DBN的预训练;微调阶段:有监督的微调训练要前向传播算法得到输出数据和后向传播算法得到偏置值和权重值。
5.根据权利要求1所述的一种SDDNE模型协同过滤模型的电影推荐方法,其特征在于,将预处理后的数据的邻接矩阵S作为SDDNE模型的输入,初始化参数θ,将S赋值给X,通过随机映射
Figure FDA0003067334710000021
以污染X中部分单元得到被污染的数据
Figure FDA0003067334710000022
基于
Figure FDA0003067334710000023
和θ,通过如下公式得到Y=YK
Figure FDA0003067334710000024
Figure FDA0003067334710000025
式中:参数集为θ={W,b};W是d×d′的权值矩阵;b是维数d′的偏移向量;
通过解码器使用公式
gθ′(y)=s(W′y+b′)
得到重建后的
Figure FDA0003067334710000026
根据如下公式计算重构误差
Figure FDA0003067334710000027
Lmix=αL2nd+βL1st+νLreg
其中,Lreg为防止过拟合的L2范数正则项;
基于公式
Figure FDA0003067334710000028
使用
Figure FDA0003067334710000029
在整个网络中进行反向传播,得到参数θ(i),更新参数W,b;
重复以上过程直至迭代结束,得到网络表示Y=YK
6.根据权利要求1所述的一种SDDNE模型协同过滤模型的电影推荐方法,其特征在于,用得到的用户和电影特征向量来拟合用户—电影评分矩阵,计算用户、电影特征之间的相关度simuser-item
首先,构建以喜好、浏览记录、评分、收藏为主的用户—电影评分矩阵,用户集合为包含N个用户的集合U={u1,u2,…,uN},电影集合为包含M个电影的集合I={i1,i2,…,i3};每一位用户ui∈U都对至少一个电影进行了评价,评价结果以分值形式记录为RNM;所构成的用户-电影评分矩阵为:
Figure FDA00030673347100000210
上式中,行ri表示用户所评价电影集合,列rj表示评价这部电影的用户集合,rij为用户评分;
其次,根据用户-电影评分矩阵利用余弦相似度计算用户之间的相似度,余弦相似度就是将矩阵RNM中的第u、v行认定为向量a和b;用户u、v之间的相似度由向量a和b夹角的余弦值来定义;
Figure FDA0003067334710000031
然后,将用户与其他用户的最近邻居KNN通过用户之间的近似度得到,通过KNN设定的选择阈值选择前N个相似度最高的邻居。
7.根据权利要求1所述的一种SDDNE模型协同过滤模型的电影推荐方法,其特征在于,协同过滤模型接下来对预测进行输出,首先将前N个相似度最高的邻居喜欢的电影进行筛选,并将剩余的电影集合起来,构成电影候选集,接下来通过加权求和的计算方法对用户和电影进行预测评分;加权求和方法就是通过加权的方法对用户和所有与电影集中电影i的电影的评分进行求和来得到目标用户对电影i预测评分,将排序靠前的前几部电影作为推荐项推荐给用户。
8.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至7任意一项所述的方法。
9.一种计算设备,其特征在于包括:一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据上述方法中的任一方法的指令。
10.一种SDDNE模型协同过滤模型的电影推荐系统,其特征在于,包括:
采集模块,采集电影推荐中影响因子的用户数据集,包括电影数据、评分数据和用户数据;
预处理模块,对用户数据集中相关影响因素数据通过作为深度置信网络DBN的输入,来进行数据预处理;
训练模块,将预处理之后的数据输入到SDDNE模型中并进行训练,训练完毕得到用户和电影的特征向量;
输出模块,将得到的特征向量进行拼接,得到用户-电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。
CN202110528820.8A 2021-05-14 2021-05-14 Sddne模型协同过滤模型的电影推荐方法、系统、介质及设备 Pending CN113139089A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110528820.8A CN113139089A (zh) 2021-05-14 2021-05-14 Sddne模型协同过滤模型的电影推荐方法、系统、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110528820.8A CN113139089A (zh) 2021-05-14 2021-05-14 Sddne模型协同过滤模型的电影推荐方法、系统、介质及设备

Publications (1)

Publication Number Publication Date
CN113139089A true CN113139089A (zh) 2021-07-20

Family

ID=76817182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110528820.8A Pending CN113139089A (zh) 2021-05-14 2021-05-14 Sddne模型协同过滤模型的电影推荐方法、系统、介质及设备

Country Status (1)

Country Link
CN (1) CN113139089A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3168804A1 (en) * 2015-11-12 2017-05-17 Thomson Licensing Apparatus and method for operating a recommender device
KR20170079429A (ko) * 2015-12-30 2017-07-10 성균관대학교산학협력단 사용자 속성을 고려한 클러스터링 기반의 협업 필터링 방법 및 영화 추천 시스템
CN107491540A (zh) * 2017-08-24 2017-12-19 济南浚达信息技术有限公司 一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法
CN109165743A (zh) * 2018-07-17 2019-01-08 东南大学 一种基于深度压缩自编码器的半监督网络表示学习算法
CN109783739A (zh) * 2019-01-23 2019-05-21 北京工业大学 一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法
CN110059220A (zh) * 2019-04-12 2019-07-26 北京工业大学 一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法
CN112256965A (zh) * 2020-10-23 2021-01-22 海南大学 一种基于lambdaMart的神经协同过滤模型推荐方法
CN112287166A (zh) * 2020-09-23 2021-01-29 山东师范大学 一种基于改进深度信念网络的电影推荐方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3168804A1 (en) * 2015-11-12 2017-05-17 Thomson Licensing Apparatus and method for operating a recommender device
KR20170079429A (ko) * 2015-12-30 2017-07-10 성균관대학교산학협력단 사용자 속성을 고려한 클러스터링 기반의 협업 필터링 방법 및 영화 추천 시스템
CN107491540A (zh) * 2017-08-24 2017-12-19 济南浚达信息技术有限公司 一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法
CN109165743A (zh) * 2018-07-17 2019-01-08 东南大学 一种基于深度压缩自编码器的半监督网络表示学习算法
CN109783739A (zh) * 2019-01-23 2019-05-21 北京工业大学 一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法
CN110059220A (zh) * 2019-04-12 2019-07-26 北京工业大学 一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法
CN112287166A (zh) * 2020-09-23 2021-01-29 山东师范大学 一种基于改进深度信念网络的电影推荐方法及系统
CN112256965A (zh) * 2020-10-23 2021-01-22 海南大学 一种基于lambdaMart的神经协同过滤模型推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄德柒;苟刚;: "融合注意力机制与场感知因子分解机的电影推荐", 软件导刊, no. 06, 15 June 2020 (2020-06-15) *

Similar Documents

Publication Publication Date Title
CN110807154B (zh) 一种基于混合深度学习模型的推荐方法与系统
CN108920641B (zh) 一种信息融合个性化推荐方法
CN110674850A (zh) 一种基于注意力机制的图像描述生成方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN109389151B (zh) 一种基于半监督嵌入表示模型的知识图谱处理方法和装置
CN111127146B (zh) 基于卷积神经网络与降噪自编码器的信息推荐方法及系统
CN112464100B (zh) 信息推荐模型训练方法、信息推荐方法、装置及设备
CN112559900B (zh) 产品推荐方法、装置、计算机设备和存储介质
CN112487199A (zh) 一种基于用户购买行为的用户特征预测方法
Zhang et al. Taxonomy-aware collaborative denoising autoencoder for personalized recommendation
CN113051440A (zh) 一种基于超图结构的链路预测方法及系统
CN113761359A (zh) 数据包推荐方法、装置、电子设备和存储介质
CN114020999A (zh) 一种电影社交网络的社区结构检测方法及系统
CN116958320A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN114880538A (zh) 基于自监督的属性图社团检测方法
CN114821299A (zh) 一种遥感图像变化检测方法
CN117058276B (zh) 图像生成方法、装置、设备及存储介质
Sarang Thinking Data Science: A Data Science Practitioner’s Guide
CN112950316A (zh) 基于微调bert模型的电力零售套餐向量表示方法
CN113139088A (zh) Idf模型协同过滤模型的电影推荐方法、介质、设备及系统
CN113139089A (zh) Sddne模型协同过滤模型的电影推荐方法、系统、介质及设备
CN113297385B (zh) 基于改进GraphRNN的多标签文本分类系统及分类方法
CN111310029A (zh) 一种基于用户商品画像和潜在因子特征提取的混合推荐方法
CN113821571B (zh) 基于bert和改进pcnn的食品安全关系抽取方法
CN113111257A (zh) 一种基于协同过滤的融合多源异构信息的推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination