CN107273438B - 一种推荐方法、装置、设备及存储介质 - Google Patents

一种推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN107273438B
CN107273438B CN201710372766.6A CN201710372766A CN107273438B CN 107273438 B CN107273438 B CN 107273438B CN 201710372766 A CN201710372766 A CN 201710372766A CN 107273438 B CN107273438 B CN 107273438B
Authority
CN
China
Prior art keywords
user
article
scored
recommendation
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710372766.6A
Other languages
English (en)
Other versions
CN107273438A (zh
Inventor
傅向华
余冲
李坚强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201710372766.6A priority Critical patent/CN107273438B/zh
Publication of CN107273438A publication Critical patent/CN107273438A/zh
Application granted granted Critical
Publication of CN107273438B publication Critical patent/CN107273438B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用计算机技术领域,提供了一种推荐方法、装置、设备及存储介质,该方法包括:获取用户的历史评分数据、待评分物品以及待评分物品的文本内容,根据用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,计算用户对待评分物品的预测评分,根据预测评分生成推荐列表,并向用户输出推荐列表,从而在向用户推荐物品时结合物品特征和用户特征,有效地提高了推荐的准确率,进而提高了物品的推荐效率。

Description

一种推荐方法、装置、设备及存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种推荐方法、装置、设备及存储介质。
背景技术
随着互联网技术的日新月异,用户的生活方式发生了重大的改变。在信息琳琅满目、竞争激励的互联网时代,如何帮助用户快速准确的挑选出其感兴趣的物品,对一个互联网企业至关重要。基于上述问题,推荐系统技术应运而生。协同过滤技术是推荐系统中使用最广、最受欢迎的一项技术。常用的协同过滤技术有基于最邻近方法和基于模型的方法。基于模型的方法又细分为聚类模型、贝叶斯分类模型、隐因子模型、图模型,其中对于隐因子模型的研究效果最好。
基于隐因子模型的研究可以从物品隐因子和用户隐因子两个方面进行研究。CWang等人提出的协同主题回归模型(Collaborative Topic Regression,简称CTR)利用主题模型(Latent Dirichlet Allocation,简称LDA)从物品内容描述中捕获物品隐因子,并对概率矩阵分解(Probabilistic Matrix Factorization,PMF)模型分解出的物品特征矩阵进行约束,得到了很好的推荐性能。但是CTR存在的一个问题是当物品的描述信息稀疏时,通过LDA学习的物品隐藏特征是不充分有效的。对此,Hao Wang等人提出利用栈式降噪自编码器(Stacked Denoising Autoencoder,简称SDAE)替换LDA从物品内容描述中学习更加丰富有效的物品隐藏特征的深度协同模型(Collaborative Deep Learning,简称CDL),通过深度模型在学习隐藏特征方面的优势,CDL取得了比CTR更好的推荐效果。但是它们都只考虑了物品特征对推荐性能的影响,没有考虑用户特征对推荐的影响。
发明内容
本发明的目的在于提供一种推荐方法及装置,旨在解决现有技术推荐准确率不高,导致推荐效果不好的问题。
一方面,本发明提供了一种推荐方法,所述方法包括下述步骤:
获取用户的历史评分数据、待评分物品以及待评分物品的文本内容,所述历史评分数据包括已评分物品的文本内容;
根据所述用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征;
根据所述用户特征矩阵、所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征,计算所述用户对待评分物品的预测评分;
根据所述预测评分生成推荐列表,并向所述用户输出所述推荐列表。
另一方面,本发明提供了一种推荐装置,所述装置包括:
数据获取单元,用于获取用户的历史评分数据、待评分物品以及待评分物品的文本内容,所述历史评分数据包括已评分物品的文本内容;
模型训练单元,用于根据所述用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征;
评分计算单元,用于根据所述用户特征矩阵、所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征,计算所述用户对待评分物品的预测评分;以及
推荐输出单元,用于根据所述预测评分生成推荐列表,并向所述用户输出所述推荐列表。
另一方面,本发明还提供了一种推荐设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述推荐方法的步骤。
另一方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述推荐方法的步骤。
本发明获取用户的历史评分数据、待评分物品以及待评分物品的文本内容,根据用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵和物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,计算用户对待评分物品的预测评分,根据预测评分生成推荐列表,并向用户输出推荐列表,从而在向用户推荐物品时结合物品特征和用户特征,有效地提高了推荐的准确率,进而提高了物品的推荐效率。
附图说明
图1是本发明实施例一提供的推荐方法的实现流程图;
图2是推荐模型的示意图;
图3是本发明实施例二提供的推荐装置的结构示意图;
图4是本发明实施例二提供的推荐装置的优选结构示意图;以及
图5是本发明实施例三提供的推荐设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的推荐方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,获取用户的历史评分数据、待评分物品以及待评分物品的文本内容。
在本发明实施例中,历史评分数据组成评分矩阵,历史评分数据包括已评分物品的文本内容。获取的已评分物品和待评分物品的文本内容作为预设模型的输入,具体地,如图2所示,图中I表示总共有I个用户,J表示总共有J个物品,Xc∈RJ×S表示J个物品的向量表示集合,Xc为SDAE部分的原始的输入数据,其中物品的向量表示是从所有物品的文本描述信息中,选取S个关键词语组成的一个字典,然后用bag-of-words的向量方式表示每一个物品,Xc的第j行为物品j的向量表示,记为Xc,j*。其中,R∈RI×J表示I个用户对J个物品的评分矩阵,每一个元素Rij表示用户i对物品j的评分,X0∈RJ×S为Xc加入噪声后的表示,
Figure BDA0001303196540000041
表示SDAE中第l层的输出,Kl为第l层的神经单元数,和Xc一样Xl的第j行用Xl,j*表示,L表示SDAE的层数。为了表示方便,用W+表示所有层的权重矩阵和偏置向量的集合。
在步骤S102中,根据用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征。
在本发明实施例中,同时考虑物品特征和用户特征对推荐性能的影响,其中,物品特征用物品的文本内容表示,用户特征用该用户评论过的所有物品的内容描述组成的集合表示。将获取的数据中的物品特征和用户特征数据输入预设的SDAE和预设的PMF模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,从而在推荐过程中自动从物品内容和评分矩阵中获取物品隐藏特征和用户隐藏特征,既考虑物品特征对推荐的影响,又考虑用户特征对推荐的影响。
优选地,在将获取的数据中的物品特征和用户特征数据输入预设的SDAE和预设的PMF模型进行训练时,根据待评分物品的文本内容,对预设的SDAE和预设的PMF模型进行训练,得到物品特征矩阵以及对应的物品隐藏特征,根据历史评分数据中用户的已评分物品的文本内容,对预设的SDAE和预设的PMF模型进行训练,得到用户特征矩阵以及对应的用户隐藏特征,从而将用户评论过的已评分物品的文本内容组成集合当作用户的个人描述信息,增加了推荐参数,进而提高推荐的准确性。
具体地,如图2所示,利用SDAE从用户的文本内容中学习用户特征时,SDAE的中间层XL/2的输出为用户约束参数,利用SDAE从物品的文本内容中学习物品特征时,SDAE的中间层XL/2的输出为物品约束参数,然后将SDAE的中间层XL/2的输出作为SDAE和PMF模型相互连接、相互影响的桥梁,从用户和物品两个方面,分别使用用户约束参数和物品约束参数对PMF模型分解出来的用户特征向量u和物品特征向量v进行约束,使它们都符合以SDAE中间层的输出为均值的正态分布,即使Vi和Ui满足:
Figure BDA0001303196540000051
从而得到用户特征矩阵U和物品特征矩阵V,其中,λw、λn、λu、λs、λv是超参数,图2中的λ’w、λ’n也是超参数,在给定当前所有权重矩阵和偏置向量的集合W+下,ui的更新规则从:ui←(VCiVTuIK)- 1VCiRi变为ui←(VCiVTuIK)-1(VCiRiufe(X0,j*,W+)T),其中,Ci表示预测评分的置信度。
在步骤S103中,根据用户特征矩阵、物品特征矩阵及对应的物品隐藏特征和用户隐藏特征,计算用户对待评分物品的预测评分。
在本发明实施例中,在计算用户对待评分物品的预测评分时,优选地,根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,使用公式Rij≈(ui)Tvj=(fe(X0,i*,W+)Ti)T(fe(X0,j*,W+)Tj)计算用户对待评分物品的预测评分,从而得到用户对待评分物品的预测评分,提高推荐的准确性。其中,fe(·,W+)为编码函数,fe(X0,i*,W+)为以用户i带有噪声的内容向量X0,i*作为输入的编码函数,fe(X0,j*,W+)为以物品j带有噪声的内容向量X0,j*作为输入的编码函数,βi为用户i的隐含偏移量,εj为物品j的隐含偏移量,物品隐藏特征用向量
Figure BDA0001303196540000061
表示,用户隐藏特征用向量
Figure BDA0001303196540000062
表示。
在步骤S104中,根据预测评分生成推荐列表,并向用户输出推荐列表。
在本发明实施例中,在根据预测评分生成推荐列表时,优选地,根据预测评分对待推荐物品进行正序排序,获取排序中的前N个物品,根据获取的N个物品生成推荐列表,将推荐列表中的物品当作系统为用户生成的物品推荐项,然后向用户推荐,从而提高推荐的效率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
实施例二:
图3示出了本发明实施例二提供的推荐装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
数据获取单元31,用于获取用户的历史评分数据、待评分物品以及待评分物品的文本内容,其中,历史评分数据包括已评分物品的文本内容。
模型训练单元32,用于根据获取的数据,使用预设的深度栈式降噪自动编码学习技术和概率矩阵分解技术对预设的双向约束深度协同模型进行训练,得到用户特征矩阵和物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征。
在本发明实施例中,同时考虑物品特征和用户特征对推荐性能的影响,其中,物品特征用物品的文本内容表示,用户特征用该用户评论过的所有物品的内容描述组成的集合表示。模型训练单元将获取的数据中的物品特征和用户特征数据输入预设的SDAE和预设的PMF模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,从而在推荐过程中自动从物品内容和评分矩阵中获取物品隐藏特征和用户隐藏特征,既考虑物品特征对推荐的影响,又考虑用户特征对推荐的影响。
优选地,在将获取的数据中的物品特征和用户特征数据输入预设的SDAE和预设的PMF模型进行训练时,根据待评分物品的文本内容,对预设的SDAE和预设的PMF模型进行训练,得到物品特征矩阵以及对应的物品隐藏特征,根据历史评分数据中用户的已评分物品的文本内容,对预设的SDAE和预设的PMF模型进行训练,得到用户特征矩阵以及对应的用户隐藏特征,从而将用户评论过的已评分物品的文本内容组成集合当作用户的个人描述信息,增加了推荐参数,进而提高推荐的准确性。
具体地,如图2所示,利用SDAE从用户的文本内容中学习用户特征时,SDAE的中间层XL/2的输出为用户约束参数,利用SDAE从物品的文本内容中学习物品特征时,SDAE的中间层XL/2的输出为物品约束参数,然后将SDAE的中间层XL/2的输出作为SDAE和PMF模型相互连接、相互影响的桥梁,从用户和物品两个方面,分别使用用户约束参数和物品约束参数对PMF模型分解出来的用户特征向量u和物品特征向量v进行约束,使它们都符合以SDAE中间层的输出为均值的正态分布,即使Vi和Ui满足:
Figure BDA0001303196540000071
从而得到用户特征矩阵U和物品特征矩阵V,其中,λw、λn、λu、λs、λv是超参数,图2中的λ’w、λ’n也是超参数,在给定当前所有权重矩阵和偏置向量的集合W+下,ui的更新规则从:ui←(VCiVTuIK)- 1VCiRi变为ui←(VCiVTuIK)-1(VCiRiufe(X0,j*,W+)T),其中,Ci表示预测评分的置信度。
评分计算单元33,用于根据用户特征矩阵、物品特征矩阵及对应的物品隐藏特征和用户隐藏特征,计算用户对待评分物品的预测评分。
在本发明实施例中,评分计算单元在计算用户对待评分物品的预测评分时,优选地,根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,使用公式Rij≈(ui)Tvj=(fe(X0,i*,W+)Ti)T(fe(X0,j*,W+)Tj)计算用户对待评分物品的预测评分,从而得到用户对待评分物品的预测评分,提高推荐的准确性。其中,fe(·,W+)为编码函数,fe(X0,i*,W+)为以用户i带有噪声的内容向量X0,i*作为输入的编码函数,fe(X0,j*,W+)为以物品j带有噪声的内容向量X0,j*作为输入的编码函数,βi为用户i的隐含偏移量,εj为物品j的隐含偏移量,物品隐藏特征用向量
Figure BDA0001303196540000081
表示,用户隐藏特征用向量
Figure BDA0001303196540000082
表示。
推荐输出单元34,用于根据预测评分生成推荐列表,并向用户输出推荐列表。
在本发明实施例中,推荐输出单元在根据预测评分生成推荐列表时,优选地,根据预测评分对待推荐物品进行正序排序,获取排序中的前N个物品,根据获取的N个物品生成推荐列表,将推荐列表中的物品当作系统为用户生成的物品推荐项,然后向用户推荐,从而提高推荐的效率。
因此,优选地,如图4所示,该模型训练单元32包括:
第一训练单元421,用于根据待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到物品特征矩阵以及对应的物品隐藏特征;
第二训练单元422,用于根据历史评分数据中用户的已评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵以及对应的用户隐藏特征;
优选地,该评分计算单元33包括:
计算子单元431,用于根据训练得到的用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,使用公式Rij≈(ui)Tvj=(fe(X0,i*,W+)Ti)T(fe(X0,j*,W+)Tj)计算用户对待评分物品的预测评分;
其中,fe(·,W+)为编码函数,fe(X0,i*,W+)为以用户i带有噪声的内容向量X0,i*作为输入的编码函数,fe(X0,j*,W+)为以物品j带有噪声的内容向量X0,j*作为输入的编码函数,βi为用户i的隐含偏移量,εj为物品j的隐含偏移量,vj为物品隐藏特征,
Figure BDA0001303196540000091
ui为用户隐藏特征,
Figure BDA0001303196540000092
优选地,该推荐输出单元34包括:
列表推荐单元441,用于根据预测评分对待推荐物品进行正序排序,获取排序中的前N个物品,根据获取的N个物品生成推荐列表。
在本发明实施例中,推荐装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。
实施例三:
图5示出了本发明实施例三提供的推荐设备的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
本发明实施例的推荐设备5包括处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52。该处理器50执行计算机程序52时实现上述推荐方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,处理器50执行计算机程序52时实现上述各装置实施例中各单元的功能,例如图3所示单元31至34的功能。
在本发明实施例中,该处理器50执行计算机程序52时实现上述各个屏幕唤醒的控制方法实施例中的步骤时,获取用户的历史评分数据、待评分物品以及待评分物品的文本内容,根据用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,计算用户对待评分物品的预测评分,根据预测评分生成推荐列表,并向用户输出推荐列表。该推荐设备5中处理器50在执行计算机程序52时实现的步骤具体可参考实施例一中方法的描述,在此不再赘述。
实施例四:
在本发明实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述各个推荐方法实施例中的步骤,例如,图1所示的步骤S101至S104。或者,该计算机程序被处理器执行时实现上述装置实施例中各单元的功能,例如图3所示单元31至34的功能。
在本发明实施例中,获取用户的历史评分数据、待评分物品以及待评分物品的文本内容,根据用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,根据用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征,计算用户对待评分物品的预测评分,根据预测评分生成推荐列表,并向用户输出推荐列表。该计算机程序被处理器执行时实现的推荐方法进一步可参考前述方法实施例中步骤的描述,在此不再赘述。
本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,ROM/RAM、磁盘、光盘、闪存等存储器。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种推荐方法,其特征在于,所述方法包括下述步骤:
获取用户的历史评分数据、待评分物品以及待评分物品的文本内容,所述历史评分数据包括已评分物品的文本内容;
根据所述用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征;
根据所述用户特征矩阵、所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征,计算所述用户对待评分物品的预测评分;
根据所述预测评分生成推荐列表,并向所述用户输出所述推荐列表;
根据所述用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵和物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征的步骤,包括:
根据所述历史评分数据中所述用户的已评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到所述用户特征矩阵以及所述对应的用户隐藏特征,具体地,在利用预设的栈式降噪自编码器从所述用户的已评分物品的文本内容中学习用户特征时,预设的栈式降噪自编码器的中间层的输出为用户约束参数,使用所述用户约束参数对预设的概率矩阵分解模型分解出来的用户特征向量进行约束,使所述用户特征矩阵符合以预设的栈式降噪自编码器中间层的输出为均值的正态分布。
2.如权利要求1所述的方法,其特征在于,根据所述用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵和物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征的步骤,还包括:
根据所述待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到所述物品特征矩阵以及所述对应的物品隐藏特征。
3.如权利要求1所述的方法,其特征在于,根据所述用户特征矩阵、所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征,计算所述用户对待评分物品的预测评分的步骤,包括:
根据所述用户特征矩阵、所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征,使用公式Rij≈(ui)Tvj=(fe(X0,i*,W+)Ti)T(fe(X0,j*,W+)Tj)计算所述用户对待评分物品的预测评分;
所述fe(·,W+)为编码函数,所述fe(X0,i*,W+)为以用户i带有噪声的内容向量X0,i*作为输入的编码函数,所述fe(X0,j*,W+)为以物品j带有噪声的内容向量X0,j*作为输入的编码函数,所述βi为所述用户i的隐含偏移量,所述εj为所述物品j的隐含偏移量,所述vj为所述物品隐藏特征,
Figure FDA0002788707420000021
所述ui为所述用户隐藏特征,
Figure FDA0002788707420000022
4.如权利要求1所述的方法,其特征在于,根据所述预测评分生成推荐列表的步骤,包括:
根据所述预测评分对所述待评分 物品进行正序排序,获取排序中的前N个物品,根据所述获取的N个物品生成推荐列表。
5.一种推荐装置,其特征在于,所述装置包括:
数据获取单元,用于获取用户的历史评分数据、待评分物品以及待评分物品的文本内容,所述历史评分数据包括已评分物品的文本内容;
模型训练单元,用于根据所用户的历史评分数据、待评分物品以及待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到用户特征矩阵、物品特征矩阵以及对应的物品隐藏特征和用户隐藏特征;
评分计算单元,用于根据所述用户特征矩阵、所述物品特征矩阵及所述对应的物品隐藏特征和用户隐藏特征,计算所述用户对待评分物品的预测评分;以及
推荐输出单元,用于根据所述预测评分生成推荐列表,并向所述用户输出所述推荐列表;
所述模型训练单元包括:
第二训练单元,用于根据所述历史评分数据中所述用户的已评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到所述用户特征矩阵以及所述对应的用户隐藏特征;
所述第二训练单元具体用于在利用预设的栈式降噪自编码器从所述用户的已评分物品的文本内容中学习用户特征时,预设的栈式降噪自编码器的中间层的输出为用户约束参数,使用所述用户约束参数对预设的概率矩阵分解模型分解出来的用户特征向量进行约束,使所述用户特征矩阵符合以预设的栈式降噪自编码器中间层的输出为均值的正态分布。
6.如权利要求5所述的装置,其特征在于,所述模型训练单元还包括:
第一训练单元,用于根据所述待评分物品的文本内容,对预设的栈式降噪自编码器和预设的概率矩阵分解模型进行训练,得到所述物品特征矩阵以及所述对应的物品隐藏特征。
7.如权利要求5所述的装置,其特征在于,所述评分计算单元包括:
计算子单元,用于根据训练得到的所述用户特征矩阵和所述物品特征矩阵以及所述对应的物品隐藏特征和用户隐藏特征,使用公式Rij≈(ui)Tvj=(fe(X0,i*,W+)Ti)T(fe(X0,j*,W+)Tj)计算所述用户对待评分物品的预测评分;
所述fe(·,W+)为编码函数,所述fe(X0,i*,W+)为以用户i带有噪声的内容向量X0,i*作为输入的编码函数,所述fe(X0,j*,W+)为以物品j带有噪声的内容向量X0,j*作为输入的编码函数,所述βi为所述用户i的隐含偏移量,所述εj为所述物品j的隐含偏移量,所述vj为所述物品隐藏特征,
Figure FDA0002788707420000031
所述ui为所述用户隐藏特征,
Figure FDA0002788707420000041
8.如权利要求5所述的装置,其特征在于,所述推荐输出单元包括:
列表推荐单元,用于根据所述预测评分对所述待评分 物品进行正序排序,获取排序中的前N个物品,根据所述获取的N个物品生成推荐列表。
9.一种推荐设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。
CN201710372766.6A 2017-05-24 2017-05-24 一种推荐方法、装置、设备及存储介质 Active CN107273438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710372766.6A CN107273438B (zh) 2017-05-24 2017-05-24 一种推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710372766.6A CN107273438B (zh) 2017-05-24 2017-05-24 一种推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN107273438A CN107273438A (zh) 2017-10-20
CN107273438B true CN107273438B (zh) 2021-02-23

Family

ID=60064172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710372766.6A Active CN107273438B (zh) 2017-05-24 2017-05-24 一种推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN107273438B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191234A (zh) * 2018-08-02 2019-01-11 武汉纺织大学 一种综合服装推荐方法、装置和存储介质

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107943897B (zh) * 2017-11-17 2021-11-26 东北师范大学 一种用户推荐方法
CN107967627A (zh) * 2017-12-05 2018-04-27 北京工业大学 一种基于内容的线性回归理财产品推荐方法
CN108268934A (zh) 2018-01-10 2018-07-10 北京市商汤科技开发有限公司 基于深度学习的推荐方法和装置、电子设备、介质、程序
CN108763314B (zh) * 2018-04-26 2021-01-19 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN108717654B (zh) * 2018-05-17 2022-03-25 南京大学 一种基于聚类特征迁移的多电商交叉推荐方法
CN108711075A (zh) * 2018-05-22 2018-10-26 阿里巴巴集团控股有限公司 一种产品推荐方法和装置
CN108874914B (zh) * 2018-05-29 2021-11-02 吉林大学 一种基于图卷积与神经协同过滤的信息推荐方法
CN108874960A (zh) * 2018-06-06 2018-11-23 电子科技大学 一种在线学习中基于降噪自编码器混合模型的课程视频推荐算法
CN108833173B (zh) * 2018-06-22 2020-10-27 中国科学技术大学 丰富结构信息的深度网络表征方法
CN109360058A (zh) * 2018-10-12 2019-02-19 平安科技(深圳)有限公司 基于信任网络的推送方法、装置、计算机设备及存储介质
CN109241449A (zh) * 2018-10-30 2019-01-18 国信优易数据有限公司 一种物品推荐方法及装置
CN109446430B (zh) * 2018-11-29 2021-10-01 西安电子科技大学 产品推荐的方法、装置、计算机设备及可读存储介质
CN110059220A (zh) * 2019-04-12 2019-07-26 北京工业大学 一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法
CN111931035B (zh) * 2019-05-13 2023-11-24 中国移动通信集团湖北有限公司 业务推荐方法、装置及设备
CN110175895B (zh) * 2019-05-31 2023-04-07 京东方科技集团股份有限公司 一种物品推荐方法及装置
CN110543597B (zh) * 2019-08-30 2022-06-03 北京奇艺世纪科技有限公司 一种评分确定方法、装置及电子设备
CN110598040B (zh) * 2019-09-17 2023-10-10 上海喜马拉雅科技有限公司 专辑召回方法、装置、设备及存储介质
CN110866637B (zh) * 2019-11-06 2022-07-05 湖南大学 评分预测方法、装置、计算机设备和存储介质
CN110929733A (zh) * 2019-12-09 2020-03-27 上海眼控科技股份有限公司 除噪方法、装置、计算机设备、存储介质及模型训练方法
CN111144283A (zh) * 2019-12-25 2020-05-12 辽宁工程技术大学 一种基于人脸识别的智能超市商品推荐系统
CN111259222B (zh) * 2020-01-22 2023-08-22 北京百度网讯科技有限公司 物品推荐方法、系统、电子设备及存储介质
CN111737427B (zh) * 2020-05-11 2024-03-22 华南理工大学 融合论坛互动行为与用户阅读偏好的慕课论坛帖推荐方法
CN111767470A (zh) * 2020-06-30 2020-10-13 山东汇贸电子口岸有限公司 一种物品推荐方法、装置、设备及计算机可读存储介质
CN112016975A (zh) * 2020-09-02 2020-12-01 中国平安财产保险股份有限公司 产品筛选方法、装置、计算机设备及可读存储介质
CN112417289B (zh) * 2020-11-29 2023-04-07 中国科学院电子学研究所苏州研究院 一种基于深度聚类的资讯信息智能推荐方法
CN113268657B (zh) * 2021-04-16 2022-10-28 中国人民解放军战略支援部队信息工程大学 基于评论和物品描述的深度学习推荐方法及系统
CN113239277A (zh) * 2021-06-07 2021-08-10 安徽理工大学 一种基于用户评论的概率矩阵分解推荐方法
CN113688314B (zh) * 2021-08-13 2024-03-19 今彩慧健康科技(苏州)有限公司 一种理疗门店推荐方法及装置
CN113935477B (zh) * 2021-12-17 2022-02-22 深圳佑驾创新科技有限公司 推荐模型的训练方法、推荐方法及计算机可读存储介质
CN114581161B (zh) * 2022-05-06 2022-08-16 深圳市明珞锋科技有限责任公司 一种基于深度学习的信息推送方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996143A (zh) * 2014-05-12 2014-08-20 华东师范大学 一种基于隐式偏见和好友兴趣的电影评分预测方法
CN106294859A (zh) * 2016-08-22 2017-01-04 南京邮电大学盐城大数据研究院有限公司 一种基于属性耦合矩阵分解的项目推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996143A (zh) * 2014-05-12 2014-08-20 华东师范大学 一种基于隐式偏见和好友兴趣的电影评分预测方法
CN106294859A (zh) * 2016-08-22 2017-01-04 南京邮电大学盐城大数据研究院有限公司 一种基于属性耦合矩阵分解的项目推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Collaborative Deep Learning for Recommender Systems;Hao Wang.etc;《Conference: KDD 2015》;20150818;第1-10页 *
基于SDAE 及极限学习机模型的协同过滤应用研究;潘昊等;《计算机应用研究》;20160815;第2332-2335,2375页 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191234A (zh) * 2018-08-02 2019-01-11 武汉纺织大学 一种综合服装推荐方法、装置和存储介质
CN109191234B (zh) * 2018-08-02 2021-11-05 武汉纺织大学 一种综合服装推荐方法、装置和存储介质

Also Published As

Publication number Publication date
CN107273438A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
CN107273438B (zh) 一种推荐方法、装置、设备及存储介质
AU2016256764B2 (en) Semantic natural language vector space for image captioning
CN106776673B (zh) 多媒体文档概括
US9811765B2 (en) Image captioning with weak supervision
GB2547068B (en) Semantic natural language vector space
Chen et al. General functional matrix factorization using gradient boosting
CN107256494B (zh) 一种物品推荐方法及装置
Li et al. Recursive deep learning for sentiment analysis over social data
CN107507073A (zh) 基于信任扩展和列表级排序学习的服务推荐方法
CN106610970A (zh) 基于协同过滤的内容推荐系统与方法
CN110297885B (zh) 实时事件摘要的生成方法、装置、设备及存储介质
CN115455171B (zh) 文本视频的互检索以及模型训练方法、装置、设备及介质
CN111523319B (zh) 基于情景lstm结构网络的微博情感分析方法
CN112699310A (zh) 基于深度神经网络的冷启动跨域混合推荐的方法及系统
CN115618101A (zh) 基于负反馈的流媒体内容推荐方法、装置及电子设备
CN104572915B (zh) 一种基于内容环境增强的用户事件相关度计算方法
US9875443B2 (en) Unified attractiveness prediction framework based on content impact factor
Liphoto et al. A survey on recommender systems
CN114492669B (zh) 关键词推荐模型训练方法、推荐方法和装置、设备、介质
JP2010250496A (ja) 時空間検索装置及び方法及びプログラム
Isa et al. Sentiment classification of Malay newspaper using immune network (SCIN)
CN111079376B (zh) 数据标注方法、装置、介质以及电子设备
CN117391497A (zh) 一种新闻稿件质量主客观评分一致性评价方法及系统
CN113268657B (zh) 基于评论和物品描述的深度学习推荐方法及系统
JP5829471B2 (ja) 意味分析装置およびそのプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant