CN109726331B - 对象偏好预测的方法、装置和计算机可读介质 - Google Patents

对象偏好预测的方法、装置和计算机可读介质 Download PDF

Info

Publication number
CN109726331B
CN109726331B CN201811653933.5A CN201811653933A CN109726331B CN 109726331 B CN109726331 B CN 109726331B CN 201811653933 A CN201811653933 A CN 201811653933A CN 109726331 B CN109726331 B CN 109726331B
Authority
CN
China
Prior art keywords
user
feature representation
level
information
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811653933.5A
Other languages
English (en)
Other versions
CN109726331A (zh
Inventor
刘天乔
刘子韬
杨松帆
黄琰
张邦鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Century TAL Education Technology Co Ltd
Original Assignee
Beijing Century TAL Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Century TAL Education Technology Co Ltd filed Critical Beijing Century TAL Education Technology Co Ltd
Priority to CN201811653933.5A priority Critical patent/CN109726331B/zh
Publication of CN109726331A publication Critical patent/CN109726331A/zh
Priority to PCT/CN2019/125866 priority patent/WO2020135144A1/zh
Priority to US17/419,152 priority patent/US11651255B2/en
Application granted granted Critical
Publication of CN109726331B publication Critical patent/CN109726331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Abstract

本公开的实施例涉及对象偏好预测的方法、装置和计算机可读介质。该方法包括:获取评价信息,评价信息指示用户集中部分用户针对对象集中部分对象的偏好值;获取用户集和对象集中至少一个的辅助信息,辅助信息指示用户集中的相应用户和对象集中的相应对象中的至少一个的属性;基于评价信息和辅助信息,利用矩阵分解模型确定用户特征表示和对象特征表示;以及基于用户特征表示和对象特征表示,确定用户集中的目标用户针对对象集的目标对象的偏好预测值,目标用户对目标对象的偏好值未由评价信息指示。基于这样的方法,可以在推荐过程中考虑针对用户集和对象集中至少一项的辅助信息,从而实现更为精准的推荐。

Description

对象偏好预测的方法、装置和计算机可读介质
技术领域
本公开的实施例涉及人工智能领域,并且更具体地,涉及对象偏好预测的方法、装置和计算机可读介质。
背景技术
随着互联网技术的飞速发展,互联网每天都将产生大量新的内容。用户迫切地希望能够从海量的内容中及时、准确地选择所需要的信息内容。近年来,个性化智能推荐服务(PRS,Personalized Recommender Services)技术发展迅速,其能够基于用户和/或对象的信息来推测用户的偏好,并进而根据用户的兴趣偏好来推荐符合用户兴趣偏好的信息。
一种常见的推荐方式是基于用户对于对象的偏好预测来进行推荐。然而,在这样的推荐过程中往往存在多个用户和多个对象,但仅能够获得部分用户对于部分对象的偏好。因此,如何基于用户对于对象的已有偏好值来更准确地推测用户对于对象的偏好成为了当前关注的焦点。
发明内容
本公开的实施例提供一种用于对象偏好预测的方案。
根据本公开的第一方面,提出了一种对象偏好预测的方法。该方法包括:获取评价信息,评价信息指示用户集中部分用户针对对象集中部分对象的偏好值;获取用户集和对象集中至少一个的辅助信息,辅助信息指示用户集中的相应用户和对象集中的相应对象中的至少一个的属性;基于评价信息和辅助信息,利用矩阵分解模型确定用户特征表示和对象特征表示;以及基于用户特征表示和对象特征表示,确定用户集中的目标用户针对对象集的目标对象的偏好预测值,目标用户对目标对象的偏好值未由评价信息指示。
根据本公开的第二方面,提出了一种用于对象偏好预测的装置。该装置包括:评价信息获取模块,被配置为获取评价信息,评价信息指示用户集中部分用户针对对象集中部分对象的偏好值;辅助信息获取模块,被配置为获取用户集和对象集中至少一个的辅助信息,辅助信息指示用户集中的相应用户和对象集中的相应对象中的至少一个的属性;特征表示确定模块,基于评价信息和辅助信息,利用矩阵分解模型确定用户特征表示和对象特征表示;以及偏好预测确定模块,被配置为基于用户特征表示和对象特征表示,确定用户集中的目标用户针对对象集的目标对象的偏好预测值,目标用户对目标对象的偏好值未由评价信息指示。
在本公开的第三方面,提供了一种计算机可读存储介质。该计算机可读存储介质具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行根据第一方面所描述的方法。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1图示了可以用来实施本公开实施例的环境的示意图;
图2图示了根据本公开实施例的对象偏好预测的方法的流程图;
图3图示了根据本公开实施例的示例辅助信息的示意图;
图4图示了根据本公开的一个实施例的确定用户特征表示的过程的流程图;
图5图示了根据本公开的一个实施例的确定对象特征表示的过程的流程图;
图6图示了根据本公开实施例的示例层级信息的示意图;
图7图示了根据本公开的一个实施例的确定对象特征表示的过程的流程图;
图8图示了根据本公开的一个实施例的确定用户特征表示的过程的流程图;
图9图示了根据本公开的实施例的用于对象偏好预测的装置的示意框图;以及
图10图示了可以用来实施本公开内容的实施例的示例设备的示意性框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
如上文所讨论的,对象偏好评估可以基于用户对于对象的已有偏好值来确定,例如可以根据用户对其他对象的已知偏好和/或其他用户对某些对象的已知偏好来执行估计。在实际应用中,用户通常可以主动提供对于某些对象的评分信息,这样的评分信息反映了用户对于对象的偏好。例如,当用户购买并使用了某些商品后,用户可能会在购物网站上提交对于商品的偏好值。然而,对于推荐系统而言,这样的信息往往是不全面的,从而难以为用户提供全面且准确的对象推荐。例如,当目标用户仅针对多个对象中的特定对象提供了偏好值时,推荐系统难以确定目标用户是否对于其他未评分对象的偏好情况,进而无法给出准确的推荐。
根据本公开的实施例,提供了一种对象偏好预测的方案。在该方案中,获取指示用户集中的部分用户针对对象集中的部分对象的偏好值的评价信息。随后,获取用户集和对象集中至少一个的辅助信息,该辅助信息指示用户集中的相应用户和对象集中的相应对象中的至少一个的属性。随后,基于评价信息和辅助信息,利用矩阵分解模型确定用户特征表示和对象特征表示。然后,基于用户特征表示和对象特征表示,确定用户集中的目标用户针对对象集的目标对象的偏好预测值,其中目标用户对目标对象的偏好值未由评价信息指示。基于这样的方法,可以在推荐过程中考虑针对用户集和对象集中至少一项的辅助信息,并基于这样的辅助信息来更为准确地估计评价信息中未指示的目标用户对于目标对象的偏好值,从而实现更为准确的对象推荐。
图1示出了可以用于实施本公开的方法的环境100的示意图。如图1所示,环境100包括计算设备120,其可以用于实施本公开的多种实现中的对象偏好预测。计算设备120能够接收评价信息110。在一些实施例中,评价信息110可以表示为偏好矩阵。如图1所示,评价信息110可以是用户集中的n个用户(用户1、用户2、……用户n)对于对象集中的m个对象(对象1、对象2、……对象m)的偏好值,即评价信息110被表示为一个n×m的偏好矩阵。在一些实施例中,偏好值可以是用户对于对象的打分值,例如,以5分为满分的1-5分。应当理解,这样的偏好值仅是示例性的,可以采用本领域已知的任何形式的偏好值。
在实际情况中,所获取的评价信息110往往不能够包括用户集中的全部用户对于对象集中的全部对象的偏好值。如图1所示,指示评价信息110的偏好矩阵中部分的取值为空(在图1中以取值为0表示)。例如,用户1对于对象m的偏好值112和用户2对于对象m的偏好值114都为空,即,评价信息110不能够反映用户1和用户2对于对象m的偏好。
计算设备120可以基于评价信息110中所指示的部分用户对于部分对象的偏好值,来预测评价信息110中未指示的目标用户对于目标对象的偏好值。如图1所示,计算设备120可以基于与评价信息110相对应的偏好矩阵中的非空值来预测该矩阵中的空值,即可以预测用户1对于对象m的偏好预测值132和用户2对于对象m的偏好预测值134。在一些实施例中,偏好预测值132和偏好预测值134可以被输入到与评价信息110相对应的偏好矩阵中,从而得到经更新的偏好矩阵,以体现更新后的评价信息130。在一些实施例中,计算设备120进而可以利用更新后的评价信息130来向用户集中的用户推荐对象集中的对象。应当理解,图1示出的评价信息110和更新后的评价信息130及得分矩阵中的具体取值均只是示意性的。
以下将结合图2-图8描述根据本公开实施例的训练神经网络的方案。图2图示了根据本公开实施例的对象偏好预测的方法200的流程图。方法200可以被由图1中的计算设备120实施。以下将结合图1所述的环境100来描述方法200中所涉及的动作。
在框202,计算设备120获取评价信息110,其中评价信息指示用户集中部分用户针对对象集中部分对象的偏好值。在一些实施例中,评价信息110可以表示为偏好矩阵。在图1的示例中,评价信息110可以被表示偏好矩阵R,其中
Figure BDA0001930138000000051
其表示用户集u={u1,u2,…,un}中的多个用户对于对象集v={v1,v2,…,vm}中多个对象的偏好值。具体地,如果用户ui对于对象vj具有偏好值,则R(i,j)>0,并且指示用户ui对于对象vj的偏好值;否则,如果用户ui对于对象vj没有偏好值,则R(i,j)=0。如图1所示,R(1,m)=0,并且R(2,m)=0。
在一些实施例中,计算设备120可以从互联网页面中获取用户集中的用户对于对象集中的对象的评价信息110。例如,互联网购物网站(例如,淘宝、京东和亚马逊等)的页面中存在大量用户对于对象(商品)的偏好值,可以利用本领域公知的技术从这些页面中提取用户对于对象(商品)的偏好值,以确定评价信息110。
在一些实施例中,计算设备120也可以从评论数据库中获取用户集中的用户对于对象集中的对象的评价信息110。例如,评论数据库可以是被集成到计算设备120的一部分。备选地,评论数据库可以是与计算设备120独立的存储装置,计算设备120可以通过有线或无线网络来获取评价信息110。
在一些实施例中,也可以通过向用户集中的用户发送电子调查问卷或者纸质调查问卷以获取用户集中的用户对于对象集中的对象的评价信息。应当理解,获取评价信息110的这些方式都是示例性的,本公开不旨在对于如何获取评价信息110进行限定,可以采用本领域任何合适的方式来获取评价信息110。
在框204,计算设备120获取用户集和对象集中至少一个的辅助信息。辅助信息指示用户集中的相应用户和对象集中的相应对象中的至少一个的属性。根据本公开的实施例,除了所获取的用户集中的用户对于对象集中的对象的偏好的评价信息110,与用户集中的用户相关联的某些属性以及与对象集中的对象相关联的某些属性也能够反映用户与对象之间可能的偏好程度。例如,职业为“程序员”的用户可能比职业为“舞蹈演员”的用户对于对象“机械键盘”更感兴趣。
在一些实施例中,按照所考虑的属性是否能被组织成层级结构,辅助信息可以分为两种类型:层级信息与非层级信息。为了便于理解,图3示出了根据本公开实施例的示例辅助信息300的示意图。如图3所示,以对象集中的一个对象是书本《动物庄园(AnimalFarm)》310为例,针对书本310的辅助信息可以包括关于书本310的不同属性的信息,例如,作者、出版年份、出版语言、和所属类别等。在图3的示例中,书本310的作者属性322(“乔治·奥威尔”)、出版年份属性324(“1945年”)和出版语言属性326(“英文”)之间不存在层级关系,其构成了书本310的非层级信息320。书本310的层级信息330可以包括书本310所属的类别:政治小说338、历史小说336和小说332。如图3所示,书本310的类别被组织成了如层级信息330所示的结构:类别(小说332)-->子类别(历史小说336)-->更详细的类别(政治小说338)。类似地,用户的辅助信息也可以被分类成层级信息(例如,用户所属的社区、用户的出生地等)和非层级信息(例如,用户的年龄、性别、教育水平等)。
在一些实施例中,计算设备120可以从互联网页面中获取针对用户的辅助信息和/或针对对象的辅助信息。以购物网站作为示例,互联网购物网站(例如,淘宝、京东和亚马逊等)可以列出对象(商品)的层级信息和非层级信息。继续图3的示例,例如,可以从亚马逊的页面中的商品介绍部分提取书本31O的非层级信息320。此外,一些互联网购物网站还会列出对象(商品)所属的多个类别,例如,亚马逊的页面给出了书本310属于以下类别:小说332-->历史小说336-->政治小说338。类似地,计算设备120也可以从互联网网站获取用户的层级信息和非层级信息。
在一些实施例中,计算设备120也可以从辅助信息数据库中获取用户的辅助信息和对象的辅助信息。例如,辅助信息数据库可以是被集成到计算设备120的一部分。备选地,辅助信息数据库可以是与计算设备120独立的存储装置,计算设备120可以通过有线或无线网络来获取辅助信息。应当理解,以上关于获取辅助信息的方式仅是示例性的,而不应当理解为是限定性的,可以使用任何合适的方式来获取针对用户集和对象集中的至少一个的辅助信息。
在下文中,针对相应用户的辅助信息中的层级信息和非层级信息分别被称为用户层级信息和用户非层级信息。此外,针对相应对象的辅助信息中的层级信息和非层级信息分别被称为对象层级信息和对象非层级信息。计算设备120所获取的辅助信息可以包括这四类信息中的一个或多个。
继续参考图2,在框206,基于所获取的评价信息110和辅助信息,计算设备120利用矩阵分解模型确定用户特征表示和对象特征表示。在基于协同过滤的推荐系统中,矩阵分解是一种常用的用于获取用户集的特征表示和针对对象集的特征表示的方法。一般而言,加权的矩阵分解的目标函数如下所示:
Figure BDA0001930138000000081
其中,
Figure BDA0001930138000000082
是针对与评价信息110相关联的偏好矩阵R的指示矩阵,其中如果R(i,j)>0,则M(i,j)=1,否则M(i,j)=0。U指示基于矩阵分解获得的针对用户集的用户特征表示,V指示基于矩阵分解获得的针对对象集的对象特征表示,其中
Figure BDA0001930138000000083
并且
Figure BDA0001930138000000084
d表示单个用户特征表示/对象特征表示的特征维度。在等式(1)中,⊙表示Hadamard乘积,入表示权重系数。
在等式(1)所示的目标函数中,矩阵分解仅仅考虑了与评价信息110相对应的偏好矩阵,而没有考虑用户集或者针对对象集的辅助信息,这样的推荐往往是缺乏准确性的。在本公开的实施例中,计算设备120可以结合偏好矩阵以及辅助信息以确定更为准确的推荐信息。以下将结合图4-图8描述根据本公开的实施例的在矩阵分解过程中结合针对用户集和针对对象集的辅助信息的方案。
在一些实施例中,所获取的辅助信息包括用户非层级信息,用户非层级信息指示用户集中的相应用户的非层级属性。图4示出了根据本公开实施例的确定针对用户集的用户特征表示和针对对象集的对象特征表示的方法400的流程图。
在框402,计算设备120初始化用户特征表示以获得当前的用户特征表示。在一些实施例中,计算设备120在求解矩阵分解的目标函数的时候,可以设置针对用户特征表示的初始化值,以作为调整取值的起点。
在框404,计算设备120获取当前的用户特征表示在与用户非层级信息相关联的特征维度上的投影。在一些实施例中,用户非层级信息可以被表示为
Figure BDA0001930138000000085
在矩阵分解的过程中,用户特征表示U(i,:)和非层级信息X(:,i)描述了同一个用户ui,因此在相同的特征空间中,U(i,:)和X(:,i)应当是接近的。基于以上思想,矩阵分解的目标函数可以考虑用户非层级信息X而被变形为:
Figure BDA0001930138000000091
其中,
Figure BDA0001930138000000092
是将用户特征表示U投影到与用户非层级信息X相同特征维度的投影矩阵,γ是对应的权重系数。在矩阵分解过程中,计算设备120需要求解Su以使得用户特征表示U在与用户非层级信息X相同特征维度上的投影SuUT与用户非层级信息X的距离最小。
在框406,计算设备120基于当前的对象特征表示的投影与对象非层级信息之间的差异,调整当前的对象特征表示以获得对象特征表示。在一些实施例中,在求解目标函数(2)的过程中,计算设备120可以采用梯度下降方法以使得经调整的用户特征表示的投影SuUT与用户非层级信息X之间的差异降低,从而使得目标函数(2)的值降低直到满足收敛条件。在一些实施例中,收敛条件可以是目标函数(2)的值小于预定的阈值。在一些实施例中,收敛条件可以是调整超过阈值次数。在一些实施例中,收敛条件也可以是判断调整参数前后目标函数的差异小于预定的阈值。
当确定目标函数(2)满足收敛条件时,计算设备120可以输出对应的用户特征表示U和对象特征表示V。此时,矩阵分解不仅考虑了用户特征表示U和对象特征表示V之间的Hadamard乘积需要与偏好矩阵R足够接近,还考虑了用户特征表示U在相同特征维度上的值应当接近已知的用户非层级信息X。
在一些实施例中,考虑到用户非层级信息X通常较为稀疏,计算设备120可以利用边缘降噪自编码器(MDA)来对用户非层级信息X进行处理。在一些实施例中,计算设备120可以利用单次映射
Figure BDA0001930138000000095
来重构用户非层级信息X=[x1,x2,…,xn],具体地,重构的损失函数可以被表示为:
Figure BDA0001930138000000094
其中
Figure BDA0001930138000000101
表示针对每个用户ui的加噪版本。为了避免特征的随机加扰导致Wu变化过大,计算设备120可以使用k次加扰的方式,因此损失函数(3)可以被更新为:
Figure BDA0001930138000000102
其中
Figure BDA00019301380000001010
表示特征xi在第j次的加扰版本。损失函数(4)也可以按照矩阵形式被表示为:
Figure BDA0001930138000000104
其中
Figure BDA00019301380000001011
并且
Figure BDA00019301380000001012
表示原始特征X的第j次加噪版本。相应地,矩阵分解的目标函数(2)可以被表示为:
Figure BDA0001930138000000108
在目标函数(6)中,计算设备120在矩阵分解过程中进一步引入了自编码信息,从而避免用户非层级特征X过于稀疏的问题,进一步提高了推荐的准确性。
对于框206,附加地或备选地,辅助信息也可以包括对象非层级信息,对象非层级信息指示对象集中的相应对象的非层级属性。图5示出了根据本公开实施例的确定对象特征表示的方法500的流程图。
在框502,计算设备120初始化对象特征表示以获得当前的对象特征表示。在一些实施例中,计算设备120在求解矩阵分解的目标函数的时候,可以设置针对对象特征表示的初始化值,以作为调整取值的起点。
在框504,计算设备获取当前的对象特征表示在与对象非层级信息相关联的特征维度上的投影。在一些实施例中,对象非层级信息可以被表示为
Figure BDA00019301380000001013
在矩阵分解的过程中,用户特征表示V(j,:)和非层级信息Y(:,j)描述了同一个对象vj,因此在相同的特征空间中,V(j,:)和Y(:,j)应当是接近的。基于以上思想,矩阵分解的目标函数可以考虑用户非层级信息X而被变形为:
Figure BDA0001930138000000111
其中,
Figure BDA0001930138000000112
是将对象特征表示V投影到与对象非层级信息Y相同特征维度的投影矩阵,θ是对应的权重系数。在矩阵分解过程中,计算设备120需要求解Sv以使得对象特征表示V在与对象非层级信息Y相同特征维度上的投影SvV与对象非层级信息Y的距离最小。
在框506,计算设备120基于当前的用户特征表示的投影与用户非层级信息之间的差异,调整当前的用户特征表示以获得用户特征表示。在一些实施例中,在求解目标函数(7)的过程中,计算设备120可以采用梯度下降方法以使得经调整的对象特征表示的投影SvV与对象非层级信息Y之间的差异降低,从而使得目标函数(7)的值降低直到满足收敛条件。在一些实施例中,收敛条件可以是目标函数(7)的值小于预定的阈值。在一些实施例中,收敛条件可以是调整超过阈值次数。在一些实施例中,收敛条件也可以是判断调整参数前后目标函数的差异小于预定的阈值。
当确定目标函数(7)满足收敛条件时,计算设备120可以输出对应的用户特征表示U和对象特征表示V。此时,矩阵分解不仅考虑了用户特征表示U和对象特征表示V之间的Hadamard乘积需要与偏好矩阵R足够接近,还考虑了对象特征表示V在相同特征维度上的值应当接近已知的对象非层级信息Y。
在一些实施例中,与针对用户的非层级信息X类似,计算设备130也可以利用边缘降噪自编码器(MDA)来对对象非层级信息Y进行处理,从而避免对象非层级信息Y过于稀疏的问题,进一步提高了推荐的准确性。
在一些实施例中,计算设备120还可以同时考虑用户非层级信息X以及对象非层级信息Y。例如,矩阵分解的目标函数可以进一步被表示为:
Figure BDA0001930138000000121
其中,
Figure BDA00019301380000001210
是针对对象非层级信息Y的映射矩阵,
Figure BDA0001930138000000123
Figure BDA00019301380000001211
并且
Figure BDA00019301380000001212
表示特征Y的第j次加噪版本。
在公式(8)给出的目标函数中,计算设备120需要调整参数以使得同时满足以下条件:(1)用户集的用户特征表示U与对象集的对象特征表示V的Hadamard乘积与偏好矩阵R接近;(2)用户集的特征表示U在用户非层级信息X的特征维度的投影与经自编码处理后的特征表示WuX接近;(3)
Figure BDA0001930138000000127
与经自编码处理后的特征表示WuX接近;(4)对象集的特征表示U在对象非层级信息Y的特征维度的投影与经自编码处理后的特征表示WvY接近;(3)
Figure BDA0001930138000000128
与经自编码处理后的特征表示
Figure BDA00019301380000001213
接近。因此,计算设备120能够确定更为准确的用户特征表示U和对象特征表示V。
在一些实施例中,辅助信息可以附加地或备选地包括对象层级信息。对象层级信息指示对象集中的相应对象的具有层级关系的多个属性,多个属性被构造为多个层级。继续图3的示例,书本310的层级信息330可以指示书本330具有以下属性(小说332、历史小说336和政治小说338)。如图3所示,小说332是个父节点,其具有多个子节点,例如推理小说334和历史小说336。历史小说336进一步是政治小说338的父节点。
在一些实施例中,可以利用树状结构来表示针对对象集的层级信息。例如,图6示出了根据本公开实施例的示例对象层级信息600的示意图。如图6所示,以针对对象集的对象层级信息600作为示例,对象集包括4个对象v1、v2、v3和v4,对象层级信息600包括多个对象层级610、620和630,每个对象层级中包括一个或多个节点。例如,对象层级630指示包括指示对象集中4个对象的节点:v1 632、v2 634、V3 636和v4 638。对象层级620包括指示2个不同类别的节点:v1 v2 622和v3 v4 624,其表示对象v1 632和v2 634都属于类别622,对象v3 636和v4 638都属于类别624(例如,都具有“历史小说”这一属性)。对象层级610包括指示一个类别的节点:v1 v2 v3 v4 612,其表示对象v1 632、v2 634、v3 636和v4 638均属于总类别612(例如,都具有“小说”这一属性)。
在一些实施例中,可以利用矩阵
Figure BDA0001930138000000131
来指示这样的层级关系,其中Tk表示对象层级信息600中的第k层级中的节点和第k+1层级中的节点的父子关系。具体地,Tk(i,j)=1表示第k层中的第i个类别是第k+1层中的第j个类别的子节点。例如,对于图6所示的示例,
Figure BDA0001930138000000132
并且,T2(1,1)=1,T2(2,1)=1。因此,对象层级信息可以被表示为τ={T1,T2,…,Tq},其中假设存在q个对象层级。例如,在图6所示的对象层级信息中,q等于3。
对于辅助信息包括对象层级信息的实施例,以下将结合图7描述根据本公开实施例的确定对象特征表示的过程700的流程图。
在框710,基于对象层级信息,计算设备120确定与多个对象层级相对应的多个对象层级关系特征表示。在一些实施例中,对于对象特征表示
Figure BDA00019301380000001310
为了引入已知的层级信息,V可以被分解为两个矩阵
Figure BDA0001930138000000139
Figure BDA0001930138000000135
以使得V≈V2′V1。假设在第二对象层级中包括m1个节点(或类别),因此对象层级关系特征表示V1指示了第二对象层级中的m1个类别与第一对象层级中的m个对象的父子关系。进一步地,V2′给出了m1个类别的特征表示。类似地,如果对象层级信息包括多余两个对象层级,则V2′可以进一步被分解为V2′≈V3′V2,其中对象层级关系特征表示
Figure BDA0001930138000000136
表示了第二对象层级和第三对象层级中的类别的父子关系。当对象层级信息中包括q个对象层级时,以上过程可以被重复q次,从而可以将对象特征表示V分解为q个对象层级关系特征表示:
V≈Vq…V3V2V1 (9)
其中
Figure BDA00019301380000001311
并且m0=m。因此,求解对象特征表示V的问题可以被转换为如何求解q个对象层级关系特征表示。
具体地,在框712,计算设备120设置多个对象层级关系特征表示的初始化值,以获得当前的多个对象层级关系特征表示的初始化值。在一些实施例中,计算设备120在求解矩阵分解的目标函数的时候,可以设置针对多个对象层级关系特征表示的初始化值,以作为调整取值的起点。
在框714,基于多个对象层级关系特征表示,计算设备120确定与多个对象层级中的第一对象层级相关联的第一对象层级特征表示。例如,对于多个对象层级中的第i对象层级,其对象层级特征表示Vi’可以被表示为Vq…Vi
在框716,基于多个对象层级关系特征表示,计算设备120确定与多个对象层级中的第二对象层级相关联的第二对象层级特征表示,第二对象层级为第一对象层级的子层级。例如,对于多个对象层级中的第i对象层级的下一对象层级:第i-1对象层级,其对象层级特征表示Vi-1’可以被表示为Vq…Vi-1
在框718,基于第二对象层级特征表示和对象层级信息,计算设备120确定与第一对象层级相关联的预测对象层级特征表示。例如,在已知对象层级信息τ={T1,T2,…,Tq}的情况下,可以根据第i-1对象层级的对象层级特征表示Vi-1’来确定针对第i对象层级的预测对象层级特征表示:Vq…Vi-1Qi-1,其中Qk是Tk的归一化表示,其中:
Figure BDA0001930138000000141
在框720,计算设备120基于第一对象层级特征表示和对象预测层级特征表示之间的差异,调整当前的多个对象层级关系特征表示以获得与多个对象层级相对应的多个对象层级关系特征表示。在一些实施例中,为了使得对象特征表示V能够尽可能的符合对象已知的层级信息,计算设备120可以调整多个对象层级关系特征表示Vq、…V3、V2和V1,以使得通过分解所求得的第一对象层级特征表示与基于对象层级信息所确定的预测对象层级特征表示尽可能的接近。在一些实施例中,计算设备120也可以通过使得对于所有多个对象层级的对象层级特征表示的总和与对象预测层级特征表示的总和尽可能的接近。也即,对于对象特征表示V的求解,计算设备120可以加入以下约束,以获得与多个层级相对应的多个对象层级关系特征表示Vq、…V3、V2和V1
Figure BDA0001930138000000151
在一些实施例中,在求解目标函数(11)的过程中,计算设备120可以采用梯度下降方法以使得经调整的第一对象层级特征表示与对象预测层级特征表示之间的差异降低,从而使得目标函数(11)的值降低直到满足收敛条件。在一些实施例中,收敛条件可以是目标函数(11)的值小于预定的阈值。在一些实施例中,收敛条件可以是调整超过阈值次数。在一些实施例中,收敛条件也可以是判断调整参数前后目标函数的差异小于预定的阈值。
在框730,基于多个对象层级关系特征表示,计算设备120确定对象特征表示。如上所讨论的,在确定多个层级关系特征表示Vq、V3、V2和V1后,对象特征表示V可以根据等式(9)而被确定。基于这样的方式,计算设备120在求解用户特征表示U和对象特征表示V时,进一步考虑对象特征表示V应当符合已知的层级信息,从而进一步提高了推荐的准确度。
对于框206,作为一个备选方案或者附加方案,辅助信息可以包括用户层级信息,其中用户层级信息指示用户集中的相应用户的具有层级关系的多个属性,相应用户的多个属性被构造为多个层级。以下将参考图8来描述根据本公开实施例的确定用户特征表示和对象特征表示的过程800。应当理解,过程800与以上结合图7所描述的过程700是类似的
在框81O,基于用户层级信息,计算设备120确定与多个用户层级相对应的多个用户层级关系特征表示。在一些实施例中,与上文针对对象层级信息所描述的过程类似,当用户层级信息包括p个用户层级时,用户特征表示U可以被分解为p个用户层级关系特征表示:
U≈U1U2…Up (12)因此,求解用户特征表示U的问题可以被转换为如何求解p个用户层级关系特征表示。
具体地,在框812,计算设备120设置多个用户层级关系特征表示的初始化值,以获得当前的多个用户层级关系特征表示的初始化值。在一些实施例中,计算设备120在求解矩阵分解的目标函数的时候,可以设置针对多个用户层级关系特征表示的初始化值,以作为调整取值的起点。
在框814,基于多个用户层级关系特征表示,计算设备120确定与多个用户层级中的第一用户层级相关联的第一用户层级特征表示。例如,对于多个用户层级中的第i用户层级,其用户层级特征表示Ui’可以被表示为Ui…Up
在框816,基于多个用户层级关系特征表示,计算设备120确定与多个用户层级中的第二用户层级相关联的第二用户层级特征表示,第四用户层级为第三用户层级的子层级。例如,对于多个用户层级中的第i用户层级的下一用户层级:第i-1用户层级,其用户层级特征表示Ui-1’可以被表示为Ui-1…Up
在框818,基于第二用户层级特征表示和用户层级信息,计算设备120确定与第一用户层级相关联的预测用户层级特征表示。例如,在已知用户层级信息的情况下,可以根据第i-1用户层级的用户层级特征表示Ui-1’来确定针对第i用户层级的预测用户层级特征表示:Pi-1Ui-1…Up,其中Pk是用户层级信息Ck的归一化表示,其中:
Figure BDA0001930138000000161
在框820,计算设备120基于第一对象层级特征表示和对象预测层级特征表示之间的差异,调整多个用户层级关系特征表示以获得与多个用户层级相对应的多个用户层级关系特征表示。在一些实施例中,为了使得用户特征表示U能够尽可能的符合已知的用户层级信息,计算设备120可以调整多个层级关系特征表示Up、…、U2和U1,以使得通过分解所求得的第一用户层级特征表示与基于用户层级信息所确定的预测用户层级特征表示尽可能的接近。在一些实施例中,计算设备120也可以通过使得对于所有多个用户层级的用户层级特征表示的总和与预测用户层级特征表示的总和尽可能的接近。也即,对于用户特征表示U的求解,计算设备120可以加入以下约束,以获得与多个层级相对应的多个用户层级关系特征表示Up、…、U2和U1
Figure BDA0001930138000000171
在一些实施例中,在求解目标函数(14)的过程中,计算设备120可以采用梯度下降方法以使得经调整的第一用户层级特征表示与用户预测层级特征表示之间的差异降低,从而使得目标函数(11)的值降低直到满足收敛条件。在一些实施例中,收敛条件可以是目标函数(11)的值小于预定的阈值。在一些实施例中,收敛条件可以是调整超过阈值次数。在一些实施例中,收敛条件也可以是判断调整参数前后目标函数的差异小于预定的阈值。
在框830,基于多个用户层级关系特征表示,计算设备120确定用户特征表示。如上所讨论的,在确定多个层级关系特征表示Up、…、U2和U1后,用户特征表示U可以根据等式(12)而被确定。基于这样的方式,计算设备120在求解用户特征表示U和用户特征表示V时,进一步考虑用户特征表示U应当符合已知的用户层级信息,从而进一步提高了推荐的准确度。
在一些实施例中,辅助信息可以既包括层级信息又包括非层级信息。在一个具体示例中,当辅助信息包括用户层级信息、用户非层级信息、对象层级信息和对象非层级信息时,基于以上的讨论,矩阵分解模型的目标函数可以被表示为:
Figure BDA0001930138000000181
其中,下和θ分别是针对用户非层级信息和对象非层级信息的权重系数,α和β分别是针对用户层级信息和对象层级信息的权重系数。根据目标函数(15),计算设备120可以利用梯度下降方法确定使得目标函数(15)最小的U1,……,Up、V1,……Vq、Su、Wu、Sv和Wv。基于以上的方法,在利用矩阵分解进行推荐的过程中,计算设备120同时考虑了针对用户集/对象集的层级信息和非层级信息,充分利用了用户/对象自身的各种属性,提高了特征表示的准确性。
以上讨论了如何基于评价信息和辅助信息来确定用户特征表示和对象特征表示。继续参考图2,在框208,基于用户特征表示和对象特征表示,计算设备120确定用户集中的目标用户针对对象集的目标对象的偏好预测值,其中目标用户对目标对象的偏好值未由评价信息指示。在一些实施例中,在通过求解目标函数确定用户特征表示U和对象特征表示V后,计算设备120可以计算U与V之间的矩阵乘积,并基于该矩阵乘积来来确定目标用户对于目标对象的偏好预测值。例如,在图1的示例中,计算设备120可以基于通过特征分解所求的用户特征表示U和对象特征表示V,来确定在评价信息110中未指示的用户1对于对象m和用户2对于对象m的偏好值。例如,偏好预测值132和偏好预测值134可以被填入到原始的偏好矩阵,从而获得经更新的评价信息130,从而获得用户集中的全部用户对于对象集中的全部对象的偏好值。
在一些实施例中,计算设备120可以利用经更新的评价信息130来向目标用户推荐对象集中的对象。在一些实施例中,计算设备120可以向目标用户推荐偏好大于预定阈值的对象。在一些实施例中,计算设备120也可以根据与目标用户相关联的多个对象的偏好来确定偏好排名,并选择偏好排名靠前的对象以进行推荐。应当理解,这样的推荐方式只是示例性的,并不旨在限定本公开的范围。
图9根据本公开的实施例的对象偏好预测的装置900的方框图。装置900可以被包括在图1的计算设备120中或者被实现为计算设备120。如图9所示,装置900包括评价信息获取模块910,被配置为获取评价信息,评价信息指示用户集中部分用户对对象集中部分对象的偏好。装置900还包括辅助信息获取模块920,被配置为获取用户集和对象集的至少一个的辅助信息,辅助信息指示用户集中的相应用户和对象集中的相应对象中的至少一个的属性。装置900还包括特征表示确定模块930,被配置为基于评价信息和辅助信息,利用矩阵分解模型确定用户特征表示和对象特征表示。此外,装置900还包括偏好预测确定模块940,被配置为基于用户特征表示和对象特征表示,确定用户集中的目标用户针对对象集的目标对象的偏好预测值,目标用户对目标对象的偏好值未由评价信息指示。
在一些实施例中,其中辅助信息包括对象非层级信息,对象非层级信息指示对象集的相应对象的非层级属性,并且其中特征表示确定模块930包括:第一初始化模块,被配置为设置对象特征表示的初始化值,以获得当前的对象特征表示;第一投影获取模块,被配置为获取当前的对象特征表示在与对象非层级信息相关联的特征维度上的投影;以及第一调整模块,被配置为基于当前的对象特征表示的投影与对象非层级信息之间的差异,调整当前的对象特征表示以获得对象特征表示。
在一些实施例中,其中辅助信息包括对象层级信息,对象层级信息指示对象集的相应对象的具有层级关系的多个属性,相应对象的多个属性被构造为多个层级,并且其中特征表示确定模块930包括:对象层级关系特征表示确定模块,被配置为基于对象层级信息,确定与多个对象层级相对应的多个对象层级关系特征表示;以及对象特征表示确定模块,被配置为基于多个对象层级关系特征表示,确定对象特征表示。
在一些实施例中,其中对象层级关系特征表示确定模块包括:第二初始化模块,被配置为初始化多个对象层级关系特征表示以获得当前的多个对象层级关系特征表示;第一对象层级特征表示确定模块,被配置为基于当前的多个对象层级关系特征表示,确定与多个层级中的第一对象层级相关联的第一对象层级特征表示;第二对象层级特征表示确定模块,被配置为基于多个对象层级关系特征表示,确定与多个想层级中的第二对象层级相关联的第二对象层级特征表示,第二对象层级为第一对象层级的子层级;预测对象层级表示确定模块,被配置为基于第二对象层级特征表示和对象层级信息,确定与第一对象层级相关联的预测对象层级特征表示;以及第二调整模块,被配置为基于第一对象层级特征表示和对象预测层级特征表示之间的差异,调整当前的多个对象层级关系特征表示以获得与多个对象层级相对应的多个对象层级关系特征表示。
在一些实施例中,其中辅助信息包括用户非层级信息,用户非层级信息指示用户集的相应用户的非层级属性,并且其中特征表示确定模块930包括:第三初始化模块,被配置为初始化用户特征表示以获得当前的用户特征表示;第二投影获取模块,被配置为获取当前的用户特征表示在与用户非层级信息相关联的特征维度上的投影;以及第三调整模块,被配置为基于当前的用户特征表示的投影与用户非层级信息之间的差异,调整当前的用户特征表示以获得用户特征表示。
在一些实施例中,其中辅助信息包括用户层级信息,用户层级信息指示用户集的相应用户的具有层级关系的多个属性,并且其中特征表示确定模块930包括:用户层级关系特征表示确定模块,被配置为基于用户层级信息,确定与多个用户层级相对应的多个用户层级关系特征表示;以及用户特征表示确定模块,被配置为基于多个用户层级关系特征表示,确定用户特征表示。
在一些实施例中,其中用户层级关系特征表示确定模块包括:第四初始化模块,被配置为初始化多个用户层级关系特征表示以获得当前的多个用户层级关系特征表示;第一用户层级特征表示确定模块,被配置为基于多个用户层级关系特征表示,确定与多个用户层级中的第一用户层级相关联的第一用户层级特征表示;第二用户层级特征表示确定模块,被配置为基于多个用户层级关系特征表示,确定与多个用户层级中的第二层级相关联的第二用户层级特征表示,第二用户层级为第一用户层级的子层级;预测用户层级表示确定模块,被配置为基于第二用户层级特征表示和用户层级信息,确定与第一用户层级相关联的预测用户层级特征表示;以及第四调整模块,被配置为基于第一用户层级特征表示和用户预测层级特征表示之间的差异,调整多个用户层级关系特征表示以获得与多个用户层级相对应的多个用户层级关系特征表示。
在一些实施例中,偏好预测模块940还包括:矩阵乘积计算模块,被配置为计算用户特征表示与对象特征表示的矩阵乘积;以及偏好预测值确定模块,被配置为基于矩阵乘积,确定目标用户针对目标对象的偏好预测值。
在一些实施例中,装置900还包括:推荐模块,被配置为基于评价信息和偏好预测值,向目标用户推荐对象集中的对象。
图10示出了可以用来实施本公开内容的实施例的示例设备1000的示意性框图。例如,如图1所示的计算设备120由设备1000来实施。如图所示,设备1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的计算机程序指令或者从存储单元1010加载到随机访问存储器(RAM)1003中的计算机程序指令,来执行各种适当的动作和处理。在RAM 1003中,还可存储设备1000操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
设备1000中的多个部件连接至I/O接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法200、方法400、方法500、方法700和/或方法800,可由处理单元1001执行。例如,在一些实施例中,方法200、方法400、方法500、方法700和/或方法800可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些实施例中,计算机程序的部分或者全部可以经由ROM1002和/或通信单元1007而被载入和/或安装到设备1000上。当计算机程序被加载到RAM 1003并由CPU 1001执行时,可以执行上文描述的方法200、方法400、方法500、方法700和/或方法800的一个或多个动作。
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是--但不限于--电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言-诸如Smalltalk、C++等,以及常规的过程式编程语言一诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络-包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。

Claims (19)

1.一种对象偏好预测的方法,包括:
获取评价信息,所述评价信息指示用户集中部分用户针对对象集中部分对象的偏好值;
获取所述用户集和所述对象集中至少一个的辅助信息,所述辅助信息指示所述用户集中的相应用户和所述对象集中的相应对象中的至少一个的属性;
基于所述评价信息和所述辅助信息,利用矩阵分解模型确定用户特征表示和对象特征表示;以及
基于所述用户特征表示和所述对象特征表示,确定所述用户集中的目标用户针对所述对象集的目标对象的偏好预测值,所述目标用户对所述目标对象的偏好值未由所述评价信息指示,
其中所述辅助信息包括对象非层级信息、对象层级信息、用户非层级信息和用户层级信息中的至少一项,
所述对象非层级信息指示所述对象集的相应对象的非层级属性,所述对象层级信息指示所述对象集中的相应对象的具有层级关系的多个属性,所述用户非层级信息指示所述用户集中的相应用户的非层级属性,所述用户层级信息指示所述用户集中的相应用户的具有层级关系的多个属性。
2.根据权利要求1所述的方法,其中所述辅助信息包括所述对象非层级信息,并且其中确定所述用户特征表示和所述对象特征表示包括:
初始化所述对象特征表示以获得当前的对象特征表示;
获取所述当前的对象特征表示在与所述对象非层级信息相关联的特征维度上的投影;以及
基于所述当前的对象特征表示的所述投影与所述对象非层级信息之间的差异,调整所述当前的对象特征表示以获得所述对象特征表示。
3.根据权利要求1所述的方法,其中所述辅助信息包括所述对象层级信息,所述相应对象的所述多个属性被构造为多个对象层级,并且其中确定所述对象特征表示包括:
基于所述对象层级信息,确定与所述多个对象层级相对应的多个对象层级关系特征表示;以及
基于所述多个对象层级关系特征表示,确定所述对象特征表示。
4.根据权利要求3所述的方法,其中确定与所述多个对象层级相对应的多个对象层级关系特征表示包括:
初始化多个对象层级关系特征表示以获得当前的多个对象层级关系特征表示;
基于当前的所述多个对象层级关系特征表示,确定与所述多个对象层级中的第一对象层级相关联的第一对象层级特征表示;
基于所述多个对象层级关系特征表示,确定与所述多个对象层级中的第二对象层级相关联的第二对象层级特征表示,所述第二对象层级为所述第一对象层级的子层级;
基于所述第二对象层级特征表示和所述对象层级信息,确定与所述第一对象层级相关联的预测对象层级特征表示;以及
基于所述第一对象层级特征表示和所述对象预测层级特征表示之间的差异,调整所述当前的多个对象层级关系特征表示以获得与所述多个对象层级相对应的所述多个对象层级关系特征表示。
5.根据权利要求1所述的方法,其中所述辅助信息包括所述用户非层级信息,并且其中确定所述用户特征表示和所述对象特征表示包括:
初始化所述用户特征表示以获得当前的用户特征表示;
获取当前的用户特征表示在与所述用户非层级信息相关联的特征维度上的投影;以及
基于所述当前的用户特征表示的所述投影与所述用户非层级信息之间的差异,调整所述当前的用户特征表示以获得所述用户特征表示。
6.根据权利要求1所述的方法,其中所述辅助信息包括所述用户层级信息,所述相应用户的多个属性被构造为多个用户层级,并且其中确定所述用户特征表示和所述对象特征表示包括:
基于所述用户层级信息,确定与所述多个用户层级相对应的多个用户层级关系特征表示;以及
基于所述多个用户层级关系特征表示,确定所述用户特征表示。
7.根据权利要求6所述的方法,其中确定与所述多个用户层级相对应的多个用户层级关系特征表示包括:
初始化多个用户层级关系特征表示以获得当前的多个用户层级关系特征表示;
基于当前的所述多个用户层级关系特征表示,确定与所述多个用户层级中的第一用户层级相关联的第一用户层级特征表示;
基于所述多个用户层级关系特征表示,确定与所述多个用户层级中的第二用户层级相关联的第二用户层级特征表示,所述第二用户层级为所述第一用户层级的子层级;
基于所述第二用户层级特征表示和所述用户层级信息,确定与所述第一用户层级相关联的预测用户层级特征表示;以及
基于所述第一用户层级特征表示和所述用户预测层级特征表示之间的差异,调整所述多个用户层级关系特征表示以获得与所述多个用户层级相对应的所述多个用户层级关系特征表示。
8.根据权利要求1所述的方法,其中确定所述用户集中的所述目标用户针对所述对象集的所述目标对象的所述偏好预测值包括:
计算所述用户特征表示与所述对象特征表示的矩阵乘积;以及
基于所述矩阵乘积,确定所述目标用户针对所述目标对象的所述偏好预测值。
9.根据权利要求1所述的方法,还包括:
基于所述评价信息和所述偏好预测值,向所述目标用户推荐所述对象集中的对象。
10.一种用于对象偏好预测的装置,包括:
评价信息获取模块,被配置为获取评价信息,所述评价信息指示用户集中部分用户对对象集中部分对象的偏好;
辅助信息获取模块,被配置为获取所述用户集和所述对象集中至少一个的辅助信息,所述辅助信息指示所述用户集中的相应用户和所述对象集中的相应对象中的至少一个的属性;
特征表示确定模块,被配置为基于所述评价信息和所述辅助信息,利用矩阵分解模型确定用户特征表示和对象特征表示;以及
偏好预测确定模块,被配置为基于所述用户特征表示和所述对象特征表示,确定所述用户集中的目标用户针对所述对象集中目标对象的偏好预测值,所述目标用户对所述目标对象的偏好值未由所述评价信息指示,
其中所述辅助信息包括对象非层级信息、对象层级信息、用户非层级信息和用户层级信息中的至少一项,
所述对象非层级信息指示所述对象集的相应对象的非层级属性,所述对象层级信息指示所述对象集中的相应对象的具有层级关系的多个属性,所述用户非层级信息指示所述用户集中的相应用户的非层级属性,所述用户层级信息指示所述用户集中的相应用户的具有层级关系的多个属性。
11.根据权利要求10所述的装置,其中所述辅助信息包括所述对象非层级信息,并且其中所述特征表示确定模块包括:
第一初始化模块,被配置为初始化所述对象特征表示以获得当前的对象特征表示;
第一投影获取模块,被配置为获取当前的对象特征表示在与所述对象非层级信息相关联的特征维度上的投影;以及
第一调整模块,被配置为基于所述当前的对象特征表示的所述投影与所述对象非层级信息之间的差异,调整所述当前的对象特征表示以获得所述对象特征表示。
12.根据权利要求10所述的装置,其中所述辅助信息包括所述对象层级信息,所述相应对象的所述多个属性被构造为多个层级,并且其中所述特征表示确定模块包括:
对象层级关系特征表示确定模块,被配置为基于所述对象层级信息,确定与所述多个对象层级相对应的多个对象层级关系特征表示;以及
对象特征表示确定模块,被配置为基于所述多个对象层级关系特征表示,确定所述对象特征表示。
13.根据权利要求12所述的装置,其中所述对象层级关系特征表示确定模块包括:
第二初始化模块,被配置为初始化多个对象层级关系特征表示以获得当前的多个对象层级关系特征表示;
第一对象层级特征表示确定模块,被配置为基于当前的所述多个对象层级关系特征表示,确定与所述多个层级中的第一对象层级相关联的第一对象层级特征表示;
第二对象层级特征表示确定模块,被配置为基于所述多个对象层级关系特征表示,确定与所述多个想层级中的第二对象层级相关联的第二对象层级特征表示,所述第二对象层级为所述第一对象层级的子层级;
预测对象层级表示确定模块,被配置为基于所述第二对象层级特征表示和所述对象层级信息,确定与所述第一对象层级相关联的预测对象层级特征表示;以及
第二调整模块,被配置为基于所述第一对象层级特征表示和所述对象预测层级特征表示之间的差异,调整所述当前的多个对象层级关系特征表示以获得与所述多个对象层级相对应的所述多个对象层级关系特征表示。
14.根据权利要求10所述的装置,其中所述辅助信息包括所述用户非层级信息,并且其中所述特征表示确定模块包括:
第三初始化模块,被配置为初始化所述用户特征表示以获得当前的用户特征表示;
第二投影获取模块,被配置为获取当前的用户特征表示在与所述用户非层级信息相关联的特征维度上的投影;以及
第三调整模块,被配置为基于所述当前的用户特征表示的所述投影与所述用户非层级信息之间的差异,调整所述当前的用户特征表示以获得所述用户特征表示。
15.根据权利要求10所述的装置,其中所述辅助信息包括所述用户层级信息,所述相应用户的多个属性被构造为多个用户层级,并且其中所述特征表示确定模块包括:
用户层级关系特征表示确定模块,被配置为基于所述用户层级信息,确定与所述多个用户层级相对应的多个用户层级关系特征表示;以及
用户特征表示确定模块,被配置为基于所述多个用户层级关系特征表示,确定所述用户特征表示。
16.根据权利要求15所述的装置,其中所述用户层级关系特征表示确定模块包括:
第四初始化模块,被配置为初始化多个用户层级关系特征表示以获得当前的多个用户层级关系特征表示;
第一用户层级特征表示确定模块,被配置为基于所述多个用户层级关系特征表示,确定与所述多个用户层级中的第一用户层级相关联的第一用户层级特征表示;
第二用户层级特征表示确定模块,被配置为基于所述多个用户层级关系特征表示,确定与所述多个用户层级中的第二层级相关联的第二用户层级特征表示,所述第二用户层级为所述第一用户层级的子层级;
预测用户层级表示确定模块,被配置为基于所述第二用户层级特征表示和所述用户层级信息,确定与所述第一用户层级相关联的预测用户层级特征表示;以及
第四调整模块,被配置为基于所述第一用户层级特征表示和所述用户预测层级特征表示之间的差异,调整所述多个用户层级关系特征表示以获得与所述多个用户层级相对应的所述多个用户层级关系特征表示。
17.根据权利要求10所述的装置,其中所述偏好预测确定模块包括:
矩阵乘积计算模块,被配置为计算所述用户特征表示与所述对象特征表示的矩阵乘积;以及
偏好预测值确定模块,被配置为基于所述矩阵乘积,确定所述目标用户针对所述目标对象的所述偏好预测值。
18.根据权利要求10所述的装置,还包括:
推荐模块,被配置为基于所述评价信息和所述偏好预测值,向所述目标用户推荐所述对象集中的对象。
19.一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行根据权利要求1-9中任一项所述的方法。
CN201811653933.5A 2018-12-29 2018-12-29 对象偏好预测的方法、装置和计算机可读介质 Active CN109726331B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201811653933.5A CN109726331B (zh) 2018-12-29 2018-12-29 对象偏好预测的方法、装置和计算机可读介质
PCT/CN2019/125866 WO2020135144A1 (zh) 2018-12-29 2019-12-17 对象偏好预测的方法、装置和计算机可读介质
US17/419,152 US11651255B2 (en) 2018-12-29 2019-12-17 Method and apparatus for object preference prediction, and computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811653933.5A CN109726331B (zh) 2018-12-29 2018-12-29 对象偏好预测的方法、装置和计算机可读介质

Publications (2)

Publication Number Publication Date
CN109726331A CN109726331A (zh) 2019-05-07
CN109726331B true CN109726331B (zh) 2021-05-18

Family

ID=66298642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811653933.5A Active CN109726331B (zh) 2018-12-29 2018-12-29 对象偏好预测的方法、装置和计算机可读介质

Country Status (3)

Country Link
US (1) US11651255B2 (zh)
CN (1) CN109726331B (zh)
WO (1) WO2020135144A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726331B (zh) 2018-12-29 2021-05-18 北京世纪好未来教育科技有限公司 对象偏好预测的方法、装置和计算机可读介质
CN112085158A (zh) * 2020-07-21 2020-12-15 西安工程大学 一种基于堆栈降噪自编码器的图书推荐方法
US20230138579A1 (en) * 2021-10-29 2023-05-04 Microsoft Technology Licensing, Llc Anchor-based collaborative filtering

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982107A (zh) * 2012-11-08 2013-03-20 北京航空航天大学 一种融合用户、项目和上下文属性信息的推荐系统优化方法
CN104077351A (zh) * 2014-05-26 2014-10-01 东北师范大学 基于异构信息网络的内容提供方法及系统
CN106294758A (zh) * 2016-09-23 2017-01-04 华南师范大学 基于用户认知度变化的协同推荐方法
CN107016058A (zh) * 2017-03-10 2017-08-04 浙江工业大学 一种基于属性信息偏好自学习的推荐预测方法
CN108665308A (zh) * 2018-05-07 2018-10-16 华东师范大学 评分预测方法和装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080262945A1 (en) * 2007-03-28 2008-10-23 Daniel Carver Clark Ontological subscription and publication system with automatic notification of matching advertisements, products, and services within the ontological system for buyers and sellers
JP5440394B2 (ja) * 2010-05-31 2014-03-12 ソニー株式会社 評価予測装置、評価予測方法、及びプログラム
CN102254028A (zh) * 2011-07-22 2011-11-23 青岛理工大学 一种集成属性和结构相似性的个性化商品推荐方法和系统
US8484208B1 (en) * 2012-02-16 2013-07-09 Oracle International Corporation Displaying results of keyword search over enterprise data
CN103399858B (zh) * 2013-07-01 2016-08-10 吉林大学 基于信任的社会化协同过滤推荐方法
US10127596B1 (en) * 2013-12-10 2018-11-13 Vast.com, Inc. Systems, methods, and devices for generating recommendations of unique items
US10140120B2 (en) * 2015-06-15 2018-11-27 International Business Machines Corporation Context-specific view of a hierarchical data structure
US20170206581A1 (en) * 2016-01-15 2017-07-20 Target Brands, Inc. Product vector for product recommendation
MX2018012578A (es) * 2016-04-15 2019-03-01 Walmart Apollo Llc Sistemas y metodos para proporcionar recomendaciones de productos basadas en contenido.
US20190213522A1 (en) * 2016-06-29 2019-07-11 ITY Labs Corp. System and method for determining user metrics
CN107730289A (zh) 2016-08-11 2018-02-23 株式会社理光 一种用户行为分析方法及用户行为分析装置
JP6751235B2 (ja) * 2016-09-30 2020-09-02 富士通株式会社 機械学習プログラム、機械学習方法、および機械学習装置
US10726466B2 (en) * 2016-11-03 2020-07-28 International Business Machines Corporation System and method for recommending products to bridge gaps between desired and actual personal branding
US20180342004A1 (en) * 2017-05-25 2018-11-29 Microsoft Technology Licensing, Llc Cumulative success-based recommendations for repeat users
CN108416628B (zh) 2018-03-15 2020-07-07 重庆大学 一种融合食物多属性关系的餐厅菜品智能推荐系统
CN109726331B (zh) 2018-12-29 2021-05-18 北京世纪好未来教育科技有限公司 对象偏好预测的方法、装置和计算机可读介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982107A (zh) * 2012-11-08 2013-03-20 北京航空航天大学 一种融合用户、项目和上下文属性信息的推荐系统优化方法
CN104077351A (zh) * 2014-05-26 2014-10-01 东北师范大学 基于异构信息网络的内容提供方法及系统
CN106294758A (zh) * 2016-09-23 2017-01-04 华南师范大学 基于用户认知度变化的协同推荐方法
CN107016058A (zh) * 2017-03-10 2017-08-04 浙江工业大学 一种基于属性信息偏好自学习的推荐预测方法
CN108665308A (zh) * 2018-05-07 2018-10-16 华东师范大学 评分预测方法和装置

Also Published As

Publication number Publication date
CN109726331A (zh) 2019-05-07
US11651255B2 (en) 2023-05-16
US20220044137A1 (en) 2022-02-10
WO2020135144A1 (zh) 2020-07-02

Similar Documents

Publication Publication Date Title
US11651163B2 (en) Multi-turn dialogue response generation with persona modeling
US10936963B2 (en) Systems and methods for content response prediction
JP7160980B2 (ja) 情報提供装置、情報提供方法、およびプログラム
CN111542844A (zh) 信息处理设备、信息处理方法和程序
CN109726331B (zh) 对象偏好预测的方法、装置和计算机可读介质
CN114048331A (zh) 一种基于改进型kgat模型的知识图谱推荐方法及系统
WO2018177145A1 (en) Knowledge network platform
CN111259647A (zh) 基于人工智能的问答文本匹配方法、装置、介质及电子设备
Paleti et al. Approaching the cold-start problem using community detection based alternating least square factorization in recommendation systems
US11531927B2 (en) Categorical data transformation and clustering for machine learning using natural language processing
AU2017235890B2 (en) Recommending software actions to create an image and recommending images to demonstrate the effects of software actions
US11645563B2 (en) Data filtering with fuzzy attribute association
CN114358807A (zh) 基于可预测用户特征属性的用户画像方法及系统
CN111079376B (zh) 数据标注方法、装置、介质以及电子设备
Idrissi et al. A new hybrid-enhanced recommender system for mitigating cold start issues
JP7231322B2 (ja) 学習装置、学習方法、学習プログラム及びプログラム
JP6831719B2 (ja) 情報処理システム、情報処理方法、およびプログラム
CN115344698A (zh) 标签处理方法、装置、计算机设备、存储介质和程序产品
Srifi et al. A concise survey on content recommendations
EP4354382A1 (en) Contextually relevant content sharing in high-dimensional conceptual content mapping
KR102389555B1 (ko) 가중 트리플 지식 그래프를 생성하는 장치, 방법 및 컴퓨터 프로그램
WO2024012219A1 (zh) 一种模型的训练方法的相关装置
US20240013057A1 (en) Information processing method, information processing apparatus, and non-transitory computer-readable storage medium
Zhao et al. Combining influence and sensitivity to factorize matrix for multi-context recommendation
CN115130000A (zh) 一种信息推荐的方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant