CN108109058B - 一种融合人格特质和物品标签的单分类协同过滤方法 - Google Patents
一种融合人格特质和物品标签的单分类协同过滤方法 Download PDFInfo
- Publication number
- CN108109058B CN108109058B CN201810033637.9A CN201810033637A CN108109058B CN 108109058 B CN108109058 B CN 108109058B CN 201810033637 A CN201810033637 A CN 201810033637A CN 108109058 B CN108109058 B CN 108109058B
- Authority
- CN
- China
- Prior art keywords
- user
- article
- item
- preference
- formula
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
Abstract
本发明公开了一种融合人格特质和物品标签的单分类协同过滤方法,包括:首先基于用户人格特质计算用户间的相似度,根据其相似度计算用户对物品的偏好程度;然后基于物品标签计算用户对物品的偏好程度;紧接着融合基于人格的用户对物品的偏好和基于物品标签的用户对物品的偏好得到用户对物品的总偏好程度,利用其总偏好程度构建矩阵分解模型;最后根据模型进行推荐。本发明使用人格特质和物品标签作为额外的信息来识别出缺失数据中混合在一起的正例和负例,从而有效地解决数据稀疏问题和新用户冷启动问题,继而提高个性化推荐的精度。
Description
技术领域
本发明属于电子商务领域,具体地说是一种融合人格特质和物品标签的矩阵分解方法(PTMF)。
背景技术
随着信息技术的发展、信息资源的膨胀以及电子商务的迅速发展,对于用户来说,寻找自己感兴趣的商品信息已经成为一件困难且昂贵的阻碍;对于各大电商企业来说,如何有效提高用户的购买率成为了他们首要考虑的问题。推荐系统通过给用户提供满足用户需求个性化的物品、产品或服务能够很好的客服这个阻碍。协同过滤技术是个性化推荐应用最早也是最为成功的技术之一,它能够很好地基于物品或用户之间的相似性对用户的购买决策提供技术支撑。协同过滤在亚马逊购物网、Netflix电影租赁网站以及lastFM社交音乐网站等得到了扩展和实际的应用。近年来协同过滤的算法在国内外得到了广泛的扩展和研究,按照处理数据的不同主要分为两类:一类是有明确的偏好数据,如评分;另一类则是隐性数据,如点击,购买。这种隐性反馈的数据广泛存在于真实世界的应用场景中,由于不需要用户提供明确的评分,因此比评分等显性数据更容易获取。对于隐性反馈数据,该类数据中仅有正例是可以明确知道的,负例是不确定的,故称这类问题为单分类协同过滤问题。单分类协同过滤的任务就是通过分析这些隐性数据来针对特定用户的偏好进行个性化推荐。以用户听歌的数据为例,这些数据中用户听过的歌曲构成的数据可以解释为正例,其余缺失数据是负例和漏掉的正例的混合。现有的研究虽然为单分类协同过滤问题提供了基础理论支撑和实践指导但仍存在着诸多的问题:
(1)数据稀疏性问题
在实际的场景中,用户真实购买的产品在整个产品的目录中的占比很少。尤其对单分类协同过滤来说,只有用户对产品的正例是可获得的,而不是用户的评分,如表1所示:
表1
因此利用传统的协同过滤,根据这些正例来计算物品或者用户之间的相似度显然是不合理的。而且缺失的数据很多情况下并不是代表用户不喜欢该产品,而是由于某些限制用户无法关注到这些产品,这些潜在的有用信息没有得到有效利用,这会更一步加剧数据稀疏性问题。
(2)新用户冷启动问题
所谓的新用户冷启动问题就是当一个推荐系统面对新来的用户(新注册用户)的时候,由于没有该用户历史的兴趣偏好等行为记录,导致推荐系统无法精准地进行个性化推荐。如表2所示,u5和u6两个用户没有相关的行为记录,因此无法根据传统的协同过滤技术来进行推荐:
表2
发明内容
本发明为了克服现有单分类协同过滤存在的不足之处,提出了一种融合人格特质和物品标签的单分类协同过滤方法,以期使用人格特质和物品标签作为额外的信息来识别出缺失数据中混合在一起的正例和负例数据,从而有效地解决数据稀疏问题和新用户冷启动问题,继而提高个性化推荐的精度。
为了达到上述目的,本发明所采用的技术方案为:
本发明一种融合人格特质和物品标签的单分类协同过滤方法的特点是按照如下步骤进行:
步骤一、用二维表R={u,i}表示用户对物品的行为记录,用二维表P={u,p}表示用户的人格特质数据,用二维表T={i,tag}表示物品的标签数据;其中,u={u1,u2,...,un,...,uN}表示用户集合,un表示第n个用户,n=1,2,…,|N|,|N|表示用户的总数;i={i1,i2,...,im,...,iM}表示物品集合,im表示第m个物品,m=1,2,…,|M|,|M|表示物品的总数;p={p1,p2,...,pn,...,p|N|}表示用户人格特质的信息集合,pn表示第n个用户un的人格特质,并有: 表示第n个用户un的第j个人格特质,j=1,2,…,|J|,|J|表示人格特征的总数;tag={t1,t2,...,tk,...,t|K|}表示物品的标签集合,tk表示第k个标签,|K|表示标签的总数;
步骤二、基于用户人格特质的信息集合p,利用式(1)得到第n个用户un与第s个用户us的相似度sim(un,us),从而得到与第n个用户un相似度最高的前Q个近邻用户:
式(1)中,|·|表示向量长度;
步骤五、融合人格特质和物品标签,利用式(4)得到第n个用户un对第m个物品im的总偏好程度:
式(4)中,δ表示权重系数;
步骤六、基于人格特质和物品标签建模:
步骤6.1、将所述二维表R={u,i}分解为用户隐因子偏好矩阵X={xnf}和物品隐因子偏好矩阵Y={ymf};其中,xnf表示第n个用户un在第f个隐因子维度上的偏好值,ymf表示第m个物品im在第f个隐因子维度上的偏好值;f=1,2,…,F,F表示隐因子数量;
步骤6.2、利用式(5)构建目标函数:
式(5)中,Wn,m表示第n个用户un对第m个物品im的负例置信度,并有:若rn,m=1,则Wn,m=1;若rn,m=0,Wn,m=1-pren,m;
步骤6.3、利用最小交替二乘法对所述目标函数进行优化求解,得到所述用户隐因子偏好矩阵X和物品隐因子偏好矩阵Y的最优值;
步骤七、根据所述用户隐因子偏好矩阵X和物品隐因子偏好矩阵Y的最优值,得到更新后的二维表R*,从而利用所述更新后的二维表R*对任意用户进行物品推荐。
与现有技术相比,本发明的有益效果体现在:
1.本发明对用户对物品的偏好权重矩阵的计算,采用了基于用户人格特质的相似性计算以及利用了物品标签的偏好计算,而不是传统的对于所有的缺失数据赋予统一权重。相比较传统的方法新加入的人格特质和物品标签信息能够准确地识别出缺失数据中的正例和负例,因此该偏好权重计算方法可靠性更高,能够有效地克服数据稀疏这一问题,为已有信息的充分利用提供了解决思路,其推荐精度明显优于传统的矩阵分解方法。同时,人格特质和物品标签信息作为额外的补充信息能够克服冷启动问题。
2.本发明使用了用户人格特质作为额外的用户信息,相比较传统的个性化推荐使用用户基本信息或者用户搜索内容信息等其他一定程度反映用户的偏好信息,人格特质信息能够更好的反映一个用户真实的偏好,对缺失数据的偏好预测提供了可靠真实的支持。而且对于一个新用户,人格特质能够很好的解释具有相同人格特质的用户会偏好相似的物品,通过人格特质信息能够克服现有技术中新用户冷启动的问题。
3.本发明使用了物品标签信息,物品的标签信息代表了物品的属性特征,当一个用户喜欢一个产品的时候,极大的可能性是因为喜欢该产品的某个或某些属性特征,因此物品的标签信息能够很好的代表一个用户对物品属性特征偏好,对缺失数据的偏好预测提供了可靠真实的支持。而且对于一个新的物品,其物品标签能够克服现有技术中新物品冷启动的问题。
4.本发明可用于手机和书籍等实体产品,音乐和电影等数字产品,旅游计划和度假行程等服务产品的个性化推荐系统,可以在网页和APP等平台同时使用,以期提高商家和消费者的双向经济效益及整体满意度。
附图说明
图1为本发明的流程示意图。
具体实施方式
本实施例中,如图1所示,一种融合人格特质和物品标签的单分类协同过滤方法是按照如下步骤进行:
步骤一、用二维表R={u,i}表示用户对物品的行为记录,用二维表P={u,p}表示用户的人格特质数据,用二维表T={i,tag}表示物品的标签数据;其中,u={u1,u2,...,un,...,u|N|}表示用户集合,un表示第n个用户,n=1,2,…,|N|,|N|表示用户的总数;i={i1,i2,...,im,...,i|M|}表示物品集合,im表示第m个物品,m=1,2,…,|M|,|M|表示物品的总数;p={p1,p2,...,pn,...,p|N|}表示用户人格特质的信息集合,pn表示第n个用户un的人格特质,并有: 表示第n个用户un的第j个人格特质,j=1,2,…,|J|,|J|表示人格特质的总数,这里的人格特质的描述类型有很多的,常用的是大五人格特质,大五人格特质将用户的人格划分为五个维度,分别是开放性人格、严谨性人格、外向性人格、宜人性人格和神经质性人格,每个人格维度上会有一个1-5的分数值以代表用户在每个人格维度上的偏向程度;tag={t1,t2,...,tk,...,t|K|}表示物品的标签集合,tk表示第k个标签,|K|表示标签的总数,这里的物品标签一般指的是物品的属性特征,如电影的标签包括:导演、演员、电影流派、国家等;
步骤二、基于用户人格特质的信息集合p,利用式(1)得到第n个用户un与第s个用户us的相似度sim(un,us),然后根据用户之间的相似度大小降序排列选取列表前Q个近邻用户,从而得到与第n个用户un相似度最高的前Q个近邻用户:
式(1)中,|·|表示向量长度;传统的用户间的相似度度量利用的是用户物品行为矩阵,但是在单分类协同过滤中,用户物品行为矩阵中的数据十分稀疏,这样计算出来的用户间的相似度不精确,利用用户的人格特质信息作为用户的额外信息来计算用户间的相似度不会有数据稀疏问题的影响,计算出来的用户间的相似度更加准确。
式(2)中,表示第n个用户un的第k个标签的数量,sum(tagn)表示第n个用户un的总的标签数量,这里基于的一个假设是:物品标签作为物品的属性特质,用户对物品的偏好程度是受到物品的属性特征影响的,用户喜欢一个物品极大可能是因为物品的某些特定属性,这些属性也反映了用户的物品属性偏好,因此通过标签信息来计算用户对物品的偏好更加准确;
式(3)中,表示与第n个用户un相似度最高的前Q个近邻用户中第q个近邻用户,rq,m表示第q个近邻用户对第m个物品im的行为记录,若有过行为记录,则令rq,m=1,否则,令rq,m=0;当用户物品的交互行为是评分的时候,这里的rq,m同样可以用来代替评分数据,因此本发明提出的方法也同样适用于传统的协同过滤问题;
步骤五、融合人格特质和物品标签,通过人格特质信息得到的第n个用户un对第m个物品im的偏好程度和通过物品标签得到的第n个用户un对第m个物品im的偏好程度赋予不同的权重系数以代表人格特质和物品标签分别对第n个用户un对第m个物品im的偏好程度pren,m的不同影响,利用式(4)得到第n个用户un对第m个物品im的总偏好程度:
式(4)中,δ表示权重系数;
步骤六、基于人格特质和物品标签得到的用户对物品的偏好程度建模:
步骤6.1、将所述二维表R={u,i}分解为用户隐因子偏好矩阵X={xnf}和物品隐因子偏好矩阵Y={ymf};其中,xnf表示第n个用户un在第f个隐因子维度上的偏好值,ymf表示第m个物品im在第f个隐因子维度上的偏好值;f=1,2,…,F,F表示隐因子数量;
步骤6.2、利用式(5)构建目标函数:
式(5)中,λ是正则化系数,||·||2是L2正则化项,Wn,m表示第n个用户un对第m个物品im的负例置信度,并有:若rn,m=1,则Wn,m=1;若rn,m=0,Wn,m=1-pren,m,这里Wn,m=1-pren,m负例置信度设置基于的假设是:用户对物品的偏好程度越高,那么该例为负例的可能性越小;
步骤6.3、利用最小交替二乘法对所述目标函数进行优化求解,可以得到用户隐因子偏好矩阵X和物品隐因子偏好矩阵Y的迭代公式如下:
对式(6)和式(7)使用随机梯度下降法进行迭代求解,其过程如下:首先设置隐因子数量F,初始化用户隐因子矩阵,物品隐因子矩阵和正则化系数;然后交替对xnf和ymf进行迭代直到收敛;最后得到所述用户隐因子偏好矩阵X和物品隐因子偏好矩阵Y的最优值;
步骤七、根据所述用户隐因子偏好矩阵X和物品隐因子偏好矩阵Y的最优值,得到更新后的二维表R*,从而利用所述更新后的二维表R*对任意用户进行物品推荐。
Claims (1)
1.一种融合人格特质和物品标签的单分类协同过滤方法,其特征是按照如下步骤进行:
步骤一、用二维表R={u,i}表示用户对物品的行为记录,用二维表P={u,p}表示用户的人格特质数据,用二维表T={i,tag}表示物品的标签数据;其中,u={u1,u2,...,un,...,u|N|}表示用户集合,un表示第n个用户,n=1,2,…,|N|,|N|表示用户的总数;i={i1,i2,...,im,...,i|M|}表示物品集合,im表示第m个物品,m=1,2,…,|M|,|M|表示物品的总数;p={p1,p2,...,pn,...,p|N|}表示用户人格特质的信息集合,pn表示第n个用户un的人格特质,并有: 表示第n个用户un的第j个人格特质,j=1,2,…,|J|,|J|表示人格特征的总数;tag={t1,t2,...,tk,...,t|K|}表示物品的标签集合,tk表示第k个标签,|K|表示标签的总数;
步骤二、基于用户人格特质的信息集合p,利用式(1)得到第n个用户un与第s个用户us的相似度sim(un,us),从而得到与第n个用户un相似度最高的前Q个近邻用户:
式(1)中,|·|表示向量长度;
步骤五、融合人格特质和物品标签,利用式(4)得到第n个用户un对第m个物品im的总偏好程度:
式(4)中,δ表示权重系数;
步骤六、基于人格特质和物品标签建模:
步骤6.1、将所述二维表R={u,i}分解为用户隐因子偏好矩阵X={xnf}和物品隐因子偏好矩阵Y={ymf};其中,xnf表示第n个用户un在第f个隐因子维度上的偏好值,ymf表示第m个物品im在第f个隐因子维度上的偏好值;f=1,2,…,F,F表示隐因子数量;
步骤6.2、利用式(5)构建目标函数:
式(5)中,Wn,m表示第n个用户un对第m个物品im的负例置信度,并有:若rn,m=1,则Wn,m=1;若rn,m=0,Wn,m=1-pren,m;
步骤6.3、利用最小交替二乘法对所述目标函数进行优化求解,得到所述用户隐因子偏好矩阵X和物品隐因子偏好矩阵Y的最优值;
步骤七、根据所述用户隐因子偏好矩阵X和物品隐因子偏好矩阵Y的最优值,得到更新后的二维表R*,从而利用所述更新后的二维表R*对任意用户进行物品推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810033637.9A CN108109058B (zh) | 2018-01-11 | 2018-01-11 | 一种融合人格特质和物品标签的单分类协同过滤方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810033637.9A CN108109058B (zh) | 2018-01-11 | 2018-01-11 | 一种融合人格特质和物品标签的单分类协同过滤方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108109058A CN108109058A (zh) | 2018-06-01 |
CN108109058B true CN108109058B (zh) | 2021-06-29 |
Family
ID=62218967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810033637.9A Active CN108109058B (zh) | 2018-01-11 | 2018-01-11 | 一种融合人格特质和物品标签的单分类协同过滤方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108109058B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108874998B (zh) * | 2018-06-14 | 2021-10-19 | 华东师范大学 | 一种基于混合特征向量表示的对话式音乐推荐方法 |
CN110413880B (zh) * | 2019-07-10 | 2021-09-14 | 合肥工业大学 | 基于用户人格分层结构的单分类协同过滤方法 |
CN111310028A (zh) * | 2020-01-19 | 2020-06-19 | 浙江连信科技有限公司 | 基于心理化特征的推荐方法及装置 |
CN111667096B (zh) * | 2020-05-12 | 2023-03-28 | 汕头大学 | 一种人格特质引导的新用户行为反馈预测方法 |
CN112770181A (zh) * | 2021-01-12 | 2021-05-07 | 贵州省广播电视信息网络股份有限公司 | 一种针对家庭组的推荐内容快速验证系统及其方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609523A (zh) * | 2012-02-10 | 2012-07-25 | 上海视畅信息科技有限公司 | 基于物品分类和用户分类的协同过滤推荐算法 |
CN103309976A (zh) * | 2013-06-13 | 2013-09-18 | 华东师范大学 | 一种基于用户性格提高社交引荐效率的方法 |
CN106651524A (zh) * | 2016-12-27 | 2017-05-10 | 杭州火小二科技有限公司 | 一种智能生成推荐菜单的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050033722A1 (en) * | 2003-08-08 | 2005-02-10 | International Business Machines Corporation | Personality switch hard drive shim |
-
2018
- 2018-01-11 CN CN201810033637.9A patent/CN108109058B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609523A (zh) * | 2012-02-10 | 2012-07-25 | 上海视畅信息科技有限公司 | 基于物品分类和用户分类的协同过滤推荐算法 |
CN103309976A (zh) * | 2013-06-13 | 2013-09-18 | 华东师范大学 | 一种基于用户性格提高社交引荐效率的方法 |
CN106651524A (zh) * | 2016-12-27 | 2017-05-10 | 杭州火小二科技有限公司 | 一种智能生成推荐菜单的方法 |
Non-Patent Citations (1)
Title |
---|
融合人格信息的单分类协同过滤方法研究;孙见山;《第十二届中国管理学年会论文集》;20171028;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108109058A (zh) | 2018-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108109058B (zh) | 一种融合人格特质和物品标签的单分类协同过滤方法 | |
CN108121737B (zh) | 一种业务对象属性标识的生成方法、装置和系统 | |
CN107833117B (zh) | 一种考虑标签信息的贝叶斯个性化排序推荐方法 | |
Panniello et al. | Incorporating context into recommender systems: an empirical comparison of context-based approaches | |
CN106600302A (zh) | 基于Hadoop的商品推荐系统 | |
CN103886487A (zh) | 基于分布式的b2b平台的个性化推荐方法与系统 | |
JP2014508333A (ja) | ウェブサイト横断情報を表示する方法およびシステム | |
CN111161021B (zh) | 基于实时特征的推荐商品的快速二次排序方法 | |
CN103559622A (zh) | 基于特征的协同过滤推荐方法 | |
Madadipouya et al. | A literature review on recommender systems algorithms, techniques and evaluations | |
CN111310038B (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
US11663661B2 (en) | Apparatus and method for training a similarity model used to predict similarity between items | |
CN105023178B (zh) | 一种基于本体的电子商务推荐方法 | |
CN104615721B (zh) | 用于基于退货关联信息推荐商品的方法和系统 | |
CN109584003A (zh) | 智能推荐系统 | |
CN111104606B (zh) | 一种基于权重的条件游走图推荐方法 | |
Prasetyo | Searching cheapest product on three different e-commerce using k-means algorithm | |
CN113269232B (zh) | 模型训练方法、向量化召回方法、相关设备及存储介质 | |
CN110020918B (zh) | 一种推荐信息生成方法和系统 | |
Wu et al. | Using the mathematical model on precision marketing with online transaction data computing | |
WO2017095371A1 (en) | Product recommendations based on selected user and product attributes | |
Wang et al. | Integrating collaborative filtering and association rule mining for market basket recommendation | |
CN114943543A (zh) | 模型训练方法、异常商品识别方法、电子设备及存储介质 | |
Mohan et al. | Recommendation system in business intelligence solutions for grocery shops: Challenges and perspective | |
Schwartz et al. | Style similarity as feedback for product design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |