CN110020118B - 一种计算用户之间相似度的方法及装置 - Google Patents

一种计算用户之间相似度的方法及装置 Download PDF

Info

Publication number
CN110020118B
CN110020118B CN201710909747.2A CN201710909747A CN110020118B CN 110020118 B CN110020118 B CN 110020118B CN 201710909747 A CN201710909747 A CN 201710909747A CN 110020118 B CN110020118 B CN 110020118B
Authority
CN
China
Prior art keywords
attention
context
context information
calculating
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710909747.2A
Other languages
English (en)
Other versions
CN110020118A (zh
Inventor
陈磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710909747.2A priority Critical patent/CN110020118B/zh
Publication of CN110020118A publication Critical patent/CN110020118A/zh
Application granted granted Critical
Publication of CN110020118B publication Critical patent/CN110020118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种计算用户之间相似度的方法,所述方法包括:获取M个用户各自对应的历史关注信息以及所述历史关注信息对应的上下文信息,其中,M为大于或者等于2的整数;根据所述历史关注信息以及所述历史关注信息对应的上下文信息计算用户之间的相似度。如此,由于是通过历史关注信息和上下文信息这两类信息来计算不用用户之间的相似度的,能够精确计算用户之间的相似度。本发明实施例同时还公开了一种计算用户之间相似度的装置。

Description

一种计算用户之间相似度的方法及装置
技术领域
本发明涉及信息技术领域,尤其涉及一种计算用户之间相似度的方法及装置。
背景技术
随着信息化的发展以及计算机技术和互联网技术的普及,产品数量与日俱增,在面对海量的产品,如商品、音频、视频、电子券、社交网络信息时,人们往往很难及时发现自己最喜欢或最合适的产品。因此,为了缩短用户寻找所需产品的时间,经常需要网站通过推荐系统向用户推荐用户可能感兴趣的各种产品。
目前,推荐系统往往会通过分析不同用户对于相同产品的关注度,来计算用户之间的相似度,如,利用用户的历史评分信息来计算用户之间的相似度;然后基于用户之间的相似度,为有着相似偏好的用户推荐相似的产品。
在执行上述用户之间的相似度获取的过程中,发明人发现现有技术中至少存在如下问题:现有的用户之间的相似度的计算方式只利用了用户的历史评分信息,仅通过一种信息确定用户之间的相似度,使得获取的用户之间的相似度不够准确。
发明内容
有鉴于此,本发明实施例提供一种计算用户之间相似度的方法及装置,主要目的在于通过多种信息来计算用户相似度,能够有效提高所获取的用户之间的相似度的准确性。
为达到上述目的,本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供一种计算用户之间相似度的方法,所述方法包括:获取M个用户各自对应的历史关注信息以及所述历史关注信息对应的上下文信息,其中,M为大于或者等于2的整数;根据所述历史关注信息以及所述历史关注信息对应的上下文信息计算用户之间的相似度。
第二方面,本发明实施例提供一种计算用户之间相似度的装置,所述装置包括:获取单元以及计算单元,其中,所述获取单元,用于获取M个用户各自对应的历史关注信息以及所述历史关注信息对应的上下文信息,其中,M为大于或者等于2的整数;所述计算单元,用于根据所述历史关注信息以及所述历史关注信息对应的上下文信息计算用户之间的相似度。
第三方面,本发明实施例提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述计算用户之间相似度的方法。
第四方面,本发明实施例提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述计算用户之间相似度的方法。
本发明实施例提供的一种计算用户之间相似度的方法及装置,在获取到M个用户各自对应的历史关注信息以及所述历史关注信息对应的上下文信息后,就会根据所述历史关注信息以及所述历史关注信息对应的上下文信息,来计算用户之间的相似度。这样,由于是通过历史关注信息和上下文信息这两类信息来计算不用用户之间的相似度的,丰富了计算用户间相似度所采用的数据种类,提高了计算用户之间的相似度的准确性。那么,将该用户之间的相似度获取方法用于推荐系统中时,由于通过提高用户之间相似度的计算准确度能够做出更符合用户偏好的推荐,从而,能够提高推荐效果,提高网站的转化率,同时为用户带来更好的体验。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1-1示出了本发明实施例一中的计算用户之间相似度的方法的一种流程示意图;
图1-2示出了本发明实施例一中的计算用户之间相似度的方法的另一种流程示意图;
图2示出了本发明实施例二中的评分信息与上下文信息空间示意图;
图3示出了本发明实施例三中的计算用户之间相似度的装置的结构示意图;
图4示出了本发明实施例四中的计算用户之间相似度的设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实施例一
随着信息化的发展以及计算机技术和互联网技术的普及,人们可以便利地通过互联网来获取各种各样的业务对象,如通过电子商务平台在网络上购买商品、通过视频网站观看电影、电视剧等视频等,但是互联网上的的业务对象的数量与日俱增,在面对海量的业务对象,如商品、音频、视频、电子券、书籍、广告、公众号等时,人们往往很难快速发现自己最喜欢或最合适的业务对象。因此,为了缩短用户寻找所需业务对象的时间,就需要各个互联网平台通过推荐系统为有着相似偏好的用户推荐相似的业务对象。那么,为了准确地计算不同用户之间的相似度,以便确定不同用户的偏好是否相似,本发明实施例提供一种计算方法。
在实际应用中,该计算方法可以应用于各种需要计算不同用户之间的相似度的场合,如电子商务平台中的推荐系统向用户推荐商品、社交网络平台中的推荐系统向用户推荐公众号和广告、个性化阅读平台向用户推荐书籍、网络资源等、团购平台中的推荐系统向用户推荐优惠券、电子电影票、用餐券等虚拟资源。
图1-1为本发明实施例一中的计算用户之间相似度的方法的一种流程示意图,参见图1-1所示,该计算用户之间相似度的方法包括:
S101:获取M个用户各自对应的历史关注信息以及历史关注信息对应的上下文信息;
其中,M为大于或者等于2的整数。
在实施过程中,在需要计算不同用户之间的相似度时,可以从推荐系统所处的网络应用平台所对应的数据库中,分别获取预设时间段内M个用户各自对应的关注信息,这样,就获得了该M个用户各自对应的历史操作数据。
这里,历史关注信息是指用户登录网络应用平台后,对该网络应用平台所提供的业务对象进行各种操作所产生的数据。
示例性地,历史关注信息可以为在用户使用电子商务平台时,在登录电子商务平台后,用户对该电子商务平台提供的商品进行购买、查看、收藏、转让等操作时所产生的数据;历史关注信息可以为在用户使用社交应用时,在登录社交应用后,用户对该社交应用提供的公众号进行关注、取消关注、查看推送信息等操作时所产生的数据;历史关注信息可以为在用户使用视频网站时,在登录视频网站后,用户在该视频网站上点击、观看、下载视频资源时所产生的数据。
在实际应用中,可以将预设时间段设置为连续的时间段,如距今连续几年、某一年的某一季度,也可以将预设时间段设置为间断的时间段,如近5年内的11月11日,当然,还可以设置为其它。
S102:根据历史关注信息以及历史关注信息对应的上下文信息计算用户之间的相似度。
具体地,在获得了M个用户各自对应的历史关注信息及其对应的上下文信息后,就可以根据该历史关注信息及其对应的上下文信息来计算用户之间的相似度。
在具体实施过程中,参见图1-2所示,S102可以包括:
S1021:基于历史关注信息,确定第i个用户与第j个用户所共同关注的N个业务对象;
其中,N为大于或者等于1的整数,i小于或者等于M,j小于或者等于M,i不等于j。
这里,业务对象可以为商品信息,如就餐券、代金券、产品等,也可以为内容数据,如音频、视频、广告、推广信息等,当然,还可以为其它,如公众号、用户发布或者关注的帖子、文章等,本发明实施例不做具体限定。
在实际应用中,第i个用户与第j个用户所共同关注的业务对象可以是指第i个用户与第j个用户共同操作的业务对象,如均购买过的商品、均收藏的商品、均评分过的物品、均关注的公众号等,也可以是指预设时间内共同操作的业务对象,如最近一段时间均查看过且关注的公众号、近一个月均购买过的商品等,当然,还可以是指具有其它共同特征的业务对象。
在具体实施过程中,在获得了M个用户各自对应的历史关注信息后,可以先从M个用户各自对应的历史关注信息中,确定出第i个用户对应的历史操作数据和第j个用户对应的历史关注信息,然后,再将第i个用户对应的历史关注信息和第j个用户对应的历史关注信息中符合预设筛选条件的业务对象,确定为第i个用户与第j个用户所共同关注的N个业务对象。
在实际应用中,根据预设筛选条件的不同,从相同第i个用户对应的历史操作数据和第j个用户对应的历史关注信息,所确定出的第i个用户与第j个用户所共同关注的业务对象也是不同的。
示例性地,在电子商务平台中,业务对象可以为物品。假设第i个用户的历史关注信息为{收藏物品A1、A2;购买物品B1、B2、B3;将物品C1、C2加入购物车;点击物品D1;搜索物品E1、E2},第j个用户的历史操作数据为{收藏物品A1、A2;购买物品C1、C2、C3、C4;将物品B1、B2加入购物车;点击物品D1;搜索物品F1、F2}。由于第i个用户与第j个用户均操作过的物品为A1、A2、B1、B2、C1、C2、D1,所以,第i个用户与第j个用户所共同关注的N个业务对象可以为{A1、A2、B1、B2、C1、C2、D1};由于第i个用户与第j个用户均收藏过的物品为A1、A2,所以,第i个用户与第j个用户所共同关注的N个业务对象可以为{A1、A2}。
S1022:针对N个业务对象,根据历史关注信息以及历史关注信息对应的上下文信息,获取第i个用户对应的第一关注度集和第一上下文信息集,并获取第j个用户对应的第二关注度集和第二上下文信息集;
其中,第一上下文信息集与第一关注度集对应,第二上下文信息集与第二关注度集对应。
在具体实施过程中,在确定了第i个用户与第j个用户所共同关注的N个业务对象后,就可以从第i个用户对应的历史关注信息中,确定出第i个用户分别对每一个业务对象的第一关注值,获得N个第一关注度值,从而,生成第i个用户对应的第一关注度集,然后,从第i个用户对应的历史关注信息所对应的上下文信息中,确定出第i个用户分别对每一个业务对象进行操作时对应的第一上下文信息,获得N个第一上下文信息,从而,生成第i个用户对应的第一上下文信息集。同理,就可以从第j个用户对应的历史关注信息以及历史关注信息对应的上下文信息中,确定出第j个用户对应的第二关注度集和第二上下文信息。
下面详细介绍第一关注度集、第一上下文信息集、第二关注度集和第二上下文信息集。
首先,介绍第一关注度集和第二关注度集。
具体地,第一关注度集包含有第i个用户对N个业务对象的第一关注度值。可见,第一关注度集包含的第一关注度值的数量为N个。同理,第二关注度集包含有第j个用户对N个业务对象的第二关注度值,其中,第二关注度集中包含的第二关注度值的数量为N个。
在实际应用中,第一关注度值和第二关注度值可以为用户对业务对象操作的结果,如用户对菜品的评分值,也可以为用户对业务对象的操作行为对应的特征值,如预先对不同用户操作行为特征进行数字标识后所得的数值,当然,还可以为其它,这里奔放买那个实施例不做具体限定。
示例性地,假设业务对象为{物品1,物品2},用户1对业务对象的所做评分为{4.5,3},用户2对业务对象所做的评分为{3,5},从而,用户1对应的第一关注度集就可以为{4.5,3},而用户2对应的第二关注度集为{3,5}。
示例性地,预先对不同用户操作行为特征进行数字标识,如用户在购物网站中搜索物品记为0、点击物品记为1、收藏物品记为2、将物品加入购物车记为3、购买物品记为4。那么,用户1对业务对象所做的操作为{购买物品1,点击物品2},而用户2对业务对象所做的操作为{收藏物品1,将物品2加入购物车},从而,用户1对应的第一关注度集就可以为{4,1}。同理,用户2对应的第二关注度集为{2,3}。
其次,介绍第一上下文信息集和第二上下文信息集。
具体地,第一上下文信息集包含有第i个用户对N个业务对象进行操作时所处的第一上下文信息。可见,第一上下文信息集中包含的第一上下文信息的数量为N个,每一个第一上下文信息由一种或多种上下文信息组成。同理,第二上下文信息集包含有第j个用户对N个业务对象进行操作时所处的第二上下文信息,其中,第二上下文信息集中的数据量为N个。
在实际应用中,第二上下文信息中的数据类型和数据数目与第一上下文信息一致。
在实际应用中,第一上下文信息和第二上下文信息可以为用户操作业务对象的操作数据,如用户查看音视频的时长,也可以为用户对业务对象的操作行为对应的上下文信息的特征值,当然,还可以为其它,这里奔放买那个实施例不做具体限定。
示例性地,假设第一上下文信息为时间点,预先对不同时间段进行数字标识,如用户在视频网站中查看视频的时间点在早上记为1、在中午记为2、在下午记为3、在晚上记为4,并将用户查看视频的时长小于10分钟记为1、大于10分钟记为2。那么,假设用户1对查看业务对象{视频1,视频2}所对应的上下文信息为{在早上查看视频1共计5分钟,在晚上查看视频2共计5分钟},而用户2查看业务对象{视频1,视频2}所对应的上下文信息为{在中午查看视频1共计11分钟,在中午查看视频2共计1分钟},从而,用户1对应的第一上下文信息集就可以为{{1,1},{4,1}},其中,{1,1}为视频1对应的第一上下文信息,{4,1}为视频2对应的第二上下文信息。同理,用户2对应的第二上下文信息集为{{2,2},{2,1}}。
在实际应用中,参见表1所示,根据该计算用户之间相似度的方法的应用场景的不同,在用户关注业务对象时,即对业务对象进行操作时所对应的上下文信息内容是不同的。
表1
Figure BDA0001424583790000081
下面以该计算用户之间相似度的方法的应用场景是电子商务平台为例,来详细介绍第一上下文信息和第二上下文信息。
示例性地,假设将不同用户之间所共同评分过的N个商品作为不同用户所共同关注的N个业务对象。在此场景下,该N个商品中的第v个商品的第一上下文信息可以包括:第i个用户对该第v个商品进行评分时,第i个用户评分的时间信息、第i个用户所处的位置信息、第i个用户的年龄信息、该第v个商品的属性信息或类别信息、以及第i个用户所使用的设备类型等中的一种或者多种。
那么,当第一上下文信息和第二上下文信息均由n种不同上下文信息来实现时,第i个用户对该N个商品中第v个商品评分时的第一上下文信息可以如下公式(1)所示。
Xv={X1v,X2v,...,Xgv,...,Xnv} 公式(1)
在公式(1)中,Xv表示第i个用户对该N个商品中第v个商品评分时的第一上下文信息,X1v,X2v,...,Xgv,...,Xnv表示n种不同的上下文信息。
同理,第j个用户对该N个商品中第v个商品评分时的第二上下文信息可以如下公式(2)所示。
Yv={Y1v,Y2v,...,Ygv,...,Ynv} 公式(2)
在公式(2)中,Yv表示第j个用户对该N个商品中第v个商品评分时的第二上下文信息,Y1v,Y2v,...,Ygv,...,Ynv表示n种不同的上下文信息。
S1023:基于第一关注度集、第一上下文信息集、第二关注度集和第二上下文信息集,计算第i个用户与第j个用户之间的相似度。
在实际应用中,由于不同用户关注业务对象时所处的上下文信息,对于确定不同用户之间的相似度也至关重要。因此,在具体实施过程中,为了更准确地计算出不同用户之间的相似度,除了使用不同用户对业务对象的关注度,还需要使用不同用户关注业务对象时所处的上下文信息。具体地,可以基于第i个用户对应的第一关注度集和第一上下文信息集、以及第j个用户对应的第二关注度集和第二上下文信息集,来计算第i个用户与第j个用户之间的相似度。
在本发明其它实施例中,S1023可以包括:
步骤1023a:基于第一上下文信息集和第二上下文信息集,计算N个业务对象对应的上下文相关系数集;
步骤1023b:基于上下文相关系数集、第一关注度集和第二关注度集,计算第i个用户与第j个用户之间的相似度。
在具体实施过程中,步骤1023a可以包括:基于第一上下文信息集和第二上下文信息集,通过皮尔森相关系数计算公式,计算N个业务对象各自对应的皮尔森相关系数;基于N个业务对象各自对应的皮尔森相关系数,计算每一个业务对象的上下文相关系数;
其中,参见公式(3)所示,皮尔森相关系数计算公式为:
Figure BDA0001424583790000091
在公式(3)中,pccv表示第i个用户与第j个用户所共同关注的N个业务对象中的N个业务对象中的第v个业务对象的皮尔森相关系数,Xv表示第i个用户对应的第一上下文信息集中与第v个业务对象对应的第v个第一上下文信息子集,Xgv表示第v个第一上下文信息子集中的第g种第一上下文信息,
Figure BDA0001424583790000101
表示第i个用户关注第v个业务对象时的各种第一上下文信息的均值,Yv表示第j个用户对应的第二上下文信息集中与第v个业务对象对应的第v个第二上下文信息子集,Ygv表示第v个第二上下文信息子集中的第g种第二上下文信息,
Figure BDA0001424583790000102
表示第j个用户关注第v个业务对象时的各种第二上下文信息的均值,g为大于或者等于1的整数,v小于或者等于N。
在具体实施过程中,基于N个业务对象各自对应的皮尔森相关系数,计算每一个业务对象的上下文相关系数的步骤可以包括:分别将每一个业务对象对应的皮尔森相关系数进行归一化处理,获得每一个业务对象对应的归一化后的皮尔森相关系数;基于每一个业务对象对应的归一化后的皮尔森相关系数,通过上下文相关系数计算公式,计算每一个业务对象的上下文相关系数;
其中,参见公式(4)所示,上下文相关系数计算公式为:
Figure BDA0001424583790000103
在公式(4)中,wv表示第v个业务对象的上下文相关系数,N(pccv)表示第v个业务对象对应的归一化后的皮尔森相关系数,
Figure BDA0001424583790000104
表示N个业务对象各自对应的归一化后的皮尔森相关系数的总和,Vij表示第i个用户与第j个用户所共同关注的N个业务对象,v'表示Vij中任意业务对象。
下面来详细介绍如何计算第i个用户与第j个用户所共同关注的N个业务对象中的第v个业务对象的上下文相关系数。
第一步,基于如下公式(5)所示的第一上下文信息集和如下公式(6)所示的第二上下文信息集,通过上述公式(3)计算第i个用户与第j个用户所共同关注的每一个业务对象对应的皮尔森相关系数。
X={X1,X2,...,Xv,...,XN} 公式(5)
Y={Y1,Y2,...,Yv,...,YN} 公式(6)
在公式(5)中,X表示第i个用户对应的第一上下文信息集,Xv表示第i个用户对应的第一上下文信息集中,与第v个业务对象相对应的第v个第一上下文信息子集;在公式(6)中,Y表示第j个用户对应的第二上下文信息集,Yv表示第j个用户对应的第二上下文信息集中,与第v个业务对象相对应的第v个第二上下文信息子集;
第二步,为了统一量纲,便于后续进行数据处理,可以通过归一化函数,将每一个业务对象对应的皮尔森相关系数的值映射到[0,1]内,这样,就获得了每一个业务对象对应的归一化后的皮尔森相关系数;
这里,当使用N(·)表示归一化函数时,第v个业务对象对应的归一化后的皮尔森相关系数就可以表示为:N(pccv)。
第三步,在获得每一个业务对象对应的归一化后的皮尔森相关系数后,就可以对所有归一化后的皮尔森相关系数求和,获得如下公式(7)所示的第一和值;
Figure BDA0001424583790000111
在公式(7)中,sum1表示N个业务对象各自对应的归一化后的皮尔森相关系数的总和,Vij表示第i个用户与第j个用户所共同关注的N个业务对象,v'表示Vij中任意业务对象。
第四步,在获得每一个业务对象对应的归一化后的皮尔森相关系数以及第一和值后,由于sum1和pccv已知,那么,通过公式(8)就可以计算出如公式(4)所示的第v个业务对象的上下文相关系数。
Figure BDA0001424583790000112
在公式(8)中,wv表示第i个用户与第j个用户所共同关注的N个业务对象中第v个业务对象的上下文相关系数,N(pccv)表示第v个业务对象对应的归一化后的皮尔森相关系数,sum1表示第i个用户与第j个用户所共同关注的N个业务对象各自对应的归一化后的皮尔森相关系数的总和。
在具体实施过程中,步骤1023b可以包括:计算第一关注度集中N个第一关注度值的平均值,获得第一均值,其中,N个第一关注度值与N个业务对象一一对应;计算第二关注度集中N个第二关注度值的平均值,获得第二均值,其中,N个第二关注度值与N个业务对象一一对应;基于上下文相关系数集中的N个上下文相关系数、N个第一关注度值、N个第二关注度值、第一均值以及第二均值,通过相似度计算公式,计算第i个用户与第j个用户之间的相似度;
其中,参见公式(9)所示,相似度计算公式为:
Figure BDA0001424583790000121
在公式(9)中,Sim(i,j)表示第i个用户与第j个用户之间的相似度,wv表示第v个业务对应的上下文相关系数,Riv表示第v个业务对象对应的第一关注度值,
Figure BDA0001424583790000122
表示第一均值,Rjv表示第v个业务对象对应的第二关注度值,
Figure BDA0001424583790000123
表示第二均值,Vij表示第i个用户与第j个用户所共同关注的N个业务对象。
在实际应用中,N个业务对象对应N个第一关注度值,假设第i个用户对应的第一关注度集Ri如公式(10)所示,则计算第一关注度集中N个第一关注度值的平均值,获得如下公式(11)所示的第一均值
Figure BDA0001424583790000124
Ri={Ri1,...,Riv,...,RiN} 公式(10)
Figure BDA0001424583790000125
同理,与计算第一均值的方法类似,可参考公式(10)和公式(11),来计算第二均值
Figure BDA0001424583790000126
至此,便完成了不同用户之间的相似度的计算过程。
由上述内容可知,本发明实施例所提供的计算用户之间相似度的方法,在获取M个用户各自对应的历史关注信息以及历史关注信息对应的上下文信息后,就会根据历史关注信息以及历史关注信息对应的上下文信息,来计算用户之间的相似度。这样,由于是通过历史关注信息和上下文信息这两类信息来计算不用用户之间的相似度的,丰富了计算用户间相似度所采用的数据种类,提高了计算用户之间的相似度的准确性。那么,将该用户之间的相似度获取方法用于推荐系统中时,由于通过提高用户之间相似度的计算准确度能够做出更符合用户偏好的推荐,从而,能够提高推荐效果,提高网站的转化率,同时为用户带来更好的体验。
实施例二
基于前述实施例,本实施例提供一种计算用户之间相似度的方法,该计算用户之间相似度的方法应用于以下场景中:通过用户Uj和用户Uf均评分过的物品(也可称为项目)所对应的评分和上下文信息,来计算用户Uj和用户Uf之间的相似度。
该计算用户之间相似度的方法的详细说明如下:
通过在用户之间的相似度计算方式中对于每个物品添加一个上下文相关的系数来引入上下文信息:
Figure BDA0001424583790000131
在公式(12)中,Sc(j,f)表示用户Uj和用户Uf之间的相似度,V(j)∩V(f)表示用户Uj和用户Uf共同评分过的物品集合,wv表示物品v的权重,即物品v对应的上下文相关系数,Rj,v表示用户Uj对物品v的评分值,
Figure BDA0001424583790000132
表示用户Uj对自身和用户Uf均评分过的所有物品的评分值的均值,Rf,v表示用户Uf对物品v的评分值,
Figure BDA0001424583790000133
表示用户Uf对自身和用户Uj均评分过的所有物品的评分值的均值。
在实施过程中,物品v的权重计算方式如公式(13)所示。
Figure BDA0001424583790000134
在公式(13)中,N(.)为归一化函数,能够将相似度的值限定在[0,1]内,pccv表示用户Uj对物品v的评分Rj,v和用户Uf对物品v的评分Rf,v之间的皮尔森相关系数。
在实施过程中,上述皮尔森相关系数通过和物品v的每个评分相关的上下文信息向量来计算:
Figure BDA0001424583790000135
在公式(14)中,Xi表示用户Uj对项目Vv的评分Rj,v所对应的上下文向量实例,Yi表示用户Uf对项目Vv的评分Rf,v对应的上下文向量实例。
Figure BDA0001424583790000136
分别表示Xi,Yi的平均取值。
Ci={C1,C2,C3,...} 公式(15)
在公式(15)中,C1、C2、C3表示不同的上下文信息,Ci表示上下文信息向量。
此外,参见图2所示,用户21和物品22以及评分信息23可以看作一张二维的表,用户评分时的上下文信息24可以构成另一个维度。其中,U1、U2、…、U6为用户,V1、V2、…、V6为物品。
由公式(12)至公式(14)可以看出,物品v对应的权重系数wv越高,则说明两个用户对物品v做出评分时所处的上下文越相似,因而物品v的评分对于计算两个用户间的相似度应该有着更高的权重。
由上述内容可知,本发明实施例所提供的计算用户之间相似度的方法,通过引入用户评分时的上下文信息,能够准确地计算出用户之间的相似度,从而,将该方法应用到推荐系统时,能够提高推荐系统推荐的准确度,改善用户体验,提升网站的转化率。
实施例三
基于同一发明构思,作为对上述方法的实现,本发明实施例提供了一种计算用户之间相似度的装置,该装置实施例与前述方法实施例对应,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。
图3为本发明实施例三中的计算用户之间相似度的装置的结构示意图,参见图3所示,该计算装置30包括:获取单元301以及计算单元302,其中,获取单元301,用于获取M个用户各自对应的历史关注信息以及历史关注信息对应的上下文信息,其中,M为大于或者等于2的整数;计算单元302,用于根据历史关注信息以及历史关注信息对应的上下文信息计算用户之间的相似度。
在本发明实施例中,计算单元,用于基于历史关注信息,确定第i个用户与第j个用户所共同关注的N个业务对象,其中,N为大于或者等于1的整数,i小于或者等于M,j小于或者等于M,i不等于j;针对N个业务对象,根据历史关注信息以及历史关注信息对应的上下文信息,获取第i个用户对应的第一关注度集和第一关注度集对应的第一上下文信息集,并获取第j个用户对应的第二关注度集和第二关注度集对应的第二上下文信息集;基于第一关注度集、第一上下文信息集、第二关注度集和第二上下文信息集,计算第i个用户与第j个用户之间的相似度。
在本发明实施例中,计算单元,用于基于第一上下文信息集和第二上下文信息集,计算N个业务对象对应的上下文相关系数集;基于上下文相关系数集、第一关注度集和第二关注度集,计算第i个用户与第j个用户之间的相似度。
在本发明实施例中,计算单元,用于基于第一上下文信息集和第二上下文信息集,通过皮尔森相关系数计算公式,计算N个业务对象各自对应的皮尔森相关系数;基于N个业务对象各自对应的皮尔森相关系数,计算每一个业务对象的上下文相关系数;
其中,皮尔森相关系数计算公式为:
Figure BDA0001424583790000151
在皮尔森相关系数计算公式中,pccv表示N个业务对象中的第v个业务对象的皮尔森相关系数,Xv表示第一上下文信息集中与第v个业务对象对应的第v个第一上下文信息子集,Xgv表示第v个第一上下文信息子集中的第g种第一上下文信息,
Figure BDA0001424583790000152
表示第i个用户关注第v个业务对象时的各种第一上下文信息的均值,Yv表示第二上下文信息集中与第v个业务对象对应的第v个第二上下文信息子集,Ygv表示第v个第二上下文信息子集中的第g种第二上下文信息,
Figure BDA0001424583790000153
表示第j个用户关注第v个业务对象时的各种第二上下文信息的均值,g为大于或者等于1的整数,v小于或者等于N。
在本发明实施例中,计算单元,用于分别将每一个业务对象对应的皮尔森相关系数进行归一化处理,获得每一个业务对象对应的归一化后的皮尔森相关系数;基于每一个业务对象对应的归一化后的皮尔森相关系数,通过上下文相关系数计算公式,计算每一个业务对象的上下文相关系数;
其中,上下文相关系数计算公式为:
Figure BDA0001424583790000161
在上下文相关系数计算公式中,wv表示第v个业务对象的上下文相关系数,N(pccv)表示第v个业务对象对应的归一化后的皮尔森相关系数,
Figure BDA0001424583790000162
表示N个业务对象各自对应的归一化后的皮尔森相关系数的总和,Vij表示第i个用户与第j个用户所共同关注的N个业务对象,v'表示Vij中任意业务对象。
在本发明实施例中,计算单元,用于计算第一关注度集中N个第一关注度值的平均值,获得第一均值,其中,N个第一关注度值与N个业务对象一一对应;计算第二关注度集中N个第二关注度值的平均值,获得第二均值,其中,N个第二关注度值与N个业务对象一一对应;基于上下文相关系数集中的N个上下文相关系数、N个第一关注度值、N个第二关注度值、第一均值以及第二均值,通过相似度计算公式,计算第i个用户与第j个用户之间的相似度;
其中,相似度计算公式为:
Figure BDA0001424583790000163
在相似度计算公式中,Sim(i,j)表示第i个用户与第j个用户之间的相似度,wv表示第v个业务对应的上下文相关系数,Riv表示第v个业务对象对应的第一关注度值,
Figure BDA0001424583790000164
表示第一均值,Rjv表示第v个业务对象对应的第二关注度值,
Figure BDA0001424583790000165
表示第二均值,Vij表示第i个用户与第j个用户所共同关注的N个业务对象。
上述计算用户之间相似度的装置包括处理器和存储器,上述第一获取单元、确定单元、第二获取单元以及计算单元均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核从存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现识别物料信息中的关键词,并基于关键词对物料信息进行分类。
上述处理器可由中央处理器(Central Processing Unit,CPU)、微处理器(MicroProcessor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)、或现场可编程门阵列(Field Programmable Gate Array,FPGA)等实现。
存储器可能包括计算机可读介质中的非永久性存储器,随机存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(Flash RAM),存储器包括至少一个存储芯片。
基于同一发明构思,本发明实施例提供一种存储介质,其上存储有程序,该程序被处理器执行时实现上述计算用户之间相似度的方法。
基于同一发明构思,本发明实施例提供一种处理器,处理器用于运行程序,其中,程序运行时执行上述计算用户之间相似度的方法。
在实际应用中,该计算用户之间相似度的装置可应用于终端中。终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(PortableMedia Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机、服务器等固定终端。
实施例四
基于同一发明构思,本发明实施例提供一种计算用户之间相似度的设备。图4为本发明实施例四中的计算用户之间相似度的设备的结构示意图,参见图4所示,该计算设备40包括:存储器401、处理器402以及存储在存储器401上并可在处理器402上运行的计算机程序403,处理器执行程序403时实现以下步骤:获取M个用户各自对应的历史关注信息以及历史关注信息对应的上下文信息,其中,M为大于或者等于2的整数;根据历史关注信息以及历史关注信息对应的上下文信息计算用户之间的相似度。
在本发明实施例中,上述处理器执行程序时还可实现以下步骤:基于历史关注信息,确定第i个用户与第j个用户所共同关注的N个业务对象,其中,N为大于或者等于1的整数,i小于或者等于M,j小于或者等于M,i不等于j;针对N个业务对象,根据历史关注信息以及历史关注信息对应的上下文信息,获取第i个用户对应的第一关注度集和第一关注度集对应的第一上下文信息集,并获取第j个用户对应的第二关注度集和第二关注度集对应的第二上下文信息集;基于第一关注度集、第一上下文信息集、第二关注度集和第二上下文信息集,计算第i个用户与第j个用户之间的相似度。
在本发明实施例中,上述处理器执行程序时还可实现以下步骤:基于第一上下文信息集和第二上下文信息集,计算N个业务对象对应的上下文相关系数集;基于上下文相关系数集、第一关注度集和第二关注度集,计算第i个用户与第j个用户之间的相似度。
在本发明实施例中,上述处理器执行程序时还可实现以下步骤:在本发明实施例中,计算单元,用于基于第一上下文信息集和第二上下文信息集,通过皮尔森相关系数计算公式,计算N个业务对象各自对应的皮尔森相关系数;基于N个业务对象各自对应的皮尔森相关系数,计算每一个业务对象的上下文相关系数;
其中,皮尔森相关系数计算公式为:
Figure BDA0001424583790000181
在皮尔森相关系数计算公式中,pccv表示N个业务对象中的第v个业务对象的皮尔森相关系数,Xv表示第一上下文信息集中与第v个业务对象对应的第v个第一上下文信息子集,Xgv表示第v个第一上下文信息子集中的第g种第一上下文信息,
Figure BDA0001424583790000182
表示第i个用户关注第v个业务对象时的各种第一上下文信息的均值,Yv表示第二上下文信息集中与第v个业务对象对应的第v个第二上下文信息子集,Ygv表示第v个第二上下文信息子集中的第g种第二上下文信息,
Figure BDA0001424583790000183
表示第j个用户关注第v个业务对象时的各种第二上下文信息的均值,g为大于或者等于1的整数,v小于或者等于N。。
在本发明实施例中,上述处理器执行程序时还可实现以下步骤:分别将每一个业务对象对应的皮尔森相关系数进行归一化处理,获得每一个业务对象对应的归一化后的皮尔森相关系数;基于每一个业务对象对应的归一化后的皮尔森相关系数,通过上下文相关系数计算公式,计算每一个业务对象的上下文相关系数;
其中,上下文相关系数计算公式为:
Figure BDA0001424583790000191
在上下文相关系数计算公式中,wv表示第v个业务对象的上下文相关系数,N(pccv)表示第v个业务对象对应的归一化后的皮尔森相关系数,
Figure BDA0001424583790000192
表示N个业务对象各自对应的归一化后的皮尔森相关系数的总和,Vij表示第i个用户与第j个用户所共同关注的N个业务对象,v'表示Vij中任意业务对象。
在本发明实施例中,上述处理器执行程序时还可实现以下步骤:计算第一关注度集中N个第一关注度值的平均值,获得第一均值,其中,N个第一关注度值与N个业务对象一一对应;计算第二关注度集中N个第二关注度值的平均值,获得第二均值,其中,N个第二关注度值与N个业务对象一一对应;基于上下文相关系数集中的N个上下文相关系数、N个第一关注度值、N个第二关注度值、第一均值以及第二均值,通过相似度计算公式,计算第i个用户与第j个用户之间的相似度;
其中,相似度计算公式为:
Figure BDA0001424583790000193
在相似度计算公式中,Sim(i,j)表示第i个用户与第j个用户之间的相似度,wv表示第v个业务对应的上下文相关系数,Riv表示第v个业务对象对应的第一关注度值,
Figure BDA0001424583790000194
表示第一均值,Rjv表示第v个业务对象对应的第二关注度值,
Figure BDA0001424583790000195
表示第二均值,Vij表示第i个用户与第j个用户所共同关注的N个业务对象。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备
上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,该计算用户之间相似度的设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,RAM和/或非易失性内存等形式,如ROM或Flash RAM。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机可读存储介质可以是ROM、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是快闪记忆体或其他内存技术、CD-ROM、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息;还可以是包括上述存储器之一或任意组合的各种电子设备,如移动电话、计算机、平板设备、个人数字助理等。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (6)

1.一种计算用户之间相似度的方法,其特征在于,所述方法包括:
获取M个用户各自对应的历史关注信息以及所述历史关注信息对应的上下文信息,其中,M为大于或者等于2的整数;
根据所述历史关注信息以及所述历史关注信息对应的上下文信息计算用户之间的相似度;
所述根据所述历史关注信息以及所述历史关注信息对应的上下文信息计算用户之间的相似度,包括:
基于所述历史关注信息,确定第i个用户与第j个用户所共同关注的N个业务对象,其中,N为大于或者等于1的整数,i小于或者等于M,j小于或者等于M,i不等于j;
针对所述N个业务对象,根据所述历史关注信息以及所述历史关注信息对应的上下文信息,获取所述第i个用户对应的第一关注度集和所述第一关注度集对应的第一上下文信息集,并获取所述第j个用户对应的第二关注度集和所述第二关注度集对应的第二上下文信息集;
基于所述第一上下文信息集和所述第二上下文信息集,计算所述N个业务对象对应的上下文相关系数集,具体为:基于所述第一上下文信息集和所述第二上下文信息集,通过皮尔森相关系数计算公式,计算所述N个业务对象各自对应的皮尔森相关系数;基于所述N个业务对象各自对应的皮尔森相关系数,计算每一个业务对象的上下文相关系数;
基于所述上下文相关系数集、所述第一关注度集和所述第二关注度集,计算所述第i个用户与所述第j个用户之间的相似度;
所述基于所述上下文相关系数集、所述第一关注度集和所述第二关注度集,计算所述第i个用户与所述第j个用户之间的相似度,包括:
计算所述第一关注度集中N个第一关注度值的平均值,获得第一均值,其中,所述N个第一关注度值与所述N个业务对象一一对应;
计算所述第二关注度集中N个第二关注度值的平均值,获得第二均值,其中,所述N个第二关注度值与所述N个业务对象一一对应;
基于所述上下文相关系数集中的N个上下文相关系数、所述N个第一关注度值、所述N个第二关注度值、所述第一均值以及所述第二均值,通过相似度计算公式,计算所述第i个用户与所述第j个用户之间的相似度;
其中,所述相似度计算公式为:
Figure FDA0003144746910000021
在所述相似度计算公式中,Sim(i,j)表示第i个用户与第j个用户之间的相似度,wv表示物品v的权重,即物品v对应的上下文相关系数,Riv表示所述第v个业务对象对应的第一关注度值,
Figure FDA0003144746910000022
表示第一均值,Rjv表示第v个业务对象对应的第二关注度值,
Figure FDA0003144746910000023
表示第二均值,Vij表示第i个用户与第j个用户所共同关注的N个业务对象。
2.根据权利要求1所述的方法,其特征在于,其中,所述皮尔森相关系数计算公式为:
Figure FDA0003144746910000024
在所述皮尔森相关系数计算公式中,pccv表示所述N个业务对象中的第v个业务对象的皮尔森相关系数,Xv表示所述第一上下文信息集中与所述第v个业务对象对应的第v个第一上下文信息子集,Xgv表示第v个第一上下文信息子集中的第g种第一上下文信息,
Figure FDA0003144746910000025
表示第i个用户关注第v个业务对象时的各种第一上下文信息的均值,Yv表示所述第二上下文信息集中与所述第v个业务对象对应的第v个第二上下文信息子集,Ygv表示第v个第二上下文信息子集中的第g种第二上下文信息,
Figure FDA0003144746910000026
表示第j个用户关注第v个业务对象时的各种第二上下文信息的均值,g为大于或者等于1的整数,v小于或者等于N。
3.根据权利要求2所述的方法,其特征在于,所述基于所述N个业务对象各自对应的皮尔森相关系数,计算每一个业务对象的上下文相关系数,包括:
分别将每一个业务对象对应的皮尔森相关系数进行归一化处理,获得所述每一个业务对象对应的归一化后的皮尔森相关系数;
基于所述每一个业务对象对应的归一化后的皮尔森相关系数,通过上下文相关系数计算公式,计算每一个业务对象的上下文相关系数;
其中,所述上下文相关系数计算公式为:
Figure FDA0003144746910000031
在所述上下文相关系数计算公式中,wv表示所述第v个业务对象的上下文相关系数,N(pccv)表示所述第v个业务对象对应的归一化后的皮尔森相关系数,
Figure FDA0003144746910000032
表示所述N个业务对象各自对应的归一化后的皮尔森相关系数的总和,Vij表示第i个用户与第j个用户所共同关注的N个业务对象,v'表示Vij中任意业务对象。
4.一种计算用户之间相似度的装置,其特征在于,所述装置包括:获取单元以及计算单元,其中,
所述获取单元,用于获取M个用户各自对应的历史关注信息以及所述历史关注信息对应的上下文信息,其中,M为大于或者等于2的整数;
所述计算单元,用于根据所述历史关注信息以及所述历史关注信息对应的上下文信息计算用户之间的相似度;
所述计算单元,用于基于所述历史关注信息,确定第i个用户与第j个用户所共同关注的N个业务对象,其中,N为大于或者等于1的整数,i小于或者等于M,j小于或者等于M,i不等于j;针对所述N个业务对象,根据所述历史关注信息以及所述历史关注信息对应的上下文信息,获取所述第i个用户对应的第一关注度集和所述第一关注度集对应的第一上下文信息集,并获取所述第j个用户对应的第二关注度集和所述第二关注度集对应的第二上下文信息集;基于第一上下文信息集和第二上下文信息集,计算N个业务对象对应的上下文相关系数集,具体为:基于所述第一上下文信息集和所述第二上下文信息集,通过皮尔森相关系数计算公式,计算所述N个业务对象各自对应的皮尔森相关系数;基于所述N个业务对象各自对应的皮尔森相关系数,计算每一个业务对象的上下文相关系数;基于上下文相关系数集、第一关注度集和第二关注度集,计算第i个用户与第j个用户之间的相似度;计算所述第一关注度集中N个第一关注度值的平均值,获得第一均值,其中,所述N个第一关注度值与所述N个业务对象一一对应;
计算所述第二关注度集中N个第二关注度值的平均值,获得第二均值,其中,所述N个第二关注度值与所述N个业务对象一一对应;
基于所述上下文相关系数集中的N个上下文相关系数、所述N个第一关注度值、所述N个第二关注度值、所述第一均值以及所述第二均值,通过相似度计算公式,计算所述第i个用户与所述第j个用户之间的相似度;
其中,所述相似度计算公式为:
Figure FDA0003144746910000041
在所述相似度计算公式中,Sim(i,j)表示第i个用户与第j个用户之间的相似度,wv表示物品v的权重,即物品v对应的上下文相关系数,Riv表示所述第v个业务对象对应的第一关注度值,
Figure FDA0003144746910000042
表示第一均值,Rjv表示第v个业务对象对应的第二关注度值,
Figure FDA0003144746910000043
表示第二均值,Vij表示第i个用户与第j个用户所共同关注的N个业务对象。
5.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1至3任一项所述的计算用户之间相似度的方法。
6.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1至3任一项所述的计算用户之间相似度的方法。
CN201710909747.2A 2017-09-29 2017-09-29 一种计算用户之间相似度的方法及装置 Active CN110020118B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710909747.2A CN110020118B (zh) 2017-09-29 2017-09-29 一种计算用户之间相似度的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710909747.2A CN110020118B (zh) 2017-09-29 2017-09-29 一种计算用户之间相似度的方法及装置

Publications (2)

Publication Number Publication Date
CN110020118A CN110020118A (zh) 2019-07-16
CN110020118B true CN110020118B (zh) 2021-11-16

Family

ID=67186468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710909747.2A Active CN110020118B (zh) 2017-09-29 2017-09-29 一种计算用户之间相似度的方法及装置

Country Status (1)

Country Link
CN (1) CN110020118B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111768263A (zh) * 2020-03-31 2020-10-13 北京京东尚科信息技术有限公司 信息推送方法、装置、服务器及存储介质
CN113656708B (zh) * 2021-10-20 2021-12-24 北京搜狐新媒体信息技术有限公司 一种确定物品相似度的方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426381A (zh) * 2015-08-27 2016-03-23 浙江大学 一种基于微博情绪上下文的音乐推荐方法
CN106649657A (zh) * 2016-12-13 2017-05-10 重庆邮电大学 面向社交网络基于张量分解的上下文感知推荐系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100581227C (zh) * 2008-05-16 2010-01-13 华东师范大学 一种引入节目热门度权重的协作过滤推荐方法
US9704483B2 (en) * 2015-07-28 2017-07-11 Google Inc. Collaborative language model biasing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426381A (zh) * 2015-08-27 2016-03-23 浙江大学 一种基于微博情绪上下文的音乐推荐方法
CN106649657A (zh) * 2016-12-13 2017-05-10 重庆邮电大学 面向社交网络基于张量分解的上下文感知推荐系统及方法

Also Published As

Publication number Publication date
CN110020118A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
US20210287250A1 (en) Providing data and analysis for advertising on networked devices
US11995112B2 (en) System and method for information recommendation
CN108121737B (zh) 一种业务对象属性标识的生成方法、装置和系统
US10354184B1 (en) Joint modeling of user behavior
JP5960887B1 (ja) 算出装置、算出方法及び算出プログラム
WO2018053966A1 (zh) 点击率预估
WO2018121700A1 (zh) 基于已安装应用来推荐应用信息的方法、装置、终端设备及存储介质
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
US20130339350A1 (en) Ranking Search Results Based on Click Through Rates
CN106557480B (zh) 查询改写的实现方法及装置
US20200234218A1 (en) Systems and methods for entity performance and risk scoring
Wijnhoven et al. Sentiment analysis and Google trends data for predicting car sales
US9269049B2 (en) Methods, apparatus, and systems for using a reduced attribute vector of panel data to determine an attribute of a user
CN107633416B (zh) 一种业务对象的推荐方法、装置和系统
US20190087859A1 (en) Systems and methods for facilitating deals
AU2018211215A1 (en) Method and system for modifying a webpage
CN106570031A (zh) 一种业务对象的推荐方法和装置
Zheng et al. A scalable purchase intention prediction system using extreme gradient boosting machines with browsing content entropy
KR20150122307A (ko) 광고 제공 방법 및 서버 장치
CN110020118B (zh) 一种计算用户之间相似度的方法及装置
CN114595323A (zh) 画像构建、推荐、模型训练方法、装置、设备及存储介质
WO2020150597A1 (en) Systems and methods for entity performance and risk scoring
WO2015179717A1 (en) Determination of initial value for automated delivery of news items
JP2017076376A (ja) 算出装置、算出方法および算出プログラム
US20210056437A1 (en) Systems and methods for matching users and entities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant