CN107305559A - 一种应用推荐方法和装置 - Google Patents
一种应用推荐方法和装置 Download PDFInfo
- Publication number
- CN107305559A CN107305559A CN201610250789.5A CN201610250789A CN107305559A CN 107305559 A CN107305559 A CN 107305559A CN 201610250789 A CN201610250789 A CN 201610250789A CN 107305559 A CN107305559 A CN 107305559A
- Authority
- CN
- China
- Prior art keywords
- user
- similarity
- application
- score
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 239000013598 vector Substances 0.000 claims description 49
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000205 computational method Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012098 association analyses Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种应用推荐方法,包括:获取用户的应用偏好得分和用户信息;根据所述用户信息,确定所述用户间的综合相似度;根据所述应用偏好得分和所述综合相似度,确定推荐的应用。本发明实施例还同时公开了一种应用推荐装置。
Description
技术领域
本发明涉及数据挖掘技术,尤其涉及一种应用推荐方法和装置。
背景技术
随着终端应用的快速发展,尤其针对日常生活中使用最频繁的手机,用户需要花费大量的时间才能找到自己想要安装的应用。为了便于用户查找到自己想要安装的应用,应用推荐系统应运而生。其中,推荐应用的准确性是衡量应用推荐系统好坏的一个重要指标。
现有技术中,以手机为例,手机应用推荐模式基本都是基于“产品”(即应用)这一个因素,具体的,利用关联分析等数据挖掘算法工具,来探索应用之间的相似度和关联关系,并在用户选择安装或使用某一应用后,服务器会利用协同过滤算法建立用户-应用之间的关系,并会通过该关系向用户推荐与用户选择安装或使用应用相关联的应用。
现有的模式仅仅考虑到用户已安装或者使用应用的信息,考虑因素过于单一,仅考虑了“产品”这一个因素,并未考虑到用户实际需求这个因素,推荐给用户的应用不能满足用户的实际需要,使得用户并不会使用推荐的应用,减低用户体验,从而使得推荐的准确性受到负面影响。
发明内容
为解决上述技术问题,本发明实施例期望提供一种应用推荐方法和装置,为用户推荐满足用户需求的应用,从而提高推荐的准确性。
本发明的技术方案是这样实现的:
第一方面,提供一种应用推荐方法,所述方法包括:
获取用户的应用偏好得分和用户信息;
根据所述用户信息,确定所述用户间的综合相似度;
根据所述应用偏好得分和所述综合相似度,确定推荐的应用。
可选的,所述用户信息包括交往信息、应用偏好信息和终端信息,所述根据所述用户信息,确定所述用户间的综合相似度包括:
根据所述交往信息,确定所述用户间交往圈亲密相似度;
根据所述应用偏好信息,确定所述用户间应用偏好相似度;
根据所述终端信息,确定所述用户间终端信息相似度;
根据所述用户间交往圈亲密相似度、所述用户间应用偏好相似度和所述用户间终端信息相似度,确定所述用户间综合相似度。
可选的,对于第一用户,所述根据所述应用偏好信息,确定所述用户间应用偏好相似度包括:
根据所述偏好信息,获取所述第一用户的第一应用使用频率向量和第二用户的第二应用使用频率向量;
根据所述第一应用使用频率向量和所述第二应用使用频率向量,确定所述第一用户和所述第二用户间应用偏好相似度。
可选的,所述终端信息包括终端品牌等级得分和终端价格等级得分,对于第一用户,所述根据所述终端信息,确定所述用户间终端信息相似度包括:
根据所述终端信息,获取所述第一用户的第一终端品牌等级得分与第一终端价格等级得分和第二用户的第二终端品牌等级得分与第二终端价格等级得分;
根据所述第一终端品牌等级得分、第一终端价格等级得分、第二终端品牌等级得分和第二终端价格等级得分,确定所述第一用户和所述第二用户间终端信息相似度。
可选的,所述交往信息包括所述用户之间的第一通话次数、所述用户之间的第一通话时长和所述用户之间的第一短信次数,对于第一用户,所述根据所述交往信息,确定所述用户间交往圈亲密相似度包括:
根据所述通话次数、所述通话时长和所述短信次数,获取所述第一用户和第二用户之间的第二通话次数、所述第一用户和所述第二用户之间的第二通话时长和所述第一用户和所述第二用户之间的第二短信次数;
根据所述第一通话次数、所述第一通话时长、所述第一短信次数、所述第二通话次数、所述第二通话时长和所述第二短信次数,确定所述第一用户和所述第二用户间交往圈亲密相似度。
可选的,对于第一用户,所述根据所述用户间交往圈亲密相似度、所述用户间应用偏好相似度和所述用户间终端信息相似度,确定所述用户间综合相似度包括:
确定所述第一用户和第二用户间交往圈亲密度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度;
确定所述第一用户和所述第二用户间交往圈亲密相似度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度的平均值;
根据所述平均值,确定所述第一用户和所述第二用户间综合相似度。
可选的,所述根据所述应用偏好得分和所述综合相似度,确定推荐的应用包括:
根据所述应用偏好得分和所述综合相似度,确定应用的推荐预测得分;
将前N个最大的所述推荐预测得分对应的应用确定为所述推荐的应用,所述N是小于总应用个数的正整数。
第二方面,提供一种应用推荐装置,所述装置包括:
获取模块,用于获取用户的应用偏好得分和用户信息;
确定模块,用于根据所述用户信息,确定所述用户间的综合相似度;
所述确定模块还用于根据所述应用偏好得分和所述综合相似度,确定推荐的应用。
可选的,所述用户信息包括交往信息、应用偏好信息和终端信息,所述确定模块具体用于:
根据所述交往信息,确定所述用户间交往圈亲密相似度;
根据所述应用偏好信息,确定所述用户间应用偏好相似度;
根据所述终端信息,确定所述用户间终端信息相似度;
根据所述用户间交往圈亲密相似度、所述用户间应用偏好相似度和所述用户间终端信息相似度,确定所述用户间综合相似度。
可选的,对于第一用户,所述确定模块还具体用于:
根据所述偏好信息,获取所述第一用户的第一应用使用频率向量和第二用户的第二应用使用频率向量;
根据所述第一应用使用频率向量和所述第二应用使用频率向量,确定所述第一用户和所述第二用户间应用偏好相似度。
可选的,所述终端信息包括终端品牌等级得分和终端价格等级得分,对于第一用户,所述确定模块还具体用于:
根据所述终端信息,获取所述第一用户的第一终端品牌等级得分与第一终端价格等级得分和第二用户的第二终端品牌等级得分与第二终端价格等级得分;
根据所述第一终端品牌等级得分、第一终端价格等级得分、第二终端品牌等级得分和第二终端价格等级得分,确定所述第一用户和所述第二用户间终端信息相似度。
可选的,所述交往信息包括所述用户之间的第一通话次数、所述用户之间的第一通话时长和所述用户之间的第一短信次数,对于第一用户,所述确定模块还具体用于:
根据所述通话次数、所述通话时长和所述短信次数,获取所述第一用户和第二用户之间的第二通话次数、所述第一用户和所述第二用户之间的第二通话时长和所述第一用户和所述第二用户之间的第二短信次数;
根据所述第一通话次数、所述第一通话时长、所述第一短信次数、所述第二通话次数、所述第二通话时长和所述第二短信次数,确定所述第一用户和所述第二用户间交往圈亲密相似度。
可选的,对于第一用户,所述确定模块还具体用于:
确定所述第一用户和第二用户间交往圈亲密度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度;
确定所述第一用户和所述第二用户间交往圈亲密相似度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度的平均值;
根据所述平均值,确定所述第一用户和所述第二用户间综合相似度。
可选的,所述确定模块还用于:
根据所述应用偏好得分和所述综合相似度,确定应用的推荐预测得分;
将前N个最大的所述推荐预测得分对应的应用确定为所述推荐的应用,所述N是小于总应用个数的正整数。
本发明实施例提供了一种应用推荐方法和装置,获取用户的应用偏好得分和用户信息;再根据用户信息,确定用户间的综合相似度;之后,根据应用偏好得分和综合相似度,确定推荐的应用。这样一来,根据某一确定用户的应用偏好得分和该用户与其他用户的综合相似度,就可以高效、准确地确定出给该用户推荐的应用,这样,不仅考虑到该用户已安装或者使用的应用,还有考虑该用户与其他用户的综合相似度,从而达到对用户手机应用的高准确性推荐,使得应用的推荐成功率大大增加。
同时,在该用户不主动下载应用的时候,仍可根据综合相似度给该用户进行推荐,从而达到对用户手机应用的高准确性推荐,使得应用的推荐成功率大大增加。
附图说明
图1为本发明实施例提供的一种应用推荐方法的流程图;
图2为本发明实施例提供的一种综合相似度推理系统示意图;
图3为本发明实施例提供的一种构建产品偏好相似度示意图;
图4为本发明实施例提供的一种构建交往圈亲密度相似度示意图;
图5为本发明实施例提供的一种应用推荐装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
实施例一
本发明实施例提供一种应用推荐方法,应用于应用推荐装置,该装置可以是服务器中的一部分,也可以是单独的设备,如图1所示,该方法包括:
步骤101、获取用户的应用偏好得分和用户信息。
这里,获取用户的应用偏好得分时,采用的是熵值法,该熵值法在实际应用中已经非常成熟,本实施例就不再详述。获取用户信息的目的是为接下来的步骤做准备。其中,用户信息可直接从服务器中获得。
具体的,获取用户的应用偏好得分可按以下小步骤进行。
(1)初始化用户-应用偏好得分矩阵
首先,定义用户-应用偏好矩阵:其中gij表示第i个用户对第j个应用的偏好得分。
用户在时间、情感、金钱等三方面的投入能最大程度地反映用户对某类应用的偏好程度,因此对指标体系都进行频度、粘度和额度的统一标准化处理。其中频度体现用户的时间投入,包括使用次数、天数等;粘度体现用户的情感投入,包括流量使用大小、使用时长等;额度体现用户的金钱投入,包括在应用里付费次数、付费金额等。
(2)指标去量纲的标准化处理
这里,以用户i为例,用户i对应用j的指标k标准化得分:其中,fijk表示用户i对应用j的指标k得分;skmq表示用户i对应用j的指标k的标准化得分;表示用户i对应用j的指标k得分的最小值;表示用户i对应用j的指标k得分的最大值。值得说明的是,i的取值范围是大于等于1且小于等于m的正整数,代表所有用户中的一个用户;j的取值范围是大于等于1且小于等于n的正整数,代表所有应用中的一个应用;指标k是指上述频度、粘度和额度。
(3)计算偏好得分矩阵
这里,计算偏好得分矩阵的方法有很多,本实施例以采用用户赋权法-熵值法建立偏好得分模型为例进行说明。
第一步:定义偏好得分评估体系;其中,定义的偏好得分评估体系如表1所示。
表1
第二步:计算三级指标熵值Hjk;
具体的,其中,sijk表示分类中第i个用户对第j个应用的第k个指标标准化得分,m为用户总数量,n为指标总数目。
第三步:计算三级指标熵权wjk;
这里,三级指标熵权wjk与表1中三级权重相对应。具体的,利用指标熵值Hjk计算指标熵权wjk,其中,n为指标总数目。
第四步:计算二级指标矩阵频度、粘度和额度;
具体的,s′ijk=[aij bij cij],其中,频度粘度额度
第五步:计算二级指标熵值及熵权;
这里,二级指标熵值及熵权的计算方法与第二步和第三步的方法相同。具体的。二级指标熵权二级指标熵值其中,表示分类中第i个用户对第j个应的第k个指标标准化得分,m为用户总数量,n为指标总数目。
第六步、计算用户i对应用j的偏好得分。
具体的,用户i对应用j的偏好得分为:gij=oj*aj+pj*bj+qj*cj。
示例的,以手机阅读为例,如表2所示。
步骤102、根据用户信息,确定用户间的综合相似度。
具体的,用户信息包括交往信息、应用偏好信息和终端信息;根据交往信息,确定所述用户间交往圈亲密相似度;根据应用偏好信息,确定用户间应用偏好相似度;根据终端信息,确定用户间终端信息相似度;根据用户间交往圈亲密相似度、用户间应用偏好相似度和用户间终端信息相似度,确定用户间综合相似度。
值得说明的是,本实施例中除了获取到用户的偏好得分,还会获取到用户间综合相似度,实现从多角度、全方位考虑用户信息,达到以高准确度向用户推荐应用。如图2所示,本发明综合相似度综合了用户关于交际圈、偏好和所使用终端三个维度的相似度,具体的,这三个维度的相似度分别为交往圈亲密相似度、产品偏好相似度和终端信息相似度。
具体的,如图3所示,对于第一用户,根据应用偏好信息,确定用户间应用偏好相似度可以包括:根据偏好信息,获取第一用户的第一应用使用频率向量和第二用户的第二应用使用频率向量;根据第一应用使用频率向量和第二应用使用频率向量,确定第一用户和第二用户间应用偏好相似度。
优选的,根据第一应用使用频率向量和第二应用使用频率向量,确定第一用户和第二用户间应用偏好相似度时,利用余弦相似度来确定出第一用户和第二用户间应用偏好相似度。
这里,余弦相似度又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估它们的相似度。余弦值的范围在[-1,1]之间,值越趋近于1,就代表两个向量的方向越趋近于0,它们的方向更加一致。
示例的,以向量和向量为例,其余弦相似度满足第一公式:其中θ表示向量和向量之间的夹角。具体到本实施例中,向量和向量可以是第一应用使用频率向量和第二应用使用频率向量;向量和向量还可以是第一用户终端信息向量和第二用户终端信息向量。
具体到本实施例中的第一用户和第二用户间应用偏好相似度,该应用偏好相似度取值范围在[0,1]之间,当该应用偏好相似度越大,即越接近于1时,表明第一用户的第一应用使用频率向量和第二用户的第二应用使用频率向量的夹角越小,说明第一用户和第二用户的相似度越高。
值得说明的是,第一应用使用频率向量中存放的是第一用户使用应用的频率得分,同样的,第二应用使用频率向量中存放的是第二用户使用应用的频率得分。这里,第一应用使用频率向量和第二应用使用频率向量中所指的应用是第一用户和第二用户共同使用的应用。
示例的,假设有A、B和C三个用户,使用应用1,2,3,4的频率得分如表3所示:
表3
使用频率得分 | 应用1 | 应用2 | 应用3 | 应用4 |
A | 0.84 | 0.21 | 0.54 | 0.32 |
B | 0.12 | 0.54 | 0.84 | 0.21 |
C | 0.51 | 0.95 | 0.21 | 0.23 |
这里,我们将A和B的应用偏好相似度记为sim_cos(A,B);同理,A和C的应用偏好相似度记为sim_cos(A,C);B和C的应用偏好相似度记为sim_cos(B,C)。根据上述余弦相似度第一公式可得:
其他两个应用偏好相似度的计算方法相类似,此处就不再详述。
具体的,终端信息包括终端品牌等级得分和终端价格等级得分,对于第一用户,根据终端信息,确定用户间终端信息相似度包括:根据终端信息,获取第一用户的第一终端品牌等级得分与第一终端价格等级得分和第二用户的第二终端品牌等级得分与第二终端价格等级得分;根据第一终端品牌等级得分、第一终端价格等级得分、第二终端品牌等级得分和第二终端价格等级得分,确定第一用户和第二用户间终端信息相似度。
终端可以在一定程度上反映用户的价值和用户的偏好,在实际中,使用同一类型终端的用户会存在一定的相似性。因此,可以利用终端品牌、终端价格、是否支持第四代移动通信技术(the 4th Generation mobile communication technology,4G)、是否国产终端、是否为合约机等构建终端信息相似度。由于终端信息都是序数类似的变量,可以采用斯皮尔曼等级相关系数来衡量用户的相似度。具体的,斯皮尔曼等级相关系数可以将终端品牌的文字信息、终端价格的价格区间等转化成等级得分。
这里,斯皮尔曼等级相关系数主要用于解决称名数据和顺序数据相关的问题,适用范围广,推荐系统中的GroupLens小组采用相关系数来度量用户的相似度,两者用户的相关程度越高,说明两者的相似度越高。
本实施例中终端信息选取终端品牌和终端价格,终端品牌和终端价格通过斯皮尔曼等级相关系数转化成终端品牌等级得分和终端价格等级得分后,同样采用余弦相似度来刻画终端信息相似度。第一用户和第二用户间终端信息相似度记为p12,该p12满足第二公式:其中,表示第一用户终端信息向量,该向量包括第一终端品牌等级得分和第一终端价格等级得分,同样的,表示第二用户终端信息向量,该向量包括第二终端品牌等级得分和第二终端价格等级得分。
示例的,依据斯皮尔曼等级相关系数,终端品牌等级得分转换表如表4所示,终端价格得分转换表如表5所示。假设先有用户A、B和C三人,结合表4和表5分析后,得知用户A、B和C的终端信息情况如表6所示。
表4
表5
价格区间 | 等级得分 |
1000以内 | 1 |
1000-2000 | 2 |
2000-3000 | 3 |
3000-4000 | 4 |
4000以上 | 5 |
表6
用户 | 终端品牌得分 | 终端价格得分 |
A | 3 | 1 |
B | 2 | 2 |
C | 1 | 3 |
结合表6和第二公式,可得:
具体的,交往信息包括用户之间的第一通话次数、用户之间的第一通话时长和用户之间的第一短信次数,对于第一用户,根据交往信息,确定所述用户间交往圈亲密相似度包括:根据通话次数、通话时长和短信次数,获取第一用户和第二用户之间的第二通话次数、第一用户和第二用户之间的第二通话时长和第一用户和第二用户之间的第二短信次数;根据第一通话次数、第一通话时长、第一短信次数、第二通话次数、第二通话时长和第二短信次数,确定第一用户和第二用户间交往圈亲密相似度。
如图4所示,正所谓“物以类聚,人以群分”,用户使用应用的时候很容易受到周围人的影响。因此,计算第一用户与交往圈第二用户的交往亲密度,这样就可以将与第一用户交往亲密度相似度较高的第二用户正使用的应用推荐给第一用户,便会提高推荐的准确性。
具体的,根据第一通话次数、第一通话时长、第一短信次数、第二通话次数、第二通话时长和第二短信次数,确定第一用户和第二用户间交往圈亲密相似度包括:根据第一通话次数,确定第一通话次数的第一最大值和第一最小值;根据第一通话时长,确定第一通话时长的第二最大值和第二最小值;根据第一通话短信,确定第一通话短信的第三最大值和第三最小值;根据第一最大值、第一最小值、第二最大值、第二最小值、第三最大值和第三最小值,分别确定第一通话次数的第一权值、第一通话时长的第二权值和第一短信次数的第三权值;根据第二通话次数、第一最小值、第二通话时长、第二最小值、第二短信次数、第三最小值、第一权值、第二权值和第三权值,确定第一用户和第二用户间交往圈亲密相似度。
本实施例中,亲密度记为Q,通话次数记为ccnt,通话时长记为cdur,短信次数记为mcnt,最大通话次数记为max(ccnt),最大通话时长记为max(cdur),最大短信次数记为max(mcnt),最小通话次数记为min(ccnt),最小通话时长记为min(cdur),最小短信次数记为min(mcnt),第一权值记为x,第二权值记为y,第三权值记为z,1和2分别代表第一用户和第二用户。优选的,Q12满足第三公式:
其中,
示例的,假设有A、B和C三个用户,他们之间的交往信息如表7所示。在表7中,“10次/30分钟/2条”表示用户A和B之间的通话次数为10次,通话时长为30分钟,短信条数为2条;“2次/5分钟/0条”表示用户A和C之间的通话次数为2次,通话时长为5分钟,短信条数为0条;“25次/60分钟/0条”表示用户B和C之间的通话次数为25次,通话时长为60分钟,短信条数为0条。
表7
ccnt/cdur/mcnt | A | B | C |
A | 10次/30分钟/2条 | 2次/5分钟/0条 | |
B | 25次/60分钟/0条 | ||
C |
结合第三公式可知:利用相同的方法可得:QAC=0;QBC=0.67。A、B和C用户间交往圈亲密相似度如表8所示。
表8
Q12 | A | B | C |
A | 0.6 | 0 | |
B | 0.67 | ||
C |
采用了3种维度交往圈、产品偏好程度、终端信息去描述用户间的相似度,这3种相似度结合起来可以让用户间的相似数据更加完整。
具体的,对于第一用户,根据用户间交往圈亲密相似度、用户间应用偏好相似度和用户间终端信息相似度,确定用户间综合相似度包括:确定第一用户和第二用户间交往圈亲密度、第一用户和第二用户间应用偏好相似度和第一用户和第二用户间终端信息相似度;确定第一用户和第二用户间交往圈亲密相似度、第一用户和第二用户间应用偏好相似度和第一用户和第二用户间终端信息相似度的平均值;根据平均值,确定第一用户和第二用户间综合相似度。
在本步骤上述中已经计算出第一用户和第二用户间三个维度上的相似度,接下来就要利用这三个维度上的相似度构建第一用户和第二用户间综合相似度。该第一用户和第二用户间综合相似度记为s(1,2),其中s(1,2)与第一用户和第二用户间交往圈亲密度相似度Q12、第一用户和第二用户间应用偏好相似度sim_cos(1,2)、第一用户和第二用户间终端信息相似度p12满足第三公式:其中n自然数。该第三公式的内在含义是指,先求取三个维度相似度的平均值,然后将该平均值映射到角度内,最终用该角度的正弦值表示综合相似度。这个综合相似度描述了三种维度的相似度,并且引入正弦得到归一化的结果,可以支持后面出推荐得分的计算,所有s(1,2)组成第一用户的相似度向量s1。
优选的,本实施例中n取2,会把上述平均值映射到直角范围内,该直角对应的正弦函数是单调函数,得到的综合相似度值域取值为[0,1],没有重复值的出现,故在保证差异性的同时还很好地确保了稳定性。
示例的,根据第一公式和第二公式,用户A、B和C之间的各个维度相似度如表9所示。
表9
Q12 | sim_cos(1,2) | p12 | |
A与B | 0.6 | 0.99 | 0.89 |
A与C | 0 | 0.8 | 0.6 |
B与C | 0.67 | 0.92 | 0.8 |
根据第三公式和表9可得:s(B,C)=0.95。
步骤103、根据应用偏好得分和综合相似度,确定推荐的应用。
具体的,根据应用偏好得分和综合相似度,确定应用的推荐预测得分;将前N个最大的推荐预测得分对应的应用确定为推荐的应用,N是小于总应用个数的正整数。
和传统基于用户的协同过滤推荐算法处理方式相似,以第一用户相似度向量s1作为权值,对用户范围内所有第二用户的对应用i的偏好得分进行加权评分,就可以得到第一用户对应用i的推荐预测得分。具体计算满足第四公式:其中,和分别表示第一用户和第二用户使用应用的偏好评分的平均值,P1,i表示第一用户对应用i的偏好得分,s(1,2)表示第一用户第二用户的综合相似度,该综合相似度作为权重,这里考虑了不同用户使用深度不同,偏好评分保守和积极的情况导致的偏差,克服了评价尺度不一致的缺点。
为第一用户对所有候选推荐应用进行预测评分后,根据推荐预测得分值对这些应用进行排序,选取得分值最高的前N个应用作为推荐应用,呈现给第一用户,作为推荐结果。
示例的,假设用户A、B和C的用户-应用偏好矩阵如表10所示;同时,用户A、B和C的综合相似度为:s(B,C)=0.95。
表10
应用r | 应用s | 应用t | 应用u | |
A | 4.6 | 0 | 0 | 2.4 |
B | 0 | 1 | 5.4 | 6.6 |
C | 0 | 0 | 9.2 | 0 |
其中,表10中的数字“0”代表用户的终端没有安装该应用。
根据表10和第四公式,可得:用户A对应用t的推荐预测得分为:采用同样的方法,可分别求得用户A对应用s的推荐预测得分、用户B对应用r的推荐预测得分和用户C对应用r、s、u的推荐预测得分,对用户A、B和C的推荐预测得分矩阵如表11所示。
表11
应用r | 应用s | 应用t | 应用u | |
A | 0.42 | 5.85 | ||
B | 4.93 | |||
C | 3.25 | 1.54 | 5.19 |
对于手机应用推荐系统,给每个用户推荐一款最有可能使用的应用,那么结果是对用户A推荐应用t,对用户B推荐应用r,对用户C推荐应用u。值得说明的是,表11中未得分的部分表示所属用户已在手机上安装相对应的应用,无需进行推荐。
这样一来,根据某一确定用户的应用偏好得分和该用户与其他用户的综合相似度,就可以高效、准确地确定出给该用户推荐的应用,这样,不仅考虑到该用户已安装或者使用的应用,还有考虑该用户与其他用户的综合相似度,从而达到对用户手机应用的高准确性推荐,使得应用的推荐成功率大大增加。
同时,在该用户不主动下载应用的时候,仍可根据综合相似度给该用户进行推荐,从而达到对用户手机应用的高准确性推荐,使得应用的推荐成功率大大增加。
实施例二
本发明实施例提供的一种应用推荐装置20,如图5所示,该装置20包括:
获取模块201,用于获取用户的应用偏好得分和用户信息;
确定模块202,用于根据所述用户信息,确定所述用户间的综合相似度;
所述确定模块还用于根据所述应用偏好得分和所述综合相似度,确定推荐的应用。
这样一来,根据某一确定用户的应用偏好得分和该用户与其他用户的综合相似度,就可以高效、准确地确定出给该用户推荐的应用,这样,不仅考虑到该用户已安装或者使用的应用,还有考虑该用户与其他用户的综合相似度,从而达到对用户手机应用的高准确性推荐,使得应用的推荐成功率大大增加。
同时,在该用户不主动下载应用的时候,仍可根据综合相似度给该用户进行推荐,从而达到对用户手机应用的高准确性推荐,使得应用的推荐成功率大大增加。
具体的,所述用户信息包括交往信息、应用偏好信息和终端信息,所述确定模块202具体用于:
根据所述交往信息,确定所述用户间交往圈亲密相似度;
根据所述应用偏好信息,确定所述用户间应用偏好相似度;
根据所述终端信息,确定所述用户间终端信息相似度;
根据所述用户间交往圈亲密相似度、所述用户间应用偏好相似度和所述用户间终端信息相似度,确定所述用户间综合相似度。
具体的,对于第一用户,所述确定模块202还具体用于:
根据所述偏好信息,获取所述第一用户的第一应用使用频率向量和第二用户的第二应用使用频率向量;
根据所述第一应用使用频率向量和所述第二应用使用频率向量,确定所述第一用户和所述第二用户间应用偏好相似度。
具体的,所述终端信息包括终端品牌等级得分和终端价格等级得分,对于第一用户,所述确定模块202还具体用于:
根据所述终端信息,获取所述第一用户的第一终端品牌等级得分与第一终端价格等级得分和第二用户的第二终端品牌等级得分与第二终端价格等级得分;
根据所述第一终端品牌等级得分、第一终端价格等级得分、第二终端品牌等级得分和第二终端价格等级得分,确定所述第一用户和所述第二用户间终端信息相似度。
具体的,所述交往信息包括所述用户之间的第一通话次数、所述用户之间的第一通话时长和所述用户之间的第一短信次数,对于第一用户,所述确定模块202还具体用于:
根据所述通话次数、所述通话时长和所述短信次数,获取所述第一用户和第二用户之间的第二通话次数、所述第一用户和所述第二用户之间的第二通话时长和所述第一用户和所述第二用户之间的第二短信次数;
根据所述第一通话次数、所述第一通话时长、所述第一短信次数、所述第二通话次数、所述第二通话时长和所述第二短信次数,确定所述第一用户和所述第二用户间交往圈亲密相似度。
具体的,对于第一用户,所述确定模块202还具体用于:
确定所述第一用户和第二用户间交往圈亲密度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度;
确定所述第一用户和所述第二用户间交往圈亲密相似度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度的平均值;
根据所述平均值,确定所述第一用户和所述第二用户间综合相似度。
进一步的,所述确定模块202还用于:
根据所述应用偏好得分和所述综合相似度,确定应用的推荐预测得分;
将前N个最大的所述推荐预测得分对应的应用确定为所述推荐的应用,所述N是小于总应用个数的正整数。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (14)
1.一种应用推荐方法,其特征在于,所述方法包括:
获取用户的应用偏好得分和用户信息;
根据所述用户信息,确定所述用户间的综合相似度;
根据所述应用偏好得分和所述综合相似度,确定推荐的应用。
2.根据权利要求1所述的方法,其特征在于,所述用户信息包括交往信息、应用偏好信息和终端信息,所述根据所述用户信息,确定所述用户间的综合相似度包括:
根据所述交往信息,确定所述用户间交往圈亲密相似度;
根据所述应用偏好信息,确定所述用户间应用偏好相似度;
根据所述终端信息,确定所述用户间终端信息相似度;
根据所述用户间交往圈亲密相似度、所述用户间应用偏好相似度和所述用户间终端信息相似度,确定所述用户间综合相似度。
3.根据权利要求2所述的方法,其特征在于,对于第一用户,所述根据所述应用偏好信息,确定所述用户间应用偏好相似度包括:
根据所述偏好信息,获取所述第一用户的第一应用使用频率向量和第二用户的第二应用使用频率向量;
根据所述第一应用使用频率向量和所述第二应用使用频率向量,确定所述第一用户和所述第二用户间应用偏好相似度。
4.根据权利要求2所述的方法,其特征在于,所述终端信息包括终端品牌等级得分和终端价格等级得分,对于第一用户,所述根据所述终端信息,确定所述用户间终端信息相似度包括:
根据所述终端信息,获取所述第一用户的第一终端品牌等级得分与第一终端价格等级得分和第二用户的第二终端品牌等级得分与第二终端价格等级得分;
根据所述第一终端品牌等级得分、第一终端价格等级得分、第二终端品牌等级得分和第二终端价格等级得分,确定所述第一用户和所述第二用户间终端信息相似度。
5.根据权利要求2所述的方法,其特征在于,所述交往信息包括所述用户之间的第一通话次数、所述用户之间的第一通话时长和所述用户之间的第一短信次数,对于第一用户,所述根据所述交往信息,确定所述用户间交往圈亲密相似度包括:
根据所述通话次数、所述通话时长和所述短信次数,获取所述第一用户和第二用户之间的第二通话次数、所述第一用户和所述第二用户之间的第二通话时长和所述第一用户和所述第二用户之间的第二短信次数;
根据所述第一通话次数、所述第一通话时长、所述第一短信次数、所述第二通话次数、所述第二通话时长和所述第二短信次数,确定所述第一用户和所述第二用户间交往圈亲密相似度。
6.根据权利要求2所述的方法,其特征在于,对于第一用户,所述根据所述用户间交往圈亲密相似度、所述用户间应用偏好相似度和所述用户间终端信息相似度,确定所述用户间综合相似度包括:
确定所述第一用户和第二用户间交往圈亲密度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度;
确定所述第一用户和所述第二用户间交往圈亲密相似度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度的平均值;
根据所述平均值,确定所述第一用户和所述第二用户间综合相似度。
7.根据权利要求1所述的方法,其特征在于,所述根据所述应用偏好得分和所述综合相似度,确定推荐的应用包括:
根据所述应用偏好得分和所述综合相似度,确定应用的推荐预测得分;
将前N个最大的所述推荐预测得分对应的应用确定为所述推荐的应用,所述N是小于总应用个数的正整数。
8.一种应用推荐装置,其特征在于,所述装置包括:
获取模块,用于获取用户的应用偏好得分和用户信息;
确定模块,用于根据所述用户信息,确定所述用户间的综合相似度;
所述确定模块还用于根据所述应用偏好得分和所述综合相似度,确定推荐的应用。
9.根据权利要求8所述的装置,其特征在于,所述用户信息包括交往信息、应用偏好信息和终端信息,所述确定模块具体用于:
根据所述交往信息,确定所述用户间交往圈亲密相似度;
根据所述应用偏好信息,确定所述用户间应用偏好相似度;
根据所述终端信息,确定所述用户间终端信息相似度;
根据所述用户间交往圈亲密相似度、所述用户间应用偏好相似度和所述用户间终端信息相似度,确定所述用户间综合相似度。
10.根据权利要求9所述的装置,其特征在于,对于第一用户,所述确定模块还具体用于:
根据所述偏好信息,获取所述第一用户的第一应用使用频率向量和第二用户的第二应用使用频率向量;
根据所述第一应用使用频率向量和所述第二应用使用频率向量,确定所述第一用户和所述第二用户间应用偏好相似度。
11.根据权利要求9所述的装置,其特征在于,所述终端信息包括终端品牌等级得分和终端价格等级得分,对于第一用户,所述确定模块还具体用于:
根据所述终端信息,获取所述第一用户的第一终端品牌等级得分与第一终端价格等级得分和第二用户的第二终端品牌等级得分与第二终端价格等级得分;
根据所述第一终端品牌等级得分、第一终端价格等级得分、第二终端品牌等级得分和第二终端价格等级得分,确定所述第一用户和所述第二用户间终端信息相似度。
12.根据权利要求9所述的装置,其特征在于,所述交往信息包括所述用户之间的第一通话次数、所述用户之间的第一通话时长和所述用户之间的第一短信次数,对于第一用户,所述确定模块还具体用于:
根据所述通话次数、所述通话时长和所述短信次数,获取所述第一用户和第二用户之间的第二通话次数、所述第一用户和所述第二用户之间的第二通话时长和所述第一用户和所述第二用户之间的第二短信次数;
根据所述第一通话次数、所述第一通话时长、所述第一短信次数、所述第二通话次数、所述第二通话时长和所述第二短信次数,确定所述第一用户和所述第二用户间交往圈亲密相似度。
13.根据权利要求9所述的装置,其特征在于,对于第一用户,所述确定模块还具体用于:
确定所述第一用户和第二用户间交往圈亲密度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度;
确定所述第一用户和所述第二用户间交往圈亲密相似度、所述第一用户和所述第二用户间应用偏好相似度和所述第一用户和所述第二用户间终端信息相似度的平均值;
根据所述平均值,确定所述第一用户和所述第二用户间综合相似度。
14.根据权利要求8所述的装置,其特征在于,所述确定模块还用于:
根据所述应用偏好得分和所述综合相似度,确定应用的推荐预测得分;
将前N个最大的所述推荐预测得分对应的应用确定为所述推荐的应用,所述N是小于总应用个数的正整数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610250789.5A CN107305559A (zh) | 2016-04-21 | 2016-04-21 | 一种应用推荐方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610250789.5A CN107305559A (zh) | 2016-04-21 | 2016-04-21 | 一种应用推荐方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107305559A true CN107305559A (zh) | 2017-10-31 |
Family
ID=60151603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610250789.5A Pending CN107305559A (zh) | 2016-04-21 | 2016-04-21 | 一种应用推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107305559A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109040164A (zh) * | 2018-05-21 | 2018-12-18 | 广州优视网络科技有限公司 | 应用推荐方法、装置、存储介质及计算机设备 |
CN109756868A (zh) * | 2017-11-01 | 2019-05-14 | 中国移动通信集团终端有限公司 | 应用程序的推荐方法、装置、设备和介质 |
CN110633408A (zh) * | 2018-06-20 | 2019-12-31 | 北京正和岛信息科技有限公司 | 智能商业资讯的推荐方法和系统 |
CN111027993A (zh) * | 2018-10-09 | 2020-04-17 | 中国移动通信集团山西有限公司 | 移动电话推荐方法、装置、设备及存储介质 |
CN112800291A (zh) * | 2021-04-15 | 2021-05-14 | 武汉卓尔数字传媒科技有限公司 | 一种相似账户确定方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609533A (zh) * | 2012-02-15 | 2012-07-25 | 中国科学技术大学 | 一种基于核方法的协同过滤推荐系统及方法 |
CN103823908A (zh) * | 2014-03-21 | 2014-05-28 | 北京飞流九天科技有限公司 | 基于用户偏好的内容推荐方法和服务器 |
CN104732422A (zh) * | 2015-02-27 | 2015-06-24 | 湖南大学 | 基于移动用户标签的个性化美食推荐方法 |
-
2016
- 2016-04-21 CN CN201610250789.5A patent/CN107305559A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609533A (zh) * | 2012-02-15 | 2012-07-25 | 中国科学技术大学 | 一种基于核方法的协同过滤推荐系统及方法 |
CN103823908A (zh) * | 2014-03-21 | 2014-05-28 | 北京飞流九天科技有限公司 | 基于用户偏好的内容推荐方法和服务器 |
CN104732422A (zh) * | 2015-02-27 | 2015-06-24 | 湖南大学 | 基于移动用户标签的个性化美食推荐方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109756868A (zh) * | 2017-11-01 | 2019-05-14 | 中国移动通信集团终端有限公司 | 应用程序的推荐方法、装置、设备和介质 |
CN109040164A (zh) * | 2018-05-21 | 2018-12-18 | 广州优视网络科技有限公司 | 应用推荐方法、装置、存储介质及计算机设备 |
CN110633408A (zh) * | 2018-06-20 | 2019-12-31 | 北京正和岛信息科技有限公司 | 智能商业资讯的推荐方法和系统 |
CN111027993A (zh) * | 2018-10-09 | 2020-04-17 | 中国移动通信集团山西有限公司 | 移动电话推荐方法、装置、设备及存储介质 |
CN111027993B (zh) * | 2018-10-09 | 2023-09-22 | 中国移动通信集团山西有限公司 | 移动电话推荐方法、装置、设备及存储介质 |
CN112800291A (zh) * | 2021-04-15 | 2021-05-14 | 武汉卓尔数字传媒科技有限公司 | 一种相似账户确定方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107305559A (zh) | 一种应用推荐方法和装置 | |
CN111291266A (zh) | 基于人工智能的推荐方法、装置、电子设备及存储介质 | |
EP3625734A2 (en) | Neural network based translation of natural language queries to database queries | |
CN104516897B (zh) | 一种针对应用对象进行排序的方法和装置 | |
CN106610970A (zh) | 基于协同过滤的内容推荐系统与方法 | |
Garg | Optimal selection of E‐learning websites using multiattribute decision‐making approaches | |
CN107341176A (zh) | 一种样本权重设置方法及装置,电子设备 | |
CN103246681A (zh) | 一种搜索方法及装置 | |
CN108322317A (zh) | 一种账号识别关联方法及服务器 | |
JP2021529369A (ja) | コンピュータで実行される見積もり方法、見積もり装置、電子機器及び記憶媒体 | |
CN113569129A (zh) | 点击率预测模型处理方法、内容推荐方法、装置及设备 | |
CN109690581A (zh) | 用户指导系统及方法 | |
CN107767152A (zh) | 产品购买倾向分析方法及服务器 | |
CN110222838A (zh) | 深度神经网络及其训练方法、装置、电子设备及存储介质 | |
CN104077327B (zh) | 核心词重要性识别方法和设备及搜索结果排序方法和设备 | |
CN113407854A (zh) | 一种应用推荐方法、装置、设备及计算机可读存储介质 | |
CN107016566A (zh) | 基于本体的用户模型构建方法 | |
CN112131261A (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN104778205B (zh) | 一种基于异构信息网络的移动应用排序和聚类方法 | |
Yin et al. | Analysis of the investment security of the accommodation industry for countries along the B&R: An empirical study based on panel data | |
CN110310012A (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
CN111368081A (zh) | 一种精选文本内容确定方法和系统 | |
CN116756281A (zh) | 知识问答方法、装置、设备和介质 | |
CN116822813A (zh) | 一种空间众包中任务分配方法、装置、设备及存储介质 | |
CN108229572A (zh) | 一种参数寻优方法及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171031 |