CN108833458B - 一种应用推荐方法、装置、介质及设备 - Google Patents

一种应用推荐方法、装置、介质及设备 Download PDF

Info

Publication number
CN108833458B
CN108833458B CN201810284503.4A CN201810284503A CN108833458B CN 108833458 B CN108833458 B CN 108833458B CN 201810284503 A CN201810284503 A CN 201810284503A CN 108833458 B CN108833458 B CN 108833458B
Authority
CN
China
Prior art keywords
user
application
target user
applications
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810284503.4A
Other languages
English (en)
Other versions
CN108833458A (zh
Inventor
陈彦其
段志云
向辉
周东谕
罗超凡
代继洪
赵增
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810284503.4A priority Critical patent/CN108833458B/zh
Publication of CN108833458A publication Critical patent/CN108833458A/zh
Application granted granted Critical
Publication of CN108833458B publication Critical patent/CN108833458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Abstract

本发明属于智能推荐技术领域,提供一种应用推荐方法、装置、介质及设备,本发明提供的技术方案中,将目标用户使用过的应用中偏好度大于第一阈值的应用,确定为目标用户的偏好应用;将与偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用;将与目标用户的余弦相似度大于第三阈值的用户,确定为目标用户的相似用户;将相似用户使用过的应用中目标用户未使用过的应用,作为第二类待推荐应用;将第一类待推荐应用以及第二类待推荐应用推荐给目标用户。本发明能够在一定程度上提高推荐给目标用户的应用的转化率。

Description

一种应用推荐方法、装置、介质及设备
技术领域
本申请涉及智能推荐技术领域,尤其涉及一种应用推荐方法、装置、介质及设备。
背景技术
现阶段,向不同用户推荐的应用均相同,即针对不同用户确定出的待推荐应用均相同,在确定待推荐应用过程中并不会考虑用户自身的特性,无法针对不同用户生成不同的待推荐应用,这就会导致推荐的应用转化率较低的问题。因此,如何向不同用户进行应用的个性化推荐是一个需要考虑的问题。
发明内容
本申请提供一种应用推荐方法、装置、介质及设备,用于解决现有技术中存在的推荐的应用转化率较低的问题。
第一方面,本申请实施例提供一种应用推荐方法,包括:将目标用户使用过的应用中偏好度大于第一阈值的应用,确定为所述目标用户的偏好应用;将与所述偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用;以及将与所述目标用户的余弦相似度大于第三阈值的用户,确定为所述目标用户的相似用户;将所述相似用户使用过的应用中所述目标用户未使用过的应用,作为第二类待推荐应用;将所述第一类待推荐应用以及所述第二类待推荐应用推荐给所述目标用户。本实施例中,与目标用户偏好的应用相似的应用也为该目标用户偏好的应用的概率较大,并且,目标用户将要使用的应用为与该目标用户的相似用户使用过的应用的概率较大,因此可在一定程度上提高推荐给目标用户的应用的转化率。
作为一种可能的实施方式,应用的偏好度是根据所述目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数确定的。
作为一种可能的实施方式,所述应用的偏好度为:所述目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数的加权求和结果。
作为一种可能的实施方式,将与所述目标用户的余弦相似度大于第三阈值的用户,确定为所述目标用户的相似用户,具体包括:针对所述目标用户之外的每个用户,确定该用户与所述目标用户共同使用过的应用的个数;根据该用户与所述目标用户共同使用过的应用的个数、该用户使用过的应用的个数以及所述目标用户使用过的应用的个数,确定该用户与所述目标用户的余弦相似度;将所述目标用户之外的用户中,与所述目标用户的余弦相似度大于第三阈值的用户,确定为所述目标用户的相似用户。
作为一种可能的实施方式,将所述第一类待推荐应用以及所述第二类待推荐应用推荐给所述目标用户,具体包括:分别对所述第一类待推荐应用以及所述第二类待推荐应用进行去重处理;按照次日留存率由高到低的顺序,从去重处理后的第一类待推荐应用中选取第一数目个待推荐应用推荐给所述目标用户;以及按照次日留存率由高到低的顺序,从去重处理后的第二类待推荐应用中选取第二数目个待推荐应用推荐给所述目标用户。这种实施方式,可避免向目标用户推荐的应用中出现相同的应用,并且,将次日留存率较高的应用推荐给目标用户,可保证向目标用户推荐的应用的品质。
作为一种可能的实施方式,本申请实施例提供的应用推荐方法,还包括:根据确定的评估指标,对所述第一类待推荐应用进行评估,所述评估指标包括准确度、召回率、覆盖度以及新颖度中的至少一项。这种实施方式可对第一类待推荐应用的可靠性进行评估。
作为一种可能的实施方式,对所述第一类待推荐应用的进行评估,具体包括:若所述准确度超过准确度阈值、所述召回率超过召回率阈值、所述覆盖度超过覆盖度阈值和/或所述新颖度超过新颖度阈值,则确定所述第一类待推荐应用可靠。这种实施方式可在至少一个评估指标大于其对应的阈值的情况下,实现对第一类待推荐应用的可靠性的评估。
作为一种可能的实施方式,按照以下方式确定所述评估指标:将各个目标用户对应的第一参数的和值与各个目标用户对应的第二参数的和值的比值,确定为所述准确度,其中,目标用户对应的第一参数为向该目标用户推荐的第一类待推荐应用中包含的该目标用户的偏好应用的个数,目标用户对应的第二参数为向该目标用户推荐的第一类待推荐应用中包含的待推荐应用的个数;以及将各个目标用户对应的第一参数的和值与各个目标用户对应的第三参数的和值的比值,确定为所述召回率,其中,目标用户对应的第三参数为该目标用户的偏好应用的个数;以及将各个目标用户对应的第二参数的和值与数据库中应用总个数的比值,确定为所述覆盖度;以及将各个目标用户对应的第四参数的和值与各个目标用户对应的第二参数的和值的比值,确定为所述新颖度,其中,目标用户对应的第四参数为向该用户推荐的第一类待推荐应用中包含的热门应用的个数。
第二方面,本申请实施例提供一种应用推荐装置,包括:第一确定模块,用于将目标用户使用过的应用中偏好度大于第一阈值的应用,确定为所述目标用户的偏好应用;第二确定模块,用于将与所述偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用;第三确定模块,用于将与所述目标用户的余弦相似度大于第三阈值的用户,确定为所述目标用户的相似用户;第四确定模块,用于将所述相似用户使用过的应用中所述目标用户未使用过的应用,作为第二类待推荐应用;推荐模块,用于将所述第一类待推荐应用以及所述第二类待推荐应用推荐给所述目标用户。
作为一种可能的实施方式,应用的偏好度是根据所述目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数确定的。
作为一种可能的实施方式,所述应用的偏好度为:所述目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数的加权求和结果。
作为一种可能的实施方式,所述第三确定模块,具体包括:第一确定单元,用于针对所述目标用户之外的每个用户,确定该用户与所述目标用户共同使用过的应用的个数;第二确定单元,用于根据该用户与所述目标用户共同使用过的应用的个数、该用户使用过的应用的个数以及所述目标用户使用过的应用的个数,确定该用户与所述目标用户的余弦相似度;第三确定单元,用于将所述目标用户之外的用户中,与所述目标用户的余弦相似度大于第三阈值的用户,确定为所述目标用户的相似用户。
作为一种可能的实施方式,所述推荐模块,具体包括:去重单元,用于分别对所述第一类待推荐应用以及所述第二类待推荐应用进行去重处理;第一选取单元,用于按照次日留存率由高到低的顺序,从去重处理后的第一类待推荐应用中选取第一数目个待推荐应用推荐给所述目标用户;以及第二选取单元,用于按照次日留存率由高到低的顺序,从去重处理后的第二类待推荐应用中选取第二数目个待推荐应用推荐给所述目标用户。
作为一种可能的实施方式,本申请实施提供的应用推荐装置,还包括:评估模块,用于根据确定的评估指标,对所述第一类待推荐应用进行评估,所述评估指标包括准确度、召回率、覆盖度以及新颖度中的至少一项。
作为一种可能的实施方式,所述评估模块,具体用于:若所述准确度超过准确度阈值、所述召回率超过召回率阈值、所述覆盖度超过覆盖度阈值和/或所述新颖度超过新颖度阈值,则确定所述第一类待推荐应用可靠。
作为一种可能的实施方式,本申请实施提供的应用推荐装置,还包括:指标确定模块,用于按照以下方式确定所述评估指标:将各个目标用户对应的第一参数的和值与各个目标用户对应的第二参数的和值的比值,确定为所述准确度,其中,目标用户对应的第一参数为向该目标用户推荐的第一类待推荐应用中包含的该目标用户的偏好应用的个数,目标用户对应的第二参数为向该目标用户推荐的第一类待推荐应用中包含的待推荐应用的个数;以及将各个目标用户对应的第一参数的和值与各个目标用户对应的第三参数的和值的比值,确定为所述召回率,其中,目标用户对应的第三参数为该目标用户的偏好应用的个数;以及将各个目标用户对应的第二参数的和值与数据库中应用总个数的比值,确定为所述覆盖度;以及将各个目标用户对应的第四参数的和值与各个目标用户对应的第二参数的和值的比值,确定为所述新颖度,其中,目标用户对应的第四参数为向该用户推荐的第一类待推荐应用中包含的热门应用的个数。
第三方面,本申请实施例提供另一种应用推荐方法,包括:确定对目标应用的偏好度大于第一阈值的第一用户群;分别确定与所述第一用户群中每个用户的余弦相似度大于第三阈值的相似用户;确定各个相似用户中未使用过所述目标应用的目标用户;将所述目标应用推荐给确定出的每一个目标用户。本实施例中,与偏好目标应用的第一用户群相似的用户也偏好该目标应用的概率较大,此时将各个相似用户中未使用过目标应用的用户作为目标用户,并将目标应用推荐给目标用户,可在一定程度上提高目标应用的转化率。
第四方面,本申请实施例提供另一种应用推荐装置,包括:用户群确定模块,用于确定对目标应用的偏好度大于第一阈值的第一用户群;相似用户确定模块,用于分别确定与所述第一用户群中每个用户的余弦相似度大于第三阈值的相似用户;目标用户确定模块,用于确定各个相似用户中未使用过所述目标应用的目标用户;推荐模块,用于将所述目标应用推荐给确定出的每一个目标用户。
第五方面,本申请实施例提供一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现上述第一方面提供的任一应用推荐方法的步骤。
第六方面,本申请实施例提供一种计算机设备,包括:存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述程序时实现上述第一方面提供的任一应用推荐方法的步骤。
第七方面,本申请实施例提供一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现上述第三方面提供的应用推荐方法的步骤。
第八方面,本申请实施例提供一种计算机设备,包括:存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述程序时实现上述第三方面提供的应用推荐方法的步骤。
本申请实施例提的应用推荐方法、装置、介质及设备,根据与目标用户偏好的应用相似的应用以及目标用户的相似用户使用过的应用中该目标用户未使用过的应用作为针对该目标用户的应用个性化推荐结果并推荐给该目标用户,其中,与目标用户偏好的应用相似的应用也为该目标用户偏好的应用的概率较大,并且,目标用户将要使用的应用为与该目标用户的相似用户使用过的应用的概率较大,因此可在一定程度上提高推荐给目标用户的应用的转化率。以及,与偏好目标应用的第一用户群相似的用户也偏好该目标应用的概率较大,此时将各个相似用户中未使用过目标应用的用户作为目标用户,并将目标应用推荐给目标用户,可在一定程度上提高目标应用的转化率。
附图说明
通过参考附图阅读下文的详细描述,本申请示例性实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,其中:
图1为本申请实施例提供的应用推荐方法的应用场景示意图;
图2为本申请实施例提供的一应用推荐方法的流程示意图;
图3为本申请实施例提供的确定目标用户的相似用户的方法流程示意图;
图4为本申请实施例提供的将待推荐应用推荐给目标用户的方法流程示意图;
图5为本申请实施例提供的实现游戏推荐的实施过程流程示意图;
图6为本申请实施例提供的另一应用推荐方法的流程示意图;
图7为本申请实施例提供的一应用推荐装置结构示意图;
图8为本申请实施例提供的另一应用推荐装置结构示意图;
图9为本申请实施例提供的计算机设备的硬件结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。为了方便理解,下面对本申请实施例中涉及的名词进行解释。
用户使用过的应用:用户在预设时间段内登陆的应用以及注册的应用。
次日留存率:当日使用过某一应用的用户中在当日的下一日还使用该应用的用户数与当日使用过该应用的用户数的比值。
热门应用:指应用运营商主推的应用以及用户数超过一定值的应用。
准确度:用户的偏好应用在向用户推荐的应用中所占的比例。
召回率:向用户推荐的应用在用户的偏好应用中所占的比例。
覆盖度:向用户推荐的应用在所有应用中所占的比例。
新颖度:热门应用在向用户推荐的应用中所占的比例。
偏好度:用于反应用户对应用的喜爱程度,与用户对应用的喜爱程度成正比。
发明人发现,现有技术在确定待推荐应用过程中并不会考虑用户自身的特性,无法针对不同用户生成不同的待推荐应用,也就无法生成针对不同用户的应用个性化推荐结果,这就会导致推荐的应用转化率较低的问题。
为此,本申请实施例提供一种应用推荐方法,该方法在实现过程中参考了目标用户偏好的应用以及与目标用户相似的用户使用过的应用,从而能够生成针对该目标用户的应用个性化推荐结果,该方法可以包括:将目标用户使用过的应用中偏好度大于第一阈值的应用,确定为该目标用户的偏好应用;将与偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用;以及,将与目标用户的余弦相似度大于第三阈值的用户,确定为目标用户的相似用户;将相似用户使用过的应用中目标用户未使用过的应用,作为第二类待推荐应用;将第一类待推荐应用以及第二类待推荐应用推荐给目标用户。
本申请实施例提供的应用推荐方法,根据与目标用户偏好的应用相似的应用以及目标用户的相似用户使用过的应用中该目标用户未使用过的应用确定针对该目标用户的应用个性化推荐结果并推荐给该目标用户,其中,与目标用户偏好的应用相似的应用也为该目标用户偏好的应用的概率较大,并且,目标用户将要使用的应用为与该目标用户的相似用户使用过的应用的概率较大,因此可在一定程度上提高推荐给目标用户的应用的转化率。
下面结合图1提供的应用场景,对本申请实施例提供的应用推荐方案进行说明。
如图1所示,包括数据库服务器101、计算服务器102以及客户端103。其中,数据库服务器101中存储了在预设时间段内各个用户的历史应用数据。计算服务器102从数据库服务器101获取用户的历史应用数据;根据用户的历史应用数据确定各个用户使用过的应用;并将目标用户使用过的应用中偏好度大于第一阈值的应用,确定为目标用户的偏好应用;将与偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用;以及,将与目标用户的余弦相似度大于第三阈值的用户,确定为目标用户的相似用户;将相似用户使用过的应用中目标用户未使用过的应用,作为第二类待推荐应用;将第一类待推荐应用以及第二类待推荐应用发送至该目标用户登录的客户端103。目标用户可在客户端103中查看计算服务器102向其推荐的第一类待推荐应用以及第二类待推荐应用。
图1中,数据库服务器101与计算服务器102可通过局域网、广域网或移动互联网等通信网络进行通信,计算服务器102与客户端103可通过局域网、广域网或移动互联网等通信网络进行通信。数据库服务器101、服务器设备102以及客户端103可以为便携设备(例如:手机、平板、笔记本电脑等),也可以为个人电脑(PC,Personal Computer)。
作为另一种应用场景,图1中的数据库服务器和计算服务器可以为同一台计算设备,即数据库服务器可以具备计算服务器的功能,计算服务器可以具备数据库服务器的功能。
需要注意的是,上文涉及的应用场景仅是为了便于理解本申请的精神和原理而示出,本申请实施例在此方面不受任何限制。相反,本申请实施例可以应用于适用的任何场景。
下面结合图2,对本申请实施例提供的应用推荐方法进行说明。需要说明的是,本申请实施例中涉及的目标用户为待推荐应用的任一用户,实际应用中,可针对每个目标用户执行本申请实施例提供的应用推荐方法。
如图2所示,本申请实施例提供的应用推荐方法,可以包括以下步骤:
步骤201,将目标用户使用过的应用中偏好度大于第一阈值的应用,确定为该目标用户的偏好应用。
具体实施时,可获取目标用户在预设时间段内的历史应用数据;从获取的历史应用数据中提取目标用户使用过的应用;确定目标用户对使用过的每个应用的偏好度,并将用户使用过的应用中偏好度大于第一阈值的应用,作为该目标用户的偏好应用。
具体实施时,目标用户在预设时间段内的历史应用数据包括了登录应用的时间、登录应用的时长以及登录应用的次数,可针对目标用户使用过的每个应用,从目标用户在预设时间段内的历史应用数据中,统计出该目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数,其中,登录该应用的时长为该目标用户在预设时间段内登录该应用的总时长,使用过该应用的次数该目标用户在预设时间段内使用过该应用的总次数。
针对目标用户使用过的每个应用,可根据统计出的该目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数中的至少两项,确定该应用的偏好度,该应用的偏好度即该目标用户对该应用的偏好度,从而得到目标用户对使用过的每个应用的偏好度;将目标用户使用过的应用中偏好度大于第一阈值的应用确定为目标用户的偏好应用。可选地,应用的偏好度是根据目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数确定的。这种结合三方面因素确定出的应用的偏好度更加准确可靠。
其中,预设时间段为当前时间之前的一个时间段,预设时间段对应的时长可根据实际应用场景设定,这里不做限定,比如,预设时间段对应的时长为三个月、两个月等。第一阈值的大小可根据实际需求设定,这里不做限定。
具体实施时,可按照以下方式确定应用的偏好度:
针对目标用户使用过的每个应用,计算目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数的加权求和结果;将该加权求和结果作为目标用户对该应用的偏好度。即,应用的偏好度为:目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数的加权求和结果。
具体实施时,可预先分别为登录应用的天数、登录应用的时长以及使用过该应用的次数设置权重。可根据登录应用的天数、登录应用的时长以及使用过该应用的次数的重要程度为三者设置相应的权重大小,三者的权重的具体值这里不做限定。可选地,用于衡量应用偏好度较重要的因素的权重比用于衡量用户对应用偏好度不重要的因素的权重大。实际应用中,登录应用的天数为用于衡量用户对应用偏好度较重要的因素,因此,本申请实施例中可将登录应用的天数的权重设置的比登录应用的时长以及使用过应用的次数的权重大,比如,将登录应用的天数的权重设置为4,将登录应用的时长以及使用过该应用的次数的权重均设置为3。
可选地,还可按照以下方式确定应用的偏好度大于第一阈值:
针对目标用户使用过的每个应用,若目标用户在预设时间段内登录该应用的天数大于天数阈值、登录该应用的时长大于时长阈值并且使用过该应用的次数大于次数阈值,则确定该应用的偏好度大于第一阈值;或者,
针对目标用户使用过的每个应用,若目标用户在预设时间段内登录该应用的天数大于天数阈值,则确定该应用的偏好度大于第一阈值;或者,若目标用户在预设时间段内登录该应用的天数等于天数阈值,并且,目标用户在预设时间段内登录该应用的次数大于次数阈值,则确定该应用的偏好度大于第一阈值;或者,若目标用户在预设时间段内登录该应用的天数等于天数阈值,目标用户在预设时间段内登录该应用的次数等于次数阈值,并且,目标用户在预设时间段内登录该应用的时长大于时长阈值,则确定该应用的偏好度大于第一阈值。
需要说明的是,本申请实施例涉及的应用可以为游戏或者办公软件等类型的应用。
步骤202,将与偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用。
具体实施时,可针对目标用户的偏好应用之外的每个应用,确定该应用与用户的偏好应用的相似度;将与目标用户的偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用。
其中,可按照以下方式确定两个应用的相似度,其中,将两个应用中的一个应用称为第一应用,另一个应用称为第二应用:
方式一:确定所有用户中偏好第一应用的用户集合以及偏好第二应用的用户集合;确定偏好第一应用的用户集合中的用户数,作为第一用户数;以及,确定偏好第二应用的用户集合中的用户数,作为第二用户数;以及,确定偏好第一应用的用户集合与偏好第二应用的用户集合的交集中的用户数,作为第三用户数;根据第一用户数、第二用户数以及第三用户数,确定第一应用与第二应用的余弦相似度,作为第一应用与第二应用的相似度,具体的余弦相似度计算公式如下:
Figure BDA0001615627520000121
其中,wab表示应用a和应用b之间的余弦相似度,M(a)表示偏好应用a的用户集合,M(b)表示偏好应用b的用户集合,|M(a)∩M(b)|表示第三用户数,|M(a)|表示第一用户数,|M(b)|表示第二用户数,a表示两个应用中的第一应用,b表示两个应用中的第二应用。
通常情况下,在进行应用推荐的过程中,偏好热门应用的用户数相对较多,即热门应用的推荐权重较高,本申请实施例中,应用之间的余弦相似度能够惩罚热门应用的推荐权重,两个应用中只要存在热门应用,分母
Figure BDA0001615627520000122
的值就会增大,从而降低热门应用的推荐优先级,这样有利于向用户推荐非热门应用,从而提高非热门应用的曝光率。此外,将应用之间的余弦相似度作为两个应用的相似度,还能够挖掘出更多的长尾应用。
方式二:确定所有用户中偏好第一应用的用户集合以及偏好第二应用的用户集合;确定偏好第一应用的用户集合与偏好第二应用的用户集合的交集中的用户数,作为第三用户数;确定偏好第一应用的用户集合与偏好第二应用的用户集合的并集中的用户数,作为第四用户数,将第三用户数与第四用户数的比值作为第一应用与第二应用的相似度,具体的计算公式如下:
Figure BDA0001615627520000123
其中,rab表示应用a和应用b之间的相似度,M(a)表示偏好应用a的用户集合,M(b)表示偏好应用b的用户集合,|M(a)∩M(b)|表示第三用户数,|M(a)∪M(b)|表示第四用户数,a表示两个应用中的第一应用,b表示两个应用中的第二应用。
通常情况下,在进行应用推荐的过程中,偏好热门应用的用户数相对较多,即热门应用的推荐权重较高,本申请实施例中,rab的计算公式能够惩罚热门应用的推荐权重,两个应用中只要存在热门应用,分母|M(a)∪M(b)|的值就会增大,从而降低热门应用的推荐优先级,这样有利于向用户推荐非热门应用,从而提高非热门应用的曝光率。
步骤203,将与该目标用户的余弦相似度大于第三阈值的用户,确定为目标用户的相似用户。
具体实施时,针对目标用户之外的每个用户,确定该用户与目标用户的余弦相似度,并将与该目标用户的余弦相似度大于第三阈值的用户,作为目标用户的相似用户。可根据用户的应用行为数据以及用户属性等信息,确定两个用户的余弦相似度,或者按照其他方式确定两个用户的余弦相似度,这里不做限定。更具体的,两个用户的余弦相似度为根据两个用户的历史应用数据确定出的余弦相似度。
步骤204,将相似用户使用过的应用中该目标用户未使用过的应用,作为第二类待推荐应用。
具体实施时,两个相似的用户具有共同偏好的可能性较大,此时,与目标用户相似的用户使用过的应用为该目标用户期望的应用或者使用过的应用的可能性较大,因此,本步骤中从目标用户的各个相似用户使用过的应用中提取该目标用户未使用过的应用,作为第二类待推荐应用。
需要说明的是,不对步骤201-步骤202与步骤203-步骤204的执行顺序进行限定,也可先执行步骤203-步骤204,后执行步骤201-步骤202,或者,步骤203-步骤204与步骤201-步骤202同时执行。
步骤205,将第一类待推荐应用以及第二类待推荐应用推荐给该目标用户。
具体实施时,可将第一类待推荐应用以及第二类待推荐应用中的所有应用均推荐给目标用户,或者,从第一类待推荐应用和第二类待推荐应用的并集中选取一定数量的应用推荐给目标用户,或者按照其他方式实施步骤205,这里不做限定。
本申请实施例提供的应用推荐方法,根据与目标用户偏好的应用相似的应用以及目标用户的相似用户使用过的应用中该目标用户未使用过的应用作为针对该目标用户的应用个性化推荐结果并推荐给该目标用户,其中,与目标用户偏好的应用相似的应用也为该目标用户偏好的应用的概率较大,并且,目标用户将要使用的应用为与该目标用户的相似用户使用过的应用的概率较大,因此可在一定程度上提高推荐给目标用户的应用的转化率。
作为一种可能的实施方式,按照图3提供的内容,将与目标用户的余弦相似度大于第三阈值的用户,确定为目标用户的相似用户:
步骤301,针对该目标用户之外的每个用户,确定该用户与该目标用户共同使用过的应用的个数。
步骤302,根据该用户与该目标用户共同使用过的应用的个数、该用户使用过的应用的个数以及该目标用户使用过的应用的个数,确定该用户与该目标用户的余弦相似度。
具体实施时,根据用户在预设时间段内的历史应用数据,确定目标用户在预设时间段内使用过的应用的集合以及该目标用户之外的每个用户在预设时间段内使用过的应用的集合;针对目标用户之外的每个用户,将该用户在预设时间段内使用过的应用的集合与目标用户在预设时间段内使用过的应用的集合的交集中的应用个数,作为该用户与该目标用户共同使用过的应用的个数,以及,将目标用户在预设时间段内使用过的应用的集合中应用的个数作为该目标用户使用过的应用的个数,将该用户在预设时间段内使用过的应用的集合中应用的个数作为该用户使用过的应用的个数。
可按照以下公式确定目标用户之外的任一用户与该目标用户的余弦相似度:针对应用
Figure BDA0001615627520000151
其中,u表示目标用户,v表示目标用户之外的任一用户,|wuv|表示目标用户之外的任一用户与目标用户的余弦相似度,|N(u)∩N(v)|表示目标用户之外的任一用户与目标用户共同使用过的应用的个数,|N(u)|表示目标用户使用过的应用的个数,|N(v)|表示目标用户之外的任一用户使用过的应用的个数,N(u)为目标用户使用过的应用的集合,N(v)为目标用户之外的任一用户使用过的应用的集合。
需要说明的是,不对步骤301与步骤302的执行顺序进行限定,也可先执行步骤302,后执行步骤302,或者,步骤301与步骤302同时执行。
步骤303,将该目标用户之外的用户中,与该目标用户的余弦相似度大于第三阈值的用户,确定为该目标用户的相似用户。
作为一种可能的实施方式,按照图4提供的内容,将第一类待推荐应用以及第二类待推荐应用推荐给目标用户:
步骤401,分别对第一类待推荐应用以及第二类待推荐应用进行去重处理。
具体实施时,当目标用户的偏好应用包括多个时,针对每个偏好应用,确定与该偏好应用相似的应用,并将与各个偏好应用相似的应用作为第一类待推荐应用,此时,第一类待推荐应用中不免会出现重复的应用,因此,本步骤中对第一类待推荐应用进行去重处理,去重处理后的第一类待推荐应用中不存在两个相同的应用,其中,与该偏好应用相似的应用即与该偏好应用的相似度大于第二阈值的应用。比如与偏好应用A相似的应用包括应用a和应用b,与偏好应用B相似的应用包括应用a和应用c,则去重前的第一类待推荐应用为应用a、应用b、应用a、应用c,去重后的第一类待推荐应用为应用a、应用b、应用c,即,第一类待推荐应用中仅保留一个重复的应用a即可。
当目标用户的相似用户(以下简称相似用户)包括多个时,针对每个相似用户,确定该相似用户使用过的应用中该目标用户未使用过的应用,并将各个相似用户使用过的应用中该目标用户未使用过的应用作为第二类待推荐应用,此时,第二类待推荐应用中不免会出现重复的应用,因此,本步骤中对第二类待推荐应用进行去重处理,去重处理后的第二类待推荐应用中不存在两个相同的应用。比如相似用户A使用过但目标用户未你使用过的应用包括应用1、应用2,相似用户B使用过但目标用户未使用过的应用包括应用1、应用3,则,去重前的第二类待推荐应用为应用1、应用2、应用1、应用3,去重后的第二类待推荐应用为应用1、应用2、应用3,即,第二类待推荐应用中仅保留一个重复的应用1即可。
步骤402,按照次日留存率由高到低的顺序,从去重处理后的第一类待推荐应用中选取第一数目个待推荐应用推荐给目标用户。
步骤403,按照次日留存率由高到低的顺序,从去重处理后的第二类待推荐应用中选取第二数目个待推荐应用推荐给目标用户。
具体实施时,分别计算去重后的第一类待推荐应用中每个应用的次日留存率,按照次日留存率由高到低的顺序,从去重后的第一类待推荐应用中选取第一数目个待推荐应用推荐给目标用户。其中,第一数目的大小可根据经验设定,这里不做限定,比如,设置为8、10等。
分别计算去重后的第二类待推荐应用中每个应用的次日留存率,按照次日留存率由高到低的顺序,从去重后的第二类待推荐应用中选取第二数目个待推荐应用推荐给目标用户。其中,第二数目的大小可根据经验设定,这里不做限定,比如,设置为8、9等。第一数目与第二数目可以相同也可以不同。
这种实施方式,可避免向目标用户推荐的应用中出现相同的应用,并且,将次日留存率较高的应用推荐给目标用户,可保证向目标用户推荐的应用的品质。
需要说明的是,不对步骤402与步骤403的执行顺序进行限定,也可先执行步骤403,后执行步骤402,或者,步骤402与步骤403同时执行。
在实际应用中,若从去重后的第一类待推荐应用中选取的第一数目个待推荐应用和从去重处理后的第二类待推荐应用中选取的第二数目个待推荐应用存在重复的应用,则按照次日留存率由高到低的顺序,从去重后的第一类待推荐应用中,当前未选取的应用中选取待推荐应用,替换重复的应用;或者,按照次日留存率由高到低的顺序,从去重后的第二类待推荐应用中,当前未选取的应用中选取待推荐应用,替换重复的应用。比如,从去重后的第一类待推荐应用中选取的待推荐应用为应用a、应用1,从去重处理后的第二类待推荐应用中选取的待推荐应用为应用a、应用2,其中,应用a为重复的应用,则可从去重后的第一类待推荐应用中选取应用c,替换从去重后的第一类待推荐应用中选取的应用a,此时,从去重后的第一类待推荐应用中选取的待推荐应用更新为应用c、应用1,此时向用户推荐的应用为应用c、应用1,应用a以及应用2。
作为一种可能的实施方式,本申请实施例提供的应用推荐方法还可以包括对第一类待推荐应用的可靠性进行评估的方式,即:根据确定的评估指标,对第一类待推荐应用进行评估,评估指标包括准确度、召回率、覆盖度以及新颖度中的至少一项。
具体实施时,可对确定出的要向目标用户推荐的第一类待推荐应用的可靠性进行评估。若各个评估指标中存在至少一个评估指标大于相应指标对应的阈值,则确定第一类待推荐应用可靠,即,若准确度、召回率、覆盖度以及新颖度中存在至少一项大于其各自对应的阈值,则确定第一类待推荐应用可靠,比如:若准确度大于准确度阈值、召回率大于召回率阈值、覆盖度大于覆盖度阈值或者新颖度大于新颖度阈值,则确定第一类待推荐应用可靠。实际应用中,对确定的推荐结果进行评估时,准确度和召回率是两个具有重要参考意义的指标,因此,可选地,评估指标至少包括准确度和召回率这两项。
可选地,按照以下方式对第一类待推荐应用的进行评估:
若准确度超过准确度阈值、召回率超过召回率阈值、覆盖度超过覆盖度阈值和/或新颖度超过新颖度阈值,则确定第一类待推荐应用可靠,其中,同时考虑四个评估指标的评估方式,可以使评估出的第一类待推荐应用的可靠性更加准确。
可选地,还可按照以下方式对第一类待推荐应用进行评估:
计算各个评估指标的加权求和结果,若该加权求和结果大于结果阈值,则确定第一类待推荐应用可靠。比如在评估指标同时包括准确度、召回率、覆盖度以及新颖度的情况下,确定准确度、召回率、覆盖度以及新颖度的加权求和结果,若该加权求和结果大于结果阈值,则确定第一类待推荐应用可靠。其中,可将对第一类待推荐应用的可靠性影响比较大的指标的权重设置的相对较大。
在具体实施时,可根据针对利用本申请实施例提供的应用推荐方法进行推荐应用的每个目标用户对应的各个参数,确定各个评估指标,其中,该目标用户对应的第一参数为向该目标用户推荐的第一类待推荐应用中包含的该目标用户的偏好应用的个数;该目标用户对应的第二参数为向该目标用户推荐的第一类待推荐应用中包含的待推荐应用的个数;目标用户对应的第三参数为该目标用户的偏好应用的个数;目标用户对应的第四参数为向该目标用户推荐的第一类待推荐应用中包含的热门应用的个数。可按照以下方式,基于上述参数确定相应的评估指标:
将各个目标用户对应的第一参数的和值与各个目标用户对应的第二参数的和值的比值,确定为准确度;将各个目标用户对应的第一参数的和值与各个目标用户对应的第三参数的和值的比值,确定为召回率;将各个目标用户对应的第二参数的和值与数据库中应用总个数的比值,确定为覆盖度;将各个目标用户对应的第四参数的和值与各个目标用户对应的第二参数的和值的比值,确定为新颖度。
具体实施时,准确度的计算公式为:
Figure BDA0001615627520000191
其中,u表示目标用户,K表示目标用户的总个数,R(u)表示向目标用户u推荐的第一类待推荐应用的集合,T(u)表示目标用户u的偏好应用的集合,|R(u)|表示目标用户u对应的第二参数,即向目标用户u推荐的第一类待推荐应用中包含的待推荐应用的个数,|R(u)∩T(u)|表示目标用户u对应的第一参数,即向目标用户u推荐的第一类待推荐应用中包含的目标用户u的偏好应用的个数。
具体实施时,召回率的计算公式为:
Figure BDA0001615627520000192
其中,u表示目标用户,K表示目标用户的总个数,R(u)表示向目标用户u推荐的第一类待推荐应用的集合,T(u)表示目标用户u的偏好应用的集合,|T(u)|表示目标用户u对应的第三参数,即目标用户u的偏好应用的个数,|R(u)∩T(u)|表示目标用户u对应的第一参数,即向目标用户u推荐的第一类待推荐应用中包含的目标用户u的偏好应用的个数。
具体实施时,覆盖度的计算公式为:
Figure BDA0001615627520000193
其中,u表示目标用户,K表示目标用户的总个数,R(u)表示向目标用户u推荐的第一类待推荐应用的集合,|R(u)|表示目标用户u对应的第二参数,即向目标用户u推荐的第一类待推荐应用中包含的待推荐应用的个数,U表示数据库中应用总个数。具体实施时,数据库为用于存储应用运营商可为用户推荐的所有应用,比如,数据库中的应用可以为应用市场中的所有应用,或者为应用运营商运营的所有应用。
具体实施时,新颖度的计算公式为:
Figure BDA0001615627520000201
其中,u表示目标用户,K表示目标用户的总个数,R(u)表示向目标用户u推荐的第一类待推荐应用的集合,|R(u)|表示目标用户u对应的第二参数,即向目标用户u推荐的第一类待推荐应用中包含的待推荐应用的个数,G(u)表示热门应用的集合,|R(u)∩G(u)|表示目标用户u对应的第四参数,即向目标用户推荐的第一类待推荐应用中包含的热门应用的个数。
下面介绍在本申请实施例涉及的应用为游戏类型的应用的情况下,利用本申请实施例提供的应用推荐方法实现游戏推荐的具体实现过程。
如图5所示,为本发明实施例提供的游戏推荐方法的实现过程流程图,包括:
步骤501,针对目标用户玩过的每个游戏,若目标用户在预设时间段内登录该游戏的天数大于天数阈值、登录该游戏的时长大于时长阈值并且玩过该应用的次数大于次数阈值,则确定该目标用户对该游戏的偏好度大于第一阈值。
需要强调的是,在本发明实施涉及的应用为游戏的情况下,用户使用过的应用即为用户玩过的游戏。
步骤502,将该目标用户玩过的游戏中偏好度大于第一阈值的游戏,确定为该目标用户的偏好游戏。
步骤503,将与该目标用户的偏好游戏的相似度大于第二阈值的游戏,作为第一类待推荐游戏。
步骤504,针对该目标用户之外的每个用户,确定该用户与该目标用户共同玩过的游戏的个数。
步骤505,根据该用户与该目标用户共同玩过的游戏的个数、该用户玩过的游戏的个数以及该目标用户玩过的游戏的个数,确定该用户与该目标用户的余弦相似度。
步骤506,将与所该目标用户的余弦相似度大于第三阈值的用户,确定为该目标用户的相似用户。
步骤507,将所该目标用户的相似用户玩过的游戏中该目标用户未玩过的游戏,作为第二类待推荐游戏。
步骤508,分别对第一类待推荐游戏以及第二类待推荐游戏进行去重处理。
步骤509,按照次日留存率由高到低的顺序,从去重处理后的第一类待推荐游戏中选取第一数目个待推荐游戏推荐给目标用户,以及,按照次日留存率由高到低的顺序,从去重处理后的第二类待推荐游戏中选取第二数目个待推荐游戏推荐给目标用户。
下面结合图6对本申请实施例提供的另一种应用推荐方法进行说明,如图6所示,包括:
步骤601,确定对目标应用的偏好度大于第一阈值的第一用户群。
其中,用户对目标应用的偏好度的确定方式参考上述实施例提供的确定游戏偏好度的确定方式,这里不做赘述。
步骤602,分别确定与第一用户群中每个用户的余弦相似度大于第三阈值的相似用户。
具体实施时,针对第一用户群中的每个用户,确定与该用户的余弦相似度大于第三阈值的用户,作为该用户的相似用户,以得到第一用户群中各个用户的相似度用户。
步骤603,确定与第一用户群中每个用户的余弦相似度大于第三阈值的相似用户中未使用过目标应用的目标用户。
具体实施时,将第一用户群中各个用户的相似度用户中,为使用过目标应用的用户作为目标用户。
步骤604,将该目标应用推荐给确定出的每一个目标用户。
本实施例中,与偏好目标应用的第一用户群相似的用户也偏好该目标应用的概率较大,此时将各个相似用户中未使用过目标应用的用户作为目标用户,并将目标应用推荐给目标用户,可在一定程度上提高目标应用的转化率。
下面结合图7对本申请实施例提供的一应用推荐装置进行说明。
如图7所示,为本申请实施例提供的应用推荐装置的结构示意图,包括:
第一确定模块701,用于将目标用户使用过的应用中偏好度大于第一阈值的应用,确定为该目标用户的偏好应用;
第二确定模块702,用于将与偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用;
第三确定模块703,用于将与该目标用户的余弦相似度大于第三阈值的用户,确定为该目标用户的相似用户;
第四确定模块704,用于将相似用户使用过的应用中该目标用户未使用过的应用,作为第二类待推荐应用;
推荐模块705,用于将第一类待推荐应用以及第二类待推荐应用推荐给该目标用户。
作为一种可能的实施方式,应用的偏好度是根据目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数确定的。
作为一种可能的实施方式,应用的偏好度为:目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用过该应用的次数的加权求和结果。
作为一种可能的实施方式,第三确定模块703,具体包括:
第一确定单元7031,用于针对该目标用户之外的每个用户,确定该用户与该目标用户共同使用过的应用的个数;
第二确定单元7032,用于根据该用户与该目标用户共同使用过的应用的个数、该用户使用过的应用的个数以及该目标用户使用过的应用的个数,确定该用户与该目标用户的余弦相似度;
第三确定单元7033,用于将该目标用户之外的用户中,与该目标用户的余弦相似度大于第三阈值的用户,确定为该目标用户的相似用户。
作为一种可能的实施方式,推荐模块705,具体包括:
去重单元7051,用于分别对第一类待推荐应用以及第二类待推荐应用进行去重处理;
第一选取单元7052,用于按照次日留存率由高到低的顺序,从去重处理后的第一类待推荐应用中选取第一数目个待推荐应用推荐给该目标用户;以及
第二选取单元7053,用于按照次日留存率由高到低的顺序,从去重处理后的第二类待推荐应用中选取第二数目个待推荐应用推荐给该目标用户。
作为一种可能的实施方式,本申请实施提供的应用推荐装置,还包括:
评估模块706,用于根据确定的评估指标,对第一类待推荐应用进行评估,评估指标包括准确度、召回率、覆盖度以及新颖度中的至少一项。
作为一种可能的实施方式,评估模块706,具体用于:
若准确度超过准确度阈值、召回率超过召回率阈值、覆盖度超过覆盖度阈值和/或新颖度超过新颖度阈值,则确定第一类待推荐应用可靠。
作为一种可能的实施方式,本申请实施提供的应用推荐装置,还包括:
指标确定模块707,用于按照以下方式确定评估指标:
将各个目标用户对应的第一参数的和值与各个目标用户对应的第二参数的和值的比值,确定为准确度,其中,目标用户对应的第一参数为向该目标用户推荐的第一类待推荐应用中包含的该目标用户的偏好应用的个数,目标用户对应的第二参数为向该目标用户推荐的第一类待推荐应用中包含的待推荐应用的个数;以及
将各个目标用户对应的第一参数的和值与各个目标用户对应的第三参数的和值的比值,确定为召回率,其中,目标用户对应的第三参数为该目标用户的偏好应用的个数;以及
将各个目标用户对应的第二参数的和值与数据库中应用总个数的比值,确定为覆盖度;以及
将各个目标用户对应的第四参数的和值与各个目标用户对应的第二参数的和值的比值,确定为新颖度,其中,目标用户对应的第四参数为向该用户推荐的第一类待推荐应用中包含的热门应用的个数。
下面结合图8对本申请实施例提供的另一应用推荐装置进行说明。
如图8所示,为本申请实施例提供另一种应用推荐装置的结构示意图,包括:
用户群确定模块801,用于确定对目标应用的偏好度大于第一阈值的第一用户群;
相似用户确定模块802,用于分别确定与第一用户群中每个用户的余弦相似度大于第三阈值的相似用户;
目标用户确定模块803,用于确定各个相似用户中未使用过目标应用的目标用户;
推荐模块804,用于将目标应用推荐给确定出的每一个目标用户。
介绍了本申请实施例提供的应用推荐方法和装置之后,下面介绍本申请实施例提供的非易失性计算机存储介质。
本申请实施例提供一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现上述实施例提供的任一应用推荐方法的步骤。
介绍了本申请实施例提供的应用推荐方法、装置及介质之后,下面介绍本申请实施例提供的计算机设备。
本申请实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述程序时实现上述实施例中的任一应用推荐方法的步骤。
本申请实施例还提供一种计算机设备,用于执行上述实施例中的任一应用推荐方法,如图9所示,为本申请实施中所述的计算机设备的硬件结构示意图,该计算机设备具体可以为台式计算机、便携式计算机、智能手机、平板电脑等。具体地,该计算机设备可以包括存储器901、处理器902及存储在存储器上的计算机程序,所述处理器执行所述程序时实现上述实施例中的任一应用推荐方法的步骤。其中,存储器901可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器902提供存储器901中存储的程序指令和数据。
进一步地,本申请实施例中所述的计算机设备还可以包括输入装置903以及输出装置904等。输入装置903可以包括键盘、鼠标、触摸屏等;输出装置904可以包括显示设备,如液晶显示器(Liquid Crystal Display,LCD)、阴极射线管(Cathode Ray Tube,CRT),触摸屏等。存储器901,处理器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
处理器902调用存储器901存储的程序指令并按照获得的程序指令执行上述实施例提供的任一应用推荐方法。
利用本申请实施例提的应用推荐方法、装置、介质及设备,至少具有以下有益效果:根据与目标用户偏好的应用相似的应用以及目标用户的相似用户使用过的应用中该目标用户未使用过的应用作为针对该目标用户的应用个性化推荐结果并推荐给该目标用户,其中,与目标用户偏好的应用相似的应用也为该目标用户偏好的应用的概率较大,并且,目标用户将要使用的应用为与该目标用户的相似用户使用过的应用的概率较大,因此可在一定程度上提高推荐给目标用户的应用的转化率。以及,与偏好目标应用的第一用户群相似的用户也偏好该目标应用的概率较大,此时将各个相似用户中未使用过目标应用的用户作为目标用户,并将目标应用推荐给目标用户,可在一定程度上提高目标应用的转化率。
应当注意,尽管在上文详细描述中提及了应用推荐装置的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (15)

1.一种应用推荐方法,其特征在于,包括:
将目标用户使用过的应用中偏好度大于第一阈值的应用,确定为所述目标用户的偏好应用;所述偏好度是所述目标用户对应用的偏好度;
将与所述偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用;其中,按照以下方式确定两个应用的相似度:确定所有用户中偏好所述两个应用中第一应用的用户集合以及偏好所述两个应用中第二应用的用户集合;确定偏好所述第一应用的用户集合中的用户数,作为第一用户数,以及,确定偏好所述第二应用的用户集合中的用户数,作为第二用户数,以及,确定偏好所述第一应用的用户集合与偏好所述第二应用的用户集合的交集中的用户数,作为第三用户数;根据所述第一用户数、所述第二用户数以及所述第三用户数,确定所述第一应用与所述第二应用的余弦相似度,其中,所述第一应用与所述第二应用的余弦相似度与所述第三用户数呈正比例关系,且与所述第一用户数以及所述第二用户数呈反比例关系;以及
将与所述目标用户的余弦相似度大于第三阈值的用户,确定为所述目标用户的相似用户;其中,一个用户与所述目标用户的余弦相似度,是根据所述一个用户与所述目标用户共同使用过的应用的个数、所述一个用户使用过的应用的个数、所述目标用户使用过的应用的个数确定的,且所述一个用户与所述目标用户的余弦相似度,与所述一个用户与所述目标用户共同使用过的应用的个数呈正比例关系,且与所述一个用户使用过的应用的个数以及所述目标用户使用过的应用的个数呈反比例关系;
将所述相似用户使用过的应用中所述目标用户未使用过的应用,作为第二类待推荐应用;
按照次日留存率由高到低的顺序,从所述第一类待推荐应用以及所述第二类待推荐应用选取至少一个待推荐应用推荐给所述目标用户。
2.根据权利要求1所述的方法,其特征在于,应用的偏好度是根据所述目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用该应用的次数确定的。
3.根据权利要求2所述的方法,其特征在于,所述应用的偏好度为:所述目标用户在预设时间段内登录该应用的天数、登录该应用的时长以及使用该应用的次数的加权求和结果。
4.根据权利要求1所述的方法,其特征在于,将与所述目标用户的余弦相似度大于第三阈值的用户,确定为所述目标用户的相似用户,具体包括:
针对所述目标用户之外的每个用户,确定该用户与所述目标用户共同使用过的应用的个数;
根据该用户与所述目标用户共同使用过的应用的个数、该用户使用过的应用的个数以及所述目标用户使用过的应用的个数,确定该用户与所述目标用户的余弦相似度;
将所述目标用户之外的用户中,与所述目标用户的余弦相似度大于第三阈值的用户,确定为所述目标用户的相似用户。
5.根据权利要求1所述的方法,其特征在于,将所述第一类待推荐应用以及所述第二类待推荐应用推荐给所述目标用户,具体包括:
分别对所述第一类待推荐应用以及所述第二类待推荐应用进行去重处理;
按照次日留存率由高到低的顺序,从去重处理后的第一类待推荐应用中选取第一数目个待推荐应用推荐给所述目标用户;以及
按照次日留存率由高到低的顺序,从去重处理后的第二类待推荐应用中选取第二数目个待推荐应用推荐给所述目标用户。
6.根据权利要求1所述的方法,其特征在于,还包括:
根据确定的评估指标,对所述第一类待推荐应用进行评估,所述评估指标包括准确度、召回率、覆盖度以及新颖度中的至少一项。
7.根据权利要求6所述的方法,其特征在于,对所述第一类待推荐应用的进行评估,具体包括:
若所述准确度超过准确度阈值、所述召回率超过召回率阈值、所述覆盖度超过覆盖度阈值和/或所述新颖度超过新颖度阈值,则确定所述第一类待推荐应用可靠。
8.根据权利要求6或7所述的方法,其特征在于,按照以下方式确定所述评估指标:
将各个目标用户对应的第一参数的和值与各个目标用户对应的第二参数的和值的比值,确定为所述准确度,其中,目标用户对应的第一参数为向该目标用户推荐的第一类待推荐应用中包含的该目标用户的偏好应用的个数,目标用户对应的第二参数为向该目标用户推荐的第一类待推荐应用中包含的待推荐应用的个数;以及
将各个目标用户对应的第一参数的和值与各个目标用户对应的第三参数的和值的比值,确定为所述召回率,其中,目标用户对应的第三参数为该目标用户的偏好应用的个数;以及
将各个目标用户对应的第二参数的和值与数据库中应用总个数的比值,确定为所述覆盖度;以及
将各个目标用户对应的第四参数的和值与各个目标用户对应的第二参数的和值的比值,确定为所述新颖度,其中,目标用户对应的第四参数为向该用户推荐的第一类待推荐应用中包含的热门应用的个数。
9.一种应用推荐方法,其特征在于,包括:
确定对目标应用的偏好度大于第一阈值的第一用户群;
分别确定与所述第一用户群中每个用户的余弦相似度大于第三阈值的相似用户;其中,第一用户和第二用户的余弦相似度是根据所述第一用户与所述第二用户共同使用过的应用的个数、所述第一用户使用过的应用的个数和所述第二用户 使用过的应用的个数确定的,且所述第一用户与所述第二用户的余弦相似度,与所述第一用户与所述第二用户共同使用过的应用的个数呈正比例关系,且与所述第一用户使用过的应用的个数以及所述第二用户使用过的应用的个数呈反比例关系,所述第一用户和所述第二用户为所述第一用户群中的不同用户;
确定各个相似用户中未使用过所述目标应用的目标用户;
将所述目标应用推荐给确定出的每一个目标用户。
10.一种应用推荐装置,其特征在于,包括:
第一确定模块,用于将目标用户使用过的应用中偏好度大于第一阈值的应用,确定为所述目标用户的偏好应用;
第二确定模块,用于将与所述偏好应用的相似度大于第二阈值的应用,作为第一类待推荐应用;其中,按照以下方式确定两个应用的相似度:确定所有用户中偏好所述两个应用中第一应用的用户集合以及偏好所述两个应用中第二应用的用户集合;确定偏好所述第一应用的用户集合中的用户数,作为第一用户数,以及,确定偏好所述第二应用的用户集合中的用户数,作为第二用户数,以及,确定偏好所述第一应用的用户集合与偏好所述第二应用的用户集合的交集中的用户数,作为第三用户数;根据所述第一用户数、所述第二用户数以及所述第三用户数,确定所述第一应用与所述第二应用的余弦相似度,其中,所述第一应用与所述第二应用的余弦相似度与所述第三用户数呈正比例关系,且与所述第一用户数以及所述第二用户数呈反比例关系;
第三确定模块,用于将与所述目标用户的余弦相似度大于第三阈值的用户,确定为所述目标用户的相似用户;其中,一个用户与所述目标用户的余弦相似度,是根据所述一个用户与所述目标用户共同使用过的应用的个数、所述一个用户使用过的应用的个数、所述目标用户使用过的应用的个数确定的,且所述一个用户与所述目标用户的余弦相似度,与所述一个用户与所述目标用户共同使用过的应用的个数呈正比例关系,且与所述一个用户使用过的应用的个数以及所述目标用户使用过的应用的个数呈反比例关系;
第四确定模块,用于将所述相似用户使用过的应用中所述目标用户未使用过的应用,作为第二类待推荐应用;
推荐模块,用于按照次日留存率由高到低的顺序,从所述第一类待推荐应用以及所述第二类待推荐应用选取至少一个待推荐应用推荐给所述目标用户。
11.一种应用推荐装置,其特征在于,包括:
用户群确定模块,用于确定对目标应用的偏好度大于第一阈值的第一用户群;
相似用户确定模块,用于分别确定与所述第一用户群中每个用户的余弦相似度大于第三阈值的相似用户;其中,第一用户和第二用户的余弦相似度是根据所述第一用户与所述第二用户共同使用过的应用的个数、所述第一用户使用过的应用的个数和所述第二用户使用过的应用的个数确定的,且所述第一用户与所述第二用户的余弦相似度,与所述第一用户与所述第二用户共同使用过的应用的个数呈正比例关系,且与所述第一用户使用过的应用的个数以及所述第二用户使用过的应用的个数呈反比例关系,所述第一用户和所述第二用户为所述第一用户群中的不同用户;
目标用户确定模块,用于确定各个相似用户中未使用过所述目标应用的目标用户;
推荐模块,用于将所述目标应用推荐给确定出的每一个目标用户。
12.一种非易失性计算机存储介质,其特征在于,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现权利要求1-8任一所述方法的步骤。
13.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述程序时实现权利要求1-8任一所述方法的步骤。
14.一种非易失性计算机存储介质,其特征在于,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现权利要求9所述方法的步骤。
15.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述程序时实现权利要求9所述方法的步骤。
CN201810284503.4A 2018-04-02 2018-04-02 一种应用推荐方法、装置、介质及设备 Active CN108833458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810284503.4A CN108833458B (zh) 2018-04-02 2018-04-02 一种应用推荐方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810284503.4A CN108833458B (zh) 2018-04-02 2018-04-02 一种应用推荐方法、装置、介质及设备

Publications (2)

Publication Number Publication Date
CN108833458A CN108833458A (zh) 2018-11-16
CN108833458B true CN108833458B (zh) 2021-08-06

Family

ID=64155304

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810284503.4A Active CN108833458B (zh) 2018-04-02 2018-04-02 一种应用推荐方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN108833458B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614549B (zh) * 2018-12-10 2019-11-12 北京字节跳动网络技术有限公司 用于推送信息的方法和装置
CN109636538A (zh) * 2018-12-20 2019-04-16 成都知数科技有限公司 银行产品推荐方法、装置及服务器
CN110390605B (zh) * 2019-07-25 2021-11-30 新奥(中国)燃气投资有限公司 一种改造方案推送方法及装置
CN110532473A (zh) * 2019-08-30 2019-12-03 车智互联(北京)科技有限公司 一种内容推荐方法及计算设备
CN114286999A (zh) * 2019-11-05 2022-04-05 深圳市欢太科技有限公司 推送内容的处理方法、装置、电子设备以及存储介质
CN111444438B (zh) * 2020-03-24 2023-09-01 北京百度网讯科技有限公司 召回策略的准召率的确定方法、装置、设备及存储介质
CN113590925A (zh) * 2020-04-30 2021-11-02 中国移动通信集团北京有限公司 一种用户确定方法、装置、设备及计算机存储介质
CN111899049A (zh) * 2020-07-23 2020-11-06 广州视源电子科技股份有限公司 广告投放方法、装置及设备
CN112365290A (zh) * 2020-11-26 2021-02-12 上海触乐信息科技有限公司 提高应用的用户留存率的方法、装置、存储介质和服务器
CN113434779B (zh) * 2021-07-22 2023-01-03 咪咕数字传媒有限公司 可智能推荐的互动阅读方法、装置、计算设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765751A (zh) * 2014-01-07 2015-07-08 腾讯科技(深圳)有限公司 应用推荐方法及装置
CN106997358A (zh) * 2016-01-22 2017-08-01 中移(杭州)信息技术有限公司 信息推荐方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999588A (zh) * 2012-11-15 2013-03-27 广州华多网络科技有限公司 一种多媒体应用的推荐方法和系统
CN104504084B (zh) * 2014-12-24 2018-07-31 小米科技有限责任公司 确定用户留存率的方法及装置
CN107122990A (zh) * 2017-03-22 2017-09-01 广州优视网络科技有限公司 应用推荐方法、客户端、服务器及系统
CN107239524A (zh) * 2017-05-26 2017-10-10 四川九洲电器集团有限责任公司 一种对象推荐方法及设备
CN107566358B (zh) * 2017-08-25 2020-10-30 腾讯科技(深圳)有限公司 一种风险预警提示方法、装置、介质及设备
CN107562917B (zh) * 2017-09-12 2021-04-06 广州酷狗计算机科技有限公司 用户推荐方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765751A (zh) * 2014-01-07 2015-07-08 腾讯科技(深圳)有限公司 应用推荐方法及装置
CN106997358A (zh) * 2016-01-22 2017-08-01 中移(杭州)信息技术有限公司 信息推荐方法及装置

Also Published As

Publication number Publication date
CN108833458A (zh) 2018-11-16

Similar Documents

Publication Publication Date Title
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
CN113610239B (zh) 针对机器学习的特征处理方法及特征处理系统
CN103116582B (zh) 一种信息检索方法及相关系统和装置
CN108322317B (zh) 一种账号识别关联方法及服务器
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理系统
CN108021673A (zh) 一种用户兴趣模型生成方法、职位推荐方法及计算设备
CN110675017A (zh) 基于人工智能的绩效评价方法和装置
WO2019019649A1 (zh) 投资组合产品的生成方法、装置、存储介质和计算机设备
CN111401700A (zh) 一种数据分析方法、装置、计算机系统及可读存储介质
CN104598539A (zh) 一种互联网事件热度计算方法及终端
CN111612581A (zh) 一种物品推荐的方法、装置、设备及存储介质
CN112396211A (zh) 一种数据预测方法及装置、设备和计算机存储介质
CN106156123B (zh) 活跃值计算方法及装置
CN110580265B (zh) Etl任务的处理方法、装置、设备及存储介质
CN110633304B (zh) 组合特征筛选方法、装置、计算机设备及存储介质
Almomani et al. Selecting a good stochastic system for the large number of alternatives
CN113516065B (zh) 基于区块链的资料权重测算方法、装置、服务器及存储介质
US9122705B1 (en) Scoring hash functions
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN115185606A (zh) 业务配置参数的获得方法、装置、设备及存储介质
CN111625720B (zh) 数据决策项目执行策略的确定方法、装置、设备和介质
CN113934894A (zh) 基于指标树的数据显示方法、终端设备
CN108229572A (zh) 一种参数寻优方法及计算设备
CN111598390B (zh) 服务器高可用性评估方法、装置、设备和可读存储介质
CN114021642A (zh) 数据处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant