CN107103036B - 应用下载概率的获取方法、设备及可编程设备 - Google Patents

应用下载概率的获取方法、设备及可编程设备 Download PDF

Info

Publication number
CN107103036B
CN107103036B CN201710174513.8A CN201710174513A CN107103036B CN 107103036 B CN107103036 B CN 107103036B CN 201710174513 A CN201710174513 A CN 201710174513A CN 107103036 B CN107103036 B CN 107103036B
Authority
CN
China
Prior art keywords
application
user
target
download
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710174513.8A
Other languages
English (en)
Other versions
CN107103036A (zh
Inventor
潘岸腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Uc Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Uc Network Technology Co ltd filed Critical Guangzhou Uc Network Technology Co ltd
Priority to CN201710174513.8A priority Critical patent/CN107103036B/zh
Publication of CN107103036A publication Critical patent/CN107103036A/zh
Application granted granted Critical
Publication of CN107103036B publication Critical patent/CN107103036B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明公开了一种应用下载概率的获取方法、设备及可编程设备。所述方法包括:获取目标用户的历史下载信息、目标应用的下载比例以及目标用户对目标应用的应用偏好指标,以构建目标特征向量;通过预先构建的下载概率预测模型处理目标特征向量,以获取目标用户对目标应用的下载概率。根据本发明,可以实时获取用户对应用的下载概率,使得可以根据所获取的应用下载概率预估推荐应用获取的收益来向用户推荐应用,实现提供应用推荐服务的应用平台的营收最大化。

Description

应用下载概率的获取方法、设备及可编程设备
技术领域
本发明涉及互联网应用技术领域,更具体地,涉及一种应用下载概率的获取方法、设备及可编程设备。
背景技术
随着互联网技术的飞速发展,以及电子设备的移动化以及智能化的普及,越来越多的用户习惯通过诸如手机、平板设备这类电子设备,下载应用进行安装,以获取该应用提供的服务。为用户推荐应用并提供下载的应用平台,例如应用商店,随之应运而生。
应用商店作为向用户推荐应用、以及提供用户搜索应用、免费下载应用的应用平台,其运营模式通常是通过向用户推荐应用以提升应用的下载量,以此从提供应用的应用运营商处获取推广收益来实现营收。因此,如何利用应用商店的有限资源(包括用户资源、应用展示为资源等)来推荐应用,以获取营收最大化,是应用商店运营者最关心的问题。
目前的应用商店,一般是通过在其优质的展示位置中,优先推荐预期收益高的应用来实现营收最大化,因此,如何确定预期收益高的应用来进行推荐,成为关键。而除了对应的应用运营商可提供的推广收益之外,决定应用的预期收益的核心因素,还有应用的下载概率,应用的下载概率越高,对应的推荐应用可获取的实际应用下载量一般也越高,可以带来更高的收益。因此,如何获取应用的下载概率,成为决定应用商店如何实现营收最大化的关键问题。
发明内容
本发明的一个目的是提供一种用于应用下载概率的获取的新技术方案。
根据本发明的第一方面,提供了一种应用下载概率的获取方法,包括:
获取目标用户的历史下载信息、目标应用的下载比例以及所述目标用户对所述目标应用的应用偏好指标,以构建目标特征向量,
其中,所述目标用户对所述目标应用的应用偏好指标至少包括所述目标用户对所述目标应用的应用偏好度和所述目标用户对所述目标应用所属的应用分类的应用分类偏好度;
通过预先构建的下载概率预测模型处理所述目标特征向量,以获取所述目标用户对所述目标应用的下载概率。
可选地,所述方法还包括:
根据所有用户的与应用相关的历史行为数据,获取多个模型训练样本,其中,
每个所述模型训练样本,表征一个应用被向一个用户展示后是否被该用户下载;
对每个所述模型训练样本,获取对应的样本特征向量,
其中,所述样本特征向量包括对应的所述模型训练样本所对应的特定用户的历史下载信息、对应的所述模型训练样本所对应的特定应用的下载比例以及所述特定用户对所述特定应用的应用偏好指标,
所述特定用户对所述特定应用的应用偏好指标至少包括所述特定用户对所述特定应用的应用偏好度和所述特定用户对所述特定应用所属的应用分类的应用分类偏好度;
对所获取的多个所述样本特征向量,通过回归算法训练以构建所述下载概率预测模型。
可选地,
所述历史下载信息是对应的用户的应用平均下载数量;
所述下载比例是对应的应用的被下载总次数与被展示总次数之比。
可选地,
获取一个用户对一个应用的所述应用偏好度的步骤包括:
获取该用户的安装应用列表,
其中,所述安装应用列表中包括对应的用户已安装的所有应用;
根据所述安装应用列表和已获取的应用相似性矩阵,获取该用户对该应用的所述应用偏好度,
其中,所述应用相似性矩阵中包括每个应用与其他应用之间的相似度。
进一步可选地,获取一个用户对一个应用的所述应用偏好度的步骤还包括:
获取每个应用的用户安装向量,
其中,所述用户安装向量用于表征所有用户中每个用户是否安装对应的应用;
根据所获取的多个所述用户安装向量,分别计算每个应用与其他应用之间的相似度,以构建所述应用相似性矩阵。
可选地,
获取一个用户对一个应用所属的应用分类的所述应用分类偏好度的步骤包括:
获取该用户安装属于该应用分类的应用安装数量和所有用户安装属于该应用分类的应用的平均应用安装数量;
根据所述应用安装数量和所述平均应用安装数量,获取该用户对该应用分类的所述应用分类偏好度。
可选地,所述回归算法是逻辑斯蒂回归算法。
根据本发明的第二方面,提供一种应用下载概率的获取设备,包括:
目标特征构建单元,用于获取目标用户的历史下载信息、目标应用的下载比例以及所述目标用户对所述目标应用的应用偏好指标,以构建目标特征向量,
其中,所述目标用户对所述目标应用的应用偏好指标至少包括所述目标用户对所述目标应用的应用偏好度和所述目标用户对所述目标应用所属的应用分类的应用分类偏好度;
下载概率获取单元,用于通过预先构建的下载概率预测模型处理所述目标特征向量,以获取所述目标用户对所述目标应用的下载概率。
进一步可选地,还包括:
样本训练单元,用于根据所有用户的与应用相关的历史行为数据,获取多个模型训练样本,其中,
每个所述模型训练样本,表征一个应用被向一个用户展示后是否被该用户下载;
样本特征获取单元,对每个所述模型训练样本,获取对应的样本特征向量,
其中,所述样本特征向量包括对应的所述模型训练样本所对应的特定用户的历史下载信息、对应的所述模型训练样本所对应的特定应用的下载比例以及所述特定用户对所述特定应用的应用偏好指标,
所述特定用户对所述特定应用的应用偏好指标至少包括所述特定用户对所述特定应用的应用偏好度和所述特定用户对所述特定应用所属的应用分类的应用分类偏好度;
模型构建单元,用于对所获取的多个所述样本特征向量,通过回归算法训练以构建所述下载概率预测模型。
根据本发明的第三方面,提供一种可编程设备,
包括存储器和处理器,
所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行本发明的第一方面提供的任一项应用下载概率的获取方法。
本发明的发明人发现,在现有技术中,尚未存在一种应用下载概率的获取方法、设备及可编程设备,使得可以根据所获取的应用下载概率预估推荐应用获取的收益来推荐应用。因此,本发明所要实现的技术任务或者所要解决的技术问题是本领域技术人员从未想到的或者没有预期到的,故本发明是一种新的技术方案。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是显示可用于实现本发明的实施例的实施环境的硬件配置的例子的框图。
图2示出了本发明的实施例的应用下载概率的获取方法的流程图。
图3示出了本发明的实施例的应用下载概率的获取方法的流程图。
图4示出了本发明的实施例的应用下载概率的获取方法的流程图。
图5示出了本发明的实施例的应用下载概率的获取方法的流程图。
图6示出了本发明的实施例的应用下载概率的获取方法的流程图。
图7示出了本发明的实施例的应用下载概率的获取设备的框图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1是示出可以实现本发明的实施例的实施环境1000的硬件配置的框图。
如图1所示,实施环境1000包括服务器1100、客户端1200以及网络1300。
服务器1100例如可以是刀片服务器等。在一个例子中,服务器1100可以是一台计算机。在在另一个例子中,服务器1100可以如图1所示,包括处理器1110、存储器1120、接口装置1130、通信装置1140、显示装置1150、输入装置1160。尽管服务器也可以包括扬声器、麦克风等等,但是,这些部件与本发明无关,故在此省略。其中,处理器1110例如可以是中央处理器CPU、微处理器MCU等。存储器1120例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1130例如包括USB接口、串行接口等。通信装置1140例如能够进行有线或无线通信。显示装置1150例如是液晶显示屏。输入装置1160例如可以包括触摸屏、键盘等。
客户端设备1200可以是便携式电脑(1200-1)、台式计算机(1200-2)、手机(1200-3)、平板电脑(1200-4)等。通信网络1300可以是无线网络也可以网络,可以是局域网也可以是广域网。在图1所示的配置环境1000中,客户端1200-1、1200-2、1200-3、1200-4以及服务器1100可以通过通信网络1300进行通信。
图1所示的配置环境1100仅是解释性的,并且决不是为了要限制本发明、其应用或用途。应用于本发明的实施例中,服务器1100的所述存储器1120用于存储指令,所述指令用于控制所述处理器1110进行操作以执行本发明实施例提供的任意一项应用下载概率的预测方法。本领域技术人员应当理解,尽管在图1中对网页服务器1100以及客户端1200都示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,服务器1100只涉及处理器1110和存储装置1120。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
<实施例>
本发明实施例的总体构思,是提供一种应用下载概率的获取方法、设备及可编程设备,使得可以根据所获取的应用下载概率预估推荐应用获取的收益来推荐应用,实现提供应用推荐服务的应用平台(例如应用商店)的营收最大化。
<方法>
所述应用下载概率的获取方法如图2所示,包括:
步骤S2100,获取目标用户的历史下载信息、目标应用的下载比例以及所述目标用户对所述目标应用的应用偏好指标,以构建目标特征向量;
其中,用户的历史下载信息,用于衡量用户的应用下载意愿,可以通过该用户所使用的提供应用下载、推荐服务的应用平台(例如应用商店)获取,例如,通过该用户使用的应用商店记录的该用户的与应用相关的历史行为数据获取。
具体地,所述历史下载信息可以是对应的用户的应用平均下载数量,例如,可以是根据该用户使用应用商店进行的与应用相关的历史行为数据,计算的该用户使用应用商店下载应用的平均数量,更具体地,通过该用户历史下载应用的总数量除以该用户历史使用应用商店的次数获取。
所述目标应用的下载比例,用于衡量目标应用本身的受欢迎程度。
具体地,所述下载比例是对应的应用的被下载总次数与被展示总次数之比,可以通过提供该应用的下载服务的应用商店的历史记录,获取该应用的被下载总次数、被展示总次数后计算获取。
所述目标用户对所述目标应用的应用偏好指标,至少包括所述目标用户对所述目标应用的应用偏好度和所述目标用户对所述目标应用所属的应用分类的应用分类偏好度。
而一个用户对一个应用的应用偏好度,用于衡量该用户与该应用的匹配度或者相似度。具体地,获取一个用户对一个应用的所述应用偏好度的步骤,包括:
步骤S301,获取该用户的安装应用列表,
其中,所述安装应用列表中包括对应的用户已安装的所有应用;
例如,假设用户u安装了50个应用a1、a2、……a50,用户u的安装应用列表I={a1,a2,……,a50},包括用户u已安装的所有应用;
步骤S302,根据所述安装应用列表和已获取的应用相似性矩阵,获取该用户对该应用的所述应用偏好度,
其中,所述应用相似性矩阵中包括每个应用与其他应用之间的相似度,在类似的应用商店这样的应用平台上,会提供多个应用供用户下载,应用相似性矩阵中,就包括应用商店可提供下载的所有应用中的每一个应用与其他每个应用之间的相似度,例如,应用商店中提供5000个应用供用户下载,对应的应用相似性矩阵可以是一个5000*5000的矩阵,其中矩阵中每一个元素Simi,j(i=1,......5000;j=1,......5000)表示5000个应用中任意一个应用bi与应用bj之间的相似度,其中i=j时Simi,j=1,表示应用bi自身相似度,而i≠j时Simi,j表示应用bi与其他应用bj之间的相似度。
从而,在上例中,可以获取用户u对应用b的应用偏好度Xu,b:
Figure BDA0001252021570000081
更具体地,可以如图4所示,获取应用相似性矩阵的步骤包括:
步骤S401,获取每个应用的用户安装向量,
其中,所述用户安装向量用于表征所有用户中每个用户是否安装对应的应用;
例如,假设使用应用商店提供下载的应用为5000个,使用该应用商店的用户有10000个,则对于5000个应用中的每个应用,10000个用户中任意一个用户,如果安装了该应用,记为1,如果未安装该应用,记为0,从而可以获取该应用的长度为10000的用户安装向量,以此类推,可以获取5000个应用中每个应用的长度为10000的用户安装向量;
步骤S402,根据所获取的多个所述用户安装向量,分别计算每个应用与其他应用之间的相似度,以构建所述应用相似性矩阵。
具体地,假设应用bi的用户安装向量为
Figure BDA0001252021570000084
所属的应用分类为Tagi,应用bj的用户安装向量为
Figure BDA0001252021570000085
所属的应用分类为Tagj,其中,用分类具体可以是所述应用分类为应用所属的一级分类,例如,应用通常被分为购物类应用、游戏类应用、休闲类应用、社交类应用、教育类应用等等,那么,应用bi与应用bj之间的相似度Simi,j为:
Figure BDA0001252021570000091
以此类推,分别计算每个应用与其他应用之间的相似度,从而构建所述应用相似性矩阵。
因此,通过如图3或图4所示的方法,可以获取目标用户对目标应用的应用偏好度。
而一个用户对一个应用所属的应用分类的应用偏好度,用于衡量该用户对该应用分类的兴趣度。
具体地,获取一个用户对一个应用所属的应用分类的所述应用分类偏好度的步骤,如图5所示,包括:
步骤S501,获取该用户安装属于该应用分类的应用安装数量和所有用户安装属于该应用分类的应用的平均应用安装数量;
步骤S502,根据所述应用安装数量和所述平均应用安装数量,获取该用户对该应用分类的所述应用分类偏好度。
例如,目标应用a所属的应用分类Taga为“教育类应用”,获取目标用户u安装教育类应用的应用安装数量
Figure BDA0001252021570000092
而统计得到使用应用商店的所有用户构成的用户集合U中每一个用户v安装教育类应用的应用安装数量为
Figure BDA0001252021570000093
则平均应用安装数量为
Figure BDA0001252021570000094
则用户u对应用分类Taga的应用分类偏好度
Figure BDA0001252021570000096
为:
Figure BDA0001252021570000095
以上已经说明如何获取目标用户的历史下载信息、目标应用的下载比例以及所述目标用户对所述目标应用的应用偏好指标,从而可以构建目标特征向量。
例如,目标用户u的历史下载信息为Xu、目标应用a的下载比例为Xa,目标用户u对目标应用a的应用偏好指标包括目标用户u对目标应用a的应用偏好度为Xu,a和目标用户u对目标应用a所述的应用分类Ta的应用分类偏好度为
Figure BDA0001252021570000102
从而可以得到目标特征向量为
Figure BDA0001252021570000101
在获取目标特征向量之后,进入步骤S2200,通过预先构建的下载概率预测模型处理所述目标特征向量,以获取所述目标用户对所述目标应用的下载概率。
具体地,所述构建下载概率模型步骤可以如图6所示,包括:
步骤S601,根据所有用户的与应用相关的历史行为数据,获取多个模型训练样本,其中,
每个所述模型训练样本,表征一个应用被向一个用户展示后是否被该用户下载;
其中,提供应用下载服务的应用平台例如应用商店,可以记录所有使用其的用户的与应用相关的历史行为数据;
具体的,可以是应用商店在向用户展示应用后,用户对应用是否进行下载的历史行为数据,从而可以获取模型训练样本;
例如,应用商店向用户u展示了应用a,用户u并没有下载,从而可以得到一个模型训练样本为负样本(u,a),而应用商店向用户u展示了应用b,用户u下载了应用b,从而可以得到一个模型训练样本为正样本(u,a),因此,模型训练样本可以记为(用户,应用),同时还对每个样本i设置fi,用于表示该样本为正样本还是负样本,fi为0时表示负样本,fi为1时表示正样本;
步骤S602,对每个所述模型训练样本,获取对应的样本特征向量,
其中,所述样本特征向量包括对应的所述模型训练样本所对应的特定用户的历史下载信息、对应的所述模型训练样本所对应的特定应用的下载比例以及所述特定用户对所述特定应用的应用偏好指标,
所述特定用户对所述特定应用的应用偏好指标至少包括所述特定用户对所述特定应用的应用偏好度和所述特定用户对所述特定应用所属的应用分类的应用分类偏好度;
具体地,对于模型训练样本(u,a),特定用户为用户u,特定应用为应用a,
所述历史下载信息可以是对应的用户u的应用平均下载数量X1,在上文中已描述如何获取,在此不再赘述;
所述下载比例是对应的应用a的被下载总次数与被展示总次数之比X4,在上文中已描述如何获取,在此不再赘述;
所述特定用户u对所述特定应用a的应用偏好度X2,可以通过如图3或图4所示的方法获取,在此不再赘述;
所述特定用户u对所述特定应用a所属的应用分类Ta的应用分类偏好度X3,可以通过如图5所示的方法获取,在此不再赘述;
从而可以获取对应的样本特征向量为[X1,X2,X3,X4],以此类推,从而可以获取每个模型训练样本对应的样本特征向量
步骤S603,对所获取的多个所述样本特征向量,通过回归算法训练以构建所述下载概率预测模型。
假设获取n个样本特征向量为Xi=[X1i,X2i,X3i,X4i](i=1,......,n),把样本特征向量Xi作为输入变量,以对应样本标记fi作为目标变量,进行回归算法训练,可以构建所述下载概率预测模型。
其中,所述回归算法是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,通过回归算法训练,可以通过多个样本特征向量构建下载概率预测模型,以用于获取用户对应用的应用下载概率。
例如,回归算法可以是逻辑斯蒂回归算法,逻辑斯蒂回归算法使可以使用一个S型生长函数,将训练的样本的特征向量的线性加权结果映射到0到1之间,而这刚好可以是数据样本点属于某一类的概率,从而通过训练多个样本特征向量得到对应的下载预测概率模型。
回归算法可以是线性回归算法,线性回归算法能将输入样本向量的各个维度的特征进行了有效的结合(通过分配不同的权重),使得所有特征共同协同合作最后的决策,从而通过训练多个样本特征向量以拟合得到对应的下载预测概率模型。
所述回归算法还可以是其他常用的回归算法,例如因子分解机等,在此不一一列举。
应当理解的是,出于实施效果的优化目的,本实施例中下载概率预测模型的构建可以是持续进行的,以使得根据所述下载概率预测模型根据实时获取的模型训练样本不断优化,通过所述载概率预测模型处理获取更准确的用户对应用的应用下载概率。
以上已结合附图描述本实施例的应用下载概率的获取方法,通过获取目标用户对目标应用的目标特征向量,再通过预先构建的下载概率预测模型处理该目标特征向量,获取目标用户对目标应用的下载概率,从而可以获取目标用户对所有应用的下载概率,使得可以根据所获取的应用下载概率预估推荐应用获取的收益来向用户推荐应用,实现提供应用推荐服务的应用平台(例如应用商店)的营收最大化。
<装置>
在本实施例中,还提供一种应用下载概率的获取设备7000,如图7所示,包括目标特征构建单元7100、下载概率获取单元7200,可选地,所述应用下载概率的获取设备7000还包括样本训练单元7300、样本特征获取单元7400以及模型构建单元7500,用于实施本实施例中提供任意一项应用下载概率的获取方法,在此不再赘述。
应用下载概率的获取设备7000,包括:
目标特征构建单元7100,用于获取目标用户的历史下载信息、目标应用的下载比例以及所述目标用户对所述目标应用的应用偏好指标,以构建目标特征向量,
其中,所述目标用户对所述目标应用的应用偏好指标至少包括所述目标用户对所述目标应用的应用偏好度和所述目标用户对所述目标应用所属的应用分类的应用分类偏好度;
下载概率获取单元7200,用于通过预先构建的下载概率预测模型处理所述目标特征向量,以获取所述目标用户对所述目标应用的下载概率。
可选地,应用下载概率的获取设备7000还包括:
样本训练单元7300,用于根据所有用户的与应用相关的历史行为数据,获取多个模型训练样本,其中,
每个所述模型训练样本,表征一个应用被向一个用户展示后是否被该用户下载;
样本特征获取单元7400,用于对每个所述模型训练样本,获取对应的样本特征向量,
其中,所述样本特征向量包括对应的所述模型训练样本所对应的特定用户的历史下载信息、对应的所述模型训练样本所对应的特定应用的下载比例以及所述特定用户对所述特定应用的应用偏好指标,
所述特定用户对所述特定应用的应用偏好指标至少包括所述特定用户对所述特定应用的应用偏好度和所述特定用户对所述特定应用所属的应用分类的应用分类偏好度;
模型构建单元7500,用于对所获取的多个所述样本特征向量,通过回归算法训练以构建所述下载概率预测模型。
在本实施例中,所述应用下载概率的获取设备7000可以具有多种实体实施形式,例如,可以是与提供应用下载服务的应用平台建立连接的独立设备,也可以是内置于提供应用下载服务的应用平台的功能单元,还可以是提供应用下载服务的应用平台本身,例如应用商店。
本领域技术人员应当明白,可以通过各种方式来实现所述应用下载概率的获取设备7000。例如,可以通过指令配置处理器来实现所述应用下载概率的获取设备7000。例如,可以将指令存储在ROM中,并且当启动设备时,将指令从ROM读取到可编程器件中来实现所述应用下载概率的获取设备7000。例如,可以将所述应用下载概率的获取设备7000固化到专用器件(例如ASIC)中。可以将所述应用下载概率的获取设备7000分成相互独立的单元,或者可以将它们合并在一起实现。所述应用下载概率的获取设备7000可以通过上述各种实现方式中的一种来实现,或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。
<实体设备>
在本实施例中,还提供一种可编程设备,包括存储器和处理器,
所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行本实施例中提供的任一项应用下载概率的获取方法。
具体地,所述可编程设备可以如图1所示的服务器1100。
以上已经结合附图描述了本发明的实施例,根据本实施例,提供一种应用下载概率的获取方法、设备及可编程设备,通过获取目标用户对目标应用的目标特征向量,再通过预先构建的下载概率预测模型处理该目标特征向量,获取目标用户对目标应用的下载概率,从而可以实时获取目标用户对所有应用的下载概率,使得可以根据所获取的应用下载概率预估推荐应用获取的收益来向用户推荐应用,实现提供应用推荐服务的应用平台(例如应用商店)的营收最大化。
本领域技术人员公知的是,随着诸如大规模集成电路技术的电子信息技术的发展和软件硬件化的趋势,要明确划分计算机系统软、硬件界限已经显得比较困难了。因为,任何操作可以软件来实现,也可以由硬件来实现。任何指令的执行可以由硬件完成,同样也可以由软件来完成。对于某一机器功能采用硬件实现方案还是软件实现方案,取决于价格、速度、可靠性、存储容量、变更周期等非技术性因素。因此,对于电子信息技术领域的普通技术人员来说,更为直接和清楚地描述一个技术方案的方式是描述该方案中的各个操作。在知道所要执行的操作的情况下,本领域技术人员可以基于对所述非技术性因素的考虑直接设计出期望的产品。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims (9)

1.一种应用下载概率的获取方法,其特征在于,包括:
获取目标用户的历史下载信息、目标应用的下载比例以及所述目标用户对所述目标应用的应用偏好指标,以构建目标特征向量,
其中,所述目标用户对所述目标应用的应用偏好指标至少包括所述目标用户对所述目标应用的应用偏好度和所述目标用户对所述目标应用所属的应用分类的应用分类偏好度;
通过预先构建的下载概率预测模型处理所述目标特征向量,以获取所述目标用户对所述目标应用的下载概率;
获取一个用户对一个应用所属的应用分类的所述应用分类偏好度的步骤包括:
获取该用户安装属于该应用分类的应用安装数量和所有用户安装属于该应用分类的应用的平均应用安装数量;
根据所述应用安装数量和所述平均应用安装数量,获取该用户对该应用分类的所述应用分类偏好度。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据所有用户的与应用相关的历史行为数据,获取多个模型训练样本,其中,
每个所述模型训练样本,表征一个应用被向一个用户展示后是否被该用户下载;
对每个所述模型训练样本,获取对应的样本特征向量,
其中,所述样本特征向量包括对应的所述模型训练样本所对应的特定用户的历史下载信息、对应的所述模型训练样本所对应的特定应用的下载比例以及所述特定用户对所述特定应用的应用偏好指标,
所述特定用户对所述特定应用的应用偏好指标至少包括所述特定用户对所述特定应用的应用偏好度和所述特定用户对所述特定应用所属的应用分类的应用分类偏好度;
对所获取的多个所述样本特征向量,通过回归算法训练以构建所述下载概率预测模型。
3.根据权利要求1或2所述的方法,其特征在于,
所述历史下载信息是对应的用户的应用平均下载数量;
所述下载比例是对应的应用的被下载总次数与被展示总次数之比。
4.根据权利要求1或2所述的方法,其特征在于,
获取一个用户对一个应用的所述应用偏好度的步骤包括:
获取该用户的安装应用列表,
其中,所述安装应用列表中包括对应的用户已安装的所有应用;
根据所述安装应用列表和已获取的应用相似性矩阵,获取该用户对该应用的所述应用偏好度,
其中,所述应用相似性矩阵中包括每个应用与其他应用之间的相似度。
5.根据权利要求4所述的方法,其特征在于,还包括:
获取每个应用的用户安装向量,
其中,所述用户安装向量用于表征所有用户中每个用户是否安装对应的应用;
根据所获取的多个所述用户安装向量,分别计算每个应用与其他应用之间的相似度,以构建所述应用相似性矩阵。
6.根据权利要求2所述的方法,其特征在于,
所述回归算法是逻辑斯蒂回归算法。
7.一种应用下载概率的获取设备,其特征在于,
目标特征构建单元,用于获取目标用户的历史下载信息、目标应用的下载比例以及所述目标用户对所述目标应用的应用偏好指标,以构建目标特征向量,
其中,所述目标用户对所述目标应用的应用偏好指标至少包括所述目标用户对所述目标应用的应用偏好度和所述目标用户对所述目标应用所属的应用分类的应用分类偏好度;
下载概率获取单元,用于通过预先构建的下载概率预测模型处理所述目标特征向量,以获取所述目标用户对所述目标应用的下载概率。
8.根据权利要求7所述的设备,其特征在于,还包括:
样本训练单元,用于根据所有用户的与应用相关的历史行为数据,获取多个模型训练样本,其中,
每个所述模型训练样本,表征一个应用被向一个用户展示后是否被该用户下载;
样本特征获取单元,对每个所述模型训练样本,获取对应的样本特征向量,
其中,所述样本特征向量包括对应的所述模型训练样本所对应的特定用户的历史下载信息、对应的所述模型训练样本所对应的特定应用的下载比例以及所述特定用户对所述特定应用的应用偏好指标,
所述特定用户对所述特定应用的应用偏好指标至少包括所述特定用户对所述特定应用的应用偏好度和所述特定用户对所述特定应用所属的应用分类的应用分类偏好度;
模型构建单元,用于对所获取的多个所述样本特征向量,通过回归算法训练以构建所述下载概率预测模型。
9.一种可编程设备,其特征在于,包括:
存储器和处理器,
所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行如权利要求1-6中任一项所述的方法。
CN201710174513.8A 2017-03-22 2017-03-22 应用下载概率的获取方法、设备及可编程设备 Active CN107103036B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710174513.8A CN107103036B (zh) 2017-03-22 2017-03-22 应用下载概率的获取方法、设备及可编程设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710174513.8A CN107103036B (zh) 2017-03-22 2017-03-22 应用下载概率的获取方法、设备及可编程设备

Publications (2)

Publication Number Publication Date
CN107103036A CN107103036A (zh) 2017-08-29
CN107103036B true CN107103036B (zh) 2020-05-08

Family

ID=59674774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710174513.8A Active CN107103036B (zh) 2017-03-22 2017-03-22 应用下载概率的获取方法、设备及可编程设备

Country Status (1)

Country Link
CN (1) CN107103036B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729544B (zh) * 2017-11-01 2021-06-22 阿里巴巴(中国)有限公司 一种推荐应用的方法和装置
CN108520034B (zh) * 2018-03-29 2021-01-05 阿里巴巴(中国)有限公司 应用推荐方法、装置及计算机设备
CN110490625A (zh) * 2018-05-11 2019-11-22 北京京东尚科信息技术有限公司 用户偏好确定方法及装置、电子设备、存储介质
CN109040164B (zh) * 2018-05-21 2021-11-26 阿里巴巴(中国)有限公司 应用推荐方法、装置、存储介质及计算机设备
CN108733825B (zh) * 2018-05-23 2022-04-26 创新先进技术有限公司 一种对象触发事件预测方法及装置
CN109040202A (zh) * 2018-07-16 2018-12-18 佛山市影腾科技有限公司 一种信息推送方法、装置及服务器
CN109242592A (zh) * 2018-07-19 2019-01-18 广州优视网络科技有限公司 一种应用的推荐方法和装置
CN109102332A (zh) * 2018-08-06 2018-12-28 北京小度信息科技有限公司 一种数据处理的方法、装置和电子设备
CN110910257A (zh) * 2019-11-15 2020-03-24 泰康保险集团股份有限公司 信息预测方法、装置、电子设备和计算机可读介质
CN112104505B (zh) * 2020-09-21 2023-06-23 深圳市欢太科技有限公司 应用推荐方法、装置、服务器和计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102124466A (zh) * 2008-09-05 2011-07-13 索尼公司 内容推荐系统、内容推荐方法、内容推荐设备、程序以及信息存储介质
CN103824213A (zh) * 2014-03-13 2014-05-28 北京理工大学 一种基于用户偏好与商品属性的个性化推荐方法
CN104536983A (zh) * 2014-12-08 2015-04-22 北京掌阔技术有限公司 一种预测广告点击率的方法和装置
CN104899266A (zh) * 2015-05-22 2015-09-09 广东欧珀移动通信有限公司 一种应用推荐方法及装置
CN105528374A (zh) * 2014-10-21 2016-04-27 苏宁云商集团股份有限公司 一种电子商务中的商品推荐方法及其系统
CN106250532A (zh) * 2016-08-04 2016-12-21 广州优视网络科技有限公司 应用推荐方法、装置及服务器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6981040B1 (en) * 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US8019782B2 (en) * 2007-10-22 2011-09-13 Samsung Electronics Co., Ltd. Situation-aware recommendation using limited cluster sizes

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102124466A (zh) * 2008-09-05 2011-07-13 索尼公司 内容推荐系统、内容推荐方法、内容推荐设备、程序以及信息存储介质
CN103824213A (zh) * 2014-03-13 2014-05-28 北京理工大学 一种基于用户偏好与商品属性的个性化推荐方法
CN105528374A (zh) * 2014-10-21 2016-04-27 苏宁云商集团股份有限公司 一种电子商务中的商品推荐方法及其系统
CN104536983A (zh) * 2014-12-08 2015-04-22 北京掌阔技术有限公司 一种预测广告点击率的方法和装置
CN104899266A (zh) * 2015-05-22 2015-09-09 广东欧珀移动通信有限公司 一种应用推荐方法及装置
CN106250532A (zh) * 2016-08-04 2016-12-21 广州优视网络科技有限公司 应用推荐方法、装置及服务器

Also Published As

Publication number Publication date
CN107103036A (zh) 2017-08-29

Similar Documents

Publication Publication Date Title
CN107103036B (zh) 应用下载概率的获取方法、设备及可编程设备
WO2018171271A1 (zh) 应用推荐方法、客户端、服务器及系统
CN112100489B (zh) 对象推荐的方法、装置和计算机存储介质
CN110781934A (zh) 监督学习、标签预测方法及装置、电子设备和存储介质
US10607139B2 (en) Candidate visualization techniques for use with genetic algorithms
US20200134034A1 (en) Recommendation systems implementing separated attention on like and dislike items for personalized ranking
US20200412682A1 (en) Feedback enabled network curation of relevant content thread
US10332161B2 (en) Retrieving reviews based on user profile information
CN111191834A (zh) 用户行为的预测方法、装置及服务器
CN111104874A (zh) 人脸年龄预测方法及模型的训练方法、装置及电子设备
CN108596711B (zh) 应用推荐方法、装置及电子设备
US20220188663A1 (en) Automated machine learning model selection
US20180129664A1 (en) System and method to recommend a bundle of items based on item/user tagging and co-install graph
CN112381236A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
CN112418443A (zh) 基于迁移学习的数据处理方法、装置、设备及存储介质
US20200097813A1 (en) Deep learning model for probabilistic forecast of continuous manufacturing process
CN113220922B (zh) 图像搜索方法、装置和电子设备
US10462095B2 (en) Time and sentiment based messaging
CN115994807A (zh) 一种物料推荐方法、装置及系统
US20220245460A1 (en) Adaptive self-adversarial negative sampling for graph neural network training
CN112418442A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
US11068552B2 (en) Updating social media post based on subsequent related social media content
CN111339432A (zh) 电子对象的推荐方法、装置和电子设备
CN112418441A (zh) 基于迁移学习的数据处理方法、装置、设备及存储介质
CN113360745A (zh) 一种数据对象推荐方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200525

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 510627, room 146-150, first floor, No. 07, Whampoa Avenue, Tianhe District, Guangdong, Guangzhou

Patentee before: GUANGZHOU UC NETWORK TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right