CN113449188A - 应用推荐方法、装置、电子设备及可读存储介质 - Google Patents

应用推荐方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN113449188A
CN113449188A CN202110743081.4A CN202110743081A CN113449188A CN 113449188 A CN113449188 A CN 113449188A CN 202110743081 A CN202110743081 A CN 202110743081A CN 113449188 A CN113449188 A CN 113449188A
Authority
CN
China
Prior art keywords
training
app
distribution
user
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110743081.4A
Other languages
English (en)
Inventor
王志峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan ELF Education Software Co Ltd
Original Assignee
Dongguan ELF Education Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan ELF Education Software Co Ltd filed Critical Dongguan ELF Education Software Co Ltd
Priority to CN202110743081.4A priority Critical patent/CN113449188A/zh
Publication of CN113449188A publication Critical patent/CN113449188A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种应用推荐方法、装置、电子设备及可读存储介质,服务器接收到来自当前用户通过终端设备发送的应用推荐请求后,响应该应用推荐请求时,将当前用户的用户画像和候选集合中各APP的APP画像输入至预先训练好的深度学习模型,使得深度学习模型输出各APP的参考值,参考值用于指示当前用户下载该APP的可能性。之后,服务器根据各APP的参考值确定出推荐给用户的目标APP并指示给终端设备。采用该种方案,准确率高、适用性强,提高应用推荐的有效性和适用性的同时,实现个性化推荐。

Description

应用推荐方法、装置、电子设备及可读存储介质
技术领域
本申请涉及互联网技术领域,具体涉及一种应用推荐方法、装置、电子设备及可读存储介质。
背景技术
随着技术的飞速发展,手机等终端设备已得到广泛的使用,手机上能够实现的功能也越来越多。用户利用安装在终端设备上的应用(application,APP)听歌、看视频、看小说等。
海量应用给用户带来丰富多样的用户体验的同时,也给用户增添了选择难题。未解决该难题,现有的应用推荐方法中,服务器按照下载量从高到低的顺序等对应用进行排名,将排名靠前的应用推荐给所有用户。
然而,排名靠前的应用不一定适用于所有用户。显然,上述的应用推荐有效性低、适用性差。
发明内容
本申请实施例公开了一种应用推荐方法、装置、电子设备及可读存储介质,利用训练过程中对权重在似然基础上进行贝叶斯化处理的深度学习模型向用户推荐应用,提高应用推荐的有效性和适用性的同时,实现个性化推荐。
第一方面,本申请实施例提供一种应用推荐方法,包括:
接收来自终端设备的应用推荐请求;
响应所述应用推荐请求,将当前用户的用户画像和候选集合中各应用程序APP的APP画像输入预先训练好的深度学习模型以获取所述候选集合中各APP的参考值,所述参考值用于指示用户下载所述候选集合中各APP的可能性,所述深度学习模型为训练过程中对权重在似然基础上进行贝叶斯化处理的模型;
根据所述候选集合中各APP的参考值,从所述候选集合中确定出目标APP;
向所述终端设备发送用于指示所述目标APP的应用推荐响应。
第二方面,本申请实施例提供一种应用推荐装置,包括:
接收模块,用于接收来自终端设备的应用推荐请求;
处理模块,用于响应所述应用推荐请求,将当前用户的用户画像和候选集合中各应用程序APP的APP画像输入预先训练好的深度学习模型以获取所述候选集合中各APP的参考值,所述参考值用于指示用户下载所述候选集合中各APP的可能性,所述深度学习模型为训练过程中对权重在似然基础上进行贝叶斯化处理的模型;
确定模块,用于根据所述候选集合中各APP的参考值,从所述候选集合中确定出目标APP;
发送模块,用于向所述终端设备发送用于指示所述目标APP的应用推荐响应。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时使得所述电子设备实现如上所述的应用推荐方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,所述计算机指令在被处理器执行时用于实现如上所述的应用推荐方法。
第五方面,本申请实施例提供一种包含计算程序的计算机程序产品,所述计算机程序被处理器执行时实现如上所述的应用推荐方法。
本申请实施例提供一种应用推荐方法、装置、电子设备及可读存储介质,服务器接收到来自当前用户通过终端设备发送的应用推荐请求后,响应该应用推荐请求时,将当前用户的用户画像和候选集合中各APP的APP画像输入至预先训练好的深度学习模型,使得深度学习模型输出各APP的参考值,参考值用于指示当前用户下载该APP的可能性。之后,服务器根据各APP的参考值确定出推荐给用户的目标APP并指示给终端设备。采用该种方案,由于深度学习模型为训练过程中对权重在似然基础上进行贝叶斯化处理的模型,也就是说,该深度学习模型为训练过程中考虑每一轮训练权重更新后的分布变化,因此,利用该深度学习模型能够从候选集合的海量APP中精准的确定出推荐给用户的目标APP,准确率高、适用性强,提高应用推荐的有效性和适用性的同时,实现个性化推荐。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的应用推荐方法的实施环境示意图;
图2是本申请实施例提供的一种应用推荐方法的流程图;
图3是本申请实施例提供的应用推荐方法中模型训练的流程图;
图4是本申请实施例提供的应用推荐方法中模型训练的过程示意图;
图5是本申请实施例提供的应用推荐方法中确定权重向量的流程图;
图6为本申请实施例提供的应用推荐方法中权重的更新流程图;
图7为本申请实施例提供的应用推荐装置的结构示意图;
图8为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
随着移动互联网技术的发展,终端设备成为人们生活中不可或缺的一部分,通过在终端设备上安装各种应用,极大程度上方便了人们的生活。然而,随着应用数目的增长,用户面临着如何从海量的应用中找到自己感兴趣的应用。
为此,应用商店服务器向用户推荐应用时,将下载量高的应用推荐给用户。然而,排名靠前的应用不一定适用于所有用户。显然,上述的应用推荐有效性低、适用性差,且无法满足个性化推荐。
而且,目前对应用的排序大多采用深度因子分解机(factorization machine,deepFM)模型、深度兴趣网络(Deep Interest Network,DIN)模型等。该些模型通常以频率派的似然估计为计算基础,未对模型参数的不确定性加以度量。对模型参数做一次采样后,完全依靠梯度来推动参数更新的,导致最终确定出的推荐给用户的应用不合理。也就是说,deepFM模型、DIN模型等无法实现准确推荐应用的目的。其中,模型参数例如为权重等。
基于此,本申请实施例提供一种应用推荐方法、装置、电子设备及可读存储介质,利用训练过程中对权重在似然基础上进行贝叶斯化处理的深度学习模型向用户推荐应用,提高应用推荐的有效性和适用性的同时,实现个性化推荐。
图1是本申请实施例提供的应用推荐方法的实施环境示意图。请参照图1,该实施环境包括:服务器11和终端设备12,服务器11和终端设备12建立网络连接。服务器11为单独部署的服务器或服务器集群,服务器11例如为应用商店的服务器等。终端设备12为用户的手机、笔记本、车载终端等。服务器11上部署预先训练好的深度学习模型,该深度学习模型为训练过程中对权重在似然基础上进行贝叶斯化处理的模型,也就是说,该深度学习模型为训练过程中考虑每一轮训练权重更新后的分布变化。
下面,基于图1所示实施环境,对本申请实施例所述的应用推荐方法进行详细说明。示例性的,请参照图2。
图2是本申请实施例提供的一种应用推荐方法的流程图。本实施例的执行主体是服务器,如应用商店的服务器,本实施例包括:
201、接收来自终端设备的应用推荐请求。
示例性的,当前用户在终端设备的显示屏上点击应用商店等,触发终端设备向服务器发送应用推荐请求。相应的,服务器接收来自终端设备的应用推荐请求。
202、响应所述应用推荐请求,将当前用户的用户画像和候选集合中各应用程序APP的APP画像输入预先训练好的深度学习模型以获取所述候选集合中各APP的参考值。
其中,所述参考值用于指示用户下载所述候选集合中各APP的可能性,所述深度学习模型为训练过程中对权重在似然基础上进行贝叶斯化处理的模型。
本申请实施例中,当前用户即为使用终端设备的用户,用户画像包括用户的年龄、性别、用户的终端设备上已安装的应用、用户访问应用商店并浏览某个应用的应用详情但未下载的应用等。服务器可以从用户的行为数据提取出用户画像。其中,用户的行为数据包括用户的注册行为、访问行为、浏览行为等产生的数据。
服务器例如为应用商店的服务器,服务器上存储各种供用户下载的APP,该些APP称之为候选APP。APP的画像包括APP的大小、APP的类目、APP的版本、APP的上架时间、APP的下载量等。其中,APP的类目包括社交类、购物类、资讯类、购物类等。
本步骤中,当服务器响应应用推荐请求时,将当前用户的用户画像和候选集合中各APP的画像输入至深度学习模型,使得深度学习模型输出候选集合中各APP的参考值,参考值可以是分数、概率等。参考值越大,说明用户越偏好该APP,下载该APP的几率越大。若参考值比较小,则说明用户不喜好该APP,下载该APP的几率比较小。
203、根据所述候选集合中各APP的参考值,从所述候选集合中确定出目标APP。
示例性的,服务器按照APP的参考值从大到小的顺序,对候选集合中的各APP排序,将排序靠前的多个APP作为目标APP。
204、向所述终端设备发送用于指示所述目标APP的应用推荐响应。
示例性的,服务器向终端设备发送应用推荐响应,该应用推荐响应用于指示目标APP。终端设备接收到应用推荐响应后,显示该些目标APP供用户点击下载等。
本申请实施例提供的应用推荐方法,服务器接收到来自当前用户通过终端设备发送的应用推荐请求后,响应该应用推荐请求时,将当前用户的用户画像和候选集合中各APP的APP画像输入至预先训练好的深度学习模型,使得深度学习模型输出各APP的参考值,参考值用于指示当前用户下载该APP的可能性。之后,服务器根据各APP的参考值确定出推荐给用户的目标APP并指示给终端设备。采用该种方案,由于深度学习模型为训练过程中对权重在似然基础上进行贝叶斯化处理的模型,也就是说,该深度学习模型为训练过程中考虑每一轮训练权重更新后的分布变化,因此,利用该深度学习模型能够从候选集合的海量APP中精准的确定出推荐给用户的目标APP,准确率高、适用性强,提高应用推荐的有效性和适用性的同时,实现个性化推荐。
下面,对如何训练出深度学习模型进行详细说明。本申请实施例中,训练深度学习模型的过程主要包括两个阶段:数据采集阶段和模型训练阶段。
首先,数据采集阶段。
该阶段中,服务器构建正样本和负样本以得到样本集合。构建正样本时,服务器根据历史用户的用户画像和所述历史用户已下载APP中的每个APP的APP画像,构建正样本。
示例性的,服务器获取成千上万的历史用户的用户画像,以及每个历史用户的APP使用列表,APP使用列表中包含了用户以下载的APP。之后,服务器根据历史用户的用户画像和已下载APP的APP画像构建正样本。举例来说,对于某一个历史用户,该历史用户的APP使用列表中存在10个APP,即该历史用户下载了10个APP,则服务器能够根据历史用户的用户画像和10个APP中的每个APP的APP画像构建正样本,总共10个正样本。
构建负样本时,服务器根据历史用户的用户画像和所述历史用户浏览但未下载的APP中每个APP的APP画像,构建负样本。
示例性的,历史用户访问服务器时,服务器获取历史用户的行为数据,行为数据中记录了历史用户浏览但未下载的APP。服务器根据历史用户的用户画像和浏览但未下载的APP的APP画像构建负样本。例如,行为数据指示历史用户浏览了APP A、APP B的详情,但未下载APP A以及APP B。则服务器根据历史用户的用户画像以及APP A的APP画像构建出一个负样本,根据历史用户的用户画像以及APP B的APP画像构建出一个负样本。
服务器构建出正样本和负样本得到样本集合后,使用包含正样本和负样本的样本集训练初始模型以得到深度学习模型。
采用该种方案,服务器构建正确的正样本和负样本,实现训练出准确的深度学习模型的目的。
其次,模型训练过程。
示例性的,请参照图3和图4,图3是本申请实施例提供的应用推荐方法中模型训练的流程图,图4是本申请实施例提供的应用推荐方法中模型训练的过程示意图。
图3包括如下步骤:
301、本轮训练中,从所述样本集中确定出用于本轮训练的样本。
本申请实施例中,样本集中样本的数量数以万计甚至更多。样本集中正样本和负样本的比例可灵活设置。每轮训练中,服务器从样本集中确定出本轮训练的样本。例如,每轮训练需要用到4000个样本,即批次(batch)大小为4000,一个batch中样本的数量用“N”表示,N的取值包括但不限于4000。
302、提取本轮训练的样本的稀疏特征和密集特征。
请参照图4,深度学习模型至少包括输入层、处理层、因子分解机FM层(FM layer)、隐藏层(hidden layer)以及输出单元(output unit)。
本步骤中,服务器在输入层对提取本轮训练的样本的稀疏特征(sparse feature)和密集特征(dense feature)。
303、处理所述稀疏特征和所述密集特征,以得到嵌入向量。
请参照图4,服务器在处理层处理疏特征和密集特征从而得到嵌入向量。其中,处理层的处理包括嵌入(embedding)等,该嵌入处理也称之为密集嵌入(dense embedding)等。
304、根据所述嵌入向量确定二阶特征向量和高阶特征向量。
请参照图4,处理层的嵌入向量被发送至FM层和隐藏层。在FM层,服务器根据嵌入向量计算出二阶特征向量;在隐藏层,服务器根据嵌入向量计算出高阶特征向量。
305、拼接所述二阶特征向量和所述高阶特征向量以得到拼接特征向量。
图4中未示意出拼接单元,拼接过程中,服务器横向拼接二阶特征向量和高阶特征向量从而得到拼接特征向量。之后,该服务器将该拼接特征向量输入至激活单元(图4中未示意出),在激活单元计算每个样本的参考值。从拼接单元到激活单元,需要计算一个权重向量,对于每一个样本,该样本的参考值即为:该样本的拼接特征向量的每个维度的值乘以权重向量中的对应权重,得到的各个维度的乘积后,对该些乘积求和,之后,对求和的结果做激活。以batch的大小为4000为例,针对每个样本计算出一个二阶特征向量和一个高阶特征向量,之后拼接该二阶特征向量和高阶特征向量得到拼接特征向量。该拼接特征向量的维度例如为100维。因此,当batch的大小为4000时,一共是4000×200维的数据。
根据上述可知:每一轮训练中,得到拼接特征向量后,从拼接单元到激活单元,需要计算一个权重向量。计算权重向量的过程中,本轮训练的权重向量是根据上一轮训练的权重向量得到的,即对上一轮训练的权重向量在似然基础上进行贝叶斯化处理,从而得到本轮训练的权重向量。
306、根据所述权重向量和所述拼接特征向量训练初始模型以得到所述深度学习模型。
采用该种方案,模型训练过程中通过拼接FM层的二阶特征向量和隐藏层的高阶特征向量,实现提高模型效率和准确率的目的。
可选的,上述实施例中,服务器确定所述拼接特征向量对应的权重向量时,先根据用于确定上一轮训练的权重向量的第一分布,确定第二分布。之后,服务器对所述第二分布采样以得到本轮训练的权重向量。
示例性的,相邻两轮训练中,本轮训练的权重向量是根据上一轮训练的权重向量确定出的,即利用用于确定上一轮训练过程中的权重向量的第一分布,确定一个新的第二分布,对第二分布采样以得到本轮训练的权重向量。若两轮训练中的第一轮训练为模型训练过程中的第一次训练,则对第一分布采样即可得到第一次训练的权重向量。
第一分布例如为高斯分布、均匀分布等。第一次训练时,以batch大小为4000为例,服务器利用第一个batch训练深度学习模型时,对于该4000个样本,得到各个样本的拼接特征向量后,对第一分布采样从而得到权重向量,此时,4000个样本共享该权重向量。但是,每个样本的拼接特征向量不同,因此,不同样本计算出的参考值不同。
第二次训练时,服务器从样本集合中确定出第二个batch,以batch大小为4000为例,服务器利用第二个batch训练深度学习模型时,对于该4000个样本,得到各个样本的拼接特征向量后,对第二分布采样从而得到权重向量,利用新的权重向量和第二个batch中各样本的拼接特征向量,计算第二个batch内每个样本的参考值。其中,第二分布例如是服务器根据上一轮训练的权重向量确定出的。
采用该种方案,实现模型训练过程中服务器准确确定出每轮训练权重的目的。
下面,对本轮训练不是第一次训练时,即当本轮训练时第一次训练之后的训练时,服务器如何根据上一轮的权重向量,确定本轮训练的权重向量进行详细说明。示例性的,请参照图5。
图5是本申请实施例提供的应用推荐方法中确定权重向量的流程图。本实施例包括:
501、确定所述第一分布的第一均值向量和第一协方差矩阵。
502、根据所述上一轮训练的权重向量确定后验分布、先验分布以及似然,根据所述似然确定对数似然。
示例性的,服务器根据上一轮训练的权重向量确定后验分布、先验分布以及似然。以上一轮训练为第一次训练、第一分布为高斯分布为例,则第一次训练过程中的权重向量中的权重是从高斯分布中采样得到的,用公式(1)表示:
w~N(w|m0,s0) 公式(1)
其中,w表示第一次训练过程中的权重向量,N表示batch中样本的数量,m0表示第一均值向量,s0表示第一协方差矩阵。由于本轮训练为第一次训练,第一次训练中,第一均值向量也称之为初始均值向量,第一协方差矩阵也称之为初始协方差矩阵。
根据公式(1)和贝叶斯定理可得公式(2):
p(w|t)∝p(w)*p(t|w) 公式(2)
其中,p表示分布,分布也称为概率,p(w|t)表示后验分布,∝表示正比,p(w)表示先验分布,p(t|w)表示似然。根据公式(2)可知:后验分布p(w|t)正比于先验分布p(w)与似然p(t|w)的成绩。
根据权重服从高斯分布的假设可得公式(3):
Figure BDA0003142469260000111
其中,表示i的取值范围为1~N,∏表示求乘积运算,yi表示第i个样本的预测参考值,ti表示第i个样本的实际参考值。
根据公式(3)可得公式(4):
Figure BDA0003142469260000112
其中,lnp(w|t)表示对数似然,const表示常数,ln表示对数。
503、根据所述对数似然确定第二均值向量以及第二协方差矩阵。
根据公式(4)可得公式(5)和公式(6):
Figure BDA0003142469260000113
Figure BDA0003142469260000114
其中,wmap表示更新后的均值向量,即第二均值向量,Hessian表示更新后的协方差矩阵,即第二协方差矩阵。
504、根据所述第二均值向量和所述第二协方差矩阵,确定第二分布。
示例性的,第二分布如公式(7)所示:
w~N(w|wmap,Hessian) 公式(7)
其中,w表示本轮训练的权重向量中的权重。本轮信令中,服务器对第二分布采样以得到本轮训练的权重向量。由此可见,每轮训练中权重是从新的分布(即第二分布)中采样出的一组权重,实现每轮训练中更新权重的目的。训练过程中,深度学习模型的其他参数的更新按照梯度下降等进行更新,最后一层的参数独立更新。最后一层的参数即为从拼接单元到激活单元的权重。
图6为本申请实施例提供的应用推荐方法中权重的更新流程图,包括:
601、先验采样。
示例性的,对于相邻两次训练中的第一次训练,服务器对第一分布采样得到上一轮训练的权重向量。
602、计算似然。
示例性的,服务器第一分布确定第一均值向量和第一协方差矩阵,之后计算后验分布、先验分布以及似然,并确定对数似然。
603、更新后验。
示例性的,服务器根据对数似然确定第二均值向量以及第二协方差矩阵,并根据第二均值向量和所述第二协方差矩阵,确定第二分布。
604、后验采样。
示例性的,服务器对第二分布采样以得到本轮训练的权重向量。之后,服务器进行本轮训练。
完成本轮训练后,若深度学习模型还没有达到最优,还需要继续训练,则返回步骤602,确定下一轮训练中用于确定权限向量的分布。
采用该种方案,服务器在最大似然的基础上,对网络输出层的权重做了贝叶斯化的处理,即在输出层,引入了权重的先验分布(即第一分布),来捕捉模型训练过程中权重分布的变化,以更新的分布(即第二分布)采样前向传播过程中的网络参数,来达到确定出合理的目标APP的目的。
需要说明的是,虽然上述实施例中,向终端设备推荐目标应用的服务器和训练深度学习模型的服务器为同一个服务器。然而,本申请实施例并不限制,其他可行的实现方式中,向终端设备推荐目标应用的服务器和训练深度学习模型的服务器可以为不同的服务器,用于训练深度学习模型的服务器训练好深度学习模型后,向终端社保推荐目标应用的服务器,即应用商店的服务器获取并加载该深度学习模型。
可选的,上述实施例中,服务器使用包含所述正样本和所述负样本的样本集训练初始模型以得到所述深度学习模型时,本轮训练中,确定本轮训练的受试者工作特征曲线下方的面积(Area Under Curve,AUC)。当所述AUC大于预设AUC时,停止训练所述深度学习模型,当AUC小于或等于预设AUC时,继续下一轮的训练。
示例性的,模型训练过程中,每次训练后,服务器判断本轮训练的ACU。对比ACU以确定模式是否最优,即确定何时停止模型训练。
采用该种方案,服务器根据ACU指标判断是否完成深度学习模型的训练,准确率高,时效性高。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图7为本申请实施例提供的应用推荐装置的结构示意图。该应用推荐装置700包括:接收模块71、处理模块72、确定模块73和发送模块74。
接收模块71,用于接收来自终端设备的应用推荐请求;
处理模块72,用于响应所述应用推荐请求,将当前用户的用户画像和候选集合中各应用程序APP的APP画像输入预先训练好的深度学习模型以获取所述候选集合中各APP的参考值,所述参考值用于指示用户下载所述候选集合中各APP的可能性,所述深度学习模型为训练过程中对权重在似然基础上进行贝叶斯化处理的模型;
确定模块73,用于根据所述候选集合中各APP的参考值,从所述候选集合中确定出目标APP;
发送模块74,用于向所述终端设备发送用于指示所述目标APP的应用推荐响应。
一种可行的实现方式中,所述处理模块72响应所述应用推荐请求之前,还用于根据历史用户的用户画像和所述历史用户已下载APP中的每个APP的APP画像,构建正样本;根据历史用户的用户画像和所述历史用户浏览但未下载的APP中每个APP的APP画像,构建负样本;使用包含所述正样本和所述负样本的样本集训练初始模型以得到所述深度学习模型。
一种可行的实现方式中,所述处理模块72使用包含所述正样本和所述负样本的样本集训练初始模型以得到所述深度学习模型时,用于本轮训练中,从所述样本集中确定出用于本轮训练的样本,并提取本轮训练的样本的稀疏特征和密集特征;处理所述稀疏特征和所述密集特征,以得到嵌入向量;根据所述嵌入向量确定二阶特征向量和高阶特征向量;拼接所述二阶特征向量和所述高阶特征向量以得到拼接特征向量;确定所述拼接特征向量对应的权重向量;根据所述权重向量和所述拼接特征向量训练初始模型以得到所述深度学习模型。
一种可行的实现方式中,所述处理模块72确定所述拼接特征向量对应的权重向量时,用于根据用于确定上一轮训练的权重向量的第一分布,确定第二分布;对所述第二分布采样以得到本轮训练的权重向量。
一种可行的实现方式中,所述处理模块72根据用于确定上一轮训练的权重向量的第一分布,确定第二分布时,用于确定所述第一分布的第一均值向量和第一协方差矩阵;根据所述上一轮训练的权重向量确定后验分布、先验分布以及似然;根据所述似然确定对数似然;根据所述对数似然确定第二均值向量以及第二协方差矩阵;根据所述第二均值向量和所述第二协方差矩阵,确定第二分布。
一种可行的实现方式中,当所述上一次训练为第一次训练时,所述第一分布为高斯分布或均匀分布。
一种可行的实现方式中,所述处理模块72使用包含所述正样本和所述负样本的样本集训练初始模型以得到所述深度学习模型时,用于本轮训练中,确定本轮训练的受试者工作特征曲线下方的面积AUC;当所述AUC大于预设AUC时,停止训练所述深度学习模型。
本申请实施例提供的应用推荐装置,可以执行上述实施例中服务器的动作,其实现原理和技术效果类似,在此不再赘述。
图8为本申请实施例提供的一种电子设备的结构示意图。该电子设备800例如为上述的服务器。如图8所示,该电子设备800包括:
处理器81和存储器82;
所述存储器82存储计算机指令;
所述处理器81执行所述存储器82存储的计算机指令,使得所述处理器81执行如上所述的应用推荐方法。
处理器81的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
可选地,该电子设备800还包括通信部件83。其中,处理器81、存储器82以及通信部件83可以通过总线84连接。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现如上所述的应用推荐方法。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包含计算机程序,计算机程序被处理器执行时实现如上所述的应用推荐方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种应用推荐方法,其特征在于,包括:
接收来自终端设备的应用推荐请求;
响应所述应用推荐请求,将当前用户的用户画像和候选集合中各应用程序APP的APP画像输入预先训练好的深度学习模型以获取所述候选集合中各APP的参考值,所述参考值用于指示用户下载所述候选集合中各APP的可能性,所述深度学习模型为训练过程中对权重在似然基础上进行贝叶斯化处理的模型;
根据所述候选集合中各APP的参考值,从所述候选集合中确定出目标APP;
向所述终端设备发送用于指示所述目标APP的应用推荐响应。
2.根据权利要求1所述的方法,其特征在于,所述响应所述应用推荐请求之前,还包括:
根据历史用户的用户画像和所述历史用户已下载APP中的每个APP的APP画像,构建正样本;
根据历史用户的用户画像和所述历史用户浏览但未下载的APP中每个APP的APP画像,构建负样本;
使用包含所述正样本和所述负样本的样本集训练初始模型以得到所述深度学习模型。
3.根据权利会要求2所述的方法,其特征在于,所述使用包含所述正样本和所述负样本的样本集训练初始模型以得到所述深度学习模型,包括:
本轮训练中,从所述样本集中确定出用于本轮训练的样本,并提取本轮训练的样本的稀疏特征和密集特征;
处理所述稀疏特征和所述密集特征,以得到嵌入向量;
根据所述嵌入向量确定二阶特征向量和高阶特征向量;
拼接所述二阶特征向量和所述高阶特征向量以得到拼接特征向量;
确定所述拼接特征向量对应的权重向量;
根据所述权重向量和所述拼接特征向量训练初始模型以得到所述深度学习模型。
4.根据权利要求3所述的方法,其特征在于,所述确定所述拼接特征向量对应的权重向量,包括:
根据用于确定上一轮训练的权重向量的第一分布,确定第二分布;
对所述第二分布采样以得到本轮训练的权重向量。
5.根据权利要求4所述的方法,其特征在于,所述根据用于确定上一轮训练的权重向量的第一分布,确定第二分布,包括:
确定所述第一分布的第一均值向量和第一协方差矩阵;
根据所述上一轮训练的权重向量确定后验分布、先验分布以及似然;
根据所述似然确定对数似然;
根据所述对数似然确定第二均值向量以及第二协方差矩阵;
根据所述第二均值向量和所述第二协方差矩阵,确定第二分布。
6.根据权利要求4所述的方法,其特征在于,
当所述上一次训练为第一次训练时,所述第一分布为高斯分布或均匀分布。
7.根据权利要求2-6任一项所述的方法,其特征在于,所述使用包含所述正样本和所述负样本的样本集训练初始模型以得到所述深度学习模型,包括:
本轮训练中,确定本轮训练的受试者工作特征曲线下方的面积AUC;
当所述AUC大于预设AUC时,停止训练所述深度学习模型。
8.一种应用推荐装置,其特征在于,包括:
接收模块,用于接收来自终端设备的应用推荐请求;
处理模块,用于响应所述应用推荐请求,将当前用户的用户画像和候选集合中各应用程序APP的APP画像输入预先训练好的深度学习模型以获取所述候选集合中各APP的参考值,所述参考值用于指示用户下载所述候选集合中各APP的可能性,所述深度学习模型为训练过程中对权重在似然基础上进行贝叶斯化处理的模型;
确定模块,用于根据所述候选集合中各APP的参考值,从所述候选集合中确定出目标APP;
发送模块,用于向所述终端设备发送用于指示所述目标APP的应用推荐响应。
9.一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时使得所述电子设备实现如权利要求1至7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机指令,所述计算机指令在被处理器执行时用于实现如权利要求1-7中任一项所述的方法。
CN202110743081.4A 2021-06-30 2021-06-30 应用推荐方法、装置、电子设备及可读存储介质 Pending CN113449188A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110743081.4A CN113449188A (zh) 2021-06-30 2021-06-30 应用推荐方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110743081.4A CN113449188A (zh) 2021-06-30 2021-06-30 应用推荐方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN113449188A true CN113449188A (zh) 2021-09-28

Family

ID=77814663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110743081.4A Pending CN113449188A (zh) 2021-06-30 2021-06-30 应用推荐方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113449188A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114743081A (zh) * 2022-05-10 2022-07-12 北京瑞莱智慧科技有限公司 模型训练方法、相关装置及存储介质
CN114996487A (zh) * 2022-05-24 2022-09-02 北京达佳互联信息技术有限公司 媒体资源推荐方法、装置、电子设备以及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090080731A1 (en) * 2007-09-26 2009-03-26 Siemens Medical Solutions Usa, Inc. System and Method for Multiple-Instance Learning for Computer Aided Diagnosis
US20150294191A1 (en) * 2014-04-15 2015-10-15 Xerox Corporation System and method for predicting iconicity of an image
CN107423442A (zh) * 2017-08-07 2017-12-01 火烈鸟网络(广州)股份有限公司 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备
US20190073590A1 (en) * 2017-09-01 2019-03-07 Facebook, Inc. Sparse Neural Network Training Optimization
US20190114668A1 (en) * 2016-09-13 2019-04-18 Tencent Technology (Shenzhen) Company Limited Application recommendation method and server
US20190188212A1 (en) * 2016-07-27 2019-06-20 Anomalee Inc. Prioritized detection and classification of clusters of anomalous samples on high-dimensional continuous and mixed discrete/continuous feature spaces
CN110189191A (zh) * 2019-05-05 2019-08-30 苏宁易购集团股份有限公司 一种基于实时模型的金融产品推荐方法及系统
US20200005149A1 (en) * 2018-06-28 2020-01-02 Microsoft Technology Licensing, Llc Applying learning-to-rank for search
CN111177575A (zh) * 2020-04-07 2020-05-19 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、电子设备和存储介质
WO2021071711A1 (en) * 2019-10-09 2021-04-15 The Uab Research Foundation Method for uncertainty estimation in deep neural networks

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090080731A1 (en) * 2007-09-26 2009-03-26 Siemens Medical Solutions Usa, Inc. System and Method for Multiple-Instance Learning for Computer Aided Diagnosis
US20150294191A1 (en) * 2014-04-15 2015-10-15 Xerox Corporation System and method for predicting iconicity of an image
US20190188212A1 (en) * 2016-07-27 2019-06-20 Anomalee Inc. Prioritized detection and classification of clusters of anomalous samples on high-dimensional continuous and mixed discrete/continuous feature spaces
US20190114668A1 (en) * 2016-09-13 2019-04-18 Tencent Technology (Shenzhen) Company Limited Application recommendation method and server
CN107423442A (zh) * 2017-08-07 2017-12-01 火烈鸟网络(广州)股份有限公司 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备
US20190073590A1 (en) * 2017-09-01 2019-03-07 Facebook, Inc. Sparse Neural Network Training Optimization
US20200005149A1 (en) * 2018-06-28 2020-01-02 Microsoft Technology Licensing, Llc Applying learning-to-rank for search
CN110189191A (zh) * 2019-05-05 2019-08-30 苏宁易购集团股份有限公司 一种基于实时模型的金融产品推荐方法及系统
WO2021071711A1 (en) * 2019-10-09 2021-04-15 The Uab Research Foundation Method for uncertainty estimation in deep neural networks
CN111177575A (zh) * 2020-04-07 2020-05-19 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114743081A (zh) * 2022-05-10 2022-07-12 北京瑞莱智慧科技有限公司 模型训练方法、相关装置及存储介质
CN114996487A (zh) * 2022-05-24 2022-09-02 北京达佳互联信息技术有限公司 媒体资源推荐方法、装置、电子设备以及存储介质

Similar Documents

Publication Publication Date Title
CN109872242B (zh) 信息推送方法和装置
CN110008973B (zh) 一种模型训练方法、基于模型确定目标用户的方法及装置
CN114265979B (zh) 确定融合参数的方法、信息推荐方法和模型训练方法
CN113449188A (zh) 应用推荐方法、装置、电子设备及可读存储介质
CN110889759A (zh) 信用数据的确定方法、装置及存储介质
CN112232546A (zh) 一种推荐概率预估方法、装置、电子设备及存储介质
CN111783810A (zh) 用于确定用户的属性信息的方法和装置
CN110209658A (zh) 数据清洗方法和装置
CN108667877B (zh) 确定推荐信息的方法及装置、计算机设备及存储介质
CN113822460A (zh) 一种交通流量预测方法、装置、电子设备和存储介质
CN114417174B (zh) 内容推荐方法、装置、设备及计算机存储介质
CN113836388B (zh) 信息推荐方法、装置、服务器及存储介质
CN113836390A (zh) 资源推荐方法、装置、计算机设备及存储介质
CN109544241B (zh) 一种点击率预估模型的构建方法、点击率预估方法和装置
CN111291868A (zh) 网络模型训练方法、装置、设备及计算机可读存储介质
US20150170035A1 (en) Real time personalization and categorization of entities
CN114430504A (zh) 一种媒体内容的推荐方法以及相关装置
CN111159558B (zh) 一种推荐列表的生成方法、装置和电子设备
CN113051126B (zh) 画像构建方法、装置、设备及存储介质
CN113609397A (zh) 用于推送信息的方法和装置
CN111949860A (zh) 用于生成相关度确定模型的方法和装置
CN113065066B (zh) 预测方法、装置、服务器及存储介质
CN116720003B (zh) 排序处理方法、装置、计算机设备、及存储介质
US20230245206A1 (en) Time sensitive item-to-item recommendation system and method
CN113283115B (zh) 图像模型生成方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210928

RJ01 Rejection of invention patent application after publication