CN105117440A - 确定待推荐应用app的方法及装置 - Google Patents
确定待推荐应用app的方法及装置 Download PDFInfo
- Publication number
- CN105117440A CN105117440A CN201510490713.5A CN201510490713A CN105117440A CN 105117440 A CN105117440 A CN 105117440A CN 201510490713 A CN201510490713 A CN 201510490713A CN 105117440 A CN105117440 A CN 105117440A
- Authority
- CN
- China
- Prior art keywords
- app
- term vector
- recommended
- vector
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Abstract
本发明提供了一种确定待推荐应用APP的方法和装置,包括:获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;将词语集合通过神经网络语言模型进行训练,确定词语集合对应的第一词向量;将第一词向量通过预测模型进行预测计算处理;根据预测计算结果来确定待推荐应用APP。本发明中,由于采取了基于终端用户的历史安装数据构建词向量来确定待推荐应用APP的方法,即在推荐过程中考虑到终端用户的实际使用习惯和实际使用需求,使得确定的待推荐APP与终端用户具有较高匹配度,进一步地,将与终端用户匹配度较高的APP推荐至终端用户后,用户可快速获取与其使用需求和使用习惯相匹配的APP,提高了用户的使用体验。
Description
技术领域
本发明涉及计算机技术领域,具体而言,本发明涉及确定待推荐应用APP的方法及装置。
背景技术
随着时代的发展,各种终端设备已成为人们生活中必不可少的工具,各种功能强大的终端应用程序APP不断涌现,为用户带来了更加便捷的体验。目前的应用搜索及应用管理服务均会提供应用推荐功能,现有的应用推荐功能大多采用根据下载量和/或用户评价机制来进行相关APP推荐的方式,因此,人气较高的APP会依赖滚雪球效应不断被推荐下载,由于该种推荐方式并未考虑个体用户的实际使用需求,因此,推荐至用户的APP与个体用户的匹配度较低。因此,有必要寻找一种更加合理的APP推荐方法,使得被推荐的APP更加符合用户的使用习惯及使用需求。
发明内容
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
本发明的实施例提出了一种确定待推荐应用APP的方法,包括:
获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;
将所述词语集合通过神经网络语言模型进行训练,确定所述词语集合对应的第一词向量;
将所述第一词向量通过预测模型进行预测计算处理;
根据预测计算结果来确定待推荐应用APP。
其中,神经网络语言模型,具体包括以下至少任一项:
CBOW模型;Skip-gram模型。
优选地,将所述第一词向量通过预测模型进行预测计算处理的方法,具体包括:
将所述第一词向量与APP词向量存储库中的多个APP词向量进行相似度计算,获取所述第一词向量与各个APP词向量之间的向量相似度。
其中,根据预测计算结果来确定待推荐应用APP,包括以下至少一种情形:
将与所述第一词向量的向量相似度大于预定相似度阈值的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP;
对向量相似度进行排序,并将与前预定位数的向量相似度相应的APP词向量对应的APP确定为待推荐应用APP。
可选地,将所述第一词向量通过预测模型进行预测计算处理,具体包括:
将所述第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理;
其中,根据预测计算结果来确定待推荐应用APP,具体包括:
将与所述第一词向量为同一类的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP。
优选地,采用k-means聚类方法将所述第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理。
本发明的另一实施例提出了一种确定待推荐应用APP的装置,包括:
集合生成模块,用于获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;
词向量确定模块,用于将所述词语集合通过神经网络语言模型进行训练,确定所述词语集合对应的第一词向量;
计算模块,用于将所述第一词向量通过预测模型进行预测计算处理;
APP确定模块,用于根据预测计算结果来确定待推荐应用APP。
其中,所述神经网络语言模型包括以下至少任一项:
CBOW模型;Skip-gram模型。
优选地,所述计算模块具体用于将所述第一词向量与APP词向量存储库中的多个APP词向量进行相似度计算,获取所述第一词向量与各个APP词向量之间的向量相似度。
可选地,所述APP确定模块用于将与所述第一词向量的向量相似度大于预定相似度阈值的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP;或所述APP确定模块用于对向量相似度进行排序,并将与前预定位数的向量相似度相应的APP词向量对应的APP确定为待推荐应用APP。
优选地,所述计算模块具体用于将所述第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理;所述APP确定模块具体用于将与所述第一词向量为同一类的至少一个APP词向量对应的APP确定为待推荐应用APP。
其中,采用k-means聚类方法将所述第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理。
本发明还提供了一种确定待推荐应用APP的系统,包括服务器端的推荐引擎、推荐数据接口以及终端设备端的页面展示模块:
所述推荐引擎,用于获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;将所述词语集合通过神经网络语言模型进行训练,确定所述词语集合对应的第一词向量;将所述第一词向量通过预测模型进行预测计算处理;根据预测计算结果来确定待推荐应用APP;
所述数据接口,用于将所述待推荐应用APP进行封装并传输至终端设备;
所述页面展示模块,用于接收所述待推荐应用APP,并将所述待推荐应用APP通过应用展示页面进行展示。
本发明的实施例中,提出了确定待推荐应用APP的方案,将包括按照安装时序排列的多个APP名称组成的词语集合通过神经网络语言模型进行训练,确定词语集合对应的第一词向量,并将第一词向量通过预测模型进行预测计算处理,根据预测计算结果来确定待推荐应用APP。本发明中,由于采取了基于终端用户的历史安装数据构建词向量来确定待推荐应用APP的方法,即在推荐过程中考虑到终端用户的实际使用习惯和实际使用需求,使得确定的待推荐APP与终端用户具有较高匹配度,进一步地,将与终端用户匹配度较高的APP推荐至终端用户后,用户可快速获取与其使用需求和使用习惯相匹配的APP,提高了用户的使用体验;同时,也会大大提高用户点击下载推荐APP的几率,提高了服务提供方的推荐效果。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明中一个实施例的确定待推荐应用APP的方法的流程图;
图2为本发明中另一实施例的确定待推荐应用APP的装置的结构示意图;
图3为本发明中又一实施例的确定待推荐应用APP的系统的框架示意图;
图4为本方案一个优选实施例的确定待推荐应用APP的系统的框架示意图;
图5为本方案另一优选实施例的确定待推荐应用APP的系统的框架示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
图1为本发明中一个实施例的确定待推荐应用APP的方法的流程图。
步骤S110:获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;步骤S120:将词语集合通过神经网络语言模型进行训练,确定词语集合对应的第一词向量;步骤S130:将第一词向量通过预测模型进行预测计算处理;步骤S140:根据预测计算结果来确定待推荐应用APP。
其中,本发明的实施例中的待推荐APP,可包括:游戏、书籍、娱乐、教育、旅游、商务、音乐、体育、新闻、健康医疗、摄影、医学、导航、天气等类别的应用。
步骤S110:获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合。
具体地,根据终端用户的ID或终端设备的设备标识来获取到该终端用户本地存储的APP安装日志信息,也可以在网络侧服务器,例如日志服务器中获取用户的APP安装日志信息,其中,APP安装日志信息记录中记录用户下载的应用的标识符、应用的图标、下载地址等信息;并从该APP安装日志信息提取在预定时长内该终端用户安装的多个APP名称,按照安装时序生成包括多个APP名称的词语集合。
其中,所述设备标识用于标识一个计算设备,如,计算设备的IP地址,网卡地址和MID值等。其中,MID(MobileInternetDevice,移动互联网设备)值是通过移动设备的硬件的编号计算出的唯一的特征值。例如,从用户user1从APP安装日志信息中提取到依据安装时序排列的安装APP名称为:
2015.08.0318:00:00安装了APP1
2015.08.0318:10:00安装了APP2
2015.08.0318:20:00安装了APP3
……;
基于安装时序生成包括多个APP名称的词语集合{APP1,APP2,APP3,……}。
步骤S120:将词语集合通过神经网络语言模型进行训练,确定词语集合对应的第一词向量。
具体地,将词语集合作为神经网络语言模型的输入数据进行训练,输出得到该词语集合对应的第一词向量。
其中,神经网络语言模型包括但不限于:CBOW模型;Skip-gram模型。词向量是通过深度学习中的神经网络语言模型词训练的得到的向量,其是用DistributedRepresentation表示的一种低维实数向量;如该种向量的表示方式可为[0.792,?0.177,?0.107,0.109,?0.542,…],且维度可包括50维或100维;词向量可以用来刻画词之间的语义距离。
S130:将第一词向量通过预测模型进行预测计算处理。
其中,所述预测计算处理可包括离线计算和在线计算两种方式。
步骤S140:根据预测计算结果来确定待推荐应用APP。
优选地,S130包括步骤S131(图中未示出);步骤S131:将第一词向量与APP词向量存储库中的多个APP词向量进行相似度计算,获取第一词向量与各个APP词向量之间的向量相似度。
可选地,S140包括步骤S141(图中未示出);步骤S141:将与第一词向量的向量相似度大于预定相似度阈值的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP。
在一个具体应用场景中,将第一词向量与APP词向量存储库中的各个APP词向量进行cosine相似度计算,获取第一词向量与各个APP词向量之间的向量相似度;提取与第一词向量的向量相似度大于预定相似度阈值的至少一个APP词向量,并将至少一个APP词向量分别对应的APP确定为待推荐应用APP。
其中,词向量存储库部署于云端服务器中,云端服务器通过收集海量APP样本来维护和更新云端数据库存储的数据。词向量存储库中包括以往根据用户的下载记录计算得的APP词向量、根据人工标记的数据计算获得的APP词向量。
可选地,S140包括步骤S142(图中未示出);步骤S142:对向量相似度进行排序,并将与前预定位数的向量相似度相应的APP词向量对应的APP确定为待推荐应用APP。
在另一个具体应用场景中,将第一词向量与APP词向量存储库中的各个APP词向量进行cosine相似度计算,获取第一词向量与各个APP词向量之间的向量相似度;将获取到的向量相似度进行排序处理,根据排序结果,提取如将排序前三位的向量相似度相应的一个或多个APP词向量,并将该一个或多个APP词向量对应的APP确定为待推荐应用APP。
再优选地,S130包括步骤S132(图中未示出),S140包括步骤S143(图中未示出);步骤S132:将第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理;步骤S143:将与第一词向量为同一类的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP。
其中,采用k-means聚类方法将第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理。
在一个具体应用场景中,将第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理,当采用k-means聚类方法进行聚类时,将第一词向量和多个APP词向量作为训练样本{x(1),...,x(m)},其中,,K-means聚类算法是将训练样本聚类成k个簇(cluster),具体聚类过程如下所示:
首先,随机选取k个聚类质心点(clustercentroids)为。
随后,重复下面过程直到收敛{
对于每一个样例i,计算其应该属于的类
对于每一个类j,重新计算该类的质心
将与第一词向量聚类为同一类的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP。
本发明的实施例中,由于采取了基于终端用户的历史安装数据构建词向量来确定待推荐应用APP的方法,即在推荐过程中考虑到终端用户的实际使用习惯和实际使用需求,使得确定的待推荐APP与终端用户具有较高匹配度,进一步地,将与终端用户匹配度较高的APP推荐至终端用户后,用户可快速获取与其使用需求和使用习惯相匹配的APP,提高了用户的使用体验;同时,也会大大提高用户点击下载推荐APP的几率,提高了服务提供方的推荐效果。
图2为本发明中另一实施例的确定待推荐应用APP的装置的结构示意图。
集合生成模块210获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;词向量确定模块220将词语集合通过神经网络语言模型进行训练,确定词语集合对应的第一词向量;计算模块230将第一词向量通过预测模型进行预测计算处理;APP确定模块240根据预测计算结果来确定待推荐应用APP。
本发明的实施例中,由于采取了基于终端用户的历史安装数据构建词向量来确定待推荐应用APP的方法,即在推荐过程中考虑到终端用户的实际使用习惯和实际使用需求,使得确定的待推荐APP与终端用户具有较高匹配度,进一步地,将与终端用户匹配度较高的APP推荐至终端用户后,用户可快速获取与其使用需求和使用习惯相匹配的APP,提高了用户的使用体验;同时,也会大大提高用户点击下载推荐APP的几率,提高了服务提供方的推荐效果。
集合生成模块210获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合。
具体地,根据终端用户的ID,获取到该终端用户的APP安装日志信息,并从该APP安装日志信息提取在预定时长内该终端用户安装的多个APP名称,按照安装时序生成包括多个APP名称的词语集合。
例如,从用户user1从APP安装日志信息中提取到依据安装时序排列的安装APP名称为:
2015.08.0318:00:00安装了APP1
2015.08.0318:10:00安装了APP2
2015.08.0318:20:00安装了APP3
……;
基于安装时序生成包括多个APP名称的词语集合{APP1,APP2,APP3,……}。
词向量确定模块220将词语集合通过神经网络语言模型进行训练,确定词语集合对应的第一词向量。
具体地,将词语集合作为神经网络语言模型的输入数据进行训练,输出得到该词语集合对应的第一词向量。
其中,神经网络语言模型包括但不限于:CBOW模型;Skip-gram模型。词向量是通过深度学习中的神经网络语言模型词训练的得到的向量,其是用DistributedRepresentation表示的一种低维实数向量;如该种向量的表示方式可为[0.792,?0.177,?0.107,0.109,?0.542,…],且维度可包括50维或100维;词向量可以用来刻画词之间的语义距离。
计算模块230将第一词向量通过预测模型进行预测计算处理。
其中,所述预测计算处理可包括离线计算和在线计算两种方式。
APP确定模块240根据预测计算结果来确定待推荐应用APP。
优选地,计算模块230将第一词向量与APP词向量存储库中的多个APP词向量进行相似度计算,获取第一词向量与各个APP词向量之间的向量相似度。
可选地,APP确定模块240将与第一词向量的向量相似度大于预定相似度阈值的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP。
在一个具体应用场景中,将第一词向量与APP词向量存储库中的各个APP词向量进行cosine相似度计算,获取第一词向量与各个APP词向量之间的向量相似度;提取与第一词向量的向量相似度大于预定相似度阈值的至少一个APP词向量,并将至少一个APP词向量分别对应的APP确定为待推荐应用APP。
可选地,APP确定模块240对向量相似度进行排序,并将与前预定位数的向量相似度相应的APP词向量对应的APP确定为待推荐应用APP。
在另一个具体应用场景中,将第一词向量与APP词向量存储库中的各个APP词向量进行cosine相似度计算,获取第一词向量与各个APP词向量之间的向量相似度;将获取到的向量相似度进行排序处理,根据排序结果,提取如将排序前三位的向量相似度相应的一个或多个APP词向量,并将该一个或多个APP词向量对应的APP确定为待推荐应用APP。
再优选地,计算模块230将第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理;APP确定模块240将与第一词向量为同一类的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP。
其中,采用k-means聚类方法将第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理。
在一个具体应用场景中,将第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理,当采用k-means聚类方法进行聚类时,将第一词向量和多个APP词向量作为训练样本{x(1),...,x(m)},其中,,K-means聚类算法是将训练样本聚类成k个簇(cluster),具体聚类过程如下所示:
首先,随机选取k个聚类质心点(clustercentroids)为。
随后,重复下面过程直到收敛{
对于每一个样例i,计算其应该属于的类
对于每一个类j,重新计算该类的质心
将与第一词向量聚类为同一类的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP。
图3为本发明中又一实施例的确定待推荐应用APP的系统的框架示意图。
其中,该系统包括服务器端的推荐引擎411、数据接口412以及终端设备端的页面展示模块421。
推荐引擎411获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;将词语集合通过神经网络语言模型进行训练,确定词语集合对应的第一词向量;将第一词向量通过预测模型进行预测计算处理;根据预测计算结果来确定待推荐应用APP;数据接口412将待推荐应用APP进行封装并传输至终端设备;页面展示模块421接收所述待推荐应用APP,并将待推荐应用APP通过应用展示页面进行展示。
在一个优选实例中,如图4所示,该系统还包括服务器端的数据层,数据接口421具体包括推荐数据接口和服务端前端接口;具体地:
数据层存储APP相关数据,包括APP名称、APP标签、APP分类以及预存储的APP词向量等,数据层中包括APP词向量存储库;用户相关数据,包括用户浏览的行为记录、用户下载的行为记录等;推荐引擎获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;将词语集合通过神经网络语言模型进行训练,确定词语集合对应的第一词向量;将第一词向量通过预测模型进行预测计算处理;根据预测计算结果来确定待推荐应用APP;推荐数据接口将待推荐应用APP传输至服务端前端接口;服务端前端接口将推荐数据接口返回的待推荐APP的相关数据重新封装成终端设备端的产品展现层能展示的数据形式;产品展现模块将接收到的封装后的待推荐APP的相关数据在应用展示页面中进行展示。
在另一优选实例中,如图5所示,该系统还包括后台部分,具体地:页面展示模块,对应图5中的页面展示层,用于软件的板块展现的业务逻辑部分,负责用户行为数据采集,推荐结果呈现,主要以页面的形式在客户端中展现;推荐引擎包括离线计算引擎、在线推荐备选应用集合和推荐在线计算接口,离线计算引擎用于针对待推荐APP的数据运算,在线推荐备选应用集合用于存储待推荐APP,推荐在线计算接口用于根据用户相关数据进行个性化计算;后台部分,具体包括运营后台和统计后台,运营后台用于结果数据展现,结果数据展现用于维护推荐应用集合。
本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-OnlyMemory,只读存储器)、RAM(RandomAccessMemory,随即存储器)、EPROM(ErasableProgrammableRead-OnlyMemory,可擦写可编程只读存储器)、EEPROM(ElectricallyErasableProgrammableRead-OnlyMemory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种确定待推荐应用APP的方法,其特征在于,包括:
获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;
将所述词语集合通过神经网络语言模型进行训练,确定所述词语集合对应的第一词向量;
将所述第一词向量通过预测模型进行预测计算处理;
根据预测计算结果来确定待推荐应用APP。
2.根据权利要求1所述的确定待推荐应用APP的方法,其中,所述神经网络语言模型包括以下至少任一项:
CBOW模型;Skip-gram模型。
3.根据权利要求1或2所述的确定待推荐应用APP的方法,其中,将所述第一词向量通过预测模型进行预测计算处理,包括:
将所述第一词向量与APP词向量存储库中的多个APP词向量进行相似度计算,获取所述第一词向量与各个APP词向量之间的向量相似度。
4.根据权利要求3所述的确定待推荐应用APP的方法,其中,根据预测计算结果来确定待推荐应用APP,包括以下至少一种情形:
将与所述第一词向量的向量相似度大于预定相似度阈值的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP;
对向量相似度进行排序,并将与前预定位数的向量相似度相应的APP词向量对应的APP确定为待推荐应用APP。
5.根据权利要求1或2所述的确定待推荐应用APP的方法,其中,将所述第一词向量通过预测模型进行预测计算处理,包括:
将所述第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理;
其中,根据预测计算结果来确定待推荐应用APP,具体包括:
将与所述第一词向量为同一类的至少一个APP词向量对应的至少一个APP确定为待推荐应用APP。
6.根据权利要求5所述的确定待推荐应用APP的方法,其中,采用k-means聚类方法将所述第一词向量与APP词向量存储库中的多个APP词向量进行聚类处理。
7.一种确定待推荐应用APP的装置,其特征在于,包括:
集合生成模块,用于获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;
词向量确定模块,用于将所述词语集合通过神经网络语言模型进行训练,确定所述词语集合对应的第一词向量;
计算模块,用于将所述第一词向量通过预测模型进行预测计算处理;
APP确定模块,用于根据预测计算结果来确定待推荐应用APP。
8.根据权利要求7所述的确定待推荐应用APP的装置,其中,所述神经网络语言模型包括以下至少任一项:
CBOW模型;Skip-gram模型。
9.根据权利要求7或8所述的确定待推荐应用APP的装置,其中,所述计算模块具体用于将所述第一词向量与APP词向量存储库中的多个APP词向量进行相似度计算,获取所述第一词向量与各个APP词向量之间的向量相似度。
10.一种确定待推荐应用APP的系统,其特征在于,包括服务器端的推荐引擎、推荐数据接口以及终端设备端的页面展示模块:
所述推荐引擎,用于获取终端用户在预定时长内安装的多个APP名称,并基于安装时序生成包括多个APP名称的词语集合;将所述词语集合通过神经网络语言模型进行训练,确定所述词语集合对应的第一词向量;将所述第一词向量通过预测模型进行预测计算处理;根据预测计算结果来确定待推荐应用APP;
所述数据接口,用于将所述待推荐应用APP进行封装并传输至终端设备;
所述页面展示模块,用于接收所述待推荐应用APP,并将所述待推荐应用APP通过应用展示页面进行展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510490713.5A CN105117440A (zh) | 2015-08-11 | 2015-08-11 | 确定待推荐应用app的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510490713.5A CN105117440A (zh) | 2015-08-11 | 2015-08-11 | 确定待推荐应用app的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105117440A true CN105117440A (zh) | 2015-12-02 |
Family
ID=54665430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510490713.5A Pending CN105117440A (zh) | 2015-08-11 | 2015-08-11 | 确定待推荐应用app的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105117440A (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105302622A (zh) * | 2015-12-09 | 2016-02-03 | 北京奇虎科技有限公司 | 安装软件的方法及装置 |
CN106126597A (zh) * | 2016-06-20 | 2016-11-16 | 乐视控股(北京)有限公司 | 用户属性预测方法及装置 |
CN106202515A (zh) * | 2016-07-22 | 2016-12-07 | 浙江大学 | 一种基于排序学习的移动应用推荐方法及其推荐系统 |
CN106326369A (zh) * | 2016-08-12 | 2017-01-11 | 广州优视网络科技有限公司 | 应用专题推荐方法、装置及服务器 |
CN106599226A (zh) * | 2016-12-19 | 2017-04-26 | 深圳大学 | 一种内容推荐方法及内容推荐系统 |
CN107818105A (zh) * | 2016-09-13 | 2018-03-20 | 腾讯科技(深圳)有限公司 | 应用程序的推荐方法及服务器 |
CN107885852A (zh) * | 2017-11-13 | 2018-04-06 | 上海交通大学 | 一种基于app使用记录的app推荐方法及系统 |
CN108062342A (zh) * | 2016-11-08 | 2018-05-22 | 北京国双科技有限公司 | 应用程序的推荐方法及装置 |
CN108170665A (zh) * | 2017-11-29 | 2018-06-15 | 有米科技股份有限公司 | 基于综合相似度的关键词拓展方法和装置 |
CN108304440A (zh) * | 2017-11-01 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 游戏推送的方法、装置、计算机设备及存储介质 |
CN108520034A (zh) * | 2018-03-29 | 2018-09-11 | 广州优视网络科技有限公司 | 应用推荐方法、装置及计算机设备 |
CN108536572A (zh) * | 2018-04-16 | 2018-09-14 | 浙江大学 | 基于AppUsage2Vec模型的智能手机App使用预测方法 |
CN108563639A (zh) * | 2018-04-17 | 2018-09-21 | 内蒙古工业大学 | 一种基于循环神经网络的蒙古语语言模型 |
CN108574704A (zh) * | 2017-03-08 | 2018-09-25 | 北京搜狗科技发展有限公司 | App套件的发送方法及装置、推荐方法及装置 |
CN108809987A (zh) * | 2018-06-14 | 2018-11-13 | 广州任天游网络科技有限公司 | 一种基于大数据分析的网游推广方法 |
CN109636450A (zh) * | 2018-11-29 | 2019-04-16 | 北京金山安全软件有限公司 | 广告推送方法、装置、电子设备及存储介质 |
WO2019096330A1 (en) * | 2017-11-20 | 2019-05-23 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Application prediction method, application preloading method and application preloading apparatus |
CN110309427A (zh) * | 2018-05-31 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 一种对象推荐方法、装置及存储介质 |
CN110765352A (zh) * | 2019-10-11 | 2020-02-07 | 上海上湖信息技术有限公司 | 一种用户兴趣识别方法及装置 |
CN110807097A (zh) * | 2018-08-03 | 2020-02-18 | 北京京东尚科信息技术有限公司 | 分析数据的方法和装置 |
CN111259231A (zh) * | 2018-12-03 | 2020-06-09 | 珠海格力电器股份有限公司 | 应用程序的推荐方法和装置 |
CN111672128A (zh) * | 2020-05-18 | 2020-09-18 | 苏州思酷数字科技有限公司 | 基于本地保留时长识别的游戏商城游戏推荐方法及系统 |
CN111753145A (zh) * | 2020-06-10 | 2020-10-09 | 西北工业大学 | 一种基于时序模式的移动应用使用预测方法 |
CN112667252A (zh) * | 2020-12-30 | 2021-04-16 | 瀚云科技有限公司 | 数据处理方法和装置、服务器及存储介质 |
CN114443967A (zh) * | 2022-04-08 | 2022-05-06 | 北京并行科技股份有限公司 | 一种相似应用推荐方法、计算设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722379A (zh) * | 2011-03-30 | 2012-10-10 | 腾讯科技(深圳)有限公司 | 软件推荐方法及系统 |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
CN102880501A (zh) * | 2012-07-24 | 2013-01-16 | 北京奇虎科技有限公司 | 应用推荐的实现方法、装置和系统 |
CN103778548A (zh) * | 2012-10-19 | 2014-05-07 | 阿里巴巴集团控股有限公司 | 商品信息与关键词匹配方法、商品信息投放方法及装置 |
CN104090890A (zh) * | 2013-12-12 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 关键词相似度获取方法、装置及服务器 |
CN104199822A (zh) * | 2014-07-11 | 2014-12-10 | 五八同城信息技术有限公司 | 一种识别搜索对应的需求分类的方法和系统 |
CN104636456A (zh) * | 2015-02-03 | 2015-05-20 | 大连理工大学 | 一种基于词向量的问题路由方法 |
-
2015
- 2015-08-11 CN CN201510490713.5A patent/CN105117440A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722379A (zh) * | 2011-03-30 | 2012-10-10 | 腾讯科技(深圳)有限公司 | 软件推荐方法及系统 |
CN102880501A (zh) * | 2012-07-24 | 2013-01-16 | 北京奇虎科技有限公司 | 应用推荐的实现方法、装置和系统 |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
CN103778548A (zh) * | 2012-10-19 | 2014-05-07 | 阿里巴巴集团控股有限公司 | 商品信息与关键词匹配方法、商品信息投放方法及装置 |
CN104090890A (zh) * | 2013-12-12 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 关键词相似度获取方法、装置及服务器 |
CN104199822A (zh) * | 2014-07-11 | 2014-12-10 | 五八同城信息技术有限公司 | 一种识别搜索对应的需求分类的方法和系统 |
CN104636456A (zh) * | 2015-02-03 | 2015-05-20 | 大连理工大学 | 一种基于词向量的问题路由方法 |
Cited By (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105302622A (zh) * | 2015-12-09 | 2016-02-03 | 北京奇虎科技有限公司 | 安装软件的方法及装置 |
CN106126597A (zh) * | 2016-06-20 | 2016-11-16 | 乐视控股(北京)有限公司 | 用户属性预测方法及装置 |
WO2017219548A1 (zh) * | 2016-06-20 | 2017-12-28 | 乐视控股(北京)有限公司 | 用户属性预测方法及装置 |
CN106202515A (zh) * | 2016-07-22 | 2016-12-07 | 浙江大学 | 一种基于排序学习的移动应用推荐方法及其推荐系统 |
CN106326369A (zh) * | 2016-08-12 | 2017-01-11 | 广州优视网络科技有限公司 | 应用专题推荐方法、装置及服务器 |
CN106326369B (zh) * | 2016-08-12 | 2019-12-31 | 广州优视网络科技有限公司 | 应用专题推荐方法、装置及服务器 |
CN107818105A (zh) * | 2016-09-13 | 2018-03-20 | 腾讯科技(深圳)有限公司 | 应用程序的推荐方法及服务器 |
US11157956B2 (en) | 2016-09-13 | 2021-10-26 | Tencent Technology (Shenzhen) Company Limited | Application recommendation method and server |
CN108062342A (zh) * | 2016-11-08 | 2018-05-22 | 北京国双科技有限公司 | 应用程序的推荐方法及装置 |
CN106599226B (zh) * | 2016-12-19 | 2020-08-28 | 深圳大学 | 一种内容推荐方法及内容推荐系统 |
CN106599226A (zh) * | 2016-12-19 | 2017-04-26 | 深圳大学 | 一种内容推荐方法及内容推荐系统 |
CN108574704B (zh) * | 2017-03-08 | 2022-02-01 | 北京搜狗科技发展有限公司 | App套件的发送方法及装置、推荐方法及装置 |
CN108574704A (zh) * | 2017-03-08 | 2018-09-25 | 北京搜狗科技发展有限公司 | App套件的发送方法及装置、推荐方法及装置 |
CN108304440A (zh) * | 2017-11-01 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 游戏推送的方法、装置、计算机设备及存储介质 |
CN108304440B (zh) * | 2017-11-01 | 2021-08-31 | 腾讯科技(深圳)有限公司 | 游戏推送的方法、装置、计算机设备及存储介质 |
CN107885852A (zh) * | 2017-11-13 | 2018-04-06 | 上海交通大学 | 一种基于app使用记录的app推荐方法及系统 |
WO2019096330A1 (en) * | 2017-11-20 | 2019-05-23 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Application prediction method, application preloading method and application preloading apparatus |
CN109814936A (zh) * | 2017-11-20 | 2019-05-28 | 广东欧珀移动通信有限公司 | 应用程序预测模型建立、预加载方法、装置、介质及终端 |
CN108170665A (zh) * | 2017-11-29 | 2018-06-15 | 有米科技股份有限公司 | 基于综合相似度的关键词拓展方法和装置 |
CN108520034B (zh) * | 2018-03-29 | 2021-01-05 | 阿里巴巴(中国)有限公司 | 应用推荐方法、装置及计算机设备 |
CN108520034A (zh) * | 2018-03-29 | 2018-09-11 | 广州优视网络科技有限公司 | 应用推荐方法、装置及计算机设备 |
CN108536572B (zh) * | 2018-04-16 | 2020-05-12 | 浙江大学 | 基于AppUsage2Vec模型的智能手机App使用预测方法 |
CN108536572A (zh) * | 2018-04-16 | 2018-09-14 | 浙江大学 | 基于AppUsage2Vec模型的智能手机App使用预测方法 |
CN108563639B (zh) * | 2018-04-17 | 2021-09-17 | 内蒙古工业大学 | 一种基于循环神经网络的蒙古语语言模型 |
CN108563639A (zh) * | 2018-04-17 | 2018-09-21 | 内蒙古工业大学 | 一种基于循环神经网络的蒙古语语言模型 |
CN110309427A (zh) * | 2018-05-31 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 一种对象推荐方法、装置及存储介质 |
CN110309427B (zh) * | 2018-05-31 | 2023-03-10 | 腾讯科技(深圳)有限公司 | 一种对象推荐方法、装置及存储介质 |
CN108809987B (zh) * | 2018-06-14 | 2020-10-23 | 江苏果米文化发展有限公司 | 一种基于大数据分析的网游推广方法 |
CN108809987A (zh) * | 2018-06-14 | 2018-11-13 | 广州任天游网络科技有限公司 | 一种基于大数据分析的网游推广方法 |
CN110807097A (zh) * | 2018-08-03 | 2020-02-18 | 北京京东尚科信息技术有限公司 | 分析数据的方法和装置 |
CN109636450A (zh) * | 2018-11-29 | 2019-04-16 | 北京金山安全软件有限公司 | 广告推送方法、装置、电子设备及存储介质 |
CN109636450B (zh) * | 2018-11-29 | 2023-01-13 | 北京金山安全软件有限公司 | 广告推送方法、装置、电子设备及存储介质 |
CN111259231A (zh) * | 2018-12-03 | 2020-06-09 | 珠海格力电器股份有限公司 | 应用程序的推荐方法和装置 |
CN110765352A (zh) * | 2019-10-11 | 2020-02-07 | 上海上湖信息技术有限公司 | 一种用户兴趣识别方法及装置 |
CN110765352B (zh) * | 2019-10-11 | 2022-11-11 | 上海上湖信息技术有限公司 | 一种用户兴趣识别方法及装置 |
CN111672128A (zh) * | 2020-05-18 | 2020-09-18 | 苏州思酷数字科技有限公司 | 基于本地保留时长识别的游戏商城游戏推荐方法及系统 |
CN111753145A (zh) * | 2020-06-10 | 2020-10-09 | 西北工业大学 | 一种基于时序模式的移动应用使用预测方法 |
CN112667252A (zh) * | 2020-12-30 | 2021-04-16 | 瀚云科技有限公司 | 数据处理方法和装置、服务器及存储介质 |
CN114443967A (zh) * | 2022-04-08 | 2022-05-06 | 北京并行科技股份有限公司 | 一种相似应用推荐方法、计算设备及存储介质 |
CN114443967B (zh) * | 2022-04-08 | 2022-07-08 | 北京并行科技股份有限公司 | 一种相似应用推荐方法、计算设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105117440A (zh) | 确定待推荐应用app的方法及装置 | |
US11157956B2 (en) | Application recommendation method and server | |
CN108427708B (zh) | 数据处理方法、装置、存储介质和电子装置 | |
CN105912669B (zh) | 用于补全搜索词及建立个体兴趣模型的方法及装置 | |
CN103455522B (zh) | 应用程序扩展工具推荐方法及系统 | |
CN104834641B (zh) | 网络媒介信息的处理方法和相关系统 | |
CN105740268A (zh) | 一种信息推送方法和装置 | |
CN105447730A (zh) | 目标用户定向方法及装置 | |
CN110852793A (zh) | 文案推荐方法及装置、电子设备 | |
CN105095187A (zh) | 一种搜索意图识别方法及装置 | |
CN102663022B (zh) | 一种基于url的分类识别方法 | |
CN109388743B (zh) | 语言模型的确定方法和装置 | |
CN105069036A (zh) | 一种信息推荐方法及装置 | |
CN103853722A (zh) | 一种基于检索串的关键词扩展方法、装置和系统 | |
CN104915426B (zh) | 信息排序方法、用于生成信息排序模型的方法及装置 | |
CN107818491A (zh) | 电子装置、基于用户上网数据的产品推荐方法及存储介质 | |
CN109272360B (zh) | 一种广告智能推荐方法、系统及装置 | |
CN110188264A (zh) | 一种用户数据交互方法及装置 | |
CN110298029A (zh) | 基于用户语料的好友推荐方法、装置、设备及介质 | |
CN105791543A (zh) | 一种清理短信的方法、装置、客户端和系统 | |
CN110515904B (zh) | 媒体文件的质量预测模型训练方法、质量预测方法及装置 | |
CN112508609A (zh) | 人群扩量的预测方法、装置、设备及存储介质 | |
CN109284498A (zh) | 自提柜推荐方法、自提柜推荐装置和电子装置 | |
CN111259231A (zh) | 应用程序的推荐方法和装置 | |
CN113592605B (zh) | 基于相似产品的产品推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151202 |