CN110309357B - 应用数据推荐的方法、模型训练的方法、装置及存储介质 - Google Patents

应用数据推荐的方法、模型训练的方法、装置及存储介质 Download PDF

Info

Publication number
CN110309357B
CN110309357B CN201810164614.1A CN201810164614A CN110309357B CN 110309357 B CN110309357 B CN 110309357B CN 201810164614 A CN201810164614 A CN 201810164614A CN 110309357 B CN110309357 B CN 110309357B
Authority
CN
China
Prior art keywords
user
data
application data
interest
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810164614.1A
Other languages
English (en)
Other versions
CN110309357A (zh
Inventor
杨春风
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810164614.1A priority Critical patent/CN110309357B/zh
Publication of CN110309357A publication Critical patent/CN110309357A/zh
Application granted granted Critical
Publication of CN110309357B publication Critical patent/CN110309357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请公开了一种应用数据推荐的方法,包括:获取当前频道中的目标用户的信息,目标用户在当前频道的已有历史数据满足数据稀疏条件;根据目标用户的信息确定目标用户对应的各应用数据的兴趣值,各应用数据的兴趣值与通过训练数据迁移模型得到目标用户在当前频道的兴趣向量,以及各应用数据的兴趣向量相关联,应用数据包括视频;根据各应用数据的兴趣值确定待推荐的应用数据,待推荐的应用数据为N个兴趣值最高的应用数据,N为大于或等于1的整数。本申请技术方案由于以在当前频道已有的历史数据稀疏的情况下,也可以依据其他频道的信息做出有效的推荐。

Description

应用数据推荐的方法、模型训练的方法、装置及存储介质
技术领域
本申请涉及计算机技术领域,具体涉及一种应用数据推荐的方法、模型训练的方法、装置、计算机设备及计算机可读存储介质。
背景技术
视频推荐已经成为在线视频服务中愈发重要的一部分。目前比较流行的视频推荐算法包括基于内容的推荐(content-based)、协同过滤推荐(collaborative filtering)和混合推荐(hybrid recommendation)。这些算法均面临数据稀疏性(data sparsity)的挑战,即当用户没有足够的观看历史时,即难以准确把握用户的观影喜好时,传统的视频推荐算法往往不能够满足用户的需求。
发明内容
为了解决现有技术中在历史数据稀疏的情况下,视频推荐效果差的问题,本申请实施例提供一种应用数据推荐的方法,可以在当前频道已有的历史数据稀疏的情况下,也可以依据其他频道的信息做出有效的推荐。本申请实施例还提供了相应的装置、设备以及计算机可读存储介质。
本申请实施例提供一种应用数据推荐的方法,包括:
获取当前频道中的目标用户的信息,所述目标用户在所述当前频道的已有历史数据满足数据稀疏条件;
根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,所述各应用数据的兴趣值与通过训练数据迁移模型得到所述目标用户在当前频道的兴趣向量,以及所述各应用数据的兴趣向量相关联,所述应用数据包括视频;
根据所述各应用数据的兴趣值确定待推荐的应用数据,所述待推荐的应用数据为N个兴趣值最高的应用数据,所述N为大于或等于1的整数。
本申请实施例提供一种迁移模型训练的方法,包括:
获取样本数据,所述样本数据包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集;
使用所述频道集、所述用户集、所述数据集和所述浏览记录矩阵集对迁移模型进行训练,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,所述通用向量、所述专属向量和所述兴趣向量用于确定所述各用户对所述各频道上的各应用数据的兴趣值。
本申请实施例提供一种应用数据推荐的装置,包括:
获取程序模块,用于获取当前频道中的目标用户的信息,所述目标用户在所述当前频道的已有历史数据满足数据稀疏条件;
第一确定程序模块,用于根据所述获取程序模块获取的所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,所述各应用数据的兴趣值与通过训练数据迁移模型得到所述目标用户在当前频道的兴趣向量,以及所述各应用数据的兴趣向量相关联,所述应用数据包括视频;
第二确定程序模块,用于根据所述第一确定程序模块确定的所述各应用数据的兴趣值确定待推荐的应用数据,所述待推荐的应用数据为N个兴趣值最高的应用数据,所述N为大于或等于1的整数。
本申请实施例提供一种迁移模型训练的装置,包括:
获取程序模块,用于获取样本数据,所述样本数据包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集;
训练程序模块,用于使用所述获取程序模块获取的所述频道集、所述用户集、所述数据集和所述浏览记录矩阵集对迁移模型进行训练,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,所述通用向量、所述专属向量和所述兴趣向量用于确定所述各用户对所述各频道上的各应用数据的兴趣值。
本申请实施例提供一种计算机设备,所述计算机设备包括:输入/输出(I/O)接口、处理器和存储器,所述存储器中存储有程序指令;
所述处理器用于执行存储器中存储的程序指令,执行如上述应用数据推荐的方法或迁移模型训练的方法。
本申请的提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本申请的又一方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本申请实施例采用依据迁移模型预先训练好的在当前频道的兴趣向量和应用数据兴趣向量确定用户对各应用数据的兴趣值,可以在当前频道已有的历史数据稀疏的情况下,也可以依据其他频道的信息做出有效的推荐。
附图说明
图1是本申请实施例中迁移模型训练的一场景示例示意图;
图2是本申请实施例中迁移学习模型的一示例示意图;
图3是本申请实施例中视频推荐的一场景示例示意图;
图4是本申请实施例中视频推荐的另一场景示例示意图;
图5是本申请实施例中视频推荐的一界面示例示意图;
图6是本申请实施例中应用数据推荐的方法的一实施例示意图;
图7是本申请实施例中迁移模型训练的方法的一实施例示意图;
图8是本申请实施例中用数据推荐的装置的一实施例示意图;
图9是本申请实施例中用迁移模型训练的装置的一实施例示意图;
图10是本申请实施例中计算机设备的一实施例示意图;
图11是本申请实施例中终端设备的一实施例示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。本领域普通技术人员可知,随着技术的发展和新场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本申请实施例提供一种应用数据推荐的方法,可以在当前频道已有的历史数据稀疏的情况下,也可以依据其他频道的信息做出有效的推荐。本申请实施例还提供了相应的装置、设备以及计算机可读存储介质。以下分别进行详细说明。
迁移学习:把已学训练好的模型参数迁移到新的模型来帮助新模型训练数据集。
数据稀疏性:没有用户历史数据或者用户历史数据非常少,例如在一个业务还没有上线或者刚刚上线的时候,用户在该业务下的历史数据几乎为零。
应用数据可以包括视频、音乐、小说、游戏以及公众号文章等网络中的数据。
用户使用互联网过程中,互联网后台的计算机设备会记录下用户的访问痕迹,例如:用户玩游戏、购物、看的电视机、看的电影、听的音乐、读的小说、微博关注的文章等。后台的计算机设备会按照这些用户历史数据产生的场景或应用进行记录。本申请实施例中将这些历史数据产生的场景或者应用称为频道,一个用户可能在多个频道都会有历史数据记录,当有一个新频道出现,或者用户使用了一个之前没有使用过的频道,在该频道没有历史数据或者历史数据很少时,在做应用数据推荐时,就可以借助其他频道已有历史数据进行推荐。
以腾讯视频为例,一个用户之前很少看电视剧,在电视剧频道的历史数据非常少,但该用户在电影频道、综艺频道以及其他频道的历史数据很多,这样就可以借助电影频道、综艺频道以及其他频道的历史数据来做电视剧频道的视频推荐。
通过其他频道的历史数据来对数据稀疏的频道做推荐的思想为数据迁移学习。数据迁移学习需要使用多个频道上的所有用户和所产生的所有数据进行迁移模型训练,从而产生在做应用数据推荐时所能应用的参数。
下面结合图1的迁移模型训练的场景示意图介绍本申请实施例中的迁移模型训练的过程。
如图1所示,该场景中包括多个终端设备10、网络20、数据库服务器30和用户迁移模型训练的计算机设备40。
多个终端设备10数据库服务器30和计算机设备40通过网络20通信连接,用户在使用终端设备10的过程中会产生应用数据,这些应用数据可以是电视剧的数据、电影的数据、综艺的数据和小说的数据等,数据库服务器30中会记录存储这些应用数据,并会记录这些应用数据是在哪个频道上由哪个用户产生的。因此,计算机设备40在准备做迁移模型训练时,就可以从数据库服务器30获取样本数据,该样本数据中会包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集。其中,频道集为包含网络中所有频道的集合,这些频道可以是电视机、电影、综艺、吐槽、体育、动漫、少儿、纪录片和音乐等网络中已有的频道。用户集为浏览过频道集中的频道的用户的集合。数据集用户集中的用户在所有频道上的历史数据的集合。应用数据的浏览记录矩阵集为所有频道的观影记录矩阵的集合。
使用所述频道集、所述用户集、所述数据集和所述浏览记录矩阵集对迁移模型进行训练,可以参阅图2进行理解。图2所示的是一个迁移学习模型的示例图,该场景中应用数据以视频为例,但实际不限于视频,这里只是以视频为例进行说明,不应将其理解为是对应用数据的限定。图2中的各变量的符号含义可以参阅表1进行理解。
表1:迁移学习模型中变量的符号及含义
Figure GDA0003890677390000051
Figure GDA0003890677390000061
上述图2所示的模型中采用矩阵分解(matrix factorization)作为模型的基底,因为矩阵分解可以对稀疏矩阵进行降维得到密集的数据。矩阵分解的数学表示是:
Figure GDA0003890677390000062
对于某一个用户和一个频道,虽然在该用户在当前频道下没有或者只有很少的历史数据,但是可以通过挖掘用户在不同的频道下的历史数据来确定该用户兴趣,因为兴趣具有共通性,就可以有效缓解当前频道下的数据稀疏性问题。每个频道又由于其本身的差异性,使得用户在不同场景下所展示出的兴趣又有所不同。因此可以将用户i在频道s的兴趣向量分解为两部分之和:用户i在所有频道的通用向量
Figure GDA0003890677390000063
和用户i在频道s的专属向量
Figure GDA0003890677390000064
即:
Figure GDA0003890677390000065
其中用户i在所有频道的通用向量
Figure GDA0003890677390000066
是在不同的频道之间共享和迁移的部分。
本申请实施例中的迁移模型训练就是要通过上述样本数据中频道集、用户集和数据集以及矩阵集的数据,训练得到各个用户的通用向量
Figure GDA0003890677390000071
和专属向量
Figure GDA0003890677390000072
以及用户对各个视频的兴趣向量vj
对于一个用户,其通用兴趣向量用所有频道的数据联合训练来得到,该用户在某一频道的专属兴趣向量仅由用户在该频道的数据训练得到。
计算通用向量
Figure GDA0003890677390000073
和专属向量
Figure GDA0003890677390000074
以及用户对各个视频的兴趣向量vj的过程可以是:对所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计。
用户的兴趣向量
Figure GDA0003890677390000075
和视频的兴趣向量vj,使用均值为
Figure GDA0003890677390000076
方差为σ2的高斯分布作为
Figure GDA0003890677390000077
的估计,即:
Figure GDA0003890677390000078
其中:
Figure GDA0003890677390000079
完整的观影记录数据分布为:
Figure GDA00038906773900000710
同时,分别赋予用户和视频兴趣向量高斯分布作为它们的高斯估计,也就是先验概率:
Figure GDA00038906773900000711
Figure GDA00038906773900000712
将所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计代入贝叶斯后验概率公式确定所述用户集和所述数据集的后验概率;
Figure GDA00038906773900000713
对该后验概率取对数,转化成:
Figure GDA0003890677390000081
去掉和用户和视频兴趣向量无关的参数,则最大化上述后验概率转化成最小化下述误差函数:
Figure GDA0003890677390000082
其中
Figure GDA0003890677390000083
求解该优化问题可以直接使用梯度下降法求得最优的参数
Figure GDA0003890677390000084
vj1andμ2
上述求解得到
Figure GDA0003890677390000085
vj后,可以利用公式
Figure GDA0003890677390000086
计算得到
Figure GDA0003890677390000087
还可以再进一步利用公式
Figure GDA0003890677390000088
计算得到
Figure GDA0003890677390000089
若计算得到了
Figure GDA00038906773900000810
则可以在计算机设备上存储用户i对视频j的兴趣值
Figure GDA00038906773900000811
在需要做视频推荐时,可以直接根据该
Figure GDA00038906773900000812
做视频推荐,也可以直接存储
Figure GDA00038906773900000813
和vj,或者存储
Figure GDA00038906773900000814
和vj,在做视频推荐时,利用公式
Figure GDA00038906773900000815
和公式
Figure GDA00038906773900000816
计算出
Figure GDA00038906773900000817
再确定视频推荐列表。
本申请实施例中视频推荐的过程可以参阅图3和图4进行理解,图3所示的为用户i使用终端设备看电视剧时,该用户在电视剧频道的历史数据很稀疏,则该用户可以通过终端设备10向计算机设备50发送消息,通知计算机设备50用户i访问了电视剧频道,则计算机设备50就会根据已经训练好的结果确定电视剧频道的视频推荐列表,若计算机设备50中存储的是兴趣值
Figure GDA0003890677390000091
则计算机设备可以直接根据用户i可能对电视剧感兴趣的兴趣值做出推荐,若计算机设备中存储的是
Figure GDA0003890677390000092
和vj,则计算机设备50可以通过计算得到兴趣值
Figure GDA0003890677390000093
再根据用户i可能对电视剧感兴趣的兴趣值做出推荐。最终,计算机设备根据用户i对各个视频的兴趣值
Figure GDA0003890677390000094
确定了视频推荐列表,该视频推荐列表中按照兴趣值从高到低的顺序分别为“琅琊榜”、“伪装者”和“猎场”。针对该用户i虽然在电视剧频道没有什么历史记录,但可能其他频道的历史记录中,该用户i非常喜欢看演员“胡某”的节目,因此,迁移模型训练的结果就会有该用户i对胡某的电视剧的兴趣值偏高。
图3是终端设备10向计算机设备50请求视频推荐列表的情况,还可以是图4中所示的终端设备中存储有该用户i与
Figure GDA0003890677390000095
或者用户i与
Figure GDA0003890677390000096
和vj的对应关系,由该终端设备10直接确定视频推荐列表。通常是推荐一个视频列表(Top-N推荐),根据中的ri,j计算方法预测用户对不同视频感兴趣的程度,然后按照ri,j的值从大到小排序,可以去除用户已经观看的视频后,选择排名前N的视频,作为最终的推荐结果。
当然,视频推荐列表的展示形式不限于图3和图4中所示出的样式,而且,也不限于在电视剧频道下推荐电视剧,在电影频道下推荐电影,例如:可以在用户进入腾讯视频的主界面时根据用户的兴趣做出例如图5所示的视频推荐。本申请实施例的视频推荐方案可以实现“千人千面”的推荐,也就是针对不同用户实现不同视频内容的推荐。推荐的内容也不限于在终端设备的页面上一次展示,可以通过左右滑动或者上下滑动视频推荐列表的内容进行查看。
本申请实施例提供的基于迁移学习的视频推荐方案可以有效的缓解冷启动,也就是没有历史数据或者历史数据及其稀疏时的视频推荐问题,提高推荐结果的准确性,带来点击率上的明显提升。
另外需要说明的是,本申请实施例中的视频推荐推荐方案也不限于上述一种,还可以是将用户在多个场景(不同应用,不同网站,不同业务)的历史数据直接混合在一起,然后采用传统的个性化推荐算法,如矩阵分解来进行视频推荐。
在视频推荐过程中,还可以对不同场景(不同应用,不同网站,不同业务)的历史数据赋予不同的权重(如当前场景的行为数据给予更高的权重),具体做法可以是:即可以对不同场景的数据进行不同比例的数据抽样(权重高的场景抽取更高比例的训练数据),也可以对不同场景的训练数据在最终模型的目标函数(objective function)中赋予不同的权重。然后采用传统的个性化推荐算法,如矩阵分解来进行视频推荐。
如图6所示,本申请实施例提供的应用数据推荐的方法的一实施例包括:
101、获取当前频道中的目标用户的信息,所述目标用户在所述当前频道的已有历史数据满足数据稀疏条件。
本申请实施例中满足数据稀疏条件可以是该用户在当前频道的已有历史数据低于预设阈值。
当前频道可以是目标用户当前所点击进入的应用或场景,如:综艺频道、电影频道等。
目标用户指的是使用终端设备的用户,该目标用户的信息可以通过终端设备的标识、所使用应用的注册账户以及其他可以反映出用户的信息进行标记。
102、根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,所述各应用数据的兴趣值与通过训练数据迁移模型得到所述目标用户在当前频道的兴趣向量,以及所述各应用数据的兴趣向量相关联,所述应用数据包括视频。
各应用数据的兴趣值可以理解为是前述场景示例中的
Figure GDA0003890677390000101
目标用户在当前频道的兴趣向量可以理解为是前述场景示例中的
Figure GDA0003890677390000102
各应用数据的兴趣向量可以理解为是前述场景示例中的vj。结合上文对模型训练的描述可知,在模型训练的过程中已经确定了各个用户对各个视频的兴趣值,所以在已知了目标用户的信息后,可以直接确定该目标用户在相应频道对各个应用数据的兴趣值。
103、根据所述各应用数据的兴趣值确定待推荐的应用数据,所述待推荐的应用数据为N个兴趣值最高的应用数据,所述N为大于或等于1的整数。
在做应用数据推荐的过程中,只需要依据各个应用数据的兴趣值做从高到低的排序即可。这部分可以参阅上述图3和图4部分的描述进行理解,本处不再重复赘述。
本申请实施例采用依据迁移模型预先训练好的在当前频道的兴趣向量和应用数据兴趣向量确定用户对各应用数据的兴趣值,可以在当前频道已有的历史数据稀疏的情况下,也可以依据其他频道的信息做出有效的推荐,从而提高了点击率。
可选地,在上述图6对应的实施例的基础上,本申请实施例提供的应用数据推荐的方法的另一实施例中,所述根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,可以包括:
根据所述目标用户的信息获取所述目标用户在所有频道的通用向量和在所述当前频道的专属向量,以及所述目标用户对各应用数据的兴趣向量;
根据所述通用向量和所述专属向量确定所述目标用户在当前频道的兴趣向量;
用所述目标用户在当前频道的兴趣向量的转置结果与所述各应用数据的兴趣向量进行乘积,以得到所述目标用户对应的各应用数据的兴趣值。
本申请实施例中,根据目标用户的信息可以获取
Figure GDA0003890677390000111
和vj,然后利用公式
Figure GDA0003890677390000112
计算得到
Figure GDA0003890677390000113
再进一步利用公式
Figure GDA0003890677390000114
计算得到
Figure GDA0003890677390000115
从而得到目标用户对各应用数据的兴趣值。
该实施例还可以是对于每一个用户i,抽取向量
Figure GDA0003890677390000116
对于每一个频道s,抽取
Figure GDA0003890677390000117
对每一个视频j,抽取
Figure GDA0003890677390000118
对频道s里的每一个用户-视频对(i,j),抽取
Figure GDA0003890677390000119
作为用户i对视频j的偏好估计。这种方式虽然计算量稍微大一些,但准确度更高。
可选地,在上述图6对应的实施例的基础上,本申请实施例提供的应用数据推荐的方法的另一实施例中,所述根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,可以包括:
根据所述目标用户的信息,在映射关系中查找所述目标用户对应的各应用数据的兴趣值,所述映射关系为每个用户的信息与各应用数据的兴趣值的对应关系,所述映射关系中每个用户所对应的各应用数据的兴趣值为预先根据所述每个用户的在所有频道的通用向量和在所述当前频道的专属向量,以及所述各应用数据的兴趣向量确定得到的。
本申请实施例中,还可以是在模型训练的过程中预先将用户在各个频道对各个应用数据的兴趣值都计算出来,然后在视频推荐时直接根据目标用户的信息查找该目标用户对各个应用数据的兴趣值,从而进行应用数据的推荐。这种推荐方式的计算量最小,推荐速度最快。
以上是对应用数据推荐的描述,具体过程还可以参阅前述图1至图5中的响应描述进行理解,下面结合图7介绍本申请实施例中的迁移模型训练的方法。
如图7所示,本申请实施例提供的迁移模型训练的方法的实施例包括:
201、获取样本数据,所述样本数据包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集。
频道集为包含网络中所有频道的集合,这些频道可以是电视机、电影、综艺、吐槽、体育、动漫、少儿、纪录片和音乐等网络中已有的频道。用户集为浏览过频道集中的频道的用户的集合。数据集用户集中的用户在所有频道上的历史数据的集合。应用数据的浏览记录矩阵集为所有频道的观影记录矩阵的集合。
202、使用所述频道集、所述用户集、所述数据集和所述浏览记录矩阵集对迁移模型进行训练,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,所述通用向量、所述专属向量和所述兴趣向量用于确定所述各用户对所述各频道上的各应用数据的兴趣值。
本申请实施例所提供的迁移模型训练的方法可以参阅前述图1和图2部分对迁移模型的训练过程的描述进行理解,预先通过对迁移模型的训练可以得到用户应用数据推荐的各个参数,从而有利于在用户数据稀疏的频道进行更贴近用户喜好的高效推荐,从而提高了点击率。
可选地,在上述图7对应的实施例的基础上,本申请实施例提供的迁移模型训练的方法的另一实施例还可以包括:
根据所述各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,确定所述各用户对所述各频道的兴趣向量。
本申请实施例中,在训练出
Figure GDA0003890677390000131
后,可以利用公式
Figure GDA0003890677390000132
计算得到
Figure GDA0003890677390000133
可选地,在上述图7对应的实施例的基础上,本申请实施例提供的迁移模型训练的方法的另一实施例还可以包括:
根据所述各用户对所述各频道的兴趣向量和所述各用户对所述各频道上的各应用数据的兴趣向量,确定所述各用户对所述各应用数据的兴趣值。
本申请实施例中,在已知
Figure GDA0003890677390000134
和vj后,可以利用公式
Figure GDA0003890677390000135
计算得到
Figure GDA0003890677390000136
从而得到目标用户对各应用数据的兴趣值。
可选地,在上述图7对应的实施例的基础上,本申请实施例提供的迁移模型训练的方法的另一实施例中,所述使用所述频道集、所述用户集、所述数据集和所述浏览记录矩阵集对迁移模型进行训练,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,可以包括:
对所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计;
将所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计代入贝叶斯后验概率公式确定所述用户集和所述数据集的后验概率;
采用梯度下降法求解所述后验概率,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量。
本申请实施例的计算过程可以参阅上述图2对应实施例处的相应公式求解过程进行理解。
以上是对应用数据推荐的方法和迁移模型训练的方法描述,下面结合附图描述本申请实施例中的应用数据推荐的装置和迁移模型训练的装置。
如图8所示,本申请实施例提供的应用数据推荐的装置30的一实施例包括:
获取程序模块301,用于获取当前频道中的目标用户的信息,所述目标用户在所述当前频道的已有历史数据满足数据稀疏条件;
第一确定程序模块302,用于根据所述获取程序模块301获取的所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,所述各应用数据的兴趣值与通过训练数据迁移模型得到所述目标用户在当前频道的兴趣向量,以及所述各应用数据的兴趣向量相关联,所述应用数据包括视频;
第二确定程序模块303,用于根据所述第一确定程序模块302确定的所述各应用数据的兴趣值确定待推荐的应用数据,所述待推荐的应用数据为N个兴趣值最高的应用数据,所述N为大于或等于1的整数。
本申请实施例采用依据迁移模型预先训练好的在当前频道的兴趣向量和应用数据兴趣向量确定用户对各应用数据的兴趣值,可以在当前频道已有的历史数据稀疏的情况下,也可以依据其他频道的信息做出有效的推荐,从而提高了点击率。
可选地,所述第一确定程序模块302用于:
根据所述目标用户的信息获取所述目标用户在所有频道的通用向量和在所述当前频道的专属向量,以及所述目标用户对各应用数据的兴趣向量;
根据所述通用向量和所述专属向量确定所述目标用户在当前频道的兴趣向量;
用所述目标用户在当前频道的兴趣向量的转置结果与所述各应用数据的兴趣向量进行乘积,以得到所述目标用户对应的各应用数据的兴趣值。
可选地,所述第一确定程序模块302用于:
根据所述目标用户的信息,在映射关系中查找所述目标用户对应的各应用数据的兴趣值,所述映射关系为每个用户的信息与各应用数据的兴趣值的对应关系,所述映射关系中每个用户所对应的各应用数据的兴趣值为预先根据所述每个用户的在所有频道的通用向量和在所述当前频道的专属向量,以及所述各应用数据的兴趣向量确定得到的。
以上对应用数据推荐的装置30的描述可以参阅前述实施例中应用数据推荐的方法的相应部分内容进行理解,本处不再重复赘述。
如图9所示,本申请实施例提供的迁移模型训练的装置40的一实施例包括:
获取程序模块401,用于获取样本数据,所述样本数据包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集;
训练程序模块402,用于使用所述获取程序模块401获取的所述频道集、所述用户集、所述数据集和所述浏览记录矩阵集对迁移模型进行训练,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,所述通用向量、所述专属向量和所述兴趣向量用于确定所述各用户对所述各频道上的各应用数据的兴趣值。
本申请实施例所提供的迁移模型训练的装置可以参阅前述图1和图2部分对迁移模型的训练过程的描述进行理解,预先通过对迁移模型的训练可以得到用户应用数据推荐的各个参数,从而有利于在用户数据稀疏的频道进行更贴近用户喜好的高效推荐,从而提高了点击率。
可选地,所述装置40还包括:
确定程序模块403用于:
根据所述各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,确定所述各用户对所述各频道的兴趣向量;
根据所述各用户对所述各频道的兴趣向量和所述各用户对所述各频道上的各应用数据的兴趣向量,确定所述各用户对所述各应用数据的兴趣值。
可选地,所述训练程序模块402用于:
对所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计;
将所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计代入贝叶斯后验概率公式确定所述用户集和所述数据集的后验概率;
采用梯度下降法求解所述后验概率,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量。
图10是本申请实施例提供的计算机设备50的结构示意图。所述计算机设备50包括处理器510、存储器550和输入输出(I/O)接口530,存储器550可以包括只读存储器和随机存取存储器,并向处理器510提供操作指令和数据。存储器550的一部分还可以包括非易失性随机存取存储器(NVRAM)。
在一些实施方式中,存储器550存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
在本申请实施例中,在应用数据推荐的过程中,通过调用存储器550存储的操作指令(该操作指令可存储在操作系统中),
获取当前频道中的目标用户的信息,所述目标用户在所述当前频道的已有历史数据满足数据稀疏条件;
根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,所述各应用数据的兴趣值与通过训练数据迁移模型得到所述目标用户在当前频道的兴趣向量,以及所述各应用数据的兴趣向量相关联,所述应用数据包括视频;
根据所述各应用数据的兴趣值确定待推荐的应用数据,所述待推荐的应用数据为N个兴趣值最高的应用数据,所述N为大于或等于1的整数。
本申请实施例采用依据迁移模型预先训练好的在当前频道的兴趣向量和应用数据兴趣向量确定用户对各应用数据的兴趣值,可以在当前频道已有的历史数据稀疏的情况下,也可以依据其他频道的信息做出有效的推荐。
处理器510控制计算机设备50的操作,处理器510还可以称为CPU(CentralProcessing Unit,中央处理单元)。存储器550可以包括只读存储器和随机存取存储器,并向处理器510提供指令和数据。存储器550的一部分还可以包括非易失性随机存取存储器(NVRAM)。具体的应用中计算机设备50的各个组件通过总线系统520耦合在一起,其中总线系统520除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统520。
上述本申请实施例揭示的方法可以应用于处理器510中,或者由处理器510实现。处理器510可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器510中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器510可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器550,处理器510读取存储器550中的信息,结合其硬件完成上述方法的步骤。
可选地,处理器510用于:
根据所述目标用户的信息获取所述目标用户在所有频道的通用向量和在所述当前频道的专属向量,以及所述目标用户对各应用数据的兴趣向量;
根据所述通用向量和所述专属向量确定所述目标用户在当前频道的兴趣向量;
用所述目标用户在当前频道的兴趣向量的转置结果与所述各应用数据的兴趣向量进行乘积,以得到所述目标用户对应的各应用数据的兴趣值。
可选地,处理器510用于:
根据所述目标用户的信息,在映射关系中查找所述目标用户对应的各应用数据的兴趣值,所述映射关系为每个用户的信息与各应用数据的兴趣值的对应关系,所述映射关系中每个用户所对应的各应用数据的兴趣值为预先根据所述每个用户的在所有频道的通用向量和在所述当前频道的专属向量,以及所述各应用数据的兴趣向量确定得到的。
另外,在迁移模型训练过程中,还可以参阅图10的结构进行理解。在迁移模型训练过程中,处理器510用于:
获取样本数据,所述样本数据包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集;
使用所述频道集、所述用户集、所述数据集和所述浏览记录矩阵集对迁移模型进行训练,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,所述通用向量、所述专属向量和所述兴趣向量用于确定所述各用户对所述各频道上的各应用数据的兴趣值。
可选地,处理器510还用于:
根据所述各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,确定所述各用户对所述各频道的兴趣向量。
可选地,处理器510还用于:
根据所述各用户对所述各频道的兴趣向量和所述各用户对所述各频道上的各应用数据的兴趣向量,确定所述各用户对所述各应用数据的兴趣值。
可选地,处理器510用于:
对所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计;
将所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计代入贝叶斯后验概率公式确定所述用户集和所述数据集的后验概率;
采用梯度下降法求解所述后验概率,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量。
上对计算机设备50的描述可以参阅图1至图7部分的描述进行理解,本处不再重复赘述。
上述应用数据推荐的过程还可以由终端设备来执行,例如手机,平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑等任意终端设备,以终端为手机为例:
图11示出的是与本发明实施例提供的终端设备相关的手机的部分结构的框图。参考图11,手机包括:射频(Radio Frequency,RF)电路1110、存储器1120、输入单元1130、显示单元1140、传感器1150、音频电路1160、无线保真(wireless fidelity,WiFi)模块1170、处理器1180、以及摄像头1190等部件。本领域技术人员可以理解,图11中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图11对手机的各个构成部件进行具体的介绍:
RF电路1110可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1180处理;另外,将设计上行的数据发送给基站。通常,RF电路1110包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、双工器等。此外,RF电路1110还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication,GSM)、通用分组无线服务(General Packet RadioService,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器1120可用于存储软件程序以及模块,处理器1180通过运行存储在存储器1120的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1130可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1130可包括触控面板1131以及其他输入设备1132。触控面板1131,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1131上或在触控面板1131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1180,并能接收处理器1180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1131。除了触控面板1131,输入单元1130还可以包括其他输入设备1132。具体地,其他输入设备1132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1140可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1140可包括显示面板1141,可选的,可以采用液晶显示器(LiquidCrystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1141。进一步的,触控面板1131可覆盖显示面板1141,当触控面板1131检测到在其上或附近的触摸操作后,传送给处理器1180以确定触摸事件的类型,随后处理器1180根据触摸事件的类型在显示面板1141上提供相应的视觉输出。虽然在图11中,触控面板1131与显示面板1141是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1131与显示面板1141集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1141的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1141和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1160、扬声器1161,传声器1162可提供用户与手机之间的音频接口。音频电路1160可将接收到的音频数据转换后的电信号,传输到扬声器1161,由扬声器1161转换为声音信号输出;另一方面,传声器1162将收集的声音信号转换为电信号,由音频电路1160接收后转换为音频数据,再将音频数据输出处理器1180处理后,经RF电路1110以发送给比如另一手机,或者将音频数据输出至存储器1120以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图11示出了WiFi模块1170,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1180是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1120内的软件程序和/或模块,以及调用存储在存储器1120内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1180可包括一个或多个处理单元;优选的,处理器1180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1180中。
摄像头1190用于采集图像。
手机还包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理系统与处理器1180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本发明实施例中,该终端所包括的处理器1180还具有以下功能:
获取当前频道中的目标用户的信息,所述目标用户在所述当前频道的已有历史数据满足数据稀疏条件;
根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,所述各应用数据的兴趣值与通过训练数据迁移模型得到所述目标用户在当前频道的兴趣向量,以及所述各应用数据的兴趣向量相关联,所述应用数据包括视频;
根据所述各应用数据的兴趣值确定待推荐的应用数据,所述待推荐的应用数据为N个兴趣值最高的应用数据,所述N为大于或等于1的整数。
可选地,所述根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,可以包括:
根据所述目标用户的信息获取所述目标用户在所有频道的通用向量和在所述当前频道的专属向量,以及所述目标用户对各应用数据的兴趣向量;
根据所述通用向量和所述专属向量确定所述目标用户在当前频道的兴趣向量;
用所述目标用户在当前频道的兴趣向量的转置结果与所述各应用数据的兴趣向量进行乘积,以得到所述目标用户对应的各应用数据的兴趣值。
可选地,所述根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,可以包括:
根据所述目标用户的信息,在映射关系中查找所述目标用户对应的各应用数据的兴趣值,所述映射关系为每个用户的信息与各应用数据的兴趣值的对应关系,所述映射关系中每个用户所对应的各应用数据的兴趣值为预先根据所述每个用户的在所有频道的通用向量和在所述当前频道的专属向量,以及所述各应用数据的兴趣向量确定得到的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专属计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
需要说明的是,本申请所涉及的信息(包括但限于用户设备信息、用户个人信息等)、数据(包括但不限于分析的数据、存储的数据、展示的数据等)以及信号,均经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规的标准。
以上对本申请实施例所提供的应用数据推荐的方法、迁移模型训练的方法、装置、计算机设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (13)

1.一种应用数据推荐的方法,其特征在于,包括:
获取当前频道中的目标用户的信息,所述目标用户在所述当前频道的已有历史数据满足数据稀疏条件;
根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,所述各应用数据的兴趣值与通过训练数据迁移模型得到所述目标用户在当前频道的兴趣向量,以及所述各应用数据的兴趣向量相关联,所述应用数据包括视频;
根据所述各应用数据的兴趣值确定待推荐的应用数据,所述待推荐的应用数据为N个兴趣值最高的应用数据,所述N为大于或等于1的整数;
其中,所述训练数据迁移模型的训练过程包括:获取样本数据,所述样本数据包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集;对所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计;将所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计代入贝叶斯后验概率公式确定所述用户集和所述数据集的后验概率;采用梯度下降法求解所述后验概率,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,所述通用向量、所述专属向量和所述兴趣向量用于确定所述各用户对所述各频道上的各应用数据的兴趣值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,包括:
根据所述目标用户的信息获取所述目标用户在所有频道的通用向量和在所述当前频道的专属向量,以及所述目标用户对各应用数据的兴趣向量;
根据所述通用向量和所述专属向量确定所述目标用户在当前频道的兴趣向量;
用所述目标用户在当前频道的兴趣向量的转置结果与所述各应用数据的兴趣向量进行乘积,以得到所述目标用户对应的各应用数据的兴趣值。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,包括:
根据所述目标用户的信息,在映射关系中查找所述目标用户对应的各应用数据的兴趣值,所述映射关系为每个用户的信息与各应用数据的兴趣值的对应关系,所述映射关系中每个用户所对应的各应用数据的兴趣值为预先根据所述每个用户的在所有频道的通用向量和在所述当前频道的专属向量,以及所述各应用数据的兴趣向量确定得到的。
4.一种迁移模型训练的方法,其特征在于,包括:
获取样本数据,所述样本数据包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集;
对所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计;
将所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计代入贝叶斯后验概率公式确定所述用户集和所述数据集的后验概率;
采用梯度下降法求解所述后验概率,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,所述通用向量、所述专属向量和所述兴趣向量用于确定所述各用户对所述各频道上的各应用数据的兴趣值。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,确定所述各用户对所述各频道的兴趣向量。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据所述各用户对所述各频道的兴趣向量和所述各用户对所述各频道上的各应用数据的兴趣向量,确定所述各用户对所述各应用数据的兴趣值。
7.一种应用数据推荐的装置,其特征在于,包括:
获取程序模块,用于获取当前频道中的目标用户的信息,所述目标用户在所述当前频道的已有历史数据满足数据稀疏条件;
第一确定程序模块,用于根据所述获取程序模块获取的所述目标用户的信息确定所述目标用户对应的各应用数据的兴趣值,所述各应用数据的兴趣值与通过训练数据迁移模型得到所述目标用户在当前频道的兴趣向量,以及所述各应用数据的兴趣向量相关联,所述应用数据包括视频;
第二确定程序模块,用于根据所述第一确定程序模块确定的所述各应用数据的兴趣值确定待推荐的应用数据,所述待推荐的应用数据为N个兴趣值最高的应用数据,所述N为大于或等于1的整数;
其中,所述训练数据迁移模型的训练过程包括:获取样本数据,所述样本数据包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集;对所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计;将所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计代入贝叶斯后验概率公式确定所述用户集和所述数据集的后验概率;采用梯度下降法求解所述后验概率,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,所述通用向量、所述专属向量和所述兴趣向量用于确定所述各用户对所述各频道上的各应用数据的兴趣值。
8.根据权利要求7所述的装置,其特征在于,
所述第一确定程序模块用于:
根据所述目标用户的信息获取所述目标用户在所有频道的通用向量和在所述当前频道的专属向量,以及所述目标用户对各应用数据的兴趣向量;
根据所述通用向量和所述专属向量确定所述目标用户在当前频道的兴趣向量;
用所述目标用户在当前频道的兴趣向量的转置结果与所述各应用数据的兴趣向量进行乘积,以得到所述目标用户对应的各应用数据的兴趣值。
9.根据权利要求7所述的装置,其特征在于,
所述第一确定程序模块用于:
根据所述目标用户的信息,在映射关系中查找所述目标用户对应的各应用数据的兴趣值,所述映射关系为每个用户的信息与各应用数据的兴趣值的对应关系,所述映射关系中每个用户所对应的各应用数据的兴趣值为预先根据所述每个用户的在所有频道的通用向量和在所述当前频道的专属向量,以及所述各应用数据的兴趣向量确定得到的。
10.一种迁移模型训练的装置,其特征在于,包括:
获取程序模块,用于获取样本数据,所述样本数据包括包含多个频道的频道集、与所述频道集对应的用户集、数据集以及所述用户集中的用户对所述数据集中的应用数据的浏览记录矩阵集;
训练程序模块,用于使用所述获取程序模块获取的所述频道集、所述用户集、所述数据集和所述浏览记录矩阵集对迁移模型进行训练,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量,所述通用向量、所述专属向量和所述兴趣向量用于确定所述各用户对所述各频道上的各应用数据的兴趣值;
所述训练程序模块用于:
对所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计;
将所述用户集、所述数据集和所述浏览记录矩阵集做高斯估计代入贝叶斯后验概率公式确定所述用户集和所述数据集的后验概率;
采用梯度下降法求解所述后验概率,以得到所述用户集中各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,以及所述各用户对所述数据集中各应用数据的兴趣向量。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
确定程序模块用于:
根据所述各用户在所述频道集中所有频道的通用向量和所述各用户在所述频道集中各频道的专属向量,确定所述各用户对所述各频道的兴趣向量;
根据所述各用户对所述各频道的兴趣向量和所述各用户对所述各频道上的各应用数据的兴趣向量,确定所述各用户对所述各应用数据的兴趣值。
12.一种计算机设备,其特征在于,所述计算机设备包括:输入/输出(I/O)接口、处理器和存储器,所述存储器中存储有程序指令;
所述处理器用于执行存储器中存储的程序指令,执行如权利要求1-6任一所述的方法。
13.一种计算机可读存储介质,包括指令,其特征在于,当所述指令在计算机设备上运行时,使得所述计算机设备执行如权利要求1-6中任一项所述的方法。
CN201810164614.1A 2018-02-27 2018-02-27 应用数据推荐的方法、模型训练的方法、装置及存储介质 Active CN110309357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810164614.1A CN110309357B (zh) 2018-02-27 2018-02-27 应用数据推荐的方法、模型训练的方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810164614.1A CN110309357B (zh) 2018-02-27 2018-02-27 应用数据推荐的方法、模型训练的方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110309357A CN110309357A (zh) 2019-10-08
CN110309357B true CN110309357B (zh) 2022-12-02

Family

ID=68073653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810164614.1A Active CN110309357B (zh) 2018-02-27 2018-02-27 应用数据推荐的方法、模型训练的方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110309357B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268655A (zh) * 2020-02-17 2021-08-17 北京搜狗科技发展有限公司 一种信息推荐方法、装置和电子设备
CN111310056B (zh) * 2020-03-11 2023-04-14 深圳市雅阅科技有限公司 基于人工智能的信息推荐方法、装置、设备及存储介质
CN111859142A (zh) * 2020-07-28 2020-10-30 山东大学 一种基于互联互通家居平台的跨设备迁移推荐系统及其工作方法
CN112364244A (zh) * 2020-11-16 2021-02-12 广州酷狗计算机科技有限公司 多媒体数据推荐方法、装置、服务器及存储介质
CN114117126A (zh) * 2021-12-02 2022-03-01 聚好看科技股份有限公司 一种视频推荐方法及显示设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013012990A1 (en) * 2011-07-20 2013-01-24 Siemens Corporation Multi-task learning for bayesian matrix factorization
CN103678329A (zh) * 2012-09-04 2014-03-26 中兴通讯股份有限公司 推荐方法及装置
EP2860672A2 (en) * 2013-10-10 2015-04-15 Deutsche Telekom AG Scalable cross domain recommendation system
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN104778670A (zh) * 2015-04-17 2015-07-15 广西科技大学 一种基于多元统计模型的分形小波自适应图像去噪方法
EP2983123A1 (en) * 2014-07-17 2016-02-10 Deutsche Telekom AG Self transfer learning recommendation method and system
CN106202205A (zh) * 2016-06-28 2016-12-07 重庆大学 基于内存计算框架和长短周期兴趣迁移及融合模型的音乐推荐方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013012990A1 (en) * 2011-07-20 2013-01-24 Siemens Corporation Multi-task learning for bayesian matrix factorization
CN103678329A (zh) * 2012-09-04 2014-03-26 中兴通讯股份有限公司 推荐方法及装置
EP2860672A2 (en) * 2013-10-10 2015-04-15 Deutsche Telekom AG Scalable cross domain recommendation system
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
EP2983123A1 (en) * 2014-07-17 2016-02-10 Deutsche Telekom AG Self transfer learning recommendation method and system
CN104778670A (zh) * 2015-04-17 2015-07-15 广西科技大学 一种基于多元统计模型的分形小波自适应图像去噪方法
CN106202205A (zh) * 2016-06-28 2016-12-07 重庆大学 基于内存计算框架和长短周期兴趣迁移及融合模型的音乐推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Consolidation: Metric+Active Learning and Its Applications for Cross-Domain Recommendation;Chu Guan等;《2015 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology (WI-IAT)》;20160204;244–251 *
基于移动用户行为的智能应用推荐算法和框架的研究;杨凡超;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;20170215(第2期);I138-4377 *

Also Published As

Publication number Publication date
CN110309357A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN110309357B (zh) 应用数据推荐的方法、模型训练的方法、装置及存储介质
US11216523B2 (en) Method, system, server and intelligent terminal for aggregating and displaying comments
US11270343B2 (en) Method and apparatus for generating targeted label, and storage medium
US10783206B2 (en) Method and system for recommending text content, and storage medium
US9621950B2 (en) TV program identification method, apparatus, terminal, server and system
WO2016197758A1 (zh) 信息推荐系统、方法及装置
US11409817B2 (en) Display apparatus and method of controlling the same
CN108334539B (zh) 对象推荐方法、移动终端及计算机可读存储介质
CN110164415B (zh) 一种基于语音识别的推荐方法、装置及介质
WO2021120875A1 (zh) 搜索方法、装置、终端设备及存储介质
CN110825863B (zh) 一种文本对融合方法及装置
CN111143543A (zh) 一种对象推荐方法、装置、设备及介质
WO2019024237A1 (zh) 信息推荐方法、移动终端及计算机可读存储介质
CN104281610B (zh) 过滤微博的方法和装置
CN114443897A (zh) 一种视频推荐方法、装置、电子设备和存储介质
CN111090877B (zh) 数据生成、获取方法及对应的装置、存储介质
CN116010630A (zh) 推荐视频的实时筛选方法、装置、电子设备及存储介质
CN110555155A (zh) 物品信息推荐方法、设备和存储介质
CN106131296A (zh) 信息展示方法及装置
CN109918348B (zh) 应用浏览记录的清理方法、终端及计算机可读存储介质
CN109544241B (zh) 一种点击率预估模型的构建方法、点击率预估方法和装置
CN106484688B (zh) 一种数据处理方法及系统
CN114430504B (zh) 一种媒体内容的推荐方法以及相关装置
CN107133296B (zh) 一种应用程序推荐方法、装置及计算机可读存储介质
CN108897774B (zh) 一种获取新闻热点的方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant