CN114218486A

CN114218486A - 信息推荐方法、模型训练方法、装置、设备及存储介质

Info

Publication number: CN114218486A
Application number: CN202111546417.4A
Authority: CN
Inventors: 程晓娜; 高山; 彭冲; 范将科; 程兵
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-12-16
Filing date: 2021-12-16
Publication date: 2022-03-22

Abstract

本申请公开了一种信息推荐方法、模型训练方法、装置、设备及存储介质，属于人工智能技术领域。该方法包括：从参数表中获取用户标识对应的第一降维向量、以及n个候选内容的n个第二降维向量；基于第一降维向量与n个第二降维向量计算每个候选内容的推荐分数；基于n个推荐分数从n个候选内容中确定推荐信息，向用户标识对应的用户设备发送推荐信息，n为正整数。其中，第一降维向量与第二降维向量是在线下分别对历史浏览内容序列与候选内容进行特征降维提取得到的，这使得线上信息推荐时可以直接获取预设维度上的特征向量进行计算，获得用户历史行为序列对用户兴趣的准确表达的同时，也不再受限于线上服务资源限制。

Description

信息推荐方法、模型训练方法、装置、设备及存储介质

技术领域

本申请涉及人工智能技术领域，特别涉及一种信息推荐方法、模型训练方法、装置、设备及存储介质。

背景技术

用户兴趣建模是个性化推荐系统的重要组成部分，所谓“人以群分”，对用户兴趣进行全面、多样地刻画，对于提升个性化推荐系统的用户满意度具有重要意义。

其中，用户历史行为序列是表达用户兴趣的重要组成部分。示例性的，推荐系统可以采集用户历史行为序列作为输入数据，然后从用户历史行为序列中提取兴趣特征来表征用户兴趣，基于兴趣特征筛选用户感兴趣的推荐内容。

但是，由于受限于线上服务资源的限制，推荐系统所能支持的用户历史行为序列的长度和维度都十分有限，使得用户兴趣表达受限。

发明内容

本申请实施例提供了一种信息推荐方法、模型训练方法、装置、设备及存储介质，该方法在线下完成对历史浏览内容序列的特征降维提取、以及候选内容的特征降维提取，使得线上信息推荐时可以直接获取预设维度上的特征向量进行计算，按照提供的线上服务资源来控制预设维度的大小，能够获得用户历史行为序列对用户兴趣的准确表达的同时，也不再受限于线上服务资源的限制，实现符合用户兴趣的精准信息推荐。所述技术方案如下：

根据本申请的一个方面，提供了一种信息推荐方法，该方法包括：

从参数表中获取用户标识对应的第一降维向量，以及从参数表中获取n个内容标识对应的n个第二降维向量；第一降维向量是预先对第一高维向量离线降维得到的预设维度上的第一降维向量，第一高维向量是从用户标识对应的历史浏览内容序列中提取得到的用户兴趣的表征向量；第二降维向量是预先对内容标识对应的候选内容的第二高维向量离线降维得到的预设维度上的第二降维向量；预设维度小于第一高维向量与第二高维向量的维度；

基于第一降维向量与n个第二降维向量，计算每个第二降维向量对应的候选内容的推荐分数，得到n个内容标识对应的n个候选内容的n个推荐分数；

基于n个推荐分数从n个候选内容中确定推荐信息，向用户标识对应的用户设备发送推荐信息，n为正整数。

根据本申请的另一个方面，提供了一种模型训练方法，该方法用于对降维模型和排序模型的联合训练，降维模型用于特征向量的离线降维，排序模型用于内容评分，该方法包括：

获取训练样本，每组训练样本包括至少两个浏览内容样本对应的浏览内容序列和推荐内容样本，推荐内容样本标记有参考推荐分数；

调用降维模型对浏览内容序列进行降维处理，得到第一样本降维向量；以及调用降维模型对推荐内容样本进行降维处理，得到第二样本降维向量；

调用排序模型基于第一样本降维向量和第二样本降维向量进行评分计算，得到推荐内容样本的预测推荐分数；

基于预测推荐分数与参考推荐分数之间的误差，对降维模型和排序模型进行参数调整。

根据本申请的另一个方面，提供了一种信息推荐装置，该装置包括：

第一获取模块，用于从参数表中获取用户标识对应的第一降维向量，以及从参数表中获取n个内容标识对应的n个第二降维向量；第一降维向量是预先对第一高维向量离线降维得到的预设维度上的第一降维向量，第一高维向量是从用户标识对应的历史浏览内容序列中提取得到的用户兴趣的表征向量；第二降维向量是预先对内容标识对应的候选内容的第二高维向量离线降维得到的预设维度上的第二降维向量；预设维度小于第一高维向量与第二高维向量的维度；

第一计算模块，用于基于第一降维向量与n个第二降维向量，计算每个第二降维向量对应的候选内容的推荐分数，得到n个内容标识对应的n个候选内容的n个推荐分数；

信息推荐模块，用于基于n个推荐分数从n个候选内容中确定推荐信息，向用户标识对应的用户设备发送推荐信息，n为正整数。

根据本申请的另一个方面，提供了一种模型训练装置，该装置用于对降维模型和排序模型的联合训练，降维模型用于特征向量的离线降维，排序模型用于内容评分，该装置包括：

第二获取模块，用于获取训练样本，每组训练样本包括至少两个浏览内容样本对应的浏览内容序列和推荐内容样本，推荐内容样本标记有参考推荐分数；

第二提取模块，用于调用降维模型对浏览内容序列进行降维处理，得到第一样本降维向量；以及调用降维模型对推荐内容样本进行降维处理，得到第二样本降维向量；

第二计算模块，用于调用排序模型基于第一样本降维向量和第二样本降维向量进行评分计算，得到推荐内容样本的预测推荐分数；

参数调整模块，用于基于预测推荐分数与参考推荐分数之间的误差，对降维模型和排序模型进行参数调整。

根据本申请的另一个方面，提供了一种计算机设备，上述计算机设备包括：处理器和存储器，上述存储器存储有计算机程序，上述计算机程序由上述处理器加载并执行以实现如上所述的信息推荐方法，或者，如上所述的模型训练方法。

根据本申请的另一个方面，提供了一种计算机可读存储介质，上述计算机可读存储介质中存储有计算机程序，上述计算机程序由处理器加载并执行以实现如上所述的信息推荐方法，或者，如上所述的模型训练方法。

根据本申请的另一个方面，提供了一种计算机程序(或计算机程序产品)，上述计算机程序(或计算机程序产品)包括计算机指令，上述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从上述计算机可读存储介质读取上述计算机指令，上述处理器执行上述计算机指令，使得上述计算机设备执行如上所述的信息推荐方法，或者，如上所述的模型训练方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

计算机设备中设置有参数表，参数表中存储有第一降维向量与第二降维向量，第一降维向量用于表达用户浏览信息的长期兴趣点，第二降维向量是信息推荐时可供选择内容的特征向量。计算机设备在进行线上的信息推荐时，从参数表中获取用户标识对应的第一降维向量、以及n个内容标识对应的n个第二降维向量；基于第一降维向量与第二降维向量，对每个第二降维向量对应的候选内容进行评分，得到n个内容标识对应的n个候选内容的推荐分数，再基于n个推荐分数从n个候选内容中筛选出推荐信息，向用户标识对应的用户设备发送该推荐信息，为用户标识对应的用户的信息浏览提供推荐信息。这一信息推荐过程中采用的第一降维向量和第二降维向量，都是预先降维处理后的预设维度上的向量，因此，可以获得用户的长期兴趣表征的同时，还避免了由于线上资源有限，无法支持超长与超高维度的用户兴趣表达序列的处理这一问题；其次，这一信息推荐过程还减少了对用户兴趣特征的提取步骤、以及对候选内容的特征提取步骤，进而减少了计算机设备上运算资源的占用，提高了信息推荐的效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请一个示例性实施例提供的信息推荐方法的实现架构图；

图2示出了本申请一个示例性实施例提供的推荐系统的框图；

图3示出了本申请一个示例性实施例提供的模型训练方法的流程图；

图4示出了本申请一个示例性实施例提供的精排模型的结构示意图；

图5示出了本申请一个示例性实施例提供的第一降维向量的提取方法的流程图；

图6示出了本申请一个示例性实施例提供的第二降维向量的提取方法的流程图；

图7示出了本申请一个示例性实施例提供的信息推荐方法的流程图；

图8示出了本申请一个示例性实施例提供的信息推荐装置的框图；

图9示出了本申请一个示例性实施例提供的模型训练装置的框图；

图10示出了本申请一个示例性实施例提供的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

用户兴趣建模是个性化推荐系统的重要组成部分，所谓“人以群分”，对用户兴趣进行全面、多样地刻画，对于提升个性化推荐系统的用户满意度具有重要意义。其中，用户历史行为序列是表达用户兴趣的重要组成部分。

推荐系统通常以用户历史行为序列作为输入数据；若要准确地表达用户兴趣，需要从很长一段时间内的多模态的用户历史行为中进行提取，这使得用户历史行为序列的长度过长，且多模态中图片这一模态的维度也过高。受限于线上服务资源的限制，推荐系统对用户历史行为序列的长度和维度均有限制，比如，推荐系统通常只能处理20～50个向量长度的序列，和/或，只能处理32～64维的特征，最终使得用户兴趣表达的不够准确，影响了按照用户兴趣进行信息推荐的精准度。为了解决这一技术问题，本申请提供了一种信息推荐方法，该方法的详细实现细节请参考以下实施例。

图1示出了本申请一个示例性实施例提供的信息推荐方法的实现架构图。该信息推荐方法的前期准备是对降维模型102和排序模型104进行模型的联合训练，也即将降维模型102和排序模型104作为一个整体进行训练，其中，将降维模型102和排序模型104的组合命名为精排模型106。

一、精排模型106的训练部分

计算机设备获取至少两组训练样本，基于至少两组训练样本对精排模型106进行训练，调整精排模型106中的模型参数，经过至少两轮迭代训练，完成对精排模型106的训练。

示例性的，每组训练样本包括浏览内容序列和推荐内容样本，推荐内容样本标记有参考推荐分数；计算机设备针对每组训练样本，调用精排模型106对浏览内容序列进行降维特征提取，得到第一样本降维向量，以及对推荐内容样本进行降维特征提取，得到第二样本降维向量；调用精排模型106基于第一样本降维向量和第二样本降维向量对推荐内容样本进行评分，得到推荐内容样本的预测推荐分数；调用精排模型106基于预测推荐分数与参考推荐分数之间的误差，对精排模型106进行整体的模型参数调整。

对于每组训练样本的生成，计算机设备获取至少两个用户标识下的历史浏览内容，每个用户标识下存在至少两个历史浏览内容；针对每个用户标识，将该用户标识下的至少两个历史浏览内容作为浏览内容样本，对至少两个浏览内容样本进行聚合，生成该用户标识对应的超长序列高维聚合特征，也即浏览内容序列。示例性的，计算机设备在浏览内容序列生成时，还在浏览内容序列中加入用户标识对应的其他特征，其他特征是该用户标识对应的用户的行为特征信息，比如，该用户标识对应的用户对浏览内容的点击率、内容浏览时的行为习惯等。

计算机设备还获取每个用户标识对应的推荐内容，每个用户标识对应的推荐内容符合该用户标识对应的用户的用户浏览兴趣，生成该推荐内容的原始高维表征作为推荐内容样本。示例性的，上述推荐内容可以是图片内容，则计算机设备生成图片内容的图片原始高维表征，以作为推荐内容样本。

示例性的，计算机设备将生成的浏览内容序列和推荐内容样本作为一组训练样本；将每个用户标识对应的训练样本和用户标识对应存储至计算机设备对应的数据库，或者对应存储至计算机设备的存储器中。在精排模型106训练的过程中，计算机设备从存储器或者数据库中获取训练样本。

示例性的，上述每个用户标识下的至少两个浏览内容样本与推荐内容对应存储在计算机设备对应的数据库中，或者，存储在计算机设备的存储器中。在精排模型106训练的过程中，计算机设备从存储器或者数据库中获取每个用户标识下的至少两个浏览内容样本与推荐内容，生成每个用户标识对应的训练样本。

其中，上述用户标识可以包括提供历史浏览内容的用户设备上登录的用户帐号，或者提供历史浏览内容的应用程序中登录的用户帐号。

二、精排模型106的使用部分

计算机设备完成精排模型106的训练之后，将精排模型106中的降维模型102作为线下模型，用于特征向量的离线降维提取；将精排模型106中的排序模型103作为线上模型，用于线上的内容评分。

1)线下部分

在向每个用户标识对应的用户设备进行信息推荐之前，计算机设备获取该用户标识在第一指定时间段内的历史浏览内容，对历史浏览内容进行模型外聚合，生成历史浏览内容的全量用户聚合向量(也即历史浏览内容序列)；调用降维模型102对全量用户聚合向量进行降维处理，得到第一降维向量(也即用户长期序列表征)，以采用第一降维向量表征用户浏览兴趣，将第一降维向量与用户标识(dpid)对应存储。

即将在第二指定时间段内向每个用户标识对应的用户设备进行信息推荐，那么在第二指定时间段之前，计算机设备获取第二指定时间段内的可分发图片的预训练向量(即候选内容)；调用降维模型102对可分发图片的预训练向量进行降维处理，得到第二降维向量(也即图片表征)，以采用第二降维向量表征可分发图片的特征，将可分发图片与内容标识(itemid)对应存储。

计算机设备将第一降维向量与dpid预加载至线上的用户画像对应的数据库中，以及将第二降维向量与itemid预加载至线上的Item特征对应的数据库中，以提供信息推荐所需的计算向量。

2)线上部分

向一个用户标识对应的用户设备进行信息推荐，计算机设备从用户画像对应的数据库中，查询该用户标识对应的第一降维向量，以及从Item特征对应的数据库中，查询n个内容标识对应的n个候选内容的n个第二降维向量；调用排序模型104基于第一降维向量和n个第二降维向量进行评分计算，得到每个第二降维向量对应的推荐评分；对n个推荐评分进行排序，将前k个推荐评分对应的候选内容确定为推荐信息，将推荐信息发送至用户标识对应的用户设备上，k为小于或等于n的正整数。

其中，历史浏览内容和候选内容均可以是多模态的组合信息，比如，历史浏览内容和候选内容均是图片和文字两种模态的组合信息。

综上所述，本实施例提供的信息推荐方法，采用线下线上两部分，对用户兴趣的特征表征、以及候选内容的特征表征在线下已经完成，线上时可以直接查询使用，无需在线上进行超长序列的特征提取，线下进行超长序列的特征提取无需考虑线上可用运算资源的限制，对于超长序列的长度和维度没有限制，能够采用序列更长和维度更高的原始数据进行特征提取，从而提取到更准确、更充分的用户兴趣特征，对于特征提取无需线上进行还大大减少了线上的运算量，提高了信息推荐的效率。

另外，对于降维模型的训练，是与排序模型共同训练的，根据排序的准确性不断的对降维的精准度进行训练，能够学习到对高维向量的准确降维，避免高维向量降维后兴趣特征的大量丢失。

示例性的，上述计算机设备包括服务器；上述信息推荐方法的执行与模型训练的执行可以采用同一服务器或者不同服务器来实现，如图2，示出了本申请一个示例性实施例提供的推荐系统200的框图。该推荐系统200包括电子设备220、通信网络240和服务器260。

电子设备220可以包括智能手机、平板电脑、电子书阅读器、MP3(Moving PictureExperts Group Audio Layer III，动态影像专家压缩标准音频层面3)播放器、MP4(MovingPicture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机中、笔记本电脑的至少一种。

电子设备220中安装有操作系统和至少一个应用程序。该操作系统可以是安卓(Android)操作系统、或苹果(IOS)操作系统、或鸿蒙(Harmony)操作系统。电子设备220中安装和运行有客户端，该客户端具备信息浏览功能，比如，该客户端可以是浏览器、新闻软件、以及社交网络平台等；该客户端还可以是支持小程序运行的宿主程序，小程序具备信息浏览功能。

电子设备220与服务器260之间通过通信网络240相连，该通信网络240可以是有线网络或者无线网络。示例性的，有线网络可以是城域网、局域网、光纤网等；无线网络可以是移动通信网络或者无线保真网络(Wireless Fidelity，WiFi)。

服务器260用于为电子设备220中运行的客户端和/或客户端上的小程序提供后台服务。示例性的，服务器260可以包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。

服务器260可以执行本申请实施例提供的信息推荐方法，为电子设备220上运行的客户端和/或小程序提供信息推荐服务。示例性的，电子设备220接收到用户触发的信息浏览操作，向服务器260发送信息推荐请求(Request)；服务器260响应上述信息推荐请求，执行上述信息推荐方法，向电子设备220发送筛选出的推荐信息。

在另一些实施例中，服务器260还可以执行本申请实施例提供的模型训练方法，对降维模型和排序模型进行联合训练。

本领域技术人员可以知晓，上述推荐系统200中电子设备220的数量可以更多或更少。比如，电子设备220可以仅为一个，或者为几十个或几百个，或者更多数量，本申请实施例对推荐系统200中电子设备220的数量和设备类型不加以限定。

图3示出了本申请一个示例性实施例提供的模型训练方法的流程图，以应用于图2所示的服务器中为例，该方法包括：

步骤301，获取训练样本，每组训练样本包括至少两个浏览内容样本对应的浏览内容序列和推荐内容样本，推荐内容样本标记有参考推荐分数。

服务器从数据库中获取至少两组训练样本，每组训练样本包括浏览内容序列和推荐内容样本。示例性的，推荐内容由人工标注参考推荐分数。

在一个实施例中，服务器从至少两个用户标识下获取历史浏览内容；对每个用户标识下的至少两个历史浏览内容，将至少两个历史浏览内容中最新浏览内容作为推荐内容，以及将至少两个历史浏览内容中剩余历史浏览内容作为浏览内容样本；生成浏览内容样本的聚合表征向量，得到浏览内容序列，以及生成推荐内容的表征向量，得到推荐内容样本。其中，最新浏览内容是指在至少两个历史浏览内容中，浏览时刻距离训练样本的获取时刻最近的历史浏览内容。

在另一个实施例中，服务器从至少两个用户标识下获取历史浏览内容；对每个用户标识下的至少两个历史浏览内容，展示上述至少两个历史浏览内容；接收用户触发的对目标历史浏览内容的选择操作，将目标历史浏览内容确定为推荐内容，以及将至少两个历史浏览内容中剩余历史浏览内容作为浏览内容样本；生成浏览内容样本的聚合表征向量，得到浏览内容序列，以及生成推荐内容的表征向量，得到推荐内容样本。

示例性的，服务器还可以从每个用户标识下的至少两个历史浏览内容中确定出至少两组训练样本。

步骤302，调用降维模型对浏览内容序列进行降维处理，得到第一样本降维向量。

上述降维网络可以是对神经网络模型训练得到的。示例性的，降维网络可以是由卷积神经网络(Convolutional Neural Networks，CNN)构建的。服务器通过CNN对浏览内容序列进行降维处理，得到第一样本降维向量。

可选地，降维模型包括规范网络和降维网络；服务器将浏览内容序列输入规范网络，对浏览内容序列进行规范处理，得到规范后的样本内容序列向量；将规范后的样本内容序列向量输入降维网络，对规范后的样本内容序列向量进行降维处理，得到第一样本降维向量。

步骤303，调用降维模型对推荐内容样本进行降维处理，得到第二样本降维向量。

示例性的，服务器通过CNN对推荐内容样本进行降维处理，得到第二样本降维向量。

可选地，降维模型包括规范网络和降维网络；服务器将推荐内容样本输入规范网络，对推荐内容样本进行规范处理，得到规范后的样本内容向量；将规范后的样本内容向量输入降维网络，对规范后的样本内容向量进行降维处理，得到第二样本降维向量。

示例性的，每组训练样本中可以包括至少两个推荐内容样本；服务器对至少两个推荐内容样本进行拼接，生成推荐内容样本序列；服务器调用降维模型对推荐内容样本序列进行降维处理，得到第二样本降维向量。

示例性的，第二样本降维向量与第一样本降维向量均是预设维度上的向量，预设维度小于浏览内容序列的向量维度，且预设维度小于推荐内容样本的向量维度。

步骤304，调用排序模型基于第一样本降维向量和第二样本降维向量进行评分计算，得到推荐内容样本的预测推荐分数。

服务器将第一样本降维向量和第二样本降维向量合并，得到合并后的样本降维向量；调用排序模型从m个评分方向上对合并后的样本降维向量进行评分计算，得到m个评分方向上的m个样本子推荐分数；基于m个样本子推荐分数确定推荐内容样本的预测推荐分数，评分方向是指对推荐内容样本评分的参考点，m为大于1的正整数。

示例性的，对于向量合并，服务器对第一样本降维向量与第二样本降维向量进行拼接，即得到合并后的样本降维向量。比如，第一样本降维向量为D_1，第二样本降维向量为D_2，服务器对D_1和D_2进行拼接，即得到合并后的样本降维向量(D_1,D_2)。

上述排序模型可以是对神经网络模型训练得到的。示例性的，排序模型可以是基于多任务学习模型(Multi-gate Mixture-Of-Experts，MMOE)构建的。可选地，排序模型包括m个门限网络、专家网络、m个评分网络和输出网络；m个样本子推荐分数包括第i个评分方向上的样本子推荐分数，i为小于或者等于m的正整数；服务器将合并后的样本降维向量输入第i个门限网络，得到第i个评分方向对应的第i组样本权重，以及将合并后的样本降维向量输入专家网络，得到学习后的样本评分特征向量；将第i组样本权重与样本评分特征向量相乘，得到第i个评分方向上的样本评分特征向量；将第i个评分方向上的样本评分特征向量输入第i个评分网络，得到第i个评分方向上的样本子推荐分数；采用上述四个步骤计算每一个评分方向上的样本子推荐分数，得到m个样本子推荐分数，之后通过输出网络基于m个样本子推荐分数确定推荐内容样本的预测推荐分数。示例性的，计算机设备可以同时计算m个评分方向上的m个样本子推荐分数。

示例性的，排序模型包括r个专家网络，r为正整数；对于第i个评分方向上的样本评分特征向量的生成，服务器将合并后的样本降维向量输入r个专家网络中的每个专家网络，得到r个样本评分特征向量；将每个样本评分特征向量与第i组样本权重相乘，得到r个加权后的样本评分特征向量；对r个加权后的样本评分特征向量进行相加，即得到第i个评分方向上的样本评分特征向量。

示例性的，服务器通过输出网络对m个样本子推荐分数进行相加，得到推荐内容样本的预测推荐分数；或者，通过输出网络计算m个样本子推荐分数的平均分数，得到推荐内容样本的预测推荐分数。

需要说明的是，若每组训练样本中包括至少两个推荐内容样本，服务器采用上述预测推荐分数的计算方式计算每个推荐内容样本的预测推荐分数；示例性的，服务器将第i个评分方向上的样本评分特征向量输入第i个评分网络，由第i个评分网络计算得到第i个评分方向上至少两个推荐内容样本对应的至少两个样本子推荐分数；针对每个推荐内容样本，通过输出网络基于m个样本子推荐分数确定该推荐内容样本的预测推荐分数。

上述针对评分任务，服务器采用MMOE架构，在多评分方向上对推荐内容进行评分计算，可以按照用户浏览兴趣对推荐内容进行更全面的评分，提高对推荐内容评分的准确度。

步骤305，基于预测推荐分数与参考推荐分数之间的误差，对降维模型和排序模型进行参数调整。

服务器计算预测推荐分数与参考推荐分数之间的误差，基于上述误差对降维模型和排序模型进行反向传播训练，调整降维模型和排序模型中的模型参数，经过多轮训练，得到训练完成的降维模型和排序模型。

示例性的，如图4，对降维模型401和排序模型402的联合训练进行举例说明，服务器获取u个浏览内容样本pic_0、pic_1、……、pic_u，在模型外对每一个浏览内容样本进行向量转换，得到每个浏览内容样本的样本内容向量，对u个浏览内容样本的u个样本内容向量进行聚合，即得到浏览内容序列，u为大于1的正整数；服务器将浏览内容序列输入标准化层，通过批标准化(BatchNormalization)函数进行处理，得到规范后的样本内容序列向量；将规范后的样本内容序列向量输入第一全连接层，在第一全连接层中以线性整流函数(Rectified Linear Unit，ReLU)作为激活函数，对规范后的样本内容序列向量进行降维处理，得到降维后的样本内容序列向量；将降维后的样本内容序列向量输入第二全连接层，在第二全连接层中以S形(Sigmoid)函数作为激活函数，对降维后的样本内容序列向量进行降维处理，得到第一样本降维向量；如上所述，降维模型401通过三个神经网络层对浏览内容序列进行了降维处理，经过标准化层输出512维度的向量，经过第一全连接层输出128维度的向量，再经过第二全连接层输出32维度的向量，对浏览内容序列的维度层层递减，最终得到预设维度上的第一样本降维向量；

服务器还获取推荐内容item_pic，在模型外对推荐内容进行向量转换，得到推荐内容样本；服务器将推挤内容样本输入标准化层，通过BatchNormalization函数进行处理，得到规范后的样本内容向量；将规范后的样本内容向量输入第一全连接层，通过第一全连接层中的ReLU对规范后的样本内容向量进行降维处理，得到降维后的样本内容向量；将降维后的样本内容向量输入第二全连接层，通过第二全连接层中的Sigmoid函数对降维后的样本内容向量进行降维处理，得到第二样本降维向量。

服务器合并第一样本降维向量、第二样本降维向量和其他特征向量，将合并后的样本降维向量输入MMOE中，对推荐内容样本进行评分，得到预测推荐评分；服务器基于预测推荐评分和标准推荐评分的误差，对降维模型401和排序模型402中的模型参数进行调整。其中，其他特征向量是由服务器对其他特征进行向量转换得到的，第一样本降维向量、第二样本降维向量和其他特征向量具有相同向量维度。

综上所述，本实施例提供的模型训练方法，将降维模型和排序模型作为一个整体进行联合训练，可以根据评分计算的误差不断地对降维模型的模型参数进行调整，使得降维模型对浏览内容序列中兴趣特征的降维提取越来越精准，从而避免了由于向量降维导致的兴趣特征丢失，进而导致的推荐信息与用户浏览兴趣不符的问题；还提高了排序模型基于降维后的向量进行评分计算的准确度，进而提高了针对用户浏览兴趣进行信息推荐的准确度。

在得到训练完成的降维模型和排序模型之后，服务器将降维模型作为线下模型，对历史浏览内容序列和候选内容进行离线降维处理，再将降维向量上传至线上，为线上的排序模型进行信息推荐提供数据。

对于线下部分，图5示出了本申请一个示例性实施例提供的第一降维向量的提取方法的流程图，以应用于图2所示的服务器中为例，该方法包括：

步骤501，获取第一时间段内用户标识对应的至少两个历史浏览内容，生成第一时间段内的历史浏览内容序列。

针对每一个用户标识，服务器获取第一时间段内该用户标识下的至少两个历史浏览内容；对每个历史浏览内容进行向量转换，得到内容向量；将至少两个内容向量进行拼接，即得到第一时间段内的历史浏览内容序列。

上述第一时间段的时长为第一预设时长，该第一预设时长可以是3天、7天、15天、30天、60天、180天，本实施例对第一时间段的时长不加以限定。

步骤502，调用降维模型对第一时间段内的历史浏览内容序列进行离线特征提取，得到预设维度上的第一降维向量。

其中，降维模型用于对特征向量进行降维提取。降维模型包括规范网络和降维网络；服务器将第一时间段内的历史浏览内容序列输入规范网络，对历史浏览内容序列进行规范处理，得到规范后的内容序列向量；将规范后的内容序列向量输入降维网络，对规范后的内容序列向量进行降维处理，得到预设维度上的第一降维向量。如图4所示，规范网络包括标准化层，降维网络包括第一全连接层和第二全连接层；服务器将第一时间段内的历史浏览内容序列输入标准化层，通过BatchNormalization函数对历史浏览内容序列进行规范处理，得到规范后的内容序列向量；将规范后的内容序列向量输入第一全连接层，通过ReLU对规范后的内容序列向量进行降维处理，得到降维后的内容序列向量；将降维后的内容序列向量输入第二全连接层，通过Sigmoid函数对降维后的内容序列向量进行降维处理，得到第一降维向量。

步骤503，将第一降维向量与用户标识对应加载至参数表。

服务器在得到每个用户标识对应的第一降维向量之后，将用户标识与第一降维向量对应加载至线上的参数表，该参数表可以是哈希表。

用户浏览信息的兴趣点随着时间会不断变化，因此，服务器会按照第一更新周期对线上哈希表中用户标识对应的第一降维向量进行更新，示例性的，服务器获取第三时间段内用户标识对应的至少两个历史浏览内容，生成第三时间段内的历史浏览内容序列；调用降维模型对第三时间段内的历史浏览内容序列进行离线特征提取，得到预设维度上的第三降维向量；根据第三降维向量对参数表中用户标识对应的第一降维向量进行更新；其中，第一时间段内的最大时刻先于第三时间段内的最大时刻。比如，服务器每隔7天重新获取一个用户标识下前30天内的至少两个历史浏览内容，生成前30天内的历史浏览内容序列；调用降维模型对前30天内的历史浏览内容序列进行离线特征提取，得到预设维度上的第三降维向量；将参数表中上述用户标识对应的第一降维向量更新为第三降维向量。

综上所述，本实施例提供的第一降维向量的提取方法，通过线下对用户浏览兴趣进行提取，因此，更长更高维度的向量处理可以由线下模型来处理完成，不受到线上资源的限制，能够采用更长更高维度的历史浏览内容序列提取更充足的用户浏览兴趣特征。该方法中还按照第一更新周期对参数表中的第一降维向量进行更新，能够更好地把握用户随着时间而变化的浏览兴趣。

对于线下部分，图6示出了本申请一个示例性实施例提供的第二降维向量的提取方法的流程图，以应用于图2所示的服务器中为例，该方法包括：

步骤601，获取第二时间段内的n个候选内容。

服务器获取在第二时间段内可作为推荐信息的n个候选信息，对每个候选信息进行向量转换，得到n个候选信息对应的n个候选内容。

上述第二时间段的时长为第二预设时长，该第二预设时长可以是1天、3天、7天、15天、30天、60天，本实施例对第二时间段的时长不加以限定。

步骤602，调用降维模型对每个候选内容进行离线特征提取，得到预设维度上的第二降维向量。

其中，降维模型用于对特征向量进行降维提取。降维模型包括规范网络和降维网络；服务器将每个候选内容输入规范网络，对候选内容进行规范处理，得到规范后的内容向量；将规范后的内容向量输入降维网络，对规范后的内容向量进行降维处理，得到预设维度上的第二降维向量。如图4所示，规范网络包括标准化层，降维网络包括第一全连接层和第二全连接层；服务器将第二时间段内的每个候选内容输入标准化层，通过BatchNormalization函数对候选内容进行规范处理，得到规范后的内容向量；将规范后的内容向量输入第一全连接层，通过ReLU对规范后的内容向量进行降维处理，得到降维后的内容向量；将降维后的内容向量输入第二全连接层，通过Sigmoid函数对降维后的内容向量进行降维处理，得到第二降维向量。

步骤603，将第二降维向量与内容标识对应加载至参数表。

服务器在得到n个第二降维向量之后，将候选内容对应的内容标识与第二降维向量对应加载至线上的参数表，该参数表可以是哈希表。第二降维向量对应的参数表与第一降维向量对应的参数表可以是相同或者不同的参数表。

各类消息每天都在更新，因此，也需要不断对候选内容进行更新，进而还需要对参数表中候选内容的第二降维向量进行更新，示例性的，服务器获取第四时间段内的k个新增候选内容；调用降维模型对每个新增候选内容进行离线特征提取，得到预设维度上的第四降维向量；将新增候选内容的第四降维向量与内容标识对应更新至参数表；其中，第二时间段内的最大时刻先于第四时间段内的最大时刻，k为正整数。比如，服务器每天获取新增候选内容，调用降维模型对新增候选内容进行离线特征提取，得到预设维度上的第四降维向量；将参数表中上述新增候选内容的内容标识与第四降维向量更新至参数表中。示例性的，服务器若是对部分候选内容删除，则还对应删除参数表中该部分候选内容对应的第二降维向量。

综上所述，本实施例提供的第二降维向量的提取方法，通过线下对候选内容的特征向量进行提取，因此，更长更高维度的向量处理可以由线下模型来处理完成，不受到线上资源的限制，能够提取更长更高维度的候选内容的特征向量。

对于线上部分，图7示出了本申请一个示例性实施例提供的信息推荐方法的流程图，该方法应用于图2所示的服务器中，该方法包括：

步骤701，从参数表中获取用户标识对应的第一降维向量。

服务器向目标用户标识推荐信息时，从参数表中获取目标用户标识对应的第一降维向量。其中，第一降维向量是预先对第一高维向量离线降维得到的预设维度上的第一降维向量，第一高维向量是从用户标识对应的历史浏览内容序列中提取得到的用户兴趣的表征向量，预设维度小于第一高维向量的维度。

步骤702，从参数表中获取n个内容标识对应的n个第二降维向量。

其中，第二降维向量是预先对内容标识对应的候选内容的第二高维向量离线降维得到的预设维度上的第二降维向量；预设维度小于第二高维向量的维度。

步骤703，基于第一降维向量与n个第二降维向量，计算每个第二降维向量对应的候选内容的推荐分数，得到n个内容标识对应的n个候选内容的n个推荐分数。

可选地，服务器对于每个第二降维向量，将第二降维向量与第一降维向量合并，得到合并后的降维向量；调用排序模型从m个评分方向上对合并后的降维向量进行评分计算，得到m个评分方向上的m个子推荐分数，评分方向是指对候选内容评分的参考点，排序模型用于内容评分；基于m个子推荐分数确定第二降维向量对应的候选内容的推荐分数，m为大于1的正整数。

示例性的，排序模型包括m个门限网络、专家网络、m个评分网络和输出网络；m个子推荐分数包括第i个评分方向上的子推荐分数，i为小于或者等于m的正整数；对于推荐分数的计算，服务器将合并后的降维向量输入第i个门限网络，得到第i个评分方向对应的第i组权重；以及将合并后的降维向量输入专家网络，得到学习后的评分特征向量；将第i组权重与评分特征向量相乘，得到第i个评分方向上的评分特征向量；将第i个评分方向上的评分特征向量输入第i个评分网络，得到第i个评分方向上的子推荐分数；采用上述四个步骤计算每一个评分方向上的子推荐分数，得到m个子推荐分数，之后通过输出网络基于m个子推荐分数确定第二降维向量对应的候选内容的推荐分数。其中，计算机设备可以同时计算得到m个子推荐分数。

示例性的，排序模型包括r个专家网络；对于第i个评分方向上的评分特征向量的生成，服务器将合并后的降维向量输入r个专家网络中的每个专家网络，得到r个评分特征向量；将每个评分特征向量与第i组权重相乘，得到r个加权后的评分特征向量；对r个加权后的评分特征向量进行相加，即得到第i个评分方向上的评分特征向量。

可选地，服务器将第一降维向量与n个第二降维向量合并，得到合并后的降维向量；调用排序模型基于合并后的降维向量进行评分计算，以从m个评分方向上对n个候选内容进行评分，得到每个候选内容在m个评分方向上的m个子推荐分数；对于每个候选内容，通过输出网络基于m个子推荐分数计算该候选内容的推荐分数。

示例性的，服务器通过输出网络对m个子推荐分数进行相加，得到候选内容的推荐分数；或者，通过输出网络计算m个子推荐分数的平均分数，得到候选内容的推荐分数。

步骤704，基于n个推荐分数从n个候选内容中确定推荐信息，向用户标识对应的用户设备发送推荐信息，n为正整数。

服务器调用排序模型对n个候选内容对应的n个推荐分数排序，将排序后的n个推荐分数中前g个推荐分数对应的候选内容确定为g个推荐信息，g为正整数。如图4所示，排序模型包括输出层，服务器通过输出层对n个推荐分数排序，将前g个推荐分数对应的候选内容确定为g个推荐信息。

综上所述，本实施例提供的信息推荐方法，计算机设备在进行线上的信息推荐时，从参数表中获取用户标识对应的第一降维向量、以及n个内容标识对应的n个第二降维向量；基于第一降维向量与第二降维向量，对每个第二降维向量对应的候选内容进行评分，得到n个内容标识对应的n个候选内容的推荐分数，再基于n个推荐分数从n个候选内容中筛选出推荐信息，向用户标识对应的用户设备发送该推荐信息，为用户标识对应的用户的信息浏览提供推荐信息。这一信息推荐过程中采用的第一降维向量和第二降维向量，都是预先降维处理后的预设维度上的向量，因此，可以获得用户的长期兴趣表征的同时，还避免了由于线上资源有限，无法支持超长与超高维度的用户兴趣表达序列的处理这一问题；其次，这一信息推荐过程还减少了对用户兴趣特征的提取步骤、以及对候选内容的特征提取步骤，进而减少了计算机设备上运算资源的占用，提高了信息推荐的效率。

图8示出了本申请一个示例性实施例提供的信息推荐装置的框图，该装置可以通过软件、硬件、或者二者结合实现成为计算机设备的部分或者全部。该装置包括：

第一获取模块810，用于从参数表中获取用户标识对应的第一降维向量，以及从参数表中获取n个内容标识对应的n个第二降维向量；第一降维向量是预先对第一高维向量离线降维得到的预设维度上的第一降维向量，第一高维向量是从用户标识对应的历史浏览内容序列中提取得到的用户兴趣的表征向量；第二降维向量是预先对内容标识对应的候选内容的第二高维向量离线降维得到的预设维度上的第二降维向量；预设维度小于第一高维向量与第二高维向量的维度；

第一计算模块820，用于基于第一降维向量与n个第二降维向量，计算每个第二降维向量对应的候选内容的推荐分数，得到n个内容标识对应的n个候选内容的n个推荐分数；

信息推荐模块830，用于基于n个推荐分数从n个候选内容中确定推荐信息，向用户标识对应的用户设备发送推荐信息，n为正整数。

在一些实施例中，第一计算模块820，用于：

对于每个第二降维向量，将第二降维向量与第一降维向量合并，得到合并后的降维向量；

调用排序模型从m个评分方向上对合并后的降维向量进行评分计算，得到m个评分方向上的m个子推荐分数；评分方向是指对候选内容评分的参考点，排序模型用于内容评分；

基于m个子推荐分数确定第二降维向量对应的候选内容的推荐分数，m为大于1的正整数。

在一些实施例中，排序模型包括m个门限网络、专家网络、m个评分网络和输出网络；m个子推荐分数包括第i个评分方向上的子推荐分数，i为小于或者等于m的正整数；第一计算模块820，用于：

将合并后的降维向量输入第i个门限网络，得到第i个评分方向对应的第i组权重；以及将合并后的降维向量输入专家网络，得到学习后的评分特征向量；

将第i组权重与评分特征向量相乘，得到第i个评分方向上的评分特征向量；

将第i个评分方向上的评分特征向量输入第i个评分网络，得到第i个评分方向上的子推荐分数；

采用上述四个步骤计算得到m个子推荐分数之后，通过输出网络基于m个子推荐分数确定第二降维向量对应的候选内容的推荐分数。

在一些实施例中，该装置还包括：第一提取模块840和加载模块850；

第一获取模块810，用于获取第一时间段内用户标识对应的至少两个历史浏览内容，生成第一时间段内的历史浏览内容序列；

第一提取模块840，用于调用降维模型对第一时间段内的历史浏览内容序列进行离线特征提取，得到预设维度上的第一降维向量；其中，降维模型用于对特征向量进行降维提取；

加载模块850，用于将第一降维向量与用户标识对应加载至参数表。

在一些实施例中，降维模型包括规范网络和降维网络；第一提取模块840，用于：

将第一时间段内的历史浏览内容序列输入规范网络，对历史浏览内容序列进行规范处理，得到规范后的内容序列向量；

将规范后的内容序列向量输入降维网络，对规范后的内容序列向量进行降维处理，得到预设维度上的第一降维向量。

在一些实施例中，该装置还包括：更新模块860；

第一获取模块810，用于获取第三时间段内用户标识对应的至少两个历史浏览内容，生成第三时间段内的历史浏览内容序列；

第一提取模块840，用于调用降维模型对第三时间段内的历史浏览内容序列进行离线特征提取，得到预设维度上的第三降维向量；

更新模块860，用于根据第三降维向量对参数表中用户标识对应的第一降维向量进行更新；其中，第一时间段内的最大时刻先于第三时间段内的最大时刻。

第一获取模块810，用于获取第二时间段内的n个候选内容；

第一提取模块840，用于调用降维模型对每个候选内容进行离线特征提取，得到预设维度上的第二降维向量；其中，降维模型用于对特征向量进行降维提取；

加载模块850，用于将第二降维向量与内容标识对应加载至参数表。

将每个候选内容输入规范网络，对候选内容进行规范处理，得到规范后的内容向量；

将规范后的内容向量输入降维网络，对规范后的内容向量进行降维处理，得到预设维度上的第二降维向量。

在一些实施例中，该装置还包括：更新模块860；

第一获取模块810，用于获取第四时间段内的k个新增候选内容；

第一提取模块840，用于调用降维模型对每个新增候选内容进行离线特征提取，得到预设维度上的第四降维向量；

更新模块860，用于将新增候选内容的第四降维向量与内容标识对应更新至参数表；其中，第二时间段内的最大时刻先于第四时间段内的最大时刻，k为正整数。

在一些实施例中，信息推荐模块830，用于：

调用排序模型对n个推荐分数排序，将排序后的n个推荐分数中前g个推荐分数对应的候选内容确定为g个推荐信息，g为正整数。

综上所述，本实施例提供的信息推荐装置，在进行线上的信息推荐时，从参数表中获取用户标识对应的第一降维向量、以及n个内容标识对应的n个第二降维向量；基于第一降维向量与第二降维向量，对每个第二降维向量对应的候选内容进行评分，得到n个内容标识对应的n个候选内容的推荐分数，再基于n个推荐分数从n个候选内容中筛选出推荐信息，向用户标识对应的用户设备发送该推荐信息，为用户标识对应的用户的信息浏览提供推荐信息。这一信息推荐过程中采用的第一降维向量和第二降维向量，都是预先降维处理后的预设维度上的向量，因此，可以获得用户的长期兴趣表征的同时，还避免了由于线上资源有限，无法支持超长与超高维度的用户兴趣表达序列的处理这一问题；其次，这一信息推荐过程还减少了对用户兴趣特征的提取步骤、以及对候选内容的特征提取步骤，进而减少了计算机设备上运算资源的占用，提高了信息推荐的效率。

图9示出了本申请一个示例性实施例提供的模型训练装置的框图，该装置可以通过软件、硬件、或者二者结合实现成为计算机设备的部分或者全部。该装置包括：

第二获取模块910，用于获取训练样本，每组训练样本包括至少两个浏览内容样本对应的浏览内容序列和推荐内容样本，推荐内容样本标记有参考推荐分数；

第二提取模块920，用于调用降维模型对浏览内容序列进行降维处理，得到第一样本降维向量；以及调用降维模型对推荐内容样本进行降维处理，得到第二样本降维向量；

第二计算模块930，用于调用排序模型基于第一样本降维向量和第二样本降维向量进行评分计算，得到推荐内容样本的预测推荐分数；

参数调整模块940，用于基于预测推荐分数与参考推荐分数之间的误差，对降维模型和排序模型进行参数调整。

在一些实施例中，第二计算模块930，用于：

将第一样本降维向量和第二样本降维向量合并，得到合并后的样本降维向量；

调用排序模型从m个评分方向上对合并后的样本降维向量进行评分计算，得到m个评分方向上的m个样本子推荐分数；评分方向是指对推荐内容样本评分的参考点；

基于m个样本子推荐分数确定推荐内容样本的预测推荐分数，m为大于1的正整数。

在一些实施例中，排序模型包括m个门限网络、专家网络、m个评分网络和输出网络；m个样本子推荐分数包括第i个评分方向上的样本子推荐分数，i为小于或者等于m的正整数；第二计算模块930，用于：

将合并后的样本降维向量输入第i个门限网络，得到第i个评分方向对应的第i组样本权重；以及将合并后的样本降维向量输入专家网络，得到学习后的样本评分特征向量；

将第i组样本权重与样本评分特征向量相乘，得到第i个评分方向上的样本评分特征向量；

将第i个评分方向上的样本评分特征向量输入第i个评分网络，得到第i个评分方向上的样本子推荐分数；

采用上述四个步骤计算得到m个样本子推荐分数之后，通过输出网络基于m个样本子推荐分数确定推荐内容样本的预测推荐分数。

在一些实施例中，降维模型包括规范网络和降维网络；第二提取模块920，用于：

将浏览内容序列输入规范网络，对浏览内容序列进行规范处理，得到规范后的样本内容序列向量；

将规范后的样本内容序列向量输入降维网络，对规范后的样本内容序列向量进行降维处理，得到第一样本降维向量。

将推荐内容样本输入规范网络，对推荐内容样本进行规范处理，得到规范后的样本内容向量；

将规范后的样本内容向量输入降维网络，对规范后的样本内容向量进行降维处理，得到第二样本降维向量。

综上所述，本实施例提供的模型训练装置，将降维模型和排序模型作为一个整体进行联合训练，可以根据评分计算的误差不断地对降维模型的模型参数进行调整，使得降维模型对浏览内容序列中兴趣特征的降维提取越来越精准，从而避免了由于向量降维导致的兴趣特征丢失，进而导致的推荐信息与用户浏览兴趣不符的问题；还提高了排序模型基于降维后的向量进行评分计算的准确度，进而提高了针对用户浏览兴趣进行信息推荐的准确度。

图10示出了本申请一个示例性实施例提供的计算机设备的结构示意图。该计算机设备可以是执行如本申请提供的信息推荐方法和/或模型训练方法的设备。具体来讲：

计算机设备1000包括中央处理单元(CPU，Central Processing Unit)1001、包括随机存取存储器(RAM，Random Access Memory)1002和只读存储器(ROM，Read OnlyMemory)1003的系统存储器1004，以及连接系统存储器1004和中央处理单元1001的系统总线1005。计算机设备1000还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统，Input Output System)1006，和用于存储操作系统1013、应用程序1014和其他程序模块1015的大容量存储设备1007。

基本输入/输出系统1006包括有用于显示信息的显示器1008和用于用户输入信息的诸如鼠标、键盘之类的输入设备1009。其中显示器1008和输入设备1009都通过连接到系统总线1005的输入输出控制器1010连接到中央处理单元1001。基本输入/输出系统1006还可以包括输入输出控制器1010以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器1010还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备1007通过连接到系统总线1005的大容量存储控制器(未示出)连接到中央处理单元1001。大容量存储设备1007及其相关联的计算机可读介质为计算机设备1000提供非易失性存储。也就是说，大容量存储设备1007可以包括诸如硬盘或者紧凑型光盘只读存储器(CD-ROM，Compact Disc Read Only Memory)驱动器之类的计算机可读介质(未示出)。

计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(EPROM，Erasable Programmable Read Only Memory)、带电可擦可编程只读存储器(EEPROM,Electrically Erasable Programmable Read Only Memory)、闪存或其他固态存储其技术，CD-ROM、数字通用光盘(DVD，Digital Versatile Disc)或固态硬盘(SSD，Solid State Drives)、其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。其中，随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM，Resistance RandomAccess Memory)和动态随机存取存储器(DRAM，Dynamic Random Access Memory)。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器1004和大容量存储设备1007可以统称为存储器。

根据本申请的各种实施例，计算机设备1000还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1000可以通过连接在系统总线1005上的网络接口单元1011连接到网络1012，或者说，也可以使用网络接口单元1011来连接到其他类型的网络或远程计算机系统(未示出)。

上述存储器还包括一个或者一个以上的程序，一个或者一个以上程序存储于存储器中，被配置由CPU执行。

在一个可选的实施例中，提供了一种计算机设备，该计算机设备包括处理器和存储器，存储器中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上所述的信息推荐方法和/或模型训练方法。

在一个可选的实施例中，提供了一种计算机可读存储介质，该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上所述的信息推荐方法和/或模型训练方法。

可选地，该计算机可读存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、固态硬盘(SSD，Solid State Drives)或光盘等。其中，随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM，Resistance RandomAccess Memory)和动态随机存取存储器(DRAM，Dynamic Random Access Memory)。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

本申请还提供一种计算机可读存储介质，该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，该至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的信息推荐方法和/或模型训练方法。

本申请还提供了一种计算机程序产品，上述计算机程序产品包括计算机指令，上述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从上述计算机可读存储介质读取上述计算机指令，上述处理器执行上述计算机指令，使得上述计算机设备执行如上所述的信息推荐方法和/或模型训练方法。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种信息推荐方法，其特征在于，所述方法包括：

从参数表中获取用户标识对应的第一降维向量，以及从所述参数表中获取n个内容标识对应的n个第二降维向量；所述第一降维向量是预先对第一高维向量离线降维得到的预设维度上的第一降维向量，所述第一高维向量是从所述用户标识对应的历史浏览内容序列中提取得到的用户兴趣的表征向量；所述第二降维向量是预先对所述内容标识对应的候选内容的第二高维向量离线降维得到的所述预设维度上的第二降维向量；所述预设维度小于所述第一高维向量与所述第二高维向量的维度；

基于所述第一降维向量与所述n个第二降维向量，计算每个所述第二降维向量对应的候选内容的推荐分数，得到所述n个内容标识对应的n个候选内容的n个推荐分数；

基于所述n个推荐分数从所述n个候选内容中确定推荐信息，向所述用户标识对应的用户设备发送所述推荐信息，n为正整数。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一降维向量与所述n个第二降维向量，计算每个所述第二降维向量对应的候选内容的推荐分数，得到所述n个内容标识对应的n个候选内容的n个推荐分数，包括：

对于每个所述第二降维向量，将所述第二降维向量与所述第一降维向量合并，得到合并后的降维向量；

调用排序模型从m个评分方向上对所述合并后的降维向量进行评分计算，得到所述m个评分方向上的m个子推荐分数；所述评分方向是指对所述候选内容评分的参考点，所述排序模型用于内容评分；

基于所述m个子推荐分数确定所述第二降维向量对应的候选内容的推荐分数，所述m为大于1的正整数。

3.根据权利要求2所述的方法，其特征在于，所述排序模型包括m个门限网络、专家网络、m个评分网络和输出网络；所述m个子推荐分数包括第i个评分方向上的子推荐分数，i为小于或者等于m的正整数；

所述调用排序模型从m个评分方向上对所述合并后的降维向量进行评分计算，得到所述m个评分方向上的m个子推荐分数，包括：

将所述合并后的降维向量输入第i个门限网络，得到所述第i个评分方向对应的第i组权重；以及将所述合并后的降维向量输入所述专家网络，得到学习后的评分特征向量；

将所述第i组权重与所述评分特征向量相乘，得到所述第i个评分方向上的评分特征向量；

将所述第i个评分方向上的评分特征向量输入第i个评分网络，得到所述第i个评分方向上的子推荐分数；

采用上述四个步骤计算得到所述m个子推荐分数之后，所述基于所述m个子推荐分数确定所述第二降维向量对应的候选内容的推荐分数，包括：

通过所述输出网络基于所述m个子推荐分数确定所述第二降维向量对应的候选内容的推荐分数。

4.根据权利要求1至3任一所述的方法，其特征在于，所述从参数表中获取用户标识对应的第一降维向量之前，还包括：

获取第一时间段内所述用户标识对应的至少两个历史浏览内容，生成所述第一时间段内的历史浏览内容序列；

调用降维模型对所述第一时间段内的历史浏览内容序列进行离线特征提取，得到所述预设维度上的所述第一降维向量；其中，所述降维模型用于对特征向量进行降维提取；

将所述第一降维向量与所述用户标识对应加载至所述参数表。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

获取第三时间段内所述用户标识对应的至少两个历史浏览内容，生成所述第三时间段内的历史浏览内容序列；

调用所述降维模型对所述第三时间段内的历史浏览内容序列进行离线特征提取，得到所述预设维度上的第三降维向量；

根据所述第三降维向量对所述参数表中所述用户标识对应的所述第一降维向量进行更新；其中，所述第一时间段内的最大时刻先于所述第三时间段内的最大时刻。

6.根据权利要求1至3任一所述的方法，其特征在于，所述从所述参数表中获取n个内容标识对应的n个第二降维向量之前，还包括：

获取第二时间段内的所述n个候选内容；

调用降维模型对每个所述候选内容进行离线特征提取，得到所述预设维度上的所述第二降维向量；其中，所述降维模型用于对特征向量进行降维提取；

将所述第二降维向量与所述内容标识对应加载至所述参数表。

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

获取第四时间段内的k个新增候选内容；

调用所述降维模型对每个所述新增候选内容进行离线特征提取，得到所述预设维度上的第四降维向量；

将所述新增候选内容的第四降维向量与所述内容标识对应更新至所述参数表；其中，所述第二时间段内的最大时刻先于所述第四时间段内的最大时刻，k为正整数。

8.根据权利要求1至3任一所述的方法，其特征在于，所述基于所述n个推荐分数从所述n个候选内容中确定推荐信息，包括：

调用排序模型对所述n个推荐分数排序，将排序后的所述n个推荐分数中前g个推荐分数对应的候选内容确定为g个所述推荐信息，g为正整数。

9.一种模型训练方法，其特征在于，所述方法用于对降维模型和排序模型的联合训练，所述降维模型用于特征向量的离线降维，所述排序模型用于内容评分，所述方法包括：

获取训练样本，每组所述训练样本包括至少两个浏览内容样本对应的浏览内容序列和推荐内容样本，所述推荐内容样本标记有参考推荐分数；

调用所述降维模型对所述浏览内容序列进行降维处理，得到第一样本降维向量；以及调用所述降维模型对所述推荐内容样本进行降维处理，得到第二样本降维向量；

调用所述排序模型基于所述第一样本降维向量和所述第二样本降维向量进行评分计算，得到所述推荐内容样本的预测推荐分数；

基于所述预测推荐分数与所述参考推荐分数之间的误差，对所述降维模型和所述排序模型进行参数调整。

10.根据权利要求9所述的方法，其特征在于，所述调用所述排序模型基于所述第一样本降维向量和所述第二样本降维向量进行评分计算，得到所述推荐内容样本的预测推荐分数，包括：

将所述第一样本降维向量和所述第二样本降维向量合并，得到合并后的样本降维向量；

调用所述排序模型从m个评分方向上对所述合并后的样本降维向量进行评分计算，得到所述m个评分方向上的m个样本子推荐分数；所述评分方向是指对所述推荐内容样本评分的参考点；

基于所述m个样本子推荐分数确定所述推荐内容样本的预测推荐分数，所述m为大于1的正整数。

11.根据权利要求10所述的方法，其特征在于，所述排序模型包括m个门限网络、专家网络、m个评分网络和输出网络；所述m个样本子推荐分数包括第i个评分方向上的样本子推荐分数，i为小于或者等于m的正整数；

所述调用所述排序模型从m个评分方向上对所述合并后的样本降维向量进行评分计算，得到所述m个评分方向上的m个样本子推荐分数，包括：

将所述合并后的样本降维向量输入第i个门限网络，得到所述第i个评分方向对应的第i组样本权重；以及将所述合并后的样本降维向量输入所述专家网络，得到学习后的样本评分特征向量；

将所述第i组样本权重与所述样本评分特征向量相乘，得到所述第i个评分方向上的样本评分特征向量；

将所述第i个评分方向上的样本评分特征向量输入第i个评分网络，得到所述第i个评分方向上的样本子推荐分数；

采用上述四个步骤计算得到所述m个样本子推荐分数之后，所述基于所述m个样本子推荐分数确定所述推荐内容样本的预测推荐分数，包括：

通过所述输出网络基于所述m个样本子推荐分数确定所述推荐内容样本的预测推荐分数。

12.一种信息推荐装置，其特征在于，所述装置包括：

第一获取模块，用于从参数表中获取用户标识对应的第一降维向量，以及从所述参数表中获取n个内容标识对应的n个第二降维向量；所述第一降维向量是预先对第一高维向量离线降维得到的预设维度上的第一降维向量，所述第一高维向量是从所述用户标识对应的历史浏览内容序列中提取得到的用户兴趣的表征向量；所述第二降维向量是预先对所述内容标识对应的候选内容的第二高维向量离线降维得到的所述预设维度上的第二降维向量；所述预设维度小于所述第一高维向量与所述第二高维向量的维度；

第一计算模块，用于基于所述第一降维向量与所述n个第二降维向量，计算每个所述第二降维向量对应的候选内容的推荐分数，得到所述n个内容标识对应的n个候选内容的n个推荐分数；

信息推荐模块，用于基于所述n个推荐分数从所述n个候选内容中确定推荐信息，向所述用户标识对应的用户设备发送所述推荐信息，n为正整数。

13.一种模型训练装置，其特征在于，所述装置用于对降维模型和排序模型的联合训练，所述降维模型用于特征向量的离线降维，所述排序模型用于内容评分，所述装置包括：

第二获取模块，用于获取训练样本，每组所述训练样本包括至少两个浏览内容样本对应的浏览内容序列和推荐内容样本，所述推荐内容样本标记有参考推荐分数；

第二提取模块，用于调用所述降维模型对所述浏览内容序列进行降维处理，得到第一样本降维向量；以及调用所述降维模型对所述推荐内容样本进行降维处理，得到第二样本降维向量；

第二计算模块，用于调用所述排序模型基于所述第一样本降维向量和所述第二样本降维向量进行评分计算，得到所述推荐内容样本的预测推荐分数；

参数调整模块，用于基于所述预测推荐分数与所述参考推荐分数之间的误差，对所述降维模型和所述排序模型进行参数调整。

14.一种计算机设备，其特征在于，所述计算机设备包括：处理器和存储器，所述存储器存储有计算机程序，所述计算机程序由所述处理器加载并执行以实现如权利要求1至8任一所述的信息推荐方法，或者，如权利要求9至11任一所述的模型训练方法。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序由处理器加载并执行以实现如权利要求1至8任一所述的信息推荐方法，或者，如权利要求9至11任一所述的模型训练方法。