CN109582903B

CN109582903B - 一种信息展示的方法、装置、设备和存储介质

Info

Publication number: CN109582903B
Application number: CN201811447835.6A
Authority: CN
Inventors: 杨晚鹏; 谭怒涛
Original assignee: Guangzhou Baiguoyuan Information Technology Co Ltd
Current assignee: Guangzhou Baiguoyuan Information Technology Co Ltd
Priority date: 2018-11-29
Filing date: 2018-11-29
Publication date: 2023-10-20
Anticipated expiration: 2038-11-29
Also published as: CN109582903A

Abstract

本发明公开了一种信息展示的方法、装置、设备和存储介质，其中，该方法包括：获取推送信息；根据所述推送信息的标识获取对应的特征向量；将所述特征向量输入离线训练模型，得到所述推送信息在各展示位置上的点击通过率，所述离线训练模型中包括下发列表中各展示位置的权重向量；分别根据各所述推送信息在各展示位置上的点击通过率，确定在所述下发列表中各展示位置处的推送信息。本发明实施例提供的技术方案，实现下发列表中各展示位置处的推送信息确定，去除了不同的展示位置对确定推送信息的点击通过率带来的噪声干扰，为用户推送更加优质的内容。

Description

一种信息展示的方法、装置、设备和存储介质

技术领域

本发明实施例涉及互联网技术领域，尤其涉及一种信息展示的方法、装置、设备和存储介质。

背景技术

随着互联网技术的飞速发展，爆炸式增长的信息导致用户想要获取感兴趣的有效内容越来越困难，个性化推荐系统显然已经成为互联网领域不可或缺的基础技术，在新闻、短视频和音乐等产品中扮演着越来越重要的角色。

目前，信息推荐系统中在推送多条信息时首先需要确定各个推送信息的具体展示位置，传统的对于信息推送算法主要是通过离线根据用户行为数据得到样本标签，从线上服务器的特征日志中进行特征提取，二者联合后得到训练样本，来训练尽量拟合用户对推送后的信息的点击行为的逻辑回归(Logistic Regression，LR)模型。通过线上基于该LR模型预测用户对推送信息的点击率，选择推送给用户的若干条最优信息构成本次推送的下发列表。在理想情况下，某一推送信息是否被用户点击与展示位置无关；然而，如果把信息展示位置用one-hot编码方式加入到样本特征中，能够使LR模型在相同内容测试集上的测试分数指标(Area Under the Curve，AUC)从0.698提升到0.715，说明信息展示位置对点击结果有较大影响,从而给推送信息的点击通过率(Click Through Rate，CTR)预测带来干扰噪声。

发明内容

本发明实施例提供了一种信息展示的方法、装置、设备和存储介质，以解决现有技术中展示位置对预测推送信息的点击通过率带来的噪声干扰的问题，实现下发列表中各展示位置处的推送信息确定，去除了不同的展示位置对确定推送信息的点击通过率带来的噪声干扰。

第一方面，本发明实施例提供了一种信息展示的方法，该方法包括：

获取推送信息；

根据所述推送信息的标识获取对应的特征向量；

将所述特征向量输入离线训练模型，得到所述推送信息在各展示位置上的点击通过率，所述离线训练模型中包括下发列表中各展示位置的权重向量；

分别根据各所述推送信息在各展示位置上的点击通过率，确定在所述下发列表中各展示位置处的推送信息。

进一步的，所述离线训练模型通过执行下述操作预先确定：

获取历史推送信息，作为对应的训练样本；

根据所述训练样本的标识获取对应的样本特征向量；

根据所述样本特征向量、所述训练样本在历史下发列表中的历史展示位置和预设的列表展示数量构建所述训练样本的目的特征向量；

将所述训练样本的目的特征向量输入逻辑回归模型，更新对应展示位置的权重向量，并重新获取训练样本再次进行离线训练，直至各展示位置上权重向量的当前更新值低于预设阈值，则将当前的逻辑回归模型作为所述离线训练模型，所述离线训练模型中包括的各展示位置的权重向量为对应最新的权重向量。

进一步的，在获取推送信息时，还包括：

确定线上发布的所述离线训练模型。

进一步的，根据各所述推送信息在各展示位置上的点击通过率，确定在所述下发列表中各展示位置处的推送信息，包括：

针对各展示位置中的任一展示位置，根据在下发列表中该展示位置之前的其他展示位置处的推送信息确定该展示位置处的候选推送信息；

根据各所述候选推送信息在该展示位置上的点击通过率，确定在所述下发列表中该展示位置处的推送信息。

进一步的，所述获取推送信息，包括：

获取用户的推送请求；

根据所述推送请求获取对应的推送信息。

进一步的，在确定在所述下发列表中各展示位置处的推送信息之后，还包括：

根据各展示位置处的推送信息，构建所述下发列表，并将所述下发列表显示给用户。

第二方面，本发明实施例提供了一种信息展示的装置，该装置包括：

信息获取模块，用于获取推送信息；

特征获取模块，用于根据所述推送信息的标识获取对应的特征向量；

点击预测模块，用于将所述特征向量输入离线训练模型，得到所述推送信息在各展示位置上的点击通过率，所述离线训练模型中包括下发列表中各展示位置的权重向量；

展示确定模块，用于分别根据各所述推送信息在各展示位置上的点击通过率，确定在所述下发列表中各展示位置处的推送信息。

进一步的，所述离线训练模型通过执行下述操作预先确定：

获取历史推送信息，作为对应的训练样本；

根据所述训练样本的标识获取对应的样本特征向量；

进一步的，所述信息展示的装置，还包括：

模型确定模块，用于在获取推送信息时，确定线上发布的所述离线训练模型。

进一步的，所述展示确定模块，包括：

候选信息确定单元，用于针对各展示位置中的任一展示位置，根据在下发列表中该展示位置之前的其他展示位置处的推送信息确定该展示位置处的候选推送信息；

展示确定单元，用于根据各所述候选推送信息在该展示位置上的点击通过率，确定在所述下发列表中该展示位置处的推送信息。

进一步的，所述信息获取模块，包括：

请求获取单元，用于获取用户的推送请求；

信息获取单元，用于根据所述推送请求获取对应的推送信息。

进一步的，所述信息展示的方法，还包括：

列表显示模块，用于在确定在所述下发列表中各展示位置处的推送信息之后，根据各展示位置处的推送信息，构建所述下发列表，并将所述下发列表显示给用户。

第三方面，本发明实施例提供了一种设备，该设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明任意实施例中所述的信息展示的方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明任意实施例中所述的信息展示的方法。

本发明实施例提供了一种信息展示的方法、装置、设备和存储介质，通过各个推送信息的特征向量，以及离线训练模型中包括的下发列表中各展示位置的权重向量，直接确定各个推送信息在各展示位置处的点击通过率，从而实现下发列表中各展示位置处的推送信息确定，去除了不同的展示位置对确定推送信息的点击通过率带来的噪声干扰，为用户推送更加优质的内容。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明实施例提供的信息展示的方法所适用的一种应用场景的场景架构图；

图2为本发明实施例一提供的一种信息展示的方法的流程图；

图3A为本发明实施例二提供的方法中确定离线训练模型的原理框图；

图3B为本发明实施例二提供的方法中信息展示的实现流程示意图；

图4为本发明实施例三提供的一种信息展示的方法的流程图；

图5为本发明实施例四提供的一种信息展示的装置的结构示意图；

图6为本发明实施例五提供的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

本发明实施例主要通过采用逻辑回归模型对现有的不同展示位置对应训练的各个子模型进行融合，确定一个可以针对各个展示位置的统一离线训练模型，并在该离线训练模型中确定各个推送信息在各个不同的展示位置上的点击通过率，从而依次挑选出当前展示位置处最优的推送信息，去除不同展示位置对各信息推荐系统中的CTR预测所带来的噪声干扰问题。

图1为本发明实施例提供的信息展示的方法所适用的一种应用场景的场景架构图。参考图1，该场景中包括推送服务端110和客户端120。其中，客户端120上对应安装有推送服务端110对应的前端应用产品，各个用户可以通过在对应的客户端120中运行该前端应用产品进行登录，使得客户端120与推送服务端110建立通信连接；同时，推送服务端110可以保存有线上发布的离线训练模型以及为各个用户推送的历史推送信息，此时执行的线上操作主要有：根据该离线训练模型对本次获取的推送信息在下发列表中的展示位置进行排序；对应的离线操作主要有：从历史推送信息中获取训练样本以及对应的特征向量，输入到LR模型中进行离线训练，得到最终的离线训练模型。

具体的，该推送服务端110中可以提供下述服务：线上的召回服务、特征服务和排序服务以及离线的训练服务，不同的服务可以对应不同的服务端，也就是推送服务端110中可以包括召回服务端111、特征服务端112、排序服务端113和训练服务端114。可选的，排序服务端113在接收到用户作用在客户端120上的下发请求后，会向召回服务端111执行召回服务，召回服务端111根据该用户的历史行为数据或者下发请求中的请求信息，向排序服务端113反馈本次请求相关的推送信息；然后排序服务端113根据各个推送信息的标识向特征服务端112获取各推送信息对应的特征向量，并对各个特征向量进行预处理，输入到训练服务端114在线上发布的离线训练模型中，以对各个推送信息作CTR预测，挑选CTR预测值靠前的预设熟练下的推送信息构建下发列表，该预设数量为下发列表中允许一次性战士的信息数量；并将构建的下发列表下发给该用户所在的客户端120，从而为用户更精准地推送各个推送信息。

需要说明的是，本发明实施例适用于对新闻、资讯、音乐、短视频等进行信息推送或查询响应的反馈场景中，特别适用于用户规模大、下发次数多、且时效性强的应用产品对应的后台服务端中。本实施例中客户端120的数量可以有多个，对此不作限定；同时，为了提高信息推送的速率，降低后台运算量，本实施例中的推送服务端110可以是集群服务器，包括多个用于执行各类服务功能的服务器。本实施例中的推送服务端110可以执行下述任意实施例中的信息展示的方法，具体的执行过程在下述信息展示的方法中进行进一步说明，在此不作介绍。

实施例一

图2为本发明实施例一提供的一种信息展示的方法的流程图，本实施例可应用于任一种可以为用户提供针对相关推送信息的下发请求服务的信息推送系统中。本发明实施例的方案可以适用于如何去除不同展示位置对相关推送信息的CTR预测带来的噪声干扰问题。本实施例提供的一种信息展示的方法可以由本发明实施例提供的信息展示的装置来执行，该装置可以通过软件和/或硬件的方式来实现，并集成在执行本方法的设备中，该设备可以是承载有相应信息推送系统的任一种智能终端设备。

具体的，参考图2，该方法可以包括如下步骤：

S210，获取推送信息。

其中，推送信息是推送服务端接收到用户在客户端作用的下发请求时，通过执行召回服务在召回服务端上获取的与本次请求相关的一系列信息。

具体的，本实施例中对于推送信息在召回服务端上的召回，可以通过判断下发请求中是否包含具体的请求内容，而实现具体信息的召回，从而获取本次请求的推送信息。

可选的，在本实施例中获取推送信息，具体可以包括：获取用户的推送请求；根据推送请求获取对应的推送信息。

具体的，该推送请求为用户需要推送服务端在当前推送对应的相关信息时，通过在客户端执行对应的内容刷新操作或者对具体某一信息的搜索查找操作，而对应生成本次请求中的指令信息，也就是对应的下发请求。在推送请求中不包含具体的请求内容时，可以通过在召回服务端对该用户的历史行为数据进行分析，判断该用户较为感兴趣的新闻、资讯、音乐或短视频等内容，从而查找出对应的数据内容，作为本次请求对应的推送信息，该种召回方法一般针对的是用户在客户端安装的对应软件产品中执行内容刷新操作，不确定所需要的具体信息，此时根据历史行为数据分析对应的推送信息，从而为用户推送优质的信息；同时，在推送请求中包含具体的请求内容时，可以直接对该具体的请求内容进行分析，从而在召回服务器中查找与本次请求的具体内容相关联的新闻、资讯、音乐或短视频等内容，将查找到的关联信息作为本次请求对应的推送信息，该种召回方法一般针对的是用户在客户端安装的对应软件产品中执行相关内容信息的搜索查找操作，此时可以根据本次请求中的具体搜索内容确定对应的推送信息，从而为用户推送匹配的信息。

可选的，本实施例中在执行召回服务时，可以根据用户的历史行为数据通过现有的物品推荐itemCF算法、用户推荐userCF算法、内容推荐content-based算法或服务推荐vector-based算法等在召回服务端查找大量与本次请求对应的推送信息。

S220，根据推送信息的标识获取对应的特征向量。

其中，推送信息的标识可以是能够在存储的全部信息中唯一确定出该推送信息的特征记号；特征向量是可以通过特征服务器中存储的特征日志对推送信息的各类特征分析出的在不同维度上的特征数据，例如，如果从点赞、转发和评论三方面对某一条推送信息进行特征分析，则从这三方面分别对应分析出的点赞结果、转发结果和评论结果可以组成该推送信息的一个三维特征向量。

可选的，本实施例中在执行召回服务，从召回服务端获取到多个推送信息时，为了后续确定各个推送信息的显示排序，首先需要确定从召回服务端获取的各个推送信息的标识，并根据该标识从特征服务端中预先存储的全部特征日志中获取各个推送信息对应的特征向量，从而在后续根据各特征向量确定对应推送信息相对于该用户在本次下发请求中的优先级显示顺序。

S230，将特征向量输入离线训练模型，得到推送信息在各展示位置上的点击通过率。

其中，该离线训练模型中包括下发列表中各展示位置的权重向量。具体的，离线训练模型是由训练服务端在离线时预先将大量的历史推送信息的特征向量以及在历史下发列表中的历史展示位置等各类在历史下发列表中的用户行为点击数据输入到逻辑回归模型中，进行大量训练得到的尽量拟合用户在下发列表中的点击行为的一种模型，该离线训练模型中通过历史推送信息在逻辑回归模型中进行每次训练时，都需要确定LR模型在相同内容测试集上的测试分数指标AUC，如果该AUC值在多次训练后均处在一个固定值的上下进行小范围波动，则可以确定该离线训练模型已经训练成功，此时该离线训练模型中可以包括所确定的下发列表中各个展示位置的权重向量。可选的，各展示位置的权重向量可以表示每个展示位置对用户点击浏览下发列表中的各个推送信息的影响大小，也可以表示各展示位置在下发列表中的优先级情况。其中，由于在离线训练时是针对各个历史推送信息对应的特征向量，对用户在下发列表中的点击行为进行的训练，因此所训练出的各个展示位置的权重向量与该特征向量属于同一维度下的向量。该离线训练模型主要的目的在于确定下发列表中的各个展示位置对用户点击相应推送信息的行为造成的影响大小，从而消除各展示位置对后续为各推送信息作CTR预测时带来的噪声干扰。

此外，推送信息的点击通过率是指下发列表中对应推送信息的点击到达率,也就是该推送信息在下发列表中的实际点击次数除以该下发列表的信息展示总量，以此确定为用户展示的各个推送信息的优劣性。本实施例中将各推送信息的特征向量与下发列表中对应展示位置的权重向量的乘积作为各推送信息在下发列表中对应展示位置的点击通过率。

可选的，在根据获取的各个推送信息的标识获取到对应的特征向量后，为了在确定各推送信息在下发列表中的点击通过率，也就是对各推送信息作CTR预测，并消除各展示位置对CTR预测带来的噪声干扰，本实施例中可以通过排序服务端将各个推送信息的特征向量输入到该离线训练模型中，从而将每一个推送信息的特征向量分别与下发列表中各个展示位置处的权重向量相乘，并将分别得到的乘积作为对应推送信息在对应展示位置的点击通过率；也就是将第一个推送信息分别与各个展示位置处的权重向量相乘，将第二个推送信息分别与各个展示位置处的权重向量相乘，依次循环，最终得到每一个推送信息分别在下发列表中各个展示位置的点击通过率。

具体的，本实施例中在确定推送信息在各展示位置上的点击通过率时，由于下发列表中每一个展示位置均有对应的权重向量，因此全部的权重向量可以对应作为一个权重向量组，该权重向量组中包括下发列表的展示位置数量的权重向量，因此推送信息的特征向量与各展示位置的权重向量相乘时，可以将该推送信息的特征向量拷贝生成一个特征向量组，该特征向量组包括相同的展示位置数量的该特征向量，然后将特征向量组与权重向量组对应相乘，便可以一次性得到该推送信息在各个展示位置的点击通过率，加快了运算次数。

S240，分别根据各推送信息在各展示位置上的点击通过率，确定在下发列表中各展示位置处的推送信息。

具体的，在得到各个推送信息在下发列表中各个展示位置的点击通过率时，此时已经消除展示位置对于CTR预测所带来的影响，可以保证此时得到的点击通过率为比较准确的预测结果，因此在确定下发列表中各个展示位置处的推送信息时，可以直接根据每个推送信息在下发列表中当前展示位置的点击通过率，将点击通过率最高的推送信息确定为当前展示位置处的推送信息，从而依次得到下发列表中各个展示位置处的推送信息。

可选的，本实施例中针对下发列表中的任一展示位置处的推送信息的确定进行具体说明。此时，根据各推送信息在各展示位置上的点击通过率，确定在下发列表中各展示位置处的推送信息，具体可以包括：针对各展示位置中的任一展示位置，根据在下发列表中该展示位置之前的其他展示位置处的推送信息确定该展示位置处的候选推送信息；根据各候选推送信息在该展示位置上的点击通过率，确定在下发列表中该展示位置处的推送信息。

具体的，由于在获取的推送信息中，确定当前展示位置的推送信息时，下发列表中在当前展示位置之前的各展示位置已经确定对应的推送信息，此时除去已经确定展示位置的推送信息之外的其他推送信息为候选推送信息。本实施例中在确定各个展示位置处的推送信息时，主要是从下发列表中的第一个展示位置开始，对该展示位置上的各推送信息的点击通过率进行判断，将该展示位置上的点击通过率最高的推送信息作为该展示位置上的推送信息；然后将除第一展示位置的推送信息之外的其他推送信息，作为第二展示位置的候选推送信息，从而根据各个候选推送信息在第二展示位置上的点击通过率，确定第二个展示位置上的推送信息，依次循环，直到确定下发列表中最后一个展示位置的推送信息，从而确定下发列表中每个展示位置处的推送信息。

本实施例提供的技术方案，通过各个推送信息的特征向量，以及离线训练模型中包括的下发列表中各展示位置的权重向量，直接确定各个推送信息在各展示位置处的点击通过率，从而实现下发列表中各展示位置处的推送信息确定，去除了不同的展示位置对确定推送信息的点击通过率带来的噪声干扰，为用户推送更加优质的内容。

实施例二

图3A为本发明实施例二提供的方法中确定离线训练模型的原理框图。本实施例是在上述实施例的基础上进行优化，本实施例中主要对离线训练模型的具提训练过程进行详细的解释说明。

可选的，本实施例可以包括如下步骤：

S310，获取历史推送信息，作为对应的训练样本。

具体的，通过机器学习对离线训练模型进行大量训练时，首先需要获取大量的训练样本进行离线训练，以尽量模拟用户在下发列表中的点击行为。本实施例中将离线训练过程在训练服务端中进行，此时训练服务端中会对应设置有日志收集器，在排序服务端为各个用户确定对应的下发列表时，也会将下发列表和对应推送信息的特征日志发给训练服务端中的日志收集器进行存储；用户在客户端上对下发列表中的各项推送信息进行浏览时，客户端也会将用户对各推送信息进行浏览查看的行为打点数据发给训练服务端中的日志收集器中，以便在离线状态下训练服务端也可以在本地查找到对应的历史推送信息，在日志收集器中可以查找到用户对历史推送信息进行查阅的行为数据以及该历史推送信息的原始特征数据。此时训练服务端在进行模型的离线训练时，首先在日志收集器中得到对应的历史推送信息，将该历史推送信息作为训练样本进行离线训练。

S320，根据训练样本的标识获取对应的样本特征向量。

可选的，得到离线训练模型中的训练样本后，为了对各个训练样本的特征进行对应分析，此时首先需要确定各个训练样本的标识，以根据该标识通过特征抽取模块在日志收集器中存储的各个推送信息的原始特征数据中确定出各个训练样本的原始特征数据，从而将不同维度上的各类特征组成该训练样本的样本特征向量，以便后续对大量训练样本在对应维度上的各方面的特征数据进行分析，训练出更加优化的离线训练模型。

S330，根据样本特征向量、训练样本在历史下发列表中的历史展示位置和预设的列表展示数量构建训练样本的目的特征向量。

具体的，在确定训练样本的样本特征向量后，为了将现有的不同展示位置对应训练的各个子模型进行融合，针对下发列表中的各个展示位置可以训练一个统一的模型，本实施例中可以对各个展示位置的优先性信息进行对应的分析，此时根据下发列表中预设的列表展示数量对该训练样本的样本特征向量进行对应的维度扩展，以将各个展示位置对CTR预测的影响加入到训练样本的离线训练过程中，消除展示位置对CTR预测的干扰噪声。本实施例中根据预设的列表展示数量将样本特征向量的维度进行扩展，如原始维度为D，预设的列表展示数量为n，则扩展后的特征向量的维度为n*D，此时根据训练样本在历史下发列表中的历史展示位置将该训练样本在原始维度下的样本特征向量中的特征值依次对应到扩展后的目的特征向量的对应维度位置上，且目的特征向量中其他维度位置上的特征值均设为0，如某一训练样本在原始维度下的样本特征向量为X＝(a,b,c)，预设的列表展示数量为3，且该训练样本在历史下发列表中的历史展示位置为第二各展示位置，此时样本特征向量进行维度扩展后，得到的目的特征向量为Y＝(0,0,0,a,b,c,0,0,0)，其中，目的特征向量为Y中的前三位对应下发列表中的第一展示位置，中间三位对应下发列表中的第二展示位置，后三位对应下发列表中的第三展示位置，此时可以将下发列表中的展示位置对CTR预测的影响因素加入训练样本中，后续进行对应的训练训练。

S340，将训练样本的目的特征向量输入逻辑回归模型，更新对应展示位置的权重向量，并重新获取训练样本再次进行离线训练，直至各展示位置上权重向量的当前更新值低于预设阈值，则将当前的逻辑回归模型作为离线训练模型。

其中，离线训练模型中包括的各展示位置的权重向量为对应最新的权重向量。具体的，逻辑回归模型是一种归一化的处理模型，本实施例中可以得到下发列表中在同一个历史展示位置上的各个训练样本，对各训练样本的样本特征向量中分别处于同一向量位置上的各特征值进行归一化特征分析，从而确定该展示位置上的样本特征向量中每一个向量位置上的归一化特征值，对不同展示位置上的训练样本的样本特征向量进行大量的离线训练，得到各个展示位置上的样本特征向量中每一个向量位置上的归一化特征值；也就是根据各个训练样本的目的特征向量中的各个特征值，对扩展后的各个向量位置上的特征值进行归一化分析，得到目的特征向量中每一个向量位置上的归一化特征值，并根据该归一化特征值确定各个向量位置在目的特征向量中所占的比重，也就是各个向量位置的权重值；此时可以根据各个向量位置上的权重值以及原始维度，确定各个展示位置所对应的权重向量，也就是依次将原始维度下的一组权重值作为对应展示位置的权重向量。本实施例中初始的逻辑回归模型中的目的特征向量中各个向量位置上的特征值是由用户输入的，误差较大，后续不断根据大量训练样本的目的特征向量对其进行优化，同时根据各个向量位置上的特征值也不断对各个向量位置的权重值进行优化，也就是对各个展示位置的权重向量进行优化更新。

可选的，在得到维度扩展后各个训练样本的目的特征向量时，将该训练样本的目的特征向量输入到训练服务端上已经存在的逻辑回归模型中，由于逻辑回归模型中在本次训练样本之前，可能已经通过大量训练样本的目的特征向量对各个向量位置上的特征值进行归一化训练，因此本实施例中在离线训练时，由于训练样本的目的特征向量中只有在与该训练样本的历史展示位置对应的向量位置上才有具体的特征值，其他维度的特征值为0，因此可以根据该训练样本的目的特征向量中对应向量位置上的特征值，对逻辑回归模型中目的特征向量的对应向量位置上的特征值再次进行归一化训练，并根据本次训练后的各个向量位置上的归一化特征，更新的对应向量位置上的权重值，也就是更新对应展示位置的权重向量。此时可以判断本次训练后的权重向量相比于上次训练的当前更新值，若当前更新值低于预设阈值，说明权重向量此时已经达到一定的归一化程度，此时的LR模型在相同内容测试集上的测试分数指标AUC已经趋于在一个固定值的上下小范围波动，此时已经消除展示位置对CTR预测带来的噪声干扰，可以直接将当前离线训练后的逻辑回归模型作为CTE预测时所需要的离线训练模型，且此时该离线训练模型中包括的各展示位置的权重向量为对应更新为最新的权重向量。而若判断本次训练后的权重向量相比于上次训练的当前更新值还是高于预设阈值，说明本次离线训练还没有达到可以消除展示位置对CTR预测所带来的影响的要求，此时还需要继续获取信息的训练样本，再次根据上述过程进行离线训练，直到各展示位置上权重向量的当前更新值低于预设阈值。

具体的，若预设的列表展示数量为n，原始维度为D，此时对于历史下发列表中分别在第Pi展示位置和第Pj展示位置的两个训练样本的样本特征向量Xi和Xj，如图3B所示，对样本特征向量Xi和Xj分别进行对应的维度扩展后，得到的目的特征向量Yi和Yj中仅在对应展示位置Pi和Pj的向量位置上的具有对应的特征值，其他位置的特征值为0。此时分别将目的特征向量Yi和Yj输入到逻辑回归模型进行离线训练，更新对应展示位置的权重向量Wl和Wm。在生成离线训练模型后，该离线训练模型中包括有各个展示位置的权重向量，如图3B中离线训练模型中共有n个权重向量。后续对获取的推送信息进行CTR预测时，可以直接将该推送信息的特征向量Ti，分别与离线训练模型中各个展示位置的权重向量作乘积，得到该推送信息在下发列表各个展示位置的点击通过率，对于多个推送信息，分别将多个推送信息与各展示位置的权重向量作乘积，得到每一个推送信息在各个展示位置上的点击通过率。

本实施例提供的技术方案，通过将根据样本特征向量、训练样本在历史下发列表中的历史展示位置和预设的列表展示数量，对样本特征向量进行维度扩展，从而将展示位置对CTR预测带来的影响考虑到训练样本中，训练出针对各个展示位置的统一离线训练模型，将现有的不同展示位置对应训练的各个子模型进行融合，解决了现有技术中各个子模型离线训练的迭代周期过长的问题，去除了不同的展示位置对确定推送信息的点击通过率带来的噪声干扰，为用户推送更加优质的内容，提高了用户的使用体验。

实施例三

图4为本发明实施例三提供的一种信息展示的方法的流程图。本实施例是在上述实施例的基础上进行优化。具体的，如图4所示，本实施例可以包括如下步骤：

S410，获取用户的推送请求。

S420，根据推送请求获取对应的推送信息。

S430，确定线上发布的离线训练模型。

具体的，本实施例中在为客户端推送信息时，为了消除下发列表中的展示位置对CTR预测带来的噪声干扰，首先需要确定可以消除展示位置对推送信息的CTR预测的噪声干扰的离线训练模型，在训练服务端利用大量的历史推送信息作为训练样本，在线下进行离线训练后，能够得到可以消除展示位置对推送信息的CTR预测带来的噪声干扰的离线训练模型。在离线训练完成后，会将该离线训练模型在线上发布，以使推送服务端在为各个客户端推送信息时可以直接使用。因此推送服务端在根据推送请求获取对应的推送信息时，首先会确定训练服务端在线上发布的离线训练模型，通过该离线训练模型对获取的各个推送信息进行线上CTR预测，消除各个展示位置对CTR预测带来的噪声干扰。

需要说明的是，本实施例中S420和S430的执行顺序没有先后之分，S430与S420可以同时执行，也可以先后执行，本实施例中对其不作限定。

S440，根据推送信息的标识获取对应的特征向量。

S450，将特征向量输入离线训练模型，得到推送信息在各展示位置上的点击通过率，该离线训练模型中包括下发列表中各展示位置的权重向量。

S460，分别根据各推送信息在各展示位置上的点击通过率，确定在下发列表中各展示位置处的推送信息。

S470，根据各展示位置处的推送信息，构建下发列表，并将下发列表显示给用户。

具体的，在确定下发列表中各展示位置处的推送信息后，可以在获取的大量推送信息中，选取出已经确定在各展示位置处的推送信息，并根据选取出的推送信息与各个展示位置之间的对应关系，构建本次请求的下发列表，从而将该下发列表发送给客户端，进而展示给用户，为各用户挑选更优质的内容进行推送。

本实施例提供的技术方案，通过各个推送信息的特征向量，以及离线训练模型中包括的下发列表中各展示位置的权重向量，直接确定各个推送信息在各展示位置处的点击通过率，从而实现下发列表中各展示位置处的推送信息确定，去除了不同的展示位置对确定推送信息的点击通过率带来的噪声干扰，解决了现有技术中各个子模型离线训练的迭代周期和线上用户请求时间过长的问题，减少了用户的请求等待时长，为用户推送更加优质的内容，提高了用户的使用体验。

实施例四

图5为本发明实施例四提供的一种信息展示的装置的结构示意图，具体的，如图5所示，该装置可以包括：

信息获取模块510，用于获取推送信息；

特征获取模块520，用于根据推送信息的标识获取对应的特征向量；

点击预测模块530，用于将特征向量输入离线训练模型，得到推送信息在各展示位置上的点击通过率，该离线训练模型中包括下发列表中各展示位置的权重向量；

展示确定模块540，用于分别根据各推送信息在各展示位置上的点击通过率，确定在下发列表中各展示位置处的推送信息。

本实施例提供的技术方案，通过各个推送信息的特征向量，以及离线训练模型中包括的下发列表中各展示位置的权重向量，直接确定各个推送信息在各展示位置处的点击通过率，从而实现下发列表中各展示位置处的推送信息确定，去除不同的展示位置对确定推送信息的点击通过率带来的噪声干扰，为用户推送更加优质的内容。

进一步的，上述离线训练模型可以通过执行下述操作预先确定：

获取历史推送信息，作为对应的训练样本；

根据训练样本的标识获取对应的样本特征向量；

根据样本特征向量、训练样本在历史下发列表中的历史展示位置和预设的列表展示数量构建训练样本的目的特征向量；

将训练样本的目的特征向量输入逻辑回归模型，更新对应展示位置的权重向量，并重新获取训练样本再次进行离线训练，直至各展示位置上权重向量的当前更新值低于预设阈值，则将当前的逻辑回归模型作为离线训练模型，该离线训练模型中包括的各展示位置的权重向量为对应最新的权重向量。

进一步的，上述信息展示的装置，还可以包括：

模型确定模块，用于在获取推送信息时，确定线上发布的离线训练模型。

进一步的，上述展示确定模块，可以包括：

展示确定单元，用于根据各候选推送信息在该展示位置上的点击通过率，确定在下发列表中该展示位置处的推送信息。

进一步的，上述信息获取模块，可以包括：

请求获取单元，用于获取用户的推送请求；

信息获取单元，用于根据推送请求获取对应的推送信息。

进一步的，上述信息展示的方法，还可以包括：

列表显示模块，用于在确定在下发列表中各展示位置处的推送信息之后，根据各展示位置处的推送信息，构建下发列表，并将下发列表显示给用户。

本实施例提供的信息展示的装置可适用于上述任意实施例提供的信息展示的方法，具备相应的功能和有益效果。

实施例五

图6为本发明实施例五提供的一种设备的结构示意图，如图6所示，该设备包括处理器60、存储装置61和通信装置62；设备中处理器60的数量可以是一个或多个，图6中以一个处理器60为例；设备中的处理器60、存储装置61和通信装置62可以通过总线或其他方式连接，图6中以通过总线连接为例。

存储装置61作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中提供的信息展示的方法对应的程序指令/模块。处理器60通过运行存储在存储装置61中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述信息展示的方法。

存储装置61可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储装置61可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置61可进一步包括相对于处理器60远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

通信装置62可用于实现设备间的网络连接或者移动数据连接。

本实施例提供的一种设备可用于执行上述任意实施例提供的信息展示的方法，具备相应的功能和有益效果。

实施例六

本发明实施例六还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时可实现上述任意实施例中的信息展示的方法。该方法具体可以包括：

获取推送信息；

根据推送信息的标识获取对应的特征向量；

将特征向量输入离线训练模型，得到推送信息在各展示位置上的点击通过率，该离线训练模型中包括下发列表中各展示位置的权重向量；

分别根据各推送信息在各展示位置上的点击通过率，确定在下发列表中各展示位置处的推送信息。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的信息展示的方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述信息展示的装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域技术人员而言，本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种信息展示的方法，其特征在于，包括：

获取推送信息；

根据所述推送信息的标识获取对应的特征向量；

将所述特征向量输入离线训练模型，得到所述推送信息在各展示位置上的点击通过率，所述离线训练模型中包括下发列表中各展示位置的权重向量；所述推送信息在各展示位置的点击通过率为所述推送信息的特征向量与所述下发列表中对应展示位置的权重向量的乘积；

分别根据各所述推送信息在各展示位置上的点击通过率，确定在所述下发列表中各展示位置处的推送信息；

所述离线训练模型通过执行下述操作预先确定：

获取历史推送信息，作为对应的训练样本；

根据所述训练样本的标识获取对应的样本特征向量；

2.根据权利要求1所述的方法，其特征在于，在获取推送信息时，还包括：

确定线上发布的所述离线训练模型。

3.根据权利要求1所述的方法，其特征在于，根据各所述推送信息在各展示位置上的点击通过率，确定在所述下发列表中各展示位置处的推送信息，包括：

4.根据权利要求1所述的方法，其特征在于，所述获取推送信息，包括：

获取用户的推送请求；

根据所述推送请求获取对应的推送信息。

5.根据权利要求1所述的方法，其特征在于，在确定在所述下发列表中各展示位置处的推送信息之后，还包括：

6.一种信息展示的装置，其特征在于，包括：

信息获取模块，用于获取推送信息；

点击预测模块，用于将所述特征向量输入离线训练模型，得到所述推送信息在各展示位置上的点击通过率，所述离线训练模型中包括下发列表中各展示位置的权重向量；所述推送信息在各展示位置的点击通过率为所述推送信息的特征向量与所述下发列表中对应展示位置的权重向量的乘积；

展示确定模块，用于分别根据各所述推送信息在各展示位置上的点击通过率，确定在所述下发列表中各展示位置处的推送信息；所述离线训练模型通过执行下述操作预先确定：

获取历史推送信息，作为对应的训练样本；

根据所述训练样本的标识获取对应的样本特征向量；

7.一种信息展示的设备，其特征在于，所述信息展示的设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的信息展示的方法。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-5中任一所述的信息展示的方法。