CN110543598B

CN110543598B - 信息推荐方法、装置及终端

Info

Publication number: CN110543598B
Application number: CN201910843373.8A
Authority: CN
Inventors: 黄玉兰; 宋佳颖
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-09-06
Filing date: 2019-09-06
Publication date: 2022-03-25
Anticipated expiration: 2039-09-06
Also published as: CN110543598A

Abstract

本申请公开了一种信息推荐方法、装置及终端，属于人工智能领域。在该方法中，响应信息推荐请求，得到与之对应的信息池，并根据信息点击率对信息池进行划分，得到第一信息池和第二信息池；按照召回策略分别对第一信息池和第二信息池进行召回处理，并根据得到的信息簇生成信息推荐列表。这样，对信息池按照信息点击率进行了划分，可以使得召回的信息一部分能够反映用户点击过的信息，另一部分可以表征对时新信息的召回，从而实现了对时新信息的召回，使得最终生成的信息推荐结果完整和准确。

Description

信息推荐方法、装置及终端

技术领域

本申请涉及人工智能技术领域，尤其涉及一种信息推荐方法、装置及终端。

背景技术

随着信息技术的日益发展，信息推荐已经成为目前网络技术应用的一项重要内容。例如，在用户浏览新闻时推荐其可能感兴趣的内容，在用户浏览商品时推荐其倾向购买的商品等等。

通常在进行信息推荐时，需要从信息池中召回待推荐信息，生成信息推荐列表并反馈至用户。其中，在对信息池进行召回处理时，目前通常是根据用户点击率这一参数实现，导致现有的信息推荐方法得到的推荐信息往往都是用户点击过的历史信息，会造成在进行信息推荐时某些信息的丢失，使得信息推荐结果不完整和不准确。

发明内容

有鉴于此，本申请提供了一种信息推荐方法、装置及终端，以使得能够提升推荐信息的完整性和准确性。

为实现上述目的，一方面，本申请提供了一种信息推荐方法，包括：

响应信息推荐请求，得到与所述信息推荐请求对应的信息池；

对所述信息池按照信息点击率进行划分，得到第一信息池和第二信息池，所述第一信息池中信息的点击率大于阈值；所述第二信息池中信息的点击率不大于所述阈值；

按照召回策略分别对所述第一信息池和所述第二信息池中的信息进行召回处理，得到与所述第一信息池对应的第一信息簇，以及与所述第二信息池对应的第二信息簇；

利用所述第一信息簇和所述第二信息簇，生成信息推荐列表。

在一种可能的实现方式中，该方法还包括：

获取训练样本集，所述训练样本集是带有用户和信息对应关系的样本日志；

对所述训练样本集进行特征提取，获得至少包括信息点击率特征的第一样本特征；以及不包括信息点击率特征和信息序列号特征的第二样本特征；

通过包括第一样本特征的训练样本集对神经网络进行训练，得到第一召回模型，所述第一召回模型用于利用信息的点击率特征和信息的语义特征对信息进行召回；

通过包括第二样本特征的训练样本集对神经网络进行训练，得到第二召回模型，所述第二召回模型用于仅利用信息的语义特征对信息进行召回。

在又一种可能的实现方式中，所述按照召回策略分别对所述第一信息池和所述第二信息池中的信息进行召回处理，得到与所述第一信息池对应的第一信息簇，以及与所述第二信息池对应的第二信息簇，包括：

利用所述第一召回模型对所述第一信息池进行处理，得到第一信息向量，所述第一信息向量表征至少包括信息点击率特征的向量；

通过所述第一信息向量对所述第一信息池的信息进行聚簇处理，得到第一信息簇；

利用所述第二召回模型对所述第二信息池进行处理，得到第二信息向量，所述第二信息向量为信息语义特征的向量；

通过所述第二信息向量对所述第二信息池的信息进行聚簇处理，得到第二信息簇。

又一方面，本申请还提供了一种信息推荐装置，包括：

请求响应单元，用于响应信息推荐请求，得到与所述信息推荐请求对应的信息池；

信息池划分单元，用于对所述信息池按照信息点击率进行划分，得到第一信息池和第二信息池，所述第一信息池中信息的点击率大于阈值；所述第二信息池中信息的点击率不大于所述阈值；

信息召回单元，用于按照召回策略分别对所述第一信息池和所述第二信息池中的信息进行召回处理，得到与所述第一信息池对应的第一信息簇，以及与所述第二信息池对应的第二信息簇；

推荐列表生成单元，用于利用所述第一信息簇和所述第二信息簇，生成信息推荐列表。

又一方面，本申请还提供了一种终端，包括：

处理器和存储器；

其中，所述处理器用于执行所述存储器中存储的程序；

所述存储器用于存储程序，所述程序至少用于：

可见，在期望获取推荐信息时，响应信息推荐请求，得到与之对应的信息池，并根据信息点击率对信息池进行划分，得到第一信息池和第二信息池；按照召回策略分别对第一信息池和第二信息池进行召回处理，并根据得到的信息簇生成信息推荐列表。这样，对信息池按照信息点击率进行了划分，可以使得召回的信息一部分能够反映用户点击过的信息，另一部分可以表征对时新信息的召回，从而实现了对时新信息的召回，使得最终生成的信息推荐结果完整和准确。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1示出了本申请实施例的一种信息推荐系统一种组成架构示意图；

图2示出了本申请实施例的一种信息推荐方法的一种流程交互示意图；

图3示出了本申请实施例的一种信息池的划分示意图；

图4示出了本申请实施例的终端展示推荐信息列表的一示例图；

图5示出了本申请实施例的一种召回模型的生成方法的流程示意图；

图6示出了本申请实施例的召回模型生成过程的示例图；

图7示出了本申请实施例的一种信息推荐列表生成的方法的流程示意图；

图8示出了本申请实施例的一种文章推荐系统的处理流程示意图；

图9示出了本申请实施例提供的一种视频推荐场景的示例图；

图10示出了本申请实施例的一种信息推荐装置的组成示意图；

图11示出了本申请实施例的一种终端的组成结构示意图。

具体实施方式

本申请的方案可以在用户浏览某些互联网应用或者访问相关信息，服务器通过用户浏览的应用或者其他信息传输渠道，向当前用户推荐某些信息的过程中，可以较为及时、准确地为用户提供除用户点击过的历史信息外的时新信息的推荐，以保证推荐信息的准确性和完整性。

其中，在本申请实施例中，推荐的信息是指用于向用户推荐的各种能够被传输和处理的内容，可以为音讯、消息、通讯系统等传输和处理的对象，例如，推荐的信息可以是音频数据、视频数据、新闻资讯、商品信息等。召回，是指在信息推荐系统的待推荐的信息集中，根据某些特征而选定的一批待推荐的信息。

生成的信息推荐列表可以包括若干个针对当前信息推荐请求相匹配的信息。例如，信息推荐请求表征的是获取推荐的音频信息，则信息推荐列表中会包括若干条音频数据，并且这些音频数据会满足与信息推荐请求相匹配的用户特征，或者满足该信息推荐请求产生的时间特征，又或者满足发出该信息推荐请求的应用属性特征，等等。

为了便于理解本申请的信息推荐方法，下面对本申请的信息推荐方法所适用的系统进行介绍，参见图1，其示出了本申请一种信息推荐系统一种组成架构示意图。

如图1所示，本申请实施例提供的信息推荐系统包括：终端10和服务器20 用户通过在终端10中安装的信息应用的客户端，打开、登录或点击信息应用的客户端后可以浏览信息页面。当用户在终端进行信息页面浏览时，会产生信息推荐请求，终端将该信息推荐请求发送至服务器20中。实现本申请实施例提供的信息推荐方法的信息推荐装置可以作为应用的服务端程序安装于服务器20。当服务器20执行信息推荐方法时会应用召回策略，对与信息推荐请求对应的信息池中的信息进行召回，需要说明的是在进行信息召回时首先需要根据信息的点击率对信息池进行划分，然后对划分后的信息池分别进行信息召回。

在本申请实施例中，信息推荐请求可以是用户通过终端10浏览信息应用的客户端时产生的，也可以是信息应用定时产生的，如，每天下午15:00为用户推荐相关信息的信息推荐请求。其中，终端10可以为手机、平板电脑等移动终端，也可以为连接有信息显示或信息输出功能模块的个人计算机等固定终端。

相应的，服务器20会识别终端10发送的信息推荐请求，并通过信息召回处理匹配与该信息推荐请求对应的信息，生成信息推荐列表，将该信息推荐列表返回给终端10，以使得终端10可以输出该信息推荐列表，从而达到向终端的用户推荐信息的目的。

终端10与服务器20，以及服务器20和数据库30之间均是通过网络进行数据传输和信息交互的。

下面对图1示出的信息推荐系统对应的信息推荐方法进行说明。请参见图 2，其示出了一种信息推荐方法一个实施例的流程交互示意图，本实施例的方法可以包括：

S201、终端发送信息推荐请求至服务器。

当用户对终端中的信息应用客户端进行信息浏览时会生成信息推荐请求，或者当用户对终端中的信息应用进行使用时，在某个固定时间段会生成信息推荐请求，又或者当终端的某个应用设置有接收推荐信息的应用功能时，即使用户没有使用或者浏览该应用，也会在固定时间段生成信息推荐请求。

在信息应用生成信息推荐请求后，终端会将该信息推荐请求发送至服务器，以使得服务器能够接收到该信息推荐请求。

S202、服务器获得与信息推荐请求对应的信息池；

S203、服务器对信息池按照信息点击率进行划分，得到第一信息池和第二信息池。

信息池包括若干个信息，并且对每个信息池内的信息均会按照点击率进行划分，得到第一信息池和第二信息池，其中，第一信息池中信息的点击率大于阈值，第二信息池中信息的点击率不大于所述阈值。阈值是指根据信息推荐需求和精细粒度确定的，例如，将阈值设置为1，则对应的第一信息池中的信息都满足历史点击数大于1的条件对应的信息，而第二信息池中的信息都满足历史点击数不大于1的条件对应的信息。需要说明的是，该历史点击数量是指在当前时刻之前的一段时间内的点击数量，如可以，是当前时刻的上一个小时，也可以是特定的某个时间段。即对点击数量进行判断时是通过统计周期内的点击数量来判断的。

信息池可以根据不同的信息属性标签进行划分，例如，包括音频信息池、视频信息池、新闻资讯信息池、商品信息池等。并且，为了保证推荐的信息能够满足用户的需求和具有时新醒，信息池中的信息可以是按照更新周期进行更新的。例如，每隔一天对信息池中的信息进行更新。

服务器在接收到信息推荐请求时，需要对信息推荐请求进行解析，以获得待推荐信息的信息属性标签以及用户属性标签。可以通过对生成信息推荐请求的信息应用的相关标识信息进行解析，也可以对发送信息推荐请求的终端信息进行解析，也可以对信息推荐请求携带的信息进行解析，通常信息推荐请求会携带请求发送终端的信息、请求具体内容信息，请求信息类型信息等。对信息推荐请求进行解析时，首先要获得待推荐信息的相关类型等属性标签，即需要推荐的信息类型是什么。如，需要推荐的信息是新闻资讯，或者是视频信息。

举例说明，当用户访问某个视频客户端时，会生成一个信息推荐请求，由于该视频客户端中会存在“热点视频”这一列表，当用户需要对某个视频进行播放时，也会对应播放广告。因此，当用户访问该视频客户端时，生成的信息推荐请求会包括请求视频信息和请求广告信息的关键信息。这样，服务器根据该视频请求确定的信息池会包括视频信息池和广告信息池。

目前已知的信息推荐方式中，实质均是依赖于对用户自身的历史浏览信息的行为分析确定。即通常是通过分析用户已经点击的信息，然后确定待推荐的目标信息。这样会造成目标信息是用户点击过的历史信息，其中，用户泛指所有对信息进行阅读、浏览和点击的用户对象，即统计的点击率不一定来源于发出信息推荐请求的目标用户。该点击是指用户对某些信息的选定，例如，用户点击某条新闻资讯，其可以浏览到该新闻资讯的具体内容；又例如，用户在电商平台上浏览商品信息时对某个商品的点击，其可以对该商品的商品详情信息进行浏览。需要说明的是，在本申请实施例中的点击属性是表征用户对某些信息是否进行浏览或选定的描述方式，在特殊的应用场景中，点击属性并不一定是通过用户对某些信息的点击这个动作产生的。如，在眼动控制场景中，信息的点击属性可以通过用户对信息的注视时长来体现，即当用户注视某个信息一定时长后，就会展示该信息，则对应的用户这个注视的动作也能作为体现信息的点击属性的执行动作。此时，阈值可以表征用户的注视时长。

参见图3，其示出了本申请实施例中一种信息池的划分示意图。在图3中，信息池包括视频信息池301，音频信息池302和新闻资讯信息池303。并按照用户对新闻资讯的点击数量对新闻资讯信息池303中的新闻资讯进行划分，例如，将历史点击数量大于2的新闻资讯划分到第一信息池3031中，将历史点击数量不大于2的新闻资讯划分至第二信息池3032中。需要说明的是，第一信息池中的点击事件并不一定来源于产生信息推荐请求对应的终端用户，也可以是统计的其他用户的点击次数，即只要当前新闻资讯被点击过2次以上，无论是哪个用户进行的点击，均可以被划分至第一信息池中。

S204、服务器按照召回策略分别对第一信息池和第二信息池中的信息进行召回处理，得到与第一信息池对应的第一信息簇，以及与第二信息池对应的第二信息簇；

该召回策略是分别针对第一信息池和第二信息池的，即分别针对具有点击率的信息的召回，和没有点击率的信息或者点击率较低的信息的召回。

随着人工智能技术快速发展，从传统的机器学到目前的深度学习，人工智能技术被广泛应用于多个领域。可以理解的是，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟延伸和扩展的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

在本申请实施例提供的信息推荐方法中，也应用了人工智能技术，即可以通过深度学习的方法来确定召回策略，具体的，通过深度学习的方式来对大量的样本信息进行学习，来获得样本信息之间的相似性和关联性，从而可以实现计算机模拟或实现人类的学习行为，这样可以通过深度学习的方式来学习获得信息召回的行为，从而可以确定信息召回策略，来获得召回信息。

该召回策略可以对第一信息池中的信息主要按照点击率进行聚簇分析，得到点击率较高的信息簇，当然在对信息按照点击率进行聚簇分析的过程中，也会考虑信息之间的语义相似度，使得召回的信息不仅具有较高的点击率还具有语义管理；该召回策略可以对第二信息池中的信息进行语义分析，需要说明的是，在对第二信息池中的信息进行语义分析时，是只通过信息的语义特征进行分析，不考虑其点击属性，这样相当于忽略了信息是否被点击这个特征，使得聚簇分析的结果也适用于对时新信息的召回。语义聚簇分析可以为对信息进行类型聚簇分析，或者主题聚簇、标签聚簇等，得到语义关联较相似的信息簇。

因此，召回策略分别针对不同的信息池进行处理，使得召回得到的信息簇，至少包括两方面的信息，一方面是对具有点击率的信息进行召回，可以保证信息的点击率；另一方面是对没有点击或者不满足点击统计数量的信息进行召回，而这类信息由于没有产生点击数据，或者点击较少，通常能够反映时新信息的特征，即反映实时更新的信息，因此可以实现对时新信息的召回，能够保证召回信息中时新信息的占比，从而保证时新文章的分发量。

针对本申请实施例中的召回策略，将在本申请下面的实施例中进行具体的说明。

S205、服务器利用第一信息簇和第二信息簇，生成信息推荐列表。

第一信息簇和第二信息簇中的信息表征的是信息推荐系统中产生的召回信息。然后需要对召回信息根据设定的条件确定优先级，其中，优先级高(即排序在前的)信息将被优先推荐给终端。

在本申请实施例中设定的条件是根据信息推荐请求中携带的信息确定的。如，信息推荐请求中携带有目标用户的信息，则会根据目标用户的信息来确定召回信息的优先级，即确定第一信息簇和第二信息簇中信息的优先级。信息推荐请求中携带有用户访问应用的信息，也可以根据用户访问的应用的相关信息来确定召回信息的优先级，如，用户访问的是某个视频客户端，在获得召回视频时，可以根据是否是该视频客户端的自制视频来确定召回视频的视频排序，这样，可以将该视频客户端的自制视频排在推荐较靠前的位置，使得用户能够优先浏览或者访问该视频，便于稳定该视频客户端的用户群体。

需要说明的是，在本申请实施例中可以根据确定的信息优先级条件，分别在第一信息簇和第二信息簇中筛选出目标信息，然后组成信息推荐列表。可以根据实际的推荐请求和信息展示布局，选出对应数量的信息，即第从第一消息队列中筛选出的信息和从第二消息队列中筛选出的信息的数量可以不等。

S206、服务器将信息推荐列表发送给终端。

S207、终端输出该信息推荐列表。

其中，终端输出该信息推荐列表的方式可以有多种可能，主要根据信息的特征属性、推荐信息的展示方式、终端信息显示的布局、信息推送的时间等因素决定。参见图4，其示出了终端展示推荐信息列表的一示例图。如图4 (a)，该终端中运行的应用是新闻信息应用时，并且在新闻应用的显示页面中包括一个“热点新闻”的标签，则当用户选定该“热点新闻”的标签的时候，会显示与信息推荐列表中对应的新闻资讯，在图4(a)中包括了五个可以显示的新闻资讯位置栏，因此，对应的信息推荐列表中包括五条新闻资讯，可以将第一信息队列中确定的目标推荐新闻对应显示在前三个新闻资讯位置栏中，同时将第二信息队列中确定的目标推荐系新闻对应显示在后两个新闻资讯位置栏中。

如图4(b)，当用户进入新闻客户端时，会在新闻客户端中弹出一个界面，该界面用于输出推荐信息，通常由于显示版面的局限，该推荐信息会以信息链接的形式出现，如，将“周边的人都在看的新闻”作为展示信息，当用户选定该展示信息，会显示对应的信息推荐列表中的详细信息。

通过本申请实施例提供的信息推荐方法，可以对与信息推荐请求对应的信息池按照信息点击率进行划分，得到第一信息池和第二信息池，然后按照召回策略分别对第一信息池和第二信息池进行召回处理，再根据召回得到的信息簇生成信息推荐列表。由于对信息池按照点击率进行划分再召回，从而获得的信息推荐列表中的信息即包括有点击率的历史信息，也可以包括时新信息，一方面保证了信息推荐的准确性和完整性，另一方面也可以保证推荐信息的点击率和分发率。

在本申请实施例中是根据召回策略对信息池中的信息进行召回的，为了进一步实现信息召回的准确性和便捷性，可以通过召回模型进行信息的召回。

参见图5，其示出了本申请实施例提供的一种召回模型的生成方法的流程示意图，该方法包括：

S501、获取训练样本集；

S502、对所述训练样本集进行特征提取，获得至少包括信息点击率特征的第一样本特征；以及不包括信息点击率特征和信息序列号特征的第二样本特征；

S503、通过包括第一样本特征的训练样本集对神经网络进行训练，得到第一召回模型；

S504、通过包括第二样本特征的训练样本集对神经网络进行训练，得到第二召回模型。

训练样本集是带有用户和信息对应关系的样本日志，即每一条样本日志均包括用户特征和信息特征。其中，用户特征指根据用户的日志记录分析出的特征或属性，每个类型的用户特征不同。用户特征可以包括用户的基本属性信息，如，年龄、性别、职业等；用户的画像信息，如，兴趣、用户的类目等；用户的行为特征信息，如，用户对信息的访问时间、短期或者长期访问的信息种类等。信息特征指根据信息的日志记录分析出的特征或属性，如，信息的类别、信息的属性等。训练样本即包括用户特征和信息特征的文本，例如，信息推荐系统向用户推荐信息的推荐日志记录，也被称为样本日志。其中，每一条样本日志都带有用户和信息的对应关系，即每一条样本日志中都是用户特征与信息特征匹配存储的，例如，在新闻资讯系统中，每一条样本日志都表征用户与对应的新闻资讯之间的关系，具体的如用户甲是否对当前新闻资讯进行了点击，以及当前新闻资讯的特征列表和用户特征信息等。

在本申请实施例中获得了训练样本后，并不是直接根据训练样本中的所有特征对神经网络进行训练，需要对训练样本进行进一步的特征提取，以保证每个模型能够对特征信息进行准确的学习，从而使得生成的召回模型在后续的信息召回过程中更加准确。

由于第一召回模型用于利用信息的点击率特征和信息语义特征对信息进行召回，因此需要保证训练第一召回模型的训练样本中的每一条样本数据都包括点击率特征。而第二召回模型用于仅利用信息的语义特征对信息进行召回，实现的是对时新信息的召回，因此，为了能够实现对时新信息的召回，需要训练样本的样本特征近似时新信息的特征，即此时样本特征不包括点击率特征和信息序列号特征，其中，之所以不包括信息序列号特征是由于通常被点击过的信息才会有信息序列号，而未被点击的信息通常在没有被利用的情况下是不具备信息序列号的，这样可以使得后续该第二召回模型进行信息召回时能够更准确召回得到相应的时新新闻。

在获得了包括各自样本特征的训练样本集后，需要对神经网络进行训练。其中，神经网络(Neural Networks，NN)是人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的链接方式组成不同的网络。其是由大量、简单的处理单元(称为神经元) 广泛地互相连接而形成的复杂网络系统，它反映了人脑功能的许多基本特征，是一个高度复杂的非线性动力学习系统。

在对神经网络训练时，需要将训练样本集中的数据输入到神经网络训练模块中，更新网络参数生成新的模型即召回模型。对每一个训练样本，都沿着神经网络传递得到一个数字，然后将这个数字与想要得到的实际数字做差再求平方，这样计算出来的就是说预测值与真实值之间的距离，而训练神经网络就是期望这个距离或损失函数减小。

例如，

上式中的y代表想要从神经网络得到的数字，

指的一个样本通过神经网络得到的实际结果，i可以是训练样本的索引。假设以鉴别图片的属性为例，图片的属性为第一属性和第二属性，有一个样本数据集，由第一属性的图片和具有第二属性的图片组成，如果图片是第一属性对应的标签是1，如果图片是第二属性，对应的标签是0。这个标签可以是上式中对应的y，在向神经网络传递一张图片的时候想通过神经网络得到结果。为了计算损失函数，必须遍历数据集中的每一张图片，为每一个样本计算y，然后按照上面的定义计算损失函数。如果损失函数比较大，说明神经网络性能并不是很好，为了想要损失函数尽可能的小，需要更新神经网络参数，例如，通过调节权值是改变损失函数，得到一个较好的神经网络参数，生成新的模型。具体的，训练神经网络模型的过程，除了调整损失函数还可以通过逆误差传播算法来进行训练，对此，本申请实施例不做限制。

在本申请实施例中通过人工智能技术中的神经网络训练得到召回模型，可以利用召回模型对信息池中的大量信息进行语义分析，来获得具有相似性的信息簇来作为召回信息，实现了信息召回的智能化、自动化，提升了信息召回的效率和准确性。

参见图6，其示出了本申请实施例中提供的召回模型生成过程的示例图。在本申请实施例中需要生成两个召回模型，即第一召回模型和第二召回模型。这两个召回模型的训练样本集可以相同，但是神经网络进行学习的特征不同，这是由于第一召回模型用于对有点击特征的信息进行召回，而第二召回模型用于对没有点击特征的信息进行召回。即，在生成第一召回模型时，训练样本的信息特征标签至少包括：信息点击属性标签；在生成第二召回模型时，训练样本的信息特征标签不包括信息点击属性标签和信息编号标签。如图6所示，样本日志格式为(信息是否被点击，用户特征列表，信息特征列表)。若在进行第一召回模型训练时，训练样本集包含的样本日志601采用的是全特征训练，即包括信息是否被点击这个特征、用户全部的特征和信息的全部特征，然后通过第一模型训练模块602进行模型训练，得到第一召回模型603。对应的，在进行第二召回模型训练时，还需要对样本日志601通过特征过滤模块604进行特征过滤，即对样本日志中的信息特征标签进行处理，只保留信息侧语义相关特征，如信息标题，标签等特征，需要删除信息编号(ID)、信息展示点击信息等。这是由于样本日志包括展示过的信息，在实际中，由于很对信息没有被展示过，其就没有参与训练过程。在本申请实施例中对召回模型进行训练时，删除信息编号以及点击属性特征，对没有参与训练的信息相对公平，只靠信息的语义特征也可以把这些相关信息排到前面从而通过召回模型进行召回。在对特征进行过滤后，通过然后通过第二模型训练模块605 进行模型训练，得到第二召回模型606。

通过生成第一召回模型可以对有点击的信息进行召回，通过第二召回模型可以对没有点击的时新信息进行召回，这样保证了召回信息的完整性。

在获得了召回信息即第一信息簇和第二信息簇后，还需要获得推荐信息。召回信息是在信息推荐系统的待推荐的信息中，根据特征而选定的一批待推荐的信息，然后目标推荐信是对召回信息根据设定的条件确定优先级，再根据优先级高的信息作为目标推荐信息。

通过召回信息生成信息推荐列表的一种简单的方式可以为根据召回信息，如第一信息队列中的信息进行聚类分析，在每一类信息中随机选取一条或多条信息作为推荐信息。或者可以根据聚类后的信息预先设置的权重，选取其中的一类信息作为推荐信息。

但是为了能够使得推荐信息能够更加匹配当前的信息推荐请求，在本申请实施例中还提供了一种信息推荐列表生成的方法，参见图7，其示出了本申请实施例提供的一种信息推荐列表生成的方法的流程示意图，该方法包括：

S701、对信息推荐请求进行解析，得到目标用户；

S702、利用第一召回模型对目标用户进行用户特征组合，得到第一用户特征向量；

S703、利用第二召回模型对目标用户进行用户特征组合，得到第二用户特征向量；

S704、利用第一用户特征向量对第一信息簇进行搜索，得到第一待推荐信息；

S705、利用第二用户特征向量对第二信息簇进行搜索，得到第二待推荐信息；

S706、将所述第一待推荐信息和所述第二待推荐信息进行组合，得到信息推荐列表。

为了使得生成的信息推荐列表中的信息能够更加匹配信息推荐请求，需要对信息推荐请求进行解析，以获得该信息推荐请求中的目标用户，然后生成目标用户的用户特征向量。使用用户特征向量在第一信息簇和第二信息簇中进行搜索来获得召回信息，再对召回信息进行排序，得到信息推荐列表。其中，第一用户特征向量包括用户对信息的点击率特征向量；第二用户特征向量包括用户兴趣类别特征向量。

其中，目标用户是指需要将推荐信息推荐给的用户。用户特征是指根据用户的用户表示获取到的特征或属性，如从用户的日志分析出的特征或属性。

在本申请实施例中预先创建的第一召回模型和第二召回模型，在进行神经网络训练时，不仅对信息特征进行了学习，也对用户的相关特征进行了学习。因此，可以通过第一召回模型和第二召回模型对用户的特征信息进行处理，得到目标用户相应的特征向量。具体的，获取信息推荐请求的目标用户。通过召回模型对目标用户进行特征组合，即能够对目标用户端的特征进行相似性或者聚类分析，实现得到的第一用户特征向量更加能够反映用户对信息的点击率特征，这样在根据第一用户特征向量搜索得到的第一待推荐信息，往往是该目标用户点击率最高的类似新闻，而第二用户特征向量更加能够反映用户兴趣类别特征向量，即根据用户第二特征向量得到的第二推荐信息更能反映用户感兴趣的信息。之所以，通过两个召回模型分别获得用户的特征向量，是因为在不同的召回模型训练时，使用的样本日志的特征不同，从而可以根据不同的召回模型得到对应属性下更准确的用户特征向量，在后续的召回信息筛选时，筛选到的推荐信息也更加准确。

具体的，在利用第一用户特征向量对第一信息簇进行搜索，得到第一待推荐信息包括：利用所述第一用户特征向量对所述第一信息簇进行搜索，得到属性相匹配的第一目标簇；在所述第一目标簇中按照属性相关度进行排序，并根据排序结果得到第一待推荐信息。利用所述第一用户特征向量对所述第一信息簇进行搜索，得到第一待推荐信息，包括：利用所述第二用户特征向量对所述第二信息簇进行搜索，得到属性相匹配的第二目标簇；在所述第二目标簇中按照属性相关度进行排序，并根据排序结果得到第二待推荐信息。

举例说明，使用用户特征向量，搜索有点击文章簇中最相近的K个簇，从这些簇中挑选出最相似的排序靠前的T个文章，生成有点击的文章召回队列。

在获得召回信息时，也是利用召回模型得到信息向量，从而获得召回信息即信息簇。具体的，在本申请实施例中，利用所述第一召回模型对所述第一信息池进行处理，得到第一信息向量，所述第一信息向量表征信息点击率特征的向量；通过所述第一信息向量对所述第一信息池的信息进行聚簇处理，得到第一信息簇；利用所述第二召回模型对所述第二信息池进行处理，得到第二信息向量，所述第二信息向量表征信息语义特征的向量；通过所述第二信息向量对所述第二信息池的信息进行聚簇处理，得到第二信息簇。实现了对有点击信息和时新信息的召回。

参见图8，其示出了一种文章推荐系统的处理流程示意图。在该实施例中，信息推荐请求为文章推荐请求，在获得了该文章推荐请求后，需要对文章池 801进行划分，得到点击文章池802和时新文章池803，其中，将历史点击数大于1的文章划入有点击文章池802中，剩余文章即历史点击数不大于1的文章，也被称为时新度高的文章放入时新文章池803中。然后需要获得召回文章，即得到文章簇。从数据库获取对应的点击召回模型804和时新召回模型805，对有点击文章池802，利用点击召回模型804生成文章向量，然后可以利用kmeans 算法聚类，生成有点击文章簇806。对时新文章池803，利用时新召回模型805 生成文章向量，利用kmeans算法聚类，生成时新文章簇807。

然后，分别利用点击召回模型804和时新召回模型805对文章推荐请求中的目标用户进行处理，生成用户向量。使用用户向量搜索有点击文章簇中最相似的K个簇，从这些簇中挑选出最相似的排名靠前的若干个文章，生成有点击的召回队列。对应的，使用用户向量，搜索时新文章簇中最相近的K个簇，从这些簇中挑选出最相似的排名靠前的若干个文章，生成时新文章的召回队列。从而根据有点击的召回队列和时新文章的召回队列得到目标推荐信息。该实施例中使用两种文章池进行神经网络召回，有点击文章召回队列有效提升点击率，时新文章召回队列保证文章分发，提升时新文章的占比。

需要说明的是，在本申请实施例中，为了保证召回模型的实时性，即需要对召回模型中相关参数进行更新，使得召回模型更能适用于当前的信息召回需求。例如，用户在不同的时期其对信息的需求不同，因此用户在不同时期感兴趣的信息的类别不同，只有对召回模型进行不断更新，其召回得到的信息才能更加准确。因此，训练样本集中的样本日志也是实时更新的，例如，每小时获取用户上个小时的样本日志。在进行信息推荐处理时，对召回模型进行加载时，也可以每个小时加载新的召回模型，即召回模型也是每个小时实时更新的。

参见图9，其示出了本申请实施例中提供的一种视频推荐场景的示例图。在图9(a)中展示了目标用户的视频应用界面，在该界面中包括精选视频标签901，当用户点击该精选视频标签时，会给用户展示目标推荐视频。在该实施例中目标推荐视频包括根据当前用户的好友点击视频生成的第一目标推荐视频列表和时新视频对应的推荐列表。

因此，当用户访问该视频应用时会随之产生视频推荐请求，然后对视频推荐请求进行解析，即可以获得当前用户的登录账号信息，然后依据该登录账号信息获得用户的好友信息。再通过调用的召回模型，生成好友信息对应的用户向量。对视频池中视频进行划分，得到有点击的视频池和时新视频池，然后再利用召回模型分别对两个视频池中的视频信息进行处理，得到推荐视频。参见图9(b)所示，即当用户点击视频推荐标签901后，会展示出对应的视频推荐队列，包括“好友都在看”的视频列表902，在该实施例中对应的包括三条推荐视频，还包括“最新视频”的视频列表903，在该实施例中对应包括两条推荐视频。因此，通过本申请实施例提供的视频推荐方法，可以同时得到最新视频和能够保证用户进行点击的点击视频列表，实现了推荐信息的完整性和准确性。

需要说明的是，为了满足对信息推荐请求的实时处理需求，在本申请的另一实施例中还需要对第一召回模型和第二召回模型的参数进行更新，实现对召回模型的定期更新。之所以要对模型进行更新，是因为信息具有实时性，并且由于信息的更换速度较快，用户对某些信息的点击或者阅读习惯也会发生改变。为了实现对模型的更新，本申请的实施例中还包括：根据设定周期对所述训练样本集进行更新，得到更新后的训练样本集；通过更新后的训练样本集和所述信息推荐列表，对所述第一召回模型和所述第二召回模型的模型参数进行更新，得到更新后的第一召回模型和第二召回模型，使得更新后的第一召回模型和第二召回模型实时满足对信息推荐请求的处理。

即当服务器生成信息推荐列表后也可以存储在数据库中，使得在对召回模型进行更新时，可以利用数据库中的信息推荐列表中的信息进行机器学习，从而获得待更新的参数，对召回模型进行更新。这样根据实时生成的推荐信息列表进行模型更新，使得模型会更加准确。

又一方面，本申请还提供了一种基于人工智能的信息推荐装置，如参见图10，其示出了本申请一种信息推荐装置一个实施例的组成示意图，本实施例的装置可以应用于终端或者服务器，该装置可以包括：

请求响应单元1001，用于响应信息推荐请求，得到与所述信息推荐请求对应的信息池；

信息池划分单元1002，用于对所述信息池按照信息点击率进行划分，得到第一信息池和第二信息池，所述第一信息池中信息的点击率大于阈值；所述第二信息池中信息的点击率不大于所述阈值；

信息召回单元1003，用于按照召回策略分别对所述第一信息池和所述第二信息池中的信息进行召回处理，得到与所述第一信息池对应的第一信息簇，以及与所述第二信息池对应的第二信息簇；

推荐列表生成单元1004，用于利用所述第一信息簇和所述第二信息簇，生成信息推荐列表。

在一种可能的情况中，该装置还包括模型生成单元，所述模型生成单元具体用于：

通过包括第一样本特征的训练样本集对神经网络进行训练，得到第一召回模型，所述第一召回模型用于利用信息的点击率特征和信息语义特征对信息进行召回；

可选地，所述信息召回单元，包括：

第一处理子单元，用于利用所述第一召回模型对所述第一信息池进行处理，得到第一信息向量，所述第一信息向量表征至少信息点击率特征的向量；

第一聚簇子单元，用于通过所述第一信息向量对所述第一信息池的信息进行聚簇处理，得到第一信息簇；

第二处理子单元，用于利用所述第二召回模型对所述第二信息池进行处理，得到第二信息向量，所述第二信息向量为信息语义特征的向量；

第二聚簇子单元，用于通过所述第二信息向量对所述第二信息池的信息进行聚簇处理，得到第二信息簇。

可选地，所述装置还包括：

请求解析单元，用于对所述信息推荐请求进行解析，得到目标用户；

第一特征组合单元，用于利用所述第一召回模型对所述目标用户进行用户特征组合，得到第一用户特征向量，所述第一用户特征向量包括用户对信息的点击率特征向量；

第二特征组合单元，用于利用所述第二召回模型对所述目标用户进行用户特征组合，得到第二用户特征向量，所述第二用户特征向量包括用户兴趣类别特征向量。

可选地，所述推荐列表生成单元包括：

第一搜索子单元，用于利用所述第一用户特征向量对所述第一信息簇进行搜索，得到第一待推荐信息；

第二搜索子单元，用于利用所述第二用户特征向量对所述第二信息簇进行搜索，得到第二待推荐信息；

列表生成子单元，用于将所述第一待推荐信息和所述第二待推荐信息进行组合，得到信息推荐列表。

在上述实施例的基础上，所述第一搜索子单元具体用于：

利用所述第一用户特征向量对所述第一信息簇进行搜索，得到属性相匹配的第一目标簇；

在所述第一目标簇中按照属性相关度进行排序，并根据排序结果得到第一待推荐信息；

所述第二搜索子单元具体用于：

利用所述第二用户特征向量对所述第二信息簇进行搜索，得到属性相匹配的第二目标簇；

在所述第二目标簇中按照属性相关度进行排序，并根据排序结果得到第二待推荐信息。

在又一种可能的实现方式中，所述装置还包括更新单元，所述更新单元用于：

根据设定周期对所述训练样本集进行更新，得到更新后的训练样本集；

通过更新后的训练样本集和所述信息推荐列表，对所述第一召回模型和所述第二召回模型的模型参数进行更新，得到更新后的第一召回模型和第二召回模型，使得更新后的第一召回模型和第二召回模型实时满足对信息推荐请求的处理。

另一方面，本申请还提供了一种终端，如参见图11，其示出了本申请的终端的一种组成结构示意图，本实施例的终端1100可以包括：处理器1101和存储器1102。

可选的，该终端还可以包括通信接口1103、输入单元1104和显示器1105 和通信总线1106。

处理器1101、存储器1102、通信接口1103、输入单元1104、显示器1105、均通过通信总线1106完成相互间的通信。

在本申请实施例中，该处理器1101，可以为中央处理器(CentralProcessingUnit，CPU)，特定应用集成电路，数字信号处理器、现成可编程门阵列或者其他可编程逻辑器件等。

一些实施例中，处理器1101还可以包括AI(ArtificialIntelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

该处理器可以调用存储器1102中存储的程序。存储器1102中用于存放一个或者一个以上程序，程序可以包括程序代码，所述程序代码包括计算机操作指令，在本申请实施例中，该存储器中至少存储有用于实现以下功能的程序：

在一种可能的实现方式中，该存储器1102可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、以及至少一个功能(比如神经网络训练功能等)所需的应用程序等；存储数据区可存储根据计算机的使用过程中所创建的数据，比如，召回模型及训练样本等等。

此外，存储器1102可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件或其他易失性固态存储器件。

该通信接口1103可以为通信模块的接口，如GSM模块的接口。

本申请还可以包括显示器1104和输入单元1105等等。

当然，图11所示的终端的结构并不构成对本申请实施例中终端的限定，在实际应用中终端可以包括比图11所示的更多或更少的部件，或者组合某些部件。

另一方面，本申请实施例还提供了一种存储介质，所述存储介质中存储有计算机可执行指令，所述计算机可执行指令被处理器加载并执行时，实现如上任意一个实施例中的信息推荐方法。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

以上仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种信息推荐方法，其特征在于，包括：

响应信息推荐请求，得到与所述信息推荐请求对应的信息池；所述信息池为根据不同的信息属性标签进行划分的；

利用第一召回模型对所述第一信息池进行处理，得到第一信息向量，所述第一信息向量表征至少包括信息点击率特征的向量；

利用第二召回模型对所述第二信息池进行处理，得到第二信息向量，所述第二信息向量为信息语义特征的向量；

通过所述第二信息向量对所述第二信息池的信息进行聚簇处理，得到第二信息簇；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

通过包括第一样本特征的训练样本集对神经网络进行训练，得到所述第一召回模型，所述第一召回模型用于利用信息的点击率特征和信息的语义特征对信息进行召回；

通过包括第二样本特征的训练样本集对神经网络进行训练，得到所述第二召回模型，所述第二召回模型用于仅利用信息的语义特征对信息进行召回。

3.根据权利要求2所述的方法，其特征在于，该方法还包括：

对所述信息推荐请求进行解析，得到目标用户；

利用所述第一召回模型对所述目标用户进行用户特征组合，得到第一用户特征向量，所述第一用户特征向量包括用户对信息的点击率特征向量；

利用所述第二召回模型对所述目标用户进行用户特征组合，得到第二用户特征向量，所述第二用户特征向量包括用户兴趣类别特征向量。

4.根据权利要求3所述的方法，其特征在于，所述利用第一信息簇和第二信息簇，生成信息推荐列表，包括：

利用所述第一用户特征向量对所述第一信息簇进行搜索，得到第一待推荐信息；

利用所述第二用户特征向量对所述第二信息簇进行搜索，得到第二待推荐信息；

将所述第一待推荐信息和所述第二待推荐信息进行组合，得到信息推荐列表。

5.根据权利要求4所述的方法，其特征在于，所述利用所述第一用户特征向量对所述第一信息簇进行搜索，得到第一待推荐信息，包括：

所述利用所述第二用户特征向量对所述第二信息簇进行搜索，得到第二待推荐信息，包括：

6.根据权利要求2所述的方法，其特征在于，该方法还包括：

7.一种信息推荐装置，其特征在于，包括：

请求响应单元，用于响应信息推荐请求，得到与所述信息推荐请求对应的信息池；所述信息池为根据不同的信息属性标签进行划分的；

信息召回单元，包括：第一处理子单元、第一聚簇子单元、第二处理子单元以及第二聚簇子单元；

所述第一处理子单元，用于利用第一召回模型对所述第一信息池进行处理，得到第一信息向量，所述第一信息向量表征至少包括信息点击率特征的向量；

所述第一聚簇子单元，用于通过所述第一信息向量对所述第一信息池的信息进行聚簇处理，得到第一信息簇；

所述第二处理子单元，用于利用第二召回模型对所述第二信息池进行处理，得到第二信息向量，所述第二信息向量为信息语义特征的向量；

所述第二聚簇子单元，用于通过所述第二信息向量对所述第二信息池的信息进行聚簇处理，得到第二信息簇；

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

样本获取单元，用于获取训练样本集，所述训练样本集是带有用户和信息对应关系的样本日志；

特征提取单元，用于对所述训练样本集进行特征提取，获得至少包括信息点击率特征的第一样本特征；以及不包括信息点击率特征和信息序列号特征的第二样本特征；

第一训练单元，用于通过包括第一样本特征的训练样本集对神经网络进行训练，得到所述第一召回模型，所述第一召回模型用于利用信息的点击率特征和信息的语义特征对信息进行召回；

第二训练单元，用于通过包括第二样本特征的训练样本集对神经网络进行训练，得到所述第二召回模型，所述第二召回模型用于仅利用信息的语义特征对信息进行召回。

9.一种终端，其特征在于，包括：

处理器和存储器；

其中，所述处理器用于执行所述处理器中存储的程序；

所述存储器用于存储程序，所述程序至少用于：