CN111444428A

CN111444428A - 基于人工智能的信息推荐方法、装置、电子设备及存储介质

Info

Publication number: CN111444428A
Application number: CN202010226929.1A
Authority: CN
Inventors: 尹珺; 刘安安
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2020-07-24
Anticipated expiration: 2040-03-27
Also published as: CN111444428B

Abstract

本发明提供了一种基于人工智能的信息推荐方法、装置、电子设备及计算机可读存储介质；方法包括：对目标用户的画像信息进行特征提取，得到目标用户的长期兴趣特征；对目标用户的历史点击行为数据进行特征提取，得到目标用户的短期兴趣特征；其中，长期兴趣特征的有效时间大于短期兴趣特征的有效时间；将目标用户的长期兴趣特征、以及目标用户的有效期内的短期兴趣特征进行融合处理，得到目标用户的整体兴趣；从信息库中确定与目标用户的整体兴趣相似的信息，以作为召回信息；基于召回信息执行对应目标用户的推荐操作。通过本发明，能够向用户推荐符合用户兴趣的信息，提高用户体验感。

Description

基于人工智能的信息推荐方法、装置、电子设备及存储介质

技术领域

本发明涉及人工智能技术，尤其涉及一种基于人工智能的信息推荐方法、装置、电子设备及存储介质。

背景技术

人工智能(AI，Artificial Intelligence)是计算机科学的一个综合技术，通过研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，例如自然语言处理技术以及机器学习/深度学习等几大方向，随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

推荐系统是人工智能领域的重要应用之一，能够在信息过载的环境中帮助用户发现可能令他们感兴趣的信息，并将信息推送给对它们感兴趣的用户。

虽然，现有技术中的推荐系统可以向用户推荐用户可能感兴趣的信息。但是，现有技术中的推荐系统向用户推荐的准确性有待提高。

发明内容

本发明实施例提供一种基于人工智能的信息推荐方法、装置、电子设备及存储介质，能够结合目标用户的整体兴趣，向用户推荐符合用户兴趣的信息，提高用户体验感。

本发明实施例的技术方案是这样实现的：

本发明实施例提供一种基于人工智能的信息推荐方法，所述方法包括：

对目标用户的画像信息进行特征提取，得到所述目标用户的长期兴趣特征；

对所述目标用户的历史点击行为数据进行特征提取，得到所述目标用户的短期兴趣特征；

其中，所述长期兴趣特征的有效时间大于所述短期兴趣特征的有效时间；

将所述目标用户的长期兴趣特征、以及所述目标用户的有效期内的短期兴趣特征进行融合处理，得到所述目标用户的整体兴趣；

从信息库中确定与所述目标用户的整体兴趣相似的信息，以作为召回信息；

基于所述召回信息执行对应所述目标用户的推荐操作。

本发明实施例提供一种基于人工智能的信息推荐装置，包括：

第一提取模块，用于对目标用户的画像信息进行特征提取，得到所述目标用户的长期兴趣特征；

第二提取模块，用于对所述目标用户的历史点击行为数据进行特征提取，得到所述目标用户的短期兴趣特征；

融合模块，用于将所述目标用户的长期兴趣特征、以及所述目标用户的有效期内的短期兴趣特征进行融合处理，得到所述目标用户的整体兴趣；

确定模块，用于从信息库中确定与所述目标用户的整体兴趣相似的信息，以作为召回信息；

处理模块，用于基于所述召回信息执行对应所述目标用户的推荐操作。

上述技术方案中，所述第一提取模块还用于对所述目标用户的画像信息进行非统计特征提取，得到所述目标用户的非统计特征；

对所述目标用户的画像信息进行统计特征提取，得到所述目标用户的统计特征；

对所述目标用户的非统计特征和所述目标用户的统计特征进行组合，得到所述目标用户的长期兴趣特征；

其中，所述非统计特征的字段包括以下至少之一：年龄、性别和设备标志；所述统计特征的字段包括：信息标签、信息话题、信息类别和发表信息媒体。

上述技术方案中，所述第二提取模块还用于将所述目标用户的每个历史阶段的历史点击行为数据进行统计处理，得到所述每个历史阶段中的多个历史点击信息，并

对所述每个历史阶段中的多个历史点击信息进行兴趣特征提取，得到所述目标用户在所述每个历史阶段的短期兴趣特征。

上述技术方案中，所述第二提取模块还用于对所述目标用户的历史点击行为数据进行遍历处理，得到所述历史点击行为数据中每个历史点击信息的时间戳，并

对所述每个历史点击信息的时间戳进行降序排序，将排序在前的部分时间戳对应的历史点击信息，确定为所述目标用户的有效期内的历史点击信息；

对所述目标用户的有效期内的历史点击信息进行特征提取，得到所述目标用户的有效期内的短期兴趣特征。

上述技术方案中，所述第二提取模块还用于从所述目标用户的每个历史阶段的历史点击行为数据中，提取与所述每个历史阶段中多个历史点击信息分别对应的统计特征；

针对多个所述历史点击信息的统计特征包括的字段，确定相同字段的统计值；

将不同字段的统计值进行组合，得到所述目标用户在所述历史阶段的短期兴趣特征；

其中，所述统计特征的字段包括：信息标签、信息话题、信息类别、发表信息媒体和信息标识。

上述技术方案中，所述第二提取模块还用于针对所述多个历史点击信息中的每个历史点击信息，确定所述每个历史点击信息与待召回信息的相似度，并进行归一化处理以得到归一化相似度；

以所述每个历史点击信息与所述待召回信息的归一化相似度为权重，对所述多个历史点击信息的统计特征包括的相同字段进行加权，将加权结果作为所述相同字段的统计值。

上述技术方案中，所述第二提取模块还用于对所述待召回信息进行统计特征提取，得到所述待召回信息的统计特征；

确定所述每个历史点击信息的统计特征与所述待召回信息的统计特征之间的余弦相似度。

上述技术方案中，所述融合模块还用于将所述目标用户的长期兴趣特征与所述目标用户的有效期内的短期兴趣特征进行拼接处理，得到所述目标用户的整体兴趣特征；

对所述目标用户的整体兴趣特征进行非线性映射处理，得到所述目标用户的隐向量；

对所述目标用户的隐向量进行双曲正切处理，得到所述目标用户的整体兴趣的向量表示。

上述技术方案中，所述确定模块还用于对从所述信息库中提取出的待召回信息进行统计特征提取，得到所述待召回信息的统计特征；

对所述目标用户的整体兴趣、以及所述待召回信息的统计特征进行相似度处理，得到所述待召回信息的召回得分；

基于多个所述待召回信息的召回得分，从多个所述待召回信息中筛选出所述目标用户的召回信息；

上述技术方案中，所述确定模块还用于对所述待召回信息的统计特征进行非线性映射处理，得到所述待召回信息的隐向量；

对所述待召回信息的隐向量进行双曲正切处理，得到所述待召回信息的特征向量；

确定所述目标用户的整体兴趣的向量表示与所述待召回信息的特征向量之间的余弦相似度。

上述技术方案中，所述确定模块还用于当所述待召回信息的召回得分大于召回得分阈值时，将所述待召回信息确定为所述目标用户的召回信息；或者，

对所述多个所述待召回信息的召回得分进行降序排序，将排序在前的部分召回得分对应的待召回信息，确定为所述目标用户的召回信息；

所述处理模块还用于响应于所述目标用户进行信息推荐的请求，从所述请求中提取出关键词；

根据所述关键词，对所述目标用户的每个召回信息进行匹配处理，得到所述每个召回信息的匹配得分；

基于所述每个召回信息的匹配得分，对所述每个召回信息进行筛选处理，将筛选结果中的召回信息作为响应所述请求的推荐信息。

上述技术方案中，所述装置还包括：

训练模块，用于通过信息召回模型对信息样本进行特征提取，得到所述信息样本的统计特征；

对所述目标用户的整体兴趣与所述信息样本的统计特征进行相似度处理，得到所述信息样本的召回得分；

基于所述信息样本的标签、以及所述信息样本的召回得分，构建所述信息召回模型的损失函数；

更新所述信息召回模型的参数直至所述损失函数收敛，将所述损失函数收敛时更新得到的参数，作为训练后的所述信息召回模型的参数。

本发明实施例提供一种用于信息推荐的电子设备，所述电子设备包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本发明实施例提供的基于人工智能的信息推荐方法。

本发明实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本发明实施例提供的基于人工智能的信息推荐方法。

本发明实施例具有以下有益效果：

通过融合目标用户的长期兴趣特征和短期兴趣特征，得到目标用户的整体兴趣，并根据目标用户的整体兴趣，从信息库中确定出召回信息，从而能够综合长期兴趣特征和短期兴趣特征，从数据库中召回符合目标用户兴趣的召回信息，提高召回的准确性以及多样性；根据准确的召回信息执行对应目标用户的推荐操作，从而提高推荐的准确性，提高用户体验感。

附图说明

图1是本发明实施例提供的推荐系统10的应用场景示意图；

图2是本发明实施例提供的用于信息推荐的电子设备500的结构示意图；

图3-5是本发明实施例提供的基于人工智能的信息推荐方法的流程示意图；

图6是本发明实施例提供的推荐文本的结果示意图；

图7为本发明实施例提供的语义模型的结构示意图；

图8为本发明实施例提供的注意力模型的结构示意图；

图9为本发明实施例提供的文本推荐方法的模型架构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，所描述的实施例不应视为对本发明的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的，不是旨在限制本发明。

对本发明实施例进行进一步详细说明之前，对本发明实施例中涉及的名词和术语进行说明，本发明实施例中涉及的名词和术语适用于如下的解释。

1)自然语言处理(Nature Language Processing，NLP)：计算机科学领域与人工智能领域中的一个重要方向，能实现人与计算机之间用自然语言进行有效通信。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，该领域将涉及自然语言，即人们日常使用的语言，所以它与语言学有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

2)目标用户：当前使用推荐系统的用户、即当前用户，例如用户A在使用文本推荐系统看新闻，则用户A为目标用户。

3)用户画像：又称用户角色，作为一种勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像在各领域得到了广泛的应用，在实际操作的过程中，往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来，作为实际用户的虚拟代表。

4)用户兴趣：用户在使用推荐系统时，所表现的行为倾向性。推荐系统会根据用户的一系列行为表现来确实用户的兴趣。

5)召回(Recall)：从文档库中检索出相关文档，例如为用户粗选一批待推荐的商品。

本发明实施例提供了一种基于人工智能的信息推荐方法、装置、电子设备及计算机可读存储介质，能够结合目标用户的整体兴趣，向用户推荐符合用户兴趣的信息，提高用户体验感。下面说明本发明实施例提供的基于人工智能的信息推荐设备的示例性应用，本发明实施例提供的基于人工智能的信息推荐设备可以是服务器，例如部署在云端的服务器，根据目标用户的整体兴趣，从信息库中确定出与目标用户的整体兴趣相似的召回信息，并基于召回信息执行对应目标用户的推荐操作，向目标用户提供符合用户兴趣的推荐信息；也可是笔记本电脑，平板电脑，台式计算机，移动设备(例如，移动电话，个人数字助理)等每个种类型的用户终端，例如手持终端，根据目标用户的整体兴趣，从信息库中确定出与目标用户的整体兴趣相似的召回信息，并基于召回信息执行对应目标用户的推荐操作，向目标用户提供符合用户兴趣的推荐信息。其中，该信息可以是文本、图文、视频等数据。

参见图1，图1是本发明实施例提供的推荐系统10的应用场景示意图，终端200通过网络300连接服务器100，网络300可以是广域网或者局域网，又或者是二者的组合。

终端200可以被用来获取针对目标用户进行信息推荐的请求，例如，当目标用户打开新闻应用后，终端自动获取针对目标用户进行信息推荐的请求。

在一些实施例中，终端200本地执行本发明实施例提供的基于人工智能的信息推荐方法来完成根据针对目标用户进行信息推荐的请求，得到符合目标用户兴趣的信息，例如，在终端200上安装新闻应用(Application，APP)，如新闻推送APP，用户在打开新闻推送APP后，终端200自动生成针对目标用户进行文本推荐的请求，并根据目标用户的整体兴趣，从文本库中确定出与目标用户的整体兴趣相似的召回文本，并从召回文本中确定出符合用户兴趣的推荐文本，以响应推荐请求的推荐文本，并将该推荐文本显示在终端200的显示界面210上。

终端200也可以通过网络300向服务器100发送针对目标用户进行信息推荐的请求，并调用服务器100提供的信息推荐功能，服务器100通过本发明实施例提供的基于人工智能的信息推荐方法获得用于响应推荐请求的推荐信息，例如，在终端200上安装新闻推送APP，用户在打开新闻推送APP后，终端200自动生成针对目标用户进行文本推荐的请求，并通过网络300向服务器100发送针对目标用户进行文本推荐的请求，服务器100根据目标用户的整体兴趣，从文本库中确定出与目标用户的整体兴趣相似的召回文本，并从召回文本中确定出符合用户兴趣的推荐文本，并返回该推荐文本至新闻推送APP，将推荐文本显示在终端200的显示界面上。

在一些应用场景中，该推荐系统10可以应用于文本推荐应用中，即从召回文本中确定出推荐文本，例如用户在打开推荐APP后，终端200自动生成针对目标用户进行文本推荐的请求，并根据目标用户的整体兴趣，从文本库中确定出与目标用户的整体兴趣相似的召回文本，并从召回文本中确定出符合用户兴趣的推荐文本，并返回该推荐APP，以便用户得到准确的推荐文本。

在一些应用场景中，该推荐系统10还可以应用于图片搜索应用中，例如，根据搜索词，从召回广告图片中确定出推荐广告图片，例如用户在打开广告搜索APP后，在搜索框中输入搜索词(关键字)，终端200自动生成针对目标用户进行广告图片推荐的请求，并根据目标用户的整体兴趣，从图片库中确定出与目标用户的整体兴趣相似的召回广告图片，并根据请求中的关键字，从召回广告图片中确定出符合用户兴趣的推荐广告图片，并返回该搜索APP，以便用户得到准确的广告图片。

在一些应用场景中，该推荐系统10还可以应用于视频搜索应用中，即根据搜索词，从召回视频中确定出推荐视频，例如用户在打开搜索APP后，在搜索框中输入搜索词(关键字)，终端200自动生成针对目标用户进行视频推荐的请求，并根据目标用户的整体兴趣，从视频库中确定出与目标用户的整体兴趣相似的召回视频，并根据请求中的关键字，从召回视频中确定出符合用户兴趣的推荐视频，并返回该搜索APP，以便用户得到准确的推荐视频。

继续说明本发明实施例提供的基于人工智能的信息推荐设备的结构，基于人工智能的信息推荐设备可以是各种终端，例如手机、电脑等，也可以是如图1示出的服务器100。

参见图2，图2是本发明实施例提供的用于信息推荐的电子设备500的结构示意图，图2所示的用于信息推荐的电子设备500包括：至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。基于人工智能的信息推荐设备500中的各个组件通过总线系统540耦合在一起。可理解，总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图2中将各种总线都标为总线系统540。

处理器510可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

用户接口530包括使得能够呈现媒体内容的一个或多个输出装置531，包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口530还包括一个或多个输入装置532，包括有助于用户输入的用户接口部件，比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。

存储器550包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(ROM，Read Onl y Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access M emory)。本发明实施例描述的存储器550旨在包括任意适合类型的存储器。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。

在一些实施例中，存储器550能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统551，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块552，用于经由一个或多个(有线或无线)网络接口520到达其他计算设备，示例性的网络接口520包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等；

显示模块553，用于经由一个或多个与用户接口530相关联的输出装置531(例如，显示屏、扬声器等)使得能够呈现信息(例如，用于操作外围设备和显示内容和信息的用户接口)；

输入处理模块554，用于对一个或多个来自一个或多个输入装置532之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。

在一些实施例中，本发明实施例提供的基于人工智能的信息推荐装置可以采用软硬件结合的方式实现，作为示例，本发明实施例提供的基于人工智能的信息推荐装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本发明实施例提供的基于人工智能的信息推荐方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific In tegrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable LogicDevice)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

在另一些实施例中，本发明实施例提供的基于人工智能的信息推荐装置可以采用软件方式实现，图2示出了存储在存储器550中的基于人工智能的信息推荐装置555，其可以是程序和插件等形式的软件，并包括一系列的模块，包括第一提取模块5551、第二提取模块5552、融合模块5553、确定模块5554、处理模块5555、以及训练模块5556；其中，第一提取模块5551、第二提取模块5552、融合模块5553、确定模块5554、处理模块5555用于实现本发明实施例提供的基于人工智能的信息推荐方法，训练模块5556用于训练信息召回模型。

根据上文可以理解，本发明实施例提供的基于人工智能的信息推荐方法可以由各种类型的用于信息推荐的电子设备实施，例如智能终端和服务器等。

下面结合本发明实施例提供的服务器的示例性应用和实施，说明本发明实施例提供的基于人工智能的信息推荐方法。参见图3，图3是本发明实施例提供的基于人工智能的信息推荐方法的流程示意图，结合图3示出的步骤进行说明。

在步骤101中，对目标用户的画像信息进行特征提取，得到目标用户的长期兴趣特征。

其中，本发明实施例中的信息可以是文本、图文、视频等数据，例如，服务器在接收到目标用户进行文本推荐的请求之前，可以先对目标用户的画像信息进行特征提取，以得到目标用户的长期兴趣特征，以便后续根据目标用户的长期兴趣特征，得到符合目标用户长期兴趣的召回文本。或者，在服务器接收到目标用户进行文本推荐的请求之后，对目标用户的画像信息进行特征提取，以得到目标用户的长期兴趣特征。

参见图4，图4是本发明实施例提供的基于人工智能的信息推荐方法的一个可选的流程示意图，图4示出图3中的步骤101可以通过图4示出的步骤1011至步骤1013实现。在步骤1011中，对目标用户的画像信息进行非统计特征提取，得到目标用户的非统计特征；在步骤1012中，对目标用户的画像信息进行统计特征提取，得到目标用户的统计特征；在步骤1013中，对目标用户的非统计特征和目标用户的统计特征进行组合，得到目标用户的长期兴趣特征。

其中，非统计特征的字段包括以下至少之一：年龄、性别和设备标志；统计特征的字段包括：信息标签、信息话题、信息类别和发表信息媒体。长期兴趣特征包括两种类型的特征，一种是不用进行统计即可得到的特征(非统计特征)，例如目标用户的年龄、性别、使用的设备等特征；另一种是基于统计得到的特征(统计特征)，在确定了目标用户后，可以获得目标用户的画像信息，并从目标用户的画像信息中提取出统计特征，其中，目标用户的画像信息可以是一直累积的用户信息，也可以是在一段长时间内的用户信息，例如2年内的用户信息。另外，目标用户的画像信息还可以是由目标用户人工确定的，例如目标用户可以主动选择自己长期的信息标签兴趣、信息话题兴趣、信息类别兴趣和发表信息媒体兴趣，从而信息标签兴趣、信息话题兴趣、信息类别兴趣和发表信息媒体兴趣构成目标用户的画像信息，以便从目标用户的画像信息提取出目标用户的统计特征。

在步骤102中，对目标用户的历史点击行为数据进行特征提取，得到目标用户的短期兴趣特征。

其中，长期兴趣特征表征目标用户长期偏好的兴趣特征，短期兴趣特征表征目标用户短期偏好的兴趣特征，长期兴趣特征的有效时间大于短期兴趣特征的有效时间。目标用户的历史点击行为可以表征目标用户历史的兴趣特征，对目标用户的历史点击行为数据进行特征提取，可以得到目标用户的短期兴趣特征，以便后续根据目标用户的短期兴趣特征，得到符合目标用户短期兴趣的召回信息。

在一些实施例中，目标用户的历史点击行为是分阶段的，对目标用户的历史点击行为数据进行特征提取，得到目标用户的短期兴趣特征，包括：将目标用户的每个历史阶段的历史点击行为数据进行统计处理，得到每个历史阶段中的多个历史点击信息，并对每个历史阶段中的多个历史点击信息进行兴趣特征提取，得到目标用户在每个历史阶段的短期兴趣特征。

例如，当信息为视频时，将目标用户前5天内的历史点击行为数据进行统计处理，得到前5天内的100个历史点击视频，并对该100个历史点击视频进行兴趣特征提取，得到目标用户在前5天内的短期兴趣特征；将目标用户前一个月内的历史点击行为数据进行统计处理，得到前一个月内的100个历史点击视频，并对该100个历史点击视频进行兴趣特征提取，得到目标用户在前一个月内的短期兴趣特征，以便后续根据目标用户在每个历史阶段的短期兴趣特征，得到所需的有效期内的短期兴趣特征。

参见图4，图4是本发明实施例提供的基于人工智能的信息推荐方法的一个可选的流程示意图，图4示出图3中的步骤102可以通过图4示出的步骤1021至步骤1023实现。在步骤1021中，对目标用户的历史点击行为数据进行遍历处理，得到历史点击行为数据中每个历史点击信息的时间戳；在步骤1022中，对每个历史点击信息的时间戳进行降序排序，将排序在前的部分时间戳对应的历史点击信息，确定为目标用户的有效期内的历史点击信息；在步骤1023中，对目标用户的有效期内的历史点击信息进行特征提取，得到目标用户的有效期内的短期兴趣特征。

示例性地，当该信息为文本时，当有效期内的短期兴趣特征是由固定数量的历史点击文本得到时，获取历史点击行为数据中每个历史点击文本的时间戳，并将每个历史点击文本的时间戳进行降序排序，将前N个时间戳对应的历史点击文本，确定为目标用户的有效期内的历史点击文本，其中N为自然数，可以根据实际应用进行设定，并对该有效期内的历史点击文本进行特征提取，得到目标用户的有效期内的短期兴趣特征，以得到目标用户最近的兴趣偏好。

在一些实施例中，对目标用户的历史点击行为数据进行特征提取，得到目标用户的短期兴趣特征，包括：从目标用户的每个历史阶段的历史点击行为数据中，提取与每个历史阶段中多个历史点击信息分别对应的统计特征；针对多个历史点击信息的统计特征包括的字段，确定相同字段的统计值；将不同字段的统计值进行组合，得到目标用户在历史阶段的短期兴趣特征；其中，统计特征的字段包括：信息标签、信息话题、信息类别、发表信息媒体和信息标识。

示例性地，当该信息为文本时，某历史阶段的多个历史点击文本为历史点击文本1、历史点击文本2、历史点击文本3，提取历史点击文本1的统计特征1(包括字段：文本标签、文本话题、文本类别、发文媒体和文本标识)，提取历史点击文本2的统计特征2(包括字段：文本标签、文本话题、文本类别、发文媒体和文本标识)，提取历史点击文本3的统计特征3(包括字段：文本标签、文本话题、文本类别、发文媒体和文本标识)。针对多个历史点击文本的统计特征包括的字段，确定出相同字段的统计值，即确定出文本标签的统计值、文本话题的统计值、文本类别的统计值、发文媒体的统计值和文本标识的统计值，例如对历史点击文本1中的文本标签的值、历史点击文本2中的文本标签的值、历史点击文本3中的文本标签的值进行平均，得到文本标签的统计值。最后，将不同字段的统计值进行组合，即可得到目标用户在历史阶段的短期兴趣特征，例如将文本标签的统计值、文本话题的统计值、文本类别的统计值、发文媒体的统计值和文本标识的统计值组合为目标用户在该历史阶段的短期兴趣特征。

在一些实施例中，针对多个历史点击信息的统计特征包括的字段，确定相同字段的统计值，包括：针对多个历史点击信息中的每个历史点击信息，确定每个历史点击信息与待召回信息的相似度，并进行归一化处理以得到归一化相似度；以每个历史点击信息与待召回信息的归一化相似度为权重，对多个历史点击信息的统计特征包括的相同字段进行加权，将加权结果作为相同字段的统计值。

为了避免所有历史点击信息对目标用户的影响都相同，可以在确定目标用户的短期兴趣特征中融入历史点击信息的权重，使得目标用户的短期兴趣特征能够融入多种权重不同的历史点击信息，以提高目标用户的短期兴趣特征的多样性，从而提高召回信息的多样性。在确定了每个历史点击信息与待召回信息的相似度后，可以对该相似度进行归一化，从而将每个历史点击信息与待召回信息的归一化相似度作为权重，对多个历史点击信息的统计特征包括的相同字段进行加权，并将加权结果作为相同字段的统计值。

承接上述示例，历史点击文本1、历史点击文本2、历史点击文本3的权重分别为0.2、0.3、0.5，对历史点击文本1、历史点击文本2、历史点击文本3的统计特征包括的相同字段进行加权，并将加权结果作为相同字段的统计值，即文本标签的统计值、文本话题的统计值、文本类别的统计值、发文媒体的统计值和文本标识的统计值，例如文本标签的统计值＝历史点击文本1中的文本标签的值*0.2+历史点击文本2中的文本标签的值*0.3+历史点击文本3中的文本标签的值*0.5。

在一些实施例中，确定每个历史点击信息与待召回信息的相似度，包括：对待召回信息进行统计特征提取，得到待召回信息的统计特征；确定每个历史点击信息的统计特征与待召回信息的统计特征之间的余弦相似度。

为了加快相似度的计算，可以对每个历史点击信息的统计特征与待召回信息的统计特征进行余弦相似处理，以得到每个历史点击信息的统计特征与待召回信息的统计特征之间的余弦相似度，无需对历史点击信息的其他的特征进行相似度处理。

在步骤103中，将目标用户的长期兴趣特征、以及目标用户的有效期内的短期兴趣特征进行融合处理，得到目标用户的整体兴趣。

为了能够得到目标用户准确的兴趣，可以对目标用户的长期兴趣特征、以及目标用户的有效期内的短期兴趣特征进行融合，使得融合后得到的目标用户的整体兴趣不仅具有目标用户长期的兴趣偏好，还具有目标用户短期的兴趣偏好，能够表征目标用户完整的兴趣偏好。

示例性地，当对不同历史阶段中的多个历史点击信息进行兴趣特征提取，得到目标用户在不同历史阶段的短期兴趣特征时，需要从不同历史阶段的短期兴趣特征中确定出目标用户的有效期内的短期兴趣特征。根据目标用户的历史点击行为确定目标用户的点击频次(活跃度)，并根据目标用户的点击频次确定对应的有效期，从而根据确定出的有效期，从不同历史阶段的短期兴趣特征中确定出目标用户的有效期内的短期兴趣特征，其中点击频次(活跃度)与有效期成反比，即当目标用户的点击频次高时，则说明目标用户的短期兴趣可能更新比较快，因此，对应的短期兴趣特征的有效期比较短。例如，目标用户的点击频次为100次/天，即目标用户的活跃度比较高，则根据点击频次与有效期的对应关系，确定出对应的有效期为5天，从而从不同历史阶段的短期兴趣特征中确定出5天的短期兴趣特征，并将5天的短期兴趣特征作为目标用户的有效期内的短期兴趣特征。

示例性地，当对不同历史阶段中的多个历史点击信息进行兴趣特征提取，得到目标用户在不同历史阶段的短期兴趣特征时，需要从不同历史阶段的短期兴趣特征中确定出目标用户的有效期内的短期兴趣特征。根据目标用户的历史点击行为确定历史点击信息的类型或来源，并根据目标用户的历史点击信息的类型或来源确定对应的有效期，从而根据确定出的有效期，从不同历史阶段的短期兴趣特征中确定出目标用户的有效期内的短期兴趣特征，其中历史点击信息的类型或来源与有效期成映射关系。例如，目标用户的历史点击信息的类型为娱乐型，由于娱乐型的历史点击信息的时效性比较低，则根据历史点击信息的类型与有效期的对应关系，确定出对应的有效期为7天，从而从不同历史阶段的短期兴趣特征中确定出7天的短期兴趣特征，并将7天的短期兴趣特征作为目标用户的有效期内的短期兴趣特征；目标用户的历史点击信息的来源为可靠媒体，由于可靠媒体出版的历史点击信息的时效性比较高，则根据历史点击信息的来源与有效期的对应关系，确定出对应的有效期为一个月，从而从不同历史阶段的短期兴趣特征中确定出一个月的短期兴趣特征，并将一个月的短期兴趣特征作为目标用户的有效期内的短期兴趣特征。

在一些实施例中，将目标用户的长期兴趣特征、以及目标用户的有效期内的短期兴趣特征进行融合处理，得到目标用户的整体兴趣，包括：将目标用户的长期兴趣特征与目标用户的有效期内的短期兴趣特征进行拼接处理，得到目标用户的整体兴趣特征；对目标用户的整体兴趣特征进行非线性映射处理，得到目标用户的隐向量；对目标用户的隐向量进行双曲正切处理，得到目标用户的整体兴趣的向量表示。

示例性地，在服务器得到目标用户的长期兴趣特征与目标用户的有效期内的短期兴趣特征后，将目标用户的长期兴趣特征与目标用户的有效期内的短期兴趣特征连接起来，以得到目标用户的整体兴趣特征，并对目标用户的整体兴趣特征进行一次非线性映射处理，得到目标用户的第一隐向量，在对目标用户的第一隐向量进行一次非线性映射处理，得到目标用户的第二隐向量，最后通过对目标用户的第二隐向量进行双曲正切处理，得到目标用户的整体兴趣的向量表示，从而实现对目标用户的整体兴趣特征的降维处理，以减小计算量。

在步骤104中，从信息库中确定与目标用户的整体兴趣相似的信息，以作为召回信息。

在服务器确定出与目标用户的整体兴趣后，可以根据目标用户的整体兴趣，从信息库中确定出召回信息，以便后续从召回信息中确定出推荐信息，以提供给目标用户。

在一些实施例中，从信息库中确定与目标用户的整体兴趣相似的信息，以作为召回信息，包括：对从信息库中提取出的待召回信息进行统计特征提取，得到待召回信息的统计特征；对目标用户的整体兴趣、以及待召回信息的统计特征进行相似度处理，得到待召回信息的召回得分；基于多个待召回信息的召回得分，从多个待召回信息中筛选出目标用户的召回信息；其中，统计特征的字段包括：信息标签、信息话题、信息类别、发表信息媒体和信息标识。

为了有效地利用目标用户的整体兴趣，可以对从信息库中的待召回信息进行同样的统计特征提取，得到待召回信息的统计特征，并将目标用户的整体兴趣、与待召回信息的统计特征进行余弦相似度处理，将得到目标用户的整体兴趣与待召回信息的相似度确定为待召回信息的召回得分，并根据信息库中多个待召回信息的召回得分，从待召回信息中筛选出目标用户的召回信息。其中，

在一些实施例中，对目标用户的整体兴趣、以及待召回信息的统计特征进行相似度处理，包括：对待召回信息的统计特征进行非线性映射处理，得到待召回信息的隐向量；对待召回信息的隐向量进行双曲正切处理，得到待召回信息的特征向量；确定目标用户的整体兴趣的向量表示与待召回信息的特征向量之间的余弦相似度。

示例性地，在服务器得到待召回信息的统计特征后，可以对待召回信息的统计特征进行一次非线性映射处理，得到待召回信息的第一隐向量，在对待召回信息的第一隐向量进行一次非线性映射处理，得到待召回信息的第二隐向量，最后通过对待召回信息的第二隐向量进行双曲正切处理，得到待召回信息的特征向量，从而实现对待召回信息的统计特征的降维处理，以减小计算量。将目标用户的整体兴趣的向量表示与待召回信息的特征向量之间的余弦相似度，确定为目标用户的整体兴趣与待召回信息的相似度。

在一些实施例中，基于多个待召回信息的召回得分，从多个待召回信息中筛选出目标用户的召回信息，包括：当待召回信息的召回得分大于召回得分阈值时，将待召回信息确定为目标用户的召回信息；或者，对多个待召回信息的召回得分进行降序排序，将排序在前的部分召回得分对应的待召回信息，确定为目标用户的召回信息。

示例性地，从多个待召回信息筛选出召回信息有两种方式，一种方式是，在待召回信息的召回得分大于召回得分阈值时，将该待召回信息确定为目标用户的召回信息，例如召回得分阈值为0.90，某待召回信息的召回得分为0.95，则将该待召回信息确定为目标用户的召回信息；另一种方式是，对多个待召回信息的召回得分进行降序排序，将前M个召回得分对应的待召回信息，确定为目标用户的召回信息，其中M为自然数，可以根据实际需求进行设定。

在步骤105中，基于召回信息执行对应目标用户的推荐操作。

例如，当目标用户在打开某推荐应用后，终端将自动生成目标用户进行信息推荐的请求，并将该目标用户进行信息推荐的请求发送至服务器，服务器接收到该目标用户进行信息推荐的请求后，从该召回信息中确定出推荐信息，并将推荐信息发送至推荐应用，以提供给目标用户。其中，服务器可以对召回信息进行分类，按照不同类别的比例，从召回信息中随机抽取出相应比例的类别的推荐信息，例如，娱乐型推荐文本：新闻型推荐文本：生活型推荐文本＝2:3:5，其中推荐文本的数量为20，则从召回文本中随机抽取出4个娱乐型的召回文本作为娱乐型推荐文本、6个新闻型的召回文本作为新闻型推荐文本、10个生活型的召回文本作为生活型推荐文本。

示例性地，当目标用户在打开某搜索应用后，并在搜索框中输入关键词，终端将自动生成目标用户进行信息推荐的请求，并将该目标用户进行信息推荐的请求发送至服务器，服务器接收到该目标用户进行信息推荐的请求后，从请求中提取出关键词，并根据关键词，对目标用户的每个召回信息进行匹配处理，得到每个召回信息的匹配得分，基于每个召回信息的匹配得分，对每个召回信息进行筛选处理，将筛选结果中的召回信息作为响应请求的推荐信息。例如，当召回信息的匹配得分大于匹配得分阈值时，将该召回信息确定为目标用户的推荐信息；或者，对多个召回信息的匹配得分进行降序排序，将排序在前的部分匹配得分对应的召回信息，确定为目标用户的推荐信息。

在一些实施例中，针对信息召回模型的训练进行说明，参见图5，基于图3，图5是本发明实施例提供的基于人工智能的信息推荐方法的流程示意图，在步骤106中，通过信息召回模型对信息样本进行特征提取，得到信息样本的统计特征；在步骤107中，对目标用户的整体兴趣与信息样本的统计特征进行相似度处理，得到信息样本的召回得分；在步骤108中，基于信息样本的标签、以及信息样本的召回得分，构建信息召回模型的损失函数；在步骤109中，更新信息召回模型的参数直至损失函数收敛，将损失函数收敛时更新得到的参数，作为训练后的信息召回模型的参数。

其中，步骤106-109与步骤101-105并无明显的先后顺序。当服务器基于信息样本的标签、以及信息样本的召回得分，确定信息召回模型的损失函数的值后，可以判断损失函数的值是否超出预设阈值，当损失函数的值超出预设阈值时，基于损失函数确定信息召回模型的误差信号，将误差信息在信息召回模型中反向传播，并在传播的过程中更新各个层的模型参数。

这里，对反向传播进行说明，将训练样本数据输入到神经网络模型的输入层，经过隐藏层，最后达到输出层并输出结果，这是神经网络模型的前向传播过程，由于神经网络模型的输出结果与实际结果有误差，则计算输出结果与实际值之间的误差，并将该误差从输出层向隐藏层反向传播，直至传播到输入层，在反向传播的过程中，根据误差调整模型参数的值；不断迭代上述过程，直至收敛，其中，信息召回模型属于神经网络模型。

至此已经结合本发明实施例提供的服务器的示例性应用和实施，说明本发明实施例提供的基于人工智能的信息推荐方法，下面继续说明本发明实施例提供的基于人工智能的信息推荐装置555中各个模块配合实现信息推荐的方案。

第一提取模块5551，用于对目标用户的画像信息进行特征提取，得到所述目标用户的长期兴趣特征；第二提取模块5552，用于对所述目标用户的历史点击行为数据进行特征提取，得到所述目标用户的短期兴趣特征；其中，所述长期兴趣特征的有效时间大于所述短期兴趣特征的有效时间；融合模块5553，用于将所述目标用户的长期兴趣特征、以及所述目标用户的有效期内的短期兴趣特征进行融合处理，得到所述目标用户的整体兴趣；确定模块5554，用于从信息库中确定与所述目标用户的整体兴趣相似的信息，以作为召回信息；处理模块5555，用于基于所述召回信息执行对应所述目标用户的推荐操作。

在一些实施例中，所述第一提取模块5551还用于对所述目标用户的画像信息进行非统计特征提取，得到所述目标用户的非统计特征；对所述目标用户的画像信息进行统计特征提取，得到所述目标用户的统计特征；对所述目标用户的非统计特征和所述目标用户的统计特征进行组合，得到所述目标用户的长期兴趣特征；其中，所述非统计特征的字段包括以下至少之一：年龄、性别和设备标志；所述统计特征的字段包括：信息标签、信息话题、信息类别和发表信息媒体。

在一些实施例中，所述第二提取模块5552还用于将所述目标用户的每个历史阶段的历史点击行为数据进行统计处理，得到所述每个历史阶段中的多个历史点击信息，并对所述每个历史阶段中的多个历史点击信息进行兴趣特征提取，得到所述目标用户在所述每个历史阶段的短期兴趣特征。

在一些实施例中，所述第二提取模块5552还用于对所述目标用户的历史点击行为数据进行遍历处理，得到所述历史点击行为数据中每个历史点击信息的时间戳，并对所述每个历史点击信息的时间戳进行降序排序，将排序在前的部分时间戳对应的历史点击信息，确定为所述目标用户的有效期内的历史点击信息；对所述目标用户的有效期内的历史点击信息进行特征提取，得到所述目标用户的有效期内的短期兴趣特征。

在一些实施例中，所述第二提取模块5552还用于从所述目标用户的每个历史阶段的历史点击行为数据中，提取与所述每个历史阶段中多个历史点击信息分别对应的统计特征；针对多个所述历史点击信息的统计特征包括的字段，确定相同字段的统计值；将不同字段的统计值进行组合，得到所述目标用户在所述历史阶段的短期兴趣特征；其中，所述统计特征的字段包括：信息标签、信息话题、信息类别、发表信息媒体和信息标识。

在一些实施例中，所述第二提取模块5552还用于针对所述多个历史点击信息中的每个历史点击信息，确定所述每个历史点击信息与待召回信息的相似度，并进行归一化处理以得到归一化相似度；以所述每个历史点击信息与所述待召回信息的归一化相似度为权重，对所述多个历史点击信息的统计特征包括的相同字段进行加权，将加权结果作为所述相同字段的统计值。

在一些实施例中，所述第二提取模块5552还用于对所述待召回信息进行统计特征提取，得到所述待召回信息的统计特征；确定所述每个历史点击信息的统计特征与所述待召回信息的统计特征之间的余弦相似度。

在一些实施例中，所述融合模块5553还用于将所述目标用户的长期兴趣特征与所述目标用户的有效期内的短期兴趣特征进行拼接处理，得到所述目标用户的整体兴趣特征；对所述目标用户的整体兴趣特征进行非线性映射处理，得到所述目标用户的隐向量；对所述目标用户的隐向量进行双曲正切处理，得到所述目标用户的整体兴趣的向量表示。

在一些实施例中，所述确定模块5554还用于对从所述信息库中提取出的待召回信息进行统计特征提取，得到所述待召回信息的统计特征；对所述目标用户的整体兴趣、以及所述待召回信息的统计特征进行相似度处理，得到所述待召回信息的召回得分；基于多个所述待召回信息的召回得分，从多个所述待召回信息中筛选出所述目标用户的召回信息；其中，所述统计特征的字段包括：信息标签、信息话题、信息类别、发表信息媒体和信息标识。

在一些实施例中，所述确定模块5554还用于对所述待召回信息的统计特征进行非线性映射处理，得到所述待召回信息的隐向量；对所述待召回信息的隐向量进行双曲正切处理，得到所述待召回信息的特征向量；确定所述目标用户的整体兴趣的向量表示与所述待召回信息的特征向量之间的余弦相似度。

在一些实施例中，所述确定模块5554还用于当所述待召回信息的召回得分大于召回得分阈值时，将所述待召回信息确定为所述目标用户的召回信息；或者，对所述多个所述待召回信息的召回得分进行降序排序，将排序在前的部分召回得分对应的待召回信息，确定为所述目标用户的召回信息；所述处理模块5555还用于响应于所述目标用户进行信息推荐的请求，从所述请求中提取出关键词；根据所述关键词，对所述目标用户的每个召回信息进行匹配处理，得到所述每个召回信息的匹配得分；基于所述每个召回信息的匹配得分，对所述每个召回信息进行筛选处理，将筛选结果中的召回信息作为响应所述请求的推荐信息。

在一些实施例中，所述基于人工智能的信息推荐装置555还包括：训练模块5556，用于通过信息召回模型对信息样本进行特征提取，得到所述信息样本的统计特征；对所述目标用户的整体兴趣与所述信息样本的统计特征进行相似度处理，得到所述信息样本的召回得分；基于所述信息样本的标签、以及所述信息样本的召回得分，构建所述信息召回模型的损失函数；更新所述信息召回模型的参数直至所述损失函数收敛，将所述损失函数收敛时更新得到的参数，作为训练后的所述信息召回模型的参数。

本发明实施例还提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本发明实施例提供的基于人工智能的信息推荐方法，例如，如图3-5示出的基于人工智能的信息推荐方法。

在一些实施例中，存储介质可以是FRAM、ROM、PROM、EPROM、EE PROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(H TML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备(包括智能终端和服务器在内的设备)上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

下面，将说明本发明实施例在一个实际的应用场景中的示例性应用。

本发明实施例可以应用于各种文本推荐的场景，例如，个性化新闻推荐，是根据用户的兴趣特点和阅读行为，向用户推荐他们感兴趣的新闻。当目标用户在打开某新闻阅读应用后，终端将自动生成目标用户进行文本推荐的请求，并将该目标用户进行文本推荐的请求发送至服务器，服务器接收到该目标用户进行文本推荐的请求后，从文本库中确定与目标用户的整体兴趣相似的召回文本，并从召回文本中随机抽取不同类型的召回文本，将不同类型的召回文本作为推荐文本，并将推荐文本发送至新闻阅读应用，以提供给目标用户。如图6所示，目标用户打开终端上的新闻阅读APP后，点击新闻阅读APP上的“推荐”按钮601，从而终端自动生成针对目标用户进行新闻推荐的请求，并将该目标用户进行文本推荐的请求发送至服务器，服务器接收到该目标用户进行文本推荐的请求后，经过一系列处理，得到推荐文本，并将推荐文本发送至新闻阅读应用，并在终端的显示界面上进行显示，如图6所显示的推荐文本。

个性化新闻推荐(Personalized News Recommendation)已成为现代人们生活的一部分，在信息爆炸时代，它为用户提供千人千面的图文视频新闻结果。个性化新闻推荐的关键技术在于刻画用户兴趣，并基于用户的兴趣，把物品和用户的个性化偏好进行匹配。

深度神经网络(DNN，Deep Neural Network)在新闻推荐系统、点击率(CTR，Click-Through Rate)预估领域已经有了应用，例如浅层&深层(wide&deep)、深度因子分解机(deepFM，deep Factorization Machines)模型等。通过深度神经网络抽取特征的高阶特征，减少人工特征组合，取得了很好的效果。因此，在个性化新闻推荐中，采用深度神经网络对用户兴趣进行向量表示，并用该向量表示和新闻向量计算得分，将本发明实施例未融入注意力机制的文本推荐方法召回的前N个新闻结果作为本发明实施例未融入注意力机制的文本推荐方法的召回结果，将本发明实施例未融入注意力机制的文本推荐方法的召回结果和其他方法的召回结果经过统一的粗排排序模型排序后，得到前200个新闻，其中本发明实施例未融入注意力机制的文本推荐方法的召回占比比其他方法的召回占比高，例如，本发明实施例未融入注意力机制的文本推荐方法的召回占比为57％(114/200)，其他方法的召回占比为32％(64/200)，说明本发明实施例未融入注意力机制的文本推荐方法召回的新闻更贴合上层粗排排序模型。

若采用深度神经网络仅对用户学习一个单一向量，则不足以覆盖用户所有兴趣。首先，通过分析深度神经网络在线上的召回结果，发现召回的文章(新闻)过于集中，文章都集中在头部兴趣(对用户所有的兴趣进行权重排序，靠前的兴趣为头部兴趣)；深度神经网络召回的文章在粗排排序模型输出的前200个新闻的占比是57％，但是在最终曝光给用户的新闻中占比33％(本发明实施例未融入注意力机制的文本推荐方法的新闻的曝光数与新闻的总曝光数的比值)，则说明经过精排策略之后，召回的文章很多都没有曝光给用户；其次，线上统计数据发现用户兴趣画像中平均分类个数是7.8个，由于用户的兴趣有多样性的特点，因此，只有部分历史行为数据影响到当次推荐的新闻是否被点击，而不是所有的历史行为都影响到当次推荐的新闻是否被点击。

本发明实施例提出的一种基于人工智能的文本推荐方法是由两种神经网络组合而来的，即个性化推荐任务中的各种深度神经网络结构和注意力模型，具体如下：

1)个性化推荐任务中的各种深度神经网络结构

在信息搜索系统中，基于深度网络的语义模型(DSSM，Deep Structured SemanticModels)将搜索词(query)和文档用深度神经网络映射到同一空间，通过海量点击曝光日志学习query和文本的表示，在训练好语义模型之后，目标用户在搜索场景下输入query之后，可以根据该query计算其与候选文本的语义相似度，返回前K个候选文本作为召回文本，其中K为自然数。语义模型的结构，如图7所示。与信息搜索系统类似，在新闻推荐系统中，将目标用户和物品利用深度神经网络映射到同一空间，并通过历史行为数据学习其表示和网络参数。进一步的，为了弥补DSSM会丢失上下文的问题，可以将DSSM的全连接网络结构改进为卷积神经网络结构。

图7中主要包括两个步骤：1、将query和候选文本的高维向量映射为低维语义向量；2、根据语义向量计算query和候选文本(doc)的相似度。具体步骤如下所示：

1、将query和候选文本的高维向量映射为低维语义向量

图7中的x表示输入的词向量，y表示输出的向量，l_i,i＝1,...,N-1表示隐藏层，W_i表示第i层的参数矩阵，b_i表示第i层的偏置项，其计算公式如下所示：

l₁＝W₁x (1)

l_i＝f(W_il_i-1+b_i),i＝2,...,N-1 (2)

y＝f(W_Nl_N-1+b_N) (3)

其中，可以采用tanh作为输出层和隐藏层的激活函数，其计算公式如公式(4)所示：

2、根据语义向量计算query和候选文本(doc)的相似度

图7中的Q表示一个query，D表示一个候选文本，则query和候选文本的相似度的计算公式如公式(5)所示：

其中，y_Q表示query的语义向量，y_D表示候选文本的语义向量。

图7中可以采用全连接前向神经网络作为编码器，本发明并不具体限定深度神经网络的模型类别和拓扑结构，可以替换为各种其他模型结构，例如卷积神经网络及变种、循环神经网络及变种，或者变压器(transformer)等其他网络结构。

2)注意力模型

注意力机制(Attention Mechanism)的原理就是一种权重参数的分配机制，目标是协助注意力模型捕捉重要信息。

在推荐系统中，注意力机制就是注意力模型在预测的时候，对用户不同行为的注意力是不一样的，“相关”的历史行为权重大，“不相关”的历史行为权重小。注意力模型结构如图8所示，在这个模型中，对不同候选得到的用户向量是不同的，V_u＝f(V_a)＝∑w_i*V_i＝∑g(V_i,V_a)*V_i。其中，V_u表示用户的嵌入(embedding)向量，V_a表示候选广告商品的embedding向量，V_i是用户u的第i次行为的embedding向量(这里用户的行为就是浏览商品或店铺，即行为的embedding的向量就是浏览的商品或店铺的embedding向量)。通过计算候选商品和用户历史商品序列中每一件商品的相关性，得到带权重的用户历史序列，而这个序列由于权重的不同，自然会随着候选商品的变化而变化。将该注意力模型应用到新闻推荐系统中，通过计算待召回文本和用户历史点击文本序列中每个历史点击文本的相关性，得到带权重的用户历史点击文本序列，而这个序列由于权重的不同，自然会随着待召回文本的变化而变化。

其中，图8中的池化可以采用最大池化(sum-pooling)的方式对相同域特征进行处理，该池化也可以采用平均池化(ave-pooling)或带门控网络的其它方式，本发明实施例并不具体限定具体对相同域输入特征的处理方式。

其中，图8中的激活函数(PRelu)的计算公式如公式(6)所示：

激活函数(Dice)的计算公式如公式(7)所示：

综上，本发明实施例提供了一种基于人工智能的文本推荐方法，该方法使用注意力机制的神经网络刻画用户兴趣，该用户兴趣包含全局长期兴趣和短期动态兴趣两方面。该方法可用在个性化推荐的各种实际场景中，例如看点快报和手Q看点。本发明实施例的文本推荐方法的模型架构如图9所示，具体的处理步骤如下所述：

1)确定用户画像的向量u₀：u₀包括基于非统计的用户标签(例如年龄、性别、设备标识等)和基于统计的用户兴趣(例如标签(tag)兴趣、话题(topic)兴趣、分类兴趣和发文媒体兴趣等)。

2)用户各个历史点击向量(p₁,p₂,...,p_N)：取用户近期的N个点击新闻。

3)确定待召回新闻的新闻d。

如图9所示，将用户画像u₀(包括年龄、性别、设备标识、tag兴趣、topi c兴趣、分类兴趣和发文媒体兴趣)输入至文本召回模型中，将带权的历史点击序列(包括标签(tag)、话题(topic)、类别(category)、发文媒体(media)和标识(doc id))输入至文本召回模型中，用户画像u₀和带权的历史点击序列经过激活函数(Relu)以及双曲正切函数的处理，得到用户嵌入向量(user em bedding)、即用户的整体兴趣的向量表示。将待召回新闻d(包括标签、话题、类别、发文媒体和标识)输入至文本召回模型中，经过激活函数(Relu)以及双曲正切函数的处理，得到待召回新闻的嵌入向量表示(Doc embedding)，对用户和待召回新闻进行匹配，得到用户与待召回新闻的召回得分，其召回得分的计算公式如公式(8)所示：

其中，

λ表示学习参数，a_i表示第i个历史点击新闻的权重，d^Tu₀表示用户-新闻的隐式匹配模型，

表示用户历史点击行为的k近邻模型。

其中，本发明实施例中的文本召回模型使用了3层的递归神经网络。本发明实施例并不具体限定层数，可以替换为多层的神经网络及双向神经网络。

基于文本召回模型的网络结构，在召回过程中，若仅使用user embedding检索Docembedding，不考虑待召回新闻，必然会出现相似的新闻，从而导致召回过于集中。注意力机制恰好可以解决该问题，即在生成user embedding的时候，为每一个待召回新闻都生成一个权重，在匹配待召回新闻和用户的时候，综合考虑各个待召回新闻的权重，例如在预估一篇体育的文章和用户的相关性的时候，可以看用户历史上是不是点击过体育类的文章，或者有没有点击过待预测文章相关的文章，而历史上点击过的娱乐或者其他类别的文章对这次预估不起作用或者起到很小的作用。

该文本召回模型读入用户特征和新闻特征，训练采用随机负采样的方法，每个小批量(minibatch)内将其他用户的正样本作为该用户的负样本。

通过损失函数训练该文本召回模型的所有参数(网络结构参数和特征embedding)，该损失函数的计算公式如公式(9)所示：

其中，θ表示训练参数，f⁽ⁱ⁾(u,d)表示第i个样本的标签，u⁽ⁱ⁾表示第i个样本的用户向量，d⁽ⁱ⁾表示第i个样本的向量表示。

当参数训练完成后，线上服务加载参数后即时计算user embedding，并获取相应的召回结果。该模型可以进行增量训练，小时级更新。

在服务器获得待召回新闻的召回得分后，基于待召回新闻的召回得分，从待召回新闻中筛选出召回新闻，并从召回新闻中确定出推荐新闻，以推荐给用户，例如从召回新闻中随机抽取出不同类别的推荐新闻。

综上，本发明实施例将用户语义向量表示(用户的整体兴趣)分为两部分，全局长期部分和局部短期部分。其中，全局长期部分由用户长期画像获得，局部短期兴趣部分由用户短期历史点击新闻序列获得。局部短期兴趣部分的用户向量，与用户历史点击以及待召回新闻向量相关，即用户历史点击序列中每个历史点击新闻的带权加和，其某个历史点击新闻的权重与该历史点击新闻与待召回新闻的相似度成正相关关系。本发明实施例提出的文本推荐方法，提高了召回新闻的多样性，进而提高新闻推荐的多样性以及准确性，改善新闻推荐的产品体验，最终提升整体效果。

以上，仅为本发明的实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本发明的保护范围之内。

Claims

1.一种基于人工智能的信息推荐方法，其特征在于，所述方法包括：

基于所述召回信息执行对应所述目标用户的推荐操作。

2.根据权利要求1所述的方法，其特征在于，所述对目标用户的画像信息进行特征提取，得到所述目标用户的长期兴趣特征，包括：

对所述目标用户的画像信息进行非统计特征提取，得到所述目标用户的非统计特征；

3.根据权利要求1所述的方法，其特征在于，所述对所述目标用户的历史点击行为数据进行特征提取，得到所述目标用户的短期兴趣特征，包括：

将所述目标用户的每个历史阶段的历史点击行为数据进行统计处理，得到所述每个历史阶段中的多个历史点击信息，并

4.根据权利要求1所述的方法，其特征在于，所述对所述目标用户的历史点击行为数据进行特征提取，得到所述目标用户的短期兴趣特征，包括：

对所述目标用户的历史点击行为数据进行遍历处理，得到所述历史点击行为数据中每个历史点击信息的时间戳，并

5.根据权利要求1所述的方法，其特征在于，所述对所述目标用户的历史点击行为数据进行特征提取，得到所述目标用户的短期兴趣特征，包括：

从所述目标用户的每个历史阶段的历史点击行为数据中，提取与所述每个历史阶段中多个历史点击信息分别对应的统计特征；

6.根据权利要求5所述的方法，其特征在于，所述针对多个所述历史点击信息的统计特征包括的字段，确定相同字段的统计值，包括：

针对所述多个历史点击信息中的每个历史点击信息，确定所述每个历史点击信息与待召回信息的相似度，并进行归一化处理以得到归一化相似度；

7.根据权利要求6所述的方法，其特征在于，所述确定所述每个历史点击信息与待召回信息的相似度，包括：

对所述待召回信息进行统计特征提取，得到所述待召回信息的统计特征；

8.根据权利要求1所述的方法，其特征在于，所述将所述目标用户的长期兴趣特征、以及所述目标用户的有效期内的短期兴趣特征进行融合处理，得到所述目标用户的整体兴趣，包括：

将所述目标用户的长期兴趣特征与所述目标用户的有效期内的短期兴趣特征进行拼接处理，得到所述目标用户的整体兴趣特征；

9.根据权利要求1所述的方法，其特征在于，所述从信息库中确定与所述目标用户的整体兴趣相似的信息，以作为召回信息，包括：

对从所述信息库中提取出的待召回信息进行统计特征提取，得到所述待召回信息的统计特征；

10.根据权利要求9所述的方法，其特征在于，所述对所述目标用户的整体兴趣、以及所述待召回信息的统计特征进行相似度处理，包括：

对所述待召回信息的统计特征进行非线性映射处理，得到所述待召回信息的隐向量；

11.根据权利要求9所述的方法，其特征在于，所述基于多个所述待召回信息的召回得分，从多个所述待召回信息中筛选出所述目标用户的召回信息，包括：

当所述待召回信息的召回得分大于召回得分阈值时，将所述待召回信息确定为所述目标用户的召回信息；或者，

所述基于所述召回信息执行对应所述目标用户的推荐操作，包括：

响应于所述目标用户进行信息推荐的请求，从所述请求中提取出关键词；

12.根据权利要求1-11任一所述的方法，其特征在于，所述方法还包括：

通过信息召回模型对信息样本进行特征提取，得到所述信息样本的统计特征；

13.一种基于人工智能的信息推荐装置，其特征在于，所述装置包括：

14.一种电子设备，其特征在于，所述电子设备包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至12任一项所述的基于人工智能的信息推荐方法。

15.一种计算机可读存储介质，其特征在于，存储有可执行指令，用于被处理器执行时，实现权利要求1至12任一项所述的基于人工智能的信息推荐方法。