CN112883258B

CN112883258B - 信息推荐方法、装置、电子设备及存储介质

Info

Publication number: CN112883258B
Application number: CN202110034339.3A
Authority: CN
Inventors: 牛亚男; 冷德维; 惠轶群; 宋洋
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-01-11
Filing date: 2021-01-11
Publication date: 2024-05-21
Anticipated expiration: 2041-01-11
Also published as: CN112883258A; WO2022148038A1

Abstract

本公开关于一种信息推荐方法、装置、电子设备及存储介质，该方法包括响应于目标对象的信息获取请求，获取目标对象的长期行为数据集，长期行为数据集表征目标对象在预设时间段内的多个历史行为数据；确定待推荐信息集中每个待推荐信息的特征信息；基于每个待推荐信息的特征信息从长期行为数据集中，确定每个待推荐信息对应的目标行为数据；将目标行为数据输入兴趣识别网络进行兴趣识别，得到目标对象对每个待推荐信息的兴趣指标；基于兴趣指标将待推荐信息集中的目标信息推荐给目标对象。利用本公开实施例可以有效反映对象的真实兴趣偏好，提高兴趣识别效率和识别精准性，进而大大提升推荐系统中信息推荐精准性和推荐效果。

Description

信息推荐方法、装置、电子设备及存储介质

技术领域

本公开涉及互联网技术领域，尤其涉及信息推荐方法、装置、电子设备及存储介质。

背景技术

随着互联网技术的发展，大量网络平台也在不断的升级，除了可以发布一些图文信息之外，也可以供个人用户随时分享日常的短视频等，而如何精准的捕捉用户的兴趣是大量推荐系统遇到的挑战。

相关技术中，往往偏向于从用户近期行为数据中提取出用户的兴趣喜好，并结合近期行为数据中提取的用户兴趣喜好来进行信息推荐。但近期行为数据通常只能表示用户很短一段时间内的兴趣，缺失了用户的中长期兴趣特征，导致无法有效表征用户真实兴趣，进而造成推荐系统中推荐精准性和效果差的问题。

发明内容

本公开提供一种信息推荐方法、装置、电子设备及存储介质，以至少解决相关技术中无法有效表征用户真实兴趣，进而造成推荐系统中推荐精准性和效果差的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种信息推荐方法，包括：

响应于目标对象的信息获取请求，获取所述目标对象的长期行为数据集，所述长期行为数据集表征所述目标对象在预设时间段内的多个历史行为数据；

确定待推荐信息集中每个待推荐信息的特征信息；

基于所述每个待推荐信息的特征信息从所述长期行为数据集中，确定所述每个待推荐信息对应的目标行为数据；

将所述目标行为数据输入兴趣识别网络进行兴趣识别，得到所述目标对象对每个待推荐信息的兴趣指标；

基于所述兴趣指标将所述待推荐信息集中的目标信息推荐给所述目标对象。

可选的，所述基于所述每个待推荐信息的特征信息从所述长期行为数据集中，确定所述每个待推荐信息对应的目标行为数据包括：

获取所述长期行为数据集中每个历史行为数据的行为特征信息；

计算每个待推荐信息的特征信息与所述行为特征信息间的第一相似度；

根据所述第一相似度，从所述长期行为数据集中确定所述每个待推荐信息对应的目标行为数据。

可选的，所述响应于目标对象的信息获取请求，获取所述目标对象的长期行为数据集包括：

接收所述目标对象的信息获取请求，所述信息获取请求包括所述目标对象的目标对象标识；

基于所述目标对象标识获取所述目标对象的长期行为数据集。

可选的，所述基于所述对象标识获取所述目标对象的长期行为数据集包括：

获取预先构建的历史行为数据库，所述历史行为数据库包括多个对象的历史行为数据，以及所述多个对象的对象标识与对应的历史行为数据间的映射关系；

根据所述映射关系从所述历史行为数据库中，获取所述目标对象标识对应的历史行为数据；

将所述对应的历史行为数据作为所述目标对象的长期行为数据集。

可选的，所述确定待推荐信息集中每个待推荐信息的特征信息包括：

获取所述每个待推荐信息的主题标签；

基于所述每个待推荐信息的主题标签生成所述每个待推荐信息的特征信息；

或，

提取所述每个待推荐信息的文本信息；

基于所述每个待推荐信息的文本信息生成所述每个待推荐信息的特征信息。

可选的，所述基于所述兴趣指标将所述待推荐信息集中的目标信息推荐给所述目标对象包括：

根据所述兴趣指标从所述待推荐信息集中确定目标信息；

将所述目标信息推荐给所述目标对象。

可选的，所述方法还包括：

获取多个样本推荐信息的信息标识和样本特征信息；

基于每个样本推荐信息的信息标识确定所述每个样本推荐信息对应的历史推荐对象和所述历史推荐对象对应的兴趣标注指标；

获取所述历史推荐对象的长期样本行为数据集；

基于所述每个样本推荐信息的样本特征信息从对应长期样本行为数据集中，确定所述每个样本推荐信息对应的样本行为数据；

将所述样本行为数据输入待训练神经网络进行兴趣识别，得到每个历史推荐对象对对应的样本推荐信息的兴趣预测指标；

根据所述兴趣预测指标和所述兴趣标注指标，确定目标损失；

基于所述目标损失训练所述待训练神经网络，得到所述兴趣识别网络。

可选的，在基于所述每个样本推荐信息的样本特征信息从对应长期样本行为数据集中，确定所述每个样本推荐信息对应的样本行为数据之前，所述方法还包括：

确定所述每个样本推荐信息的推荐时间；

基于所述推荐时间对对应的长期样本行为数据集进行数据过滤，得到过滤行为数据集；

所述基于所述每个样本推荐信息的样本特征信息从对应的长期样本行为数据集中，确定所述每个样本推荐信息对应的样本行为数据包括：

基于所述每个样本推荐信息的样本特征信息从对应的过滤行为数据集中，确定所述每个样本推荐信息对应的样本行为数据。

根据本公开实施例的第二方面，提供一种信息推荐装置，包括：

第一行为数据集获取模块，被配置为执行响应于目标对象的信息获取请求，获取所述目标对象的长期行为数据集，所述长期行为数据集表征所述目标对象在预设时间段内的多个历史行为数据；

特征信息确定模块，被配置为执行确定待推荐信息集中每个待推荐信息的特征信息；

目标行为数据确定模块，被配置为执行基于所述每个待推荐信息的特征信息从所述长期行为数据集中，确定所述每个待推荐信息对应的目标行为数据；

第一兴趣识别模块，被配置为执行将所述目标行为数据输入兴趣识别网络进行兴趣识别，得到所述目标对象对每个待推荐信息的兴趣指标；

信息推荐模块，被配置为执行基于所述兴趣指标将所述待推荐信息集中的目标信息推荐给所述目标对象。

可选的，所述目标行为数据确定模块包括：

行为特征信息获取单元，被配置为执行获取所述长期行为数据集中每个历史行为数据的行为特征信息；

第一相似度计算单元，被配置为执行计算每个待推荐信息的特征信息与所述行为特征信息间的第一相似度；

目标行为数据确定单元，被配置为执行根据所述第一相似度，从所述长期行为数据集中确定所述每个待推荐信息对应的目标行为数据。

可选的，所述第一行为数据集获取模块包括：

信息获取请求接收单元，被配置为执行接收所述目标对象的信息获取请求，所述信息获取请求包括所述目标对象的目标对象标识；

长期行为数据集获取单元，被配置为执行基于所述目标对象标识获取所述目标对象的长期行为数据集。

可选的，所述长期行为数据集获取单元包括：

历史行为数据库获取单元，被配置为执行获取预先构建的历史行为数据库，所述历史行为数据库包括多个对象的历史行为数据，以及所述多个对象的对象标识与对应的历史行为数据间的映射关系；

历史行为数据获取单元，被配置为执行根据所述映射关系从所述历史行为数据库中，获取所述目标对象标识对应的历史行为数据；

长期行为数据集确定单元，被配置为执行将所述对应的历史行为数据作为所述目标对象的长期行为数据集。

可选的，所述特征信息确定模块包括：

第一主题标签获取单元，被配置为执行获取所述每个待推荐信息的主题标签；

第一特征信息生成单元，被配置为执行基于所述每个待推荐信息的主题标签生成所述每个待推荐信息的特征信息；

或，

第一文本信息提取单元，被配置为执行提取所述每个待推荐信息的文本信息；

第二特征信息生成单元，被配置为执行基于所述每个待推荐信息的文本信息生成所述每个待推荐信息的特征信息。

可选的，所述信息推荐模块包括：

目标信息确定单元，被配置为执行根据所述兴趣指标从所述待推荐信息集中确定目标信息；

信息推单元，被配置为执行将所述目标信息推荐给所述目标对象。

可选的，所述装置还包括：

信息获取模块，被配置为执行获取多个样本推荐信息的信息标识和样本特征信息；

模块，被配置为执行基于每个样本推荐信息的信息标识确定所述每个样本推荐信息对应的历史推荐对象和所述历史推荐对象对应的兴趣标注指标；

第二行为数据集获取模块，被配置为执行获取所述历史推荐对象的长期样本行为数据集；

样本行为数确定模块，被配置为执行基于所述每个样本推荐信息的样本特征信息从对应长期样本行为数据集中，确定所述每个样本推荐信息对应的样本行为数据；

第二兴趣识别模块，被配置为执行将所述样本行为数据输入待训练神经网络进行兴趣识别，得到每个历史推荐对象对对应的样本推荐信息的兴趣预测指标；

目标损失确定模块，被配置为执行根据所述兴趣预测指标和所述兴趣标注指标，确定目标损失；

网络训练模块，被配置为执行基于所述目标损失训练所述待训练神经网络，得到所述兴趣识别网络。

可选的，所述装置还包括：

推荐时间确定模块，被配置为执行确定所述每个样本推荐信息的推荐时间；

数据过滤模块，被配置为执行基于所述推荐时间对对应的长期样本行为数据集进行数据过滤，得到过滤行为数据集；

所述样本行为数据确定模块还被配置为执行基于所述每个样本推荐信息的样本特征信息从对应的过滤行为数据集中，确定所述每个样本推荐信息对应的样本行为数据。

根据本公开实施例的第三方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如上述第一方面中任一项所述的方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行本公开实施例的第一方面中任一所述方法。

根据本公开实施例的第五方面，提供一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例的第一方面中任一所述方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

在信息推荐过程中，获取目标对象的长期行为数据集，保证了行为数据的全面性，能够有效反映对象的兴趣喜好，同时结合不同待推荐信息的特征信息有针对性的进行历史行为数据的筛选，使得用于进行兴趣识别的目标行为数据可以有效反映目标对象对待推荐信息的真实兴趣偏好情况，且可以大大降低兴趣识别过程中的数据量，有效提高兴趣识别效率和识别精准性，进而大大提升推荐系统中信息推荐精准性和推荐效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种应用环境的示意图；

图2是根据一示例性实施例示出的一种信息推荐方法的流程图；

图3是根据一示例性实施例示出的一种基于每个待推荐信息的特征信息从长期行为数据集中，确定每个待推荐信息对应的目标行为数据的流程示意图；

图4是根据一示例性实施例示出的一种预先训练兴趣识别网络的流程示意图；

图5是根据一示例性实施例示出的一种预先训练兴趣识别网络的流程示意图；

图6是根据一示例性实施例示出的一种信息推荐装置框图；

图7是根据一示例性实施例示出的一种用于信息推荐的电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

请参阅图1，图1是根据一示例性实施例示出的一种应用环境的示意图，如图1所示，该应用环境可以包括日志数据库01、检索服务器02、历史行为数据库03、训练服务器04、终端05、内容分发服务器06和业务服务器07。

在一个具体的实施例中，日志数据库01可以用于存储推荐系统推荐过程中产生的推荐日志信息。历史行为数据库03可以用于存储推荐系统中大量对象的长期历史行为数据。可选的，历史行为数据库03以对象标识为key(检索参数)，对象对应的历史行为数据集为value(检索参数对应的返回数据)来进行数据存储。

在一个具体的实施例中，检索服务器02可以结合日志数据库01中的推荐日志信息发起长期行为数据集获取请求，从历史行为数据库03中获取推荐系统推荐过的样本推荐信息对应的历史推荐对象的长期样本行为数据集；并将长期样本行为数据集和样本推荐信息作为训练数据发送给训练服务器04。

在一个具体的实施例中，训练服务器04可以结合检索服务器02发送的长期样本行为数据集和样本推荐信息进行兴趣识别网络的训练，并将训练好的兴趣识别网络发送给业务服务器07。

在一个具体的实施例中，终端05可以提供面向用户的信息推荐服务；相应的，用户可以基于终端05触发信息获取请求。

在一个具体的实施例中，终端05触发的信息获取请求可以发送至内容分发服务器06；相应的，由内容分发服务器06向业务服务器07转发该信息获取请求，进而由业务服务器07结合信息获取请求中携带的目标对象的目标对象标识从历史行为数据库03中获取待推荐信息对应的目标对象的目标行为数据，并结合兴趣识别网络进行兴趣识别，进而可以基于兴趣识别的结果进行信息推荐。

在一个可选的实施例中，检索服务器02、训练服务器04、内容分发服务器06和业务服务器07可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。

在一个可选的实施例中，终端05可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、智能可穿戴设备等类型的电子设备。可选的，电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。

在一个可选的实施例中，日志数据库01和历史行为数据库03可以为关系型数据库。

此外，需要说明的是，图1所示的仅仅是本公开提供的一种应用环境，在实际应用中，还可以包括其他应用环境，例如终端05的信息获取请求可以直接发送给业务服务器07，本说明书实施例中，在终端05与业务服务器07间设置的内容分发服务器06可以有效降低业务服务器的请求压力，进而提升信息推荐效率。

本说明书实施例中，上述日志数据库01、检索服务器02、历史行为数据库03、训练服务器04、终端05、内容分发服务器06和业务服务器07可以通过有线或无线通信方式进行直接或间接地连接，本公开在此不做限制。

图2是根据一示例性实施例示出的一种信息推荐方法的流程图，如图2所示，该信息推荐方法用于服务器、边缘计算节点等电子设备中，包括以下步骤：

在步骤S201中，响应于目标对象的信息获取请求，获取目标对象的长期行为数据集。

在一个具体的实施例中，长期行为数据集表征目标对象在预设时间段内的多个历史行为数据。具体的，预设时间段可以结合实际应用需求进行设置，例如1年等。本说明书实施例中，每一历史行为数据可以反映相应的对象对推荐信息行为过程中的关联数据，具体的实施例中，每一历史行为数据可以包括：历史推荐信息的信息标识、历史推荐信息的发布者标识、推荐时间、信息查看时间、历史推荐信息的主题标签、对象对历史推荐信息的行为标签(例如点击，喜欢，关注，转发等)。

在一个具体的实施例中，上述响应于目标对象的信息获取请求，获取目标对象的长期行为数据集包括：接收目标对象的信息获取请求，信息获取请求包括目标对象的目标对象标识；基于目标对象标识获取目标对象的长期行为数据集。

在一个可选的实施例中，上述方法还可以包括：

预先构建历史行为数据库。

具体的，历史行为数据库可以包括多个对象的历史行为数据，以及多个对象的对象标识与对应的历史行为数据间的映射关系。一般的，每个对象往往对应的大量的历史行为数据。

在实际应用中，为了尽快存储足够的历史行为数据，历史行为数据库可以支持两种格式的回填：历史数据回填和推荐事件触发的自动回填。历史数据回填过程中，可以从大量历史日志数据中提取历史行为数据，并回填到历史行为数据库，推荐事件触发的自动回填可以为将实时信息推荐过程中的行为数据更新至历史行为数据库。此外，为了保证数据的一致性，在更新的时候，可以结合推荐时间和历史推荐信息的信息标识进行去重处理。

相应的，上述基于对象标识获取目标对象的长期行为数据集可以包括：

获取预先构建的历史行为数据库，历史行为数据库包括多个对象的历史行为数据，以及多个对象的对象标识与对应的历史行为数据间的映射关系；

根据映射关系从历史行为数据库中，获取目标对象标识对应的历史行为数据；

将对应的历史行为数据作为目标对象的长期行为数据集。

上述实施例中，通过预先构建包括大量对象的历史行为数据，以及大量对象的对象标识与对应的历史行为数据间的映射关系的历史行为数据库，可以便于在接收到目标对象的信息获取请求时，直接结合对象标识快速查询到对象的长期行为数据集。

在步骤S203中，确定待推荐信息集中每个待推荐信息的特征信息。

本说明书实施例中，待推荐信息集中可以包括大量推荐系统中的待推荐信息，可选的待推荐信息可以为视频、图片、文本信息等。

在一个可选的实施例中，确定待推荐信息集中每个待推荐信息的特征信息包括：

1)获取每个待推荐信息的主题标签；

2)基于每个待推荐信息的主题标签生成每个待推荐信息的特征信息；

在实际应用中，待推荐信息的主题标签可以为能够表征待推荐信息主题内容的文本信息。在一个可选的实施例中，一些平台中在用户进行信息发布时，往往会让用户结合预设符号填写信息的主题标签，例如在信息发布编辑页面和后续的发布的信息中，可以通过将主题标签放在预设符号间的方式来区分主题标签，相应的，可以通过匹配预设符号的方式，从信息的相关文本信息中获取主题标签。在一个具体的实施例中，预设符号可以为“##”，当然在实际应用中还可以通过其他符号或方式来区分主题标签。

在另一个可选的实施例中，也可以通过预先训练好的主题标签识别网络来提取待推荐信息的主题标签。具体的，该主题标签是被网络可以为基于大量样本推荐信息和样本推荐信息对应的主题标签对预设神经网络进行主题标签识别训练得到的。

进一步的，基于每个待推荐信息的主题标签生成该待推荐信息的特征信息可以包括获取该主题标签的词向量，相应的，可以将主题标签的词向量作为该待推荐信息的特征信息。

在一个具体的实施例中，可以预先基于预设训练文本信息对预设词向量模型进行训练得到的词向量表征模型，可选的，预设训练文本信息可以为推荐系统中的文本信息。

可选的，在进行词向量表征模型训练过程中，可以将预设训练文本信息进行分词处理，将分词处理后的分次信息输入预设词向量模型进行训练，在训练过程中可以将每个词语映射成K维实数向量，得到词向量表征模型的同时可以得到表征词语之间的语义相似度的词向量集合。以某一系统中的预设训练文本信息对预设词向量模型进行训练，得到的词向量表征模型，可以有效表征该系统中词语之间的语义相似度。

可选的，在训练好词向量表征模型之后，可以将主题标签进行分词后输入该词向量表征模型，该词向量表征模型可以基于词向量集合中的词向量确定上述主题标签对应的分词信息的词向量。进一步的，在主题标签对应的分词信息有多个词的情况下，可以取这多个词的词向量的均值，作为主题标签的词向量；在主题标签对应的分词信息有一个词的情况下，可以将这个词的词向量作为主题标签的词向量。

本说明书实施例中，预设词向量模型可以包括但不限于word2vec、BERT、glove等模型。

在另一个可选的实施例中，上述确定待推荐信息集中每个待推荐信息的特征信息可以包括：

1)提取每个待推荐信息的文本信息；

2)基于每个待推荐信息的文本信息生成每个待推荐信息的特征信息。

在一个可选的实施例中，在推荐信息本身为文本信息的情况下，可以将推荐信息作为文本信息。可选的，在推荐信息为视频的情况下，推荐信息的文本信息可以包括视频中语音信息对应的文本信息、视频封面的文本信息、视频的标题信息、视频中提取的实体文本(实体可以为人物、物体等)以及视频的搜索信息(即在推荐系统中可以基于该搜索信息召回该视频)等。

在一个具体的实施例中，基于每个待推荐信息的文本信息生成每个待推荐信息的特征信息可以为生成待推荐信息的文本信息对应的词向量，相应的，将该对应的词向量待推荐信息的特征信息。生成待推荐信息的文本信息对应的词向量的具体细化可以参见上述相关步骤，在此不再赘述。

在另一个可选的实施例中，也可以结合one-hot(独热)编码网络、N-Gram(汉语语言模型)等特征表征网络来生成待推荐信息的文本信息对应的特征向量，相应的，可以将该特征向量作为待推荐信息的特征信息。

上述实施例中，通过待推荐信息的主题标签或文本信息来生成待推荐信息的特征信息，可以实现对待推荐信息的有效表征，进而保证后续召回与待推荐信息相关的行为数据。

在步骤S205中，基于每个待推荐信息的特征信息从长期行为数据集中，确定每个待推荐信息对应的目标行为数据。

在一个具体的实施例中，如图3所示，上述基于每个待推荐信息的特征信息从长期行为数据集中，确定每个待推荐信息对应的目标行为数据可以包括以下步骤：

在步骤S2051中，获取长期行为数据集中每个历史行为数据的行为特征信息；

在步骤S2053中，计算每个待推荐信息的特征信息与行为特征信息间的第一相似度；

在步骤S2055中，根据第一相似度，从长期行为数据集中确定每个待推荐信息对应的目标行为数据。

在一个可选的实施例中，历史行为数据的行为特征信息为可以结合one-hot编码网络、N-Gram(汉语语言模型)等特征表征网络生成的历史行为数据对应的特征向量。

在一个具体的实施例中，行为特征信息与待推荐信息的特征信息间的第一相似度可以表征历史行为数据与待推荐信息间的关联程度，具体的，行为特征信息与待推荐信息的特征信息间的第一相似度越高，对应的历史行为数据与待推荐信息间的关联程度越高；反之，行为特征信息与待推荐信息的特征信息间的第一相似度越低，对应的历史行为数据与待推荐信息间的关联程度越低。

在一个可选的实施例中，行为特征信息与待推荐信息的特征信息间的第一相似度可以包括但不限于行为特征信息与待推荐信息的特征信息间的余弦距离、欧式距离、曼哈顿距离。

在一个具体的实施例中，可以将与待推荐信息的特征信息的第一相似度大于等于预设阈值的行为特征信息所对应的历史行为数据作为该待推荐信息对应的目标行为数据。

在另一个具体的实施例中，可以将长期行为数据集中每个历史行为数据的行为特征信息与待推荐信息的特征信息间的第一相似度进行降序排序，相应的，可以将排序在前预设数量个行为特征信息所对应的历史行为数据作为该待推荐信息对应的目标行为数据。

本说明书实施例中，预设阈值和预设数量可以预先结合实际应用对信息推荐精准性需求进行设置(待推荐信息与历史行为数据间的关联程度越高，信息推荐的精准性越好)。

上述实施例中，通过待推荐信息的特征信息与历史行为数据的行为特征信息间的相似度，可以从目标对象的长期行为数据集中为每个待推荐信息筛选出关联程度较高的历史行为数据，来作为待推荐信息对应的目标行为数据，保证了用于进行兴趣识别的行为数据可以全面反映对象的兴趣喜好；同时，结合不同待推荐信息的特征信息有针对性的进行历史行为数据的筛选，使得目标行为数据可以有效反映目标对象对待推荐信息的兴趣偏好情况且大大降低兴趣识别过程中的数据量，有效提高兴趣识别效率和识别精准性。

在步骤S207中，将目标行为数据输入兴趣识别网络进行兴趣识别，得到目标对象对每个待推荐信息的兴趣指标。

在一个具体的实施例中，兴趣指标可以表征目标对象对待推荐信息的喜好情况。在一个具体的实施例中，可以预先训练兴趣识别网络，相应的，上述方法还可以包括预先训练兴趣识别网络的步骤，具体的，如图4所示，预先训练兴趣识别网络可以包括以下步骤：

在步骤S401中，获取多个样本推荐信息的信息标识和样本特征信息。

本说明书实施例中，多个样本推荐信息可以为推荐系统中推荐过的信息。在一个具体的实施例中，日志数据库中存储的推荐日志信息中可以包括多个历史推荐事件对应的样本推荐信息、多个历史推荐事件对应的样本推荐信息的信息标识和推荐时间等历史推荐事件的基本信息。相应的，本说明书实施例中，可以从推荐日志信息中获取多个样本推荐信息的信息标识。

在一个具体的实施例中，上述多个样本推荐信息的样本特征信息可以采用下述方式获取：

获取每个样本推荐信息的主题标签；

基于每个样本推荐信息的主题标签生成每个样本推荐信息的样本特征信息；

或，

提取每个样本推荐信息的文本信息；

基于每个样本推荐信息的文本信息生成每个样本推荐信息的样本特征信息。

本说明书实施例中，获取样本推荐信息的样本特征信息的相关步骤的具体细化可以参见上述确定待推荐信息集中每个待推荐信息的特征信息的相关步骤的具体细化，在此不再赘述。

上述实施例中，通过样本推荐信息的主题标签或文本信息来生成样本推荐信息的样本特征信息，可以实现对样本推荐信息的有效表征，进而保证后续召回与样本推荐信息相关的行为数据。

在步骤S403中，基于每个样本推荐信息的信息标识确定每个样本推荐信息对应的历史推荐对象和历史推荐对象对应的兴趣标注指标。

在实际应用中，历史行为数据库中存储的大量历史行为数据可以反映推荐信息被推荐后相应的对象的行为，相应的，每一历史行为数据中可以包括推荐信息(样本推荐信息)的信息标识和对象对该推荐信息的行为标签。

本说明书实施例中，可以将包括样本推荐信息的信息标识的历史行为数据对对应的对象作为该样本推荐信息对应的历史推荐对象。相应的，可以结合历史行为数据中对象对该样本荐信息的行为标签生成兴趣标注指标。

在实际应用中，不同业务场景下，表征对象对一个推荐信息的喜好情况的行为可以不同，且同一业务场景下，也可以由多种表征对象对一个推荐信息的喜好情况的行为。相应的，本说明书实施例中，兴趣标注指标可以结合实际应用场景包括一种或多种行为所反映的对象对推荐信息的喜好情况。在一个具体的实施例中，以通过点击行为来反映对象对推荐信息的喜好情况为例，假设历史行为数据中的行为标签为点击，可选的，兴趣标注指标可以为1(通过1表示点击，0表示未点击)。

在步骤S405中，获取历史推荐对象的长期样本行为数据集。

在一个具体的实施例中，在确定样本推荐信息对应的历史推荐对象之后，可以获取该历史推荐对象的对象标识；可选的，可以结合该对象标识从历史行为数据库中，获取对应的历史行为数据，以作为该历史推荐对象的长期样本行为数据集。

在步骤S407中，基于每个样本推荐信息的样本特征信息从对应长期样本行为数据集中，确定每个样本推荐信息对应的样本行为数据。

在一个具体的实施例中，基于每个样本推荐信息的样本特征信息从对应的长期样本行为数据集中，确定每个样本推荐信息对应的样本行为数据可以包括：

获取长期样本行为数据集中每个样本行为数据的样本行为特征信息；

计算样本行为特征信息与每个样本推荐信息的样本特征信息间的第二相似度；

根据第二相似度，从长期样本行为数据集中确定每个样本推荐信息对应的样本行为数据。

本说明书实施例中，基于每个样本推荐信息的样本特征信息从对应的长期样本行为数据集中，确定每个样本推荐信息对应的样本行为数据的相关步骤的具体细化，可以参见上述基于每个待推荐信息的特征信息从长期行为数据集中，确定每个待推荐信息对应的目标行为数据的相关步骤的具体细化，在此不再赘述。

上述实施例中，通过样本推荐信息的样本特征信息与对应历史推荐对象的历史行为数据的行为特征信息间的相似度，可以从历史推荐对象的长期样本行为数据集中为每个样本推荐信息筛选出关联程度较高的历史行为数据，来作为样本推荐信息对应的样本行为数据，保证了用于进行兴趣识别的样本行为数据可以全面反映对象兴趣喜好；同时，结合不同样本推荐信息有针对性的进行历史行为数据的筛选，使得样本行为数据可以有效反映历史推荐对象对样本推荐信息的兴趣偏好情况，且大大降低兴趣识别过程中的数据量，进而可以提高兴趣识别效率和识别精准性。

在步骤S409中，将样本行为数据输入待训练神经网络进行兴趣识别，得到每个历史推荐对象对对应的样本推荐信息的兴趣预测指标。

在一个具体的实施例中，待训练神经网络可以为待训练的兴趣识别网络。在一个具体的实施例中，待训练神经网络可以包括但不限于卷积神经网络，递归神经网络等。具体的，兴趣预测指标可以表征待训练神经网络预测的每个历史推荐对象对对应的样本推荐信息的喜好情况。在一个可选的实施例中，兴趣预测指标可以为大于等于0小于等于1的数值，相应的，兴趣预测指标的数值越大，表征待训练神经网络预测的历史推荐对象对对应的样本推荐信息的越喜欢。

在步骤S411中，根据兴趣预测指标和兴趣标注指标，确定目标损失。

在一个具体的实施例中，根据兴趣预测指标和兴趣标注指标，确定目标损失可以包括基于预设损失函数计算每个历史推荐对象对应的兴趣预测指标和对应的兴趣标注指标间的损失，并对多个样本推荐信息对应的历史推荐对象对应的损失进行求和，得到上述目标损失。

本说明书实施例中，预设损失函数可以包括但不限于交叉熵损失函数、逻辑损失函数、Hinge(铰链)损失函数、指数损失函数等，本说明书实施例并不以上述为限。

在步骤S413中，基于目标损失训练待训练神经网络，得到兴趣识别网络。

在一个具体的实施例中，基于目标损失训练待训练神经网络，得到兴趣识别网络可以包括

在目标损失不满足预设条件的情况下，更新待训练神经网络中的网络参数；

基于更新后待训练神经网络更新目标损失，至目标损失满足预设条件，将当前的待训练神经网络作为上述兴趣识别网络。

在一个可选的实施例中，目标损失满足预设条件可以为目标损失小于等于指定阈值，或前后两次训练过程中对应的目标损失间的差值小于一定阈值。本说明书实施例中，指定阈值和一定阈值可以为结合实际训练需求进行设置。

此外，需要说明书的是，在实际应用中，当待训练神经网络为待训练的多任务神经网络，相应的，兴趣标注信息可以为多个任务对应的任务标注信息，兴趣预测指标可以为多个任务对应的任务预测信息。

上述实施例中，在兴趣识别网络训练过程中，获取结合样本推荐信息的标识信息确定历史推荐对象及该历史推荐对象对应的兴趣标注指标，并获取历史推荐对象的长期样本行为数据集，保证了训练过程中行为数据的全面性，能够有效反映对象的兴趣喜好，同时结合不同样本推荐信息有针对性的进行历史行为数据的筛选，使得用于进行兴趣识别的样本行为数据可以有效反映历史推荐对象对样本推荐信息的真实兴趣偏好情况，且可以大大降低兴趣识别过程中的数据量，进而有效提高训练出的兴趣识别网络的兴趣识别效率和识别精准性。

在一个可选的实施例中，在基于每个样本推荐信息的样本特征信息从对应长期样本行为数据集中，确定每个样本推荐信息对应的样本行为数据之前，如图5所示，上述方法还包括：

在步骤S415中，确定每个样本推荐信息的推荐时间；

在步骤S417中，基于推荐时间对对应的长期样本行为数据集进行数据过滤，得到过滤行为数据集；

相应的，基于每个样本推荐信息的样本特征信息从对应的长期样本行为数据集中，确定每个样本推荐信息对应的样本行为数据可以包括：

基于每个样本推荐信息的样本特征信息从对应的过滤行为数据集中，确定每个样本推荐信息对应的样本行为数据。

在一个具体的实施例中，样本推荐信息的推荐时间可以从对应的推荐日志信息中获取。

在一个具体的实施例中，基于推荐时间对对应的长期样本行为数据集进行数据过滤，得到过滤行为数据集可以包括从每个样本推荐信息对应的历史推荐对象的长期样本行为数据集中，过滤掉行为时间晚于该每个样本推荐信息的样本行为数据，得到上述过滤行为数据集。

上述实施例中，结合样本推荐信息的推荐时间对对应的长期样本行为数据集进行数据过滤，可以有效防止数据穿越，实现对推荐时间之后产生的历史行为数据的过滤，保证了信息用于进行兴趣识别的行为数据的有效性。

在步骤S209中，基于兴趣指标将待推荐信息集中的目标信息推荐给目标对象。

在一个具体的实施例中，基于兴趣指标将待推荐信息集中的目标信息推荐给目标对象可以包括：根据兴趣指标从待推荐信息集中确定目标信息；将目标信息推荐给目标对象。

在一个具体的实施例中，兴趣指标表征目标对象对待推荐信息集中每个待推荐信息的喜好情况。可选的，该兴趣指标可以为与喜好程度成正比的数值，也可以为表征目标对象对待推荐信息集中每个待推荐信息的喜好程度的字符化表征，例如“中”，可选的，可以结合一定的规则，将字符号表征量化为相应的数值。

在一个可选的实施例中，可以预先结合信息推荐精准性需求设置一个置信度阈值(一般的置信度阈值越高，推荐的信息越精准)，相应的，当兴趣指标对应的数值大于等于该置信度阈值的待推荐信息可以作为目标信息。

由以上本说明书实施例提供的技术方案可见，本说明书实施例中，在信息推荐过程中，获取目标对象的长期行为数据集，保证了行为数据的全面性，能够有效反映对象的兴趣喜好，同时结合不同待推荐信息的特征信息有针对性的进行历史行为数据的筛选，使得用于进行兴趣识别的目标行为数据可以有效反映目标对象对待推荐信息的真实兴趣偏好情况，且可以大大降低兴趣识别过程中的数据量，有效提高兴趣识别效率和识别精准性，进而大大提升推荐系统中信息推荐精准性和推荐效果。

图6是根据一示例性实施例示出的一种信息推荐装置框图。参照图6，该装置包括：

第一行为数据集获取模块610，被配置为执行响应于目标对象的信息获取请求，获取目标对象的长期行为数据集；

特征信息确定模块620，被配置为执行确定待推荐信息集中每个待推荐信息的特征信息；

目标行为数据确定模块630，被配置为执行基于每个待推荐信息的特征信息从长期行为数据集中，确定每个待推荐信息对应的目标行为数据；

第一兴趣识别模块640，被配置为执行将目标行为数据输入兴趣识别网络进行兴趣识别，得到目标对象对每个待推荐信息的兴趣指标；

信息推荐模块650，被配置为执行基于兴趣指标将待推荐信息集中的目标信息推荐给目标对象。

可选的，目标行为数据确定模块630包括：

行为特征信息获取单元，被配置为执行获取长期行为数据集中每个历史行为数据的行为特征信息；

第一相似度计算单元，被配置为执行计算每个待推荐信息的特征信息与行为特征信息间的第一相似度；

目标行为数据确定单元，被配置为执行根据第一相似度，从长期行为数据集中确定每个待推荐信息对应的目标行为数据。

可选的，第一行为数据集获取模块610包括：

信息获取请求接收单元，被配置为执行接收目标对象的信息获取请求，信息获取请求包括目标对象的目标对象标识；

长期行为数据集获取单元，被配置为执行基于目标对象标识获取目标对象的长期行为数据集。

可选的，长期行为数据集获取单元包括：

历史行为数据库获取单元，被配置为执行获取预先构建的历史行为数据库，历史行为数据库包括多个对象的历史行为数据，以及多个对象的对象标识与对应的历史行为数据间的映射关系；

历史行为数据获取单元，被配置为执行根据映射关系从历史行为数据库中，获取目标对象标识对应的历史行为数据；

长期行为数据集确定单元，被配置为执行将对应的历史行为数据作为目标对象的长期行为数据集。

可选的，特征信息确定模块620包括：

第一主题标签获取单元，被配置为执行获取每个待推荐信息的主题标签；

第一特征信息生成单元，被配置为执行基于每个待推荐信息的主题标签生成每个待推荐信息的特征信息；

或，

第一文本信息提取单元，被配置为执行提取每个待推荐信息的文本信息；

第二特征信息生成单元，被配置为执行基于每个待推荐信息的文本信息生成每个待推荐信息的特征信息。

可选的，信息推荐模块650包括：

目标信息确定单元，被配置为执行根据兴趣指标从待推荐信息集中确定目标信息；

信息推单元，被配置为执行将目标信息推荐给目标对象。

可选的，上述装置还包括：

模块，被配置为执行基于每个样本推荐信息的信息标识确定每个样本推荐信息对应的历史推荐对象和历史推荐对象对应的兴趣标注指标；

第二行为数据集获取模块，被配置为执行获取历史推荐对象的长期样本行为数据集；

样本行为数确定模块，被配置为执行基于每个样本推荐信息的样本特征信息从对应长期样本行为数据集中，确定每个样本推荐信息对应的样本行为数据；

第二兴趣识别模块，被配置为执行将样本行为数据输入待训练神经网络进行兴趣识别，得到每个历史推荐对象对对应的样本推荐信息的兴趣预测指标；

目标损失确定模块，被配置为执行根据兴趣预测指标和兴趣标注指标，确定目标损失；

网络训练模块，被配置为执行基于目标损失训练待训练神经网络，得到兴趣识别网络。

可选的，上述装置还包括：

推荐时间确定模块，被配置为执行确定每个样本推荐信息的推荐时间；

数据过滤模块，被配置为执行基于推荐时间对对应的长期样本行为数据集进行数据过滤，得到过滤行为数据集；

样本行为数据确定模块还被配置为执行基于每个样本推荐信息的样本特征信息从对应的过滤行为数据集中，确定每个样本推荐信息对应的样本行为数据。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图7是根据一示例性实施例示出的一种用于信息推荐的电子设备的框图，该电子设备可以是服务器，其内部结构图可以如图7所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括计算机可读存储介质、内存储器。该计算机可读存储介质存储有操作系统和计算机程序。该内存储器为计算机可读存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推荐方法。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在示例性实施例中，还提供了一种电子设备，包括：处理器；用于存储该处理器可执行指令的存储器；其中，该处理器被配置为执行该指令，以实现如本公开实施例中的信息推荐方法。

在示例性实施例中，还提供了一种计算机可读存储介质，当该计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开实施例中的信息推荐方法。可选地，计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例中的信息推荐方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种信息推荐方法，其特征在于，包括：

确定待推荐信息集中每个待推荐信息的特征信息；

根据所述第一相似度，从所述长期行为数据集中确定所述每个待推荐信息对应的目标行为数据；

2.根据权利要求1所述的信息推荐方法，其特征在于，所述响应于目标对象的信息获取请求，获取所述目标对象的长期行为数据集包括：

3.根据权利要求2所述的信息推荐方法，其特征在于，所述基于所述对象标识获取所述目标对象的长期行为数据集包括：

4.根据权利要求1所述的信息推荐方法，其特征在于，所述确定待推荐信息集中每个待推荐信息的特征信息包括：

获取所述每个待推荐信息的主题标签；

或，

提取所述每个待推荐信息的文本信息；

5.根据权利要求1所述的信息推荐方法，其特征在于，所述基于所述兴趣指标将所述待推荐信息集中的目标信息推荐给所述目标对象包括：

根据所述兴趣指标从所述待推荐信息集中确定目标信息；

将所述目标信息推荐给所述目标对象。

6.根据权利要求1至5任一所述的信息推荐方法，其特征在于，所述方法还包括：

获取多个样本推荐信息的信息标识和样本特征信息；

获取所述历史推荐对象的长期样本行为数据集；

7.根据权利要求6所述的信息推荐方法，其特征在于，在基于所述每个样本推荐信息的样本特征信息从对应长期样本行为数据集中，确定所述每个样本推荐信息对应的样本行为数据之前，所述方法还包括：

确定所述每个样本推荐信息的推荐时间；

8.一种信息推荐装置，其特征在于，包括：

目标行为数据确定单元，被配置为执行根据所述第一相似度，从所述长期行为数据集中确定所述每个待推荐信息对应的目标行为数据；

9.根据权利要求8所述的信息推荐装置，其特征在于，所述第一行为数据集获取模块包括：

10.根据权利要求9所述的信息推荐装置，其特征在于，所述长期行为数据集获取单元包括：

11.根据权利要求8所述的信息推荐装置，其特征在于，所述特征信息确定模块包括：

或，

12.根据权利要求8所述的信息推荐装置，其特征在于，所述信息推荐模块包括：

13.根据权利要求8至12任一所述的信息推荐装置，其特征在于，所述装置还包括：

14.根据权利要求13所述的信息推荐装置，其特征在于，所述装置还包括：

15.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至7中任一项所述的信息推荐方法。

16.一种计算机可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至7中任一项所述的信息推荐方法。