CN117454015B

CN117454015B - 一种信息推荐方法及装置

Info

Publication number: CN117454015B
Application number: CN202311746124.XA
Authority: CN
Inventors: 刘艳刚; 董辉; 王芳
Original assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Current assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date: 2023-12-19
Filing date: 2023-12-19
Publication date: 2024-04-12
Anticipated expiration: 2043-12-19
Also published as: CN117454015A

Abstract

本公开涉及人工智能技术领域，提供一种信息推荐方法、装置、计算机设备及计算机可读存储介质。该方法在利用内容推荐模块筛选出待推荐信息后，可以利用内容生成模块在理解用户信息的基础之上，基于目标用户的用户信息对待推荐信息进行调整，得到目标推荐信息。这样，向用户推荐的目标推荐信息既可以涵盖用户觉得有需求的主要内容信息，且可以保证目标推荐信息中没有用户觉得无用的信息的同时，也可以更加自然、易懂，这样，便可以实现更加便于用户更快速的找到想要的信息，能够更好地满足用户需求，提高信息推荐的质量和效率，提高了信息推荐模型的目标推荐信息的精准度，进而提高了用户体验。

Description

一种信息推荐方法及装置

技术领域

本公开涉及人工智能技术领域，尤其涉及一种信息推荐方法及装置。

背景技术

目前，需要结合推荐系统能力，来为用户提供个性化的新闻推荐，帮助用户快速找到感兴趣的新闻。在现有的推荐系统中，更多的还是基于已有的内容，结合用户与内容的偏好匹配度，为用户推荐可能感兴趣的新闻，而不需要浪费时间在无关新闻的浏览上。

随着信息越来越多，内容良莠不齐的问题也越来越严重，一方面，有些内容掺杂了一些不良的负面信息，容易对读者用户造成不好的影响，目前常用的解决方式是基于人工规则和专门的运维人员充当“网管”角色进行筛查，消耗较大的人力、物力成本，且不支持内容的“去糟粕留精华”；另一方面，对于不同年龄、专业的人来说，有不同的阅读习惯，在同一篇新闻内容的接受程度和理解程度会有差异。

如何降低不良信息的识别成本，并将不良信息通过再生成的方式，保留有效信息，去除不良信息；此外，通过对原有新闻内容的个性化生成，提升不同用户获取有效信息的效率，成为目前需要解决的问题。

发明内容

有鉴于此，本公开实施例提供了一种信息推荐方法、装置、计算机设备及计算机可读存储介质，以解决现有技术中如何降低不良信息的识别成本，并将不良信息通过再生成的方式，保留有效信息，去除不良信息，此外，通过对原有新闻内容的个性化生成，提升不同用户获取有效信息的效率的问题。

本公开实施例的第一方面，提供了一种信息推荐方法，所述方法应用于信息推荐模型，所述信息推荐模型包括编码模块、内容推荐模块和内容生成模块；所述方法包括：

获取目标用户的用户信息、若干候选信息和上下文信息；

将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量；

将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，得到待推荐信息；其中，所述待推荐信息为所述若干候选信息中的至少一个候选信息；

将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息；其中，所述目标推荐信息为基于所述用户信息特征向量对所述待推荐信息进行内容调整所得到的。

本公开实施例的第二方面，提供了一种信息推荐装置，所述装置应用于信息推荐模型，所述信息推荐模型包括编码模块、内容推荐模块和内容生成模块；所述装置包括：

信息获取单元，用于获取目标用户的用户信息、若干候选信息和上下文信息；

向量获取单元，用于将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量；

信息处理单元，用于将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，得到待推荐信息；其中，所述待推荐信息为所述若干候选信息中的至少一个候选信息；

信息确定单元，用于将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息；其中，所述目标推荐信息为基于所述用户信息特征向量对所述待推荐信息进行内容调整所得到的。

本公开实施例的第三方面，提供了一种计算机设备，包括存储器、处理器以及存储在存储器中并且可以在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

本公开实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

本公开实施例与现有技术相比存在的有益效果是：本公开实施例应用于信息推荐模型，所述信息推荐模型包括编码模块、内容推荐模块和内容生成模块。本实施例通过获取目标用户的用户信息、若干候选信息和上下文信息；将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量；将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，得到待推荐信息；其中，所述待推荐信息为所述若干候选信息中的至少一个候选信息；将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息；其中，所述目标推荐信息为基于所述用户信息特征向量对所述待推荐信息进行内容调整所得到的。可见，本实施例在利用内容推荐模块筛选出待推荐信息后，可以利用内容生成模块在理解用户信息的基础之上，基于目标用户的用户信息对待推荐信息进行调整，得到目标推荐信息。这样，本实施例中向用户推荐的目标推荐信息既可以涵盖用户觉得有需求的主要内容信息，且可以保证目标推荐信息中没有用户觉得无用的信息（例如不良信息、广告信息）的同时，也可以更加自然、易懂，这样，便可以实现更加便于用户更快速的找到想要的信息，能够更好地满足用户需求，提高信息推荐的质量和效率；也就是说，本实施例可以让信息推荐结果（即目标推荐信息）是用户真正想要的信息且目标推荐信息更加自然、易懂，提升了信息推荐的效率和效果，从而提高实际业务场景中信息推荐模型的信息推荐效果，比如提高了信息推荐模型的信息推荐结果（即目标推荐信息）的精准度，进而提高了用户体验。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本公开实施例的应用场景的场景示意图；

图2是本公开实施例提供的信息推荐方法的流程图；

图3是本公开实施例提供的信息推荐模型的网络架构示意图；

图4是本公开实施例提供的信息推荐装置的框图；

图5是本公开实施例提供的计算机设备的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本公开实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本公开的描述。

下面将结合附图详细说明根据本公开实施例的一种信息推荐方法和装置。

在现有技术中，由于有些内容掺杂了一些不良的负面信息，容易造成不好的影响，目前常用的解决方式是基于人工规则和专门的运维人员充当“网管”角色进行筛查，消耗较大的人力、物力成本，且不支持内容的“去糟粕留精华”；另一方面，对于不同年龄、专业的人来说，有不同的阅读习惯，在同一篇新闻内容的接受程度和理解程度会有差异。

为了解决上述问题，本发明提供了一种信息推荐方法，在本方法中，由于本实施例在利用内容推荐模块筛选出待推荐信息后，可以利用内容生成模块在理解用户信息的基础之上，基于目标用户的用户信息对待推荐信息进行调整，得到目标推荐信息。这样，本实施例中向用户推荐的目标推荐信息既可以涵盖用户觉得有需求的主要内容信息，且可以保证目标推荐信息中没有用户觉得无用的信息（例如不良信息、广告信息）的同时，也可以更加自然、易懂，这样，便可以实现更加便于用户更快速的找到想要的信息，能够更好地满足用户需求，提高信息推荐的质量和效率；也就是说，本实施例可以让信息推荐结果（即目标推荐信息）是用户真正想要的信息且目标推荐信息更加自然、易懂，提升了信息推荐的效率和效果，从而提高实际业务场景中信息推荐模型的信息推荐效果，比如提高了信息推荐模型的信息推荐结果（即目标推荐信息）的精准度，进而提高了用户体验。

举例说明，本发明实施例可以应用到如图1所示的应用场景。在该场景中，可以包括终端设备1和服务器2。

终端设备1可以是硬件，也可以是软件。当终端设备1为硬件时，其可以是具有显示屏且支持与服务器2通信的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等；当终端设备1为软件时，其可以安装在如上该的电子设备中。终端设备1可以实现为多个软件或软件模块，也可以实现为单个软件或软件模块，本公开实施例对此不作限制。进一步地，终端设备1上可以安装有各种应用，例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。

服务器2可以是提供各种服务的服务器，例如，对与其建立通信连接的终端设备发送的请求进行接收的后台服务器，该后台服务器可以对终端设备发送的请求进行接收和分析等处理，并生成处理结果。服务器2可以是一台服务器，也可以是由若干台服务器组成的服务器集群，或者还可以是一个云计算服务中心，本公开实施例对此不作限制。

需要说明的是，服务器2可以是硬件，也可以是软件。当服务器2为硬件时，其可以是为终端设备1提供各种服务的各种电子设备。当服务器2为软件时，其可以是为终端设备1提供各种服务的多个软件或软件模块，也可以是为终端设备1提供各种服务的单个软件或软件模块，本公开实施例对此不作限制。

终端设备1与服务器2可以通过网络进行通信连接。网络可以是采用同轴电缆、双绞线和光纤连接的有线网络，也可以是无需布线就能实现各种通信设备互联的无线网络，例如，蓝牙（Bluetooth）、近场通信（Near Field Communication，NFC）、红外（Infrared）等，本公开实施例对此不作限制。

具体地，用户可以通过终端设备1输入目标用户的用户信息、若干候选信息和上下文信息；终端设备1将目标用户的用户信息、若干候选信息和上下文信息向服务器2发送。服务器2存储有信息推荐模型，所述信息推荐模型包括编码模块、内容推荐模块和内容生成模块。服务器2可以先将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量。然后，服务器2可以将将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，得到待推荐信息；其中，所述待推荐信息为所述若干候选信息中的至少一个候选信息。接着，服务器2可以将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息；其中，所述目标推荐信息为基于所述用户信息特征向量对所述待推荐信息进行内容调整所得到的。接下来，服务器2可以将目标推荐信息向终端设备1发送，以便终端设备1将目标推荐信息向用户展示。这样，由于本实施例中向用户推荐的目标推荐信息既可以涵盖用户觉得有需求的主要内容信息，且可以保证目标推荐信息中没有用户觉得无用的信息（例如不良信息、广告信息）的同时，也可以更加自然、易懂，这样，便可以实现更加便于用户更快速的找到想要的信息，能够更好地满足用户需求，提高信息推荐的质量和效率；也就是说，本实施例可以让信息推荐结果（即目标推荐信息）是用户真正想要的信息且目标推荐信息更加自然、易懂，提升了信息推荐的效率和效果，从而提高实际业务场景中信息推荐模型的信息推荐效果，比如提高了信息推荐模型的信息推荐结果（即目标推荐信息）的精准度，进而提高了用户体验。

需要说明的是，终端设备1和服务器2以及网络的具体类型、数量和组合可以根据应用场景的实际需求进行调整，本公开实施例对此不作限制。

需要注意的是，上述应用场景仅是为了便于理解本公开而示出，本公开的实施方式在此方面不受任何限制。相反，本公开的实施方式可以应用于适用的任何场景。

图2是本公开实施例提供的一种信息推荐方法的流程图。图2的一种信息推荐方法可以由图1的终端设备或服务器执行，具体地，所述方法可以应用于信息推荐模型，如图3所示，所述信息推荐模型可以包括查询模块、召回模块、精排模块、生成模块和判别模块。如图2所示，该信息推荐方法包括：

S201：获取目标用户的用户信息、若干候选信息和上下文信息。

在本实施例中，目标用户可以理解为需要进行信息推荐的用户，目标用户的用户信息可以理解为能够反映目标用户的用户属性的信息，例如，可以包括用户的年龄段、性别、所在地区、感兴趣的信息的类型、历史搜索信息、历史浏览信息（比如新闻浏览记录、视频浏览记录）、每天阅读时间等属用户性的信息。

在本实施例中，可以预先设置有预设数据库，其中，预设数据库中可以预先存储有大量文本信息，比如可以为新闻信息。为了便于描述，可以将预设数据库中所存储的文本信息称之为候选信息，在一种可能的实现方式中，候选文本信息可以为一篇新闻、一篇文章、一段文字或者一本书籍等。

在本实施例中，上下文信息可以理解为能够反映与目标用户、候选信息相关的相关信息，例如，目标用户用于查看信息的设备的设备型号、操作系统，或者，目标用户查看信息的时间等。

S202：将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量。

在获取到目标用户的用户信息、若干候选信息和上下文信息后，可以先将目标用户的用户信息、若干候选信息和上下文信息转换为信息推荐模型能够处理的特征向量，具体地，可以将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量。

可以理解的是，用户信息特征向量为能够反映目标用户的用户属性的特征向量。候选信息特征向量为能够反映候选信息的文本内容意思的特征向量，例如，候选信息特征向量可以反映候选信息中的关键词、短语和标题等相关信息。上下文信息特征向量可以理解为能够反映与目标用户、候选信息相关的相关信息的特征向量，即上下文信息特征向量能够反映目标用户与候选信息之间的联系。

S203：将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，得到待推荐信息。

在本实施例中，可以利用内容推荐模块对候选信息进行筛选，以筛选出最符合目标用户需求以及上下文信息的候选信息。需要说明的是，在本实施例中，可以将内容推荐模块所筛选出侧候选信息称之为待推荐信息。获取到所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量后，可以将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，内容推荐模块可以根据用户信息特征向量和上下文信息特征向量，确定与用户信息特征向量、上下文信息特征向量最匹配的候选信息特征向量，接着，内容推荐模块可以将与用户信息特征向量、上下文信息特征向量最匹配的候选信息特征向量对应的候选信息作为待推荐信息进行输出。可以理解的是，所述待推荐信息为所述若干候选信息中的至少一个候选信息，也就是说，待推荐信息可以是若干候选信息中的一个或多个。

S204：将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息。

在本实施例中，获取到待推荐信息后，可以将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，以利用内容生成模块根据用户信息特征向量对待推荐信息进行调整，得到目标推荐信息，即所述目标推荐信息为基于所述用户信息特征向量对所述待推荐信息进行内容调整所得到的。例如，内容生成模块可以将待推荐信息调整成目标用户更喜欢、更容易理解的文字表达，和/或，将待推荐信息中目标用户觉得无用的信息（例如不良信息、广告信息）进行删除，和/或，将待推荐信息中的文本内容转换为目标用户更容易接受、理解的展示形式，比如图片、视频的形式。可以理解的是，目标推荐信息的展示形式可以包括以下至少一种：文本、图片、视频等。

在一些实施例中，所述编码模块包括第一编码子模块和第二编码子模块；S202“将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量”，具体可以包括以下步骤：

S201：将所述目标用户的用户信息、所述候选信息和所述上下文信息分别输入所述第一编码子模块，得到所述目标用户的用户信息对应的稠密向量、所述候选信息对应的稠密向量和所述上下文信息对应的稠密向量。

在本实施例中，获取到所述目标用户的用户信息、所述候选信息和所述上下文信息后，可以利用第一编码子模块分别对所述目标用户的用户信息、所述候选信息和所述上下文信息进行编码，得到所述目标用户的用户信息对应的稠密向量、所述候选信息对应的稠密向量和所述上下文信息对应的稠密向量。

S202：将所述目标用户的用户信息对应的稠密向量、所述候选信息对应的稠密向量和所述上下文信息对应的稠密向量分别输入所述第二编码子模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量。

在一些实施例中，所述第二编码子模块包括one-hot编码模块和双向编码模块。获取到所述目标用户的用户信息对应的稠密向量、所述候选信息对应的稠密向量和所述上下文信息对应的稠密向量后，可以根据稠密向量的特征类型判断需要输入哪个第二编码子模块进行梳理。

具体地，针对所述目标用户的用户信息对应的稠密向量，将特征类型为离散特征的稠密向量输入所述one-hot编码模块，得到所述用户信息对应的第一特征向量；将特征类型为连续特征的稠密向量作为所述用户信息对应的第二特征向量；将特征类型为请求特征的稠密向量输入所述双向编码模块，得到所述用户信息对应的第三特征向量；将所述用户信息对应的第一特征向量、第二特征向量和第三特征向量进行拼接，得到所述用户信息特征向量。

针对所述目标用户的候选信息对应的稠密向量，将特征类型为离散特征的稠密向量输入所述one-hot编码模块，得到所述候选信息对应的第一特征向量；将特征类型为连续特征的稠密向量作为所述候选信息对应的第二特征向量；将特征类型为离散特征的稠密向量输入所述双向编码模块，得到所候选信息对应的第三特征向量；将所述候选信息对应的第一特征向量、第二特征向量和第三特征向量进行拼接，得到所述候选信息特征向量，

针对所述目标用户的上下文信息对应的稠密向量，将特征类型为离散特征的稠密向量输入所述one-hot编码模块，得到所述上下文信息对应的第一特征向量；将特征类型为连续特征的稠密向量作为所述上下文信息对应的第二特征向量；将特征类型为离散特征的稠密向量输入所述双向编码模块，得到所述上下文信息对应的第三特征向量；将所述上下文信息对应的第一特征向量、第二特征向量和第三特征向量进行拼接，得到所述上下文信息特征向量。

接下来，结合图3举例说明，以目标用户的用户信息对应的稠密向量为例，且候选信息为新闻信息。目标用户的用户信息对应的稠密向量归为3类：离散特征，连续特征，query特征（即请求特征）。假设目标用户A，其离散特征为：男、上海人、喜欢军事、IT新闻；连续特征为：23岁、每天阅读3小时；query特征为：“手机发布时间”。可以将目标用户A的3种不同类型的特征进行编码，离散特征使用one-hot编码模块，连续特征直接使用，请求特征使用Bert(双向Encoder表征器，即双向编码模块)模型编码，最终将三个维度的向量拼接，获得用户信息特征向量。即将特征类型为离散特征“男、上海人、喜欢军事、IT新闻”的稠密向量输入所述one-hot编码模块，得到所述用户信息对应的第一特征向量；将特征类型为连续特征“23岁、每天阅读3小时”的稠密向量作为所述用户信息对应的第二特征向量；将特征类型为请求特征“手机发布时间”的稠密向量输入所述双向编码模块，得到所述用户信息对应的第三特征向量；将所述用户信息对应的第一特征向量、第二特征向量和第三特征向量进行拼接，得到所述用户信息特征向量。

在一些实施例中，所述内容推荐模块为深度神经网络（即DNN）。S203“将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，得到待推荐信息”，具体可以包括以下步骤：

S203a：针对每一候选信息，所述内容推荐模块根据所述用户信息特征向量、所述候选信息对应的候选信息特征向量和所述上下文信息特征向量，确定所述候选信息对应的匹配度。

在本实施例中，所述候选信息对应的匹配度用于表征所述候选信息与所述目标用户的匹配程度。可以理解的是，候选信息对应的匹配度越高，说明所述候选信息与所述目标用户的匹配程度越高，即该候选信息为目标用户真正希望被推荐的信息的可能性越高，反之，候选信息对应的匹配度越低，说明所述候选信息与所述目标用户的匹配程度越低，即该候选信息为目标用户真正希望被推荐的信息的可能性越低。

作为一种示例，针对每一候选信息，可以将所述用户信息特征向量、所述候选信息对应的候选信息特征向量和所述上下文信息特征向量拼接在一起输入DNN(深度神经网络)中获取所述候选信息对应的匹配度，从而确定了所述候选信息对应的匹配度。

S203b：所述内容推荐模块将匹配度满足预设条件的候选信息作为待推荐信息。

其中，所述预设条件为候选信息对应的匹配度为最高的，或者，候选信息对应的匹配度在全部候选信息对应的匹配度由高到低的排序结果中位于前N位，其中，N为正整数。

在一些实施例中，所述内容生成模块为生成式预训练Transformer模型，举例来说，可以为在参数量达到1.0B之上的大规模语言模型，比如GPT3.5或者GPT4。S204“将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息”，具体可以包括以下步骤：

S204a：若所述内容生成模块检测到所述待推荐信息包括预设类型内容，则所述内容生成模块将所述预设类型内容从所述待推荐信息中删除，得到第一调整推荐信息；

S204b：所述内容生成模块根据所述用户信息特征向量，对所述第一调整推荐信息进行文本内容调整，得到第二调整推荐信息；

S204c：所述内容生成模块根据所述用户信息特征向量，生成所述第二调整推荐信息对应的配图图片；

S204d：所述内容生成模块将所述第二调整推荐信息和所述第二调整推荐信息对应的配图图片作为目标推荐信息。

在本实施例中，若所述内容生成模块检测到所述待推荐信息包括预设类型内容，其中，预设类型内容可以为敏感、违规的内容，比如涉及到不良的内容；则所述内容生成模块可以将所述预设类型内容从所述待推荐信息中删除，得到第一调整推荐信息。例如，有些待推荐信息（比如新闻）配图违规，令人反感，可以使用内容生成模块进行监测并删除。

进一步，为了保证用户的体验更好，所述内容生成模块可以根据所述用户信息特征向量，对所述第一调整推荐信息进行文本内容调整，得到第二调整推荐信息。作为一种示例，内容生成模块可以根据所述用户信息特征向量确定目标用户对应的年龄段，并根据目标用户对应的年龄段对所述第一调整推荐信息进行文本内容调整，得到第二调整推荐信息。比如有的新闻内容，过于生涩，不适宜青少年阅读或者文化不够丰富的群体读起来会有困难，可以使用内容生成模块对待推荐信息进行个性化的润色和修饰，去除修改晦涩难懂的名词。

更进一步的，所述内容生成模块可以根据所述用户信息特征向量，生成所述第二调整推荐信息对应的配图图片。作为一种示例，内容生成模块可以根据所述用户信息特征向量确定目标用户对应的年龄段，并根据目标用户对应的年龄段，生成所述第二调整推荐信息对应的配图图片。例如有些待推荐信息（比如新闻）太过于平淡，使用内容生成模块进行漫画风格的转换，可以吸引用户阅读。基于内容生成模块的待推荐信息（比如新闻）内容多模态丰富，使得信息推荐系统的生态更加完善和智能。

结合图3举例说明，待推荐信息为新闻时，对目标用户推荐的待推荐信息，可以在原始的人工撰写的新闻内容之上，进行修改，增加更多年轻化以及用户本身的元素内容，增加有趣的配图辅助理解，提升用户体验，通过多模态内容转化操作，吸引目标用户进行深入阅读，能够有效提升用户的体验及留存率，对于平台上能有效提升其转化价值。

在一些实施例中，在S204之后，方法还可以包括以下步骤：

步骤a：将所述目标推荐信息在目标页面进行展示；

步骤b：若检测到用户针对所述目标推荐信息执行采纳操作，则将所述目标推荐信息以及所述目标推荐信息对应的候选消息作为正样本；以及，将所述正样本作为训练样本存储至反馈数据库；

步骤c：若检测到用户针对所述目标推荐信息执行不采纳操作，则将所述目标推荐信息以及所述目标推荐信息对应的候选消息作为负样本；以及，将所述负样本作为训练样本存储至反馈数据库；

步骤d：利用所述反馈数据库中的训练样本对所述信息推荐模型进行模型训练。

作为一种示例，可以在展示目标推荐信息的目标页面中，针对目标推荐信息设置一个采纳按钮（例如点赞按钮）和一个不采纳按钮（例如点踩按钮）。如果用户觉得所展示的目标推荐信息的质量较高，符合用户预期，用户点击了采纳按钮（即检测到用户针对目标推荐信息执行采纳操作），则可以将所述目标推荐信息以及所述目标推荐信息对应的候选消息作为正样本，即将所述目标推荐信息、所述目标推荐信息对应的候选消息以及采纳结果作为正样本；以及，将所述正样本作为训练样本存储至反馈数据库。反之，如果用户觉得所展示的目标推荐信息的质量不高，用户点击了不采纳按钮（即检测到用户针对所述目标推荐信息执行不采纳操作），则可以将所述目标推荐信息以及所述目标推荐信息对应的候选消息作为负样本，即将所述目标推荐信息、所述目标推荐信息对应的候选消息以及不采纳结果作为负样本；以及，将所述负样本作为训练样本存储至反馈数据库。并利用所述反馈数据库中的训练样本对所述信息推荐模型进行模型训练，即利用所述反馈数据库中的训练样本对所述信息推荐模型的模型参数进行调整，使得信息推荐模型的精度更高。可见，本实施例可以基于用户对目标推荐信息的反馈（即用户针对目标推荐信息所执行的采纳操作或不采纳操作的结果）对信息推荐模型进行模型校正，不断提升信息推荐模型所输出的目标推荐信息的准确性。

结合图3举例说明，用户可以在线对生成的新闻列表（即目标推荐信息）进行反馈，点赞或者点踩，通过显示的反馈，信息推荐模型都能够得到即时的修正。在线学习模块，基于强化学习，通过信息推荐模型接收用户的正负反馈，实时微调内部的参数，可以使得信息推荐模型的信息推荐结果更加准确。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。

图4是本公开实施例提供的信息推荐装置的示意图。如图4所示，所述装置应用于信息推荐模型，所述信息推荐模型包括编码模块、内容推荐模块和内容生成模块；所述装置包括：

信息获取单元401，用于获取目标用户的用户信息、若干候选信息和上下文信息；

向量获取单元402，用于将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量；

信息处理单元403，用于将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，得到待推荐信息；其中，所述待推荐信息为所述若干候选信息中的至少一个候选信息；

信息确定单元404，用于将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息；其中，所述目标推荐信息为基于所述用户信息特征向量对所述待推荐信息进行内容调整所得到的。

可选的，所述编码模块包括第一编码子模块和第二编码子模块；所述向量获取单元402，用于：

将所述目标用户的用户信息、所述候选信息和所述上下文信息分别输入所述第一编码子模块，得到所述目标用户的用户信息对应的稠密向量、所述候选信息对应的稠密向量和所述上下文信息对应的稠密向量；

将所述目标用户的用户信息对应的稠密向量、所述候选信息对应的稠密向量和所述上下文信息对应的稠密向量分别输入所述第二编码子模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量。

可选的，所述第二编码子模块包括one-hot编码模块和双向编码模块；所述向量获取单元402，用于：

针对所述目标用户的用户信息对应的稠密向量，将特征类型为离散特征的稠密向量输入所述one-hot编码模块，得到所述用户信息对应的第一特征向量；将特征类型为连续特征的稠密向量作为所述用户信息对应的第二特征向量；将特征类型为请求特征的稠密向量输入所述双向编码模块，得到所述用户信息对应的第三特征向量；将所述用户信息对应的第一特征向量、第二特征向量和第三特征向量进行拼接，得到所述用户信息特征向量；

针对所述目标用户的候选信息对应的稠密向量，将特征类型为离散特征的稠密向量输入所述one-hot编码模块，得到所述候选信息对应的第一特征向量；将特征类型为连续特征的稠密向量作为所述候选信息对应的第二特征向量；将特征类型为离散特征的稠密向量输入所述双向编码模块，得到所述候选信息对应的第三特征向量；将所述候选信息对应的第一特征向量、第二特征向量和第三特征向量进行拼接，得到所述候选信息特征向量；

可选的，所述信息处理单元403，用于：

针对每一候选信息，所述内容推荐模块根据所述用户信息特征向量、所述候选信息对应的候选信息特征向量和所述上下文信息特征向量，确定所述候选信息对应的匹配度；所述候选信息对应的匹配度用于表征所述候选信息与所述目标用户的匹配程度；

所述内容推荐模块将匹配度满足预设条件的候选信息作为待推荐信息。

可选的，信息确定单元404，用于：

若所述内容生成模块检测到所述待推荐信息包括预设类型内容，则所述内容生成模块将所述预设类型内容从所述待推荐信息中删除，得到第一调整推荐信息；

所述内容生成模块根据所述用户信息特征向量，对所述第一调整推荐信息进行文本内容调整，得到第二调整推荐信息；

所述内容生成模块根据所述用户信息特征向量，生成所述第二调整推荐信息对应的配图图片；

所述内容生成模块将所述第二调整推荐信息和所述第二调整推荐信息对应的配图图片作为目标推荐信息。

可选的，所述内容推荐模块为深度神经网络；所述内容生成模块为生成式预训练Transformer模型。

可选的，所述装置还包括训练单元，用于：

将所述目标推荐信息在目标页面进行展示；

若检测到用户针对所述目标推荐信息执行采纳操作，则将所述目标推荐信息以及所述目标推荐信息对应的候选消息作为正样本；以及，将所述正样本作为训练样本存储至反馈数据库；

若检测到用户针对所述目标推荐信息执行不采纳操作，则将所述目标推荐信息以及所述目标推荐信息对应的候选消息作为负样本；以及，将所述负样本作为训练样本存储至反馈数据库；

利用所述反馈数据库中的训练样本对所述信息推荐模型进行模型训练。

本公开实施例与现有技术相比存在的有益效果是：本公开实施例提供了一种信息推荐装置，所述装置应用于信息推荐模型，所述信息推荐模型包括编码模块、内容推荐模块和内容生成模块；所述装置包括：信息获取单元，用于获取目标用户的用户信息、若干候选信息和上下文信息；向量获取单元，用于将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量；信息处理单元，用于将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，得到待推荐信息；其中，所述待推荐信息为所述若干候选信息中的至少一个候选信息；信息确定单元，用于将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息；其中，所述目标推荐信息为基于所述用户信息特征向量对所述待推荐信息进行内容调整所得到的。可见，本实施例在利用内容推荐模块筛选出待推荐信息后，可以利用内容生成模块在理解用户信息的基础之上，基于目标用户的用户信息对待推荐信息进行调整，得到目标推荐信息。这样，本实施例中向用户推荐的目标推荐信息既可以涵盖用户觉得有需求的主要内容信息，且可以保证目标推荐信息中没有用户觉得无用的信息（例如不良信息、广告信息）的同时，也可以更加自然、易懂，这样，便可以实现更加便于用户更快速的找到想要的信息，能够更好地满足用户需求，提高信息推荐的质量和效率；也就是说，本实施例可以让信息推荐结果（即目标推荐信息）是用户真正想要的信息且目标推荐信息更加自然、易懂，提升了信息推荐的效率和效果，从而提高实际业务场景中信息推荐模型的信息推荐效果，比如提高了信息推荐模型的信息推荐结果（即目标推荐信息）的精准度，进而提高了用户体验。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本公开实施例的实施过程构成任何限定。

图5是本公开实施例提供的计算机设备5的示意图。如图5所示，该实施例的计算机设备5包括：处理器501、存储器502以及存储在该存储器502中并且可以在处理器501上运行的计算机程序503。处理器501执行计算机程序503时实现上述各个方法实施例中的步骤。或者，处理器501执行计算机程序503时实现上述各装置实施例中各模块/模块的功能。

示例性地，计算机程序503可以被分割成一个或多个模块/模块，一个或多个模块/模块被存储在存储器502中，并由处理器501执行，以完成本公开。一个或多个模块/模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序503在计算机设备5中的执行过程。

计算机设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算机设备。计算机设备5可以包括但不仅限于处理器501和存储器502。本领域技术人员可以理解，图5仅仅是计算机设备5的示例，并不构成对计算机设备5的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如，计算机设备还可以包括输入输出设备、网络接入设备、总线等。

处理器501可以是中央处理模块（Central Processing Unit，CPU），也可以是其它通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器502可以是计算机设备5的内部存储模块，例如，计算机设备5的硬盘或内存。存储器502也可以是计算机设备5的外部存储设备，例如，计算机设备5上配备的插接式硬盘，智能存储卡（Smart Media Card，SMC），安全数字（Secure Digital，SD）卡，闪存卡（Flash Card）等。进一步地，存储器502还可以既包括计算机设备5的内部存储模块也包括外部存储设备。存储器502用于存储计算机程序以及计算机设备所需的其它程序和数据。存储器502还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能模块、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块、模块完成，即将装置的内部结构划分成不同的功能模块或模块，以完成以上描述的全部或者部分功能。实施例中的各功能模块、模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中，上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。另外，各功能模块、模块的具体名称也只是为了便于相互区分，并不用于限制本公开的保护范围。上述系统中模块、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

在本公开所提供的实施例中，应该理解到，所揭露的装置/计算机设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/计算机设备实施例仅仅是示意性的，例如，模块或模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或模块的间接耦合或通讯连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

集成的模块/模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本公开实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在计算机可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如，在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围，均应包含在本公开的保护范围之内。

Claims

1.一种信息推荐方法，其特征在于，所述方法应用于信息推荐模型，所述信息推荐模型包括编码模块、内容推荐模块和内容生成模块；所述方法包括：

获取目标用户的用户信息、若干候选信息和上下文信息；

将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息；其中，所述目标推荐信息为基于所述用户信息特征向量对所述待推荐信息进行内容调整所得到的；

所述编码模块包括第一编码子模块和第二编码子模块；所述将所述目标用户的用户信息、所述候选信息和所述上下文信息输入所述编码模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量，包括：

将所述目标用户的用户信息对应的稠密向量、所述候选信息对应的稠密向量和所述上下文信息对应的稠密向量分别输入所述第二编码子模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量；

所述第二编码子模块包括one-hot编码模块和双向编码模块；

所述将所述目标用户的用户信息对应的稠密向量、所述候选信息对应的稠密向量和所述上下文信息对应的稠密向量分别输入所述第二编码子模块，得到用户信息特征向量、候选信息特征向量和上下文信息特征向量，包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述用户信息特征向量、所述候选信息特征向量和所述上下文信息特征向量输入所述内容推荐模块，得到待推荐信息，包括：

3.根据权利要求1所述的方法，其特征在于，所述将所述待推荐信息和所述用户信息特征向量输入所述内容生成模块，得到目标推荐信息，包括：

4.根据权利要求1-3中任一所述的方法，其特征在于，所述内容推荐模块为深度神经网络；所述内容生成模块为生成式预训练Transformer模型。

5.根据权利要求1-3中任一所述的方法，其特征在于，所述方法还包括：

将所述目标推荐信息在目标页面进行展示；

6.一种信息推荐装置，用于实现权利要求1-5中任一项所述的方法，其特征在于，所述装置应用于信息推荐模型，所述信息推荐模型包括编码模块、内容推荐模块和内容生成模块；所述装置包括：

7.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并且在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述方法的步骤。

8.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述方法的步骤。