CN117938951B

CN117938951B - 信息推送方法、装置、计算机设备和存储介质

Info

Publication number: CN117938951B
Application number: CN202410341747.7A
Authority: CN
Inventors: 叶祺; 赵军; 秦子淳; 王峰
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2024-03-25
Filing date: 2024-03-25
Publication date: 2024-05-24
Anticipated expiration: 2044-03-25
Also published as: CN117938951A

Abstract

本申请涉及一种信息推送方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：获取交互物品标识序列，交互物品标识序列中包括用户的各个交互物品标识；基于交互物品标识序列获取交互物品特征序列和交互行为特征序列；将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，并提取融合特征序列中融合特征的自相关信息，得到自相关特征序列；从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列；增强特征序列用于进行物品信息推送。采用本方法能够提高信息推送的准确性。

Description

信息推送方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能技术领域，特别是涉及一种信息推送方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

随着人工智能技术的发展，出现了信息推送技术，通过信息推送技术可以提取用户的表征，然后通过计算用户的表征与要推送的信息的表征之间的相似度来确定是否进行信息推送。目前，在提取用户的表征时，通常是获取用户的历史行为信息来提取用户的嵌入表征，然而通过用户的历史行为信息提取得到的用户的嵌入表征准确性较低，容易导致信息推送的准确性降低，进而造成推送资源的浪费。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高信息推送准确性，进而节省推送资源的信息推送方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

一方面，本申请提供了一种信息推送方法。所述方法包括：

获取交互物品标识序列，交互物品标识序列中包括用户的各个交互物品标识；

基于交互物品标识序列获取交互物品特征序列和交互行为特征序列，交互物品特征序列是对各个交互物品标识的物品信息进行特征提取得到的，交互行为特征序列是对各个交互物品标识的交互行为信息进行特征提取得到的，交互行为信息是从交互物品标识所属于的交互场景获取到的；

将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，并提取融合特征序列中融合特征的自相关信息，得到自相关特征序列；

从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列；增强特征序列用于预测得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度进行物品信息推送。

第二方面，本申请还提供了一种信息推送装置。所述装置包括：

标识序列获取模块，用于获取交互物品标识序列，交互物品标识序列中包括用户的各个交互物品标识；

特征序列获取模块，用于基于交互物品标识序列获取交互物品特征序列和交互行为特征序列，交互物品特征序列是对各个交互物品标识的物品信息进行特征提取得到的，交互行为特征序列是对各个交互物品标识的交互行为信息进行特征提取得到的，交互行为信息是从交互物品标识所属于的交互场景获取到的；

特征提取模块，用于将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，并提取融合特征序列中融合特征的自相关信息，得到自相关特征序列；

推送模块，用于从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列；增强特征序列用于预测得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度进行物品信息推送。

另一方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述信息推送方法的步骤。

另一方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述信息推送方法的步骤。

另一方面，本申请还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述信息推送方法的步骤。

上述信息推送方法、装置、计算机设备、存储介质和计算机程序产品，通过获取交互物品标识序列，交互物品标识序列中包括用户的各个交互物品标识；将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，并提取融合特征序列中融合特征的自相关信息，得到自相关特征序列；从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列，即通过使用多个场景特征增强信息对自相关特征序列进行特征增强，能够更好的拟合物品信息和交互场景的交互行为信息，提高得到的增强特征序列的准确性。然后增强特征序列可以用于预测得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度进行物品信息推送，即通过使用准确性高的增强特征序列进行预测并进行信息推送，提高了信息推送的准确性，即可以减少将交互程度低的物品信息进行推送，节省了推送资源。

附图说明

图1为一个实施例中信息推送方法的应用环境图；

图2为一个实施例中信息推送方法的流程示意图；

图3为一个具体实施例中大语言模型的网络架构示意图；

图4为一个实施例中得到增强特征序列的流程示意图；

图5为另一个实施例中得到增强特征序列的流程示意图；

图6为一个具体实施例中得到增强特征序列的网络架构示意图；

图7为一个具体实施例中稀疏混合专家网络的网络架构示意图；

图8为一个具体实施例中得到深度增强特征序列的网络架构图；

图9为一个具体实施例中信息推送模型的模型架构示意图；

图10为一个具体实施例中信息推送方法的原理示意图；

图11为一个具体实施例中信息推送方法的流程示意图；

图12为一个实施例中信息推送方法装置的结构框图；

图13为一个实施例中计算机设备的内部结构图；

图14为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

自然语言处理(Nature Language processing, NLP)是计算机科学领域与人工智能领域中的重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理涉及自然语言，即人们日常使用的语言，与语言学研究密切；同时涉及计算机科学和数学。人工智能领域模型训练的重要技术，预训练模型，即是从NLP领域的大语言模型（Large Language Model）发展而来。经过微调，大语言模型可以广泛应用于下游任务。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

计算机视觉技术(Computer Vision, CV)计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。大模型技术为计算机视觉技术发展带来重要变革，swin-transformer，ViT，V-MOE，MAE等视觉领域的预训练模型经过微调（fine tune）可以快速、广泛适用于下游具体任务。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

本申请实施例提供的方案涉及人工智能的文本语义理解、图像语义理解、机器翻译等技术，具体通过如下实施例进行说明：

本申请实施例提供的信息推送方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以单独设置，可以集成在服务器104上，也可以放在云上或其他服务器上。服务器104可以接收到用户的终端102发送的信息推送请求，根据信息推送请求获取交互物品标识序列，交互物品标识序列中包括用户的各个交互物品标识；服务器104基于交互物品标识序列获取交互物品特征序列和交互行为特征序列，交互物品特征序列是对各个交互物品标识的物品信息进行特征提取得到的，交互行为特征序列是对各个交互物品标识的交互行为信息进行特征提取得到的，交互行为信息是从交互物品标识所属于的交互场景获取到的；服务器104将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，并提取融合特征序列中融合特征的自相关信息，得到自相关特征序列；服务器104从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列；服务器使用增强特征序列预测得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度，向用户的终端102进行物品信息推送。其中，终端可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

在一个实施例中，如图2所示，提供了一种信息推送方法，以该方法应用于图1中的服务器为例进行说明，可以理解的是，该方法也可以应用于终端，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：

S202，获取交互物品标识序列，交互物品标识序列中包括用户的各个交互物品标识。

其中，交互物品标识用于唯一标识交互物品，交互物品是指用户存在交互行为的物品，该交互行为是指用户与物品的物品信息之间存在交互的行为，该交互的行为可以是用户对物品信息的各种操作，包括但不限于用户浏览物品信息、用户点击物品信息、用户评论物品信息、用户转发物品信息等等。交互物品标识序列是用户的各个交互物品标识形成的序列，比如，可以是用户的各个交互物品的ID（Identity document，唯一编码）形成的序列。该交互物品标识序列的序列顺序可以是根据用户与物品信息交互的先后顺序确定的，即在先交互的交互物品标识在序列前，在后交互的交互物品标识在序列后。该交互物品标识序列的序列顺序也可以是根据用户与物品信息交互的次数确定的，即交互次数越多的交互物品标识在交互物品标识序列的序列顺序就越前，交互次数越少的交互物品标识在交互物品标识序列的序列顺序就越后。该交互物品标识序列的序列顺序还可以是根据人为设置好的顺序。

具体地，服务器可以直接从数据库中获取到交互物品标识序列。服务器也可以获取到提供信息推送服务的服务方获取到交互物品标识序列。服务器还可以获取到终端上传的交互物品标识序列。服务器还可以从提供数据服务的服务方获取到交互物品标识序列。服务器也可以获取到用户的各个交互物品标识，然后将各个交互物品标识进行排序，得到交互物品标识序列。比如，服务器可以从数据库中获取到用户的各个交互物品标识和每个交互物品标识对应的交互时间点，然后服务器根据交互时间点的先后顺序将各个交互物品标识进行排序，得到交互物品标识序列。又比如，服务器可以从数据库中获取到用户的各个交互物品标识和每个交互物品标识对应的重要性，然后服务器根据重要性的大小顺序将各个交互物品标识进行排序，得到交互物品标识序列。还比如，服务器可以从数据库中获取到用户的各个交互物品标识和每个交互物品标识对应的交互次数，然后服务器根据交互次数的大小顺序将各个交互物品标识进行排序，得到交互物品标识序列。

S204，基于交互物品标识序列获取交互物品特征序列和交互行为特征序列，交互物品特征序列是对各个交互物品标识的物品信息进行特征提取得到的，交互行为特征序列是对各个交互物品标识的交互行为信息进行特征提取得到的，交互行为信息是从交互物品标识所属于的交互场景获取到的。

其中，交互物品特征序列是用户的各个交互物品特征形成的序列，交互物品特征用于表征用户的交互物品，是对对应交互物品标识的物品信息进行特征提取得到的。物品信息是指用于描述交互物品标识对应交互物品的信息，物品信息可以是多模态的信息，比如，可以是包括图片、文本以及音频中至少一种的物品信息。交互行为特征序列用户的各个交互行为特征形成的序列，交互行为特征用于表征用户对交互物品的交互行为，是对对应交互物品标识的交互行为信息进行特征提取得到的。交互行为信息是用于描述用户对交互物品的交互行为的信息，可以是文本信息，比如，交互行为信息可以是描述对交互物品的物品信息进行了点击操作的文本信息，即交互行为信息可以是“点击了物品A”。交互场景是指用于展示交互物品的物品信息的具体场景，比如，可以是客户端场景、网页端场景、手机端场景等等。在不同的交互场景同一交互行为对交互物品的交互方式可以不同。同一个交互物品在不同的交互场景中可以获取到不同的交互行为信息，比如，物品A的交互行为信息可以是“场景1点击了物品A”以及“场景2点击物品A”。该交互物品特征序列的序列顺序以及交互行为特征序列的序列顺序与交互物品标识序列的序列顺序一致。比如，交互物品特征序列中第一个交互物品特征是交互物品标识序列中第一个交互物品标识对应的，交互行为特征序列中第一交互行为特征是第一个交互物品标识对应的。

具体地，服务器可以根据交互物品标识序列中的各个交互物品标识获取对应的交互物品特征，得到交互物品特征序列，其中，服务器可以预先获取到所有物品的物品信息，然后对所有物品的物品信息进行特征提取，得到所有物品的物品特征，可以将所有物品的物品特征保存。然后服务器根据交互物品标识序列中的交互物品标识在数据库的物品特征中查找到对应的物品特征，从而得到每个交互物品标识的交互物品特征。服务器也可以从数据库中获取到各个交互物品标识的物品信息，然后分别对每个交互物品标识的物品信进行特征提取，得到每个交互物品标识的交互物品特征。服务器还可以获取到提供信息推送服务的服务方发送的每个交互物品标识的交互物品特征。

服务器可以同时获取到各个交互物品标识对应的交互行为特征，得到交互行为特征序列。其中，服务器可以从交互物品标识所属于的交互场景中采集得到用户对交互物品标识的物品信息的交互行为信息，然后对每个交互物品标识的交互行为信息进行特征提取，得到每个交互物品标识的交互行为特征。服务器还可以是从提供信息推送服务的服务方获取到每个交互物品标识的交互行为特征。服务器也可以是在数据库中查找到每个交互物品标识的交互行为特征。

S206，将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，并提取融合特征序列中融合特征的自相关信息，得到自相关特征序列。

其中，融合特征序列中包括各个交互物品标识的融合特征，融合特征是将同一交互物品标识的交互物品特征和交互行为特征进行融合得到的。自相关特征序列中包括各个自相关特征，自相关特征是提取融合特征的自相关信息得到的，该自相关信息用于表征融合特征序列中不同位置之间的相关关系，即自相关特征中包含了融合特征中不同位置之间的相关语义信息。

具体地，服务器将交互物品特征序列中每个交互物品特征分别与交互行为特征序列中对应的交互行为特征进行融合，得到融合特征序列，其中该融合可以是进行线性加和，可以是进行加权和，也可以是进行特征向量的向量运算，比如，计算向量和、计算向量积等等。然后服务器通过自相关提取参数提取融合特征序列中融合特征的自相关信息，得到自相关特征序列，该自相关提取参数可以是预先设置好的，也可以是训练得到的，比如，该自相关提取参数可以是通过对神经网络训练完成后得到的神经网络参数。

S208，从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列。增强特征序列用于预测得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度进行物品信息推送。

其中，预设场景特征增强信息是指预先设置好的场景特征增强信息，该场景特征增强信息是指对自相关特征序列中的自相关特征进行特征增强的信息，可以包括特征增强参数，不同的场景特征增强信息能够对不同场景的嵌入表征进行增强。通过场景特征增强信息能够对自相关特征序列的语义表达进行增强，通过不同的场景特征增强信息能够增强自相关特征序列中不同场景的语义表达。增强特征序列中包括各个增强特征，该增强特征序列用于作为表征对应的用户，可以将增强特征序列作为用户的嵌入表征进行后续的任务处理，比如，可以进行信息推送的预测，可以进行分类等等。

具体地，服务器计算各个预设场景特征增强信息中与自相关特征序列的相关程度，然后根据每个预设场景特征增强信息与自相关特征序列的相关程度，从各个预设场景特征增强信息中选取自相关特征序列对应的至少两个场景特征增强信息，该选取的至少两个场景特征增强信息是与自相关特征序列最相关的场景特征增强信息。然后使用至少两个场景特征增强信息对自相关特征序列进行特征增强，可以是使用每个选取得到的场景特征增强信息对自相关特征序列进行增强，得到各个增强后的特征序列，然后所有增强后的特征序列进行融合，得到增强特征序列，即使用与输入相关的场景特征增强信息进行特征增强，可以提高得到的增强特征序列的准确性。并且避免了使用所有的场景特征增强信息对自相关特征序列进行特征增强，可以在保证准确性基础上减少计算复杂性。然后服务器可以将增强特征序列作为用户的表征进行保存，然后可以使用增强特征序列进行后续的任务，比如，使用用户的增强特征序列进行信息推送的预测。在一个实施例中，当用户的交互行为信息以及用户的交互物品标识进行更新后，可以使用更新后的用户的各个交互物品标识对保存的增强特征序列进行更新，得到更新后的增强特征序列，保证增强特征序列的准确性，方便进行后续的任务。

其中，预设候选物品标识是指预先设置好的需要进行筛选的物品标识。该各个预设候选物品标识可以是所有物品的物品标识，也可以是部分物品的物品标识，比如，可以是用户未交互过的物品标识。交互程度是指用于表征用户对预设候选物品标识的物品信息进行交互的可能性。该交互程度越高，用户对对应物品信息进行交互的可能性就越高。

具体地，服务器可以使用用户的增强特征序列进行物品信息推送，即使用增强特征序列对各个预设候选物品标识进行预测，得到各个预设候选物品标识分别对应的交互程度，然后使用各个预设候选物品标识分别对应的交互程度，对各个预设候选物品标识进行筛选，其中，可以按照预先设置好的筛选数量进行筛选，比如，服务器可以筛选最大交互程度的预设候选物品标识，将最大交互程度的预设候选物品标识的物品信息向用户的终端进行推送，也可以筛选交互程度排序前三的预设候选物品标识，将排序前三的预设候选物品标识的物品信息向用户的终端进行推送。用户的终端接收到服务器推送的物品信息并进行展示，用户就可以与推送的物品信息进行交互。

上述信息推送方法，通过获取交互物品标识序列，交互物品标识序列中包括用户的各个交互物品标识；将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，并提取融合特征序列中融合特征的自相关信息，得到自相关特征序列；从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列，即通过使用多个场景特征增强信息对自相关特征序列进行特征增强，能够更好的拟合物品信息和交互场景的交互行为信息，提高得到的增强特征序列的准确性。然后增强特征序列可以用于预测得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度进行物品信息推送，即通过使用准确性高的增强特征序列进行预测并进行信息推送，提高了信息推送的准确性，即可以减少将交互程度低的物品信息进行推送，节省了推送资源。

在一个实施例中，S202，基于交互物品标识序列获取交互物品特征序列和交互行为特征序列，包括：

基于交互物品标识序列中的各个交互物品标识，在各个预提取的交互物品特征中查找各个交互物品标识分别对应的交互物品特征，得到交互物品特征序列；从各个交互物品标识所属于的至少两个交互场景获取各个交互物品标识的至少两个交互行为信息；针对每个交互物品标识，提取至少两个交互行为信息的嵌入表征，得到至少两个行为表征，并将至少两个行为表征进行融合，得到交互行为特征序列。

其中，预提取的交互物品特征是指预先提取得到的交互物品标识的物品信息的特征。行为表征是指提取交互行为信息的嵌入表征得到的。不同交互场景有不同的交互行为信息，可以提取得到不同的行为特征。

具体地，服务器的数据库中保存有每个交互物品标识分别对应的预提取的交互物品特征。然后服务器可以使用交互物品标识序列中的各个交互物品标识，在各个预提取的交互物品特征中查找各个交互物品标识分别对应的交互物品特征，并按照交互物品标识序列的序列顺序进行排序，得到交互物品特征序列。即在数据库中查找相同的交互物品标识，并将相同的交互物品标识对应的物品特征作为交互物品特征。然后服务器也可以从各个交互物品标识所属于的至少两个交互场景获取各个交互物品标识的至少两个交互行为信息。其中，可以查找到每个交互物品标识所属于的多个交互场景的场景标识，然后根据场景标识在数据库中查找交互物品标识在该交互场景中产生的交互行为信息，从而得到每个交互物品标识的多个不同交互场景的交互行为信息。

此时，服务器对每个交互物品标识，通过嵌入表征提取算法提取该交互物品标识对应的每个交互行为信息的嵌入表征，得到每个交互行为信息对应的行为表征，其中，嵌入表征提取算法可以是神经网络算法、向量化算法等等。最后服务器将同一交互物品标识在不同交互场景中的所有行为表征进行融合，可以计算所有行为表征的和，得到该交互物品标识的交互行为特征。服务器遍历计算所有交互物品标识，得到所有交互物品标识的交互行为特征，并按照交互物品标识序列的序列顺序进行排序，得到交互行为特征序列。

在上述实施例中，通过在各个预提取的交互物品特征中查找各个交互物品标识分别对应的交互物品特征，得到交互物品特征序列，不需要实时提取，提高了得到交互物品特征序列的效率。然后获取各个交互物品标识的至少两个交互行为信息；针对每个交互物品标识，提取至少两个交互行为信息的嵌入表征，得到至少两个行为表征，并将至少两个行为表征进行融合，得到交互行为特征序列，通过使用多个不同交互场景的交互行为信息提取得到交互行为特征，使交互行为特征中包含有不同交互场景的语义信息，提高了得到的交互行为特征序列的准确性。

在一个实施例中，服务器可以获取交互物品标识序列中各个交互物品标识的物品信息，并提取物品信息的嵌入表征，得到交互物品特征序列，同时从各个交互物品标识所属于的交互场景获取各个交互物品标识的交互行为信息，并提取交互行为信息的嵌入表征，得到交互行为特征序列。即可以实时提取各个交互物品标识的物品信息的嵌入表征，实时提取交互行为信息的嵌入表征，不需要预先提取所有物品的物品特征，可以节省服务器计算资源。

在一个实施例中，服务器可以针对交互物品标识序列中的每个交互物品标识，获取每个交互物品标识对应的各个物品模态信息，然后分别提取各个物品模态信息的嵌入表征，得到各个模态嵌入特征，并将各个模态编码特征进行融合，得到交互物品特征序列。比如，服务器可以提取每个交互物品标识对应的各个物品模态信息中文本信息的嵌入表征，得到文本嵌入特征序列，提取每个交互物品标识对应的各个物品模态信息中图片信息的嵌入表征，得到图片嵌入特征序列。最后将文本嵌入特征序列和图片嵌入特征序列进行融合，得到交互物品特征序列。即将不同模态的信息分别进行嵌入表征提取，最后再进行融合，从而提高了得到的交互物品特征的准确性。

在一个实施例中，服务器可以基于交互物品标识序列获取目标融合特征序列，目标融合特征序列中是对各个交互物品标识的目标物品信息进行特征提取得到的，目标物品信息是将各个交互物品标识的物品信息与各个交互物品标识的交互行为信息进行拼接得到的，比如，服务器可以将物品信息中的文本信息与交互行为信息进行拼接，得到拼接后的文本信息，然后将拼接后的文本信息和其他模态的物品信息共同作为目标物品信息。然后服务器将目标融合特征序列作为融合特征序列进行后续的增强特征序列提取，得到增强特征序列，即通过将交互行为信息和物品信息拼接得到目标物品信息，然后使用目标物品信息进行特征提取，可以提高得到融合特征序列的效率。

在一个具体的实施例中，可以通过大语言模型对各个交互物品标识的物品信息进行特征提取，得到交互物品特征序列。如图3所示，为大语言模型的网络架构示意图，具体来说：服务器获取到各个交互物品标识的物品信息，该物品信息是多模态信息，包括物品图片和物品文本，该物品文本可以是物品的名称、介绍、所属类型信息等等。然后将物品图片和物品文本输入到大语言模型中，获取到物品文本的token（大语言模型的基本单元，通常是单词、标点符号或其他符号，还可以被用于表示文本中的上下文信息）序列，可以将物品文本以基本单元token进行划分，得到物品文本的token序列。然后将文本的token序列输入文本嵌入层提取文本嵌入表征，得到文本嵌入特征序列，同时通过大语言模型中的图片编码器对物品图片进行编码，得到图片token的嵌入表征，然后将图片token的嵌入表征通过线性投影层进行线性投影映射，映射到与文本token的嵌入表征相同维度的空间中，得到图片嵌入特征序列。然后服务器将图片嵌入特征序列和文本嵌入特征序列进行融合，输入到transformer（基于自注意力机制的神经网络模型，用于处理序列数据）解码层中，通过transformer解码层中的多个transformer解码网络进行解码，即通过tansformer层进行文本token的生成，得到输出的交互物品特征序列。其中，大语言模型可以是LLaVa（多模态预训练模型，实现跨模态的理解和生成），MiniGPT（增强视觉语言理解与先进的大型语言模型），BLIP-2（一种多模态 Transformer 模型）等，通过大语言模型可以融合图片特征与文本特征，进行基于图片信息的文本生成，提高了得到的交互物品特征序列的准确性。

在一个实施例中，S206，即将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，包括步骤：

将交互物品特征序列中的交互物品特征与交互行为特征序列中对应的交互行为特征进行融合，得到融合特征序列。

具体地，服务器可以计算交互物品特征序列中的交互物品特征与交互行为特征序列中对应的交互行为特征的和，得到融合特征序列，服务器也可以获取到预先设置好的每个交互物品标识对应的重要性，然后使用重要性将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，即计算同一交互物品标识的交互物品特征与交互行为特征的特征和，并使用重要性对特征和进行加权，得到该交互物品标识的融合特征，遍历所有的交互物品标识，得到融合特征序列。

在一个实施例中，服务器可以计算交互物品特征序列与交互行为特征序列中各个特征元素按照相同位置进行线性加和，得到融合特征序列。

在一个实施例中，服务器可以将交互物品特征序列和交互行为特征输入到已训练的用于进行特征融合的神经网络中进行特征融合，得到输出的融合特征序列。

在上述实施例中，通过将交互物品特征序列中的交互物品特征与交互行为特征序列中对应的交互行为特征进行融合，得到融合特征序列，使融合特征中不仅包含物品信息，还包含有交互场景的交互行为信息，从而提高了得到的融合特征序列的准确性。

在一个实施例中，S206，即提取融合特征序列中融合特征的自相关信息，得到自相关特征序列，包括步骤：

将融合特征序列进行线性转换，得到目标查询序列，目标键序列和目标值序列；计算目标查询序列与目标键序列之间的相关程度，得到相关程度序列，并基于相关程度序列对目标值序列进行变换，得到自相关特征序列。

具体地，服务器获取到线性变换参数，该线性变换参数中可以包括变换得到目标查询序列的参数、变换得到目标键序列的参数以及变换得到目标值序列的参数，该线性变换参数是预先设置好的，也可以是预先训练得到的，比如，可以是通过自注意力神经网络进行训练得到的。然后使用线性变换参数将融合特征序列进行线性转换，即使用变换得到目标查询序列的参数对融合特征序列进行线性转换，得到目标查询序列，使用变换得到目标键序列的参数对融合特征序列进行线性转换，得到目标键序列，以及使用变换得到目标值序列的参数对融合特征序列进行线性转换，得到目标值序列。此时，服务器使用相似度算法计算目标查询序列与目标键序列之间的相关程度，得到相关程度序列，该相似度算法可以是距离相似算法、余弦相似算法、点积运算等等。最后服务器可以将相关程度序列进行归一化，得到归一化后的相关程度序列，然后使用归一化后的相关程度序列对目标值序列进行加权，得到自相关特征序列。

在上述实施例中，通过将融合特征序列进行线性转换，得到目标查询序列，目标键序列和目标值序列，计算目标查询序列与目标键序列之间的相关程度，得到相关程度序列，可以充分提取出融合特征序列中不同位置之间的依赖关系，然后基于相关程度序列对目标值序列进行变换，得到自相关特征序列，提高了得到的自相关特征序列的准确性。

在一个实施例中，如图4所示，S208，从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列，包括：

S402，基于自相关特征序列进行信息选取计算，得到各个预设场景特征增强信息对应的选取程度。

其中，选取程度用于表征自相关特征序列与预设场景特征增强信息的相关程度，自相关特征序列与预设场景特征增强信息越相关，对应的选取程度就越高。

具体地，服务器可以对自相关特征序列进行全连接运算，得到各个预设场景特征增强信息对应的选取程度，在进行全连接运算时，可以使用预先训练得到的用于计算选取程度的全连接运算参数进行运算，也可以是使用预先设置好的全连接运算参数进行运算。在一个实施例中，服务器可以将自相关特征序列输入到选取程度计算的全连接神经网络中计算各个预设场景特征增强信息对应的选取程度，该全连接神经网络可以是预先训练好的用于进行选取程度计算的。

S404，基于各个预设场景特征增强信息对应的选取程度，对各个预设场景特征增强信息进行筛选，得到自相关特征序列对应的至少两个场景特征增强信息；

S406，基于至少两个场景特征增强信息分别对自相关特征序列进行特征增强，得到至少两个当前增强特征序列。

其中，当前增强特征序列是当前使用场景特征增强信息对自相关特征序列进行特征增强得到的。不同的场景特征增强信息对自相关特征序列进行特征增强得到不同的当前增强特征序列。

具体地，服务器按照各个预设场景特征增强信息对应的选取程度，对各个预设场景特征增强信息进行筛选，可以获取到预先设置好的要筛选的数量，该要筛选的数量至少是两个。然后按照选取程度从大到小选取场景特征增强信息，从而得到自相关特征序列对应最相关的至少两个场景特征增强信息。此时，服务器使用每个场景特征增强信息对自相关特征序列进行特征增强，得到每个场景特征增强信息对应的当前增强特征序列。

S408，按照至少两个场景特征增强信息分别对应的选取程度将至少两个当前增强特征序列进行融合，得到增强特征序列。

具体地，服务器计算所有当前增强特征序列与对应选取程度的加权和，从而得到增强特征序列，即计算每个当前增强特征序列与对应选取程度的乘积，然后计算所有乘积的和，得到增强特征序列。

在上述实施例中，通过计算选取程度筛选得到至少两个场景特征增强信息，然后对自相关特征序列进行特征增强后，再按照选取程度进行融合，得到增强特征序列，即使用与自相关特征序列最相关的场景特征增强信息进行特征增强，然后按照选取程度对增强后的特征进行加权融合，提高了得到的增强特征序列的准确性。

在一个实施例中，如图5所示，S408，按照至少两个场景特征增强信息分别对应的选取程度将至少两个当前增强特征序列进行融合，得到增强特征序列，包括：

S502，获取至少两个场景特征增强信息的信息数量，基于信息数量将各个预设场景特征增强信息分别对应的选取程度进行更新，得到各个预设场景特征增强信息分别对应的更新程度。

其中，信息数量是选取得到的场景特征增强信息的数量，该信息数量可以是预先设置好的要选取的场景特征增强信息的数量。更新程度是指更新后的选取程度，用于表征对应场景特征增强信息在进行特征增强时选取的可能性。

具体地，服务器获取到预先设置好的要筛选得到的场景特征增强信息的信息数量。服务器也可以统计已经筛选得到的场景特征增强信息的信息数量。然后根据信息数量将各个预设场景特征增强信息分别对应的选取程度进行更新，其中，服务器可以根据信息数量将各个预设场景特征增强信息分别对应的选取程度划分为不同类型的选取程度，然后按照预先设置好的不同类型的更新规则对不同类型的选取程度进行更新，该不同类型的选取程度可以包括需要更新的选取程度以及需要维持不变的选取程度，从而得到每个预设场景特征增强信息对应的更新程度

S504，将各个预设场景特征增强信息分别对应的更新程度进行归一化，得到各个预设场景特征增强信息分别对应的目标选取程度。

其中，目标选取程度是指对每个预设场景特征增强信息的更新程度进行归一化得到的选取程度，所有预设场景特征增强信息的目标选取程度的总和为目标值，该目标值可以为1，也可以为其他值。

具体地，服务器可以使用归一化算法将各个预设场景特征增强信息分别对应的更新程度进行归一化，该归一化算法可以是最小-最大归一化算法、缩放归一化算法、均值方差归一化算法等等，得到每个预设场景特征增强信息的目标选取程度。

S506，从各个预设场景特征增强信息分别对应的目标选取程度中确定至少两个场景特征增强信息分别对应的目标选取程度；

S508，按照至少两个场景特征增强信息分别对应的目标选取程度将至少两个当前增强特征序列进行融合，得到增强特征序列。

具体地，服务器从各个预设场景特征增强信息分别对应的目标选取程度中确定筛选得到的至少两个场景特征增强信息分别对应的目标选取程度，然后按照至少两个场景特征增强信息分别对应的目标选取程度计算至少两个增强特征序列的加权和，得到增强特征序列。

在一个实施例中，服务器也可以获取到筛选得到的至少两个场景特征增强信息分别对应的选取程度，然后直接将至少两个场景特征增强信息分别对应的选取程度进行归一化，得到至少两个场景特征增强信息分别对应的目标选取程度。

在上述实施例中，通过将所有场景特征增强信息的选取程度进行更新并进行归一化，进而确定筛选得到的场景特征增强信息的目标选取程度，即通过统一更新和归一化，提高了得到的目标选取程度的准确性，然后使用目标选取程度将至少两个当前增强特征序列进行融合，得到增强特征序列，提高了得到的增强特征序列的准确性。

在一个实施例中，S502，基于信息数量将各个预设场景特征增强信息分别对应的选取程度进行更新，得到各个预设场景特征增强信息分别对应的更新程度，包括步骤：

基于信息数量从各个预设场景特征增强信息分别对应的选取程度中确定排序前列的各个选取程度和排序后列的各个选取程度；将排序前列的各个选取程度保持不变，并将排序后列的各个选取程度更新为预设目标值，得到各个预设场景特征增强信息分别对应的更新程度。

其中，排序前列的各个选取程度是指选取程度从大到小筛选到的与信息数量相同数量的选取程度。排序后列的各个选取程度是指除排序前列的各个选取程度以外的选取程度，即从大到小筛选信息数量的选取程度后剩余的选取程度。预设目标值是指预先设置好的目标值，用于将选取程度较低的预设场景特征增强信息过滤，保证在进行特征融合时，使用的是筛选得到的预设场景特征增强信息。该预设目标值可以是负无穷。

具体地，服务器按照信息数量从各个预设场景特征增强信息分别对应的选取程度中从大到小依次确定排序前列的各个选取程度，即该排序前列的各个选取程度的数量与信息数量相同，然后将其他的选取程度作为排序后列的各个选取程度。然后服务器将排序前列的各个选取程度保持不变，并将排序后列的各个选取程度全部更新为预设目标值，此时，就得到每个预设场景特征增强信息的更新程度。

在一个具体的实施例中，在对各个预设场景特征增强信息分别对应的选取程度进行更新时，可以使用如下所示的公式（1）进行更新。

公式（1）

其中，是指排序前k个。k可以是信息数量，k可以预先设置为2。是指第i个预设场景特征增强信息的选取程度。是指负无穷。是指第i个更新后的选取程度。然后，可以使用如下所示的公式（2）将更新程度进行归一化。

公式（2）

其中，x是指自相关特征序列。是指信息选取计算的参数，比如，可以是全连接运算参数。通过计算自相关特征序列和信息选取计算的参数的乘积，得到各个预设场景特征增强信息的选取程度，然后使用公式（1）计算得到，该是指排序前k个预设场景特征增强信息的更新程度。是指归一化函数。是指排序前k个预设场景特征增强信息的更新程度进行归一化后得到的目标选取程度。

在上述实施例中，将排序前列的各个选取程度保持不变，并将排序后列的各个选取程度更新为预设目标值，得到各个预设场景特征增强信息分别对应的更新程度，然后在归一化时，可以将未选取的预设场景特征增强信息进行筛选，避免使用未选取的预设场景特征增强信息进行特征增强，进而提高了特征增强的准确性。

在一个实施例中，S508，即按照至少两个场景特征增强信息分别对应的目标选取程度将至少两个当前增强特征序列进行融合，得到增强特征序列，包括：

针对每个场景特征增强信息，按照目标选取程度对对应的当前增强特征序列进行加权，得到各个加权特征序列；将各个加权特征序列进行融合，得到增强特征序列。

具体地，服务器计算筛选得到的场景特征增强信息的目标选取程度与该场景特征增强信息的当前增强特征序列的乘积，得到该场景特征增强信息对应的加权特征序列，遍历所有筛选得到的场景特征增强信息，得到各个加权特征序列。最后，服务器计算所有加权特征序列的和，可以是将所有加权特征序列中相同位置的特征元素进行线性加和，得到增强特征序列。

在一个具体的实施例中，可以使用如下所示的公式（3）计算得到增强特征序列。

公式（3）

其中，是指第i个场景特征增强信息的目标选取程度，是指第i个当前增强特征序列，n是指至少两个场景特征增强信息的信息数量。

在上述实施例中，通过目标选取程度对对应的当前增强特征序列进行加权，得到各个加权特征序列，然后将各个加权特征序列进行融合，得到增强特征序列，即通过目标选取程度进行加权后再进行融合，提高了得到的增强特征序列的准确性。

在一个具体的实施例中，如图6所示，提供一种得到增强特征序列的网络架构示意图，具体来说：服务器将融合特征序列输入到transformer的解码网络中，该transformer的解码网络是将多头自注意力网络之后的前馈神经网络替换为稀疏混合专家网络得到的，即该transformer的解码网络包括带掩码机制的多头自注意力网络和稀疏混合专家网络，该 transformer的解码网络还包括图中未示出的残差连接（Residual Connection）和层归一化网络。服务器通过带掩码机制的多头自注意力网络对融合特征序列进行多头自注意力计算，捕捉输入序列中不同位置之间的依赖关系，从而得到自相关特征序列。然后通过残差连接（Residual Connection）和层归一化网络进行残差连接，并对残差连接的结果进行归一化，从而可以提高网络的性能。通过稀疏混合专家网络对自相关特征序列进行特征增强，得到增强特征序列。该稀疏混合专家网络的网络架构示意图可以如图7所示，该稀疏混合专家网络包括路由网络和各个专家网络，该各个专家网络用于表征对应的预设场景特征增强信息，该专家网络的网络架构与transformer中前馈神经网络的网络架构相同。然后服务器将自相关特征序列输入到稀疏混合专家网络中，首先通过路由网络确定自相关特征序列需要输入的专家网络，比如，稀疏混合专家网络中总共可以有8个专家网络，只需要激活其中的前k（topk）个专家网络，该k可以为2。即服务器将自相关特征序列输入到路由网络中，通过路由网络计算得到8个专家网络的选取概率。该路由网络可以通过计算得到选取概率，是路由网络的网络参数，该路由网络可以是全连接神经网络。然后根据8个专家网络的选取概率确定2个最大的选取概率以及对应的专家网络。然后使用公式（1）对8个专家网络的选取概率进行更新，即保持2个最大的选取概率不变，将其他的6个选取概率置为负无穷。然后再使用公式（2）将更新后的选取概率进行归一化，从而可以确定输入的自相关特征序列进入topk的专家网络的更新概率，保证进入非topk的专家网络的概率为0。然后将自相关特征序列输入到2个最大的选取概率的专家网络中进行特征增强，得到2个专家网络输出的当前增强特征序列。然后使用该2个专家网络的更新概率和2个专家网络输出的当前增强特征序列通过公式（3）计算得到增强特征序列，即可以只激活2个专家网络进行特征增强，减少了计算复杂度，提高了计算的效率。

在一个实施例中，在S208之后，即在基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列之后，还包括步骤：

将增强特征序列作为融合特征序列，并返回提取融合特征序列中融合特征的自相关信息，得到自相关特征序列的步骤执行，直到达到深度增强完成条件时，得到深度增强特征序列；深度增强特征序列用于预测得到各个预设候选物品标识分别对应的深度交互程度，并基于各个预设候选物品标识分别对应的深度交互程度进行物品信息推送。

其中，深度增强完成条件是指提取得到深度增强特征序列的条件，包括但不限于迭代执行的次数达到设置的最大次数。

具体地，服务器可以进行多次的迭代执行，对融合特征序列进行深度信息的提取，得到深度增强特征序列，每次迭代在进行自相关特征提取和特征增强时使用的参数可以相同，也可以不同。即服务器可以将增强特征序列作为融合特征序列，并返回提取融合特征序列中融合特征的自相关信息，得到自相关特征序列的步骤执行，每次得到增强特征序列时，判断是否达到深度增强完成条件，当未达到深度增强完成条件时，将得到的增强特征序列作为下一次迭代的起始输入。当达到深度增强完成条件时，将得到的增强特征序列作为最终提取得到的得到深度增强特征序列，将该深度增强特征序列作为用户的表征。然后服务器可以使用深度增强特征序列进行后续任务的处理，比如，可以进行物品信息推送，也可以进行物品信息的召回、排序等等。

在一个实施例中，如图8所示，提供一种得到深度增强特征序列的网络架构图，该网络架构中包括n个transformer的解码网络，该n个transformer的解码网络的网络架构可以是如图6所示的网络架构，该n个transformer的解码网络的网络参数是不同的，并且是预先训练好的，n可以是预先根据经验设置好的，比如，可以设置为6。然后，服务器将融合特征序列输入到第一个transformer的解码网络中提取得到输出的增强特征序列，并将增强特征序列作为第二个transformer的解码网络的输入，通过第二个transformer的解码网络提取得到输出的增强特征序列，并输入到下一个transformer的解码网络中，然后直到通过最后一个transformer的解码网络提取得到输出的增强特征序列，就得到深度增强特征序列，通过多个transformer的解码网络进行增强特征的提取，提高了得到的增强特征序列的准确性。

在上述实施例中，通过迭代执行得到深度增强特征序列，可以深度提取输入序列中的相关信息，提高了深度增强特征序列的准确性，然后使用深度增强特征序列进行信息推送，提高了信息推送的准确性。

在一个实施例中，在S208之后，即在从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列之后，还包括步骤：

基于各个预设候选物品标识将增强特征序列进行线性变换，得到各个预设候选物品标识分别对应的线性变换特征；将各个预设候选物品标识分别对应的线性变换特征进行交互程度映射，得到各个预设候选物品标识分别对应的交互程度。基于各个预设候选物品标识分别对应的交互程度，对各个预设候选物品标识进行筛选，得到目标物品标识；将目标物品标识的物品信息进行推送。

其中，线性变换特征是将增强特征序列进行线性变换后得到的特征。目标物品标识是最终筛选得到的最大交互程度对应的候选物品标识。

具体地，服务器获取到线性变换参数，使用线性变换参数将增强特征序列进行线性变换，得到线性变换特征序列，然后使用归一化函数将线性变换特征序列进行归一化映射，得到各个预设候选物品标识分别对应的交互程度，该交互程度可以使用概率表示。然后根据交互程度的大小对各个预设候选物品标识进行筛选，得到最大交互程度对应的目标物品标识，最后，服务器将目标物品标识的物品信息向用户的终端进行推送。

在一个实施例中，服务器可以使用预先设置好的神经网络输出层进行交互程度的预测，即将增强特征序列输入到神经网络输出层中，通过神经网络输出层的线性转换网络和归一化函数对增强特征序列进行输出计算，得到输出的各个预设候选物品标识分别对应的交互程度。然后选取最大交互程度对应的候选物品标识作为目标物品标识，也可以选取排序前列的多个候选物品标识作为要推送的物品标识，最后将要推送的物品标识的物品信息向用户的终端进行推送。即通过线性变换将最后一个transformer解码网络的输出映射到一个维度等于词汇表大小的向量空间，softmax函数将这个向量空间中的每个元素转换为一个概率值，表示要推送的下一个的物品标识的概率。

在上述实施例中，通过使用增强特征序列计算得到各个预设候选物品标识分别对应的交互程度。然后筛选最大交互程度的候选物品标识得到目标物品标识，即将交互程度最大的目标物品标识的物品信息向用户终端进行推送，可以避免将用户不感兴趣的信息进行推送，提高了信息推送的准确性。

在一个实时实施例中，信息推送方法，还包括步骤：

将交互物品标识序列输入到信息推送模型中，信息推送模型包括特征提取网络、自相关特征提取网络、特征增强网络和信息推送网络；通过特征提取网络获取交互物品标识序列对应的交互物品特征序列和交互行为特征序列，并将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列；通过自相关特征提取网络提取融合特征序列中融合特征的自相关信息，得到自相关特征序列；通过特征增强网络从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列；通过信息推送网络基于增强特征序列预测得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度进行物品信息推送。

其中，信息推送模型是指用于进行信息推送的神经网络模型，该信息推送模型可以是使用历史交互物品标识序列进行训练得到的，该历史交互物品标识序列中包括用户的各个历史交互物品标识。特征提取网络是指进行特征提取的神经网络，可以是嵌入表征提取的神经网络，也可以是向量化的神经网络等等。自相关特征提取网络是指进行自相关特征的神经网络，可以是自注意力网络。特征增强网络是指进行特征增强的神经网络，可以是稀疏混合专家网络。信息推送网络是指进行信息推送的神经网络，可以是神经网络的输出层。

具体地，将交互物品标识序列输入到信息推送模型中，该信息推送模型可以实现上述任意实施例中信息推送方法的步骤。该信息推送模型包括特征提取网络、自相关特征提取网络、特征增强网络和信息推送网络。该特征提取网络可以实现上述任意实施例中得到融合特征序列的方法步骤。自相关特征提取网络可以实现上述任意实施例中得到自相关特征序列的方法步骤。特征增强网络可以实现上述任意实施例中得到增强特征序列的方法步骤。信息推送网络可以实现上述任意实施例中得到各个预设候选物品标识分别对应的交互程度的方法步骤。即服务器通过信息推送模型可以得到各个预设候选物品标识分别对应的交互程度，然后基于各个预设候选物品标识分别对应的交互程度进行物品信息推送。

在一个实施例中，服务器获取到各个交互物品标识，该各个交互物品标识形成的序列长度小于预设序列长度时，获取到填充掩码，使用各个交互物品标识和他填充掩码得到预设序列长度的交互物品标识序列。

在上述实施例中，通过将交互物品标识序列输入到信息推送模型中，得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度进行物品信息推送，即通过预先训练好的信息推送模型进行信息推送，可以提高信息推送的效率。

在一个实施例中，信息推送模型的训练包括以下步骤：

获取历史交互物品标识序列，并基于历史交互物品标识序列确定训练交互物品标识序列和物品标识训练标签；将训练交互物品标识序列输入到初始信息推送模型中，得到输出的各个预设候选物品标识分别对应的训练交互程度；基于各个预设候选物品标识分别对应的训练交互程度和物品标识训练标签进行损失计算，得到损失信息；基于损失信息对初始信息推送模型进行训练，当达到训练完成条件时，得到信息推送模型。

其中，历史交互物品标识序列中包括用户的各个历史交互物品标识，该历史交互物品标识是指用户历史存在交互行为的物品标识。训练交互物品标识序列是指训练时使用的历史交互物品标识序列。物品标识训练标签是指训练时使用的物品标识的标签。初始信息推送模型是指模型参数初始化的信息推送模型，该初始信息推送模型可以是使用神经网络建立的，该神经网络可以是卷积神经网络、循环神经网络、前馈神经网络等等。损失信息用于表征训练交互程度和物品标识训练标签之间的误差。训练完成条件是指训练结束的条件，包括但不限于迭代次数达到最大迭代次数、模型参数不再发生变化或者模型的损失信息小于预设损失阈值。

具体地，服务器可以从数据库中获取到历史交互物品标识序列，然后从历史交互物品标识序列中选取训练交互物品标识序列，并历史交互物品标识序列中确定训练交互物品标识序列的下一个历史交互物品标识作为物品标识训练标签。比如，历史交互物品标识序列中有m个历史交互物品标识，服务器可以将历史交互物品标识序列中前q-1（q小于m）个历史交互物品标识作为训练交互物品标识序列，再根据第q个历史交互物品标识确定物品标识训练标签，即将第q个历史交互物品标识设置为下一个推送标签，其他的历史交互物品标识设置为未推送标签。然后服务器将训练交互物品标识序列输入到初始信息推送模型中，通过初始信息推送模型中的初始化模型参数进行预测，得到输出的各个预设候选物品标识分别对应的训练交互程度。然后使用预先设置好的损失函数计算各个预设候选物品标识分别对应的训练交互程度和物品标识训练标签之间的误差，得到损失信息，该损失函数可以是交叉熵损失函数，也可以是对数损失函数。然后通过梯度下降算法反向更新初始信息推送模型，得到更新后的信息推送模型。此时，服务器判断是否达到训练完成条件时，当未达到训练完成条件时，服务器将更新后的信息推送模型作为初始信息推送模型，并返回初始信息推送模型的步骤迭代执行，直到当达到训练完成条件时，将最后一次得到的更新后的信息推送模型作为最终训练得到信息推送模型。

在一个具体的实施例中，服务器训练的目标函数可以是负对数似然损失，具体来说：该对数损失函数的目标是最大化条件下，预测下一个物品的交互的概率。该对数损失函数可以如下公式（4）所示。

公式（4）

其中，是指负对数似然损失。是指第1个到第t-1个位置的历史交互物品标识的序列。是指第t个位置的历史交互物品标识。表示在给定的历史交互物品标识序列后，预测的交互概率。在训练过程中，使用随机梯度下降等优化算法最小化负对数损失函数，并更新初始信息推送模型的参数，从而使信息推送模型能够更好地预测用户下一个会交互的物品标识。

在上述实施例中，通过使用训练交互物品标识序列和物品标识训练标签对初始信息推送模型进行训练，并当达到训练完成条件时，得到信息推送模型，从而提高了信息推送模型进行信息推送的准确性。

在一个具体的实施例中，如图9所示，提供一种信息推送模型的模型架构示意图，该信息推送模型包括输入层、嵌入层、transformer解码层以及输出层。具体来说：服务器将交互物品标识序列通过输出层输入到信息推送模型中，然后信息推送模型通过嵌入层提取得到交互物品标识序列对应的交互物品特征和交互行为特征，将交互物品特征和交互行为特征进行融合后，将融合特征序列输入到transformer解码层，该transformer解码层通过如图8所示的网络架构提取得到融合特征序列对应的深度增强特征序列，然后将深度增强特征序列输入到输出层中，通过输出层预测得到概率分布，该概率分布表示各个候选物品标识分别对应的交互程度，然后选取最大交互程度的物品标识作为下一个要向用户推送物品信息的物品标识，并向用户的众多进行物品信息的推送。即通过稀疏混合专家网络更好地区分不同物品标识所属的模态以及场景行为信息，从而更好地拟合用户在多模态、多场景的序列行为特征，从而实现更加准确的信息推送服务。

在一个实施例中，交互物品标识序列包括交互视频标识序列，交互视频标识序列中包括用户的各个交互视频标识，各个预设候选物品标识包括各个预设候选视频标识，信息推送方法，还包括步骤：

获取交互视频标识序列对应的增强特征序列，并基于交互视频标识序列对应的增强特征序列预测得到各个预设候选视频标识分别对应的交互程度；基于各个预设候选视频标识分别对应的交互程度，对各个预设候选视频标识进行筛选，得到目标视频标识；将目标视频标识的视频信息进行推送。

其中，交互视频标识用于唯一标识交互视频，该交互视频是指用户存在交互行为的视频。预设候选视频标识是指预先设置好的候选的视频标识。目标视频标识是指交互程度最大的候选的视频标识。

具体地，服务器进行视频信息的推送服务。在进行视频信息推送时，服务器获取到用户的交互视频标识序列，然后根据交互视频标识序列输入到信息推送模型中，得到输出的各个预设候选视频标识分别对应的交互程度，然后选取最大交互程度的候选视频标识，得到目标视频标识。最后服务器将目标视频标识的视频信息向用户的终端进行推送，用户的终端接收到服务器推送的视频信息，可以展示视频信息，比如，播放视频内容、展示视频名称、展示视频介绍以及展示视频类型等等。

在上述实施例中，通过获取交互视频标识序列，然后基于交互视频标识序列预测得到目标视频标识，并将目标视频标识的视频信息进行推送，提高了视频信息推送的准确性。

在一个具体的实施例中，如图10所示，提供一种信息推送方法的原理示意图，具体来说：服务器获取到用户的交互物品标识序列，根据交互物品标识序列中的各个交互物品标识查找对应的交互物品特征和交互行为特征，得到交互物品特征序列和交互行为特征序列，然后将交互物品特征序列和交互行为特征序列的融合，得到融合特征序列。服务器进一步提取融合特征序列的自相关特征序列，并从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个特征增强信息，然后使用识别得到的所有特征增强信息对自相关特征序列进行特征增强，得到增强特征序列，此时，就将增强特征序列作为用户的表征。然后可以使用增强特征序列进行信息推送。即通过多个不同的特征增强信息对自相关特征序列进行特征增强，提高了得到的增强特征序列的准确性，然后使用增强特征序列进行信息推送，提高了信息推送的准确性。

在一个具体的实施例中，如图11所示，提供一种信息推送方法的流程示意图，由计算机设备执行，该计算机设备可以是服务器，也可以是终端，具体包括以下步骤；

S1102，获取交互物品标识序列，将交互物品标识序列输入到信息推送模型中通过特征提取网络基于交互物品标识序列中的各个交互物品标识，在各个预提取的交互物品特征中查找各个交互物品标识分别对应的交互物品特征，得到交互物品特征序列。

S1104，通过特征提取网络从各个交互物品标识所属于的至少两个交互场景获取各个交互物品标识的至少两个交互行为信息，针对每个交互物品标识，提取至少两个交互行为信息的嵌入表征，得到至少两个行为表征，并将至少两个行为表征进行融合，得到交互行为特征序列。

S1106，通过特征提取网络将交互物品特征序列中的交互物品特征与交互行为特征序列中对应的交互行为特征进行融合，得到融合特征序列。

S1108，通过自相关特征提取网络将融合特征序列进行线性转换，得到目标查询序列，目标键序列和目标值序列，计算目标查询序列与目标键序列之间的相关程度，得到相关程度序列，并基于相关程度序列对目标值序列进行变换，得到自相关特征序列。

S1110，通过特征增强网络对自相关特征序列进行信息选取计算，得到各个预设场景特征增强信息对应的选取程度，基于各个预设场景特征增强信息对应的选取程度，对各个预设场景特征增强信息进行筛选，得到自相关特征序列对应的至少两个场景特征增强信息，基于至少两个场景特征增强信息分别对自相关特征序列进行特征增强，得到至少两个当前增强特征序列。

S1112，通过特征增强网络获取至少两个场景特征增强信息的信息数量，基于信息数量将各个预设场景特征增强信息分别对应的选取程度进行更新，得到各个预设场景特征增强信息分别对应的更新程度，将各个预设场景特征增强信息分别对应的更新程度进行归一化，得到各个预设场景特征增强信息分别对应的目标选取程度。

S1114，通过特征增强网络从各个预设场景特征增强信息分别对应的目标选取程度中确定至少两个场景特征增强信息分别对应的目标选取程度，按照至少两个场景特征增强信息分别对应的目标选取程度将至少两个当前增强特征序列进行融合，得到增强特征序列；

S1116，通过信息推送网络按照各个预设候选物品标识将增强特征序列进行线性变换，得到各个预设候选物品标识分别对应的线性变换特征，将各个预设候选物品标识分别对应的线性变换特征进行交互程度映射，得到各个预设候选物品标识分别对应的交互程度。

S1118，基于各个预设候选物品标识分别对应的交互程度，对各个预设候选物品标识进行筛选，得到目标物品标识，将目标物品标识的物品信息进行推送。

在一个具体的实施例中，该信息推送方法可以应用于商品信息推送平台中，具体来说：商品信息推送平台的服务器获取到用户终端发送的商品推送请求，根据商品推送请求从数据库查找到用户的历史交互商品序列，然后将历史交互商品序列输入到已部署的信息推送模型中，通过信息推送模型预测得到各个候选商品标识分别对应的交互程度，然后选取最大交互程度的商品标识，得到目标商品标识，最后商品信息推送平台的服务器将目标商品标识的商品信息向用户的终端进行推送，用户的终端接收到商品信息并在商品信息推送平台中进行展示，用户就可以通过商品信息推送平台与展示的商品信息进行交互，可以避免将交互程度低的商品信息推送给用户，从而提高了商品信息推送的准确性。该信息推送方法也可以应用到直播信息推送平台中使用用户的交互直播标识序列预测得到各个候选直播标识的交互程度，然后选取最大交互程度直播标识进行对应直播信息的推送，提高了直播信息推送的准确性。该信息推送方法也可以应用到新闻信息推送平台中使用用户的交互新闻标识序列预测得到各个候选新闻标识的交互程度，然后选取最大交互程度新闻标识进行对应新闻信息的推送，提高了新闻信息推送的准确性。

应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的信息推送方法的信息推送装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个信息推送装置实施例中的具体限定可以参见上文中对于信息推送方法的限定，在此不再赘述。

在一个实施例中，如图12所示，提供了一种信息推送装置1200，包括：标识序列获取模块1202、特征序列获取模块1204、特征提取模块1206和推送模块1208，其中：

标识序列获取模块1202，用于获取交互物品标识序列，交互物品标识序列中包括用户的各个交互物品标识1204；

特征序列获取模块1204，用于基于交互物品标识序列获取交互物品特征序列和交互行为特征序列，交互物品特征序列是对各个交互物品标识的物品信息进行特征提取得到的，交互行为特征序列是对各个交互物品标识的交互行为信息进行特征提取得到的，交互行为信息是从交互物品标识所属于的交互场景获取到的；

特征提取模块1206，用于将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列，并提取融合特征序列中融合特征的自相关信息，得到自相关特征序列；

推送模块1208，用于从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列；增强特征序列用于预测得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度进行物品信息推送。

在一个实施例中，特征序列获取模块1204还用于基于交互物品标识序列中的各个交互物品标识，在各个预提取的交互物品特征中查找各个交互物品标识分别对应的交互物品特征，得到交互物品特征序列；从各个交互物品标识所属于的至少两个交互场景获取各个交互物品标识的至少两个交互行为信息；针对每个交互物品标识，提取至少两个交互行为信息的嵌入表征，得到至少两个行为表征，并将至少两个行为表征进行融合，得到交互行为特征序列。

在一个实施例中，特征提取模块1206还用于将交互物品特征序列中的交互物品特征与交互行为特征序列中对应的交互行为特征进行融合，得到融合特征序列。

在一个实施例中，特征提取模块1206还用于将融合特征序列进行线性转换，得到目标查询序列，目标键序列和目标值序列；计算目标查询序列与目标键序列之间的相关程度，得到相关程度序列，并基于相关程度序列对目标值序列进行变换，得到自相关特征序列。

在一个实施例中，推送模块1208还用于基于自相关特征序列进行信息选取计算，得到各个预设场景特征增强信息对应的选取程度；基于各个预设场景特征增强信息对应的选取程度，对各个预设场景特征增强信息进行筛选，得到自相关特征序列对应的至少两个场景特征增强信息；基于至少两个场景特征增强信息分别对自相关特征序列进行特征增强，得到至少两个当前增强特征序列；按照至少两个场景特征增强信息分别对应的选取程度将至少两个当前增强特征序列进行融合，得到增强特征序列。

在一个实施例中，推送模块1208还用于获取至少两个场景特征增强信息的信息数量，基于信息数量将各个预设场景特征增强信息分别对应的选取程度进行更新，得到各个预设场景特征增强信息分别对应的更新程度；将各个预设场景特征增强信息分别对应的更新程度进行归一化，得到各个预设场景特征增强信息分别对应的目标选取程度；从各个预设场景特征增强信息分别对应的目标选取程度中确定至少两个场景特征增强信息分别对应的目标选取程度；按照至少两个场景特征增强信息分别对应的目标选取程度将至少两个当前增强特征序列进行融合，得到增强特征序列。

在一个实施例中，推送模块1208还用于基于信息数量从各个预设场景特征增强信息分别对应的选取程度中确定排序前列的各个选取程度和排序后列的各个选取程度；将排序前列的各个选取程度保持不变，并将排序后列的各个选取程度更新为预设目标值，得到各个预设场景特征增强信息分别对应的更新程度。

在一个实施例中，推送模块1208还用于针对每个场景特征增强信息，按照目标选取程度对对应的当前增强特征序列进行加权，得到各个加权特征序列；将各个加权特征序列进行融合，得到增强特征序列。

在一个实施例中，信息推送装置1200，还包括：

深度特征提取模块，用于将增强特征序列作为融合特征序列，并返回提取融合特征序列中融合特征的自相关信息，得到自相关特征序列的步骤执行，直到达到深度增强完成条件时，得到深度增强特征序列；深度增强特征序列用于预测得到各个预设候选物品标识分别对应的深度交互程度，并基于各个预设候选物品标识分别对应的深度交互程度进行物品信息推送。

在一个实施例中，信息推送装置1200，还包括：

物品信息推送模块，用于基于各个预设候选物品标识将增强特征序列进行线性变换，得到各个预设候选物品标识分别对应的线性变换特征；将各个预设候选物品标识分别对应的线性变换特征进行交互程度映射，得到各个预设候选物品标识分别对应的交互程度；基于各个预设候选物品标识分别对应的交互程度，对各个预设候选物品标识进行筛选，得到目标物品标识；将目标物品标识的物品信息进行推送。

在一个实施例中，信息推送装置1200，还包括：

模型推送模块，用于将交互物品标识序列输入到信息推送模型中，信息推送模型包括特征提取网络、自相关特征提取网络、特征增强网络和信息推送网络；通过特征提取网络获取交互物品标识序列对应的交互物品特征序列和交互行为特征序列，并将交互物品特征序列与交互行为特征序列进行融合，得到融合特征序列；通过自相关特征提取网络提取融合特征序列中融合特征的自相关信息，得到自相关特征序列；通过特征增强网络从各个预设场景特征增强信息中识别自相关特征序列对应的至少两个场景特征增强信息，并基于至少两个场景特征增强信息对自相关特征序列进行特征增强，得到增强特征序列；通过信息推送网络基于增强特征序列预测得到各个预设候选物品标识分别对应的交互程度，并基于各个预设候选物品标识分别对应的交互程度进行物品信息推送。

在一个实施例中，信息推送装置1200，还包括：

模型训练模块，用于获取历史交互物品标识序列，并基于历史交互物品标识序列确定训练交互物品标识序列和物品标识训练标签；将训练交互物品标识序列输入到初始信息推送模型中，得到输出的各个预设候选物品标识分别对应的训练交互程度；基于各个预设候选物品标识分别对应的训练交互程度和物品标识训练标签进行损失计算，得到损失信息；基于损失信息对初始信息推送模型进行训练，当达到训练完成条件时，得到信息推送模型。

在一个实施例中，交互物品标识序列包括交互视频标识序列，交互视频标识序列中包括用户的各个交互视频标识，各个预设候选物品标识包括各个预设候选视频标识，信息推送装置1200，还包括：

视频推送模块，用于获取交互视频标识序列对应的增强特征序列，并基于交互视频标识序列对应的增强特征序列预测得到各个预设候选视频标识分别对应的交互程度；基于各个预设候选视频标识分别对应的交互程度，对各个预设候选视频标识进行筛选，得到目标视频标识；将目标视频标识的视频信息进行推送。

上述信息推送装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output，简称I/O）和通信接口。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储交互物品标识序列、各个交互物品标识的物品信息、各个交互物品标识的交互行为信息、交互行为特征序列以及交互物品标识所属于的交互场景等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推送方法。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图14所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、移动蜂窝网络、NFC（近场通信）或其他技术实现。该计算机程序被处理器执行时以实现一种信息推送方法。该计算机设备的显示单元用于形成视觉可见的画面，可以是显示屏、投影装置或虚拟现实成像装置，显示屏可以是液晶显示屏或电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图13或者图14中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于分析的数据、存储的数据、展示的数据等），均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器（Read-OnlyMemory，ROM）、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器（ReRAM）、磁变存储器（Magnetoresistive Random Access Memory，MRAM）、铁电存储器（Ferroelectric Random Access Memory，FRAM）、相变存储器（Phase Change Memory，PCM）、石墨烯存储器等。易失性存储器可包括随机存取存储器（Random Access Memory，RAM）或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器（Static Random Access Memory，SRAM）或动态随机存取存储器（Dynamic RandomAccess Memory，DRAM）等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种信息推送方法，其特征在于，所述方法包括：

获取交互物品标识序列，所述交互物品标识序列中包括用户的各个交互物品标识；

基于所述交互物品标识序列获取交互物品特征序列和交互行为特征序列，所述交互物品特征序列是对所述各个交互物品标识的物品信息进行特征提取得到的，所述交互行为特征序列是对所述各个交互物品标识的交互行为信息进行特征提取得到的，所述交互行为信息是从交互物品标识所属于的交互场景获取到的；

将所述交互物品特征序列与所述交互行为特征序列进行融合，得到融合特征序列，并提取所述融合特征序列中融合特征的自相关信息，得到自相关特征序列；

从各个预设场景特征增强信息中识别所述自相关特征序列对应的至少两个场景特征增强信息，并基于所述至少两个场景特征增强信息对所述自相关特征序列进行特征增强，得到增强特征序列；

所述增强特征序列用于预测得到各个预设候选物品标识分别对应的交互程度，并基于所述各个预设候选物品标识分别对应的交互程度进行物品信息推送。

2.根据权利要求1所述的方法，其特征在于，所述基于所述交互物品标识序列获取交互物品特征序列和交互行为特征序列，包括：

基于所述交互物品标识序列中的各个交互物品标识，在各个预提取的交互物品特征中查找所述各个交互物品标识分别对应的交互物品特征，得到所述交互物品特征序列；

从所述各个交互物品标识所属于的至少两个交互场景获取所述各个交互物品标识的至少两个交互行为信息；

针对每个交互物品标识，提取至少两个交互行为信息的嵌入表征，得到至少两个行为表征，并将所述至少两个行为表征进行融合，得到所述交互行为特征序列。

3.根据权利要求1所述的方法，其特征在于，所述将所述交互物品特征序列与所述交互行为特征序列进行融合，得到融合特征序列，包括：

将所述交互物品特征序列中的交互物品特征与所述交互行为特征序列中对应的交互行为特征进行融合，得到所述融合特征序列。

4.根据权利要求1所述的方法，其特征在于，所述提取所述融合特征序列中融合特征的自相关信息，得到自相关特征序列，包括：

将所述融合特征序列进行线性转换，得到目标查询序列，目标键序列和目标值序列；

计算所述目标查询序列与目标键序列之间的相关程度，得到相关程度序列，并基于所述相关程度序列对所述目标值序列进行变换，得到所述自相关特征序列。

5.根据权利要求1所述的方法，其特征在于，所述从各个预设场景特征增强信息中识别所述自相关特征序列对应的至少两个场景特征增强信息，并基于所述至少两个场景特征增强信息对所述自相关特征序列进行特征增强，得到增强特征序列，包括：

基于所述自相关特征序列进行信息选取计算，得到所述各个预设场景特征增强信息对应的选取程度；

基于所述各个预设场景特征增强信息对应的选取程度，对所述各个预设场景特征增强信息进行筛选，得到所述自相关特征序列对应的至少两个场景特征增强信息；

基于所述至少两个场景特征增强信息分别对所述自相关特征序列进行特征增强，得到至少两个当前增强特征序列；

按照至少两个场景特征增强信息分别对应的选取程度将所述至少两个当前增强特征序列进行融合，得到所述增强特征序列。

6.根据权利要求5所述的方法，其特征在于，所述按照至少两个场景特征增强信息分别对应的选取程度将所述至少两个当前增强特征序列进行融合，得到所述增强特征序列，包括：

获取所述至少两个场景特征增强信息的信息数量，基于所述信息数量将所述各个预设场景特征增强信息分别对应的选取程度进行更新，得到所述各个预设场景特征增强信息分别对应的更新程度；

将所述各个预设场景特征增强信息分别对应的更新程度进行归一化，得到所述各个预设场景特征增强信息分别对应的目标选取程度；

从所述各个预设场景特征增强信息分别对应的目标选取程度中确定所述至少两个场景特征增强信息分别对应的目标选取程度；

按照至少两个场景特征增强信息分别对应的目标选取程度将所述至少两个当前增强特征序列进行融合，得到所述增强特征序列。

7.根据权利要求6所述的方法，其特征在于，所述基于所述信息数量将所述各个预设场景特征增强信息分别对应的选取程度进行更新，得到所述各个预设场景特征增强信息分别对应的更新程度，包括：

基于所述信息数量从所述各个预设场景特征增强信息分别对应的选取程度中确定排序前列的各个选取程度和排序后列的各个选取程度；

将所述排序前列的各个选取程度保持不变，并将所述排序后列的各个选取程度更新为预设目标值，得到所述各个预设场景特征增强信息分别对应的更新程度。

8.根据权利要求6所述的方法，其特征在于，所述按照至少两个场景特征增强信息分别对应的目标选取程度将所述至少两个当前增强特征序列进行融合，得到所述增强特征序列，包括：

针对每个场景特征增强信息，按照目标选取程度对对应的当前增强特征序列进行加权，得到各个加权特征序列；

将所述各个加权特征序列进行融合，得到所述增强特征序列。

9.根据权利要求1所述的方法，其特征在于，在所述基于所述至少两个场景特征增强信息对所述自相关特征序列进行特征增强，得到增强特征序列之后，还包括：

将所述增强特征序列作为所述融合特征序列，并返回提取所述融合特征序列中融合特征的自相关信息，得到自相关特征序列的步骤执行，直到达到深度增强完成条件时，得到深度增强特征序列；

所述深度增强特征序列用于预测得到各个预设候选物品标识分别对应的深度交互程度，并基于所述各个预设候选物品标识分别对应的深度交互程度进行物品信息推送。

10.根据权利要求1所述的方法，其特征在于，在所述从各个预设场景特征增强信息中识别所述自相关特征序列对应的至少两个场景特征增强信息，并基于所述至少两个场景特征增强信息对所述自相关特征序列进行特征增强，得到增强特征序列之后，还包括：

基于所述各个预设候选物品标识将所述增强特征序列进行线性变换，得到所述各个预设候选物品标识分别对应的线性变换特征；

将所述各个预设候选物品标识分别对应的线性变换特征进行交互程度映射，得到所述各个预设候选物品标识分别对应的交互程度；

基于所述各个预设候选物品标识分别对应的交互程度，对所述各个预设候选物品标识进行筛选，得到目标物品标识；

将所述目标物品标识的物品信息进行推送。

11.根据权利要求1所述的方法，其特征在于，所述方法，还包括：

将所述交互物品标识序列输入到信息推送模型中，所述信息推送模型包括特征提取网络、自相关特征提取网络、特征增强网络和信息推送网络；

通过所述特征提取网络获取所述交互物品标识序列对应的交互物品特征序列和交互行为特征序列，并将所述交互物品特征序列与所述交互行为特征序列进行融合，得到融合特征序列；

通过所述自相关特征提取网络提取所述融合特征序列中融合特征的自相关信息，得到自相关特征序列；

通过所述特征增强网络从各个预设场景特征增强信息中识别所述自相关特征序列对应的至少两个场景特征增强信息，并基于所述至少两个场景特征增强信息对所述自相关特征序列进行特征增强，得到增强特征序列；

通过所述信息推送网络基于增强特征序列预测得到各个预设候选物品标识分别对应的交互程度，并基于所述各个预设候选物品标识分别对应的交互程度进行物品信息推送。

12.根据权利要求11所述的方法，其特征在于，所述信息推送模型的训练包括以下步骤：

获取历史交互物品标识序列，并基于所述历史交互物品标识序列确定训练交互物品标识序列和物品标识训练标签；

将所述训练交互物品标识序列输入到初始信息推送模型中，得到输出的各个预设候选物品标识分别对应的训练交互程度；

基于所述各个预设候选物品标识分别对应的训练交互程度和所述物品标识训练标签进行损失计算，得到损失信息；

基于所述损失信息对所述初始信息推送模型进行训练，当达到训练完成条件时，得到所述信息推送模型。

13.根据权利要求1所述的方法，其特征在于，所述交互物品标识序列包括交互视频标识序列，所述交互视频标识序列中包括用户的各个交互视频标识，所述各个预设候选物品标识包括各个预设候选视频标识，所述方法，还包括：

获取所述交互视频标识序列对应的增强特征序列，并基于所述交互视频标识序列对应的增强特征序列预测得到所述各个预设候选视频标识分别对应的交互程度；

基于所述各个预设候选视频标识分别对应的交互程度，对所述各个预设候选视频标识进行筛选，得到目标视频标识；

将所述目标视频标识的视频信息进行推送。

14.一种信息推送装置，其特征在于，所述装置包括：

标识序列获取模块，用于获取交互物品标识序列，所述交互物品标识序列中包括用户的各个交互物品标识；

特征序列获取模块，用于基于所述交互物品标识序列获取交互物品特征序列和交互行为特征序列，所述交互物品特征序列是对所述各个交互物品标识的物品信息进行特征提取得到的，所述交互行为特征序列是对所述各个交互物品标识的交互行为信息进行特征提取得到的，所述交互行为信息是从交互物品标识所属于的交互场景获取到的；

特征提取模块，用于将所述交互物品特征序列与所述交互行为特征序列进行融合，得到融合特征序列，并提取所述融合特征序列中融合特征的自相关信息，得到自相关特征序列；

推送模块，用于从各个预设场景特征增强信息中识别所述自相关特征序列对应的至少两个场景特征增强信息，并基于所述至少两个场景特征增强信息对所述自相关特征序列进行特征增强，得到增强特征序列；所述增强特征序列用于预测得到各个预设候选物品标识分别对应的交互程度，并基于所述各个预设候选物品标识分别对应的交互程度进行物品信息推送。

15.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。

17.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。