CN110598109A

CN110598109A - 一种信息推荐方法、装置、设备及存储介质

Info

Publication number: CN110598109A
Application number: CN201910869718.7A
Authority: CN
Inventors: 成梭宇
Original assignee: Shanghai Himalaya Technology Co Ltd
Current assignee: Shanghai Himalaya Technology Co Ltd
Priority date: 2019-09-16
Filing date: 2019-09-16
Publication date: 2019-12-20

Abstract

本发明公开了一种信息推荐方法、装置、设备及存储介质。其中，该方法包括：根据用户访问的信息和从数据库中提取的用户的特征数据训练得到的第一模型获取拟推荐信息，根据历史访问日志获取对比信息，并根据拟推荐信息和对比信息确定匹配信息，进而根据匹配信息的特征数据和用户的特征数据，确定推荐信息，将推荐信息推荐给用户。这样基于训练后的第一模型对可能向用户推荐的信息进行筛选，避免过度热门的信息被不恰当地推荐给用户，不仅解决了网站上曝光资源浪费的问题，同时也提高向用户推荐网络信息的准确性。

Description

一种信息推荐方法、装置、设备及存储介质

技术领域

本发明实施例涉及信息处理技术，尤其涉及一种信息推荐方法、装置、设备及存储介质。

背景技术

在信息推荐系统中，通常使用深度学习模型对用户可能感兴趣的信息进行推荐以及预测用户对该信息的点击通过率。其中，比较常用的深度学习模型为Youtube深度神经网络(Deep Neural Networks，DNN)。

但是，在使用Youtube DNN模型进行信息推荐时，Youtube DNN推荐的结果往往会偏向于热门信息，即该信息的访问量比较大，或者该信息被推荐的可能性比较大。由于这样将热门的信息被不太精准的推荐给用户，导致热门信息的点击通过率比Youtube DNN模型的平均点击通过率低，从而浪费了平台的曝光资源。

发明内容

本发明提供一种信息推荐方法、装置、设备及存储介质，能够基于训练后的模型对可能向用户推荐的信息进行筛选，避免过度热门的信息被不恰当地推荐给用户，从而提高向用户推荐信息的准确性。

第一方面，本发明实施例提供了一种信息推荐方法，该方法包括：

根据第一模型获取拟推荐信息；

其中，第一模型是根据用户访问的信息和从数据库中提取的用户的特征数据训练得到的；

根据历史访问日志获取对比信息；

根据拟推荐信息和所述对比信息确定匹配信息；

根据匹配信息的特征数据和用户的特征数据，确定推荐信息；

将推荐信息推荐给用户。

第二方面，本发明实施例还提供了一种信息推荐装置，该装置包括：

获取模块，用于根据第一模型获取拟推荐信息；

获取模块，还用于根据历史访问日志获取对比信息；

确定模块，用于根据拟推荐信息和对比信息确定匹配信息；

确定模块，还用于根据匹配信息和用户的特征数据，确定推荐信息；

推荐模块，用于将推荐信息推荐给用户。

第三方面，本发明实施例还提供了一种信息推荐设备，该设备包括：

存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，当处理器执行计算机程序时，实现如本发明第一方面提供的信息推荐方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，当该计算机程序被处理器执行时，实现如本发明第一方面提供的信息推荐方法。

本发明实施例提供了一种信息推荐方法，具体为根据用户访问的信息和从数据库中提取的用户的特征数据训练得到的第一模型获取拟推荐信息，根据历史访问日志获取对比信息，并根据拟推荐信息和对比信息确定匹配信息，进而根据匹配信息的特征数据和用户的特征数据，确定推荐信息，将推荐信息推荐给用户。这样基于训练后的第一模型对可能向用户推荐的信息进行筛选，避免过度热门的信息被不恰当地推荐给用户，不仅解决了网站上曝光资源浪费的问题，同时也提高向用户推荐网络信息的准确性。

附图说明

图1是本发明实施例一中的信息推荐方法流程图；

图2是本发明实施例二中的信息推荐方法流程图；

图3是本发明实施例三中的信息推荐装置结构示意图；

图4是本发明实施例四中的信息推荐设备结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

另外，在本发明实施例中，“可选地”或者“示例性地”等词用于表示作例子、例证或说明。本发明实施例中被描述为“可选地”或者“示例性地”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“可选地”或者“示例性地”等词旨在以具体方式呈现相关概念。

实施例一

本发明实施例提供了一种信息推荐方法，其具体实现方式如图1所示，包括：

S101、根据第一模型获取拟推荐信息。

在本实施例中，第一模型可以是根据用户访问的信息和从数据库中提取的用户的特征数据训练得到的，其中，用户的特征数据可以为用户的年龄、性别、兴趣类别等，用户访问的信息可以为用户在某网站上浏览的电影、音乐、新闻、论文等。

可以理解的是，通常用户在某网站平台上浏览信息时，可能会在网站上注册会员或者在该网站上选择自己感兴趣的话题，那么用户注册会员时可能填写的用户性别、年龄，以及选择的兴趣类别即可以作为用户的特征数据。

在本实施例中，拟推荐的信息也可以为各个网站平台上可能推荐的电影、音乐、新闻等。因此，本步骤可以理解为根据用户访问的信息和从数据库中提取的用户的特征数据训练得到第一模型，进而根据训练后的第一模型获取网站上可能推荐的各类信息。

S102、根据历史访问日志获取对比信息。

本领域技术人员公知的是，用户在某网站平台上浏览信息时，该网站后台会自动记录用户的访问记录，并生成历史访问日志。

在本实施例中，对比信息可以为网站上热度较高的信息。进一步地，本步骤中，根据历史访问日志获取对比信息可以理解为根据用户的历史访问日志获取网站上的热门信息。

S103、根据拟推荐信息和对比信息确定匹配信息。

在本实施例中，上述匹配信息可以为拟推荐信息中的热门信息。因此，本步骤可以理解为根据确定的拟推荐信息和步骤S102中确定的对比信息确定两者中相同的热门信息。

S104、根据匹配信息的特征数据和用户的特征数据，确定推荐信息。

可选地，匹配信息的特征数据可以包括信息的类别，例如，历史类信息、文学类信息、音乐类信息等。由于步骤S101中描述用户的特征数据可以包括用户的兴趣类别，那么本步骤可以理解为根据用户的兴趣类别这一特征数据和匹配信息的类别，确定将要向用户推荐的信息。

示例性地，当用户的兴趣类别这一特征数据与匹配信息的类别这一特征数据不相同时，可以认为用户对当前的热门信息不感兴趣，进而可以将匹配信息从拟推荐的信息中删除，将拟推荐信息中的其余信息作为推荐信息。

S105、将推荐信息推荐给用户。

如步骤S104中所列举的情况，当用户对匹配信息(也即网站上的热门信息)不感兴趣时，将匹配信息从拟推荐的信息中剔除，并将其余信息推荐给用户，这样可以避免将网站上过度热门的信息推荐给对其不感兴趣的用户，不仅解决了网站上曝光资源浪费的问题，同时也提高向用户推荐网络信息的准确性。

实施例二

图2为本发明实施例提供的一种信息推荐方法的流程图，本发明实施例是在上述实施例一的基础上做的进一步优化，该方法具体包括以下步骤：

S201、根据第一模型获取拟推荐信息。

在本实施例中，第一模型是根据用户访问的信息和从数据库中提取的用户的特征数据训练得到的，其中，用户的特征数据可以为用户的年龄、性别、兴趣类别等。信息可以为各个网站平台上的电影、音乐、新闻等网络信息。

在本实施例中，示例性地提供一种根据用户访问的信息和从数据库中提取的用户的特征数据训练得到第一模型的实现方式，该实现方式具体包括以下步骤：

S2010、构建训练模型。

示例性地，在本实施例中构建的训练模型为YouTube深度神经网络(Deep NeuralNetworks，DNN)模型。

需要说明的是，上述YouTube DNN模型仅是用于在本实施例中进行示例性的描述，并不用于限定本发明的保护范围。

S2011、根据历史访问日志生成训练数据。

在本发明实施例中，训练数据可以包括用户标识、第一信息标识以及至少一个第二信息标识。其中，第一信息标识为用户历史访问信息中最新信息的标识，至少一个第二信息标识为用户历史访问信息中除最新信息之外其余信息的标识。

例如，用户在网站平台上浏览各类网络信息时，该网站后台会自动记录用户的访问记录和用户标识，并基于记录的信息生成与该用户标识对应的历史访问日志，其中，该用户标识可以为用户的用户名。

在本实施例中，以5个信息为例，按倒序时间的顺序根据历史访问日志依次获取5个信息，其中获取的第一个信息即为最新信息，也即上述第一信息，对应地，获取第一个信息的标识即为第一信息标识。在获取的5个信息中剩余的其余信息，即获取的第二个至第五个信息为第二信息，对应地，剩余的其余信息的标识即为第二信息标识。

需要说明的是，在基于历史访问日志获取用户访问信息的过程中，仅保留用户访问信息数目大于等于2的记录，若某一用户访问信息的记录为访问1个信息或者并未访问任何信息，那么剔除该用户记录。

S2012、根据训练数据从数据库中提取用户的特征数据。

由于训练数据是根据历史访问日志生成的，该训练日志中包括有用户标识。因此，可以根据训练日志中的用户标识从数据库中提取用户的特征数据。例如，提取与该用户标识对应的用户的年龄、性别、兴趣类别等。

S2013、对用户的特征数据和训练数据进行处理，得到输入数据。

在本步骤中，对用户的特征数据和训练数据的处理方式可以为对步骤S2012从数据库中提取的用户的年龄、性别、兴趣类别等用户特征数据进行编码处理，例如独热(one-hot)编码。

对训练数据中的至少一个第二信息标识进行向量处理，得到信息向量。

进而，将信息向量与经过独热编码后的用户的特征数据进行拼接，得到输入数据。

可选地，本实施例提供一种得到信息向量的可能的实现方式为对训练数据中的至少一个第二信息标识进行编码，将编码后的至少一个第二信息标识和训练模型中的分类层进行匹配，得到信息向量。

本领域技术人员熟知，本实施例所选取的YouTube DNN这一训练模型中包含有分类层(softmax)，根据将编码后的至少一个第二信息标识从训练模型的分类层取出对应编码的参数向量，即可获得信息向量。其中，该分类层包含有计算得到的用户与各信息之间的相关度(例如，用户可能访问某一信息的概率)。

其中，上述编码方式可以为将每个信息标识对应至一个整数。例如，假设有5万个不同的信息需要被编码，编码后的索引范围为1～50000，每个信息编码后的索引都作为该信息样本的标签。同时，分类层作为多分类层，其中也包含有和上述5万个信息相对应的5万个向量。如步骤S2011所列举的情况，用户有4个第二信息标识，其编码后对应的索引分别为2、1000、10001、30000，那么根据索引列表可以从分类层分别取出与4个第二信息标识对应的参数向量，即可获得信息向量。

需要说明的是，为了保证输入数据的长度固定。当仅有一个第二信息时，通过分类层获得一个参数向量，该一个参数向量即为信息向量，并将该信息向量与经过编码后的用户的特征数据进行拼接。当存在有多个第二信息时，同样会得到多个参数向量，此时可以对多个参数向量取平均值，将取平均值得到的参数向量作为信息向量与经过编码后的用户的特征数据进行拼接。

上述过程可以理解为将用户的访问历史，即至少一个第二信息的标识，作为用户的行为特征，并将该行为特征与用户的年龄、性别、兴趣类别等特征进行拼接，得到输入数据。

S2014、根据输入数据和训练数据训练训练模型，得到第一模型。

在本实施例中，该步骤可以为根据输入数据和训练数据中的第一信息标识训练训练模型，进而得到第一模型。

进一步地，在训练模型之前，可以对训练数据中的第一信息标识进行编码，例如，采用对至少一个第二信息同样的编码方式。进而，通过编码后的第一信息标识和输入数据训练训练模型。

需要说明的是，在本实施例中，可以按照根据历史访问日志依次获取信息的顺序进行编码，即可以先对第一信息标识编码，再采用相同的编码方式对至少一个第二信息标识进行编码。

在模型训练过程中，根据输入数据和第一信息标识训练训练模型时，训练模型的分类层可以计算出该用户可能会访问第一信息标识对应的第一信息的概率，即为理论概率。通过最小化理论概率和实际概率之间的差距，来更新模型参数，从而达到收敛。假设训练结果为访问第一信息的理论概率为0.5，而从步骤S2011中可以得知，第一信息标识对应的第一信息为用户最新访问的信息，即该第一信息的实际访问概率为1。理论概率和实际概率之间相差较大，因此，可以通过最小化损失函数，对训练模型中的参数(例如，中间层参数)进行调整，以使模型达到收敛，即访问某一信息的理论概率和实际访问概率相差较小。

需要说明的是，在上述模型训练过程中，需要通过分类层进行负采样生成负样本，将负样本与输入数据相结合，以对训练模型进行训练。其中，负样本为用户未访问过的信息，也即与负样本对应的实际访问概率为0，这样使训练模型基于输入数据和负样本有效区分用户是否访问对应的信息，并结合对应信息的实际访问概率和理论概率，可以更加准确、可靠地对训练模型进行训练。

采用上述训练方法，在对多个向用户推荐的信息进行反复训练、模型参数调整之后，即可得到符合预期期望的第一模型。

需要说明的是，在上述模型训练过程中所采用的最小化损失函数可以为现有技术中的任意函数，例如，交叉熵损失函数等，本申请对此不作限定。但本领域技术人员采用任意损失函数实现本实施例的方案均属于本发明的保护范围。

202、根据历史访问日志获取对比信息。

在本实施例中，对比信息可以为网站上的热门信息。由于用户在某网站平台上浏览信息时，该网站后台会自动记录用户的访问记录，并生成历史访问日志。因此，本步骤可以理解为根据用户的历史访问日志获取网站上的热门信息。

例如，在n个用户中，用户1、用户2、……用户n的历史访问日志中均存在信息a，即信息a在n个用户的历史访问日志中出现了n次，那么该信息a可以被确认为是热门信息，也即本步骤中的对比信息。

相反，若用户1、用户2、……用户n的历史访问日志中均不存在信息b，即信息b在n个用户的历史访问日志中总共出现了0次，那么该信息b可以被判定为非热门信息或者冷门信息，进而，该信息b也不能被确定为本步骤中的对比信息。

需要说明的是，本步骤所列举的n个用户为某网站平台上所有的用户数量或者接近访问该网站平台的所有用户数量。

S203、根据拟推荐信息和对比信息确定匹配信息。

在本实施例中，匹配信息可以理解为拟推荐信息中的热门信息，也即该步骤为根据确定的拟推荐信息和对比信息确定两者中相同的热门信息。

示例性地，如步骤S102中举例，信息a被确认为热门信息(或对比信息)，若拟推荐信息中也存在信息a，那么该信息a即为匹配信息。

当然，若拟推荐信息中不存在对比信息中的任意一个信息，即拟推荐信息与对比信息中不存在相同的信息，那么匹配信息为空。

S204、根据匹配信息的特征数据和用户的特征数据，确定推荐信息。

可选地，匹配信息的特征数据可以包括信息的类别，例如，历史类信息、文学类信息、音乐类信息等。由于步骤S101中描述用户的特征数据可以包括用户的兴趣，那么本步骤可以理解为根据用户的兴趣这一特征数据和匹配信息的类别，确定将要向用户推荐的信息。

在本实施例中，列举可能存在的多种情况：

第一种情况，当用户的兴趣这一特征数据与匹配信息的类别这一特征数据不相同时，可以认为用户对当前的热门信息不感兴趣，进而可以将匹配信息从拟推荐的信息中删除，将拟推荐信息中的其余信息作为推荐信息推荐给用户。这样可以避免将网站上过度热门的信息推荐给对其不感兴趣的用户，不仅解决了网站上曝光资源浪费的问题，同时也提高向用户推荐网络信息的准确性。

第二种情况，当用户的兴趣这一特征数据与匹配信息的类别这一特征数据相同时，可以认为用户对当前的热门信息感兴趣，进而可以将拟推荐信息推荐确定为推荐信息，并将该推荐信息推荐给用户。由于拟推荐信息中既包含有匹配信息(即热门信息)，也包括匹配信息之外的其余信息(即非热门信息)，这样将拟推荐信息作为推荐信息推荐给用户时，既可以满足将用户感兴趣的热门信息推荐给用户，又可以将其余信息推荐给用户实现个性化推荐。

第三种情况，当匹配信息为空时，即拟推荐信息中不存在热门信息，那么将拟推荐信息确定为推荐信息。由于这种情况下无法判断匹配信息的特征数据和用户的特征数据是否相同，因此，确定为推荐信息的拟推荐信息中可能存在有各种类型的信息，这样将拟推荐信息推荐给用户可以实现向用户的个性化推荐。

在上述三种可能的情况中，由于当匹配信息的特征数据与用户的特征数据不相同时，将匹配信息从拟推荐信息中删除了，并将删除之后的其余信息作为推荐信息推荐给用户，这样可以针对用户的特征数据进行信息推荐，提高向用户推荐信息的准确性。

S205、将推荐信息推荐给用户。

在步骤S204中，对于各种可能的情况设置了对应的确定推荐信息的方法，并将推荐信息推荐给用户，从而可以避免过度热门的信息被不恰当地推荐给用户，从而提高向用户推荐信息的准确性。

实施例三

本发明实施例提供了一种信息推荐装置，如图3所示，该装置包括：获取模块301、确定模块302、推荐模块303。

其中，获取模块，用于根据第一模型获取拟推荐信息；

获取模块，还用于根据历史访问日志获取对比信息；

确定模块，用于根据拟推荐信息和对比信息确定匹配信息；

推荐模块，用于将推荐信息推荐给用户。

进一步地，信息推荐装置还包括构建模块、生成模块、处理模块、训练模块；

其中，构建模块用于构建训练模型；

生成模块，用于根据历史访问日志生成训练数据；

其中，训练数据包括用户标识、第一信息标识以及至少一个第二信息标识，第一信息标识为用户历史访问信息中最新信息的标识，至少一个第二信息标识为用户历史访问信息中除最新信息之外其余信息的标识；

获取模块，用于根据训练数据从数据库中提取用户的特征数据；

处理模块，用于对用户的特征数据和训练数据进行处理，得到输入数据；

训练模块，用于根据输入数据和训练数据训练所述训练模型，得到第一模型。

进一步地，上述处理模块，用于对用户的特征数据进行独热(one-hot)编码；对训练数据中的至少一个第二信息标识进行向量处理，得到信息向量；将信息向量与经过独热编码后的用户的特征数据进行拼接，得到输入数据。

进一步地，处理模块，具体用于对训练数据中的至少一个第二信息标识进行编码；将编码后的至少一个第二信息标识和训练模型中的分类层进行匹配，得到信息向量。

进一步地，确定模块，用于当拟推荐信息的特征数据和对比信息的特征数据中有至少一个相同的特征数据时，将至少一个相同的特征数据对应的信息确定为匹配信息；

或者，当拟推荐信息的特征数据和对比信息的特征数据中不存在相同的特征数据时，确定匹配信息为空。

进一步地，确定模块，用于当匹配信息的特征数据与用户的特征数据不相同时，将匹配信息从拟推荐信息中删除，将拟推荐信息中的其余信息确定为推荐信息；

或者，当匹配信息的特征数据与用户的特征数据相同时，将拟推荐信息确定为推荐信息；

或者，当匹配信息为空时，将拟推荐信息确定为推荐信息。

本发明实施例所提供的信息推荐装置可执行本发明实施例一、二所提供的信息推荐方法，具备执行方法相应的功能模块和有益效果。

实施例四

图4为本发明实施例四提供的一种信息推荐设备的结构示意图，如图4所示，该设备包括处理器401、存储器402、输入装置403和输出装置404；设备中处理器401的数量可以是一个或多个，图4中以一个处理器401为例；设备中的处理器401、存储器402、输入装置403和输出装置404可以通过总线或其他方式连接，图4中以通过总线连接为例。

存储器402作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例一中的信息推荐方法对应的程序指令/模块(例如，信息推荐装置中的获取模块301、确定模块302、推荐模块303)。处理器401通过运行存储在存储器402中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的信息推荐方法。

存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器402可进一步包括相对于处理器401远程设置的存储器，这些远程存储器可以通过网络连接至设备/终端/服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置403可用于接收输入的数字或字符信息，以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置304可包括显示屏等显示设备。

实施例五

本发明实施例四还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种信息推荐方法，该方法包括：

根据第一模型获取拟推荐信息；

根据历史访问日志获取对比信息；

根据拟推荐信息和对比信息确定匹配信息；

将推荐信息推荐给用户。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的信息推荐方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述信息推荐装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种信息推荐方法，其特征在于，包括：

根据第一模型获取拟推荐信息；

其中，所述第一模型是根据用户访问的信息和从数据库中提取的用户的特征数据训练得到的；

根据历史访问日志获取对比信息；

根据所述拟推荐信息和所述对比信息确定匹配信息；

根据所述匹配信息的特征数据和所述用户的特征数据，确定所述推荐信息；

将所述推荐信息推荐给用户。

2.根据权利要求1所述的方法，其特征在于，训练得到所述第一模型，包括：

构建训练模型；

根据历史访问日志生成训练数据；

根据所述训练数据从所述数据库中提取用户的特征数据；

对所述用户的特征数据和所述训练数据进行处理，得到输入数据；

根据所述输入数据和所述训练数据训练所述训练模型，得到所述第一模型。

3.根据权利要求2所述的方法，其特征在于，所述训练数据包括用户标识、第一信息标识以及至少一个第二信息标识，所述第一信息标识为用户历史访问信息中最新信息的标识，所述至少一个第二信息标识为用户历史访问信息中除最新信息之外其余信息的标识。

4.根据权利要求2或3所述的方法，其特征在于，对所述用户的特征数据和所述训练数据进行处理，得到输入数据，包括：

对所述用户的特征数据进行独热编码；

对所述训练数据中的至少一个第二信息标识进行向量处理，得到信息向量；

将所述信息向量与经过独热编码后的用户的特征数据进行拼接，得到输入数据。

5.根据权利要求4所述的方法，其特征在于，所述对所述训练数据中的至少一个第二信息标识进行向量处理，得到信息向量，包括：

对所述训练数据中的至少一个第二信息标识进行编码；

将编码后的所述至少一个第二信息标识和所述训练模型中的分类层进行匹配，得到信息向量。

6.根据权利要求1所述的方法，其特征在于，所述根据所述拟推荐信息和所述对比信息确定匹配信息，包括：

当所述拟推荐信息的特征数据和所述对比信息的特征数据中有至少一个相同的特征数据时，将所述至少一个相同的特征数据对应的信息确定为匹配信息；

或者，当所述拟推荐信息的特征数据和所述对比信息的特征数据中不存在相同的特征数据时，确定所述匹配信息为空。

7.根据权利要求1或6所述的方法，其特征在于，所述根据所述匹配信息的特征数据和所述用户的特征数据，确定所述推荐信息，包括：

当所述匹配信息的特征数据与所述用户的特征数据不相同时，将所述匹配信息从所述拟推荐信息中删除，将所述拟推荐信息中的其余信息确定为所述推荐信息；

或者，当所述匹配信息的特征数据与所述用户的特征数据相同时，将所述拟推荐信息确定为推荐信息；

或者，当所述匹配信息为空时，将所述拟推荐信息确定为所述推荐信息。

8.一种信息推荐装置，其特征在于，包括：

获取模块，用于根据第一模型获取拟推荐信息；

所述获取模块，还用于根据历史访问日志获取对比信息；

确定模块，用于根据所述拟推荐信息和所述对比信息确定匹配信息；

所述确定模块，还用于根据所述匹配信息和所述用户的特征数据，确定所述推荐信息；

推荐模块，用于将所述推荐信息推荐给用户。

9.一种信息推荐设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时，实现如权利要求1-7任一项所述的信息推荐方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-7中任一项所述的信息推荐方法。