CN113254777A

CN113254777A - 信息推荐方法、装置、电子设备及存储介质

Info

Publication number: CN113254777A
Application number: CN202110629609.5A
Authority: CN
Inventors: 陈程; 王贺; 石奕
Original assignee: Wuhan Zhuoer Digital Media Technology Co ltd
Current assignee: Wuhan Zhuoer Digital Media Technology Co ltd
Priority date: 2021-06-07
Filing date: 2021-06-07
Publication date: 2021-08-13
Anticipated expiration: 2041-06-07
Also published as: CN113254777B

Abstract

本发明实施例提供了一种信息推荐方法，该方法包括：基于至少一个第一用户对第一类信息和第二类信息的第一历史评论数据，确定第一类信息和第二类信息之间的相似度；根据第二用户针对第二类信息的第二历史评论数据，确定第二用户对第二类信息的情感倾向信息；基于第一类信息和第二类信息的相似度，从第一类信息中选择与第二类信息具有相似性的备选信息；基于所述第二类信息的情感倾向信息，从备选信息中选择与具有正向情感评价的第二类信息相似的备选信息作为目标信息推荐给第二用户。

Description

信息推荐方法、装置、电子设备及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种信息推荐方法、装置、电子设备及存储介质。

背景技术

随着网络技术的发展，社交媒体平台（例如新浪微博或网易微博等）的便捷性使得用户能够随时随地的在网络发布信息，这也导致了社交媒体平台呈现信息过载的状态。海量的信息对社交媒体平台来说确实是一笔宝贵的财富，但海量信息带来的信息过载也增加了社交媒体平台进行个性化信息精准推送的难度。

发明内容

本发明实施例提供一种信息推荐方法、装置、电子设备及存储介质。

本发明实施例的技术方案是这样实现的：

第一方面，本发明实施例提供一种信息推荐方法，包括：

基于至少一个第一用户对第一类信息和第二类信息的第一历史评论数据，确定所述第一类信息和所述第二类信息之间的相似度；

根据第二用户针对所述第二类信息的第二历史评论数据，确定所述第二用户对所述第二类信息的情感倾向信息；

基于所述第一类信息和所述第二类信息的相似度，从所述第一类信息中选择与所述第二类信息具有相似性的备选信息；

基于所述第二类信息的情感倾向信息，从所述备选信息中选择与具有正向情感评价的所述第二类信息相似的备选信息作为目标信息推荐给所述第二用户。

可选地，所述基于至少一个第一用户对第一类信息和第二类信息的第一历史评论数据，确定所述第一类信息和所述第二类信息之间的相似度，包括：

基于至少一个第一用户对第一类信息和第二类信息的第一历史评分，确定所述第一类信息和所述第二类信息之间的评分差值；

基于所述第一类信息和所述第二类信息之间的评分差值和所述第一用户的数量的比值，确定所述第一类信息和所述第二类信息之间的相似度。

可选地，所述根据第二用户针对所述第二类信息的第二历史评论数据，确定所述第二用户对所述第二类信息的情感倾向信息，包括：

根据所述第二用户针对所述第二类信息的第二历史评论和所述第二历史评论中的多个主题词，确定属于正向情感类别的主题词；

根据所述第二历史评论与所述属于正向情感类别的主题词之间的语义相关性，确定所述第二用户对所述第二类信息的情感倾向信息。

可选地，所述根据所述第二用户针对所述第二类信息的第二历史评论和所述第二历史评论中的多个主题词，确定属于正向情感类别的主题词，包括：

基于所述第二用户针对所述第二类信息的第二历史评论，提取所述第二历史评论中的多个主题词；

根据所述多个主题词和所述第二历史评论，对所述主题词进行基于词义的情感分类，得到所述多个主题词的情感得分；

基于所述多个主题词的情感得分，确定出属于正向情感类别的主题词。

可选地，所述基于所述第一类信息和所述第二类信息的相似度，从所述第一类信息中选择与所述第二类信息具有相似性的备选信息，包括：

基于所述第一类信息和所述第二类信息的相似度，确定所述第一类信息和所述第二类信息之间的第一隐因子向量；

基于所述第二用户对所述第二类信息的第二历史评分，确定所述第二用户与所述第二类信息之间的第二隐因子向量；

根据所述第一类信息和所述第二类信息之间的隐因子向量，以及所述第二用户与所述第二类信息之间的隐因子向量，确定所述第二用户对所述第一类信息的预测评分；

根据所述第二用户对所述第一类信息的预测评分，从所述第一类信息中选择出所述备选信息。

可选地，所述基于所述第二类信息的情感倾向信息，从所述备选信息中选择与具有正向情感评价的所述第二类信息相似的备选信息作为目标信息推荐给所述第二用户，包括：

根据所述第二用户对所述第二类信息的情感得分和所述第二用户对所述备选信息的预测评分的加权和，从所述备选信息中选择出推荐给所述第二用户的所述目标信息。

可选地，所述方法还包括：

获取所述第二用户针对所述目标信息的评论数据；

基于所述第二用户针对所述目标信息的评论数据，调整所述第二用户对所述第二类信息的情感得分的权重值。

第二方面，本发明实施例提供一种信息推荐装置，包括：

第一确定模块，用于基于至少一个第一用户对第一类信息和第二类信息的第一历史评论数据，确定所述第一类信息和所述第二类信息之间的相似度；

第二确定模块，用于根据第二用户针对所述第二类信息的第二历史评论数据，确定所述第二用户对所述第二类信息的情感倾向信息；

选择模块，用于基于所述第一类信息和所述第二类信息的相似度，从所述第一类信息中选择与所述第二类信息具有相似性的备选信息；基于所述第二类信息的情感倾向信息，从所述备选信息中选择与具有正向情感评价的所述第二类信息相似的备选信息作为目标信息推荐给所述第二用户。

第三方面，本发明实施例提供一种电子设备，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现如前述一个或多个技术方案提供的信息推荐方法。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令；所述计算机可执行指令被处理器执行后，能够实现前述一个或多个技术方案提供的信息推荐方法。

本发明实施例提供的一种信息推荐方法、装置、电子设备和存储介质，一方面，本发明实施例利用第一用户对所述第一类信息和所述第二类信息的第一历史评论数据，确定出所述第一类信息和所述第二类信息之间的相似度；基于所述第一类信息和所述第二类信息之间的相似度，从第一类信息中选择出与所述第二类信息具有相似性的备选信息；减少了信息推荐处理过程中涉及到的第一类信息的数量，提高了信息推荐效率。

另一方面，本发明实施例根据第二用户对第二类信息的第二历史评论数据，确定第二用户对所述第二类信息的情感倾向信息；从而根据所述第二用户对第二类信息的情感倾向信息，从而选择出与具有正向情感评价的第二类信息具有相似性的备选信息作为推荐给第二用户的目标信息；保证了信息推荐的准确性。

附图说明

图1是本发明实施例提供的一种信息推荐方法的流程示意图一；

图2是本发明实施例提供的一种信息推荐方法的流程示意图二；

图3是本发明实施例提供的一种信息推荐装置的结构示意图；

图4是本示例提供的一种信息推荐方法的流程示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，所描述的实施例不应视为对本发明的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的，不是旨在限制本发明。

推荐系统在向用户进行信息推荐时，通过提取停留时间大于时间阈值且屏幕中线穿过的热点消息；基于所述热点消息，提取关键字；根据所述关键词进行第一次匹配，获得第一次匹配结果；利用所述关键字的特征信息进行第二次匹配的匹配范围限定，在所述第一次匹配结果下进行第二次匹配，将第二次匹配内容作为推荐信息进行显示。但由于方法没有考虑到推荐信息之间的相似度，即对这类信息感兴趣的用户，还会对哪类信息感兴趣，使得推荐准确性较低，且推荐效率不高。

本发明实施例提供一种信息推荐方法，图1是本发明实施例提供的一种信息推荐方法的流程示意图一，如图1所示，所述方法包括以下步骤：

步骤101，基于至少一个第一用户对第一类信息和第二类信息的第一历史评论数据，确定所述第一类信息和所述第二类信息之间的相似度；

步骤102，根据第二用户针对所述第二类信息的第二历史评论数据，确定所述第二用户对所述第二类信息的情感倾向信息；

步骤103，基于所述第一类信息和所述第二类信息的相似度，从所述第一类信息中选择与所述第二类信息具有相似性的备选信息；

步骤104，基于所述第二类信息的情感倾向信息，从所述备选信息中选择与具有正向情感评价的所述第二类信息相似的备选信息作为目标信息推荐给所述第二用户。

在本发明实施例中，所述信息推荐方法可应用于移动终端，还可以应用于服务器中。当应用于服务器中，移动终端向服务器发送携带有第二用户信息的信息推荐请求，服务器接收到所述信息推荐请求后，采用101-104的步骤进行处理获得目标信息后，将所述目标信息发送给移动终端，以便移动终端向所述第二用户推荐所述目标信息。

以信息推荐方法应用于移动终端为例，该移动终端可以是智能手机、平板电脑或可穿戴设备等；所述移动终端上可以安装有各种应用程序（Application，APP），用户可以通过使用所述移动终端上安装的APP来获取推荐的信息，所述信息可为广告信息、新闻信息或其他个性化服务信息。例如，用户可以基于新闻APP获取该新闻APP推送的新闻信息。

在步骤101中，所述第一类信息可为所述第二用户处理过的信息；这里，所述处理可以为任意适当的处理，包括但不限于：阅读、分享、收藏、评论或转发等；所述第二类信息可为所述第二用户未阅读过的信息。

所述第一历史评论数据是所述第一用户对第一类信息和第二类信息的反馈，可根据至少一个第一用户对第一类信息和第二类信息的第一历史评论数据，确定所述第一类信息和所述第二类信息的标签信息；根据所述第一类信息和所述第二类信息的标签信息，确定所述第一类信息和所述第二类信息的相似性。

在本发明实施例中，所述标签信息可以是基于所述第一类信息和所述第二类信息的第一历史评论数据提取的主题信息；还可以是基于所述第一类信息和所述第二类信息的第一历史评论数据提取的评论内容信息。

所述第一类信息和所述第二类信息的相似性可为主题相似度和/或内容相似度。

在一个实施例中，在确定第一类信息和第二类信息的相似度时，不仅考虑到标题所涉及的主题的相似性，还将考虑内容相似性，如此，减少了标题党信息等劣质信息的干扰性，从而再次提升了信息推荐的精准度。

示例性地，可通过对至少一个第一用户对第一类信息和所述第二类信息的第一历史评论进行主题提取，得到所述第一类信息的第一评论主题向量和所述第二类信息的第二评论主题向量；基于所述第一评论主题向量和所述第二评论主题向量之间的余弦相似度，确定所述第一类信息和所述第二类信息的相似性。

又示例性地，可通过对至少一个第一用户对第一类信息和所述第二类信息的第一历史评论进行语义分析处理，得到针对第一类信息的第一语义特征和针对第二类信息的第二语义特征；根据所述第一语义特征和所述第二语义特征，确定所述第一语义特征和第二语义特征的关联特征；根据所述关联特征，确定所述第一类信息和所述第二类信息的相似性。

在步骤102中，所述第二历史评论数据是所述第二用户对所述第二类信息的反馈；所述第二历史评论数据可为包含正面情感和/或负面情感的评论数据；

例如，“虽然这款手机的价格很贵，但是功能非常齐全，物超所值”，其中，“价格很贵”表达了负面情感，而“功能非常齐全”以及“物超所值”表达了正面情感。

在本发明的一些实施例中，可通过获取第二用户对所述第二类信息的第二历史评论数据，从所述第二类信息的第二历史评论数据中提取情感词，根据所述第二历史评论数据中正面情感词在所述情感词中所占的比例，确定第二用户对所述第二类信息的情感倾向信息。

这里，所述情感词至少包括：正面情感词和负面情感词；

正面情感词是指表示肯定的、积极的正面情感的词汇；例如，好、清楚、喜欢或乐意等；负面情感词是指表示否定的、消极的负面情感的词汇；例如，坏、不好、模糊、不喜欢或讨厌等。

需要说明的是，第二历史评论数据的数量越多，根据所述第二历史评论数据确定的第二类信息的情感倾向信息越准确；但第二历史评论数据的数量越多，计算量越大。因此，获取的第二历史评论数据的数量可根据经验进行设置，在此不作限定。

在本发明的另一些实施例中，考虑到第二用户对第二类信息的兴趣可能会随着时间衰减，故所述第二历史评论数据可以是预先选定的时间段内的评论数据。

这里，选定的时间段越近，越能准确反映第二用户对第二类信息的情感倾向信息因此，预先选定的时间段可以是最近的时间段，例如，可以是当前时刻之前的一个星期或两个星期等。

在步骤103中，根据所述第一类信息和所述第二类信息之间的相似度，按从高到低的顺序对相似度进行排序，并根据排序结果选择前N个相似度对应的第一类信息，将所述前N个相似度对应的第一类信息作为备选信息。所述N为大于或等于1的正整数。

在本发明的一些实施例中，所述基于所述第一类信息和所述第二类信息的相似度，从所述第一类信息中选择与所述第二类信息具有相似性的备选信息，包括：

根据所述第一类信息和所述第二类信息之间的相似度，将所述相似度高于预定阈值的第一类信息作为与所述第二类信息具有相似性的备选信息。

这里，所述预定阈值可根据实际需求进行设定，本发明不作限定。

在本发明的另一些实施例中，所述基于所述第一类信息和所述第二类信息的相似度，从所述第一类信息中选择与所述第二类信息具有相似性的备选信息，包括：

根据所述第一类信息和所述第二类信息之间的相似度，将所述相似度位于前N%的第一类信息作为与所述第二类信息具有相似性的备选信息。

这里，所述N可根据实际需求进行设定；例如，N为大于0且小于30的常数。

在步骤104中，由于所述备选信息为与所述第二类信息具有相似性的第一类信息，因此，根据第二用户对所述第二类信息的情感倾向信息，确定出具有正向情感评价的第二类信息；并从备选信息中选择出与具有正向情感评价的第二类信息具有相似性的目标信息，将其推荐给第二用户。

一方面，本发明实施例利用第一类信息和第二类信息之间的相似度，减少了信息推荐处理过程中涉及到的第一类信息的数量，提高了信息推荐效率；另一方面，利用第二用户对第二类信息的情感倾向信息，直接确定出与具有正向情感评价的第二类信息具有相似性的备选信息作为目标信息，保证了信息推荐的准确性。

可选地，所述步骤101中基于至少一个第一用户对第一类信息和第二类信息的第一历史评论数据，确定所述第一类信息和所述第二类信息之间的相似度，包括：

在本发明实施例中，所述第一历史评分可用于指示第一用户对所述第一类信息或第二类信息的情感倾向和程度；例如，第一用户对信息A的第一历史评分为0.8分，对信息B的第一历史评分为-0.2分，对信息C的第一历史评分为0.4分，说明第一用户对信息A和信息C都感兴趣，但对信息A的兴趣程度更深；对信息B不感兴趣。

根据第一用户对第一类信息和第二类信息的第一历史评分，确定出第一用户在所述第一类信息和所述第二类信息之间的评分差值；所述评分差值可用于表征所述第一类信息和所述第二类信息之间的相似度。

需要说明的是，若第一类信息和第二类信息之间的评分差值越小，说明第一用户对第一类信息的情感倾向和程度，与第一用户对第二类信息的情感倾向和程度较接近，第一类信息和第二类信息之间具有相似性的概率就越高；反之，若第一类信息和第二类信息之间的评分差值越大，说明第一类信息和第二类信息之间具有相似性的概率就越低。

本发明实施例通过统计多个第一用户对第一类信息和第二类信息的评分差值，确定出第一类信息和所述第二类信息之间的平均评分差值；利用所述平均评分差值，确定所述第一类信息和所述第二类信息之间的相似度。

在本发明的一些实施例中，所述第一类信息和所述第二类信息之间的相似度可由下式确定：

；

这里，所述

为所述第一类信息和所述第二类信息之间的相似度；所述

为所述第一用户A对所述第一类信息a的评分；所述

为所述第一用户A对所述第二类信息b的评分；所述

为评价过第一类信息a的第一用户集合；所述

为评价过第二类信息b的第一用户集合；所述

为评价过第一类信息a和第二类信息b的第一用户数；所述E(S)为评价过第一类信息a和第二类信息b的第一用户集合，即

。

在本发明的另一些实施例中，可将至少一个第一用户对所述第一类信息和所述第二类信息的第一历史评分与预设评分阈值进行对比，若所述第一历史评分大于或等于所述预设评分阈值，确定所述第一历史评分对应的评论用户是否属于可疑用户；若所述评论用户为可疑用户，删除所述可疑用户对第一类信息和第二类信息的第一历史评分。

需要说明的是，由于第一历史评论数据中可能包含有虚假评论数据，使得最后确定出的第一类信息和第二类信息之间的相似度不够准确；对此，在确定所述第一类信息和第二类信息之间的相似度之前，需要先将第一历史评论数据中的虚假评论数据筛除。

这里，考虑到第一历史评论数据中可能存在有刷好评的虚假评分，故可通过将第一历史评分与预设评分阈值进行比对，确定出可疑的第一历史评分；所述预设评分阈值可根据实际需求进行设定，例如，预设评分阈值为0.9。

所述确定所述第一历史评分对应的评论用户是否属于可疑用户，可包括：

获取所述评论用户的全部历史评分；

若所述全部历史评分均大于或等于预设评分阈值，确定所述评论用户属于可疑用户。

在另一些实施例中，还可通过对所述多个第一用户对第一类信息和第二类信息的第一历史评论数据进行聚类处理；根据聚类结果，从所述第一历史评论数据中筛除离散评论数据。例如，用户A的评论的情感倾向总是偏离大部分第一用户评论的情感倾向所在簇的距离大于预设距离，则可以认定用户A为前述可疑用户。

可选地，所述步骤102中所述根据第二用户针对所述第二类信息的第二历史评论数据，确定所述第二用户对所述第二类信息的情感倾向信息，包括：

在本发明实施例中，所述主题词为所述第二历史评论的主题，代表所述第二历史评论中的关键内容。例如，反映第二用户对所述第二类信息的情感倾向的词语。

可通过对所述第二历史评论进行词语拆分，得到多个词语；确定所述多个词语在所述第二历史评论中出现的频率；根据各个所述词语对应的频率确定各个所述词语的分值；根据各个所述词语的分值，选择出分值满足预设条件的词语作为主题词；

可以理解的是，所述词语在第二历史评论中出现的频率越高，所述词语对应的分值就越高；故所述预设条件可以是分值排在前N个的词语，其中N为大于或等于1的正整数；或者，所述预设条件还可以是分值大于预设阈值的词语。

根据所述第二历史评论确定出多个主题词后，可通过对所述多个主题词进行情感倾向性分类；根据情感倾向性分类结果，从所述多个主题词中确定出属于正向情感类别的主题词。

在一些实施例中，可利用词语情感倾向性词典，对所述多个主题词进行情感倾向性分类，确定出属于正向情感类别的主题词。

需要说明的是，所述词语情感倾向性词典中收集了各种表征出情感倾向的词语，以及所述词语对应的情感倾向性分值。

一方面根据所述情感倾向性分值能够确定所述词语的情感属于正向情感类别还是负向情感类别；例如，若所述词语的情感倾向性分值大于0且小于或等于1时，确定所述词语属于正向情感类别；若所述词语的情感倾向性分值小于0且小于或等于-1，确定所述词语属于负向情感类别；若所述词语的情感倾向性分值等于0，确定所述词语属于中性情感类别。

另一方面根据所述情感倾向性分值的大小，可以确定所述词语所反映的正向情感或负向情感的程度；例如，词语“喜欢”和“不错”对应的情感倾向性分值可分别为“1”和“0.7”。

可根据所述第二历史评论和所述属于正向情感类别的主题词，确定所述第二历史评论对应的评论语义向量和所述属于正向情感类别的主题词对应的主题词语义向量；确定所述评论语义向量与所述主题词语义向量之间的向量距离；根据所述向量距离，确定所述第二历史评论与所述属于正向情感类别的主题词之间的语义相关性。

这里，所述评论语义向量与所述主题词语义向量之间的向量距离可以为欧几里得距离、欧式距离或汉明距离等；所述向量距离越大，则所述评论语义向量与所述主题词语义向量之间的语义相关性越低。

根据确定出的所述第二历史评论与所述属于正向情感类别的主题词之间的语义相关性，若所述第二历史评论与所述属于正向情感类别的主题词之间的语义相关性大于或等于预设相关性阈值，确定所述第二用户对所述第二历史评论的情感倾向信息属于正向情感类别。

这里，所述预设相关性阈值可根据实际需求进行设定，本发明不作限定。

在另一些实施例中，所述步骤102中所述根据第二用户针对所述第二类信息的第二历史评论数据，确定所述第二用户对所述第二类信息的情感倾向信息，包括：

基于所述第二用户针对所述第二类信息的第二历史评论，提取所述第二历史评论中包含的情感词；

根据所述第二历史评论中包含的情感词的情感程度和/或出现频次，确定所述第二用户对所述第二类信息的情感倾向信息。

在本发明实施例中，可对第二历史评论进行分词处理，并将分词处理后得到的各个词语分别与词语情感倾向性词典进行匹配，得到所述第二历史评论中包含的情感词以及所述情感词对应的情感倾向性分值。

由于所述情感倾向性分值可用于反映所述情感词的正向情感或负向情感的程度；可根据所述情感词对应的情感倾向性分值，确定所述情感词对应的情感强度等级。

这里，所述情感词对应的情感强度等级可根据实际需要进行设置；在本发明实施例中，所述情感强度等级可包括第一等级、第二等级和第三等级。示例性地，有预先建立不同表达情感的词语与情感强烈等级之间的对应关系，在确定情感强度等级时可以根据查询该对应关系来实现。

若所述情感词对应的情感倾向性分值的绝对值大于第一阈值，确定所述情感词的情感强度等级为第一等级；若所述情感词对应的情感倾向性分值的绝对值小于第一阈值且大于第二阈值，确定所述情感词的情感强度等级为第二等级；若所述情感词对应的情感倾向性分值的绝对值小于第二阈值，确定所述情感词的情感强度等级为第三等级。

所述第一阈值和第二阈值可根据实际需求进行设置，例如，第一阈值为0.7，第二阈值为0.3。

可根据所述情感词对应的情感强度等级，确定所述情感强度等级对应的权重值，基于所述情感词对应的情感倾向性分值和所述情感强度等级对应的权重值，确定第二用户对第二历史评论的情感倾向信息。

可以理解的是，不同情感强度等级对应的权重值不同，并且，所述第一等级对应的权重值大于所述第二等级对应的权重值；所述第二等级对应的权重值大于所述第三等级对应的权重值。

可根据所述第二历史评论中各个情感词在所述第二历史评论中出现的频次，确定所述频次对应的权重值；基于所述情感词对应的情感倾向性分值和所述频次对应的权重值，确定第二用户对第二历史评论的情感倾向信息。

可根据第二历史评论中同一情感词的数量占所有情感词数量的比值，确定各个所述情感词对应的频次；并将各个所述情感词对应的频次，确定为各个所述情感词对应的权重值。

例如，所述第二历史评论中包含有10个情感词，其中，情感词A出现了3次，情感词B出现了4次，情感词C出现了2次，情感词D出现了1次；故所述情感词A对应的频次为0.3，权重值为0.3；所述情感词B对应的频次为0.4，权重值为0.4；情感词C对应的频次为0.2，权重值为0.2；情感词D对应的频次为0.1，权重值为0.1。

在本发明实施例中，可通过对所述第二用户的第二历史评论进行主题提取，获取所述第二历史评论中的多个主题词。例如，可利用隐含狄利克雷分布（Latent DirichletAllocation，LDA）主题模型从所述第二历史评论中提取主题词。

需要说明的是，利用所述LDA主题模型，可以确定出所述第二历史评论中的主题词以及所述主题词对应的概率信息；可基于所述主题词以及所述主题词对应的概率信息，确定出主题词向量。在实际应用中，利用LDA主题模型提取主题词时，可能会存在多个主题词，可通过基于所述多个主题词的平均概率值，确定所述主题词向量。

在本发明实施例中，可利用情感分类模型，基于所述多个主题词和所述第二历史评论，预测所述多个主题词的情感得分；根据所述多个主题词的情感得分，确定出属于正向情感类别的主题词。

这里，所述情感分类模型可为基于注意力机制的长短期记忆（Long Short-TermMemory，LSTM）神经网络模型。

可通过对所述多个主题词和所述第二历史评论进行预处理，得到所述多个主题词对应的主题词向量和所述第二历史评论对应的评论文本向量；将所述主题词向量和所述评论文本向量输入至所述基于注意力机制的LSTM神经网络模型中，得到所述主题词向量和所述评论文本向量的情感类别。

其中，所述基于注意力机制的LSTM神经网络模型至少包括：LSTM网络模块、注意力模块和分类模块。

所述LSTM网络模块可基于所述主题词向量和所述评论文本向量，获取所述主题词向量的语义特征信息和所述评论文本向量的语义特征信息。

所述注意力模块利用所述主题词向量的语义特征信息和所述评论文本向量的语义特征信息，确定所述评论文本向量中各个词向量与所述主题词向量之间的语义相关性；确定所述各个词向量对应的注意力权重；基于所示评论文本向量中各个词向量对应的注意力权重，以及所述主题词向量和所述评论文本向量的语义特征信息；

所述分类模块基于所述主题词向量和所述评论文本向量的语义特征信息，确定所述主题词向量和所述评论文本向量的情感类别。

可选地，所述步骤103中基于所述第一类信息和所述第二类信息的相似度，从所述第一类信息中选择与所述第二类信息具有相似性的备选信息，包括：

在本发明实施例中，所述第一隐因子向量用于指示所述第一类信息和所述第二类信息中各个信息包含的隐因子的比例；所述第二隐因子向量用于指示所述用户对隐因子的喜好概率。可利用隐因子模型，确定出所述第一隐因子向量和所述第二隐因子向量，从而预测所述第二用户对所述第一类信息的预测评分。

需要说明的是，所述隐因子模型的算法思想是：认为每个用户都有自己偏好信息，同时每个信息也包含所有用户的偏好信息，那么用户对信息的高评分体现的是信息中所包含的偏好信息恰好是用户的偏好信息，但这个偏好信息无法明确的确定出来，因此，可将该偏好信息确定为潜在影响用户对信息进行评价的因子，即隐因子。通过确定出信息对应的第一隐因子向量和用户对应的第二隐因子向量，根据所述第一隐因子向量和所述第二隐因子向量，即可确定出用户对信息的评分。

隐因子模型的具体计算方式为：

；

其中，所述r为用户对信息的预测评分；所述p是第二隐因子向量，表示的是用户对各个隐因子的喜好概率；所述

是第一隐因子向量，表示的是所述第i个信息项中包含的各个隐因子的比例。

本发明实施例中，可利用所述至少第一用户对所述第一类信息和所述第二类信息的第一历史评分和所述第二用户对所述第二类信息的第二历史评分作为隐因子模型的训练样本集，利用训练样本集对隐因子模型中参数迭代更新，当所述隐因子模型的损失函数取得最小值时，根据所述隐因子模型中的参数，确定所述第一隐因子向量和所述第二隐因子向量。

这里，所述损失函数可以根据实际需求进行设置；示例性地，本发明实施例可选用所述预测评分与实际评分的之间差值的平方和作为所述隐因子模型的损失函数。

又示例性地，为了防止所述隐因子模型过拟合，在所述损失函数中引入正则项。

在本发明的另一些实施例中，由于不同用户定义的评分标准不同，为了解决评分标准的差异而导致的评分不准确的问题，可采用奇异值分解（singular valuedecomposition，SVD）法在隐因子模型中引入全局偏置项、信息偏置项和用户偏置项。

所述基于SVD的隐因子模型的具体计算方式为：

；

其中，所述r为用户对信息的预测评分，所述全局偏置项u为所述训练集中所有信息的评分的平均值；所述信息偏置项

为用于表示一个信息的平均评分；所述用户偏置项

为用于表示一个用户评分的平均值；所述p是第二隐因子向量，表示的是用户对各个隐因子的喜好概率；所述

需要说明的是，所述信息偏置项用于指示该信息被大众的喜爱程度；所述用户偏置项用于指示用户对信息的苛刻程度。

确定出所述第二用户对所述第一类信息的预测评分后，可根据所述第二用户对所述第一类信息的预测评分，按从高到低的顺序对预测评分进行排序，并根据排序结果选择前N个预测评分对应的第一类信息，将所述前N个预测评分对应的第一类信息作为备选信息。所述N为大于或等于1的正整数。

在本发明的另一些实施例中，还可将所述第二用户对第一类信息的预测评分与预设的分数阈值进行对比，将所述预测评分大于或等于所述预设的分数阈值的第一类信息作为备选信息。

这里，所述预设的分数阈值可根据实际需求进行设定，本发明不作限定。

可选地，所述步骤104中基于所述第二类信息的情感倾向信息，从所述备选信息中选择与具有正向情感评价的所述第二类信息相似的备选信息作为目标信息推荐给所述第二用户，包括：

在本发明实施例中，所述第二用户对所述第二类信息的情感得分对应的第一权重和所述第二用户对所述备选信息的预测评分对应的第二权重，可由用户预先设定。

根据所述第一权重和所述第二权重，将所述第二用户对所述第二类信息的情感得分和所述第二用户对所述备选信息的预测评分进行加权求和，得到所述备选信息的综合评分。

基于所述备选信息的综合评分和所述预设的选择策略，从所述备选信息中选择出推荐给所述第二用户的所述目标信息。

这里，所述预设的选择策略可根据实际需求进行设置，本发明实施例不作限定。

可选地，如图2所示，图2是本发明实施例提供的一种信息推荐方法的流程示意图二，所述方法还包括：

步骤105，获取所述第二用户针对所述目标信息的评论数据；

步骤106，基于所述第二用户针对所述目标信息的评论数据，调整所述第二用户对所述第二类信息的情感得分的权重值。

在本发明实施例中，在确定目标信息并向所述第二用户推荐所述目标信息后，获取所述第二用户针对所述目标信息的评论数据；根据所述第二用户针对所述目标信息的评论数据，确定所述第二用户对所述目标信息的情感倾向信息；根据所述第二用户对所述目标信息的情感倾向信息和预设的调整策略，调整所述第二用户对所述第二类信息的情感得分对应的第一权重。

这里，预设的调整策略可根据实际需求进行设定，例如，若所述第二用户对所述目标信息的情感倾向信息属于正向情感类别，增大所述第一权重的值。若所述第二用户对所述目标信息的情感倾向信息属于负向情感类别，降低所述第一权重的值。

又例如，确定所述第二用户对所述目标信息的情感得分；若所述情感得分大于或等于预设分数阈值，增大所述第一权重的值；若所述情感得分小于所述预设分数阈值，降低所述第一权重的值。

下面，本发明实施例提供一种信息推荐装置300，如图3所示，图3是本发明实施例提供的一种信息推荐装置的结构示意图，所述装置包括：

第一确定模块301，用于基于至少一个第一用户对第一类信息和第二类信息的第一历史评论数据，确定所述第一类信息和所述第二类信息之间的相似度；

第二确定模块302，用于根据第二用户针对所述第二类信息的第二历史评论数据，确定所述第二用户对所述第二类信息的情感倾向信息；

选择模块303，用于基于所述第一类信息和所述第二类信息的相似度，从所述第一类信息中选择与所述第二类信息具有相似性的备选信息；基于所述第二类信息的情感倾向信息，从所述备选信息中选择与具有正向情感评价的所述第二类信息相似的备选信息作为目标信息推荐给所述第二用户。

可选地，所述第一确定模块301，用于：

可选地，所述第二确定模块302，用于：

可选地，所述选择模块303，用于：

可选地，所述选择模块303，还用于：

可选地，所述装置还包括：

调整模块，用于获取所述第二用户针对所述目标信息的评论数据；基于所述第二用户针对所述目标信息的评论数据，调整所述第二用户对所述第二类信息的情感得分的权重值。

结合本发明上述实施例，下面将说明本发明实施例在实际的应用场景中的示例性应用。如图4所示，图4是本示例提供的一种信息推荐方法的流程示意图。

步骤401，基于至少一个第一用户对第一类信息和第二类信息的第一历史评论，确定所述第一类信息和所述第二类信息的相似度；

在本示例中，通过获取至少一个第一用户对第一类信息和第二类信息的第一历史评论，根据第一历史评论，确定第一类信息和第二类信息之间的平均偏好值，根据所述第一类信息和所述第二类信息之间的平均偏好值，确定出推荐结果。这里，所述第一类信息和所述第二类信息之间的平均偏好值能够用于指示所述第一类信息和所述第二类信息之间的相似度。

在实际应用中，可基于至少一个第一用户对所述第一类信息和所述第二类信息的第一历史评分，确定所述第一类信息和所述第二类信息之间的评分差值；基于所述第一类信息和所述第二类信息之间的评分差值和所述第一用户的数量的比值，确定所述第一类信息和所述第二类信息之间的平均偏好值。

可以理解的是，假设有3种类型的用户（如用户A、用户B和用户C），每个用户对接收的广告信息都会进行简单的评论；统计这3种类型的用户对广告信息的历史评论数据，若统计数据表明用户A和用户B都在对广告信息1感兴趣的同时，也会对广告信息3感兴趣，说明这两个广告信息之间具有较高的相似度；若统计数据显示用户C也对广告1感兴趣，则用户C可能会对广告信息3也感兴趣，可以向用户C推荐广告信息3。

步骤402，根据第二用户针对所述第二类信息的第二历史评论，提取所述第二历史评论中的多个主题词；

在本示例中，可通过LDA主题模型从所述第二历史评论中提取所述第二历史评论中的多个主题词；

需要说明的是，在使用所述LDA主题模型提取所述第二历史评论中的主题词，可能会提取到多个主题词，可采用所有主题词的概率值的平均值作为所述第二历史评论中主题词对应的词向量；具体公式如下所示：

；

这里，所述t为所述第二历史评论中主题词对应的词向量；所述n为所述第二历史评论中主题词的数量；所述

为所述第二历史评论中第i个主题词对应的概率值。

步骤403，根据所述多个主题词和所述第二历史评论，对所述主题词进行基于词义的情感分类，得到所述多个主题词的情感得分；基于所述多个主题词的情感得分，确定出属于正向情感类别的主题词；根据所述第二历史评论与所述属于正向情感类别的主题词之间的语义相关性，确定所述第二用户对所述第二类信息的情感倾向信息；

在本示例中，可利用长短期记忆网络和注意力机制相结合的算法，基于所述第二历史评论，确定所述第二用户对所述第二类信息的情感倾向信息。

可根据所述多个主题词和所述第二历史评论，获取主题词向量和评论文本向量；并将所述评论文本向量和所述主题词向量的组合序列作为长短期记忆网络的输入，并将所述长短期记忆网络的输出向量和所述主题词向量的组合序列作为注意力机制层的输入，所述注意力机制层可以根据所述序列中每个词向量与主题词向量之间的语义相关性，确定所述词向量的注意力权重；通过对所述词向量按照所述注意力权重进行加权求和，得到所述注意力机制层的输出向量；根据所述长短期记忆网络的输出向量和所述注意力机制层的输出向量，确定所述第二用户对所述第二类信息的情感倾向信息。

步骤404，基于所述第一类信息和所述第二类信息的相似度，以及所述第二用户对所述第二类信息的第二历史评分，确定第一隐因子向量和第二隐因子向量；根据所述第一隐因子向量和所述第二隐因子向量，确定所述第二用户对所述第一类信息的预测评分；

在本示例中，所述第一隐因子向量用于指示所述第一类信息和所述第二类信息中各个信息包含的各个隐因子的比例；所述第二隐因子向量用于指示所述用户对各个隐因子的喜好概率；可利用隐因子模型，确定所述第一隐因子向量和所述第二隐因子向量，从而预测所述第二用户对所述第一类信息的预测评分。

由于不同用户定义的评分标准不同，为了解决评分标准的差异而导致的评分不准确的问题，可采用基于SVD的隐因子模型，在确定用户对各项信息的预测评分时引入全局偏置项、信息偏置项和用户偏置项。

在实际应用中，可根据用户对信息的历史评分，确定用户对信息的情感倾向信息；所述情感倾向信息可包括：情感类别和情感程度；所述情感类别可包括：正向情感、中性情感和负向情感。所述情感程度可由历史评分的分值确定。

例如，若所述信息的历史评分大于0且小于或等于1，确定所述用户对所述信息的情感倾向信息为正向情感；若信息的历史评分小于0且小于或等于-1，确定所述用户对所述信息的情感倾向信息为负向情感；若信息的历史评分为0，确定所述用户对所述信息的情感倾向信息为中性情感。

可根据用户对信息的历史评分，确定信息的平均情感值；

所述信息的平均情感值可由下式确定：

；

其中，所述

为信息t在主题词i下的平均情感值，所述

、

和

分别表示在主题j下的情感倾向信息为正向情感、中性情感和负向情感的历史评论数目；所述

为正向情感状态下的情感值；所述

为中性情感状态下的情感值；所述

为负向情感状态下的情感值。

步骤405，根据所述第二用户对所述第一类信息的预测评分，从所述第一类信息中选择出所述备选信息；

确定出所述第二用户对所述第一类信息的预测评分，按照从高到低的顺序对预测评分进行排序，并根据排序结果选择前N个预测评分对应的第一类信息，将所述前N个预测评分对应的第一类信息作为备选信息。这里，所述N为大于或等于1的正整数。

步骤406，根据所述第二用户对所述第二类信息的情感得分和所述第二用户对所述备选信息的预测评分的加权和，从所述备选信息中选择出推荐给第二用户的目标信息；

在本示例中，所述第二用户对所述第二例信息的情感得分对应的第一权重和所述第二用户对所述备选信息的预测评分对应的第二权重，可由用户预先设定。

步骤407，获取所述第二用户针对所述目标信息的评论数据；基于所述第二用户针对所述目标信息的评论数据，调整所述第二用户对所述第二类信息的情感得分的权重值。

在本示例中，在确定目标信息并向所述第二用户推荐所述目标信息后，获取所述第二用户针对所述目标信息的评论数据；根据所述第二用户针对所述目标信息的评论数据，确定所述第二用户对所述目标信息的情感得分；根据所述第二用户对所述目标信息的情感得分，调整所述第二用户对所述第二类信息的情感得分的权重值。

本发明实施例还提供一种电子设备，所述电子设备包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现前述一个或多个技术方案提供的信息推荐方法。

下面对本发明实施例提供的一种电子设备的硬件结构做详细说明，所述电子设备包括但不限于服务器或终端。所述电子设备包括：至少一个处理器、存储器，可选的，电子设备可进一步包括至少一个通信接口，电子设备中的各个组件通过总线系统耦合在一起，可理解，总线系统用于实现这些组件之间的连接通信。总线系统除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。

可以理解，存储器可以是易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器（ROM，Read Only Memory）、可编程只读存储器（PROM，Programmable Read-Only Memory）、可擦除可编程只读存储器（EPROM，Erasable Programmable Read-Only Memory）、电可擦除可编程只读存储器（EEPROM，Electrically Erasable Programmable Read-Only Memory）、磁性随机存取存储器（FRAM，ferromagnetic random access memory）、快闪存储器（Flash Memory）、磁表面存储器、光盘、或只读光盘（CD-ROM，Compact Disc Read-Only Memory）；磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器（RAM，Random AccessMemory），其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器（SRAM，Static Random Access Memory）、同步静态随机存取存储器（SSRAM，Synchronous Static Random Access Memory）、动态随机存取存储器（DRAM，Dynamic Random Access Memory）、同步动态随机存取存储器（SDRAM，SynchronousDynamic Random Access Memory）、双倍数据速率同步动态随机存取存储器（DDRSDRAM，Double Data Rate Synchronous Dynamic Random Access Memory）、增强型同步动态随机存取存储器（ESDRAM，Enhanced Synchronous Dynamic Random Access Memory）、同步连接动态随机存取存储器（SLDRAM，SyncLink Dynamic Random Access Memory）、直接内存总线随机存取存储器（DRRAM，Direct Rambus Random Access Memory）。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

本发明实施例中的存储器用于存储各种类型的数据以支持电子设备的操作。这些数据的示例包括：用于在电子设备上操作的任何计算机程序，实现本发明实施例方法的程序可以包含在存储器中。

上述本发明实施例揭示的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器（DSP，Digital Signal Processor），或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤，可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中，该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成前述方法的步骤。

在示例性实施例中，电子设备可以被一个或多个应用专用集成电路（ASIC，Application Specific Integrated Circuit）、DSP、可编程逻辑器件（PLD，ProgrammableLogic Device）、复杂可编程逻辑器件（CPLD，Complex Programmable Logic Device）、现场可编程门阵列（FPGA，Field-Programmable Gate Array）、通用处理器、控制器、微控制器（MCU，Micro Controller Unit）、微处理器（Microprocessor）、或其他电子元件实现，用于执行上述方法。

在本发明所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本发明实施例还提供一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序被处理器执行后，并执行前述一个或多个技术方案提供的信息推荐方法，例如，可执行如图1所示的方法。

本发明实施例提供的计算机存储介质包括：移动存储设备、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。可选为，所述计算机存储介质可为非瞬间存储介质。这里的非瞬间存储介质又可以称为非易失性存储介质。

在一些实施例中，计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。计算机可以是包括智能终端和服务器在内的各种计算设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言（包括编译或解释语言，或者声明性或过程性语言）来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言（HTML，Hyper TextMarkup Language）文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件（例如，存储一个或多个模块、子程序或代码部分的文件）中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

以上所述，仅为本发明的实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本发明的保护范围之内。

Claims

1.一种信息推荐方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于至少一个第一用户对第一类信息和第二类信息的第一历史评论数据，确定所述第一类信息和所述第二类信息之间的相似度，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据第二用户针对所述第二类信息的第二历史评论数据，确定所述第二用户对所述第二类信息的情感倾向信息，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述第二用户针对所述第二类信息的第二历史评论和所述第二历史评论中的多个主题词，确定属于正向情感类别的主题词，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述第一类信息和所述第二类信息的相似度，从所述第一类信息中选择与所述第二类信息具有相似性的备选信息，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于所述第二类信息的情感倾向信息，从所述备选信息中选择与具有正向情感评价的所述第二类信息相似的备选信息作为目标信息推荐给所述第二用户，包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

获取所述第二用户针对所述目标信息的评论数据；

8.一种信息推荐装置，其特征在于，包括：

9.一种电子设备，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现如权利要求1-7任一项所述的信息推荐方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有可执行指令，所述可执行指令被处理器执行时，实现如权利要求1-7任一项所述的信息推荐方法。