WO2019134554A1

WO2019134554A1 - 内容推荐方法及装置

Info

Publication number: WO2019134554A1
Application number: PCT/CN2018/123283
Authority: WO
Inventors: 刘阳阳
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2018-01-08
Filing date: 2018-12-25
Publication date: 2019-07-11
Also published as: CN108268619B; CN108268619A; TWI687823B; US20200320086A1; TW201931170A; US11720572B2; SG11202006532QA

Abstract

一种内容推荐方法，该方法包括：获取内容信息库中的内容信息，并确定与该内容信息相关的关键词信息（S110）；确定与该内容信息对应的特定领域（S120）；获取与该特定领域对应的领域知识信息（S130）；根据领域知识信息从关键词信息中确定内容信息的特征标签（S140）；根据用户的属性标签和特征标签，从内容信息库中确定向用户推荐的内容推荐信息（S150）。

Description

内容推荐方法及装置

技术领域

本说明书披露的多个实施例涉及互联网技术领域，尤其涉及一种内容推荐方法及装置。

背景技术

随着互联网技术的发展，人们越来越频繁地浏览网络平台提供的内容信息。例如，在网络购物平台中浏览商品信息，或者在新闻平台浏览热点信息，或者在理财平台浏览理财资讯，或者在支付平台浏览支付服务信息等。

不同用户在使用同一网络平台时，对其提供的内容信息的需求有着或多或少的差异。另一方面，网络平台中信息的海量增长也常常让用户难以选择。目前，向用户推荐的内容信息由于存在不够精准等不足，难以满足用户的个性化需求。因此，需要提供一种合理的方法，以满足用户浏览网络平台中提供的内容信息的多种需求。

发明内容

本说明书描述了一种内容推荐方法及装置，通过确定与内容信息对应的特定领域以及与特征领域对应的领域知识信息，进而确定内容信息的特征标签，并结合用户的属性标签向用户推荐更加精准的内容信息。

第一方面，提供了一种内容推荐方法。该方法包括：

获取内容信息库中的内容信息，并确定所述内容信息的关键词信息；

确定与所述内容信息对应的特定领域；

获取与所述特定领域对应的领域知识信息；

根据所述领域知识信息从所述关键词信息中确定所述内容信息的特征标签；

根据用户的属性标签和所述特征标签，从所述内容信息库中确定向所述用户推荐的内容推荐信息。

在一种可能的实施方式中，所述领域知识信息包括领域层级知识，所述领域层级知识包括领域名称，与所述领域名称对应的类别名称，以及与所述类别名称对应的特征单词。

在一种可能的实施方式中，所述特征单词基于内容语料库中的内容语料训练而获得。

在一种可能的实施方式中，所述根据所述领域知识信息从所述关键词信息中确定所述内容信息的特征标签包括：

确定与所述内容信息对应的特定类别；

在所述领域层级知识中，确定与所述特定类别对应的特定类别名称，以及与所述特定类别名称对应的特征单词；

根据所述特征单词从所述关键词信息中确定所述内容信息的特征标签。

在一种可能的实施方式中，所述内容信息包括类别标签，所述确定与所述内容信息对应的特定类别，包括：

根据所述类别标签确定与所述内容信息对应的特定类别。

在一种可能的实施方式中，所述根据所述特征单词从所述关键词信息中确定所述内容信息的特征标签，包括：

将所述关键词信息中与所述特征单词匹配的关键词信息作为所述特征标签。

在一种可能的实施方式中，所述关键词信息包括多个关键词和各个关键词的排序信息，所述根据所述特征单词从所述关键词信息中确定所述内容信息的特征标签，包括：

根据所述关键词信息中所述各个关键词与所述特征单词的匹配情况，以及所述排序信息，对所述多个关键词重新排序；

将经过所述重新排序后、位于预定顺序范围内的关键词信息作为所述内容信息的特征标签。

在一种可能的实施方式中，所述领域知识信息包括领域知识图谱，所述领域知识图谱在其第一层包括与领域对应的实体词，在其第二层包括与所述实体词对应的关联词，所述实体词和所述关联词组合构成特征组合词。

确定与所述特定领域对应的领域知识图谱中包括的特征组合词；

根据所述特征组合词从所述关键词信息中确定所述内容信息的特征标签。

在一种可能的实施方式中，所述根据所述特征组合词从所述关键词信息中确定所述内容信息的特征标签，包括：

将所述关键词信息中与所述特征组合词匹配的关键词信息作为所述特征标签。

在一种可能的实施方式中，所述关键词信息包括多个关键词和各个关键词的排序信息，所述根据所述特征组合词从所述关键词信息中确定所述内容信息的特征标签，包括：

根据所述关键词信息中所述各个关键词与所述特征组合词的匹配情况，以及所述排序信息，对所述多个关键词重新排序；

在一种可能的实施方式中，所述属性标签基于所述用户的历史浏览内容确定。

在一种可能的实施方式中，所述从内容信息库中确定向所述用户推荐的内容推荐信息，包括：

将与所述属性标签匹配的特征标签所对应的内容信息，作为向所述用户推荐的候选内容信息；

根据预设规则对所述候选内容信息中的各个内容信息进行排名，并将名次在预设范围内的内容信息作为所述内容推荐信息。

第二方面，提供了一种内容推荐装置。该装置包括：

第一获取模块，用于获取内容信息库中的内容信息；

第一确定模块，用于确定所述内容信息的关键词信息；

第二确定模块，用于确定与所述内容信息对应的特定领域；

第二获取模块，用于获取与所述特定领域对应的领域知识信息；

第三确定模块，用于根据所述领域知识信息从所述关键词信息中确定所述内容信息的特征标签；

处理模块，用于根据用户的属性标签和所述特征标签，从所述内容信息库中确定向所述用户推荐的内容推荐信息。

在一种可能的实施方式中，所述第二获取模块获取的领域知识信息包括领域层级知识，所述领域层级知识包括领域名称，与所述领域名称对应的类别名称，以及与所述类别名称对应的特征单词。

在一种可能的实施方式中，所述第二获取模块获取的所述特征单词基于内容语料库中的内容语料训练而获得。

在一种可能的实施方式中，所述第三确定模块具体包括：

第一确定子模块，用于确定与所述内容信息对应的特定类别；

第二确定子模块，用于在所述领域层级知识中，确定与所述特定类别对应的特定类别名称，以及与所述特定类别名称对应的特征单词；

第三确定子模块，根据所述特征单词从所述关键词信息中确定所述内容信息的特征标签。

在一种可能的实施方式中，所述第一获取模块获取的内容信息包括类别标签，所述第一确定子模块具体用于：

根据所述类别标签确定与所述内容信息对应的特定类别。

在一种可能的实施方式中，所述第三确定子模块具体用于：

在一种可能的实施方式中，所述第一确定模块确定的关键词信息中包括多个关键词和各个关键词的排序信息，所述第三确定子模块具体用于：

在一种可能的实施方式中，所述第二获取模块获取的领域知识信息包括领域知识图谱，所述领域知识图谱在其第一层包括与领域对应的实体词，在其第二层包括与所述实体词对应的关联词，所述实体词和所述关联词组合构成特征组合词。

在一种可能的实施方式中，所述第三确定模块具体包括：

第二确定子模块，用于确定与所述特定领域对应的领域知识图谱中包括的特征组合词；

第三确定子模块，用于根据所述特征组合词从所述关键词信息中确定所述内容信息的特征标签。

在一种可能的实施方式中，所述第三确定子模块具体用于：

在一种可能的实施方式中，所述处理模块中包括的属性标签基于所述用户的历史浏览内容确定。

在一种可能的实施方式中，所述处理模块具体用于：

第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序。当所述计算机程序在计算机中执行时，令计算机执行上述第一方面中任一种实施方式提供的方法。

第四方面，提供了一种计算设备，包括存储器和处理器。所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现上述第一方面中任一种实施方式提供的方法。

本说明书提供的一种内容推荐方法及装置，首先，获取内容信息库中的内容信息，并确定与该内容信息相关的关键词信息。以及，确定与该内容信息对应的特定领域，并获取与该特定领域对应的领域知识信息。接着，根据该领域知识信息从关键词信息中确定内容信息的特征标签。然后，根据该特征标签和用户的属性标签，从内容信息库中确定向用户推荐的内容推荐信。通过采用这种方式，实现向用户推荐更加精准的内容信息。

附图说明

为了更清楚地说明本说明书披露的多个实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书披露的多个实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本说明书披露的一个实施例提供的一种内容推荐方法的流程图；

图2为本说明书披露的一个实施例提供的领域层级知识的示意图；

图3为本说明书披露的一个实施例提供的领域知识图谱的示意图；

图4为本说明书披露的一个实施例提供的一种内容推荐装置的结构图。

具体实施方式

下面结合附图，对本说明书披露的多个实施例进行描述。

图1为本说明书披露的一个实施例提供的一种内容推荐方法的流程图。所述方法的执行主体可以为具有处理能力的设备：服务器或者系统或者装置。如图1所示，所述方法具体包括：

步骤S110，获取内容信息库中的内容信息，并确定该内容信息的关键词信息。

具体地，内容信息库中可以包括在有效期内的内容信息。其中，有效期可以根据内容信息所对应业务的业务属性(如，对时效性的要求)设定。例如，可以将新闻业务所对应的内容信息的有效期设置为1天。又例如，可以将科普知识业务所对应的内容信息的有效期设置为1个月。

内容信息可以包括图文信息(如，图片、文章等)或音视频信息(如，音频、视频广告等)。

确定内容信息的关键词信息，可以包括：确定内容信息的文本信息，并根据文本信息确定关键词信息。

在一个实施例中，内容信息包括视频广告，此时，可以从视频中提取文字信息以及将其中的音频信息转化为文字信息，并根据其中的文字信息确定视频广告的关键词信息；或者，内容信息包括视频广告和该视频广告的文本介绍信息，则可以根据文本介绍信息确定视频广告的关键词信息。

在另一个实施例中，内容信息包括文章，此时，可以直接确定该文章中的文本信息。

进一步地，根据文本信息确定关键词信息，可以包括：对文本信息进行结构化分析、分词处理、去停用词处理、词性标注和命名实体识别中的至少一种预处理。以及采用关键词提取算法，从经过预处理后的文本信息中确定关键词信息。

其中，结构化分析可以包括对文本信息中段落结构的分析，例如，判断出文本信息中的标题和正文，以及正文中的段落结构；分词处理可以包括一元分词(unigram)、二元分词(bigram)、三元分词(trigram)等；去停用词可以包括根据预设的停用词表去除文本信息中的停用词(如，无实际意义的功能词：这、那、的)；词性标注可以包括对文本信息中的词语的词性(如，名词、副词、形容词等)进行标注；命名实体识别(Named Entity Recognition，简称NER)可以包括识别文本信息中具有特定意义的实体(如，人名、地名、机构名、专有名词等)；关键词提取算法可以包括TextRank算法和TF-IDF(Term Frequency–inverse Document Frequency)算法等。

在一个例子中，经过预处理后的文本信息中包括多个词语，以及各个词语在文本信息中的位置(如，位于标题中或位于正文中)、标注的词性等。相应地，可以采用关键词提取算法，从经过预处理后的文本信息中加权识别出关键词信息。

步骤S120，确定与内容信息对应的特定领域。

在一个实施例中，内容信息中可以包括领域标签。相应地，确定与内容信息对应的特定领域，可以包括：根据领域标签确定与内容信息对应的特定领域。其中，领域标签可以由内容信息的创建者为该内容信息便于用户搜索而定义生成。

在一个例子中，内容信息中包括的领域标签为“出行服务”，相应地可以确定出与该内容信息对应的特定领域为出行服务。

在另一个实施例中，可以根据步骤S110中确定出的关键词信息，进一步确定与内容信息对应的特定领域。在一个例子中，关键词信息中包括领域信息，相应地，可以根据领域信息确定出与内容信息对应的特定领域。

在步骤S120中确定与内容信息对应的特定领域后，接着，在步骤S130，获取与特定领域对应的领域知识信息。

具体地，服务器中可以存储有预先设定的领域知识信息，该领域知识信息可以包括领域层级知识和领域知识图谱中的至少一种。其中，领域层级知识可以包括领域名称，与该领域名称对应的类别名称，以及与该类别名称对应的特征单词；领域知识图谱可以在其第一层包括与领域对应的实体词，在其第二层包括与实体词对应的关联词，且实体词和与之对应的关联词可以组合构成特征组合词。

需要说明的是，领域层级知识中包括的领域名称和类别名称可以基于目前通用的知识体系(如，知识体系中可以包括领域和学科的划分)进行设定。此外，领域层级知识中包括的特征单词，可以基于内容语料库中的大量内容语料进行训练而获得。

领域知识图谱可以基于内容语料库中的大量内容语料处理而获得。更具体地，首先，可以通过NER识别与领域对应的实体词(如，专有名词等)，例如，可以识别出与领域“出行服务”对应的专有名词“驾驶证”等。然后，可以通过模板提取、词间相关性和互信息熵等方式确定与实体词对应的关联词。其中，模板提取方式可以包括设定一个模板(如，驾驶证XX的出台)，然后利用模板从内容语料中提取关联词(如，新规)；词间相关性方式可以包括利用长度为预定字符数(如，5个字符)的滑动窗口，提取出在滑动窗口中与实体词同时出现的词语，并将这些词语中出现频次达到预定次数(如，10次)的词语作为关联词；互信息熵方式可以包括确定内容语料包括的词语中与实体词之间的相似度，并将相似度高于预设值(如，0.6)的词语作为关联词。

在一个实施例中，可以获取与步骤S120中确定的特定领域对应的领域层级知识和/领域知识图谱。

在一个实施例中，获取的与特定领域对应的领域层级知识中，可以包括与该特定领域对应的多个类别名称，以及与多个类别名称中各个类别名称对应的多个特征单词。

在一个例子中，在步骤S120中确定的特定领域为出行服务，据此可以获取与出行服务对应的如图2所示的领域层级知识。图2中，领域名称为出行服务，与出行服务对应的类别名称包括：汽车、飞机、火车和地铁等。与汽车对应特征单词包括：保养、加油、洗车等，与飞机对应的特征单词包括：里程、经济舱、头等舱等(图2中未示出与地铁、火车等其他类别对应的特征单词)。

在一个实施例中，单个领域中可以包括多个实体词，相应地，与该领域对应的领域知识图谱可以有多个。各个领域知识图谱在其第一层可以包括实体词，在第二层可以包括与该实体词对应的多个关联词。

在一个例子中，在步骤S120中确定的特定领域为出行服务，据此可以获取与出行服务对应的多个领域知识图谱。例如，获取的多个领域知识图谱中可以包括如图4所示的领域知识图谱。图4中，实体词是驾驶证，与实体词对应的关联词包括扣分、新规、查询违规、换证、年审等。

在步骤S110中确定出内容信息的关键词信息，以及在步骤S130中获取到与特定领域对应的领域知识信息后，在步骤S140中，根据领域知识信息从关键词信息中确定内容信息的特征标签。

具体地，将关键词信息中与领域知识信息相匹配的关键词信息作为内容信息的特征标签。或者，根据领域知识信息对关键词信息进行排名，并将排名在预设范围内的关键词信息作为内容信息的特征标签。

在一个实施例中，在步骤S130中获取的领域知识信息可以至少包括领域层级知识，根据该领域层级知识从关键词信息中确定内容信息的特征标签，可以包括：确定与内容信息对应的特定类别；在领域层级知识中，确定与特定类别对应的特定类别名称，以及与特定类别名称对应的特征单词；根据特征单词确定内容信息的特征标签。

在一个例子中，内容信息可以包括类别标签。相应地，确定与内容信息对应的特定类别，可以包括：根据类别标签确定与内容信息对应的特定类别。其中，类别标签可以由内容信息的创建者为该内容信息便于用于搜索而定义生成。例如，内容信息中包括的类别标签为“汽车”，相应地可以确定出与该内容信息对应的特定类别为汽车。

在另一个例子中，可以根据步骤S110中确定出的关键词信息，进一步确定与内容信息对应的特定类别。在一个例子中，关键词信息中包括类别信息，相应地，可以根据类别信息确定出与内容信息对应的特定类别。

在一个例子中，确定的与内容信息对应的特定类别为汽车，在步骤S130中获取的领域层级知识如图2所示。据此，可以在领域层级知识中，确定与特定类别(汽车)对应的特定类别名称为汽车，以及与类别名称(汽车)对应的特征单词包括：保养、加油和洗车等。

在一个例子中，根据特征单词确定内容信息的特征标签，可以包括：将关键词信息中与特征单词匹配的关键词信息作为特征标签。例如，确定的特征单词包括：保养、加油、洗车等，据此可以从关键词信息(如，包括：保养、洗车等)确定出包括保养、洗车的特征标签。

在另一例子中，关键词信息中可以包括多个关键词以及各个关键词的权重信息。相应地，根据特征单词确定内容信息的特征标签，可以包括：根据各个关键词与特征单词的匹配情况，更新所述多个关键词的权重；将更新后的权重大于预设阈值的关键词作为内容信息的特征标签。比如说，当关键词(如，洗车)与某个特征单词(洗车)完全匹配时，可以将该关键词的权重值增加第一预设值(如，0.1)；当关键词(如，自动洗车)与某个特征单词(洗车)部分匹配时，可以将该关键词的权重值增加第二预设值(如，0.05)；当关键词与所有特征单词均不匹配时，可以保持该关键词原有的权重值。如此，可以更新各个关键词的权重值。对于更新了权重的关键词，判断其最终权重是否大于预设阈值(如0.5)，将权重值大于预设阈值的关键词作为特征标签。

进一步地，在另一个例子中，关键词信息中还可以包括多个关键词以及各个关键词对应的排序信息(如，可以根据权重进行排序)。相应地，根据特征单词确定内容信息的特征标签，可以包括：根据各个关键词与特征单词的匹配情况以及原有的排序信息，对多个关键词进行重新排序；将经过重新排序后、位于预定顺序范围内的关键词信息作为内容信息的特征标签。其中，预定顺序范围可以提前设定或实时修改。

例如，排序信息可包括各个关键词的权重值，可以根据各个关键词与特征单词的匹配情况(如，是否匹配)更新该关键词的权重值。更新权重值的方式可以如之前例子所述。然后，根据更新后的权重值对多个关键词进行排序，并将位于预定顺序范围(如，前十位)内的关键词信息作为特征标签。

在另一个实施例中，在步骤S130中获取的领域知识信息可以至少包括领域知识图谱，根据该领域知识图谱从关键词信息中确定内容信息的特征标签，可以包括：确定该领域知识图谱中包括的特征组合词；根据特征组合词从关键词信息中确定内容信息的特征标签。在一个例子中，在步骤S130中可以获取包括如图4所示的领域知识图谱。图4中的实体词为驾驶证，与驾驶证对应的关联词包括：扣分、新规、查询违规、换证和年审等。相应地，可以确定出其中的特征组合词包括：“驾驶证-扣分”、“驾驶证-新规”、“驾驶证-查询违规”、“驾驶证-换证”和“驾驶证-年审”等。

在一个例子中，根据特征组合词确定内容信息的特征标签，可以包括：将关键词信息中与特征组合词匹配的关键词信息作为特征标签。例如，确定的特征组合词包括：驾驶证-扣分、驾驶证-新规、驾驶证-查询违规、驾驶证-换证和驾驶证-年审等，据此可以从关键词信息(如，包括：驾驶证、扣分、新规、驾驶证年审等)确定出包括驾驶证-扣分、驾驶证-新规、驾驶证-年审的特征标签。

在另一例子中，关键词信息中可以包括多个关键词以及各个关键词的权重信息。相应地，根据特征组合词确定内容信息的特征标签，可以包括：根据各个关键词与特征组合词的匹配情况，更新所述多个关键词的权重；将更新后的权重大于预设阈值的关键词作为内容信息的特征标签。

在另一个例子中，关键词信息中可以包括多个关键词以及各个关键词对应的排序信息(如，可以根据权重进行排序)。相应地，根据特征组合词确定内容信息的特征标签，可以包括：根据各个关键词与特征组合词的匹配情况以及原有的排序信息，对多个关键词进行重新排序；将经过重新排序后、位于预定顺序范围内的关键词信息作为内容信息的特征标签。

例如，排序信息可包括各个关键词的权重值，可以根据各个关键词与特征组合词的匹配情况(如，是否匹配)更新该关键词的权重值。比如说，当关键词(如，驾驶证-扣分)与某个特征组合词(驾驶证-扣分)完全匹配时，可以将该关键词的权重值增加第一预设值(如，0.1)；当关键词(如，驾驶证)与某个特征组合词(驾驶证-扣分)部分匹配时，可以将该关键词的权重值增加第二预设值(如，0.05)；当关键词与所有特征组合词均不匹配时，可以保持该关键词原有的权重值。然后，根据更新后的权重值对多个关键词进行排序，并将位于预定顺序范围(如，前五位)内的关键词信息作为特征标签。

在步骤S140中确定内容信息的特征标签后，接着，在步骤S150，根据用户的属性标签和特征标签，从内容信息库中确定向用户推荐的内容推荐信息。

具体地，用户的属性标签可以基于用户的历史浏览内容确定。在一个实施例中，可以根据用户的历史浏览内容的特征标签，确定用户的属性标签。其中特征标签可以通过执行上述步骤S110-步骤S140而获得，区别在于步骤S110中不是获取内容信息库中的内容信息，而是获取用户的历史浏览内容。

在一个实施例中，从内容信息库中确定向用户推荐的内容推荐信息，可以包括：将与属性标签匹配的特征标签所对应的内容信息，作为内容推荐信息。

在另一实施例中，从特征标签与属性标签相匹配的内容信息中，按照预设规则进行进一步筛选，来确定最终的内容推荐信息。具体而言，在一个例子中，从内容信息库中确定向用户推荐的内容推荐信息包括，将与属性标签匹配的特征标签所对应的内容信息，作为向用户推荐的候选内容信息；以及根据预设规则对候选内容信息中的各个内容信息进行排名，并将名次在预设范围内的内容信息作为内容推荐信息。

在一个例子中，预设规则可以包括特征标签的权重值，根据预设规则对候选内容信息中的各个内容信息进行排名，可以包括：根据候选内容信息中各个内容信息所对应的特征标签以及特征标签的权重值，通过加权求和的方式确定该内容信息的评分，并根据评分对各个内容信息进行排名。

在一个例子中，预设范围可以根据与内容信息相关的业务规则进行设定，例如，内容信息属于科技资讯，其业务规则可以包括向用户推荐名次排在前五位的内容信息。又例如，内容信息属于音乐栏目，其业务规则可以包括向用户推荐名次排在前十位的内容信息。

需要说明的是，可以在根据步骤S110-S140确定出用户的属性标签后，直接从内容信息库中确定向用户推荐的内容推荐信息。具体地，可以根据包括第一用户在内的多个用户的属性标签确定多个用户之间的相似度，并从多个用户中确定与第一用户的相似度在预设阈值范围内的多个第二用户。然后，根据多个第二用户对内容信息库中内容信息的浏览记录，从内容信息库中确定向第一用户推荐的内容推荐信息。

另外，单个内容信息可以与多个领域相关。相应地，在步骤S120中，可以确定与该内容信息对应的多个特定领域，再在步骤S130中可以获取与各个特定领域对应的领域知识信息(如，领域层级知识和/或领域知识图谱)。

在一个实施例中，在步骤S130中可以获取与各个特定领域对应的领域层级知识，进而在步骤S140中确定内容信息在各个特定领域中所对应的特定类别，以及与各个特定类别对应的特征单词，以及根据该特征单词确定内容信息的特征标签。

在另一个实施例中，在步骤S130中可以获取与各个特定领域对应的领域知识图谱，进而在步骤S140中确定各个领域知识图谱中包括的特征组合词，以及根据该特征组合词确定内容信息的特征标签。

此外，领域知识信息中包括的领域层级知识和领域知识图谱的主要区别在于：第一，领域层级知识中的特征单词包括单个的词语，领域知识图谱中的特征组合词包括由至少两个单词组合的词语。第二，领域层级知识中的特征单词主要是与类别强相关(也就是能够根据该词语明确推测出其所属的一个或几个类别)的词语(如，特征单词“洗车”通常属于汽车类别)，而对于某些在所有类别都存在、但是在不同类别下具有不同语义的词语(如，新规)可能不会被设定为特征单词。而基于领域知识图谱可以通过提取组合词(如，驾驶证-新规)的方式确定出在领域中具有明确语义的特征信息。显然，在上述方法中，既可以单独使用领域层级知识或领域知识图谱，也可以将领域层级知识和领域知识图谱结合起来使用，以确定内容信息的特征标签，进而确定向用户推荐的内容推荐信息。

由上可知，在本说明书披露的多个实施例提供的内容推荐方法中，首先，获取内容信息库中的内容信息，并确定与该内容信息相关的关键词信息。以及，确定与该内容信息对应的特定领域，并获取与该特定领域对应的领域知识信息。接着，根据该领域知识信息从关键词信息中确定内容信息的特征标签。然后，根据该特征标签和用户的属性标签，从内容信息库中确定向用户推荐的内容推荐信。通过采用这种方法，实现向用户推荐更加精准的内容信息。

与内容推荐方法对应地，本说明书披露的多个实施例还提供一种内容推荐装置，如图4所示，该装置400包括：

第一获取模块410，用于获取内容信息库中的内容信息；

第一确定模块420，用于确定内容信息的关键词信息；

第二确定模块430，用于确定与内容信息对应的特定领域；

第二获取模块440，用于获取与特定领域对应的领域知识信息；

第三确定模块450，用于根据领域知识信息从关键词信息中确定内容信息的特征标签；

处理模块460，用于根据用户的属性标签和特征标签，从内容信息库中确定向用户推荐的内容推荐信息。

在一种可能的实施方式中，确定子模块中的关键词提取算法包括TF-IDF算法和TextRank算法中的至少一种。

在一种可能的实施方式中，第一获取模块410获取的内容信息包括领域标签，第二确定模块430具体用于：

根据领域标签确定与内容信息对应的特定领域。

在一种可能的实施方式中，第二获取模块440获取的领域知识信息包括领域层级知识，领域层级知识包括领域名称，与领域名称对应的类别名称，以及与类别名称对应的特征单词。

在一种可能的实施方式中，第二获取模块440获取的特征单词基于内容语料库中的内容语料训练而获得。

在一种可能的实施方式中，第三确定模块450具体包括：

第一确定子模块451，用于确定与内容信息对应的特定类别；

第二确定子模块452，用于在领域层级知识中，确定与特定类别对应的特定类别名称，以及与特定类别名称对应的特征单词；

第三确定子模块453，根据特征单词从关键词信息中确定内容信息的特征标签。

在一种可能的实施方式中，第一获取模块410获取的内容信息包括类别标签，第一确定子模块451具体用于：

根据类别标签确定与内容信息对应的特定类别。

在一种可能的实施方式中，第三确定子模块453具体用于：

将关键词信息中与特征单词匹配的关键词信息作为特征标签。

在一种可能的实施方式中，第一确定模块420确定的关键词信息中包括多个关键词和各个关键词的排序信息，第三确定子模块453具体用于：

根据关键词信息中各个关键词与特征单词的匹配情况，以及排序信息，对多个关键词重新排序；

将经过重新排序后、位于预定顺序范围内的关键词信息作为内容信息的特征标签。

在一种可能的实施方式中，第二获取模块440获取的领域知识信息包括领域知识图谱，领域知识图谱在其第一层包括与领域对应的实体词，在其第二层包括与实体词对应的关联词，实体词和关联词组合构成特征组合词。

在一种可能的实施方式中，第三确定模块450具体包括：

第二确定子模块452，用于确定与特定领域对应的领域知识图谱中包括的特征组合词；

第三确定子模块453，用于根据特征组合词从关键词信息中确定内容信息的特征标签。

在一种可能的实施方式中，第三确定子模块453具体用于：

将关键词信息中与特征组合词匹配的关键词信息作为特征标签。

根据关键词信息中各个关键词与特征组合词的匹配情况，以及排序信息，对多个关键词重新排序；

在一种可能的实施方式中，处理模块460中包括的属性标签基于用户的历史浏览内容确定。

在一种可能的实施方式中，处理模块460具体用于：

将与属性标签匹配的特征标签所对应的内容信息，作为向用户推荐的候选内容信息；

根据预设规则对候选内容信息中的各个内容信息进行排名，并将名次在预设范围内的内容信息作为内容推荐信息。

由上可知，在本说明书披露的多个实施例提供的内容推荐装置中，首先，第一获取模块410获取内容信息库中的内容信息，第一确定模块420确定与该内容信息相关的关键词信息，第二确定模块430确定与该内容信息对应的特定领域，第二获取模块440获取与该特定领域对应的领域知识信息。接着，第三确定模块450根据该领域知识信息从关键词信息中确定内容信息的特征标签。然后，处理模块460根据该特征标签和用户的属性标签，从内容信息库中确定向用户推荐的内容推荐信。通过采用这种装置，实现向用户推荐更加精准的内容信息。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本说明书披露的多个实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本说明书披露的多个实施例的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本说明书披露的多个实施例的具体实施方式而已，并不用于限定本说明书披露的多个实施例的保护范围，凡在本说明书披露的多个实施例的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本说明书披露的多个实施例的保护范围之内。

Claims

一种内容推荐方法，其特征在于，包括：

获取内容信息库中的内容信息，并确定所述内容信息的关键词信息；

确定与所述内容信息对应的特定领域；

获取与所述特定领域对应的领域知识信息；

根据所述领域知识信息从所述关键词信息中确定所述内容信息的特征标签；

根据用户的属性标签和所述特征标签，从所述内容信息库中确定向所述用户推荐的内容推荐信息。
根据权利要求1所述的方法，其特征在于，所述领域知识信息包括领域层级知识，所述领域层级知识包括领域名称，与所述领域名称对应的类别名称，以及与所述类别名称对应的特征单词。
根据权利要求2所述的方法，其特征在于，所述根据所述领域知识信息从所述关键词信息中确定所述内容信息的特征标签包括：

确定与所述内容信息对应的特定类别；

在所述领域层级知识中，确定与所述特定类别对应的特定类别名称，以及与所述特定类别名称对应的特征单词；

根据所述特征单词从所述关键词信息中确定所述内容信息的特征标签。
根据权利要求3所述的方法，其特征在于，所述内容信息包括类别标签，所述确定与所述内容信息对应的特定类别，包括：

根据所述类别标签确定与所述内容信息对应的特定类别。
根据权利要求3所述的方法，其特征在于，所述根据所述特征单词从所述关键词信息中确定所述内容信息的特征标签，包括：

将所述关键词信息中与所述特征单词匹配的关键词信息作为所述特征标签。
根据权利要求3所述的方法，其特征在于，所述关键词信息包括多个关键词和各个关键词的排序信息，所述根据所述特征单词从所述关键词信息中确定所述内容信息的特征标签，包括：

根据所述关键词信息中所述各个关键词与所述特征单词的匹配情况，以及所述排序信息，对所述多个关键词重新排序；

将经过所述重新排序后、位于预定顺序范围内的关键词信息作为所述内容信息的特征标签。
根据权利要求1所述的方法，其特征在于，所述领域知识信息包括领域知识图谱，所述领域知识图谱在其第一层包括与领域对应的实体词，在其第二层包括与所述实体词对应的关联词，所述实体词和所述关联词组合构成特征组合词。
根据权利要求7所述的方法，其特征在于，所述根据所述领域知识信息从所述关键词信息中确定所述内容信息的特征标签包括：

确定与所述特定领域对应的领域知识图谱中包括的特征组合词；

根据所述特征组合词从所述关键词信息中确定所述内容信息的特征标签。
根据权利要求8所述的方法，其特征在于，所述根据所述特征组合词从所述关键词信息中确定所述内容信息的特征标签，包括：

将所述关键词信息中与所述特征组合词匹配的关键词信息作为所述特征标签。
根据权利要求8所述的方法，其特征在于，所述关键词信息包括多个关键词和各个关键词的排序信息，所述根据所述特征组合词从所述关键词信息中确定所述内容信息的特征标签，包括：

根据所述关键词信息中所述各个关键词与所述特征组合词的匹配情况，以及所述排序信息，对所述多个关键词重新排序；

将经过所述重新排序后、位于预定顺序范围内的关键词信息作为所述内容信息的特征标签。
一种内容推荐装置，其特征在于，包括：

第一获取模块，用于获取内容信息库中的内容信息；

第一确定模块，用于确定所述内容信息的关键词信息；

第二确定模块，用于确定与所述内容信息对应的特定领域；

第二获取模块，用于获取与所述特定领域对应的领域知识信息；

第三确定模块，用于根据所述领域知识信息从所述关键词信息中确定所述内容信息的特征标签；

处理模块，用于根据用户的属性标签和所述特征标签，从所述内容信息库中确定向所述用户推荐的内容推荐信息。
根据权利要求11所述的装置，其特征在于，所述第二获取模块获取的领域知识信息包括领域层级知识，所述领域层级知识包括领域名称，与所述领域名称对应的类别名称，以及与所述类别名称对应的特征单词。
根据权利要求12所述的装置，其特征在于，所述第三确定模块具体包括：

第一确定子模块，用于确定与所述内容信息对应的特定类别；

第二确定子模块，用于在所述领域层级知识中，确定与所述特定类别对应的特定类别名称，以及与所述特定类别名称对应的特征单词；

第三确定子模块，根据所述特征单词从所述关键词信息中确定所述内容信息的特征标签。
根据权利要求13所述的装置，其特征在于，所述第一获取模块获取的内容信息包括类别标签，所述第一确定子模块具体用于：

根据所述类别标签确定与所述内容信息对应的特定类别。
根据权利要求13所述的装置，其特征在于，所述第三确定子模块具体用于：

将所述关键词信息中与所述特征单词匹配的关键词信息作为所述特征标签。
根据权利要求13所述的装置，其特征在于，所述第一确定模块确定的关键词信息中包括多个关键词和各个关键词的排序信息，所述第三确定子模块具体用于：

根据所述关键词信息中所述各个关键词与所述特征单词的匹配情况，以及所述排序信息，对所述多个关键词重新排序；

将经过所述重新排序后、位于预定顺序范围内的关键词信息作为所述内容信息的特征标签。
根据权利要求11所述的装置，其特征在于，所述第二获取模块获取的领域知识信息包括领域知识图谱，所述领域知识图谱在其第一层包括与领域对应的实体词，在其第二层包括与所述实体词对应的关联词，所述实体词和所述关联词组合构成特征组合词。
根据权利要求11所述的装置，其特征在于，所述第三确定模块具体包括：

第二确定子模块，用于确定与所述特定领域对应的领域知识图谱中包括的特征组合词；

第三确定子模块，用于根据所述特征组合词从所述关键词信息中确定所述内容信息的特征标签。
根据权利要求18所述的装置，其特征在于，所述第三确定子模块具体用于：

将所述关键词信息中与所述特征组合词匹配的关键词信息作为所述特征标签。
根据权利要求18所述的装置，其特征在于，所述第一确定模块确定的关键词信息中包括多个关键词和各个关键词的排序信息，所述第三确定子模块具体用于：

根据所述关键词信息中所述各个关键词与所述特征组合词的匹配情况，以及所述排序信息，对所述多个关键词重新排序；

将经过所述重新排序后、位于预定顺序范围内的关键词信息作为所述内容信息的特征标签。