CN110555107B

CN110555107B - 确定业务对象主题、业务对象推荐的方法及装置

Info

Publication number: CN110555107B
Application number: CN201810270519.XA
Authority: CN
Inventors: 何恒旭
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2018-03-29
Filing date: 2018-03-29
Publication date: 2023-07-25
Anticipated expiration: 2038-03-29
Also published as: CN110555107A

Abstract

本申请公开了一种确定业务对象主题的方法，所述方法包括：根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签；建立所述特性标签与预先设置的兴趣主题之间的关联关系；使用各业务对象具备的特性标签以及所述关联关系，确定各业务对象对应的兴趣主题。采用上述方法，解决现有业务对象推荐方式单一、无法对用户进行个性化的推荐的问题。

Description

确定业务对象主题、业务对象推荐的方法及装置

技术领域

本申请涉及计算机技术领域，具体涉及一种确定业务对象主题的方法及装置，本申请另外涉及一种业务对象推荐方法及装置。

背景技术

近年来，随着互联网技术的快速发展和人民生活水平的不断提高，在线旅游行业发展迅速。

现有技术下，在线旅游行业对旅行产品的推荐方式是基于目的地维度来进行的，将旅行产品按照目的地进行分类，并根据目的地将与目的地匹配的旅行产品推荐给用户。

按照目的地对旅行产品的推荐方式存在以下缺陷：

1、对旅行产品的分类方式过于单一；

2、对于目的地不太明确的用户无法提供其他的推荐方式；

3、无法针对用户进行个性化的推荐。

发明内容

本申请提供一种确定业务对象主题的方法及装置，以解决现有业务对象推荐方式单一、无法对用户进行个性化的推荐的问题。

本申请提供一种确定业务对象主题的方法，所述方法包括：

根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签；

建立所述特性标签与预先设置的兴趣主题之间的关联关系；

使用各业务对象具备的特性标签以及所述关联关系，确定各业务对象对应的兴趣主题。

可选的，所述建立所述特性标签与预先设置的兴趣主题之间的关联关系，采用如下方式实现：

所述兴趣主题采用以特性标签组成的逻辑运算式表达；每个兴趣主题对应一个或者多个逻辑运算式。

可选的，所述使用各业务对象具备的特性标签以及所述关联关系，确定各业务对象对应的兴趣主题，包括：

根据特定兴趣主题的以特性标签组成的逻辑运算式，判断某个业务对象具备的标签是否满足所述逻辑运算式；

若是，设定所述业务对象对应所述特定兴趣主题。

为每个兴趣主题建立对应的特性标签组合的记录，并将所述记录存入数据库供查询。

可选的，所述根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签，采用如下方式实现：

根据介绍业务对象的文本描述信息，从预先设定的多个维度为所述业务对象设置特性标签。

可选的，所述根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签，包括：

对业务对象的文本描述信息进行分词并进行词向量处理；

将词向量处理的结果输入训练获得的标签提取模型，提取业务对象的特性标签。

可选的，所述标签提取模型以下述方式获得：

选择业务对象作为样本，并进行人工打标，生成样本集；所述样本集包括训练集和测试集；

对所述样本集的文本描述信息进行分词，并进行词向量处理；

根据训练集词向量处理的结果对神经网络模型进行训练；

将采用经过训练的神经网络模型生成的标签及其权重、以及采用词频统计方式生成的标签及其权重，通过线性函数进行拟合，获得拟合后线性函数，并使用所述测试集测试所生成的拟合后线性函数；

将所述经过训练的神经网络模型和所述拟合的线性函数的组合作为所述标签提取模型。

可选的，所述对所述样本集的文本描述信息进行分词，包括：

从所述样本集的文本描述信息中提取核心文本信息；

对所述核心文本信息进行分词。

可选的，所述核心文本信息，包括标题、副标题、推荐理由。

可选的，所述根据训练集词向量处理的结果对神经网络模型进行训练，具体为：

将训练集词向量处理的结果作为神经网络模型的输入进行模型训练，并在输出层设置分类器进行多分类预测。

可选的，所述预先设置的兴趣主题采用如下方式获得：

对潜在客户根据兴趣特征和/或属性特征进行多维度分组；

根据各个分组特有的兴趣特征和/或属性特征，为其设置对应的兴趣主题。

可选的，所述预先设置的兴趣主题采用如下方式获得：

搜集业务对象推广文案；

对所述业务对象推广文案进行分词并进行相关词向量处理；

将所述词向量处理的结果输入训练获得的兴趣主题提取模型，提取兴趣主题。

可选的，所述兴趣主题提取模型采用下述方式获得：

选择业务对象推广文案作为样本，并进行人工打标，生成样本集；所述样本集包括训练集和测试集；

对所述样本集的相关业务对象推广文案进行分词，并进行词向量处理；

根据训练集词向量处理的结果对神经网络模型进行训练；

将所述经过训练的神经网络模型和所述拟合的线性函数的组合作为所述提兴趣主题提取模型。

可选的，所述业务对象为旅行产品；所述特性标签包括用于表征以下所列中至少一种属性的内容：时间、目的地、出发地、适合人群、交通工具、用户兴趣。

本申请另外提供一种业务对象推荐方法，所述方法包括：

确定用户感兴趣的兴趣主题；

根据所述兴趣主题与特性标签之间的关联关系，确定所述兴趣主题相关的特性标签及关系；

根据所述兴趣主题对应的特性标签及关系，以及根据各业务对象具备的特性标签，得到与兴趣主题对应的业务对象，并将其推送给用户。

可选的，所述兴趣主题与特性标签之间的关联关系，通过如下方式确定：

可选的，所述根据所述兴趣主题对应的特性标签及关系，以及根据各业务对象具备的特性标签，得到与兴趣主题对应的业务对象，包括：

根据所述兴趣主题的以特性标签组成的逻辑运算式，判断业务对象具备的标签是否满足所述逻辑运算式；

若是，确定所述业务对象为所述与兴趣主题对应的业务对象。

可选的，所述确定用户感兴趣的兴趣主题，包括：

获取用户的兴趣特征和/或属性特征；

根据所述用户的兴趣特征和/或属性特征，匹配相应的兴趣主题。

本申请还提供一种确定业务对象主题的装置，所述装置包括：

特性标签确定单元，用于根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签；

关联关系建立单元，用于建立所述特性标签与预先设置的兴趣主题之间的关联关系；

兴趣主题确定单元，用于使用各业务对象具备的特性标签以及所述关联关系，确定各业务对象对应的兴趣主题。

本申请还提供一种业务对象推荐装置，所述装置包括：

兴趣主题确定单元，用于确定用户感兴趣的兴趣主题；

标签及关系确定单元，用于根据所述兴趣主题与特性标签之间的关联关系，确定所述兴趣主题相关的特性标签及关系；

业务对象得到单元，用于根据所述兴趣主题对应的特性标签及关系，以及根据各业务对象具备的特性标签，得到与兴趣主题对应的业务对象，并将其推送给用户。

与现有技术相比，本申请具有以下优点：

本申请提供一种确定业务对象主题的方法，所述方法包括：根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签；建立所述特性标签与预先设置的兴趣主题之间的关联关系；使用各业务对象具备的特性标签以及所述关联关系，确定各业务对象对应的兴趣主题。

本申请提供的确定业务对象主题的方法，通过确定业务对象的至少一个特性标签和兴趣主题关联的标签，实现了以特性标签为桥梁，将各业务对象与兴趣主题关联，其相对于现有技术具有如下优点：

1、由于预先设置的兴趣主题可以有多个，因此能够提供业务对象的多样分类方式；

2、由于本申请的优选方案可以按照多维度主题进行推荐，因此对于目的地不太明确的用户可以提供其他的推荐方式；

3、由于预先设置的兴趣主题是根据用户的兴趣特征和属性特征设置的，因此使得针对用户进行个性化的推荐成为了可能。

附图说明

图1是本申请第一实施例提供的一种确定业务对象主题的方法的流程图。

图2是本申请第一实施例提供的根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签的流程图。

图3是本申请第一实施例提供的一种获得标签提取模型的方法的流程图。

图4是本申请第一实施例提供的标准的CNN神经网络模型LeNet5的示意图。

图5是本申请第二实施例提供的一种业务对象推荐方法的流程图。

图6是本申请第三实施例提供的一种确定业务对象主题的装置的示意图。

图7是本申请第四实施例提供的一种业务对象推荐装置的示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施的限制。

本申请第一实施例提供了一种确定业务对象主题的方法。请参考图1、图2、图3和图4，图1其示出了根据本申请的实施例提供的一种确定业务对象主题的方法的流程图，图2是本申请第一实施例提供的根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签的流程图，图3是本申请第一实施例提供的一种获得标签提取模型的方法的流程图，图4是本申请第一实施例提供的标准的CNN神经网络模型LeNet5的示意图。以下结合图1、图2、图3和图4进行详细说明。

如图1所示，在步骤S101中，根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签。

确定所述业务对象的至少一个特性标签的目的是：通过业务对象具有的标签与预先设置的兴趣主题进行匹配，将业务对象与兴趣主题匹配，业务对象具有的标签作为业务对象与兴趣主题的桥梁，通过标签将业务对象与兴趣主题关联起来。

所述业务对象，可以包括旅行产品、电商销售的商品、人物介绍等，本申请第一实施例中主要以旅行产品为例进行说明。

所述业务对象的文本描述信息，指对业务对象进行描述的文字信息。例如，某个旅行产品的文本描述信息：“大巴上门接送三亚呀诺达热带雨林一日纯玩游，景点门票电瓶车自由行钻石级雨林景区，最具观赏价值的热带雨林资源博览馆；中国地处北纬18度的热带雨林；适合情侣蜜月、家庭亲子、公司拓展等人群；原生态，天然氧吧，健康旅游最佳选择等”；或者淘宝上销售的“外套”，其文本描述信息为“红色纯棉短款外套”。

当业务对象为旅行产品时，特性标签可以包括用于表征以下所列中至少一种属性的内容：时间、目的地、出发地、适合人群、交通工具、用户兴趣。

根据介绍业务对象的文本描述信息，可以从预先设定的多个维度为所述业务对象设置特性标签，例如，业务对象为旅行产品，可以从时间、目的地、出发地、适合人群、交通工具、用户兴趣等多个维度为旅行产品设置特性标签。

所述根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签，包括：

对业务对象的文本描述信息进行分词并进行词向量处理；

请参考图2，其示出了根据本申请第一实施例提供的根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签的流程图。以下结合图2进行详细说明。

如图2所示，在步骤S101-1中，对业务对象的文本描述信息进行分词并进行词向量处理。

所述分词，指将文本描述信息按照一定的规则重新组合成词序列的过程。文本相同，设定的规则不同，分词过程就不同。例如，“海南三亚双飞五日游”可以根据不同的规则分词为“海南/三亚/双飞/五日游”或“海/南/三/亚/双/飞/五日游”或其他的分词结果。

由于所述业务对象的文本描述信息通常由卖家自由填写，结构相对松散，噪声较多，因此在对所述业务对象的文本描述信息进行分词时，最好从所述业务对象的文本描述信息中提取核心文本信息，再对所述核心文本信息进行分词。其中，所述核心文本包括标题、副标题、推荐理由等。

为了方便计算，可以将文本信息转化成向量。要将文本信息交给机器学习中的算法来处理，通常需要首先将文本数学化，词向量就是用来将文本中的词进行数学化的一种方式，其含义是把文本特征变成向量特征，例如，[0.92,0.43,0.13,0.32,0.54]就是一个五维的词向量。具体实施时，可采用word2vec进行词向量处理。其中，word2vec是Google于2013年开源推出的一个用于获取word vector的工具包。

word2vec原理如下：Word2Vec的训练模型，是具有一个隐含层的神经元网络。它的输入是词汇表向量，当看到一个训练样本时，对于样本中的每一个词，就把相应的在词汇表中出现的位置的值置为1，否则置为0。它的输出也是词汇表向量，对于训练样本的标签中的每一个词，就把相应的在词汇表中出现的位置的值置为1，否则置为0。那么，对所有的样本，训练这个神经元网络。收敛之后，将从输入层到隐含层的那些权重，作为每一个词汇表中的词的向量。比如，第一个词的向量是(w1,1w1,2w1,3...w1,m)，m是表示向量的维度。所有虚框中的权重就是所有词的向量的值。有了每个词的有限维度的向量，就可以用到其它的应用中，因为它们就像图像，有了有限维度的统一意义的输入。

在对业务对象的文本描述信息进行分词并进行词向量处理处理后，就可以将词向量处理的结果输入标签提取模型进行业务对象的特性标签的提取。

如图2所示，在步骤S101-2中，将词向量处理的结果输入训练获得的标签提取模型，提取业务对象的特性标签。

所述标签提取模型以下述方式获得：

根据训练集词向量处理的结果对神经网络模型进行训练；

如图3所示，在步骤标签提取模型S101-2-1中，选择业务对象作为样本，并进行人工打标，生成样本集；所述样本集包括训练集和测试集。

所述训练集，指从样本集中选出的用于进行模型训练使用的用于训练的训练样本的集合。训练集用于建立神经网络模型，通常训练集包含上万个训练样本，一般情况下其数量大于测试集的样本数量，例如将训练集的样本数量与测试集的样本数量设为3:1。

所述测试集，指从样本集中选出的用于进行模型测试时使用的测试样本的集合。测试集用于检验选择的模型的性能。

所述人工打标，指采用人工的方式将业务对象打标签。例如，“红色纯棉短款外套”可以打上“外套”标签或者将介绍海岛的文本打上“海岛”标签。

为了生成用于根据业务对象的文本描述信息提取特性标签的模型，首先需要从全量业务对象中抽取部分样本并进行人工打标生成样本集，并将样本集分为训练集和测试集。

为了保证样本集的特性标签分布相对均匀，在从全量业务对象中抽取部分样本并进行人工打标生成样本集时，可以根据各类业务对象的数量从全量特定对象中按比例抽取出各类特定对象样本并进行人工打标生成样本集。采用此种方式选出的样本集，能够使生成的标签提取模型打签的准确率更高。例如，假设样本集包括国内游和出国游，如果国内游占70％，出国游占30％，则选取择的样本集中国内游可以占70％，出国游可以占30％。

如图3所示，步骤S101-2-2，对所述样本集的相关文本进行分词并进行词向量处理。

由于所述样本集的相关文本通常由商品卖家自由填写，结构相对松散，噪声较多，因此在对所述样本集的相关文本进行分词时，最好从所述样本集的相关文本中提取核心文本信息，再对所述核心文本信息进行分词。其中，所述核心文本包括标题、副标题、推荐理由等。

在经过词向量处理后，就可以根据训练集词向量处理的结果对神经网络模型进行训练。

如图3所示，在步骤S101-2-3中，根据训练集词向量处理的结果对神经网络模型进行训练。

所述神经网络，是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为“神经网络”或类神经网络。

所述神经网络模型包括CNN神经网络(convolutional neural network，卷积神经网络)、RNN神经网络、CNN-RNN结合框架等。CNN中的“局部卷积”信息处理机制，可以用于提取文本中的N-gram特征，对固定范围内的局部依存关系进行建模。

所述训练，指根据已知数据寻找神经网络模型参数的过程，经过训练获得的模型被称为经过训练的神经网络模型。

所述根据训练集词向量处理的结果对神经网络模型进行训练，具体为：

所述多分类预测：预测结果为多种情况时，即为多分类预测，SoftMax就是用来做多分类预测的。例如，预测结果为好，中，及格，差这四种其中的一种，那么这就是多分类预测，可以采用在输出层设置SoftMax分类器进行多分类预测。

图4是标准的CNN神经网络模型LeNet5的示意图。

LeNet5这张图从左到右，先输入层，即输入的图片或者是文本。输入层到C1这部分就是一个卷积层(convolution运算)，C1到S2是一个子采样层(pooling运算)，然后，S2到C3又是卷积，C3到S4又是子采样，可以发现，卷积和子采样都是成对出现的，卷积后面一般跟着子采样S4到C5(卷积层)之间是全连接的神经网络，每层都包含可训练参数，最后从F6(全连接层)到输出层，其实就是一个分类器，这一层就叫分类层，此处使用的是SoftMax分类器，是用来做多分类预测的。

CNN神经网络模型，能够保留文本的前后顺序关系和语义依赖关系，更好地理解文本，对特定对象进行分类。

通过步骤S101-2-3，可以获得经过训练的神经网络模型。

如图3所示，在步骤S101-2-4中，将采用经过训练的神经网络模型生成的标签及其权重、以及采用词频统计方式生成的标签及其权重，通过线性函数进行拟合，获得拟合后线性函数，并使用所述测试集测试所生成的拟合后线性函数。

由于仅采用步骤S101-2-3获得的经过训练的神经网络模型提取业务对象的特性标签，其效果与采用TFIDF方式进行打签相差不大，但是经过训练的神经网络模型具有一定的预测效果。将采用经过训练的神经网络模型生成的标签和采用TFIDF方式生成的标签及其权重，通过线性函数进行拟合，获得拟合后线性函数，并使用所述测试集测试所生成的拟合后线性函数，再将拟合的线性函数与经过训练的神经网络模型组合在一起对业务对象打标签，能够显著提高提取业务对象的特性标签的准确率。

所述权重，指采用模型将某一个文本预测到某一个标签的概率，例如，介绍海岛的文本预测成“海岛”标签的权重是0.7，预测成“沙滩”标签的权重是0.5，说明更有可能应该打上“海岛”标签，它的作用就是找到一个概率最大的标签。

例如，采用线性函数y＝ax1+bx2进行拟合，其中x1是传统方式(即TFIDF方式)预测的权重，x2是cnn模型预测的权重，可以通过经验给定一个a和b的值，或者通过最小二乘法来计算a和b让a和b都达到一个合适的值让最终的y最优化。

举个例子：假设传统方式预测一段文本的结果为：“海岛”的权重为0.9，“沙滩”的权重为0.7，采用cnn模型预测的结果为：“海岛”的权重为0.8，“沙滩”的权重为0.4；先假设a＝0.5，b＝0.5，那么最终预测成“海岛”的权重值就是0.5*0.9+0.5*0.8＝0.85，预测成“沙滩”的权重值是0.5*0.7+0.5*0.4＝0.55，所以应该将所述文本打上“海岛”标签，而不是“沙滩”，通过最小二乘法来最小化损失函数也能拟合出一个a和b让结果最优。

如图3所示，在步骤S101-2-5中，将所述经过训练的神经网络模型和所述拟合的线性函数的组合作为所述标签提取模型。

为了提高提取标签的准确率，将所述经过训练的神经网络模型和所述拟合的线性函数的组合作为所述标签提取模型。

需要说明的是，在将词向量处理的结果输入训练获得的标签提取模型，提取业务对象的特性标签时，可以设定业务对象提取特性标签的数量阈值，例如，将提取特性标签的数量阈值设为10，则采用标签提取模型对业务对象提取标签时，对业务对象提取的标签小于或等于10个。例如，业务对象为某个商家发布的关于旅行商品的介绍，其标题为“上海一日游纯玩旅游含上海城隍庙东方明珠门票无购物”，则可以将其标题作为核心文本提取出来进行词向量处理，然后将词向量处理的结果输入标签提取模型提取上述旅行商品的特性标签，提取出特性标签为“上海一日纯玩上海城隍庙东方明珠无购物”，提取出的特性标签的数量为6个，小于10个。

如果提取出的特性标签的数量大于设定的特性标签数量阈值，则将提取出的特定对象的特性标签按照标签的权重对特性标签进行排序，保留权重较高的设定的特性标签数量阈值的特性标签。例如，如果设定特性标签数量阈值为5个，则保留权重前5的特性标签。可以将仍沿用上面的例子，如果设置旅行产品特性标签的权重从大到小顺序依次为：旅游目的地、旅行社、旅行天数、包含景点、旅游类型。则可以将提取出的特性标签按照权重从大到小排序，即“上海一日上海城隍庙东方明珠纯玩无购物”，此时，特性标签的数量大于5个，则只保留权重较高的前5个特性标签，即“上海一日上海城隍庙东方明珠纯玩”。

由于采用本实施例中标签提取模型提取标签，其准确率高，因此在具体应用场景中，采用本实施例中根据业务对象的文本描述信息提取标签的方法进行打签，比传统方式准确率更高。

请再参照图1，在步骤S102中，建立所述特性标签与预先设置的兴趣主题之间的关联关系。

所述兴趣主题指用户感兴趣的业务对象对应的主题。设置兴趣主题时可以根据用户的兴趣特征和属性特征进行设置。例如，当业务对象为旅游产品时，可以根据用户的兴趣设置“冰雪世界”、“去海边吧”、“境外自驾”等主题作为兴趣主题，根据用户的属性特征设置“情侣必去”、“带娃游世界”、“爸妈放心游”等主题作为兴趣主题。

建立所述特性标签与预先设置的兴趣主题之间的关联关系，可以采用如下方式实现：所述兴趣主题采用以特性标签组成的逻辑运算式表达；每个兴趣主题对应一个或者多个逻辑运算式。其中逻辑运算式可以包括逻辑与、逻辑或、逻辑非等运算符号。例如，兴趣主题“爸妈游”对应的特性标签为夕阳红、跟团游，则兴趣主题“爸妈游”可以采用逻辑运算式“夕阳红AND跟团游”表达。

建立所述特性标签与预先设置的兴趣主题之间的关联关系，可以采用如下方式实现：

如表1所示：

序号	兴趣主题	特性标签1	特性标签2	特性标签3
					1	冰雪世界	滑雪	滑冰	雪圈
2	亲子游	儿童乐园	采摘	儿童俱乐部
					3	爸妈游	夕阳红	跟团游	爸妈轻松游

预先设置的兴趣主题可以采用如下方式获得：

搜集业务对象推广文案；

对所述业务对象推广文案进行分词并进行相关词向量处理；

所述兴趣主题提取模型可以采用下述方式获得：

根据训练集词向量处理的结果对神经网络模型进行训练；

如图1所示，在步骤S103中，使用各业务对象具备的特性标签以及所述关联关系，确定各业务对象对应的兴趣主题。

例如，如果业务对象为某个旅游产品，其具备的特性标签为“滑冰、滑雪”，则可以根据表1中兴趣主题与特性标签的关联关系，确定其对应的兴趣主题为“冰雪世界”。

使用各业务对象具备的特性标签以及所述关联关系，确定各业务对象对应的兴趣主题，可以包括下述步骤：

若是，设定所述业务对象对应所述特定兴趣主题。

例如，某个特定兴趣主题以逻辑运算式“特性标签1AND(特性标签2OR特性标签3)”，如果业务对象A满足上述逻辑运算式，则业务对象A对应某个特定兴趣主题。

需要说明的是，一个业务对象可以具备多个特性标签，而多个特性标签可能满足不同兴趣主题对应的逻辑运算式，因此一个业务对象可以对应多个特定兴趣主题。

通过本申请第一实施例，实现了业务对象与兴趣主题的对应，使按照兴趣主题进行业务对象的推荐成为了可能。

本申请第二实施例提供了一种业务对象推荐方法。请参考图5，其示出了根据本申请第二实施例提供的一种业务对象推荐方法的流程图。以下结合图5进行详细说明。

如图5所示，在步骤S501中，确定用户感兴趣的兴趣主题。

所述兴趣主题指用户感兴趣的业务对象对应的主题。

所述业务对象所述业务对象，可以包括旅行产品、电商销售的商品、人物介绍等。

确定用户感兴趣的兴趣主题包括多种方式：

一种是在推荐旅行产品的界面上展示兴趣主题，可以根据接收到的用户点击行为确定用户感兴趣的兴趣主题，例如如果用户点击了“带娃游世界”，则确定用户感兴趣的兴趣主题为“带娃游世界”。

另一种是根据用户的兴趣特征和/或属性特征来确定用户感兴趣的兴趣主题，可以包括下述步骤：

获取用户的兴趣特征和/或属性特征；

在具体实施时，可以通过接收用户输入的兴趣特征关键词来确定用户的兴趣主题，或者根据记录的用户的属性特征匹配相应的兴趣主题。

例如，当业务对象为旅行产品时，接收到的用户输入的兴趣特征关键词包括“滑冰、滑雪”，则可以确定用户感兴趣的兴趣主题为“冰雪世界”。如果通过历史记录和用户的注册信息获得用户喜欢参加亲子游，则可以根据用户的属性特征匹配“带娃游世界”作为用户感兴趣的兴趣主题。

步骤S502，根据所述兴趣主题与特性标签之间的关联关系，确定所述兴趣主题相关的特性标签及关系。

当业务对象为旅行产品时；所述特性标签包括用于表征以下所列中至少一种属性的内容：时间、目的地、出发地、适合人群、交通工具、用户兴趣。

兴趣主题与特性标签之间的关联关系，可以通过如下方式确定：所述兴趣主题采用以特性标签组成的逻辑运算式表达；每个兴趣主题对应一个或者多个逻辑运算式。其中逻辑运算式可以包括逻辑与、逻辑或、逻辑非等运算符号。例如，兴趣主题“爸妈游”对应的特性标签为夕阳红、跟团游，则兴趣主题“爸妈游”可以采用逻辑运算式“夕阳红AND跟团游”表达。

根据所述兴趣主题与特性标签之间的关联关系，可以确定所述兴趣主题相关的特性标签及关系，例如，如果兴趣主题A与特性标签1、特性标签2具有关联关系：兴趣主题A可以采用逻辑运算式“特性标签1AND特性标签2”表达，则根据上述关联关系，确定与兴趣主题A相关的特性标签为特性标签1和特性标签2，且特性标签1和特性标签2的关系为“AND”。

步骤S503，根据所述兴趣主题对应的特性标签及关系，以及根据各业务对象具备的特性标签，得到与兴趣主题对应的业务对象，并将其推送给用户。

当兴趣主题采用以特性标签组成的逻辑运算式表达时，所述根据所述兴趣主题对应的特性标签及关系，以及根据各业务对象具备的特性标签，得到与兴趣主题对应的业务对象，包括：

例如，如果业务对象为旅行产品A，兴趣主题B以特性标签组成的逻辑运算式“特性标签1AND特性标签2”，业务对象A具备的标签包括特性标签1和特性标签2，则可以根据兴趣主题B与特性标签的关联关系，确定旅行产品A为与兴趣主题B对应的业务对象。

根据所述兴趣主题对应的特性标签及关系，以及根据各业务对象具备的特性标签，可以得到与兴趣主题对应的业务对象，并将其推送给用户，通过特性标签作为桥梁，实现了兴趣主题与业务对象之间的关联，用户可以获得与自己兴趣主题对应的业务对象，提升了用户的体验。

与上述提供的一种确定业务对象主题的方法相对应的，本申请第三实施例还提供了一种确定业务对象主题的装置。如图6所示，确定业务对象主题的装置包括：特性标签确定单元601、关联关系建立单元602、兴趣主题确定单元603。

特性标签确定单元601，用于根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签；

关联关系建立单元602，用于建立所述特性标签与预先设置的兴趣主题之间的关联关系；

兴趣主题确定单元603，用于使用各业务对象具备的特性标签以及所述关联关系，确定各业务对象对应的兴趣主题。

可选的，所述兴趣主题确定单元，具体用于：

若是，设定所述业务对象对应所述特定兴趣主题。

可选的，所述特性标签确定单元，具体用于：

对业务对象的文本描述信息进行分词并进行词向量处理；

可选的，所述标签提取模型以下述方式获得：

根据训练集词向量处理的结果对神经网络模型进行训练；

将所述经过训练的神经网络模型和所述拟合的线性函数的组合作为所述提取特性标签的模型。

从所述样本集的文本描述信息中提取核心文本信息；

对所述核心文本信息进行分词。

可选的，所述预先设置的兴趣主题采用如下方式获得：

对潜在客户根据兴趣特征和/或属性特征进行多维度分组；

可选的，所述预先设置的兴趣主题采用如下方式获得：

搜集业务对象推广文案；

对所述业务对象推广文案进行分词并进行相关词向量处理；

可选的，所述兴趣主题提取模型采用下述方式获得：

根据训练集词向量处理的结果对神经网络模型进行训练；

需要说明的是，对于本申请第三实施例提供的确定业务对象主题的装置的详细描述可以参考对本申请第一实施例的相关描述，这里不再赘述。

与上述提供的一种业务对象推荐方法相对应的，本申请第四实施例还提供了一种业务对象推荐装置。如图7所示，业务对象推荐装置包括：兴趣主题确定单元701、标签及关系确定单元702、业务对象得到单元703。

兴趣主题确定单元701，用于确定用户感兴趣的兴趣主题；

标签及关系确定单元702，用于根据所述兴趣主题与特性标签之间的关联关系，确定所述兴趣主题相关的特性标签及关系；

业务对象得到单元703，用于根据所述兴趣主题对应的特性标签及关系，以及根据各业务对象具备的特性标签，得到与兴趣主题对应的业务对象，并将其推送给用户。

可选的，所述业务对象得到单元，具体用于：

若是，确定所述业务对象为所述与兴趣主题对应的业务对象，并将其推送给用户。

可选的，所述兴趣主题确定单元，具体用于：

获取用户的兴趣特征和/或属性特征；

需要说明的是，对于本申请第四实施例提供的业务对象推荐装置的详细描述可以参考对本申请第二实施例的相关描述，这里不再赘述。

本发明虽然以较佳实施例公开如上，但其并不是用来限定本发明，任何本领域技术人员在不脱离本发明的精神和范围内，都可以做出可能的变动和修改，因此本发明的保护范围应当以本发明权利要求所界定的范围为准。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims

1.一种确定业务对象主题的方法，其特征在于，包括：

建立所述特性标签与预先设置的兴趣主题之间的关联关系；所述兴趣主题采用以特性标签组成的逻辑运算式表达；每个兴趣主题对应一个或者多个逻辑运算式；

2.根据权利要求1所述的确定业务对象主题的方法，其特征在于，所述使用各业务对象具备的特性标签以及所述关联关系，确定各业务对象对应的兴趣主题，包括：

若是，设定所述业务对象对应所述特定兴趣主题。

3.根据权利要求1所述的确定业务对象主题的方法，其特征在于，所述建立所述特性标签与预先设置的兴趣主题之间的关联关系，采用如下方式实现：

4.根据权利要求1所述的确定业务对象主题的方法，其特征在于，所述根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签，采用如下方式实现：

5.根据权利要求1所述的确定业务对象主题的方法，其特征在于，所述根据业务对象的文本描述信息，确定所述业务对象的至少一个特性标签，包括：

对业务对象的文本描述信息进行分词并进行词向量处理；

6.根据权利要求5所述的确定业务对象主题的方法，其特征在于，所述标签提取模型以下述方式获得：

根据训练集词向量处理的结果对神经网络模型进行训练；

7.根据权利要求6所述的确定业务对象主题的方法，其特征在于，所述对所述样本集的文本描述信息进行分词，包括：

从所述样本集的文本描述信息中提取核心文本信息；

对所述核心文本信息进行分词。

8.根据权利要求7所述的确定业务对象主题的方法，其特征在于，所述核心文本信息，包括标题、副标题、推荐理由。

9.根据权利要求6所述的确定业务对象主题的方法，其特征在于，所述根据训练集词向量处理的结果对神经网络模型进行训练，具体为：

10.根据权利要求1所述的确定业务对象主题的方法，其特征在于，所述预先设置的兴趣主题采用如下方式获得：

对潜在客户根据兴趣特征和/或属性特征进行多维度分组；

11.根据权利要求1所述的确定业务对象主题的方法，其特征在于，所述预先设置的兴趣主题采用如下方式获得：

搜集业务对象推广文案；

对所述业务对象推广文案进行分词并进行相关词向量处理；

12.根据权利要求11所述的确定业务对象主题的方法，其特征在于，所述兴趣主题提取模型采用下述方式获得：

根据训练集词向量处理的结果对神经网络模型进行训练；

将所述经过训练的神经网络模型和所述拟合的线性函数的组合作为所述兴趣主题提取模型。

13.根据权利要求1-12任一权项所述的确定业务对象主题的方法，其特征在于，所述业务对象为旅行产品；所述特性标签包括用于表征以下所列中至少一种属性的内容：时间、目的地、出发地、适合人群、交通工具、用户兴趣。

14.一种业务对象推荐方法，其特征在于，包括：

确定用户感兴趣的兴趣主题；

根据所述兴趣主题与特性标签之间的关联关系，确定所述兴趣主题相关的特性标签及关系；所述兴趣主题采用以特性标签组成的逻辑运算式表达；每个兴趣主题对应一个或者多个逻辑运算式；

15.根据权利要求14所述的业务对象推荐方法，其特征在于，所述根据所述兴趣主题对应的特性标签及关系，以及根据各业务对象具备的特性标签，得到与兴趣主题对应的业务对象，包括：

16.根据权利要求14所述的业务对象推荐方法，其特征在于，所述确定用户感兴趣的兴趣主题，包括：

获取用户的兴趣特征和/或属性特征；

17.根据权利要求14-16任一权项所述的业务对象推荐方法，其特征在于，所述业务对象为旅行产品；所述特性标签包括用于表征以下所列中至少一种属性的内容：时间、目的地、出发地、适合人群、交通工具、用户兴趣。

18.一种确定业务对象主题的装置，其特征在于，包括：

关联关系建立单元，用于建立所述特性标签与预先设置的兴趣主题之间的关联关系；所述兴趣主题采用以特性标签组成的逻辑运算式表达；每个兴趣主题对应一个或者多个逻辑运算式；

19.一种业务对象推荐装置，其特征在于，包括：

兴趣主题确定单元，用于确定用户感兴趣的兴趣主题；

标签及关系确定单元，用于根据所述兴趣主题与特性标签之间的关联关系，确定所述兴趣主题相关的特性标签及关系；所述兴趣主题采用以特性标签组成的逻辑运算式表达；每个兴趣主题对应一个或者多个逻辑运算式；