WO2018068648A1

WO2018068648A1 - 一种信息匹配方法及相关装置

Info

Publication number: WO2018068648A1
Application number: PCT/CN2017/103858
Authority: WO
Inventors: 张一昌; 赵争超; 张建伟; 蔡仁贵; 林君; 肖谦; 潘林林
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2016-10-11
Filing date: 2017-09-28
Publication date: 2018-04-19
Also published as: TW201814556A; CN107918778B; CN107918778A

Abstract

本申请实施例提供了一种信息匹配方法及相关装置，所述方法包括：获取待匹配的第一信息和第二信息；获取标签类目树，所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目；从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述第一信息的内容相匹配，所述第二树枝的最低层的标签节点与所述第二信息的内容相匹配；至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度。可见，本申请实施例计算出的匹配度能够反映信息之间的关联性，从而提高匹配准确率。

Description

一种信息匹配方法及相关装置

本申请要求2016年10月11日递交的申请号为201610887444.0、发明名称为“一种信息匹配方法及相关装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，尤其是涉及一种信息匹配方法及相关装置。

背景技术

信息匹配技术是一种常用的计算机技术，用于获得多条信息之间的匹配度。信息匹配技术广泛应用在多种互联网场景中，例如，对于买家在电子商务等网站输入的多条评价信息，通过信息匹配技术获得各条评价信息与商家订阅信息的匹配度，从而能够快速地定位到商家感兴趣的评价信息。

目前一种常用的信息匹配方式包括：将待匹配的多条信息分词，判断是否存在相同的分词结果，根据相同的分词结果计算多条信息之间的匹配度。

显然，上述信息匹配方式只能判断出多条信息之间是否存在相同的分词结果，而无法反映多条信息之间是否存在关联性。例如，买家输入的评价信息为“服务不好”，而商家订阅信息为“客服态度”，虽然“服务不好”和“客服态度”都是在描述服务，具有一定的关联性，但是按照上述信息匹配方式计算出的匹配度为0，显然匹配准确率较低。

发明内容

本申请解决的技术问题在于提供一种信息匹配方法及相关装置，使得计算出的匹配度能够反映信息之间的关联性，从而提高匹配准确率。

为此，本申请解决技术问题的技术方案是：

本申请提供了一种信息匹配方法，包括：

获取待匹配的商家订阅信息和用户评价信息；

获取标签类目树，所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目；

从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述用户评价信息的内容相匹配，所述第二树枝的最低层的标签节点与所述商家订阅信息的内容相匹配；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度。

可选的，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度；

至少根据所述第一匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度。

可选的，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，以及每层的权重值，计算第一匹配度。

可选的，所述方法还包括：

获取训练后的统计模型；

根据所述统计模型计算所述用户评价信息的情感指数；

计算所述用户评价信息的情感指数与目标情感指数的近似度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述用户评价信息和所述商家订阅信息的匹配度。

可选的，所述方法还包括：

根据所述统计模型计算所述商家订阅信息的情感指数，所述商家订阅信息的情感指数作为所述目标情感指数。

可选的，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述用户评价信息和所述商家订阅信息的匹配度，包括：

若所述近似度大于或等于第一阈值，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度计算所述用户评价信息和所述商家订阅信息的匹配度；

若所述近似度小于所述第一阈值，所述用户评价信息和所述商家订阅信息的匹配度为0。

可选的，获取训练后的统计模型，包括：

获取所述用户评价信息对应的类目；

获取所述类目对应的训练后的统计模型。

可选的，获取所述用户评价信息对应的类目，包括：

获取场景类目树，所述场景类目树包括至少两层，每层包括至少一个场景节点，每个场景节点的父场景节点为该场景节点的父类目；

从所述场景类目树中获取与所述用户评价信息匹配的场景节点，确定出所述匹配的场景节点对应的上一级或多级父场景节点，将所述上一级或多级父场景节点作为所述用户评价信息对应的类目。

可选的，所述方法还包括：

获取所述用户评价信息的词向量和所述商家订阅信息的词向量；

计算所述用户评价信息的词向量与所述商家订阅信息的词向量的匹配度，作为第二匹配度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度和所述第二匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度。

可选的，所述方法还包括：

获取所述标签类目树中多个标签节点之间的匹配度；

根据所述多个标签节点之间的匹配度进行机器学习，根据机器学习的结果生成或者修正所述标签类目树。

本申请还提供了一种信息匹配方法，包括：

获取待匹配的商家订阅信息和用户评价信息；

获取训练后的统计模型；

根据所述统计模型计算所述用户评价信息的情感指数；

至少根据所述用户评价信息的情感指数与目标情感指数的近似度，计算所述用户评价信息和所述商家订阅信息的匹配度。

可选的，所述方法还包括：

获取所述用户评价信息与所述商家评价信息的初始匹配度；

至少根据所述用户评价信息的情感指数与目标情感指数的近似度，计算所述用户评价信息和所述商家订阅信息的匹配度，包括：

至少根据所述近似度和所述初始匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度。

可选的，至少根据所述近似度和所述初始匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度，包括：

若所述近似度大于或等于第一阈值，至少根据所述初始匹配度计算所述用户评价信息和所述商家订阅信息的匹配度；

可选的，获取训练后的统计模型，包括：

获取所述用户评价信息对应的类目；

获取所述类目对应的训练后的统计模型。

可选的，获取所述用户评价信息对应的类目，包括：

可选的，所述方法还包括：

根据所述统计模型计算所述商家订阅信息的情感指数，将所述商家订阅信息的情感指数作为所述目标情感指数。

本申请还提供了一种信息输入方法，包括：

客户端获取用户输入的用户评价信息或者商家订阅信息；

所述客户端将所述用户评价信息或者商家订阅信息发送至计算单元，所述计算单元用于计算用户评价信息和商家订阅信息的匹配度。

本申请还提供了一种信息匹配方法，包括：

获取待匹配的第一信息和第二信息；

从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述第一信息的内容相匹配，所述第二树枝的最低层的标签节点与所述第二信息的内容相匹配；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度。

可选的，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度，包括：

至少根据所述第一匹配度，计算所述第一信息和所述第二信息的匹配度。

可选的，所述方法还包括：

获取训练后的统计模型；

根据所述统计模型计算所述第一信息的情感指数；

计算所述第一信息的情感指数与目标情感指数的近似度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述第一信息和所述第二信息的匹配度。

可选的，所述方法还包括：

根据所述统计模型计算所述第二信息的情感指数，所述第二信息的情感指数作为所述目标情感指数。

可选的，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述第一信息和所述第二信息的匹配度，包括：

若所述近似度大于或等于第一阈值，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度计算所述第一信息和所述第二信息的匹配度；

若所述近似度小于所述第一阈值，所述第一信息和所述第二信息的匹配度为0。

可选的，获取训练后的统计模型，包括：

获取所述第一信息对应的类目；

获取所述类目对应的训练后的统计模型。

可选的，获取所述第一信息对应的类目，包括：

从所述场景类目树中获取与所述第一信息匹配的场景节点，确定出所述匹配的场景节点对应的上一级或多级父场景节点，将所述上一级或多级父场景节点作为所述第一信息对应的类目。

可选的，所述训练后的统计模型的训练特征包括输入信息的分词结果；

所述方法还包括：对所述第一信息进行分词，得到第一信息的分词结果；

根据所述统计模型计算所述第一信息的情感指数，包括：将所述第一信息的分词结果输入到所述统计模型，得到所述第一信息的情感指数。

可选的，所述输入信息的分词结果为对所述输入信息中每两个相邻字符进行分词所得到的分词结果；

所述对所述第一信息进行分词，包括：对所述第一信息中每两个相邻字符进行分词。

可选的，所述训练后的统计模型的训练特征还包括上下文的情感特征；

所述方法还包括：提取所述第一信息的上下文的情感特征；

将所述第一信息的分词结果输入到所述统计模型，得到所述第一信息的情感指数，包括：将所述第一信息的分词结果和所述第一信息的上下文的情感特征，输入到所述统计模型，得到所述第一信息的情感指数。

可选的，所述上下文的情感特征包括以下任一项或者多项：

前一句的情感指数、前一句与当前句的主题相似度，上文的整体情感分布、以及上文中的至少一条相关句的情感分布，所述至少一条相关句与当前句的主题相似度大于第二阈值。

可选的，所述训练后的统计模型包括训练后的第一统计模型和第二统计模型，所述第一统计模型的训练特征包括输入信息的分词结果，所述第二统计模型的训练特征包括上下文的情感特征。

可选的，所述训练后的统计模型为训练后的最大熵模型。

可选的，所述方法还包括：

获取所述第一信息的词向量和所述第二信息的词向量；

计算所述第一信息的词向量与所述第二信息的词向量的匹配度，作为第二匹配度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度和所述第二匹配度，计算所述第一信息和所述第二信息的匹配度。

可选的，所述方法还包括：

获取所述标签类目树中多个标签节点之间的匹配度；

本申请还提供了一种信息匹配装置，包括：

信息获取单元，用于获取待匹配的商家订阅信息和用户评价信息；

类目树获取单元，用于标签类目树，所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目；

树枝获取单元，用于从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述用户评价信息的内容相匹配，所述第二树枝的最低层的标签节点与所述商家订阅信息的内容相匹配；

匹配度计算单元，用于至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度。

可选的，所述匹配度计算单元具体用于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度，至少根据所述第一匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度。

可选的，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度时，所述匹配度计算单元具体用于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，以及每层的权重值，计算第一匹配度。

可选的，还包括：

模型获取单元，用于获取训练后的统计模型；

情感计算单元，用于根据所述统计模型计算所述用户评价信息的情感指数；

近似度计算单元，用于计算所述用户评价信息的情感指数与目标情感指数的近似度；

所述匹配度计算单元具体用于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述用户评价信息和所述商家订阅信息的匹配度。

可选的，所述情感计算单元，还用于根据所述统计模型计算所述商家订阅信息的情感指数，所述商家订阅信息的情感指数作为所述目标情感指数。

可选的，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述用户评价信息和所述商家订阅信息的匹配度时，所述匹配度计算单元具体用于：

可选的，所述模型获取单元具体用于，获取所述用户评价信息对应的类目，获取所述类目对应的训练后的统计模型。

可选的，获取所述用户评价信息对应的类目时，所述模型获取单元具体用于：

可选的，还包括：词向量获取单元，用于获取所述用户评价信息的词向量和所述商家订阅信息的词向量；

匹配度计算单元，还用于计算所述用户评价信息的词向量与所述商家订阅信息的词向量的匹配度，作为第二匹配度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度时，匹配度计算单元具体用于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度和所述第二匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度。

可选的，还包括：

修正单元，用于获取所述标签类目树中多个标签节点之间的匹配度，根据所述多个标签节点之间的匹配度进行机器学习，根据机器学习的结果生成或者修正所述标签类目树。

本申请还提供了一种信息匹配装置，包括：

模型获取单元，用于获取训练后的统计模型；

匹配度计算单元，用于至少根据所述用户评价信息的情感指数与目标情感指数的近似度，计算所述用户评价信息和所述商家订阅信息的匹配度。

可选的，还包括：

匹配度获取单元，用于获取所述用户评价信息与所述商家评价信息的初始匹配度；

至少根据所述用户评价信息的情感指数与目标情感指数的近似度，计算所述用户评价信息和所述商家订阅信息的匹配度时，所述匹配度计算单元具体用于，至少根据所述近似度和所述初始匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度。

可选的，至少根据所述近似度和所述初始匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度时，所述匹配度计算单元具体用于：

可选的，模型获取单元具体用于，获取所述用户评价信息对应的类目，获取所述类目对应的训练后的统计模型。

可选的，情感计算单元还用于，根据所述统计模型计算所述商家订阅信息的情感指数，将所述商家订阅信息的情感指数作为所述目标情感指数。

本申请还提供了一种客户端，包括：

信息获取单元，用于获取用户输入的用户评价信息或者商家订阅信息；

发送单元，用于将所述用户评价信息或者商家订阅信息发送至计算单元，所述计算单元用于计算用户评价信息和商家订阅信息的匹配度。

本申请还提供了一种信息匹配装置，包括：

信息获取单元，用于获取待匹配的第一信息和第二信息；

树枝获取单元，用于从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述第一信息的内容相匹配，所述第二树枝的最低层的标签节点与所述第二信息的内容相匹配；

匹配度计算单元，用于至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度。

可选的，所述匹配度计算单元具体用于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度；至少根据所述第一匹配度，计算所述第一信息和所述第二信息的匹配度。

可选的，还包括：

模型获取单元，用于获取训练后的统计模型；

情感计算单元，用于根据所述统计模型计算所述第一信息的情感指数；

近似度计算单元，用于计算所述第一信息的情感指数与目标情感指数的近似度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度时，所述匹配度计算单元具体用于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述第一信息和所述第二信息的匹配度。

可选的，情感计算单元还用于，根据所述统计模型计算所述第二信息的情感指数，所述第二信息的情感指数作为所述目标情感指数。

可选的，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述第一信息和所述第二信息的匹配度时，所述匹配度计算单元具体用于：

可选的，模型获取单元具体用于，获取所述第一信息对应的类目，获取所述类目对应的训练后的统计模型。

可选的，获取所述第一信息对应的类目时，模型获取单元具体用于：

所述装置还包括：分词单元，用于对所述第一信息进行分词，得到第一信息的分词结果；

情感计算单元具体用于，将所述第一信息的分词结果输入到所述统计模型，得到所述第一信息的情感指数。

对所述第一信息进行分词时，分词单元具体用于，对所述第一信息中每两个相邻字符进行分词。

所述装置还包括：情感提取单元，用于提取所述第一信息的上下文的情感特征；

将所述第一信息的分词结果输入到所述统计模型，得到所述第一信息的情感指数时，情感计算单元具体用于，将所述第一信息的分词结果和所述第一信息的上下文的情感特征，输入到所述统计模型，得到所述第一信息的情感指数。

可选的，所述上下文的情感特征包括以下任一项或者多项：

可选的，所述训练后的统计模型为训练后的最大熵模型。

可选的，还包括：词向量获取单元，用于获取所述第一信息的词向量和所述第二信息的词向量；

匹配度计算单元，还用于计算所述第一信息的词向量与所述第二信息的词向量的匹配度，作为第二匹配度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度时，匹配度计算单元具体用于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度和所述第二匹配度，计算所述第一信息和所述第二信息的匹配度。

可选的，还包括：修正单元，用于获取所述标签类目树中多个标签节点之间的匹配度，根据所述多个标签节点之间的匹配度进行机器学习，根据机器学习的结果生成或者修正所述标签类目树。

通过上述技术方案可知，本申请实施例中在匹配第一信息和第二信息时，不再将第一信息和第二信息分词后直接匹配，而是从标签类目树中获取第一信息对应的第一树枝和第二信息对应的第二树枝。其中，第一树枝的最低层的标签节点与所述第一信息的内容相匹配，并且所述标签类目树中每个标签节点的父标签节点为该标签节点的父类目，因此所述第一树枝不仅包括与第一信息的内容相匹配的标签节点，还包括该相匹配的标签节点的逐层父类目，同样地，所述第二树枝不仅包括与第二信息的内容相匹配的标签节点，还包括该相匹配的标签节点的逐层父类目，因此，根据所述第一树枝与所述第二树枝在每层分别对应的匹配度计算出的第一信息和第二信息的匹配度，不仅能够反映第一信息和第二信息的匹配度，还能够反映第一信息和第二信息的逐层父类目的匹配度，相当于反映出第一信息和第二信息的逐层父类目之间的关联性，从而提高了匹配准确率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其它的附图。

图1为本申请提供的一种方法实施例的流程示意图；

图2为本申请提供的标签类目树的一种示意图；

图3为本申请提供的另一种方法实施例的流程示意图；

图4为本申请提供的场景类目树的一种示意图；

图5为本申请提供的另一种方法实施例的流程示意图；

图6为本申请提供的一种装置实施例的结构示意图；

图7为本申请提供的另一种装置实施例的结构示意图；

图8为本申请提供的另一种装置实施例的结构示意图；

图9为本申请提供的另一种装置实施例的结构示意图；

图10为本申请提供的另一种装置实施例的结构示意图；

图11为本申请提供的另一种装置实施例的结构示意图。

具体实施方式

评价信息指的是用户在网站、APP(应用程序)等网络平台输入的反馈信息。例如，买家在电子商务网站上购买了商品后，可以对该商品、商家提供的物流、服务等服务流程进行评价。商家通过输入商家订阅信息，能够提取出商家感兴趣的评价信息并推送给商家。具体过程包括：买家输入多条评价信息，商家输入商家订阅信息，将商家订阅信息与评价信息分别进行分词，判断两者是否存在相同的分词结果，根据相同的分词结果计算多条信息之间的匹配度。

显然，上述信息匹配方式只能判断出评价信息和商家订阅信息之间是否存在相同的分词结果，而无法反映两者之间是否存在关联性，例如无法判断出两者的父类目之间的关联性。举例说明，买家输入的评价信息为“服务不好”，而商家订阅信息为“客服态度”，虽然“服务不好”和“客服态度”的父类目都是服务，具有一定的关联性，但是按照上述信息匹配方式计算出的匹配度为0，显然匹配准确率较低，导致商家需要通过额外的算法获取具有关联性的评价信息，造成系统资源的浪费。

本申请实施例提供一种信息匹配方法及相关装置，使得计算出的匹配度能够反映信息之间的关联性，具体是反映多条信息的逐层父类目之间的关联性，从而提高匹配准确率。

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

请参阅图1，本申请实施例提供了信息匹配方法的一种方法实施例，本实施例的所述方法包括：

S101：获取待匹配的第一信息和第二信息。

其中，所述第一信息和/或所述第二信息可以是用户输入的词语、短句等信息。例如，所述第一信息可以为买家输入的用户评价信息，所述第二信息可以为商家输入的商家订阅信息。

S102：获取标签类目树。

本申请实施例中的所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目。

例如图2所示的标签类目树包括三层，第一层包括一个标签节点：“服务”，即所述标签类目树的根节点；第二层包括两个标签节点：“售前”和“售后”；第三层包括四个标签节点：“客服态度”、“响应速度”、“返现”和“保修”。其中，所述标签类目树按照逐层递增的顺序，对应的类目逐层细化，也就是说，每个标签节点的父标签节点是该标签节点的父类目。例如，“售前”是“客服态度”的父类目，“服务”是“售前”的父类目。

S103：从所述标签类目树中获取第一树枝和第二树枝。所述第一树枝和/或所述第二树枝包括至少一个标签节点。

其中，所述第一树枝的最低层的标签节点与所述第一信息的内容相匹配，由于所述标签类目树中每个标签节点的父标签节点为该标签节点的父类目。因此，若所述第一信息匹配的不是根节点，则所述第一树枝不仅包括与第一信息的内容相匹配的标签节点，还包括该相匹配的标签节点的逐层父类目。

所述第一树枝的获取过程可以包括：将所述第一信息与所述标签类目树中的各个节点进行匹配，获得匹配的标签节点，将该匹配的标签节点以及该匹配的标签节点的逐层父节点作为所述第一树枝。其中，在与所述标签类目树匹配之前，可以将所述第一信息进行分词，将分词结果与所述标签类目树进行匹配。

例如，所述第一信息为：“服务不好”，将第一信息分词后得到分词结果“服务”和“不好”，将分词结果“服务”和“不好”与标签类目树中的各个节点进行匹配，获得匹配的标签节点“服务”，由于该标签节点“服务”是根节点，没有父节点，则将“服务”作为第一树枝。又例如，所述第一信息为：“客服态度不好”，根据上述类似的方式获得匹配的标签节点“客服态度”，将“客服态度”以及“客服态度”的逐层父节点：“售前”和“服务”作为第一树枝。

同样的，所述第二树枝的最低层的标签节点与所述第二信息的内容相匹配。若所述第二信息匹配的不是根节点，则所述第二树枝不仅包括与第二信息的内容相匹配的标签节点，还包括该相匹配的标签节点的逐层父类目。所述第二树枝的获取过程与所述第一信息的获取过程类似，可以包括：将所述第二信息与所述标签类目树中的各个节点进行匹配，获得匹配的节点，将该匹配的节点以及该匹配的节点的逐层父节点作为所述第二树枝。其中，在与所述标签类目树匹配之前，可以将所述第二信息进行分词，将分词结果与所述标签类目树进行匹配。

S104：至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度。

具体地，本步骤可以包括：所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度；至少根据所述第一匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度。本申请实施例中可以直接将所述第一匹配度作为第一信息和第二信息的匹配度，也可以根据第一匹配度，并结合其他参数计算第一信息和第二信息的匹配度。

由于所述第一树枝包括至少一层标签节点，所述第二树枝包括至少一层标签节点，将所述第一树枝和所述第二树枝每层对应的标签节点进行匹配，获得每层分别对应的匹配度，并根据每层分别对应的匹配度计算所述第一信息和所述第二信息的匹配度。

例如，所述第一树枝依次包括：“服务”，所述第二树枝依次包括：“服务”、“售前”，第一层的匹配度为100％，第二层的匹配度为0，根据这两层的匹配度计算出第一匹配度。例如将这两层的匹配度之和的1/2作为所述第一信息和所述第二信息的匹配度，上述例子中计算出的匹配度为50％。又例如，所述第一树枝依次包括：“服务”、“售前”、“客服态度”，所述第二树枝依次包括：“服务”、“售前”、“响应速度”，将这三层的匹配度之和的1/3作为所述第一信息和所述第二信息的匹配度，计算出的匹配度为67％。

其中在根据每层分别对应的匹配度计算第一匹配度时，还可以考虑每层的权重值，例如，所述第一匹配度Tagsim为：

其中，w_i为第i层的权重值，P_i为所述第一树枝与所述第二树枝在第i层对应的匹配度，P_i＝100％时函数I等于1，P_i≠100％时，函数I等于0。其中，各层的权重值可以全部等于1，或者也可以逐层递增，权重值可以通过机器学习的方式进行设置和/或调整。需要说明的是，上述公式仅是第一匹配度的一种可选的计算方式，本领域技术人员可以对上述公式进行扩展和变形，例如P_i＝100％时函数I可以等于其他数值，或者函数I也可以在满足其他条件时，例如大于一定的数值时等于1，本申请实施例对此不加以限定。

通过上述技术方案可知，本申请实施例中在匹配第一信息和第二信息时，不再将第一信息和第二信息分词后直接匹配，而是从标签类目树中获取第一信息对应的第一树枝和第二信息对应的第二树枝。其中，所述第一树枝不仅包括与第一信息的内容相匹配的标签节点，还包括该相匹配的标签节点的逐层父类目，同样地，所述第二树枝不仅包括与第二信息的内容相匹配的标签节点，还包括该相匹配的标签节点的逐层父类目，因此，根据所述第一树枝与所述第二树枝在每层分别对应的匹配度计算出的第一信息和第二信息的匹配度，不仅能够反映第一信息和第二信息的匹配度，还能够反映第一信息和第二信息的逐层父类目的匹配度，相当于反映出第一信息和第二信息的逐层父类目之间的关联性，从而提高了匹配准确率。

可见，本申请实施例实际上相当于对第一信息和第二信息加上了至少一层的类目标签，根据对应层的类目标签的匹配度计算第一信息和第二信息的匹配度。因此，应用本申请实施例能够计算出所属类目具有一定关联性的信息之间的匹配度，例如，同义词之间的匹配度，属于同一类目的多条信息之间的匹配度等等。

举例说明，买家输入的评价信息为“服务不好”，而商家订阅信息为“客服态度”，虽然“服务不好”和“客服态度”都是在描述服务，具有一定的关联性，然而将两者直接匹配时，匹配度为0，匹配准确率较低。而通过本申请实施例计算两者匹配度时，所述第一树枝依次包括：“服务”，所述第二树枝依次包括：“服务”、“售前”，第一层的匹配度为100％，第二层的匹配度为0，最终计算出的匹配度可以为50％。可见，本申请实施例中计算的匹配度能够反映这两者之间的关联性，因此提高了匹配准确率。

需要说明的是，本申请实施例中，除了用户评价信息和商家订阅信息之外，所述第一信息和所述第二信息也可以为其他应用场景下的信息。例如，所述第一信息为用户在微信群、钉钉群中输入的聊天信息，所述第二信息为特定订阅信息，例如群管理员输入的订阅词或者订阅短语等等，本申请实施例中对此并不加以限定。下面通过一个具体例子加以说明。

对于一个电影兴趣小组的微信群，标签类目树包括两层，第一层包括一个标签节点：“电影”，第二层包括两个标签节点：“喜剧”和“动作剧”。其中，所述标签类目树按照逐层递增的顺序，对应的类目逐层细化，也就是说，每个标签节点的父标签节点是该标签节点的父类目。例如，“电影”是“喜剧”和“动作剧”的父类目。若群管理员输入的订阅词为：“电影”，用户输入的聊天信息为：“我喜欢看喜剧”，将两者直接匹配时，匹配度为0，匹配准确率较低。而通过本申请实施例计算两者匹配度时，所述第一树枝依次包括：“电影”、“喜剧”，所述第二树枝包括：“电影”，最终计算出的匹配度可以为50％，提高了匹配准确率。

需要说明的是，若所述第一信息和/或所述第二信息从所述标签类目树中匹配到多条树枝，则可以从所述第一信息匹配的树枝中选取一个树枝，从所述第二信息匹配的树枝中选取一个树枝，计算两两树枝之间的匹配度，将计算出的最高的匹配度作为所述第一信息和所述第二信息的匹配度。

背景技术中描述的信息匹配方式，由于只判断是否存在相同的分词结果，因此无法计算出同义词之间的匹配度，进一步导致匹配准确率较低。为了解决这一问题，还提出了一种基于word embedding(中文：词向量)技术的信息匹配方式，通过word2vec(一种处理文本的双层神经网络)等方法计算出信息的词向量，根据词向量之间的相似性计算匹配度。因此本申请实施例在计算第一信息和第二信息的匹配度时，还可以结合第一信息和第二信息的词向量之间的相似性。下面具体说明。

所述方法还可以包括：获取所述第一信息的词向量和所述第二信息的词向量；计算所述第一信息的词向量与所述第二信息的词向量的匹配度，作为第二匹配度；S104中至少根据所述第一匹配度，即所述第一树枝与所述第二树枝在每层分别对应的匹配度，和所述第二匹配度，计算所述第一信息和所述第二信息的匹配度。

具体实现时，可以将所述第一信息分词后，提取每个词的词向量，将各个词的词向量相加得到第一信息的词向量，按照类似的方式可以获得第二信息的词向量，通过计算余弦相似度等方式计算第一信息的词向量与第二信息的词向量的匹配度。其中，词向量可以为利用word2vec等技术所提取的词向量。

在根据第一匹配度和第二匹配度计算第一信息和第二信息的匹配度时，可以将第一匹配度和第二匹配度之和作为最终的匹配度，同时也可以设置相应的权重值。例如，第一信息和第二信息的匹配度sim可以为：sim＝λ₁Vecsim+λ₁Tagsim，其中， Tagsim为第一匹配度，Vecsim为第二匹配度，λ₁和λ₂为对应的权重值，该权重值可以通过机器学习的方式进行设置和/或调整。

其中，word embedding技术的原理就是利用机器学习技术对大量的信息进行学习，从而将词语通过对应的词向量表示，而词向量实际上表示的是词语所处的语境，但是在一些情况下根据词向量计算出的匹配度会存在准确率较低的问题。例如一种情况，有些词语的语境虽然相同，但是语义却有较大差别，因此词向量在很多情况下并不能准确地表示词语的语义。例如，“好”和“坏”的语义相反，但是词向量之间的余弦相似度却很高。例如另一种情况，相同词语在不同环境下所表达的含义不同。例如，“很薄”在描述手机时就是正面词，而在描述羽绒服时就是负面词，而通过词向量这种方式计算出的匹配度都是相同的。此外，由于很难证明词向量中的数值分别对应的含义，因此无法对词向量本身进行调整以解决上述问题。

为了解决上述问题，本申请实施例还可以根据统计模型计算信息的情感指数，该情感指数可以指示出该信息是正面词、负面词还是中性词，并且在计算最终的匹配度时考虑情感指数。

具体地，如图3所示，本申请实施例的所述方法还可以包括：

S301：获取训练后的统计模型。

其中，所述统计模型可以根据对大量的训练数据训练得到，每个训练数据都标记了对应的情感指数。例如，训练数据为20万条语句，每条语句都标记了对应的情感指数。

可选的，统计模型可以为最大熵模型等任一种数学模型。经过发明人大量的实验发现，采用最大熵模型时，能够使得计算出的情感指数更贴合语义，从而能够提高信息匹配的准确率。

S302：根据所述统计模型计算所述第一信息的情感指数。

将第一信息输入到训练后的统计模型，能够获得第一信息的情感指数。其中，根据情感指数所位于的区间，能够指示出第一信息对应的情感分别为正面、负面还是中性。

S303：计算所述第一信息的情感指数与目标情感指数的近似度。

在本申请实施例中，目标情感指数可以是预设的情感指数，也可以根据第二信息计算得出。例如，根据所述统计模型计算所述第二信息的情感指数，所述第二信息的情感指数作为所述目标情感指数。目标情感指数能够指示出目标情感为正面、负面还是中性。

其中，所述近似度可以表现为差值或者占比等任一种形式，或者也可以根据所述第一信息的情感指数和所述目标情感指数指示的情感是否相同计算，例如，若所述第一信息的情感指数和所述目标情感指数指示的情感均为负面，则表示两者的近似度较高。

S104中至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述第一信息和所述第二信息的匹配度。

本实施例中，在计算第一信息和第二信息的匹配度时，还考虑了第一信息的情感指数和目标情感指数的近似度，并且该近似度越大时，也就是说第一信息的情感与目标情感越接近时，计算出的匹配度越高，反之则越低，从而能够解决语境相同但是语义差别很大时造成的匹配准确率低的问题。例如对于“大”和“小”，由于情感相差很大，因此计算出的匹配度也就越低，与语义相符，从而提高了匹配准确率。

因此在本实施例中，假设商家关心的是用户评价信息中的负面评价信息，因此，可以预设目标情感指数为负面对应的情感指数，若用户评价信息与目标情感指数比较接近时，则最终计算出的匹配度较高，从而根据这种方式提取出商家关心的负面评价信息。

在具体计算匹配度时，可以采用以下方式：

若所述近似度大于或等于第一阈值，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度计算所述第一信息和所述第二信息的匹配度。例如所述第一信息的情感指数和所述目标情感指数指示的情感均为负面，sim＝Tagsim，其中sim为第一信息和第二信息的匹配度，Tagsim为第一匹配度。

若所述近似度小于所述第一阈值，所述第一信息和所述第二信息的匹配度为0。例如所述第一信息的情感指数和所述目标情感指数指示的情感不同，sim＝0。此时所述第一信息和所述第二信息的匹配度还可以为其他较低的数值，本申请实施例对此不做限定。

本申请实施例中，针对相同词语在不同环境下所表达的含义不同，还可以设置多个类目分别对应的统计模型，每个统计模型能够计算出在该类目下，第一信息的情感指数。不同的统计模型根据不同的场景类目对应的训练数据训练得到，例如对于同一语句，在不同场景类目下标记的情感指数不同，从而使得不同的统计模型计算出的情感指数与场景类目对应。

具体地，获取训练后的统计模型可以包括：获取所述第一信息对应的类目，获取所述类目对应的训练后的统计模型。其中，所述第一信息对应的类目，可以指的是所述第一信息的评价对象所属的类目，举例说明，买家在电子商务网站上购买了服装类的商品，并输入了用户评价信息用于评价该服装类的商品，即该用户评价信息所对应的类目为服装类。

其中，可以通过场景类目树的方式获取所述第一信息对应的类目。具体地，获取所述第一信息对应的类目包括：获取场景类目树，所述场景类目树包括至少两层，每层包括至少一个场景节点，每个场景节点的父场景节点为该场景节点的父类目；从所述场景类目树中获取与所述第一信息匹配的场景节点，确定出所述匹配的场景节点对应的上一级或多级父场景节点，将所述上一级或多级父场景节点作为所述第一信息对应的类目。其中，上一级或多级父场景节点可以指的是根场景节点，即直接获取根场景节点作为对应的类目。

举例说明，买家在电子商务网站上购买了裙子，并输入了用户评价信息用于评价该裙子，因此从场景类目树中获取到匹配的场景节点：裙子，确定出该场景节点对应的根场景节点：服装类，获取服装类对应的训练后的统计模型，利用该统计模型计算第一信息的情感指数。因此，本实施例在计算“很薄”的情感指数时，根据“很薄”对应的场景类目具体是手机还是服装类，选取对应的统计模型，从而根据场景类目计算出“很薄”的情感指数，提高了信息匹配的准确率。

可选的，本实施例中的统计模型的训练特征包括输入信息的分词结果；

所述方法还包括：对所述第一信息进行分词，得到第一信息的分词结果；根据所述统计模型计算所述第一信息的情感指数，包括：将所述第一信息的分词结果输入到所述统计模型，得到所述第一信息的情感指数。

经过发明人大量的实验表明，在进行分词时，可以基于bigram模式进行分词，也就是对所述第一信息中每两个相邻字符进行分词，得到第一信息的分词结果。例如：“服务不好”的分词结果为“服务”、“务不”和“不好”。基于该方式进行分词能够获得较高的信息匹配的准确率。

除了分词结果之外，统计模型的训练特征还可以包括上下文的情感特征，从而能够综合词语本身和上下文信息对情感指数进行计算。具体地，所述方法还包括：提取所述第一信息的上下文的情感特征；将所述第一信息的分词结果输入到所述统计模型，得到所述第一信息的情感指数，包括：将所述第一信息的分词结果和所述第一信息的上下文的情感特征，输入到所述统计模型，得到所述第一信息的情感指数。

其中，所述上下文的情感特征包括以下任一项或者多项：

前一句的情感指数、前一句与当前句的主题相似度，上文的整体情感分布、以及上文中的至少一条相关句的情感分布，所述至少一条相关句与当前句的主题相似度大于第二阈值。下面分别说明。前一句的情感指数可以指示前一句的情感是正面、负面还是中性；前一句与当前句的主题相似度能够表示前一句和当前句描述的是否是相同或相似主题；上文的整体情感分布可以指的是上文中，情感分别为正面、负面和中性的语句的数量；相关句用于表示与当前句描述相同或相似主题的句子，而上文中的至少一条相关句的情感分布可以指的是上文描述相同或相似主题的句子中，分别为正面、负面和中性的语句的数量。

本申请实施例具体可以采用两个统计模型计算第一信息的情感指数。也就是说，所述训练后的统计模型包括训练后的第一统计模型和第二统计模型，所述第一统计模型的训练特征包括输入信息的分词结果，所述第二统计模型的训练特征包括上下文的情感特征。

下面以电子商务网站对应的场景为例，描述本申请提供的一种具体实施例。

请参阅图5，本申请实施例提供了信息匹配方法的另一种方法实施例，本实施例的所述方法包括：

S501：获取买家输入的用户评价信息和商家输入的商家订阅信息。其中，买家输入的用户评价信息用于评价买家购买的裙子，即评价对象为裙子。

例如，该用户评价为“响应速度慢”，商家订阅信息为“客服态度”

S502：获取如图2所示的标签类目树。其中，可以通过手动添加等方式对本申请实施例中的标签类目树进行修改。

S503：从所述标签类目树中获取第一树枝和第二树枝。所述第一树枝的最低层的标签节点与所述用户评价信息匹配，具体包括：服务、售前、响应速度；所述第二树枝的最低层的标签节点与所述商家订阅信息匹配，具体包括：服务、售前、客服态度。

S503：至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度。

例如，所述第一匹配度的计算公式为：

其中，w_i为第i层的权重值，P_i为所述第一树枝与所述第二树枝在第i层对应的匹配度，P_i＝100％时函数I等于1，P_i≠100％时，函数I等于0。

S504：分别获取用户评价信息的词向量和商家订阅信息的词向量，计算词向量的匹配度，作为第二匹配度。

S505：获取如图4所示的场景类目树。其中，可以通过手动添加等方式对本申请实施例中的场景类目树进行修改。

S506：从场景类目树中获取与所述评价对象匹配的场景节点：裙子，确定出该场景节点对应的根场景节点：服装类。

S507：获取服装类对应的训练后的最大熵模型A和最大熵模型B。该最大熵模型A的训练特征包括基于bigram模式的分词结果，该最大熵模型B的训练特征包括上下文的情感特征。

S508：对用户评价信息基于bigram模式进行分词，将分词结果输入到最大熵模型A，得到用户评价信息的情感指数。

S509：提取用户评价信息的上下文的情感特征，将该上下文的情感特征和S508中得到的情感指数输入到最大熵模型B，得到修正后的情感指数。

其中，如表1所示，所述上下文的情感特征包括以下多项：

前一句的情感指数(分别为正面、负面还是中性，以及相应的强度)、前一句和当前句描述的是否是相同主题、上文中情感分别为正面、负面和中性的语句的数量、以及上文描述相同主题的句子中，分别为正面、负面和中性的语句的数量。

表1

S510：根据修正后的情感指数、第一匹配度和第二匹配度计算用户评价信息和商家订阅信息的匹配度。

其中，目标情感为负面，若S509中得到的修正后的情感指数指示的情感不为负面，则匹配度为0。

若S509中得到的修正后的情感指数指示的情感为负面，则匹配度为：

sim＝λ₁Vecsim+λ₁Tagsim

Tagsim为S503中计算出的第一匹配度，Vecsim为S504中计算出的第二匹配度，λ₁和λ₂为对应的权重值。

请参阅图6，本申请实施例还提供了信息匹配方法的另一种实施例。本实施例的所述方法包括：

S601：获取待匹配的第一信息和第二信息。

S602：获取训练后的统计模型。

S603：根据所述统计模型计算所述第一信息的情感指数。

S604：至少根据所述第一信息的情感指数与目标情感指数的近似度，计算所述第一信息和第二信息的匹配度。

可选的，所述方法还包括：获取所述第一信息与所述第二信息的初始匹配度；步骤S604包括：至少根据所述近似度和所述初始匹配度，计算所述第一信息和所述第二信息的匹配度。

其中，所述初始匹配度可以是上述实施例中的所述第一匹配度，即所述第一树枝与所述第二树枝在每层分别对应的匹配度。

可选的，至少根据所述近似度和所述初始匹配度，计算所述第一信息和所述第二信息的匹配度，包括：

若所述近似度大于或等于第一阈值，至少根据所述初始匹配度计算所述第一信息和所述第二信息的匹配度；

可选的，获取训练后的统计模型，包括：

获取所述第一信息对应的类目；获取所述类目对应的训练后的统计模型。

可选的，获取所述第一信息对应的类目，包括：

可选的，所述方法还包括：

根据所述统计模型计算所述第二信息的情感指数，将所述第二信息的情感指数作为所述目标情感指数。

本实施例的相关内容请参阅图1、3、5所示实施例中的相关描述，这里不再赘述。

请参阅图7，本申请还提供了信息输入方法的一种实施例。本实施例的所述方法包括：

S701：客户端获取第一信息或者第二信息。

S702：所述客户端将所述第一信息或者第二信息发送至计算单元，所述计算单元用于计算第一信息和第二信息的匹配度。

其中，计算单元可以采用上述信息匹配方法的任一种实施例，计算第一信息和第二信息的匹配度。本实施例的相关内容请参阅图1、3、5所示实施例中的相关描述，这里不再赘述。

对应上述方法实施例，本申请还提供了相应的装置实施例，下面具体说明。

请参阅图8，本申请实施例提供了信息匹配装置的一种装置实施例。本实施例的所述装置包括：

信息获取单元801，用于获取待匹配的商家订阅信息和用户评价信息。

类目树获取单元802，用于标签类目树，所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目。

树枝获取单元803，用于从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述用户评价信息的内容相匹配，所述第二树枝的最低层的标签节点与所述商家订阅信息的内容相匹配。

匹配度计算单元804，用于至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度。

可选的，还包括：

模型获取单元，用于获取训练后的统计模型；

可选的，还包括：

请参阅图9，本申请实施例提供了信息匹配装置的另一种装置实施例。本实施例的所述装置包括：

信息获取单元901，用于获取待匹配的商家订阅信息和用户评价信息；

模型获取单元902，用于获取训练后的统计模型；

情感计算单元903，用于根据所述统计模型计算所述用户评价信息的情感指数；

匹配度计算单元904，用于至少根据所述用户评价信息的情感指数与目标情感指数的近似度，计算所述用户评价信息和所述商家订阅信息的匹配度。

可选的，还包括：

请参阅图10，本申请实施例提供了客户端的一种装置实施例。本实施例的所述装置包括：

信息获取单元1001，用于获取用户输入的用户评价信息或者商家订阅信息；

发送单元1002，用于将所述用户评价信息或者商家订阅信息发送至计算单元，所述计算单元用于计算用户评价信息和商家订阅信息的匹配度。

请参阅图11，本申请实施例提供了信息匹配装置的另一种装置实施例。本实施例的所述装置包括：

信息获取单元1101，用于获取待匹配的第一信息和第二信息；

类目树获取单元1102，用于标签类目树，所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目；

树枝获取单元1103，用于从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述第一信息的内容相匹配，所述第二树枝的最低层的标签节点与所述第二信息的内容相匹配；

匹配度计算单元1104，用于至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度。

可选的，还包括：

模型获取单元，用于获取训练后的统计模型；

可选的，所述上下文的情感特征包括以下任一项或者多项：

可选的，所述训练后的统计模型为训练后的最大熵模型。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种信息匹配方法，其特征在于，包括：

获取待匹配的商家订阅信息和用户评价信息；

获取标签类目树，所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目；

从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述用户评价信息的内容相匹配，所述第二树枝的最低层的标签节点与所述商家订阅信息的内容相匹配；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度。
根据权利要求1所述的方法，其特征在于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度；

至少根据所述第一匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度。
根据权利要求2所述的方法，其特征在于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，以及每层的权重值，计算第一匹配度。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取训练后的统计模型；

根据所述统计模型计算所述用户评价信息的情感指数；

计算所述用户评价信息的情感指数与目标情感指数的近似度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述用户评价信息和所述商家订阅信息的匹配度。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

根据所述统计模型计算所述商家订阅信息的情感指数，所述商家订阅信息的情感指数作为所述目标情感指数。
根据权利要求4所述的方法，其特征在于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述用户评价信息和所述商家订阅信息的匹配度，包括：

若所述近似度大于或等于第一阈值，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度计算所述用户评价信息和所述商家订阅信息的匹配度；

若所述近似度小于所述第一阈值，所述用户评价信息和所述商家订阅信息的匹配度为0。
根据权利要求4所述的方法，其特征在于，获取训练后的统计模型，包括：

获取所述用户评价信息对应的类目；

获取所述类目对应的训练后的统计模型。
根据权利要求7所述方法，其特征在于，获取所述用户评价信息对应的类目，包括：

获取场景类目树，所述场景类目树包括至少两层，每层包括至少一个场景节点，每个场景节点的父场景节点为该场景节点的父类目；

从所述场景类目树中获取与所述用户评价信息匹配的场景节点，确定出所述匹配的场景节点对应的上一级或多级父场景节点，将所述上一级或多级父场景节点作为所述用户评价信息对应的类目。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取所述用户评价信息的词向量和所述商家订阅信息的词向量；

计算所述用户评价信息的词向量与所述商家订阅信息的词向量的匹配度，作为第二匹配度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度和所述第二匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取所述标签类目树中多个标签节点之间的匹配度；

根据所述多个标签节点之间的匹配度进行机器学习，根据机器学习的结果生成或者修正所述标签类目树。
一种信息匹配方法，其特征在于，包括：

获取待匹配的商家订阅信息和用户评价信息；

获取训练后的统计模型；

根据所述统计模型计算所述用户评价信息的情感指数；

至少根据所述用户评价信息的情感指数与目标情感指数的近似度，计算所述用户评价信息和所述商家订阅信息的匹配度。
根据权利要求11所述的方法，其特征在于，所述方法还包括：

获取所述用户评价信息与所述商家评价信息的初始匹配度；

至少根据所述用户评价信息的情感指数与目标情感指数的近似度，计算所述用户评价信息和所述商家订阅信息的匹配度，包括：

至少根据所述近似度和所述初始匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度。
根据权利要求12所述的方法，其特征在于，至少根据所述近似度和所述初始匹配度，计算所述用户评价信息和所述商家订阅信息的匹配度，包括：

若所述近似度大于或等于第一阈值，至少根据所述初始匹配度计算所述用户评价信息和所述商家订阅信息的匹配度；

若所述近似度小于所述第一阈值，所述用户评价信息和所述商家订阅信息的匹配度为0。
根据权利要求11所述的方法，其特征在于，获取训练后的统计模型，包括：

获取所述用户评价信息对应的类目；

获取所述类目对应的训练后的统计模型。
根据权利要求14所述的方法，其特征在于，获取所述用户评价信息对应的类目，包括：

获取场景类目树，所述场景类目树包括至少两层，每层包括至少一个场景节点，每个场景节点的父场景节点为该场景节点的父类目；

从所述场景类目树中获取与所述用户评价信息匹配的场景节点，确定出所述匹配的场景节点对应的上一级或多级父场景节点，将所述上一级或多级父场景节点作为所述用户评价信息对应的类目。
根据权利要求11所述的方法，其特征在于，所述方法还包括：

根据所述统计模型计算所述商家订阅信息的情感指数，将所述商家订阅信息的情感指数作为所述目标情感指数。
一种信息输入方法，其特征在于，包括：

客户端获取用户输入的用户评价信息或者商家订阅信息；

所述客户端将所述用户评价信息或者商家订阅信息发送至计算单元，所述计算单元用于计算用户评价信息和商家订阅信息的匹配度。
一种信息匹配方法，其特征在于，包括：

获取待匹配的第一信息和第二信息；

获取标签类目树，所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目；

从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述第一信息的内容相匹配，所述第二树枝的最低层的标签节点与所述第二信息的内容相匹配；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度。
根据权利要求18所述的方法，其特征在于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度；

至少根据所述第一匹配度，计算所述第一信息和所述第二信息的匹配度。
根据权利要求19所述的方法，其特征在于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算第一匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，以及每层的权重值，计算第一匹配度。
根据权利要求18所述的方法，其特征在于，所述方法还包括：

获取训练后的统计模型；

根据所述统计模型计算所述第一信息的情感指数；

计算所述第一信息的情感指数与目标情感指数的近似度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述第一信息和所述第二信息的匹配度。
根据权利要求21所述的方法，其特征在于，所述方法还包括：

根据所述统计模型计算所述第二信息的情感指数，所述第二信息的情感指数作为所述目标情感指数。
根据权利要求21所述的方法，其特征在于，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度以及所述近似度，计算所述第一信息和所述第二信息的匹配度，包括：

若所述近似度大于或等于第一阈值，至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度计算所述第一信息和所述第二信息的匹配度；

若所述近似度小于所述第一阈值，所述第一信息和所述第二信息的匹配度为0。
根据权利要求21所述的方法，其特征在于，获取训练后的统计模型，包括：

获取所述第一信息对应的类目；

获取所述类目对应的训练后的统计模型。
根据权利要求24所述方法，其特征在于，获取所述第一信息对应的类目，包括：

获取场景类目树，所述场景类目树包括至少两层，每层包括至少一个场景节点，每个场景节点的父场景节点为该场景节点的父类目；

从所述场景类目树中获取与所述第一信息匹配的场景节点，确定出所述匹配的场景节点对应的上一级或多级父场景节点，将所述上一级或多级父场景节点作为所述第一信息对应的类目。
根据权利要求21所述的方法，其特征在于，所述训练后的统计模型的训练特征包括输入信息的分词结果；

所述方法还包括：对所述第一信息进行分词，得到第一信息的分词结果；

根据所述统计模型计算所述第一信息的情感指数，包括：将所述第一信息的分词结果输入到所述统计模型，得到所述第一信息的情感指数。
根据权利要求26所述的方法，其特征在于，所述输入信息的分词结果为对所述输入信息中每两个相邻字符进行分词所得到的分词结果；

所述对所述第一信息进行分词，包括：对所述第一信息中每两个相邻字符进行分词。
根据权利要求26所述的方法，其特征在于，所述训练后的统计模型的训练特征还包括上下文的情感特征；

所述方法还包括：提取所述第一信息的上下文的情感特征；

将所述第一信息的分词结果输入到所述统计模型，得到所述第一信息的情感指数，包括：将所述第一信息的分词结果和所述第一信息的上下文的情感特征，输入到所述统计模型，得到所述第一信息的情感指数。
根据权利要求28所述的方法，其特征在于，所述上下文的情感特征包括以下任一项或者多项：

前一句的情感指数、前一句与当前句的主题相似度，上文的整体情感分布、以及上文中的至少一条相关句的情感分布，所述至少一条相关句与当前句的主题相似度大于第二阈值。
根据权利要求28所述的方法，其特征在于，所述训练后的统计模型包括训练后的第一统计模型和第二统计模型，所述第一统计模型的训练特征包括输入信息的分词结果，所述第二统计模型的训练特征包括上下文的情感特征。
根据权利要求21至30任一项所述的方法，其特征在于，所述训练后的统计模型为训练后的最大熵模型。
根据权利要求18所述的方法，其特征在于，所述方法还包括：

获取所述第一信息的词向量和所述第二信息的词向量；

计算所述第一信息的词向量与所述第二信息的词向量的匹配度，作为第二匹配度；

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度，包括：

至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度和所述第二匹配度，计算所述第一信息和所述第二信息的匹配度。
根据权利要求18所述的方法，其特征在于，所述方法还包括：

获取所述标签类目树中多个标签节点之间的匹配度；

根据所述多个标签节点之间的匹配度进行机器学习，根据机器学习的结果生成或者修正所述标签类目树。
一种信息匹配装置，其特征在于，包括：

信息获取单元，用于获取待匹配的商家订阅信息和用户评价信息；

类目树获取单元，用于标签类目树，所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目；

树枝获取单元，用于从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述用户评价信息的内容相匹配，所述第二树枝的最低层的标签节点与所述商家订阅信息的内容相匹配；

匹配度计算单元，用于至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述商家订阅信息和所述用户评价信息的匹配度。
一种信息匹配装置，其特征在于，包括：

信息获取单元，用于获取待匹配的商家订阅信息和用户评价信息；

模型获取单元，用于获取训练后的统计模型；

情感计算单元，用于根据所述统计模型计算所述用户评价信息的情感指数；

匹配度计算单元，用于至少根据所述用户评价信息的情感指数与目标情感指数的近似度，计算所述用户评价信息和所述商家订阅信息的匹配度。
一种客户端，其特征在于，包括：

信息获取单元，用于获取用户输入的用户评价信息或者商家订阅信息；

发送单元，用于将所述用户评价信息或者商家订阅信息发送至计算单元，所述计算单元用于计算用户评价信息和商家订阅信息的匹配度。
一种信息匹配装置，其特征在于，包括：

信息获取单元，用于获取待匹配的第一信息和第二信息；

类目树获取单元，用于标签类目树，所述标签类目树包括至少两层，每层包括至少一个标签节点，每个标签节点的父标签节点为该标签节点的父类目；

树枝获取单元，用于从所述标签类目树中获取第一树枝和第二树枝，所述第一树枝的最低层的标签节点与所述第一信息的内容相匹配，所述第二树枝的最低层的标签节点与所述第二信息的内容相匹配；

计算单元，用于至少根据所述第一树枝与所述第二树枝在每层分别对应的匹配度，计算所述第一信息和所述第二信息的匹配度。