CN105446988A

CN105446988A - 预测类别的方法和装置

Info

Publication number: CN105446988A
Application number: CN201410310442.6A
Authority: CN
Inventors: 钱剑锋; 赫彩凤; 范伟
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2014-06-30
Filing date: 2014-06-30
Publication date: 2016-03-30
Anticipated expiration: 2034-06-30
Also published as: CN105446988B

Abstract

本发明实施例提供了一种预测类别的方法和装置，该方法包括：确定多个第一预测模型，其中，多个第一预测模型中的每个第一预测模型用于将实例分成多个组，多个组中的每个组对应多个标签类别中的一个标签类别，标签类别包含至少一个标签；根据多个第一预测模型中的标签之间的相互关系将多个第一预测模型合并为第二预测模型，其中，第二预测模型用于对实例进行分类得到多个组，第二预测模型的多个组中的每个组对应多个多标签类别中的一个多标签类别，多标签类别包含多个标签；根据第二预测模型确定当前的实例属于多个多标签类别中的每个多标签类别的概率，以预测当前的实例的类别，计算简便。

Description

预测类别的方法和装置

技术领域

本发明涉及数据挖掘领域，特别涉及一种预测类别的方法和装置。

背景技术

预测是数据挖掘中应用领域极其广泛的重要技术之一,预测是通过对样本数据(历史数据)的输入值和输出值关联性的学习，得到预测模型，再利用该模型对未来的输入值进行输出值预测。预测包括分类和回归，分类是根据数据集的特点构造一个分类器,利用该分类器对未知类别的对象赋予类别的一种技术，回归是为了了解两个或多个变量间是否相关、相关方向与强度，并建立数学模型以便观察特定变量来预测研究者感兴趣的变量一种技术。

现有的预测算法中，采用一种多类预测合并算法(multiclasspredictioncombinationalgorithms)，该多类预测合并算法采用通过多个预测模型对实例进行分别预测，在结合各个预测结果给出最后的预测的一种算法。该算法中，需要采用多个预测模型对预测的对象分别预测，计算量较大。

发明内容

本发明实施例提供一种预测算法和装置，能够减小计算量。

第一方面，提供了一种预测类别的方法，包括：确定多个第一预测模型，其中，所述多个第一预测模型中的每个第一预测模型用于将实例分成多个组，所述多个组中的每个组对应多个标签类别中的一个标签类别，所述标签类别包含至少一个标签；根据所述多个第一预测模型中的标签之间的相互关系将所述多个第一预测模型合并为第二预测模型，其中，所述第二预测模型用于对实例进行分类得到多个组，所述第二预测模型的多个组中的每个组对应多个多标签类别中的一个多标签类别，所述多标签类别包含多个标签；根据所述第二预测模型确定当前的实例属于所述多个多标签类别中的每个多标签类别的概率，以预测所述当前的实例的类别。

结合第一方面，在第一种可能的实现方式中，该方法还包括：确定所述当前的实例的类别具有不确定性，其中所述当前的实例的类别具有不确定性表示根据所述第二预测模型无法预测所述当前的实例的类别；获取标注的所述当前的实例的类别；根据所述标注的所述当前的实例的类别，对所述第二预测模型进行训练，以便于根据训练后的第二预测模型对待预测的实例的类别进行预测。

结合第一种可能的实现方式，在第二种可能的实现方式中，所述确定所述当前的实例的类别具有不确定性，包括：根据所述当前的实例的信息熵确定所述当前的实例的类别具有不确定性。

结合第二种可能的实现方式，在第三种可能的实现方式中，所述根据所述当前的实例的信息熵确定所述当前的实例的类别具有不确定性，包括：根据以下公式确定所述当前的实例的信息熵：

H_{i} = - Σ_{l = 1}^{c} u_{l}^{i} \log u_{l}^{i}

其中，i表示第i个实例，H_i表示第i个实例的信息熵，l为大于或等于1且小于或等于c的整数，表示第l个第二标签类别，表示第i个实例属于第l个第二标签类别的概率，c为所述第二预模型中的第二标签类别的个数；在所述信息熵大于或等于预设的阈值情时，确定所述当前的实例的类别具有不确定性。

结合第一方面或第一至第三种可能的实现方式中的任一种可能的实现方式，在第四种可能的实现方式中，所述根据所述多个第一预测模型中的标签之间的相互关系将所述多个第一预测模型合并为第二预测模型，包括：根据所述多个第一预测模型中的标签之间的相斥关系和相容关系，将所述多个第一预测模型中的多个组对应的标签类别合并为所述第二预测模型中的多个组对应的多标签类别。

结合第一方面或第一至第四种可能的实现方式中的任一种可能的实现方式，在第五种可能的实现方式中，还包括：确定所述第二预测模型中的标签的相关性图，其中所述相关性图包括多个顶点，所述多个顶点分别表示所述第二预测模型中多个组对应的多标签类别，所述相关性图的多个顶点两两相连接，用以表示所述第二预测模型中的标签之间的相关性。

第二方面，提供了一种预测类别的装置，包括：确定单元，用于生成多个第一预测模型，其中，所述多个第一预测模型中的每个第一预测模型用于将实例分成多个组，所述多个组中的每个组对应多个标签类别中的一个标签类别，所述标签类别包含至少一个标签；合并单元，用于根据所述多个第一预测模型中的标签之间的相互关系将所述多个第一预测模型合并为第二预测模型，其中，所述第二预测模型用于对实例进行分类得到多个组，所述第二预测模型的多个组中的每个组对应多个多标签类别中的一个多标签类别，所述多标签类别包含多个标签；第一确定单元，用于根据所述第二预测模型确定当前的实例属于所述多个多标签类别中的每个多标签类别的概率，以预测所述当前的实例的类别。

结合第二方面，在第一种可能的实现方式中，还包括：第二确定单元，用于确定所述当前的实例的类别具有不确定性，其中所述当前的实例的类别具有不确定性表示根据所述第二预测模型无法预测所述当前的实例的类别；获取单元，用于获取标注的所述当前的实例的类别；训练单元，用于根据所述标注的所述当前的实例的类别，对所述第二预测模型进行训练，以便于根据训练后的第二预测模型对待预测的实例的类别进行预测。

结合第二方面的第一种可能的实现方式，在第二种可能的实现方式中，所述第二确定单元根据所述当前的实例的信息熵确定所述当前的实例的类别具有不确定性。

结合第二方面的第二种可能的实现方式，在第三种可能的实现方式中，所述第二确定单元根据以下公式确定所述当前的实例的信息熵：

H_{i} = - Σ_{l = 1}^{c} u_{l}^{i} \log u_{l}^{i}

结合第二方面或第二方面的第一至第三种可能的实现方式中的任一种可能的实现方式，在第四种可能的实现方式中，所述合并单元根据所述多个第一预测模型中的标签之间的相斥关系和相容关系，将所述多个第一预测模型中的多个组对应的标签类别合并为所述第二预测模型中的多个组对应的多标签类别。

结合第二方面或第二方面的第一至第四种可能的实现方式中的任一种可能的实现方式，在第五种可能的实现方式中，还包括：第三确定单元，用于确定所述第二预测模型中的标签的相关性图，其中所述相关性图包括多个顶点，所述多个顶点分别表示所述第二预测模型中多个组对应的多标签类别，所述相关性图的多个顶点两两相连接，用以表示所述第二预测模型中的标签之间的相关性。

基于上述技术方案，通过将多个第一预测模型中的标签之间的相互关系将多个第一预测模型合并为第二预测模型，根据该第二预测模型对实例的类别进行预测，无需根据多个第一预测模型分别对当前实例的类别进行预测，能够减小计算量。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明一个实施例的预测的方法的示意性流程图。

图2是根据本发明另一实施例的预测类别的方法的示意性流程图。

图3是常规预测方法的示意图。

图4是根据本发明另一实施例的预测类别的方法的示意性流程图。

图5是根据本发明另一实施例的预测类别的方法的示意性流程图。

图6是根据本发明一个实施例的预测类别的装置的示意性框图。

图7是根据本发明另一实施例的预测类别的装置的示意性框图。

图8是根据本发明另一实施例的预测类别的装置的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

图1是根据本发明一个实施例的预测的方法的示意性流程图。图1所示的方法可以应用于分类中，也可以应用于回归分析中，本发明实施例并不限于此，如图1，该方法包括如下内容：

110，确定多个第一预测模型，其中，多个第一预测模型中的每个第一预测模型用于将实例分成多个组，多个组中的每个组对应多个标签类别中的一个标签类别，该标签类别包含至少一个标签。

具体地，该多个第一预测模型可以是预设的预测模型，也可以是根据实际需求而生成的，还可以是预测装置中已存储的预测模型。

120，根据多个第一预测模型中的标签之间的相互关系将多个第一预测模型合并为第二预测模型，其中，第二预测模型用于对实例进行分类得到多个组，第二预测模型的多个组中的每个组对应多个多标签类别中的一个多标签类别，该多标签类别包含多个标签。

例如，可以根据标签的相互关系将两个第一预测模型合并为一个第二预测模型。

130，根据第二预测模型确定当前的实例属于多个多标签类别中的每个多标签类别的概率，以预测当前的实例的类别。

在120中，可以根据多个第一预测模型中的标签之间的相斥关系和相容关系，将多个第一预测模型中的多个组对应的标签类别合并为第二预测模型中的多个组对应的多标签类别。具体地，相容关系可以包括互相影响关系或相近关系，换句话说标签的相互关系可以为各个标签间的互相影响关系、排斥关系和相近关系中的至少一个。例如，对于排斥关系来说，例如，两个标签分别为高收入者和小学生，通常情况下这两个标签是不会在同一个人身上发生或同时存在的，存在着排斥关系，因此，在合并标签时，不应该把存在排斥关系的标签合并在一个多标签类别中。再例如，对于互相影响关系来说，例如，明星和高人气两个标签来说一般是在同一个人身上发生或同时存在的，具有互相影响关系，因此在合并标签时，可以将具有相互影响关系的标签合并在一个多标签类别中。

因此，本发明实施例通过将多个第一预测模型中的标签之间的相互关系将多个第一预测模型合并为第二预测模型，并根据该第二预测模型对当前实例的类别进行预测，无需根据多个预测模型分别对当前实例的类别进行预测，从而能够减小计算量。

可选地,作为另一实施例，在120中，每个第二预测模型具有多个多标签类别和多个分类器模型，其中，每一个多标签类别包括至少两个标签。可以根据多个第一预测模型中的标签之间的相互关系合并多个第一预测模型中的标签形成多个多标签类别，第二预测模型中的多个分类器模型中的每一个分类器模型包括至少两个组；其中，至少两个组中的每一个组对应于多个多标签类别中的一个多标签类别。

可选地，作为另一实施例，本发明实施例方法还包括确定当前的实例的类别具有不确定性，其中当前的实例的类别具有不确定性表示根据第二预测模型无法预测当前的实例的类别；获取标注的当前的实例的类别；根据标注的当前的实例的类别，对第二预测模型进行训练，以便于根据训练后的第二预测模型对待预测的实例的类别进行预测。

具体地，如图2所示，包括：

210，确定多个第一预测模型，其中，多个第一预测模型中的每个第一预测模型用于将实例分成多个组，多个组中的每个组对应多个标签类别中的一个标签类别，标签类别包含至少一个标签。

220，根据多个第一预测模型中的标签之间的相互关系将多个第一预测模型合并为第二预测模型，其中，第二预测模型用于对实例进行分类得到多个组，第二预测模型的多个组中的每个组对应多个多标签类别中的一个多标签类别，多标签类别包含多个标签。

230,根据第二预测模型确定当前的实例属于多个多标签类别中的每个多标签类别的概率，以预测当前的实例的类别。

具体地，步骤210-230与步骤110-130对应，为避免重复，不再详述。

240,确定当前的实例的类别具有不确定性，其中当前的实例的类别具有不确定性表示根据第二预测模型无法预测当前的实例的类别。

换句话说，当前的实例的类别具有不确定性表示根据第二预测模型无法预测当前的实例的类别，或者预测的当前实例的类别不够准确。

250，获取标注的当前的实例的类别。

具体地，在当前实例存在不确定性时，对该当前实例进行标注，然后获取当前实例的预测结果，例如可以获取专家对当前实例的预测结果。

260，根据标注的当前的实例的类别，对第二预测模型进行训练，以便于根据训练后的第二预测模型对待预测的实例的类别进行预测。

换句话说,在获取存在不确定性的当前实例的预测后,根据存在不确定性的当前实例的预测结果，对第二预测模型进行训练,之后使用训练后的第二预测模型对于与当前实例相关的实例进行预测,能够提高预测精度,因此,本发明实施例方法通过基于不确定性的主动学习方法，能够提高预测精度。

可选地，在240中，可以根据当前的实例的信息熵确定当前的实例的类别具有不确定性。

进一步地，可以根据以下公式确定当前的实例的信息熵：

H_{i} = - Σ_{l = 1}^{c} u_{l}^{i} \log u_{l}^{i}

其中，i表示第i个实例，H_i表示第i个实例的信息熵，l为大于或等于1且小于或等于c的整数，表示第l个第二标签类别，表示第i个实例属于第l个第二标签类别的概率，c为第二预模型中的第二标签类别的个数；

在信息熵大于或等于预设的阈值情时，确定当前的实例的类别具有不确定性。

应注意，在服从均匀分布的时候得到H_i最大值，换句话说，当实例的针对当前的多标签类别的预测概率都相等时，例如为1/c，c为多标签类别的个数，表明当前的预测最无法判断第i个实例属于哪一个多标签类别，该实例最需要获取专家进行的预测，换句话说，需要获取专家标定的该实例属于哪一个多标签类别。

例如，可以对多个当前实例计算信息熵，得到多个信息熵，将该多个信息熵进行大小排序，可以以该多个信息熵的中间信息熵作为该预设阈值，与大于预设阈值的信息熵对应的实例存在不确定性。

换句话说，将信息熵大于或等于预设阈值的实例获取专家的预测或标定的其多标签类别。对第二预测模型进行训练,之后使用训练后的第二预测模型对于与该不确定性大于预设阈值的实例相关的实例通进行预测,能够提高预测精度,因此,本发明实施例方法通过基于不确定性的主动学习方法，能够提高预测精度。

应注意，本发明实施例还可以取多个信息熵的平均值作为预设阈值，也可以根据经验设定一个数值作为该预设阈值，该预设阈值可以大于平均值小于该多个信息熵的最大值，也可以小于平均值，本发明实施并不对此做限定。

可替代地，作为另一实施例，如果当前实例的信息熵小于预设阈值则不进行标注。

可选地，作为另一实施例，还包括：确定第二预测模型中的标签的相关性图，其中相关性图包括多个顶点，多个顶点分别表示第二预测模型中多个组对应的多标签类别，相关性图的多个顶点两两相连接，用以表示第二预测模型中的标签之间的相关性。

下面结合具体例子更加详细的描述本发明实施例。应注意，图1的例子仅仅是为了帮助本领域技术人员理解本发明实施例，而非要将本发明实施例限于所例示的具体数值或具体场景。本领域技术人员根据所给出的图1的例子，显然可以进行各种等价的修改或变化，这样的修改或变化也落入本发明实施例的范围内。

图3是常规预测方法的示意图。如图3所示，例如，每个预测模型可以包括两个分类器模型，分别为M1和M2，其中每个分类器模型中包含有三个组，例如，分类器模型M1中包含有组g1、g2和g3，分类器模型M2中包含有组g4、g5和g6，两个标签类别分别为[1，0]和[0，1]，每个标签类别中各包含有两个标签，其中标签类别中的“1”“0”代表标签状态。常规预测方法需要分别采用每个预测模型对当前实例的类别进行预测，再结合各个预测模型给出的预测结果得到最终的预测结果。因此，常规预测方法需要分别采用多个模型对实例进行预测，计算量大，而且未考虑标签的相互关系，影响了最后的预测结果。

图4是根据本发明另一实施例的预测的方法的示意性流程图。应注意，图4所示方法是对图3的常规技术的改进。为了清楚起见，本实施例以两个实例x1和x2、两个标签类别、两个待合并的预测模型为例进行说明。应理解，本发明的实施例并不限于此，实例、标签类别和预测模型的数目可以为更多个。这里，待合并的预测模型与图3中的预测模型相同，在此不再赘述。

本发明的实施例在合并不同的预测模型时，会考虑到待合并的不同预测模型中各个标签的互相关系。例如，两个标签分别代表收入和年龄段1-5岁，那么通常情况下年龄段1-5岁的人群是没有收入的，因此，通常情况下高收入者和年龄段1-5岁的人群是矛盾的，即这两个标签具有相互排拆的关系，因此在合并时不会将这两个标签合并成一个多标签类别。再如，明星和高人气是具有相互影响关系标签，因此在合并时，可以将这两个标签合并成一个多标签类别。考虑到两个第一预测模型中的各个标签的互相关系，可以将待合并的两个第一预测模型合并为一个第二预测模型，也就是说，将待合并的两个第一预测模型中的标签类别中的标签合并形成多标签类别，例如，多标签类别可以分别为[1,0,0]、[0,1,0]和[0,0,1]，从而获得第二预测模型，如图4所示。具体而言，在合并两个第一预测模型时，可以将两个第一预测模型中的组合并成第二预测模型中相应的组，例如，将两个第一预测模型中的g1合并成第二预测模型中的g1，将两个第一预测模型中的g2合并成第二预测模型中的g2，依次类推，并且根据两个待合并的第一预测模型中的组与标签类别的关联关系，确定第二预测模型中的组与多标签类别的关联关系，例如，如果实例x1或x2与两个第一预测模型中的哪个组相关联，则合并后，实例x1或x2仍旧与第二预测模型中的对应组相关联。这样，根据第一预测模型中的组与标签类别的关系，第二预测模型中的每个组可以连接到一个特定的多标签类别上。例如，图4中，组g1和g4与多标签类别[1,0,0]相关联、组g2和g5与多标签类别[0,1,0]相关联、组g3和g6与多标签类别[0,0,1]相关联。从图4可以看出，当根据第二预测模型预测实例的类别时，实例x1与组g1、g2、g4和g6总共4个组相关，由于g1和g4两个组都与多标签类别[1,0,0]相关，g1和g4两个组占总共四个组的比例为2/4，可以预测实例x1属于多标签类别[1,0,0]的概率为50％，同理，实例x1属于多标签类别[0,10]的概率为25％，属于多标签类别[0,0,1]的概率为25％。

应理解，图3和图4中的例子是为了帮助本领域技术人员更好地理解本发明实施例，而非要限制本发明实施例的范围。本领域技术人员根据所给出的图4的例子，显然可以进行各种等价的修改或变化，这样的修改或变化也落入本发明实施例的范围内。

应理解，上述各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

应理解，图3中的标签类别的个数应至少为两个，图4中的多标签类别应至少为两个。还应理解，图3中的标签类别中可以有一个标签也可以有多个标签，图4中的多标签类别中可以有一个标签也可以有多个标签。另外，图3的多个标签类别中不同的标签类别中的标签的种类可以不同，同样的，图4的多个标签类别中不同的标签类别中的标签的种类可以不同。再有，图3中的一个标签类别和图4中的一个标签类别中的标签的种类也可以不同，图3中的一个标签类别和图4中的一个标签类别中的标签的个数也可以不同，本发明实施例并不对此做限定。

还应理解，上述实施例中，图3和图4中均包括两个分类器模型，在实际应用中，第二预测模型中的分类器模型的个数可以与第一预测模型中的分类器模型的个数不同，第二预测模型中的分类器模型中的组与第一预测模型中的分类模型中的组也可以不同，本发明实施例并不对此做限定。

可选地，可以根据标签的相互关系，得到标签的相关性图，具体地，如图5所示，将图4中的所有组两两相连，当前的组形成的顶点代表了各个组与第二预测模型中相对应的多标签类别。根据该相关性图，能够直观的得标签的相互关系。

根据图4中所示的第二预测模型可以确定出具有不确定性的实例，并进行标注，

具体地，通过实例的信息熵衡量实例是否具有不确定性，在当前实例的信息熵大于预设阈值时，表明实例具有不确定性，表明当前实例的预测不够准确，需要获取专家对当前实例进行的预测。

例如，根据以下公式确定当前的实例的信息熵：

H_{i} = - Σ_{l = 1}^{c} u_{l}^{i} \log u_{l}^{i}

其中，i表示第i个实例，H_i表示第i个实例的信息熵,l为大于或等于1且小于或等于c的整数，表示第l个多标签类别，表示第i个实例属于第l个多标签类别的概率。

例如，预设阈值可以为可以H_T，可以将信息熵H_i≥H_T的实例标注，获取专家的预测，换句话说，获取专家对信息熵大于或等于预设阈值的实例的预测或标注的其多标签类别。然后根据专家的预测或标注对第二预测模型进行训练，之后使用训练后的第二预测模型对于与该不确定性大于预设阈值的实例相关的实例进行预测，能够提高预测精度,因此,本发明实施例方法通过基于不确定性的主动学习方法，能够提高预测精度。

例如，应用于分类预测中，如果实例为某一个人，可以根据分类器模型中的组对该实例进行预测其属于哪一个多标签类别。例如，有多个多标签类别，如有3个或4个多标签类别，其中，第一个多标签类别可以为高收入者、中年人、教育行业和男性，第二个多标签类别还可以为高收入者、青年人、IT行业和女性。分类器模型可以根据该实例的属性对该实例进行预测，并确定出该实例属于当前的多标签类别的概率，例如，属于第一个多标签类别的概率为75％，属于第二个多标签类别的概率为25％，属于其他多标签类别的概率均为0％。再例如，如果有4个多标签类别，该实例属于当前的类别的概率均为25％，表明该实例具有不确定性，需要将此实例进行标注，获取专家进行标注其属于哪一个多标签类别，或者属于哪一个多标签类别的概率较高。之后将此信息反馈给分类器模型进行训练。通过基于不确定性的主动学习方法，能够提高预测精度。

例如，应用于回归预测中，如果实例可以为出租房，分类器模型可以包括房租的计算模型、出租房受欢迎程度的计算模型和房屋地理位置计算模型等。可以根据分类器模型中的组对该实例进行预测其属于哪一个多标签类别，例如，有两个多标签类别，第一多标签类别中的一个标签为价格3000-5000元，和另一个标签为市区。第一个多标签类别中的一个标签为价格2000-3000元，和另一个标签为郊区。同样可以预测出该出租房属于哪一个多标签类别的概率，如果具有不确定性，同样需要将此实例进行标注，获取专家进行标定的其属于哪一个多标签类别，或者属于哪一个多标签类别的概率较高。之后将此信息反馈给分类器模型进行训练。通过基于不确定性的主动学习方法，能够提高预测精度。

上文结合图1至图5详细描述了本发明实施例的预测类别的方法，下面将结合图6-图8详细描述本发明实施例的预测类别的装置。

图6是根据本发明实施例的一种预测类别的装置的示意性框图。如图6所示的装置600包括：确定单元610、合并单元620和第一确定单元630。

具体地，确定单元610，用于生成多个第一预测模型，其中，多个第一预测模型中的每个第一预测模型用于将实例分成多个组，多个组中的每个组对应多个标签类别中的一个标签类别，标签类别包含至少一个标签；合并单元620，用于根据多个第一预测模型中的标签之间的相互关系将多个第一预测模型合并为第二预测模型，其中，第二预测模型用于对实例进行分类得到多个组，第二预测模型的多个组中的每个组对应多个多标签类别中的一个多标签类别，多标签类别包含多个标签；第一确定单元630，用于根据第二预测模型确定当前的实例属于多个多标签类别中的每个多标签类别的概率，以预测当前的实例的类别。

图6的预测类别的装置能够实现图1的实施例中预测类别的方法的各个过程，为避免重复，此处不再详述。

如图7所示的预测类别的装置700包括：确定单元710、合并单元720、第一确定单元730、第二确定单元740、获取单元750、和训练单元760。

具体地，本发明实施例图7中的预测类别的装置700中的确定单元710、合并单元720、第一确定单元730分别与图6中的确定单元610、合并单元620和第一确定单元630的功能相对应。为避免重复，此处省略详细描述。第二确定单元740用于确定当前的实例的类别具有不确定性，其中当前的实例的类别具有不确定性表示根据第二预测模型无法预测当前的实例的类别；获取单元750用于获取标注的当前的实例的类别；训练单元760用于根据标注的当前的实例的类别，对第二预测模型进行训练，以便于根据训练后的第二预测模型对待预测的实例的类别进行预测。

根据本发明的实施例，第二确定单元740根据当前的实例的信息熵确定当前的实例的类别具有不确定性。

根据本发明的实施例，第二确定单元740根据以下公式确定当前的实例的信息熵：

H_{i} = - Σ_{l = 1}^{c} u_{l}^{i} \log u_{l}^{i}

在信息熵大于或等于预设的阈值情时，第二确定单元740确定当前的实例的类别具有不确定性。

根据本发明的实施例，合并单元720根据多个第一预测模型中的标签之间的相斥关系和相容关系，将多个第一预测模型中的多个组对应的标签类别合并为第二预测模型中的多个组对应的多标签类别。

可选地，作为另一实施例，预测类别的装置700还包括：第三确定单元，用于确定第二预测模型中的标签的相关性图，其中相关性图包括多个顶点，多个顶点分别表示第二预测模型中多个组对应的多标签类别，相关性图的多个顶点两两相连接，用以表示第二预测模型中的标签之间的相关性。

图8是根据本发明另一实施例的预测类别的装置的示意性框图。图8所示的预测类别的装置800包括处理器810、存储器820和总线830。

具体地，处理器810用于通过总线830调用存储在存储器820中的代码，以确定多个第一预测模型，其中，多个第一预测模型中的每个第一预测模型用于将实例分成多个组，多个组中的每个组对应多个标签类别中的一个标签类别，标签类别包含至少一个标签；根据多个第一预测模型中的标签之间的相互关系将多个第一预测模型合并为第二预测模型，其中，第二预测模型用于对实例进行分类得到多个组，第二预测模型的多个组中的每个组对应多个多标签类别中的一个多标签类别，多标签类别包含多个标签；根据第二预测模型确定当前的实例属于多个多标签类别中的每个多标签类别的概率，以预测当前的实例的类别。

上述本发明实施例揭示的方法可以应用于处理器810中，或者由处理器810实现。处理器810可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器810中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器810可以是通用处理器、数字信号处理器(DigitalSignalProcessor，DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、现成可编程门阵列(FieldProgrammableGateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器(RandomAccessMemory，RAM)、闪存、只读存储器(Read-OnlyMemory，ROM)、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器820，处理器810读取存储器820中的信息，结合其硬件完成上述方法的步骤。

图8的预测类别的装置800能够实现图1的实施例中预测类别的方法的各个过程，为避免重复，此处不再详述。

可选地，作为另一实施例，处理器810还用于确定当前的实例的类别具有不确定性，其中当前的实例的类别具有不确定性表示根据第二预测模型无法预测当前的实例的类别；获取标注的当前的实例的类别；根据标注的当前的实例的类别，对第二预测模型进行训练，以便于根据训练后的第二预测模型对待预测的实例的类别进行预测。

根据本发明的实施例，处理器810根据当前的实例的信息熵确定当前的实例的类别具有不确定性。

根据本发明的实施例，处理器810根据以下公式确定当前的实例的信息熵：

H_{i} = - Σ_{l = 1}^{c} u_{l}^{i} \log u_{l}^{i}

其中，i表示第i个实例，H_i表示第i个实例的信息熵，l为大于或等于1且小于或等于c的整数，表示第l个第二标签类别，表示第i个实例属于第l个第二标签类别的概率，c为第二预模型中的第二标签类别的个数；在信息熵大于或等于预设的阈值情时，确定当前的实例的类别具有不确定性。

根据本发明的实施例，处理器810根据多个第一预测模型中的标签之间的相斥关系和相容关系，将多个第一预测模型中的多个组对应的标签类别合并为第二预测模型中的多个组对应的多标签类别。

可选地，作为另一实施例，处理器810还用于确定第二预测模型中的标签的相关性图，其中相关性图包括多个顶点，多个顶点分别表示第二预测模型中多个组对应的多标签类别，相关性图的多个顶点两两相连接，用以表示第二预测模型中的标签之间的相关性。

说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。

应理解，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

应理解，在本发明的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种预测类别的方法，其特征在于，包括：

确定多个第一预测模型，其中，所述多个第一预测模型中的每个第一预测模型用于将实例分成多个组，所述多个组中的每个组对应多个标签类别中的一个标签类别，所述标签类别包含至少一个标签；

根据所述多个第一预测模型中的标签之间的相互关系将所述多个第一预测模型合并为第二预测模型，其中，所述第二预测模型用于对实例进行分类得到多个组，所述第二预测模型的多个组中的每个组对应多个多标签类别中的一个多标签类别，所述多标签类别包含多个标签；

根据所述第二预测模型确定当前的实例属于所述多个多标签类别中的每个多标签类别的概率，以预测所述当前的实例的类别。

2.根据权利要求1所述的方法，其特征在于，还包括：

确定所述当前的实例的类别具有不确定性，其中所述当前的实例的类别具有不确定性表示根据所述第二预测模型无法预测所述当前的实例的类别；

获取标注的所述当前的实例的类别；

根据所述标注的所述当前的实例的类别，对所述第二预测模型进行训练，以便于根据训练后的第二预测模型对待预测的实例的类别进行预测。

3.根据权利要求2所述的方法，其特征在于，所述确定所述当前的实例的类别具有不确定性，包括：

根据所述当前的实例的信息熵确定所述当前的实例的类别具有不确定性。

4.根据权利要求3所述的方法，其特征在于，所述根据所述当前的实例的信息熵确定所述当前的实例的类别具有不确定性，包括：

根据以下公式确定所述当前的实例的信息熵：

H_{i} = - Σ_{l = 1}^{c} u_{l}^{i} \log u_{l}^{i}

其中，i表示第i个实例，H_i表示第i个实例的信息熵，l为大于或等于1且小于或等于c的整数，表示第l个第二标签类别，表示第i个实例属于第l个第二标签类别的概率，c为所述第二预模型中的第二标签类别的个数；

在所述信息熵大于或等于预设的阈值情时，确定所述当前的实例的类别具有不确定性。

5.根据权利要求1至4中的任一项所述的方法，其特征在于，所述根据所述多个第一预测模型中的标签之间的相互关系将所述多个第一预测模型合并为第二预测模型，包括：

根据所述多个第一预测模型中的标签之间的相斥关系和相容关系，将所述多个第一预测模型中的多个组对应的标签类别合并为所述第二预测模型中的多个组对应的多标签类别。

6.根据权利要求1至5中任一项所述的方法，其特征在于，还包括：

确定所述第二预测模型中的标签的相关性图，其中所述相关性图包括多个顶点，所述多个顶点分别表示所述第二预测模型中多个组对应的多标签类别，所述相关性图的多个顶点两两相连接，用以表示所述第二预测模型中的标签之间的相关性。

7.一种预测类别的装置，其特征在于，包括：

确定单元，用于生成多个第一预测模型，其中，所述多个第一预测模型中的每个第一预测模型用于将实例分成多个组，所述多个组中的每个组对应多个标签类别中的一个标签类别，所述标签类别包含至少一个标签；

合并单元，用于根据所述多个第一预测模型中的标签之间的相互关系将所述多个第一预测模型合并为第二预测模型，其中，所述第二预测模型用于对实例进行分类得到多个组，所述第二预测模型的多个组中的每个组对应多个多标签类别中的一个多标签类别，所述多标签类别包含多个标签；

第一确定单元，用于根据所述第二预测模型确定当前的实例属于所述多个多标签类别中的每个多标签类别的概率，以预测所述当前的实例的类别。

8.根据权利要求7所述的装置，其特征在于，还包括：

第二确定单元，用于确定所述当前的实例的类别具有不确定性，其中所述当前的实例的类别具有不确定性表示根据所述第二预测模型无法预测所述当前的实例的类别；

获取单元，用于获取标注的所述当前的实例的类别；

训练单元，用于根据所述标注的所述当前的实例的类别，对所述第二预测模型进行训练，以便于根据训练后的第二预测模型对待预测的实例的类别进行预测。

9.根据权利要求8所述的装置，其特征在于，

所述第二确定单元根据所述当前的实例的信息熵确定所述当前的实例的类别具有不确定性。

10.根据权利要求9所述的装置，其特征在于，

所述第二确定单元根据以下公式确定所述当前的实例的信息熵：

H_{i} = - Σ_{l = 1}^{c} u_{l}^{i} \log u_{l}^{i}

11.根据权利要求7至10中任一项所述的装置，其特征在于，

所述合并单元根据所述多个第一预测模型中的标签之间的相斥关系和相容关系，将所述多个第一预测模型中的多个组对应的标签类别合并为所述第二预测模型中的多个组对应的多标签类别。

12.根据权利要求7至11中任一项所述的装置，其特征在于，还包括：

第三确定单元，用于确定所述第二预测模型中的标签的相关性图，其中所述相关性图包括多个顶点，所述多个顶点分别表示所述第二预测模型中多个组对应的多标签类别，所述相关性图的多个顶点两两相连接，用以表示所述第二预测模型中的标签之间的相关性。