CN109214412A

CN109214412A - 一种分类模型的训练方法和装置

Info

Publication number: CN109214412A
Application number: CN201810765795.3A
Authority: CN
Inventors: 张志伟; 吴丽军; 赵伟阳
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2018-07-12
Filing date: 2018-07-12
Publication date: 2019-01-15

Abstract

本发明实施例提供了一种分类模型的训练方法和装置，所述方法包括：获取图像数据；根据所述图像数据获得图像特征数据；获取用户与图像之间的评论数据；根据所述评论数据获得文本特征数据；拼接所述图像特征数据和所述文本特征数据获得融合特征数据；采用所述融合特征数据训练指定分类模型。本发明实施例将文本特征数据应用到指定分类模型中，由于文本特征数据会随着用户与图像数据之间评论数据越来越多，从而使得分类模型的分类结果变得越加准确。

Description

一种分类模型的训练方法和装置

技术领域

本发明涉及数据处理技术领域，特别是涉及一种分类模型的训练方法、一种分类模型的训练装置以及一个或多个机器可读介质。

背景技术

图像分类是根据图像的语义信息将不同类别图像区分开来，是计算机视觉中重要的基本问题，也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。

近年来，深度学习在视频图像、语音识别、自然语言处理等相关领域获得了广泛应用。卷积神经网络(CNN，Convolutional Neural Network)作为深度学习的一个重要分支，由于其超强的拟合能力以及端到端的全局优化能力，使得图像分类任务在应用卷积神经网络之后，预测精度大幅提升。

在使用卷积神经网络模型对未知数据进行预测时，一般采用的方式为：

(1)根据已知的数据集，离线训练一个分类模型；

(1)加载预先训练好的模型参数，对未知数据进行预测。

这种方式是静态地对数据进行预测，利用的信息仅有图像或者其它的多媒体数据信息，所以这种方式存在下面两个缺点：

(1)无论采用何种训练算法，采用何种网络结构，数据规模限制着基于卷积神经网络模型的精度上限；

(2)卷积神经网络模型是静态的，不会随着时间的推移变得原来越准，相反的往往会在模型运行一定时间之后出现模型退化的情况。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种分类模型的训练方法、一种分类模型的训练装置以及一个或多个机器可读介质。

为了解决上述问题，本发明实施例公开了一种分类模型的训练方法，包括：

获取图像数据；

根据所述图像数据获得图像特征数据；

获取用户对图像的评论数据；

根据所述评论数据获得文本特征数据；

拼接所述图像特征数据和所述文本特征数据获得融合特征数据；

采用所述融合特征数据训练指定分类模型。

优选地，所述根据所述图像数据获得图像特征数据，包括：

采用所述图像数据训练图像分类模型；

采用所述训练后的图像分类模型从所述图像数据中提取图像特征数据。

优选地，所述采用所述训练后的图像分类模型从所述图形训练数据中提取图像特征数据，包括：

将所述图像数据输入到训练后的图像分类模型，获得网络层的特征数据；

从所述网络层特征数据中选取最后两层的特征数据作为图像特征数据；所述图像特征数据包括语义特征数据和类别特征数据。

优选地，所述根据所述评论数据获得文本特征数据，包括：

获取所述用户对图像数据的评论数据；

对所述评论数据进行分词操作得到分词集合；

去除所述分词集合中停用词；

将所述去除分词集合后的分词集合作为文本特征数据。

本发明实施例还公开了一种分类模型的训练装置，包括：

图像数据获取模块，用于获取图像数据；

图像特征数据获得模块，用于根据所述图像数据获得图像特征数据；

评论数据获取模块，用于获取用户对图像的评论数据；

文本特征数据获得模块，用于根据所述评论数据获得文本特征数据；

特征数据拼接模块，用于拼接所述图像特征数据和所述文本特征数据获得融合特征数据；

指定分类模型训练模块，用于采用所述融合特征数据训练指定分类模型。

优选地，所述图像特征数据获得模块包括：

图像分类模型训练子模块，用于采用所述图像数据训练图像分类模型；

图像特征数据提取子模块，用于采用所述训练后的图像分类模型从所述图像数据中提取图像特征数据。

优选地，所述图像特征数据提取子模块包括：

网络层特征数据获得单元，用于将所述图像数据输入到训练后的图像分类模型，获得网络层的特征数据；

图像特征数据获得单元，用于从所述网络层特征数据中选取最后两层的特征数据作为图像特征数据；所述图像特征数据包括语义特征数据和类别特征数据。

优选地，所述文本特征数据获得模块包括：

评论数据获取子模块，用于获取所述用户对图像数据的评论数据；

分词子模块，用于对所述评论数据进行分词操作得到分词集合；

停用词去除子模块，用于去除所述分词集合中停用词；

文本特征数据获得子模块，用于将所述去除分词集合后的分词集合作为文本特征数据。

本发明实施例还公开了一种分类模型的训练系统，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述电子设备执行如上述的一种分类模型的训练方法。

本发明实施例还公开了一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得所述处理器执行如上述的一个或多个的一种分类模型的训练方法。

本发明实施例包括以下优点：

在本发明实施例中，从图像数据中提取出图像特征数据，此外，从用户对图像的评论数据提取出文本特征数据，拼接图像特征数据和文本特征数据获得融合特征数据，随后采用融合特征数据训练指定分类模型，本发明实施例将文本特征数据应用到指定分类模型中，由于文本特征数据会随着用户与图像数据之间评论数据越来越多，从而使得分类模型的分类结果变得越加准确。

附图说明

图1是本发明的一种分类模型的训练方法实施例的步骤流程图；

图2是本发明的一种基于用户评论数据的分类总体框架图；

图3是本发明的一种不同网络层的图像特征数据的示意图；

图4是本发明的一种分类模型的训练装置实施例的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1，示出了本发明的一种分类模型的训练方法实施例的步骤流程图，具体可以包括如下步骤：

步骤101，获取图像数据。

具体地，图像数据为已有的训练数据集合，在实施本发明实施例时，根据不同的任务，获取不同的训练数据集合，例如，假设是一个识别动物的任务，将获取包括“猫”、“狗”、“猴”等动物的图像数据。

步骤102，根据所述图像数据获得图像特征数据。

本发明实施例可以通过模型从图像数据中提取出图像特征数据。

在本发明的一种实施例中，所述步骤102可以包括如下子步骤：

子步骤S11，采用所述图像数据训练图像分类模型；

子步骤S12，采用所述训练后的图像分类模型从所述图像数据中提取图像特征数据。

在获取到图像数据后，可以通过图像分类模型来提取图像特征数据。在一种实施方式中，图像分类模型为静态的图像分类模型model_i，其中，图像分类模型model可以是卷积神经网络模型。

在本发明实施例中使用model_i提取图像数据中所有的图像的不同网络层的特征，作为图像数据的图像特征数据，可以用feature_i表示。

在本发明的一种优选实施例中，所述子步骤S12可以包括如下子步骤：

model_i是由若干卷积层、池化层多个网络层组成，每一层对应都会输出输入数据(图像)的图像特征数据。具体可以参照图2所示，一般采用最后一层分类结果以及倒数第二层的图像特征数据。当然也可以选取其他网络层的数据，本发明实施例对此无需加以限制。

步骤103，获取用户对图像的评论数据。

本发明实施例获取用户对图像的评论数据。本发明实施例将根据用户与图像的评论数据，提取评论的文本特征数据。

步骤104，根据所述评论数据获得文本特征数据。

在本发明的一种优选实施例中，所述步骤104可以包括如下子步骤：

子步骤S21，获取所述用户对图像数据的评论数据；

子步骤S22，对所述评论数据进行分词操作得到分词集合；

子步骤S23，去除所述分词集合中停用词；

子步骤S24，将所述去除分词集合后的分词集合作为文本特征数。

在本发明实施例中，根据用户与图像的评论数据，提取评论的文本特征数据。具体地，可以使用JieBa分词器进行分词，对当前图像的所有评论数据进行分词，最后得到分词集合。在实际应用中还需要去除分词集合中的停用词。

步骤105，拼接所述图像特征数据和所述文本特征数据获得融合特征数据。

当得到图像特征数据和所述文本特征数据，也即是feature_i和featureu后，将feature_i以及featureu拼接在一起，得到融合特征数据。

步骤106，采用所述融合特征数据训练指定分类模型。

在一种实施方式中，指定分类模型可以是诸如XGBoost模型，本发明实施例中将融合特征数据，输入XGBoost模型中，训练模型。

本发明实施例将评论数据应用到分类模型中。参照图3，本发明实施例分为两个阶段模型，首先通过是卷积神经网络模型提取图像特征数据，然后通过JieBa分词器对评论数据提取文本特征数据，最后融合图像特征数据和文本特征数据，输入到XGBoost模型训练，对分类结果进行进一步提升。

本发明实施例充分利用了用户在使用应用程序时产生的评论数据，达到对分类结果进一步优化的目的。本发明实施例会随着用户与视频或者图像产生越来越多的评论数据时，使分类结果变得越加准确，所以克服了静态图像分类模型的两个缺点：

1、用户的评论数据无穷无尽，会随着时间推移越来越多，所以本发明实施例不会存在数据规模对精度上限的限制。

2、用户的评论数据是动态产生的，融入了评论数据使得分类模型不再一个静态的模型，而且会随着时间推移，使分类任务越来越准。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

参照图4，示出了本发明的一种分类模型的训练装置实施例的结构框图，具体可以包括如下模块：

图像数据获取模块201，用于获取图像数据；

图像特征数据获得模块202，用于根据所述图像数据获得图像特征数据；

评论数据获取模块203，用于获取用户对图像的评论数据；

文本特征数据获得模块204，用于根据所述评论数据获得文本特征数据；

特征数据拼接模块205，用于拼接所述图像特征数据和所述文本特征数据获得融合特征数据；

指定分类模型训练模块206，用于采用所述融合特征数据训练指定分类模型。

在本发明实施例的一种优选实施例中，所述图像特征数据获得模块202可以包括如下子模块：

在本发明实施例的一种优选实施例中，所述图像特征数据提取子模块可以包括如下单元：

在本发明实施例的一种优选实施例中，所述文本特征数据获得模块204可以包括如下子模块：

停用词去除子模块，用于去除所述分词集合中停用词；

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本发明实施例还提供了一种分类模型的训练系统，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述电子设备执行上述的一种分类模型的训练方法。

本发明实施例还提供了一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得所述处理器执行上述的一种分类模型的训练方法。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种分类模型的训练方法、一种分类模型的训练装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种分类模型的训练方法，其特征在于，包括：

获取图像数据；

根据所述图像数据获得图像特征数据；

获取用户对图像的评论数据；

根据所述评论数据获得文本特征数据；

采用所述融合特征数据训练指定分类模型。

2.根据权利要求1所述的方法，其特征在于，所述根据所述图像数据获得图像特征数据，包括：

采用所述图像数据训练图像分类模型；

3.根据权利要求2所述的方法，其特征在于，所述采用所述训练后的图像分类模型从所述图形训练数据中提取图像特征数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述评论数据获得文本特征数据，包括：

获取所述用户对图像数据的评论数据；

对所述评论数据进行分词操作得到分词集合；

去除所述分词集合中停用词；

将所述去除分词集合后的分词集合作为文本特征数据。

5.一种分类模型的训练装置，其特征在于，包括：

图像数据获取模块，用于获取图像数据；

评论数据获取模块，用于获取用户对图像的评论数据；

6.根据权利要求5所述的装置，其特征在于，所述图像特征数据获得模块包括：

7.根据权利要求6所述的装置，其特征在于，所述图像特征数据提取子模块包括：

8.根据权利要求5所述的装置，其特征在于，所述文本特征数据获得模块包括：

停用词去除子模块，用于去除所述分词集合中停用词；

9.一种分类模型的训练系统，其特征在于，包括：

一个或多个处理器；和

其上存储有指令的一个或多个机器可读介质，当由所述一个或多个处理器执行时，使得所述电子设备执行如权利要求1-4一个或多个的一种分类模型的训练方法。

10.一个或多个机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得所述处理器执行如权利要求1-4一个或多个的一种分类模型的训练方法。