WO2017113232A1

WO2017113232A1 - 一种基于深度学习的产品分类方法及装置

Info

Publication number: WO2017113232A1
Application number: PCT/CN2015/099965
Authority: WO
Inventors: 樊春玲; 张巍; 姜青山
Original assignee: 中国科学院深圳先进技术研究院
Priority date: 2015-12-30
Filing date: 2015-12-30
Publication date: 2017-07-06
Also published as: CN107683469A

Abstract

一种基于深度学习的产品分类方法及装置，其中，该方法包括以下步骤：从产品的描述文本中提取产品的文本特征；基于预训练得到的卷积神经网络模型，从产品的图像中提取产品的图像特征；将产品的文本特征与产品的图像特征融合，得到产品的特征信息；基于预训练得到的产品分类模型对产品的特征信息进行处理，得到产品的分类结果。由于该方案综合考虑了待分类产品的产品文本特征和产品图像特征，与只根据产品的文本信息进行产品分类相比，提高了分类准确率。

Description

一种基于深度学习的产品分类方法及装置

技术领域

本发明涉及模式识别技术领域，特别涉及一种基于深度学习的产品分类方法及装置。

背景技术

随着电子商务的迅猛发展，网上购物已逐渐成为网民的日常行为。网络产品种类繁杂，数量庞大，电商网站在物品管理方面需要花费很大精力，才能为用户提供良好的购物体验。产品分类问题是物品管理的首要问题，然而目前产品分类主要靠人工标定产品类别。虽然目前已有的智能分类方法大多使用产品的文本信息进行分类，然而由于文字并非能完全描述图片的所有内容，如果文字信息描述偏差的情况下，会导致产品被错误分类，需要花费很多人力成本来修正产品类别，因此现有的产品分类方法分类准确性较差。

发明内容

本发明实施例提供了一种基于深度学习的产品分类方法，解决了现有技术中根据产品的文本信息进行产品分类准确性较差的技术问题。该产品分类方法包括：

从产品的描述文本中提取产品的文本特征；

基于预训练得到的卷积神经网络模型，从产品的图像中提取产品的图像特征；

将产品的文本特征与产品的图像特征融合，得到产品的特征信息；

基于预训练得到的产品分类模型对产品的特征信息进行处理，得到产品的分类结果。

本发明实施例还提供了一种基于深度学习的产品分类装置，解决了现有技术中根据产品的文本信息进行产品分类准确性较差的技术问题。该产品分类装置包括：

文本特征提取模块，用于从产品的描述文本中提取产品的文本特征；

图像特征提取模块，用于基于预训练得到的卷积神经网络模型，从产品的图像中提取产品的图像特征；

特征信息获得模块，用于将产品的文本特征与产品的图像特征融合，得到产品的特征信息；

分类模块，用于基于预训练得到的产品分类模型对产品的特征信息进行处理，得到产品的分类结果。

在本发明实施例中，通过提取产品的文本特征和图像特征，再将产品的文本特征与产品的图像特征融合，得到产品的特征信息，从而利用该产品的特征信息进行分类获得分类结果，由于综合考虑了待分类产品的文本特征和图像特征，与只根据产品的文本信息进行产品分类相比，提高了分类准确率。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。在附图中：

图1是本发明实施例提供的一种基于深度学习的产品分类方法流程图；

图2是本发明实施例提供的一种文本特征提取方法流程图；

图3是本发明实施例提供的一种预训练网络示意图；

图4是本发明实施例提供的一种图像特征提取方法流程示意图；

图5是本发明实施例提供的一种训练模型和预测产品流程图；

图6是本发明实施例提供的一种基于深度学习的产品分类装置结构示意图；

图7是本发明实施例提供的文本特征提取模块的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施方式和附图，对本发明做进一步详细说明。在此，本发明的示意性实施方式及其说明用于解释本发明，但并不作为对本发明的限定。

现有的对产品进行分类的方法，只是单纯的使用产品的文本信息进行分类，如果文字信息描述出现偏差，会导致产品被错误分类，需要花费很多人力成本来修正产品类别，分类准确性较差。如果结合使用产品的文本信息和图像信息，就可以解决现有的分类方法分类准确性较差这一问题。基于此，本发明提出一种基于深度学习的产品分类方法及装置。

图1是本发明实施例提供的一种基于深度学习的产品分类方法流程图，如图1所示，该方法包括：

本实施例对互联网产品中C类产品进行分类，如针织衫、T恤、外套、裤子、衬衫、连衣裙、单肩包、单鞋、产务包、靴子等，其中每类有500个产品。

产品的描述文本是指用于描述待分类产品的文本，包括文字、符号、数字等。产品的描述文本可对应存储于产品文本文档中，这样一个产品文本对应一个产品文本文档。

步骤101：从产品的描述文本中提取产品的文本特征，具体的流程如图2所示，包括：

输入产品p_j，根据给定的文本Text，利用文本特征提取的方法，提取相应的文本特征，得到T_j。

步骤一：将产品的描述文本进行分词，获得候选词；

每个产品信息被作为一个文档，首先对其进行分词，将文档分割为一系列的词序列。本发明中采用中国科学院计算技术研究所基于多层隐马尔科夫模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology，Chinese Lexical Analysis System)进行中文分词，分词精度达98.45％。

步骤二：根据预设评估函数从所述候选词中筛选出产品特征词；

本发明用于特征提取的评估函数有：特征频率函数、文档频率函数、信息增益函数、互信息函数、开方拟和检验函数五种。这五种评估函数可以任选其中一种，也可以是几种的组合，最优的是采用五种评估函数来得到五种产品特征词，然后将五种产品特征词综合使用。

1)特征频率函数(Term Frequency，TF)：

计算候选词在样本文档中出现的次数，将出现次数大于或等于次数阈值的候选词作为产品特征词。

具体的，首先遍历所有候选词(有用词)，求出每个候选词(有用词)在样本文档中出现的次数，设定一定的阈值(如10)，删除那些出现次数小于阈值对分类贡献很小的词，选取大于该阈值的分词作为产品特征词。

2)文档频率函数(Document Frequency，DF)：

计算包含候选词的样本文档占样本文档总数的比重，将比重在预设范围内的候选词作为产品特征词。

具体的，根据公式(1)计算每个候选词(有用词)t的文档频次P_t：

其中，n_t为包含每个候选词(有用词)t的样本文档数，n为样本文档总数。

设定特征词频次阈值(如(0.005，0.08))，筛选出在阈值范围内的候选词(有用词)t作为产品特征词。

3)信息增益函数(Information Gain，IG)：

计算所述候选词的信息增益权值，将信息增益权值大于信息增益权值阈值的候选词作为产品特征词。

具体的，根据公式(2)计算每个候选词(有用词)t的信息增益权值：

其中，t表示候选词(有用词)，C表示文档类别，m表示类别数，P(C_i)表示C_i类文档在训练样本集中出现的概率，P(t)表示训练样本集中包含词条t的文档的概率，P(C_i|t)表示文档包含词条t时属于C类的条件概率，

表示训练样本集中不包含词条t的文档的概率，

表示文档中不包含词条t时属于C类的条件概率。

求出权值后，设定阈值(如0.006)，选取权值大于该阈值的有用词作为产品特征词。

4)互信息函数(Mutual Information，MI)：

计算候选词的互信息值，将互信息值大于互信息值阈值的候选词作为产品特征词。

具体的，按照公式(3)或(4)计算每个候选词(有用词)t_k与每个类别C_i的互信息值：

也可表示为

MI(t_k，C_i)＝logP(t_k|C_i)-logP(t_k) (4)

其中，P(t_k，C_i)为类别C_i、特征P(t_k)在训练样本集中出现的概率，P(t_k)为t_k在整个训练样本集中出现的概率，P(C_i)为C_i类样本文档在整个训练样本集中出现的概率，P(t_k|C_i)为t_k在C_i类样本文档中出现的条件概率。

在计算出的互信息值中选取大于阈值1.54的有用词作为特征词。

5)开方拟和检验函数(Chi-square，CHI)：

计算候选词与预设类别的相关度，将相关度大于相关度阈值的候选词作为产品特征词。

具体的，按照公式(5)计算每个有用词候选词(有用词)t_k与每个类别C_i之间的相关性，其值定义为

其中，n为训练样本集的样本文档数，P(t_k，C_i)为训练样本集中出现特征t_k并且属于类别C_i的样本文档出现的概率，

为训练样本集中不出现特征t_k并且不属于类别C_i的样本文档出现的概率，

为训练样本集中出现特征t_k并且不属于类别C_i的样本文档出现的概率，

不出现特征t_k并且属于类别C_i的样本文档出现的概率。

设定相关性阈值(如10)，筛选出大于该阈值的有用词作为特征词。

上述1)至5)能够生成五组产品特征词，对应五种产品特征文本，可显著提高产品文本特征描述待分类产品的能力，从而提高分类的准确性。

具体实施时，在步骤二之前还包括：过滤掉包含在预设停用词表中的所述候选词。

候选词中可能会存在一些会造成分类干扰、对分类没有价值的字或词(停用词)，比如语气词、助词等。因此预先设置停用词表，将这些会造成分类干扰的字或词加入停用词表中，从而过滤掉包含在预设停用词表中的候选词，可以避免不必要的计算，节省产品分类所需时间。

步骤三：根据所述产品特征词在样本文档中出现的频率、样本文档总数和包含所述产品特征词的样本文档的个数确定产品特征词权值。

具体的，通过上述五种方法选取的产品特征词后，分别对每组产品特征词根据公式(6)计算每个产品特征词的权值：

W_i＝TF_i(t，d)×n/DF(t) (6)

其中，W_i为第i个产品特征词的权重，TF_i(t，d)为产品特征词t在文档d中出现的频率，n表示文档数，DF(t)为包含产品特征词t的文档数。

步骤四：根据所述产品特征词权值生成待分类产品的产品文本特征。

具体的，根据式(6)分别计算出每种方法中求出的每个产品特征词的权值之后，即可将每个产品的描述文本转换为一个以产品特征词为维度的向量，每个维度的属性值为产品特征词的权值。每种方法会得出一个向量，即一个产品文本特征。则对于一个产品文本，根据1)至5)可以得出五种向量，即五种产品文本特征，这样就得到待分类产品的产品文本特征。采用五种产品文本特征，可提高产品分类的准确率。

步骤102：基于预训练得到的卷积神经网络模型，从产品的图像中提取产品的图像特征。

具体实施时，近年来，深度学习在图像分类方面表现突出，尤其是卷积神经网络能够自动学习图像特征，并且提取的特征稳定可靠。本发明实施例采集互联网产品中十类产品的图片信息进行分类，针织衫、T恤、外套、裤子、衬衫、连衣裙、单肩包、单鞋、商务包、靴子等，其中每类有300个产品。每个产品将会包含一条文字描述性文字和一张图片，本实施例将利用预训练好的卷积神经网络自动学习产品的图像特征。

产品图像是指包括待分类产品的影像的图像。可提取产品图像的颜色特征(比如颜色直方图)、纹理特征或形状特征等作为产品图像特征。

具体的，首先，本发明实施例采用卷积神经网络模型，由于网络参数庞大，需要大量的训练数据，因此很有必要做数据增强(图像增强)。本发明实施例采用的数据增强(图像增强)方式包括，首先对每幅产品图像按比例缩放，将短边缩放到256pixel；再对图像进行翻转；最后，随机加入光照噪声，随机改变图像的对比度、亮度等。

然后，预训练卷积神经网络：

本发明实施例采用ImageNet 2012数据集预训练卷积神经网络，网络示意图见图3，具体为五层卷积层C_i{N，S}i＝1，...，5，其中，N表示卷积核个数，S表示卷积核大小，每个卷积层都采用矫正的线性单元(Rectified linear units，ReLU)激活函数。本发明实施例采用的每个卷积层参数分别为C₁{48，5*5}，C2{128，3*3}，C3{192，3*3}，C4{128，3*3}，C5{128，3*3}，前四个卷积层后面分别连接一个最大池化(max pooling)层，即从局部范围中选取最大值的元素，第五个卷积层后接一个多尺度空间池化(Spatial Pooling Pooling，SPP)层，本实施例采用的pooling尺度为(6*6，3*3，2*2)，用于对不同大小图像卷积得到的不同大小的特征图进行pooling得到相同长度的特征向量。具体为对每幅大小不同的图像都将其平均划分为6*6、3*3、2*2个子块，用max pooling的方式提取子块特征，最终将得到6*6+3*3+2*2＝49*Feature维的特征向量，Feature是第五层卷积层输出的特征图大小。

卷积层之后连接三层全连接层，前两层FC1、FC2分别为2048个节点，最后一层为一个1000个输出的softmax分类器。训练网络采用随机梯度下降法，为了避免过拟合，在前两层全连接层采用随机丢弃比例为0.5的丢弃(dropout)策略。

再者，对预训练好的卷积神经网络进行微调：

由于训练使用的ImageNet 2012数据集是1000个类别，所以训练的卷积神经网络输出时1000-way，而本实施例对互联网产品分类总共有C类，因此将最后一层全连接层改为C个节点，再用互联网产品对网络最后一层全连接层进行微调。微调采用随机梯度下降法，动量设置为0.9，权重衰减设置为0.0005，学习率初始值设为0.01，随着迭代次数增加逐渐减小学习率。

最后，基于微调后的预训练好的卷积神经网络，从产品图像中提取产品的图像特征。

本发明实施例将测试图像输入到预训练好的卷积神经网络，卷积神经网络用来抽象图像的特征，经过五层卷积神经网络可以提取到较高层级的图像特征，通过全连接层将图像特征拉成一维向量，本发明实施例选取第二个全连接层输出作为图像特征t_j，见图4。

步骤103：将产品的文本特征与产品的图像特征融合，得到产品的特征信息；

产品的文本特征与产品的图像特征均为一个一维向量，本发明实施例将产品的文本特征与产品的图像特征拼接起来，作为第j个产品的特征P_j＝{x_j，t_j}。

步骤104：基于预训练得到的产品分类模型对产品的特征信息进行处理，得到产品的分类结果。

具体实施时，在目前众多的智能分类方法中，支持向量机技术(Support vector machine，SVM)分类和训练速度较快，模型泛化能力较强，成为机器学习相关领域的热点和重点，本发明实施例采用SVM技术。其基本思想是建立一个或一系列高维空间的超平面，使得超平面到最相邻的训练样本之间的距离最大。SVM技术中一个重要的工作就是核函数的选择。当样本特征还有异构信息，样本规模很大，多维数据的不规则或数据在高位特征空间分布的不平坦，采用单核进行映射的方式对所有样本进行处理并不合理，即需要将多个核函数进行组合及多核学习方法。

构造多核学习最常见也最常用的一种方法就是考虑多个核函数的凸组合，形如式：

式中K_j是基本核函数，M是基本和的总个数，β_j是权系数

合成核的方法有很多，本发明实施例采用Francesco提出的基于稀疏编码的多核学习方法，稀疏性的提高在一些情况下可以减少冗余，提高运算效率。

具体的，本发明通过多核学习算法按如下方式预训练得到了产品分类模型：

从训练样本集中产品样本的描述文本中提取产品样本的文本特征；

基于预训练得到的卷积神经网络模型，从训练样本集中产品样本的图像中提取产品样本的图像特征；

将产品样本的文本特征和产品样本的图像特征融合，得到产品样本的特征信息；

对产品样本的特征信息进行训练，获得基于支持向量机的产品分类模型；

其中，训练样本集包括预设类别的多个产品样本，所述产品样本包括产品样本的描述文本和图像。

根据多核学习算法，将多个产品特征信息输入到产品分类模型Model中进行处理，就能获得产品的分类标记label_j，流程图如图5。

具体实施时，由于互联网产品中每个产品会有一个文字描述和多个产品图像，因此本发明实施例利用不限输入图像大小的卷积神经网络自动学习产品图像特征，并且将图像特征与文本特征融合，最后再将每个产品的不同图像样本预测结果进行跨样本的最大化池化max pooling，选取每个产品中对类别响应最强的预测结果作为每个产品的预测类别，以便自动剔除掉噪声信息，在互联网产品分类中能提高自动分类的准确性。

本方法在AMAX服务器平台上已经做实验，在产品分类中能够获得比使用人工制定的图像特征与文本信息结合分类更高的准确率。

基于同一发明构思，本发明实施例中还提供了一种基于深度学习的产品分类装置，如下面的实施例所述。由于基于深度学习的产品分类装置解决问题的原理与基于深度学习的产品分类方法相似，因此基于深度学习的产品分类装置的实施可以参见基于深度学习的产品分类方法的实施，重复之处不再赘述。以下所使用的，术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图6是本发明实施例的基于深度学习的产品分类装置的一种结构框图，如图6所示，该产品分类装置包括：

文本特征提取模块601，用于从产品的描述文本中提取产品的文本特征；

图像特征提取模块602，用于基于预训练得到的卷积神经网络模型，从产品的图像中提取产品的图像特征；

特征信息获得模块603，用于将产品的文本特征与产品的图像特征融合，得到产品的特征信息；

分类模块604，用于基于预训练得到的产品分类模型对产品的特征信息进行处理，得到产品的分类结果。

下面对该结构进行说明。

具体实施时，如图7所示所述文本特征提取模块601具体包括，：

分词模块701，用于将产品的描述文本进行分词，获得候选词；

特征词筛选模块702，用于根据预设评估函数从所述候选词中筛选出产品特征词；

特征词权值确定模块703，用于根据所述产品特征词在样本文档中出现的频率、样本文档总数和包含所述产品特征词的样本文档的个数确定产品特征词权值；

文本特征生成模块704，用于根据所述产品特征词权值生成待分类产品的产品文本特征；

其中，所述产品的描述文本存储于样本文档中。

具体实施时，所述文本特征提取模块601还包括：

候选词过滤模块，用于过滤掉包含在预设停用词表中的所述候选词。

具体实施时，所述特征词筛选模块702具体用于：

确定所述候选词在所述样本文档中出现的次数，将出现次数大于或等于次数阈值的候选词作为产品特征词；和/或，

确定包含所述候选词的样本文档占样本文档总数的比重，将比重在预设范围内的候选词作为产品特征词；和/或，

确定所述候选词的信息增益权值，将信息增益权值大于信息增益权值阈值的候选词作为产品特征词；和/或，

确定所述候选词的互信息值，将互信息值大于互信息值阈值的候选词作为产品特征词；和/或，

确定所述候选词与所述预设类别的相关度，将相关度大于相关度阈值的候选词作为产品特征词。

具体实施时，所述特征词筛选模块702具体按如下方式确定所述候选词与所述预设类别的相关度：

根据所述训练样本集中是否出现所述候选词和所述候选词是否属于所述预设类别的概率，确定所述候选词与所述预设类别的相关度。

具体实施时，所述分类模块604具体用于按如下方式获得产品分类模型：

具体实施时，该产品分类装置还包括：

图像增强模块，用于对所述待分类产品的产品图像进行图像增强；

所述图像特征提取模块602，还用于基于预训练得到的卷积神经网络模型，从图像增强后的产品的图像中提取产品的图像特征。

具体实施时，所述图像增强模块605具体用于：

将产品的图像按预设比例缩放；

将比例缩放后的产品的图像进行翻转；

在翻转后的产品的图像中加入光照噪声；

改变加入光照噪声的产品的图像的对比度和/或亮度。

综上所述，本发明提出一种基于深度学习的(多特征)产品分类方法及装置，打破传统的以人工制定的图像描述子提取图像特征的方法，将产品图像原始数据直接输入卷积神经网络自动学习图像特征，最后将图像特征和文本特征融合，再通过SVM分类器预测产品类别，以实现产品自动分类，提高智能分类的准确性。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种基于深度学习的产品分类方法，其特征在于，包括：

从产品的描述文本中提取产品的文本特征；

基于预训练得到的卷积神经网络模型，从产品的图像中提取产品的图像特征；

将产品的文本特征与产品的图像特征融合，得到产品的特征信息；

基于预训练得到的产品分类模型对产品的特征信息进行处理，得到产品的分类结果。
如权利要求1所述的基于深度学习的产品分类方法，其特征在于，还包括：按如下方式预训练得到产品分类模型：

从训练样本集中产品样本的描述文本中提取产品样本的文本特征；

基于预训练得到的卷积神经网络模型，从训练样本集中产品样本的图像中提取产品样本的图像特征；

将产品样本的文本特征和产品样本的图像特征融合，得到产品样本的特征信息；

对产品样本的特征信息进行训练，获得基于支持向量机的产品分类模型；

其中，训练样本集包括预设类别的多个产品样本，所述产品样本包括产品样本的描述文本和图像。
如权利要求1所述的基于深度学习的产品分类方法，其特征在于，所述从产品的描述文本中提取产品的文本特征，包括：

将产品的描述文本进行分词，获得候选词；

根据预设评估函数从所述候选词中筛选出产品特征词；

根据所述产品特征词在样本文档中出现的频率、样本文档总数和包含所述产品特征词的样本文档的个数确定产品特征词权值；

根据所述产品特征词权值生成待分类产品的产品文本特征；

其中，所述产品的描述文本存储于样本文档中。
如权利要求3所述的基于深度学习的产品分类方法，其特征在于，在根据预设评估函数从所述候选词中筛选出产品特征词之前，还包括：

过滤掉包含在预设停用词表中的所述候选词。
如权利要求3所述的基于深度学习的产品分类方法，其特征在于，所述根据预设评估函数从所述候选词中筛选出产品特征词，包括：

确定所述候选词在所述样本文档中出现的次数，将出现次数大于或等于次数阈值的候选词作为产品特征词；和/或，

确定包含所述候选词的样本文档占样本文档总数的比重，将比重在预设范围内的候选词作为产品特征词；和/或，

确定所述候选词的信息增益权值，将信息增益权值大于信息增益权值阈值的候选词作为产品特征词；和/或，

确定所述候选词的互信息值，将互信息值大于互信息值阈值的候选词作为产品特征词；和/或，

确定所述候选词与所述预设类别的相关度，将相关度大于相关度阈值的候选词作为产品特征词。
如权利要求5所述的基于深度学习的产品分类方法，其特征在于，所述确定候选词与所述预设类别的相关度，包括：

根据所述训练样本集中是否出现所述候选词和所述候选词是否属于所述预设类别的概率，确定所述候选词与所述预设类别的相关度。
如权利要求1所述的基于深度学习的产品分类方法，其特征在于，还包括：

对产品的图像进行图像增强；

基于预训练得到的卷积神经网络模型，从产品的图像中提取产品的图像特征，还包括：

基于预训练的卷积神经网络模型，从图像增强后的产品的图像中提取产品的图像特征。
如权利要求7所述的基于深度学习的产品分类方法，其特征在于，所述对产品的图像进行图像增强包括：

将产品的图像按预设比例缩放；

将比例缩放后的产品的图像进行翻转；

在翻转后的产品的图像中加入光照噪声；

改变加入光照噪声的产品的图像的对比度和/或亮度。
如权利要求1所述的基于深度学习的产品分类方法，其特征在于，所述基于预训练得到的卷积神经网络模型，从产品的图像中提取产品的图像特征，具体包括：

通过五层卷积神经网络从产品的图像中提取产品特征图；

将所述产品特征图分割成不同大小的产品特征图子块；

采用最大化池化法从所述产品特征图子块中提取出产品图像特征。
一种基于深度学习的产品分类装置，其特征在于，包括：

文本特征提取模块，用于从产品的描述文本中提取产品的文本特征；

图像特征提取模块，用于基于预训练得到的卷积神经网络模型，从产品的图像中提取产品的图像特征；

特征信息获得模块，用于将产品的文本特征与产品的图像特征融合，得到产品的特征信息；

分类模块，用于基于预训练得到的产品分类模型对产品的特征信息进行处理，得到产品的分类结果。
如权利要求10所述的基于深度学习的产品分类装置，其特征在于，所述分类模块具体用于按如下方式获得产品分类模型：

从训练样本集中产品样本的描述文本中提取产品样本的文本特征；

基于预训练得到的卷积神经网络模型，从训练样本集中产品样本的图像中提取产品样本的图像特征；

将产品样本的文本特征和产品样本的图像特征融合，得到产品样本的特征信息；

对产品样本的特征信息进行训练，获得基于支持向量机的产品分类模型；

其中，训练样本集包括预设类别的多个产品样本，所述产品样本包括产品样本的描述文本和图像。
如权利要求10所述的基于深度学习的产品分类装置，其特征在于，所述文本特征提取模块具体包括：

分词模块，用于将产品的描述文本进行分词，获得候选词；

特征词筛选模块，用于根据预设评估函数从所述候选词中筛选出产品特征词；

特征词权值确定模块，用于根据所述产品特征词在样本文档中出现的频率、样本文档总数和包含所述产品特征词的样本文档的个数确定产品特征词权值；

文本特征生成模块，用于根据所述产品特征词权值生成待分类产品的产品文本特征；

其中，所述产品的描述文本存储于样本文档中。
如权利要求12所述的基于深度学习的产品分类装置，其特征在于，所述文本特征提取模块还包括：

候选词过滤模块，用于过滤掉包含在预设停用词表中的所述候选词。
如权利要求12所述的基于深度学习的产品分类装置，其特征在于，所述特征词筛选模块具体用于：

确定所述候选词在所述样本文档中出现的次数，将出现次数大于或等于次数阈值的候选词作为产品特征词；和/或，

确定包含所述候选词的样本文档占样本文档总数的比重，将比重在预设范围内的候选词作为产品特征词；和/或，

确定所述候选词的信息增益权值，将信息增益权值大于信息增益权值阈值的候选词作为产品特征词；和/或，

确定所述候选词的互信息值，将互信息值大于互信息值阈值的候选词作为产品特征词；和/或，

确定所述候选词与所述预设类别的相关度，将相关度大于相关度阈值的候选词作为产品特征词。
如权利要求14所述的基于深度学习的产品分类装置，其特征在于，所述特征词筛选模块具体按如下方式确定所述候选词与所述预设类别的相关度：

根据所述训练样本集中是否出现所述候选词和所述候选词是否属于所述预设类别的概率，确定所述候选词与所述预设类别的相关度。
如权利要求10所述的基于深度学习的产品分类装置，其特征在于，还包括：

图像增强模块，用于对所述待分类产品的产品图像进行图像增强；

所述图像特征提取模块，还用于基于预训练得到的卷积神经网络模型，从图像增强后的产品的图像中提取产品的图像特征。
如权利要求16所述的基于深度学习的产品分类装置，其特征在于，所述图像增强模块具体用于：

将产品的图像按预设比例缩放；

将比例缩放后的产品的图像进行翻转；

在翻转后的产品的图像中加入光照噪声；

改变加入光照噪声的产品的图像的对比度和/或亮度。
如权利要求16所述的基于深度学习的产品分类装置，其特征在于，所述图像特征提取模块具体用于：

通过五层卷积神经网络从产品的图像中提取产品特征图；

将所述产品特征图分割成不同大小的产品特征图子块；

采用最大化池化法从所述产品特征图子块中提取出产品图像特征。