CN109816030A - 一种基于受限玻尔兹曼机的图像分类方法及装置 - Google Patents
一种基于受限玻尔兹曼机的图像分类方法及装置 Download PDFInfo
- Publication number
- CN109816030A CN109816030A CN201910092833.8A CN201910092833A CN109816030A CN 109816030 A CN109816030 A CN 109816030A CN 201910092833 A CN201910092833 A CN 201910092833A CN 109816030 A CN109816030 A CN 109816030A
- Authority
- CN
- China
- Prior art keywords
- image
- boltzmann machine
- classification
- limited boltzmann
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明提供一种基于受限玻尔兹曼机的图像分类方法及装置,该分类方法包括以下步骤:获取图像样本训练集;将训练集按照类别划分为C个数据集,对每个数据集进行受限玻尔兹曼机训练,得到C个受限玻尔兹曼机模型和对应的训练参数;将训练集中的图像样本输入到各受限玻尔兹曼机模型中,对训练集中的各图像样本进行特征提取;利用提取到的训练集中各图像样本的特征及其对应类别标签对分类模型进行训练;将待测图像样本输入到各受限玻尔兹曼机模型中进行特征提取,将提取出的待测图像样本特征输入到训练好的分类模型,实现对待测试图像样本的分类。本发明提供的技术方案,能够对待测试图像样本更高精度的分类,解决现有技术中图像分类精度低的问题。
Description
技术领域
本发明属于基于玻尔兹曼机的图像分类技术领域,具体涉及一种基于受限玻尔兹曼机的图像分类方法及装置。
背景技术
基于深度学习的图像分类技术是机器学习和计算机视觉领域的重要研究课题。图像分类技术是指借助计算机对图像数据进行特征提取,形成一种对图像内容的描述,并根据这种描述对图像所属类别进行划分的图像处理方法。利用深度神经网络(NN)模型,例如:卷积神经网络(CNN)、受限玻尔兹曼机模型(RBM)、深度信念网络模型(DBN)、自动编码器(AE)等,进行图像特征的自动学习,可以有效提高分类效果。因此,基于深度学习的图像分类技术互联网应用中的图像检索、医疗图像的自动诊断、人脸识别和视频分析等领域都具有广阔的应用前景。
受限玻尔兹曼机模型是一个二分无向图模型,由输入层与隐藏层组成。这两层之间的节点进行完全连接,而输入层和隐藏层的自身节点之间没有连接,如图1所示。受限玻尔兹曼机模型通过对比发散(CD)算法以无监督的方式进行训练。除了作为构建深模型的基本构建块之外,每个受限玻尔兹曼机单元还可以看作是一个特征提取器,将原始训练和测试样本经过受限玻尔兹曼机进行特征提取,可以获取与原始输入样本相关的最顶层隐藏层的概率,作为新的训练和测试样本。采用特征提取后的样本进行分类模型的训练和预测,可以提高图像的分类精度。自2006年Hinton等人提出了受限玻尔兹曼机模型的分层训练策略后,受限玻尔兹曼机模型及其变体因其能够去除图像繁杂冗余信息,获取图像最本质特征表示,而受到研究者广泛关注。
传统受限玻尔兹曼机模型,在所有训练数据集随机抽取小批量样本进行模型训练,如授权公告号为CN106991429B的中国发明专利文件所公开的图像识别深度新年网络结构的构建方法中,在训练样本时就是将训练样本图像分批输入到受限玻尔兹曼机模型中进行训练的。小批量样本易包含来自不同类别的易混淆样本。以MNIST数据集中类别“3”和“5”中样本为例,它们下半部形状是相似的,如图2所示,因此基于受限玻尔兹曼机摩擦的特征难以区分类似类别“3”和“5”间的混淆样本,该问题通常称为“特征共享(FS)”问题。因此,基于传统受限玻尔兹曼机模型的特征提取方法易导致分类器性能偏弱,影响分类精度。
发明内容
本发明的目的在于提供一种基于受限玻尔兹曼机的图像分类方法及装置,用于解决现有技术中图像分类精度低的问题。
为实现上述目的,本发明提供的技术方案是:
一种基于受限玻尔兹曼机的图像分类方法,该分类方法包括以下步骤:
(1)获取图像样本训练集,该训练集中包括C个类别的图像,每个类别包含有相应数量的训练图像;
(2)将训练集按照类别划分为C个数据集,对每个数据集进行受限玻尔兹曼机训练,得到C个受限玻尔兹曼机模型和对应的训练参数;
(3)将训练集中的图像样本输入到各受限玻尔兹曼机模型中,对训练集中的各图像样本进行特征提取,得到图像样本在各受限玻尔兹曼机模型中的特征,图像样本的特征为:
其中表示图像样本训练集中第i个类别的第j个图像样本,ftri T表示该图像样本在第i个受限玻尔兹曼机模型中提取到的特征;
(4)利用步骤(3)中提取到的训练集中各图像样本的特征及其对应类别标签对分类模型进行训练;
(5)将待测的图像样本输入到各受限玻尔兹曼机模型中,对待测试图像样本进行特征提取,并将提取出的待测图像样本特征输入到训练好的分类模型中,实现对待测试图像样本的分类。
本发明所提供的技术方案,通过对图像样本训练集进行分类,得到多个类别的受限玻尔兹曼机模型,然后到图像样本在各受限玻尔兹曼机模型中的特征,并根据该特征即对于类别标签对各分类模型进行训练,最后采用各受限玻尔兹曼机模型对待测图像样本进行分类,从而避免待测图像样本中某些图形局部相同或整体相似而造成分类混淆的问题,提高图像分类的精度。
进一步的,为了使输入到受限玻尔兹曼机图像样本的大小、分辨率一致,所述步骤(1)还包括对训练集中的样本图像进行预处理的步骤,该预处理包括对样本图像进行分辨率一致的缩放处理过程和对缩放处理后的样本进行归一化的过程;所述步骤(5)在对待测试图像进行特征提取之前需要对待测试图像样本进行预处理,该预处理包括对样本图像进行分辨率一致的缩放处理过程和对缩放处理后的样本图像进行归一化的过程。
进一步的,所述受限玻尔兹曼机模型为一个两层的玻尔兹曼机模型。
采用两层的玻尔兹曼机模型,能够提高对图像分类的精度。
进一步的,所述步骤(3)中提取的特征为
为第k类别对应第一层受限玻尔兹曼机模型中隐层单元和可见单元之间的交互项,为第k类别对应第一层受限玻尔兹曼机模型中可见层的偏差,为第k类别对应第一层受限玻尔兹曼机模型中隐层的偏差,为第k类别对应第一层受限玻尔兹曼机模型中隐层单元和可见单元之间的交互项,为第k类别对应第二层受限玻尔兹曼机模型中可见层的偏差,为第k类别对应第二层受限玻尔兹曼机模型中隐层的偏差,σ(x)为sigmoid激活函数。
进一步的,所述步骤(3)和步骤(5)进行特征提取的受限玻尔兹曼机模型为高斯-伯努利受限玻尔兹曼机模型,是将训练后的受限玻尔兹曼机模型扩展得到。
采用高斯-伯努利受限玻尔兹曼机模型,能够提高对图像分类的精度。
进一步的,所述分类模型为支持向量机。
采用支持向量机作为分类模型,能够加快对待处理图像分类的速度,提高工作效率。
一种基于受限玻尔兹曼机的图像分类装置,包括处理器和存储器,所述存储器上存储有用于在所述处理器上执行的计算机程序,所述处理器执行该计算机程序时实现基于受限玻尔兹曼机的图像分类方法,该分类方法包括如下步骤:
(1)获取图像样本训练集,该训练集中包括C个类别的图像,每个类别包含有相应数量的训练图像;
(2)将训练集按照类别划分为C个数据集,对每个数据集进行受限玻尔兹曼机训练,得到C个受限玻尔兹曼机模型和对应的训练参数,得到图像样本在各受限玻尔兹曼机模型中的特征,图像样本的特征为:
其中表示图像样本训练集中第i个类别的第j个图像样本,ftri T表示该图像样本在第i个受限玻尔兹曼机模型中提取到的特征;
(3)将训练集中的图像样本输入到各受限玻尔兹曼机模型中,对训练集中的各图像样本进行特征提取;
(4)利用步骤(3)中提取到的训练集中各图像样本的特征及其对应类别标签对分类模型进行训练;
(5)将待测的图像样本输入到各受限玻尔兹曼机模型中,对待测试图像样本进行特征提取,并将提取出的待测图像样本特征输入到训练好的分类模型中,实现对待测试图像样本的分类。
本发明所提供的技术方案,通过对图像样本训练集进行分类,得到多个类别的受限玻尔兹曼机模型,然后到图像样本在各受限玻尔兹曼机模型中的特征,并根据该特征即对于类别标签对各分类模型进行训练,最后采用各受限玻尔兹曼机模型对待测图像样本进行分类,从而避免待测图像样本中某些图形局部相同或整体相似而造成分类混淆的问题,提高图像分类的精度。
进一步的,为了使输入到受限玻尔兹曼机图像样本的大小、分辨率一致,所述步骤(1)还包括对训练集中的样本图像进行预处理的步骤,该预处理包括对样本图像进行分辨率一致的缩放处理过程和对缩放处理后的样本进行归一化的过程;所述步骤(5)在对待测试图像进行特征提取之前需要对待测试图像样本进行预处理,该预处理包括对样本图像进行分辨率一致的缩放处理过程和对缩放处理后的样本图像进行归一化的过程。
进一步的,所述受限玻尔兹曼机模型为一个两层的玻尔兹曼机模型。
采用两层的玻尔兹曼机模型,能够提高对图像分类的精度。
进一步的,所述步骤(3)和步骤(5)进行特征提取的受限玻尔兹曼机模型为高斯-伯努利受限玻尔兹曼机模型,是将训练后的受限玻尔兹曼机模型扩展得到。
采用高斯-伯努利受限玻尔兹曼机模型,能够提高对图像分类的精度。
附图说明
图1为现有技术中受限玻尔兹曼机的示意图;
图2为现有技术中MNIST数据的示意图;
图3为本发明方法实施例中基于受限玻尔兹曼机的图像分类方法的流程图;
图4为本发明方法实施例中自然图像Scene-15数据集;
图5为本发明方法实施例中在Scene-15数据集上不同维度下CS-GBRBM和DRBM方法的分类率;
图6a为本发明方法实施例中在Scene-15数据集上不同维度下CS-GBRBM的分类率;
图6b为本发明方法实施例中在Coil-100数据集上不同维度下CS-GBRBM的分类率;
图7a为本发明方法实施例中来自CS-RBM模型的特征辨别的可视化图
图7b为本发明方法实施例中来自CI-RBM模型的特征辨别的可视化图。
具体实施方式
下面结合具体实施方式对本发明的技术方案作进一步说明。
方法实施例:
本实施例一种基于受限玻尔兹曼机的图像分类方法,通过对图像样本训练集进行分类,得到多个类别的受限玻尔兹曼机模型,然后到图像样本在各受限玻尔兹曼机模型中的特征,并根据该特征即对于类别标签对各分类模型进行训练,最后采用各受限玻尔兹曼机模型对待测图像样本进行分类,从而避免待测图像样本中某些图形局部相同或整体相似而造成分类混淆的问题,提高图像分类的精度。
本实施例所提供的受限玻尔兹曼的图像分类方法,其流程如图3所示,包括如下步骤:
(1)获取图像样本训练集,该训练集中包括C个类别的图像,每个类别包含有相应数量的训练图像。
设获取的图像样本训练集为其中为图像样本训练集中第i个类别第j个图像样本,为样本图像的类别。
为了减少图像分类过程的复杂程度,提高图像分类的效率,在得到图像样本训练集后对其进行预处理,该预处理包含如下步骤:
对训练集中图像样本进行缩放处理使其分辨率一致,得到缩放处理后的图像样本
将缩放处理后的进行归一化处理,得到预处理后的图像样本训练集
(2)将训练集按照类别划分为C个数据集,对每个数据集进行受限玻尔兹曼机训练,得到C个受限玻尔兹曼机和对应的训练参数。
对于C个类别的图像,进行受限玻尔兹曼机训练时采用的是两层受限玻尔兹曼机模型,得到C个两层受限玻尔兹曼机模型,其中第i类样本集训练得到的受限玻尔兹曼机参数为和其中Wi (1)为第i类样本对应的第一层受限玻尔兹曼机模型中隐层单元和可见单元之间的交互项,为第i类样本对应的第一层受限玻尔兹曼机模型中可见层的偏差,为第i类样本对应的第一层受限玻尔兹曼机模型中隐层的偏差,Wi (2)为第i类样本对应的第二层受限玻尔兹曼机模型中隐层单元和可见单元之间的交互项,为第i类样本对应的第二层受限玻尔兹曼机模型中可见层的偏差,为第i类样本对应的第一层受限玻尔兹曼机模型中隐层的偏差。
(3)将训练集中的图像样本输入到各受限玻尔兹曼机模型中,对训练集中的各图像样本进行特征提取。
对于C个类别的图像,第i类样本集的特征为:
级联C个类别受限玻尔兹曼机特征,将图像样本训练集重写为:
(4)利用步骤(3)中提取到的训练集中各图像样本的特征及其对应类别标签对分类模型进行训练;
本实施例中采用支持向量机SVM作为分类模型,采用如下公式对该支持向量机SVM进行训练:
支持向量机的罚分参数选自{0.05,0.1,0.5,1}。
作为其他实施方式,也可以采用其他的分类器作为分类模型,如采用k近邻分离器、逻辑斯特回归、softmax、极限学习机等分类器。
(5)将待测的图像样本输入到各受限玻尔兹曼机模型中,对待测试图像样本进行特征提取,并将提取出的待测图像样本特征输入到训练好的分类模型中,实现对待测试图像样本的分类。
在对待测试图像样本进行特征提取时,先对其进行预处理,该预处理包括如下步骤:
对待测试图像样本{(zi)}进行缩放处理,使其分辨率一致,得到缩放处理后的待测试图像样本{(z1i)};
对缩放处理后的待测试图像样本{(z1i)}进行归一化处理,得到预处理后的待测试图像样本{(zi)}。
然后计算每个类别中测试样品zi的变换特征为:
其中k为样本集类别,取值范围为1至C;为第k类别对应第一层受限玻尔兹曼机模型中隐层单元和可见单元之间的交互项,为第k类别对应第一层受限玻尔兹曼机模型中可见层的偏差,为第k类别对应第一层受限玻尔兹曼机模型中隐层的偏差,为第k类别对应第一层受限玻尔兹曼机模型中隐层单元和可见单元之间的交互项,为第k类别对应第二层受限玻尔兹曼机模型中可见层的偏差,为第k类别对应第二层受限玻尔兹曼机模型中隐层的偏差,σ(x)为sigmoid激活函数。
级联C个类别受限玻尔兹曼机特征,将测试数据集重写为
将训练后获取的SVM模型对得到的测试数据集进行测试,将C个类别中一个对应类别分配给zi。
在上述基于受限玻尔兹曼机的图像分类方法的步骤(3)和步骤(5)中进行特征提取时采用的受限玻尔兹曼机为高斯-伯努利受限玻尔兹曼机,是将训练后的受限玻尔兹曼机模型扩展得到的,扩展过程为:
受限玻尔兹曼机能量函数为:
将受限玻尔兹曼机能量函数中的二元神经元vi(i=1,2,…,D)修改为对实值可见神经元,则能量函数重新表述如下:
其中,D为可视层单元数量,F为隐含层单元数量,h为隐含层单元状态,σ为与高斯可见点vi相关的标准偏差,wij表示可见单元i和隐藏单元j之间的交互项;ai和bj分别是第i可见层与第j隐藏层的偏差,v为可视层的状态变量,θ为受限玻尔兹曼机的参数。
为了体现本实施例所提供的基于受限玻尔兹曼机的图像分类方法的可信度和分类性能,实验选用四类基准数据集:MNIST数据集、USPS数据集,场景图像Scene-15数据集和目标图像Coil-100数据集,执行分类任务。
MNIST数据集包括10个手写数字类别(0-9),其中包括60000个训练样本图像和10000个测试图像。将MNIST数据集中每个样本的像素规模统一调整为28×28,并将没有图像样本由矩阵形式堆叠为单列向量,维数为784。对于CS-RBM学习率设定为0.05,CD(对比度发散)设定为3,通过交叉验证选择权重衰减,并设为0.00001。实验中,将训练集划分为100个批量进行模型训练,所有实验中都没有监督微调。
USPS是美国邮政服务数字识别数据集,USPS数据集包含10类手写数字(0-9)的标准化灰度图像,每幅图像像素为16×16。该数据集包含7291幅训练集图像和2007幅测试集图像。训练集中每个类别约含500-1000幅图像。
自然图像Scene-15数据集,由来自15个场景类别的4,485幅图像组成,如图4所示。对于Scene-15,将每幅图像的维数设为3000。每个类随机选择100个样本作为训练集,将每个类的剩余样本作为测试集。
Coil-100是一个物体识别数据集,由100个具有不同光照条件的类别组成,每个类别含有72幅图像,共7200幅图像样本集。每幅图像的像素规模为32×32。实验中每个类别中随机选择30幅图像作为训练集,其余图像作为测试集。
实验所用计算机硬件配置为:Intel Core(TM)i5-7300HQ CPU主频2.5GHz,内存16GB,采用Matlab2014b软件编程仿真。为减少误差对实验结果的影响,取每组实验中10次分类结果的平均值。实验结果表1-4所示,其中表1为MNIST数据集上不同方法的分类率比较表,表2为USPS数据集上不同方法的分类率比较表,表3为Scene-15数据集上不同方法的分类率比较表,表4为Coil-100数据集上不同方法的分类率比较表。
表1
方法 | 错误率(%) | 方法 | 错误率(%) |
RBM | 3.39 | DBN | 1.25 |
DRBM | 1.81 | DBM | 0.95 |
RBM+NNet | 1.41 | SVM(Gaussion kernel) | 1.4 |
HDRBM | 1.28 | 2-layer NN | 1.6 |
Sparse HDRBM | 1.16 | Pairwise linear classifier | 7.6 |
Subspace RBM | 2.63 | LeNet5[no distortions] | 0.95 |
3-layer NN | 1.53 | CI-RBM(one layer) | 1.45 |
1-layer NN | 12 | CS-RBM | 1.23 |
CNN,[no distortions] | 0.83 | CS-RBM+CI-RBM | 1.12 |
Original feature+linear SVM | 5.2 | CI-RBM(two layers) | 1.34 |
在表1中,SVM(Gaussion kernel)为支持向量机(高斯核),RBM为受限玻尔兹曼机,DRBM为判别受限玻尔兹曼机,RBM+Nnet为受限玻尔茨曼机+神经网络,HDRBM为类别指导受限玻尔兹曼机,Sparse HDRBM为稀疏类别指导受限玻尔兹曼机,Subspace RBM为子空间受限玻尔兹曼机,3-layer NN为三层神经网络,2-layer NN为两层神经网络,1-layer NN为一层神经网络,CNN[no distortions]为卷积神经网络[无扰动],Original feature+linearSVM为初始特征+线性支持向量机,CI-RBM(two layers)为类别具体化受限玻尔茨曼机(两层),CS-RBM+CI-RBM为类别具体化受限玻尔茨曼机+类别独立受限玻尔茨曼机,LeNet5[nodistortions]为五层卷积神经网络[无扰动],Pairwise linear classifier为成对线性分类器,CI-RBM(one layer)为单层类别独立受限玻尔茨曼机,CS-RBM为类别具体化受限玻尔茨曼机,CI-RBM(two layers)为双层类别独立受限玻尔茨曼机,DBN为深度信念网络,DBM为深度玻尔兹曼机。
表2
方法 | 错误率(%) | 方法 | 错误率(%) |
Nearest Neighbor | 5.6 | Kernel Densities | 5.5 |
Relevant vectors | 5.5 | Mixture densities | 7.2 |
CI-RBM | 4.73 | CS-RBM | 4.58 |
CS-RBM+CI-RBM | 4.18 |
表2中Nearest Neighbor为最近邻分类器,Kernel Densities为核密度方法,Mixture densities为混合密度方法,Relevant vectors为相关向量法。
表3
方法 | 正确率(%) | 方法 | 正确率(%) |
SVM(Gaussion kernel) | 93.6 | SRC | 91.8 |
CRC | 92.3 | LLC | 89.2 |
LC KSVD1 | 90.4 | LC KSVD2 | 92.9 |
LRC | 91.9 | RPCA | 92.1 |
CI-GBRBM | 96.7 | CS-GBRBM | 98.5 |
表4
方法 | 正确率(%) | 方法 | 正确率(%) |
SVM(Gaussion kernel) | 92.44 | SRC | 93.91 |
CRC | 87.72 | LLC | 93.84 |
DLSR | 93.24 | SLRR | 76.47 |
LRC | 92.63 | LatLRR | 92.47 |
CI-GBRBM | 95.02 | CS-GBRBM | 95.79 |
表3和表4中LC_KSVD1为标签一致性奇异值分解方法1,LC_KSVD2为标签一致性奇异值分解方法2,RPCA为鲁棒主成分分析方法,CI-GBRBM为类别独立的高斯-伯努利受限玻尔兹曼机,CS-GBRBM为类别无关的高斯-伯努利受限玻尔兹曼机,SVM(Gaussion kernel)为支持向量机(高斯核),CRC为协同分类方法,SRC为稀疏表示分类方法,LLC为局部线性编码,LRC为线性回归分类方法,DLSR为判别最小二乘回归,LatLRR为潜变量低秩模型,SLRR为稀疏低秩回归模型。
为考察隐含层节点数对算法性能的影响,以Scene-15数据集为例,通过改变CS-GBRBM(类别无关的高斯-伯努利受限玻尔兹曼机)和DRBM(判别受限玻尔兹曼机)的隐藏节点数来进行实验。具体来说,为了公平比较,我们使用单层架构来实现上述两种方法;CS-GBRBM的隐藏节点数取自:
D1={200;500;1000;2000;3000;4000;5000};
因此,级联特征(用于线性SVM训练)的尺寸为:
D2={200×15;500×15;1000×15;2000×15;3000×15;4000×15;5000×15;6000×15g};
DRBM的隐藏节点也取自D2。
实验结果如图5所示,Scene-15数据集在上不同维度下通过改变CS-GBRBM和DRBM隐藏节点数所得到的分类精度与特征纬度之间的关系。
为了考察算法中所提出的类分组过程的有效性,我们分别以Scene-15和Coil-100为例,在一层特殊类别受限玻尔兹曼机特征提取模型下进行实验。对于Scene-15数据集,将组数量g设为5和每组中类别的数量n设置为3,实验得到的分类精度与特征纬度之间的对应关系如图6a所示。对于Coil-100数据集,将组数量g和每组中类别的数量n分别设置为25和4。对于Scene-15,隐藏节点数取自:
D3={200×3;500×3;1000×3;2000×3;3000×3;4000×3;5000×3;6000×3};
对于Coil-100,隐藏节点数取自:
D4={50;100;200;300;400;500};
实验得到的分类精度与特征纬度之间的对应关系如图6b所示。
为对比所设计方法特殊类别受限玻尔兹曼机(CS-RBM)与类别独立受限玻尔兹曼机(CI-RBM)间特征判别能力,在MNIST数据集中选取8个类别(0-7)的样本集进行对比实验。从MNIST数据集的测试样本集中为每个类随机选择100、300和500个样本,并采用CS-RBM抽取三组特征。同样,采用CI-RBM为相同数据集抽取另外三组特征。CS-RBM和CI-RBM的特征维数分别为5000和2000。最后通过PCA将上述特征维数减小到2D,并在2D空间上绘制这些2D点,以观察两种特征的可分离性。实验结果如图7a和图7b所示,其中图7a为每类100个样本的可分离性示意图,图7b为每类300个样本的可分离性示意图。
装置实施例:
本实施例提供一种基于受限玻尔兹曼机的图像分类装置,包括处理器和存储器,存储器上存储有用于在处理器上执行的计算机程序,处理器执行该计算机程序时实现如上述方法实施例中所提供的基于受限玻尔兹曼机的图像分类方法。
以上给出了本发明涉及的具体实施方式,但本发明不局限于所描述的实施方式。在本发明给出的思路下,采用对本领域技术人员而言容易想到的方式对上述实施例中的技术手段进行变换、替换、修改,并且起到的作用与本发明中的相应技术手段基本相同、实现的发明目的也基本相同,这样形成的技术方案是对上述实施例进行微调形成的,这种技术方案仍落入本发明的保护范围内。
Claims (10)
1.一种基于受限玻尔兹曼机的图像分类方法,其特征在于,该分类方法包括以下步骤:
(1)获取图像样本训练集,该训练集中包括C个类别的图像,每个类别包含有相应数量的训练图像;
(2)将训练集按照类别划分为C个数据集,对每个数据集进行受限玻尔兹曼机训练,得到C个受限玻尔兹曼机模型和对应的训练参数;
(3)将训练集中的图像样本输入到各受限玻尔兹曼机模型中,对训练集中的各图像样本进行特征提取,得到图像样本在各受限玻尔兹曼机模型中的特征,图像样本的特征为:
其中表示图像样本训练集中第i个类别的第j个图像样本,ftri T表示该图像样本在第i个受限玻尔兹曼机模型中提取到的特征;
(4)利用步骤(3)中提取到的训练集中各图像样本的特征及其对应类别标签对分类模型进行训练;
(5)将待测的图像样本输入到各受限玻尔兹曼机模型中,对待测试图像样本进行特征提取,并将提取出的待测图像样本特征输入到训练好的分类模型中,实现对待测试图像样本的分类。
2.根据权利要求1所述的基于受限玻尔兹曼机的图像分类方法,其特征在于,所述步骤(1)还包括对训练集中的样本图像进行预处理的步骤,该预处理包括对样本图像进行分辨率一致的缩放处理过程和对缩放处理后的样本进行归一化的过程;所述步骤(5)在对待测试图像进行特征提取之前需要对待测试图像样本进行预处理,该预处理包括对样本图像进行分辨率一致的缩放处理过程和对缩放处理后的样本图像进行归一化的过程。
3.根据权利要求1所述的基于受限玻尔兹曼机的图像分类方法,其特征在于,所述受限玻尔兹曼机模型为一个两层的玻尔兹曼机模型。
4.根据权利要求3所述的基于受限玻尔兹曼机的图像分类方法,其特征在于,所述步骤(3)中提取的特征为:
为第k类别对应第一层受限玻尔兹曼机模型中隐层单元和可见单元之间的交互项,
为第k类别对应第一层受限玻尔兹曼机模型中可见层的偏差,为第k类别对应第一层受限玻尔兹曼机模型中隐层的偏差,为第k类别对应第一层受限玻尔兹曼机模型中隐层单元和可见单元之间的交互项,为第k类别对应第二层受限玻尔兹曼机模型中可见层的偏差,为第k类别对应第二层受限玻尔兹曼机模型中隐层的偏差,σ(x)为sigmoid激活函数。
5.根据权利要求1所述的基于受限玻尔兹曼机的图像分类方法,其特征在于,所述步骤(3)和步骤(5)进行特征提取的受限玻尔兹曼机模型为高斯-伯努利受限玻尔兹曼机模型,是将训练后的受限玻尔兹曼机模型扩展得到。
6.根据权利要求1所述的基于受限玻尔兹曼机的图像分类方法,其特征在于,所述分类模型为支持向量机。
7.一种基于受限玻尔兹曼机的图像分类装置,其特征在于,包括处理器和存储器,所述存储器上存储有用于在所述处理器上执行的计算机程序,所述处理器执行该计算机程序时实现基于受限玻尔兹曼机的图像分类方法,该分类方法包括如下步骤:
(1)获取图像样本训练集,该训练集中包括C个类别的图像,每个类别包含有相应数量的训练图像;
(2)将训练集按照类别划分为C个数据集,对每个数据集进行受限玻尔兹曼机训练,得到C个受限玻尔兹曼机模型和对应的训练参数,得到图像样本在各受限玻尔兹曼机模型中的特征,图像样本的特征为:
其中表示图像样本训练集中第i个类别的第j个图像样本,ftri T表示该图像样本在第i个受限玻尔兹曼机模型中提取到的特征;
(3)将训练集中的图像样本输入到各受限玻尔兹曼机模型中,对训练集中的各图像样本进行特征提取;
(4)利用步骤(3)中提取到的训练集中各图像样本的特征及其对应类别标签对分类模型进行训练;
(5)将待测的图像样本输入到各受限玻尔兹曼机模型中,对待测试图像样本进行特征提取,并将提取出的待测图像样本特征输入到训练好的分类模型中,实现对待测试图像样本的分类。
8.根据权利要求7所述的基于受限玻尔兹曼机的图像分类装置,其特征在于,所述步骤(1)还包括对训练集中的样本图像进行预处理的步骤,该预处理包括对样本图像进行分辨率一致的缩放处理过程和对缩放处理后的样本进行归一化的过程;所述步骤(5)在对待测试图像进行特征提取之前需要对待测试图像样本进行预处理,该预处理包括对样本图像进行分辨率一致的缩放处理过程和对缩放处理后的样本图像进行归一化的过程。
9.根据权利要求7所述的基于受限玻尔兹曼机的图像分类装置,其特征在于,所述受限玻尔兹曼机模型为一个两层的玻尔兹曼机模型。
10.根据权利要求7所述的基于受限玻尔兹曼机的图像分类装置,其特征在于,所述步骤(3)和步骤(5)进行特征提取的受限玻尔兹曼机模型为高斯-伯努利受限玻尔兹曼机模型,是将训练后的受限玻尔兹曼机模型扩展得到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910092833.8A CN109816030A (zh) | 2019-01-30 | 2019-01-30 | 一种基于受限玻尔兹曼机的图像分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910092833.8A CN109816030A (zh) | 2019-01-30 | 2019-01-30 | 一种基于受限玻尔兹曼机的图像分类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109816030A true CN109816030A (zh) | 2019-05-28 |
Family
ID=66605834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910092833.8A Pending CN109816030A (zh) | 2019-01-30 | 2019-01-30 | 一种基于受限玻尔兹曼机的图像分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109816030A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298401A (zh) * | 2019-06-28 | 2019-10-01 | 上海电力学院 | 一种基于模糊和去冗余的受限玻尔兹曼机图像分类方法 |
CN110909820A (zh) * | 2019-12-02 | 2020-03-24 | 齐鲁工业大学 | 基于自监督学习的图像分类方法及系统 |
CN111027603A (zh) * | 2019-11-27 | 2020-04-17 | 湖北工业大学 | 一种改进gan模型的图像生成方法 |
CN111291634A (zh) * | 2020-01-17 | 2020-06-16 | 西北工业大学 | 基于卷积受限玻尔兹曼机的无人机图像目标检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091181A (zh) * | 2014-07-15 | 2014-10-08 | 中国科学院合肥物质科学研究院 | 基于深度受限玻尔兹曼机的害虫图像自动识别方法及系统 |
CN106529461A (zh) * | 2016-11-07 | 2017-03-22 | 湖南源信光电科技有限公司 | 一种基于积分特征通道和svm训练器的车型识别算法 |
CN106897737A (zh) * | 2017-01-24 | 2017-06-27 | 北京理工大学 | 一种基于超限学习机的高光谱遥感图像地物分类方法 |
CN106980871A (zh) * | 2016-01-13 | 2017-07-25 | 福特全球技术公司 | 应用到道路场景图像的低保真分类器和高保真分类器 |
CN108694415A (zh) * | 2018-05-16 | 2018-10-23 | 南京大学 | 图像特征提取方法、装置及水源图像分类方法、装置 |
-
2019
- 2019-01-30 CN CN201910092833.8A patent/CN109816030A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091181A (zh) * | 2014-07-15 | 2014-10-08 | 中国科学院合肥物质科学研究院 | 基于深度受限玻尔兹曼机的害虫图像自动识别方法及系统 |
CN106980871A (zh) * | 2016-01-13 | 2017-07-25 | 福特全球技术公司 | 应用到道路场景图像的低保真分类器和高保真分类器 |
CN106529461A (zh) * | 2016-11-07 | 2017-03-22 | 湖南源信光电科技有限公司 | 一种基于积分特征通道和svm训练器的车型识别算法 |
CN106897737A (zh) * | 2017-01-24 | 2017-06-27 | 北京理工大学 | 一种基于超限学习机的高光谱遥感图像地物分类方法 |
CN108694415A (zh) * | 2018-05-16 | 2018-10-23 | 南京大学 | 图像特征提取方法、装置及水源图像分类方法、装置 |
Non-Patent Citations (1)
Title |
---|
GUO-SEN XIE,XIAO-BO JIN,ET AL.: ""From Class-Specific to Class-Mixture: Cascaded Feature Representations via Restricted Boltzmann Machine Learning"", 《IEEE ACCESS》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298401A (zh) * | 2019-06-28 | 2019-10-01 | 上海电力学院 | 一种基于模糊和去冗余的受限玻尔兹曼机图像分类方法 |
CN111027603A (zh) * | 2019-11-27 | 2020-04-17 | 湖北工业大学 | 一种改进gan模型的图像生成方法 |
CN111027603B (zh) * | 2019-11-27 | 2022-07-05 | 湖北工业大学 | 一种改进gan模型的图像生成方法 |
CN110909820A (zh) * | 2019-12-02 | 2020-03-24 | 齐鲁工业大学 | 基于自监督学习的图像分类方法及系统 |
CN111291634A (zh) * | 2020-01-17 | 2020-06-16 | 西北工业大学 | 基于卷积受限玻尔兹曼机的无人机图像目标检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ali et al. | Boosted NNE collections for multicultural facial expression recognition | |
CN109816030A (zh) | 一种基于受限玻尔兹曼机的图像分类方法及装置 | |
CN103955707B (zh) | 一种基于深度层次特征学习的海量图像分类系统 | |
CN104933428B (zh) | 一种基于张量描述的人脸识别方法及装置 | |
Zhang et al. | Unsupervised difference representation learning for detecting multiple types of changes in multitemporal remote sensing images | |
CN109086886A (zh) | 一种基于极限学习机的卷积神经网络学习算法 | |
CN106485259B (zh) | 一种基于高约束高分散主成分分析网络的图像分类方法 | |
CN107918636A (zh) | 一种人脸快速检索方法、系统 | |
CN109190643A (zh) | 基于卷积神经网络中药识别方法及电子设备 | |
CN110378366A (zh) | 一种基于耦合知识迁移的跨域图像分类方法 | |
Beikmohammadi et al. | SWP-LeafNET: A novel multistage approach for plant leaf identification based on deep CNN | |
CN109063719A (zh) | 一种联合结构相似性和类信息的图像分类方法 | |
CN104966075B (zh) | 一种基于二维判别特征的人脸识别方法与系统 | |
CN109325513A (zh) | 一种基于海量单类单幅图像的图像分类网络训练方法 | |
Li et al. | Dating ancient paintings of Mogao Grottoes using deeply learnt visual codes | |
Han | Evaluation of English online teaching based on remote supervision algorithms and deep learning | |
Naqvi et al. | Feature quality-based dynamic feature selection for improving salient object detection | |
CN110414626A (zh) | 一种猪只品种识别方法、装置和计算机可读存储介质 | |
CN112949738B (zh) | 基于eecnn算法的多类不平衡高光谱图像分类方法 | |
Pei et al. | Action recognition by learning temporal slowness invariant features | |
Guo et al. | A multi-organ plant identification method using convolutional neural networks | |
CN111310838A (zh) | 一种基于深度Gabor网络的药效图像分类识别方法 | |
Zhong et al. | A diversified deep belief network for hyperspectral image classification | |
Li et al. | MLP-Mixer Approach for Corn Leaf Diseases Classification | |
Fu et al. | A multi-scale pooling convolutional neural network for accurate steel surface defects classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190528 |
|
WD01 | Invention patent application deemed withdrawn after publication |