CN106778863A

CN106778863A - 基于Fisher判别字典学习的仓库货品识别方法

Info

Publication number: CN106778863A
Application number: CN201611140174.3A
Authority: CN
Inventors: 刘毅敏; 苗姣姣; 梁柏华
Original assignee: Wuhan University of Science and Engineering WUSE
Current assignee: Wuhan University of Science and Engineering WUSE
Priority date: 2016-12-12
Filing date: 2016-12-12
Publication date: 2017-05-31

Abstract

本发明涉及了一种基于Fisher判别字典学习的仓库货品识别方法。首先将不同条件下采集到的仓库货品图像分为两部分：训练样本集和测试样本集。对这两种样本集分别进行预处理，然后重排像素值并经过PCA降维。训练样本集通过Fisher准则方法学习得到一个判别的字典，使用判别字典的线性加权表示一个测试样本。采用最小二乘法求解L2范数最小化问题，得到测试样本在该判别字典下的稀疏表示矩阵。最后由各类别的重构误差和稀疏编码系数构成的e_i来实现对仓库货品的识别。本发明解决了传统识别方法受选取的特征影响大，识别过程比较复杂以及一般字典在构造过程中丢失大量分类信息的问题。本发明能够实现不同货品的准确快速识别，为智能化仓库的实现的奠定了基础。

Description

基于Fisher判别字典学习的仓库货品识别方法

技术领域

本发明属于仓库货品识别技术领域，尤其涉及一种基于Fisher判别字典学习的仓库货品识别方法。

背景技术

仓库是物资集中储存的场所，包括国家、集体或个体经营储存物品的各类仓库、堆栈、货场等。日常工作的重要内容是为物流与供应链系统服务，所以对仓库货品的管理有很高的要求。目前，很多仓库管理工作采用人工的方式，要付出大量人力填写各种表格、凭证、账册、卡片和文件。由于信息是随着时间不断变化的，所以仓库数据要按照不同的分类经常不断地汇总、统计，往往要做许多重复登记和转抄。这种手工操作的管理方式不仅浪费人力，而且存在着处理速度慢、易出现错误、不便于查询及缺乏综合性等缺点，大大降低了信息的利用价值，很难适应现代仓库管理工作的需要。随着企业现代化生产的不断扩大，仓库的规模化也得到了快速发展，货品的准确快速分类识别越来越受重视，同时也是实现智能化仓库的前提和基础。传统的识别方法遵循先提取特征、后输入分类器模式的一般研究规律。即先采用SIFT、SURT以及纹理或颜色等进行特征提取，然后采用人工神经网络、支持向量机等人工智能方法进行分类识别。此类识别方法具有各自的特点和应用局限性，并且受选取的特征影响很大，增加了识别的复杂性。

随着压缩感知理论的提出，采用稀疏表示来解决识别问题成为了热点。在过去的几年里，稀疏信号表示已广泛应用于数字信号处理领域，例如：压缩感知和图像恢复。Wright等率先将稀疏表示方法引入到人脸识别中，提出了基于稀疏表示的人脸识别方法(sparse representation based classification,SRC)。SRC直接用训练样本构造字典矩阵，通过L1范数最小化计算待测试样本的稀疏表示系数，最后根据各类别对应的稀疏系数计算重构误差，得到分类结果。在稀疏表示中，构造好的字典起着重要的作用。构建稀疏编码字典的方法一般有两种，分别是标准的数据模型法和数据驱动法。在数据模型法中，选择的标准字典原子通常不能足够有效地表示信号，而利用数据驱动方法学习的字典却能更准确地代表信号。但是直接用训练样本构造字典矩阵是数据冗余的，如果训练样本数太多，大量的计算也会成为棘手的问题。因此，在训练样本中学习得到一个更简洁或鲁棒的字典，不仅能够实现正确地分类，而且具有更好的数据独立性。

发明内容

本发明旨在解决上述问题，将Fisher准则的结构化字典学习方法引入到仓库货品识别领域，在判别字典的学习过程中，通过利用每一个字典对应一个类别标签类来减少同类别训练样本对应的重构误差，同时综合考虑稀疏编码系数类内、类间误差，以使类内误差最小、类间误差最大。最后由重构误差和稀疏编码系数实现对仓库货品的分类识别。仓库货品识别的基本问题是在给定C种不同类别的训练样本的条件下，对于一个新的测试样本正确地识别其所属类别。SRC对训练样本降维后按列直接构造字典矩阵，丢失大量分类信息。并且由于存在干扰信息，该字典并不能有效表示测试样本。为了使得字典即具有较好的重构能力，又具有很好的判别能力，本文提出一种基于Fisher判别字典学习的仓库货品识别的方法，从训练样本集中求得具有更好表现能力和分类能力的字典矩阵。

具体而言，本发明提供的一种基于Fisher判别字典学习的仓库货品识别方法包括以下步骤：

步骤1：首先采集不同条件下的仓库货品图像，将采集到的图像分为两部分：训练样本集和测试样本集。并对这两种样本集分别进行图像预处理操作，然后重排像素值并经过PCA进行降维；

步骤2：将降维预处理好的训练样本集通过Fisher准则方法学习一个判别的字典，将字典学习转化为求如下目标函数的最优解J_(D,X)＝arg min_D,X{r(A,D,X)+λ₁‖X‖₁+λ₂f(X)}，其中，r(A,D,X)是字典的表达能力保真项；‖X‖₁为系数的稀疏约束；f(X)表示判别约束项；λ₁，λ₂为控制目标函数中3项信息比例的常量。具体过程如下：

步骤2-1：初始化字典矩阵D，字典的每个基向量为训练样本的PCA特征向量；

步骤2-2：固定字典D，目标函数简化为其中

M_k、M分别为类别K和全部类别的平均系数矩阵。设n_i、n分别为第i类和全部的训练样本数目，当η>1-n_i/n时，f_i(X_i)严格凸优化于X_i，令η＝1，可通过迭代投影法求出X_i最优解，更新稀疏编码系数X；

步骤2-3：固定稀疏编码系数X，更新D_i时，D_j(j≠i)固定不变，目标函数简化为上式是一个二次规划问题，使用投影字典对字典学习求解，更新字典D；

步骤2-4：当相邻迭代结果误差小于一定阈值，或达到最大迭代次数，输出X和D，否则返回步骤2-2；

步骤3：将降维预处理好的测试样本通过判别字典得出稀疏编码系数，然后同时使用重构误差和稀疏编码系数进行分类，从而测评子字典是否能够很好地重构测试样本，得出分类结果。

针对传统识别方法的应用局限性、受选取的特征影响大，识别的复杂性以及SRC在字典构造过程中丢失大量分类信息，不利于更好的实现分类识别等问题。本文提出了一种基于Fisher判别字典学习的仓库货品识别方法。判别字典的学习综合考虑了两方面因素，一是字典原子和类别标签相对应，使同类的重构误差最小；另一方面使得稀疏编码系数的类内误差最小、类间误差最大。在分类时，重构误差和稀疏编码系数判别信息共同用于分类识别。同时，所用字典的维度和字典原子个数可以较少，数据量减少、更简单快速。并且该方法获得了更高的准确率，同时提高识别速度，对抗噪声干扰有较好的鲁棒性。

附图说明

为了更清楚地说明本发明中的技术方案，下面将对现有技术描述中所需要使用的附图作简单地介绍，显而易见，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明基于Fisher判别字典学习的仓库货品识别流程图。

图2为本发明基于Fisher判别字典学习的仓库货品识别方法与SRC、SVM在不同维度下的识别率对比图。

图3为本发明基于Fisher判别字典学习的PLC仓库货品识别结果图。

图4为本发明基于Fisher判别字典学习的仓库货品识别结果图。

具体实施方式

为了进一步说明本发明的技术方案，下面结合附图和实施例对本发明进行详细的说明，但该实施例不应理解为对本发明的限制。

参见图1，本发明所描述的一种基于Fisher判别字典学习的仓库货品识别方法。首先将不同条件下采集到的仓库货品图像分为两部分：训练样本集和测试样本集。对两种样本集分别进行预处理，然后重排像素值并经过PCA降维。训练样本集通过Fisher准则方法学习得到一个判别的字典，使用判别字典的线性加权表示一个测试样本。利用L2范数最小化计算训练样本的稀疏编码系数。最后由各类别的重构误差和稀疏编码系数构成的e_i来求得分类结果。具体包括以下步骤：

步骤1：首先采集20种货品在不同光照条件下的400幅图像，货品的种类包括电机、PLC、继电器、截止阀、直流电源和变频器等。其中，每一类货品采集20张。将采集到的图像分为训练样本集和测试样本集。

通过摄像机采集到的图像为RGB彩色图像，由于存储彩色图像会占用大量的内存资源，并且货品的彩色图像特征并不能作为货品分类的依据。为了提高处理效率，将彩色图像转换为灰度图像，并且也滤除了一些不必要的图像噪声。同时为了降低数据存储量提高识别效率，本发明采用主成分分析方法(principal component analysis,PCA)降维。降维过程具体步骤如下：

将采集到的彩色图像灰度化后重排像素值为一行，维度为k。设共有n个训练样本集，将n个k维训练样本集组成n行k列矩阵M。其训练样本集集合矩阵为M(M∈R^n×k)，协方差矩阵为Σ(Σ∈R^n×k)。则相应的PCA模型数据矩阵为M，其中每一行表示一幅图像，列表示像素点值。

首先需要对M进行标准化处理，为了书写方便将标准化后的矩阵仍记为M。其标准化公式为：

式中：表示指标x_ij的样本均值，表示x_j的样本标准差。

其PCA降维过程如下：

1)计算M的协方差矩阵

2)计算Σ的k个特征值λ₁≥λ₂≥…≥λ_k，以及对应的正交特征向量P₁,P₂,…,P_k；

3)求取主成分向量Y为：Y＝MP；

其中元素y_h为：

式中：p_jh是主轴P_h的第j个分量。

4)计算各主成分的贡献率和累积贡献率：

贡献率：

累积贡献率：

λ_i为数据矩阵M的协方差矩阵Σ的特征值，且λ₁≥λ₂≥…≥λ_k≥0。其中一般要求β_m在85％以上，认为m个主成分可以反映原始数据足够多的信息，即确定主成分个数为m。

5)利用式(4)来进行提取前m(m<k)个主成分，得到压缩后的向量，即各方向主成分y_m。

步骤2：经过PCA预处理降维后的训练样本集为Y(Y∈R^n×m)，对其进行转置记为A(A∈R^m×n)。训练样本集通过Fisher准则方法学习得到一个判别字典，设C类货品训练样本集为A＝[A₁,A₂,…,A_C]，A_i为第i类训练样本集其中m为维数，n_i为第i类训练样本的样本数，字典矩阵为D＝[D₁,D₂,…,D_C]，D_i为第i类对应的字典矩阵，训练样本的稀疏系数为X＝[X₁,X₂,…,X_c]，X_i为A_i的稀疏系数，则字典学习转化为求如下的目标函数的最优解：

J_(D,X)＝arg min_D,X{r(A,D,X)+λ₁‖X‖₁+λ₂f(X)} (7)

其中，r(A,D,X)是字典的表达能力保真项；‖X‖₁为系数的稀疏约束；f(X)表示判别约束项；λ₁，λ₂为控制目标函数中3项信息比例的常量。

其中保真项的定义为

表示第i类训练样本A_i在子字典D_j上分解后得到的稀疏编码系数。首先，字典D能很好地表示样本A_i，因此，应该小。其次，D_i也可以很好地表示样本A_i，但是不能被D_j(i≠j)很好地表示。因此，和也应该小。

为保证字典D对A中训练样本的分类能力，可通过Fisher判别准则使得样本集A的编码系数解X的类内误差S_W(X)最小，同时类间误差S_B(X)最大，即

其中m_i和m分别为编码系统矩阵X_i和X的均值。

定义f(X)为

将加入式(11)解决非凸且不稳定的问题，η表示常量。

可以看出，r(A,D,X)保真样本可用其所属类别的字典基向量线性组合表示，而不能被其他类别线性表示，使得字典D对训练集内的任意样本具有最优的表示能力。f(X)保证训练样本的编码系数类内误差最小、类间误差最大，使字典D获得最佳分类能力，同时训练样本的编码系数也可用于分类。

目标函数转化为如下：

该函数在D和X中任意一个固定时为凸优化问题，因此可通过固定X更新D，再固定D更新X，迭代求解。具体过程如下：

步骤2-2：固定字典D，目标函数简化为其中M_k、M分别代表类别K和全部类别的编码系数均值。设n_i、n分别表示第i类和全部的训练样本数目，当η>1-n_i/n时，f_i(X_i)严格凸优化于X_i，令η＝1，可通过迭代投影法求出X_i最优解，更新训练样本集的稀疏编码系数X。

步骤3：通过Fisher准则方法学习得到了具有判别能力的字典D。因为判别字典学习使用了重构误差和稀疏编码稀疏的判别信息，所以同时使用重构误差和稀疏编码系数进行分类。将降维预处理好的测试样本通过判别字典D，使用最小二乘法解L2范数最小化问题，得出稀疏编码系数，然后使用重构误差和稀疏编码系数进行仓库货品的分类。具体过程如下：

使用子字典D_i求得测试样本y∈R^m的稀疏编码系数，定义目标函数为

其中，是与子字典D_i相关联的第i类稀疏编码系数均值向量；γ表示常量；使用最小二乘法求解的最小L2范数，可以很快得到解。

因为学习的字典D_i不仅可以很好地线性表示y，而且稀疏编码系数向量x与相似，定义分类的评分为

最后分类结果为id(y)＝argmin_{i＝1,2,…,c}{e_i}，其最小值代表正确地分类。

图2为本发明基于Fisher判别字典学习的仓库货品识别方法与SRC、SVM在不同维度下的识别率对比图。在仓库货品识别算法的实现过程中，为了减少存储数据提高识别效率，高维降至低维去除冗余维度的过程显得至关重要。本发明采用主成分分析方法(principal component analysis,PCA)降维，测试在不同降维维数d参数下，Fisher判别字典学习识别算法、SRC和SVM对仓库货品的识别能力。同时选取不同维度d作对比测试，重复10次实验求结果平均值。

将仓库货品数据库中所有的货品图像归一化到54*48，每类任取15张图片作为训练样本，其余作为测试样本。对样本进行预处理后按行展开排成一行再进行PCA降维。图2显示在不同维度下SRC、SVM与本发明方法在仓库货品上的识别率。

货品识别准确率随降维维数d的变化趋势如图2所示。从图中可以看出降维维数d较小时，识别准确率较低，随着降维维数d的增大识别准确率逐渐增高。最终，测试获得采用本发明方法的最高识别率是97.8％，采用SRC的最高识别率为97％，采用SVM的最高识别率为96.5％。随着降维维数d的降低，本发明方法与SRC、SVM相比具有更好地识别性能。并且采用本文方法时当d>＝80时分类准确率达到95％以上，并趋于稳定。虽然随着维度的增加，SRC、SVM和本发明方法的识别率逐渐接近，但是SRC和SVM的识别速度远远低于本发明方法。SRC、SVM和本发明方法在特征维度为100时的识别速度分分别为1.1145s、0.9872s、0.0221s。

图3是本发明基于Fisher判别字典学习的PLC仓库货品识别结果图。本发明使用的仓库货品种类有20类。采用PCA降维到100，每类训练样本数为12。针对训练样本采用基于Fisher判别字典学习方法学习判别字典。输入测试样本，利用判别字典和L2范数最小化求解出稀疏表示矩阵。最后由重构误差和稀疏编码系数确定目标归属类。

以PLC货品图像为例，图2为利用重构误差和稀疏编码系数求得的e_i来判断分类结果，最小响应值对应所归属的类别。从图中可以看出本发明能够实现正确分类，并且所属类别的e_i与其他类相比具有明显的差距。

图4是本发明基于Fisher判别字典学习的仓库货品识别结果图，采用200个测试样本，每10个对应一种类型。类型1(1-10)、类型2(11-20)、类型3(21-30)……以此类推，识别结果中类型5中的第42个测试样本，类型7中的第63个测试样本以及类型14中的第135个测试样本识别错误，总识别率达到了98.5％。

本发明所描述的一种基于Fisher判别字典学习的仓库货品识别方法已在国内某钢铁集团热轧分公司的仓库中实施，利用工业相机采集20种货品图像进行处理。实践表明，本发明的方法为仓库货品的分类识别提供了保障、提高了识别准确率和效率。本发明解决了目前货品的特征不明显，且提取比较麻烦；另外提取到的特征对分类结果影响也很大的问题，具有广阔的应用推广前景。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种基于Fisher判别字典学习的仓库货品识别方法。其特征在于：Fisher判别字典的学习综合考虑了两方面因素，一是字典原子和类别标签相对应，使同类的重构误差最小；另一方面使得稀疏编码系数的类内误差最小、类间误差最大。在分类时，重构误差和稀疏编码系数判别信息共同用于分类识别。同时，所用字典的维度和字典原子个数可以较少，数据量减少、更简单快速。并且该方法获得了更高的准确率，同时提高了识别速度，对抗噪声干扰有较好的鲁棒性。

2.根据权利要求1所述的基于Fisher判别字典学习的仓库货品识别方法，其特征在于：主要包括如下步骤：

步骤1：采集不同条件下的仓库货品图像，将采集到的图像分为两部分：训练样本集和测试样本集。并对这两种样本集分别进行图像预处理操作，然后重排像素值并经过PCA进行降维；

步骤2-2：固定字典D，目标函数简化为其中M_k、M分别为类别K和全部类别的平均系数矩阵，通过迭代投影法求出X_i最优解，更新稀疏编码系数X；

步骤2-3：固定稀疏编码系数X，更新D_i时，D_j(j≠i)固定不变，目标函数简化为使用投影字典对字典学习求解，更新字典D；

步骤3：将降维预处理好的测试样本通过判别字典得出稀疏编码系数，然后同时使用重构误差和稀疏编码系数进行分类，得出分类结果。

3.根据权利要求2所述的基于Fisher判别字典学习的仓库货品识别方法，其特征在于：步骤1中，通过摄像机采集到的图像为RGB彩色图像，由于存储彩色图像会占用大量的内存资源，并且货品的彩色图像特征并不能作为货品分类的依据。为了提高处理效率，将彩色图像转换为灰度图像，并且也滤除了一些不必要的图像噪声。同时为了降低数据存储量提高识别效率，采用主成分分析方法(principal component analysis,PCA)进行降维操作。

4.根据权利要求2所述的基于Fisher判别字典学习的仓库货品识别方法，其特征在于：步骤2-2中，固定字典D，目标函数简化为其中M_k、M分别代表类别K和全部类别的编码系数均值。设n_i、n分别表示第i类和全部的训练样本数目，当η>1-n_i/n时，f_i(X_i)严格凸优化于X_i，令η＝1，可通过迭代投影法求出X_i最优解，更新训练样本集的稀疏编码系数X。

5.根据权利要求2所述的基于Fisher判别字典学习的仓库货品识别方法，其特征在于：步骤2-3中，固定稀疏编码系数X，更新D_i时，D_j(j≠i)固定不变，目标函数简化为上式是一个二次规划问题，使用投影字典对字典学习求解，更新字典D。

6.根据权利要求2所述的基于Fisher判别字典学习的仓库货品识别方法，其特征在于：步骤3中，通过Fisher准则方法学习得到的字典D使用了重构误差和稀疏编码系数的判别信息，所以同时使用重构误差和稀疏编码系数进行分类。将降维预处理好的测试样本通过判别字典D，使用最小二乘法解L2范数最小化问题，得出稀疏编码系数，然后使用重构误差和稀疏编码系数进行仓库货品的分类。具体过程如下：

使用子字典D_i表示测试样本y∈R^m的稀疏编码系数，定义目标函数为其中，是与子字典D_i相关联的第i类稀疏编码系数均值向量；γ表示常量；使用最小二乘法求解的最小L2范数，可以很快得到解。

因为学习的字典D_i不仅可以很好地线性表示y，而且稀疏编码系数向量x与相似，定义分类的评分为最后分类结果为id(y)＝arg min_{i＝1,2,…,c}{e_i}，其最小值代表正确地分类。