CN106778863A - 基于Fisher判别字典学习的仓库货品识别方法 - Google Patents
基于Fisher判别字典学习的仓库货品识别方法 Download PDFInfo
- Publication number
- CN106778863A CN106778863A CN201611140174.3A CN201611140174A CN106778863A CN 106778863 A CN106778863 A CN 106778863A CN 201611140174 A CN201611140174 A CN 201611140174A CN 106778863 A CN106778863 A CN 106778863A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- fisher
- learning
- sparse coding
- coding coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012549 training Methods 0.000 claims abstract description 43
- 238000012360 testing method Methods 0.000 claims abstract description 27
- 239000011159 matrix material Substances 0.000 claims abstract description 21
- 230000006870 function Effects 0.000 claims abstract description 19
- 230000009467 reduction Effects 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 11
- 238000000513 principal component analysis Methods 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 2
- 238000010276 construction Methods 0.000 abstract description 2
- 230000004069 differentiation Effects 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005098 hot rolling Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/087—Inventory or stock management, e.g. order filling, procurement or balancing against orders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
- G06F18/21322—Rendering the within-class scatter matrix non-singular
- G06F18/21324—Rendering the within-class scatter matrix non-singular involving projections, e.g. Fisherface techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及了一种基于Fisher判别字典学习的仓库货品识别方法。首先将不同条件下采集到的仓库货品图像分为两部分:训练样本集和测试样本集。对这两种样本集分别进行预处理,然后重排像素值并经过PCA降维。训练样本集通过Fisher准则方法学习得到一个判别的字典,使用判别字典的线性加权表示一个测试样本。采用最小二乘法求解L2范数最小化问题,得到测试样本在该判别字典下的稀疏表示矩阵。最后由各类别的重构误差和稀疏编码系数构成的ei来实现对仓库货品的识别。本发明解决了传统识别方法受选取的特征影响大,识别过程比较复杂以及一般字典在构造过程中丢失大量分类信息的问题。本发明能够实现不同货品的准确快速识别,为智能化仓库的实现的奠定了基础。
Description
技术领域
本发明属于仓库货品识别技术领域,尤其涉及一种基于Fisher判别字典学习的仓库货品识别方法。
背景技术
仓库是物资集中储存的场所,包括国家、集体或个体经营储存物品的各类仓库、堆栈、货场等。日常工作的重要内容是为物流与供应链系统服务,所以对仓库货品的管理有很高的要求。目前,很多仓库管理工作采用人工的方式,要付出大量人力填写各种表格、凭证、账册、卡片和文件。由于信息是随着时间不断变化的,所以仓库数据要按照不同的分类经常不断地汇总、统计,往往要做许多重复登记和转抄。这种手工操作的管理方式不仅浪费人力,而且存在着处理速度慢、易出现错误、不便于查询及缺乏综合性等缺点,大大降低了信息的利用价值,很难适应现代仓库管理工作的需要。随着企业现代化生产的不断扩大,仓库的规模化也得到了快速发展,货品的准确快速分类识别越来越受重视,同时也是实现智能化仓库的前提和基础。传统的识别方法遵循先提取特征、后输入分类器模式的一般研究规律。即先采用SIFT、SURT以及纹理或颜色等进行特征提取,然后采用人工神经网络、支持向量机等人工智能方法进行分类识别。此类识别方法具有各自的特点和应用局限性,并且受选取的特征影响很大,增加了识别的复杂性。
随着压缩感知理论的提出,采用稀疏表示来解决识别问题成为了热点。在过去的几年里,稀疏信号表示已广泛应用于数字信号处理领域,例如:压缩感知和图像恢复。Wright等率先将稀疏表示方法引入到人脸识别中,提出了基于稀疏表示的人脸识别方法(sparse representation based classification,SRC)。SRC直接用训练样本构造字典矩阵,通过L1范数最小化计算待测试样本的稀疏表示系数,最后根据各类别对应的稀疏系数计算重构误差,得到分类结果。在稀疏表示中,构造好的字典起着重要的作用。构建稀疏编码字典的方法一般有两种,分别是标准的数据模型法和数据驱动法。在数据模型法中,选择的标准字典原子通常不能足够有效地表示信号,而利用数据驱动方法学习的字典却能更准确地代表信号。但是直接用训练样本构造字典矩阵是数据冗余的,如果训练样本数太多,大量的计算也会成为棘手的问题。因此,在训练样本中学习得到一个更简洁或鲁棒的字典,不仅能够实现正确地分类,而且具有更好的数据独立性。
发明内容
本发明旨在解决上述问题,将Fisher准则的结构化字典学习方法引入到仓库货品识别领域,在判别字典的学习过程中,通过利用每一个字典对应一个类别标签类来减少同类别训练样本对应的重构误差,同时综合考虑稀疏编码系数类内、类间误差,以使类内误差最小、类间误差最大。最后由重构误差和稀疏编码系数实现对仓库货品的分类识别。仓库货品识别的基本问题是在给定C种不同类别的训练样本的条件下,对于一个新的测试样本正确地识别其所属类别。SRC对训练样本降维后按列直接构造字典矩阵,丢失大量分类信息。并且由于存在干扰信息,该字典并不能有效表示测试样本。为了使得字典即具有较好的重构能力,又具有很好的判别能力,本文提出一种基于Fisher判别字典学习的仓库货品识别的方法,从训练样本集中求得具有更好表现能力和分类能力的字典矩阵。
具体而言,本发明提供的一种基于Fisher判别字典学习的仓库货品识别方法包括以下步骤:
步骤1:首先采集不同条件下的仓库货品图像,将采集到的图像分为两部分:训练样本集和测试样本集。并对这两种样本集分别进行图像预处理操作,然后重排像素值并经过PCA进行降维;
步骤2:将降维预处理好的训练样本集通过Fisher准则方法学习一个判别的字典,将字典学习转化为求如下目标函数的最优解J(D,X)=arg minD,X{r(A,D,X)+λ1‖X‖1+λ2f(X)},其中,r(A,D,X)是字典的表达能力保真项;‖X‖1为系数的稀疏约束;f(X)表示判别约束项;λ1,λ2为控制目标函数中3项信息比例的常量。具体过程如下:
步骤2-1:初始化字典矩阵D,字典的每个基向量为训练样本的PCA特征向量;
步骤2-2:固定字典D,目标函数简化为其中
Mk、M分别为类别K和全部类别的平均系数矩阵。设ni、n分别为第i类和全部的训练样本数目,当η>1-ni/n时,fi(Xi)严格凸优化于Xi,令η=1,可通过迭代投影法求出Xi最优解,更新稀疏编码系数X;
步骤2-3:固定稀疏编码系数X,更新Di时,Dj(j≠i)固定不变,目标函数简化为上式是一个二次规划问题,使用投影字典对字典学习求解,更新字典D;
步骤2-4:当相邻迭代结果误差小于一定阈值,或达到最大迭代次数,输出X和D,否则返回步骤2-2;
步骤3:将降维预处理好的测试样本通过判别字典得出稀疏编码系数,然后同时使用重构误差和稀疏编码系数进行分类,从而测评子字典是否能够很好地重构测试样本,得出分类结果。
针对传统识别方法的应用局限性、受选取的特征影响大,识别的复杂性以及SRC在字典构造过程中丢失大量分类信息,不利于更好的实现分类识别等问题。本文提出了一种基于Fisher判别字典学习的仓库货品识别方法。判别字典的学习综合考虑了两方面因素,一是字典原子和类别标签相对应,使同类的重构误差最小;另一方面使得稀疏编码系数的类内误差最小、类间误差最大。在分类时,重构误差和稀疏编码系数判别信息共同用于分类识别。同时,所用字典的维度和字典原子个数可以较少,数据量减少、更简单快速。并且该方法获得了更高的准确率,同时提高识别速度,对抗噪声干扰有较好的鲁棒性。
附图说明
为了更清楚地说明本发明中的技术方案,下面将对现有技术描述中所需要使用的附图作简单地介绍,显而易见,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于Fisher判别字典学习的仓库货品识别流程图。
图2为本发明基于Fisher判别字典学习的仓库货品识别方法与SRC、SVM在不同维度下的识别率对比图。
图3为本发明基于Fisher判别字典学习的PLC仓库货品识别结果图。
图4为本发明基于Fisher判别字典学习的仓库货品识别结果图。
具体实施方式
为了进一步说明本发明的技术方案,下面结合附图和实施例对本发明进行详细的说明,但该实施例不应理解为对本发明的限制。
参见图1,本发明所描述的一种基于Fisher判别字典学习的仓库货品识别方法。首先将不同条件下采集到的仓库货品图像分为两部分:训练样本集和测试样本集。对两种样本集分别进行预处理,然后重排像素值并经过PCA降维。训练样本集通过Fisher准则方法学习得到一个判别的字典,使用判别字典的线性加权表示一个测试样本。利用L2范数最小化计算训练样本的稀疏编码系数。最后由各类别的重构误差和稀疏编码系数构成的ei来求得分类结果。具体包括以下步骤:
步骤1:首先采集20种货品在不同光照条件下的400幅图像,货品的种类包括电机、PLC、继电器、截止阀、直流电源和变频器等。其中,每一类货品采集20张。将采集到的图像分为训练样本集和测试样本集。
通过摄像机采集到的图像为RGB彩色图像,由于存储彩色图像会占用大量的内存资源,并且货品的彩色图像特征并不能作为货品分类的依据。为了提高处理效率,将彩色图像转换为灰度图像,并且也滤除了一些不必要的图像噪声。同时为了降低数据存储量提高识别效率,本发明采用主成分分析方法(principal component analysis,PCA)降维。降维过程具体步骤如下:
将采集到的彩色图像灰度化后重排像素值为一行,维度为k。设共有n个训练样本集,将n个k维训练样本集组成n行k列矩阵M。其训练样本集集合矩阵为M(M∈Rn×k),协方差矩阵为Σ(Σ∈Rn×k)。则相应的PCA模型数据矩阵为M,其中每一行表示一幅图像,列表示像素点值。
首先需要对M进行标准化处理,为了书写方便将标准化后的矩阵仍记为M。其标准化公式为:
式中:表示指标xij的样本均值,表示xj的样本标准差。
其PCA降维过程如下:
1)计算M的协方差矩阵
2)计算Σ的k个特征值λ1≥λ2≥…≥λk,以及对应的正交特征向量P1,P2,…,Pk;
3)求取主成分向量Y为:Y=MP;
其中元素yh为:
式中:pjh是主轴Ph的第j个分量。
4)计算各主成分的贡献率和累积贡献率:
贡献率:
累积贡献率:
λi为数据矩阵M的协方差矩阵Σ的特征值,且λ1≥λ2≥…≥λk≥0。其中一般要求βm在85%以上,认为m个主成分可以反映原始数据足够多的信息,即确定主成分个数为m。
5)利用式(4)来进行提取前m(m<k)个主成分,得到压缩后的向量,即各方向主成分ym。
步骤2:经过PCA预处理降维后的训练样本集为Y(Y∈Rn×m),对其进行转置记为A(A∈Rm×n)。训练样本集通过Fisher准则方法学习得到一个判别字典,设C类货品训练样本集为A=[A1,A2,…,AC],Ai为第i类训练样本集其中m为维数,ni为第i类训练样本的样本数,字典矩阵为D=[D1,D2,…,DC],Di为第i类对应的字典矩阵,训练样本的稀疏系数为X=[X1,X2,…,Xc],Xi为Ai的稀疏系数,则字典学习转化为求如下的目标函数的最优解:
J(D,X)=arg minD,X{r(A,D,X)+λ1‖X‖1+λ2f(X)} (7)
其中,r(A,D,X)是字典的表达能力保真项;‖X‖1为系数的稀疏约束;f(X)表示判别约束项;λ1,λ2为控制目标函数中3项信息比例的常量。
其中保真项的定义为
表示第i类训练样本Ai在子字典Dj上分解后得到的稀疏编码系数。首先,字典D能很好地表示样本Ai,因此,应该小。其次,Di也可以很好地表示样本Ai,但是不能被Dj(i≠j)很好地表示。因此,和也应该小。
为保证字典D对A中训练样本的分类能力,可通过Fisher判别准则使得样本集A的编码系数解X的类内误差SW(X)最小,同时类间误差SB(X)最大,即
其中mi和m分别为编码系统矩阵Xi和X的均值。
定义f(X)为
将加入式(11)解决非凸且不稳定的问题,η表示常量。
可以看出,r(A,D,X)保真样本可用其所属类别的字典基向量线性组合表示,而不能被其他类别线性表示,使得字典D对训练集内的任意样本具有最优的表示能力。f(X)保证训练样本的编码系数类内误差最小、类间误差最大,使字典D获得最佳分类能力,同时训练样本的编码系数也可用于分类。
目标函数转化为如下:
该函数在D和X中任意一个固定时为凸优化问题,因此可通过固定X更新D,再固定D更新X,迭代求解。具体过程如下:
步骤2-1:初始化字典矩阵D,字典的每个基向量为训练样本的PCA特征向量;
步骤2-2:固定字典D,目标函数简化为其中Mk、M分别代表类别K和全部类别的编码系数均值。设ni、n分别表示第i类和全部的训练样本数目,当η>1-ni/n时,fi(Xi)严格凸优化于Xi,令η=1,可通过迭代投影法求出Xi最优解,更新训练样本集的稀疏编码系数X。
步骤2-3:固定稀疏编码系数X,更新Di时,Dj(j≠i)固定不变,目标函数简化为上式是一个二次规划问题,使用投影字典对字典学习求解,更新字典D;
步骤2-4:当相邻迭代结果误差小于一定阈值,或达到最大迭代次数,输出X和D,否则返回步骤2-2;
步骤3:通过Fisher准则方法学习得到了具有判别能力的字典D。因为判别字典学习使用了重构误差和稀疏编码稀疏的判别信息,所以同时使用重构误差和稀疏编码系数进行分类。将降维预处理好的测试样本通过判别字典D,使用最小二乘法解L2范数最小化问题,得出稀疏编码系数,然后使用重构误差和稀疏编码系数进行仓库货品的分类。具体过程如下:
使用子字典Di求得测试样本y∈Rm的稀疏编码系数,定义目标函数为
其中,是与子字典Di相关联的第i类稀疏编码系数均值向量;γ表示常量;使用最小二乘法求解的最小L2范数,可以很快得到解。
因为学习的字典Di不仅可以很好地线性表示y,而且稀疏编码系数向量x与相似,定义分类的评分为
最后分类结果为id(y)=argmini=1,2,…,c{ei},其最小值代表正确地分类。
图2为本发明基于Fisher判别字典学习的仓库货品识别方法与SRC、SVM在不同维度下的识别率对比图。在仓库货品识别算法的实现过程中,为了减少存储数据提高识别效率,高维降至低维去除冗余维度的过程显得至关重要。本发明采用主成分分析方法(principal component analysis,PCA)降维,测试在不同降维维数d参数下,Fisher判别字典学习识别算法、SRC和SVM对仓库货品的识别能力。同时选取不同维度d作对比测试,重复10次实验求结果平均值。
将仓库货品数据库中所有的货品图像归一化到54*48,每类任取15张图片作为训练样本,其余作为测试样本。对样本进行预处理后按行展开排成一行再进行PCA降维。图2显示在不同维度下SRC、SVM与本发明方法在仓库货品上的识别率。
货品识别准确率随降维维数d的变化趋势如图2所示。从图中可以看出降维维数d较小时,识别准确率较低,随着降维维数d的增大识别准确率逐渐增高。最终,测试获得采用本发明方法的最高识别率是97.8%,采用SRC的最高识别率为97%,采用SVM的最高识别率为96.5%。随着降维维数d的降低,本发明方法与SRC、SVM相比具有更好地识别性能。并且采用本文方法时当d>=80时分类准确率达到95%以上,并趋于稳定。虽然随着维度的增加,SRC、SVM和本发明方法的识别率逐渐接近,但是SRC和SVM的识别速度远远低于本发明方法。SRC、SVM和本发明方法在特征维度为100时的识别速度分分别为1.1145s、0.9872s、0.0221s。
图3是本发明基于Fisher判别字典学习的PLC仓库货品识别结果图。本发明使用的仓库货品种类有20类。采用PCA降维到100,每类训练样本数为12。针对训练样本采用基于Fisher判别字典学习方法学习判别字典。输入测试样本,利用判别字典和L2范数最小化求解出稀疏表示矩阵。最后由重构误差和稀疏编码系数确定目标归属类。
以PLC货品图像为例,图2为利用重构误差和稀疏编码系数求得的ei来判断分类结果,最小响应值对应所归属的类别。从图中可以看出本发明能够实现正确分类,并且所属类别的ei与其他类相比具有明显的差距。
图4是本发明基于Fisher判别字典学习的仓库货品识别结果图,采用200个测试样本,每10个对应一种类型。类型1(1-10)、类型2(11-20)、类型3(21-30)……以此类推,识别结果中类型5中的第42个测试样本,类型7中的第63个测试样本以及类型14中的第135个测试样本识别错误,总识别率达到了98.5%。
本发明所描述的一种基于Fisher判别字典学习的仓库货品识别方法已在国内某钢铁集团热轧分公司的仓库中实施,利用工业相机采集20种货品图像进行处理。实践表明,本发明的方法为仓库货品的分类识别提供了保障、提高了识别准确率和效率。本发明解决了目前货品的特征不明显,且提取比较麻烦;另外提取到的特征对分类结果影响也很大的问题,具有广阔的应用推广前景。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (6)
1.一种基于Fisher判别字典学习的仓库货品识别方法。其特征在于:Fisher判别字典的学习综合考虑了两方面因素,一是字典原子和类别标签相对应,使同类的重构误差最小;另一方面使得稀疏编码系数的类内误差最小、类间误差最大。在分类时,重构误差和稀疏编码系数判别信息共同用于分类识别。同时,所用字典的维度和字典原子个数可以较少,数据量减少、更简单快速。并且该方法获得了更高的准确率,同时提高了识别速度,对抗噪声干扰有较好的鲁棒性。
2.根据权利要求1所述的基于Fisher判别字典学习的仓库货品识别方法,其特征在于:主要包括如下步骤:
步骤1:采集不同条件下的仓库货品图像,将采集到的图像分为两部分:训练样本集和测试样本集。并对这两种样本集分别进行图像预处理操作,然后重排像素值并经过PCA进行降维;
步骤2:将降维预处理好的训练样本集通过Fisher准则方法学习一个判别的字典,将字典学习转化为求如下目标函数的最优解J(D,X)=arg minD,X{r(A,D,X)+λ1‖X‖1+λ2f(X)},其中,r(A,D,X)是字典的表达能力保真项;‖X‖1为系数的稀疏约束;f(X)表示判别约束项;λ1,λ2为控制目标函数中3项信息比例的常量。具体过程如下:
步骤2-1:初始化字典矩阵D,字典的每个基向量为训练样本的PCA特征向量;
步骤2-2:固定字典D,目标函数简化为其中Mk、M分别为类别K和全部类别的平均系数矩阵,通过迭代投影法求出Xi最优解,更新稀疏编码系数X;
步骤2-3:固定稀疏编码系数X,更新Di时,Dj(j≠i)固定不变,目标函数简化为使用投影字典对字典学习求解,更新字典D;
步骤2-4:当相邻迭代结果误差小于一定阈值,或达到最大迭代次数,输出X和D,否则返回步骤2-2;
步骤3:将降维预处理好的测试样本通过判别字典得出稀疏编码系数,然后同时使用重构误差和稀疏编码系数进行分类,得出分类结果。
3.根据权利要求2所述的基于Fisher判别字典学习的仓库货品识别方法,其特征在于:步骤1中,通过摄像机采集到的图像为RGB彩色图像,由于存储彩色图像会占用大量的内存资源,并且货品的彩色图像特征并不能作为货品分类的依据。为了提高处理效率,将彩色图像转换为灰度图像,并且也滤除了一些不必要的图像噪声。同时为了降低数据存储量提高识别效率,采用主成分分析方法(principal component analysis,PCA)进行降维操作。
4.根据权利要求2所述的基于Fisher判别字典学习的仓库货品识别方法,其特征在于:步骤2-2中,固定字典D,目标函数简化为其中Mk、M分别代表类别K和全部类别的编码系数均值。设ni、n分别表示第i类和全部的训练样本数目,当η>1-ni/n时,fi(Xi)严格凸优化于Xi,令η=1,可通过迭代投影法求出Xi最优解,更新训练样本集的稀疏编码系数X。
5.根据权利要求2所述的基于Fisher判别字典学习的仓库货品识别方法,其特征在于:步骤2-3中,固定稀疏编码系数X,更新Di时,Dj(j≠i)固定不变,目标函数简化为上式是一个二次规划问题,使用投影字典对字典学习求解,更新字典D。
6.根据权利要求2所述的基于Fisher判别字典学习的仓库货品识别方法,其特征在于:步骤3中,通过Fisher准则方法学习得到的字典D使用了重构误差和稀疏编码系数的判别信息,所以同时使用重构误差和稀疏编码系数进行分类。将降维预处理好的测试样本通过判别字典D,使用最小二乘法解L2范数最小化问题,得出稀疏编码系数,然后使用重构误差和稀疏编码系数进行仓库货品的分类。具体过程如下:
使用子字典Di表示测试样本y∈Rm的稀疏编码系数,定义目标函数为 其中,是与子字典Di相关联的第i类稀疏编码系数均值向量;γ表示常量;使用最小二乘法求解的最小L2范数,可以很快得到解。
因为学习的字典Di不仅可以很好地线性表示y,而且稀疏编码系数向量x与相似,定义分类的评分为最后分类结果为id(y)=arg mini=1,2,…,c{ei},其最小值代表正确地分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611140174.3A CN106778863A (zh) | 2016-12-12 | 2016-12-12 | 基于Fisher判别字典学习的仓库货品识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611140174.3A CN106778863A (zh) | 2016-12-12 | 2016-12-12 | 基于Fisher判别字典学习的仓库货品识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106778863A true CN106778863A (zh) | 2017-05-31 |
Family
ID=58880210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611140174.3A Pending CN106778863A (zh) | 2016-12-12 | 2016-12-12 | 基于Fisher判别字典学习的仓库货品识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106778863A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832772A (zh) * | 2017-09-20 | 2018-03-23 | 深圳大学 | 一种基于半监督字典学习的图像识别方法及装置 |
CN107832786A (zh) * | 2017-10-31 | 2018-03-23 | 济南大学 | 一种基于字典学习的人脸识别分类方法 |
CN108229505A (zh) * | 2018-02-05 | 2018-06-29 | 南京邮电大学 | 基于fisher多级字典学习的图像分类方法 |
CN108416371A (zh) * | 2018-02-11 | 2018-08-17 | 艾视医疗科技成都有限公司 | 一种糖尿病性视网膜病变自动检测方法 |
CN109033994A (zh) * | 2018-07-03 | 2018-12-18 | 辽宁工程技术大学 | 一种基于卷积神经网络的人脸表情识别方法 |
CN109978064A (zh) * | 2019-03-29 | 2019-07-05 | 苏州大学 | 基于图像集的李群字典学习分类方法 |
CN110147782A (zh) * | 2019-05-29 | 2019-08-20 | 苏州大学 | 一种基于投影字典对学习的人脸识别方法及装置 |
CN110705343A (zh) * | 2019-08-20 | 2020-01-17 | 西南科技大学 | 一种结构不相干投影字典对学习的人脸识别方法及系统 |
CN112183300A (zh) * | 2020-09-23 | 2021-01-05 | 厦门大学 | 一种基于多层次稀疏表示的ais辐射源识别方法及系统 |
CN112241768A (zh) * | 2020-11-25 | 2021-01-19 | 广东技术师范大学 | 一种基于深度分解字典学习的精细图像分类方法 |
CN112464836A (zh) * | 2020-12-02 | 2021-03-09 | 珠海涵辰科技有限公司 | 一种基于稀疏表示学习的ais辐射源个体识别方法 |
CN112613547A (zh) * | 2020-12-16 | 2021-04-06 | 西安交通大学 | 基于Fisher判别字典学习模型的齿轮运行分类方法 |
CN113392700A (zh) * | 2021-05-07 | 2021-09-14 | 杭州电子科技大学 | 基于Fisher判别字典学习的主动声呐目标分类方法 |
CN113496046A (zh) * | 2021-01-18 | 2021-10-12 | 图林科技(深圳)有限公司 | 一种基于区块链的电商物流系统及方法 |
CN113515673A (zh) * | 2021-04-30 | 2021-10-19 | 山西大学 | 一种高价值对象储运全程信息压缩重构方法及系统 |
CN113627556A (zh) * | 2021-08-18 | 2021-11-09 | 广东电网有限责任公司 | 一种图像分类的实现方法、装置、电子设备和存储介质 |
CN114330535A (zh) * | 2021-12-24 | 2022-04-12 | 南京工业大学 | 一种基于支持向量正则化字典对学习的模式分类方法 |
-
2016
- 2016-12-12 CN CN201611140174.3A patent/CN106778863A/zh active Pending
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832772A (zh) * | 2017-09-20 | 2018-03-23 | 深圳大学 | 一种基于半监督字典学习的图像识别方法及装置 |
CN107832786A (zh) * | 2017-10-31 | 2018-03-23 | 济南大学 | 一种基于字典学习的人脸识别分类方法 |
CN107832786B (zh) * | 2017-10-31 | 2019-10-25 | 济南大学 | 一种基于字典学习的人脸识别分类方法 |
CN108229505A (zh) * | 2018-02-05 | 2018-06-29 | 南京邮电大学 | 基于fisher多级字典学习的图像分类方法 |
CN108229505B (zh) * | 2018-02-05 | 2022-02-18 | 南京邮电大学 | 基于fisher多级字典学习的图像分类方法 |
CN108416371A (zh) * | 2018-02-11 | 2018-08-17 | 艾视医疗科技成都有限公司 | 一种糖尿病性视网膜病变自动检测方法 |
CN109033994B (zh) * | 2018-07-03 | 2021-08-10 | 辽宁工程技术大学 | 一种基于卷积神经网络的人脸表情识别方法 |
CN109033994A (zh) * | 2018-07-03 | 2018-12-18 | 辽宁工程技术大学 | 一种基于卷积神经网络的人脸表情识别方法 |
CN109978064A (zh) * | 2019-03-29 | 2019-07-05 | 苏州大学 | 基于图像集的李群字典学习分类方法 |
CN110147782B (zh) * | 2019-05-29 | 2023-06-13 | 苏州大学 | 一种基于投影字典对学习的人脸识别方法及装置 |
CN110147782A (zh) * | 2019-05-29 | 2019-08-20 | 苏州大学 | 一种基于投影字典对学习的人脸识别方法及装置 |
CN110705343A (zh) * | 2019-08-20 | 2020-01-17 | 西南科技大学 | 一种结构不相干投影字典对学习的人脸识别方法及系统 |
CN112183300B (zh) * | 2020-09-23 | 2024-03-22 | 厦门大学 | 一种基于多层次稀疏表示的ais辐射源识别方法及系统 |
CN112183300A (zh) * | 2020-09-23 | 2021-01-05 | 厦门大学 | 一种基于多层次稀疏表示的ais辐射源识别方法及系统 |
CN112241768B (zh) * | 2020-11-25 | 2024-04-26 | 广东技术师范大学 | 一种基于深度分解字典学习的精细图像分类方法 |
CN112241768A (zh) * | 2020-11-25 | 2021-01-19 | 广东技术师范大学 | 一种基于深度分解字典学习的精细图像分类方法 |
CN112464836A (zh) * | 2020-12-02 | 2021-03-09 | 珠海涵辰科技有限公司 | 一种基于稀疏表示学习的ais辐射源个体识别方法 |
CN112613547A (zh) * | 2020-12-16 | 2021-04-06 | 西安交通大学 | 基于Fisher判别字典学习模型的齿轮运行分类方法 |
CN112613547B (zh) * | 2020-12-16 | 2024-04-09 | 西安交通大学 | 基于Fisher判别字典学习模型的齿轮运行分类方法 |
CN113496046B (zh) * | 2021-01-18 | 2024-05-10 | 华翼(广东)电商科技有限公司 | 一种基于区块链的电商物流系统及方法 |
CN113496046A (zh) * | 2021-01-18 | 2021-10-12 | 图林科技(深圳)有限公司 | 一种基于区块链的电商物流系统及方法 |
CN113515673A (zh) * | 2021-04-30 | 2021-10-19 | 山西大学 | 一种高价值对象储运全程信息压缩重构方法及系统 |
CN113515673B (zh) * | 2021-04-30 | 2023-01-31 | 山西大学 | 一种高价值对象储运全程信息压缩重构方法及系统 |
CN113392700A (zh) * | 2021-05-07 | 2021-09-14 | 杭州电子科技大学 | 基于Fisher判别字典学习的主动声呐目标分类方法 |
CN113392700B (zh) * | 2021-05-07 | 2024-06-07 | 杭州电子科技大学 | 基于Fisher判别字典学习的主动声呐目标分类方法 |
CN113627556A (zh) * | 2021-08-18 | 2021-11-09 | 广东电网有限责任公司 | 一种图像分类的实现方法、装置、电子设备和存储介质 |
CN114330535A (zh) * | 2021-12-24 | 2022-04-12 | 南京工业大学 | 一种基于支持向量正则化字典对学习的模式分类方法 |
CN114330535B (zh) * | 2021-12-24 | 2024-09-06 | 南京工业大学 | 一种基于支持向量正则化字典对学习的模式分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106778863A (zh) | 基于Fisher判别字典学习的仓库货品识别方法 | |
CN110532920B (zh) | 基于FaceNet方法的小数量数据集人脸识别方法 | |
CN108596203B (zh) | 并联池化层对受电弓碳滑板表面磨耗检测模型的优化方法 | |
CN109308485B (zh) | 一种基于字典域适应的迁移稀疏编码图像分类方法 | |
CN111461157B (zh) | 一种基于自学习的跨模态哈希检索方法 | |
CN103544499B (zh) | 一种基于机器视觉的表面瑕疵检测的纹理特征降维方法 | |
CN109522956A (zh) | 一种低秩判别特征子空间学习方法 | |
CN107957946B (zh) | 基于邻域嵌入保护算法支持向量机的软件缺陷预测方法 | |
Alrobah et al. | A hybrid deep model for recognizing arabic handwritten characters | |
CN105574548A (zh) | 一种基于稀疏和低秩表示图的高光谱数据降维方法 | |
CN105184298A (zh) | 一种快速局部约束低秩编码的图像分类方法 | |
CN113591866B (zh) | 基于db与crnn的特种作业证件检测方法及系统 | |
CN118134915B (zh) | 一种对接触网线夹脱槽现象的智能检测方法 | |
Sen et al. | Face recognition using deep convolutional network and one-shot learning | |
CN109324595B (zh) | 一种基于增量pca的工业监测数据分类方法 | |
Dan et al. | PF‐ViT: Parallel and Fast Vision Transformer for Offline Handwritten Chinese Character Recognition | |
Hong et al. | Improved yolov7 model for insulator surface defect detection | |
You et al. | Robust structure low-rank representation in latent space | |
CN108388918B (zh) | 具有结构保持特性的数据特征选择方法 | |
CN117392450A (zh) | 一种基于进化多尺度特征学习的钢铁材料质量解析方法 | |
CN112966735A (zh) | 一种基于谱重建的监督多集相关特征融合方法 | |
CN117131022A (zh) | 一种电力信息系统的异构数据迁移方法 | |
CN114821181B (zh) | 一种图像分类方法 | |
CN114943862B (zh) | 一种基于结构性解析字典学习的两阶段图像分类方法 | |
CN112381108A (zh) | 一种基于图卷积神经网络深度学习的枪弹痕迹相似度识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170531 |