CN109190645B - 一种高阶高维图像数据的表示与分类方法 - Google Patents

一种高阶高维图像数据的表示与分类方法 Download PDF

Info

Publication number
CN109190645B
CN109190645B CN201711193755.8A CN201711193755A CN109190645B CN 109190645 B CN109190645 B CN 109190645B CN 201711193755 A CN201711193755 A CN 201711193755A CN 109190645 B CN109190645 B CN 109190645B
Authority
CN
China
Prior art keywords
low
rank
data
image data
sparse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711193755.8A
Other languages
English (en)
Other versions
CN109190645A (zh
Inventor
胡岩峰
陆成韬
周鹏
杭谊青
陆茜茜
廉海明
彭晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Research Institute Institute Of Electronics Chinese Academy Of Sciences
Original Assignee
Suzhou Research Institute Institute Of Electronics Chinese Academy Of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Research Institute Institute Of Electronics Chinese Academy Of Sciences filed Critical Suzhou Research Institute Institute Of Electronics Chinese Academy Of Sciences
Priority to CN201711193755.8A priority Critical patent/CN109190645B/zh
Publication of CN109190645A publication Critical patent/CN109190645A/zh
Application granted granted Critical
Publication of CN109190645B publication Critical patent/CN109190645B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/36Applying a local operator, i.e. means to operate on image points situated in the vicinity of a given point; Non-linear local filtering operations, e.g. median filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Nonlinear Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种高阶高维图像数据的表示与分类方法,属于模式识别领域,其解决了图像识别过程中受噪音影响、图像原始结构被破坏,数据特征维度高、表示算法与分类算法不契合等问题。本发明所采用的技术方案是,利用投影矩阵集将图像数据从原始空间按模式投影到低秩子空间中,得到数据的低秩表示;在低秩子空间中训练稀疏表示字典和线性分类器,对图像数据进行分。利用投影矩阵集将图像数据从原始空间按模式投影到低秩子空间中,得到数据的低秩表示;在低秩子空间中训练稀疏表示字典和线性分类器,对图像数据进行分类。

Description

一种高阶高维图像数据的表示与分类方法
技术领域
本发明属于模式识别领域,尤其涉及一种高阶高维图像数据的表示与分类方法。
背景技术
随着人类社会的发展,每天都会收集到海量的图像数据,智能化处理与分析图像数据成为研究热点。图像识别的目的就是用计算机代替人类,完成对图像数据的识别任务。图像的表示和分类问题是研究图像识别的重点和难点。
图像表示又分为图像的预处理和图像的特征提取。图像的预处理包括对噪音和畸变的消除,对缺失信息的修复和对图像的分割等;图像的特征提取是根据任务的需求,利用降维算法和图像处理技术,从图像中提取出更加精简、更加抽象和更易处理的特征信息。
图像分类是将未知类别的图像归属到已知类别中的过程,其中比较经典的方法有K近邻,支持向量机和人工神经网络等。
目前对高阶高维图像数据的识别往往会遇到以下几个问题:
1)在图像的采集、传输和存储过程中经常会出现误差,从而导致数据被噪音污染失真,甚至损毁缺失,在高阶高维数据中这种情况尤为常见。
2)传统方法一般用向量来表示图像,需要对采集得到的图像进行展开。这一过程既破坏了图像原本的空间结构,损失了像素间的关联信息,又造成了数据维度的增加,容易引起维度灾和小样本问题。
表示算法与分类算法往往是独立设计的,经常会出现表示算法与分类算法不契合的情况。
发明内容
本发明所要解决的技术问题是
本发明为解决上述技术问题采用以下技术方案
一种高阶高维图像数据的表示与分类方法,具体包含模型训练和分类预测两部分;
模型训练用于利用已知类别的图像数据训练出具有分类能力的模型;
分类预测用于利用训练得到的模型对未知类别的图像数据进行分类;
其中,所述模型训练具体包含如下步骤:
步骤1,直接使用张量形式表示每张图像,构造原始数据Y;
步骤2,利用原始数据计算低秩投影矩阵集{U},并将原始数据Y按模式投影到低秩子空间中,得到低秩数据;
步骤3,利用低秩数据计算稀疏表示字典D和线性分类器W,并通过稀疏重构对低秩子空间进行修正,得到更具判别性的低秩子空间;
步骤4,迭代步骤2和步骤3直至收敛;
所述分类预测具体包含如下步骤:
步骤a,直接使用张量形式表示未知类别的待分类图像数据;
步骤b,利用低秩投影矩阵集{U}将已知类别的待分类图像数据按模式投影到低秩子空间中,得到低秩数据;
步骤c,利用稀疏表示字典D对低秩数据进行稀疏重构,得到稀疏重构系数a;
步骤d,将稀疏重构系数a输入到分类器W中,得到类别标签向量l,则l中最大值对应的位置为图像预测类别。
作为本发明一种高阶高维图像数据的表示与分类方法的进一步优选方案,所述步骤2具体计算如下:
Figure GDA0003292518690000021
s.t.φ(960,1024,1000)(DA)=[Y;U1,U2,I]+ò
其中,λ是权衡参数,用于平衡低秩性和投影误差,D∈R983040×1000是稀疏表示字典,A∈R1000×1000是稀疏重构系数,φ(a,b,c)(·)是一个转换函数,能够将矩阵X∈Rab×c折叠成张量X∈Ra×b×c,ò为投影误差。
作为本发明一种高阶高维图像数据的表示与分类方法的进一步优选方案,所述步骤3具体如下:
Figure GDA0003292518690000022
s.t.||a||0≤R
其中,α为权衡参数,用于平衡重构误差和分类误差,||·||0表示0范数,a是A的每一列,是每个数据的稀疏重构系数,R为稀疏约束系数,H∈R5×1000是标签矩阵,当第n个样本属于第k类时,Hkn=1,其余元素为0。
作为本发明一种高阶高维图像数据的表示与分类方法的进一步优选方案,所述步骤c具体计算如下:
Figure GDA0003292518690000023
其中,vec(·)是将张量展开成向量的函数,β为权衡参数,用于平衡重构误差和稀疏性,||·||1为1范数。
作为本发明一种高阶高维图像数据的表示与分类方法的进一步优选方案,在步骤d中,l=Wa∈R5
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明针对高阶高维数据特征维度高,强噪音和易缺失等特点,利用图像数据的低秩特性,通过投影对受噪音污染和损毁缺失的图像进行降噪修复;
2、本发明直接使用张量表示图像,保持了图像的原始结构,并减少了每次需要计算的特征数量,避免了维度灾;
3、本发明联合使用低秩表示和稀疏表示,将表示过程和分类过程相结合,避免了表示算法与分类算法独立设计的缺陷,提高了分类正确率。
附图说明
图1是图像分类流程图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本发明分为模型训练和和分类预测两部分,模型训练为利用已知类别的图像数据训练出具有分类能力的模型;而分类预测为利用训练得到的模型对未知类别的图像数据进行分类。
本发明的具体步骤如下:
(1)模型训练:
步骤1:直接使用张量形式表示每张图像,构造原始数据Y;
步骤2:利用原始数据Y计算低秩投影矩阵集{U},并将原始数据按模式投影到低秩子空间中,得到低秩数据
Figure GDA0003292518690000031
步骤3:利用低秩数据
Figure GDA0003292518690000032
计算稀疏表示字典D和线性分类器W,并通过稀疏重构对低秩子空间进行修正,得到更具判别性的子空间;
步骤4:迭代步骤2和步骤3直至收敛。
(2)分类预测:
步骤5:直接使用张量形式表示未知类别的待分类图像数据X;
步骤6:利用投影矩阵集{U}将图像数据X按模式投影到低秩子空间中,得到低秩数据
Figure GDA0003292518690000041
步骤7:利用稀疏表示字典D对低秩数据
Figure GDA0003292518690000042
进行稀疏重构,得到稀疏重构系数a;
步骤8:将稀疏重构系数a输入到分类器W中,得到类别标签向量l,l中最大值对应的位置为图像预测类别。
下面结合流程图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
具体实施例如下:
步骤1:以张量形式表示图像数据:
例如:我们有1000张灰度图像,分为5类每类200张,图像分辨率为960x1024。对于每张图像表示为2阶矩阵Y∈R960×1024,那么整个数据集可以表示成3阶张量Y∈R960×1024×1000,其中第1阶为图像的行空间,第2阶为图像的列空间,第3阶为图像的样本空间。
步骤2:利用原始数据Y计算低秩投影矩阵集{U1∈R960×960,U2∈R1024×1024},并将原始数据按模式投影到子空间中,得到低秩数据
Figure GDA0003292518690000043
步骤2本质是计算如下最优化问题:
Figure GDA0003292518690000044
s.t.φ(960,1024,1000)(DA)=[Y;U1,U2,I]+ò
其中λ是权衡参数,用于平衡低秩性和投影误差,D∈R983040×1000是稀疏表示字典,A∈R1000×1000是稀疏重构系数,φ(a,b,c)(·)是一个转换函数,能够将矩阵X∈Rab×c折叠成张量X∈Ra×b×c,ò为投影误差。
这个最优化问题可以通过块坐标下降法和增广拉格朗日乘子法计算。在得到投影矩阵集后,可以计算低秩数据
Figure GDA0003292518690000045
步骤3:利用低秩数据
Figure GDA0003292518690000046
计算稀疏表示字典D和线性分类器W∈R5×1000
步骤3本质是计算如下最优化问题:
Figure GDA0003292518690000051
s.t.||a||0≤R
其中α为权衡参数,用于平衡重构误差和分类误差,||·||0表示0范数,a是A的每一列,是每个数据的稀疏重构系数,R为稀疏约束系数,H∈R5×1000是标签矩阵,当第n个样本属于第k类时,Hkn=1,其余元素为0。
这个最优化问题可以通过K-SVD算法计算。
步骤4:迭代步骤2和步骤3直至收敛。
至此我们成功训练得到一组低秩投影矩阵集{U1,U2},一个稀疏表示字典D和一个线性分类器W。下面将说明如何对未知类别的图像进行分类。
步骤5:对于相同分辨率未知类别的待分类图像,可以表示为2阶矩阵X∈R960×1024
步骤6:利用投影矩阵集将数据X投影到低秩子空间中,得到低秩数据
Figure GDA0003292518690000052
步骤7:利用字典D对低秩数据
Figure GDA0003292518690000053
进行稀疏重构,得到稀疏重构系数a∈R1000
步骤7本质是计算如下最优化问题:
Figure GDA0003292518690000054
其中vec(·)是将张量展开成向量的函数,β为权衡参数,用于平衡重构误差和稀疏性,||·||1为1范数。这个问题可以通过正交匹配追踪算法计算。
步骤8:将稀疏重构系数a输入到线性分类器W中,得到图像预测的类别:
计算类别标签向量l=Wa∈R5,其中最大值所在的位置就是我们预测的图像类别。

Claims (3)

1.一种高阶高维图像数据的表示与分类方法,其特征在于:具体包含模型训练和分类预测两部分;
模型训练用于利用已知类别的图像数据训练出具有分类能力的模型;
分类预测用于利用训练得到的模型对未知类别的图像数据进行分类;
其中,所述模型训练具体包含如下步骤:
步骤1,直接使用张量形式表示每张图像,构造原始数据Y;
步骤2,利用原始数据计算低秩投影矩阵集{U},并将原始数据Y按模式投影到低秩子空间中,得到低秩数据;
步骤3,利用低秩数据计算稀疏表示字典D和线性分类器W,并通过稀疏重构对低秩子空间进行修正,得到更具判别性的低秩子空间;
步骤4,迭代步骤2和步骤3直至收敛;
所述分类预测具体包含如下步骤:
步骤a,直接使用张量形式表示未知类别的待分类图像数据;
步骤b,利用低秩投影矩阵集{U}将已知类别的待分类图像数据按模式投影到低秩子空间中,得到低秩数据;
步骤c,利用稀疏表示字典D对低秩数据进行稀疏重构,得到稀疏重构系数a;
步骤d,稀疏重构系数a输入到分类器W中,得到类别标签向量l,则l中最大值对应的位置为图像预测类别;
所述步骤2具体计算如下:
Figure FDA0003292518680000011
Figure FDA0003292518680000012
其中,λ是权衡参数,用于平衡低秩性和投影误差,D∈R983040×1000是稀疏表示字典,A∈R1000×1000是稀疏重构系数,φ(a,b,c)(·)是一个转换函数,能够将矩阵X∈Rab×c折叠成张量X∈Ra×b×c
Figure FDA0003292518680000013
为投影误差;投影矩阵集{U1∈R960×960,U2∈R1024×1024};
所述步骤3具体如下:
Figure FDA0003292518680000021
s.t.||a||0≤R
其中,α为权衡参数,用于平衡重构误差和分类误差,||·||0表示0范数,a是A的每一列,是每个数据的稀疏重构系数,R为稀疏约束系数,H∈R5×1000是标签矩阵,当第n个样本属于第k类时,Hkn=1,其余元素为0。
2.根据权利要求1所述的一种高阶高维图像数据的表示与分类方法,其特征在于:所述步骤c具体计算如下:
Figure FDA0003292518680000022
其中,vec(·)是将张量展开成向量的函数,β为权衡参数,用于平衡重构误差和稀疏性,||·||1为1的范数。
3.根据权利要求2所述的一种高阶高维图像数据的表示与分类方法,其特征在于:在步骤d中,l=Wa∈R5
CN201711193755.8A 2017-11-24 2017-11-24 一种高阶高维图像数据的表示与分类方法 Active CN109190645B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711193755.8A CN109190645B (zh) 2017-11-24 2017-11-24 一种高阶高维图像数据的表示与分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711193755.8A CN109190645B (zh) 2017-11-24 2017-11-24 一种高阶高维图像数据的表示与分类方法

Publications (2)

Publication Number Publication Date
CN109190645A CN109190645A (zh) 2019-01-11
CN109190645B true CN109190645B (zh) 2022-02-22

Family

ID=64948451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711193755.8A Active CN109190645B (zh) 2017-11-24 2017-11-24 一种高阶高维图像数据的表示与分类方法

Country Status (1)

Country Link
CN (1) CN109190645B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449772B (zh) * 2021-05-26 2022-11-25 浙江工业大学 基于鲁棒多投影支持向量机的医学图像处理方法
CN113627555A (zh) * 2021-08-18 2021-11-09 广东电网有限责任公司 一种图像分类的实现方法、装置、设备和介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279932B (zh) * 2013-06-05 2016-12-28 北京工业大学 一种二维合成稀疏模型和基于该模型的字典训练方法
CN104281855B (zh) * 2014-09-30 2017-05-10 西安电子科技大学 基于多任务低秩的高光谱图像分类方法
CN107067040A (zh) * 2017-05-11 2017-08-18 攀枝花学院 基于张量稀疏表示及聚类的多光谱遥感图像分类方法

Also Published As

Publication number Publication date
CN109190645A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
CN108009559B (zh) 一种基于空谱联合信息的高光谱数据分类方法
WO2022041678A1 (zh) 张量协作图判别分析遥感图像特征提取方法
US20190087726A1 (en) Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications
CN108256486B (zh) 一种基于非负低秩和半监督学习的图像识别方法及装置
CN109190511B (zh) 基于局部与结构约束低秩表示的高光谱分类方法
CN106980825B (zh) 一种基于归一化像素差特征的人脸姿势分类方法
CN105528620B (zh) 一种联合鲁棒主成分特征学习与视觉分类方法及系统
Shah et al. Abnormality detection using deep neural networks with robust quasi-norm autoencoding and semi-supervised learning
Flenner et al. A deep non-negative matrix factorization neural network
CN108460400A (zh) 一种结合多种特征信息的高光谱图像分类方法
CN108647726B (zh) 一种图像聚类方法
CN111126169B (zh) 基于正交化的图正则非负矩阵分解的人脸识别方法及系统
CN109190645B (zh) 一种高阶高维图像数据的表示与分类方法
Huang et al. A deep dictionary model for image super-resolution
Yang et al. Unsupervised images segmentation via incremental dictionary learning based sparse representation
CN110826534B (zh) 一种基于局部主成分分析的人脸关键点检测方法及系统
CN109271874B (zh) 一种融合空间和光谱信息的高光谱图像特征提取方法
CN106960225B (zh) 一种基于低秩监督的稀疏图像分类方法
Qiu et al. Learning transformations for classification forests
You et al. Robust structure low-rank representation in latent space
Elsayed et al. Hand gesture recognition based on dimensionality reduction of histogram of oriented gradients
CN108009586B (zh) 封顶概念分解方法及图像聚类方法
CN106709494B (zh) 一种基于耦合空间学习的场景文字识别方法
CN108121965B (zh) 基于鲁棒联合稀疏特征提取的图像识别方法
CN113177602B (zh) 图像分类方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant