CN109190645B

CN109190645B - 一种高阶高维图像数据的表示与分类方法

Info

Publication number: CN109190645B
Application number: CN201711193755.8A
Authority: CN
Inventors: 胡岩峰; 陆成韬; 周鹏; 杭谊青; 陆茜茜; 廉海明; 彭晨
Original assignee: Suzhou Research Institute Institute Of Electronics Chinese Academy Of Sciences
Current assignee: Suzhou Research Institute Institute Of Electronics Chinese Academy Of Sciences
Priority date: 2017-11-24
Filing date: 2017-11-24
Publication date: 2022-02-22
Anticipated expiration: 2037-11-24
Also published as: CN109190645A

Abstract

本发明公开了一种高阶高维图像数据的表示与分类方法，属于模式识别领域，其解决了图像识别过程中受噪音影响、图像原始结构被破坏，数据特征维度高、表示算法与分类算法不契合等问题。本发明所采用的技术方案是，利用投影矩阵集将图像数据从原始空间按模式投影到低秩子空间中，得到数据的低秩表示；在低秩子空间中训练稀疏表示字典和线性分类器，对图像数据进行分。利用投影矩阵集将图像数据从原始空间按模式投影到低秩子空间中，得到数据的低秩表示；在低秩子空间中训练稀疏表示字典和线性分类器，对图像数据进行分类。

Description

一种高阶高维图像数据的表示与分类方法

技术领域

本发明属于模式识别领域，尤其涉及一种高阶高维图像数据的表示与分类方法。

背景技术

随着人类社会的发展，每天都会收集到海量的图像数据，智能化处理与分析图像数据成为研究热点。图像识别的目的就是用计算机代替人类，完成对图像数据的识别任务。图像的表示和分类问题是研究图像识别的重点和难点。

图像表示又分为图像的预处理和图像的特征提取。图像的预处理包括对噪音和畸变的消除，对缺失信息的修复和对图像的分割等；图像的特征提取是根据任务的需求，利用降维算法和图像处理技术，从图像中提取出更加精简、更加抽象和更易处理的特征信息。

图像分类是将未知类别的图像归属到已知类别中的过程，其中比较经典的方法有K近邻，支持向量机和人工神经网络等。

目前对高阶高维图像数据的识别往往会遇到以下几个问题：

1)在图像的采集、传输和存储过程中经常会出现误差，从而导致数据被噪音污染失真，甚至损毁缺失，在高阶高维数据中这种情况尤为常见。

2)传统方法一般用向量来表示图像，需要对采集得到的图像进行展开。这一过程既破坏了图像原本的空间结构，损失了像素间的关联信息，又造成了数据维度的增加，容易引起维度灾和小样本问题。

表示算法与分类算法往往是独立设计的，经常会出现表示算法与分类算法不契合的情况。

发明内容

本发明所要解决的技术问题是

本发明为解决上述技术问题采用以下技术方案

一种高阶高维图像数据的表示与分类方法，具体包含模型训练和分类预测两部分；

模型训练用于利用已知类别的图像数据训练出具有分类能力的模型；

分类预测用于利用训练得到的模型对未知类别的图像数据进行分类；

其中，所述模型训练具体包含如下步骤：

步骤1，直接使用张量形式表示每张图像，构造原始数据Y；

步骤2，利用原始数据计算低秩投影矩阵集{U}，并将原始数据Y按模式投影到低秩子空间中，得到低秩数据；

步骤3，利用低秩数据计算稀疏表示字典D和线性分类器W，并通过稀疏重构对低秩子空间进行修正，得到更具判别性的低秩子空间；

步骤4，迭代步骤2和步骤3直至收敛；

所述分类预测具体包含如下步骤：

步骤a，直接使用张量形式表示未知类别的待分类图像数据；

步骤b，利用低秩投影矩阵集{U}将已知类别的待分类图像数据按模式投影到低秩子空间中，得到低秩数据；

步骤c，利用稀疏表示字典D对低秩数据进行稀疏重构，得到稀疏重构系数a；

步骤d，将稀疏重构系数a输入到分类器W中，得到类别标签向量l，则l中最大值对应的位置为图像预测类别。

作为本发明一种高阶高维图像数据的表示与分类方法的进一步优选方案，所述步骤2具体计算如下：

s.t.φ_{(960,1024,1000)}(DA)＝[Y；U₁,U₂,I]+ò

其中，λ是权衡参数，用于平衡低秩性和投影误差，D∈R^983040×1000是稀疏表示字典，A∈R^1000×1000是稀疏重构系数，φ_(a,b,c)(·)是一个转换函数，能够将矩阵X∈R^ab×c折叠成张量X∈R^a×b×c，ò为投影误差。

作为本发明一种高阶高维图像数据的表示与分类方法的进一步优选方案，所述步骤3具体如下：

s.t.||a||₀≤R

其中，α为权衡参数，用于平衡重构误差和分类误差，||·||₀表示0范数，a是A的每一列，是每个数据的稀疏重构系数，R为稀疏约束系数，H∈R^5×1000是标签矩阵，当第n个样本属于第k类时，H_kn＝1，其余元素为0。

作为本发明一种高阶高维图像数据的表示与分类方法的进一步优选方案，所述步骤c具体计算如下：

其中，vec(·)是将张量展开成向量的函数，β为权衡参数，用于平衡重构误差和稀疏性，||·||₁为1范数。

作为本发明一种高阶高维图像数据的表示与分类方法的进一步优选方案，在步骤d中，l＝Wa∈R⁵。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：

1、本发明针对高阶高维数据特征维度高，强噪音和易缺失等特点，利用图像数据的低秩特性，通过投影对受噪音污染和损毁缺失的图像进行降噪修复；

2、本发明直接使用张量表示图像，保持了图像的原始结构，并减少了每次需要计算的特征数量，避免了维度灾；

3、本发明联合使用低秩表示和稀疏表示，将表示过程和分类过程相结合，避免了表示算法与分类算法独立设计的缺陷，提高了分类正确率。

附图说明

图1是图像分类流程图。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明：

本发明分为模型训练和和分类预测两部分，模型训练为利用已知类别的图像数据训练出具有分类能力的模型；而分类预测为利用训练得到的模型对未知类别的图像数据进行分类。

本发明的具体步骤如下：

(1)模型训练：

步骤1：直接使用张量形式表示每张图像，构造原始数据Y；

步骤2：利用原始数据Y计算低秩投影矩阵集{U}，并将原始数据按模式投影到低秩子空间中，得到低秩数据

步骤3：利用低秩数据

计算稀疏表示字典D和线性分类器W，并通过稀疏重构对低秩子空间进行修正，得到更具判别性的子空间；

步骤4：迭代步骤2和步骤3直至收敛。

(2)分类预测：

步骤5：直接使用张量形式表示未知类别的待分类图像数据X；

步骤6：利用投影矩阵集{U}将图像数据X按模式投影到低秩子空间中，得到低秩数据

步骤7：利用稀疏表示字典D对低秩数据

进行稀疏重构，得到稀疏重构系数a；

步骤8：将稀疏重构系数a输入到分类器W中，得到类别标签向量l，l中最大值对应的位置为图像预测类别。

下面结合流程图，对优选实施例作详细说明。应该强调的是，下述说明仅仅是示例性的，而不是为了限制本发明的范围及其应用。

具体实施例如下：

步骤1：以张量形式表示图像数据：

例如：我们有1000张灰度图像，分为5类每类200张，图像分辨率为960x1024。对于每张图像表示为2阶矩阵Y∈R^960×1024，那么整个数据集可以表示成3阶张量Y∈R^{960×1024×1000}，其中第1阶为图像的行空间，第2阶为图像的列空间，第3阶为图像的样本空间。

步骤2：利用原始数据Y计算低秩投影矩阵集{U₁∈R^960×960,U₂∈R^1024×1024}，并将原始数据按模式投影到子空间中，得到低秩数据

步骤2本质是计算如下最优化问题：

s.t.φ_{(960,1024,1000)}(DA)＝[Y；U₁,U₂,I]+ò

其中λ是权衡参数，用于平衡低秩性和投影误差，D∈R^983040×1000是稀疏表示字典，A∈R^1000×1000是稀疏重构系数，φ_(a,b,c)(·)是一个转换函数，能够将矩阵X∈R^ab×c折叠成张量X∈R^a×b×c，ò为投影误差。

这个最优化问题可以通过块坐标下降法和增广拉格朗日乘子法计算。在得到投影矩阵集后，可以计算低秩数据

步骤3：利用低秩数据

计算稀疏表示字典D和线性分类器W∈R^5×1000：

步骤3本质是计算如下最优化问题：

s.t.||a||₀≤R

其中α为权衡参数，用于平衡重构误差和分类误差，||·||₀表示0范数，a是A的每一列，是每个数据的稀疏重构系数，R为稀疏约束系数，H∈R^5×1000是标签矩阵，当第n个样本属于第k类时，H_kn＝1，其余元素为0。

这个最优化问题可以通过K-SVD算法计算。

步骤4：迭代步骤2和步骤3直至收敛。

至此我们成功训练得到一组低秩投影矩阵集{U₁,U₂}，一个稀疏表示字典D和一个线性分类器W。下面将说明如何对未知类别的图像进行分类。

步骤5：对于相同分辨率未知类别的待分类图像，可以表示为2阶矩阵X∈R^960×1024；

步骤6：利用投影矩阵集将数据X投影到低秩子空间中，得到低秩数据

步骤7：利用字典D对低秩数据

进行稀疏重构，得到稀疏重构系数a∈R¹⁰⁰⁰：

步骤7本质是计算如下最优化问题：

其中vec(·)是将张量展开成向量的函数，β为权衡参数，用于平衡重构误差和稀疏性，||·||₁为1范数。这个问题可以通过正交匹配追踪算法计算。

步骤8：将稀疏重构系数a输入到线性分类器W中，得到图像预测的类别：

计算类别标签向量l＝Wa∈R⁵，其中最大值所在的位置就是我们预测的图像类别。

Claims

1.一种高阶高维图像数据的表示与分类方法，其特征在于：具体包含模型训练和分类预测两部分；

其中，所述模型训练具体包含如下步骤：

步骤1，直接使用张量形式表示每张图像，构造原始数据Y；

步骤4，迭代步骤2和步骤3直至收敛；

所述分类预测具体包含如下步骤：

步骤a，直接使用张量形式表示未知类别的待分类图像数据；

步骤d，稀疏重构系数a输入到分类器W中，得到类别标签向量l，则l中最大值对应的位置为图像预测类别；

所述步骤2具体计算如下：

其中，λ是权衡参数，用于平衡低秩性和投影误差，D∈R^983040×1000是稀疏表示字典，A∈R^1000×1000是稀疏重构系数，φ_(a，b，c)(·)是一个转换函数，能够将矩阵X∈R^ab×c折叠成张量X∈R^a×b×c，

为投影误差；投影矩阵集{U₁∈R^960×960，U₂∈R^1024×1024}；

所述步骤3具体如下：

s.t.||a||₀≤R

2.根据权利要求1所述的一种高阶高维图像数据的表示与分类方法，其特征在于：所述步骤c具体计算如下：

其中，vec(·)是将张量展开成向量的函数，β为权衡参数，用于平衡重构误差和稀疏性，||·||₁为1的范数。

3.根据权利要求2所述的一种高阶高维图像数据的表示与分类方法，其特征在于：在步骤d中，l＝Wa∈R⁵。