CN110163274B

CN110163274B - 一种基于鬼成像和线性判别分析的物体分类方法

Info

Publication number: CN110163274B
Application number: CN201910401793.0A
Authority: CN
Inventors: 赵生妹; 魏朝鹏; 何儒勇; 林泽群
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2019-05-15
Filing date: 2019-05-15
Publication date: 2022-08-30
Anticipated expiration: 2039-05-15
Also published as: CN110163274A

Abstract

本发明提出了一种基于鬼成像和线性判别分析的物体分类方法，先根据线性判别分析算法获得基于MNIST手写体数字数据集的适合于鬼成像的特征散斑，接着使用这些散斑对未知物体进行照射，然后使用没有任何空间分辨率的桶探测器接收从未知数字物体反射或者透射的光场信号，最后将桶探测器接收的信号与MNIST手写体数字数据集均值图像在特征散斑照射下桶探测器的接收信号进行比较，完成未知物体的分类，本发明可以用较少的散斑个数我们就能以较高的准确率对未知物体进行分类，可用于图像识别中。

Description

一种基于鬼成像和线性判别分析的物体分类方法

技术领域

本发明涉及一种光学图像物体分类方法，具体的说是一种基于鬼成像和线性判别分析的物体分类方法，属于量子光学技术领域。

背景技术

关联成像(Correlated Imaging)，又称“鬼”成像(Ghost Imaging,GI)，是近些年来量子光学领域的前沿和热点之一。关联成像采用两条光路，一支称为信号光路，指散斑通过物体后的光用一个无空间分辨能力的桶探测器接收；另一支称为参考光路，指散斑在传输一段距离后由具有空间分辨能力的探测器接收。最后对两条光路的探测结果进行二阶关联可以在参考光路得到物体的恢复图像。与传统的成像方式不同的是关联成像可以在不包含物体的光路上恢复出物体图像，这一特性称为非定域性。随着关联成像的发展，热光“鬼”成像、计算“鬼”成像等新型“鬼”成像技术被不断提出。与此同时，随着“鬼”成像性能的提高，各种基于“鬼”成像的应用也得以实现。大量研究表明，“鬼”成像可广泛应用在军事、加密、激光雷达等领域。

对物体分类可以更清晰、有序地认识物体，对物体的分类有依据一定的标准。分类在实际应用的范围非常广泛，对一个物体不断细化分类就能让我们更加了解这个物体。对未知物体的分类能够让我们对该物体或者该场景有更完整的认识。

线性判别分析(Linear Discriminant Analysis,LDA)是一种经典的机器学习方法，可以将其应用于分类问题。LDA技术通过物体的信息和类别通过设计相应的投影矩阵使得投影后的结果能很好的应用于物体分类任务。

K最近邻分类算法是分类技术中最简单的方法之一。K最近邻分类算法的核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。K最近邻分类算法先计算待分类样本与已知类别的训练样本之间的距离，找到距离与待分类样本数据最近的K个邻居；再根据这些邻居所属的类别来判断待分类样本数据的类别；特别的，当K取值为1时，K近邻算法又称为最近邻算法。

发明内容

本发明的目的是提供一种基于鬼成像和线性判别分析的物体分类方法，在无需得知未知物体图片即可对图片进行分类。

本发明的目的是这样实现的：一种基于鬼成像和线性判别分析的物体分类方法，包括以下步骤：

步骤一：加载MNIST手写数据集中的手写体数字图片及其对应的标签，并将其分为训练集和测试集，其中训练集中包含60000张数字图片，测试集中包含10000张数字图片；

步骤二：根据训练集数据，求得各类样本的均值

计算各个数字类别的协方差矩阵之和，称为类内散度矩阵S_w；将各个数字类别的样本均值的差乘以差的转置，所得的结果称为类间散度矩阵S_b，提取出S_w ^-1·S_b的前K个特征值和特征向量(S_w ^-1为类内散度矩阵的逆)，这个特征向量即是利用线性判别分析算法设计出的适用于鬼成像中手写体数字图片分类的特征散斑；

步骤三：将特征散斑载入数字微镜设备(Digital micromirror device,DMD)，将激光照射到DMD上并使用DMD产生的散斑对未知数字图像进行照射，然后使用没有任何空间分辨率的桶探测器接收未知数字物体反射(透射)后的光；

步骤四：将K个特征散斑分别照射训练集中的60000张MNIST手写训练图片，并获取对应的桶探测器信号，利用桶探测器信号及其图片的类别标签作为图片数字分类算法的训练集，在计算机内对最近邻分类算法进行训练；

步骤五：将K个特征散斑分别照射未知类别的数字图片，并获取对应的桶探测器信号；将桶探测器值输入到计算机内训练好的最近邻分类算法结果中，得到未知类别的数字图片的分类信息。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：

本发明将鬼成像引入分类问题，在无需得知未知物体的情况下即可进行分类，同时所需散斑较少，能以较少的散斑达到较大的分类精度；在使用根据线性判别分析算法设计好的特征散斑照射物体后，通过没有任何空间分辨率的桶探测器收集到的反射或透射光信息使用最近邻算法对物体进行分类，最近邻算法中采用欧氏距离进行相似性度量；同时通过理论分析可以知道鬼成像照射的散斑次数最大仅为物体的类别数减一；本发明可以用较少的散斑个数我们就能以较高的准确率对未知物体进行分类。本发明可用于图像识别中。

附图说明

图1为基于鬼成像和线性判别分析物体分类方法原理图。

图2为MNIST数据集测试集中各类别的分类准确率结果图。

图3为MNIST数据集进行测试时部分测试数据分类结果图。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明：

目前大部分的分类方法都必须知道物体的图片才能进行分类。在现实中存在一些特殊场景，如极暗环境下，我们无法通过传统光学成像直接获取到物体的信息。此时便可以将鬼成像技术应用于物体分类，可以在无法直接看到物体的情况下利用桶探测器值进行分类。基于鬼成像和线性判别分析物体分类方法的大致流程图如图1所示。

在机器学习算法中，线性判别分析经常被用于物体的降维和分类。与主成分分析(PCA)算法不同，线性判别分析算法在进行降维时加入了物体对应的类别信息，因此相比于PCA算法，线性判别分析具有更好的性能。下面我们以MNIST手写体数据集为例，简单的介绍一下基于鬼成像和线性判别分析物体分类方法的基本原理。

下面介绍如何根据MNIST数据集设计最优的应用于鬼成像物体分类方法的散斑。整个MNIST手写体数字数据集可以分成10类，分为数字0到数字9，下面是根据分类任务设计相应散斑，其具体实现过程如下。

假设数据集

其中

是指将第i个数字图片整形后的p维列向量表示，y_i是第i个数字图片对应的类别。我们定义

为第j类样本的均值，∑_j(j＝0,1，……，9)为第j类样本的协方差矩阵。

则

的表达式为：

∑_j的表达式为：

其中，X_j是数字类别j的所有的p维列向量的集合；假设数字0到数字9的MNIST手写体数字数据集中的个数为n。我们定义N_j(j＝0,1，……，9)为第j类样本的个数。

假设低维空间的维度为d，则对应的基向量假设为

基向量组成的矩阵为W，它是一个p×d的矩阵。此时，在多分类的任务中使用d个散斑对未知物体进行投影，将数字投影到一个d维的空间中，也可以说是d维的超平面。同样为了得到最好的用于鬼成像多分类任务的特征散斑，我们需要根据投影以后同类样本距离较近、不同类样本投影以后距离较远的原则进行设计。综合以上分析，我们的优化目标W^*应该为：

对公式(3)进行优化n以后，优化的d个p维向量即为我们的分类任务中的投影散斑。一般我们定义类间散度矩阵S_b为：

其中

为上文中提出的第j类样本的均值，

的表达式为：

其中D为用于所有训练的图片整形后的p维列向量集合，N是所有类别样本的个数。

同时定义类内散度矩阵S_w为：

在优化目标，即公式(3)中，此时W^TS_wW和W^TS_bW不再是一个标量，因此解此优化问题不能简单地将其作为一个标量进行优化。此时我们可以使用其他的优化目标代替我们的公式(3)，常见的优化目标W^*为：

其中

为A的主对角元素的乘积，W为p×d维的矩阵。此时J(W)可以表示为：

其中，当低维空间的维度为d时，对应的基向量为

为第i个维度的基向量

从公式(8)可知，J(W)的最大值即为

的最大的d个特征值的乘积，因此，W应该由这d个最大的特征值对应的特征向量组成。在上述分析中，根据前述，为了获取k个特征散斑，只需把d改成k，k个散斑类似于降到k维。

在我们得到用于照射物体的特征散斑之后，我们需要使用该散斑对物体进行照射，然后使用没有任何空间分辨率的桶探测器接收未知数字物体反射或者透射的光信号，最后将桶探测器的值与各类数据的均值图像使用散斑照射之后的桶探测器值进行比较，将距离最近的均值图像所在的类别作为未知数字物体的类别。

为了验证我们基于鬼成像的物体分类方法的有效性，我们使用的是MNIST手写体数字集；我们首先采用60000幅手写体数字图像进行分类算法的训练，再采用剩下的10000幅手写体数字图像作为测试集，进行分类算法的测试，测试结果的准确率为89.52％；各数字类别的分类准确率和整体的分类准确率在图2中进行展示；我们从测试结果中随机抽取9幅图及其测试结果进行展示，最终结果如图3所示；从图3可以看出，在上述9幅图中有2幅数字图片预测错误，其中把数字7和数字5错误的分类成数字9和6，然而从主观判断来说，被错误分类成的数字9和数字6比较像手写图片中的数字7和数字5；综合以上分析可知，我们提出的方法可以在物体未知的情况下直接设计出相应的散斑直接得到物体的类别信息，同时通过仿真结果我们可以知道我们的方法具有较高的分类准确率，即为89.52％，因此说明了我们基于鬼成像的分类方法具有较好的分类性能。

以上所述，仅为本发明中的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉该技术的人在本发明所揭露的技术范围内，可理解想到的变换或替换，都应涵盖在本发明的包含范围之内，因此，本发明的保护范围应该以权利要求书的保护范围为准。

Claims

1.一种基于鬼成像和线性判别分析的物体分类方法，其特征在于，包括以下步骤：

步骤二：根据训练集数据，求得各类样本的均值，

计算各个数字类别的协方差矩阵之和，称为类内散度矩阵S_w；将各个数字类别的样本均值的差乘以差的转置，所得的结果称为类间散度矩阵S_b，提取出S_w ^-1·S_b的前K个特征值和特征向量，S_w ^-1为类内散度矩阵的逆，这个特征向量即是利用线性判别分析算法设计出的适用于鬼成像中手写体数字图片分类的特征散斑；

步骤三：将特征散斑载入数字微镜设备，将激光照射到DMD上并使用DMD产生的散斑对未知数字图像进行照射，然后使用没有任何空间分辨率的桶探测器接收未知数字物体反射、透射后的光；