CN110163274B - 一种基于鬼成像和线性判别分析的物体分类方法 - Google Patents

一种基于鬼成像和线性判别分析的物体分类方法 Download PDF

Info

Publication number
CN110163274B
CN110163274B CN201910401793.0A CN201910401793A CN110163274B CN 110163274 B CN110163274 B CN 110163274B CN 201910401793 A CN201910401793 A CN 201910401793A CN 110163274 B CN110163274 B CN 110163274B
Authority
CN
China
Prior art keywords
digital
speckles
classification
unknown
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910401793.0A
Other languages
English (en)
Other versions
CN110163274A (zh
Inventor
赵生妹
魏朝鹏
何儒勇
林泽群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201910401793.0A priority Critical patent/CN110163274B/zh
Publication of CN110163274A publication Critical patent/CN110163274A/zh
Application granted granted Critical
Publication of CN110163274B publication Critical patent/CN110163274B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种基于鬼成像和线性判别分析的物体分类方法,先根据线性判别分析算法获得基于MNIST手写体数字数据集的适合于鬼成像的特征散斑,接着使用这些散斑对未知物体进行照射,然后使用没有任何空间分辨率的桶探测器接收从未知数字物体反射或者透射的光场信号,最后将桶探测器接收的信号与MNIST手写体数字数据集均值图像在特征散斑照射下桶探测器的接收信号进行比较,完成未知物体的分类,本发明可以用较少的散斑个数我们就能以较高的准确率对未知物体进行分类,可用于图像识别中。

Description

一种基于鬼成像和线性判别分析的物体分类方法
技术领域
本发明涉及一种光学图像物体分类方法,具体的说是一种基于鬼成像和线性判别分析的物体分类方法,属于量子光学技术领域。
背景技术
关联成像(Correlated Imaging),又称“鬼”成像(Ghost Imaging,GI),是近些年来量子光学领域的前沿和热点之一。关联成像采用两条光路,一支称为信号光路,指散斑通过物体后的光用一个无空间分辨能力的桶探测器接收;另一支称为参考光路,指散斑在传输一段距离后由具有空间分辨能力的探测器接收。最后对两条光路的探测结果进行二阶关联可以在参考光路得到物体的恢复图像。与传统的成像方式不同的是关联成像可以在不包含物体的光路上恢复出物体图像,这一特性称为非定域性。随着关联成像的发展,热光“鬼”成像、计算“鬼”成像等新型“鬼”成像技术被不断提出。与此同时,随着“鬼”成像性能的提高,各种基于“鬼”成像的应用也得以实现。大量研究表明,“鬼”成像可广泛应用在军事、加密、激光雷达等领域。
对物体分类可以更清晰、有序地认识物体,对物体的分类有依据一定的标准。分类在实际应用的范围非常广泛,对一个物体不断细化分类就能让我们更加了解这个物体。对未知物体的分类能够让我们对该物体或者该场景有更完整的认识。
线性判别分析(Linear Discriminant Analysis,LDA)是一种经典的机器学习方法,可以将其应用于分类问题。LDA技术通过物体的信息和类别通过设计相应的投影矩阵使得投影后的结果能很好的应用于物体分类任务。
K最近邻分类算法是分类技术中最简单的方法之一。K最近邻分类算法的核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。K最近邻分类算法先计算待分类样本与已知类别的训练样本之间的距离,找到距离与待分类样本数据最近的K个邻居;再根据这些邻居所属的类别来判断待分类样本数据的类别;特别的,当K取值为1时,K近邻算法又称为最近邻算法。
发明内容
本发明的目的是提供一种基于鬼成像和线性判别分析的物体分类方法,在无需得知未知物体图片即可对图片进行分类。
本发明的目的是这样实现的:一种基于鬼成像和线性判别分析的物体分类方法,包括以下步骤:
步骤一:加载MNIST手写数据集中的手写体数字图片及其对应的标签,并将其分为训练集和测试集,其中训练集中包含60000张数字图片,测试集中包含10000张数字图片;
步骤二:根据训练集数据,求得各类样本的均值
Figure BDA0002059979260000021
计算各个数字类别的协方差矩阵之和,称为类内散度矩阵Sw;将各个数字类别的样本均值的差乘以差的转置,所得的结果称为类间散度矩阵Sb,提取出Sw -1·Sb的前K个特征值和特征向量(Sw -1为类内散度矩阵的逆),这个特征向量即是利用线性判别分析算法设计出的适用于鬼成像中手写体数字图片分类的特征散斑;
步骤三:将特征散斑载入数字微镜设备(Digital micromirror device,DMD),将激光照射到DMD上并使用DMD产生的散斑对未知数字图像进行照射,然后使用没有任何空间分辨率的桶探测器接收未知数字物体反射(透射)后的光;
步骤四:将K个特征散斑分别照射训练集中的60000张MNIST手写训练图片,并获取对应的桶探测器信号,利用桶探测器信号及其图片的类别标签作为图片数字分类算法的训练集,在计算机内对最近邻分类算法进行训练;
步骤五:将K个特征散斑分别照射未知类别的数字图片,并获取对应的桶探测器信号;将桶探测器值输入到计算机内训练好的最近邻分类算法结果中,得到未知类别的数字图片的分类信息。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明将鬼成像引入分类问题,在无需得知未知物体的情况下即可进行分类,同时所需散斑较少,能以较少的散斑达到较大的分类精度;在使用根据线性判别分析算法设计好的特征散斑照射物体后,通过没有任何空间分辨率的桶探测器收集到的反射或透射光信息使用最近邻算法对物体进行分类,最近邻算法中采用欧氏距离进行相似性度量;同时通过理论分析可以知道鬼成像照射的散斑次数最大仅为物体的类别数减一;本发明可以用较少的散斑个数我们就能以较高的准确率对未知物体进行分类。本发明可用于图像识别中。
附图说明
图1为基于鬼成像和线性判别分析物体分类方法原理图。
图2为MNIST数据集测试集中各类别的分类准确率结果图。
图3为MNIST数据集进行测试时部分测试数据分类结果图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
目前大部分的分类方法都必须知道物体的图片才能进行分类。在现实中存在一些特殊场景,如极暗环境下,我们无法通过传统光学成像直接获取到物体的信息。此时便可以将鬼成像技术应用于物体分类,可以在无法直接看到物体的情况下利用桶探测器值进行分类。基于鬼成像和线性判别分析物体分类方法的大致流程图如图1所示。
在机器学习算法中,线性判别分析经常被用于物体的降维和分类。与主成分分析(PCA)算法不同,线性判别分析算法在进行降维时加入了物体对应的类别信息,因此相比于PCA算法,线性判别分析具有更好的性能。下面我们以MNIST手写体数据集为例,简单的介绍一下基于鬼成像和线性判别分析物体分类方法的基本原理。
下面介绍如何根据MNIST数据集设计最优的应用于鬼成像物体分类方法的散斑。整个MNIST手写体数字数据集可以分成10类,分为数字0到数字9,下面是根据分类任务设计相应散斑,其具体实现过程如下。
假设数据集
Figure BDA0002059979260000031
其中
Figure BDA0002059979260000032
是指将第i个数字图片整形后的p维列向量表示,yi是第i个数字图片对应的类别。我们定义
Figure BDA0002059979260000041
为第j类样本的均值,∑j(j=0,1,……,9)为第j类样本的协方差矩阵。
Figure BDA0002059979260000042
的表达式为:
Figure BDA0002059979260000043
j的表达式为:
Figure BDA0002059979260000044
其中,Xj是数字类别j的所有的p维列向量的集合;假设数字0到数字9的MNIST手写体数字数据集中的个数为n。我们定义Nj(j=0,1,……,9)为第j类样本的个数。
假设低维空间的维度为d,则对应的基向量假设为
Figure BDA0002059979260000045
基向量组成的矩阵为W,它是一个p×d的矩阵。此时,在多分类的任务中使用d个散斑对未知物体进行投影,将数字投影到一个d维的空间中,也可以说是d维的超平面。同样为了得到最好的用于鬼成像多分类任务的特征散斑,我们需要根据投影以后同类样本距离较近、不同类样本投影以后距离较远的原则进行设计。综合以上分析,我们的优化目标W*应该为:
Figure BDA0002059979260000046
对公式(3)进行优化n以后,优化的d个p维向量即为我们的分类任务中的投影散斑。一般我们定义类间散度矩阵Sb为:
Figure BDA0002059979260000047
其中
Figure BDA0002059979260000048
为上文中提出的第j类样本的均值,
Figure BDA0002059979260000049
的表达式为:
Figure BDA00020599792600000410
其中D为用于所有训练的图片整形后的p维列向量集合,N是所有类别样本的个数。
同时定义类内散度矩阵Sw为:
Figure BDA0002059979260000051
在优化目标,即公式(3)中,此时WTSwW和WTSbW不再是一个标量,因此解此优化问题不能简单地将其作为一个标量进行优化。此时我们可以使用其他的优化目标代替我们的公式(3),常见的优化目标W*为:
Figure BDA0002059979260000052
其中
Figure BDA0002059979260000053
为A的主对角元素的乘积,W为p×d维的矩阵。此时J(W)可以表示为:
Figure BDA0002059979260000054
其中,当低维空间的维度为d时,对应的基向量为
Figure BDA0002059979260000055
Figure BDA0002059979260000056
为第i个维度的基向量
从公式(8)可知,J(W)的最大值即为
Figure BDA0002059979260000057
的最大的d个特征值的乘积,因此,W应该由这d个最大的特征值对应的特征向量组成。在上述分析中,根据前述,为了获取k个特征散斑,只需把d改成k,k个散斑类似于降到k维。
在我们得到用于照射物体的特征散斑之后,我们需要使用该散斑对物体进行照射,然后使用没有任何空间分辨率的桶探测器接收未知数字物体反射或者透射的光信号,最后将桶探测器的值与各类数据的均值图像使用散斑照射之后的桶探测器值进行比较,将距离最近的均值图像所在的类别作为未知数字物体的类别。
为了验证我们基于鬼成像的物体分类方法的有效性,我们使用的是MNIST手写体数字集;我们首先采用60000幅手写体数字图像进行分类算法的训练,再采用剩下的10000幅手写体数字图像作为测试集,进行分类算法的测试,测试结果的准确率为89.52%;各数字类别的分类准确率和整体的分类准确率在图2中进行展示;我们从测试结果中随机抽取9幅图及其测试结果进行展示,最终结果如图3所示;从图3可以看出,在上述9幅图中有2幅数字图片预测错误,其中把数字7和数字5错误的分类成数字9和6,然而从主观判断来说,被错误分类成的数字9和数字6比较像手写图片中的数字7和数字5;综合以上分析可知,我们提出的方法可以在物体未知的情况下直接设计出相应的散斑直接得到物体的类别信息,同时通过仿真结果我们可以知道我们的方法具有较高的分类准确率,即为89.52%,因此说明了我们基于鬼成像的分类方法具有较好的分类性能。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (1)

1.一种基于鬼成像和线性判别分析的物体分类方法,其特征在于,包括以下步骤:
步骤一:加载MNIST手写数据集中的手写体数字图片及其对应的标签,并将其分为训练集和测试集,其中训练集中包含60000张数字图片,测试集中包含10000张数字图片;
步骤二:根据训练集数据,求得各类样本的均值,
Figure FDA0003688304520000011
计算各个数字类别的协方差矩阵之和,称为类内散度矩阵Sw;将各个数字类别的样本均值的差乘以差的转置,所得的结果称为类间散度矩阵Sb,提取出Sw -1·Sb的前K个特征值和特征向量,Sw -1为类内散度矩阵的逆,这个特征向量即是利用线性判别分析算法设计出的适用于鬼成像中手写体数字图片分类的特征散斑;
步骤三:将特征散斑载入数字微镜设备,将激光照射到DMD上并使用DMD产生的散斑对未知数字图像进行照射,然后使用没有任何空间分辨率的桶探测器接收未知数字物体反射、透射后的光;
步骤四:将K个特征散斑分别照射训练集中的60000张MNIST手写训练图片,并获取对应的桶探测器信号,利用桶探测器信号及其图片的类别标签作为图片数字分类算法的训练集,在计算机内对最近邻分类算法进行训练;
步骤五:将K个特征散斑分别照射未知类别的数字图片,并获取对应的桶探测器信号;将桶探测器值输入到计算机内训练好的最近邻分类算法结果中,得到未知类别的数字图片的分类信息。
CN201910401793.0A 2019-05-15 2019-05-15 一种基于鬼成像和线性判别分析的物体分类方法 Active CN110163274B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910401793.0A CN110163274B (zh) 2019-05-15 2019-05-15 一种基于鬼成像和线性判别分析的物体分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910401793.0A CN110163274B (zh) 2019-05-15 2019-05-15 一种基于鬼成像和线性判别分析的物体分类方法

Publications (2)

Publication Number Publication Date
CN110163274A CN110163274A (zh) 2019-08-23
CN110163274B true CN110163274B (zh) 2022-08-30

Family

ID=67634808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910401793.0A Active CN110163274B (zh) 2019-05-15 2019-05-15 一种基于鬼成像和线性判别分析的物体分类方法

Country Status (1)

Country Link
CN (1) CN110163274B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110646810B (zh) * 2019-09-27 2021-08-06 北京理工大学 一种散斑优化压缩感知鬼成像方法及系统
CN111695645B (zh) * 2020-05-09 2022-08-02 南京邮电大学 基于深度神经网络的未知手写体数字识别方法
CN114429429B (zh) * 2022-01-25 2024-02-06 西安交通大学 一种鬼成像求逆方法、系统、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845358A (zh) * 2016-12-26 2017-06-13 苏州大学 一种手写体字符图像特征识别的方法及系统
CN107807444A (zh) * 2017-09-06 2018-03-16 南京邮电大学 一种基于差分的投影仪“街角成像”方法
CN108805061A (zh) * 2018-05-30 2018-11-13 西北工业大学 基于局部自适应判别分析的高光谱图像分类方法
CN109242808A (zh) * 2018-06-28 2019-01-18 南京邮电大学 一种基于分数阶傅里叶变换的关联成像方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845358A (zh) * 2016-12-26 2017-06-13 苏州大学 一种手写体字符图像特征识别的方法及系统
CN107807444A (zh) * 2017-09-06 2018-03-16 南京邮电大学 一种基于差分的投影仪“街角成像”方法
CN108805061A (zh) * 2018-05-30 2018-11-13 西北工业大学 基于局部自适应判别分析的高光谱图像分类方法
CN109242808A (zh) * 2018-06-28 2019-01-18 南京邮电大学 一种基于分数阶傅里叶变换的关联成像方法

Also Published As

Publication number Publication date
CN110163274A (zh) 2019-08-23

Similar Documents

Publication Publication Date Title
Ahmad Deep image retrieval using artificial neural network interpolation and indexing based on similarity measurement
Gao et al. Subspace-based support vector machines for hyperspectral image classification
Kim et al. Tensor canonical correlation analysis for action classification
Patel et al. Dictionary-based face recognition under variable lighting and pose
Avila et al. Bossa: Extended bow formalism for image classification
Bristow et al. Dense semantic correspondence where every pixel is a classifier
CN110163274B (zh) 一种基于鬼成像和线性判别分析的物体分类方法
Biswas et al. One shot detection with laplacian object and fast matrix cosine similarity
Luo et al. Dimension reduction for non-Gaussian data by adaptive discriminative analysis
JP2008310796A (ja) コンピュータにより実施される、訓練データから分類器を構築し、前記分類器を用いてテストデータ中の移動物体を検出する方法
Lin et al. Robust face detection with multi-class boosting
US20070160296A1 (en) Face recognition method and apparatus
CN102906787A (zh) 脸部分析技术
Sawalha et al. Face recognition using harmony search-based selected features
Bahaadini et al. Direct: Deep discriminative embedding for clustering of ligo data
Sogi et al. A method based on convex cone model for image-set classification with CNN features
Luevano et al. A study on the performance of unconstrained very low resolution face recognition: Analyzing current trends and new research directions
Stivaktakis et al. Convolutional neural networks for spectroscopic redshift estimation on euclid data
Ukwatta et al. Machine vision system for automated spectroscopy
Ghaleb et al. Content-based image retrieval based on convolutional neural networks
Thilagavathi et al. Evaluating the AdaBoost algorithm for biometric-based face recognition
de Souza et al. Enhancing discriminability of randomized time warping for motion recognition
Chi et al. A novel local human visual perceptual texture description with key feature selection for texture classification
Bruntha et al. A modified approach for face recognition using PSO and ABC optimization
Arsa et al. Vehicle detection using dimensionality reduction based on deep belief network for intelligent transportation system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant