CN111126485A - 一种基于李群机器学习核函数的Lie-KFDA场景分类方法和系统 - Google Patents

一种基于李群机器学习核函数的Lie-KFDA场景分类方法和系统 Download PDF

Info

Publication number
CN111126485A
CN111126485A CN201911346450.5A CN201911346450A CN111126485A CN 111126485 A CN111126485 A CN 111126485A CN 201911346450 A CN201911346450 A CN 201911346450A CN 111126485 A CN111126485 A CN 111126485A
Authority
CN
China
Prior art keywords
sample
lie
value
test
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911346450.5A
Other languages
English (en)
Inventor
徐承俊
朱国宾
舒静倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201911346450.5A priority Critical patent/CN111126485A/zh
Publication of CN111126485A publication Critical patent/CN111126485A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于李群机器学习核函数的Lie‑KFDA场景分类方法和系统,首先获取待处理的遥感数据集,并按比例划分为训练数据文件和测试数据文件;将样本投影到李群流形空间;计算上述每个类别李群样本集的内均值;选择李群机器学习核函数,计算每个类别李群样本的参数值;计算每个类别内均值到空间
Figure DDA0002333499200000011
中的向量上的投影值;对于测试样本投影到空间
Figure DDA0002333499200000012
中的向量上;根据与内均值差值的最小值进行类别判定。本发明具有如下优点:(1)本发明具有良好的空间复杂度,不需要设置和存储大量的参数。(2)本发明采用李群内均值加速对测试样本的类别判定。(3)本发明方法可根据不同的数据集分布特点选择不同的李群核函数,具有很好的鲁棒性。

Description

一种基于李群机器学习核函数的Lie-KFDA场景分类方法和 系统
技术领域
本发明涉及图像处理、场景分类领域,尤其是涉及一种基于李群机器学习核函数的Lie-KFDA场景分类方法和系统。
背景技术
场景分类是基于视觉感知原理,发掘出场景影像中某些特定的区域,其中,区域可以是整幅影像或影像中的局部范围(区域),其最终的目标是根据预先定义的一组或者是若干组语义类别对影像进行标注。场景分类在目标检测、识别、视频监测、土地利用等都具有广泛的实用意义。目前,场景分类已经取得了一定的成果,但是实现分类性能优越、鲁棒性强和计算效率高的场景分类仍然是一项重要研究的课题和挑战。
常用的方法:(1)传统的底层特征方法,提取感兴趣区域中的特征如纹理、颜色和轮廓等,将影像共有的特征直接与有监督的学习训练方法相结合,最后完成识别分类。(2)中层特征方法,主要有语义对象分割、局部和全局的语义建模。该方法将影像划分为有意义的目标区域,接着,使用该区域的语义信息及区域的空间关系进行场景分类。(3)高层特征,主要是深度学习,由学习框架如VGG16等自动完成提取特征学习,该框架主要由卷积层,池化层和全连接层(FC)构成,根据学习到的特征对测试影像进行识别分类。
上述分类方法存在以下不足:(1)底层特征方法对于简单的场景是有效的,当场景复杂时,效果不理想,主要原因是缺乏中间语义的影响描述。(2)中层特征方法存在定义影像语义属性时存在语义不清晰的缺陷,以及特征维度和计算量不适合实时应用。(3)高层特征方法,如深度学习方法则存在大量需要根据经验值进行调整或者需要设置的参数,计算复杂程度高,需要GPU辅助计算,增加硬件的成本,以及特征不具有很好的解释性。
发明内容
本发明提供了一种基于李群机器学习核函数的Lie-KFDA场景分类方法,用以解决上述背景技术中存在的语义缺失或语义不清晰、计算性能差、计算成本高等问题。
为了实现上述目标,本发明一种基于李群机器学习核函数的Lie-KFDA场景分类方法的技术方法的具体步骤如下:
Step1、获取待处理的场景数据集,将所需处理的场景数据集分为训练集和测试集;
Step2、将上述训练集和测试集分别转化为训练数据文件和测试数据文件;
Step3、将所述训练数据文件中图像集投影到李群流形空间,得到李群样本集;
Step4、计算上述每个类别李群样本集的内均值
Figure BDA0002333499180000021
Step5、选择具体的李群机器学习核函数,计算每个类别李群样本的参数Li值和L值,Li是指第i类样本选择对应核函数的均值,L是指所有类别选择对应核函数的总体均值;
Step6、根据所选定的李群机器学习核函数,计算参数值T,T表示样本选择与对应核函数乘积求和的矩阵表示;
Step7、根据Step5和Step6计算Lagrange乘子ρ的值;
Step8、计算每个类别内均值
Figure BDA0002333499180000022
到目标特征空间
Figure BDA0002333499180000023
中的投影值
Figure BDA0002333499180000024
Step9、对于测试数据文件中图像Ttest,首先将其投影到目标特征空间
Figure BDA0002333499180000025
中求测试样本的李群内均值
Figure BDA0002333499180000026
Step10、根据
Figure BDA0002333499180000027
对测试数据文件中图像集中的所有测试样本进行类别判定,c表示训练样本总的类别数,Ttest表示测试数据文件中图像,即测试样本,c*表示测试样本对应的类别,
Figure BDA0002333499180000028
表示Step8中计算得到的投影值。
进一步的,所述Step3中得到李群样本集的具体实现方式如下,
对每个训练数据文件中图像做李群映射:xij=exp(Mij),其中,Mij表示训练数据文件图像集中第i类别的第j个影像,xij表示李群训练样本集中第i个分类中第j个样本。
进一步的,所述Step4的具体实现方式如下,
计算每个类别李群样本集的内均值:
Figure BDA0002333499180000029
其中,xij表示李群训练样本集中第i个分类中第j个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
进一步的,所述Step5的具体实现方式如下,
Step51,选择李群核函数RBF:
Figure BDA0002333499180000031
其中x,y表示李群空间两个数据点,σ是带宽;
Step52、计算每个类别李群样本的参数Li值和L值:
Figure BDA0002333499180000032
并令L=(Li-Li+1)(Li-Li+1)T,i=1,2,···,c-1,其中
Figure BDA0002333499180000033
表示李群核函数RBF,xj表示第j个样本,
Figure BDA0002333499180000034
表示第i类的第k个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
进一步的,所述Step5的具体实现方式如下,
Step51,选择基于李群样本矩阵的多项式核函数:kernel-LiePolynomial(x,y)=[tr(αxTy)+c]d,其中,tr表示矩阵求迹运算,x,y表示李群空间两个数据点,α为斜率,c为常数项,d表示多项式维度,取任意正整数;
Step52、计算每个类别李群样本的参数Li值和L值:
Figure BDA0002333499180000035
并令L=(Li-Li+1)(Li-Li+1)T,i=1,2,···,c-1,其中
Figure BDA0002333499180000036
表示基于李群样本矩阵的多项式核函数,xj表示第j个样本,
Figure BDA0002333499180000037
表示第i类的第k个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
进一步的,所述Step6的具体实现方式如下,
计算参数值T:
Figure BDA0002333499180000038
其中Ki表示n×ni矩阵,且
Figure BDA0002333499180000039
xn表示第n个样本,
Figure BDA00023334991800000310
表示第i类的第m个样本,I表示n×ni单位矩阵,
Figure BDA00023334991800000311
表示第i个分类中训练样本中元素全是1的n×ni矩阵。
进一步的,Step7中计算Lagrange乘子ρ的值:ρi=T-1(Li-Li+1)。
进一步的,Step8中计算每个类别内均值
Figure BDA00023334991800000312
到目标特征空间
Figure BDA00023334991800000313
中的投影值:
Figure BDA00023334991800000314
其中,k表示核函数,
Figure BDA00023334991800000315
表示
Figure BDA00023334991800000316
的非线性映射,
Figure BDA00023334991800000317
ρi表示Lagrange乘子,φ(xi)表示训练样本xi的非线性映射,xij表示李群训练样本集中第i个分类中第j个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
进一步的,Step9中
Figure BDA0002333499180000041
的具体计算公式如下,
Figure BDA0002333499180000042
其中,k表示核函数,φ(Ttest)表示测试样本Ttest的非线性映射,
Figure BDA0002333499180000043
ρi表示Lagrange乘子,φ(xi)表示训练样本xi的非线性映射,xij表示李群训练样本集中第i个分类中第j个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
本发明还提供一种基于李群机器学习核函数的Lie-KFDA场景分类系统,包括如下模块:
场景图像数据集读取及处理模块,用于获取待处理的场景数据集,将所需处理的场景数据集分为训练集和测试集;
数据转化模块,用于将上述训练集和测试集分别转化为训练数据文件和测试数据文件;
数据集投影模块,用于将所述训练数据文件中图像集投影到李群流形空间,得到李群样本集;
内均值计算模块,用于计算上述每个类别李群样本集的内均值
Figure BDA0002333499180000044
李群核函数选择模块,用于选择具体的李群机器学习核函数,计算每个类别李群样本的参数Li值和L值,Li是指第i类样本选择对应核函数的均值,L是指所有类别选择对应核函数的总体均值;
参数计算模块,用于根据所选定的李群机器学习核函数,计算参数值T,T表示样本选择与对应核函数乘积求和的矩阵表示;
Lagrange乘子计算模块,用于根据李群核函数选择模块和参数计算模块计算Lagrange乘子ρ的值;
投影计算模块,用于计算每个类别内均值
Figure BDA0002333499180000045
到目标特征空间
Figure BDA0002333499180000046
中的投影值
Figure BDA0002333499180000047
测试样本投影模块,用于对于测试数据文件中图像Ttest,首先将其投影到目标特征空间
Figure BDA0002333499180000048
中求测试样本的李群内均值
Figure BDA0002333499180000049
判别模块,用于根据
Figure BDA0002333499180000051
对测试数据文件中图像集中的所有测试样本进行类别判定,c表示训练样本总的类别数,Ttest表示测试数据文件中图像,即测试样本,c*表示测试样本对应的类别,
Figure BDA0002333499180000052
表示投影计算模块中计算得到的投影值。
本发明与现有技术相比,具有的有益效果是:本发明方法通过将非线性可分样本投影到(映射到)高维流形空间,使得样本可分。在分类期间采用李群内均值加速完成位置样本的类别判定。该计算方法时间复杂度和空间复杂度都较传统方法小,此外,本发明方法可根据不同的样本集分布特点选择不同的李群机器学习核函数,从而使得本发明达到更好的分类结果。本发明方法克服了上述方法复杂场景的识别分类,弥补了语义不清晰的缺陷,同时也不需要深度学习的复杂计算、大量参数。可以为今后类似学习提供参考。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面结合附图和实施例对本发明进一步说明。
图1为本发明场景图像类方法流程简图;
图2为本发明在数据集上的准确率柱形图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明的实施例的详细描述并非旨在限制要求包含的本发明的范围,而是仅仅表示本发明的选定实施例。
应注意到:相似的符号在下面附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
请参照图1,图1为本发明所提供的场景图像分类方法流程简图。
Step1,2010年布朗大学的研究人员创立了SUN Database场景数据库,该数据库包含人工标注的899个场景类别和130519幅场景图像,该数据库已经证明是一个基本无遗漏的场景数据库,对于分类方法的性能验证具有普遍的意义。在本发明中,选择SUN Database中相同的Bedroom、Building、City、Forest、Highway和Mountain,共计6个类别场景作为标准实验数据及,比较本发明与其他经典方法的分类性能。此外,对上述标准数据及进行平滑和添加噪声,构造出新的带噪声的数据集,并加入到训练学习和测试中,在该类数据集上更加准确地评价本发明方法和经典方法的鲁棒性。
Step2、将上述训练集和测试集分别转化为训练数据文件和测试数据文件;
Step3、对每个训练数据文件中图像做李群映射:xij=exp(Mij),其中,Mij表示训练数据文件图像集中第i类别的第j个影像,xij表示李群训练样本集中第i个分类中第j个样本。
Step4、计算每个类别李群样本集的内均值:
Figure BDA0002333499180000061
其中,xij表示李群训练样本集中第i个分类中第j个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
Step5、计算每个类别李群样本的参数Li值和L值。
进一步的,Step51选择具体的李群机器学习核函数:
(1)李群核函数RBF,下述为该核函数推导证明:
Gauss RBF也称作径向基函数,是使用和应用最多最广泛的核函数之一。该核函数主要针对样本集的同心环分布,将样本集映射到高维空间进行分类,具体的函数表达式为:
Figure BDA0002333499180000062
其中,x,y表示两个向量,σ是带宽,控制径向作用范围,即控制高斯核函数的局部作用范围。然而,对于李群样本的矩阵不存在减法计算,但是在李群流形空间上,可以使用群运算和群元素的逆运算来解决。具体的如x-1y(x,y∈G),对于一般李群的群运算是不满足交换律的,如||x-1y||≠||y-1x||,对于矩阵李群,则有||log2(x-1y)||F=||log2(y-1x)||F。从几何的角度分析,||x-y||表示线性空间中两个数据点x和y之间的欧氏距离,而||log2(x-1y)||则表示李群流形空间中两个数据点之间的测地线距离,从而可以发现李群流形空间上数据点x到数据点y之间的测地线距离等于数据点y到数据点x之间的测地线距离,即||log2(x-1y)||=||log2(y-1x)||。此外,用该方法求出的距离为非负值,满足了核函数矩阵为对称正定矩阵的条件。
根据上述分析,推导出李群核函数RBF:
Figure BDA0002333499180000063
其中x,y表示李群空间两个数据点,其他符号与上述含义一致。
(2)李群多项式核函数,下述为该核函数推导证明:
多项式核函数基于向量空间的表达式为:kernel(x,y)=(αxTy+c)d,其中可调参数是斜率α,常数项c和多项式维度d,其他符号与上述含义一致。向量中点积运算满足交换律,矩阵的乘法不满足交换律。所以,基于向量空间表示的多项式核函数不是应用于李群样本矩阵空间表示。
根据矩阵理论知识,在n×n矩阵组成的空间上定义一个内积,即<x,y>=tr(yhx),其中tr表示矩阵的求迹计算,yh表示
Figure BDA0002333499180000071
即表示y的共轭转置矩阵:
Figure BDA0002333499180000072
根据矩阵的内积,可以推导出很多矩阵空间表示的几何量。所以,<x,y>=tr(yhx)=tr(xhy)=<y,x>,进一步推导,得到基于李群样本矩阵的多项式核函数:kernel-LiePolynomial(x,y)=[tr(αxTy)+c]d,其中,在本发明中令斜率α=1和c=1,d表示多项式维度度,取任意正整数。
进一步的,Step52计算每个类别李群样本的参数Li值和L值,Li是指第i类样本选择对应核函数的均值,L是指所有类别选择对应核函数的总体均值:
Figure BDA0002333499180000073
并令L=(Li-Li+1)(Li-Li+1)T,(i=1,2,···,c-1),其中
Figure BDA0002333499180000074
表示核函数,可选择上述李群RBF核函数或李群多项式核函数,xj表示第j个样本,
Figure BDA0002333499180000075
表示第i类的第k个样本,其他符号含义与上述一致。
Step6、根据所选定的李群机器学习核函数,计算参数值T,T表示样本选择与对应核函数乘积求和的矩阵表示:
Figure BDA0002333499180000076
其中Ki表示n×ni矩阵,且
Figure BDA0002333499180000077
I表示n×ni单位矩阵,
Figure BDA0002333499180000078
表示第i个分类中训练样本中元素全是1的n×ni矩阵。
Step7、根据Step5和Step6计算Lagrange乘子ρ的值:ρ=T-1(Li-Li+1)。
Step8、计算每个类别内均值
Figure BDA0002333499180000079
到空间
Figure BDA00023334991800000710
中的向量ν上的投影值:
Figure BDA0002333499180000081
其中,k表示核函数,
Figure BDA0002333499180000082
表示
Figure BDA0002333499180000083
的非线性映射,
Figure BDA0002333499180000084
ρi表示Lagrange乘子,φ(xi)表示训练样本xi的非线性映射,xij表示李群训练样本集中第i个分类中第j个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
Step9、对于测试数据文件中图像Ttest,首先将其投影到空间
Figure BDA0002333499180000085
中的向量ν上
Figure BDA0002333499180000086
值:
Figure BDA0002333499180000087
其中,k表示核函数,φ(Ttest)表示测试样本Ttest的非线性映射,
Figure BDA0002333499180000088
ρi表示Lagrange乘子,φ(xi)表示训练样本xi的非线性映射,xij表示李群训练样本集中第i个分类中第j个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
Step10、本发明实施例根据
Figure BDA0002333499180000089
对测试数据文件中图像集中的所有测试样本进行类别判定,c表示训练样本总的类别数,Ttest表示测试数据文件中图像(测试样本),c*表示测试样本对应的类别,
Figure BDA00023334991800000810
表示Step8中计算得到的投影值。
表1本发明方法与其他方法进行性能对比
Figure BDA00023334991800000811
结合表1和图2,图2为在数据集上的准确率柱形图,从表1和图2中我们可以很容易发现本发明方法具有明显的优势,注:表1和图2的测试结果是选择李群多项式核函数得到的,对于不同的数据集可以通过不同的李群核函数进行对比测试。
本发明实施例还提供一种基于Lie-Fisher场景图像的场景分类系统,包括如下模块:
场景图像数据集读取及处理模块,用于获取待处理的场景数据集,将所需处理的场景数据集分为训练集和测试集;
数据转化模块,用于将上述训练集和测试集分别转化为训练数据文件和测试数据文件;
数据集投影模块,用于将所述训练数据文件中图像集投影到李群流形空间,得到李群样本集;
内均值计算模块,用于计算上述每个类别李群样本集的内均值
Figure BDA0002333499180000091
李群核函数选择模块,用于选择具体的李群机器学习核函数,计算每个类别李群样本的参数Li值和L值,Li是指第i类样本选择对应核函数的均值,L是指所有类别选择对应核函数的总体均值;
参数计算模块,用于根据所选定的李群机器学习核函数,计算参数值T,T表示样本选择与对应核函数乘积求和的矩阵表示;
Lagrange乘子计算模块,用于根据李群核函数选择模块和参数计算模块计算Lagrange乘子ρ的值;
投影计算模块,用于计算每个类别内均值
Figure BDA0002333499180000092
到目标特征空间
Figure BDA0002333499180000093
中的投影值
Figure BDA0002333499180000094
测试样本投影模块,用于对于测试数据文件中图像Ttest,首先将其投影到目标特征空间
Figure BDA0002333499180000095
中求测试样本的李群内均值
Figure BDA0002333499180000096
判别模块,用于根据
Figure BDA0002333499180000097
对测试数据文件中图像集中的所有测试样本进行类别判定,c表示训练样本总的类别数,Ttest表示测试数据文件中图像,即测试样本,c*表示测试样本对应的类别,
Figure BDA0002333499180000098
表示投影计算模块中计算得到的投影值。
各模块的具体实现和各步骤相应,本发明不予撰述。
以上所述仅为本发明的部分实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种改变。凡在本发明的精神和原则之内,所做的任何改变、等价替换或改进等,均应包含在本发明的包含范围之内。注意,相似的标号和字母在下面的附图中表示类似项。因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进一步定义和解释。

Claims (10)

1.一种基于李群机器学习核函数的Lie-KFDA场景分类方法,其特征在于,包括如下步骤:
Step1、获取待处理的场景数据集,将所需处理的场景数据集分为训练集和测试集;
Step2、将上述训练集和测试集分别转化为训练数据文件和测试数据文件;
Step3、将所述训练数据文件中图像集投影到李群流形空间,得到李群样本集;
Step4、计算上述每个类别李群样本集的内均值
Figure FDA0002333499170000011
Step5、选择具体的李群机器学习核函数,计算每个类别李群样本的参数Li值和L值,Li是指第i类样本选择对应核函数的均值,L是指所有类别选择对应核函数的总体均值;
Step6、根据所选定的李群机器学习核函数,计算参数值T,T表示样本选择与对应核函数乘积求和的矩阵表示;
Step7、根据Step5和Step6计算Lagrange乘子ρ的值;
Step8、计算每个类别内均值
Figure FDA0002333499170000012
到目标特征空间
Figure FDA0002333499170000018
中的投影值
Figure FDA0002333499170000013
Step9、对于测试数据文件中图像Ttest,首先将其投影到目标特征空间
Figure FDA0002333499170000019
中求测试样本的李群内均值
Figure FDA0002333499170000014
Step10、根据
Figure FDA0002333499170000015
对测试数据文件中图像集中的所有测试样本进行类别判定,c表示训练样本总的类别数,Ttest表示测试数据文件中图像,即测试样本,c*表示测试样本对应的类别,
Figure FDA0002333499170000016
表示Step8中计算得到的投影值。
2.如权利要求1所述的一种基于李群机器学习核函数的Lie-KFDA场景分类方法,其特征在于:所述Step3中得到李群样本集的具体实现方式如下,
对每个训练数据文件中图像做李群映射:xij=exp(Mij),其中,Mij表示训练数据文件图像集中第i类别的第j个影像,xij表示李群训练样本集中第i个分类中第j个样本。
3.如权利要求2所述的一种基于李群机器学习核函数的Lie-KFDA场景分类方法,其特征在于:所述Step4的具体实现方式如下,
计算每个类别李群样本集的内均值:
Figure FDA0002333499170000017
其中,xij表示李群训练样本集中第i个分类中第j个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
4.如权利要求3所述的一种基于李群机器学习核函数的Lie-KFDA场景分类方法,其特征在于:所述Step5的具体实现方式如下,
Step51,选择李群核函数RBF:
Figure FDA0002333499170000021
其中x,y表示李群空间两个数据点,σ是带宽;
Step52、计算每个类别李群样本的参数Li值和L值:
Figure FDA0002333499170000022
并令L=(Li-Li+1)(Li-Li+1)T,i=1,2,···,c-1,其中
Figure FDA0002333499170000023
表示李群核函数RBF,xj表示第j个样本,
Figure FDA0002333499170000024
表示第i类的第k个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
5.如权利要求3所述的一种基于李群机器学习核函数的Lie-KFDA场景分类方法,其特征在于:所述Step5的具体实现方式如下,
Step51,选择基于李群样本矩阵的多项式核函数:kernel-LiePolynomial(x,y)=[tr(αxTy)+c]d,其中,tr表示矩阵求迹运算,x,y表示李群空间两个数据点,α为斜率,c为常数项,d表示多项式维度,取任意正整数;
Step52、计算每个类别李群样本的参数Li值和L值:
Figure FDA0002333499170000025
并令L=(Li-Li+1)(Li-Li+1)T,i=1,2,···,c-1,其中
Figure FDA0002333499170000026
表示基于李群样本矩阵的多项式核函数,xj表示第j个样本,
Figure FDA0002333499170000027
表示第i类的第k个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
6.如权利要求1所述的一种基于李群机器学习核函数的Lie-KFDA场景分类方法,其特征在于:所述Step6的具体实现方式如下,
计算参数值T:
Figure FDA0002333499170000028
其中Ki表示n×ni矩阵,且
Figure FDA0002333499170000029
xxn表示第n个样本,
Figure FDA00023334991700000210
表示第i类的第m个样本,I表示n×ni单位矩阵,
Figure FDA00023334991700000211
表示第i个分类中训练样本中元素全是1的n×ni矩阵。
7.如权利要求1所述的一种基于李群机器学习核函数的Lie-KFDA场景分类方法,其特征在于:Step7中计算Lagrange乘子ρ的值:ρi=T-1(Li-Li+1)。
8.如权利要求3所述的一种基于李群机器学习核函数的Lie-KFDA场景分类方法,其特征在于:Step8中计算每个类别内均值
Figure FDA0002333499170000031
到目标特征空间
Figure FDA00023334991700000310
中的投影值:
Figure FDA0002333499170000032
其中,k表示核函数,
Figure FDA0002333499170000033
表示
Figure FDA0002333499170000034
的非线性映射,
Figure FDA0002333499170000035
ρi表示Lagrange乘子,φ(xi)表示训练样本xi的非线性映射,xij表示李群训练样本集中第i个分类中第j个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
9.如权利要求1所述的一种基于李群机器学习核函数的Lie-KFDA场景分类方法,其特征在于:Step9中
Figure FDA0002333499170000036
的具体计算公式如下,
Figure FDA0002333499170000037
其中,k表示核函数,φ(Ttest)表示测试样本Ttest的非线性映射,
Figure FDA0002333499170000038
ρi表示Lagrange乘子,φ(xi)表示训练样本xi的非线性映射,xij表示李群训练样本集中第i个分类中第j个样本,ni表示第i个分类中训练样本的个数,一共有c个类别。
10.一种基于李群机器学习核函数的Lie-KFDA场景分类系统,其特征在于,包括如下模块:
场景图像数据集读取及处理模块,用于获取待处理的场景数据集,将所需处理的场景数据集分为训练集和测试集;
数据转化模块,用于将上述训练集和测试集分别转化为训练数据文件和测试数据文件;
数据集投影模块,用于将所述训练数据文件中图像集投影到李群流形空间,得到李群样本集;
内均值计算模块,用于计算上述每个类别李群样本集的内均值
Figure FDA0002333499170000039
李群核函数选择模块,用于选择具体的李群机器学习核函数,计算每个类别李群样本的参数Li值和L值,Li是指第i类样本选择对应核函数的均值,L是指所有类别选择对应核函数的总体均值;
参数计算模块,用于根据所选定的李群机器学习核函数,计算参数值T,T表示样本选择与对应核函数乘积求和的矩阵表示;
Lagrange乘子计算模块,用于根据李群核函数选择模块和参数计算模块计算Lagrange乘子ρ的值;
投影计算模块,用于计算每个类别内均值
Figure FDA0002333499170000041
到目标特征空间
Figure FDA0002333499170000046
中的投影值
Figure FDA0002333499170000042
测试样本投影模块,用于对于测试数据文件中图像Ttest,首先将其投影到目标特征空间
Figure FDA0002333499170000047
中求测试样本的李群内均值
Figure FDA0002333499170000043
判别模块,用于根据
Figure FDA0002333499170000044
对测试数据文件中图像集中的所有测试样本进行类别判定,c表示训练样本总的类别数,Ttest表示测试数据文件中图像,即测试样本,c*表示测试样本对应的类别,
Figure FDA0002333499170000045
表示投影计算模块中计算得到的投影值。
CN201911346450.5A 2019-12-24 2019-12-24 一种基于李群机器学习核函数的Lie-KFDA场景分类方法和系统 Pending CN111126485A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911346450.5A CN111126485A (zh) 2019-12-24 2019-12-24 一种基于李群机器学习核函数的Lie-KFDA场景分类方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911346450.5A CN111126485A (zh) 2019-12-24 2019-12-24 一种基于李群机器学习核函数的Lie-KFDA场景分类方法和系统

Publications (1)

Publication Number Publication Date
CN111126485A true CN111126485A (zh) 2020-05-08

Family

ID=70501864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911346450.5A Pending CN111126485A (zh) 2019-12-24 2019-12-24 一种基于李群机器学习核函数的Lie-KFDA场景分类方法和系统

Country Status (1)

Country Link
CN (1) CN111126485A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113205280A (zh) * 2021-05-28 2021-08-03 广西大学 一种李群引导注意推理网络的电动汽车充电站选址方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003228535A (ja) * 2002-02-05 2003-08-15 Osaka Gas Co Ltd ファイル転送方法、ファイル転送装置及びコンピュータプログラム
CN102968643A (zh) * 2012-11-16 2013-03-13 华中科技大学 一种基于李群论的多模态情感识别方法
CN103310217A (zh) * 2013-06-20 2013-09-18 苏州大学 基于图像协方差特征的手写体数字识别方法及装置
US20170243336A1 (en) * 2014-09-17 2017-08-24 Biomediq A/S Bias Correction in Images
CN109614899A (zh) * 2018-11-29 2019-04-12 重庆邮电大学 一种基于李群特征和卷积神经网络的人体动作识别方法
CN109978064A (zh) * 2019-03-29 2019-07-05 苏州大学 基于图像集的李群字典学习分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003228535A (ja) * 2002-02-05 2003-08-15 Osaka Gas Co Ltd ファイル転送方法、ファイル転送装置及びコンピュータプログラム
CN102968643A (zh) * 2012-11-16 2013-03-13 华中科技大学 一种基于李群论的多模态情感识别方法
CN103310217A (zh) * 2013-06-20 2013-09-18 苏州大学 基于图像协方差特征的手写体数字识别方法及装置
US20170243336A1 (en) * 2014-09-17 2017-08-24 Biomediq A/S Bias Correction in Images
CN109614899A (zh) * 2018-11-29 2019-04-12 重庆邮电大学 一种基于李群特征和卷积神经网络的人体动作识别方法
CN109978064A (zh) * 2019-03-29 2019-07-05 苏州大学 基于图像集的李群字典学习分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
许春燕: "基于黎曼流形的图像分类算法研究", 《中国博士学位论文全文数据库 信息科技辑》 *
高聪: "李群均值学习算法及应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113205280A (zh) * 2021-05-28 2021-08-03 广西大学 一种李群引导注意推理网络的电动汽车充电站选址方法
CN113205280B (zh) * 2021-05-28 2023-06-23 广西大学 一种李群引导注意推理网络的电动汽车充电站选址方法

Similar Documents

Publication Publication Date Title
CN109584248B (zh) 基于特征融合和稠密连接网络的红外面目标实例分割方法
CN105608471B (zh) 一种鲁棒直推式标签估计及数据分类方法和系统
CN110770752A (zh) 多尺度特征融合网络结合定位模型的害虫自动计数方法
Kim et al. Color–texture segmentation using unsupervised graph cuts
CN113128558B (zh) 基于浅层空间特征融合与自适应通道筛选的目标检测方法
CN112750148B (zh) 一种基于孪生网络的多尺度目标感知跟踪方法
CN114332621B (zh) 一种基于多模型特征融合的病虫害识别方法及系统
CN110781766B (zh) 基于特征谱正则化的格拉斯曼流形判别分析图像识别方法
CN112651381A (zh) 基于卷积神经网络的视频图像中家畜识别方法及装置
Nie et al. Adap-EMD: Adaptive EMD for aircraft fine-grained classification in remote sensing
CN109241932B (zh) 一种基于运动方差图相位特征的热红外人体动作识别方法
Fu et al. A case study of utilizing YOLOT based quantitative detection algorithm for marine benthos
CN111008630A (zh) 一种基于弱监督学习的目标定位方法
CN111126485A (zh) 一种基于李群机器学习核函数的Lie-KFDA场景分类方法和系统
CN111274986B (zh) 一种基于图像分析的菜品识别分类方法
Singh et al. Wavelet based histogram of oriented gradients feature descriptors for classification of partially occluded objects
CN110287970B (zh) 一种基于cam与掩盖的弱监督物体定位方法
CN116758419A (zh) 针对遥感图像的多尺度目标检测方法、装置和设备
CN116597275A (zh) 一种基于数据增强的高速移动目标识别方法
CN110728316A (zh) 一种课堂行为检测方法、系统、装置和存储介质
Zhang et al. Digital instruments recognition based on PCA-BP neural network
Han et al. Robust and efficient vanishing point detection in unstructured road scenes for assistive navigation
Li et al. Research on YOLOv3 pedestrian detection algorithm based on channel attention mechanism
WO2023273337A1 (zh) 一种基于代表特征的遥感图像中的密集目标检测方法
Chen et al. Low-rank representation with contextual regularization for moving object detection in big surveillance video data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200508

RJ01 Rejection of invention patent application after publication