CN108629373B - 一种图像分类方法、系统、设备及计算机可读存储介质 - Google Patents

一种图像分类方法、系统、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN108629373B
CN108629373B CN201810426685.4A CN201810426685A CN108629373B CN 108629373 B CN108629373 B CN 108629373B CN 201810426685 A CN201810426685 A CN 201810426685A CN 108629373 B CN108629373 B CN 108629373B
Authority
CN
China
Prior art keywords
image
sample
characteristic
feature
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810426685.4A
Other languages
English (en)
Other versions
CN108629373A (zh
Inventor
张莉
唐白鸽
王邦军
张召
李凡长
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201810426685.4A priority Critical patent/CN108629373B/zh
Publication of CN108629373A publication Critical patent/CN108629373A/zh
Application granted granted Critical
Publication of CN108629373B publication Critical patent/CN108629373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图像分类方法、系统、设备及计算机可读存储介质。方法包括提取待分类图像的目标特征集,目标特征集包含的特征由与待分类图像的特征维数相同且各特征代表的意义相同的样本图像的最优特征子集确定;将待分类图像的目标特征集输入支持向量机分类器,获取待分类图像所属的标签类型;最优特征子集确定过程为:计算各样本图像在权重空间的间隔,并根据各间隔迭代计算特征权重向量直至满足迭代结束条件,得到各样本图像每个特征的权重值,根据各权重值对各特征进行组合生成多个特征子集;利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集为最优特征子集。本申请提高了图像分类的准确度和精度。

Description

一种图像分类方法、系统、设备及计算机可读存储介质
技术领域
本发明实施例涉及图像处理技术领域,特别是涉及一种图像分类方法、系统、设备及计算机可读存储介质。
背景技术
随着计算机技术的快速发展,图像处理技术也得到了快速的发展,将图像处理技术应用到各行各业便水到渠成。自美国在1972年发射第一颗ERTS-1后,卫星遥感技术便在全世界范围内得到了广泛应用,例如气象观测、土地资源勘探、环境评估与城市规划等领域。利用计算机技术对卫星传回的图像实施图像预处理,图像分类等步骤,不仅能够对卫星遥感研究给予快速反馈,而且能够极大地减少研究人员的工作量。
由于卫星图像识别系统吸收并综合了众多计算机领域专家的权威知识和经验,因此其对图像的分类水平远远超过了人类专家,并且变得越来越智能。快速且高精度的遥感图像分类是实现各种应用的前提。
早期的图像分类主要依靠人工为图像贴上标签,但随着收集到图像数量的急剧增长,人工标记变得不可行。如何从少量的标记图像和大量的未标记图像中学习到相关信息,并给图像进行正确标记,是卫星图像识别系统面临的重要难题。
对卫星图像处理的第一步,就是将高维数据转换为便于研究的低维数据。数据降维除了能够消除高维数据不利于图像分类的风险,还可以提取和综合更有效的信息,摒弃无用信息。降维方法可以分为监督方法和无监督方法。在监督方法中,进行特征选择的图像全部是有标签图像,如果有标签图像数量过少,那么特征选择方法一般无法识别具有类区分性的相关特征;在无监督方法中,进行特征选择的图像全部是无标签图像,虽然能够很好地利用无标签信息,但却忽略了标签中含有的信息。
现有的RELIEF-F算法,尽管可以对多分类数据进行正确分类,但无法使用无标签的训练样本;Sun等人在文章“Semi-supervised Feature Selection Under Logistic I-RELIEF Framework”中提出了一种有效的特征选择方法,能够使用少量的有标签训练图像和大量的无标签训练图像自动选择相关特征,移除不相关特征对分类的影响,并能够处理异常数据,但此算法只适用于二分类问题,不能用来处理多分类问题。
发明内容
本发明实施例的目的是提供一种图像分类方法、系统、设备及计算机可读存储介质,实现了图像半监督多分类特征选择,有利于提高图像的分类精确度。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种图像分类方法,包括:
提取经过图像预处理的待分类图像的目标特征集,所述目标特征集包含的特征由训练样本集中各样本图像的最优特征子集确定;所述训练样本集包括第一个数的有标签样本图像和第二个数的无标签样本图像,各样本图像和所述待分类图像的特征维数相同且各特征代表的意义相同;
将所述待分类图像的目标特征集输入支持向量机分类器,获取所述待分类图像所属的标签类型;
其中,所述最优特征子集确定过程为:
初始化特征权重向量、学习参数、正则化参数、停止准则,并设置最大迭代次数和初始迭代次数;
计算经过图像预处理的各样本图像在权重空间的间隔,根据各样本图像在权重空间的间隔迭代计算特征权重向量,直至满足迭代结束条件,得到各样本图像的每个特征的权重值,并根据各权重值对各特征进行组合生成多个特征子集;
分别利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集,以作为最优特征子集。
可选的,所述计算各样本图像在权重空间的间隔:
根据公式(1)计算所述训练样本集中每个有标签样本图像在权重空间的间隔:
Figure BDA0001652301930000031
式中,
Figure BDA0001652301930000032
xl为当前有标签样本图像,xi为所述训练样本集中有标签样本图像;NM(xl)为xl的异类近邻,NH(xl)为xl的同类近邻;
根据公式(2)计算所述训练样本集中每个无标签样本图像在权重空间的间隔:
Figure BDA0001652301930000033
式中,
Figure BDA0001652301930000034
Figure BDA0001652301930000035
Figure BDA0001652301930000036
为无标签样本图像当前的标签类别为j;xi为所述训练样本集中有标签样本图像;c为标签类别总数;
Figure BDA0001652301930000037
Figure BDA0001652301930000038
的异类近邻,
Figure BDA0001652301930000039
Figure BDA00016523019300000310
的同类近邻。
可选的,所述经过图像预处理的待分类图像包括:
对所述待分类图像进行降维处理;
对降维处理的待分类图像的特征进行归一化处理,使得每个特征值处于[0,1]区间。
可选的,所述根据各样本图像在权重空间的间隔迭代计算特征权重向量,直至满足迭代结束条件,得到各样本图像的每个特征的权重值包括:
根据下述公式计算特征权重向量:
Figure BDA0001652301930000041
式中,w(t)为特征权重向量;T为最大迭代次数;t为初始迭代次数;θ为停止准则;α和β为正则化参数;U为无标签样本图像的总数;L为有标签样本图像的总数;ρl为有标签样本图像在权重空间的间隔;ρu为无标签样本图像在权重空间的间隔;
判断||w(t)-w(t-1)||>θ,且t≤T;
若是,则t=t+1,根据公式(3)迭代计算特征权重向量;
若否,则令w*=w(t),得到各样本图像的每个特征的权重值。
可选的,所述分别利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集包括:
将所述训练样本集中的样本图像分为训练集和验证集;
分别利用所述训练集中的样本图像对应的各特征子集训练向量分类器,将所述验证集中各样本图像相对应的特征子集输入在训练好的向量分类器中,以对所述验证集中各样本图像进行分类;
选取对所述验证集中的样本图像分类准确度最高的向量分类器对应的特征子集,以作为满足最佳分类效果条件的特征子集。
可选的,所述待分类图像为待分类卫星图像;所述训练样本集中的各样本图像均为卫星图像。
可选的,所述经过图像预处理的各样本图像包括:
对各样本图像的特征进行归一化处理,使得每个特征值处于[0,1]区间。
本发明实施例另一方面提供了一种图像分类系统,包括:
特征确定模块,用于初始化特征权重向量、学习参数、正则化参数、停止准则,并设置最大迭代次数和初始迭代次数;计算经过图像预处理的各样本图像在权重空间的间隔,根据各样本图像在权重空间的间隔迭代计算特征权重向量,直至满足迭代结束条件,得到各样本图像的每个特征的权重值,并根据各权重值对各特征进行组合生成多个特征子集;分别利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集,以作为最优特征子集;
特征提取模块,用于提取经过图像预处理的待分类图像的目标特征集,所述目标特征集包含的特征由训练样本集中各样本图像的最优特征子集确定;所述训练样本集包括第一个数的有标签样本图像和第二个数的无标签样本图像,各样本图像和所述待分类图像的特征维数相同且各特征代表的意义相同;
分类模块,用于将所述待分类图像的目标特征集输入支持向量机分类器,获取所述待分类图像所属的标签类型。
本发明实施例还提供了一种图像分类设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述图像分类方法的步骤。
本发明实施例最后还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有图像分类程序,所述图像分类程序被处理器执行时实现如前任一项所述图像分类方法的步骤。
本发明实施例提供了一种图像分类方法,提取待分类图像的目标特征集,目标特征集包含的特征由样本图像的最优特征子集确定;各样本图像和待分类图像的特征维数相同且各特征代表的意义相同;将待分类图像的目标特征集输入支持向量机分类器,获取待分类图像所属的标签类型;最优特征子集确定过程为:计算各样本图像在权重空间的间隔,并根据各间隔迭代计算特征权重向量直至满足迭代结束条件,得到各样本图像每个特征的权重值,根据各权重值对各特征进行组合生成多个特征子集;分别利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集为最优特征子集。
本申请提供的技术方案的优点在于,通过计算样本图像在权重空间的间隔,求解特征权重向量的优化值,从而得到各特征的权重值,根据各权重值对各特征进行组合生成多个特征子集,然后利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集,也即确定从待分类图像中提取的目标特征,然后利用向量机分类器根据目标特征对待分类图像进行分类,从而实现了半监督多分类的图像预测,提高了图像分类的准确度和精度。
此外,本发明实施例还针对图像分类方法提供了相应的实现系统、设备及计算机可读存储介质,进一步使得所述方法更具有实用性,所述系统、设备及计算机可读存储介质具有相应的优点。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种图像分类方法的流程示意图;
图2为本发明实施例提供的本申请的图像分类方法和现有图像分类方法的分类精度对比示意图;
图3为本发明实施例提供的本申请的图像分类方法和现有图像分类方法的分类精度对比示意图;
图4为本发明实施例提供的图像分类系统的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种图像分类方法的流程示意图,本发明实施例可包括以下内容:
S101:提取经过图像预处理的待分类图像的目标特征集。
S102:将待分类图像的目标特征集输入支持向量机分类器,获取待分类图像所属的标签类型。
训练样本集包含多张样本图像,其中各样本图像中有多张有标签样本图像,还有多张无标签样本图像,有标签样本图像和无标签样本图像的总数之和为训练样本集中包含的样本图像的总数,也即训练样本集包括第一个数的有标签样本图像和第二个数的无标签样本图像,其中,第一个数和第二个数可根据具体实际情况进行选取,本申请对此不做任何限定。
待分类图像和训练样本集中的各样本图像的特征维数相同且各特征代表的意义相同,例如若训练样本集中的样本图像的特征维数为4维,各维特征代表的意义为颜色、形状、纹理、空间关系,那么待分类图像的特征维数也为4维,各维特征代表的意义为颜色、形状、纹理、空间关系。
在一种具体的实施方式中,待分类图像可为待分类卫星图像,训练样本集中的各样本图像均可为卫星图像。例如,卫星图像训练样本集为D=D1∪D2,其中,
Figure BDA0001652301930000071
为有标签样本集,xl∈RI,I是样本图像的维数,L为有标签样本数量,yl为样本图像xl对应的标签,且yl∈{1,2,3,...,c},c代表标签类别总数;
Figure BDA0001652301930000072
为无标签样本集,xu为无标签样本图像数据,样本数量为U。例如,L=60,U=840。
在获取待分类图像和训练样本集中各样本图像之后,可进行图像预处理,具体可为:
对待分类图像进行降维处理;
对降维处理的待分类图像和各样本图像的特征进行归一化处理,使得每个特征值处于[0,1]区间。
训练样本集中的图像不进行降维处理,例如训练样本集中特征维数是10维,利用训练样本集,计算间隔,选择最优特征子集,设最优特征子集包含5个特征;对待分类图像,根据最优特征子集,降维处理,从10个特征降到5个特征。所以图像预处理时,训练样本不进行降维,训练样本是用来确定最优特征子集的,待分类图像先降维,然后输入支持向量机分类。
目标特征集包含的特征由训练样本集中各样本图像的最优特征子集确定。即,提取待分类图像的哪些特征,可由训练样本集的最优特征子集决定,也就是说,待分类图像的目标特征集包含的特征类型与各样本图像的最优特征子集中的特征类型相同,举例来说,最优特征子集中的特征为颜色特征和形状特征,那么目标特征集包含的即为待分类图像的颜色特征和形状特征。
最优特征子集确定过程具体可为:
初始化特征权重向量、学习参数、正则化参数、停止准则,并设置最大迭代次数和初始迭代次数;
例如,初始化特征权重向量w(0)=[1,1,...,1]T∈RI,学习参数λ=0.03,正则化参数α=3和β=2,停止准则θ=0.01,设置最大迭代次数T=30,初始迭代次数t=1。
计算经过图像预处理的各样本图像在权重空间的间隔,根据各样本图像在权重空间的间隔迭代计算特征权重向量,直至满足迭代结束条件,得到各样本图像的每个特征的权重值,并根据各权重值对各特征进行组合生成多个特征子集;
分别利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集,以作为最优特征子集。
其中,可根据公式(1)计算训练样本集中每个有标签样本图像在权重空间的间隔:
Figure BDA0001652301930000081
式中,
Figure BDA0001652301930000091
xl为当前有标签样本图像,xi为训练样本集中有标签样本图像;NM(xl)为xl的异类近邻,NH(xl)为xl的同类近邻;P(xi=NM(xl)|w(t-1))为训练样本集中各有标签样本图像为当前有标签样本图像的异类近邻的概率;P(xi=NH(xl)|w(t-1))为训练样本集中各有标签样本图像为当前有标签样本图像的同类近邻的概率。
可根据公式(2)计算训练样本集中每个无标签样本图像在权重空间的间隔:
Figure BDA0001652301930000092
式中,
Figure BDA0001652301930000093
Figure BDA0001652301930000094
Figure BDA0001652301930000095
为无标签样本图像当前的标签类别为j;xi为训练样本集中有标签样本图像;c为标签类别总数;
Figure BDA0001652301930000096
Figure BDA0001652301930000097
的异类近邻,
Figure BDA0001652301930000098
Figure BDA0001652301930000099
的同类近邻。
根据下述公式计算特征权重向量:
Figure BDA00016523019300000910
式中,w(t)为特征权重向量;T为最大迭代次数;t为初始迭代次数;θ为停止准则;α和β为正则化参数;U为无标签样本图像的总数;L为有标签样本图像的总数;ρl为有标签样本图像在权重空间的间隔;ρu为无标签样本图像在权重空间的间隔;
判断||w(t)-w(t-1)||>θ,且t≤T;
若是,则t=t+1,根据公式(3)迭代计算特征权重向量;
若否,则令w*=w(t),得到各样本图像的每个特征的权重值。
由于各样本图像的特征维数相同且各特征代表意义相同,所以训练样板集中所有样本图像的相同类型的特征的权重值相同。
在得到每个特征的权重值之后,为了从各特征中选取可获得分类效果最佳的特征子集,可以按照下述方法选取:
将训练样本集中的样本图像分为训练集和验证集;
分别利用训练集中的样本图像对应的各特征子集训练向量分类器,将验证集中各样本图像相对应的特征子集输入在训练好的向量分类器中,以对验证集中各样本图像进行分类;
选取对验证集中的样本图像分类准确度最高的向量分类器对应的特征子集,以作为满足最佳分类效果条件的特征子集。
此外,在一种具体的实施方式,还可按照权重值大小递减排序各特征,然后再把特征集合按照排序来划分子集比,F1,F2……,在F1中含有1个最大权重的特征,F2中含有前两个权重最大的特征,以此类推。例如有8个特征Fi(i=1,2,…,8)每个特征的权重依次为0.1、0.8、0.5、0.45、0.7、0.2、0.66及0.98,那么排序之后为0.98、0.8、0.7、0.66、0.5、0.45、0.2、0.1,对应的特征排序为F8、F2、F5、F7、F3、F4、F6、F1,生成的特征子集可为{F8}、{F8、F2}、{F8、F2、F5}、{F8、F2、F5、F7}、{F8、F2、F5、F7、F3}、{F8、F2、F5、F7、F3、F4}、{F8、F2、F5、F7、F3、F4、F6}、{F8、F2、F5、F7、F3、F4、F6、F1}。
在得到待分类图像的目标特征集之后,将目标特征集输入支持向量机分类器,支持向量机分类器可根据输入的目标特征集和各样本图像的最优特征子集,,输出待分类图像所属的标签类型,从而实现对待分类图像的分类。
具体的,支持向量机分类器的分类原理可根据现有技术来实现,具体如何进行分类,此处不再赘述,本领域技术人员可根据具体的实际情况进行选取现有的算法,本申请对此不做任何限定。
在本发明实施例提供的技术方案中,通过计算样本图像在权重空间的间隔,求解特征权重向量的优化值,从而得到各特征的权重值,根据各权重值对各特征进行组合生成多个特征子集,然后利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集,也即确定从待分类图像中提取的目标特征,然后利用向量机分类器根据目标特征对待分类图像进行分类,从而实现了半监督多分类的图像预测,提高了图像分类的准确度和精度。
为了验证本申请提供的技术方案具有好的图像分类效果,在卫星图像数据集上进行了测试,该数据集包含6435个数据样本,共有6个类别。每个样本有9个像素点,每个像素点是一个8位二进制字,一个像素点包含四个光谱带,这9个像素点用3×3方阵表示。样本的类别与中心像素点相关联。在一个具体的样例中,36个属性按照3×3方阵从左至右,从上至下的顺序排列,因此可以计算,中间像素的四个光谱值标号为17,18,19和20。
通过本申请提供的技术方案,提取900个36维的训练样本中的特征的组合,对多个数量不同的测试样本进行分类测试。本申请的图像分类方法(Semi-Supervised FeatureSelection Based Logistic I-RELIEF for Multi-classification)与Logistic I-RELIEF算法和RELIEF-F算法在相同的数据集上做分类精度比较,请参阅图2和图3。
表1给出了5个特征时两种算法的分类精度以及5个权重最大的特征,其中分类精度取10次预测结果的均值:
表1各图像分类方法的分类精度的对比表
Figure BDA0001652301930000111
从图2和图3可以发现,在特征数量减少至5时,分类精度趋于平稳,且在5个特征时,本申请方法的分类精度远大于Logistic I-RELIEF算法和RELIEF-E算法。
本发明实施例还针对图像分类方法提供了相应的实现系统,进一步使得所述方法更具有实用性。下面对本发明实施例提供的图像分类系统进行介绍,下文描述的图像分类系统与上文描述的图像分类方法可相互对应参照。
参见图4,图4为本发明实施例提供的图像分类系统在一种具体实施方式下的结构图,该系统可包括:
特征确定模块401,用于初始化特征权重向量、学习参数、正则化参数、停止准则,并设置最大迭代次数和初始迭代次数;计算经过图像预处理的各样本图像在权重空间的间隔,根据各样本图像在权重空间的间隔迭代计算特征权重向量,直至满足迭代结束条件,得到各样本图像的每个特征的权重值,并根据各权重值对各特征进行组合生成多个特征子集;分别利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集,以作为最优特征子集。
特征提取模块402,用于提取经过图像预处理的待分类图像的目标特征集,目标特征集包含的特征由训练样本集中各样本图像的最优特征子集确定;训练样本集包括第一个数的有标签样本图像和第二个数的无标签样本图像,各样本图像和待分类图像的特征维数相同且各特征代表的意义相同。
分类模块403,用于将待分类图像的目标特征集输入支持向量机分类器,获取待分类图像所属的标签类型。
可选的,在本实施例的一些实施方式中,所述特征提取模块402可以包括:
对待分类图像进行降维处理;
对降维处理的待分类图像的特征进行归一化处理,使得每个特征值处于[0,1]区间。
此外,所述特征确定模块401可以包括:
归一化单元,用于对各样本图像的特征进行归一化处理,使得每个特征值处于[0,1]区间。
可选的,在本实施例的另一些实施方式中,所述特征确定模块401可以包括:
第一计算单元,用于根据公式(1)计算训练样本集中每个有标签样本图像在权重空间的间隔:
Figure BDA0001652301930000131
式中,
Figure BDA0001652301930000132
xl为当前有标签样本图像,xi为训练样本集中有标签样本图像;NM(xl)为xl的异类近邻,NH(xl)为xl的同类近邻;
第二计算单元,用于根据公式(2)计算训练样本集中每个无标签样本图像在权重空间的间隔:
Figure BDA0001652301930000133
式中,
Figure BDA0001652301930000134
Figure BDA0001652301930000135
Figure BDA0001652301930000136
为无标签样本图像当前的标签类别为j;xi为训练样本集中有标签样本图像;c为标签类别总数;
Figure BDA0001652301930000137
Figure BDA0001652301930000138
的异类近邻,
Figure BDA0001652301930000139
Figure BDA00016523019300001310
的同类近邻。
具体的,在一种具体的实施方式中,所述特征确定模块401还可以包括:
第三计算单元,用于根据下述公式计算特征权重向量:
Figure BDA00016523019300001311
式中,w(t)为特征权重向量;T为最大迭代次数;t为初始迭代次数;θ为停止准则;α和β为正则化参数;U为无标签样本图像的总数;L为有标签样本图像的总数;ρl为有标签样本图像在权重空间的间隔;ρu为无标签样本图像在权重空间的间隔;
判断单元,用于判断||w(t)-w(t-1)||>θ,且t≤T;
若是,则t=t+1,根据公式(3)迭代计算特征权重向量;
若否,则令w*=w(t),得到各样本图像的每个特征的权重值。
可选的,在一种具体的实施方式中,所述特征确定模块401例如还可以包括:
拆分单元,用于将训练样本集中的样本图像分为训练集和验证集;
训练单元,用于分别利用训练集中的样本图像对应的各特征子集训练向量分类器;
分类单元,用于将验证集中各样本图像相对应的特征子集输入在训练好的向量分类器中,以对验证集中各样本图像进行分类;
选取单元,用于选取对验证集中的样本图像分类准确度最高的向量分类器对应的特征子集,以作为满足最佳分类效果条件的特征子集。
本发明实施例所述图像分类系统的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例通过计算样本图像在权重空间的间隔,求解特征权重向量的优化值,从而得到各特征的权重值,根据各权重值对各特征进行组合生成多个特征子集,然后利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集,也即确定从待分类图像中提取的目标特征,然后利用向量机分类器根据目标特征对待分类图像进行分类,从而实现了半监督多分类的图像预测,提高了图像分类的准确度。
本发明实施例还提供了一种图像分类设备,具体可包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序以实现如上任意一实施例所述图像分类方法的步骤。
本发明实施例所述图像分类设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例实现了半监督多分类的图像预测,提高了图像分类的准确度。
本发明实施例还提供了一种计算机可读存储介质,存储有图像分类程序,所述图像分类程序被处理器执行时如上任意一实施例所述图像分类方法的步骤。
本发明实施例所述计算机可读存储介质的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例实现了半监督多分类的图像预测,提高了图像分类的准确度。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种图像分类方法、系统、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (9)

1.一种图像分类方法,其特征在于,包括:
提取经过图像预处理的待分类图像的目标特征集,所述目标特征集包含的特征由训练样本集中各样本图像的最优特征子集确定;所述训练样本集包括第一个数的有标签样本图像和第二个数的无标签样本图像,各样本图像和所述待分类图像的特征维数相同且各特征代表的意义相同;
将所述待分类图像的目标特征集输入支持向量机分类器,获取所述待分类图像所属的标签类型;
其中,所述最优特征子集确定过程为:
初始化特征权重向量、学习参数、正则化参数、停止准则,并设置最大迭代次数和初始迭代次数;
计算经过图像预处理的各样本图像在权重空间的间隔,根据各样本图像在权重空间的间隔迭代计算特征权重向量,直至满足迭代结束条件,得到各样本图像的每个特征的权重值,并根据各权重值对各特征进行组合生成多个特征子集;
分别利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集,以作为最优特征子集;
其中,所述计算经过图像预处理的各样本图像在权重空间的间隔:
根据公式(1)计算所述训练样本集中每个有标签样本图像在权重空间的间隔:
Figure FDA0003393668020000011
式中,
Figure FDA0003393668020000012
xl为当前有标签样本图像,xi为所述训练样本集中有标签样本图像;NM(xl)为xl的异类近邻,NH(xl)为xl的同类近邻;w(t-1)表示迭代次数为t-1次时的特征权重向量;
根据公式(2)计算所述训练样本集中每个无标签样本图像在权重空间的间隔:
Figure FDA0003393668020000013
式中,
Figure FDA0003393668020000014
Figure FDA0003393668020000021
为无标签样本图像当前的标签类别为j;xi为所述训练样本集中有标签样本图像;c为标签类别总数;
Figure FDA0003393668020000022
Figure FDA0003393668020000023
的异类近邻,
Figure FDA0003393668020000024
Figure FDA0003393668020000025
的同类近邻。
2.根据权利要求1所述的图像分类方法,其特征在于,所述经过图像预处理的待分类图像包括:
对所述待分类图像进行降维处理;
对降维处理的待分类图像的特征进行归一化处理,使得每个特征值处于[0,1]区间。
3.根据权利要求1或2所述的图像分类方法,其特征在于,所述根据各样本图像在权重空间的间隔迭代计算特征权重向量,直至满足迭代结束条件,得到各样本图像的每个特征的权重值包括:
根据下述公式计算特征权重向量:
Figure FDA0003393668020000026
式中,w(t)为特征权重向量;T为最大迭代次数;t为初始迭代次数;θ为停止准则;α和β为正则化参数;U为无标签样本图像的总数;L为有标签样本图像的总数;ρl为有标签样本图像在权重空间的间隔;ρu为无标签样本图像在权重空间的间隔;
判断||w(t)-w(t-1)||>θ,且t≤T;
若是,则t=t+1,根据公式(3)迭代计算特征权重向量;
若否,则令w*=w(t),得到各样本图像的每个特征的权重值。
4.根据权利要求3所述的图像分类方法,其特征在于,所述分别利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集包括:
将所述训练样本集中的样本图像分为训练集和验证集;
分别利用所述训练集中的样本图像对应的各特征子集训练向量分类器,将所述验证集中各样本图像相对应的特征子集输入在训练好的向量分类器中,以对所述验证集中各样本图像进行分类;
选取对所述验证集中的样本图像分类准确度最高的向量分类器对应的特征子集,以作为满足最佳分类效果条件的特征子集。
5.根据权利要求4所述的图像分类方法,其特征在于,所述待分类图像为待分类卫星图像;所述训练样本集中的各样本图像均为卫星图像。
6.根据权利要求5所述的图像分类方法,其特征在于,所述经过图像预处理的各样本图像包括:
对各样本图像的特征进行归一化处理,使得每个特征值处于[0,1]区间。
7.一种图像分类系统,其特征在于,包括:
特征确定模块,用于初始化特征权重向量、学习参数、正则化参数、停止准则,并设置最大迭代次数和初始迭代次数;计算经过图像预处理的各样本图像在权重空间的间隔,根据各样本图像在权重空间的间隔迭代计算特征权重向量,直至满足迭代结束条件,得到各样本图像的每个特征的权重值,并根据各权重值对各特征进行组合生成多个特征子集;分别利用各特征子集训练支持向量机分类器,确定满足最佳分类效果条件的特征子集,以作为最优特征子集;
特征提取模块,用于提取经过图像预处理的待分类图像的目标特征集,所述目标特征集包含的特征由训练样本集中各样本图像的最优特征子集确定;所述训练样本集包括第一个数的有标签样本图像和第二个数的无标签样本图像,各样本图像和所述待分类图像的特征维数相同且各特征代表的意义相同;
分类模块,用于将所述待分类图像的目标特征集输入支持向量机分类器,获取所述待分类图像所属的标签类型;
其中,所述计算经过图像预处理的各样本图像在权重空间的间隔:
根据公式(1)计算所述训练样本集中每个有标签样本图像在权重空间的间隔:
Figure FDA0003393668020000031
式中,
Figure FDA0003393668020000032
xl为当前有标签样本图像,xi为所述训练样本集中有标签样本图像;NM(xl)为xl的异类近邻,NH(xl)为xl的同类近邻;w(t-1)表示迭代次数为t-1次时的特征权重向量;
根据公式(2)计算所述训练样本集中每个无标签样本图像在权重空间的间隔:
Figure FDA0003393668020000041
式中,
Figure FDA0003393668020000042
Figure FDA0003393668020000043
Figure FDA0003393668020000044
为无标签样本图像当前的标签类别为j;xi为所述训练样本集中有标签样本图像;c为标签类别总数;
Figure FDA0003393668020000045
Figure FDA0003393668020000046
的异类近邻,
Figure FDA0003393668020000047
Figure FDA0003393668020000048
的同类近邻。
8.一种图像分类设备,其特征在于,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至6任一项所述图像分类方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有图像分类程序,所述图像分类程序被处理器执行时实现如权利要求1至6任一项所述图像分类方法的步骤。
CN201810426685.4A 2018-05-07 2018-05-07 一种图像分类方法、系统、设备及计算机可读存储介质 Active CN108629373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810426685.4A CN108629373B (zh) 2018-05-07 2018-05-07 一种图像分类方法、系统、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810426685.4A CN108629373B (zh) 2018-05-07 2018-05-07 一种图像分类方法、系统、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108629373A CN108629373A (zh) 2018-10-09
CN108629373B true CN108629373B (zh) 2022-04-12

Family

ID=63695638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810426685.4A Active CN108629373B (zh) 2018-05-07 2018-05-07 一种图像分类方法、系统、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108629373B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670552B (zh) * 2018-12-24 2023-03-10 苏州大学 一种图像分类方法、装置、设备及可读存储介质
CN110263859A (zh) * 2019-06-21 2019-09-20 深圳前海微众银行股份有限公司 样本分类方法、装置、设备及可读存储介质
CN110297933A (zh) * 2019-07-01 2019-10-01 山东浪潮人工智能研究院有限公司 一种基于深度学习的主题标签推荐方法及工具
CN112464977A (zh) * 2020-10-15 2021-03-09 深圳先进技术研究院 一种物体分类方法、计算机设备及存储介质
CN113420170B (zh) * 2021-07-15 2023-04-14 宜宾中星技术智能系统有限公司 大数据图像的多线程存储方法、装置、设备和介质
CN115700831A (zh) * 2021-07-29 2023-02-07 脸萌有限公司 图像的标注方法、分类方法和机器学习模型的训练方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001113762A (ja) * 1999-10-18 2001-04-24 Canon Inc 画像形成装置、その画像管理装置および画像形成方法、並びに画像形成用制御プログラムを記録した記録媒体
US7146050B2 (en) * 2002-07-19 2006-12-05 Intel Corporation Facial classification of static images using support vector machines
CN104091038A (zh) * 2013-04-01 2014-10-08 太原理工大学 基于大间隔分类准则的多示例学习特征加权方法
US9710729B2 (en) * 2014-09-04 2017-07-18 Xerox Corporation Domain adaptation for image classification with class priors
CN104463202B (zh) * 2014-11-28 2017-09-19 苏州大学 一种多类图像半监督分类方法及系统
GB2537681B (en) * 2015-04-24 2018-04-25 Univ Oxford Innovation Ltd A method of detecting objects within a 3D environment
CN105069471B (zh) * 2015-07-31 2018-08-28 西安电子科技大学 基于模糊标签的高光谱数据子空间投影和分类方法
CN105608478B (zh) * 2016-03-30 2019-12-06 苏州大学 一种图像的特征提取与分类联合方法及系统
CN107358142B (zh) * 2017-05-15 2020-12-08 西安电子科技大学 基于随机森林构图的极化sar图像半监督分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
改进的LLGC高光谱图像半监督分类;盛振国等;《哈尔滨工程大学学报》;20170426(第07期);全文 *

Also Published As

Publication number Publication date
CN108629373A (zh) 2018-10-09

Similar Documents

Publication Publication Date Title
CN108629373B (zh) 一种图像分类方法、系统、设备及计算机可读存储介质
CN104091321B (zh) 适用于地面激光雷达点云分类的多层次点集特征的提取方法
US7724961B2 (en) Method for classifying data using an analytic manifold
CN111814584A (zh) 基于多中心度量损失的多视角环境下车辆重识别方法
CN107480620B (zh) 基于异构特征融合的遥感图像自动目标识别方法
CN103942562B (zh) 基于多分类器组合的高光谱图像分类方法
CN103136504A (zh) 人脸识别方法及装置
CN107451614A (zh) 基于空间坐标与空谱特征融合的高光谱分类方法
CN107292225B (zh) 一种人脸识别方法
CN112784918B (zh) 基于无监督图表示学习的节点识别方法、系统、装置
CN114037876A (zh) 一种模型优化方法和装置
CN111046910A (zh) 图像分类、关系网络模型训练、图像标注方法及装置
Nguyen et al. Satellite image classification using convolutional learning
CN1723468A (zh) 采用照明不变神经网络的计算机视觉系统和方法
CN103886334A (zh) 一种多指标融合的高光谱遥感影像降维方法
CN113723492A (zh) 一种改进主动深度学习的高光谱图像半监督分类方法及装置
CN111259784A (zh) 基于迁移学习和主动学习的sar图像变化检测方法
WO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および記録媒体
CN104156628A (zh) 一种基于多核学习判别分析的舰船辐射信号识别方法
CN112613474B (zh) 一种行人重识别的方法和装置
CN111127407B (zh) 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法
Faghih et al. Multi-objective optimization based color constancy
CN105844299B (zh) 一种基于词袋模型的图像分类方法
Laroze et al. Active learning to assist annotation of aerial images in environmental surveys
CN105718858A (zh) 一种基于正负广义最大池化的行人识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant