CN111488923B - 增强的锚点图半监督分类方法 - Google Patents

增强的锚点图半监督分类方法 Download PDF

Info

Publication number
CN111488923B
CN111488923B CN202010263894.9A CN202010263894A CN111488923B CN 111488923 B CN111488923 B CN 111488923B CN 202010263894 A CN202010263894 A CN 202010263894A CN 111488923 B CN111488923 B CN 111488923B
Authority
CN
China
Prior art keywords
matrix
nodes
node
marked
anchor point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010263894.9A
Other languages
English (en)
Other versions
CN111488923A (zh
Inventor
马君亮
肖冰
敬欣怡
汪西莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Normal University
Original Assignee
Shaanxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Normal University filed Critical Shaanxi Normal University
Priority to CN202010263894.9A priority Critical patent/CN111488923B/zh
Publication of CN111488923A publication Critical patent/CN111488923A/zh
Application granted granted Critical
Publication of CN111488923B publication Critical patent/CN111488923B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

一种增强的锚点图半监督分类方法,包括:S100、准备数据集;S200、对S100准备的数据集采用锚点提取方法提取m个锚点,得到锚点集U;S300、根据S200得到的锚点集U,使用基于锚点的概率近邻方法建立锚点集U中的锚点或已标记数据集Xl中的节点与数据集中其他节点之间的关系,得到关系矩阵Z*;S400、将S200中得到的锚点集U中的锚点和已标记数据集Xl中的节点作为节点构造图结构,利用扩展标签传播方法进行标签传播;S500、根据S300中得到的关系矩阵Z*和S400中得到的标签矩阵F*进行标签传播得到最终分类结果。本公开提出的分类方法能够降低半监督分类过程中的时间复杂度和空间复杂度,提高效率。

Description

增强的锚点图半监督分类方法
技术领域
本公开涉及数据分类方法,具体地讲,涉及一种增强的锚点图半监督分类方法(Enhanced Semi-supervised Classification with Anchor Graph,ESCAG)。
背景技术
基于图的半监督学习为建模高维空间中可能存在于海量数据源中的流形结构提供了一个很有效的范例,它已被证明能有效地将有限数量的初始标签传播到大量的未标记数据,对已标记样本数量要求较低,从而满足许多新兴应用的需要,例如图像注释和信息检索。但是,目前大多数基于图的半监督学习方法侧重于分类的准确性,对降低方法复杂性研究较少。基于图的半监督学习方法随着数据样本数量的增加,耗费巨大的内存空间,矩阵运算十分耗时,甚至出现内存溢出的现象,空间复杂度和时间复杂度限制了基于图的半监督方法应用范围,其数据规模扩展性差,处理大型数据集的能力差。
基于锚点图的半监督分类方法能够实现对大数据集的有效分类,将大量未标记样本点的标记预测问题转换成少量锚点标签的加权平均,将方法的时间复杂度缩小到O(m2k),空间复杂度也降低到O(m+n),其中m为锚点个数,n为样本数量,m<<n,k是常量。但是该方法的锚点对噪声较为敏感;同时将节点与固定数量的锚点相关联,自适应性较差。由于存在上述缺点,因此亟需一种新的半监督分类方法,以降低分类的时间复杂度和空间复杂度,提高方法效率。
发明内容
针对上述问题,本公开提出了一种增强的锚点图半监督分类方法,对数据集进行锚点提取。通过建立样本点和锚点之间的关系矩阵标记未标记的样本点,从而进行分类,该方法能够降低半监督分类过程中的时间复杂度和空间复杂度,提高方法效率。
本公开提出的增强的锚点图半监督分类方法,可根据不同的数据集类型采用不同的锚点提取方法,例如对于像素级数据使用超像素分割(Simple Linear IterativeClustering,SLIC)方法进行锚点提取,对于图像级数据使用(K-Means ClusteringAlgorithm,K-Means)方法进行锚点提取,然后建立样本点与锚点之间的关系矩阵,使用扩展的标签传播(Extended Label Propagation,ELP)方法对锚点进行标记,最后通过关系矩阵与锚点的标记进行分类。
具体地,一种增强的锚点图半监督分类方法,包括:
S100、准备数据集,所述数据集包括已标记数据集Xl和未标记数据集Xu两部分,已标记数据集Xl的标记信息为Fl,数据集中数据的特征通过数据属性信息来描述,l表示已标记数据的个数,将数据集中的所有数据抽象为t维空间上的n个节点,其中第b个节点表示为pb
S200、对步骤S100中准备的数据集采用锚点提取方法提取m个锚点,得到锚点集U;
S300、根据步骤S200中得到的锚点集U,使用基于锚点的概率近邻方法建立锚点集U中的锚点或已标记数据集Xl中的节点二者中任一与数据集中其他节点之间的关系,得到关系矩阵Z*,关系矩阵Z*是一个n×m的矩阵,
Figure BDA0002438964200000021
代表锚点集U中的锚点或已标记数据集Xl中的节点pj二者中任一与数据集中其他节点pi之间的相似度,具体为:
Figure BDA0002438964200000022
其中,
Figure BDA0002438964200000023
代表pj和pi之间的相似度,pj表示锚点集U中的锚点或已标记数据集Xl中的节点,pi表示数据集中的其他节点,
Figure BDA0002438964200000024
表示pj与pi之间的距离,q表示pj是pi的第q个近邻,r为参数,其表示节点pi连接距离其最近的r个已标记样本点或锚点作为该节点的近邻;
S400、将步骤S200中得到的锚点集U中的锚点和已标记数据集Xl中的节点作为节点构造图结构,利用扩展的标签传播(ELP)方法进行标签传播,具体为:
S401、根据已标记数据集的标记信息Fl和锚点的标记信息建立初始的标签矩阵F,
F=[Fl;Fu],
标签矩阵F是一个n′×c的矩阵,其中n′=(l+m)为已标记节点和锚点的总数,c为标记的类别数,Fu表示锚点的标记信息,初始为0;若已标记数据集和锚点集的节点pj的标记为v,则Fjv=1,否则Fjv=0,其中Fjv表示标签矩阵F第j行第v列的元素;
S402、根据锚点和已标记数据集中的节点的属性信息将其抽象为t维空间上的n′个节点,由n′个节点组成图,计算图中节点间的欧式距离,得到距离矩阵S,距离矩阵S是一个n′×n′的二维矩阵,Slj表示矩阵中第l行第j列的值,存储图中节点pl和节点pj之间的欧氏距离,其中pl和pi都包括已标记数据集中的节点和锚点集中的锚点;
S403、根据步骤S402中得到的距离矩阵S选择每个节点的近邻并定义权值矩阵W,权值矩阵W是一个n′×n′的矩阵,其中Wlj用来描述节点pl和节点pj之间的相似度,即权值矩阵W第l行第j列的值;
S404、根据步骤S403中的权值矩阵W定义概率转移矩阵P,概率转移矩阵P是一个n′×n′的矩阵,其中Plj是概率转移矩阵P第l行第j列的值,用来描述标签信息从节点pl传播到节点pj的概率,即节点pj获取节点pl的标签信息的概率;
S405、根据步骤S401中的标签矩阵F和步骤S404中的概率转移矩阵P迭代求解得到锚点的标记信息,锚点的标记信息和已标记节点的标记信息共同组成迭代后的标签矩阵F*,标签矩阵F*是一个n′×c的矩阵,
Figure BDA0002438964200000031
表示矩阵中第i行第j列的元素;
S500、根据步骤S300中得到的关系矩阵Z*和步骤S400中得到的标签矩阵F*进行标签传播得到最终的分类结果。
优选的,所述步骤S200中,若数据集为像素级,则对像素级数据采用的锚点提取方法为超像素分割(SLIC)方法,具体为:
S211,将图像细分成多个图像子区域,即图中的网格,每个图像子区域为一个聚类,其大小是s×s,
Figure BDA0002438964200000032
其中n为像素个数即数据集中的节点个数,m为锚点个数,初始时,选定每个网格中心的节点作为聚类中心,相邻两个聚类中心之间的距离为s;
S212,以步骤S211中选定的聚类中心为中心,在3×3的邻域内重新选择聚类中心,具体为,移动聚类中心到该邻域内梯度值最低的位置,梯度值低表示此处的像素样本点相似度高,为每个像素点px设置距离d(px)=∞,d(px)表示像素点px到其所在聚类的聚类中心的距离;
S213,对步骤S212得到的每一个聚类中心遍历其2s×2s的邻域内的每一个像素点,计算邻域内的每个像素点px和聚类中心之间的距离
Figure BDA0002438964200000033
Figure BDA0002438964200000034
Figure BDA0002438964200000035
Figure BDA0002438964200000036
并将该像素点px划分到该聚类中心所在的聚类中;
S214,重复步骤S213直到每个像素点的聚类中心达到收敛,则此时所有的聚类中心作为提取的锚点集合U。
优选的,所述步骤S200中,若数据集为图像级,则对图像级数据分类采用的锚点提取方法为K均值聚类(K-Means)方法,具体为:
S221,图像级数据中每幅图像作为一个数据点,随机选取m个数据点作为初始的聚类中心;
S222,计算其他数据点与各个聚类中心的距离,并根据最小的距离对相应的数据点进行划分,即对于每个数据点来说,将其划分进距离其最近的聚类中心所在的聚类;
S223,计算每个聚类的均值并根据均值选择新的聚类中心,并选择均值最低的作为新的聚类中心,若聚类中心收敛,则方法终止,否则重复执行S222、S223,最终得到的所有聚类中心即为锚点集合U。
优选的,所述步骤S401中,Fl为已标记节点的标记信息矩阵,具体定义为:
Figure BDA0002438964200000041
其中
Figure BDA00024389642000000410
是矩阵Fl第h行第v列的值,它表示对于已标记数据集中的节点ph,如果它的标记信息为v,则
Figure BDA0002438964200000042
否则
Figure BDA0002438964200000043
yh是节点ph的标记;
Fu为锚点的标记信息矩阵,矩阵Fu的取值范围为:
Figure BDA0002438964200000044
其中
Figure BDA0002438964200000045
是矩阵Fu第g行第v列的值,它表示对于锚点ug,如果它的标记信息为v,则
Figure BDA0002438964200000046
否则
Figure BDA00024389642000000411
l为已标记数据集中的节点个数,n′为锚点和已标记节点的总数,初始时Fu=0。
优选的,所述步骤S402中,图中节点pl和节点pj之间的欧式距离为:
Figure BDA0002438964200000047
其中t表示数据的维度,pl、pj表示图中的第l、j个节点,包括已标记节点和锚点,xlw和xjw分别是节点pl、pj第w维的坐标,根据节点间的欧氏距离生成距离矩阵S。
优选的,所述步骤S403中,根据距离矩阵S,使用kNN方法选择近邻,具体的:对于图中的每个节点,选择距离其最近的k个节点作为该节点的近邻,根据选择的近邻生成邻接矩阵A,A是一个n′×n′的矩阵,邻接矩阵A中,若pj是pl的近邻,则矩阵中相应位置Alj的值为1,否则为0,Alj表示邻接矩阵A中第l行第j列的值,pl和pj均包括已标记节点和锚点。
优选的,所述步骤S403中还包括,根据邻接矩阵A和距离矩阵S定义权值矩阵W,具体为:
当l≠j时,
Figure BDA0002438964200000048
当l=j时,Wlj=0;e是自然底数。
优选的,所述步骤S404中样本特征空间的概率转移矩阵P,具体为:
Figure BDA0002438964200000049
优选的,所述步骤S405中的迭代求解具体为:
S4051,F0=F,P0=P,其中F0为初始的标签矩阵,P0为初始的样本特征空间的概率转移矩阵;
S4052,Ft+1←FtFt,其中Ft+1为第t次迭代后得到的标签矩阵,Pt为第t-1次迭代后得到的概率转移矩阵,Ft为第t-1次迭代后得到的标签矩阵,该步骤将第t-1次迭代得到的概率转移矩阵和标签矩阵的乘积赋值给Ft+1
S4053,
Figure BDA0002438964200000051
其中
Figure BDA0002438964200000052
为第t次迭代后得到的已标记节点的标记信息矩阵,Yl为初始的标记信息矩阵,该步骤将初始的标记信息矩阵赋值给
Figure BDA0002438964200000053
目的是保证初始的标记信息不会改变;
S4054,
Figure BDA0002438964200000054
其中
Figure BDA0002438964200000055
为样本标记空间的概率转移矩阵,Nor表示对矩阵的归一化,
Figure BDA0002438964200000056
表达的是类别标签之间的相关性,即,如果pl和pj属于同类样本,则
Figure BDA0002438964200000057
的第l行第j列元素为1,否则为0,该步骤将第t-1次迭代后得到的标签矩阵与其转置矩阵相乘后的矩阵归一化后赋值给
Figure BDA0002438964200000058
S4055,
Figure BDA0002438964200000059
其中Pt+1为第t次迭代后得到的概率转移矩阵,Pt为第t-1次迭代后得到的概率转移矩阵,α为参数,一般取0.4,该参数用于调整Pt
Figure BDA00024389642000000510
所占比例,M是一个n′×n′的矩阵,其中,Mlj=1表示节点pj是节点pl的k个最相似的样本之一,否则,Mlj=0;其中节点pj和节点pl均包括已标记节点和锚点,⊙是Hadamard乘积,
Figure BDA00024389642000000511
表示两个矩阵的对应位置元素相乘组成的新的矩阵,
Figure BDA00024389642000000512
为第t次迭代后得到的样本标记空间的概率转移矩阵,该步骤将第t-1次迭代后得到的概率转移矩阵和
Figure BDA00024389642000000513
矩阵以一定比例相加后得到的矩阵赋值给Pt+1
S4056,重复执行步骤S4052至S4055直到收敛,此时的矩阵Ft即为迭代后的已标记节点和锚点的标签矩阵F*
优选的,所述步骤S500中,根据关系矩阵Z*和标签矩阵F*计算未标记样本的标记信息,具体包括:
Figure BDA00024389642000000514
其中,aj表示标签矩阵F*中第j列元素组成的向量,
Figure BDA00024389642000000515
为关系矩阵第i行组成的向量,
Figure BDA00024389642000000516
表示节点pi取得标记信息j的概率,参数λj用于归一化,
Figure BDA00024389642000000517
其中,1T是一个1×n的矩阵,矩阵中所有元素均为1,对于不同的类别j,有其对应的参数λj,1为已标记节点的个数,n为节点总数,argmax代表将当
Figure BDA00024389642000000518
取得最大值时所得的j值赋值给yi,即将标记yi作为节点pi的标记,对所有节点获得标记后即完成数据的分类。
与现有技术相比,本公开具有下述有益技术效果:
(1)利用锚点实现不同分辨率下的图半监督分类方法,大大降低了构图和图正则化过程的时间复杂度和空间复杂度;
(2)采用灵活的锚点提取方法,针对不同类型的数据设计不同的锚点提取方法,进一步降低了时间复杂度;
(3)采用ELP方法进行锚点图的推导,提高了锚点图正则化的方法效率。
附图说明
图1表示本公开的增强的锚点图半监督分类方法流程图;
图2(a)表示图像分割的示例图像:person7.jpg;
图2(b)表示图像分割的示例图像:Sheep.jpg;
图2(c)表示图像分割的示例图像:388016.jpg;
图2(d)表示图像分割的示例图像:227092.jpg;
图2(e)表示图像分割的示例图像:189080.jpg;
图2(f)表示图像分割的示例图像:Teddy.jpg;
图2(g)表示图像分割的示例图像:banana2.bmp;
图2(h)表示图像分割的示例图像:music.jpg;
图3(a)表示person7.jpg的原图;
图3(b)表示person7.jpg的带标记的带分割图像;
图3(c)表示person7.jpg的标准分割结果图;
图3(d)表示person7.jpg的AGR(核回归)分割结果图;
图3(e)表示person7.jpg的AGR(LAE)分割结果图;
图3(f)表示person7.jpg的ESCAG分割结果图;
图4(a)表示Sheep.jpg的原图;
图4(b)表示Sheep.jpg的带标记的带分割图像;
图4(c)表示Sheep.jpg的标准分割结果图;
图4(d)表示Sheep.jpg的AGR(核回归)分割结果图;
图4(e)表示Sheep.Jpg的AGR(LAE)分割结果图;
图4(f)表示Sheep.Jpg的ESCAG分割结果图;
图5(a)表示388016.jpg的原图;
图5(b)表示388016.jpg的带标记的带分割图像;
图5(c)表示388016.jpg的标准分割结果图;
图5(d)表示388016.jpg的AGR(核回归)分割结果图;
图5(e)表示388016.jpg的AGR(LAE)分割结果图;
图5(f)表示388016.jpg的ESCAG分割结果图;
图6(a)表示227092.jpg的原图;
图6(b)表示227092.jpg的带标记的带分割图像;
图6(c)表示227092.jpg的标准分割结果图;
图6(d)表示227092.jpg的AGR(核回归)分割结果图;
图6(e)表示227092.jpg的AGR(LAE)分割结果图;
图6(f)表示227092.jpg的ESCAG分割结果图;
图7(a)表示189080.jpg的原图;
图7(b)表示189080.jpg的带标记的带分割图像;
图7(c)表示189080.jpg的标准分割结果图;
图7(d)表示189080.jpg的AGR(核回归)分割结果图;
图7(e)表示189080.jpg的AGR(LAE)分割结果图;
图7(f)表示189080.jpg的ESCAG分割结果图;
图8(a)表示Teddy.jpg的原图;
图8(b)表示Teddy.jpg的带标记的带分割图像;
图8(c)表示Teddy.jpg的标准分割结果图;
图8(d)表示Teddy.jpg的AGR(核回归)分割结果图;
图8(e)表示Teddy.jpg的AGR(LAE)分割结果图;
图8(f)表示Teddy.jpg的ESCAG分割结果图;
图9(a)表示banana2.bmp的原图;
图9(b)表示banana2.bmp的带标记的带分割图像;
图9(c)表示banana2.bmp的标准分割结果图;
图9(d)表示banana2.bmp的AGR(核回归)分割结果图;
图9(e)表示banana2.bmp的AGR(LAE)分割结果图;
图9(f)表示banana2.bmp的ESCAG分割结果图;
图10(a)表示music.jpg的原图;
图10(b)表示music.jpg的带标记的带分割图像;
图10(c)表示music.jpg的标准分割结果图;
图10(d)表示music.jpg的AGR(核回归)分割结果图;
图10(e)表示music.jpg的AGR(LAE)分割结果图;
图10(f)表示music.jpg的ESCAG分割结果图;
图11(a)表示USPS数据集上分类错误率随已标记样本数量变化的曲线;
图11(b)表示MNIST数据集上分类错误率随已标记样本数量变化的曲线;
图12(a)表示USPS数据集上执行时间随已标记样本数量变化的曲线;
图12(b)表示MNIST数据集上执行时间随已标记样本数量变化的曲线;
图13(a)表示USPS数据集上分类错误率随锚点数量变化的曲线;
图13(b)表示MNIST数据集上分类错误率随锚点数量变化的曲线;
图13(c)表示Letter Recognition数据集上分类错误率随锚点数量变化的曲线;
图14(a)表示USPS数据集上执行时间随锚点数量变化的曲线;
图14(b)表示MNIST数据集上执行时间随锚点数量变化的曲线;
图14(c)表示Letter Recognition数据集上执行时间随锚点数量变化的曲线。
具体实施方式
本公开提出的增强的锚点图半监督分类方法:
在一个实施例中,如图1所示,一种增强的锚点图半监督分类方法,包括:
S100、准备数据集,所述数据集包括已标记数据集Xl和未标记数据集Xu两部分,已标记数据集Xl的标记信息为Fl,数据集中数据的特征通过数据属性信息来描述,l表示已标记数据的个数,将数据集中的所有数据抽象为t维空间上的n个节点,其中第b个节点表示为pb
S200、对步骤S100中准备的数据集采用锚点提取方法提取m个锚点,得到锚点集U;
S300、根据步骤S200中得到的锚点集U,使用基于锚点的概率近邻方法建立锚点集U中的锚点或已标记数据集Xl中的节点二者中任一与数据集中其他节点之间的关系,得到关系矩阵Z*,关系矩阵Z*是一个n×m的矩阵,
Figure BDA0002438964200000081
代表锚点集U中的锚点或已标记数据集Xl中的节点pj二者中任一与数据集中其他节点pi之间的相似度,具体为:
Figure BDA0002438964200000091
其中,
Figure BDA0002438964200000092
代表pj和pi之间的相似度,pj表示锚点集U中的锚点或已标记数据集Xl中的节点,pi表示数据集中的其他节点,
Figure BDA0002438964200000093
表示pj与pi之间的距离,q表示pj是pi的第q个近邻,r为参数,其表示节点pi连接距离其最近的r个已标记样本点或锚点作为该节点的近邻;
S400、将步骤S200中得到的锚点集U中的锚点和已标记数据集Xl中的节点作为节点构造图结构,利用扩展的标签传播(ELP)方法进行标签传播,具体为:
S401、根据已标记数据集的标记信息Fl和锚点的标记信息建立初始的标签矩阵F,
F=[Fl;Fu],
标签矩阵F是一个n′×c的矩阵,其中n′=(l+m)为已标记节点和锚点的总数,c为标记的类别数,Fu表示锚点的标记信息,初始为0;若已标记数据集和锚点集的节点pj的标记为v,则Fjv=1,否则Fjv=0,其中Fjv表示标签矩阵F第j行第v列的元素;
S402、根据锚点和已标记数据集中的节点的属性信息将其抽象为t维空间上的n′个节点,由n′个节点组成图,计算图中节点间的欧式距离,得到距离矩阵S,距离矩阵S是一个n′×n′的二维矩阵,Slj表示矩阵中第l行第j列的值,存储图中节点pl和节点pj之间的欧氏距离,其中pl和pj都包括已标记数据集中的节点和锚点集中的锚点;
S403、根据步骤S402中得到的距离矩阵S选择每个节点的近邻并定义权值矩阵W,权值矩阵W是一个n′×n′的矩阵,其中Wlj用来描述节点pl和节点pj之间的相似度,即权值矩阵W第l行第j列的值;
S404、根据步骤S403中的权值矩阵W定义概率转移矩阵P,概率转移矩阵P是一个n′×n′的矩阵,其中Plj是概率转移矩阵P第l行第j列的值,用来描述标签信息从节点pl传播到节点pj的概率,即节点pj获取节点pl的标签信息的概率;
S405、根据步骤S401中的标签矩阵F和步骤S404中的概率转移矩阵P迭代求解得到锚点的标记信息,锚点的标记信息和已标记节点的标记信息共同组成迭代后的标签矩阵F*,标签矩阵F*是一个n′×c的矩阵,
Figure BDA0002438964200000094
表示矩阵中第i行第j列的元素;
S500、根据步骤S300中得到的关系矩阵Z*和步骤S400中得到的标签矩阵F*进行标签传播得到最终的分类结果。
在该实施例中,步骤Si00中准备的数据集包括已标记数据集Xl和未标记数据集Xu,所有数据抽象为t维空间上的n个节点,其中第b个节点表示为pb,其可能是已标记数据,也可能是未标记数据。步骤S200中对准备的数据集(即抽象后的数据集)采用锚点提取方法提取锚点,得到锚点集,由于数据集可能是像素级数据或图像集数据等不同类型的数据,因此针对不同的数据集类型可以采用不同的锚点提取方法,后续将进一步说明。步骤S300是根据步骤S200得到的锚点集U,建立锚点集U中的锚点或已标记数据集Xl中的节点与数据集中其他节点之间的关系,得到关系矩阵Z*;其中,相似度公式中的r参数,表示节点pi连接距离其最近的r个已标记样本点或锚点作为该节点的近邻,具体来说,计算节点pi与所有已标记样本点或锚点之间的欧氏距离,选择欧式距离最小的r个已标记样本点或锚点作为该节点的近邻。步骤S400是将步骤S200中得到的锚点集U中的锚点和已标记数据集Xl中的节点作为节点构造图结构,利用扩展的标签传播(Extended Label Propagation,ELP)方法进行标签传播,得到迭代后的标签矩阵F*;步骤S500根据步骤S300中得到的关系矩阵Z*和步骤S400中得到的标签矩阵F*进行标签传播得到最终的分类结果。
其中,具体的,所述步骤S300中得到的关系矩阵Z*通过如下方法得到:
首先建立关于矩阵Z的目标函数:
Figure BDA0002438964200000101
其中,Zij表示对于数据集中的样本pi,样本pj成为其近邻的概率,其满足0≤Zij≤1,pj表示已标记节点和锚点中的第j个节点,pi表示除此之外的节点中的第i个节点,;向量Zi表示样本空间{p1,p2,...,pn′}中所有样本成为pi的近邻的概率,且Zi中元素之和等于1,记为
Figure BDA0002438964200000102
γ是正则参数,γ>0;n′=m+l为锚点和已标记节点的总数;
Figure BDA0002438964200000103
表示样本点pi与样本点pj之间的距离,其表示为
Figure BDA0002438964200000104
q表示pj是pi的第q个近邻;由此可得到优化后的目标函数:
Figure BDA0002438964200000105
其中向量
Figure BDA0002438964200000106
表示样本空间{p1,p2,...,pn′}中所有样本与样本pi的欧氏距离;
由于正则参数γ>0,因此通过拉格朗日乘子法求解上式,拉格朗日乘子法的主要思想是将约束条件函数与原函数联立,从而求出使原函数取得极值的各个变量的解,可得:
Figure BDA0002438964200000111
其中βi>0且η>0,
Figure BDA0002438964200000112
为求得的三个变量的解,
Figure BDA0002438964200000113
表示向量βi的转置,η为拉格朗日乘子;根据Karush-Kuhn-Tucker(KKT)条件,KKT条件是非线性规划中求最佳解的必要条件,在求解不等式约束的优化问题的极值时,KKT条件包括原可行性、对偶可行性、互补松弛条件和拉格朗日平稳性,由此可以证实最优解Zii为:
Figure BDA0002438964200000114
其中Zij表示向量Zi的第j个元素,γi表示对于数据样本点pi其正则参数γ的取值;为了自适应确定数据样本点pi的近邻个数,近邻个数设置为不超过r,因此Zi的最优解中非零元素个数不超过r个,pi为除已标记节点和锚点之外的所有节点中的第i个节点;
由于
Figure BDA0002438964200000115
可以得到:
Figure BDA0002438964200000116
将Zij的最近邻约束设置为:
Figure BDA0002438964200000117
求解上式可得:
Figure BDA0002438964200000118
基于最小-最大归一化思想,最小-最大归一化是对数据进行归一化的最常用方法之一,用于将原始数据变换到[0,1]区间,将γi的值设置为:
Figure BDA0002438964200000121
将γi的取值代入最优解公式中可得关系矩阵Z*为:
Figure BDA0002438964200000122
由于
Figure BDA0002438964200000123
满足条件:向量
Figure BDA0002438964200000124
中的元素之和等于1,因此可进一步改进关系矩阵Z*为:
Figure BDA0002438964200000125
Figure BDA0002438964200000126
即为关系矩阵Z*中第i行第j列的元素,
Figure BDA0002438964200000127
即为所求得的关系矩阵。
在该实施例中,在准备好的数据集进行锚点提取,在此基础上建立未标记样本和由已标记样本和锚点组成的样本集之间的关系矩阵Z*,使用ELP方法在已标记样本点和锚点之间进行标签传播,得到锚点的标记信息,最后通过关系矩阵Z*及已标记样本标记信息和锚点标记信息进行标签传播得到最终的分类结果;该方法能够降低半监督分类过程中的时间复杂度和空间复杂度,提高方法效率。
在另一个实施例中,所述步骤S200中,若数据集为像素级,则对像素级数据采用的锚点提取方法为超像素分割(SLIC)方法,具体为:
S211,将图像细分成多个图像子区域,即图中的网格,每个图像子区域为一个聚类,其大小是s×s,
Figure BDA0002438964200000128
其中n为像素个数即数据集中的节点个数,m为锚点个数,初始时,选定每个网格中心的节点作为聚类中心,相邻两个聚类中心之间的距离为s;
S212,以步骤S211中选定的聚类中心为中心,在3×3的邻域内重新选择聚类中心,具体为,移动聚类中心到该邻域内梯度值最低的位置,梯度值低表示此处的像素样本点相似度高,为每个像素点px设置距离d(px)=∞,d(px)表示像素点px到其所在聚类的聚类中心的距离;
S213,对步骤S212得到的每一个聚类中心遍历其2s×2s的邻域内的每一个像素点,计算邻域内的每个像素点px和聚类中心之间的距离
Figure BDA0002438964200000129
Figure BDA00024389642000001210
Figure BDA00024389642000001211
Figure BDA00024389642000001212
并将该像素点px划分到该聚类中心所在的聚类中;
S214,重复步骤S213直到每个像素点的聚类中心达到收敛,则此时所有的聚类中心作为提取的锚点集合U。
在该实施例中,由于数据集可能有像素级或者图像集等不同的类别,像素级数据是图像中的像素点作为数据样本点组成数据集,图像级数据将每一幅图像作为数据样本点组成数据集。
锚点是局部的数据中心,它可以反映数据的分布,不论是像素级数据或图像集数据都可以使用不同的方法提取锚点,U表示锚点的集合,它有m个元素,即代表共有m个锚点,第i个锚点表示为ui;锚点的数量远小于数据集中数据点的数量,因而可以在计算大规模数据集时提高效率。
像素级数据主要用于图像分割,一个像素级数据就是一幅图像;在该实施例中,针对像素级数据采用超像素分割(Simple Linear Iterative Clustering,SLIC)方法来提取锚点,获得锚点集U。其中,聚类中心收敛即表示聚类中心基本不再变化。
其中,步骤S212中的梯度值是指函数在该点的变化率,对于像素点px(xx1,xx2,...,xxw),其中xx1,xx2,...,xxw分别表示像素点px第1,2,...,w维的坐标,其梯度值的计算过程具体表示为:
Figure BDA0002438964200000131
其中G(px)表示像素点px在该处的梯度值。
在另一个实施例中,所述步骤S200中,若数据集为图像级,则对图像级数据分类采用的锚点提取方法为K均值聚类(K-Means)方法,具体为:
S221,图像级数据中每幅图像作为一个数据点,随机选取m个数据点作为初始的聚类中心;
S222,计算其他数据点与各个聚类中心的距离,并根据最小的距离对相应的数据点进行划分,即对于每个数据点来说,将其划分进距离其最近的聚类中心所在的聚类;
S223,计算每个聚类的均值并根据均值选择新的聚类中心,并选择均值最低的作为新的聚类中心,若聚类中心收敛,则方法终止,否则重复执行S222、S223,最终得到的所有聚类中心即为锚点集合U。
在该实施例中,针对图像集数据提取锚点集,该方法根据数据对象之间的特征相似性,将相似性较高的数据对象划分到同一类,将相异度较高的数据对象划分到不同类,每一类有一个聚类中心,每个聚类中心都是一个锚点。聚类中心收敛即表示聚类中心基本不再变化。
在另一个实施例中,所述步骤S401中,Fl为已标记节点的标记信息矩阵,具体定义为:
Figure BDA0002438964200000141
其中
Figure BDA0002438964200000142
是矩阵Fl第h行第v列的值,它表示对于已标记数据集中的节点ph,如果它的标记信息为v,则
Figure BDA0002438964200000143
否则
Figure BDA0002438964200000144
yh是节点ph的标记;
Fu为锚点的标记信息矩阵,矩阵Fu的取值范围为:
Figure BDA0002438964200000145
其中
Figure BDA0002438964200000146
是矩阵Fu第g行第v列的值,它表示对于锚点ug,如果它的标记信息为v,则
Figure BDA0002438964200000147
否则
Figure BDA0002438964200000148
l为已标记数据集中的节点个数,n′为锚点和已标记节点的总数,初始时Fu=0。
该实施例中,具体说明了已标记节点的标记信息矩阵Fl和锚点的标记信息矩阵Fu如何取值。
在另一个实施例中,所述步骤S402中,图中节点pl和节点pj之间的欧式距离为:
Figure BDA0002438964200000149
其中t表示数据的维度,pl、pj表示图中的第l、j个节点,包括已标记节点和锚点,xlw和xjw分别是节点pl、pj第w维的坐标,根据节点间的欧氏距离生成距离矩阵S。
在另一个实施例中,所述步骤S403中,根据距离矩阵S,使用kNN方法选择近邻,具体的:对于图中的每个节点,选择距离其最近的k个节点作为该节点的近邻,根据选择的近邻生成邻接矩阵A,A是一个n′×n′的矩阵,邻接矩阵A中,若pi是pl的近邻,则矩阵中相应位置Alj的值为1,否则为0,Alj表示邻接矩阵A中第1行第j列的值,pl和pj均包括已标记节点和锚点。
在另一个实施例中,所述步骤S403中还包括,根据邻接矩阵A和距离矩阵S定义权值矩阵W,具体为:
当l≠j时,
Figure BDA0002438964200000151
当l=j时,Wlj=0;e是自然底数。
在该实施例中,权值矩阵W是一个n′×n′的矩阵,其中Wlj用来描述节点pl和节点pj之间的相似度,即权值矩阵W第l行第j列的值,其中pl和pj都包括已标记数据集中的节点和锚点集中的锚点。
在另一个实施例中,所述步骤S404中样本特征空间的概率转移矩阵P,具体为:
Figure BDA0002438964200000152
在该实施例中,概率转移矩阵P是一个n′×n′的矩阵,其中Plj是概率转移矩阵P第l行第j列的值,用来描述标签信息从节点pl传播到节点pj的概率,即节点pj获取节点pl的标签信息的概率,其中pl和pj都包括已标记数据集中的节点和锚点集中的锚点。
在另一个实施例中,所述步骤S405中的迭代求解具体为:
S4051,F0=F,P0=P,其中F0为初始的标签矩阵,P0为初始的样本特征空间的概率转移矩阵;
S4052,Ft+1←PtFt,其中Ft+1为第t次迭代后得到的标签矩阵,Pt为第t-1次迭代后得到的概率转移矩阵,Ft为第t-1次迭代后得到的标签矩阵,该步骤将第t-1次迭代得到的概率转移矩阵和标签矩阵的乘积赋值给Ft+1
S4053,
Figure BDA0002438964200000153
其中
Figure BDA0002438964200000154
为第t次迭代后得到的已标记节点的标记信息矩阵,Yl为初始的标记信息矩阵,该步骤将初始的标记信息矩阵赋值给
Figure BDA0002438964200000155
目的是保证初始的标记信息不会改变;
S4054,
Figure BDA0002438964200000156
其中
Figure BDA0002438964200000157
为样本标记空间的概率转移矩阵,Nor表示对矩阵的归一化,
Figure BDA0002438964200000158
表达的是类别标签之间的相关性,即,如果pl和pj属于同类样本,则
Figure BDA0002438964200000159
的第l行第j列元素为1,否则为0,该步骤将第t-1次迭代后得到的标签矩阵与其转置矩阵相乘后的矩阵归一化后赋值给
Figure BDA00024389642000001510
S4055,
Figure BDA00024389642000001511
其中Pt+1为第t次迭代后得到的概率转移矩阵,Pt为第t-1次迭代后得到的概率转移矩阵,α为参数,一般取0.4,该参数用于调整Pt
Figure BDA0002438964200000161
所占比例,M是一个n′×n′的矩阵,其中,Mlj=1表示节点pj是节点pl的k个最相似的样本之一,否则,Mlj=0;其中节点pj和节点pl均包括已标记节点和锚点,⊙是Hadamard乘积,
Figure BDA0002438964200000162
表示两个矩阵的对应位置元素相乘组成的新的矩阵,
Figure BDA0002438964200000163
为第t次迭代后得到的样本标记空间的概率转移矩阵,该步骤将第t-1次迭代后得到的概率转移矩阵和
Figure BDA0002438964200000164
矩阵以一定比例相加后得到的矩阵赋值给Pt+1
S4056,重复执行步骤S4052至S4055直到收敛,此时的矩阵Ft即为迭代后的已标记节点和锚点的标签矩阵F*
该实施例具体说明了步骤步骤S405中的迭代求解过程,得到已标记节点和锚点的标签矩阵F*
在另一个实施例中,所述步骤S500中,根据关系矩阵Z*和标签矩阵F*计算未标记样本的标记信息,具体包括:
Figure BDA0002438964200000165
其中,aj表示标签矩阵F*中第j列元素组成的向量,
Figure BDA0002438964200000166
为关系矩阵第i行组成的向量,
Figure BDA0002438964200000167
表示节点pi取得标记信息j的概率,参数λj用于归一化,
Figure BDA0002438964200000168
其中,1T是一个1×n的矩阵,矩阵中所有元素均为1,对于不同的类别j,有其对应的参数λj,l为已标记节点的个数,n为节点总数,argmax代表将当
Figure BDA0002438964200000169
取得最大值时所得的j值赋值给yi,即将标记yi作为节点pi的标记,对所有节点获得标记后即完成数据的分类。
该实施例中,说明了根据关系矩阵Z*和标签矩阵F*计算未标记样本的标记信息的过程,最终对所有节点获得标记后即完成对数据的分类,获得了最终的分类结果,完成了本公开提出的增强的锚点图半监督分类方法ESCAG的全部流程。
以上对本公开提出的增强的锚点图半监督分类方法步骤进行了具体介绍,以下再通过具体实验对比来说明本公开提出的分类方法相比现有的数据分类方法的优越性。
实验
为了说明本公开提出的增强的锚点图半监督分类方法的优越性,分别在像素级数据集和图像级数据集上进行了实验,主要目的在于验证所提出的方法能够降低方法的时间复杂度和空间复杂度,提高方法效率。将本公开提出的ESCAG方法与AGR(核回归)方法和AGR(LAE)方法进行比较,AGR(核回归)方法是利用核回归方法求解关系矩阵Z*,AGR(LAE)方法是利用LAE方法求解关系矩阵Z*
像素级数据分类实验结果
为了测试本公开提出的增强的锚点图半监督分类方法对于像素级数据的分类性能,在Geodesic star-dataset数据集上进行测试。Geodesic star-dataset是一个交互式图像分割数据集,该数据集包含151张图像,其中49张来自GrabCut数据集,99张来自PASCALVOC数据集和3张来自Alpha matting数据集的图片。该数据库中图像具有代表性,有的图像简单易分类,有的图像具有复杂的背景和目标,有的图像背景颜色接近于目标图形,可以充分体现所提方法的优点。
示例图像如图2(a)至图2(h)所示,图2(a)为person7.jpg,图2(b)为Sheep.jpg,图2(c)为388016.jpg,图2(d)为227092.jpg,图2(e)为189080.jpg,图2(f)为Teddy.jpg,图2(g)为banana2.bmp,图2(h)为music.jpg。将本公开ESCAG方法与AGR(核回归)方法和AGR(LAE)方法在图2(a)至图2(h)所示图像上进行比较。分割结果如图3(a)到图10(f)所示。在图3(a)到图10(f)中,图3(a)、图4(a)、图5(a)、图6(a)、图7(a)、图8(a)、图9(a)、图10(a)为原始图像,图3(b)、图4(b)、图5(b)、图6(b)、图7(b)、图8(b)、图9(b)、图10(b)上涂鸦线为已标记像素点,物体外的线为背景像素,物体上的线为待分割目标的像素,图3(c)、图4(c)、图5(c)、图6(c)、图7(c)、图8(c)、图9(c)、图10(c)为标准分割结果图像,图3(d)至图3(f)、图4(d)至图4(f)、图5(d)至图5(f)、图6(d)至图6(f)、图7(d)至图7(f)、图8(d)至图8(f)、图9(d)至图9(f)、图10(d)至图10(f)分别为AGR(核回归)、AGR(LAE)、ESCAG方法得到的图像分割结果。
为了从量化角度比较各个方法的分割效果,像素的分类错误率和方法运行的时间如表1所示,该表中第一列为实验图片,第二列和第三列分别是AGR(核回归)方法和AGR(LAE)方法的实验结果,第四列是本公开提出的ESCAG方法的实验结果,从结果可以看出,除了Sheep.jpg和music.jpg两幅图像以外,本公开提出的ESCAG方法都具有最低的分类错误率。在方法执行时间上,AGR(核回归)的执行时间最短,本公开提出的ESCAG方法的执行时间居中,略高于AGR(核回归)的时间,AGR(LAE)方法的执行时间远远大于另外两种方法。因此,本公开提出的ESCAG方法具有最高分类准确率,在保证分类准确率的情况下,相比而言具有较好的时间性能。
表1图像分割的错误率和执行时间(%/秒)
图片 AGR(核回归) AGR(LAE) ESCAG
Person7.jpg 9.60/15.9043 10.30/277.5916 9.40/18.1013
Sheep.jpg 5.23/6.1289 6.17/143.1793 5.58/18.2267
388016.jpg 3.63/5.9078 3.73/73.9042 3.44/23.0022
227092.jpg 1.75/5.3404 1.74/32.4136 1.70/20.5297
189080.jpg 3.38/5.0340 2.10/45.2084 2.03/18.5609
Teddy.jpg 1.52/3.6332 1.46/31.8552 1.27/13.7847
banana2.bmp 5.46/41.6738 5.31/170.1211 5.14/53.4346
muslc.jpg 3.89/107.6147 3.87/238.8077 3.88/56.2570
图像级数据分类实验结果
为了测试本公开提出的增强的锚点图半监督分类方法对于图像级数据的分类性能,在USPS,MNIST,Letter Recognition数据集上进行图像分类的实验,各数据集的样本数、类别数和特征维度如表2所示。
表2图像数据集列表
USPS MNIST Letter Recognition
样本数 7,291 70,000 20,000
类别数 10 10 26
维度 256 784 16
以上数据集都是现有的数据集,在ImageNet数据库中可以获取。
1.方法性能与已标记样本数量相关性实验
为了验证不同数量已标记样本对方法分类准确率的影响,在锚点数取1000的情况下,在USPS数据集和MNIST数据集上进行分类实验。在每个数据集的每类样本中随机选择10-100个样本作为已标记样本,两个数据集中的样本分别为10类,因此,已标记样本总数为100-1000。
在两个数据集上的分类结果见图11(a)至图11(b),图11(a)为USPS数据集上的分类错误率随已标记样本数量变化的曲线,图11(b)为MNIST数据集上的分类错误率随已标记样本数量变化的曲线。随着已标记样本数的增加,在两个数据集上,AGR(核回归)方法的分类错误率都快速下降,而AGR(LAE)和本公开提出的ESCAG方法的分类错误率没有明显的变化,说明AGR(核回归)方法性能受已标记样本数量的影响很大,AGR(LAE)和本公开提出的ESCAG方法几乎不受已标记样本数量的影响。AGR(核回归)方法的错误率远高于另外两种方法。AGR(LAE)和ESCAG方法在已标记样本数为100时,即可取得较低的分类错误率,其中本公开提出的ESCAG方法的错误率低于AGR(LAE)方法。因此,针对已标记样本数量的变化,本公开提出的增强的锚点图半监督分类方法在分类准确率上优于其它两种方法,对已标记样本数量要求较少。
在USPS数据集和MNIST数据集上,分类方法的执行时间如图12(a)至图12(b)所示,图12(a)为USPS数据集上执行时间随已标记样本数量变化的曲线,图12(b)为MNIST数据集上执行时间随已标记样本数量变化的曲线。随着已标记样本数量的增加,在USPS数据集和MNIST数据集上,三种方法的执行时间基本没有明显的变化,只有AGR(LAE)方法的执行时间会有少数的明显波动,因此,基于锚点的方法的执行时间受已标记样本数量的影响较小。AGR(LAE)执行时间最长,明显高于AGR(核回归)方法和本公开提出的ESCAG方法执行时间,其中AGR(核回归)方法的执行时间略低于本公开提出的ESCAG方法。
计算上述三种方法在MNIST数据集上,随已标记样本数量变化的分类错误率平均值和执行时间平均值,结果如表3所示。由图11(b)和图12(b)可知,在MNIST数据集上,随已标记样本数量变化的分类错误率平均值和执行时间平均值与表3具有类似的趋势。如表3所示,第一列为平均分类错误率,第二列为平均执行时间。从结果可以看出,AGR(核回归)方法的平均执行时间最短,但平均分类错误远高于另外两种方法。AGR(LAE)方法的平均分类错误率较低,与本公开提出的ESCAG方法的平均错误率差别不大,但是平均执行时间远高于其它两种方法。本公开提出的ESCAG方法平均分类错误率最低,并远低于AGR(核回归)方法的错误率,平均执行时间居中,略高于AGR(核回归)方法,但远低于AGR(LAE)方法。因此,本公开提出的ESCAG方法可较好地兼顾分类准确率和分类效率,在分类有效性和分类效率上达到平衡。
表3在已标记样本数量变化时,MNIST数据集上的平均分类错误率和执行时间
平均分类错误率 平均执行时间
AGR(核回归) 48.529(最高) 3.06682(最短)
AGR(LAE) 7.726(居中) 120.50861(最长)
ESCAG(本公开提出) 7.047(最低) 7.05083(居中)
2.方法性能与锚点数量相关性实验
为了验证不同数量锚点对方法分类准确率的影响,在USPS数据集、MNIST数据集和Letter Recognition数据集上进行实验。根据图11(a)至12(b)所示的实验结果,在USPS数据集和MNIST数据集中,从每类样本中随机选择50个样本作为已标记样本,每个数据集的已标记样本总数为500个。在Letter Recognition数据集上,从每类样本中随机选择10个样本作为已标记样本,已标记样本总数为260个。锚点数选取100-3000,分类结果随锚点数变化的曲线如图13(a)至图13(c)所示,图13(a)为USPS数据集上分类错误率随锚点数量变化的曲线,图13(b)为MNIST数据集上分类错误率随锚点数量变化的曲线,图13(c)为LetterRecognition数据集上分类错误率随锚点数量变化的曲线。在USPS数据集和MNIST数据集上,当锚点数超过400之后,随着锚点数量的增加,AGR(核回归)方法的错误率迅速增加。在Letter Recognition数据集上,当锚点数在100-400之间时,AGR(核回归)方法的错误率迅速增加接近最大值,之后错误率变化平缓。由图13(a)至图13(c)可以看出,AGR(LAE)方法和本公开提出的ESCAG方法随着锚点数的增加,分类错误率基本呈下降趋势,但变化平缓。在USPS数据集和MNIST数据集上,当锚点数超过400之后,AGR(LAE)方法和本公开提出的ESCAG方法的分类错误率远低于AGR(核回归)方法,在LetterRecognition数据集上,除锚点数等于100的情况外,AGR(LAE)方法和本公开提出的ESCAG方法的分类错误率明显低于AGR(核回归)方法。其中,在三个数据集上,随着锚点数的变化,本公开提出的ESCAG方法的分类错误率基本上保持最低。
三种方法的执行时间随锚点数量变化的趋势如图14(a)至图14(c)所示,图14(a)为USPS数据集上执行时间随锚点数量变化的曲线,图14(b)为MNIST数据集上执行时间随锚点数量变化的曲线,图14(c)为Letter Recognition数据集上执行时间随锚点数量变化的曲线。随着锚点数量的增加,三种方法的执行时间都呈上升趋势。AGR(LAE)方法的执行时间最长,其次为本公开提出的ESCAG方法,AGR(核回归)方法用时最短,并且AGR(LAE)方法的执行时间远远超过另外两种方法的执行时间。因此,本公开提出的ESCAG方法可较好地兼顾分类准确率和分类效率,在分类有效性和分类效率上达到平衡。
尽管以上结合附图对本发明的实施方案进行了描述,但本发明并不局限于上述的具体实施方案和应用领域,上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。

Claims (9)

1.一种增强的锚点图半监督分类方法,包括:
S100、准备数据集,所述数据集包括已标记数据
Figure DEST_PATH_IMAGE001
和未标记数据集
Figure 825001DEST_PATH_IMAGE002
两部分,已标记数据集
Figure DEST_PATH_IMAGE003
的标记信息为
Figure 718002DEST_PATH_IMAGE004
,数据集中数据的特征通过数据属性信息来描述,
Figure DEST_PATH_IMAGE005
表示已标记数据的个数,将数据集中的所有数据抽象为
Figure 9306DEST_PATH_IMAGE006
维空间上的
Figure DEST_PATH_IMAGE007
个节点,其中第
Figure 142520DEST_PATH_IMAGE008
个节点表示为
Figure DEST_PATH_IMAGE009
S200、对步骤S100中准备的数据集采用锚点提取方法提取
Figure 544682DEST_PATH_IMAGE010
个锚点,得到锚点集
Figure DEST_PATH_IMAGE011
S300、根据步骤S200中得到的锚点集
Figure 321883DEST_PATH_IMAGE011
,使用基于锚点的概率近邻方法建立锚点集
Figure 846405DEST_PATH_IMAGE011
中的锚点或已标记数据集
Figure 538418DEST_PATH_IMAGE003
中的节点二者中任一与数据集中其他节点之间的关系,得到关系矩阵
Figure 947533DEST_PATH_IMAGE012
,关系矩阵
Figure 736498DEST_PATH_IMAGE012
是一个
Figure DEST_PATH_IMAGE013
的矩阵,
Figure 743506DEST_PATH_IMAGE014
代表锚点集
Figure 188394DEST_PATH_IMAGE011
中的锚点或已标记数据集
Figure 994676DEST_PATH_IMAGE003
中的节点
Figure DEST_PATH_IMAGE015
二者中任一与数据集中其他节点
Figure 982354DEST_PATH_IMAGE016
之间的相似度,具体为:
Figure DEST_PATH_IMAGE017
其中,
Figure 753739DEST_PATH_IMAGE014
代表
Figure 420344DEST_PATH_IMAGE015
Figure 30317DEST_PATH_IMAGE016
之间的相似度,
Figure 731556DEST_PATH_IMAGE015
表示锚点集
Figure 378569DEST_PATH_IMAGE011
中的锚点或已标记数据集
Figure 125946DEST_PATH_IMAGE003
中的节点,
Figure 710248DEST_PATH_IMAGE016
表示数据集中的其他节点,
Figure 203678DEST_PATH_IMAGE018
表示
Figure 83909DEST_PATH_IMAGE015
Figure 53002DEST_PATH_IMAGE016
之间的距离,
Figure DEST_PATH_IMAGE019
表示
Figure 581941DEST_PATH_IMAGE015
Figure 320090DEST_PATH_IMAGE016
的第
Figure 574485DEST_PATH_IMAGE019
个近邻,
Figure 702978DEST_PATH_IMAGE020
为参数,其表示节点
Figure 458445DEST_PATH_IMAGE016
连接距离其最近的
Figure 926466DEST_PATH_IMAGE020
个已标记样本点或锚点作为该节点的近邻;
S400、将步骤S200中得到的锚点集
Figure 912614DEST_PATH_IMAGE011
中的锚点和已标记数据集
Figure 590720DEST_PATH_IMAGE003
中的节点作为节点构造图结构,利用扩展的标签传播(ELP)方法进行标签传播,具体为:
S401、根据已标记数据集的标记信息
Figure 759665DEST_PATH_IMAGE004
和锚点的标记信息建立初始的标签矩阵
Figure DEST_PATH_IMAGE021
Figure 410089DEST_PATH_IMAGE022
标签矩阵
Figure 68603DEST_PATH_IMAGE021
是一个
Figure DEST_PATH_IMAGE023
的矩阵,其中
Figure 811169DEST_PATH_IMAGE024
为已标记节点和锚点的总数,
Figure DEST_PATH_IMAGE025
为标记的类别数,
Figure 49384DEST_PATH_IMAGE026
表示锚点的标记信息,初始为0;若已标记数据集和锚点集的节点
Figure 288735DEST_PATH_IMAGE015
的标记为
Figure DEST_PATH_IMAGE027
,则
Figure 85528DEST_PATH_IMAGE028
,否则
Figure DEST_PATH_IMAGE029
,其中
Figure 941488DEST_PATH_IMAGE030
表示标签矩阵
Figure 452235DEST_PATH_IMAGE021
Figure DEST_PATH_IMAGE031
行第
Figure 77251DEST_PATH_IMAGE027
列的元素;
S402、根据锚点和已标记数据集中的节点的属性信息将其抽象为
Figure 576104DEST_PATH_IMAGE006
维空间上的
Figure 591464DEST_PATH_IMAGE032
个节点,由
Figure 764956DEST_PATH_IMAGE032
个节点组成图,计算图中节点间的欧式距离,得到距离矩阵
Figure DEST_PATH_IMAGE033
,距离矩阵
Figure 385425DEST_PATH_IMAGE033
是一个
Figure 618960DEST_PATH_IMAGE034
的二维矩阵,
Figure DEST_PATH_IMAGE035
表示矩阵中第
Figure 823414DEST_PATH_IMAGE005
行第
Figure 66177DEST_PATH_IMAGE031
列的值,存储图中节点
Figure 337889DEST_PATH_IMAGE036
和节点
Figure 680009DEST_PATH_IMAGE015
之间的欧氏距离,其中
Figure 263437DEST_PATH_IMAGE036
Figure 480529DEST_PATH_IMAGE015
都包括已标记数据集中的节点和锚点集中的锚点;
S403、根据步骤S402中得到的距离矩阵
Figure 872328DEST_PATH_IMAGE033
选择每个节点的近邻并定义权值矩阵
Figure DEST_PATH_IMAGE037
,权值矩阵
Figure 650928DEST_PATH_IMAGE037
是一个
Figure 597018DEST_PATH_IMAGE034
的矩阵,其中
Figure 352222DEST_PATH_IMAGE038
用来描述节点
Figure 723161DEST_PATH_IMAGE036
和节点
Figure 344766DEST_PATH_IMAGE015
之间的相似度,即权值矩阵
Figure 106049DEST_PATH_IMAGE037
Figure 228725DEST_PATH_IMAGE005
行第
Figure 329537DEST_PATH_IMAGE031
列的值;
S404、根据步骤S403中的权值矩阵
Figure 682895DEST_PATH_IMAGE037
定义概率转移矩阵
Figure DEST_PATH_IMAGE039
,概率转移矩阵
Figure 134736DEST_PATH_IMAGE039
是一个
Figure 733208DEST_PATH_IMAGE034
的矩阵,其中
Figure 78739DEST_PATH_IMAGE040
是概率转移矩阵
Figure 42147DEST_PATH_IMAGE039
Figure 10977DEST_PATH_IMAGE005
行第
Figure 741036DEST_PATH_IMAGE031
列的值,用来描述标签信息从节点
Figure 550860DEST_PATH_IMAGE036
传播到节点
Figure 747486DEST_PATH_IMAGE015
的概率,即节点
Figure 767395DEST_PATH_IMAGE015
获取节点
Figure 973248DEST_PATH_IMAGE036
的标签信息的概率;
S405、根据步骤S401中的标签矩阵
Figure 136114DEST_PATH_IMAGE021
和步骤S404中的概率转移矩阵
Figure 831538DEST_PATH_IMAGE039
迭代求解得到锚点的标记信息,锚点的标记信息和已标记节点的标记信息共同组成迭代后的标签矩阵
Figure DEST_PATH_IMAGE041
,标签矩阵
Figure 682950DEST_PATH_IMAGE041
是一个
Figure 161336DEST_PATH_IMAGE023
的矩阵,
Figure 70386DEST_PATH_IMAGE042
表示矩阵中第
Figure DEST_PATH_IMAGE043
行第
Figure 349812DEST_PATH_IMAGE031
列的元素;
S500、根据步骤S300中得到的关系矩阵
Figure 344313DEST_PATH_IMAGE012
和步骤S400中得到的标签矩阵
Figure 829652DEST_PATH_IMAGE041
进行标签传播得到最终的分类结果;
其中,所述步骤S200中,若数据集为像素级,则对像素级数据采用的锚点提取方法为超像素分割(SLIC)方法,具体为:
S211,将图像细分成多个图像子区域,即图中的网格,每个图像子区域为一个聚类,其大小是
Figure 265313DEST_PATH_IMAGE044
Figure DEST_PATH_IMAGE045
,其中
Figure 207599DEST_PATH_IMAGE007
为像素个数即数据集中的节点个数,
Figure 361499DEST_PATH_IMAGE010
为锚点个数,初始时,选定每个网格中心的节点作为聚类中心,相邻两个聚类中心之间的距离为
Figure 775163DEST_PATH_IMAGE046
S212,以步骤S211中选定的聚类中心为中心,在
Figure DEST_PATH_IMAGE047
的邻域内重新选择聚类中心,具体为,移动聚类中心到该邻域内梯度值最低的位置,梯度值低表示此处的像素样本点相似度高,为每个像素点
Figure 206276DEST_PATH_IMAGE048
设置距离
Figure DEST_PATH_IMAGE049
Figure 585042DEST_PATH_IMAGE050
表示像素点
Figure 226239DEST_PATH_IMAGE048
到其所在聚类的聚类中心的距离;
S213,对步骤S212得到的每一个聚类中心遍历其
Figure DEST_PATH_IMAGE051
的邻域内的每一个像素点,计算邻域内的每个像素点
Figure 584539DEST_PATH_IMAGE048
和聚类中心之间的距离
Figure 994792DEST_PATH_IMAGE052
,若
Figure DEST_PATH_IMAGE053
,则
Figure 278880DEST_PATH_IMAGE054
,并将该像素点
Figure 407373DEST_PATH_IMAGE048
划分到该聚类中心所在的聚类中;
S214,重复步骤S213直到每个像素点的聚类中心达到收敛,则此时所有的聚类中心作为提取的锚点集合
Figure 897261DEST_PATH_IMAGE011
2.根据权利要求1所述的方法,所述步骤S200中,若数据集为图像级,则对图像级数据分类采用的锚点提取方法为K均值聚类(K-Means)方法,具体为:
S221,图像级数据中每幅图像作为一个数据点,随机选取
Figure 427599DEST_PATH_IMAGE010
个数据点作为初始的聚类中心;
S222,计算其他数据点与各个聚类中心的距离,并根据最小的距离对相应的数据点进行划分,即对于每个数据点来说,将其划分进距离其最近的聚类中心所在的聚类;
S223,计算每个聚类的均值并根据均值选择新的聚类中心,并选择均值最低的作为新的聚类中心,若聚类中心收敛,则方法终止,否则重复执行S222、S223,最终得到的所有聚类中心即为锚点集合
Figure 852895DEST_PATH_IMAGE011
3.根据权利要求1所述的方法,所述步骤S401中,
Figure 531001DEST_PATH_IMAGE004
为已标记节点的标记信息矩阵,具体定义为:
Figure DEST_PATH_IMAGE055
其中
Figure 401743DEST_PATH_IMAGE056
是矩阵
Figure 786588DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE057
行第
Figure 913944DEST_PATH_IMAGE027
列的值,它表示对于已标记数据集中的节点
Figure 249985DEST_PATH_IMAGE058
,如果它的标记信息为
Figure 347254DEST_PATH_IMAGE027
,则
Figure DEST_PATH_IMAGE059
,否则
Figure 993130DEST_PATH_IMAGE060
Figure DEST_PATH_IMAGE061
是节点
Figure 291388DEST_PATH_IMAGE058
的标记;
Figure 849146DEST_PATH_IMAGE026
为锚点的标记信息矩阵,矩阵
Figure 422210DEST_PATH_IMAGE026
的取值范围为:
Figure 109543DEST_PATH_IMAGE062
其中
Figure DEST_PATH_IMAGE063
是矩阵
Figure 250805DEST_PATH_IMAGE026
Figure 390800DEST_PATH_IMAGE064
行第
Figure 938193DEST_PATH_IMAGE027
列的值,它表示对于锚点
Figure DEST_PATH_IMAGE065
,如果它的标记信息为
Figure 417716DEST_PATH_IMAGE027
,则
Figure 588935DEST_PATH_IMAGE066
,否则
Figure DEST_PATH_IMAGE067
Figure 357170DEST_PATH_IMAGE005
为已标记数据集中的节点个数,
Figure 770572DEST_PATH_IMAGE068
为锚点和已标记节点的总数,初始时
Figure DEST_PATH_IMAGE069
4.根据权利要求1所述的方法,所述步骤S402中,图中节点
Figure 979968DEST_PATH_IMAGE036
和节点
Figure 56508DEST_PATH_IMAGE015
之间的欧式距离为:
Figure 171094DEST_PATH_IMAGE070
其中
Figure 591449DEST_PATH_IMAGE006
表示数据的维度,
Figure 576723DEST_PATH_IMAGE036
Figure 293006DEST_PATH_IMAGE015
表示图中的第
Figure 566993DEST_PATH_IMAGE005
Figure 885978DEST_PATH_IMAGE031
个节点,包括已标记节点和锚点,
Figure DEST_PATH_IMAGE071
Figure 568501DEST_PATH_IMAGE072
分别是节点
Figure 580320DEST_PATH_IMAGE036
Figure 544865DEST_PATH_IMAGE015
Figure DEST_PATH_IMAGE073
维的坐标,根据节点间的欧氏距离生成距离矩阵
Figure 605225DEST_PATH_IMAGE033
5.根据权利要求1所述的方法,所述步骤S403中,根据距离矩阵
Figure 706036DEST_PATH_IMAGE033
,使用kNN方法选择近邻,具体的:对于图中的每个节点,选择距离其最近的
Figure 324974DEST_PATH_IMAGE074
个节点作为该节点的近邻,根据选择的近邻生成邻接矩阵
Figure DEST_PATH_IMAGE075
Figure 776815DEST_PATH_IMAGE075
是一个
Figure 375286DEST_PATH_IMAGE076
的矩阵,邻接矩阵
Figure 720817DEST_PATH_IMAGE075
中,若
Figure 684225DEST_PATH_IMAGE015
Figure 653056DEST_PATH_IMAGE036
的近邻,则矩阵中相应位置
Figure DEST_PATH_IMAGE077
的值为1,否则为0,
Figure 524060DEST_PATH_IMAGE077
表示邻接矩阵
Figure 396201DEST_PATH_IMAGE075
中第
Figure 920723DEST_PATH_IMAGE005
行第
Figure 815998DEST_PATH_IMAGE031
列的值,
Figure 254807DEST_PATH_IMAGE036
Figure 309351DEST_PATH_IMAGE015
均包括已标记节点和锚点。
6.根据权利要求5所述的方法,所述步骤S403中还包括,根据邻接矩阵
Figure 880141DEST_PATH_IMAGE075
和距离矩阵
Figure 325028DEST_PATH_IMAGE033
定义权值矩阵
Figure 131310DEST_PATH_IMAGE037
,具体为:
Figure 915727DEST_PATH_IMAGE078
时,
Figure DEST_PATH_IMAGE079
Figure 483849DEST_PATH_IMAGE080
时,
Figure DEST_PATH_IMAGE081
Figure 556979DEST_PATH_IMAGE082
是自然底数。
7.根据权利要求1所述的方法,所述步骤S404中样本特征空间的概率转移矩阵
Figure 166951DEST_PATH_IMAGE039
,具体为:
Figure DEST_PATH_IMAGE083
8.根据权利要求1所述的方法,所述步骤S405中的迭代求解具体为:
S4051,
Figure 507672DEST_PATH_IMAGE084
Figure DEST_PATH_IMAGE085
,其中
Figure 951423DEST_PATH_IMAGE086
为初始的标签矩阵,
Figure DEST_PATH_IMAGE087
为初始的样本特征空间的概率转移矩阵;
S4052,
Figure 636482DEST_PATH_IMAGE088
,其中
Figure DEST_PATH_IMAGE089
为第
Figure 385168DEST_PATH_IMAGE006
次迭代后得到的标签矩阵,
Figure 3231DEST_PATH_IMAGE090
为第
Figure DEST_PATH_IMAGE091
次迭代后得到的概率转移矩阵,
Figure 289987DEST_PATH_IMAGE092
为第
Figure 665604DEST_PATH_IMAGE091
次迭代后得到的标签矩阵,该步骤将第
Figure 617380DEST_PATH_IMAGE091
次迭代得到的概率转移矩阵和标签矩阵的乘积赋值给
Figure 995009DEST_PATH_IMAGE089
S4053,
Figure DEST_PATH_IMAGE093
,其中
Figure 842880DEST_PATH_IMAGE094
为第
Figure 909056DEST_PATH_IMAGE006
次迭代后得到的已标记节点的标记信息矩阵,
Figure DEST_PATH_IMAGE095
为初始的标记信息矩阵,该步骤将初始的标记信息矩阵赋值给
Figure 602205DEST_PATH_IMAGE094
,目的是保证初始的标记信息不会改变;
S4054,
Figure 365500DEST_PATH_IMAGE096
,其中
Figure DEST_PATH_IMAGE097
为样本标记空间的概率转移矩阵,Nor表示对矩阵的归一化,
Figure 321954DEST_PATH_IMAGE098
表达的是类别标签之间的相关性,即,如果
Figure 141006DEST_PATH_IMAGE036
Figure 106688DEST_PATH_IMAGE015
属于同类样本,则
Figure 819429DEST_PATH_IMAGE098
的第
Figure 914162DEST_PATH_IMAGE005
行第
Figure 17247DEST_PATH_IMAGE031
列元素为1,否则为0,该步骤将第
Figure 114516DEST_PATH_IMAGE091
次迭代后得到的标签矩阵与其转置矩阵相乘后的矩阵归一化后赋值给
Figure 557130DEST_PATH_IMAGE097
S4055,
Figure DEST_PATH_IMAGE099
,其中
Figure 652125DEST_PATH_IMAGE100
为第
Figure 678724DEST_PATH_IMAGE006
次迭代后得到的概率转移矩阵,
Figure 251788DEST_PATH_IMAGE090
为第
Figure 673542DEST_PATH_IMAGE091
次迭代后得到的概率转移矩阵,
Figure DEST_PATH_IMAGE101
为参数,一般取0.4,该参数用于调整
Figure 814804DEST_PATH_IMAGE090
Figure 689220DEST_PATH_IMAGE102
所占比例,
Figure DEST_PATH_IMAGE103
是一个
Figure 971034DEST_PATH_IMAGE076
的矩阵,其中,
Figure 247295DEST_PATH_IMAGE104
表示节点
Figure 621775DEST_PATH_IMAGE015
是节点
Figure 921170DEST_PATH_IMAGE036
Figure 163932DEST_PATH_IMAGE074
个最相似的样本之一,否则,
Figure DEST_PATH_IMAGE105
;其中节点
Figure 606284DEST_PATH_IMAGE015
和节点
Figure 276299DEST_PATH_IMAGE036
均包括已标记节点和锚点,
Figure 266252DEST_PATH_IMAGE106
是Hadamard乘积,
Figure 453651DEST_PATH_IMAGE102
表示两个矩阵的对应位置元素相乘组成的新的矩阵,
Figure 970083DEST_PATH_IMAGE097
为第
Figure 184901DEST_PATH_IMAGE006
次迭代后得到的样本标记空间的概率转移矩阵,该步骤将第
Figure 458888DEST_PATH_IMAGE091
次迭代后得到的概率转移矩阵和
Figure 777874DEST_PATH_IMAGE102
矩阵以一定比例相加后得到的矩阵赋值给
Figure 820916DEST_PATH_IMAGE100
S4056,重复执行步骤S4052至S4055直到收敛,此时的矩阵
Figure 708101DEST_PATH_IMAGE092
即为迭代后的已标记节点和锚点的标签矩阵
Figure 266121DEST_PATH_IMAGE041
9.根据权利要求1所述的方法,所述步骤S500中,根据关系矩阵
Figure 28278DEST_PATH_IMAGE012
和标签矩阵
Figure 925827DEST_PATH_IMAGE041
计算未标记样本的标记信息,具体包括:
Figure DEST_PATH_IMAGE107
其中,
Figure 46230DEST_PATH_IMAGE108
表示标签矩阵
Figure DEST_PATH_IMAGE109
中第
Figure 934289DEST_PATH_IMAGE110
列元素组成的向量,
Figure DEST_PATH_IMAGE111
为关系矩阵第
Figure 798340DEST_PATH_IMAGE112
行组成的向量,
Figure DEST_PATH_IMAGE113
表示节点
Figure 19237DEST_PATH_IMAGE016
取得标记信息
Figure 310541DEST_PATH_IMAGE031
的概率,参数
Figure 217055DEST_PATH_IMAGE114
用于归一化,
Figure DEST_PATH_IMAGE115
,其中,
Figure 353638DEST_PATH_IMAGE116
是一个
Figure DEST_PATH_IMAGE117
的矩阵,矩阵中所有元素均为1,对于不同的类别
Figure 225779DEST_PATH_IMAGE031
,有其对应的参数
Figure 687985DEST_PATH_IMAGE114
Figure 347374DEST_PATH_IMAGE118
为已标记节点的个数,
Figure DEST_PATH_IMAGE119
为节点总数,
Figure 553227DEST_PATH_IMAGE120
代表将当
Figure DEST_PATH_IMAGE121
取得最大值时所得的
Figure 748716DEST_PATH_IMAGE110
值赋值给
Figure 381823DEST_PATH_IMAGE122
,即将标记
Figure 997350DEST_PATH_IMAGE122
作为节点
Figure 69211DEST_PATH_IMAGE016
的标记,对所有节点获得标记后即完成数据的分类。
CN202010263894.9A 2020-04-03 2020-04-03 增强的锚点图半监督分类方法 Active CN111488923B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010263894.9A CN111488923B (zh) 2020-04-03 2020-04-03 增强的锚点图半监督分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010263894.9A CN111488923B (zh) 2020-04-03 2020-04-03 增强的锚点图半监督分类方法

Publications (2)

Publication Number Publication Date
CN111488923A CN111488923A (zh) 2020-08-04
CN111488923B true CN111488923B (zh) 2023-02-07

Family

ID=71811638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010263894.9A Active CN111488923B (zh) 2020-04-03 2020-04-03 增强的锚点图半监督分类方法

Country Status (1)

Country Link
CN (1) CN111488923B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113920346B (zh) * 2021-07-05 2024-03-01 西北工业大学 基于锚点孪生图自动编码器的大规模图像聚类方法
CN115115923B (zh) * 2022-07-18 2024-04-09 北京有竹居网络技术有限公司 模型训练方法、实例分割方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160351A (zh) * 2015-08-12 2015-12-16 西安电子科技大学 基于锚点稀疏图的半监督高光谱分类方法
CN107590507A (zh) * 2017-08-23 2018-01-16 西安电子科技大学 基于空间约束的快速更新图的半监督极化sar图像分类方法
CN108830301A (zh) * 2018-05-28 2018-11-16 温州大学苍南研究院 基于锚图结构的双拉普拉斯正则化的半监督数据分类方法
CN109815986A (zh) * 2018-12-24 2019-05-28 陕西师范大学 融合局部与全局特征的半监督分类方法
CN109829472A (zh) * 2018-12-24 2019-05-31 陕西师范大学 基于概率近邻的半监督分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717354B (zh) * 2018-07-11 2023-05-12 哈尔滨工业大学 基于半监督k-svd与多尺度稀疏表示的超像元分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160351A (zh) * 2015-08-12 2015-12-16 西安电子科技大学 基于锚点稀疏图的半监督高光谱分类方法
CN107590507A (zh) * 2017-08-23 2018-01-16 西安电子科技大学 基于空间约束的快速更新图的半监督极化sar图像分类方法
CN108830301A (zh) * 2018-05-28 2018-11-16 温州大学苍南研究院 基于锚图结构的双拉普拉斯正则化的半监督数据分类方法
CN109815986A (zh) * 2018-12-24 2019-05-28 陕西师范大学 融合局部与全局特征的半监督分类方法
CN109829472A (zh) * 2018-12-24 2019-05-31 陕西师范大学 基于概率近邻的半监督分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于锚点建图的半监督分类在遥感图像中的应用;童佳楠;《现代电子技术》;20161115(第22期);全文 *

Also Published As

Publication number Publication date
CN111488923A (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
CN108132968B (zh) 网络文本与图像中关联语义基元的弱监督学习方法
Ouali et al. Autoregressive unsupervised image segmentation
Duchenne et al. Segmentation by transduction
CN110866896B (zh) 基于k-means与水平集超像素分割的图像显著性目标检测方法
Liu et al. Adaptive spatial pooling for image classification
Myeong et al. Learning object relationships via graph-based context model
CN110969086B (zh) 一种基于多尺度cnn特征及量子菌群优化kelm的手写图像识别方法
CN110263855B (zh) 一种利用共基胶囊投影进行图像分类的方法
CN109033978B (zh) 一种基于纠错策略的cnn-svm混合模型手势识别方法
CN106874862B (zh) 基于子模技术和半监督学习的人群计数方法
CN110188827B (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
CN111488923B (zh) 增强的锚点图半监督分类方法
Khanykov et al. Image segmentation improvement by reversible segment merging
CN114299362A (zh) 一种基于k-means聚类的小样本图像分类方法
CN112766400A (zh) 高维数据基于多个数据变换空间的半监督分类集成方法
CN116188900A (zh) 一种基于全局和局部特征增广的小样本图像分类方法
Jiu et al. DHCN: Deep hierarchical context networks for image annotation
CN114492581A (zh) 基于迁移学习和注意力机制元学习应用在小样本图片分类的方法
CN111259938B (zh) 基于流形学习和梯度提升模型的图片偏多标签分类方法
Jaffel et al. A symbiotic organisms search algorithm for feature selection in satellite image classification
Bahroun et al. Building efficient deep hebbian networks for image classification tasks
Sotiropoulos Handling variable shaped & high resolution images for multi-class classification problem
Madokoro et al. Adaptive Category Mapping Networks for all-mode topological feature learning used for mobile robot vision
Deepan et al. Comparative analysis of scene classification methods for remotely sensed images using various convolutional neural network
CN115731137A (zh) 一种基于A-EdgeConv的室外大场景点云分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant