CN117710745A - 一种基于证据多视角核化的目标分类方法及装置 - Google Patents
一种基于证据多视角核化的目标分类方法及装置 Download PDFInfo
- Publication number
- CN117710745A CN117710745A CN202311776800.8A CN202311776800A CN117710745A CN 117710745 A CN117710745 A CN 117710745A CN 202311776800 A CN202311776800 A CN 202311776800A CN 117710745 A CN117710745 A CN 117710745A
- Authority
- CN
- China
- Prior art keywords
- image
- classified
- class
- trust value
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000006911 nucleation Effects 0.000 title claims description 9
- 238000010899 nucleation Methods 0.000 title claims description 9
- 238000004590 computer program Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000000926 separation method Methods 0.000 claims description 14
- 239000002131 composite material Substances 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 6
- 238000005065 mining Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000005025 nuclear technology Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000132092 Aster Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于证据多视角核化的目标分类方法及装置,获取待分类图像集对应于不同图像属性的特征信息,以及待分类图像集对应的图像类别数量;初始化每个待分类图像在不同图像属性中与每个图像类别的相似度,并基于相似度计算待分类图像在不同图像属性中属于每个图像类别的信任值;根据信任值计算图像属性的属性权重;以属性权重、信任值和相似度计算待分类图像的分类误差,当分类误差变化量小于等于误差阈值时,基于信任值确定待分类图像集中待分类图像的类别;本发明通过结合不同图像属性对图像分类的影响,可以提升图像分类精度。
Description
技术领域
本发明属于图像分类技术领域,尤其涉及一种基于证据多视角核化的目标分类方法及装置。
背景技术
随着传感器、互联网和存储设备的快速发展,一个图像可以由一系列不同特征来描述,包括颜色、直方图、纹理等等。如何对这些具有多个视角特征的图像进行聚类获得了大量的关注,被广泛应用于医疗诊断、自动驾驶等领域。
目前已经出现了一些基于证据推理的聚类方法的研究,称为证据聚类。它们通过将证据推理应用于图像聚类中,可以实现聚类不精确性的表征。在聚类问题中,证据推理辨识框架中的元素一般被认为三类:单类,复合类和噪声类。其中,只包含一个元素的集合被称之为单类,例如w1等;对应的,包含超过一个元素的集合被称为复合类,例如{w1,w2}等。特别的,复合类也被视为一个单独的类,可以理解为这些包含的单类之间的过渡类。空集一般被用来表示噪声类。在广义框架证据聚类中,图像被允许以不同的信任值(mass)分配给相应的类以表征不确定性,m(·)表示图像对某个类的信任值,对于每一个目标,确A表示图像类别。当图像被分配到复合类时,表明该图像在局部具有不精确性(不可分辨性),根据当前信息不能将图像准确划分给一个单类,但目标有可能属于该复合类包含的任意一个单类。
但是,证据聚类方法只能在单视角图像中实现聚类的不精确性表征,无法对多视角图像进行跨视角信息分析和融合,因此这些方法无法应用于多视角聚类,或是在多视角数据中聚类结果的准确性很低。
发明内容
本发明的目的是提供一种基于证据多视角核化的目标分类方法及装置,以对具有多个属性的图像进行跨属性分析和融合,提升多视角图像分类的准确性。
本发明采用以下技术方案:一种基于证据多视角核化的目标分类方法,包括以下步骤:
获取待分类图像集对应于不同图像属性的特征信息,以及待分类图像集对应的图像类别数量;
初始化每个待分类图像在不同图像属性中与每个图像类别的相似度,并基于相似度计算待分类图像在不同图像属性中属于每个图像类别的信任值;
根据信任值计算图像属性的属性权重;
以属性权重、信任值和相似度计算待分类图像的分类误差,当分类误差变化量小于等于误差阈值时,基于信任值确定待分类图像集中待分类图像的类别。
进一步地,当分类误差变化量大于误差阈值时,基于信任值更新相似度,继续计算。
进一步地,分类误差计算方法为:
其中,Q表示图像属性的数量,q∈{1,2,...,Q},aq表示第q个图像属性的属性权重,N表示待分类图像的数量,i∈{1,2,...,N},s∈{1,2,...,N},k∈{1,2,...,N},C表示图像类别数量,j∈{1,2,...,C},表示在第q个图像属性中第i个图像属于第j个图像类别的信任值,β表示信任值和相似度之间的关联因子,/>表示在第q个图像属性中第i个图像与第j个图像类别的相似度,θ表示图像属性和属性权重之间的相关因子,/>表示第q个图像属性中第s个图像与第k个图像之间的相似度,η表示不同图像属性的属性权重的差异因子。
进一步地,基于相似度计算待分类图像在不同图像属性中属于每个图像类别的信任值包括:
进一步地,基于信任值确定待分类图像集中待分类图像的类别包括:
选择待分类图像在不同图像属性中的信任值中的最大信任值;
当不存在使成立的信任值时,将待分类图像划分为最大信任值对应的图像类别;其中,Belimax表示待分类图像i的最大信任值,Belij表示待分类图像i对图像类别中第j个单类的信任值,/>表示信任值差距阈值。
进一步地,当存在使成立的信任值时:
对待分类图像进行再分类。
进一步地,对待分类图像进行再分类包括:
选择使成立的图像单类,并构建再分类图像类别集合;
基于再分类图像类别集合为进行再分类的待分类图像进行分类。
进一步地,基于再分类图像类别集合为进行再分类的待分类图像进行分类包括:
基于相似度计算待分类图像与再分类图像类别集合中每个图像类别的第二相似度;
在不同图像属性中基于相似度计算再分类图像类别集合中每个图像类别的分离度;
根据分离度和第二相似度计算再分类图像在不同图像属性中对于不同图像类别的第二信任值;
根据第二信任值确定再分类图像的图像类别。
进一步地,根据第二信任值确定再分类图像的图像类别包括:
其中,μij′表示第i个图像属于第j′个图像类别的第二信任值,表示在第q个图像属性中第i个图像属于第j′个图像类别的第二信任值,/>表示在第q个图像属性中第j′个图像类别的归一化分离度。
本发明的另一种技术方案:一种基于证据多视角核化的目标分类装置,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的方法。
本发明的有益效果是:本发明通过提取图像在不同图像属性中的特征信息,并基于该特征信息计算图像对于每个图像类别的信任值和属性权重,最后结合信任值和对应的属性权重计算图像分类误差,当分类误差预设要求时,确定对应的图像类别;本发明通过结合不同图像属性对图像分类的影响,可以提升图像分类精度。
附图说明
图1为图像类别为球形分布的示意图;
图2为图像类别为非球形分布的示意图;
图3为本发明实施例中的聚类方法原理图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
传统的证据聚类方法除了上述的问题外,广义框架带来极高的计算复杂度,导致证据聚类难以用于大规模数据中;最后,已有证据聚类以挖掘数据的线性特征为主,因此仅能在球形分布数据中获得较好的结果(如图1所示),无法应用于非球形分布数据(如图2所示)。由于多视角图像在各个视角下的图像属性信息具有一定的相关性,现有的证据聚类方法由于仅仅应用于单视角图像中,其难以考虑各个视角之间的关系,所以,即使将现有的证据聚类方法应用于多视角图像,也难以提升图像分类准确性。
在本发明中的图像指的是具有单目标物的图像,如人物的一寸照片、图像中已经识别出的目标图像框中的图像等等。
本发明公开了一种基于证据多视角核化的目标分类方法,包括以下步骤:获取待分类图像集对应于不同图像属性的特征信息,以及待分类图像集对应的图像类别数量;初始化每个待分类图像在不同图像属性中与每个图像类别的相似度,并基于相似度计算待分类图像在不同图像属性中属于每个图像类别的信任值;根据信任值计算图像属性的属性权重;以属性权重、信任值和相似度计算待分类图像的分类误差,当分类误差变化量小于等于误差阈值时,基于信任值确定待分类图像集中待分类图像的类别。
本发明通过提取图像在不同图像属性中的特征信息,并基于该特征信息计算图像对于每个图像类别的信任值和属性权重,最后结合信任值和对应的属性权重计算图像分类误差,当分类误差预设要求时,确定对应的图像类别;本发明通过结合不同图像属性对图像分类的影响,可以提升图像分类精度。
对于一组图像,本发明使用其不同的属性特征获取各个图像的不同特征信息,并将全部图像的同一属性特征视作一个视角。可使用的属性特征包括方向梯度直方图(Histogram of oriented gradient,HOG)、局部二值模式特征(Local binary pattern,LBP)、尺度不变特征变化(Scale-invariant feature transform,SIFT)、局部纹理特征、Soble算子和Laplacian算子等。
具体的,方向梯度直方图是将预处理过的图像划分成块(cell/block),统计每个块的梯度直方图(不同梯度的个数),形成特征(descriptor),再将所有块的特征进行串联,获得一个行向量即是第i个图像在第q个图像属性下(HOG视角)的特征信息。将N个图像的特征组合成矩阵/>就获得了图像集在HOG视角下的特征矩阵。
关于局部二值模式特征,是将图像划分为3×3像素大小的块,以中心像素为阈值,比较周围8个像素的灰度值。若周围像素大于阈值,则该周围像素点的位置被标记为1,否则为0。这样,块内的8个点可排列产生一个8位二进制数,该二进制数对应的十进制数表示就是中心像素的LBP值,将第i个图像所有像素的LBP值串联成一个行向量它就是第i个图像的LBP图像属性下的特征信息。将N个图像的特征组合成矩阵/>就获得了图像集在LBP视角中的特征矩阵。
关于尺度不变特征变化,对原始图像依次进行尺度空间极值检测(Scale-spaceextrema detection)、关键点定位(Keypoint localization)、方向匹配(Orientationassignment)、关键点描述符(Keypoint descriptor)操作,然后将这些对应的特征串联成行向量,用表示。它就是第i个图像在第q个视角(SIFT视角)下的特征信息。将N个图像的特征组合成矩阵/>就获得了图像集在SIFT视角中的特征矩阵。
在本发明中,Q的大小以使用的属性特征数量为准。本发明只适用于Q≥1的情况,原则上将,Q越大,使用本发明获得聚类结果所需的时间越久。
对图像进行特征提取后,用Q个矩阵表示一组包含Q个视角(即图像属性)的特征数据。接下来本发明的目标是根据这些特征信息数据将目标图像集中的图像分到C个图像单类中去。但是,可能存在一些图像根据提取的特征不足以判断它属于哪一类图像,此时本发明会为该图像分配一个不精确的结果。
本发明在聚类部分采用一种基于核技术的动态多视角证据聚类,它使用核技术构造多视角高维特征空间以挖掘数据的非线性特征,并在该空间内设计了多视角证据聚类动态框架,从而降低证据聚类广义框架(和核技术)带来的高计算复杂度。
本发明在多视角证据聚类中引入核技术,对图像特征进行二次挖掘,构造新的高维特征空间,实现证据聚类的非线性特征挖掘。因为相较于使用欧几里得距离描述目标在原始特征空间(HOG、LBP、SIFT)的关系,将各视角特征信息从原始特征空间映射到未知高维空间更有利于非线性关系的挖掘。在高维特征空间里使用线性方法进行特征的收集分析,能够得到原特征空间中对应的非线性特征。
本发明利用核技术获得各个视角高维特征空间中的图像对不同类别的信任值,从而实现基于非线性特征的多视角证据聚类。具体来说,核方法通过构造一个非线性映射函数x→φ(x),将数据由原始特征空间映射到有限或无限高维特征空间,φ(·)的具体形式可以是未知的,高维特征空间中的内积可以用符合Mercer定理的核函数K(x,y)=<φ(x),φ(y)>计算。具体的,在该高维特征空间中,图像与类中心距离的度量方式如下:
其中,表示在第q个图像属性中第i个图像与第j个图像类别的距离,即相似度,距离越大就表示二者的差别越大,说明第i个图像不具有第j个图像类别的代表性特征,即不属于第j个图像类别。/>是在第q个图像属性中第i个图像的特征/>在高维空间φ(·)中对应的特征,/>是在第q个图像属性中第j个图像类别的类中心/>(也可以理解为第j个类的代表性特征)在高维空间φ(·)中对应的特征。
在实际应用中φ(·)的计算方法是未知的,只知道核函数K(·,·)的计算方法,所以欧几里得距离转换为/>来计算出距离的值。常见的可用于本发明的核函数K(·,·)包括:高斯核函数、多项式核函数等。
在本发明实施例中有:
通过上式可推导得到高维特征空间中相关核函数计算方法:
其中,是第q个图像属性中第m个图像类别的类中心,/>是第q个图像属性中第n个图像类别的类中心,/>是在第q个图像属性中判断第i个图像属于第m个图像类别的信任值,/>是在第q个图像属性中判断第i个图像属于第n个图像类别的信任值,/>是在第q个图像属性中判断第k个图像属于第j个图像类别的信任值,/>是在第q个图像属性中第k个图像的特征。
在本发明实施例中,基于相似度计算待分类图像在不同图像属性中属于每个图像类别的信任值包括:
其中,表示在在第q个图像属性中第i个图像对第j个图像类别的信任值,C表示图像类别数量,β表示信任值和相似度之间的关联因子。
在本发明实施例中,根据信任值计算图像属性的属性权重:
其中,N表示待分类图像的数量,s∈{1,2,...,N},k∈{1,2,...,N},表示第q个图像属性中第s个图像与第k个图像之间的相似度,η表示不同图像属性的属性权重的差异因子。
在证据聚类过程中,如果对每个图像都进行广义框架下的聚类,实际上会产生很多不必要的计算,因为一个目标潜在有可能属于的类别数量往往是有限的。例如,针对一组0-60岁的人像进行分类,把它们分类到0-10岁、11-20岁、21-30岁、31-40岁、41-50岁、51-60岁中去,对于一张人像,它的潜在有可能属于的类别可是{0-10岁,11-20岁},但不可能是{0-10岁,…,41-50岁}。本发明使用简单的方法为全部图像首先进行简单分类,再针对不容易区分的图像进行更细致的特征分析以确认其类别。
具体来说,本发明构造一个三步的多视角证据聚类动态框架:1.全图像划分2.图像分类3.部分图像再划分。具体来说,首先计算全部图像对单类的支持度;然后根据该支持度将图像划分为精确分类图像和不精确分类图像,并为不精确分类图像确定其潜在类;最后对不精确划分图像在其潜在类范围内进行再次划分,获得最终聚类结果。
本发明实施例中红,首先设计面向全图像的多视角图像分类误差,获得图像可能属于不同单类的多视角信任值和各视角下单类的类中心,对应的目标函数(即分类误差)是:
其中,Q表示图像属性的数量,q∈{1,2,...,Q},aq表示第q个图像属性的属性权重,i∈{1,2,...,N},,C表示图像类别数量,j∈{1,2,...,C},表示在第q个图像属性中第i个图像属于第j个图像类别的信任值,/>表示在第q个图像属性中第i个图像与第j个图像类别的相似度,θ表示图像属性和属性权重之间的相关因子。
本发明方法与单视角数据不同,通过不同图像属性特征挖掘了图像不同方面的特征,导致不同图像属性的数据密度是不同的。在某些图像属性中,图像的分布更加集中(即类别更容易区分出不同类)。在其他图像属性中,图像的分布更加均匀(即类别的可分性很差)。因此,图像属性的权重应该是不同的,给具有更好的集群可分性的图像属性分配更高的权重,在最终确定图像类别时,更多参考该特征提供的信任值。
上式中,第一项表示第i个图像具有第j个类的代表性特征时,该图像属于第j类这个结论的可信度高,反之亦然,因此越小越好。β控制可信度和距离之间的关联性,即信任值是否对距离的变化敏感(β大时,特征差异大了一点,信任值会降低很多)。aq控制第q个图像属性的权重。
第二项越小表示在这个高维空间中图像的图像属性距离越近(越相似),说明同类的图像是相互靠近的,那依据这个图像属性去分类图像的能力越强,因此这个视角的权重aq应该越大,即/>越小越好,θ用于控制视角特征分类能力与权重的相关程度。
第三项指的是利用香农熵思想,希望视角权重aq的差距越大越好,η用于控制多视角权重差异程度,η越大,aq的差距越大。
另外,当分类误差变化量大于误差阈值时,基于信任值更新相似度,继续计算。
接下来,如图3所示,将图像分为可精确划分图像和不可精确划分图像;为不可精确划分目标确定其动态广义子框架。
作为一种具体实现方式,基于信任值确定待分类图像集中待分类图像的类别包括:选择待分类图像在不同图像属性中的信任值中的最大信任值。本发明构造多视角证据函数Beli(wj)表示第i个图像属于第j个图像单类的可能性。Belimax表示图像的最大信任值。
对于不同的图像会出现两种情况:1.不存在j使(即最大的信任值远大于其他),则可以确定该图像属于第j个图像单类,称为可精确划分图像,这部分图像不需要再进一步聚类;2.存在j使/>(即最大的几个信任值差异小),则在此阶段不能将该图像分配给图像单类,称为不可精确划分图像,这部分图像将在后面进行再划分,确定其可能归属的单类/复合类。
也就是说,当不存在使成立的信任值时,将待分类图像划分为最大信任值对应的图像类别;其中,Belimax表示待分类图像i的最大信任值,Belij表示待分类图像i对图像类别中第j个图像单类的信任值,/>表示信任值差距阈值。当存在使成立的信任值时:对待分类图像进行再分类。
在实际场景中,对于一个图像来说,它可能属于的类别数往往是有限的,即它可能属于的单类数量和可能属于的复合类规模(|Aj|)往往都是较小的。同例,针对一组0-60岁的人像进行分类,把它们分类到0-10岁、11-20岁、21-30岁、31-40岁、41-50岁、51-60岁中去,对于一张人像,它的潜在有可能属于类别可是{0-10岁,11-20岁}或{21-30岁,31-40岁,41-50岁},但若它的潜在有可能属于类别是{0-10岁,11-20岁,21-30岁,31-40岁,41-50岁},这显然是不合理的。
因此,本发明使用简单的方法就可以初步排除许多不可能的类,从而降低广义框架证据聚类的计算量(广义框架下类别数随单类数成指数级增长)。本发明根据图像全局信任值,为每个不可精确划分目标筛选出其潜在有可能属于类此外,本发明动态处理Ωi对应的广义子框架,在广义子框架是/>的基础上,进一步限制复合类规模(|Aj|),获得动态广义子框架:
也就是说,选择使成立的图像单类,并构建再分类图像类别集合;基于再分类图像类别集合为进行再分类的待分类图像进行分类。
在一个实施例中,如果第1个图像的潜在有可能属于类Ω1={w1,w3,w4},那其对应的广义子框架是若τ=2则其动态广义子框架/>阈值/>可以根据场景需求进行设定,/>越大,目标的可疑类范围越大,计算复杂度越高,但聚类的错误率也会随之下降。
阈值和τ可以根据场景需求进行设定,/>或τ越大,目标的动态广义子框架越大,计算复杂度越高,但聚类的错误率也会随之下降。
在一个实施例中,基于再分类图像类别集合为进行再分类的待分类图像进行分类包括:基于相似度计算待分类图像与再分类图像类别集合中每个图像类别的第二相似度;在不同图像属性中基于相似度计算再分类图像类别集合中每个图像类别的分离度;根据分离度和第二相似度计算再分类图像在不同图像属性中对于不同图像类别的第二信任值;根据第二信任值确定再分类图像的图像类别。
基于相似度计算待分类图像与再分类图像类别集合中每个图像类别的第二相似度其计算方法如下:
其中,γ可用于手动控制复合类类中心和相关单类类中心对的影响程度。本实施例使用和ρ对多视角证据聚类的目标函数进行了优化,减少了复合类中心对单类类中心的影响,而通过挖掘各视角的局部信息提高聚类结果的准确度。/>表示第i个再分类图像在第q个图像属性下的特征/>在高维空间φ(·)中与第j′个图像类别的类中心/>的欧几里得距离,单类的类中心/>在上述内容中被确定,复合类在高维空间φ(·)中的类中心用如下公式计算得到:
通过使用代替/>本发明降低了图像被误分给不合理复合类的可能性(图像不会被误分给多个距离远/不可能存在重叠区域的类的复合类)。同理,针对一组0-60岁的人像进行分类,对于一张人像,它的潜在有可能属于类别{21-30岁,31-40岁,41-50岁}时,它的不精确分类结果可以是{21-30岁,31-40岁}或{31-40岁,41-50岁},但若将它不精确分类的范围划定为{21-30岁,41-50岁},这显然是不合理的,公式19帮助排除将图像分配给不合理复合类(不精确分类)的可能性。
表示第j′个图像类别在第q个图像属性中的归一化分离度/>第j′个图像类别在第q个图像属性中分离度越高(第q特征中第j个类图像可分性好),意味着图像在第q个图像属性对第j个类的信任值越可靠,分离度也展示了某视角中某类相关信息的重要程度多视角分离度/>的计算方式如下:
多视角分离度对每个视角下的各个类进行单独的评估,充分挖掘各视角的局部特征,使多视角信息得到充分利用,以获得更准确的聚类结果。
由此可知各图像属性的第二信任值如下:
进一步地,根据第二信任值确定再分类图像的图像类别包括:
其中,μij′表示第i个图像属于第j′个图像类别的第二信任值,表示在第q个图像属性中第i个图像属于第j′个图像类别的第二信任值,/>表示在第q个图像属性中第j′个图像类别的归一化分离度。
需要注意的是,本发明不需要对模型进行定向训练,即根据设定单类数量C的不同,本发明会自动分析最明显的可将图像集划分为三类的图像类别,并将图像根据特征进行聚类。例如,对于一组全年龄全性别的人脸图像,若C=2,本发明可能将根据男女进行划分,若C=3,本发明将根据年龄(青少年、中年、老年)进行划分。在C=2时,如果出现难以辨别男女的图像,本发明会将其归类为“男女不可分”从而降低强行划分可能导致的高错误率。在C=3时,除去“青少年”、“中年”、“老年”三个精确的类别,本技术方案会根据图像特征将特征不明显的图像划分到“中年或老年”、“青少年或中年”、“青少年或老年”、“年龄无法辨别”这几个不精确的类别。
另外,为了验证聚类方法的有效性,在Foresttype数据集上进行了测试,该数据集包含来自遥感研究的训练和测试数据,该遥感研究使用ASTER卫星图像,根据可见光到近红外波长的光谱特征绘制了不同的森林类型。输出(森林类型图)可用于识别和量化森林提供的生态系统服务(例如碳储存、侵蚀保护)。
在测试过程中,使用了ACC(准确率)、Purity(纯度)、F-Score、Precision(精确度)、RI(兰德指数,Rand Index)等指标。各项指标的含义如下所示:
ACC表示各聚类方法识别的准确率,是用于评估监督学习模型的性能指标,用于衡量分类模型预测正确的样本比例,ACC取值范围在0到1之间,数值越接近1表示聚类结果与真实标签的一致性越高,即聚类效果越好。
Purity衡量了聚类结果中每个簇内样本被正确分配到同一类别的程度,Purity的取值范围在0到1之间,如果Purity越接近于1,表示聚类结果越好,即簇内的样本越趋向于被正确地分配到同一类别中;
F-Score是一个结合了精确度(Precision)和召回率(Recall)的指标,用于衡量分类模型的准确性,F-Score的取值范围通常在0到1之间,如果F-Score越接近于1,表示聚类结果越好。
Precision是分类模型评估中的一个指标,它衡量了分类器正确预测为正类别的样本数量与所有被分类为正类别的样本数量之间的比例,Precision的取值范围在0到1之间,如果一个簇内的所有样本都是同一类别,那么Precision会是1;如果有些样本被错误地分配到该簇,Precision将会降低。
RI是在聚类算法中用于评估聚类结果的一种指标。Rand Index用于比较聚类结果与数据集的真实标签之间的相似程度。它考察了聚类算法对数据进行分组时,是否将相似的样本归为同一类,从而衡量了聚类结果的一致性。RI的取值范围在0到1之间,当聚类结果与真实标签完全一致时,RI为1;如果聚类结果与真实标签随机分配的情况下兰德指数为0,即说明聚类结果与真实标签无关联。RI值越接近1,表示聚类结果与真实标签的一致性越高。
表1
如表1所示,MvDKE表示本发明聚类方法,从表1中可以看出,本发明方法相比于众多已有聚类方法,准确度均大大提升。
综上,本发明实现多视角图像聚类并在聚类结果中表征目标不精确性。通过表征不精确性,可以有效降低聚类结果的错误率。针对多视角数据设计特定动态聚类框架,排除无关复合类干扰,减少冗余计算,解决针多视角证据聚类和核技术带来的高复杂度问题。提高数据处理速度,实现证据聚类在大规模多视角数据中的应用。利用核函数实现多视角特征在高维非线性空间的映射,从而深入挖掘数据的非线性特征,实现证据聚类在多视角非球形分布数据中的应用。
广义多视角证据聚类在真实场景应用时还存在一些现实问题:首先,广义框架中引入复合类极大增加了现有方法的计算复杂度,为广义多视角证据聚类在大型数据或多类别数据中的实际应用带来困难;其次,针对一些真实场景中普遍存在的特殊数据结构,如非球形分布数据。本发明在表征不精确性的同时,可以降低多视角证据聚类的计算复杂度,提高其在非球形分布数据这种真实特殊数据结构中的聚类综合性能和鲁棒性,这在真实场景中具有极高的应用价值。
综上,针对动态证据聚类框架的全目标划分,可使用多视角模糊c均值聚类的相关方法获得信任值(在模糊聚类中被称为支持度)和单类类中心。采用该替代策略不会结果造成明显影响,但可能产生新的计算量。针对全目标划分的目标函数的初始化,可对各视角采用其他聚类技术如FCM、K-means、谱聚类等确定获得初步的聚类结果,进而生成更合理的初始化单类类中心。采用该策略可降低后续迭代次数,但在初始化阶段会产生新的计算量。针对全图像划分中采用的视角权重自适应变化方法,可采用全视角等权重策略替代:wq=1/Q。如果采用上述替代策略,可减少迭代过程中权重自适应带来的计算量,但无法对各视角数据进行差异化处理,在视角信息量差距大的场景中,会导致聚类结果的准确度降低。针对动态证据聚类框架的部分目标再划分的目标函数,可采用类似全目标划分的视角权重代替多视角类别分散度。采用该替代策略可略微降低计算复杂度,但难以挖掘视角的局部特征,会导致聚类结果的准确度降低。
本发明还公开了一种基于证据多视角核化的目标分类装置,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的方法。
本发明还公开了一种实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述各个方法实施例中的步骤。
本发明还提供了一种计算机程序产品,当计算机程序产品在数据存储设备上运行时,使得数据存储设备执行时可实现上述各个方法实施例中的步骤。
所述集成的单元模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到存储设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本发明中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
Claims (10)
1.一种基于证据多视角核化的目标分类方法,其特征在于,包括以下步骤:
获取待分类图像集对应于不同图像属性的特征信息,以及待分类图像集对应的图像类别数量;
初始化每个待分类图像在不同图像属性中与每个图像类别的相似度,并基于所述相似度计算待分类图像在不同图像属性中属于每个图像类别的信任值;
根据所述信任值计算图像属性的属性权重;
以所述属性权重、信任值和相似度计算待分类图像的分类误差,当所述分类误差变化量小于等于误差阈值时,基于所述信任值确定所述待分类图像集中待分类图像的类别。
2.如权利要求1所述的一种基于证据多视角核化的目标分类方法,其特征在于,当所述分类误差变化量大于误差阈值时,基于所述信任值更新所述相似度,继续计算。
3.如权利要求1或2所述的一种基于证据多视角核化的目标分类方法,其特征在于,所述分类误差计算方法为:
其中,Q表示图像属性的数量,q∈{1,2,...,Q},aq表示第q个图像属性的属性权重,N表示待分类图像的数量,i∈{1,2,...,N},s∈{1,2,...,N},k∈{1,2,...,N},C表示图像类别数量,j∈{1,2,...,C},表示在第q个图像属性中第i个图像属于第j个图像类别的信任值,β表示信任值和相似度之间的关联因子,/>表示在第q个图像属性中第i个图像与第j个图像类别的相似度,θ表示图像属性和属性权重之间的相关因子,/>表示第q个图像属性中第s个图像与第k个图像之间的相似度,η表示不同图像属性的属性权重的差异因子。
4.如权利要求3所述的一种基于证据多视角核化的目标分类方法,其特征在于,基于所述相似度计算待分类图像在不同图像属性中属于每个图像类别的信任值包括:
5.如权利要求4所述的一种基于证据多视角核化的目标分类方法,其特征在于,基于所述信任值确定所述待分类图像集中待分类图像的类别包括:
选择待分类图像在不同图像属性中的信任值中的最大信任值;
当不存在使成立的信任值时,将所述待分类图像划分为最大信任值对应的图像类别;其中,Belimax表示待分类图像i的最大信任值,Belij表示待分类图像i对图像类别中第j个单类的信任值,/>表示信任值差距阈值。
6.如权利要求5所述的一种基于证据多视角核化的目标分类方法,其特征在于,当存在使成立的信任值时:
对待分类图像进行再分类。
7.如权利要求6所述的一种基于证据多视角核化的目标分类方法,其特征在于,对待分类图像进行再分类包括:
选择使成立的图像单类,并构建再分类图像类别集合;
基于所述再分类图像类别集合为进行再分类的待分类图像进行分类。
8.如权利要求7所述的一种基于证据多视角核化的目标分类方法,其特征在于,基于所述再分类图像类别集合为进行再分类的待分类图像进行分类包括:
基于所述相似度计算待分类图像与再分类图像类别集合中每个图像类别的第二相似度;
在不同图像属性中基于所述相似度计算再分类图像类别集合中每个图像类别的分离度;
根据所述分离度和第二相似度计算再分类图像在不同图像属性中对于不同图像类别的第二信任值;
根据所述第二信任值确定再分类图像的图像类别。
9.如权利要求8所述的一种基于证据多视角核化的目标分类方法,其特征在于,根据所述第二信任值确定再分类图像的图像类别包括:
其中,μij′表示第i个图像属于第j′个图像类别的第二信任值,表示在第q个图像属性中第i个图像属于第j′个图像类别的第二信任值,/>表示在第q个图像属性中第j′个图像类别的归一化分离度。
10.一种基于证据多视角核化的目标分类装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311776800.8A CN117710745A (zh) | 2023-12-22 | 2023-12-22 | 一种基于证据多视角核化的目标分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311776800.8A CN117710745A (zh) | 2023-12-22 | 2023-12-22 | 一种基于证据多视角核化的目标分类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117710745A true CN117710745A (zh) | 2024-03-15 |
Family
ID=90144121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311776800.8A Pending CN117710745A (zh) | 2023-12-22 | 2023-12-22 | 一种基于证据多视角核化的目标分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117710745A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118011405A (zh) * | 2024-04-08 | 2024-05-10 | 厦门印海途海洋科技有限公司 | 海底地质成像方法、装置、设备及介质 |
-
2023
- 2023-12-22 CN CN202311776800.8A patent/CN117710745A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118011405A (zh) * | 2024-04-08 | 2024-05-10 | 厦门印海途海洋科技有限公司 | 海底地质成像方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3478728B1 (en) | Method and system for cell annotation with adaptive incremental learning | |
CN109871875B (zh) | 一种基于深度学习的建筑物变化检测方法 | |
CN111476806B (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
Abrahim et al. | RETRACTED ARTICLE: Splicing image forgery identification based on artificial neural network approach and texture features | |
CN110689043A (zh) | 一种基于多重注意力机制的车辆细粒度识别方法及装置 | |
Ramathilagam et al. | Extended Gaussian kernel version of fuzzy c-means in the problem of data analyzing | |
EP3663980A1 (en) | Automatic generation of a new class in a classification system | |
CN110363165B (zh) | 基于tsk模糊系统的多目标跟踪方法、装置及存储介质 | |
CN108388907B (zh) | 基于多视角学习的极化sar数据分类器实时更新方法 | |
CN109840518B (zh) | 一种结合分类与域适应的视觉追踪方法 | |
CN117710745A (zh) | 一种基于证据多视角核化的目标分类方法及装置 | |
CN114972737B (zh) | 基于原型对比学习的遥感图像目标检测系统及方法 | |
Zhang et al. | Weakly-supervised evidence pinpointing and description | |
Bourouis et al. | Color object segmentation and tracking using flexible statistical model and level-set | |
CN115393631A (zh) | 基于贝叶斯层图卷积神经网络的高光谱图像分类方法 | |
CN114299567B (zh) | 模型训练、活体检测方法、电子设备及存储介质 | |
Chen et al. | A novel graphical model approach to segmenting cell images | |
CN108805181B (zh) | 一种基于多分类模型的图像分类装置及分类方法 | |
CN107316296A (zh) | 一种基于对数变换的遥感图像变化检测方法及装置 | |
CN111008652A (zh) | 一种基于gan的高光谱遥感影像分类方法 | |
CN108960005B (zh) | 一种智能视觉物联网中对象视觉标签的建立及显示方法、系统 | |
Feng et al. | Superpixel-based convolutional neural network for georeferencing the drone images | |
Chhabra et al. | Comparison of different edge detection techniques to improve quality of medical images | |
CN115797990A (zh) | 图像分类、图像处理方法、装置和存储介质 | |
Shakya et al. | Noise clustering-based hypertangent kernel classifier for satellite imaging analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |