CN108647703A - 一种基于显著性的分类图像库的类型判断方法 - Google Patents
一种基于显著性的分类图像库的类型判断方法 Download PDFInfo
- Publication number
- CN108647703A CN108647703A CN201810355420.XA CN201810355420A CN108647703A CN 108647703 A CN108647703 A CN 108647703A CN 201810355420 A CN201810355420 A CN 201810355420A CN 108647703 A CN108647703 A CN 108647703A
- Authority
- CN
- China
- Prior art keywords
- image
- region
- conspicuousness
- notable
- image library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 230000008569 process Effects 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 22
- 238000012360 testing method Methods 0.000 claims abstract description 21
- 239000000284 extract Substances 0.000 claims abstract description 8
- 230000011218 segmentation Effects 0.000 claims description 17
- 238000005457 optimization Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000003709 image segmentation Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 239000003086 colorant Substances 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000000205 computational method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于显著性的分类图像库的类型判断方法,包括训练过程和测试过程,所述训练过程包括以下步骤:选取对象类图像,类标为1;挑选场景类图像,类标为0;提取每幅图像的显著图;计算所述每幅图像显著图的灰度直方图;将图像的所述灰度直方图特征和对应的类标输入到SVM进行训练,得到训练模型。本发明提出一种基于显著性的分类图像库的类型判断方法,在显著性的基础上对所分类图像库的类型进行判断,将图像库分为场景类图像库和对象类图像库,进而根据不同的图像库类型采用不同的分类方法,从而保证分类方法具有很好的针对性,提高分类性能。
Description
技术领域
本发明涉及计算机视觉和图像处理的技术领域,特别是一种基于显著性的分类图像库的类型判断方法。
背景技术
随着多媒体技术和网络的发展以及大数据时代的到来,海量图像的出现导致图像的管理和检索成为了亟待解决的问题。图像类别是重要的语义信息,是进行图像理解的关键问题。图像的人工分类效率低、代价大,不同的人对同一张图片的标注结果可能会存在差异,而且无法满足不断涌现的新图像和进行实时更新。计算机实现图像的自动分类一直是计算机视觉领域的基础问题,是替代人工分类的重要途径,也是图像语义信息自动提取和理解的重要手段。然而,目前的分类方法都是针对某一个特定的图像库,不需要对分类图像库的类型进行判断,进而根据不同类型的图像库采用不同的分类方法。因此本发明试图解决这个问题,即对分类图像库的类型进行判断,然后根据图像库的类型采取不同的分类方法。
在长期的进化中,人类在进行图像理解时,总会把注意力放在图像中最能引起注意的区域,自动忽略相对不能引起注意的区域。人类这种自动选择感兴趣区域的感知能力被称为视觉注意力机制。显著性检测技术是让计算机模拟人类的视觉注意力机制,对处理的图像进行自动的信息选择和筛选。图像中能够快速吸引观察者注意力的区域称为显著区域,显著性检测技术就是发现图像中的显著区域。显著性检测是计算机视觉中非常活跃的研究方向,提取的显著区域可以为诸多应用提供原始对象,其应用领域极为广泛,如对象识别、对象分割、基于内容的图像检索、内容已知的图像缩放和图像压缩等。显著性检测的结果称为显著图。
随着显著性研究的深入,目前已经有研究显示图像中不一定包含显著区域。文献【P.Wang,J.Wang,G.Zeng,J.Feng,H.Zha,and S.Li.Salient object detection forsearched web images via global saliency[C].Proceedings of IEEE Conference onComputer Vision and Pattern Recognition,2012.3194–3201.】针对网络图像中的显著区域提取任务进行了讨论,指出图像中不一定含有显著区域。
文献【P.Wang,J.Wang,G.Zeng,J.Feng,H.Zha,and S.Li.Salient objectdetection for searched web images via global saliency[C].Proceedings of IEEEConference on Computer Vision and Pattern Recognition,2012.3194–3201.】提出了图像中不一定含有显著区域。因此判断图像中是否含有显著区域在不同视觉问题中已经表现得非常重要,直接导致解决方法的不一样。
以往的图像分类方法都是针对一个已知类型的图像库提出某种分类方法,这些方法都不需要对分类图像库的类型进行判断。但是,存在的问题是当图像库类型未知的时候应该采用哪种分类方法对图像进行分类。
2014年底32期《电脑知识与技术》杂志公开了一篇名为《图像分类识别方法研究》的文章,作者为赵重阳、王松会和夏文杰,深入分析了统计法、句法识别法、神经网络法、模糊集识别法、支持向量机法和模版匹配法等几种主要图像分类识别方法,并对各种分类识别方法的优势与缺陷做了深入的总结。通过分析各类图像分类识别方法,明确各类识别方法的优势与缺陷,为图像分类识别方法的具体应用奠定基础。该文章虽然提出了几种图像识别方法,但是都没有具体的说明,仅仅是简单的方法集合,并没有解决当图像库类型未知的时候应该采用哪种分类方法对图像进行分类的问题。
发明内容
为了解决上述的技术问题,本发明提出一种基于显著性的分类图像库的类型判断方法,在显著性的基础上对所分类图像库的类型进行判断,将图像库分为场景类图像库和对象类图像库,进而根据不同的图像库类型采用不同的分类方法,从而保证分类方法具有很好的针对性,提高分类性能。
本发明提供一种基于显著性的分类图像库的类型判断方法,包括训练过程和测试过程,所述训练过程包括以下步骤:
步骤1:选取对象类图像,类标为1;挑选场景类图像,类标为0;
步骤2:提取每幅图像的显著图;
步骤3:计算所述每幅图像显著图的灰度直方图;
步骤4:将图像的所述灰度直方图特征和对应的类标输入到SVM进行训练,得到训练模型。
优选的是,所述显著图的计算过程包括以下步骤:
步骤21:对图像I进行多尺度的区域分割;
步骤22:对每个分割区域的外观特征提取及计算显著性;
步骤23:对所述显著图进行优化;
步骤24:对不同尺度下的所述显著图进行融合。
在上述任一方案中优选的是,所述步骤21为对图像I,将其在N个尺度下做分割,R={Ri|1≤i≤N},其中i代表分割的尺度,i值越小,分割的尺度越小,图像分割的粒度越细。
在上述任一方案中优选的是,所述外观特征包括颜色特征和纹理特征,所述颜色特征空间有RGB、HSV和L*a*b*。
在上述任一方案中优选的是,所述步骤22包括粉笔计算所述三种颜色空间的平均颜色值和256为统计直方图特征。
在上述任一方案中优选的是,采用的所述纹理特征为LBP特征和LM滤波池响应特征。
在上述任一方案中优选的是,所述步骤23包括使用下面的目标函数进行所述显著图优化:
其中表示区域i优化后的显著值;s表示区域i未优化的显著值;区域i为待估计的目标区域;区域j为区域i的相邻区域;α是描述区域i与区域j空间关联关系的权重值。
在上述任一方案中优选的是,所述权重值α的计算公式为
其中,Ri和Rj为分割后得到的区域,d为区域Ri和区域Rj的距离,σ2表示图像所有区域间距离的标准差。
在上述任一方案中优选的是,所述区域Ri和区域Rj的距离d的定义如下:
其中,表示示区域Ri的边缘像素集合;表示区域Rj的边缘像素集合;边界强度ES(P)为区域Ri和区域Rj公共边缘中像素P点的UCM值。
在上述任一方案中优选的是,所述步骤24为对于第i幅图像,在进行区域空间关联约束后,得到图像的(1......N)尺度的显著图采用线性模型将不同尺度下的显著图结果进行融合,
其中,S表示第i图像的融合显著图,S表示第i幅图像在尺度k下面的显著图,wk表示尺度k的权重。
在上述任一方案中优选的是,所述权重值{wk|1≤k≤N}采用最小二乘法求解,
其中Y表示训练集中图像的个数,Ai表示第i幅图像的标准二值标注。
在上述任一方案中优选的是,所述显著图的所述直方图特征的计算过程包括如下步骤:
步骤31:读取显著图S;
步骤32:判断所述显著图S的维数size;
步骤33:读取图像S'的R、G、B分量;
步骤34:分别统计R、G、B分量的直方图特征,结果为Rhist、Ghist、Bhist;
步骤35:将Rhist、Ghist、Bhist特征进行拼接,得到图像S'的直方图特征H,H=[Rhist,Ghist,Bhist]。
在上述任一方案中优选的是,所述步骤31为如果size=2,则图像S是灰度图像,将S转化为彩色图像S',
S′(:,:,1)=S(:,:,1)
S'(:,:,2)=S(:,:,2)
S′(:,:,3)=S(:,:,3)
否则,S′=S。
在上述任一方案中优选的是,所述R、G、B分量的公式为R=S′(:,:,1),G=S′(:,:,2),B=S′(:,:,3)。
在上述任一方案中优选的是,当k=0:255时,如果R=k,则Rhist(k+1)++。
在上述任一方案中优选的是,当k=0:255时,如果G=k,则Ghist(k+1)++。
在上述任一方案中优选的是,当k=0:255时,如果B=k,则Bhist(k+1)++。
在上述任一方案中优选的是,所述测试过程包括以下步骤:
步骤A:输入测试图像库;
步骤B:提取所述测试图像库中每幅图像的显著图;
步骤C:计算所述测试图像库中所述每幅图像显著图的直方图特征;
步骤D:将所述测试图像库的所述直方图特征输入到所述SVM分类器中,用训练好的所述模型对其进行分类。
本发明提出了一种基于显著性的分类图像库的类型判断方法,此方法得到的图像库类型对于后续采用何种分类算法具有关键的决策作用,根据图像中是否含有显著区域,我们把图像库的类型分为场景类图像库和对象类图像库。。
附图说明
图1为按照本发明的基于显著性的分类图像库的类型判断方法的一优选实施例的流程图。
图1A为按照本发明的基于显著性的分类图像库的类型判断方法的如图1所示实施例的显著图的计算过程的流程图。
图1B为按照本发明的基于显著性的分类图像库的类型判断方法的如图1所示实施例的直方图特征的计算过程的流程图。
图2为按照本发明的基于显著性的分类图像库的类型判断方法的一优选实施例的场景类图像库中的示例图像及其显著图。
图3为按照本发明的基于显著性的分类图像库的类型判断方法的一优选实施例的对象类图像库中的示例图像及其显著图。
图4为按照本发明的基于显著性的分类图像库的类型判断方法的一优选实施例的图像库类型的判断流程图。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的阐述。
实施例一
如图1所示,一种基于显著性的分类图像库的类型判断方法,包括训练过程100和测试过程110。其中训练过程100步骤如下:执行步骤101,选取对象类图像,类标为1;挑选场景类图像,类标为0。执行步骤102:提取每幅图像的显著图。显著图的计算过程包括以下步骤(如图1A所示):执行步骤121:对图像I进行多尺度的区域分割。对图像I,将其在N个尺度下做分割,R={Ri|1≤i≤N},其中i代表分割的尺度,i值越小,分割的尺度越小,图像分割的粒度越细。执行步骤122:对每个分割区域的外观特征提取及计算显著性。外观特征包括颜色特征和纹理特征。采用的颜色特征空间有RGB,HSV和L*a*b*,分别计算三种颜色空间的平均颜色值和256维统计直方图特征;采用的纹理特征为LBP特征和LM滤波池响应特征。提取完外观特征后通过特征差异的计算得到区域的显著性。
详细的特征及显著性计算如表1所示。基于外观的显著性计算完毕后,区域内所有像素具有和本区域相同的显著性。计算得到29维基于图像外观的显著性特征。
表1外观特征和基于外观的显著性计算
执行步骤123:对所述显著图进行空间一致性优化。考虑到相邻区域间具有空间关联关系,为了使显著图更加平滑,利用下面的目标函数进行显著图的优化:
其中表示区域i优化后的显著值;s表示区域i未优化的显著值;区域i为待估计的目标区域;区域j为区域i的相邻区域;α是描述区域i与区域j空间关联关系的权重值。为了计算权重α,首先定义分割后区域的无向图。如果区域Ri和区域Rj相邻,则有一条边连接两个区域,区域Ri和区域Rj的距离定义如下:
其中,表示示区域Ri的边缘像素集合;表示区域Rj的边缘像素集合;边界强度ES(P)为区域Ri和区域Rj公共边缘中像素P点的UCM值。
权重值α的计算公式为
其中,当区域Ri和区域Rj相邻时,区域Ri和区域Rj的距离计算方法如上面公式,当区域Ri和区域Rj不相邻的时候,区域Ri和区域Rj的距离为区域Ri和区域Rj的最短路径,在路径上直接相邻的区域距离的计算方法仍为上面公式,σ2表示图像所有区域间距离的标准差。执行步骤124:对不同尺度下的所述显著图进行融合。对于第i幅图像,在进行区域空间关联约束后,得到图像的(1......N)尺度的显著图采用线性模型将不同尺度下的显著图结果进行融合,
其中,S表示第i图像的融合显著图,S表示第i幅图像在尺度k下面的显著图,wk表示尺度k的权重。
所述权重值{wk|1≤k≤N}采用最小二乘法求解,
其中Y表示训练集中图像的个数,Ai表示第i幅图像的标准二值标注。
执行步骤103:计算所述每幅图像显著图的灰度直方图。直方图特征的计算过程包括如下步骤(如图1B所示):执行步骤131:读取显著图S。执行步骤132:判断所述显著图S的维数size,如果size=2,则图像S是灰度图像,将S转化为彩色图像S',S′(:,:,1)=S(:,:,1),S′(:,:,2)=S(:,:,2),S′(:,:,3)=S(:,:,3),否则,S′=S。执行步骤133:读取图像S'的R、G、B分量,R、G、B分量的公式为R=S′(:,:,1),G=S′(:,:,2),B=S′(:,:,3)。执行步骤134:分别统计R、G、B分量的直方图特征,结果为Rhist、Ghist、Bhist。
for k=0:255
如果R=k
则Rhist(k+1)++
end
当k=0:255时,如果R=k,则Rhist(k+1)++;
for k=0:255
如果G=k
则Ghist(k+1)++
end
当k=0:255时,如果G=k,则Ghist(k+1)++;
for k=0:255
如果B=k
则Bhist(k+1)++
end
当k=0:255时,如果B=k,则Bhist(k+1)++。
执行步骤135:将Rhist、Ghist、Bhist特征进行拼接,得到图像S'的直方图特征H,H=[Rhist,Ghist,Bhist]。
执行步骤104:将图像的所述灰度直方图特征和对应的类标输入到SVM进行训练,得到训练模型。
测试过程110步骤如下:执行步骤111:输入测试图像库。执行步骤112:提取所述测试图像库中每幅图像的显著图。显著图的计算过程包括以下步骤(如图1A所示):执行步骤121:对图像I进行多尺度的区域分割。对图像I,将其在N个尺度下做分割,R={Ri|1≤i≤N},其中i代表分割的尺度,i值越小,分割的尺度越小,图像分割的粒度越细。执行步骤122:对每个分割区域的外观特征提取及计算显著性。外观特征包括颜色特征和纹理特征。采用的颜色特征空间有RGB,HSV和L*a*b*,分别计算三种颜色空间的平均颜色值和256维统计直方图特征;采用的纹理特征为LBP特征和LM滤波池响应特征。提取完外观特征后通过特征差异的计算得到区域的显著性。基于外观的显著性计算完毕后,区域内所有像素具有和本区域相同的显著性。计算得到29维基于图像外观的显著性特征。执行步骤123:对所述显著图进行空间一致性优化。考虑到相邻区域间具有空间关联关系,为了使显著图更加平滑,利用下面的目标函数进行显著图的优化:
其中表示区域i优化后的显著值;s表示区域i未优化的显著值;区域i为待估计的目标区域;区域j为区域i的相邻区域;α是描述区域i与区域j空间关联关系的权重值。为了计算权重α,首先定义分割后区域的无向图。如果区域Ri和区域Rj相邻,则有一条边连接两个区域,区域Ri和区域Rj的距离定义如下:
其中,表示示区域Ri的边缘像素集合;表示区域Rj的边缘像素集合;边界强度ES(P)为区域Ri和区域Rj公共边缘中像素P点的UCM值。
权重值α的计算公式为
其中,当区域Ri和区域Rj相邻时,区域Ri和区域Rj的距离计算方法如上面公式,当区域Ri和区域Rj不相邻的时候,区域Ri和区域Rj的距离为区域Ri和区域Rj的最短路径,在路径上直接相邻的区域距离的计算方法仍为上面公式,σ2表示图像所有区域间距离的标准差。执行步骤124:对不同尺度下的所述显著图进行融合。对于第i幅图像,在进行区域空间关联约束后,得到图像的1......N尺度的显著图采用线性模型将不同尺度下的显著图结果进行融合,
其中,S表示第i图像的融合显著图,S表示第i幅图像在尺度k下面的显著图,wk表示尺度k的权重。
所述权重值{wk|1≤k≤N}采用最小二乘法求解,
其中Y表示训练集中图像的个数,Ai表示第i幅图像的标准二值标注。
执行步骤113:计算所述测试图像库中所述每幅图像显著图的直方图特征。直方图特征的计算过程包括如下步骤(如图1B所示):执行步骤131:读取显著图S。执行步骤132:判断所述显著图S的维数size,如果size=2,则图像S是灰度图像,将S转化为彩色图像S',S′(:,:,1)=S(:,:,1),s′(:,:,2)=S(:,:,2),S′(:,:,3)=S(:,:,3),否则,S′=S。执行步骤133:读取图像S'的R、G、B分量,R、G、B分量的公式为R=S′(:,:,1),G=S′(:,:,2),B=S'(:,:,3)。执行步骤134:分别统计R、G、B分量的直方图特征,结果为Rhist、Ghist、Bhist。
for k=0:255
如果R=k
则Rhist(k+1)++
end
当k=0:255时,如果R=k,则Rhist(k+1)++;
for k=0:255
如果G=k
则Ghist(k+1)++
end
当k=0:255时,如果G=k,则Ghist(k+1)++;
for k=0:255
如果B=k
则Bhist(k+1)++
end
当k=0:255时,如果B=k,则Bhist(k+1)++。
执行步骤135:将Rhist、Ghist、Bhist特征进行拼接,得到图像S'的直方图特征H,H=[Rhist,Ghist,Bhist]。
执行步骤114:将所述测试图像库的所述直方图特征输入到所述SVM分类器中。执行步骤115:用训练好的所述模型对其进行分类。
实施例二
训练过程
(1)选取对象类图像,类标为1;挑选场景类图像,类标为0;
(2)提取每幅图像的显著图;
(3)计算每幅图像显著图的灰度直方图;
(4)将图像的灰度直方图特征和对应的类标输入到SVM进行训练,得到训练模型。
实施例三
测试过程
(1)输入测试图像库;
(2)提取测试图像库中每幅图像的显著图;
(3)计算测试图像库每幅图像显著图的直方图特征;
(4)将测试图像库的直方图特征输入到SVM分类器,用训练好的模型对其进行分类。
实施例四
在场景类图像库中,选择15场景类图像库作为例子,从中选择6幅图像,提取6幅图像的显著图。仔细观察显著图,不难发现场景类图像中不含有明显的显著区域。结果如图2所示。
实施例五
在对象类图像库中,选择牛津大学的17花库、牛津大学的102花库、Caltech 101、Caltech 256和UIUC8库作为例子。下面的图像分别来自于这5个的图像库,提取这些图像对应的显著图。观察所选图像及其对应的显著图,可以看出对象类图像中含有明显的显著区域。结果如图3所示。
图3对象类图像库中的示例图像及其显著图。第一行的原始图像为来自于17花库;第二行的原始图像为来自于102花库;第三的原始图像来自于Caltech 101库;第四行的原始图像为来自于Caltech 256库;第五行的原始图像为来自于UIUC8库。
实施例六
基于显著性的图像库类型判断方法的整体流程。
判断方法的整体流程如图4所示。整体流程分为训练过程和测试过程。
在训练阶段,首先对输入的图像库提取每幅图像的显著图。图像分为场景类图像和对象类图像。如果是对象类图像,对应的显著图的类标为1。如果是场景类图像,对应的显著图的类标为0。在训练集中,既包括程场景类图像,也包含对象类图像。对训练集中的图像显著图统计灰度直方图作为图像的特征。将这些特征和类标输入到SVM分类器训练分类模型。
在测试阶段,提取测试图像的显著图,计算显著图的灰度直方图,将灰度直方图输入到训练好的SVM中进行检测,判断图像库是对象类图像库还是场景类图像库。
实施例七
获得一幅图像直方图特征的matlab代码
为了更好地理解本发明,以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (10)
1.一种基于显著性的分类图像库的类型判断方法,包括训练过程和测试过程,其特征在于,所述训练过程包括以下步骤:
步骤1:选取对象类图像,类标为1;挑选场景类图像,类标为0;
步骤2:提取每幅图像的显著图;
步骤3:计算所述每幅图像显著图的灰度直方图;
步骤4:将图像的所述灰度直方图特征和对应的类标输入到SVM进行训练,得到训练模型。
2.如权利要求1所述的基于显著性的分类图像库的类型判断方法,其特征在于:所述显著图的计算过程包括以下步骤:
步骤21:对图像I进行多尺度的区域分割;
步骤22:对每个分割区域的外观特征提取及计算显著性;
步骤23:对所述显著图进行优化;
步骤24:对不同尺度下的所述显著图进行融合。
3.如权利要求2所述的基于显著性的分类图像库的类型判断方法,其特征在于:所述步骤21为对图像I,将其在N个尺度下做分割,R={Ri|1≤i≤N},其中i代表分割的尺度,i值越小,分割的尺度越小,图像分割的粒度越细。
4.如权利要求3所述的基于显著性的分类图像库的类型判断方法,其特征在于:所述外观特征包括颜色特征和纹理特征,所述颜色特征空间有RGB、HSV和L*a*b*。
5.如权利要求4所述的基于显著性的分类图像库的类型判断方法,其特征在于:所述步骤22包括分别计算所述三种颜色空间的平均颜色值和256为统计直方图特征。
6.如权利要求5所述的基于显著性的分类图像库的类型判断方法,其特征在于:采用的所述纹理特征为LBP特征和LM滤波池响应特征。
7.如权利要求6所述的基于显著性的分类图像库的类型判断方法,其特征在于:所述步骤23包括使用下面的目标函数进行所述显著图优化:
其中表示区域i优化后的显著值;s表示区域i未优化的显著值;区域i为待估计的目标区域;区域j为区域i的相邻区域;α是描述区域i与区域j空间关联关系的权重值。
8.如权利要求7所述的基于显著性的分类图像库的类型判断方法,其特征在于:所述权重值α的计算公式为
其中,Ri和Rj为分割后得到的区域,d为区域Ri和区域Rj的距离,σ2表示图像所有区域间距离的标准差。
9.如权利要求8所述的基于显著性的分类图像库的类型判断方法,其特征在于:所述区域Ri和区域Rj的距离d的定义如下:
其中,表示示区域Ri的边缘像素集合;表示区域Rj的边缘像素集合;边界强度ES(P)为区域Ri和区域Rj公共边缘中像素P点的UCM值。
10.如权利要求9所述的基于显著性的分类图像库的类型判断方法,其特征在于:所述步骤24为对于第i幅图像,在进行区域空间关联约束后,得到图像的(1......N)尺度的显著图采用线性模型将不同尺度下的显著图结果进行融合,
其中,S表示第i图像的融合显著图,S表示第i幅图像在尺度k下面的显著图,wk表示尺度k的权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810355420.XA CN108647703B (zh) | 2018-04-19 | 2018-04-19 | 一种基于显著性的分类图像库的类型判断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810355420.XA CN108647703B (zh) | 2018-04-19 | 2018-04-19 | 一种基于显著性的分类图像库的类型判断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108647703A true CN108647703A (zh) | 2018-10-12 |
CN108647703B CN108647703B (zh) | 2021-11-02 |
Family
ID=63746965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810355420.XA Expired - Fee Related CN108647703B (zh) | 2018-04-19 | 2018-04-19 | 一种基于显著性的分类图像库的类型判断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647703B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544568A (zh) * | 2018-11-30 | 2019-03-29 | 长沙理工大学 | 目标图像分割方法、装置及设备 |
CN110705653A (zh) * | 2019-10-22 | 2020-01-17 | Oppo广东移动通信有限公司 | 图像分类方法、图像分类装置及终端设备 |
CN113205153A (zh) * | 2021-05-26 | 2021-08-03 | 华侨大学 | 一种儿科肺炎辅助诊断模型的训练方法及训练所得的模型 |
CN115147746A (zh) * | 2022-09-02 | 2022-10-04 | 广东容祺智能科技有限公司 | 基于无人机遥感图像的盐碱地质识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120328161A1 (en) * | 2011-06-22 | 2012-12-27 | Palenychka Roman | Method and multi-scale attention system for spatiotemporal change determination and object detection |
CN103413303A (zh) * | 2013-07-29 | 2013-11-27 | 西北工业大学 | 基于联合显著性的红外目标分割方法 |
US20160004931A1 (en) * | 2014-04-29 | 2016-01-07 | International Business Machines Corporation | Extracting salient features from video using a neurosynaptic system |
CN106778506A (zh) * | 2016-11-24 | 2017-05-31 | 重庆邮电大学 | 一种融合深度图像和多通道特征的表情识别方法 |
-
2018
- 2018-04-19 CN CN201810355420.XA patent/CN108647703B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120328161A1 (en) * | 2011-06-22 | 2012-12-27 | Palenychka Roman | Method and multi-scale attention system for spatiotemporal change determination and object detection |
CN103413303A (zh) * | 2013-07-29 | 2013-11-27 | 西北工业大学 | 基于联合显著性的红外目标分割方法 |
US20160004931A1 (en) * | 2014-04-29 | 2016-01-07 | International Business Machines Corporation | Extracting salient features from video using a neurosynaptic system |
CN106778506A (zh) * | 2016-11-24 | 2017-05-31 | 重庆邮电大学 | 一种融合深度图像和多通道特征的表情识别方法 |
Non-Patent Citations (1)
Title |
---|
SONGHE FENG ET AL.: "Adaptive all-season image tag ranking by saliency-driven image pre-classification", 《J. VIS. COMMUN. IMAGE R.》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544568A (zh) * | 2018-11-30 | 2019-03-29 | 长沙理工大学 | 目标图像分割方法、装置及设备 |
CN110705653A (zh) * | 2019-10-22 | 2020-01-17 | Oppo广东移动通信有限公司 | 图像分类方法、图像分类装置及终端设备 |
CN113205153A (zh) * | 2021-05-26 | 2021-08-03 | 华侨大学 | 一种儿科肺炎辅助诊断模型的训练方法及训练所得的模型 |
CN113205153B (zh) * | 2021-05-26 | 2023-05-30 | 华侨大学 | 一种儿科肺炎辅助诊断模型的训练方法及训练所得的模型 |
CN115147746A (zh) * | 2022-09-02 | 2022-10-04 | 广东容祺智能科技有限公司 | 基于无人机遥感图像的盐碱地质识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108647703B (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7657089B2 (en) | Automatic classification of photographs and graphics | |
Gallagher et al. | Clothing cosegmentation for recognizing people | |
Yang et al. | Saliency detection via graph-based manifold ranking | |
CN102073748B (zh) | 一种基于视觉关键词的遥感影像语义检索方法 | |
CN109801256A (zh) | 一种基于感兴趣区域和全局特征的图像美学质量评估方法 | |
US9626585B2 (en) | Composition modeling for photo retrieval through geometric image segmentation | |
CN108647703A (zh) | 一种基于显著性的分类图像库的类型判断方法 | |
CN107730515A (zh) | 基于区域增长和眼动模型的全景图像显著性检测方法 | |
CN104680546A (zh) | 一种图像显著目标检测方法 | |
CN109034035A (zh) | 基于显著性检测和特征融合的行人重识别方法 | |
CN109271932A (zh) | 基于颜色匹配的行人再识别方法 | |
Sevilmiş et al. | Automatic detection of salient objects and spatial relations in videos for a video database system | |
CN107392254A (zh) | 一种通过联合嵌入从像素中构造图像的语义分割方法 | |
CN110414336A (zh) | 一种三元组边缘中心损失的深度互补分类器行人搜索方法 | |
CN109213886A (zh) | 基于图像分割和模糊模式识别的图像检索方法及系统 | |
Feng et al. | Beyond tag relevance: integrating visual attention model and multi-instance learning for tag saliency ranking | |
Shaikh et al. | A contemporary approach for object recognition based on spatial layout and low level features’ integration | |
CN107357834A (zh) | 一种基于视觉显著性融合的图像检索方法 | |
Hu et al. | Fast face detection based on skin color segmentation using single chrominance Cr | |
Jiang et al. | An ontology-based approach to retrieve digitized art images | |
Deshmukh et al. | Real-time traffic sign recognition system based on colour image segmentation | |
Zhou et al. | Modeling perspective effects in photographic composition | |
Liang et al. | Salient object detection based on regions | |
CN114708653A (zh) | 基于行人重识别算法的指定行人动作检索方法 | |
Misra et al. | Text extraction and recognition from image using neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211102 |
|
CF01 | Termination of patent right due to non-payment of annual fee |