CN103824079B - 基于多层次模式子块划分的图像分类方法 - Google Patents
基于多层次模式子块划分的图像分类方法 Download PDFInfo
- Publication number
- CN103824079B CN103824079B CN201410045527.6A CN201410045527A CN103824079B CN 103824079 B CN103824079 B CN 103824079B CN 201410045527 A CN201410045527 A CN 201410045527A CN 103824079 B CN103824079 B CN 103824079B
- Authority
- CN
- China
- Prior art keywords
- image
- sub
- block
- window
- description
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明提出一种基于多层次模式子块划分的图像分类方法,该方法包括以下步骤:提取图像多尺度下的显著性区域分布图,并根据显著性区域分布采样不同位置和大小的窗口;对图像实施超像素分割,通过分析每个窗口与其内外邻近超像素的位置和分布关系确定每个窗口出现目标的概率,构造多层次模式子块;对每一个子块做多字典特征描述,然后将其组织为张量模式用做图像的特征描述;对图像的张量描述做典范相关分析,提取图像特征向量,最后通过分类器进行分类。多层次模式子块划分,充分考虑了复杂图像中目标的整体性和层次性,一方面实现同一目标模式信息的集中描述,另一方面实现了不同目标模式信息的显著性描述。在公测图像库上的实验结果,证实了我们的方法的有效性。
Description
技术领域
本发明属于图像处理领域,具体涉及一种基于多层次模式子块划分的图像分类方法。
背景技术
随着多媒体技术的发展,图像、视频等多媒体数据急剧增长,如何快速、有效的将图像分门别类,是当前多媒体技术研究热点之一。就图像分类而言,虽然不同的应用背景有着不同的分类目标与评价标准,然而所有的图像分类应用都需要首先进行图像的描述,并且针对不同的应用通常要选择不同的图像描述方法。图像描述通俗讲就是利用一组数据来表示一幅图像,这组数据可以是向量的形式,也可以是矩阵的形式,它是图像信息的一种抽象表达,是做图像分析的重要模块之一。自然场景图像中的图像内容复杂多变,图像中通常会出现多个目标信息,因此准确刻画图像中出现的模式信息,是实现图像准确分类的前提。
传统方法中通常是将图像分为不同尺度下的方块,然后通过描述图像中各个子块的信息来表达图像中的纹理信息和位置分布信息。这种图像描述方法没有表达出图像中的模式信息和目标显著性信息,从而导致对图像描述不够准确。此外,这种方法还存在图像中同一目标物被拆分开来的问题,使得同一目标物在场景中不同位置出现会形成完全不同的特征描述,因此,缺乏对图像中目标整体信息的描述。
发明内容
为了克服已有技术的不足,本发明的目的在于设计一种带有图像模式子块分布信息的图像分类方法,提出一个图像信息更加丰富的图像描述方法,适合于多目标图像场景的分类。为此,本发明提供一种基于多层次模式子块划分的图像分类方法。
为达到所述目的,本发明提供一种基于多层次模式子块划分的图像分类方法,该方法的图像分类步骤如下:
步骤S1:提取图像多尺度下的显著性区域分布图,并根据显著性区域分布采样不同位置和大小的窗口;
步骤S2:对图像实施超像素分割,通过分析每个窗口与其内外邻近超像素的位置和分布关系确定每个窗口出现目标的概率,构造多层次模式子块;
步骤S3:对每一个子块做多字典特征描述,然后将其组织为张量模式用做图像的特征描述;
步骤S4:对图像的张量描述作典范相关分析,提取图像特征向量,最后通过分类器进行分类。
本发明针对图像分类问题,通过显著图和超像素分割将图像划分为对应不同显著度的多层次模式子块。对每一个子块做多特征字典描述,将图像构造为一个三阶张量描述,利用张量典范相关分析提取图像的特征向量,最后通过分类器进行分类。在公测数据库上的实验结果表明,本发明的基于多层次模式子块划分的图像分类方法,有效提高了图像分类的准确率。
附图说明
图1是本发明所述图像分类方法的分类框图;
图2是多层显著图提取结果;
图3是图像超像素划分结果;
图4是显著图窗口与超像素跨越关系图;
图5是多层次模式子块划分结果图;
图6是图像张量描述结构图;
图7是基于多层次模式子块划分图像分类方法在Pascal Voc2007图像库中前10类的分类准效果;
图8是基于多层次模式子块划分图像分类方法在Pascal Voc2007图像库中后10类的分类准效果。
具体实施方式
为了更清楚的表述本发明的目的、技术方案和优势,下面结合具体例子,对本发明具体实施方式做进一步的说明。
本发明利用显著图和超像素分割结果构造多层次模式子块划分,提出了一个有效的图像分类方法。图1所示为本发明基于多层次模式子块划分图像分类方法的分类框架,主要包括图像多层次模式子块划分、图像张量描述、张量描述下图像特征提取以及利用分类器分类等几个模块。参照图1,具体实施步骤如下:
(一)多层次模式子块划分
首先,计算图像多尺度下的显著性区域分布,图2示出了三个尺度下的显著图,并根据显著性区域分布采样不同位置和大小的T个窗口;然后我们采用均值漂移方法对图像的Lab特征及位置特征进行分析和聚类来实现超像素分割,图3示出了超像素划分的结果。最后通过分析每个窗口与其内外邻近超像素的位置和分布关系确定每个窗口出现目标的概率,进而实现模式子块的提取,即定位图像中的多个目标物以及对应的外接窗口。为实现准确定位,对窗口与超像素的关系分析如下:
所有潜在目标窗口由显著性区域的分布生成,反映了图像中的潜在目标区域,因此显著图中每一个窗口w中含有度量窗口内出现显著目标程度的信息。我们利用超像素将图像分割为颜色、纹理相似的多个小区域,超像素划分需满足每一个超像素块中的像素属于同一个目标物,但一个目标物中可包含多个超像素。强边界目标下超像素不会跨越目标的边界,因此超像素具有保持目标边界的作用。由于显著图生成的窗口与超像素间的位置分布各异,为了保证窗口中目标物的完整性并使得窗口最大程度的贴合目标物,设计公式(1)所示的度量方式来计算窗口与窗内目标物的紧贴程度,窗口越贴近目标物,SW值越大。
公式(1)中w为窗口,s为超像素,SN为与w相邻接的超像素集合,sin_w为超像素位于w内的部分,sout_w为超像素位于w外的部分,Sall_in_w为w内所有超像素。参考图4中所示,式(1)中第一项表示窗口w邻接的所有超像素与窗口边界的跨越程度,假设s1,s2,s3为与窗口w1邻接的某三个超像素。当SN中所有超像素完全位于w1内时(如超像素s3),各超像素的sout_w部分面积为0,因此
此时第一项取得最大值1。当超像素的大部分位于w1内(如超像素s2)或超像素的小部分位于w1内时(如超像素s1),超像素对窗口w1边界的跨越性较小,第一项取得的值较大。当超像素位于窗口内外部分相当时(如超像素s1相对于w2),窗口对目标的贴近性不好,第一项取得的值较大。公式(1)中第二项表示超像素s位于窗口内部分与窗内所有超像素分布的相似程度,越大则表示该窗口对目标的整体包含程度比较好。第三项表示超像素s位于窗外部分与窗内所有超像素分布的相似程度,越大则表示该窗口对目标的整体包含程度较差。计算相似度时,将sin_w,sout_w,Sall_in_w表示为由均值和方差描述的高斯分布。sim(·,·)由χ2距离来度量,定义如下:
通过比较每个窗口的SW值,得到前n个出现目标概率最大的窗口w1,w2,w3,...,wn,每个窗口代表一个模式子块,进而构建图像的多层次模式子块。若为三层,则第一个层次中将原图视作一个整体子块;第二个层次中将图像粗划分为两个模式块,其中一块为图像中最显著目标窗W1,另一块为图像中剩余区域;第三个层次中将图像划分为三个模式块,其中两块分别代表最显著子块与次显著子块,即图中前两个最显著目标窗w1,w2,第三块为图像中除去前两个窗的剩余区域I-w1∪w2。图5中所示为三层模式子块划分的结果。我们所使用的图像多层次模式子块划分方法既能够表达图像中的显著信息,又具有基本的模式信息在里面。
(二)图像模式信息的张量描述
我们使用尺度不变子特征字典D1、颜色分布特征字典D2和纹理特征字典D3,三个特征字典分别描述每层中每个模式子块。将所有训练集图像中通过高斯差分和局部值极大检测到的特征点的尺度不变N维特征描述子聚类,得到大小为K的特征字典D1=[d1,...,dk]∈RN×K。按前面的多层次模式子块划分方法将训练图集中每一幅图像划分为不同层次的模式子块,统计每一子块的Lab颜色空间特征,用均值和方差表示每一个颜色分量,得到6维特征向量[μL,σL,μa,σa,μb,σb]T,若有n幅训练集图像,每幅图像分为m个层次,则共有n×(1+m)×m/2个子块,将所有子块特征向量同样聚类为K个中心,得到特征字典D2∈R6×K。将训练集样本图片划分成8×8的子块,并将其拉伸为64维向量,聚类得到最终的纹理特征字典D2∈R64 ×K。
针对不同的特征字典,构造模式子块相应的特征集合X,利用对应的特征字典,通过稀疏约束向量量化的方法得到系数矩阵U=[u1,...,uM]∈RK×M,向量量化求解如式(4)所示。
进而构造X的特征向量F=[f1,f2,...fk],其中,
fj=max{|uj1|,|uj2|,...,|ujM|} (5)
将所有子块在某个特征字典描述下的特性向量F作为行向量组合在一起,便构成了一个特征矩阵。结合反映图像不同特征信息的多个字典模型,可将图像描述为三阶张量Ψ∈RN×K×P,如图6所示,其中第一阶为不同层次下模式子块的总个数N,第二阶为在某个特征字典描述下的K维特征向量,第三阶为反映图像中不同特征信息的特征字典个数P,这里为3。
(三)张量描述下图像特征提取
图像经过特征字典集描述后得到张量描述Ψ∈RN×K×P。张量模式下的典范相关分析可以度量两个张量数据间的相似度,对于两个三阶张量Ψ1,Ψ2∈RN×K×P,我们在单模共享模式下,来做张量典范相关分析,即张量中只有一模是共享的,对其他未共享的两模作典范变换,寻找
Φ=[{(u1 k,v1 k),(u1 p,v1 p)},{(u2 n,v2 n),(u2 p,v2 p)},{(u3 n,v3 n),(u3 k,v3 k)}] (6)
使得 其中:
(X')NKP=(Ψ1×ku1 k×pu1 p)n(Ψ1×nu2 n×pu2 p)k(Ψ1×nu3 n×ku3 k)p (7)
(Y')NKP=(Ψ2×kv1 k×pv1 p)n(Ψ2×nv2 n×pv2 p)k(Ψ2×nv3 n×kv3 k)p (8)
例如,当共享张量Ψ∈RN×K×P第一模时,通过交迭SVD方法求解下式:
可获得典范方向正交集{(Uk,Vk),(Up,Vp)}(其中{(uk,vk∈RK),(up,vp∈RP)}为U,V中列向量),得到d个典范相关值(ρ1,...ρd),d<min(K,P)。因此,通过张量典范相关分析,得到了6×d个典范相关特征(两种共享模式分别产生3×d个特征),每个特征都代表了数据中不同语义方面的相似度。得到了特征向量便可以用来训练分类器和实施分类。
张量描述的优势在于它是传统向量模式的扩展和补充,相比于向量模式,张量可以更好的反映数据原有状态下的模式,而且维数和复杂度也会降低。因此,该描述方式可以避免产生高维特征描述。它既可以刻画同一阶内的关系,如各模式子块间关系,又能刻画不同阶之间的对应关系,如不同特征字典对同一子块的特征描述之间的关系。因此,图像模式信息的三阶张量描述不仅使得在图像中不同模式信息的表示更为集中,呈现出分辨性强的稀疏特性,而且对图像特征信息的刻画呈现立体性,使得表征图像中的多种特征信息得以充分利用。
实施效果
为展示本发明的基于多层次模式子块划分的图像分类方法的效果,在本实施方案中采用的测试图像集为Pascal Voc07,该图像库有20类图像,9963幅图片,该图像库中的图片的特点是既有室内也有室外图像,有特写镜头也有室外风景,并且存在各种拍摄角度。此外,目标尺寸变化也较大,并且除了待识别目标物之外还存在着多个干扰目标。实验中,模式子块划分层数为3层,图像库中50%用于训练和交叉验证,剩余50%用于测试,分类器选择为支持向量机。图7所示为1至10类上的图像分类效果,图8所示为11至20类上的图像分类效果。二十类图像顺序依次为:飞机、自行车、鸟、船、瓶子、公交车、小汽车、猫、椅子、牛、餐桌、狗、马、摩托车、人、植物、羊、沙发、火车、显示屏。分类效果评价指标采用平均准确率方法(Average Precision,简称AP),该方法是PASCAL比赛中标准指标,通过计算查准率(Precision)/查全率(Recall)曲线下方面积获得,值越高效果越好。本发明所述多层次模式子块划分图像分类方法为“方法A”,Pascal VOC07比赛中图像分类组中基于图像划分方法的为“方法B”。
以上所述仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的权利要求书的保护范围内。
Claims (4)
1.一种基于多层次模式子块划分的图像分类方法,其特征在于,该图像分类方法的步骤如下:
步骤S1:提取图像多尺度下的显著性区域分布图,并根据显著性区域分布采样不同位置和大小的窗口;
步骤S2:对图像实施超像素分割,通过分析每个窗口与其内外邻近超像素的位置和分布关系确定每个窗口出现目标的概率,构造多层次模式子块;
步骤S3:对每一个子块做多字典特征描述,然后将其组织为张量模式用做图像的特征描述;步骤S4:对图像的张量描述做典范相关分析,提取图像特征向量,最后通过分类器进行分类。
2.根据权利要求1所述的基于多层次模式子块划分的图像分类方法,其特征在于,通过计算多尺度显著图分布和超像素的跨越关系,提取图像不同层次下的潜在目标区域。
3.根据权利要求1所述的基于多层次模式子块划分的图像分类方法,其特征在于,多层次模式子块划分是指:假设将图像分三个层次来分别提取模式子块,第一个层次中将原图视作一个整体子块;第二个层次中将图像粗划分为两个模式块,其中一块为图像中最显著区域所在的子块,另一块为图像中剩余区域;第三个层次中将图像划分为三个模式块,其中两块分别代表最显著子块与次显著子块,剩余区域为第三块。
4.根据权利要求1所述的基于多层次模式子块划分的图像分类方法,其特征在于,对每一个子块做多字典特征描述,然后将其组织为三阶张量模式用做图像的特征描述。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410045527.6A CN103824079B (zh) | 2014-02-08 | 2014-02-08 | 基于多层次模式子块划分的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410045527.6A CN103824079B (zh) | 2014-02-08 | 2014-02-08 | 基于多层次模式子块划分的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103824079A CN103824079A (zh) | 2014-05-28 |
CN103824079B true CN103824079B (zh) | 2017-02-01 |
Family
ID=50759131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410045527.6A Expired - Fee Related CN103824079B (zh) | 2014-02-08 | 2014-02-08 | 基于多层次模式子块划分的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103824079B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680181B (zh) * | 2015-03-09 | 2018-03-20 | 西安电子科技大学 | 基于似然比特征的sar图像超像素分割方法 |
CN106651937B (zh) * | 2016-10-19 | 2019-10-18 | 成都电科智达科技有限公司 | 一种基于超像素和场景预测的小型无人机目标检测方法 |
CN108319952B (zh) * | 2017-01-16 | 2021-02-02 | 浙江宇视科技有限公司 | 一种车辆特征提取方法及装置 |
CN109214235A (zh) * | 2017-06-29 | 2019-01-15 | 沈阳新松机器人自动化股份有限公司 | 室外场景分类方法及系统 |
CN108122237A (zh) * | 2017-12-25 | 2018-06-05 | 北京中科慧眼科技有限公司 | 一种基于超像素生成的行车环境图像分割方法与装置 |
CN108764301B (zh) * | 2018-05-07 | 2019-11-26 | 石家庄铁道大学 | 一种基于反向稀疏表示的混凝土裂缝检测方法 |
CN109117852B (zh) * | 2018-07-10 | 2021-08-17 | 武汉大学 | 基于稀疏表示的无人机图像适配区自动提取方法及系统 |
CN110717354B (zh) * | 2018-07-11 | 2023-05-12 | 哈尔滨工业大学 | 基于半监督k-svd与多尺度稀疏表示的超像元分类方法 |
CN109886937B (zh) * | 2019-01-29 | 2021-08-03 | 国家电网有限公司 | 基于超像素分割图像识别的绝缘子缺陷检测方法 |
CN116993947B (zh) * | 2023-09-26 | 2023-12-12 | 光谷技术有限公司 | 一种三维场景可视化展示方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103413120A (zh) * | 2013-07-25 | 2013-11-27 | 华南农业大学 | 基于物体整体性和局部性识别的跟踪方法 |
-
2014
- 2014-02-08 CN CN201410045527.6A patent/CN103824079B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103413120A (zh) * | 2013-07-25 | 2013-11-27 | 华南农业大学 | 基于物体整体性和局部性识别的跟踪方法 |
Non-Patent Citations (2)
Title |
---|
图像通用目标的无监督检测;宋修锐等;《光学精密工程》;20140131;全文 * |
非类别限定的物体识别学习模型构建;高永强;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130115;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103824079A (zh) | 2014-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103824079B (zh) | 基于多层次模式子块划分的图像分类方法 | |
CN109344736B (zh) | 一种基于联合学习的静态图像人群计数方法 | |
CN106547880B (zh) | 一种融合地理区域知识的多维度地理场景识别方法 | |
CN111080629A (zh) | 一种图像拼接篡改的检测方法 | |
CN111127493A (zh) | 基于注意力多尺度特征融合的遥感图像语义分割方法 | |
CN111126202A (zh) | 基于空洞特征金字塔网络的光学遥感图像目标检测方法 | |
CN107133955B (zh) | 一种多层次结合的协同显著性检测方法 | |
CN109840521A (zh) | 一种基于深度学习的一体化车牌识别方法 | |
CN109284704A (zh) | 基于cnn的复杂背景sar车辆目标检测方法 | |
CN108647602B (zh) | 一种基于图像复杂度判定的航空遥感图像场景分类方法 | |
CN101833664A (zh) | 基于稀疏表达的视频图像文字检测方法 | |
CN108960404B (zh) | 一种基于图像的人群计数方法及设备 | |
CN110826389B (zh) | 基于注意力3d频率卷积神经网络的步态识别方法 | |
CN106203522B (zh) | 基于三维非局部均值滤波的高光谱图像分类方法 | |
CN111626993A (zh) | 一种基于嵌入式FEFnet网络的图像自动检测计数方法及系统 | |
CN111639587B (zh) | 基于多尺度谱空卷积神经网络的高光谱图像分类方法 | |
Liu et al. | Deep learning based research on quality classification of shiitake mushrooms | |
CN110163213A (zh) | 基于视差图和多尺度深度网络模型的遥感图像分割方法 | |
CN102968637A (zh) | 一种复杂背景图像文字分割方法 | |
CN104657980A (zh) | 一种改进的基于Meanshift的多通道图像分割算法 | |
CN109886147A (zh) | 一种基于单网络多任务学习的车辆多属性检测方法 | |
CN110009015A (zh) | 基于轻量化网络和半监督聚类的高光谱小样本分类方法 | |
CN112699717A (zh) | 基于gan网络的sar图像生成方法及生成装置 | |
CN105989336A (zh) | 基于带权重的解卷积深度网络学习的场景识别方法 | |
CN107067037B (zh) | 一种使用llc准则定位图像前景的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170201 Termination date: 20190208 |
|
CF01 | Termination of patent right due to non-payment of annual fee |