CN105931241B - 一种自然场景图像的自动标注方法 - Google Patents

一种自然场景图像的自动标注方法 Download PDF

Info

Publication number
CN105931241B
CN105931241B CN201610256309.6A CN201610256309A CN105931241B CN 105931241 B CN105931241 B CN 105931241B CN 201610256309 A CN201610256309 A CN 201610256309A CN 105931241 B CN105931241 B CN 105931241B
Authority
CN
China
Prior art keywords
pixel
super
conspicuousness
image
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610256309.6A
Other languages
English (en)
Other versions
CN105931241A (zh
Inventor
杨明
李志青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Youlixin Technology Co.,Ltd.
Original Assignee
Nanjing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Normal University filed Critical Nanjing Normal University
Priority to CN201610256309.6A priority Critical patent/CN105931241B/zh
Publication of CN105931241A publication Critical patent/CN105931241A/zh
Application granted granted Critical
Publication of CN105931241B publication Critical patent/CN105931241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种自然场景图像的自动标注方法,属于计算机视觉领域。该方法包括如下步骤:提取图像特征;采用无监督算法分割原图像产生超像素图;通过CRF建模像素标注模型并在模型中嵌入显著性先验信息;求解模型实现像素标注。本发明采用CRF作为基本模型,在CRF模型中引入显著性检测先验信息,通过显著性检测实现前景目标与背景的分离并在前景目标区域构建超像素间全连接关联关系。由于引入了显著性检测先验信息,有效提高了图像中前景目标的分类精度,于此同时,前景区域和背景区域的分离有效解决了前景与背景的分类“串扰”问题。因而,本方法可有效地提高像素标注的整体分类精度,针对前景目标轮廓相对复杂、各子区域间颜色纹理差异较大的场景效果显著。

Description

一种自然场景图像的自动标注方法
技术领域
本发明属于计算机视觉领域,特别涉及一种自然场景图像的自动标注方法。
背景技术
近年来,计算机视觉中的图像理解获得了迅速发展并在许多领域取得了广泛应用,受到广大学者的广泛关注。现有场景图像标注算法往往以无向图模型条件随机场CRF(Conditional Random Field)为基本框架,通过在条件随机场CRF中引入局部平滑,位置,共现,互斥等上下文先验信息实现像素标注。现有上下文先验信息的引入虽在一定程度上增强了模型描述能力,但仍然存在不足,难以有效提高分类精度尤其是前景目标的分类精度。经研究发现,现有图像理解算法难以有效提高像素标注精度的原因主要有:
1.在场景图像理解中,背景(天空,草地…)区域纹理特征相对一致,变化较小,分类相对容易。
2.前景目标(人,动物,建筑,船…)尺寸相对较小且轮廓复杂,在前景目标边缘区域过平滑问题严重,易导致前景背景分类“串扰”。
3.单个前景目标内部各子区域间的颜色纹理特征差异较大,易导致各子区域间分类不一致。
目前在图像理解问题中,背景目标的分类相对容易,精度较高,而关键前景目标的分类精度欠佳。现有算法通过在CRF中引入上下文先验信息虽在一定程度上提高了像素标注的总体分类精度,但对于相对复杂的前景目标分类效果欠佳。
发明内容
本发明为解决图像标注中复杂前景目标分类精度不高的问题,提出了一种自然场景图像的自动标注方法,可有效解决前景目标与背景分类的串扰问题及由于前景目标内部各子区域间的颜色纹理特征差异较大导致的各子区域间分类不一致问题。
本发明采用的技术方案如下:
一种自然场景图像的自动标注方法,包括如下步骤:
步骤1,提取图像特征;
步骤2,采用无监督算法分割原图像产生超像素图;
步骤3,通过CRF建模像素标注模型并在模型中嵌入显著性先验信息;
步骤4,求解模型实现像素标注。
所述步骤3中,在模型中嵌入显著性先验信息包括以下步骤:
①通过显著性检测算法计算图像像素显著性映射,并基于显著性映射采用阈值法分割出前景区域和背景区域;
②在前景区域以超像素为基本分类单元,并采用前景区域超像素类别分布和超像素内像素平均分布的加权和作为前景区域超像素类别分布;
③构建前景区域超像素间全连接关联关系,通过任意两个超像素间颜色直方图和位置特征的高斯核线性组合建模超像素间相似性,具体形式为:
其中i,j为超像素索引,hi,hj为超像素颜色直方图,pi,pj为超像素中心位置在图像中的位置,θ12为高斯核参数,w1,w2为高斯核线性组合系数,[ci≠cj]为指示函数,其具体形式为:
其中ci,cj分别为超像素i,j的类别标记;
④前景区域分别采用步骤②和③建模超像素一阶势能和二阶势能,并结合背景区域单像素一阶势能,二阶平滑项及高阶势能构建CRF分类模型。
其中,步骤①基于显著性映射采用阈值法分割出前景区域和背景区域,具体包括如下步骤:
步骤31,设定最小像素显著性阈值η,统计显著性映射图像中显著性映射大于η的显著性像素;
步骤32,设定最小超像素显著性阈值γ,统计所有超像素中显著性像素占该超像素的比例,若该比例值大于阈值γ,则该超像素为显著性超像素,所有显著性超像素组成的区域即为前景区域。
本发明采用CRF作为基本模型,在CRF模型中引入显著性检测先验信息,通过显著性检测实现前景目标与背景的分离并在前景目标区域构建超像素间全连接关联关系。与现有技术相比,本发明具有以下特征:
首先,本发明实现了前景与背景的分离,通过在前景目标和背景区域分别建模,相对有效地防止了在前景和背景边缘处的“串扰”问题,因而可有效提高总体分类精度。
其次,本发明通过阈值算法分割出前景目标后,通过在前景目标区域构建超像素全连接关联关系,并将该关联关系作为二阶势能引入CRF框架。超像素全连接将前景目标作为一个整体约束在一起,可有效解决复杂由于前景目标中局部子区域间纹理颜色特征差异较大导致的前景目标内部分类不一致问题,从而可有效提高前景目标分类精度和像素标注总体精度。该方法针对前景目标轮廓相对复杂、各子区域间颜色纹理差异较大的场景效果显著。
附图说明
图1为本发明整体流程图。
图2为本发明中构建引入显著性检测先验的图像理解模型子流程图。
图3为本发明中显著性前景目标分割步骤子流程图。
具体实施方式
以下结合附图说明本发明的具体实施方式。
如图1所示,本发明公开了一种自然场景图像的自动标注方法,需要说明的是,本发明的核心步骤是在CRF模型中嵌入显著性检测先验信息,具体实施方式的描述主要侧重于步骤3,步骤1,2以及步骤4未公开的内容可采用已有技术实现,具体描述如下:
1.提取图像特征:
特征提取是目标识别及图像理解等视觉任务的重要内容之一,其往往通过将像素的颜色及采用滤波获得的周围纹理等特征值组成向量来表征该像素点(或超像素),有效地对具有判别性的特征提取是获得高准确率的基础,具体可采用现有方法实现图像特征提取,如:首先提取图像纹理特征(基于高斯滤波器组)、Sift特征及LBP等特征描述,进而通过Kmeans等聚类算法对各个特征描述进行聚类以构建图像视觉字并基于该视觉字构建像素特征描述。
2.采用无监督算法过分割原图像产生超像素图:
本发明所构建的模型中涉及高阶建模及前景目标区域中超像素稠密连接,因此需采用无监督分割算法分割原图像产生超像素分割。具体分割算法可采用现有MeanShift算法实现图像分割。
3.通过CRF建模像素标注模型并在分类模型中嵌入显著性先验信息:
针对复杂前景目标中由于局部子区域间颜色纹理差异较大而导致的各子区域分类不一致问题,本发明提出了在CRF模型中嵌入显著性检测先验信息方法。通过显著性信息分割出前景目标,进而建立前景目标各子区域间全连接关联关系并将该全连接关联关系作为二阶势能项引入CRF模型。前景区域超像素全连接关联关系可有效地将复杂前景目标各子区域作为一个整体约束在一起,可有效解决由于局部子区域间颜色纹理差异较大而导致的各子区域分类不一致问题,从而可有效提高前景目标分类精度。同时本方法采用将前景区域和背景区域分离的方式,可有效解决前景和背景分类中的“串扰”问题,故可提高整体分类精度。
给定训练样本集D={{I1,L1},{I2,L2},...{Ik,Lk}...,{IN,LN}},N为训练图像数,Ik表示图像数据,Lk为图像Ik对应的像素标注数据。如图2所示,CRF模型中嵌入显著性先验信息的建模过程如下:
①通过显著性检测算法计算图像像素显著性映射,并基于显著性映射采用阈值法分割出前景和背景;
②在前景区域以超像素作为基本分类单元,并采用前景区域超像素类别分布和超像素内像素平均分布的加权和作为前景区域超像素类别分布。由于前景区域像素数目较多,为降低模型复杂度,故以超像素作为基本分类单元。在一阶势能中,单个像素关于目标的分布比采用超像素训练得到的目标类别分布更准确,故本发明采用前景区域超像素类别分布和该超像素内所有像素的平均分布的加权和作为该超像素的类别分布以提高超像素分类精度。超像素类别分布计算如下:
上式中的lamda即为加权系数,表示前景区域超像素ci的目标类别分布,ψi为超像素ci内像素i的目标类别分布。
③构建前景区域超像素间全连接关联关系,通过任意两个超像素间颜色直方图和位置特征的高斯核线性组合建模超像素间相似性,具体形式为:
其中i,j为超像素索引,hi,hj为超像素颜色直方图,pi,pj,θ12为高斯核参数,可采用经验值设置。w1,w2为高斯核线性组合系数,可通过网格搜索进行优化。[ci≠cj]为指示函数,其具体形式为:
其中ci,cj分别为超像素i,j的类别标记。
④前景区域分别采用步骤②和③建模超像素一阶势能和二阶势能。为实现图像标注,结合背景区域单像素一阶势能,二阶平滑项及高阶势能,进而构建像素标注模型,其形式如式子(4)所示:
(4)式中λ123分别为像素一阶势能,平滑项及超像素高阶势能项的影响因子,V表示像素位置集合,i为像素索引,SP分割出的前景目标区域即前景目标超像素集合,ci,cj即为前景目标区域超像素索引。前三项针对背景区域建模,分别为像素势能,位置相邻像素平滑项和背景区域超像素高阶势能项,该三项势能函数计算可通过现有技术实现(如:可通过训练Boost分类器构建像素及超像素一阶势能)。(4)式中最后两项即为本发明提出的通过显著性检测构建的前景目标区域超像素全连接势能项,分别为前景超像素一阶势能函数和前景区域超像素全连接势能函数。
4.求解模型(4)实现像素标注,由式(2)可知,模型(4)满足子模性,故可通过图割法求解。

Claims (2)

1.一种自然场景图像的自动标注方法,其特征在于,包括如下步骤:
步骤1,提取图像特征;
步骤2,采用无监督算法分割原图像产生超像素图;
步骤3,通过CRF建模像素标注模型并在模型中嵌入显著性先验信息;
步骤4,求解模型实现像素标注;
其中,所述步骤3中,在模型中嵌入显著性先验信息包括以下步骤:
①通过显著性检测算法计算图像像素显著性映射,并基于显著性映射采用阈值法分割出前景区域和背景区域;
②在前景区域以超像素为基本分类单元,并采用前景区域超像素类别分布和超像素内像素平均分布的加权和作为前景区域超像素类别分布;
③构建前景区域超像素间全连接关联关系,通过任意两个超像素间颜色直方图和位置特征的高斯核线性组合建模超像素间相似性,具体形式为:
其中i,j为超像素索引,hi,hj为超像素颜色直方图,pi,pj为超像素中心位置在图像中的位置,θ12为高斯核参数,w1,w2为高斯核线性组合系数,[ci≠cj]为指示函数,其具体形式为:
其中ci,cj分别为超像素i,j的类别标记;
④前景区域分别采用步骤②和③建模超像素一阶势能和二阶势能,并结合背景区域单像素一阶势能,二阶平滑项及高阶势能构建CRF分类模型。
2.如权利要求1所述的一种自然场景图像的自动标注方法,其特征在于,步骤①基于显著性映射采用阈值法分割出前景区域和背景区域,具体包括如下步骤:
步骤31,设定最小像素显著性阈值η,统计显著性映射图像中显著性映射大于η的显著性像素;
步骤32,设定最小超像素显著性阈值γ,统计所有超像素中显著性像素占该超像素的比例,若该比例值大于阈值γ,则该超像素为显著性超像素,所有显著性超像素组成的区域即为前景区域。
CN201610256309.6A 2016-04-22 2016-04-22 一种自然场景图像的自动标注方法 Active CN105931241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610256309.6A CN105931241B (zh) 2016-04-22 2016-04-22 一种自然场景图像的自动标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610256309.6A CN105931241B (zh) 2016-04-22 2016-04-22 一种自然场景图像的自动标注方法

Publications (2)

Publication Number Publication Date
CN105931241A CN105931241A (zh) 2016-09-07
CN105931241B true CN105931241B (zh) 2018-08-21

Family

ID=56838908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610256309.6A Active CN105931241B (zh) 2016-04-22 2016-04-22 一种自然场景图像的自动标注方法

Country Status (1)

Country Link
CN (1) CN105931241B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106558058B (zh) * 2016-11-29 2020-10-09 北京图森未来科技有限公司 分割模型训练方法、道路分割方法、车辆控制方法及装置
CN109427068A (zh) * 2017-08-30 2019-03-05 新加坡国立大学 基于超像素自动标注的深度学习共分割方法
CN107578069B (zh) * 2017-09-18 2020-12-29 北京邮电大学世纪学院 图像多尺度自动标注方法
CN107909081B (zh) * 2017-10-27 2022-04-08 东南大学 一种深度学习中图像数据集的快速获取和快速标定方法
CN108038857B (zh) * 2017-12-25 2018-10-12 北京航空航天大学 一种基于语义信息与边缘约束的前景目标检测方法
CN108921086A (zh) * 2018-06-29 2018-11-30 Oppo广东移动通信有限公司 图像处理方法和装置、存储介质、电子设备
CN109492686A (zh) * 2018-11-01 2019-03-19 郑州云海信息技术有限公司 一种图片标注方法与系统
CN109522908B (zh) * 2018-11-16 2023-04-14 辽宁工程技术大学 基于区域标签融合的图像显著性检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077609A (zh) * 2014-06-27 2014-10-01 河海大学 一种基于条件随机场的显著性检测方法
US8873812B2 (en) * 2012-08-06 2014-10-28 Xerox Corporation Image segmentation using hierarchical unsupervised segmentation and hierarchical classifiers
CN104239522A (zh) * 2014-09-17 2014-12-24 西安电子科技大学 一种基于图像间内容约束的超像素编码图像检索方法
CN104463870A (zh) * 2014-12-05 2015-03-25 中国科学院大学 一种图像显著区域检测方法
CN105321176A (zh) * 2015-09-30 2016-02-10 西安交通大学 一种基于分层高阶条件随机场的图像分割方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090216739A1 (en) * 2008-02-22 2009-08-27 Yahoo! Inc. Boosting extraction accuracy by handling training data bias

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8873812B2 (en) * 2012-08-06 2014-10-28 Xerox Corporation Image segmentation using hierarchical unsupervised segmentation and hierarchical classifiers
CN104077609A (zh) * 2014-06-27 2014-10-01 河海大学 一种基于条件随机场的显著性检测方法
CN104239522A (zh) * 2014-09-17 2014-12-24 西安电子科技大学 一种基于图像间内容约束的超像素编码图像检索方法
CN104463870A (zh) * 2014-12-05 2015-03-25 中国科学院大学 一种图像显著区域检测方法
CN105321176A (zh) * 2015-09-30 2016-02-10 西安交通大学 一种基于分层高阶条件随机场的图像分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
L’ubor Ladick'y 等.Associative Hierarchical CRFs for Object Class Image Segmentation.《2009 IEEE 12th International Conference on Computer Vision (ICCV)》.2009, *
基于条件随机场和图像分割的显著性检测;钱生 等;《自动化学报》;20150430;第41卷(第4期);第711、713页 *

Also Published As

Publication number Publication date
CN105931241A (zh) 2016-09-07

Similar Documents

Publication Publication Date Title
CN105931241B (zh) 一种自然场景图像的自动标注方法
CN106250895B (zh) 一种光学遥感图像感兴趣区域检测方法
CN108537239B (zh) 一种图像显著性目标检测的方法
CN109522908A (zh) 基于区域标签融合的图像显著性检测方法
CN107527054B (zh) 基于多视角融合的前景自动提取方法
CN110633708A (zh) 一种基于全局模型和局部优化的深度网络显著性检测方法
CN109558806A (zh) 高分遥感图像变化的检测方法和系统
CN105740945A (zh) 一种基于视频分析的人群计数方法
Ji et al. Parallel fully convolutional network for semantic segmentation
CN109685045A (zh) 一种运动目标视频跟踪方法及系统
CN104123554A (zh) 基于mmtd的sift图像特征提取方法
CN111091129A (zh) 一种基于多重颜色特征流形排序的图像显著区域提取方法
CN113705579A (zh) 一种视觉显著性驱动的图像自动标注方法
CN106203448A (zh) 一种基于非线性尺度空间的场景分类方法
CN112258525A (zh) 一种基于鸟类高帧频序列图像丰度统计和种群识别算法
Zheng et al. Category-wise fusion and enhancement learning for multimodal remote sensing image semantic segmentation
Schulz et al. Object-class segmentation using deep convolutional neural networks
CN105844299B (zh) 一种基于词袋模型的图像分类方法
Zhang et al. Plant species recognition based on deep convolutional neural networks
Cheng et al. Power pole detection based on graph cut
CN106340038B (zh) 一种基于单目图像中物体的深度次序推理方法
Sun et al. Contextual models for automatic building extraction in high resolution remote sensing image using object-based boosting method
CN113506253B (zh) 一种基于多层多核学习与区域合并的砂岩孔隙检测方法
Sima et al. Texture superpixels merging by color-texture histograms for color image segmentation
Zhang et al. BP-net: deep learning-based superpixel segmentation for RGB-D image

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190605

Address after: 214400 A604, 159 Chengjiang Middle Road, Jiangyin City, Wuxi City, Jiangsu Province

Patentee after: JIANGSU YOUSHENG INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 210097 Ninghai Road, Drum Tower District, Nanjing, Jiangsu Province, No. 122

Patentee before: Nanjing Normal University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201126

Address after: No. 159, Chengjiang Middle Road, high tech Zone, Jiangyin City, Wuxi City, Jiangsu Province

Patentee after: Jiangsu youlixin Education Technology Co.,Ltd.

Address before: 214400 A604, 159 Chengjiang Middle Road, Jiangyin City, Wuxi City, Jiangsu Province

Patentee before: JIANGSU YOUSHENG INFORMATION TECHNOLOGY Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 214400 A601, 159 Chengjiang Middle Road, Jiangyin hi tech Zone, Wuxi City, Jiangsu Province

Patentee after: Jiangsu Youlixin Technology Co.,Ltd.

Address before: 214400 A601, 159 Chengjiang Middle Road, Jiangyin hi tech Zone, Wuxi City, Jiangsu Province

Patentee before: Jiangsu youlixin Education Technology Co.,Ltd.