CN104637045A - 一种基于超级像素层次特征的图像像素标号方法 - Google Patents
一种基于超级像素层次特征的图像像素标号方法 Download PDFInfo
- Publication number
- CN104637045A CN104637045A CN201310568087.8A CN201310568087A CN104637045A CN 104637045 A CN104637045 A CN 104637045A CN 201310568087 A CN201310568087 A CN 201310568087A CN 104637045 A CN104637045 A CN 104637045A
- Authority
- CN
- China
- Prior art keywords
- pixel
- super
- image
- features
- labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 34
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 claims abstract description 12
- 230000011218 segmentation Effects 0.000 claims abstract description 5
- 238000012706 support-vector machine Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 abstract description 8
- 238000011176 pooling Methods 0.000 abstract description 3
- 239000002356 single layer Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 239000010410 layer Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于超级像素层次特征的对像素所属物体类别进行标号的方法,属于场景理解、图像语义分割领域。首先用已经标号的训练集图像进行训练,然后用如下步骤对待标号图像进行标号:(1)提取并编码每个像素的特征。(2)通过“过分割”,获得超级像素;对每个超级像素,根据不同距离,建立层次不同的邻域区域。对每个区域用Max-Pooling综合特征,连接各层特征,得到超级像素的层次特征。(3)利用层次特征,通过线性SVM建立并求解基于超级像素的条件随机场模型,得到图像的像素标号。该方法不仅能减少像素标号的时间,而且也能提高标号的精度。另外,在标号过程中还可采用CUDA并行计算技术,进一步提高标号速度。
Description
技术领域
本发明涉及对图像的每一个像素所属物体类别进行标号,能在同一过程中实现物体的检测、分割及识别,是图像场景理解的基础。
背景技术
目前像素标号技术主要采用条件随机场(CRF)模型对图像中的每一个像素逐一进行标号。每个像素的标号用一个随机变量表示。其联合概率分布由一元势函数(简称一元项)及二元势函数(简称二元项)决定。每个像素的一元项通常由像素分类器输出的像素标号的概率决定。由于分类器的计算量通常较大,图像像素个数又较多,因而为每像素计算一元项非常耗时。二元项通常由两相邻像素的色彩差异决定。求解条件随机场模型通常采用Y. Boykov提出的α-expansion 或αβ-swap方法,该方法需要多次计算以每个像素为顶点的所构成图的最大流(或最小切),若像素太多,也非常耗时。
为了解决该问题, B. Fulkerson等提出用过分割技术把像素聚集成为超级像素。由于超级像素通常由上百个像素构成,其数量远小于像素个数,因而计算一元项及求解条件随机场模型所需要的时间大大减少。但是由于该方法采用了非线性的SVM计算一元项,由于非线核函数的计算量较大,标号的速度依然较慢。另外,由于该方法仅采用直方图综合相邻的超级像素构成单层区域的特征作为超级像素的特征,因而标号精度也有待提高。
发明内容
为了克服上述现有技术的不足,提高像素标号的精度与速度,本发明提供了一种基于超极像素层次特征的像素标号方法。
本发明所采用的技术方案是: 首先用已经标号的训练集图像,通过训练模块对标号过程所需的特征编码器、线性SVM及条件随机场的参数进行训练,然后用标号模块对未知图像进行标号。
所述训练模块的步骤如下:
(1)提取训练集图像的每个像素的特征(如SIFT特征、HOG特征或Texton特征等)。并用这些特征训练特征编码器(如K均值聚类或稀疏编码等)获得字典。然后用编码器编码每个特征。
设x i 为第i个像素,D = [d 1, d 2,..., d k]为训练得到的字典,f(x i )为编码器,则第i个像素的编码为:
(2) 训练集图像通过分割(如quick-shift或watershed等),获得到超级像素图像。
(3) 计算超级像素层次特征:以图像的每个超级像素为中心,按不同距离合并相邻的超级像素,得到层次不同的邻域区域;或利用图像层次分割技术(如P. Arbelaez提出的层次分割法等),得到超级像素层次结构。用Max-pooling计算各区域的特征,连接各层特征,得到超级像素的层次特征。
设 为第i个超级像素的区域, 表示与第i个超级像素距离等于k的超级像素组成的区域,即:
其中表示第i个超级像与第j个超级像之间的距离。距离可用超级像素的相邻关系来度量(相邻超级像素的距离定义为1)或用两超级像素之间的色彩或纹理的相似性来度量。
用Max-Pooling综合区域 所有像素的特征,得到该层的特征。 的第j个分量为:
连接超级像素i的各层区域的特征,得到层次特征,
(4) 训练线性SVM:通过步骤(3)计算训练集图像的超级像素层次特征。训练集图像中超级像素的标号为其对应区域中所有的像素标号中出现次数最多的一个标号(训练集图像中的每个像素已事先标号)。利用超级像素层次特征以及对应的标号训练非线性SVM分类器。
设F i 为第i像素的层次特征,则其标号可由下式计算获得
其中Y为物体类别的集合, 为类别l的分类器参数,其值用训练集中超级像素层次特征以及对应的标号通过下式求解(即训练)获得,
,
其中M为选取的样本个数,F i 为训练集中第i个超级像素的层次特征,y i 为超级像素的标号,C为SVM的参数,它的值同样由训练集的数据通过训练获得。
(5)仅用线性SVM对超级像素进行标号,其结果可能会出现“噪声”。条件随机场模型可以保证相邻超级像素标号的一致性。条件随机场模型的能量函数通常由一元项与二元项组成,即:
其中,一元势函数由下式计算获得,即:
其中, p( y i | v i )为线性SVM分类器输出的第i个超级像素的标号为y i 的概率。
二元势函数由下式计算获得,
其中,L(v i , v j )为超级像素之间的边界长度,║v i - v j ║为超级像素之间的色彩差异,利用α-expansion 与 αβ-swap求解使式(7)值最小的标号y,得到超级像素标号。
利用训练集图像的层次特征通过式(8)计算一元项,利用相邻超级像素之间的边界长度及色彩差异通过式(9)计算二元项;然后通过式(7)建立条件随机场模型,选取标号精度最高的λ值。
所述标号模块步骤如下:
(1)提取待标号图像的特征,并用训练得到的字典通过式(1)进行编码。
(2)对待标号图像进行过分割,得到超级像素图像。通过训练模块的步骤(3)以及式(2),(3)与(4)计算超级像素的层次特征。
(3)利用待标号图像的层次特征,通过式(8)计算一元项;利用相邻超级像素之间的边界长度及色彩差异通过式(9)计算二元项;然后用式(7)建立条件随机场模型。采用Y. Boykov提出的α-expansion与 αβ-swap方法求使式(7)的能量函数最小的超级像素标号。把每个超级像素标号作为其对应区域所有像素的标号即获得图像的像素标号。
与现有技术相比,由于本发明采用了超级像素,大大减少了像素的数目,并且由于采用了线性SVM计算一元项,而线性SVM计算复杂度比非线性SVM低很多,因而本发明获得了比现有技术更快的标号速度。另外,由于本发明采用超级像素层次特征,比现有技术的特征表达更丰富,因而获得了比现有技术更高的标号精度。另外,本发明还可以在标号过程中运算量较大的步骤即像素区域特征的提取、量化,图像的“过分割”,以及利用线性SVM计算条件随机场一元项中采用CUDA并行计算技术,进一步提高像素标号的速度。
附图说明
图1为本发明实施例的像素标号过程示意图;
图 2 为超级像素不同层次的邻域区域示意图,S为超级像素对应的区域即0层区域,浅灰色为1层区域,深灰色为2层区域;
图3为在单线程下,本发明的CPU实现、CUDA实现方法与基于超级像素单层特征的非线性SVM像素标号方法标号分辨率为320×240图像各步骤所需要的时间比较(单位:秒/幅);
图4为本发明与基于超级像素单层特征的非线性SVM像素标号方法标号精度的比较。
具体实施方式
本发明提出的一种基于超级像素层次特征像素标号方法实施例结合附图详细说明如下:首先用已标号的训练集图像对标号过程所需要的特征编码器,线性SVM,及条件随机场的参数进行训练,然后用标号模块对待标号图像进行标号,标号过程如图1所示。
训练模块的步骤如下:
(1)提取训练集图像像每个像素的Dense-SIFT特征(即固定尺度和方向的SIFT特征),其中尺度设置为1,方向设设置0,方向直方图窗口设置为12×12。由于每个特征的计算不依赖于其它特征,因而可以并行运行,可采用基于CUDA的特征提取方法。
训练编码器:随机选取100000特征样本用K-Means聚类方法进行训练(K=512),获得K个聚类的中心,即字典(或码表)。
编码:用训练获得的字典,采用K-Means方法,对训练集图像中每个像素的SIFT特征进行编码。设x i 为第i个像素的SIFT特征,D = [d 1, d 2, d 3, ..., d k ]为字典。则第i个像素特征的编码为:
由于每个特征的编码独立于其它特征,可并行运行,因而可采用基于CUDA的K-Means编码方法。
(2)通过 Quick-SHIFT过分割技术把训练集中的图像分割成许多小区域,每个小区域即为一个超级像素,得到超级像素图像。Quick-SHIFT可采用B. Fulkerson提出的基于CUDA并行计算方法。
(3)计算超级像素的层次特征:以图像的每个超级像素为中心,通过式(2)按不同距离合并相邻的超级像素(相邻的超级像素之间的距离为1),得到层次不同的邻域区域,如图2。用Max-pooling采用式(3)计算各层区域的特征,并用式(4)连接各层特征,得到超级像素的层次特征。
(4)训练超级像素线性SVM分类器:通过步骤(3)计算训练集中图像的超级像素层次特征。训练集图像中超级像素的标号为其对应区域中所有的像素标号中出现次数最多的一个标号(训练集图像中每个像素已手工标号)。在训练集中,为每个类别随机选3000个超级像素层次特征作为正样本,所有其它类别的特征作为负样本,通过式(6)训练SVM的参数C,以及每个类别的线性SVM系数即, 。
(5)学习条件随机场模型的参数:用训练集中各超级像素的层次特征以及线性SVM,通过式(8)计算一元项。由于各超级像素一元项的计算与其余超级像素无关,可并行计算,因而可采用CUDA并行计算技术。利用相邻超级像素之间的边界长度及色彩差异通过式(9)计算二元项。然后用式(7)建立条件随机场模型,选取标号精度最高的λ值。
标号模块的标号过程如图1,其具体步骤为:
(1)提取待标号图像每个像素的SIFT特征(所用参数与训练模块相同)。并用训练获取的字典采用K-means方法通过式(10)对特征进行编码。
(2)用Quick-SHIFT对待标号图像进行过分割,得到超级像素。并采用训练模块步骤(3)计算每个超级像素的层次特征。
(3)用待标号图像超级像素层次特征通过式(8)计算一元项,利用相邻超级像素之间的边界长度及色彩差异通过式(9)计算二元项,然后用式(7)建立条件随机场模型。求解使式(7)值最小的图像超级像素标号,并把每个超级像素标号作为其对应区域所有像素的标号,即获得图像的像素标号。
(4)为提高标号的速度,与训练模块一样,可以在SIFT特征的提取,K-means编码,Quick-SHIFT,以及利用线性SVM计算一元项过程中可以采用CUDA并行计算技术。
该实施例计算机配置如下:CPU为Intel Xeon E1230-V 3.3GHz,内存8GB,显卡为Geforce GTX660TI。图像数据集采用Stanford Background 数据集,该数据集有715张户外图像,每张图像大小为320×240,每张图像的每个像素都已标号。随机选取80%的图像为训练集,剩余的为测试集。在实验中对本发明与基于超级像素单层特征的非线性SVM像素标号方法作了比较。为了保证可比较性,程序采用单线程,本发明与基于超级像素单层特征的非线性SVM像素标号方法的相同步骤即Quick-Shift过分割、SIFT特征提取采用相同的参数。
图3为单线程下,本发明的CPU实现、CUDA实现方法与基于超级像素单层特征的非线性SVM像素标号方法标号分辨率为320×240图像各步骤所需要的时间比较(单位:秒/幅)。从图2可以看出,由于采用了线性SVM,本发明在计算条件随机场一元项步骤比基于超级像素单层特征的非线性SVM像素标号方法快了27.5倍,整个标号过程所需时间快了84%。从图中还可以看出, CUDA并行技术能明显提高本发明的特征提取、编码、过分割以及一元项的计算步骤的速度。若采用CUDA并行计算技术,整个标号过程能在0.9秒内标号1幅分辨率为320×240的图像。
图4为本发明与基于超级像素单层特征的非线性SVM像素标号方法标号精度的比较。从图中可以看出,由于本发明采用了超级像素层次特征,并且把Max-Pooling与线性SVM接合在一起,各类别的像素标号精度(即:类别c的标号精度/类别c的像素个数 )与总的像素标号精度(即: 正确标号的像素个数/总的像素个数)明显比基于超级像素单层特征的非线性SVM像素标号方法高。
Claims (4)
1.一种基于超级像素层次特征的图像像素标号的方法,首先用已经标号的训练集图像,通过训练模块对标号过程所需的特征编码器、线性SVM及条件随机场的参数进行训练,然后用标号模块对未知图像进行标号,其特征是训练与标号的步骤,
所述训练模块的步骤如下:
(1)提取训练集图像的每个像素的特征,用这些特征训练特征编码器,然后用编码器对训练集的每个像素的特征进行编码;
(2)对训练集的图像进行“过分割”,获得超级像素图像;
(3)以每个超级像素为中心,按不同距离合并相邻的超级像素,得到层次不同的邻域区域,对每层区域用Max-pooling综合区域内各像素的特征,获得该层区域的特征,并连接各层特征,获得超级像素的层次特征;
(4)对训练集图像采用步骤(3)计算超级像素层次特征,然后利用超级像素层次特征及对应的超级像素标号训练线性SVM分类器;
(5)利用训练集图像的超级像素层次特征通过线性SVM计算条件随机场的一元项,利用超级像素之间的边界长度以及色彩差异计算二元项,建立条件随机场模型,选取标号精度最高的条件随机场参数;
所述标号模块的步骤如下:
(1)提取待标号图像每个像素的特征,并用编码器对特征编码;
(2)对待标号图像进行“过分割”,并采用训练模块的步骤(3)计算超级像素层次特征;
(3)利用超级像素层次特征,通过线性SVM计算条件随机场的一元项;利用超级像素之间的边界长度以及色彩差异计算二元项,建立条件随机场模型,求解该模型得到图像的像素标号。
2.如权利要求1所述的基于超级像素层次特征的图像像素标号的方法,其特征是超级像素层次特征的计算方法,包括:(1)以超级像素为中心,根据不同距离,合并相邻的超级像素,得到层次不同的邻域区域;或利用层次分割技术得到超级像素层次结构;(2)对每层区域用Max-pooling综合区域内各像素的特征,获得该层区域的特征,并连接各层特征,获得超级像素的层次特征。
3.如权利要求1所述的基于超级像素层次特征的图像像素标号的方法,其特征是利用超级像素层次特征,通过线性SVM分类超级像素,并计算出超级像素属于各类别的概率,用该概率计算条件随机场的一元项。
4.一种基于超级像素层次特征的图像像素标号的方法,其特征是为获得更快的标号速度,在标号过程中运算量较大的步骤即像素区域特征的提取、编码,图像的“过分割”以及利用线性SVM计算条件随机场的一元项中采用CUDA并行计算技术。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310568087.8A CN104637045A (zh) | 2013-11-14 | 2013-11-14 | 一种基于超级像素层次特征的图像像素标号方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310568087.8A CN104637045A (zh) | 2013-11-14 | 2013-11-14 | 一种基于超级像素层次特征的图像像素标号方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104637045A true CN104637045A (zh) | 2015-05-20 |
Family
ID=53215751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310568087.8A Pending CN104637045A (zh) | 2013-11-14 | 2013-11-14 | 一种基于超级像素层次特征的图像像素标号方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104637045A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844292A (zh) * | 2016-03-18 | 2016-08-10 | 南京邮电大学 | 一种基于条件随机场和二次字典学习的图像场景标注方法 |
CN106530321A (zh) * | 2016-10-28 | 2017-03-22 | 南方医科大学 | 一种基于方向和尺度描述子的多图谱图像分割方法 |
CN108537102A (zh) * | 2018-01-25 | 2018-09-14 | 西安电子科技大学 | 基于稀疏特征与条件随机场的高分辨sar图像分类方法 |
CN109461157A (zh) * | 2018-10-19 | 2019-03-12 | 苏州大学 | 基于多级特征融合及高斯条件随机场的图像语义分割方法 |
CN109919159A (zh) * | 2019-01-22 | 2019-06-21 | 西安电子科技大学 | 一种针对边缘图像的语义分割优化方法及装置 |
CN111932557A (zh) * | 2020-08-13 | 2020-11-13 | 中国科学院重庆绿色智能技术研究院 | 基于集成学习和概率图模型的图像语义分割方法及装置 |
CN115880249A (zh) * | 2022-12-13 | 2023-03-31 | 腾讯科技(深圳)有限公司 | 基于图像的对象分割方法、装置、设备和介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103177450A (zh) * | 2013-04-11 | 2013-06-26 | 北京航空航天大学 | 一种基于构件集采样的图像场景分割与分层联合求解方法 |
US20130188869A1 (en) * | 2012-01-20 | 2013-07-25 | Korea Advanced Institute Of Science And Technology | Image segmentation method using higher-order clustering, system for processing the same and recording medium for storing the same |
-
2013
- 2013-11-14 CN CN201310568087.8A patent/CN104637045A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130188869A1 (en) * | 2012-01-20 | 2013-07-25 | Korea Advanced Institute Of Science And Technology | Image segmentation method using higher-order clustering, system for processing the same and recording medium for storing the same |
CN103177450A (zh) * | 2013-04-11 | 2013-06-26 | 北京航空航天大学 | 一种基于构件集采样的图像场景分割与分层联合求解方法 |
Non-Patent Citations (5)
Title |
---|
BRIAN FULKERSON 等: "Class Segmentation and Object Localization with Superpixel Neighborhoods", 《2009 IEEE 12TH INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV)》 * |
BRIAN FULKERSON 等: "Really Quick Shift: Image Segmentation on a GPU", 《ECCV 2010 WORKSHOPS》 * |
JIANCHAO YANG 等: "Linear Spatial Pyramid Matching Using Sparse Coding for Image Classification", 《COMPUTER VISION AND PATTERN RECOGNITION》 * |
Y-LAN BOUREAU 等: "Learning Mid-Level Features For Recognition", 《COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
张微 等: "基于超像素的条件随机场图像分类", 《计算机应用》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105844292A (zh) * | 2016-03-18 | 2016-08-10 | 南京邮电大学 | 一种基于条件随机场和二次字典学习的图像场景标注方法 |
CN105844292B (zh) * | 2016-03-18 | 2018-11-30 | 南京邮电大学 | 一种基于条件随机场和二次字典学习的图像场景标注方法 |
CN106530321A (zh) * | 2016-10-28 | 2017-03-22 | 南方医科大学 | 一种基于方向和尺度描述子的多图谱图像分割方法 |
CN106530321B (zh) * | 2016-10-28 | 2019-07-12 | 南方医科大学 | 一种基于方向和尺度描述子的多图谱图像分割方法 |
CN108537102A (zh) * | 2018-01-25 | 2018-09-14 | 西安电子科技大学 | 基于稀疏特征与条件随机场的高分辨sar图像分类方法 |
CN108537102B (zh) * | 2018-01-25 | 2021-01-05 | 西安电子科技大学 | 基于稀疏特征与条件随机场的高分辨sar图像分类方法 |
CN109461157A (zh) * | 2018-10-19 | 2019-03-12 | 苏州大学 | 基于多级特征融合及高斯条件随机场的图像语义分割方法 |
CN109461157B (zh) * | 2018-10-19 | 2021-07-09 | 苏州大学 | 基于多级特征融合及高斯条件随机场的图像语义分割方法 |
CN109919159A (zh) * | 2019-01-22 | 2019-06-21 | 西安电子科技大学 | 一种针对边缘图像的语义分割优化方法及装置 |
CN111932557A (zh) * | 2020-08-13 | 2020-11-13 | 中国科学院重庆绿色智能技术研究院 | 基于集成学习和概率图模型的图像语义分割方法及装置 |
CN115880249A (zh) * | 2022-12-13 | 2023-03-31 | 腾讯科技(深圳)有限公司 | 基于图像的对象分割方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110428428B (zh) | 一种图像语义分割方法、电子设备和可读存储介质 | |
Chen et al. | Embedding attention and residual network for accurate salient object detection | |
CN107316307B (zh) | 一种基于深度卷积神经网络的中医舌图像自动分割方法 | |
CN104637045A (zh) | 一种基于超级像素层次特征的图像像素标号方法 | |
Du et al. | Amnet: Deep atrous multiscale stereo disparity estimation networks | |
CN110929665B (zh) | 一种自然场景曲线文本检测方法 | |
CN110866896B (zh) | 基于k-means与水平集超像素分割的图像显著性目标检测方法 | |
CN109086770B (zh) | 一种基于精准尺度预测的图像语义分割方法及模型 | |
CN111191583A (zh) | 基于卷积神经网络的空间目标识别系统及方法 | |
Ayyalasomayajula et al. | PDNet: Semantic segmentation integrated with a primal-dual network for document binarization | |
Lv et al. | A visual identification method for the apple growth forms in the orchard | |
CN114694038A (zh) | 基于深度学习的高分辨率遥感影像分类方法及系统 | |
CN112991269A (zh) | 一种肺部ct图像的识别分类方法 | |
US10373022B1 (en) | Text image processing using stroke-aware max-min pooling for OCR system employing artificial neural network | |
Al-Huda et al. | Weakly supervised pavement crack semantic segmentation based on multi-scale object localization and incremental annotation refinement | |
Qin et al. | A robust framework combined saliency detection and image recognition for garbage classification | |
CN115205672A (zh) | 一种基于多尺度区域注意力的遥感建筑物语义分割方法及系统 | |
CN110751191A (zh) | 一种图像的分类方法及系统 | |
CN110738672A (zh) | 一种基于分层高阶条件随机场的图像分割方法 | |
CN113111716A (zh) | 一种基于深度学习的遥感影像半自动标注方法和装置 | |
CN104881655A (zh) | 一种基于多特征时空关系融合的人类行为识别方法 | |
Zhou et al. | Attention transfer network for nature image matting | |
CN110991374B (zh) | 一种基于rcnn的指纹奇异点检测方法 | |
Van Hoai et al. | Feeding Convolutional Neural Network by hand-crafted features based on Enhanced Neighbor-Center Different Image for color texture classification | |
Sabater et al. | Event Transformer+. A multi-purpose solution for efficient event data processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150520 |
|
WD01 | Invention patent application deemed withdrawn after publication |