CN109325507A - 一种结合超像素显著性特征与hog特征的图像分类算法和系统 - Google Patents
一种结合超像素显著性特征与hog特征的图像分类算法和系统 Download PDFInfo
- Publication number
- CN109325507A CN109325507A CN201811185997.7A CN201811185997A CN109325507A CN 109325507 A CN109325507 A CN 109325507A CN 201811185997 A CN201811185997 A CN 201811185997A CN 109325507 A CN109325507 A CN 109325507A
- Authority
- CN
- China
- Prior art keywords
- pixel
- super
- feature
- image
- conspicuousness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007635 classification algorithm Methods 0.000 title claims abstract description 14
- 102100022823 Histone RNA hairpin-binding protein Human genes 0.000 claims abstract description 28
- 101000825762 Homo sapiens Histone RNA hairpin-binding protein Proteins 0.000 claims abstract description 28
- 230000011218 segmentation Effects 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 19
- 230000004927 fusion Effects 0.000 claims abstract description 18
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 10
- 230000006872 improvement Effects 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 26
- 238000001914 filtration Methods 0.000 claims description 17
- 210000004027 cell Anatomy 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 210000000130 stem cell Anatomy 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 14
- 238000013461 design Methods 0.000 abstract description 3
- 230000009467 reduction Effects 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 241000086550 Dinosauria Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种结合超像素显著性特征与HOG特征的图像分类算法和系统,包括以下步骤:步骤1,将原始数据集进行HOG特征提取得到特征集A;步骤2,利用超像素分割对原始数据集进行处理,得到重构显著性图像数据集;步骤3,将重构后的显著性图像集利用SLBP编码方式得到新的特征集B,所述SLBP编码方式是对传统LBP编码方式的改进;步骤4,特征融合,将步骤1和步骤3所得到特征集A和特征集B进行相加;步骤5,结合步骤4得到的训练数据,利用KNN分类器对测试数据进行监督分类并计算分类精度。本发明方法较好地满足了小型工程设计对传统机器学习算法的要求,一定程度上提好了图像分类精度。
Description
技术领域
本发明属于图像分类技术领域,适合于待分类图像数据集特征不明显、难以捕捉、相似度过高等分类场景,可用于目标识别、目标检索、数据库管理等领域。
背景技术
近些年来,随着人工智能技术不断融入人类生活和工业生产,机器视觉的探索被认为是未来十年研究热点。目标检测、模式识别、图像分割等技术作为机器视觉的重要领域至关重要,如何提高图像分类算法的时效性、分类精度、鲁棒性是研究人员面临的一大挑战。图像分类主要包括特征提取、特征工程、特征分类过程,针对图像特征提取过程,继HOG(Histogram of Oriented Gradient)特征提取方法以后,提出了LBP局部二值模式特征编码方法、SIFT局域特征检测方法、SURF稳健性局部特征提取、Harr(边缘特征、线性特征、点特征)多尺度特征描述等方法;针对特征降维过程,除了传统的PCA主成分分析法以外,还提出了LDA有监督线性降维方法、FAST-PCA改进性主成分分析法、LLE局部线性嵌入降维、LE拉普拉斯特征映射降维等方法;针对特征分类器的选择,最常用的分类器为SVM支持向量机、K-mens聚类算法、随机森林算法,还有一些优化型小波算法、双层SVM、改进型贝叶斯分类器等。这一系列的改进方式都只是在单一工程上作改进,针对不同的数据集需作出不同的决策。
往后深度学习得到了学者的一致好评,卷积神经网络、循环神经网络、对抗神经网络等一系列深度学习网络被应用于图像处理领域,虽然分类精度得到了显著性提升,但是数据量的严重不足、机器设备的内存不足、消耗时间的过长等一系列问题接踵而来。针对数据量较少、对分类时间要求苛刻的小型工程设计来说,如何提高传统的机器学习分类算法依然至关重要。
发明内容
本发明的目的是针对上述分类方法中的不足,引入深度学习中注意力机制的思想,提出了一种结合图像超像素显著性特征与原始图像HOG特征进行分类的算法,较好地满足了小型工程设计对传统机器学习算法的要求,一定程度上提好了图像分类精度。
本发明的技术方案为一种结合超像素显著性特征与HOG特征的图像分类算法,包括如下步骤:
步骤1,将原始数据集进行HOG特征提取得到特征集A;
步骤2,利用超像素分割对原始数据集进行处理,得到重构显著性图像数据集;
步骤3,将重构后的显著性图像集利用SLBP编码方式得到新的特征集B,所述SLBP编码方式是对传统LBP编码方式的改进;
步骤4,特征融合,将步骤1和步骤3所得到特征集A和特征集B进行相加;
步骤5,结合步骤4得到的训练数据,利用KNN分类器对测试数据进行监督分类并计算分类精度。
进一步的,步骤3中所述SLBP的编码方式为,针对3*3的像素空间,首先进行归一化为0或者1之后,将中心像素点设置为1,从中心像素左侧的像素点按照逆时针顺序,以2进制进位方式编码直到最后一个像素点停止。
进一步的,步骤1中HOG特征提取的具体实现包括如下子步骤,
1a,将原始数据集中的RGB图像进行灰度转换,并采用Gamma校正法对图像进行归一化处理;
1b,计算图像横坐标和纵坐标方向的梯度,以此计算每个像素的梯度大小和方向,并将图像分成若干细胞单元cells,
Gi(i,j)=H(i+1,j)-H(i-1,j) (1-1)
Gi(i,j)=H(i,j+1)-H(i,j-1) (1-2)
式中i,j为像素点的横纵坐标,Gi(i,j)、Gj(i,j)是二维梯度值,G(i,j)是整体梯度,α(i,j)是梯度的方向,H(i,j)是cells中的二维坐标值;
1c,统计每个cell梯度直方图,利用检测窗口来划分block块,检测出n*n个cell组成一个block,如果划分存在不够的情况下就会出现重叠,将block内的所有cells特征向量串联得到该block的HOG特征;
1d,将所有重叠的block进行对比度归一化处理,结合所有block的HOG特征以及重叠block的对比度归一化处理结果,获得最终的特征向量即为特征集A。
进一步的,步骤2中获得重构显著性图像数据集的具体实现包括如下子步骤,
步骤2a,将原始数据集利用高斯滤波算子进行高斯滤波得到平滑图像数据集;
步骤2b,对平滑后的数据集进行超像素分割,其中同一标签数字的像素属于同一超像素,超像素分割个数为m;
步骤2c,根据所求超像素信息矩阵,分别求出每个超像素的全局、边缘、和局部显著性特征,然后分别对每个超像素的全局、边缘、和局部显著性特征进行归一化处理,并将归一化结果进行相加。
进一步的,步骤2a中的的高斯滤波算子大小为6*6,高斯滤波函数如式(2-1)所示:
式中i,j表示像素点的横纵坐标,σ是标准差,Hi,j表示滤波后的向量,k指高斯滤波核的大小。
进一步的,步骤2c中全局显著性计算公式如式(2-3)所示,边缘显著性计算公式如(2-4)所示,局部显著性计算公式如(2-5)所示,
式中i,j表示像素点的横纵坐标,xi,j和yi,j分别表示不同像素点的坐标信息,n表示像素点的个数,dist(i,j)表示像素点距离,w*为权重,Edge表示边缘区域限制;Sa1(i)表示全局显著性矢量空间,Sa2(i)表示边缘显著性矢量空间,Sa3(i)表示局部显著性矢量空间。
进一步的,步骤5的具体实现方式如下,
步骤5a,计算测试数据与各个训练数据(即步骤4特征融合后得到的数据)之间的欧式距离;
步骤5b,按照距离的递增关系进行排序;
步骤5c,选取距离最小的K个点并确定其所在类别的出现概率;
步骤5d,返回前K个点中出现频率最高的类别作为测试数据的测试分类。
本发明还提供一种结合超像素显著性特征与HOG特征的图像分类系统,包括如下模块;
HOG特征提取模块,用于将原始数据集进行HOG特征提取得到特征集A;
超像素分割模块,用于利用超像素分割对原始数据集进行处理,得到重构显著性图像数据集;
SLBP编码模块,用于将重构后的显著性图像集利用SLBP编码方式得到新的特征集B,所述SLBP编码方式是对传统LBP编码方式的改进;
特征融合模块,用于特征融合,将HOG特征提取模块和SLBP编码模块所得到特征集A和特征集B进行相加;
KNN分类模块,用于结合特征融合模块得到的训练数据,利用KNN分类器对测试数据进行监督分类并计算分类精度。
进一步的,SLBP编码模块中所述SLBP的编码方式为,针对3*3的像素空间,首先进行归一化为0或者1之后,将中心像素点设置为1,从中心像素左侧的像素点按照逆时针顺序,以2进制进位方式编码直到最后一个像素点停止。
进一步的,所述超像素分割模块中获得重构显著性图像数据集的具体实现包括如下子模块,
第一子模块,用于将原始数据集利用6*6的高斯滤波算子进行高斯滤波得到平滑图像数据集,其中高斯滤波函数如式(2-1)所示:
式中i,j表示像素点的横纵坐标,σ是标准差,Hi,j表示滤波后的向量,k指高斯滤波核的大小;
第二子模块,用于对平滑后的数据集进行超像素分割,其中同一标签数字的像素属于同一超像素,超像素分割个数为m;
第三子模块,用于根据所求超像素信息矩阵,分别求出每个超像素的全局、边缘、和局部显著性特征,然后分别对每个超像素的全局、边缘、和局部显著性特征进行归一化处理,并将归一化结果进行相加,
其中全局显著性计算公式如式(2-3)所示,边缘显著性计算公式如(2-4)所示,局部显著性计算公式如(2-5)所示,
式中i,j表示像素点的横纵坐标,xi,j和yi,j分别表示不同像素点的坐标信息,n表示像素点的个数,dist(i,j)表示像素点距离,w*为权重,Edge表示边缘区域限制;Sa1(i)表示全局显著性矢量空间,Sa2(i)表示边缘显著性矢量空间,Sa3(i)表示局部显著性矢量空间。
本发明与传统的图像分类算法相比,有如下优点:
1、本发明中超像素作为图像一种紧凑表达方式,不仅以摒弃多余的信息而且降低了空间的复杂度,是一种在前端进行降维的思想。
2、本发明中超像素分割将上千万像素转换为几百像素表达,这有利于提高计算效率,同时利用图像总体、边缘、局部显著性来表达更是结合了更丰富的图像缺漏信息。
3、本发明中针对传统图像中纹理较弱的图像区域,传统的方法处理难以找到相关的特征电脑,进而导致这部分信息丢失,而本算法则能较高的保留下来。
4、本发明中特征融合部分利用了深度学习中注意力机制的思想,将注意力集中在图像重要部分的视觉注意力机制技术,同时兼顾原始图像特征,从而获得一个双赢的融合特征集。
实验结果表明,本发明能有效地解决普通图像分类问题,并且获得了比传统分类算法更高精度的分类结果,可进一步应用于遥感、医学、舰船等重要场景下。
附图说明
图1是本发明算法过程流程图;
图2是本发明超像素数据构建过程图;
图3是本发明中HOG特征提取过程图;
图4是本发明SLBP编码方式图;
图5是本发明KNN算法原理图;
图6是本发明测试样本中随机抽取10个分类结果图;
具体实施方式
下面将结合附图对本发明技术方案进一步说明。
如图1过程所示,本发明提供的一种结合超像素显著性特征与HOG特征的图像分类算法,包括如下步骤;
步骤1,将原始数据集进行HOG特征提取得到特征集A;
如图3所示,HOG特征提取的具体实现包括如下子步骤,
1a,将原始数据集中的RGB图像进行灰度转换,并采用Gamma校正法对图像进行归一化处理;
1b,计算图像横坐标和纵坐标方向的梯度,以此计算每个像素的梯度大小和方向,并将图像分成若干细胞单元cells,
Gi(i,j)=H(i+1,j)-H(i-1,j) (1-1)
Gi(i,j)=H(i,j+1)-H(i,j-1) (1-2)
式中i,j为像素点的横纵坐标,Gi(i,j)、Gj(i,j)是二维梯度值,G(i,j)是整体梯度,α(i,j)是梯度的方向,H(i,j)是cells中的二维坐标值;
1c,统计每个cell梯度直方图,利用检测窗口来划分block块,检测出n*n个cell组成一个block,如果划分存在不够的情况下就会出现重叠,将block内的所有cells特征向量串联得到该block的HOG特征;
1d,将所有重叠的block进行对比度归一化处理,结合所有block的HOG特征以及重叠block的对比度归一化处理结果,获得最终的特征向量即为特征集A。
步骤2,利用超像素分割对原始数据集进行处理,得到重构显著性图像数据集;
步骤2a,如图2过程所示,将原始数据集利用6*6的高斯滤波算子进行高斯滤波得到平滑图像数据集,高斯滤波函数如式(2-1)所示:
式中i,j表示像素点的横纵坐标,σ是标准差,Hi,j表示滤波后的向量,k指高斯滤波核的大小。
步骤2b,对平滑后的数据集进行超像素分割,其中同一标签数字的像素属于同一超像素,超像素分割个数为500;
步骤2c,根据所求超像素信息矩阵,分别求出每个超像素的全局、边缘、和局部显著性,然后进行归一化处理进行相加。全局显著性计算公式如式(2-3)所示,边缘显著性计算公式如(2-4)所示,局部显著性计算公式如(2-5)所示,然后对全局显著性、边缘显著性、局部显著性分别进行归一化处理。
式中i,j表示像素点的横纵坐标,xi,j和yi,j分别表示不同像素点的坐标信息,n表示像素点的个数,dist(i,j)表示像素点距离,w*为权重,Edge表示边缘区域限制,其中w*和Edge的取值可以预先设定,本领域技术人员也可以根据需要进行设定;Sa1(i)表示全局显著性矢量空间,Sa2(i)表示边缘显著性矢量空间,Sa3(i)表示局部显著性矢量空间。
步骤3,如图4编码方式所示,LBP编码方式为传统编码,SLBP为本发明中改进的编码方式。将重构后的显著性图像集利用SLBP编码方式得到新的特征集B,对3*3的像素空间进行以下编码:首先进行归一化为0或者1之后,将中心像素点设置为1,从中心像素左侧的像素点按照逆时针顺序,以2进制进位方式编码直到最后一个像素点停止,即其他8个像素点依次为2、4、8、16、32、64、126、258。
步骤4,特征融合,将步骤1和步骤3所得到特征集A和特征集B进行相加;
T=T1(i,j)+T2(i,j)
式中T1(i,j)为特征集A的空间,T2(i,j)为特征集B的空间。
步骤5,利用KNN分类器进行监督分类并计算分类精度;
步骤5a,如图5所示,计算测试数据与各个训练数据(即步骤4特征融合后得到的数据)之间的欧式距离;
步骤5b,按照距离的递增关系进行排序;
步骤5c,选取距离最小的K个点并确定其所在类别的出现概率;
步骤5d,返回前K个点中出现频率最高的类别作为测试数据的测试分类。
本发明实施例还提供一种结合超像素显著性特征与HOG特征的图像分类系统,包括如下模块;
HOG特征提取模块,用于将原始数据集进行HOG特征提取得到特征集A;
超像素分割模块,用于利用超像素分割对原始数据集进行处理,得到重构显著性图像数据集;
SLBP编码模块,用于将重构后的显著性图像集利用SLBP编码方式得到新的特征集B,所述SLBP编码方式是对传统LBP编码方式的改进;
特征融合模块,用于特征融合,将HOG特征提取模块和SLBP编码模块所得到特征集A和特征集B进行相加;
KNN分类模块,用于结合特征融合模块得到的训练数据,利用KNN分类器对测试数据进行监督分类并计算分类精度。
各模块的具体实现和各步骤相应,本发明实施例不予撰述。
本发明的效果可以通过以下实验来进行验证:
1.实验条件
在CPU为i7-6700HQ,内存16G,GPU为NVIDIA1080,WINDOWS 10系统上使用Matlab2018a软件进行实验。
2.实验内容
实验场景假设为现场采集到50张某种特殊图像数据待分类,但相似属性的图像数据量有限,此时引用对相似属性大数据集训练模型参数迁移得到的迁移学习模型。针对本场景目的对50张随机采集的5类样本进行分类,网站收集相似属性待分类val数据集100张任意尺寸RGB图像。
3.实验参数设置
提取HOG特征时,因为提取图像为256*256尺寸,所以每次分割的HOG cell大小设置为[8,8],如需捕获大尺度空间信息可增大单元尺寸;为了使单元局部亮度变换适中,Block设置为[2,2]大小;为了保证提取时间较短,HOG特征长度适中,NumBins(方向直方图分段)设置为9;方向直方图中所取方向的范围为[-180,180]。利用超像素距离计算全局显著性时的初始权重设置为0.1,计算边缘显著性时的初始阈值设为0.1.计算局部显著性的判定二维阈值设为0.12和0.18。
4.实验结果
利用本发明结合超像素显著性特征的分类算法与其余6组分类方式对本组实验数据进行分类得到分类结果如表1所示。从表中可见,对数据进行传统的HOG、LBP、SLBP提取后导入KNN分类器中进行分类,分类精度难以理想要求;将提取后的特征进行特征工程处理(PCA、LE、LLE降维)在本数据集下测试,分类精度也并未得到有效提高,主要原因还是原始图像数据中提取的特征量不够充分,考虑到这一点,本算法针对图像原始特征与超像素处理结合,分类精度在某些固定类别,比如Bus、Dinosaur上提高了5%个精度点,整体分类精度也有4%精度点的提高。综上所述,本发明相比传统的机器学习算法上一定地提高。
表1分类结果比较
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (10)
1.一种结合超像素显著性特征与HOG特征的图像分类算法,其特征在于,包括如下步骤:
步骤1,将原始数据集进行HOG特征提取得到特征集A;
步骤2,利用超像素分割对原始数据集进行处理,得到重构显著性图像数据集;
步骤3,将重构后的显著性图像集利用SLBP编码方式得到新的特征集B,所述SLBP编码方式是对传统LBP编码方式的改进;
步骤4,特征融合,将步骤1和步骤3所得到特征集A和特征集B进行相加;
步骤5,结合步骤4得到的训练数据,利用KNN分类器对测试数据进行监督分类并计算分类精度。
2.如权利要求1所述的一种结合超像素显著性特征与HOG特征的图像分类算法,其特征在于:步骤3中所述SLBP的编码方式为,针对3*3的像素空间,首先进行归一化为0或者1之后,将中心像素点设置为1,从中心像素左侧的像素点按照逆时针顺序,以2进制进位方式编码直到最后一个像素点停止。
3.如权利要求1所述的一种结合超像素显著性特征与HOG特征的图像分类算法,其特征在于:步骤1中HOG特征提取的具体实现包括如下子步骤,
1a,将原始数据集中的RGB图像进行灰度转换,并采用Gamma校正法对图像进行归一化处理;
1b,计算图像横坐标和纵坐标方向的梯度,以此计算每个像素的梯度大小和方向,并将图像分成若干细胞单元cells,
Gi(i,j)=H(i+1,j)-H(i-1,j) (1-1)
Gi(i,j)=H(i,j+1)-H(i,j-1) (1-2)
式中i,j为像素点的横纵坐标,Gi(i,j)、Gj(i,j)是二维梯度值,G(i,j)是整体梯度,α(i,j)是梯度的方向,H(i,j)是cells中的二维坐标值;
1c,统计每个cell梯度直方图,利用检测窗口来划分block块,检测出n*n个cell组成一个block,如果划分存在不够的情况下就会出现重叠,将block内的所有cells特征向量串联得到该block的HOG特征;
1d,将所有重叠的block进行对比度归一化处理,结合所有block的HOG特征以及重叠block的对比度归一化处理结果,获得最终的特征向量即为特征集A。
4.如权利要求1或2或3所述的一种结合超像素显著性特征与HOG特征的图像分类算法,其特征在于:步骤2中获得重构显著性图像数据集的具体实现包括如下子步骤,
步骤2a,将原始数据集利用高斯滤波算子进行高斯滤波得到平滑图像数据集;
步骤2b,对平滑后的数据集进行超像素分割,其中同一标签数字的像素属于同一超像素,超像素分割个数为m;
步骤2c,根据所求超像素信息矩阵,分别求出每个超像素的全局、边缘、和局部显著性特征,然后分别对每个超像素的全局、边缘、和局部显著性特征进行归一化处理,并将归一化结果进行相加。
5.如权利要求4所述的一种结合超像素显著性特征与HOG特征的图像分类算法,其特征在于:步骤2a中的高斯滤波算子大小为6*6,高斯滤波函数如式(2-1)所示:
式中i,j表示像素点的横纵坐标,σ是标准差,Hi,j表示滤波后的向量,k指高斯滤波核的大小。
6.如权利要求4所述的一种结合超像素显著性特征的图像分类算法,其特征在于:步骤2c中全局显著性计算公式如式(2-3)所示,边缘显著性计算公式如(2-4)所示,局部显著性计算公式如(2-5)所示,
式中i,j表示像素点的横纵坐标,xi,j和yi,j分别表示不同像素点的坐标信息,n表示像素点的个数,dist(i,j)表示像素点距离,w*为权重,Edge表示边缘区域限制;Sa1(i)表示全局显著性矢量空间,Sa2(i)表示边缘显著性矢量空间,Sa3(i)表示局部显著性矢量空间。
7.如权利要求1所述的一种结合超像素显著性特征与HOG特征的图像分类算法,其特征在于:步骤5的具体实现方式如下,
步骤5a,计算测试数据与各个训练数据(即步骤4特征融合后得到的数据)之间的欧式距离;
步骤5b,按照距离的递增关系进行排序;
步骤5c,选取距离最小的K个点并确定其所在类别的出现概率;
步骤5d,返回前K个点中出现频率最高的类别作为测试数据的测试分类。
8.一种结合超像素显著性特征与HOG特征的图像分类系统,其特征在于,包括如下模块;
HOG特征提取模块,用于将原始数据集进行HOG特征提取得到特征集A;
超像素分割模块,用于利用超像素分割对原始数据集进行处理,得到重构显著性图像数据集;
SLBP编码模块,用于将重构后的显著性图像集利用SLBP编码方式得到新的特征集B,所述SLBP编码方式是对传统LBP编码方式的改进;
特征融合模块,用于特征融合,将HOG特征提取模块和SLBP编码模块所得到特征集A和特征集B进行相加;
KNN分类模块,用于结合特征融合模块得到的训练数据,利用KNN分类器对测试数据进行监督分类并计算分类精度。
9.如权利要求8所述的一种结合超像素显著性特征与HOG特征的图像分类系统,其特征在于:SLBP编码模块中所述SLBP的编码方式为,针对3*3的像素空间,首先进行归一化为0或者1之后,将中心像素点设置为1,从中心像素左侧的像素点按照逆时针顺序,以2进制进位方式编码直到最后一个像素点停止。
10.如权利要求8所述的一种结合超像素显著性特征与HOG特征的图像分类系统,其特征在于:所述超像素分割模块中获得重构显著性图像数据集的具体实现包括如下子模块,
第一子模块,用于将原始数据集利用6*6的高斯滤波算子进行高斯滤波得到平滑图像数据集,其中高斯滤波函数如式(2-1)所示:
式中i,j表示像素点的横纵坐标,σ是标准差,Hi,j表示滤波后的向量,k指高斯滤波核的大小;
第二子模块,用于对平滑后的数据集进行超像素分割,其中同一标签数字的像素属于同一超像素,超像素分割个数为m;
第三子模块,用于根据所求超像素信息矩阵,分别求出每个超像素的全局、边缘、和局部显著性特征,然后分别对每个超像素的全局、边缘、和局部显著性特征进行归一化处理,并将归一化结果进行相加,
其中全局显著性计算公式如式(2-3)所示,边缘显著性计算公式如(2-4)所示,局部显著性计算公式如(2-5)所示,
式中i,j表示像素点的横纵坐标,xi,j和yi,j分别表示不同像素点的坐标信息,n表示像素点的个数,dist(i,j)表示像素点距离,w*为权重,Edge表示边缘区域限制;Sa1(i)表示全局显著性矢量空间,Sa2(i)表示边缘显著性矢量空间,Sa3(i)表示局部显著性矢量空间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811185997.7A CN109325507B (zh) | 2018-10-11 | 2018-10-11 | 结合超像素显著性特征与hog特征图像分类方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811185997.7A CN109325507B (zh) | 2018-10-11 | 2018-10-11 | 结合超像素显著性特征与hog特征图像分类方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109325507A true CN109325507A (zh) | 2019-02-12 |
CN109325507B CN109325507B (zh) | 2020-10-16 |
Family
ID=65262009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811185997.7A Active CN109325507B (zh) | 2018-10-11 | 2018-10-11 | 结合超像素显著性特征与hog特征图像分类方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109325507B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993221A (zh) * | 2019-03-25 | 2019-07-09 | 新华三大数据技术有限公司 | 一种图像分类方法及装置 |
CN110598636A (zh) * | 2019-09-09 | 2019-12-20 | 哈尔滨工业大学 | 一种基于特征迁移的舰船目标识别方法 |
CN111563473A (zh) * | 2020-05-18 | 2020-08-21 | 电子科技大学 | 基于密集特征融合和像素级注意力的遥感舰船识别方法 |
CN111860529A (zh) * | 2020-07-29 | 2020-10-30 | 山东超越数控电子股份有限公司 | 一种图像的预处理方法、系统、设备以及介质 |
CN112348820A (zh) * | 2020-11-06 | 2021-02-09 | 天津市勘察设计院集团有限公司 | 基于深度辨别性增强网络的遥感影像语义分割方法 |
CN112990316A (zh) * | 2021-03-18 | 2021-06-18 | 浪潮云信息技术股份公司 | 基于多显著性特征融合的高光谱遥感图像分类方法及系统 |
US11847811B1 (en) | 2022-07-26 | 2023-12-19 | Nanjing University Of Posts And Telecommunications | Image segmentation method combined with superpixel and multi-scale hierarchical feature recognition |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105427296A (zh) * | 2015-11-11 | 2016-03-23 | 北京航空航天大学 | 一种基于超声图像低秩分析的甲状腺病灶图像识别方法 |
CN105574866A (zh) * | 2015-12-15 | 2016-05-11 | 努比亚技术有限公司 | 一种实现图像处理的方法及装置 |
US20170091575A1 (en) * | 2015-09-25 | 2017-03-30 | Intel Corporation | Method and system of low-complexity histrogram of gradients generation for image processing |
CN106780450A (zh) * | 2016-12-06 | 2017-05-31 | 天津大学 | 一种基于低秩多尺度融合的图像显著性检测方法 |
-
2018
- 2018-10-11 CN CN201811185997.7A patent/CN109325507B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170091575A1 (en) * | 2015-09-25 | 2017-03-30 | Intel Corporation | Method and system of low-complexity histrogram of gradients generation for image processing |
CN105427296A (zh) * | 2015-11-11 | 2016-03-23 | 北京航空航天大学 | 一种基于超声图像低秩分析的甲状腺病灶图像识别方法 |
CN105574866A (zh) * | 2015-12-15 | 2016-05-11 | 努比亚技术有限公司 | 一种实现图像处理的方法及装置 |
CN106780450A (zh) * | 2016-12-06 | 2017-05-31 | 天津大学 | 一种基于低秩多尺度融合的图像显著性检测方法 |
Non-Patent Citations (3)
Title |
---|
周植宇: ""基于单目视觉的非结构化道路环境分析与可通行区域检测方法研究"", 《道客巴巴》 * |
罗雯怡: ""监控视频下行人再识别技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
谭飞刚: ""无视野重叠区域的跨摄像机行人跟踪关键技术研究"", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993221A (zh) * | 2019-03-25 | 2019-07-09 | 新华三大数据技术有限公司 | 一种图像分类方法及装置 |
CN109993221B (zh) * | 2019-03-25 | 2021-02-09 | 新华三大数据技术有限公司 | 一种图像分类方法及装置 |
CN110598636A (zh) * | 2019-09-09 | 2019-12-20 | 哈尔滨工业大学 | 一种基于特征迁移的舰船目标识别方法 |
CN110598636B (zh) * | 2019-09-09 | 2023-01-17 | 哈尔滨工业大学 | 一种基于特征迁移的舰船目标识别方法 |
CN111563473A (zh) * | 2020-05-18 | 2020-08-21 | 电子科技大学 | 基于密集特征融合和像素级注意力的遥感舰船识别方法 |
CN111563473B (zh) * | 2020-05-18 | 2022-03-18 | 电子科技大学 | 基于密集特征融合和像素级注意力的遥感舰船识别方法 |
CN111860529A (zh) * | 2020-07-29 | 2020-10-30 | 山东超越数控电子股份有限公司 | 一种图像的预处理方法、系统、设备以及介质 |
CN112348820A (zh) * | 2020-11-06 | 2021-02-09 | 天津市勘察设计院集团有限公司 | 基于深度辨别性增强网络的遥感影像语义分割方法 |
CN112348820B (zh) * | 2020-11-06 | 2023-04-07 | 天津市勘察设计院集团有限公司 | 基于深度辨别性增强网络的遥感影像语义分割方法 |
CN112990316A (zh) * | 2021-03-18 | 2021-06-18 | 浪潮云信息技术股份公司 | 基于多显著性特征融合的高光谱遥感图像分类方法及系统 |
US11847811B1 (en) | 2022-07-26 | 2023-12-19 | Nanjing University Of Posts And Telecommunications | Image segmentation method combined with superpixel and multi-scale hierarchical feature recognition |
Also Published As
Publication number | Publication date |
---|---|
CN109325507B (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109325507A (zh) | 一种结合超像素显著性特征与hog特征的图像分类算法和系统 | |
Zahisham et al. | Food recognition with resnet-50 | |
CN105956560B (zh) | 一种基于池化多尺度深度卷积特征的车型识别方法 | |
CN106127196B (zh) | 基于动态纹理特征的人脸表情的分类与识别方法 | |
CN105139004B (zh) | 基于视频序列的人脸表情识别方法 | |
CN103514456B (zh) | 基于压缩感知多核学习的图像分类方法及其装置 | |
CN102938065B (zh) | 基于大规模图像数据的人脸特征提取方法及人脸识别方法 | |
CN107688784A (zh) | 一种基于深层特征和浅层特征融合的字符识别方法及存储介质 | |
CN105825183B (zh) | 基于部分遮挡图像的人脸表情识别方法 | |
CN111126240B (zh) | 一种三通道特征融合人脸识别方法 | |
CN104063719A (zh) | 基于深度卷积网络的行人检测方法及装置 | |
CN111274922A (zh) | 基于多层次深度学习网络的行人重识别方法及系统 | |
CN108108760A (zh) | 一种快速人脸识别方法 | |
Mohamed et al. | An improved LBP algorithm for avatar face recognition | |
CN112784722B (zh) | 基于YOLOv3和词袋模型的行为识别方法 | |
Masita et al. | Pedestrian detection using R-CNN object detector | |
CN104050460B (zh) | 多特征融合的行人检测方法 | |
Wang et al. | S 3 D: Scalable pedestrian detection via score scale surface discrimination | |
CN112597324A (zh) | 一种基于相关滤波的图像哈希索引构建方法、系统及设备 | |
Paul et al. | Extraction of facial feature points using cumulative histogram | |
CN108520215A (zh) | 基于多尺度联合特征编码器的单样本人脸识别方法 | |
CN105608443B (zh) | 一种多特征描述及局部决策加权的人脸识别方法 | |
CN110414431B (zh) | 基于弹性上下文关系损失函数的人脸识别方法及系统 | |
CN104376312B (zh) | 基于词袋压缩感知特征提取的人脸识别方法 | |
CN114492634B (zh) | 一种细粒度装备图片分类识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240401 Address after: No. 1713, Unit A, No. 5, West District, Wuchangfu Phase II, Beigang Village, Hongshan District, Wuhan City, Hubei Province, 430000 Patentee after: Zhongchengke (Wuhan) Information Technology Co.,Ltd. Country or region after: China Address before: 430068 1, Lijia 1 village, Nanhu, Wuchang District, Wuhan, Hubei Patentee before: HUBEI University OF TECHNOLOGY Country or region before: China |