CN109002832B - 一种基于分层特征提取的图像识别方法 - Google Patents

一种基于分层特征提取的图像识别方法 Download PDF

Info

Publication number
CN109002832B
CN109002832B CN201810597123.6A CN201810597123A CN109002832B CN 109002832 B CN109002832 B CN 109002832B CN 201810597123 A CN201810597123 A CN 201810597123A CN 109002832 B CN109002832 B CN 109002832B
Authority
CN
China
Prior art keywords
image
template
formula
substances
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810597123.6A
Other languages
English (en)
Other versions
CN109002832A (zh
Inventor
付应雄
范洪华
石畏
李伟夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Interstellar Digital Technology Co ltd
Jiangsu Qingyun Technology Consulting Service Co ltd
Original Assignee
Hubei University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University filed Critical Hubei University
Priority to CN201810597123.6A priority Critical patent/CN109002832B/zh
Publication of CN109002832A publication Critical patent/CN109002832A/zh
Application granted granted Critical
Publication of CN109002832B publication Critical patent/CN109002832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于分层特征提取的图像识别方法,包括:步骤1,根据图像数据集的特征定义多尺度的框架和相邻尺度的变换;步骤2,根据定义的所述框架和所述变换构造不同尺度下的模板;步骤3,根据不同尺度下的所述模板构造不同尺度下的特征;步骤4,融合多尺度的所述特征,构造分类器进行图像识别。本发明提供的技术方案可有效地获得既有代表性、又有判别性的模板集合,来提取更有效的图像特征,能够以较低的计算复杂度来获取更高的识别精度。

Description

一种基于分层特征提取的图像识别方法
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于分层特征提取的图像识别方法。
背景技术
特征提取是图像识别的研究热点,被广泛应用于科学研究、工业生产、医疗卫生、教育、管理和通信等领域。通常,可靠的鉴别特征一直是完成识别任务的关键。
在过去几十年中,特征提取一直都是很多科研人员的研究重点,为此许多特征提取算法已被提出,比如主成分分析(PCA),尺度不变特征变换(SIFT),线性判别分析(LDA),空间金字塔匹配(SPM),卷积神经网络(CNN)、HMAX模型和分层的神经响应(NR)算法等。但是,通过这些方法进行图像特征提取时,计算复杂度和图像识别精度始终难以达到平衡。
发明内容
针对现有技术的不足,本发明提供一种基于分层特征提取的图像识别方法。
本发明提供的一种基于分层特征提取的图像识别方法包括:
步骤1,根据图像数据集的特征定义多尺度的框架和相邻尺度的变换。
步骤2,根据定义的所述框架和所述变换构造不同尺度下的模板。
步骤3,根据不同尺度下的所述模板构造不同尺度下的特征。
步骤4,融合多尺度的所述特征,构造分类器进行图像识别。
本发明提供的基于分层特征提取的图像识别方法的有益效果是,输入为待识别的图像,输出为经过分析和处理的识别结果。根据图像数据集的特征定义多尺度的框架和多尺度中相邻尺度的变换,确定不同尺度下的模板,从而获得既有代表性、又有判别性的模板集合,根据不同尺度下的模板获得相应特征,通过分层特征提取以获取更有效的图像特征,最后使用融合多层特征训练分类器来做分类,能够以较低的计算复杂度来获取更高的识别精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的基于分层特征提取的图像识别方法的流程示意图;
图2为本发明实施例的图像的框架示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,本发明实施例的基于分层特征提取的图像识别方法包括:
步骤1,根据图像数据集的特征定义多尺度的框架和相邻尺度的变换。
步骤2,根据定义的所述框架和所述变换构造不同尺度下的模板。
步骤3,根据不同尺度下的所述模板构造不同尺度下的特征。
步骤4,融合多尺度的所述特征,构造分类器进行图像识别。
在本实施例中,输入为待识别的图像,输出为经过分析和处理的识别结果。根据图像数据集的特征定义多尺度的框架和多尺度中相邻尺度的变换,确定不同尺度下的模板,从而获得既有代表性、又有判别性的模板集合,根据不同尺度下的模板获得相应特征,通过分层特征提取以获取更有效的图像特征,最后使用融合多层特征训练分类器来做分类,能够以较低的计算复杂度来获取更高的识别精度。
优选地,所述步骤1具体包括:
步骤1.1,根据图像数据集的特征定义图像的框架,其中所述框架包括多个图像层,如图2所示,多个所述图像层中包括依次相邻的图像层u、v和Sq,其中
Figure BDA0001692063170000031
在u、v和Sq上定义的图像块(函数)分别为fu、fv和fSq,图像集合(函数集合)分别为
Figure BDA0001692063170000032
Figure BDA0001692063170000033
其中,
Figure BDA0001692063170000034
Figure BDA0001692063170000035
具体地,图像的本质是一个二维函数,自变量对应坐标,因变量对应像素值,通过不同尺度的图像定义不同的函数集。以三层框架为例,u、v和Sq可分表表示内层图像块、中层图像块和外层图像块。
步骤1.2,确定u至v的变换为
Figure BDA0001692063170000036
其中
Figure BDA0001692063170000037
为拉伸变换,
Figure BDA0001692063170000038
为平移变换,α为拉伸参数,β为平移参数,所述变换的集合为
Figure BDA0001692063170000039
其中,
Figure BDA00016920631700000310
表示集合
Figure BDA00016920631700000311
中的元素个数;确定v至Sq的变换的集合为
Figure BDA00016920631700000312
其中,
Figure BDA00016920631700000313
表示集合
Figure BDA00016920631700000314
中的元素个数。
具体地,参数α取几个固定值,参数β符合标准的高斯分布。另外,由于u、v和Sq是依次相邻的图像层,v至Sq的变换与u至v的变换是类似的。
优选地,所述步骤2具体包括:
步骤2.1,从所述图像集合中随机选取初始模板集合
Figure BDA00016920631700000315
Figure BDA00016920631700000317
其中,
Figure BDA00016920631700000318
具体地,初始模板是在原始数据集中随机采样获取的,从图像集合中随机提取图像块可以获得初始模板,在初始模板中构造一个有代表性和判别性的模板集合。
步骤2.2,确定每个模板
Figure BDA00016920631700000319
对应的分数,其中,
Figure BDA00016920631700000320
根据所述分数的大小按降序排列,选取前
Figure BDA0001692063170000041
个模板
Figure BDA0001692063170000042
构造模板集合
Figure BDA0001692063170000043
其中,
Figure BDA0001692063170000044
具体地,tu为一级模板,其能够被很多目标共有,因此,并不利用训练图像的标签信息来选择该模板,也就是采用无监督的方法选取一级模板。
步骤2.3,确定初始模板集合
Figure BDA0001692063170000045
中每个模板的差异指标值,也就是DIV,根据所述差异指标值将初始模板集合
Figure BDA0001692063170000046
中的模板按照降序排列,记为
Figure BDA0001692063170000047
其中
Figure BDA0001692063170000048
是在
Figure BDA0001692063170000049
的第i个图像块,i=1,2,…,qv,并根据
Figure BDA00016920631700000410
构造模板集合
Figure BDA00016920631700000411
其中,
Figure BDA00016920631700000412
具体地,tv为二级模板,其包含更多有辨别力的结构,因此,利用训练图像的标签信息来选择该模板,也就是采用有监督的方法选取二级模板。
优选地,所述步骤2.2的具体实现包括:
对于图像块
Figure BDA00016920631700000413
和模板集合
Figure BDA00016920631700000414
定义图像块fv与模板
Figure BDA00016920631700000415
之间的相似度
Figure BDA00016920631700000416
为相关系数
Figure BDA00016920631700000417
其中
Figure BDA00016920631700000418
根据第一公式获得图像块fv关于模板集合
Figure BDA00016920631700000419
的相似矩阵,所述第一公式为:
Figure BDA00016920631700000420
其中,第i行的第j个分量代表
Figure BDA00016920631700000421
Figure BDA00016920631700000422
之间的相似度,其中,
Figure BDA00016920631700000423
表示复合函数运算。
对于每一个二级模板
Figure BDA00016920631700000424
其中
Figure BDA00016920631700000425
根据所述第一公式获得相似矩阵
Figure BDA00016920631700000426
初始模板集合
Figure BDA00016920631700000427
在每个模板
Figure BDA00016920631700000428
上的分数的定义为:
Figure BDA00016920631700000429
u层对应的是u这个大小的图像块,v层对应的是v这个大小的图像块。通过u这个大小的图像块出现在v这个大小的图像块中的频率,可以选择选择有判别能力的u大小的图像块。
优选地,所述步骤2.3中所述确定初始模板集合
Figure BDA00016920631700000526
中每个模板的差异指标值的具体实现包括:
令图像的训练集为
Figure BDA0001692063170000051
每个训练图像Ij的第二层尺度特征
Figure BDA0001692063170000052
是一个qv维的向量,记
Figure BDA0001692063170000053
表示第二层尺度特征的第i个分量,Nz表示属于训练集中第z类的样本个数,其中,
Figure BDA0001692063170000054
根据第二公式确定所属类别的样本在模板
Figure BDA0001692063170000055
上神经响应的平均值,所述第二公式为:
Figure BDA0001692063170000056
其中,
Figure BDA0001692063170000057
是第z类的第n个样本,n=1,2,…,Nz
Figure BDA0001692063170000058
是所述样本在
Figure BDA0001692063170000059
的神经响应值。
每个模板的差异指标值的定义为:
Figure BDA00016920631700000510
其中,
Figure BDA00016920631700000511
基于局部神经响应进行基于分层特征提取的图像识别,能够有效获得既有代表性、又有判别性的模板集合,以提取更有效的图像特征。
优选地,所述步骤2.3中所述根据
Figure BDA00016920631700000512
构造模板集合
Figure BDA00016920631700000513
的具体实现包括:
步骤2.3.1,从
Figure BDA00016920631700000514
随机选取一个模板
Figure BDA00016920631700000515
步骤2.3.2,从
Figure BDA00016920631700000516
依次选取图像模板
Figure BDA00016920631700000517
根据第三公式确定相关系数,所述第三公式为:
Figure BDA00016920631700000518
其中,
Figure BDA00016920631700000519
Figure BDA00016920631700000520
Figure BDA00016920631700000521
表示神经响应。
步骤2.3.3,当
Figure BDA00016920631700000522
最大值不超过预定阈值ε时,将
Figure BDA00016920631700000523
添加至
Figure BDA00016920631700000524
步骤2.3.4,重复步骤2.3.2和步骤2.3.3,直至有qv个模板加入到
Figure BDA00016920631700000525
优选地,所述步骤3的具体实现包括:
步骤3.1,对于标定尺度,根据所述标定尺度对应的模板构造相似矩阵。
具体地,在输入图像上计算fu和模板tu之间的相似性。
步骤3.2,对所述相似矩阵进行局部编码,获得稀疏的相似矩阵。
具体地,以矢量的形式表示图像块。
步骤3.3,对所述稀疏的相似矩阵进行最大池化,获得标定尺度下的特征。
具体地,将局部编码的输出组合为单个值。
优选地,所述步骤3.1中,对于图像块
Figure BDA0001692063170000061
和模板集合
Figure BDA0001692063170000062
通过相关系数定义它们的相似度
Figure BDA0001692063170000063
相似矩阵根据所述第一公式确定为:
Figure BDA0001692063170000064
其中,第i行的第j个分量代表
Figure BDA0001692063170000065
Figure BDA0001692063170000066
之间的相似度。
所述步骤3.2中,用最相似的k个模板来线性表示图像块
Figure BDA0001692063170000067
具体实现包括:
步骤3.2.1,对于图像块
Figure BDA0001692063170000068
其中,
Figure BDA0001692063170000069
根据Su中第i行中的相似度选择最相似的k个模板Θ,其中,Θ=(θ1,θ2,…,θk)。
步骤3.2.2,根据第四公式,基于最小化目标函数确定最相似的k个模板系数,所述第四公式为:
Figure BDA00016920631700000610
其中,x=(x1,x2,...,xk)T表示重建图像块
Figure BDA00016920631700000611
的系数。求解出来的x为图像块与模板之间新的相似度。
步骤3.2.3,收集系数后,根据第五公式对多个图像块进行编码,获得稀疏的相似矩阵,所述第五公式为:
Figure BDA00016920631700000612
其中,
Figure BDA00016920631700000613
是第个j模板对应的编码。每个图像块
Figure BDA00016920631700000614
对应于一个局部编码。对多个图像块可以得出一个稀疏的相似矩阵。
所述稀疏的相似矩阵表示为:
Figure BDA0001692063170000071
其中,第i行是由所有模板
Figure BDA0001692063170000072
编码的图像块
Figure BDA0001692063170000073
的编码,
Figure BDA00016920631700000710
Figure BDA0001692063170000074
优选地,所述步骤3.3中,根据局部编码的输出进行最大池化,具体实现包括:
根据第六公式进行最大池化,所述第六公式为:
Figure BDA0001692063170000075
其中,
Figure BDA0001692063170000076
表示一个
Figure BDA0001692063170000077
维矢量。
根据第七公式,基于归一化操作获得第一层尺度特征,所述第七公式为:
Figure BDA0001692063170000078
在获得第一层尺度特征后,可以采用类似的方法,通过应用
Figure BDA0001692063170000079
来获得相似矩阵Sv、局部编码、最大池化,来构造第二层尺度特征。并扩展到下一层尺度特征的获取。
优选地,所述步骤4的具体实现为:将不同尺度下的特征进行融合,用融合的特征训练softmax分类器,来进行图像识别。
由于softmax分类器更具有判别能力,使用softmax分类器对图像进行识别可以获取更高的识别精度。
本发明实施例所提出的方法,首先从图像集中随机选取初始模板,然后用无监督的方法选取一级模板和有监督的方法选取二级模板,通过选取的模板集,对输入原图进行局部编码和最大池化,提取具有既有代表性、又有判别性的图像特征。采用基于局部神经响应进行图像识别的特征提取方法,适用于各种图像分类,例如对象识别、场景识别和机器人定位等。只要描述获得的模板集冗余度较小,具有较强的判别性,本发明的方法都是有效的,并且本发明的方法能够以较低的计算复杂度来获取更高的图像识别精度。
本发明实施例还提供一种基于分层特征提取的图像识别系统,该系统包括:
第一处理模块,用于根据图像数据集的特征定义多尺度的框架和相邻尺度的变换。
第二处理模块,用于根据定义的所述框架和所述变换构造不同尺度下的模板。
第三处理模块,用于根据不同尺度下的所述模板构造不同尺度下的特征。
第四处理模块,用于融合多尺度的所述特征,构造分类器进行图像识别。
本发明实施例还提供一种计算机设备,包括存储器和处理器。
所述存储器,用于存储计算机程序。
所述处理器,用于当读取所述存储器存储的所述计算机程序时,执行上述的基于分层特征提取的图像识别方法。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于分层特征提取的图像识别方法,其特征在于,所述方法包括:
步骤1,根据图像数据集的特征定义多尺度的框架和相邻尺度的变换;所述步骤1具体包括:
步骤1.1,根据图像数据集的特征定义图像的框架,其中所述框架包括多个图像层,多个所述图像层中包括依次相邻的图像层u、v和Sq,其中
Figure FDA0003098766980000011
在u、v和Sq上定义的图像块分别为fu、fv和fSq,图像集合分别为
Figure FDA0003098766980000012
Figure FDA0003098766980000013
其中,
Figure FDA0003098766980000014
步骤1.2,确定u至v的变换为
Figure FDA0003098766980000015
其中,
Figure FDA0003098766980000016
为拉伸变换,
Figure FDA0003098766980000017
为平移变换,α为拉伸参数,β为平移参数,所述变换的集合为
Figure FDA0003098766980000018
其中,
Figure FDA0003098766980000019
表示集合
Figure FDA00030987669800000110
中的元素个数;确定v至Sq的变换的集合为
Figure FDA00030987669800000111
其中,
Figure FDA00030987669800000112
表示集合
Figure FDA00030987669800000113
中的元素个数;步骤2,根据定义的所述框架和所述变换构造不同尺度下的模板;
步骤3,根据不同尺度下的所述模板构造不同尺度下的特征;
步骤4,融合多尺度的所述特征,构造分类器进行图像识别。
2.根据权利要求1所述的基于分层特征提取的图像识别方法,其特征在于,所述步骤2具体包括:
步骤2.1,从所述图像集合中随机选取初始模板集合
Figure FDA00030987669800000114
Figure FDA00030987669800000115
其中,
Figure FDA00030987669800000116
步骤2.2,确定每个模板
Figure FDA00030987669800000117
对应的分数,其中,
Figure FDA00030987669800000118
j=1,2,…,qu,根据所述分数的大小按降序排列,选取前
Figure FDA00030987669800000119
个模板
Figure FDA00030987669800000120
构造模板集合
Figure FDA0003098766980000021
其中,
Figure FDA0003098766980000022
步骤2.3,确定初始模板集合
Figure FDA0003098766980000023
中每个模板的差异指标值,根据所述差异指标值将初始模板集合
Figure FDA0003098766980000024
中的模板按照降序排列,记为
Figure FDA0003098766980000025
其中
Figure FDA0003098766980000026
是在
Figure FDA0003098766980000027
的第i个图像块,i=1,2,…,qv,并根据
Figure FDA0003098766980000028
构造模板集合
Figure FDA0003098766980000029
其中,
Figure FDA00030987669800000210
其中,所述确定初始模板集合
Figure FDA00030987669800000211
中每个模板的差异指标值的具体实现包括:
令图像的训练集为
Figure FDA00030987669800000212
每个训练图像Ij的第二层尺度特征
Figure FDA00030987669800000213
是一个qv维的向量,记
Figure FDA00030987669800000214
表示第二层尺度特征的第i个分量,Nz表示属于训练集中第z类的样本个数,其中,
Figure FDA00030987669800000229
根据第二公式确定所属类别的样本在模板
Figure FDA00030987669800000215
上神经响应的平均值,所述第二公式为:
Figure FDA00030987669800000216
其中,
Figure FDA00030987669800000217
是第z类的第n个样本,n=1,2,…,Nz
Figure FDA00030987669800000218
是所述样本在
Figure FDA00030987669800000219
的神经响应值;
每个模板的差异指标值的定义为:
Figure FDA00030987669800000220
其中,
Figure FDA00030987669800000221
其中,所述根据
Figure FDA00030987669800000222
构造模板集合
Figure FDA00030987669800000223
的具体实现包括:
步骤2.3.1,从
Figure FDA00030987669800000224
随机选取一个模板
Figure FDA00030987669800000225
步骤2.3.2,从
Figure FDA00030987669800000226
依次选取图像模板
Figure FDA00030987669800000227
根据第三公式确定相关系数,所述第三公式为:
Figure FDA00030987669800000228
其中,i=2,3,…,qv,j=1,2,…,
Figure FDA0003098766980000031
表示神经响应;
步骤2.3.3,当
Figure FDA0003098766980000032
最大值不超过预定阈值ε时,将
Figure FDA0003098766980000033
添加至
Figure FDA0003098766980000034
步骤2.3.4,重复步骤2.3.2和步骤2.3.3,直至有qv个模板加入到
Figure FDA0003098766980000035
3.根据权利要求2所述的基于分层特征提取的图像识别方法,其特征在于,所述步骤2.2的具体实现包括:
对于图像块fv和模板集合
Figure FDA0003098766980000036
定义图像块fv与模板
Figure FDA0003098766980000037
之间的相似度
Figure FDA0003098766980000038
为相关系数
Figure FDA0003098766980000039
其中,
Figure FDA00030987669800000310
j=1,2,…,
Figure FDA00030987669800000311
根据第一公式获得图像块fv关于模板集合
Figure FDA00030987669800000312
的相似矩阵,所述第一公式为:
Figure FDA00030987669800000313
其中,第i行的第j个分量代表
Figure FDA00030987669800000314
Figure FDA00030987669800000315
之间的相似度,其中,
Figure FDA00030987669800000316
表示复合函数运算;
对于模板
Figure FDA00030987669800000317
其中,
Figure FDA00030987669800000318
i=1,2,…,qv,根据所述第一公式获得相似矩阵
Figure FDA00030987669800000319
分数的定义为:
Figure FDA00030987669800000320
4.根据权利要求3所述的基于分层特征提取的图像识别方法,其特征在于,所述步骤3的具体实现包括:
步骤3.1,对于标定尺度,根据所述标定尺度对应的模板构造相似矩阵;
步骤3.2,对所述相似矩阵进行局部编码,获得稀疏的相似矩阵;
步骤3.3,对所述稀疏的相似矩阵进行最大池化,获得标定尺度下的特征。
5.根据权利要求4所述的基于分层特征提取的图像识别方法,其特征在于,所述步骤3.1中图像块fv和模板集合
Figure FDA0003098766980000041
的相似矩阵根据所述第一公式确定为:
Figure FDA0003098766980000042
其中,第i行的第j个分量代表
Figure FDA0003098766980000043
Figure FDA0003098766980000044
之间的相似度;
所述步骤3.2的具体实现包括:
步骤3.2.1,对于图像块
Figure FDA0003098766980000045
其中,
Figure FDA0003098766980000046
根据Su中第i行中的相似度选择最相似的k个模板Θ,其中,Θ=(θ12,…,θk);
步骤3.2.2,根据第四公式,基于最小化目标函数确定最相似的k个模板系数,所述第四公式为:
Figure FDA0003098766980000047
其中,x=(x1,x2,…,xk)T表示重建图像块
Figure FDA0003098766980000048
的系数;
步骤3.2.3,收集系数后,根据第五公式对多个图像块进行编码,获得稀疏的相似矩阵,所述第五公式为:
Figure FDA0003098766980000049
其中,
Figure FDA00030987669800000410
是第j个模板对应的编码,
所述稀疏的相似矩阵表示为:
Figure FDA0003098766980000051
其中,第i行是由所有模板
Figure FDA0003098766980000052
编码的图像块
Figure FDA0003098766980000053
的编码,
Figure FDA0003098766980000054
6.根据权利要求5所述的基于分层特征提取的图像识别方法,其特征在于,所述步骤3.3的具体实现包括:
根据第六公式进行最大池化,所述第六公式为:
Figure FDA0003098766980000055
其中,
Figure FDA0003098766980000056
表示一个
Figure FDA0003098766980000057
维矢量;
根据第七公式,基于归一化操作获得第一层尺度特征,所述第七公式为:
Figure FDA0003098766980000058
7.根据权利要求1至6任一项所述的基于分层特征提取的图像识别方法,其特征在于,所述步骤4的具体实现为:将不同尺度下的特征进行融合,用融合的特征训练softmax分类器,来进行图像识别。
CN201810597123.6A 2018-06-11 2018-06-11 一种基于分层特征提取的图像识别方法 Active CN109002832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810597123.6A CN109002832B (zh) 2018-06-11 2018-06-11 一种基于分层特征提取的图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810597123.6A CN109002832B (zh) 2018-06-11 2018-06-11 一种基于分层特征提取的图像识别方法

Publications (2)

Publication Number Publication Date
CN109002832A CN109002832A (zh) 2018-12-14
CN109002832B true CN109002832B (zh) 2021-11-19

Family

ID=64600623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810597123.6A Active CN109002832B (zh) 2018-06-11 2018-06-11 一种基于分层特征提取的图像识别方法

Country Status (1)

Country Link
CN (1) CN109002832B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8705890B2 (en) * 2011-05-02 2014-04-22 Los Alamos National Security, Llc Image alignment
CN103208001B (zh) * 2013-02-06 2016-12-28 华南师范大学 结合形状自适应邻域和纹理特征提取的遥感图像处理方法
CN104657717B (zh) * 2015-02-12 2018-02-02 合肥工业大学 一种基于分层核稀疏表示的行人检测方法
CN105447441B (zh) * 2015-03-19 2019-03-29 北京眼神智能科技有限公司 人脸认证方法和装置
US9514391B2 (en) * 2015-04-20 2016-12-06 Xerox Corporation Fisher vectors meet neural networks: a hybrid visual classification architecture

Also Published As

Publication number Publication date
CN109002832A (zh) 2018-12-14

Similar Documents

Publication Publication Date Title
CN107766894B (zh) 基于注意力机制和深度学习的遥感图像自然语言生成方法
CN107066559B (zh) 一种基于深度学习的三维模型检索方法
CN109063666A (zh) 基于深度可分离卷积的轻量化人脸识别方法及系统
CN113657425B (zh) 基于多尺度与跨模态注意力机制的多标签图像分类方法
CN108090472B (zh) 基于多通道一致性特征的行人重识别方法及其系统
CN111738363B (zh) 基于改进的3d cnn网络的阿尔茨海默病分类方法
CN115132313A (zh) 基于注意力机制的医学影像报告自动生成方法
CN111783884B (zh) 基于深度学习的无监督高光谱图像分类方法
Peng et al. Markov random field based convolutional neural networks for image classification
CN110188827A (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
CN112580480B (zh) 一种高光谱遥感影像分类方法及装置
CN109492610B (zh) 一种行人重识别方法、装置及可读存储介质
CN109239670B (zh) 基于结构嵌入和深度神经网络的雷达hrrp识别方法
CN110046660A (zh) 一种基于半监督学习的乘积量化方法
CN114937173A (zh) 一种基于动态图卷积网络的高光谱图像快速分类方法
CN116110089A (zh) 一种基于深度自适应度量学习的面部表情识别方法
Dong et al. Research on image classification based on capsnet
Al-Jubouri et al. A comparative analysis of automatic deep neural networks for image retrieval
CN117576467B (zh) 一种融合频率域和空间域信息的农作物病害图像识别方法
Devi et al. Content based feature combination method for face image retrieval using neural network and SVM classifier for face recognition
CN113065520A (zh) 一种面向多模态数据的遥感图像分类方法
Abdallah et al. Facial-expression recognition based on a low-dimensional temporal feature space
Zheng et al. 3D texture-based face recognition system using fine-tuned deep residual networks
CN109002832B (zh) 一种基于分层特征提取的图像识别方法
Sassi et al. Neural approach for context scene image classification based on geometric, texture and color information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221221

Address after: 101300 room 818-030, building 1, yard 3, Jinhang East Road, Shunyi District, Beijing (Tianzhu comprehensive free trade zone)

Patentee after: Interstellar Digital Technology Co.,Ltd.

Address before: Room 213, Building 9, No. 30, Mengxiyuan Lane, Jingkou District, Zhenjiang City, Jiangsu Province, 212000

Patentee before: Jiangsu Qingyun Technology Consulting Service Co.,Ltd.

Effective date of registration: 20221221

Address after: Room 213, Building 9, No. 30, Mengxiyuan Lane, Jingkou District, Zhenjiang City, Jiangsu Province, 212000

Patentee after: Jiangsu Qingyun Technology Consulting Service Co.,Ltd.

Address before: 430062 368 Friendship Avenue, Wuchang District, Wuhan, Hubei.

Patentee before: Hubei University

TR01 Transfer of patent right