CN104517113B - 一种图像的特征提取方法、图像的分类方法及相关装置 - Google Patents

一种图像的特征提取方法、图像的分类方法及相关装置 Download PDF

Info

Publication number
CN104517113B
CN104517113B CN201310460255.1A CN201310460255A CN104517113B CN 104517113 B CN104517113 B CN 104517113B CN 201310460255 A CN201310460255 A CN 201310460255A CN 104517113 B CN104517113 B CN 104517113B
Authority
CN
China
Prior art keywords
image
block
characteristic vector
cluster centre
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310460255.1A
Other languages
English (en)
Other versions
CN104517113A (zh
Inventor
谢志明
潘晖
潘石柱
张兴明
傅利泉
朱江明
吴军
吴坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN201310460255.1A priority Critical patent/CN104517113B/zh
Publication of CN104517113A publication Critical patent/CN104517113A/zh
Application granted granted Critical
Publication of CN104517113B publication Critical patent/CN104517113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds

Abstract

本发明公开了一种图像的特征提取方法及装置,用以实现提取出的特征向量能够准确反映未进行缩放处理的图像的特征。本发明不需要对图像进行缩放,可以直接对原始图像进行分块,并根据分块得到的各图像块的特征向量,就可以确定原始图像的特征向量。针对单个待提取特征的图像而言,由于可以对针对该图像而获得的聚类中心的个数进行设定,从而可以实现从该图像中提取出特定长度的特征向量;而针对多个分辨率不同的待提取特征的图像而言,由于针对不同待提取特征的图像而获得的聚类中心的个数是相等的,从而可以实现从具备不同分辨率的图像中提取到相同长度的特征向量。本发明还公开了一种图像的分类方法及装置。

Description

一种图像的特征提取方法、图像的分类方法及相关装置
技术领域
本发明涉及信息处理领域,尤其涉及一种图像的特征提取方法、图像的分类方法及相关装置。
背景技术
现有技术中,在对图像进行特征向量提取时,为了从不同图像中提取出相同长度的特征向量,或者从某个图像中提取出特定长度的向量,通常都要先将不同分辨率的图像缩放为特定分辨率的图像;然后再应用某种特征提取方法对这些经过缩放处理的图像进行特征向量的提取。然而,由于在对图像进行缩放处理时,会不可避免的导致图像产生一些形变,从而导致从产生了形变的图像中提取出的特征向量不能很准确地反映相应的未进行缩放处理的原始图像的特征。
发明内容
本发明实施例提供一种图像的特征提取方法及装置,用以解决现有技术中存在的为了从图像中提取出特定长度的特征向量而对图像进行缩放处理,使得从产生了形变的图像中提取出的特征向量不能很准确地反映相应的未进行缩放处理的原始图像的特征的问题。
本发明实施例还提供一种图像的分类方法及装置。
本发明实施例采用以下技术方案:
一种图像的特征提取方法,包括:
为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;所述图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像;以及
分别针对每个由具备相同图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;
以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从所述聚类中心集合中,为该图像块的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
针对每个所述待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该待提取特征向量的图像的特征向量;
其中,当所述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的所述图像块集合而获得的所述聚类中心集合所包含的聚类中心的总个数等于规定个数。
一种图像的分类方法,包括:
获得待提取特征向量的图像的特征向量;
根据图像分类器和确定出的所述待提取特征向量的图像的特征向量,确定所述待提取特征向量的图像所属的图像类别;
其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下:
为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照所述规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;
分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从所述聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像样本块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量;
其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
一种图像的特征提取装置,包括:
标识分配单元,用于为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;所述图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像;
特定个数信息确定单元,用于分别针对每个由具备相同由标识单元分配的图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从所述聚类中心集合中,为该图像块的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
特征向量确定单元,用于针对每个所述待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该待提取特征向量的图像的特征向量;
其中,当所述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的所述图像块集合而获得的所述聚类中心集合所包含的聚类中心的总个数等于规定个数。
一种图像的分类装置,包括:
特征向量获得单元,用于获得待提取特征向量的图像的特征向量;
图像类别确定单元,用于根据图像分类器和特征向量获得单元获得的特征向量,确定所述待提取特征向量的图像所属的图像类别;
其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下:
为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照所述规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;
分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从所述聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量;
其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
本发明实施例的有益效果如下:
本发明实施例提供的该方案不需要对图像进行缩放,可以直接对原始图像进行分块,并根据分块得到的各图像块的特征向量,就可以确定原始图像的特征向量。针对单个待提取特征的图像而言,由于可以对针对该图像而获得的聚类中心的个数进行设定,从而可以实现从该图像中提取出特定长度的特征向量;而针对多个分辨率不同的待提取特征的图像而言,由于针对不同待提取特征的图像而获得的聚类中心的个数是相等的,从而可以实现从具备不同分辨率的图像中提取到相同长度的特征向量。
附图说明
图1为本发明实施例提供的一种图像的特征提取方法的流程图;
图2为本发明实施例提供的一种图像的特征提取方法的具体应用流程图;
图3为本发明实施例提供的一种图像的分类方法的流程图;
图4为本发明实施例提供的一种图像的特征提取装置的结构示意图;
图5为本发明实施例提供的一种图像的分类装置的结构示意图。
具体实施方式
为了解决现有技术中存在的为了从图像中提取出特定长度的特征向量而对图像进行缩放处理,使得从产生了形变的图像中提取出的特征向量不能很准确地反映相应的未进行缩放处理的原始图像的特征的问题,本发明实施例提供了一种图像的特征提取方案。该方案不需要对图像进行缩放,可以直接对原始图像进行分块,并根据分块得到的各图像块的特征向量确定原始图像的特征向量。针对单个待提取特征的图像而言,由于该方案可以对针对该图像而获得的聚类中心的个数进行设定,从而可以实现从该图像中提取出特定长度的特征向量;而针对多个分辨率不同的待提取特征的图像而言,由于该方案针对不同待提取特征的图像而获得的聚类中心的个数是相等的,从而可以实现从具备不同分辨率的图像中提取到相同长度的特征向量。
以下结合说明书附图对本发明的实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限制本发明。并且在不冲突的情况下,本说明中的实施例及实施例中的特征可以互相结合。
首先,本发明实施例提供了一种图像的特征提取方法,该方法的实现流程图如图1所示,主要包括下述步骤:
步骤11,为图像集合中每个图像所包括的图像块分配图像块标识,其中,这里所说的图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像;
上述每个图像中的图像块是按照相同规则划分得到的,从而每个图像块中的图像块的个数是相同的。
本发明实施例中,为图像块分配图像块标识的规则需要达到下述目标:
在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同。
步骤12,分别针对每个由具备相同图像块标识的所有图像块构成的图像块集合执行:分别提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同类别的特征描述向量的聚类中心构成的聚类中心集合;
其中,当该图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的图像块集合而获得的聚类中心集合所包含的聚类中心的总个数等于规定个数。
本发明实施例中,图像块的特征描述向量一般是指图像块的特征点的特征描述向量。比如,可以采用尺度不变特征变换匹配(Scale Invariant Feature Transform,SIFT)或加速鲁棒特征(Speeded Up Robust Features,SURF)等的特征描述向量提取方法,从图像块中确定特征点,并提取特征点的特征描述向量。一般地,“特征点”是指无论其所在的图像如何变换(比如图像进行旋转、分辨率改变等等),其周围区域的特征(比如灰度等特征)都不会发生较大变化的像素点。由于采用SIFT或SURF等方法提取特征描述向量的技术已是现有的比较成熟的技术,因此本发明实施例对此部分技术特征的具体实现方式不再进行赘述。
需要说明的是,步骤13中对于具备相同图像块标识的不同图像块需要采用相同的特征描述向量提取方法,以保证从不同图像块中提取出的特征描述向量的长度一致,从而使得不同的特征描述向量之间具有可比性,能够进行聚类。
而对于具备不同标识的图像块而言,提取其特征描述向量时所采用的特征描述向量提取方法则可以相同也可以不同。
步骤13,针对步骤12中的图像块集合中的各图像块分别执行:从获得的聚类中心集合中,为该图像块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;
其中,这里所说的特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数。
步骤14,针对每个待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有的上述特定个数的信息,确定该待提取特征向量的图像的特征向量。
通过本发明实施例提供的技术方案,针对单个待提取特征的图像而言,由于可以对针对该图像而获得的聚类中心集合所包含的聚类中心的个数(即前文所述的规定个数)进行设定,从而可以实现在不对图像的分辨率进行调整的前提下,也可以从该图像中提取出特定长度的特征向量;而针对多个分辨率不同的待提取特征的图像而言,由于针对不同待提取特征的图像而获得的聚类中心集合所包含的聚类中心的个数是相等的,从而可以实现在不对图像的分辨率进行调整的前提下,也可以从具备不同分辨率的图像中提取到相同长度的特征向量。
以下介绍本发明实施例提供的上述方法在实际中的一种具体应用流程。该应用流程包括如图2所示的下述步骤:
步骤21,针对图像集合中的各图像分别执行:将该图像划分为分别对应图像的不同区域的多个图像块;
其中,划分得到的多个图像块的个数等于第一规定个数;该图像集合包含多个图像,且至少包含一个待提取特征向量的图像。
在本发明实施例中,假设图像集合中包含M个图像,可以对该M个图像中的各图像分别执行:将该图像划分为4个图像块,且这4个图像块所在的图像区域可以按照预设的方式分别标识为区域1、区域2、区域3和区域4。本发明实施例中,不同图像块所在的区域可以完全不重叠,也可以有部分重叠。
步骤22,根据预先设置的图像的区域与图像块标识的对应关系,为对各图像划分得到的各图像块分别分配图像块标识;
具体地,可以将所在的图像区域为区域1的各图像的图像块均标识为1,将所在的图像区域为区域2的各图像的图像块均标识为2,将所在的图像区域为区域3的各图像的图像块均标识为3,将所在的图像区域为区域4的各图像的图像块均标识为4。这样,每个图像都包含标识分别为1、2、3和4的4个图像块,且具备相同图像标识块的所有图像块可以构成一个图像块集合,从而一共可以构成4个图像块集合。其中,每个图像块集合包含M个图像块。
步骤23,分别提取各图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;
在本发明实施例中,可以按照指定的特征描述向量提取方法对各图像块集合的各图像块提取特征描述向量,比如采用尺度不变特征变换匹配(Scale Invariant FeatureTransform,SIFT)的特征描述向量提取方法或加速鲁棒特征(Speeded Up RobustFeatures,SURF)的特征描述向量提取方法,分别从各图像块集合的各图像块中提取特征点的特征描述向量;然后,针对每个图像块集合都执行:对提取到的该图像块集合中的各图像块中的特征点的特征描述向量进行聚类,得到相应的聚类中心集合。为了便于描述,针对包含的图像块的标识为1的图像块集合而言,可以将得到的相应的聚类中心集合所包含的聚类中心的个数记为K1,类似地,针对包含的图像块的标识为i的图像块集合而言,可以将得到的相应的聚类中心集合所包含的聚类中心的个数记为Ki(i为图像块标识)。以每个图像都包含标识分别为1、2、3和4的4个图像块的图像集合为例,相应的4个图像块集合所分别对应的聚类中心个数K1~K4可以相等也可以不相等。其中,每个聚类中心都是一个向量,且与特征点的特征描述向量长度相等。
步骤24,针对待提取特征向量的图像的每个图像块分别执行:从上述聚类中心集合中,为该图像块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,该特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
具体地,针对待提取特征向量的图像的某个标识为i的图像块而言,可以分别对该图像块的各特征描述向量和该图像块所在的图像块集合所对应的Ki个聚类中心进行比较,从而确定分别与各特征描述向量相似度最大的各聚类中心。
例如,针对标识为1的图像块集合中的某个图像块1,假设该图像块1包含N1个特征描述向量,将这N1个特征描述向量分别与该图像块集合所对应的K1个聚类中心逐一进行比较,计算每个特征描述向量与各聚类中心之间的距离,若假设特征描述向量X与特征描述向量Y都距离聚类中心A最近(相对其他聚类中心而言),则可以把这两个特征描述向量归为与聚类中心A同属同一个类别,即可以将特征描述向量X与特征描述向量Y分类结果均视为A。
然而,若特征描述向量X与该聚类中心A之间的距离的绝对值较大,而特征描述向量Y与该聚类中心之间的距离的绝对值较小。那么,虽然将这两个特征向量都归为聚类中心A所属类别,但是,可以通过为特征描述向量X的分类结果分配权重值0.1,而为特征描述向量Y的分类结果分配权重值0.9的方式,将这两个特征描述向量的分类结果调整为0.1*A和0.9*A。类似地,对于每个特征描述向量的分类结果,都可以采用上述方式来进行调整,从而通过对调整后的分类结果的统计,就可以得到各聚类中心的加权值,如得到2.5A、3B和1.2C,其中,2.5、3、1.2分别表征了与聚类中心A、B、C相似度最大的图像块1的特征描述向量的个数的信息。
在本发明实施例中,为了较直观的体现图像块的特征描述向量与相应的聚类中心的比较结果,可以建立针对图像块的聚类中心统计直方图。具体地,将某个图像块1的所有特征描述向量与K1个聚类中心进行比较,得到每个聚类中心所分别对应的的加权值。那么,以这K1个聚类中心为横坐标,以K1个聚类中心中的每一个聚类中心所对应的加权值作为纵坐标,就可以建立该图像块1的聚类中心统计直方图。类似的,对待提取特征向量的图像的每一个图像块都执行上述操作,可以得到相应的聚类中心统计直方图。
步骤25,确定每个待提取特征向量的图像的特征向量;
针对每个待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有特定个数的信息,确定该待提取特征向量的图像的特征向量。
例如,针对单个待提取特征向量的图像m,假设该图像m共包含4个图像块,且针对该4个图像块所分别建立的聚类中心统计直方图的维数分别为:K1、K2、K3和K4,那么,就可以将这4个统计直方图组合成一个K1+K2+K3+K4维的统计直方图作为该图像m的统计直方图,该统计直方图所表示的向量即为图像m的特征向量。
虽然每个待提取特征向量的图像的各图像块所分别包含的特征点数目可能会不一致,但是由于针对各待提取特征向量的图像的不同图像块所属的图像块集合而分别获得的聚类中心之和是相同的,因此对于不同的待提取特征向量的图像而言,其分别包含的具备不同标识的各图像块所对应的聚类中心统计直方图的维数之和是相等的,从而保证了最终得到的每个待提取特征向量的图像的特征向量的长度是一致的。
可选的,在本发明实施例中,若待提取特征向量的图像同属同一类别,且需要提取待提取特征向量的图像的共性特征,则可以进一步执行下述步骤26;或者,若待提取特征向量的图像分属不同类别,且需要提取各类别的待提取特征向量的图像的共性特征,则也可以进一步执行下述步骤26。
步骤26,将得到的每个待提取特征向量的图像的特征向量进行模式识别训练,获得相应类别的共性特征。
具体的模式识别训练方式有多种,比如聚类和线性判别分析等。由于该些方式均为现有技术中比较成熟的技术,在此不再赘述。
通过本发明实施例提供的技术方案在实际中的上述应用流程可知,针对多个分辨率不同的待提取特征的图像而言,由于针对不同待提取特征的图像而获得的聚类中心的个数是相等的,从而可以实现从具备不同分辨率的图像中提取到相同长度的特征向量,而无需对图像进行缩放处理,进而也就保证图像特征的完整性,使得提取到的特征向量能够准确地反映未进行缩放处理的图像的特征。
以下介绍本发明实施例提供的一种图像的分类方法,该方法的实现流程图如图3所示,主要包括下述步骤:
步骤31,获得按照步骤11~步骤15所述的方法确定的待提取特征向量的图像的特征向量。
步骤32,根据图像分类器和确定出的待提取特征向量的图像的特征向量,确定待提取特征向量的图像所属的图像类别;
具体的,以通过线性判别分析而得到的图像分类器为例:该图像分类器会保存一个投影矩阵,然后根据该图像分类器可以识别的各图像类别的聚类中心和该投影矩阵,得到与各图像类别对应的投影中心。以步骤31确定的某个待提取特征向量的图像的特征向量为例,将该特征向量输入图像分类器,图像分类器首先利用该投影矩阵,得到该特征向量所对应的投影向量;然后通过将该投影向量与上述各图像类别对应的投影中心进行逐一比较,分别确定该投影向量与各图像类别对应的投影中心的距离;最后,选择与该投影向量距离最近的那个投影中心所对应的图像类别作为该图像的图像类别。
其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量可以按照上述特征提取方法确定,具体如下:
为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照前文所述的规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;上述每个图像样本中的图像样本块是按照相同规则划分得到的,从而每个图像样本块中的图像样本块的个数是相同的,并且,该个数与待提取特征向量的图像的图像块个数相同;
分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征向量,并通过对提取的所有特征向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从获得的聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像样本块所分别确定出的所有特定个数的信息,确定该图像样本的特征向量;
其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
出于与本发明实施例提供的图像的特征提取方法相同的发明构思,本发明实施例还提供一种图像的特征提取装置。该装置的具体结构示意图如图4所示,其具体包括如下功能单元:
标识分配单元41,用于为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;图像集合包含至少两个图像,且至少两个图像中至少存在一个待提取特征向量的图像;
特定个数信息确定单元42,用于分别针对每个由具备相同由标识单元分配的图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从获得的聚类中心集合中,为该图像块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,该特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
特征向量确定单元43,用于针对每个待提取特征向量的图像执行:根据特定个数信息确定单元42针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有特定个数的信息,确定该待提取特征向量的图像的特征向量。
可选的,上述特定个数信息确定单元42具体用于针对与该聚类中心相似度最大的该图像块的各特征向量分别执行:计算该聚类中心和该特征向量之间的距离,并根据预先设置的距离与权重值的对应关系,确定计算出的距离对应的权重值;确定针对与该聚类中心相似度最大的图像块的各特征向量而分别确定出的权重值的总和。
可选的,上述图像的特征提取装置还可以包括:
共性特征获得单元44,用于通过对根据针对各所述待提取特征向量的图像而分别确定的特征向量进行模式识别训练,获得所述多个所述待提取特征向量的图像的共性特征。
需要说明的是,当上述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的图像块集合而获得的聚类中心集合所包含的聚类中心的总个数等于规定个数。
出于与本发明实施例提供的图像的分类方法相同的发明构思,本发明实施例还提供一种图像的分类装置。该装置的具体结构示意图如图5所示,其具体包括如下功能单元:
特征向量获得单元51,用于获得待提取特征向量的图像的特征向量;其中,所述待提取特征向量的图像的特征向量是采用本发明实施例所提供的图像的特征提取法确定的;
图像类别确定单元52,用于根据图像分类器和特征向量获得单元获得的特征向量,确定所述待提取特征向量的图像所属的图像类别;
其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下:
为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;
分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从获得的聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对该聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量;
其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种图像的特征提取方法,其特征在于,包括:
为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;所述图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像;以及
分别针对每个由具备相同图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;
以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从所述聚类中心集合中,为该图像块的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
针对每个所述待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该待提取特征向量的图像的特征向量;
其中,当所述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的所述图像块集合而获得的所述聚类中心集合所包含的聚类中心的总个数等于规定个数。
2.如权利要求1所述的方法,其特征在于,确定用于表征特定个数的信息,具体包括:
针对与该聚类中心相似度最大的该图像块的各特征向量分别执行:计算该聚类中心和该特征向量之间的距离,并根据预先设置的距离与权重值的对应关系,确定计算出的所述距离对应的权重值;
确定针对与该聚类中心相似度最大的该图像块的各特征向量而分别确定出的所述权重值的总和。
3.如权利要求1所述的方法,其特征在于,所述图像集合中包含多个所述待提取特征向量的图像;则
所述方法还包括:
通过对根据针对各所述待提取特征向量的图像而分别确定的特征向量进行模式识别训练,获得所述多个所述待提取特征向量的图像的共性特征。
4.如权利要求1~3任一所述的方法,其特征在于,不同区域不相互重叠。
5.一种图像分类方法,其特征在于,包括:
获得按照如权利要求1或2所述的方法确定的待提取特征向量的图像的特征向量;
根据图像分类器和确定出的所述待提取特征向量的图像的特征向量,确定所述待提取特征向量的图像所属的图像类别;
其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下:
为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照所述规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;
分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从所述聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像样本块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量;
其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
6.一种图像的特征提取装置,其特征在于,包括:
标识分配单元,用于为图像集合中每个图像所包括的图像块分配图像块标识;其中,每个图像中的图像块是按照相同规则划分得到的;在同一个图像中,不同图像块的图像块标识不同;在不同图像中,处于相同位置的图像块的图像块标识相同;所述图像集合包含至少两个图像,且所述至少两个图像中至少存在一个待提取特征向量的图像;
特定个数信息确定单元,用于分别针对每个由具备相同由标识单元分配的图像块标识的所有图像块构成的图像块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像块集合中的各图像块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像块集合中的待提取特征向量的图像的各图像块分别执行:从所述聚类中心集合中,为该图像块的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像块的特征描述向量的个数;
特征向量确定单元,用于针对每个所述待提取特征向量的图像执行:根据针对该待提取特征向量的图像的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该待提取特征向量的图像的特征向量;
其中,当所述图像集合中包含多个图像,且仅包含一个待提取特征向量的图像时,针对不同的所述图像块集合而获得的所述聚类中心集合所包含的聚类中心的总个数等于规定个数。
7.如权利要求6所述的装置,其特征在于,所述特定个数信息确定单元具体用于:
针对与该聚类中心相似度最大的该图像块的各特征向量分别执行:计算该聚类中心和该特征向量之间的距离,并根据预先设置的距离与权重值的对应关系,确定计算出的所述距离对应的权重值;
确定针对与该聚类中心相似度最大的图像块的各特征向量而分别确定出的所述权重值的总和。
8.如权利要求6所述的装置,其特征在于,所述图像集合中包含多个所述待提取特征向量的图像;则
所述装置还包括:
共性特征获得单元,用于通过对根据针对各所述待提取特征向量的图像而分别确定的特征向量进行模式识别训练,获得所述多个所述待提取特征向量的图像的共性特征。
9.如权利要求6~8任一所述的装置,其特征在于,不同区域不相互重叠。
10.一种图像分类装置,其特征在于,包括:
特征向量获得单元,用于获得待提取特征向量的图像的特征向量;其中,所述待提取特征向量的图像的特征向量是采用如权利要求1或2所述的方法确定的;
图像类别确定单元,用于根据图像分类器和特征向量获得单元获得的特征向量,确定所述待提取特征向量的图像所属的图像类别;
其中,所述图像分类器是根据对各图像样本的特征向量进行分类训练得到的;且每个图像样本的特征向量的确定方式如下:
为每个图像样本所包括的图像样本块分配图像样本块标识;其中,每个图像样本中的图像样本块是按照所述规则划分得到的;在同一个图像样本中,不同图像样本块的图像样本块标识不同;在不同图像样本中,处于相同位置的图像样本块的图像样本块标识相同;
分别针对每个由具备相同图像样本块标识的所有图像样本块构成的图像样本块集合执行:分别采用预先规定的特征描述向量提取算法,提取该图像样本块集合中的各图像样本块的特征描述向量,并通过对提取的所有特征描述向量进行聚类,获得由不同的特征描述向量类别的聚类中心构成的聚类中心集合;以及针对该图像样本块集合中的各图像样本块分别执行:从所述聚类中心集合中,为该图像样本块中的各特征点的特征描述向量分别确定一个相似度最大的聚类中心后,针对所述聚类中心集合的每个聚类中心执行:确定用于表征特定个数的信息;其中,所述特定个数为与该聚类中心相似度最大的该图像样本块的特征描述向量的个数;
针对每个所述图像样本执行:根据针对该图像样本的具备不同图像块标识的各图像块所分别确定出的所有所述特定个数的信息,确定该图像样本的特征向量;
其中,针对所述待提取特征向量的图像的各图像块而分别获得的聚类中心集合所包含的聚类中心的个数之和等于针对任意图像样本的各图像样本块而分别获得的聚类中心集合所包含的聚类中心的个数之和。
CN201310460255.1A 2013-09-29 2013-09-29 一种图像的特征提取方法、图像的分类方法及相关装置 Active CN104517113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310460255.1A CN104517113B (zh) 2013-09-29 2013-09-29 一种图像的特征提取方法、图像的分类方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310460255.1A CN104517113B (zh) 2013-09-29 2013-09-29 一种图像的特征提取方法、图像的分类方法及相关装置

Publications (2)

Publication Number Publication Date
CN104517113A CN104517113A (zh) 2015-04-15
CN104517113B true CN104517113B (zh) 2017-12-19

Family

ID=52792381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310460255.1A Active CN104517113B (zh) 2013-09-29 2013-09-29 一种图像的特征提取方法、图像的分类方法及相关装置

Country Status (1)

Country Link
CN (1) CN104517113B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557526B (zh) * 2015-09-30 2020-06-30 富士通株式会社 处理图像的装置和方法
CN106056133A (zh) * 2016-05-19 2016-10-26 无线生活(杭州)信息科技有限公司 一种图像识别方法及装置
CN106803071B (zh) * 2016-12-29 2020-02-14 浙江大华技术股份有限公司 一种图像中的物体检测方法及装置
EP3545466A4 (en) 2016-12-29 2019-11-27 Zhejiang Dahua Technology Co., Ltd. SYSTEMS AND METHODS FOR DETECTING OBJECTS IN IMAGES
CN106778914A (zh) * 2017-01-16 2017-05-31 湖南财政经济学院 一种大数据图像分类方法
CN107784321B (zh) * 2017-09-28 2021-06-25 深圳市快易典教育科技有限公司 数字绘本快速识别方法、系统及计算机可读存储介质
CN108682153B (zh) * 2018-05-31 2020-12-29 重庆大学 一种基于rfid电子车牌数据的城市道路交通拥堵状态判别方法
CN110096607B (zh) * 2019-04-17 2021-01-15 广州思德医疗科技有限公司 一种标签图片的获取方法及装置
CN111325271B (zh) * 2020-02-18 2023-09-12 Oppo广东移动通信有限公司 图像分类方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254303A (zh) * 2011-06-13 2011-11-23 河海大学 遥感图像分割方法及遥感图像检索方法
CN102567963A (zh) * 2011-11-10 2012-07-11 西安电子科技大学 基于量子多目标聚类的遥感图像分割方法
CN102915544A (zh) * 2012-09-20 2013-02-06 武汉大学 基于纹理检测和颜色分割的视频图像运动目标提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254303A (zh) * 2011-06-13 2011-11-23 河海大学 遥感图像分割方法及遥感图像检索方法
CN102567963A (zh) * 2011-11-10 2012-07-11 西安电子科技大学 基于量子多目标聚类的遥感图像分割方法
CN102915544A (zh) * 2012-09-20 2013-02-06 武汉大学 基于纹理检测和颜色分割的视频图像运动目标提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SVM用于基于块划分特征提取的图像分类;邢慧强等;《微计算机信息》;20061231;第22卷(第5-1期);210-212 *
基于块划分颜色特征的图像检索方法;刘金梅;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20040315(第01期);I138-725 *

Also Published As

Publication number Publication date
CN104517113A (zh) 2015-04-15

Similar Documents

Publication Publication Date Title
CN104517113B (zh) 一种图像的特征提取方法、图像的分类方法及相关装置
Huijuan et al. Fast image matching based-on improved SURF algorithm
CN108681695A (zh) 视频动作识别方法及装置、电子设备和存储介质
CN104657709B (zh) 人脸图像识别方法、装置及服务器
CN111860400A (zh) 人脸增强识别方法、装置、设备及存储介质
WO2023050651A1 (zh) 图像语义分割方法、装置、设备及存储介质
CN110827312A (zh) 一种基于协同视觉注意力神经网络的学习方法
CN103218832A (zh) 基于图像中全局颜色对比度和空域分布的视觉显著性算法
CN109034136A (zh) 图像处理方法、装置、摄像设备及存储介质
CN108762740A (zh) 页面数据的生成方法、装置及电子设备
CN111563556A (zh) 一种基于颜色梯度权重的变电站箱柜设备异常识别方法及系统
CN111144215A (zh) 图像处理方法、装置、电子设备及存储介质
Varga et al. Twin deep convolutional neural network for example-based image colorization
CN110008362A (zh) 一种案件归类方法及装置
CN104156689B (zh) 一种对目标对象的特征信息进行定位的方法和设备
CN108876776A (zh) 一种分类模型生成方法、眼底图像分类方法及装置
CN105069475B (zh) 基于视觉注意机制模型的图像处理方法
CN103761510A (zh) 模拟人类视皮层感知机制的动作识别方法
Binder et al. Analyzing and validating neural networks predictions
CN104636745B (zh) 尺度不变特征提取方法和装置、对象识别方法和装置
Paul et al. Enhanced random forest for mitosis detection
JP2015001859A (ja) 情報処理装置、情報処理システム及びプログラム
CN108256405A (zh) 一种人脸识别方法及装置
CN103761513B (zh) 一种基于混合向量投影的人脸识别方法
CN113191942A (zh) 生成图像的方法、训练人物检测模型的方法、程序及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant