CN106485186B - 图像特征提取方法、装置、终端设备及系统 - Google Patents
图像特征提取方法、装置、终端设备及系统 Download PDFInfo
- Publication number
- CN106485186B CN106485186B CN201510531886.7A CN201510531886A CN106485186B CN 106485186 B CN106485186 B CN 106485186B CN 201510531886 A CN201510531886 A CN 201510531886A CN 106485186 B CN106485186 B CN 106485186B
- Authority
- CN
- China
- Prior art keywords
- image
- training
- images
- sub
- structural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 93
- 238000012549 training Methods 0.000 claims abstract description 216
- 230000000007 visual effect Effects 0.000 claims abstract description 90
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000004927 fusion Effects 0.000 claims abstract description 43
- 238000004422 calculation algorithm Methods 0.000 claims description 52
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000010276 construction Methods 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 claims description 12
- 238000013135 deep learning Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 abstract description 13
- 230000008569 process Effects 0.000 abstract description 5
- 230000000694 effects Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036544 posture Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种图像特征提取方法,首先接收用户输入的图像;然后对所述用户输入的图像进行配准,获得配准后的图像;再对所述配准后的图像构建多个结构化子图像;然后采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征;再将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据;最后采用结构化模型训练得到的模型,对所述结构化特征数据进行运算,获得图像特征数据。相较于现有技术,本申请获得的图像特征数据为特征向量,由于特征向量与模型在训练过程中保持了图像的结构化特性,因此,所述图像特征数据具有更高的准确性和可辨识性,应用在图像识别尤其是人脸识别中会具有更高的准确性,从而获得更好的识别效果。
Description
技术领域
本申请涉及电子技术领域,具体的说是一种图像特征提取方法、一种图像特征提取装置、一种图像特征提取终端设备以及一种图像特征提取系统。
背景技术
人脸识别研究始于上世纪90年代,一开始提出的有以图像主成分来描述人脸的eigen face方法与以区分性特征来描述人脸图像的fisher face方法;进入本世纪后,基于LBP与Gabor的人脸局部特征描述方法以及基于boosting的区分性特征学习方法迅速成为主流;近些年,随着深度学习(deep learning)方法的提出,人脸识别技术又被推上了一个新的台阶。目前人脸识别领域比较有代表性的前沿技术有以下几个:
首先是美国的facebook公司,首度将深度学习方法引入到人脸识别,利用5个卷积层与2个全连层构建的深度神经网络,对整幅人脸图像提取4096维的视觉特征来进行描述,在识别准确性上得到了显著的提高。
国内的face++公司同样利用深度学习方法,以金字塔结构分级学习了一个较深的神经网络,对整幅人脸图像进行分析,同样在人脸识别技术上取得了突破。
香港中文大学汤晓鸥教授所在的研究组,对基于深度学习的人脸识别技术进行了更加深入的研究,他们用多个人脸子图像分别训练深度神经网络,再将各子神经网络输出的特征串联起来,得到了更好的识别效果,但是,这种对各子图像提取的特征简单的串联损失了图像本身的结构特点。
发明内容
鉴于上述问题,本申请提供一种图像特征提取方法、一种图像特征提取装置、一种图像特征提取终端设备以及一种图像特征提取系统。本申请采用的技术方案是:
本申请提供一种图像特征提取方法,包括:
接收用户输入的图像;
对所述用户输入的图像进行配准,获得配准后的图像;
对所述配准后的图像构建多个结构化子图像;
采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征;
将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据;
采用结构化模型训练得到的模型,对所述结构化特征数据进行运算,获得图像特征数据。
可选的,所述对所述配准后的图像构建多个结构化子图像,包括:
确定所述配准后的图像的结构化基准点位置;
确定子图像的形状参数;
根据所述结构化基准点位置及所述子图像的形状参数,切割所述配准后的图像,获得多个结构化子图像。
可选的,所述确定所述配准后的图像的结构化基准点位置,包括:
根据图像特征点确定所述配准后的图像的结构化基准点位置;或者,
根据空间位置确定所述配准后的图像的结构化基准点位置。
可选的,所述根据所述结构化基准点位置及所述子图像的形状参数,切割所述配准后的图像,获得多个结构化子图像的数学算法为:
aij=C(a,pij(x,y),sij)
式中aij表示结构顺序位于横排第i个、竖排第j个的结构化子图像,C为结构化子图像的构建函数,a表示用户输入的图像,pij表示顺序位于横排第i个、竖排第j个的结构化基准点,pij(x,y)表示结构化基准点pij处于所述用户输入的图像的坐标(x,y)处,sij表示结构化子图像的形状参数,包括矩形、圆形、椭圆形等任意平面形状及其尺寸。
可选的,所述多模型训练获得的特征模型是通过以下方法获得的:
选择预定的训练图像库;
将所述预定的训练图像库中的每个训练图像按照统一的配准方法进行配准,获得配准后的多个训练图像;
对所述配准后的多个训练图像分别构建多个结构化子训练图像;
采用视觉特征学习算法对所述多个结构化子训练图像进行特征模型训练以提取相应的多个子训练图像视觉特征,并获得特征模型。
可选的,所述视觉特征学习算法包括以下任一种:
深度学习方法、boosting算法、svm算法或局部特征组合的学习算法。
可选的,所述特征模型的数学表达为:
vij=Mij(aij,qij)
式中aij表示结构顺序位于横排第i个、竖排第j个的子训练图像,Mij为对应子训练图像aij上训练得到的特征模型,qij为训练得到的特征模型参数,vij为通过特征模型Mij对子训练图像aij提取的子训练图像视觉特征。
可选的,所述将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,包括:
根据构建多个结构化子图像时的确定的结构化基准点位置,将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,所述结构化特征数据包括特征空间关系和特征信息。
可选的,所述结构化特征数据的数学表达为:
d(i,j,k)=vij(k)
式中vij表示结构化子图像的视觉特征,k为第k维的数据,d为融合后的结构化特征数据。
可选的,所述结构化模型训练得到的模型是通过以下方式获得的:
将所述多个子训练图像视觉特征进行结构化融合,获得训练图像结构化特征数据;
采用视觉特征学习算法对所述训练图像结构化特征数据进行结构化模型训练,获得结构化模型训练得到的模型。
可选的,所述结构化模型训练得到的模型的数学表达为:
v=M(d,q)
其中M为基于融合后的训练图像特征数据d进行结构化模型训练得到的模型,q为训练得到的模型参数,v为通过模型M对训练图像特征数据d融合得到的相应视觉特征。
可选的,所述图像特征提取方法还包括:
将所述图像特征数据与预定的图像数据库中的各个预定图像特征数据依次进行比对;
输出比对结果。
可选的,所述将所述图像特征数据与预定的图像数据库中的各个预定图像特征数据依次进行比对,包括:
依次计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值;
所述输出比对结果包括:
依次判断每个所述差值是否大于预定的差值阈值;
若每个所述差值都大于预定的相似度阈值,则输出没有相似图像的信息,否则,则将与所述图像特征数据差值最小的预定图像特征数据对应的图像,和/或图像的信息输出。
可选的,所述计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值的算法包括以下任一种:
欧氏距离计算方法、Cosine距离计算方法或Joint Bayesian距离计算方法。
可选的,所述图像包括:人脸图像。
本申请还提供一种图像特征提取装置,包括:
图像接收单元,用于接收用户输入的图像;
配准单元,用于对所述用户输入的图像进行配准,获得配准后的图像;
子图像构建单元,用于对所述配准后的图像构建多个结构化子图像;
视觉特征提取单元,用于采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征;
融合单元,用于将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据;
运算单元,用于采用结构化模型训练得到的模型,对所述结构化特征数据进行运算,获得图像特征数据。
可选的,所述配准单元,包括:
基准点确定子单元,用于确定所述配准后的图像的结构化基准点位置;
形状参数确定子单元,用于确定子图像的形状参数;
切割子单元,用于根据所述结构化基准点位置及所述子图像的形状参数,切割所述配准后的图像,获得多个结构化子图像。
可选的,所述基准点确定子单元,包括:
特征基准点确定子单元,用于根据图像特征点确定所述配准后的图像的结构化基准点位置;或者,
空间基准点确定子单元,用于根据空间位置确定所述配准后的图像的结构化基准点位置。
可选的,所述切割子单元采用的数学算法为:
aij=C(a,pij(x,y),sij)
式中aij表示结构顺序位于横排第i个、竖排第j个的结构化子图像,C为结构化子图像的构建函数,a表示用户输入的图像,pij表示顺序位于横排第i个、竖排第j个的结构化基准点,pij(x,y)表示结构化基准点pij处于所述用户输入的图像的坐标(x,y)处,sij表示结构化子图像的形状参数,包括矩形、圆形、椭圆形等任意平面形状及其尺寸。
可选的,所述图像特征提取装置,还包括:
多模型训练单元,用于通过多模型训练获得特征模型;
所述多模型训练单元包括:
训练图像库选择子单元,用于选择预定的训练图像库;
训练图像配准子单元,用于将所述预定的训练图像库中的每个训练图像按照统一的配准方法进行配准,获得配准后的多个训练图像;
子训练图像构建子单元,用于对所述配准后的多个训练图像分别构建多个结构化子训练图像;
特征模型获取子单元,用于采用视觉特征学习算法对所述多个结构化子训练图像进行特征模型训练以提取相应的多个子训练图像视觉特征,并获得特征模型。
可选的,所述特征模型获取子单元采用的视觉特征学习算法包括以下任一种:
深度学习方法、boosting算法、svm算法或局部特征组合的学习算法。
可选的,所述融合单元包括:
基准点融合子单元,用于根据构建多个结构化子图像时的确定的结构化基准点位置,将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,所述结构化特征数据包括特征空间关系和特征信息。
可选的,所述图像特征提取装置,还包括:
结构化模型训练单元,用于通过结构化模型训练获得模型;
所述结构化模型训练单元包括:
子训练图像融合子单元,用于将所述多个子训练图像视觉特征进行结构化融合,获得训练图像结构化特征数据;
模型获取子单元,用于采用视觉特征学习算法对所述训练图像结构化特征数据进行结构化模型训练,获得结构化模型训练得到的模型。
可选的,所述图像特征提取装置,还包括:
比对单元,用于将所述图像特征数据与预定的图像数据库中的各个预定图像特征数据依次进行比对;
输出单元,用于输出比对结果。
可选的,所述比对单元包括:
差值计算子单元,用于依次计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值;
所述输出单元包括:
差值判断子单元,用于依次判断每个所述差值是否大于预定的差值阈值;
信息输出单元,用于若每个所述差值都大于预定的相似度阈值,则输出没有相似图像的信息,否则,则将与所述图像特征数据差值最小的预定图像特征数据对应的图像,和/或图像的信息输出。
可选的,所述比对单元计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值的算法包括以下任一种:
欧氏距离计算方法、Cosine距离计算方法或Joint Bayesian距离计算方法。
本申请还提供一种图像特征提取终端设备,包括:
中央处理器;
输入输出单元;
存储器;所述存储器中存储有本申请提供的图像特征提取方法;并在启动后能够根据上述方法运行。
本申请还提供一种图像特征提取系统,包括客户端和远端服务器,使用本申请提供的图像特征提取装置,所述客户端拍摄图像和/或选取相册中的图像发送到远端服务器,所述远端服务器提取出图像特征数据,并与预定的图像数据库中的图像进行比对,并将比对结果发送至所述客户端,最终由所述客户端输出比对结果。
与现有技术相比,本申请具有以下优点:
本申请提供的一种图像特征提取方法,首先接收用户输入的图像;然后对所述用户输入的图像进行配准,获得配准后的图像;再对所述配准后的图像构建多个结构化子图像;接下来,采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征;然后将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据;最后采用结构化模型训练得到的模型,对所述结构化特征数据进行运算,获得图像特征数据。相较于现有技术的图像特征提取方法,本申请中,通过构建结构化子图像保留了结构化子图像之间的空间位置信息,因此提取的所述结构化子图像的视觉特征同时包括特征空间关系和特征信息,在进行结构化融合时既保留了各视觉特征的描述性,又保留了各视觉特征的空间关系,从而最终获得的图像特征数据为特征向量,可以用特征向量间的特征距离描述不同图像之间的差异,又由于本方法中特征向量与模型在训练过程中更好的保持了图像的结构化特性,因此,所述图像特征数据具有更高的准确性和可辨识性。在图像识别尤其是人脸识别中应用本申请提供的图像特征提取方法,会具有更高的准确性,从而获得更好的识别效果。
附图说明
图1是本申请提供的一种图像特征提取方法实施例的流程图;
图2是本申请提供的一种图像特征提取方法实施例中构建多个结构化子图像的流程图;
图3是本申请提供的根据空间位置关系确定结构化基准点的示例图;
图4是本申请提供的根据人脸特征点确定结构化基准点的示例图;
图5是本申请提供的一种图像特征提取方法实施例中多模型训练的流程图;
图6是本申请提供的特征结构化融合示意图;
图7是本申请提供的一种图像特征提取装置实施例的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
本申请提供了一种图像特征提取方法、一种图像特征提取装置、一种图像特征提取终端设备以及一种图像特征提取系统,下面依次结合附图对本申请的实施例进行详细说明。
请参考图1,其为本申请提供的一种图像特征提取方法实施例的流程图,所述图像特征提取方法包括如下步骤:
步骤S101:接收用户输入的图像。
本步骤中,首先接收用户输入的图像,用户可以从终端设备的电子相册中选择一幅图像输入,也可以通过摄像装置拍摄一幅图像并输入。需要说明的是,本申请的目的在于图像识别,因此优先考虑用户输入的图像为静态图像,但为了提高本方法的普遍适用性,在本申请的一个实施例中,可以接收用户输入的动态图像,但会进行预处理,只提取所述动态图像的特定帧(如第一帧)作为用户输入的图像,以上均在本申请的保护范围之内。
在本申请的一个优选实施例中,本图像特征提取方法用于人脸图像识别,因此,所述图像包括人脸图像。
步骤S102:对所述用户输入的图像进行配准,获得配准后的图像。
通过步骤S101,已接收到用户输入的图像,接下来,需要对所述用户输入的图像进行配准,现有技术中常用的配准方法是先检测图像特征点,然后根据特征点进行图像仿射变换,将图像归一化到预定的大小与比例,获得配准后的头像,以便进行识别和比对。
在本申请的一个优选实施例中,本图像特征提取方法用于人脸图像识别,所述图像为人脸图像,在进行配准时,首先检测人脸图像的特征点,如眼睛、嘴、鼻子的位置等,然后根据所述特征点进行图像仿射变换,归一化到预定的大小和比例,通过这种方式,将需要与所述人脸图像进行比对的图像也进行配准,使其与所述人脸图像的大小和比例一致,即可在相同的标准下进行比对,进而提高比对的准确性。
步骤S103:对所述配准后的图像构建多个结构化子图像。
通过步骤S103,已通过对所述用户输入的图像进行配准,获得了配准后的图像,接下来,需要对所述配准后的图像构建多个结构化子图像,请参考图2,其为本申请提供的一种图像特征提取方法实施例中构建多个结构化子图像的流程图,所述对所述配准后的图像构建多个结构化子图像可通过以下子步骤进行:
步骤S1031:确定所述配准后的图像的结构化基准点位置。
构建多个结构化子图像,即按照一定的结构、位置及限制条件从图像中分割出多个子图像。首先,要确定所述配准后的图像的结构化基准点位置,以用来确定结构化子图像的切割位置。
在本申请提供的一个实施例中,将所述结构化基准点作为结构化子图像切割的中心点,为了保持图像的结构特点以及方便后续的计算,一般选择上下左右关系基本保持不变的一组大致矩形分布的基准点。
结构化基准点的确定方法有多种,可以是根据空间位置确定所述配准后的图像的结构化基准点位置,也可以根据图像特征点确定所述配准后的图像的结构化基准点位置。
仍以上述人脸图像的优选实施例为例,如图3所示,其根据空间位置关系确定了一组4×4个结构化基准点,他们之间的距离相对于图像是完全固定的。如图4所示,其根据人脸特征点确定了3×3个结构化基准点,图中9个结构化基准点自上至下、自左至右依次为:右眼中心点、两眼中心点、左眼中心点、右脸颊点、鼻尖点、左脸颊点、右嘴角点、嘴唇中心点和左嘴角点,这9个结构化基准点的位置关系对于不同的人、姿态、表情会发生稍许变化,但同样满足近似的矩形结构关系。
以上仅以人脸图像为例举例说明,对于不同类别的图像,在实施时可根据图像的主体内容选择确定结构化基准点的方法,同时结构化基准点的数量也不限于上述4×4和3×3的情形,可根据实际情况灵活确定,此处不再赘述,其均在本申请的保护范围之内。
步骤S1032:确定子图像的形状参数。
通过步骤S1031,已确定所述配准后的图像的结构化基准点位置,接下来,需要确定子图像的形状参数,即以所述结构化基准点位置做参考,在其周围以一定比例与大小确定一个子图像区域,所述形状参数包括所述子图像的形状,如矩形、圆形、椭圆形等任意平面形状,以及所述子图像的尺寸,如矩形的长宽、圆形的半径等。
仍以上述人脸图像的优选实施例为例,如图3所示,确定了分别以左上与右下两个结构化基准点为中心的不同尺寸的两个矩形子图像区域。
步骤S1033:根据所述结构化基准点位置及所述子图像的形状参数,切割所述配准后的图像,获得多个结构化子图像。
通过步骤S1031和步骤S1032,已确定所述结构化基准点位置及所述子图像的形状参数,接下来,需要根据所述结构化基准点位置及所述子图像的形状参数,切割所述配准后的图像,从而提取出多个结构化子图像,同时将所述结构化基准点的位置关系作为结构信息进行记录保存。
仍以上述人脸图像的优选实施例为例,所述结构化子图像的数学算法可以为:
aij=C(a,pij(x,y),sij)
式中aij表示结构顺序位于横排第i个、竖排第j个的结构化子图像,C为结构化子图像的构建函数,a表示用户输入的图像,pij表示顺序位于横排第i个、竖排第j个的结构化基准点,pij(x,y)表示结构化基准点pij处于所述用户输入的图像的坐标(x,y)处,sij表示结构化子图像的形状参数,包括矩形、圆形、椭圆形等任意平面形状及其尺寸。
步骤S104:采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征。
通过步骤S103,已对所述配准后的图像构建多个结构化子图像,接下来,需要采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征,所述特征模型是通过多模型训练获得的用来提取图像视觉特征的数学表达,其输入是整体或者局部图像,输出是相应的视觉特征。所述视觉特征是基于图像提炼出来的能描述图像整体或者局部形状、纹理、颜色等特点的数学表达,一般用向量的形式来表示。所述多模型训练是估计特征模型参数的过程,一般通过大批图像按照某种准则完成特征模型参数的估计。
在本申请提供的一个实施例中,请参考图5,其为本申请提供的一种图像特征提取方法实施例中多模型训练的流程图,所述多模型训练获得的特征模型是通过以下子步骤实现的:
步骤S1041:选择预定的训练图像库。
本步骤,首先选择预定的训练图像库,所述预定的训练图像库是与所述用户输入的图像主题内容一致的多个训练图像的集合,以上述人脸图像的优选实施例为例,所述用户输入的图像为人脸图像,则选择预定的训练图像库为人脸训练图像库,所述人脸训练图像库可以采用业内具有代表性的公开人脸数据库,如1fw、CASIA_WebFace等,也可以使用自己按照统一标准整理的人脸数据库。
步骤S1042:将所述预定的训练图像库中的每个训练图像按照统一的配准方法进行配准,获得配准后的多个训练图像。
通过步骤S1041,已选择预定的训练图像库,接下来,为了保证所述多模型训练获得的特征模型可以适用于所述用户输入的图像,需要将所述预定的训练图像库中的训练图像全部采用与步骤S102中所述的配准方法一致的配准方法进行配准,具体请参照上述步骤S102的说明,此处不再赘述,其均在本申请的保护范围之内。
步骤S1043:对所述配准后的多个训练图像分别构建多个结构化子训练图像。
通过步骤S1042,已将所述预定的训练图像库中的每个训练图像按照统一的配准方法进行配准,获得了配准后的多个训练图像,接下来,需要对所述配准后的多个训练图像分别构建多个结构化子训练图像。具体实施方式请参考上述步骤S103的说明,此处不再赘述,其均在本申请的保护范围之内。
步骤S1044:采用视觉特征学习算法对所述多个结构化子训练图像进行特征模型训练以提取相应的多个子训练图像视觉特征,并获得特征模型。
通过步骤S1043,已对所述配准后的多个训练图像分别构建多个结构化子训练图像,接下来,采用视觉特征学习算法对所述多个结构化子训练图像进行特征模型训练以提取相应的多个子训练图像视觉特征,并获得特征模型。本步骤对各个结构化子训练图像分别进行多模型训练,以便对各结构化子训练图像提取最有表征性的视觉特征。
所述视觉特征学习算法包括以下任一种:深度学习方法、boosting算法、svm算法或局部特征组合的学习算法。以上均为现有技术中的成熟的学习算法,此处不再赘述,其均在本申请的保护范围之内。
在本申请提供的一个实施例中,所述特征模型的数学表达为:
vij=Mij(aij,qij)
式中aij表示结构顺序位于横排第i个、竖排第j个的子训练图像,Mij为对应子训练图像aij训练得到的特征模型,qij为训练得到的特征模型参数,vij为通过特征模型Mij对子训练图像aij提取的子训练图像视觉特征。
通过步骤S1041至S1044,完成了多模型训练,确定了特征模型及特征模型参数,接下来,将所述多个结构化子图像代入上述特征模型,即可计算得知每个所述结构化子图像的视觉特征。
步骤S105:将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据。
通过步骤S104,已采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征,接下来,将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据。
在本申请提供的一个实施例中,所述将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,包括:
根据构建多个结构化子图像时的确定的结构化基准点位置,将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,所述结构化特征数据包括特征空间关系和特征信息。
仍以上述人脸图像的优选实施例为例,根据上述步骤S103确定的所述结构化基准点位置,对所述结构化子图像的视觉特征在空间上进行结构化融合,这样在空间平面上可以反映各所述结构化子图像的视觉特征基于所述结构化基准点位置的空间关系,而所述结构化子图像的视觉特征的特征轴则反映了各所述结构化子图像的特征信息,其长短代表了特征维度。请参考图6,其为本申请提供的特征结构化融合示意图,特征化基准点601位置的特征值图像602经过对应的特征模型抽取特征向量603,所述特征向量603经过结构化融合获得结构化特征数据604,由于结构化融合的过程保持了结构化基准点601相对于其他结构化基准点的空间位置关系,因此所述结构化特征数据604中也包含了特征空间关系和特征信息。
在本申请提供的一个实施例中,所述结构化特征数据的数学表达为:
d(i,j,k)=vij(k)
式中vij表示结构化子图像的视觉特征,k为第k维的数据,d为融合后获得的结构化特征数据。
步骤S106:采用结构化模型训练得到的模型,对所述结构化特征数据进行运算,获得图像特征数据。
通过步骤S105,已将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,接下来,采用结构化模型训练得到的模型,对所述结构化特征数据进行运算,获得图像特征数据。
所述结构化模型训练是上述步骤S1041至S1044描述的多模型训练的后续步骤,相关之处请参照上述步骤S1041至S1044的描述,此处不再赘述,以下对结构化模型训练进行说明。
所述结构化模型训练是对结构化特征数据进行训练,在保持特征空间关系的同时,对特征信息进行更好的融合。在本申请提供的一个实施例中,所述结构化模型训练包括:
将所述多个子训练图像视觉特征进行结构化融合,获得训练图像结构化特征数据;
采用视觉特征学习算法对所述训练图像结构化特征数据进行结构化模型训练,获得结构化模型训练得到的模型。
在本申请提供的一个实施例中,所述结构化模型训练得到的模型的数学表达为:
v=M(d,q)
其中M为基于融合后的训练图像特征数据d进行结构化模型训练得到的模型,q为训练得到的模型参数,v为通过模型M对训练图像特征数据d融合得到的相应视觉特征。
通过上述多模型训练,可以确定模型及模型参数,接下来,将所述结构化特征数据代入上述模型中的d,即可计算得到最终的图像特征数据v。
至此,通过步骤S101至步骤S106完成了本申请提供的图像特征提取方法实施例的流程,本申请中,通过构建结构化子图像保留了结构化子图像之间的空间位置信息,因此提取的所述结构化子图像的视觉特征同时包括特征空间关系和特征信息,在进行结构化融合时既保留了各视觉特征的描述性,又保留了各视觉特征的空间关系,从而最终获得的图像特征数据为特征向量,可以用特征向量间的特征距离描述不同图像之间的差异,又由于本方法中特征向量与模型在训练过程中更好的保持了图像的结构化特性,因此,所述图像特征数据具有更高的准确性和可辨识性。在图像识别尤其是人脸识别中应用本申请提供的图像特征提取方法,会具有更高的准确性,从而获得更好的识别效果。
通过以上步骤,已经提取出所述用户输入的图像的图像特征数据,接下来可以利用所述图像特征数据对所述用户输入的图像进行识别,可用于判断所述用户输入的图像与某一图像的相似程度,或者判断某一图像数据库中是否有与所述用户输入的图像相似的图片,或者在某一图像数据库中筛选出与所述用户输入的图像相似的图片,在本申请提供的一个实施例中,所述图像特征提取方法还包括步骤:
将所述图像特征数据与预定的图像数据库中的各个预定图像特征数据依次进行比对;
输出比对结果。
所述比对结果可以是所述用户输入的图像与预定的图像数据库中每个图片的相似程度,也可以是将相似程度达到预定阈值的预定的图像数据库中的图片及其信息等。在实际应用时,所述预定的图像数据库可以是公安追逃应用中的罪犯人脸数据库、考勤系统中的员工人脸数据库、会员管理系统中的会员人脸数据库或者明星脸检索系统中的明星人脸数据库等等,所述比对结果可以是所述用户输入的图像是否为在逃罪犯、所述用户输入的图像是否为已注册员工或会员、考勤人员的相貌是否与考勤系统中的记录一致,所述用户输入的图像与哪个明星的相貌相似等等。
考虑到所述图像特征数据为向量,所述相似程度可以采用向量之间的距离来表征,距离越小,相似程度越高例如欧氏距离、Cosine距离或Joint Bayesian距离等。
在本申请提供的一个实施例中,所述将所述图像特征数据与预定的图像数据库中的各个预定图像特征数据依次进行比对,包括:
依次计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值;
所述输出比对结果包括:
依次判断每个计算后的相似度是否大于预定的差值阈值;
若每个计算后的差值都大于预定的相似度阈值,则输出没有相似图像的信息,否则,则将与所述图像特征数据差值最小的预定图像特征数据对应的图像,和/或图像的信息输出。
其中所述计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值的算法包括以下任一种:
欧氏距离计算方法、Cosine距离计算方法或Joint Bayesian距离计算方法。
以上,为本申请提供的一种图像特征提取方法实施例,与其相应的,本申请还提供了一种图像特征提取装置。请参考图7,其为本申请提供的一种图像特征提取装置实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本申请提供的一种图像特征提取装置实施例中,所述图像特征提取装置包括:图像接收单元701,用于接收用户输入的图像;配准单元702,用于对所述用户输入的图像进行配准,获得配准后的图像;子图像构建单元703,用于对所述配准后的图像构建多个结构化子图像;视觉特征提取单元704,用于采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征;融合单元705,用于将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据;运算单元706,用于采用结构化模型训练得到的模型,对所述结构化特征数据进行运算,获得图像特征数据。
可选的,所述配准单元702,包括:
基准点确定子单元,用于确定所述配准后的图像的结构化基准点位置;
形状参数确定子单元,用于确定子图像的形状参数;
切割子单元,用于根据所述结构化基准点位置及所述子图像的形状参数,切割所述配准后的图像,获得多个结构化子图像。
可选的,所述基准点确定子单元,包括:
特征基准点确定子单元,用于根据图像特征点确定所述配准后的图像的结构化基准点位置;或者,
空间基准点确定子单元,用于根据空间位置确定所述配准后的图像的结构化基准点位置。
可选的,所述切割子单元采用的数学算法为:
aij=C(a,pij(x,y),sij)
式中aij表示结构顺序位于横排第i个、竖排第j个的结构化子图像,C为结构化子图像的构建函数,a表示用户输入的图像,pij表示顺序位于横排第i个、竖排第j个的结构化基准点,pij(x,y)表示结构化基准点pij处于所述用户输入的图像的坐标(x,y)处,sij表示结构化子图像的形状参数,包括矩形、圆形、椭圆形等任意平面形状及其尺寸。
可选的,所述图像特征提取装置,还包括:多模型训练单元,用于通过多模型训练获得特征模型。
可选的,所述多模型训练单元包括:
训练图像库选择子单元,用于选择预定的训练图像库;
训练图像配准子单元,用于将所述预定的训练图像库中的每个训练图像按照统一的配准方法进行配准,获得配准后的多个训练图像;
子训练图像构建子单元,用于对所述配准后的多个训练图像分别构建多个结构化子训练图像;
特征模型获取子单元,用于采用视觉特征学习算法对所述多个结构化子训练图像进行特征模型训练以提取相应的多个子训练图像视觉特征,并获得特征模型。
可选的,所述特征模型获取子单元采用的视觉特征学习算法包括以下任一种:
深度学习方法、boosting算法、svm算法或局部特征组合的学习算法。
可选的,所述融合单元705包括:
基准点融合子单元,用于根据构建多个结构化子图像时的确定的结构化基准点位置,将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,所述结构化特征数据包括特征空间关系和特征信息。
可选的,所述图像特征提取装置还包括:
结构化模型训练单元,用于通过结构化模型训练获得模型。
可选的,所述结构化模型训练单元包括:
子训练图像融合子单元,用于将所述多个子训练图像视觉特征进行结构化融合,获得训练图像结构化特征数据;
模型获取子单元,用于采用视觉特征学习算法对所述训练图像结构化特征数据进行结构化模型训练,获得结构化模型训练得到的模型。
可选的,所述图像特征提取装置还包括:
比对单元,用于将所述图像特征数据与预定的图像数据库中的各个预定图像特征数据依次进行比对;
输出单元,用于输出比对结果。
可选的,所述比对单元包括:
差值计算子单元,用于依次计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值;
所述输出单元包括:
差值判断子单元,用于依次判断每个所述差值是否大于预定的差值阈值;
信息输出单元,用于若每个所述差值都大于预定的相似度阈值,则输出没有相似图像的信息,否则,则将与所述图像特征数据差值最小的预定图像特征数据对应的图像,和/或图像的信息输出。
可选的,所述比对单元计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值的算法包括以下任一种:
欧氏距离计算方法、Cosine距离计算方法或Joint Bayesian距离计算方法。
以上,为本申请提供的一种图像特征提取装置实施例。
本申请还提供一种图像特征提取终端设备,包括:
中央处理器;
输入输出单元;
存储器;所述存储器中存储有本申请提供的图像特征提取方法;并在启动后能够根据上述方法运行。
例如,所述客户端为一平板电脑,用户用平板电脑自拍一张照片或从相册中选择一张人脸照片,所述平板电脑即调用本申请提供的图像特征提取方法提取出照片的图像特征数据,并与预存的明星脸图像数据库中的图像进行比对,得到与所述照片相似度最高的明星图像,并调取所述明星的人物信息,然后将所述明星图像及人物信息在显示屏上输出。
由于本终端设备使用上述图像特征提取方法,相关之处请参见上述图像特征提取方法实施例的说明,此处不再赘述。
本申请还提供了一种图像特征提取系统,包括客户端和远端服务器,本系统部署有本申请提供的所述图像特征提取装置,在运行时,所述客户端拍摄图像和/或选取相册中的图像发送到远端服务器,所述远端服务器提取出图像特征数据,并与预定的图像数据库中的图像进行比对,并将比对结果发送至所述客户端,最终由所述客户端输出比对结果。
例如,所述客户端为一智能手机,用户用智能手机自拍一张照片或从相册中选择一张人脸照片,然后发送到远端服务器,远端服务器即调用本申请提供的图像特征提取方法提取出照片的图像特征数据,并与预存的明星脸图像数据库中的图像进行比对,得到与所述照片相似度最高的明星图像,并调取所述明星的人物信息,然后将所述明星图像及人物信息发送至所述客户端,最终在所述客户端的显示屏上输出。
由于本图像特征提取系统使用上述图像特征提取方法,相关之处请参见上述图像特征提取方法实施例的说明,此处不再赘述。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
Claims (26)
1.一种图像特征提取方法,其特征在于,包括:
接收用户输入的图像;
对所述用户输入的图像进行配准,获得配准后的图像;
对所述配准后的图像构建多个结构化子图像;
采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征,所述多模型训练获得的特征模型是采用视觉特征学习算法对多个结构化子训练图像进行特征模型训练获得的特征模型,所述多个结构化子训练图像为由配准后的多个训练图像分别构建的图像;
将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据;
采用结构化模型训练得到的模型,对所述结构化特征数据进行运算,获得图像特征数据,其中,所述结构化模型训练得到的模型是通过将多个子训练图像视觉特征进行结构化融合,获得训练图像结构化特征数据,采用视觉特征学习算法对所述训练图像结构化特征数据进行结构化模型训练而得到的模型。
2.根据权利要求1所述的图像特征提取方法,其特征在于,所述对所述配准后的图像构建多个结构化子图像,包括:
确定所述配准后的图像的结构化基准点位置;
确定子图像的形状参数;
根据所述结构化基准点位置及所述子图像的形状参数,切割所述配准后的图像,获得多个结构化子图像。
3.根据权利要求2所述的图像特征提取方法,其特征在于,所述确定所述配准后的图像的结构化基准点位置,包括:
根据图像特征点确定所述配准后的图像的结构化基准点位置;或者,
根据空间位置确定所述配准后的图像的结构化基准点位置。
4.根据权利要求2所述的图像特征提取方法,其特征在于,所述根据所述结构化基准点位置及所述子图像的形状参数,切割所述配准后的图像,获得多个结构化子图像的数学算法为:
aij=C(a,pij(x,y),sij)
式中aij表示结构顺序位于横排第i个、竖排第j个的结构化子图像,C为结构化子图像的构建函数,a表示用户输入的图像,pij表示顺序位于横排第i个、竖排第j个的结构化基准点,pij(x,y)表示结构化基准点pij处于所述用户输入的图像的坐标(x,y)处,sij表示结构化子图像的形状参数,至少包括矩形、圆形、椭圆形及其尺寸。
5.根据权利要求1所述的图像特征提取方法,其特征在于,所述多模型训练获得的特征模型是通过以下方法获得的:
选择预定的训练图像库;
将所述预定的训练图像库中的每个训练图像按照统一的配准方法进行配准,获得配准后的多个训练图像;
对所述配准后的多个训练图像分别构建多个结构化子训练图像;
采用视觉特征学习算法对所述多个结构化子训练图像进行特征模型训练以提取相应的多个子训练图像视觉特征,并获得特征模型。
6.根据权利要求5所述的图像特征提取方法,其特征在于,所述视觉特征学习算法包括以下任一种:
深度学习方法、boosting算法、svm算法或局部特征组合的学习算法。
7.根据权利要求5所述的图像特征提取方法,其特征在于,所述特征模型的数学表达为:
vij=Mij(aij,qij)
式中aij表示结构顺序位于横排第i个、竖排第j个的子训练图像,Mij为对应子训练图像aij上训练得到的特征模型,qij为训练得到的特征模型参数,vij为通过特征模型Mij对子训练图像aij提取的子训练图像视觉特征。
8.根据权利要求1所述的图像特征提取方法,其特征在于,所述将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,包括:
根据构建多个结构化子图像时的确定的结构化基准点位置,将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,所述结构化特征数据包括特征空间关系和特征信息。
9.根据权利要求8所述的图像特征提取方法,其特征在于,所述结构化特征数据的数学表达为:
d(i,j,k)=vij(k)
式中vij表示结构化子图像的视觉特征,k为第k维的数据,d为融合后的结构化特征数据。
10.根据权利要求5所述的图像特征提取方法,其特征在于,所述结构化模型训练得到的模型的数学表达为:
v=M(d,q)
其中M为基于融合后的训练图像特征数据d进行结构化模型训练得到的模型,q为训练得到的模型参数,v为通过模型M对训练图像特征数据d融合得到的相应视觉特征。
11.根据权利要求1所述的图像特征提取方法,其特征在于,还包括:
将所述图像特征数据与预定的图像数据库中的各个预定图像特征数据依次进行比对;
输出比对结果。
12.根据权利要求11所述的图像特征提取方法,其特征在于,所述将所述图像特征数据与预定的图像数据库中的各个预定图像特征数据依次进行比对,包括:
依次计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值;
所述输出比对结果包括:
依次判断每个所述差值是否大于预定的差值阈值;
若每个所述差值都大于预定的相似度阈值,则输出没有相似图像的信息,否则,则将与所述图像特征数据差值最小的预定图像特征数据对应的图像,和/或图像的信息输出。
13.根据权利要求12所述的图像特征提取方法,其特征在于,所述计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值的算法包括以下任一种:
欧氏距离计算方法、Cosine距离计算方法或Joint Bayesian距离计算方法。
14.根据权利要求1至13任一项所述的图像特征提取方法,其特征在于,所述图像包括:人脸图像。
15.一种图像特征提取装置,其特征在于,包括:
图像接收单元,用于接收用户输入的图像;
配准单元,用于对所述用户输入的图像进行配准,获得配准后的图像;
子图像构建单元,用于对所述配准后的图像构建多个结构化子图像;
视觉特征提取单元,用于采用多模型训练获得的特征模型提取每个所述结构化子图像的视觉特征,所述多模型训练获得的特征模型是采用视觉特征学习算法对多个结构化子训练图像进行特征模型训练获得的特征模型,所述多个结构化子训练图像为由配准后的多个训练图像分别构建的图像;
融合单元,用于将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据;
运算单元,用于采用结构化模型训练得到的模型,对所述结构化特征数据进行运算,获得图像特征数据;
还包括:结构化模型训练单元,用于通过结构化模型训练获得模型;其中,所述结构化模型训练单元包括:子训练图像融合子单元,用于将所述多个子训练图像视觉特征进行结构化融合,获得训练图像结构化特征数据;模型获取子单元,用于采用视觉特征学习算法对所述训练图像结构化特征数据进行结构化模型训练,获得结构化模型训练得到的模型。
16.根据权利要求15所述的图像特征提取装置,其特征在于,所述配准单元,包括:
基准点确定子单元,用于确定所述配准后的图像的结构化基准点位置;
形状参数确定子单元,用于确定子图像的形状参数;
切割子单元,用于根据所述结构化基准点位置及所述子图像的形状参数,切割所述配准后的图像,获得多个结构化子图像。
17.根据权利要求16所述的图像特征提取装置,其特征在于,所述基准点确定子单元,包括:
特征基准点确定子单元,用于根据图像特征点确定所述配准后的图像的结构化基准点位置;或者,
空间基准点确定子单元,用于根据空间位置确定所述配准后的图像的结构化基准点位置。
18.根据权利要求16所述的图像特征提取装置,其特征在于,所述切割子单元采用的数学算法为:
aij=C(a,pij(x,y),sij)
式中aij表示结构顺序位于横排第i个、竖排第j个的结构化子图像,C为结构化子图像的构建函数,a表示用户输入的图像,pij表示顺序位于横排第i个、竖排第j个的结构化基准点,pij(x,y)表示结构化基准点pij处于所述用户输入的图像的坐标(x,y)处,sij表示结构化子图像的形状参数,至少包括矩形、圆形、椭圆形及其尺寸。
19.根据权利要求15所述的图像特征提取装置,其特征在于,还包括:
多模型训练单元,用于通过多模型训练获得特征模型;
所述多模型训练单元包括:
训练图像库选择子单元,用于选择预定的训练图像库;
训练图像配准子单元,用于将所述预定的训练图像库中的每个训练图像按照统一的配准方法进行配准,获得配准后的多个训练图像;
子训练图像构建子单元,用于对所述配准后的多个训练图像分别构建多个结构化子训练图像;
特征模型获取子单元,用于采用视觉特征学习算法对所述多个结构化子训练图像进行特征模型训练以提取相应的多个子训练图像视觉特征,并获得特征模型。
20.根据权利要求19所述的图像特征提取装置,其特征在于,所述特征模型获取子单元采用的视觉特征学习算法包括以下任一种:
深度学习方法、boosting算法、svm算法或局部特征组合的学习算法。
21.根据权利要求15所述的图像特征提取装置,其特征在于,所述融合单元包括:
基准点融合子单元,用于根据构建多个结构化子图像时的确定的结构化基准点位置,将所述多个结构化子图像的视觉特征进行结构化融合,获得结构化特征数据,所述结构化特征数据包括特征空间关系和特征信息。
22.根据权利要求15所述的图像特征提取装置,其特征在于,还包括:
比对单元,用于将所述图像特征数据与预定的图像数据库中的各个预定图像特征数据依次进行比对;
输出单元,用于输出比对结果。
23.根据权利要求22所述的图像特征提取装置,其特征在于,所述比对单元包括:
差值计算子单元,用于依次计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值;
所述输出单元包括:
差值判断子单元,用于依次判断每个所述差值是否大于预定的差值阈值;
信息输出单元,用于若每个所述差值都大于预定的相似度阈值,则输出没有相似图像的信息,否则,则将与所述图像特征数据差值最小的预定图像特征数据对应的图像,和/或图像的信息输出。
24.根据权利要求23所述的图像特征提取装置,其特征在于,所述比对单元计算所述图像特征数据与预定的图像数据库中的各个预定图像特征数据之间的差值的算法包括以下任一种:
欧氏距离计算方法、Cosine距离计算方法或Joint Bayesian距离计算方法。
25.一种图像特征提取终端设备,包括:
中央处理器;
输入输出单元;
存储器;所述存储器中存储有权利要求1至权利要求14所述的图像特征提取方法;并在启动后能够根据上述方法运行。
26.一种图像特征提取系统,包括客户端和远端服务器,其特征在于,使用权利要求15至权利要求24所述的图像特征提取装置,所述客户端拍摄图像和/或选取相册中的图像发送到远端服务器,所述远端服务器提取出图像特征数据,并与预定的图像数据库中的图像进行比对,并将比对结果发送至所述客户端,最终由所述客户端输出比对结果。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510531886.7A CN106485186B (zh) | 2015-08-26 | 2015-08-26 | 图像特征提取方法、装置、终端设备及系统 |
PCT/CN2016/095524 WO2017032243A1 (zh) | 2015-08-26 | 2016-08-16 | 图像特征提取方法、装置、终端设备及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510531886.7A CN106485186B (zh) | 2015-08-26 | 2015-08-26 | 图像特征提取方法、装置、终端设备及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106485186A CN106485186A (zh) | 2017-03-08 |
CN106485186B true CN106485186B (zh) | 2020-02-18 |
Family
ID=58099586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510531886.7A Active CN106485186B (zh) | 2015-08-26 | 2015-08-26 | 图像特征提取方法、装置、终端设备及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106485186B (zh) |
WO (1) | WO2017032243A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522778A (zh) * | 2017-09-20 | 2019-03-26 | 顾泽苍 | 一种可达到图像理解水平的图像识别方法 |
CN108319894A (zh) * | 2017-12-28 | 2018-07-24 | 杭州乔戈里科技有限公司 | 基于深度学习的水果识别方法及装置 |
CN108875530A (zh) * | 2018-01-12 | 2018-11-23 | 北京旷视科技有限公司 | 活体识别方法、活体识别设备、电子设备以及存储介质 |
CN109064578B (zh) * | 2018-09-12 | 2020-11-03 | 山西巨擘天浩科技有限公司 | 一种基于云服务的考勤系统及方法 |
CN110569765B (zh) * | 2019-08-02 | 2022-04-22 | 北京旷视科技有限公司 | 图片识别方法、图片比对方法及装置 |
CN113256822B (zh) * | 2020-02-11 | 2024-02-13 | 阿里巴巴集团控股有限公司 | 空间关系预测、数据处理方法、设备及存储介质 |
CN113283432A (zh) * | 2020-02-20 | 2021-08-20 | 阿里巴巴集团控股有限公司 | 图像识别、文字排序方法及设备 |
CN112241704B (zh) * | 2020-10-16 | 2024-05-31 | 百度(中国)有限公司 | 一种判定肖像侵权的方法、装置、电子设备及存储介质 |
CN112184843B (zh) * | 2020-11-09 | 2021-06-29 | 新相微电子(上海)有限公司 | 图像数据压缩的冗余数据去除系统及方法 |
CN112712501B (zh) * | 2020-12-28 | 2021-10-26 | 江苏合泰飞梵科技有限公司 | 一种基于人工智能的后视镜组装生产方法 |
CN113408208B (zh) * | 2021-06-25 | 2023-06-09 | 成都欧珀通信科技有限公司 | 模型训练方法、信息提取方法、相关装置及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599121A (zh) * | 2009-06-30 | 2009-12-09 | 徐勇 | 彩色人脸图像认证系统和方法 |
CN101770578A (zh) * | 2010-03-24 | 2010-07-07 | 上海交通大学 | 图像特征提取方法 |
CN102592136A (zh) * | 2011-12-21 | 2012-07-18 | 东南大学 | 基于几何图像中中频信息的三维人脸识别方法 |
CN102722906A (zh) * | 2012-05-23 | 2012-10-10 | 温州大学 | 一种基于特征的自顶向下从图像建模的方法 |
CN102903126A (zh) * | 2012-08-08 | 2013-01-30 | 公安部第三研究所 | 一种视频图像纹理特征提取和结构化描述的系统和方法 |
CN103093237A (zh) * | 2013-01-15 | 2013-05-08 | 中国科学院自动化研究所 | 一种基于结构化模型的人脸检测方法 |
CN104361131A (zh) * | 2014-12-08 | 2015-02-18 | 黑龙江大学 | 四维人脸模型数据库的建立方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101477692B (zh) * | 2009-02-13 | 2012-08-22 | 阿里巴巴集团控股有限公司 | 图像特征提取方法及装置 |
WO2010150156A1 (en) * | 2009-06-24 | 2010-12-29 | Koninklijke Philips Electronics N.V. | Establishing a contour of a structure based on image information |
CN102654903A (zh) * | 2011-03-04 | 2012-09-05 | 井维兰 | 一种人脸比对方法 |
CN102663351A (zh) * | 2012-03-16 | 2012-09-12 | 江南大学 | 基于条件外观模型的人脸特征点自动标定方法 |
CN103218827B (zh) * | 2013-03-21 | 2016-03-02 | 上海交通大学 | 基于形状传递联合分割和图匹配校正的轮廓跟踪方法 |
CN103886589B (zh) * | 2014-02-27 | 2017-11-03 | 四川农业大学 | 面向目标的自动化高精度边缘提取方法 |
-
2015
- 2015-08-26 CN CN201510531886.7A patent/CN106485186B/zh active Active
-
2016
- 2016-08-16 WO PCT/CN2016/095524 patent/WO2017032243A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599121A (zh) * | 2009-06-30 | 2009-12-09 | 徐勇 | 彩色人脸图像认证系统和方法 |
CN101770578A (zh) * | 2010-03-24 | 2010-07-07 | 上海交通大学 | 图像特征提取方法 |
CN102592136A (zh) * | 2011-12-21 | 2012-07-18 | 东南大学 | 基于几何图像中中频信息的三维人脸识别方法 |
CN102722906A (zh) * | 2012-05-23 | 2012-10-10 | 温州大学 | 一种基于特征的自顶向下从图像建模的方法 |
CN102903126A (zh) * | 2012-08-08 | 2013-01-30 | 公安部第三研究所 | 一种视频图像纹理特征提取和结构化描述的系统和方法 |
CN103093237A (zh) * | 2013-01-15 | 2013-05-08 | 中国科学院自动化研究所 | 一种基于结构化模型的人脸检测方法 |
CN104361131A (zh) * | 2014-12-08 | 2015-02-18 | 黑龙江大学 | 四维人脸模型数据库的建立方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106485186A (zh) | 2017-03-08 |
WO2017032243A1 (zh) | 2017-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106485186B (zh) | 图像特征提取方法、装置、终端设备及系统 | |
US10262190B2 (en) | Method, system, and computer program product for recognizing face | |
CN105518744B (zh) | 行人再识别方法及设备 | |
US9449432B2 (en) | System and method for identifying faces in unconstrained media | |
CN109284733B (zh) | 一种基于yolo和多任务卷积神经网络的导购消极行为监控方法 | |
CN106203242B (zh) | 一种相似图像识别方法及设备 | |
US9626552B2 (en) | Calculating facial image similarity | |
CN105740780B (zh) | 人脸活体检测的方法和装置 | |
WO2017088432A1 (zh) | 图像识别方法和装置 | |
WO2018014828A1 (zh) | 识别二维码位置的方法及其系统 | |
CN107862300A (zh) | 一种基于卷积神经网络的监控场景下行人属性识别方法 | |
CN108734185B (zh) | 图像校验方法和装置 | |
CN110163211B (zh) | 一种图像识别方法、装置和存储介质 | |
US10489636B2 (en) | Lip movement capturing method and device, and storage medium | |
CN112101195B (zh) | 人群密度预估方法、装置、计算机设备和存储介质 | |
CN109886223B (zh) | 人脸识别方法、底库录入方法、装置及电子设备 | |
CN113298158B (zh) | 数据检测方法、装置、设备及存储介质 | |
CN109784185A (zh) | 基于微表情识别的客户餐饮评价自动获取方法及装置 | |
CN112836682B (zh) | 视频中对象的识别方法、装置、计算机设备和存储介质 | |
CN108764248B (zh) | 图像特征点的提取方法和装置 | |
TWI731920B (zh) | 圖像特徵提取方法、裝置、終端設備及系統 | |
CN104252618B (zh) | 提高照片归还速度的方法及系统 | |
CN104992155A (zh) | 一种获取人脸位置的方法及装置 | |
CN112149517A (zh) | 一种人脸考勤方法、系统、计算机设备及存储介质 | |
Halawani et al. | Human ear localization: A template-based approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20201117 Address after: Room 603, 6 / F, Roche Plaza, 788 Cheung Sha Wan Road, Kowloon, China Patentee after: Zebra smart travel network (Hong Kong) Limited Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands Patentee before: Alibaba Group Holding Ltd. |