CN101477692B - 图像特征提取方法及装置 - Google Patents

图像特征提取方法及装置 Download PDF

Info

Publication number
CN101477692B
CN101477692B CN2009100072189A CN200910007218A CN101477692B CN 101477692 B CN101477692 B CN 101477692B CN 2009100072189 A CN2009100072189 A CN 2009100072189A CN 200910007218 A CN200910007218 A CN 200910007218A CN 101477692 B CN101477692 B CN 101477692B
Authority
CN
China
Prior art keywords
image
gray
original image
subimage block
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009100072189A
Other languages
English (en)
Other versions
CN101477692A (zh
Inventor
周春忆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN2009100072189A priority Critical patent/CN101477692B/zh
Publication of CN101477692A publication Critical patent/CN101477692A/zh
Priority to HK09112057.6A priority patent/HK1132826A1/xx
Priority to US12/658,471 priority patent/US8515178B2/en
Priority to EP10741513.5A priority patent/EP2396750B1/en
Priority to PCT/US2010/000383 priority patent/WO2010093447A1/en
Priority to JP2011550127A priority patent/JP5538435B2/ja
Application granted granted Critical
Publication of CN101477692B publication Critical patent/CN101477692B/zh
Priority to US13/944,677 priority patent/US9865063B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding

Abstract

图像特征提取方法及装置。一种图像特征提取方法,包括:从原始图像中抠出所含物体的图像;将所述抠出的图像用单一颜色为背景填充边界,并使得填充后的图像成为最小正方形;将正方形图像全图等比缩放为第一预定大小的图像,将缩放后的图像分割为互不重叠的第二预定大小的子图像块;分别计算水平、竖直、正45°、负45°方向上相邻像素的亮度导数,将分别在四个方向导数极值点的个数、以及位于子图像块四个边界上极值点的总个数作为该子图像块的特征向量;将所有子图像块的特征向量作为原始图像的特征向量。利用本方法,可以大大提高处理速度。

Description

图像特征提取方法及装置
技术领域
本申请涉及图像处理技术领域,特别涉及一种图像特征提取方法及装置。
背景技术
图像特征包括颜色、纹理、形状这三方面的特征。本篇申请主要涉及图像的形状特征。基于形状的图像特征提取算法,是将图像中能够反映物体形状的特征通过数学方式提取并表达出来。
图像特征提取的应用十分广泛。例如在图像搜索领域,需要由负责提供图像搜索的搜索引擎将图片资料库中的图片与接收到的请求搜索的图片进行比较,从而找出图片资料库中与请求搜索的图片相接近的图片。而这类搜索中,进行比较的是请求搜索的图片的图像特征与资料库中的图片的图像特征,那么,预先对图片进行图像特征提取就成为必不可少的一步。
关于基于形状的图像特征提取,现有技术中较常用的方法是基于Hough变换来实现的。Hough变换是将图像平面上的点对应到参数平面上的线,最后通过统计特性来提取图像特征。其原理可以描述如下:直线的方程可以用y=k*x+b来表示,其中k和b是参数,分别是斜率和截距。过某一点(x0,y0)的所有直线的参数都满足方程y0=k*x0+b。对目标图象平面(x,y)中的亮度满足预设条件的点,利用b=y-k*x求出(k,b)平面上对应的直线,把这直线上的所有点都赋值为1,并设该n条直线相交于一点时,该点的值赋为所经过的直线的个数。则对于图像平面上的直线,按照上述过程,可以在参数平面上(k,b)得到一族直线,则参数平面上这些直线的相交的点,其值最高,则该点可以表示目标平面上的一条直线,从而,通过上述过程,通过统计参数平面上最高值的点可以检测目标平面上存在的直线。
多条直线,依此类推。对于计算圆和弧的,与其类似。
为了更清楚的说明现有技术的上述原理,下面以图1作为目标图像来说明,为了简单说明,图1中为10*10像素大小的图片,其中存在一条直线,以图片的左下角为坐标原点,该直线可以表示为y=5。设该图片背景亮度较低,而这一条直线上的点的亮度较高。采用Hough变换检测这条直线的方法如下:
S1:按照坐标检测图1中的每一个点;
S2:当检测到目标图像上的点(设该点的坐标为(x0,y0))亮度大于预定阈值时,在参数平面(如图2所示)上标识一条b=y0-k*x0直线,为该标识的直线上的每一点赋值为1(如命名为α值);
S3:对于参数平面上标识出的直线的相交点,设定该相交点的α值为经过该点的直线的个数。实际上,相交点的α值,也可以表示为该点上所有经过的所有直线在这一点上的α值之和,与前述设定该相交点的α值为经过该点的直线的个数的表达,实质上是同一道理。
经过上述处理,对于图1所示目标图像中y=5的直线,在图2所示的参数平面上,可以标识出一个点,即k=0,b=5的点,该点的α值最高,则该参数平面上的(0,5)这一点,可以表示目标图像上的y=5这一条直线。而参数平面上的(0,5)这一点,即0和5正好分别是目标平面上y=5的斜率与截距,说明参数平面上标识出的这一点,检测出了目标平面上存在的y=5的这条直线。
上述以一个实例说明了现有Hough变换方法对于检测目标平面中一条直线的方法。而对于目标平面中存在多条直线的情况,按照上述方法,可以在参数平面上得到多个高赋值的点,从而由参数平面上高赋值的这些点可以表示目标平面上的多条直线。
对于目标图像中圆形、弧形等其它形状的检测,原理与上述过程类似。
在对现有技术的研究和实践过程中,发明人发现现有技术中存在以下问题:
上述采用Hough变换方法特征提取,会不可避免的涉及浮点运算,例如直线的斜率存在浮点运算的情况,当然,对于更为复杂的圆、弧形的特征提取,将涉及更多的浮点运算。而本领域技术人员知道,浮点运算对CPU等硬件的计算能力提出了较高的要求,同样的硬件配置下,对于涉及浮点运算的现有Hough方法,计算速度较低。
发明内容
本申请实施例的目的是提供一种图像特征提取方法及装置,以提高图像特征提取的速度。
为解决上述技术问题,本申请实施例提供一种图像特征提取方法及装置是这样实现的:
一种图像特征提取方法,包括:
从原始图像中抠出所含物体的图像;
将所述抠出的图像用单一颜色为背景填充边界,并使得填充后的图像成为最小正方形;
将正方形图像全图等比缩放为第一预定大小的图像,将缩放后的图像分割为互不重叠的第二预定大小的子图像块;
分别计算水平、竖直、正45°、负45°方向上相邻像素的亮度导数,将分别在四个方向导数极值点的个数、以及位于子图像块四个边界上极值点的总个数作为该子图像块的特征向量;
将所有子图像块的特征向量作为原始图像的特征向量。
一种图像特征提取装置,包括:
抠取单元,用于从原始图像中抠出所含物体的图像;
填充单元,将所述抠出的图像用单一颜色为背景填充边界,并使得填充后的图像成为最小正方形;
归一化处理单元,包括缩放单元和分割单元,缩放单元用于将正方形图像全图等比缩放为第一预定大小的图像,分割单元用于将缩放后的图像分割为互不重叠的第二预定大小的子图像块;
亮度导数计算和统计单元,用于分别计算水平、竖直、正45°、负45°方向上相邻像素的亮度导数,并将分别在四个方向导数极值点的个数、以及位于子图像块四个边界上极值点的总个数作为该子图像块的特征向量;
合成单元,将所有子图像块的特征向量作为原始图像的特征向量。
由以上本申请实施例提供的技术方案可见,从原始图像中抠出所含物体的图像,将所述抠出的图像用单一颜色为背景填充边界,并使得填充后的图像成为最小正方形,将正方形图像全图等比缩放为第一预定大小的图像,将缩放后的图像分割为互不重叠的第二预定大小的子图像块,分别计算水平、竖直、正45°、负45°方向上相邻像素的亮度导数,将分别在四个方向导数极值点的个数、以及位于子图像块四个边界上极值点的总个数作为该子图像块的特征向量,将所有子图像块的特征向量作为原始图像的特征向量,经过上述处理,可以提取图像的形状特征,并且,由于这些处理只涉及整形运算,并不涉及浮点运算,因此,同样的硬件配置下,相比现有技术,可以大大提高处理速度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术Hough变换中的目标图像;
图2为现有技术Hough变换中的参数平面;
图3为本申请方法实施例的流程图;
图4为本申请实施例中填充抠出的图像为最小正方形的示意图;
图5为本申请实施例中填充抠出的图像为最小正方形的示意图;
图6为本申请装置实施的框图;
图7为本申请装置实施的框图;
图8为本申请装置实施的框图。
具体实施方式
本申请实施例提供一种图像特征提取方法及装置。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
如图3所示,本申请图像特征提取方法实施例的流程如下:
S310:从原始图像中抠出所含物体的图像。
将原始图像汇总的物体所在图像抠取出来的方法有若干种,以下给出一些介绍。
原始图像中,往往有物体和背景,而背景一般占据原始图像的外围部分,物体一般占据原始图像中的中间部分。而且,在原始图像中,物体边缘与背景的像素存在着较大的灰度差异,因此,可以利用这一特点将原始图像中物体所在的图像抠出,即:可以根据物体边缘与背景存在的灰度差异从原始图像中抠出所含物体的图像。
以下给出该步骤的一个具体例子,先来看找出原始图像中物体所在区域的左右边界,包括以下步骤:
A1:统计原始图像所有像素每一列上灰度值之和。
例如一个10*10像素的图像,每个像素都具有灰度值属性。该步骤中,即是计算每一列上所有像素的灰度值之和,作为该列像素的灰度值。
为了便于计算机软硬件的处理,通常可以统计的每一列灰度值之和存放在数组中。
A2:从左至右计算原始图像相邻两列灰度值的差值,并记录差值大于阈值的结果时右侧列的横坐标xa
例如,从左至右扫描A1中保存在数组中的各列的灰度值,并依次计算数组中相邻值的差值,当扫描到差值大于阈值时,如扫描到第2列与第3列的灰度值差值为50,大于预设的阈值30,记录第3列的横坐标x3,对应数组中第3个元素的下标。
这样,找到了原始图像中的表明物体所在位置的左边界。
需要指出的是,当扫描到差值大于阀值时,也可以是记录差值大于阈值的结果时左侧列的横坐标,如扫描到第2列与第3列的灰度值差值为50,大于预设的阈值30,也可以是记录第2列的横坐标x2,对应数组中第2个元素的下标。该方式与前面所述只差1个像素的列宽,并不影响方法的整体效果。
A3:从右至左计算原始图像相邻两列灰度值之和的差值,并记录差值大于阈值的结果时左侧列的横坐标xb
该步骤与A2类似,扫描并计算数组,记录下标xb,这样,找到了原始图像中的表明物体所在位置的右边界。
上述A2、A3中阈值的设置可以根据经验值设置,如一般情况下当大于某一值时,背景与物体边界会有较明显的区别,这时,可以将该值设定为阈值。
再来看找出原始图像中物体所在区域的上下边界,原理与上述A1至A3类似,包括以下步骤:
B1:统计原始图像所有像素每一行上灰度值之和。
B2:从上至下计算原始图像相邻两列灰度值的差值,并记录差值大于阈值的结果时下侧行的纵坐标ya
B3:从下至上原始图像相邻两列灰度值之和的差值,并记录差值大于阈值的结果时上侧行的纵坐标yb
这样,找到了原始图像中的表明物体所在位置的上、下边界,分别为ya、yb
则(xa,xb,ya,yb)范围内的图像即为从原始图像上抠出的物体图像。
上述方式,是将原始图像中物体所在的矩形图像抠出,该方式最简单易行。当然,还存在其它略为复杂的方式,如在上述方式的基础上,增加两个对角线方向上的灰度值差值的计算,从而找出物体在两个对角线方向上的边界,进而找出原始图像中物体所在的八边形图像。当然,进一步的增加方向,还可以得出物体所在的16边形、32边形的图像,不再赘述。
另外,还可以是将原始图像分为水平方向的几个子区域,利用前述方式找出每个子区域上物体的左右边界;对应地,将原始图像分为竖直方向的几个子区域,利用前述方式找出每个子区域上物体的上下边界。这样,可以得到物体所在的多边形区域。当然,这类方式会比较复杂。
S320:将所述抠出的图像用单一颜色为背景填充边界,使得抠出的图像成为最小正方形。
所述单一颜色,例如可以是采取RGB为(0,0,0)的颜色,当然也可以是其它RGB颜色。一般地,采取填充RGB为(0,0,0)的颜色,速度快,也不构成干扰,从而有利于后续亮度导数的计算。
用单一颜色填充边界,使抠出的图像成为最小的正方形,目的是在后续步骤中,便于将包括物体的图像分割为预定大小的子图像块。图4示出了填充抠出的图像为最小正方形的示意图。
S330:将正方形图像全图等比缩放为第一预定大小的图像,将缩放后的图像分割为互不重叠的第二预定大小的子图像块。
将正方形图像全图等比缩放为第一预定大小的图像,例如,可以将正方形图像全图等比缩放为64*64像素大小的图像。当然,也可以是等比缩放为128*128像素大小的图像。等比缩放,指的是将长、宽按照等比例缩放。
将缩放后的图像分割为互不重叠的第二预定大小的子图像块,可以是16*16像素的图像,也可以是8*8像素大小的图像,或者是32*32像素大小的图像。
该步骤的处理,是为了将包括物体的正方形图像做归一化处理,以使后续处理标准化、简单化。第一预定大小和第二预定大小,可以是预先设定,设定的大小只要在合理范围内,不存在质的区别。
以下以第一预定大小为64*64像素、第二预定大小为16*16像素为例加以说明。第二预定大小采取16*16像素时,第一预定大小64*64像素的包括物体的图像,将被分割为4*4块子图像块。
此外,需要指出的是,也可以将缩放后的图像分割为有重叠情况的第二预定大小的子图像块,这样的做法可能会使计算过程稍微繁琐,也可能会增加最后输出的特征向量的维度,但仍不失为一种可行的方案。
S340:分别计算水平、竖直、正45°、负45°方向上相邻像素的亮度导数,将分别在四个方向导数极值点的个数、以及位于子图像块四个边界上极值点的总个数作为该子图像块的特征向量。
首先介绍这里引入的表明图像块特征的特征向量。可以视为一个五元向量,即M(a,b,c,d,e),该五元向量,在按照S340进行处理时,在执行该处理的计算机系统中,会被初始化,则初始化后,子图像块的五元向量为M(a,b,c,d,e)=M(0,0,0,0,0)。
其次介绍亮度导数。亮度导数的定义为:亮度导数=亮度差/像素间距。一般可以使用人眼敏感曲线的算法求出亮度值。这个算法为本领域技术公知内容。一种方案是:亮度L=116/3*(0.212649*R/255+0.715169*G/255+0.072182*B/255),其中RGB代表颜色值。亮度值一般是1表示全亮,0表示暗。但是在处理上一般将0~1的浮点值对应到1到255的整数范围上。可见,亮度导数可以表示像素间亮度的变化情况。而对于提取图像形状特征来讲,一般地,根据图像中物体边缘或轮廓与其它部分图像内容的亮度差异较明显这一属性,来找出物体在图像中的边缘或轮廓,从而用数学的形式描述出图像中物体的形状。
上述属性,可以用亮度导数的极值来描述,具体的,可以在某一方向上逐一计算每个相邻像素的亮度导数极值表达。当某一方向上逐一计算每个相邻像素的亮度导数极值过程中,某一像素位置前后的亮度导数发生符号变化,即为亮度导数的极值点。从物理意义上讲,在计算得到极值点的地方,很可能就是图像中物体与其它部分的边缘,或者是图像中可以表明物体上某一部分不同于其它部分形状的特征。可见,这些特征,都是能够表明物体本身形状特性的特征,因此,可以用来作为表示物体形状特征的量。
对于分别计算水平、竖直、正45°、负45°方向上相邻像素的亮度导数,以下给出一种具体计算方式的介绍:
计算子图像块在水平方向上的亮度导数,如果存在亮度导数极值,并且落在子图像块之内的,则对b加1,如果存在多个极值,则b即为极值的个数;如果极值存在于子图像块边界上,则a加1。需要指出的是,这里计算的可以是相邻两列的像素的亮度导数。
计算子图像块在竖直方向上的亮度导数,如果存在亮度导数极值,并且落在子图像块之内,则对c加1,如果存在多个极值,则c即为极值的个数;如果极值存在于子图像块边界上,则a加1。需要指出的是,这里计算的可以是相邻两行的像素的亮度导数。
计算子图像块在正45°方向上的亮度导数,如果存在亮度导数极值,并且落在子图像块之内,则对d加1,如果存在多个极值,则d即为极值的个数;如果极值存在于子图像块边界上,则a加1。需要指出的是,这里计算的是相邻两列像素上的亮度导数。需要指出的是,这里计算的可以是正45°方向上相邻两像素上的亮度导数。
计算子图像块在负45°方向上的亮度导数,如果存在亮度导数极值,并且落在子图像块之内,则对e加1,如果存在多个极值,则e即为极值的个数;如果极值存在于子图像块边界上,则a加1。需要指出的是,这里计算的可以是负45°方向上相邻两像素上的亮度导数。
可见,经过上述处理后,该子图像块对应的五元向量中,a为表示该图像块中的物体边界位于图像块四周边界上的情况。除a的情况外,即除落在子图像块边界上的情况外,b表示子图像块内部物体在水平方向上的存在具有形状特征的边缘个数,c表示子图像块内部物体在竖直方向上的存在具有形状特征的边缘个数,d表示子图像块内部物体在正45°方向上的存在具有形状特征的边缘个数,e表示子图像块内部物体在负45°方向上的存在具有形状特征的边缘个数。
由上述这些统计出的特征,可以用来较好的表示图像中物体形状的特征。
当然,上述统计方式并非唯一方式,本领域技术人员在看到上述给出的方式后,应当会容易想到其它的可行的方式,例如,对a、b、c、d、e的统计处理,可以具有灵活的方式。
S350:将所有子图像块的特征向量作为原始图像的特征向量。
上述S340中,得到一个子图像块的五元向量组,该五元向量组可以表达该子图像块的形状特征。
由于S330中,将图像分割为了若干互不重叠的子图像块,因此,S350中,需要用所有分割的子图像块的五元向量组来表示该图像的形状特征。
例如将经过S320处理后的64*64像素的图像分割为16*16像素的互不重叠的块,则分为了4*4块。表示每一块子图像块形状特征的一个五元向量组,则这16块子图像块,排列起来,成为16个五元向量组,或者说是一共为80元的向量组。而这个80元向量组,可以用来表明该图像的形状特征。
另外,还可以包括以下归一化处理:
S311:比较图像的长和宽,如果长大于宽,则将图像顺时针旋转90度。
旋转是保证所有图象都在一个基本形状。比如一支笔,在图片中的形状有竖着放置,也会有横放置。为了统一对比各图片中笔的形状,最好将图片按同一方向放置。
此外,也可以是逆时针旋转90度。
需要指出的是,S311中处理的对象可以是S310步骤中从原始图像中抠出的图像。
另外,还可以包括以下归一化处理:
S312:比较所述抠出图像或所述最小正方形图像上半部分和下半部分灰度值总和,如果上半部分的灰度值总和大于下半部分灰度值总和,则将所述抠出图像或所述最小正方形图像倒置。
与上面的旋转类似,该步骤也是为了使图像中的物体有统一的方向。例如一个图像中显示一个苹果,这个苹果是倒放的。而大多数显示苹果的图片中,苹果都是正放的,因此,最好将倒放苹果的图片进行倒置,以便于与其它图片进行比较。显然地,对于上大下小的物体,其图像中,上半部分图像的灰度值之和要大于下半部分的灰度值之和;相反的,对于上小下大的物体,其图像中,下半部分图像的灰度值之和要大于上半部分的灰度值之和。上述处理过程,只涉及整形运算,并不涉及浮点运算,因此,同样的硬件配置下,相比现有技术,可以大大提高处理速度。
从实际中搜索引擎的角度考虑,按照每天更新100万产品图形计算,每秒必须要处理12张图片,每张图片100ms以内处理完成。这个只是考虑平均的情况,考虑到每天有4小时的产品更新的峰值,以及访问磁盘和网络的开销,按设计要求每秒必须处理50张图片,每张图片特征在20ms内完成。如果采用现有技术中的Hough变换,对一张200X200像素的图像识别直线,用标准的四核服务器,大约要20ms。仅仅Hough直线变换本身就已经不够时间了。如果识别圆形,所用时间更长。
而采用本申请实施例中对图片分块处理的办法,由于不涉及浮点运算,因此可以加快处理速度。并且,对分块后图像的处理,还可以充分利用现有的多核处理器的优势。同样对于一个200X200的图片,利用本申请实施例中的方法,全部处理过程可以在10ms之内完成。
以下介绍本申请中一种图像特征提取装置实施例,图5示出了该装置实施例的框图,如图5所示,该装置实施例包括:
抠取单元51,用于从原始图像中抠出所含物体的图像;
填充单元52,将所述抠出的图像用单一颜色为背景填充边界,并使得填充后的图像成为最小正方形;
归一化处理单元53,包括缩放单元531和分割单元532,缩放单元531用于将正方形图像全图等比缩放为第一预定大小的图像,分割单元532用于将缩放后的图像分割为互不重叠的第二预定大小的子图像块;
亮度导数计算和统计单元54,用于分别计算水平、竖直、正45°、负45°方向上相邻像素的亮度导数,并将分别在四个方向导数极值点的个数、以及位于子图像块四个边界上极值点的总个数作为该子图像块的特征向量;
合成单元55,将所有子图像块的特征向量作为原始图像的特征向量。
优选地,所述的装置实施例中,所述归一化处理单元53还可以包括:
旋转单元533,用于比较所述抠出图像的长和宽,如果长大于宽,则将填充后的图像顺时针旋转90度。如图6所示。
优选地,所述的装置实施例中,所述归一化处理单元53还可以包括:
倒置单元534,用于比较所述抠出图像上半部分和下半部分灰度值总和,如果上半图像的灰度值总和大于下半部分灰度值总和,则将填充后的图像倒置。如图7所示。
当然,所述归一化处理单元53也可以同时包括旋转单元533和倒置单元534,如图8所示。
如前述方法实施例中所述,该装置实施例中,所述抠取单元51从原始图像中抠出所含物体的图像,具体可以是根据物体边缘与背景存在较大灰度差异从原始图像中抠出所含物体的图像。
更进一步地,所述抠取单元51根据物体边缘与背景存在较大灰度差异从原始图像中抠出所含物体的图像,包括:
统计原始图像所有像素每一列上灰度值之和;从左至右计算原始图像相邻两列灰度值的差值,并记录差值大于阈值的结果时右侧列的横坐标xa;从右至左原始图像相邻两列灰度值之和的差值,并记录差值大于阈值时左侧列的横坐标xb
统计原始图像所有像素每一行上灰度值之和;从上至下计算原始图像相邻两行灰度值的差值,并记录差值大于阈值时下侧行的纵坐标ya;从下至上原始图像相邻两行灰度值之和的差值,并记录差值大于阈值时上侧行的纵坐标yb
则(xa,xb,ya,yb)范围内的图像即为从原始图像上抠出的物体图像。
该装置实施例可以位于计算机系统中,由硬件、硬件或软硬件的结合来实现,并且优选地,所述装置可以位于实现搜索引擎功能的计算机系统中。
由以上实施例可见,从原始图像中抠出所含物体的图像,将所述抠出的图像用单一颜色为背景填充边界,并使得填充后的图像成为最小正方形,将正方形图像全图等比缩放为第一预定大小的图像,将缩放后的图像分割为互不重叠的第二预定大小的子图像块,分别计算水平、竖直、正45°、负45°方向上相邻像素的亮度导数,将分别在四个方向导数极值点的个数、以及位于子图像块四个边界上极值点的总个数作为该子图像块的特征向量,将所有子图像块的特征向量作为原始图像的特征向量,经过上述处理,可以提取图像的形状特征,并且,由于这些处理只涉及整形运算,并不涉及浮点运算,因此,同样的硬件配置下,相比现有技术,可以大大提高处理速度。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,希望所附的权利要求包括这些变形和变化而不脱离本发明的精神。

Claims (7)

1.一种图像特征提取方法,其特征在于,包括:
从原始图像中抠出所含物体的图像;
将所述抠出的图像用单一颜色为背景填充边界,并使得填充后的图像成为最小正方形;
将正方形图像全图等比缩放为第一预定大小的图像,将缩放后的图像分割为第二预定大小的子图像块;
分别计算子图像块水平、竖直、正45°、负45°方向上相邻像素的亮度导数,将分别在四个方向导数极值点的个数、以及位于子图像块四个边界上极值点的总个数作为该子图像块的特征向量;
将所有子图像块的特征向量作为原始图像的特征向量;
所述方法还包括:
比较所述抠出图像的长和宽,如果长大于宽,则将所述抠出图像顺时针旋转90度;
比较所述抠出图像或所述最小正方形图像上半部分和下半部分灰度值总和,如果上半部分的灰度值总和大于下半部分灰度值总和,则将所述抠出图像或所述最小正方形图像倒置。
2.如权利要求1所述的方法,其特征在于,所述从原始图像中抠出所含物体的图像,包括:
根据物体边缘与背景存在的灰度差异从原始图像中抠出所含物体的图像。
3.如权利要求2所述的方法,其特征在于,所述根据物体边缘与背景存在的灰度差异从原始图像中抠出所含物体的图像,包括:
统计原始图像所有像素每一列上灰度值之和;从左至右计算原始图像相邻两列灰度值的差值,并记录差值大于阈值时右侧列的横坐标xa;从右至左原始图像相邻两列灰度值之和的差值,并记录差值大于阈值时左侧列的横坐标xb
统计原始图像所有像素每一行上灰度值之和;从上至下计算原始图像相邻两列灰度值的差值,并记录差值大于阈值的结果时下侧行的纵坐标ya;从下至上原始图像相邻两列灰度值之和的差值,并记录差值大于阈值时上侧行的纵坐标yb
则(xa,xb,ya,yb)范围内的图像即为从原始图像上抠出的包含物体的图像。
4.如权利要求1所述的方法,其特征在于,所述将所述抠出的图像用单一颜色为背景填充边界,包括:
将所述抠出的图像用RGB(0,0,0)的颜色为背景填充边界。
5.如权利要求1所述的方法,其特征在于,所述将缩放后的图像分割为第二预定大小的子图像块,包括:
将缩放后的图像分割为互不重叠的第二预定大小的子图像块。
6.一种图像特征提取装置,其特征在于,包括:
抠取单元,用于从原始图像中抠出所含物体的图像;
填充单元,将所述抠出的图像用单一颜色为背景填充边界,并使得填充后的图像成为最小正方形;
归一化处理单元,包括缩放单元和分割单元,缩放单元用于将正方形图像全图等比缩放为第一预定大小的图像,分割单元用于将缩放后的图像分割为第二预定大小的子图像块;
亮度导数计算和统计单元,用于分别计算水平、竖直、正45°、负45°方向上相邻像素的亮度导数,并将分别在四个方向导数极值点的个数、以及位于子图像块四个边界上极值点的总个数作为该子图像块的特征向量;
合成单元,将所有子图像块的特征向量作为原始图像的特征向量;
所述归一化单元还包括:
旋转单元,用于比较所述抠出图像的长和宽,如果长大于宽,则将所述填充后的图像顺时针旋转90度;
倒置单元,用于比较所述抠出图像上半部分和下半部分灰度值总和,如果上半图像的灰度值总和大于下半部分灰度值总和,则将所述填充后的图像倒置。
7.如权利要求6所述的装置,其特征在于,所述装置位于实现搜索引擎功能的计算机系统中。
CN2009100072189A 2009-02-13 2009-02-13 图像特征提取方法及装置 Expired - Fee Related CN101477692B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN2009100072189A CN101477692B (zh) 2009-02-13 2009-02-13 图像特征提取方法及装置
HK09112057.6A HK1132826A1 (en) 2009-02-13 2009-12-22 Image feature extraction method and apparatus
US12/658,471 US8515178B2 (en) 2009-02-13 2010-02-09 Method and system for image feature extraction
EP10741513.5A EP2396750B1 (en) 2009-02-13 2010-02-10 Method and system for image feature extraction
PCT/US2010/000383 WO2010093447A1 (en) 2009-02-13 2010-02-10 Method and system for image feature extraction
JP2011550127A JP5538435B2 (ja) 2009-02-13 2010-02-10 画像特徴抽出方法及びシステム
US13/944,677 US9865063B2 (en) 2009-02-13 2013-07-17 Method and system for image feature extraction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100072189A CN101477692B (zh) 2009-02-13 2009-02-13 图像特征提取方法及装置

Publications (2)

Publication Number Publication Date
CN101477692A CN101477692A (zh) 2009-07-08
CN101477692B true CN101477692B (zh) 2012-08-22

Family

ID=40838400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100072189A Expired - Fee Related CN101477692B (zh) 2009-02-13 2009-02-13 图像特征提取方法及装置

Country Status (6)

Country Link
US (2) US8515178B2 (zh)
EP (1) EP2396750B1 (zh)
JP (1) JP5538435B2 (zh)
CN (1) CN101477692B (zh)
HK (1) HK1132826A1 (zh)
WO (1) WO2010093447A1 (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011079412A1 (zh) * 2009-12-29 2011-07-07 中国科学院自动化研究所 快速多算子的图像缩放方法
KR101767269B1 (ko) * 2011-04-25 2017-08-10 한국전자통신연구원 영상 검색 장치 및 방법
US9501838B1 (en) 2015-08-24 2016-11-22 The Boeing Company Systems and methods for determining boundaries of features in digital images
CN106485186B (zh) * 2015-08-26 2020-02-18 阿里巴巴集团控股有限公司 图像特征提取方法、装置、终端设备及系统
CN105447876B (zh) * 2015-12-10 2017-02-15 北京中科紫鑫科技有限责任公司 一种dna测序的图像的磁珠提取方法及装置
WO2018176000A1 (en) 2017-03-23 2018-09-27 DeepScale, Inc. Data synthesis for autonomous control systems
US11409692B2 (en) 2017-07-24 2022-08-09 Tesla, Inc. Vector computational unit
US11157441B2 (en) 2017-07-24 2021-10-26 Tesla, Inc. Computational array microprocessor system using non-consecutive data formatting
US11893393B2 (en) 2017-07-24 2024-02-06 Tesla, Inc. Computational array microprocessor system with hardware arbiter managing memory requests
US10671349B2 (en) 2017-07-24 2020-06-02 Tesla, Inc. Accelerated mathematical engine
CN107944618B (zh) * 2017-11-20 2020-03-20 阿里巴巴集团控股有限公司 共享车辆的布点规划方法、装置以及电子设备
US11561791B2 (en) 2018-02-01 2023-01-24 Tesla, Inc. Vector computational unit receiving data elements in parallel from a last row of a computational array
US11215999B2 (en) 2018-06-20 2022-01-04 Tesla, Inc. Data pipeline and deep learning system for autonomous driving
US11361457B2 (en) 2018-07-20 2022-06-14 Tesla, Inc. Annotation cross-labeling for autonomous control systems
US11636333B2 (en) 2018-07-26 2023-04-25 Tesla, Inc. Optimizing neural network structures for embedded systems
US11562231B2 (en) 2018-09-03 2023-01-24 Tesla, Inc. Neural networks for embedded devices
EP3864573A1 (en) 2018-10-11 2021-08-18 Tesla, Inc. Systems and methods for training machine models with augmented data
US11196678B2 (en) 2018-10-25 2021-12-07 Tesla, Inc. QOS manager for system on a chip communications
US11816585B2 (en) 2018-12-03 2023-11-14 Tesla, Inc. Machine learning models operating at different frequencies for autonomous vehicles
US11537811B2 (en) 2018-12-04 2022-12-27 Tesla, Inc. Enhanced object detection for autonomous vehicles based on field view
US11610117B2 (en) 2018-12-27 2023-03-21 Tesla, Inc. System and method for adapting a neural network model on a hardware platform
CN109816675A (zh) 2018-12-28 2019-05-28 歌尔股份有限公司 物体的检测方法、检测装置及存储介质
US10997461B2 (en) 2019-02-01 2021-05-04 Tesla, Inc. Generating ground truth for machine learning from time series elements
US11567514B2 (en) 2019-02-11 2023-01-31 Tesla, Inc. Autonomous and user controlled vehicle summon to a target
US10956755B2 (en) 2019-02-19 2021-03-23 Tesla, Inc. Estimating object properties using visual image data
CN110853120B (zh) * 2019-10-09 2023-05-19 上海交通大学 基于分割绘图法的网络布局方法、系统及介质
CN110751689A (zh) * 2019-10-24 2020-02-04 南京农业大学 一种基于图像处理的梨果实横纵径测量方法
CN110579174A (zh) * 2019-10-24 2019-12-17 南京农业大学 一种基于机器视觉的梨果柄长度的测量方法
CN111476799A (zh) * 2020-03-23 2020-07-31 福建星网物联信息系统有限公司 一种图像分析方法及存储介质
CN111651674B (zh) * 2020-06-03 2023-08-25 北京妙医佳健康科技集团有限公司 双向搜索方法、装置及电子设备
CN112017174A (zh) * 2020-09-03 2020-12-01 湖南省华芯医疗器械有限公司 图像处理方法、装置、电子设备及存储介质
EP4305602A2 (en) * 2021-03-10 2024-01-17 Detectsystem Lab A/S Quantitative image analysis
CN112686340B (zh) * 2021-03-12 2021-07-13 成都点泽智能科技有限公司 一种基于深度神经网络的密集小目标检测方法
CN113554615B (zh) * 2021-07-21 2023-08-22 网易(杭州)网络有限公司 一种图像精细化处理方法、装置、电子设备及存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0334880A (ja) * 1989-06-30 1991-02-14 Intaadetsuku:Kk 印刷文字の検査方法及びその装置
JPH05210736A (ja) * 1992-01-31 1993-08-20 Olympus Optical Co Ltd 画像輪郭抽出方法
US20030009670A1 (en) * 2001-04-02 2003-01-09 Digimarc Corporation Background watermark processing
US5973692A (en) * 1997-03-10 1999-10-26 Knowlton; Kenneth Charles System for the capture and indexing of graphical representations of files, information sources and the like
JP4153108B2 (ja) * 1998-10-29 2008-09-17 富士フイルム株式会社 画像処理方法、画像処理装置及び記録媒体
JP2001319232A (ja) * 2000-05-11 2001-11-16 Fuji Xerox Co Ltd 類似画像検索装置および類似画像検索方法
JP3692500B2 (ja) * 2000-09-12 2005-09-07 インターナショナル・ビジネス・マシーンズ・コーポレーション 画像処理方法、画像処理システムおよび記録媒体
JP3586734B2 (ja) * 2001-10-01 2004-11-10 学校法人高知工科大学 液晶流動形成機構、液晶流動形成方法および液晶流動を用いた物体移動機構
JP2003122758A (ja) * 2001-10-11 2003-04-25 Canon Inc 画像検索方法及び装置
JP4016735B2 (ja) * 2001-11-30 2007-12-05 株式会社日立製作所 レーンマーク認識方法
US7532753B2 (en) * 2003-09-29 2009-05-12 Lipsky Scott E Method and system for specifying color of a fill area
US20060067592A1 (en) * 2004-05-27 2006-03-30 Walmsley Simon R Configurable image processor
JP2006293949A (ja) * 2005-03-17 2006-10-26 Sharp Corp 画像照合装置、画像照合方法、画像照合プログラムおよび画像照合プログラムを記録したコンピュータ読取り可能な記録媒体
CN101371273A (zh) * 2005-12-30 2009-02-18 意大利电信股份公司 视频序列的分割
US7907791B2 (en) * 2006-11-27 2011-03-15 Tessera International, Inc. Processing of mosaic images
JP4912206B2 (ja) * 2007-04-18 2012-04-11 富士通株式会社 画像処理方法、画像処理装置、画像処理システム及びコンピュータプログラム
KR101023207B1 (ko) * 2007-09-05 2011-03-18 한국전자통신연구원 영상 객체 추출 장치 및 그 방법
KR100992362B1 (ko) * 2008-12-11 2010-11-04 삼성전기주식회사 컬러 보간 장치

Also Published As

Publication number Publication date
JP2012518223A (ja) 2012-08-09
US20100208988A1 (en) 2010-08-19
WO2010093447A1 (en) 2010-08-19
EP2396750B1 (en) 2020-06-17
US9865063B2 (en) 2018-01-09
CN101477692A (zh) 2009-07-08
EP2396750A4 (en) 2018-01-10
US8515178B2 (en) 2013-08-20
JP5538435B2 (ja) 2014-07-02
HK1132826A1 (en) 2010-03-05
US20130301914A1 (en) 2013-11-14
EP2396750A1 (en) 2011-12-21

Similar Documents

Publication Publication Date Title
CN101477692B (zh) 图像特征提取方法及装置
EP2858030B1 (en) Performing a histogram using an array of addressable registers
KR101639852B1 (ko) 그래픽 프로세싱을 위한 픽셀 값 압축
CN112348815A (zh) 图像处理方法、图像处理装置以及非瞬时性存储介质
CN107103320B (zh) 嵌入式医疗数据图像识别及集成方法
EP3074945B1 (en) Content-aware image rotation
CN108780507A (zh) 用于提供图像分类器的系统和方法
KR101405410B1 (ko) 객체 검출 장치 및 시스템
CN105046213A (zh) 一种增强现实的方法
US8442327B2 (en) Application of classifiers to sub-sampled integral images for detecting faces in images
JP2018511874A (ja) 3次元モデリング方法及び装置
KR20100098641A (ko) 불변적인 시각적 장면 및 객체 인식
CN108875504B (zh) 基于神经网络的图像检测方法和图像检测装置
CN112581374A (zh) 散斑亚像素中心提取方法、系统、设备及介质
CN104268550A (zh) 特征提取方法及装置
EP3146502B1 (en) Accelerated image processing
CN108304840B (zh) 一种图像数据处理方法以及装置
Toony et al. A modified saliency detection for content-aware image resizing using cellular automata
TWI480809B (zh) Image feature extraction method and device
US20220020113A1 (en) Image resizing using seam carving
CN113705660A (zh) 目标识别方法及相关设备
Wang et al. Efficient Euclidean distance transform using perpendicular bisector segmentation
CN113240736A (zh) 基于yolo6d改进网络的位姿估计方法及装置
CN112991449A (zh) 一种agv定位与建图方法、系统、装置及介质
CN111161250B (zh) 一种多尺度遥感图像密集房屋检测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1132826

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1132826

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120822

Termination date: 20210213

CF01 Termination of patent right due to non-payment of annual fee