CN105740872B - 图像特征提取方法及其装置 - Google Patents
图像特征提取方法及其装置 Download PDFInfo
- Publication number
- CN105740872B CN105740872B CN201610070396.6A CN201610070396A CN105740872B CN 105740872 B CN105740872 B CN 105740872B CN 201610070396 A CN201610070396 A CN 201610070396A CN 105740872 B CN105740872 B CN 105740872B
- Authority
- CN
- China
- Prior art keywords
- stretching
- coordinate value
- contour
- characteristic line
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种图像特征提取方法及其装置,能够对复杂图像进行关键轮廓特征线的像素点的处理,包括提取每个像素点的坐标值和计算转换为拉伸坐标值、再计算转换为其拉伸相对坐标值、确定拉伸相对坐标值的变形公差、按变形公差参数和“未过半舍,过半入”的取整规则进行取整以获取经变形公差精确后的像素点的取整拉伸相对坐标值等处理,丰富了对复杂图像特征信息的描述,利用本发明的技术方案所输出的经变形公差精确取整后的像素点的取整拉伸相对坐标值在不同图像间的匹配,能够有效提高相同或近似图像的匹配效果。
Description
技术领域
本发明涉及图像处理的技术领域,特别涉及一种图像特征提取方法,以及一种图像特征提取装置。
背景技术
图像的轮廓是图像最基本的特征之一,往往携带着一幅图像的大部分信息。而图像的轮廓既存在于图像的不规则结构和不稳定的边缘上,也存在于图像数据的突变点处,这些点给出了图像轮廓的位置,这些轮廓常常是我们在图像识别时所需的重要的特征条件。经典的轮廓提取技术大都基于微分运算,首先通过平滑来滤除图像中的噪声,然后进行一阶微分或二阶微分运算,求得梯度最大值或二阶导数的过零点,最后选取适当的阈值来提取边界,按照该方式形成了多种图像轮廓检测算法。
图像识别的主要目的是通过对提取图像轮廓特征,找出相同或近似度比较高的比对图像。而在一些应用中,单纯的轮廓检测只能对完全一样的图形图像做出对比,一旦样本图像与待检图像大小、形状、角度与位置有变形或差异则时,此方法难以找出相同或近似度比较高的比对图像。并且,当出现图像有较大的拉伸或压缩时,由于拉伸和压缩导致轮廓线的变形,将更难以找出相同或近似度比较高的比对图像。
发明内容
基于此,本发明实施例的目的在于提供一种图像特征提取方法以及一种图像特征提取装置,能够对大小、形状、角度、位置与比例有变形或差异的待检图像进行更准确的图像特征提取,从而解决图像经拉伸、改变大小、形状与位置的情况下的比对不准确的问题。
在一些实施例中,本发明提供的图像特征提取方法,包括以下步骤:
获取输入图像,对输入图像提取图像像素的轮廓特征线;
在坐标系中对轮廓特征线进行方向与提取方形的定位;
在所述坐标系中提取轮廓特征线中像素点的坐标值;
将所述轮廓特征线中像素点的坐标值按预设的拉伸转换规则计算转换为拉伸坐标值,其中,坐标值转换后的轮廓特征线的外接方形为具有预定长宽比的矩形;
将拉伸坐标值按预设的相对数转换规则计算转换为拉伸相对坐标值。
优选地,所述转换后的轮廓特征线的外接方形的预定长宽比为:1比1。
优选地,将所述轮廓特征线中的第n个像素点的坐标值Gn(xn,yn)转换为拉伸坐标值Ln(x1 n,y1 n),所述预设的拉伸转换规则包括:
其中,当xn>yn时,x1 n=xn,y1 n=yn×r;
当xn<yn时,x1 n=xn×r,y1 n=yn;
当xn=yn时,x1 n=xn,y1 n=yn;
x1 n为所述轮廓特征线中的第n个像素点的x轴拉伸坐标值;
y1 n为所述轮廓特征线中的第n个像素点的y轴拉伸坐标值;
xn为所述轮廓特征线中的第n个像素点的x轴坐标值;
yn为所述轮廓特征线中的第n个像素点的y轴坐标值;
r为拉伸坐标值的拉伸转换参数。
优选地,所述拉伸转换参数按照以下方式确定:
当xn>yn时,r=xd÷yd;
当xn<yn时,r=yd÷xd;
当xn=yn时,r=1;
其中,r为所述拉伸转换参数;xd为所述轮廓特征线中的像素点在所述坐标系的x轴最大坐标值;yd为所述轮廓特征线中的像素点在所述坐标系的y轴最大坐标值。
优选地,将所述轮廓特征线中的第n个像素点的拉伸坐标值Ln(x1 n,y1 n)计算转换为拉伸相对坐标值LSn(x2 n,y2 n),所述预设的相对数转换规则包括:
x2 n=x1 n÷h;
y2 n=y1 n÷h;
其中,LSn(x2 n,y2 n)为所述轮廓特征线中的第n个像素点的拉伸相对坐标值;
x1 n为所述轮廓特征线中的第n个像素点的x轴拉伸坐标值;
y1 n为所述轮廓特征线中的第n个像素点的y轴拉伸坐标值;
x2 n为所述轮廓特征线中的第n个像素点的x轴拉伸相对坐标值;
y2 n为所述轮廓特征线中的第n个像素点的y轴拉伸相对坐标值;
h为具有预定长宽比的所述轮廓特征线外接方形的最大边长。
优选地,还包括以下步骤:
按变形公差参数和取整规则对拉伸相对坐标值进行取整,得到取整拉伸相对坐标值。
优选地,其中所述变形公差参数的取值介于0.5%至10%之间。
优选地,其中所述取整规则为“未过半舍过半入”规则。
优选地,在对输入图像提取图像像素的轮廓特征线之前,还包括以下步骤:对所述输入图像进行预处理,所述预处理包括以下各项中的至少一项:灰度化处理、二值化处理、去噪处理。
优选地,所述轮廓特征线包括外轮廓线像素点的集合和内轮廓线像素点的集合。
优选地,在坐标系中对轮廓特征线进行方向与提取方形的定位的步骤包括:
将输入图像提取图像像素的轮廓特征线在不改变旋转方向的条件下平移至所述轮廓特征线上像素点的x轴坐标最小值为0,且轮廓特征线上像素点的y轴坐标最小值为0的位置;其中,所述提取方形为所述轮廓特征线的外接矩形。
优选地,在坐标系中对轮廓特征线进行方向定位的步骤包括:
确定输入图像的轮廓特征线上的最长直线段,以最小的旋转将所述轮廓特征线旋转至使所述最长直线段与坐标系的坐标轴平行,并平移至所述轮廓特征线上像素点的x轴坐标最小值为0,所述轮廓特征线在提取方形内向y轴对齐并居中的位置。
优选地,在坐标系中对轮廓特征线进行提取方形定位的步骤包括:
所述方形是以方向定位后的轮廓特征线上最大的x轴或y轴坐标值为边长所构成的方形,所述方形的一条边线与x轴重合,另一条边线与y轴重合。
在一些实施例中,本发明还提供一种图像特征提取装置,包括:
轮廓特征线提取模块,用于获取输入图像,对输入图像提取图像像素的轮廓特征线;
轮廓特征线定位模块,用于在坐标系中对轮廓特征线进行方向与提取方形的定位;
像素点坐标提取模块,用于在所述坐标系中提取轮廓特征线中像素点的坐标值Gn(xn,yn);
拉伸坐标值转换模块,用于将所述轮廓特征线中像素点的坐标值按预设的拉伸转换规则计算转换为拉伸坐标值,其中,坐标值转换后的轮廓特征线的外接方形为具有预定长宽比的矩形;
拉伸相对坐标值转换模块,用于将拉伸坐标值按预设的相对数转换规则计算转换为拉伸相对坐标值。
上述实施例中的图像特征提取方法及其装置,对输入图像提取图像像素的轮廓特征线,对轮廓特征线在坐标系中进行方向与提取方形的定位,并将坐标值转换为拉伸坐标值,使所有输入图像经过转换后,其轮廓特征线的外接方形都具有预定长宽比,再将拉伸坐标值以相对数表示,获得拉伸相对坐标值,由于转换后轮廓特征线的外接方形具有预定长宽比,因此所述拉伸相对坐标值能够准确第反映图像的特征,减少图像拉伸或压缩变形对图像特征提取或图像比对造成的影响。
可以使图像原始像素信息的分析不受图形缩放、放置角度、位置、拉伸、压缩的影响,使图像在变形公差允许的范围内获得任意拉伸或压缩率下的精准识别。利用本发明的实施例能够对不规则不稳定的图像通过轮廓特征线的方向、提取方形定位等标准化处理而获取图像轮廓特征线的各像素点唯一的坐标值Gn(xn,yn)、拉伸相对坐标值LSn(xn,yn)、取整拉伸相对坐标值LZn(xn,yn),使不同的比对图形之间具备可比性。利用本发明的实施例能够对复杂图像进行关键轮廓特征线的像素点的处理,包括提取每个像素点的坐标值Gn(xn,yn)、计算转换为拉伸坐标值Ln(xn,yn)、再转换为拉伸相对坐标值LSn(xn,yn)、确定拉伸相对坐标值LSn(xn,yn)的变形公差、按变形公差参数和“未过半舍,过半入”的取整规则进行取整以获取经变形公差精确后的像素点的取整拉伸相对坐标值LZn(xn,yn)等处理,丰富了对复杂图像特征信息的描述,利用本发明所输出的经变形公差精确取整后的像素点的取整拉伸相对坐标值LZn(xn,yn)在不同图像间的匹配,能够有效提高相同或近似图像的匹配效果,丰富了图像特征信息的描述,从而达到有效克服现有的图像特征提取方法对拉伸压缩变形图像的近似识别的技术缺陷或局限,能有效提高对拉伸压缩变形图像的近似识别检出率。
附图说明
图1为一些实施例中提供的图像特征提取方法的流程示意图;
图2为另一些实施例中提供的图像特征提取方法的流程示意图;
图3为一些实施例中的示例性输入图像原图;
图4为一些实施例中的示例性轮廓特征线图;
图5为一些实施例中自然基准定位的方向定位图;
图6为一些实施例中自然基准定位的提取方形示意图;
图7为一些实施例中基准直线定位的方向定位图;
图8为另一些实施例中基准直线定位的方向定位图;
图9为一些实施例中基准直线定位的提取方形示意图;
图10为一些实施例中提供的图像特征提取装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
在一些实施例中,本发明提供的图像特征提取方法,如图1所示,包括以下步骤:
S101,获取输入图像,对输入图像提取图像像素的轮廓特征线;
S102,在坐标系中对轮廓特征线进行方向与提取方形的定位;
S103,在所述坐标系中提取轮廓特征线中像素点的坐标值;
S104,将所述轮廓特征线中像素点的坐标值按预设的拉伸转换规则计算转换为拉伸坐标值,其中,坐标值转换后的轮廓特征线的外接方形为具有预定长宽比的矩形;
S105,将拉伸坐标值按预设的相对数转换规则计算转换为拉伸相对坐标值。
上述实施例中的图像特征提取方法及其装置,对输入图像提取图像像素的轮廓特征线,对轮廓特征线在坐标系中进行方向与提取方形的定位,并将坐标值转换为拉伸坐标值,将拉伸坐标值再转换为拉伸相对坐标值,采用拉伸相对坐标值描述图像特征信息,能够对大小、形状、角度、位置与比例有变形或差异的待检图像进行更准确的图像特征信息提取,从而解决图像经拉伸、改变大小、形状与位置的情况下的比对不准确的问题。
在另一些实施例中,本发明提供的图像特征提取方法,如图2所示,包括以下步骤:
S201,获取输入图像;
S202,对输入图像进行预处理;
S203,对输入图像提取图像像素的轮廓特征线;
S204,在坐标系中对轮廓特征线进行方向与提取方形的定位;
S205,在坐标系中提取轮廓特征线中像素点的坐标值;
S206,将坐标值按预设的拉伸转换规则计算转换为拉伸坐标值;
S207,将拉伸坐标值按预设的相对数转换规则计算转换为拉伸相对坐标值;
S208,根据图像分析需求确定拉伸相对坐标值的变形公差参数;
S209,按变形公差参数和取整规则对拉伸相对坐标值进行取整,从而得到取整拉伸相对坐标值;
S210,将经精确取整后的轮廓特征线中像素点的取整拉伸相对坐标值输出。
以下基于上述实施例对各个处理步骤进行具体说明。
第一步,获取输入图像;
在实际应用中,可通过电脑设备、摄像功能的手机、照相机、摄像头或集合有摄像头或存储图像的其他设备获取输入图像,用于本发明实施例的处理对象。
图3随机给出若干图像,包括:对苹果公司的商标图形、“小肥羊”、“海天”、拉伸变形的“海天”的商标标志原图。这些图像的原图可能带有色彩,可能有无意义的背景,也可能是不规则的形状,也可能经过拉伸或压缩所产生的图形等等,均可作为本发明实施例的处理对象,即所述输入图像。
第二步,对输入图像进行灰度化、二值化、去噪等预处理。
在提取输入图像的轮廓特征线之前,可先对输入图像进行预处理,例如对输入图像进行灰度化、二值化和/或去噪处理。
灰度色是指纯白、纯黑以及两者中的一系列从黑到白的过渡色。灰度就是没有色彩,RGB色彩分量全部相等。灰度图像通常用每个采样像素8bits的非线性尺度来保存,把有黑-灰-白连续变化的灰度值量化为256个灰度级,灰度值的范围为0~255,表示亮度从深到浅,对应图像中的颜色为从黑到白,每个像素值都是介于黑色和白色之间的256种灰度中的一种。运用已知的技术提取输入图像每一像素点的灰度值。灰度图像与二值化图像相比,灰度图像具有丰富的图像层次,更能清楚逼真反映输入图像。
其中,图像二值化就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果。
噪点主要是指电荷耦合元件CCD(CMOS)将光线作为接收信号并输出的过程中所产生的图像中的粗糙部分,也指图像中不该出现的外来像素,通常由电子干扰产生。看起来就像图像被弄脏了,布满一些细小的糙点。一般所拍摄的数码照片如果用个人电脑将拍摄到的高画质图像缩小以后再看的话,也许就注意不到。不过,如果将原图像放大,那么就会出现本来没有的颜色(假色),这种假色就是图像噪音,可通过技术手段将这些噪点去除。
第三步,对输入图像提取图像像素的轮廓特征线。
在本发明的实施例中,可利用多边形逼近法中的Teh-Chin检测算法提取输入图像的关键像素点特征,即轮廓特征线,轮廓特征线就是轮廓线上像素点的集合,可生成输入图像轮廓特征线上的像素点序列图像。图4示出了若干图像的轮廓特征线,可以看到,轮廓特征线包括外轮廓线上的像素点和内轮廓线上的像素点。像素点是该图像中固有的原始特征。
对于多边形逼近法,利用该算法可提取轮廓上蕴含物体形状的重要信息的像素点的集合,即是轮廓曲线的关键点检测方法。该算法主要可以分为直线段逼近法和角点检测法。角点检测法又可以分为Rosenfeld-Johnston检测算法、Freeman-Davis检测算法、Sankar-Shama检测算法、Anderson-Bezdek检测算法、Teh-Chin检测算法。该实施例中,优选采用其中的Teh-Chin检测算法。
另外,还可以使用基于灰度差的角点检测法提取输入图像的关键像素点特征,即轮廓特征线。
第四步,在坐标系中对轮廓特征线进行方向与提取方形的定位。
对轮廓特征线进行方向与提取方形的定位就是将轮廓特征线的放置位置采用一定的方法进行方向和提取方形的唯一性定位。
方向定位是为了实现不同比对图像轮廓特征线上像素点在方向上的可比性,需要将输入图像置于统一的方向定位位置上,解决图像的方向、角度等有变形或差异时的可比性和唯一性问题。这样才能在坐标系里准确提取其坐标值,实现相同或近似图像坐标值的可比性。
提取方形定位是为了实现不同比对图像轮廓特征线上像素点在提取方形内的可比性,需要将输入图像置于提取方形内,解决图像识别范围的完整性和图像的大小、形状、位置等有变形或差异时的可比性和唯一性问题。这样才能在坐标系里准确提取其完整的坐标值,实现相同或近似图像坐标值在完整性上的可比性。
在本发明的实施例中,优选采用基准定位的方式实现定位,基准定位包括:自然基准定位和基准直线定位。在同一处理体系中只能选定一种定位标准,否则会破坏其可比性。
图5示出了自然基准定位的方向定位要点,图6示出了自然基准定位的提取方形为外接矩形的定位要点。自然基准定位是将输入图像轮廓特征线在不改变旋转方向的条件下平移至输入图像轮廓特征线上像素点的x轴坐标最小值为0,且y轴坐标最小值为0的坐标系中。采用自然基准定位具有简单易快速定位的优点。
图7和图8示出了基准直线定位的方向定位要点,图9示出了基准直线定位的提取方形为外接正方形的定位要点。基准直线定位是在输入图像轮廓特征线上找出定位直线,将输入图像轮廓特征线以最小的旋转和平移至定位直线与x轴或y轴平行(本实施例为与x轴平行),且输入图像轮廓特征线上像素点的x轴坐标最小值为0,输入图像轮廓特征线在提取方形内向y轴对齐并居中。采用基准直线定位的优点是定位精确,对放置不同角度的图像或不规则的图像具有较好的唯一性定位基准。
以下描述不同情况下基准直线定位的处理过程:
1、采用基准直线定位进行方向定位。首先,检测输入图像轮廓特征线上像素点的排列是否存在直线特征,如果有直线特征,找出外轮廓线上的最长的直线段,然后,旋转输入图像轮廓特征线,以最小的旋转度角使该外轮廓线上最长的直线段与x轴或y轴平行,即可确定轮廓特征线在方向上进行了定位。图7实施例采用外轮廓线上最长直线段实施方向定位。
方向定位时如果出现外轮廓线上最长的直线段有两条或两条以上时,选取实现最小的旋转度角使该外轮廓线上最长的直线段与x轴或y轴平行的直线作为基准直线。
方向定位时如果出现输入图像轮廓特征线上像素点的排列不存在直线特征时,检测并计算轮廓特征线上距离最大的两个像素点,将轮廓特征线旋转和平移至该距离最大的两个像素点之间的虚拟直线与x轴平行,且图像轮廓特征线上像素点的x轴坐标最小值为0。图8实施例采用距离最大的两个像素点之间的虚拟直线实施方向定位。
方向定位时如果出现输入图像轮廓特征线上距离最大的像素点超过两个时,取实现以最小的旋转度角使距离最大的两个像素点之间的虚拟直线与x轴或y轴平行时所对应的该虚拟直线作为基准直线,实施方向定位。
2、采用基准直线进行提取方形定位。首先,检测输入图像轮廓特征线上像素点在坐标系中x轴或y轴最大值,取该最大值为边长做正方形,并使输入图像轮廓特征线在正方形向y轴对齐并居中,然后平移该正方形使其一条边线与x轴重合,另一条边线与y轴重合,如图9实施例所示。
经过上述定位处理,使不同的图形特征信息之间具备可比性,使不同的图像拥有共同的参照标准和统一的比对环境。
此外,在本技术方案其他实施例中,对输入图像轮廓特征线进行定位还可采取与上述不同的定位策略,例如利用输入图像轮廓特征线的外接圆法,使该外接圆与x轴和y轴相切;也可采用输入图像轮廓特征线的外接其他几何图形法,使该几何图形与x轴和y轴相切。
第五步,在坐标系中提取轮廓特征线中像素点的坐标值Gn(xn,yn)。
输入图像轮廓特征线经方向定位和提取方形定位后,以单个像素点为一个坐标刻度在坐标系内提取轮廓特征线上全部像素点的坐标值Gn(xn,yn),其中角标n代表第n个像素点,所提取的像素点包括外轮廓线和内轮廓线上的所有像素点。同时可统计轮廓特征线上的像素点总数。
需要注意的是,提取输入图像轮廓特征线上每个像素点的坐标值Gn(xn,yn)时,应基于同一方向定位和提取方形定位标准,否则会破坏其可比性。
第六步,按预设的拉伸转换规则将坐标值Gn(xn,yn)通过计算转换为拉伸坐标值Ln(x1 n,y1 n);
对于视觉上相同或相近的多个图像,因拉伸压缩所造成的差异,即使经过图像的方向定位和提取方形定位后,也很难保证其轮廓线上全部像素点的坐标值相同,这为图像的坐标匹配带来困难。为解决这个问题,对轮廓线上像素点的坐标值Gn(xn,yn)进行拉伸坐标值Ln(x1 n,y1 n)的转换,得到每个像素点的拉伸坐标值Ln(x1 n,y1 n),可以有效解决图像因拉伸压缩所造成的差异情况下的坐标匹配问题。
在所述轮廓特征线的外接方形转换后其外接方形的预定长宽比为1比1的情况下,取得的拉伸坐标值Ln(x1 n,y1 n)所构成的图像轮廓特征线外接方形为正方形,x1 n和y1 n最大拉伸坐标值相等,优选地,x1 n和y1 n的值以绝对数表示。
具体地,将所述轮廓特征线中的第n个像素点的坐标值Gn(xn,yn)转换为拉伸坐标值Ln(x1 n,y1 n),所述预设的拉伸转换规则包括:
当xn>yn时,x1 n=xn,y1 n=yn×r;
当xn<yn时,x1 n=xn×r,y1 n=yn;
当xn=yn时,x1 n=xn,y1 n=yn;
x1 n为所述轮廓特征线中的第n个像素点的x轴拉伸坐标值;
y1 n为所述轮廓特征线中的第n个像素点的y轴拉伸坐标值;
xn为所述轮廓特征线中的第n个像素点的x轴坐标值;
yn为所述轮廓特征线中的第n个像素点的y轴坐标值;
r为拉伸坐标值的拉伸转换参数。
所述拉伸转换参数按如下方式确定:
当xn>yn时,r=xd÷yd;
当xn<yn时,r=yd÷xd;
当xn=yn时,r=1;
其中,r为所述拉伸转换参数;xd为所述轮廓特征线中的像素点在所述坐标系的x轴最大坐标值;yd为所述轮廓特征线中的像素点在所述坐标系的y轴最大坐标值。
经拉伸转换参数调整转换后x1 n和y1 n的最大坐标值相等,使其在此状态下拉伸后的提取方形为正方形并与轮廓特征线外接。
例:一个三角形的三个角点a、b、c的坐标值分别为:(0,0),(10,10),(20,0),其中三角形轮廓特征线上某一像素点e的坐标值为(15,5)。
上例中,xn大于yn,按照拉伸坐标值Ln(x1 n,y1 n)预设的转换规则和拉伸转换参数确定规则,计算结果如下:
r=xd÷yd=20÷10=2
a点拉伸坐标值为(0,0),其中,x轴拉伸坐标值x1 a=xa=0,y轴拉伸坐标值y1 a=ya×r=0×2;
b拉伸坐标值为(10,20),其中,x轴拉伸坐标值x1 b=xb=10,y轴拉伸坐标值y1 b=yb×r=10×2=20;
c拉伸坐标值为(20,0),其中,x轴拉伸坐标值x1 c=xc=20,y轴拉伸坐标值y1 c=yc×r=0×2=0;
e拉伸坐标值为(15,10),其中,x轴拉伸坐标值x1 e=xe=15,y轴拉伸坐标值y1 e=ye×r=5×2=10;
采用拉伸坐标值Ln(x1 n,y1 n)表示轮廓特征线上的像素点特征,可以有效解决两个图像拉伸或压缩变形巨大的坐标值比对与匹配问题,实现图像特征信息的可比性。
第七步,按预设的相对数转换规则将拉伸坐标值Ln(x1 n,y1 n)计算转换为拉伸相对坐标值LSn(x2 n,y2 n)。
一方面,对于视觉上相同的多个图像,因不同图像的大小存在差异,所以即使经过图像的方向定位和提取方形定位后,也很难保证其轮廓线上全部像素点的坐标值相同;另一方面,即使源于同一图像,如果出现图像的拉伸变形,例圆形变为椭圆,正方形变为长方形等,即使经过图像的方向定位和提取方形定位后,也很难保证其轮廓线上全部像素点的坐标值相同,这为图像的坐标匹配带来困难。为解决这个问题,对轮廓线上像素点的拉伸坐标值Ln(x1 n,y1 n)进行相对数的转换,得到每个像素点的拉伸相对坐标值LSn(x2 n,y2 n),可以有效解决图像因拉伸压缩所造成的差异情况下的坐标匹配问题。以相对数方式表达像素点的拉伸坐标值,可称为拉伸相对坐标值,记为LSn(x2 n,y2 n),具体地,再转换获得拉伸相对坐标值LSn(x2 n,y2 n)的计算公式如下:
x2 n=x1 n÷h;
y2 n=y1 n÷h;
其中,LSn(x2 n,y2 n)为所述轮廓特征线中的第n个像素点的拉伸相对坐标值;
x1 n为所述轮廓特征线中的第n个像素点的x轴拉伸坐标值;
y1 n为所述轮廓特征线中的第n个像素点的y轴拉伸坐标值;
x2 n为所述轮廓特征线中的第n个像素点的x轴拉伸相对坐标值;
y2 n为所述轮廓特征线中的第n个像素点的y轴拉伸相对坐标值;
h为具有预定长宽比的所述轮廓特征线外接方形的最大边长。
采用拉伸相对坐标值LSn(x2 n,y2 n),可以有效解决图像的拉伸变形情况下的坐标匹配问题。
采用拉伸相对坐标值表示轮廓特征线上的像素点特征,可以消除由拉伸或压缩导致的坐标值差异,使得即使两个图像的尺寸比例差别巨大和拉伸或压缩变形巨大,也可以识别出实质相同或近似的图像。
第八步,根据图像分析需求确定拉伸相对坐标值LSn(x2 n,y2 n)的变形公差参数。
转换拉伸相对坐标值的过程中应合理确定转换变形公差范围。变形公差是指当像素点在任意方向上偏移至变形公差参数范围内时,该像素点的拉伸相对坐标值保持不变。本发明的实施例根据图像分析需要确定拉伸相对坐标值LSn(x2 n,y2 n)的变形公差i。图像轮廓特征线上像素点的坐标值Gn(xn,yn)通过计算转换为拉伸相对坐标值LSn(x2 n,y2 n),通过计算再转换为拉伸相对坐标值LSn(x2 n,y2 n)后,能根据拉伸相对坐标值微小的差异区分输入图像的唯一性,但坐标匹配时则可能很难找到相匹配的图像,采用变形公差可以解决图像在变形公差范围内的坐称匹配问题。变形公差具体的取值应根据图像分析的需求确定。变形公差参数一般取百分数,如1%,2%等等。在本发明的实施例中,变形公差参数i取0.5%至10%的范围。
第九步,按变形公差参数和取整规则对拉伸相对坐标值LSn(x2 n,y2 n)进行取整,从而得到取整拉伸相对坐标值LZn(x3 n,y3 n)。
当变形公差参数取1%时,像素点拉伸相对坐标值的x轴和y轴坐标应平均划分为100个基准相对坐标,凡不落入基准相对坐标的,拉伸相对坐标值须按取整规则取整,以落入基准相对坐标。
本实施例的取整规则:根据变形公差参数对像素点的拉伸相对坐标值LSn(xn,yn)按“未过半舍,过半入”的取整规则进行取整,以获取经变形公差精确后的像素点的取整拉伸相对坐标值LZn(x3 n,y3 n)。
结合本技术方案的如下实施例说明取整的具体处理过程:
实施例一:假如获得的某一输入图像轮廓特征线上一组像素点的拉伸相对坐标值LSn(xn,yn)如下:
LS1(0%,52.422%),LS2(0.991%,51.767%),LS3(2.489%,50.492%),LS4(3.885%,49.748%),LS5(4.991%,47.247%),LS6(6.365%,45.198%),LS7(8.436%,43.573%),LS8(9.176%,41.882%),LS9(11.067%,38.971%)。
以变形公差参数i取2%为例,按“未过半舍,过半入”的取整规则进行取整,获取以上像素点经变形公差精确后的取整拉伸相对坐标值LZn(x3 n,y3 n)如下:
LZ1(0%,52%),LZ 2(0%,52%),LZ 3(2%,50%),LZ 4(4%,50%),LZ 5(4%,48%),LZ6(6%,46%),LZ7(8%,44%),LZ8(10%,42%),LZ9(12%,38%)。
第十步,将经精确取整后的图像像素点的取整拉伸相对坐标值LZn(x3 n,y3 n)输出。
在本发明的实施例中,在计算得到输入图像轮廓特征线上像素点的取整拉伸相对坐标值LZn(x3 n,y3 n)之后,可将计算结果输出。前述计算出的输入图像轮廓特征线上所有像素点的取整拉伸相对坐标值LZn(x3 n,y3 n),以数据形式输出并保存在样本图像数据库,可用于与其他图像的取整拉伸相对坐标值LZn(x3 n,y3 n)进行识别、匹配、比较、分析,通过像素点的取整拉伸相对坐标值LSn(xn,yn)的重合程度反映不同图像的相似度。
在一些实施例中,本发明还提供一种图像特征提取装置,包括:
轮廓特征线提取模块11,用于获取输入图像,对输入图像提取图像像素的轮廓特征线;
轮廓特征线定位模块12,用于在坐标系中对轮廓特征线进行方向与提取方形的定位;
像素点坐标提取模块13,用于在所述坐标系中提取轮廓特征线中像素点的坐标值;
拉伸坐标值转换模块14,用于将所述轮廓特征线中像素点的坐标值按预设的拉伸转换规则计算转换为拉伸坐标值,其中,坐标值转换后的轮廓特征线的外接方形为具有预定长宽比的矩形;
拉伸相对坐标值转换模块15,用于将拉伸坐标值按预设的相对数转换规则计算转换为拉伸相对坐标值。
利用本发明实施例的图像特征提取方法及其装置,还能够对复杂图像进行关键轮廓特征线的像素点的处理,包括提取每个像素点的坐标值Gn(xn,yn)和计算转换为拉伸坐标值Ln(x1 n,y1 n)、再计算转换为其拉伸相对坐标值LSn(x2 n,y2 n)、确定拉伸相对坐标值LSn(x2 n,y2 n)的变形公差、按变形公差参数和“未过半舍,过半入”的取整规则进行取整以获取经变形公差精确后的像素点的取整拉伸相对坐标值LZn(x3 n,y3 n)等处理,丰富了对复杂图像特征信息的描述,利用本发明的技术方案所输出的经变形公差精确取整后的像素点的取整拉伸相对坐标值LZn(x3 n,y3 n)在不同图像间的匹配,能够有效提高相同或近似图像的匹配效果。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形、推导和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (14)
1.一种图像特征提取方法,其特征在于,包括以下步骤:
获取输入图像,对输入图像的灰度图像提取图像像素的轮廓特征线;
在坐标系中对轮廓特征线的放置位置进行方向和提取方形的唯一性定位;
在所述坐标系中提取轮廓特征线中像素点的坐标值;
将所述轮廓特征线中像素点的坐标值按预设的拉伸转换规则计算转换为拉伸坐标值,其中,坐标值转换后的轮廓特征线的外接方形为具有预定长宽比的矩形;
将拉伸坐标值按预设相对数转换规则计算转换为拉伸相对坐标值;
根据图像分析需求确定所述拉伸相对坐标值的变形公差参数;
按照所述变形公差参数和取整规则对所述拉伸相对坐标值进行取整,得到取整拉伸相对坐标值。
2.根据权利要求1所述的图像特征提取方法,其特征在于,所述转换后的轮廓特征线的外接方形的预定长宽比为1比1。
3.根据权利要求1所述的图像特征提取方法,其特征在于,将所述轮廓特征线中的第n个像素点的坐标值Gn(xn,yn)转换为拉伸坐标值Ln(x1 n,y1 n),所述预设的拉伸转换规则包括:
其中,当xn>yn时,x1 n=xn,y1 n=yn×r;
当xn<yn时,x1 n=xn×r,y1 n=yn;
当xn=yn时,x1 n=xn,y1 n=yn;
x1 n为所述轮廓特征线中的第n个像素点的x轴拉伸坐标值;
y1 n为所述轮廓特征线中的第n个像素点的y轴拉伸坐标值;
xn为所述轮廓特征线中的第n个像素点的x轴坐标值;
yn为所述轮廓特征线中的第n个像素点的y轴坐标值;
r为拉伸坐标值的拉伸转换参数。
4.根据权利要求3所述的图像特征提取方法,其特征在于,所述拉伸转换参数按照以下方式确定:
当xn>yn时,r=xd÷yd;
当xn<yn时,r=yd÷xd;
当xn=yn时,r=1;
其中,r为所述拉伸转换参数;xd为所述轮廓特征线中的像素点在所述坐标系的x轴最大坐标值;yd为所述轮廓特征线中的像素点在所述坐标系的y轴最大坐标值。
5.根据权利要求1所述的图像特征提取方法,其特征在于,将所述轮廓特征线中的第n个像素点的拉伸坐标值Ln(x1 n,y1 n)计算转换为拉伸相对坐标值LSn(x2 n,y2 n),所述预设的相对数转换规则包括:
x2 n=x1 n÷h;
y2 n=y1 n÷h;
其中,LSn(x2 n,y2 n)为所述轮廓特征线中的第n个像素点的拉伸相对坐标值;
x1 n为所述轮廓特征线中的第n个像素点的x轴拉伸坐标值;
y1 n为所述轮廓特征线中的第n个像素点的y轴拉伸坐标值;
x2 n为所述轮廓特征线中的第n个像素点的x轴拉伸相对坐标值;
y2 n为所述轮廓特征线中的第n个像素点的y轴拉伸相对坐标值;
h为具有预定长宽比的所述轮廓特征线外接方形的最大边长。
6.根据权利要求1至5任意一项所述的图像特征提取方法,其特征在于,还包括以下步骤:
将经精确取整后的轮廓特征线中像素点的取整拉伸相对坐标值输出。
7.根据权利要求6所述的图像特征提取方法,其特征在于,其中所述变形公差参数的取值介于0.5%至10%之间。
8.根据权利要求6所述的图像特征提取方法,其特征在于,其中所述取整规则为“未过半舍过半入”规则。
9.根据权利要求1至5任意一项所述的图像特征提取方法,其特征在于,在对输入图像提取图像像素的轮廓特征线之前,还包括以下步骤:对所述输入图像进行预处理,所述预处理包括以下各项中的至少一项:灰度化处理、二值化处理、去噪处理。
10.根据权利要求1至5任意一项所述的图像特征提取方法,其特征在于,所述轮廓特征线包括外轮廓线像素点的集合和内轮廓线像素点的集合。
11.根据权利要求1至5任意一项所述的图像特征提取方法,其特征在于,在坐标系中对轮廓特征线进行方向与提取方形的定位的步骤包括:
将输入图像提取图像像素的轮廓特征线在不改变旋转方向的条件下平移至所述轮廓特征线上像素点的x轴坐标最小值为0,且轮廓特征线上像素点的y轴坐标最小值为0的位置;其中,所述提取方形为所述轮廓特征线的外接矩形。
12.根据权利要求1至5任意一项所述的图像特征提取方法,其特征在于,在坐标系中对轮廓特征线进行方向定位的步骤包括:
确定输入图像的轮廓特征线上的最长直线段,以最小的旋转将所述轮廓特征线旋转至使所述最长直线段与坐标系的坐标轴平行,并平移至所述轮廓特征线上像素点的x轴坐标最小值为0,所述轮廓特征线在提取方形内向y轴对齐并居中的位置。
13.根据权利要求1至5任意一项所述的图像特征提取方法,其特征在于,在坐标系中对轮廓特征线进行提取方形定位的步骤包括:
所述方形是以方向定位后的轮廓特征线上最大的x轴或y轴坐标值为边长所构成的方形,所述方形的一条边线与x轴重合,另一条边线与y轴重合。
14.一种图像特征提取装置,其特征在于,包括:
轮廓特征线提取模块,用于获取输入图像,对输入图像的灰度图像提取图像像素的轮廓特征线;
轮廓特征线定位模块,用于在坐标系中对轮廓特征线的放置位置进行方向和提取方形的唯一性定位;
像素点坐标提取模块,用于在所述坐标系中提取轮廓特征线中像素点的坐标值;
拉伸坐标值转换模块,用于将所述轮廓特征线中像素点的坐标值按预设的拉伸转换规则计算转换为拉伸坐标值,其中,坐标值转换后的轮廓特征线的外接方形为具有预定长宽比的矩形;
拉伸相对坐标值转换模块,用于将拉伸坐标值按预设的相对数转换规则计算转换为拉伸相对坐标值;
变形公差参数确定模块,用于根据图像分析需求确定所述拉伸相对坐标值的变形公差参数;
取整拉伸相对坐标值计算模块,用于按照所述变形公差参数和取整规则对所述拉伸相对坐标值进行取整,得到取整拉伸相对坐标值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610070396.6A CN105740872B (zh) | 2016-01-29 | 2016-01-29 | 图像特征提取方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610070396.6A CN105740872B (zh) | 2016-01-29 | 2016-01-29 | 图像特征提取方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105740872A CN105740872A (zh) | 2016-07-06 |
CN105740872B true CN105740872B (zh) | 2020-05-19 |
Family
ID=56241776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610070396.6A Active CN105740872B (zh) | 2016-01-29 | 2016-01-29 | 图像特征提取方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105740872B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106649851A (zh) * | 2016-12-30 | 2017-05-10 | 徐庆 | 近似商标查询结果排序方法、装置及其商标服务器 |
CN108334879B (zh) * | 2018-02-11 | 2020-08-21 | 深圳市朗驰欣创科技股份有限公司 | 一种区域提取方法、系统及终端设备 |
CN110321908A (zh) * | 2018-03-29 | 2019-10-11 | 华为技术有限公司 | 图像识别方法、终端设备及计算机可读存储介质 |
CN110390630A (zh) * | 2018-04-17 | 2019-10-29 | 上海碧虎网络科技有限公司 | 图像变形方法、装置、存储介质、显示系统和汽车 |
CN109635821A (zh) * | 2018-12-04 | 2019-04-16 | 北京字节跳动网络技术有限公司 | 图像区域的特征提取方法、装置、设备及可读介质 |
CN111325220B (zh) * | 2020-02-17 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 图像生成方法、装置、设备及存储介质 |
CN113518182B (zh) * | 2021-06-30 | 2022-11-25 | 天津市农业科学院 | 一种基于树莓派的黄瓜表型特征测量方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1908964A (zh) * | 2006-08-22 | 2007-02-07 | 北京方正奥德计算机系统有限公司 | 一种图像线性几何变形自动矫正的方法 |
CN103759672A (zh) * | 2014-01-15 | 2014-04-30 | 陈涛 | 雪糕棒平面轮廓尺寸的视觉测量方法 |
CN104616321A (zh) * | 2015-02-09 | 2015-05-13 | 公安部第一研究所 | 一种基于尺度不变特征变换的行李图像运动行为描述方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7873218B2 (en) * | 2004-04-26 | 2011-01-18 | Canon Kabushiki Kaisha | Function approximation processing method and image processing method |
-
2016
- 2016-01-29 CN CN201610070396.6A patent/CN105740872B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1908964A (zh) * | 2006-08-22 | 2007-02-07 | 北京方正奥德计算机系统有限公司 | 一种图像线性几何变形自动矫正的方法 |
CN103759672A (zh) * | 2014-01-15 | 2014-04-30 | 陈涛 | 雪糕棒平面轮廓尺寸的视觉测量方法 |
CN104616321A (zh) * | 2015-02-09 | 2015-05-13 | 公安部第一研究所 | 一种基于尺度不变特征变换的行李图像运动行为描述方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105740872A (zh) | 2016-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105740872B (zh) | 图像特征提取方法及其装置 | |
CN110414507B (zh) | 车牌识别方法、装置、计算机设备和存储介质 | |
CN111028213B (zh) | 图像缺陷检测方法、装置、电子设备及存储介质 | |
EP2783328B1 (en) | Text detection using multi-layer connected components with histograms | |
CN105574533B (zh) | 一种图像特征提取方法和装置 | |
Ok et al. | Circular oil tank detection from panchromatic satellite images: A new automated approach | |
JP6528723B2 (ja) | 物体認識装置、物体認識方法及びプログラム | |
CN109348731B (zh) | 一种图像匹配的方法及装置 | |
CN106709524B (zh) | 一种电气工程图中的元件符号检测与识别方法 | |
CN109344820B (zh) | 基于计算机视觉和深度学习的数字式电表读数识别方法 | |
WO2011042601A1 (en) | Face recognition in digital images | |
CN110738204A (zh) | 一种证件区域定位的方法及装置 | |
CN114581646A (zh) | 文本识别方法、装置、电子设备及存储介质 | |
CN108960247B (zh) | 图像显著性检测方法、装置以及电子设备 | |
JP2009211490A (ja) | 画像認識方法および装置 | |
WO2015158778A1 (en) | Pattern recognition system and method using gabor functions | |
CN108960246B (zh) | 一种用于图像识别的二值化处理装置及方法 | |
CN111445402B (zh) | 一种图像去噪方法及装置 | |
CN112926695A (zh) | 基于模板匹配的图像识别方法和系统 | |
CN107710229B (zh) | 图像中的形状识别方法、装置、设备及计算机存储介质 | |
US10115195B2 (en) | Method and apparatus for processing block to be processed of urine sediment image | |
KR101282663B1 (ko) | 차량 번호판의 이미지 영역을 검출하기 위한 장치 및 그 방법 | |
CN111612083A (zh) | 一种手指静脉识别方法、装置及设备 | |
CN112396638A (zh) | 一种图像处理方法、终端和计算机可读存储介质 | |
CN107092912A (zh) | 一种车牌的识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |