CN103810488B - 图像特征提取方法、图像搜索方法、服务器、终端及系统 - Google Patents

图像特征提取方法、图像搜索方法、服务器、终端及系统 Download PDF

Info

Publication number
CN103810488B
CN103810488B CN201210448102.0A CN201210448102A CN103810488B CN 103810488 B CN103810488 B CN 103810488B CN 201210448102 A CN201210448102 A CN 201210448102A CN 103810488 B CN103810488 B CN 103810488B
Authority
CN
China
Prior art keywords
area
image
target area
searched
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210448102.0A
Other languages
English (en)
Other versions
CN103810488A (zh
Inventor
段曼妮
王从德
贾梦雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210448102.0A priority Critical patent/CN103810488B/zh
Publication of CN103810488A publication Critical patent/CN103810488A/zh
Application granted granted Critical
Publication of CN103810488B publication Critical patent/CN103810488B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了图像特征提取方法、图像搜索方法、服务器、终端及系统,该方法中,对待搜索图像进行区域定位,获得至少一个备选区域,确定符合预设分类条件的备选区域为目标区域,对所述目标区域进行区域归一化处理,获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征。该方法中,服务器通过区域定位得到备选区域,并从中确定目标区域,并对目标区域进行归一化处理,从而使得该目标区域具有仿射和透视不变性,从而提高了对包含有文字信息的图像特征提取的准确性,提高了对该类图像进行检索的过程的准确性,降低了服务器的资源消耗。

Description

图像特征提取方法、图像搜索方法、服务器、终端及系统
技术领域
本申请涉及图像处理技术领域,特别涉及图像特征提取方法、图像搜索方法、服务器、终端及系统。
背景技术
随着互联网技术的发展,网络已经与人们的生活密不可分,越来越多的人选择网络作为获取信息的首要工具。
目前,为了实现通过网络获得人们想要的信息,通常采用将需要查找的信息对应的关键字作为检索条件,发送给服务器,服务器根据检索条件进行检索,然后将检索到的信息反馈给用户。
但是,当用户需要检索一张图像时,仅仅利用与该图像对应的关键字无法将该图像的特征准确的体现,因此,通过关键字检索得到的结果的准确性较低,用户不得不更换关键词后继续向服务器发送请求,而服务器也需要不断的响应用户的请求,直到用户找到满意的图像为止,由此可以看出,现有技术中利用关键字对图像进行检索的过程准确性低,服务器的资源消耗较大。
为了解决上述问题,现有技术中通常利用基于角点的图像局部特征来进行图像搜索。所谓角点,在现实世界中,其对应于物体的拐角,如道路的十字路口等。而在一幅图像中,角点可以是文字的拐角处,笔画的起始等。基于角点的图像局部特征通过角点检测算法获得,该角点检测算法通常分为两类,第一类为基于模板的角点检测方法,通常将预先设定的模板与图像做卷积,得到的响应大的位置就是角点所在的位置,第二类为基于边缘特征的角点检测方法,通常为首先检测出图像中的边缘,然后再求边缘的交点,将该交点确定为角点。上述两类算法进行角点定位后,需要确定角点的大小,然后得到一个角点区域,通常情况下,将该角点区域假设为一个圆形。这是因为圆形对于旋转和尺度缩放都有较高的不变性,但是,其对于透视形变或仿射形变的不变性较低。当需要处理的图像包含有文字信息时,如通过手机或相机对图书封面进行拍照得到的图像,除包含封面上的图案外,还包括书名、作者、出版社等文字信息,由于此时需要对包含有文字信息的图像进行透视形变或仿射形变,因此,利用现有的基于角点检测算法获得的基于角点的图像特征的准确性较低,从而并未有效的解决对包含有文字信息的图像进行检索的过程准确性低,服务器的资源消耗较大的问题。
发明内容
本申请的目的在于,提供图像特征提取方法,以解决现有技术中服务器对包含有文字信息的图像进行检索的过程准确性低,资源消耗较大的问题,具体方案包括:
一种图像特征提取方法,包括:
接收待搜索图像;
对所述待搜索图像进行区域定位,获得至少一个备选区域;
确定符合预设分类条件的备选区域为目标区域;
对所述目标区域进行区域归一化处理;
获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征。
优选的,所述确定符合预设分类条件的备选区域为目标区域的过程包括:
从所述至少一个备选区域中选取当前待分析备选区域;
当所述当前待分析备选区域包含的角点个数小于预设角点个数,且,所述当前待分析备选区域的面积与其对应的拟合椭圆的面积比值处于第一预设范围内时,确定所述当前待分析备选区域为目标区域;
或,
当所述当前待分析备选区域包含的角点个数大于或等于预设角点个数,且,所述当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积的比值大于或等于第一预设面积比值时,确定所述当前待分析备选区域为目标区域。
优选的,通过以下过程对目标区域进行区域归一化处理:
获取所述目标区域对应的拟合椭圆的两个短轴方向;
确定所述目标区域的重心;
根据所述两个短轴方向及所述重心确定所述目标区域的主方向;
当所述目标区域不符合预设分裂条件时,将所述目标区域进行旋转使其主方向为水平轴的正向;
将旋转后的目标区域压缩到预先设定的尺寸。
优选的,所述根据所述两个短轴方向及所述重心确定所述目标区域的主方向的过程包括:
获取所述重心与所述拟合椭圆长轴的距离;
当所述距离小于预设距离值时,确定所述目标区域的主方向为所述两个短轴方向;
当所述距离大于或等于预设距离值时,确定所述两个短轴方向中与所述重心位置偏差较小的短轴方向为所述目标区域的主方向。
优选的,当所述目标区域符合预设分裂条件时,还包括:
将所述目标区域依据所述拟合椭圆的长轴和短轴划分为子区域;
确定所述目标区域的主方向分别为所述子区域的主方向;
将所述子区域分别进行旋转使其主方向为水平轴的正向;
将旋转后的子区域压缩到预先设定的大小。
优选的,当所述目标区域的主方向为所述两个短轴方向时,所述将所述目标区域进行旋转使其主方向为水平轴的正向的过程包括:
将所述目标区域依据第一短轴方向进行旋转,使其主方向为水平轴的正向,得到第一旋转后目标区域;
将所述目标区域依据第二短轴方向进行旋转,使其主方向为水平轴的正向,得到第二旋转后目标区域。
优选的,按照以下步骤判断所述目标区域是否符合预设分裂条件:
获取所述目标区域对应的拟合椭圆的面积与所述待搜索图像的面积的比值;
判断其是否大于第二预设面积比值,所述第二预设面积比值大于所述第一预设面积比值,若是,则所述目标区域符合预设分裂条件。
优选的,所述获取与所述区域归一化处理后的目标区域对应的图像特征的过程包括:
将所述归一化处理后的目标区域转换为与所述预先设定的尺寸相对应的特征向量,所述特征向量的每一位分别表示其对应的像素点的RGB平均值;
确定所述特征向量为所述目标区域对应的图像特征。
优选的,还包括:
获取与所述待搜索图像对应的图像特征相匹配的搜索结果;
发送所述搜索结果。
一种图像搜索方法,包括:
采集待搜索图像;
发送所述待搜索图像给服务器,由所述服务器对所述待搜索图像进行区域定位,获得至少一个备选区域,确定符合预设分类条件的备选区域为目标区域,对所述目标区域进行区域归一化处理,获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征;
接收所述服务器获取并发送的与所述待搜索图像对应的图像特征相匹配的搜索结果。
本申请还提供了图像特征提取服务器、终端及系统,用以保证上述方法在实际中的实现及应用。
一种服务器,包括:
待搜索图像接收模块,用于接收待搜索图像;
区域定位模块,用于对所述待搜索图像进行区域定位,获得至少一个备选区域;
目标区域确定模块,用于确定符合预设分类条件的备选区域为目标区域;
归一化处理模块,用于对所述目标区域进行区域归一化处理;
图像特征获取模块,用于获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征。
优选的,所述目标区域确定模块包括:
选取单元,用于从所述至少一个备选区域中选取当前待分析备选区域;
目标区域确定单元,用于当所述当前待分析备选区域包含的角点个数小于预设角点个数,且,所述当前待分析备选区域的面积与其对应的拟合椭圆的面积比值处于第一预设范围内时,确定所述当前待分析备选区域为目标区域,或,当所述当前待分析备选区域包含的角点个数大于或等于预设角点个数,且,所述当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积的比值大于或等于第一预设面积比值时,确定所述当前待分析备选区域为目标区域。
优选的,所述归一化处理模块包括:
短轴方向单元,用于获取所述目标区域对应的拟合椭圆的两个短轴方向;
重心确定单元,用于确定所述目标区域的重心;
主方向确定单元,用于根据所述两个短轴方向及所述重心确定所述目标区域的主方向;
旋转单元,用于当所述目标区域不符合预设分裂条件时,将所述目标区域进行旋转使其主方向为水平轴的正向;
尺寸调整单元,用于将旋转后的目标区域调整到预先设定的尺寸。
优选的,还包括:
搜索模块,用于获取与所述待搜索图像对应的图像特征相匹配的搜索结果;
搜索结果发送模块,用于发送所述搜索结果。
一种终端,包括:
待搜索图像采集模块,用于采集待搜索图像;
待搜索图像发送模块,用于发送所述待搜索图像给服务器,由所述服务器对所述待搜索图像进行区域定位,获得至少一个备选区域,确定符合预设分类条件的备选区域为目标区域,对所述目标区域进行区域归一化处理,获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征的依据;
搜索结果接收模块,用于接收所述服务器获取并发送的与所述待搜索图像对应的图像特征相匹配的搜索结果。
一种图像特征提取系统,包括:如上所述的服务器,和,如上所述的终端。
与现有技术相比,本申请包括以下优点:本申请实施例公开的一种图像特征提取方法,对待搜索图像进行区域定位,获得至少一个备选区域,确定符合预设分类条件的备选区域为目标区域,对所述目标区域进行区域归一化处理,获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征。该方法中,通过区域定位得到备选区域,并从中确定目标区域,并对目标区域进行归一化处理,从而使得该目标区域具有仿射和透视不变性,从而提高了服务器对包含有文字信息的图像特征提取的准确性及对该类图像进行检索的过程的准确性,降低了服务器的资源消耗。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种图像特征提取方法的流程图;
图2为本申请实施例公开的确定符合预设分类条件的备选区域为目标区域的流程图;
图3为本申请实施例公开的区域归一化处理流程图;
图4为本申请实施例公开的根据所述两个短轴方向及所述重心确定所述目标区域的主方向的流程图;
图5为本申请实施例公开的判断目标区域是否符合分裂条件的流程图;
图6为本申请实施例公开的对目标区域进行分裂,并进行旋转和拉伸的流程图;
图7为本申请实施例公开的获取目标区域对应的图像特征的流程图;
图8为本申请实施例公开的图像搜索方法的流程图;
图9为本申请实施例公开的图像特征提取服务器的结构示意图;
图10为本申请实施例公开的目标区域确定模块的结构示意图;
图11为本申请实施例公开的归一化处理模块的结构示意图;
图12为本申请实施例公开的终端结构示意图;
图13为本申请实施例公开的图像特征提取系统结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请的主要思想之一可以包括,接收终端采集并发送的待搜索图像,对待搜索图像进行区域定位,获得至少一个备选区域,确定符合预设分类条件的备选区域为目标区域,对所述目标区域进行区域归一化处理,获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征。
如图1所示为申请实施例公开的一种图像特征提取方法的流程图,该方法应用于服务器端,包括:
步骤S11、接收发送的待搜索图像;
本实施例中接收的待搜索图像,可以为终端利用图像采集设备,例如摄像头等采集待搜索图像,并将该图像通过移动通信网络、wifi等上传至服务器的。服务器接收待搜索图像。
步骤S12、对待搜索图像进行区域定位,获得至少一个备选区域;
本步骤中服务器可以采用(Maximally Stable Extremal Regions,简称MSER)来实现,也可以通过仿射形变自适应”(Affine Shape Adaptation)方法实现,本实施例并不限定该步骤只能通过这两种方式实现,采用任意一种区域分割方法或提取方法实现图像的区域定位都是本实施例保护的范围。
本实施例中,采用MSER提取方法,具体过程如下所述:
首先,将目标图像由彩色模式转换为灰度模式,然后进行MSER提取。一般的MSER提取方法都由两轮组成,一轮处理灰度值递增(MSER+)的问题,一轮处理灰度值递减(MSER-)的问题。以MSER+为例:从0开始到255,逐渐增加阈值T,对图像的每个像素点进行检查,将灰度值小于阈值T的点忽略不计,大于或等于T的点,记录下来,在这些点中,邻接(通常指四邻接)的点就构成了极值区域,在不断增大阈值T的过程中,我们可以计算极值区域面积随着阈值变化的比率,这个变化率最小的阈值T,对应的区域就是一个MSER+区域。采用同样的方法,我们可以得到MSER-区域,与MSER+的不同是,MSER-是从255开始,逐步减小阈值T,计算所有灰度值小于等于阈值的区域,最后得到MSER-区域。
步骤S13、确定符合预设分类条件的备选区域为目标区域;
通常情况下,利用MSER获得的备选区域的形状和区域大小不固定,若对备选区域的形状和区域大小没有限制,则此处的预设分类条件为空,则不对备选区域进行筛选,直接将所有的备选区域确定为目标区域。
但是,当图像提取过程中对备选区域的形状和大小有要求时,需要判断获得的备选区域是否符合预设分类条件,只有符合预设分类条件的备选区域,才能作为目标区域。
步骤S14、对所述目标区域进行区域归一化处理;
本步骤的目的在于,缩小目标区域间的形状和区域大小的差异,使得目标区域对应的图像特征具有更好的仿射不变性。
步骤S15、获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征。
本实施例公开的图像特征提取方法中,服务器通过待搜索图像进行区域定位得到备选区域,并从中确定目标区域,并对目标区域进行归一化处理,从而使得该目标区域具有仿射和透视不变性,从而提高了服务器对包含有文字信息的图像特征提取的准确性,提高了对该类图像进行检索的过程的准确性,降低了服务器的资源消耗。
进一步的,按照图2所示流程确定符合预设分类条件的备选区域为目标区域,包括:
步骤S21、从所述至少一个备选区域中选取当前待分析备选区域;
步骤S22、获取当前待分析备选区域包含的角点个数;
本步骤中的角点个数可以预先计算获得,也可以在进行分析时,实时计算获得。
步骤S23、判断当前待分析备选区域包含的角点个数是否小于预设角点个数,若是,则执行步骤S24,若否,则执行步骤S26;
本实施例中的预设角点个数为4,也可以为5或其他根据实际情况设定的值。角点个数越多,则表明区域形状越复杂,角点个数越少则表明区域形状简单。
步骤S24、获取当前待分析备选区域的面积及其对应的拟合椭圆的面积;
本步骤中的当前待分析备选区域的面积及其对应的拟合椭圆的面积可以预先计算获得,也可以在进行分析时,实时计算获得。
步骤S25、判断当前待分析备选区域的面积与其对应的拟合椭圆的面积比值是否处于第一预设范围内,若是,则执行步骤S28;若否,则执行步骤S29;
本实施例中的第一预设范围为大于或等于0.1,小于或等于0.4。也可以为其他根据实际情况设定的值。
步骤S26、获取当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积;
步骤S27、判断所述当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积的比值是否大于或等于第一预设面积比值,若是,则执行步骤S28,若否,则执行步骤S29;
本实施例中的第一预设面积比值为0.002,即比值大于或等于0.002的当前待分析备选区域为目标区域。
步骤S28、确定所述当前待分析备选区域为目标区域;
将目标区域保留。
步骤S29、确定所述当前待分析备选区域为非目标区域;
当前待分析备选区域判断结束后,还可以判断至少一个备选区域中是否存在未被分析备选区域,若是,则选择下一未被分析备选区域为当前待分析备选区域,返回执行步骤S22。从而实现将备选区域一一进行判断,直到全部备选区域都被判断结束。
本实施例中,通过对当前待分析备选区域包含的角点个数、当前待分析备选区域的面积与其对应的拟合椭圆的面积比值以及当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积的比值三个参数来判断当前待分析备选区域是否为需要保留的目标区域,从而使得后续只需对目标区域进行分析处理,减少了数据处理量,并且避免了将不符合条件的备选区域进行处理提取到的特征降低整个图像特征提取过程的准确性。
通过图2所述的流程,可以获得与待搜索图像对应的目标区域,为了使得后续对其进行特征提取时,提取的特征具有缩放、旋转和仿射不变性的特点,需要对目标区域进行归一化处理,通常情况下,对目标区域进行归一化处理的具体的过程包括:轮廓椭圆拟合、主方向定位、对符合分裂条件的区域进行分裂、对目标区域进行旋转和拉伸。
具体的,本步骤中可以利用图2所示流程中获得的拟合椭圆,或者,再重新进行椭圆拟合,得到拟合后的椭圆。
得到拟合椭圆的过程可以通过最小二乘法来实现,在二维平面中,椭圆的代数形式表示是:
Ax2+Bxy+Cy2+Dx+Ey+F=0
并且B2-4AC<0
最小二乘法的主要思想就是寻找一组{A,B,C,D,E,F},使得轮廓上的点到该椭圆的距离最小,同时满足约束条件。具体地说,假设轮廓上有N个点,分别是{(x0,y0),(x1,y1),...,(xN,yN)}。目标函数是所有点到椭圆的距离之和, 欲使f(A,B,C,D,E,F)最小,必有:
由此可以得到一个线性方程组,结合约束条件,求解该线性方程组可以得到A,B,C,D,E,F的值。这样就完成了椭圆拟合,得到了一个椭圆方程。事实上,任何一种椭圆拟合方法都可以用在这里,并不仅限于上述最小二乘法。
对拟合后的椭圆进行主方向定位的过程可以首先统计整个椭圆区域或者轮廓内区域的所有像素的梯度方向,做一个直方图,直方图的峰值处,确定为该方向的主方向。但是这种方法多用在圆形区域的主方向定位中,而且需要区域内的像素变化比较自然缓和,比如自然图像,而对于二值化很严重的文字图像,这样的标定方法比较容易产生误差。因此,本实施例公开的确定主方向的过程如图3所示的区域归一化处理流程图中步骤S31-S33所示,包括:
步骤S31、获取所述目标区域对应的拟合椭圆的两个短轴方向;
步骤S32、确定所述目标区域的重心;
步骤S33、根据所述两个短轴方向及所述重心确定所述目标区域的主方向;
当目标区域不符合分裂条件时,对目标区域进行旋转和拉伸的过程如图3中的步骤S34-S35所示,包括:
步骤S34、将所述目标区域进行旋转使其主方向为水平轴的正向;
当所述目标区域的主方向为所述两个短轴方向时,所述将所述目标区域进行旋转使其主方向为水平轴的正向的过程包括:
将所述目标区域依据第一短轴方向进行旋转,使其主方向为水平轴的正向,得到第一旋转后目标区域;将所述目标区域依据第二短轴方向进行旋转,使其主方向为水平轴的正向,得到第二旋转后目标区域。
步骤S35、将旋转后的目标区域压缩到预先设定的尺寸。
本实施例中的预先设定的尺寸可以为(32像素*32像素),也可以为(64像素*64像素)。如有两个旋转后目标区域,则分别将其压缩到预先设定的尺寸。
本实施例中,根据所述两个短轴方向及所述重心确定所述目标区域的主方向的过程如图4所示,包括:
步骤S41、获取所述重心与所述拟合椭圆长轴的距离;
步骤S42、判断所述距离是否小于预设距离值,若是,则执行步骤S43,若否,则执行步骤S44;
本实施例中的预设距离值为0.05倍的短轴长度。若小于该预设距离值,则表明重心与长轴距离过近,该目标区域的重心偏移并不显著,容易因为噪声的影响发生偏转,从而使得主方向发生偏转。
步骤S43、确定所述目标区域的主方向为所述两个短轴方向;
在目标区域的重心与长轴距离过近的情况下,保留两个短轴方向,从而使得从该目标区域提取的特征具有一定的鲁棒性,从而使得与目标区域对应的图像特征具有更好的旋转不变性。
步骤S44、确定所述两个短轴方向中与所述重心位置偏差较小的短轴方向为所述目标区域的主方向。
由此可以看出,本实施例中确定主方向的过程具有较高的鲁棒性,保证了与目标区域对应的图像特征的准确性。
本实施例中,判断目标区域是否符合分裂条件的过程如图5所示,包括:
步骤S51、获取所述目标区域对应的拟合椭圆的面积与所述待搜索图像的面积的比值;
步骤S52、判断该比值是否大于第二预设面积比值,所述第二预设面积比值大于所述第一预设面积比值,若是,则执行步骤S53,若否,则执行步骤S54;
步骤S53、所述目标区域符合预设分裂条件;
步骤S54、所述目标区域不符合预设分裂条件。
本实施例中的第二预设面积比值为0.01。
当目标区域符合预设分裂条件时,对其进行分裂,并进行旋转和拉伸的过程如图6所示,包括:
步骤S61、将所述目标区域依据所述拟合椭圆的长轴和短轴划分为子区域;
步骤S62、确定所述目标区域的主方向分别为所述子区域的主方向;
步骤S63、将所述子区域分别进行旋转使其主方向为水平轴的正向;
步骤S64、将旋转后的子区域压缩到预先设定的大小。
通过上述流程,可以得到每一个归一化处理后的目标区域。分别获取每一个目标区域对应的图像特征。具体流程如图7所示,包括:
步骤S71、将所述归一化处理后的目标区域转换为与所述预先设定的尺寸相对应的特征向量,所述特征向量的每一位分别表示其对应的像素点的RGB平均值;
以预先设定的尺寸为(32像素*32像素)为例,将该目标区域表示成一个32*32=1024维的特征向量。每一位分别表示了某个像素点上的RGB均值:
步骤S72、确定所述特征向量为所述目标区域对应的图像特征。
将该特征向量作为目标区域对应的特征图像,由于待搜索图像包含一个或多个目标区域,则将每一个目标区域对应的特征向量进行集合,集合的结果即为该待搜索图像对应的图像特征。
本实施例并不限定采用上述方式对目标图像对应的图像特征进行表示,还可以利用每一个目标区域对应的灰度作为其对应的图像特征。
进一步的,当服务器获取到与待搜索图像对应的图像特征后,还包括:获取与所述待搜索图像对应的图像特征相匹配的搜索结果,发送所述搜索结果的步骤。
通过上述步骤,从而使得发送待搜索图像的终端能够获得搜索结果。
本申请同时公开了一种应用于终端的图像搜索方法,该方法与上述实施例中的图像特征提取流程等相对应,其流程如图8所示,包括:
步骤S81、采集待搜索图像;
步骤S82、发送所述待搜索图像给服务器。
由所述服务器对所述待搜索图像进行区域定位,获得至少一个备选区域,确定符合预设分类条件的备选区域为目标区域,对所述目标区域进行区域归一化处理,获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征。
步骤S83、接收所述服务器获取并发送的与所述待搜索图像对应的图像特征相匹配的搜索结果。
本实施例公开的图像特征搜索方法,与应用于服务器端的图像特提取过程相对应,提高了服务器对包含有文字信息的图像特征提取的准确性,提高了对该类图像进行检索的过程的准确性,降低了服务器的资源消耗。
本申请同时公开了一种应用上述实施例公开的图像特征提取方式进行图像特征提取的服务器,其结构如图9所示,包括:
待搜索图像接收模块91,用于接收待搜索图像;
区域定位模块92,用于对待搜索图像进行区域定位,获得至少一个备选区域;
目标区域确定模块93,用于确定符合预设分类条件的备选区域为目标区域;
归一化处理模块94,用于对所述目标区域进行区域归一化处理;
图像特征获取模块95,用于获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征。
本实施例公开的图像特征提取服务器的工作过程如下所述:
接收模块接收待搜索图像,区域定位模块对待搜索图像进行区域定位,得到至少一个备选区域,由于得到的备选区域的形状和大小不固定,目标区域确定模块需要根据预先设定的分类条件来确定出目标区域,该分类条件可以根据实际情况进行设定。归一化处理模块对目标区域进行区域归一化处理,最后图像特征获取模块获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征。
进一步的,上述图像特征提取服务器还包括:
搜索模块,用于获取与所述待搜索图像对应的图像特征相匹配的搜索结果;
搜索结果发送模块,用于向所述终端发送所述搜索结果。
本实施例公开的图像特征提取服务器,通过对接收的待搜索图像进行区域定位得到备选区域,并从中确定目标区域,并对目标区域进行归一化处理,从而使得该目标区域具有仿射和透视不变性,从而提高了服务器对包含有文字信息的图像特征提取的准确性,及对图像进行检索的过程的准确性,降低了服务器的资源消耗。
进一步的,目标区域确定模块93的结构如图10所示,包括:
选取单元931,用于从所述至少一个备选区域中选取当前待分析备选区域;
目标区域确定单元932,用于当所述当前待分析备选区域包含的角点个数小于预设角点个数,且,所述当前待分析备选区域的面积与其对应的拟合椭圆的面积比值处于第一预设范围内时,确定所述当前待分析备选区域为目标区域,或,当所述当前待分析备选区域包含的角点个数大于或等于预设角点个数,且,所述当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积的比值大于或等于第一预设面积比值时,确定所述当前待分析备选区域为目标区域。
进一步的,归一化处理模块94的结构如图11所示,包括:
短轴方向单元941,用于获取所述目标区域对应的拟合椭圆的两个短轴方向;
重心确定单元942,用于确定所述目标区域的重心;
主方向确定单元943,用于根据所述两个短轴方向及所述重心确定所述目标区域的主方向;
旋转单元944,用于当所述目标区域不符合预设分裂条件时,将所述目标区域进行旋转使其主方向为水平轴的正向;
尺寸调整单元945,用于将旋转后的目标区域调整到预先设定的尺寸。
具体的,本实施例公开的图像特征提取服务器的具体工作过程可以参考图1-图7所示方法流程,在此不再赘述。
与上述服务器相对应,本申请同时公开了一种利用上述方式进行图像搜索的终端,其结构如图12所示,包括:
待搜索图像采集模块121,用于采集待搜索图像;
待搜索图像发送模块122,用于发送所述待搜索图像给服务器,由所述服务器对所述待搜索图像进行区域定位,获得至少一个备选区域,确定符合预设分类条件的备选区域为目标区域,对所述目标区域进行区域归一化处理,获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征的依据。
搜索结果接收模块123,用于接收所述服务器获取并发送的与所述待搜索图像对应的图像特征相匹配的搜索结果。
本申请实施例中的终端可以为个人计算机、手持设备或便携式设备、平板型设备等。
本实施例公开的终端,与图像特征提取服务器配合工作,提高了服务器对包含有文字信息的图像特征提取的准确性,提高了对该类图像进行检索的过程的准确性,降低了服务器的资源消耗。
同时,本申请还公开了一种图像特征提取系统,其结构如图13所示,包括:终端131和图像特征提取服务器132。其中终端131的结构和功能可参考图12所对应的实施例。图像特征提取服务器132的结构和功能可参考图9-11所示实施例。
本申请公开的图像特征提取系统,终端采集并发送待搜索图像给服务器后,服务器通过对接收的待搜索图像进行区域定位得到备选区域,并从中确定目标区域,并对目标区域进行归一化处理,从而使得该目标区域具有仿射和透视不变性,从而提高了服务器及整个系统对包含有文字信息的图像特征提取的准确性,及对图像进行检索的过程的准确性,降低了服务器和系统的资源消耗。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的图像特征提取方法、服务器、终端及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种图像特征提取方法,其特征在于,包括:
接收待搜索图像;
采用MSER或仿射形变自适应方法对所述待搜索图像进行区域定位,获得至少一个备选区域;
确定符合预设分类条件的备选区域为目标区域;
对所述目标区域进行区域归一化处理;
获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征;
其中,所述确定符合预设分类条件的备选区域为目标区域的过程包括:
从所述至少一个备选区域中选取当前待分析备选区域;
当所述当前待分析备选区域包含的角点个数小于预设角点个数,且,所述当前待分析备选区域的面积与其对应的拟合椭圆的面积比值处于第一预设范围内时,确定所述当前待分析备选区域为目标区域;
或,
当所述当前待分析备选区域包含的角点个数大于或等于预设角点个数,且,所述当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积的比值大于或等于第一预设面积比值时,确定所述当前待分析备选区域为目标区域。
2.根据权利要求1所述的方法,其特征在于,通过以下过程对目标区域进行区域归一化处理:
获取所述目标区域对应的拟合椭圆的两个短轴方向;
确定所述目标区域的重心;
根据所述两个短轴方向及所述重心确定所述目标区域的主方向;
当所述目标区域不符合预设分裂条件时,将所述目标区域进行旋转使其主方向为水平轴的正向;
将旋转后的目标区域压缩到预先设定的尺寸。
3.根据权利要求2所述的方法,其特征在于,所述根据所述两个短轴方向及所述重心确定所述目标区域的主方向的过程包括:
获取所述重心与所述拟合椭圆长轴的距离;
当所述距离小于预设距离值时,确定所述目标区域的主方向为所述两个短轴方向;
当所述距离大于或等于预设距离值时,确定所述两个短轴方向中与所述重心位置偏差较小的短轴方向为所述目标区域的主方向。
4.根据权利要求2所述的方法,其特征在于,当所述目标区域符合预设分裂条件时,还包括:
将所述目标区域依据所述拟合椭圆的长轴和短轴划分为子区域;
确定所述目标区域的主方向分别为所述子区域的主方向;
将所述子区域分别进行旋转使其主方向为水平轴的正向;
将旋转后的子区域压缩到预先设定的大小。
5.根据权利要求2所述的方法,其特征在于,当所述目标区域的主方向为所述两个短轴方向时,所述将所述目标区域进行旋转使其主方向为水平轴的正向的过程包括:
将所述目标区域依据第一短轴方向进行旋转,使其主方向为水平轴的正向,得到第一旋转后目标区域;
将所述目标区域依据第二短轴方向进行旋转,使其主方向为水平轴的正向,得到第二旋转后目标区域。
6.根据权利要求2所述的方法,其特征在于,按照以下步骤判断所述目标区域是否符合预设分裂条件:
获取所述目标区域对应的拟合椭圆的面积与所述待搜索图像的面积的比值;
判断其是否大于第二预设面积比值,所述第二预设面积比值大于第一预设面积比值,若是,则所述目标区域符合预设分裂条件。
7.根据权利要求2所述的方法,其特征在于,所述获取与所述区域归一化处理后的目标区域对应的图像特征的过程包括:
将所述归一化处理后的目标区域转换为与预先设定的尺寸相对应的特征向量,所述特征向量的每一位分别表示其对应的像素点的RGB平均值;
确定所述特征向量为所述目标区域对应的图像特征。
8.根据权利要求1-7中任意一项所述的方法,其特征在于,还包括:
获取与所述待搜索图像对应的图像特征相匹配的搜索结果;
发送所述搜索结果。
9.一种图像搜索方法,其特征在于,包括:
采集待搜索图像;
发送所述待搜索图像给服务器,由所述服务器采用MSER或仿射形变自适应方法对所述待搜索图像进行区域定位,获得至少一个备选区域,确定符合预设分类条件的备选区域为目标区域,对所述目标区域进行区域归一化处理,获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征;
接收所述服务器获取并发送的与所述待搜索图像对应的图像特征相匹配的搜索结果;
其中,所述确定符合预设分类条件的备选区域为目标区域的过程包括:
从所述至少一个备选区域中选取当前待分析备选区域;
当所述当前待分析备选区域包含的角点个数小于预设角点个数,且,所述当前待分析备选区域的面积与其对应的拟合椭圆的面积比值处于第一预设范围内时,确定所述当前待分析备选区域为目标区域;
或,
当所述当前待分析备选区域包含的角点个数大于或等于预设角点个数,且,所述当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积的比值大于或等于第一预设面积比值时,确定所述当前待分析备选区域为目标区域。
10.一种服务器,其特征在于,包括:
待搜索图像接收模块,用于接收待搜索图像;
区域定位模块,用于采用MSER或仿射形变自适应方法对所述待搜索图像进行区域定位,获得至少一个备选区域;
目标区域确定模块,用于确定符合预设分类条件的备选区域为目标区域;
归一化处理模块,用于对所述目标区域进行区域归一化处理;
图像特征获取模块,用于获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征;
其中,所述目标区域确定模块包括:
选取单元,用于从所述至少一个备选区域中选取当前待分析备选区域;
目标区域确定单元,用于当所述当前待分析备选区域包含的角点个数小于预设角点个数,且,所述当前待分析备选区域的面积与其对应的拟合椭圆的面积比值处于第一预设范围内时,确定所述当前待分析备选区域为目标区域,或,当所述当前待分析备选区域包含的角点个数大于或等于预设角点个数,且,所述当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积的比值大于或等于第一预设面积比值时,确定所述当前待分析备选区域为目标区域。
11.根据权利要求10所述的服务器,其特征在于,所述归一化处理模块包括:
短轴方向单元,用于获取所述目标区域对应的拟合椭圆的两个短轴方向;
重心确定单元,用于确定所述目标区域的重心;
主方向确定单元,用于根据所述两个短轴方向及所述重心确定所述目标区域的主方向;
旋转单元,用于当所述目标区域不符合预设分裂条件时,将所述目标区域进行旋转使其主方向为水平轴的正向;
尺寸调整单元,用于将旋转后的目标区域调整到预先设定的尺寸。
12.根据权利要求10-11中任意一项所述的服务器,其特征在于,还包括:
搜索模块,用于获取与所述待搜索图像对应的图像特征相匹配的搜索结果;
搜索结果发送模块,用于发送所述搜索结果。
13.一种终端,其特征在于,包括:
待搜索图像采集模块,用于采集待搜索图像;
待搜索图像发送模块,用于发送所述待搜索图像给服务器,由所述服务器采用MSER或仿射形变自适应方法对所述待搜索图像进行区域定位,获得至少一个备选区域,确定符合预设分类条件的备选区域为目标区域,对所述目标区域进行区域归一化处理,获取与所述区域归一化处理后的目标区域对应的图像特征,并作为所述待搜索图像对应的图像特征的依据;
搜索结果接收模块,用于接收所述服务器获取并发送的与所述待搜索图像对应的图像特征相匹配的搜索结果;
其中,所述确定符合预设分类条件的备选区域为目标区域的过程包括:
从所述至少一个备选区域中选取当前待分析备选区域;
当所述当前待分析备选区域包含的角点个数小于预设角点个数,且,所述当前待分析备选区域的面积与其对应的拟合椭圆的面积比值处于第一预设范围内时,确定所述当前待分析备选区域为目标区域;
或,
当所述当前待分析备选区域包含的角点个数大于或等于预设角点个数,且,所述当前待分析备选区域对应的拟合椭圆面积与所述待搜索图像的面积的比值大于或等于第一预设面积比值时,确定所述当前待分析备选区域为目标区域。
14.一种图像特征提取系统,其特征在于,包括:如权利要求10-12中任意一项所述的服务器,和,如权利要求13所述的终端。
CN201210448102.0A 2012-11-09 2012-11-09 图像特征提取方法、图像搜索方法、服务器、终端及系统 Active CN103810488B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210448102.0A CN103810488B (zh) 2012-11-09 2012-11-09 图像特征提取方法、图像搜索方法、服务器、终端及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210448102.0A CN103810488B (zh) 2012-11-09 2012-11-09 图像特征提取方法、图像搜索方法、服务器、终端及系统

Publications (2)

Publication Number Publication Date
CN103810488A CN103810488A (zh) 2014-05-21
CN103810488B true CN103810488B (zh) 2017-08-08

Family

ID=50707229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210448102.0A Active CN103810488B (zh) 2012-11-09 2012-11-09 图像特征提取方法、图像搜索方法、服务器、终端及系统

Country Status (1)

Country Link
CN (1) CN103810488B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199973A (zh) * 2014-09-22 2014-12-10 西安酷派软件科技有限公司 图片检索方法和图片检索装置
CN105825228B (zh) * 2016-03-14 2019-04-30 百度在线网络技术(北京)有限公司 图像识别方法及装置
CN106504403A (zh) * 2016-11-17 2017-03-15 深圳怡化电脑股份有限公司 一种纸币鉴伪的方法及装置
CN106874954A (zh) * 2017-02-20 2017-06-20 佛山市络思讯科技有限公司 一种信息获取的方法以及相关装置
CN109145926B (zh) * 2017-06-13 2023-04-18 腾讯科技(深圳)有限公司 相似图片识别方法及计算机设备
CN109740337B (zh) * 2019-01-25 2020-12-22 宜人恒业科技发展(北京)有限公司 一种实现滑块验证码识别的方法及装置
CN116403232B (zh) * 2023-04-13 2024-03-08 南京少昊网络科技有限公司 一种基于像素值波动的图书信息提取方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609712A (zh) * 2012-02-24 2012-07-25 山东鲁能智能技术有限公司 用于移动机器人的类圆形指针式仪表读数方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206116B (zh) * 2007-12-07 2010-08-18 北京机械工业学院 目标点全局自动定位方法
CN102402680B (zh) * 2010-09-13 2014-07-30 株式会社理光 人机交互系统中手部、指示点定位方法和手势确定方法
CN102592281B (zh) * 2012-01-16 2015-05-06 北方工业大学 图像匹配方法
CN102679960B (zh) * 2012-05-10 2014-01-01 清华大学 基于圆形路标成像分析的机器人视觉定位方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609712A (zh) * 2012-02-24 2012-07-25 山东鲁能智能技术有限公司 用于移动机器人的类圆形指针式仪表读数方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《一种结合MSER与SIFT算子的特征检测方法》;莫会宇,王祝萍;《东华大学学报( 自然科学版)》;20111031;第37卷(第5期);第624-628页 *
《基于归一化的椭圆拟合方法》;刘蓉 等;《第四届中国智能计算大会论文集》;20100525;第218-221页 *

Also Published As

Publication number Publication date
CN103810488A (zh) 2014-05-21

Similar Documents

Publication Publication Date Title
CN103810488B (zh) 图像特征提取方法、图像搜索方法、服务器、终端及系统
CN111461089B (zh) 一种人脸检测的方法、人脸检测模型的训练方法及装置
CN102360421B (zh) 一种基于视频流的人脸识别方法及系统
CN103221954B (zh) 在网络中执行视觉搜索
CN107832794B (zh) 一种卷积神经网络生成方法、车系识别方法及计算设备
CN107169458B (zh) 数据处理方法、装置及存储介质
CN107341443B (zh) 视频处理方法、装置及存储介质
US20140233827A1 (en) Identification method for valuable file and identification device thereof
CN111325271B (zh) 图像分类方法及装置
CN107463818A (zh) 解锁控制方法及相关产品
CN111464716B (zh) 一种证件扫描方法、装置、设备及存储介质
CN110188747A (zh) 一种文本图像的倾斜校正方法、装置以及图像处理设备
CN111626163B (zh) 一种人脸活体检测方法、装置及计算机设备
CN112150493A (zh) 一种基于语义指导的自然场景下屏幕区域检测方法
CN103514446A (zh) 一种融合传感器信息的室外场景识别方法
CN102306415B (zh) 便携式有价文件识别装置
CN103353881A (zh) 一种应用程序搜索方法及装置
CN112837344A (zh) 一种基于条件对抗生成孪生网络的目标跟踪方法
CN113421206B (zh) 一种基于红外偏振成像的图像增强方法
CN103955499A (zh) 一种基于即时计算与动态追踪的视觉体验增强方法
CN112733886A (zh) 样本图像的处理方法、装置、设备及存储介质
CN108665459B (zh) 一种图像模糊检测方法、计算设备及可读存储介质
CN104715250A (zh) 十字激光检测方法和装置
US8610831B2 (en) Method and apparatus for determining motion
KR102374158B1 (ko) Gis 및 cnn 기반 공공데이터를 이용한 변화탐지 서비스 제공 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1195154

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1195154

Country of ref document: HK