CN103345738B - 基于感兴趣区域的对象检测方法及装置 - Google Patents

基于感兴趣区域的对象检测方法及装置 Download PDF

Info

Publication number
CN103345738B
CN103345738B CN201310219546.1A CN201310219546A CN103345738B CN 103345738 B CN103345738 B CN 103345738B CN 201310219546 A CN201310219546 A CN 201310219546A CN 103345738 B CN103345738 B CN 103345738B
Authority
CN
China
Prior art keywords
source image
region
target image
interest
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310219546.1A
Other languages
English (en)
Other versions
CN103345738A (zh
Inventor
丁二锐
陈世佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310219546.1A priority Critical patent/CN103345738B/zh
Publication of CN103345738A publication Critical patent/CN103345738A/zh
Application granted granted Critical
Publication of CN103345738B publication Critical patent/CN103345738B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种基于感兴趣区域的对象检测方法及装置。本发明实施例通过根据用户对目标图像的变换操作,确定目标图像的感兴趣区域,进而根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,使得能够对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果,由于基于源图像的感兴趣区域,进行多尺度扫描,因此,无需扫描整个源图像,这样,可以缩短扫描时间,且提高准确率,能够避免现有技术中由于采用对源图像进行多尺度扫描的方式进行对象检测而导致的扫描时间长,而且检测结果并不一定就是用户关心的目标对象的问题,从而提高了对象检测的效率和可靠性。

Description

基于感兴趣区域的对象检测方法及装置
【技术领域】
本发明涉及对象检测技术,尤其涉及一种基于感兴趣区域(Region OfInterest,ROI)的对象检测方法及装置。
【背景技术】
随着通信技术的发展,终端集成了越来越多的功能,从而使得终端的系统功能列表中包含了越来越多相应的应用程序。有些应用程序中会涉及一些图像中的对象识别服务,例如,根据从图像中检测出的人脸特征,匹配到预先存储的某个特征,等。在对象识别服务中,客户端需要对源图像进行多尺度扫描,以遍历源图像在每个尺度上的不同图像,通过判断扫描窗口内是否为待识别的对象,来检测出该对象。
然而,采用对源图像进行多尺度扫描的方式,进行对象检测,扫描时间长,而且检测结果并不一定就是用户关心的目标对象,从而导致了对象检测的效率和可靠性的降低。
【发明内容】
本发明的多个方面提供一种基于感兴趣区域的对象检测方法及装置,用以提高对象检测的效率和可靠性。
本发明的一方面,提供一种基于感兴趣区域的对象检测方法,包括:
根据用户对目标图像的变换操作,确定目标图像的感兴趣区域;
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域;
对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果,包括:
根据最佳视觉窗口尺寸和扫描窗口尺寸,获得第一缩放系数和至少一个第二缩放系数;
利用所述第一缩放系数和所述至少一个第二缩放系数,对所述源图像的感兴趣区域进行扫描,以获得所述对象检测结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据最佳视觉窗口尺寸和扫描窗口尺寸,获得第一缩放系数和至少一个第二缩放系数,包括:
根据最佳视觉窗口尺寸与扫描窗口尺寸的比值,获得所述第一缩放系数;
根据所述第一缩放系数和尺度变化参数,获得所述至少一个第二缩放系数。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述尺度变化参数包括下列中的至少一项:
变化范围;
变化单位;
变化个数;以及
变化方向。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,包括:
根据所述变换操作的操作系数,对所述源图像进行所述变换操作,以获得变换之后的源图像;
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述变换之后的源图像上,获得所述源图像的感兴趣区域。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,包括:
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述源图像上,获得对应区域;
根据所述变换操作的操作系数,对所述对应区域进行所述变换操作,以获得所述源图像的感兴趣区域。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述变换操作包括下列中的至少一项:
单击操作;
双击操作;
放大操作;
缩小操作;以及
平移操作。
本发明的另一方面,提供一种基于感兴趣区域的对象检测装置,包括:
确定单元,用于根据用户对目标图像的变换操作,确定目标图像的感兴趣区域;
获得单元,用于根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域;
扫描单元,用于对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述扫描单元,具体用于
根据最佳视觉窗口尺寸和扫描窗口尺寸,获得第一缩放系数和至少一个第二缩放系数;以及利用所述第一缩放系数和所述至少一个第二缩放系数,对所述源图像的感兴趣区域进行扫描,以获得所述对象检测结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述扫描单元,具体用于
根据最佳视觉窗口尺寸与扫描窗口尺寸的比值,获得所述第一缩放系数;以及根据所述第一缩放系数和尺度变化参数,获得所述至少一个第二缩放系数。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述尺度变化参数包括下列中的至少一项:
变化范围;
变化单位;
变化个数;以及
变化方向。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,具体用于
根据所述变换操作的操作系数,对所述源图像进行所述变换操作,以获得变换之后的源图像;
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述变换之后的源图像上,获得所述源图像的感兴趣区域。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,具体用于
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述源图像上,获得对应区域;
根据所述变换操作的操作系数,对所述对应区域进行所述变换操作,以获得所述源图像的感兴趣区域。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述变换操作包括下列中的至少一项:
单击操作;
双击操作;
放大操作;
缩小操作;以及
平移操作。
由上述技术方案可知,本发明实施例通过根据用户对目标图像的变换操作,确定目标图像的感兴趣区域,进而根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,使得能够对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果,由于基于源图像的感兴趣区域,进行多尺度扫描,因此,无需扫描整个源图像,这样,可以缩短扫描时间,且提高准确率,能够避免现有技术中由于采用对源图像进行多尺度扫描的方式进行对象检测而导致的扫描时间长,而且检测结果并不一定就是用户关心的目标对象的问题,从而提高了对象检测的效率和可靠性。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的基于感兴趣区域的对象检测方法的流程示意图;
图2为图1对应的实施例中目标图像的示意图;
图3为图1对应的实施例中源图像的示意图;
图4为图2经过放大操作之后的操作结果示意图;
图5为图3经过放大操作之后的操作结果示意图;
图6为图4经过平移操作之后的操作结果示意图;
图7为图5经过平移操作之后的操作结果示意图;
图8为本发明另一实施例提供的基于感兴趣区域的对象检测装置的结构示意图。
【具体实施方式】
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持装置、无线上网本、个人电脑、便携电脑、MP3播放器、MP4播放器等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明一实施例提供的基于感兴趣区域的对象检测方法的流程示意图,如图1所示。
101、根据用户对目标图像的变换操作,确定目标图像的感兴趣区域。
102、根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域。
103、对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果。
需要说明的是,101~103的执行主体可以是检测装置,可以位于本地的客户端中,以进行离线检测,或者还可以位于网络侧的服务器中,以进行在线检测,本实施例对此不进行限定。
可以理解的是,所述客户端可以是安装在终端上的应用程序,或者还可以是浏览器的一个网页,只要能够实现对象检测,以提供识别服务的客观存在形式都可以,本实施例对此不进行限定。
这样,通过根据用户对目标图像的变换操作,确定目标图像的感兴趣区域,进而根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,使得能够对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果,由于基于源图像的感兴趣区域,进行多尺度扫描,因此,无需扫描整个源图像,这样,可以缩短扫描时间,且提高准确率,能够避免现有技术中由于采用对源图像进行多尺度扫描的方式进行对象检测而导致的扫描时间长,而且检测结果并不一定就是用户关心的目标对象的问题,从而提高了对象检测的效率和可靠性。
另外,采用本发明提供的技术方案,能够仅检测用户感兴趣的区域,从而能够进一步提高对象检测的可靠性。
在本发明中,可以定义两种图像:一种是源图像,例如,拍摄图像或下载图像等;另一种是目标图像,例如,终端的屏幕上显示的图像,以供用户操作。其中,目标图像可以是源图像,或者还可以是源图像在一定尺度下的缩放图像。
另外,两种图像在尺度上具有对应关系,即目标图像与源图像的映射关系。在目标图上的操作都可以反映在源图像上。
具体地,用户对目标图像的变换操作,可以包括但不限于下列中的至少一项:
单击操作;
双击操作;
放大操作;
缩小操作;以及
平移操作。
可选地,在本实施例的一个可能的实现方式中,在101中,具体可以采用如下方式确定目标图像的感兴趣区域。
例如,可以根据单击操作或双击操作的操作位置,如手指触摸的位置、鼠标点击的位置等,确定目标图像的感兴趣区域,如目标图像在该操作位置周围的1厘米范围内的部分区域。
或者,再例如,可以根据放大操作、缩小操作或平移操作在的操作结果图像,确定目标图像的感兴趣区域,如操作结果图像在屏幕上显示的部分区域。
需要说明的是,如果用户对目标图像没有执行任何操作,也可以理解为执行了缺省操作系数的变换操作,例如,操作系数为1的缩放操作或操作系数为0的平移操作等。那么,相应地,可以将整个屏幕范围内的目标图像,作为目标图像的感兴趣区域。
可选地,在本实施例的一个可能的实现方式中,在103中,具体可以根据最佳视觉窗口尺寸和扫描窗口尺寸,获得第一缩放系数和至少一个第二缩放系数。然后,则可以利用所述第一缩放系数和所述至少一个第二缩放系数,对所述源图像的感兴趣区域进行扫描,以获得所述对象检测结果。本发明采用一部分尺度即第一缩放系数和至少一个第二缩放系数对应的尺度对源图像的感兴趣区域进行扫描,能够保证,源图像上扫描窗口与感兴趣区域的比例,与,目标图像上最佳视觉窗口与感兴趣区域的比例,近似一致,使得在最贴近感兴趣区域在源图像上的实际尺寸附近进行扫描,避免在某些尺度下的无效检测,从而能够进一步提高对象检测的可靠性。同时,还能够进一步提高对象检测的效率。
这样,由于仅利用第一缩放系数和至少一个第二缩放系数对所述源图像的感兴趣区域进行扫描,即对所述源图像的感兴趣区域进行部分尺度的扫描,而不是对所述源图像的感兴趣区域进行所有尺度的扫描,因此,能够进一步提高对象检测的效率。
其中,最佳视觉窗口尺寸,为目标图像上的扫描基本单位,可以按照用户操作习惯统计获得;扫描窗口尺寸,为源图像上的扫描基本单位,可以由扫描算法指定。
具体地,具体可以根据最佳视觉窗口尺寸与扫描窗口尺寸的比值,获得所述第一缩放系数,然后,根据所述第一缩放系数和尺度变化参数,获得所述至少一个第二缩放系数。其中,所述尺度变化参数可以包括但不限于下列中的至少一项:
变化范围,例如,在-0.5~0.5之间;
变化单位,例如,1个单位,每个单位为0.25;
变化个数,例如,2个;以及
变化方向,例如,缩小方向和/或放大方向。
需要说明的是,在102中,根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,的方法可以有两种。
一种方法是,先对源图像进行与目标图像的变换操作对应的变换操作,然后基于变换之后的源图像,获得与目标图像的感兴趣区域对应的所述源图像的感兴趣区域。可选地,在本实施例的一个可能的实现方式中,在102中,具体可以根据所述变换操作的操作系数,对所述源图像进行所述变换操作,以获得变换之后的源图像。然后,则可以根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述变换之后的源图像上,获得所述源图像的感兴趣区域。
另一种方法是,先基于源图像,获得与目标图像的感兴趣区域对应的对应区域,然后,在对所述对应区域进行与目标图像的变换操作对应的变换操作,以获得所述源图像的感兴趣区域。可选地,在本实施例的一个可能的实现方式中,在102中,具体还可以根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述源图像上,获得对应区域。然后,则可以根据所述变换操作的操作系数,对所述对应区域进行所述变换操作,以获得所述源图像的感兴趣区域。这样,由于只对与目标图像的感兴趣区域对应的对应区域进行变换操作,因此,能够进一步提高对象检测的效率。
在本发明中,感兴趣区域(Regions Of Interest,ROI)即图像中最能引起用户兴趣,最能表现图像内容的区域。确定出这些区域,将会大大提高图像处理和分析的效率和准确度。为使得本发明实施例提供的方法更加清楚,下面将以图2~图7作为举例,以说明感兴趣区域如何确定。
如图2和图3所示,目标图像是源图像缩小3倍之后的图像,即目标图像与源图像的映射关系为3倍缩小关系。假设用户对目标图像的变换操作为以目标图像的中心点为中心,进行放大2倍的放大操作。
目标图像经过放大操作之后,可以如图4所示;而根据目标图像与源图像的映射关系,源图像经过放大操作之后,可以如图5所示。
如图2和4所示,根据用户对目标图像的放大操作,确定目标图像的感兴趣区域为图中阴影部分。进一步地,还可以以目标图像为参考,记录该区域相对于目标图像的参考坐标,即相对于目标图像的顶点坐标、长和宽,例如,(x,y,a,b),其中,x,y,a,b均为相对坐标值。
如图3和5所示,根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域为图中阴影部分。进一步地,还可以以源图像为参考,记录该区域相对于源图像的参考坐标,即相对于源图像的顶点坐标、长和宽,例如,(x,y,a,b),其中,x,y,a,b均为相对坐标值。
如图6所示,根据用户对目标图像的平移操作,确定目标图像的感兴趣区域为图中阴影部分。进一步地,还可以以目标图像为参考,记录该区域相对于目标图像的参考坐标,即相对于目标图像的顶点坐标、长和宽,例如,(x+x’,y+y’,a,b),其中,x,x’,y,y’,a,b均为相对坐标值。
如图7所示,根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域为图中阴影部分。进一步地,还可以以源图像为参考,记录该区域相对于源图像的参考坐标,即相对于源图像的顶点坐标、长和宽,例如,(x+x’,y+y’,a,b),其中,x,x’,y,y’,a,b均为相对坐标值。
假设最佳视觉窗口尺寸与扫描窗口尺寸的比值为1/4,那么,则可以根据该比值和尺度变化参数,计算获得几个缩放系数,例如,4、3.5、4.5等。能够保证,源图像上扫描窗口与感兴趣区域的比例,与,目标图像上最佳视觉窗口与感兴趣区域的比例,近似一致。然后,利用这些缩放系数,对所述源图像的感兴趣区域进行扫描。
进一步地,还可以记录对象检测结果。可以理解的是,如果用户对目标图像的变换操作,且变换操作之后的包括感兴趣区域的结果图像,与之前保存的记录相同,则可以直接获得与该记录对应的对象检测结果。
本实施例中,通过根据用户对目标图像的变换操作,确定目标图像的感兴趣区域,进而根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,使得能够对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果,由于基于源图像的感兴趣区域,进行多尺度扫描,因此,无需扫描整个源图像,这样,可以缩短扫描时间,且提高准确率,能够避免现有技术中由于采用对源图像进行多尺度扫描的方式进行对象检测而导致的扫描时间长,而且检测结果并不一定就是用户关心的目标对象的问题,从而提高了对象检测的效率和可靠性。
另外,采用本发明提供的技术方案,能够仅检测用户感兴趣的区域,从而能够进一步提高对象检测的可靠性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图8为本发明另一实施例提供的基于感兴趣区域的对象检测装置的结构示意图,如图8所示。本实施例的基于感兴趣区域的对象检测装置可以包括确定单元81、获得单元82和扫描单元83。其中,确定单元81,用于根据用户对目标图像的变换操作,确定目标图像的感兴趣区域;获得单元82,用于根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域;扫描单元83,用于对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果。
需要说明的是,本实施例提供的装置,可以位于本地的客户端中,以进行离线检测,或者还可以位于网络侧的服务器中,以进行在线检测,本实施例对此不进行限定。
可以理解的是,所述客户端可以是安装在终端上的应用程序,或者还可以是浏览器的一个网页,只要能够实现对象检测,以提供识别服务的客观存在形式都可以,本实施例对此不进行限定。
这样,通过确定单元根据用户对目标图像的变换操作,确定目标图像的感兴趣区域,进而由获得单元根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,使得扫描单元能够对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果,由于基于源图像的感兴趣区域,进行多尺度扫描,因此,无需扫描整个源图像,这样,可以缩短扫描时间,且提高准确率,能够避免现有技术中由于采用对源图像进行多尺度扫描的方式进行对象检测而导致的扫描时间长,而且检测结果并不一定就是用户关心的目标对象的问题,从而提高了对象检测的效率和可靠性。
另外,采用本发明提供的技术方案,能够仅检测用户感兴趣的区域,从而能够进一步提高对象检测的可靠性。
在本发明中,可以定义两种图像:一种是源图像,例如,拍摄图像或下载图像等;另一种是目标图像,例如,终端的屏幕上显示的图像,以供用户操作。其中,目标图像可以是源图像,或者还可以是源图像在一定尺度下的缩放图像。
另外,两种图像在尺度上具有对应关系,即目标图像与源图像的映射关系。在目标图上的操作都可以反映在源图像上。
具体地,用户对目标图像的变换操作,可以包括但不限于下列中的至少一项:
单击操作;
双击操作;
放大操作;
缩小操作;以及
平移操作。
可选地,在本实施例的一个可能的实现方式中,确定单元81,具体可以采用如下方式确定目标图像的感兴趣区域。
例如,可以根据单击操作或双击操作的操作位置,如手指触摸的位置、鼠标点击的位置等,确定目标图像的感兴趣区域,如目标图像在该操作位置周围的1厘米范围内的部分区域。
或者,再例如,可以根据放大操作、缩小操作或平移操作在的操作结果图像,确定目标图像的感兴趣区域,如操作结果图像在屏幕上显示的部分区域。
需要说明的是,如果用户对目标图像没有执行任何操作,也可以理解为执行了缺省操作系数的变换操作,例如,操作系数为1的缩放操作或操作系数为0的平移操作等。那么,相应地,确定单元81可以将整个屏幕范围内的目标图像,作为目标图像的感兴趣区域。
可选地,在本实施例的一个可能的实现方式中,所述扫描单元83,具体可以用于根据最佳视觉窗口尺寸和扫描窗口尺寸,获得第一缩放系数和至少一个第二缩放系数;以及利用所述第一缩放系数和所述至少一个第二缩放系数,对所述源图像的感兴趣区域进行扫描,以获得所述对象检测结果。所述扫描单元83采用一部分尺度即第一缩放系数和至少一个第二缩放系数对应的尺度对源图像的感兴趣区域进行扫描,能够保证,源图像上扫描窗口与感兴趣区域的比例,与,目标图像上最佳视觉窗口与感兴趣区域的比例,近似一致,使得在最贴近感兴趣区域在源图像上的实际尺寸附近进行扫描,避免在某些尺度下的无效检测,从而能够进一步提高对象检测的可靠性。同时,还能够进一步提高对象检测的效率。
这样,由于仅利用第一缩放系数和至少一个第二缩放系数对所述源图像的感兴趣区域进行扫描,即对所述源图像的感兴趣区域进行部分尺度的扫描,而不是对所述源图像的感兴趣区域进行所有尺度的扫描,因此,能够进一步提高对象检测的效率。
其中,最佳视觉窗口尺寸,为目标图像上的扫描基本单位,可以按照用户操作习惯统计获得;扫描窗口尺寸,为源图像上的扫描基本单位,可以由扫描算法指定。
具体地,所述扫描单元83,具体可以用于根据最佳视觉窗口尺寸与扫描窗口尺寸的比值,获得所述第一缩放系数;以及根据所述第一缩放系数和尺度变化参数,获得所述至少一个第二缩放系数。其中,所述尺度变化参数可以包括但不限于下列中的至少一项:
变化范围,例如,在-0.5~0.5之间;
变化单位,例如,1个单位,每个单位为0.25;
变化个数,例如,2个;以及
变化方向,例如,缩小方向和/或放大方向。
需要说明的是,所述获得单元82,根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,的方法可以有两种。
一种方法是,所述获得单元82先对源图像进行与目标图像的变换操作对应的变换操作,然后基于变换之后的源图像,获得与目标图像的感兴趣区域对应的所述源图像的感兴趣区域。可选地,在本实施例的一个可能的实现方式中,所述获得单元82,具体可以用于根据所述变换操作的操作系数,对所述源图像进行所述变换操作,以获得变换之后的源图像;以及根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述变换之后的源图像上,获得所述源图像的感兴趣区域。
另一种方法是,所述获得单元82先基于源图像,获得与目标图像的感兴趣区域对应的对应区域,然后,在对所述对应区域进行与目标图像的变换操作对应的变换操作,以获得所述源图像的感兴趣区域。可选地,在本实施例的一个可能的实现方式中,所述获得单元82,具体可以用于根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述源图像上,获得对应区域;以及根据所述变换操作的操作系数,对所述对应区域进行所述变换操作,以获得所述源图像的感兴趣区域。
在本发明中,感兴趣区域(Regions Of Interest,ROI)即图像中最能引起用户兴趣,最能表现图像内容的区域。确定单元81确定出这些区域,将会大大提高图像处理和分析的效率和准确度。为使得本发明实施例提供的方法更加清楚,下面将以图2~图7作为举例,以说明感兴趣区域如何确定。
如图2和图3所示,目标图像是源图像缩小3倍之后的图像,即目标图像与源图像的映射关系为3倍缩小关系。假设用户对目标图像的变换操作为以目标图像的中心点为中心,进行放大2倍的放大操作。
目标图像经过放大操作之后,可以如图4所示;而根据目标图像与源图像的映射关系,源图像经过放大操作之后,可以如图5所示。
如图2和4所示,确定单元81根据用户对目标图像的放大操作,确定目标图像的感兴趣区域为图中阴影部分。进一步地,确定单元81还可以以目标图像为参考,记录该区域相对于目标图像的参考坐标,即相对于目标图像的顶点坐标、长和宽,例如,(x,y,a,b),其中,x,y,a,b均为相对坐标值。
如图3和5所示,获得单元82根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域为图中阴影部分。进一步地,获得单元82还可以以源图像为参考,记录该区域相对于源图像的参考坐标,即相对于源图像的顶点坐标、长和宽,例如,(x,y,a,b),其中,x,y,a,b均为相对坐标值。
如图6所示,确定单元81根据用户对目标图像的平移操作,确定目标图像的感兴趣区域为图中阴影部分。进一步地,确定单元81还可以以目标图像为参考,记录该区域相对于目标图像的参考坐标,即相对于目标图像的顶点坐标、长和宽,例如,(x+x’,y+y’,a,b),其中,x,x’,y,y’均为相对坐标值。
如图7所示,获得单元82根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域为图中阴影部分。进一步地,获得单元82还可以以源图像为参考,记录该区域相对于源图像的参考坐标,即相对于源图像的顶点坐标、长和宽,例如,(x+x’,y+y’,a,b),其中,x,x’,y,y’均为相对坐标值。
假设最佳视觉窗口尺寸与扫描窗口尺寸的比值为1/4,那么,扫描单元83则可以根据该比值和尺度变化参数,计算获得几个缩放系数,例如,4、3.5、4.5等。能够保证,源图像上扫描窗口与感兴趣区域的比例,与,目标图像上最佳视觉窗口与感兴趣区域的比例,近似一致。然后,扫描单元83利用这些缩放系数,对所述源图像的感兴趣区域进行扫描。
进一步地,扫描单元83还可以记录对象检测结果。可以理解的是,如果用户对目标图像的变换操作,且变换操作之后的包括感兴趣区域的结果图像,与扫描单元83之前保存的记录相同,扫描单元83则可以直接获得与该记录对应的对象检测结果。
本实施例中,通过确定单元根据用户对目标图像的变换操作,确定目标图像的感兴趣区域,进而由获得单元根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,使得扫描单元能够对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果,由于基于源图像的感兴趣区域,进行多尺度扫描,因此,无需扫描整个源图像,这样,可以缩短扫描时间,且提高准确率,能够避免现有技术中由于采用对源图像进行多尺度扫描的方式进行对象检测而导致的扫描时间长,而且检测结果并不一定就是用户关心的目标对象的问题,从而提高了对象检测的效率和可靠性。
另外,采用本发明提供的技术方案,能够仅检测用户感兴趣的区域,从而能够进一步提高对象检测的可靠性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种基于感兴趣区域的对象检测方法,其特征在于,包括:
根据用户对目标图像的变换操作,确定目标图像的感兴趣区域;
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域;
对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果;其中,
所述对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果,包括:
根据最佳视觉窗口尺寸和扫描窗口尺寸,获得第一缩放系数和至少一个第二缩放系数;
利用所述第一缩放系数和所述至少一个第二缩放系数,对所述源图像的感兴趣区域进行扫描,以获得所述对象检测结果;其中,
所述变换操作包括下列中的至少一项:
单击操作;
双击操作;
放大操作;
缩小操作;以及
平移操作;其中,
所述根据最佳视觉窗口尺寸和扫描窗口尺寸,获得第一缩放系数和至少一个第二缩放系数,包括:
根据最佳视觉窗口尺寸与扫描窗口尺寸的比值,获得所述第一缩放系数;
根据所述第一缩放系数和尺度变化参数,获得所述至少一个第二缩放系数。
2.根据权利要求1所述的方法,其特征在于,所述尺度变化参数包括下列中的至少一项:
变化范围;
变化单位;
变化个数;以及
变化方向。
3.根据权利要求1或2所述的方法,其特征在于,所述根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,包括:
根据所述变换操作的操作系数,对所述源图像进行所述变换操作,以获得变换之后的源图像;
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述变换之后的源图像上,获得所述源图像的感兴趣区域。
4.根据权利要求1或2所述的方法,其特征在于,所述根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域,包括:
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述源图像上,获得对应区域;
根据所述变换操作的操作系数,对所述对应区域进行所述变换操作,以获得所述源图像的感兴趣区域。
5.一种基于感兴趣区域的对象检测装置,其特征在于,包括:
确定单元,用于根据用户对目标图像的变换操作,确定目标图像的感兴趣区域;
获得单元,用于根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,获得源图像的感兴趣区域;
扫描单元,用于对所述源图像的感兴趣区域进行多尺度扫描,以获得对象检测结果;其中,
所述扫描单元,具体用于
根据最佳视觉窗口尺寸和扫描窗口尺寸,获得第一缩放系数和至少一个第二缩放系数;以及利用所述第一缩放系数和所述至少一个第二缩放系数,对所述源图像的感兴趣区域进行扫描,以获得所述对象检测结果;其中,
所述变换操作包括下列中的至少一项:
单击操作;
双击操作;
放大操作;
缩小操作;以及
平移操作;其中,
所述扫描单元,具体用于
根据最佳视觉窗口尺寸与扫描窗口尺寸的比值,获得所述第一缩放系数;以及根据所述第一缩放系数和尺度变化参数,获得所述至少一个第二缩放系数。
6.根据权利要求5所述的装置,其特征在于,所述尺度变化参数包括下列中的至少一项:
变化范围;
变化单位;
变化个数;以及
变化方向。
7.根据权利要求5或6所述的装置,其特征在于,所述获得单元,具体用于
根据所述变换操作的操作系数,对所述源图像进行所述变换操作,以获得变换之后的源图像;
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述变换之后的源图像上,获得所述源图像的感兴趣区域。
8.根据权利要求5或6所述的装置,其特征在于,所述获得单元,具体用于
根据目标图像与源图像的映射关系,以及所述目标图像的感兴趣区域,在所述源图像上,获得对应区域;
根据所述变换操作的操作系数,对所述对应区域进行所述变换操作,以获得所述源图像的感兴趣区域。
CN201310219546.1A 2013-06-04 2013-06-04 基于感兴趣区域的对象检测方法及装置 Active CN103345738B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310219546.1A CN103345738B (zh) 2013-06-04 2013-06-04 基于感兴趣区域的对象检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310219546.1A CN103345738B (zh) 2013-06-04 2013-06-04 基于感兴趣区域的对象检测方法及装置

Publications (2)

Publication Number Publication Date
CN103345738A CN103345738A (zh) 2013-10-09
CN103345738B true CN103345738B (zh) 2016-08-17

Family

ID=49280531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310219546.1A Active CN103345738B (zh) 2013-06-04 2013-06-04 基于感兴趣区域的对象检测方法及装置

Country Status (1)

Country Link
CN (1) CN103345738B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9646389B2 (en) * 2014-08-26 2017-05-09 Qualcomm Incorporated Systems and methods for image scanning
CN105989608B (zh) * 2016-04-25 2019-03-26 北京光年无限科技有限公司 一种面向智能机器人的视觉捕捉方法及装置
CN106326853B (zh) * 2016-08-19 2020-05-15 厦门美图之家科技有限公司 一种人脸跟踪方法及装置
CN109034173A (zh) * 2017-06-08 2018-12-18 北京君正集成电路股份有限公司 目标对象选取方法和装置
CN109165644A (zh) * 2018-07-13 2019-01-08 北京市商汤科技开发有限公司 目标检测方法和装置、电子设备、存储介质、程序产品
CN110798377B (zh) * 2019-10-17 2021-07-16 东软集团股份有限公司 监测图像的发送方法、装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1904940A (zh) * 2005-07-28 2007-01-31 汤姆森许可贸易公司 用于产生缩减尺寸的图像序列的方法与设备
CN101179671A (zh) * 2006-11-10 2008-05-14 上海奇码数字信息有限公司 图像缩放装置和图像缩放方法
CN101576996A (zh) * 2009-06-05 2009-11-11 腾讯科技(深圳)有限公司 一种实现图像缩放中的处理方法及装置
CN101670713A (zh) * 2008-09-10 2010-03-17 兄弟工业株式会社 打印标签编辑设备
CN102339469A (zh) * 2010-07-21 2012-02-01 腾讯科技(深圳)有限公司 图像处理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7133572B2 (en) * 2002-10-02 2006-11-07 Siemens Corporate Research, Inc. Fast two dimensional object localization based on oriented edges

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1904940A (zh) * 2005-07-28 2007-01-31 汤姆森许可贸易公司 用于产生缩减尺寸的图像序列的方法与设备
CN101179671A (zh) * 2006-11-10 2008-05-14 上海奇码数字信息有限公司 图像缩放装置和图像缩放方法
CN101670713A (zh) * 2008-09-10 2010-03-17 兄弟工业株式会社 打印标签编辑设备
CN101576996A (zh) * 2009-06-05 2009-11-11 腾讯科技(深圳)有限公司 一种实现图像缩放中的处理方法及装置
CN102339469A (zh) * 2010-07-21 2012-02-01 腾讯科技(深圳)有限公司 图像处理方法和装置

Also Published As

Publication number Publication date
CN103345738A (zh) 2013-10-09

Similar Documents

Publication Publication Date Title
CN109118542B (zh) 激光雷达与相机之间的标定方法、装置、设备及存储介质
CN103345738B (zh) 基于感兴趣区域的对象检测方法及装置
CN111309618B (zh) 页面元素定位方法、页面测试方法及相关装置
CN111899237B (zh) 标尺精度测量方法、装置、计算机设备和存储介质
US8965051B2 (en) Method and apparatus for providing hand detection
US10679094B2 (en) Automatic ruler detection
CN110619807B (zh) 生成全局热力图的方法和装置
CN108156452B (zh) 一种检测传感器的方法、装置、设备及存储介质
CN116797590B (zh) 一种基于机器视觉的Mura缺陷检测方法及系统
WO2013175389A2 (en) Methods circuits apparatuses systems and associated computer executable code for providing projection based human machine interfaces
CN111079730A (zh) 一种在界面图中确定样图所在区域的方法和电子设备
CN116958145A (zh) 图像处理方法、装置、视觉检测系统及电子设备
CN116109572A (zh) 工件边缘微弱缺陷的检测方法、装置及电子设备
CN115063473A (zh) 物体高度的检测方法、装置、计算机设备、存储介质
CN110633759A (zh) 图像融合方法、装置及电子设备
Liu et al. Automated building change detection using UltraCamD images and existing CAD data
CN111259702A (zh) 一种用户兴趣的估计方法及装置
CN113255389B (zh) 图像的识别方法、装置、电子设备以及存储介质
CN111242187B (zh) 一种图像相似度处理方法、装置、介质和电子设备
KR101768913B1 (ko) 지리 정보 데이터 분할 방법, 분할 장치 및 이를 수행하는 프로그램을 기록하는 기록매체
CN114066980A (zh) 对象检测方法、装置、电子设备及自动驾驶车辆
CN113268307A (zh) 页面组件显示方法、装置、设备及存储介质
CN118135552B (zh) 识别无标签商品信息方法、装置、设备及存储介质
CN107742275B (zh) 一种信息处理方法及电子设备
CN117974576A (zh) 图像质量检测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant