CN116630806A - 目标尺寸下对象检测方法、装置、计算机设备、存储介质 - Google Patents
目标尺寸下对象检测方法、装置、计算机设备、存储介质 Download PDFInfo
- Publication number
- CN116630806A CN116630806A CN202310624212.6A CN202310624212A CN116630806A CN 116630806 A CN116630806 A CN 116630806A CN 202310624212 A CN202310624212 A CN 202310624212A CN 116630806 A CN116630806 A CN 116630806A
- Authority
- CN
- China
- Prior art keywords
- target
- pixel area
- target object
- size
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 claims abstract description 38
- 239000013598 vector Substances 0.000 claims description 31
- 230000015654 memory Effects 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002893 slag Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Optical Radar Systems And Details Thereof (AREA)
Abstract
本公开涉及计算机技术领域,公开了一种目标尺寸下对象检测方法、装置、计算机设备及存储介质,该方法包括:确定待检测的目标尺寸;根据目标尺寸获取像素面积为目标数值且像素面积垂直于目标框的目标对象,其中,像素面积是由目标尺寸确定的,目标框为选定目标对象时的外部轮廓;获取目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定目标对象在中心点深度值下的第一像素面积;根据第一像素面积和目标框内的第二像素面积,确定目标对象的实际尺寸与目标尺寸之间的包含关系,得到对目标对象的检测结果。本公开解决当前对一些特定尺寸的物体检测时还没有一个完整可靠的对象检测方案的问题。
Description
技术领域
本公开涉及计算机技术领域,具体涉及目标尺寸下对象检测方法、装置、计算机设备及存储介质。
背景技术
目标检测任务会在图像中定位感兴趣的物体并用矩形框标记出来。在目标检测任务中也许会遇到特殊的检测需求,如检测特定尺寸的物体。比如当前需求是只想要检测边长大于50厘米的盒子,或自动驾驶中,识别两种同样外观的车辆但不同体积的车。
这时现有的固定尺寸物体检测技术是固定摄像头在平面正上方进行检测,这时只需要判断物体在图像中的像素大小即可区分特定尺寸物体,该技术可以应用在快递传送带上根据快递体积自动分拣。根据像素大小确定特定尺寸物体时,如果特定尺寸物体不再一个平面上,这时通过摄像头在平面上方进行检测的方式将不再适用。
针对上述问题,相关技术用到RGB-D相机或者激光雷达技术实现图像中待检测对象的识别,但是这些都仅是识别出待检测对象,当前对一些特定尺寸的物体检测时还没有一个完整可靠的对象检测方案。
发明内容
有鉴于此,本公开提供了一种目标尺寸下对象检测方法、装置、计算机设备及存储介质,以解决当前对一些特定尺寸的物体检测时还没有一个完整可靠的对象检测方案的问题。
第一方面,本公开提供了一种目标尺寸下对象检测方法,该方法包括:
确定待检测的目标尺寸;
根据所述目标尺寸获取像素面积为目标数值且所述像素面积垂直于目标框的目标对象,其中,所述像素面积是由所述目标尺寸确定的,所述目标框为选定所述目标对象时的外部轮廓;
获取所述目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定所述目标对象在中心点深度值下的第一像素面积;
根据所述第一像素面积和所述目标框内的第二像素面积,确定所述目标对象的实际尺寸与所述目标尺寸之间的包含关系,得到对所述目标对象的检测结果。
在本公开实施例中,根据目标尺寸获取像素面积为目标数值且像素面积垂直于目标框的目标对象,然后获取到目标对象的图像像素空间横坐标和图像像素空间纵坐标,得到目标对象在中心点深度值下的第一像素面积,再基于第一像素面积和目标框内的第二像素面积得到目标对象的实际尺寸与目标尺寸之间的包含关系,进而确定目标对象的检测结果。这样本公开实施例实现了对设定好的特定尺寸下的目标对象的检测,确定出目标对象的检测结果,适用于特征相同但尺寸不同的物体检测领域,对目标对象的检测效果高,且计算简单,解决了现有技术中对一些特定尺寸的物体检测时还没有一个完整可靠的对象检测方案的问题。
在一种可选的实施方式中,根据所述目标尺寸获取像素面积为目标数值且所述像素面积垂直于目标框的目标对象,包括:
获取所述目标框内的任意三个激光雷达点云坐标;
根据所述激光雷达点云坐标生成两组向量;
根据所述两组向量和夹角计算公式,确定夹角为预设角度时对应的两组目标向量;
根据所述目标向量得到所述像素面积垂直于所述目标框的所述目标对象。
在本公开实施例中,根据三点共面的特性得到两组向量,然后拟合出被检测的候选对象的倾斜角,调整到像素面积垂直于目标框的目标对象,这样目标对象的像素面积将是最可靠,横截面积最大的,进而为后续得到准确的检测结果提供基础。
在一种可选的实施方式中,获取所述目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定所述目标对象在中心点深度值下的第一像素面积,包括:
利用激光雷达点云数据投影到所述目标对象的图像像素坐标上,获取所述目标对象的图像像素空间横坐标和图像像素空间纵坐标;
根据所述图像像素空间横坐标和所述图像像素空间纵坐标,确定所述目标对象的目标图像像素;
根据所述目标图像像素,确定所述目标对象的所述第一像素面积。
在一种可选的实施方式中,根据所述图像像素空间横坐标和所述图像像素空间纵坐标,确定所述目标对象的目标图像像素,包括:
根据所述图像像素空间横坐标和所述图像像素空间纵坐标,生成去噪约束条件;
根据所述去噪约束条件对所述目标对象的图像像素进行预处理,去除有效识别范围之外的像素,得到所述目标图像像素。
在本公开实施例中,通过生成去噪约束条件对目标对象的图像像素进行预处理,得到去除了无用像素之后的目标图像像素,提高检测精度。
在一种可选的实施方式中,根据所述目标图像像素,确定所述目标对象的所述第一像素面积,包括:
根据所述目标图像像素,获取所述目标对象的中心点深度值;
根据所述中心点深度值和目标拟合多项式,确定所述第一像素面积。
在本公开实施例中,利用目标对象的中心点深度值与目标拟合多项式相结合的方式确定出第一像素面积,实现了中心点深度值与第一像素面积之间的对应关系,便于快速获取第一像素面积。
在一种可选的实施方式中,在所述根据所述中心点深度值和目标拟合多项式,确定所述第一像素面积之前,所述方法还包括:
获取历史中心点深度值;
调整初始拟合多项式中的函数阶数,得到由不同函数阶数组成的初始拟合多项式;
将所述历史中心点深度值分别输入包含不同函数阶数的初始拟合多项式内,确定出超参数;
根据所述超参数得到所述目标拟合多项式。
在本公开实施例中,采用调整初始拟合多项式的函数阶数的方式确定初始拟合多项式中的超参数,进而得到目标拟合多项式,这种方法仅需要较少的计算资源即可实现,节省计算资源。
在一种可选的实施方式中,根据所述第一像素面积和所述目标框内的第二像素面积,确定所述目标对象的实际尺寸与所述目标尺寸之间的包含关系,得到对所述目标对象的检测结果,包括:
在所述第二像素面积大于所述第一像素面积的情况下,确定所述实际尺寸包含所述目标尺寸,得到所述目标对象的所述检测结果为第一体积物体;
或者,
在所述第二像素面积小于或者等于所述第一像素面积的情况下,确定所述目标尺寸包含所述实际尺寸,得到所述目标对象的所述检测结果为第二体积物体。
在本公开实施例中,根据目标尺寸的第一像素面积和目标框内的第二像素面积之间的比较情况,得到目标尺寸和目标对象的实际尺寸之间的包含关系,进而确定目标对象的体积,实现对特定的目标尺寸下的对象的精准检测。
第二方面,本公开提供了一种目标尺寸下对象检测装置,该装置包括:
第一确定模块,用于确定待检测的目标尺寸;
第一获取模块,用于根据所述目标尺寸获取像素面积为目标数值且所述像素面积垂直于目标框的目标对象,其中,所述像素面积是由所述目标尺寸确定的,所述目标框为选定所述目标对象时的外部轮廓;
第二确定模块,用于获取所述目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定所述目标对象在中心点深度值下的第一像素面积;
第三确定模块,用于根据所述第一像素面积和所述目标框内的第二像素面积,确定所述目标对象的实际尺寸与所述目标尺寸之间的包含关系,得到对所述目标对象的检测结果。
第三方面,本公开提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的方法。
第四方面,本公开提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的方法。
附图说明
为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本公开实施例的目标尺寸下对象检测方法的流程示意图;
图2是根据本公开实施例的目标尺寸下对象检测过程中标定部分流程示意图;
图3是根据本公开实施例的目标尺寸下对象检测过程中检测部分流程示意图;
图4是根据本公开实施例的目标尺寸下对象检测装置的结构框图;
图5是本公开实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
在目标检测任务中也许会遇到特殊的检测需求,如检测特定尺寸的物体,这时相关技术会用到RGB-D相机或者激光雷达技术实现图像中待检测对象的识别,但是这些都仅是识别出待检测对象,当前对一些特定尺寸的物体检测时还没有一个完整可靠的对象检测方案。为了解决上述问题,根据本公开实施例,提供了一种目标尺寸下对象检测方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种目标尺寸下对象检测方法,图1是根据本公开实施例的目标尺寸下对象检测方法的流程图,如图1所示,该方法可以应用于服务器侧,该方法可以包括如下步骤:
步骤S101,确定待检测的目标尺寸。
可选地,在本公开实施例中,主要是针对特征相同但尺寸不同的物体检测。这时,需设定好待检测的目标尺寸,比如目标尺寸为50cm的炉渣。
步骤S102,根据目标尺寸获取像素面积为目标数值且像素面积垂直于目标框的目标对象,其中,像素面积是由目标尺寸确定的,目标框为选定目标对象时的外部轮廓。
可选地,在目标尺寸为50cm时,这时对应的像素面积就是目标数值为50×50=2500cm2。将像素面积为目标数值同时像素面积垂直于目标框的对象作为目标对象。需要说明的是,目标框为在识别到或者检测到目标对象时框出的外部轮廓,比如用YOLO算法结合相机或摄像头检测出目标对象。
另外,目标对象的个数可以是多个,本公开实施例为了便于描述检测过程,以任一目标对象作为描述对象展开说明,对于其他目标对象也是采用相同的方式进行检测。
步骤S103,获取目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定目标对象在中心点深度值下的第一像素面积。
可选地,在本公开实施例中,可利用激光雷达点云技术将点云数据映射到目标对象的图像像素上,得到像素坐标,即图像像素空间横坐标和图像像素空间纵坐标。
再基于像素坐标获取目标对象的中心点深度值以及与该中心点深度值相对应的像素面积,可称为第一像素面积。
步骤S104,根据第一像素面积和目标框内的第二像素面积,确定目标对象的实际尺寸与目标尺寸之间的包含关系,得到对目标对象的检测结果。
可选地,根据目标框的框选情况得到像素面积,称为第二像素面积,该第二像素面积应为目标对象的实际尺寸,然后将第一像素面积和第二像素面积进行比较,确定出目标对象的实际尺寸与目标尺寸,比如实际尺寸与50cm之间的包含关系,该包含关系实际就是实际尺寸与目标尺寸之间的大小关系,比如实际尺寸大于目标尺寸,则实际尺寸就包含了目标尺寸;实际尺寸小于或者等于目标尺寸,则目标尺寸就包含了实际尺寸,然后根据上述包含关系即可得到目标对象的检测结果。可以了解的是,该检测结果通常是目标对象是大体积物体还是小体积物体等。
在本公开实施例中,根据目标尺寸获取像素面积为目标数值且像素面积垂直于目标框的目标对象,然后获取到目标对象的图像像素空间横坐标和图像像素空间纵坐标,得到目标对象在中心点深度值下的第一像素面积,再基于第一像素面积和目标框内的第二像素面积得到目标对象的实际尺寸与目标尺寸之间的包含关系,进而确定目标对象的检测结果。这样本公开实施例实现了对设定好的特定尺寸下的目标对象的检测,确定出目标对象的检测结果,适用于特征相同但尺寸不同的物体检测领域,对目标对象的检测效果高,且计算简单,解决了现有技术中对一些特定尺寸的物体检测时还没有一个完整可靠的对象检测方案的问题。
在一些可选的实施方式中,根据目标尺寸获取像素面积为目标数值且像素面积垂直于目标框的目标对象,包括:
获取目标框内的任意三个激光雷达点云坐标;
根据激光雷达点云坐标生成两组向量;
根据两组向量和夹角计算公式,确定夹角为预设角度时对应的两组目标向量;
根据目标向量得到像素面积垂直于目标框的目标对象。
可选地,本公开实施例利用三点共面的特性拟合出被检测对象的倾斜角。进一步地,为了得到垂直于目标框的目标对象,需要获取目标框内的任意三个激光雷达点云坐标,利用三个点云坐标生成两组向量,根据两组向量和夹角计算公式可以得到当前的倾斜角度,比如假设m,n是三个点所得到的两组向量,它们的夹角为<m,n>。
由向量公式:
若向量用坐标表示,m=(x1,y1,z1),n=(x2,y2,z2),则m·n=(x1x2+y1y2+z1z2);
将这些代入向量公式:
夹角∈[0,π]
由向量m和向量n即可得到公式(1)右面等式的数值,然后由于预设角度为90°,这时cos90°=0,查看右边等式是否等于0即可,若不等于,则一直调整目标对象的角度,直到由向量m和向量n得到的公式(1)的数值等于0,将当前的向量作为两组目标向量,此时的像素面积是垂直于目标框的。
在本公开实施例中,根据三点共面的特性得到两组向量,然后拟合出被检测的候选对象的倾斜角,调整到像素面积垂直于目标框的目标对象,这样目标对象的像素面积将是最可靠,横截面积最大的,进而为后续得到准确的检测结果提供基础。
在一些可选的实施方式中,获取目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定目标对象在中心点深度值下的第一像素面积,包括:
利用激光雷达点云数据投影到目标对象的图像像素坐标上,获取目标对象的图像像素空间横坐标和图像像素空间纵坐标;
根据图像像素空间横坐标和图像像素空间纵坐标,确定目标对象的目标图像像素;
根据目标图像像素,确定目标对象的第一像素面积。
可选地,首先把激光雷达点云数据投影到标对象的图像像素坐标上,投影公式如公式(2):
其中,(xL,yL,zL)为激光雷达点云的空间坐标,(uL,vL)为激光雷达投影到图像成像平面的像素坐标,K∈R3×3,K为摄像头相机的内部参数矩阵,zc为激光雷达点云相对于激光雷达坐标系的空间坐标通过平移和旋转变换后相对于相机空间坐标系的相对坐标的高度,RL∈R3×3,RL为激光雷达空间坐标系和相机空间坐标系的相对角度偏差矩阵,tL∈R3×3,tL为激光雷达空间坐标系和相机空间坐标系的相对位置偏差矩阵。
由上述公式(2)得到uL目标对象的图像像素空间横坐标,vL目标对象的图像像素空间纵坐标。在确定了(uL,vL)后确定目标对象的目标图像像素,再根据目标图像像素得到目标对象的中心点深度值,可以根据中心线深度值与图像像素面积之间的映射关系等对应关系,得到目标对象的第一像素面积。
在一些可选的实施方式中,根据图像像素空间横坐标和图像像素空间纵坐标,确定目标对象的目标图像像素,包括:
根据图像像素空间横坐标和图像像素空间纵坐标,生成去噪约束条件;
根据去噪约束条件对目标对象的图像像素进行预处理,去除有效识别范围之外的像素,得到目标图像像素。
可选地,在本公开实施例中,根据图像像素空间横坐标和图像像素空间纵坐标得到对激光雷达点云数据去噪约束条件,如公式(3):
其中,uLmin,uLmax是图像像素空间横坐标对激光雷达点云限制的最大、最小范围;vLmin,vLmax是图像像素空间纵坐标对激光雷达点云限制的最大、最小范围。
根据公式(3)对目标对象的图像像素进行预处理,去除有效识别范围之外的像素,得到目标图像像素。其中,有效识别范围是指把激光雷达投射到像素坐标后,在相机视野内的为有效点云数据,有效点云数据组成的范围即为有效识别范围。
在本公开实施例中,通过生成去噪约束条件对目标对象的图像像素进行预处理,得到去除了无用像素之后的目标图像像素,提高检测精度。
在一些可选的实施方式中,根据目标图像像素,确定目标对象的第一像素面积,包括:
根据目标图像像素,获取目标对象的中心点深度值;
根据中心点深度值和目标拟合多项式,确定第一像素面积。
可选地,图像中像素点占得的位数就是图像的深度值,所以在确定目标图像像素后,根据目标图像像素的像素点所占位数即可确定目标对象的中心点深度值。
在本公开实施例中,可以用最小二乘法拟合(多项式拟合)去记录像素面积和对应的深度值。
如使用二阶函数,则对应的目标拟合多项式为:y=ax2+x+c;
其中,x是一组深度值,y是对应的像素面积,a,b,c为超参数。
所以将中心点深度值代入到目标拟合多项式,就可以得到第一像素面积。
在本公开实施例中,利用目标对象的中心点深度值与目标拟合多项式相结合的方式确定出第一像素面积,实现了中心点深度值与第一像素面积之间的对应关系,便于快速获取第一像素面积。
在一些可选的实施方式中,在根据中心点深度值和目标拟合多项式,确定第一像素面积之前,方法还包括:
获取历史中心点深度值;
调整初始拟合多项式中的函数阶数,得到由不同函数阶数组成的初始拟合多项式;
将历史中心点深度值分别输入包含不同函数阶数的初始拟合多项式内,确定出超参数;
根据超参数得到目标拟合多项式。
可选地,在将中心点深度值结合目标拟合多项式得到第一像素面积之前,需要先确定目标拟合多项式的具体公式,此时,为了得到更好的拟合结果,这时会通过不断调整函数阶数,比如将初始拟合多项式中的阶数由平方改成三次方、四次方等,使用更高阶函数求得对应超参数即可确定出目标拟合多项式。
具体地,获取历史中心点深度值,分别代入由不同函数阶数组成的初始拟合多项式中,根据求得的y值确定拟合效果最好时对应的超参数a,b,c。然后就将当前由超参数a,b,c构成的拟合多项式作为目标拟合多项式。
在本公开实施例中,采用调整初始拟合多项式的函数阶数的方式确定初始拟合多项式中的超参数,进而得到目标拟合多项式,这种方法仅需要较少的计算资源即可实现,节省计算资源。
在一些可选的实施方式中,根据第一像素面积和目标框内的第二像素面积,确定目标对象的实际尺寸与目标尺寸之间的包含关系,得到对目标对象的检测结果,包括:
在第二像素面积大于第一像素面积的情况下,确定实际尺寸包含目标尺寸,得到目标对象的检测结果为第一体积物体;
或者,
在第二像素面积小于或者等于第一像素面积的情况下,确定目标尺寸包含实际尺寸,得到目标对象的检测结果为第二体积物体。
可选地,将其中一个目标框内的中心点深度值代入目标拟合多项式中,求得目标对象在该中心深度值下的像素面积s1(即第一像素面积)。
获取目标框内的实际像素面积s2(即第二像素面积)。然后比较第一像素面积和第二像素面积之间的大小,若第二像素面积大于第一像素面积,则认为目标对象体积为大块物体,若第二像素面积小于或者等于第一像素面积,则认为目标对象体积为小块物体。
在本公开实施例中,根据目标尺寸的第一像素面积和目标框内的第二像素面积之间的比较情况,得到目标尺寸和目标对象的实际尺寸之间的包含关系,进而确定目标对象的体积,实现对特定的目标尺寸下的对象的精准检测。
在一些可选的实施方式中,本公开实施例可以将在目标尺寸下对象检测过程分为两部分:标定部分和检测部分。
标定部分的流程,如图2所示:
激活摄像头(比如单目摄像头)和激光雷达;
在检测范围内均匀采集由目标尺寸确定的像素面积为目标数值且像素面积垂直于目标框的目标对象,得到目标对象的图像像素和中心点深度值;
利用最小二乘法拟合图像像素和中心点深度值,得到超参数;
根据超参数,生成目标拟合多项式。
检测部分的流程,如图3所示:
激活摄像头(比如单目摄像头)和激光雷达;
在RGB图像上进行目标检测,得到目标框;
在目标框内找两个点进行平面拟合计算该目标对象倾角:利用三点共面的特性拟合出被检测目标对象的倾斜角;
再调整到垂直于相机的角度进行检测,得到较可靠的最大像素面积;
将激光雷达点云数据投影到图像像素坐标,得到目标框中心点深度值;
将其中一个目标框内的中心点深度值代入目标拟合多项式,求得目标对象在该中心点深度值下的像素面积s1;
获取该目标框的实际像素面积s2;
若s2>s1,则该目标对象为大块物体;若s2≤s1,则该目标对象为小块物体。
在本实施例中还提供了一种目标尺寸下对象检测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种目标尺寸下对象检测装置,如图4所示,包括:
第一确定模块401,用于确定待检测的目标尺寸;
第一获取模块402,用于根据目标尺寸获取像素面积为目标数值且像素面积垂直于目标框的目标对象,其中,像素面积是由目标尺寸确定的,目标框为选定目标对象时的外部轮廓;
第二确定模块403,用于获取目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定目标对象在中心点深度值下的第一像素面积;
第三确定模块404,用于根据第一像素面积和目标框内的第二像素面积,确定目标对象的实际尺寸与目标尺寸之间的包含关系,得到对目标对象的检测结果。
在一些可选的实施方式中,第一获取模块402包括:
第一获取单元,用于获取目标框内的任意三个激光雷达点云坐标;
生成单元,用于根据激光雷达点云坐标生成两组向量;
第一确定单元,用于根据两组向量和夹角计算公式,确定夹角为预设角度时对应的两组目标向量;
得到单元,用于根据目标向量得到像素面积垂直于目标框的目标对象。
在一些可选的实施方式中,第二确定模块403包括:
第二获取单元,用于利用激光雷达点云数据投影到目标对象的图像像素坐标上,获取目标对象的图像像素空间横坐标和图像像素空间纵坐标;
第二确定单元,用于根据图像像素空间横坐标和图像像素空间纵坐标,确定目标对象的目标图像像素;
第三确定单元,用于根据目标图像像素,确定目标对象的第一像素面积。
在一些可选的实施方式中,第二确定单元包括:
生成子模块,用于根据图像像素空间横坐标和图像像素空间纵坐标,生成去噪约束条件;
去除子模块,用于根据去噪约束条件对目标对象的图像像素进行预处理,去除有效识别范围之外的像素,得到目标图像像素。
在一些可选的实施方式中,第三确定单元包括:
获取子模块,用于根据目标图像像素,获取目标对象的中心点深度值;
确定子模块,用于根据中心点深度值和目标拟合多项式,确定第一像素面积。
在一些可选的实施方式中,该装置还包括:
第二获取模块,用于在根据中心点深度值和目标拟合多项式,确定第一像素面积之前,获取历史中心点深度值;
调整模块,用于调整初始拟合多项式中的函数阶数,得到由不同函数阶数组成的初始拟合多项式;
第四确定模块,用于将历史中心点深度值分别输入包含不同函数阶数的初始拟合多项式内,确定出超参数;
得到模块,用于根据超参数得到目标拟合多项式。
在一些可选的实施方式中,第三确定模块404包括:
第四确定单元,用于在第二像素面积大于第一像素面积的情况下,确定实际尺寸包含目标尺寸,得到目标对象的检测结果为第一体积物体;
或者,
第五确定单元,用于在第二像素面积小于或者等于第一像素面积的情况下,确定目标尺寸包含实际尺寸,得到目标对象的检测结果为第二体积物体。
本实施例中的目标尺寸下对象检测装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本公开实施例还提供一种计算机设备,具有上述图4所示的目标尺寸下对象检测装置。
请参阅图5,图5是本公开可选实施例提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据一种小程序落地页的展现的计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
本公开实施例还提供了一种计算机可读存储介质,上述根据本公开实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本公开的实施例,但是本领域技术人员可以在不脱离本公开的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种目标尺寸下对象检测方法,其特征在于,所述方法包括:
确定待检测的目标尺寸;
根据所述目标尺寸获取像素面积为目标数值且所述像素面积垂直于目标框的目标对象,其中,所述像素面积是由所述目标尺寸确定的,所述目标框为选定所述目标对象时的外部轮廓;
获取所述目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定所述目标对象在中心点深度值下的第一像素面积;
根据所述第一像素面积和所述目标框内的第二像素面积,确定所述目标对象的实际尺寸与所述目标尺寸之间的包含关系,得到对所述目标对象的检测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标尺寸获取像素面积为目标数值且所述像素面积垂直于目标框的目标对象,包括:
获取所述目标框内的任意三个激光雷达点云坐标;
根据所述激光雷达点云坐标生成两组向量;
根据所述两组向量和夹角计算公式,确定夹角为预设角度时对应的两组目标向量;
根据所述目标向量得到所述像素面积垂直于所述目标框的所述目标对象。
3.根据权利要求1所述的方法,其特征在于,所述获取所述目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定所述目标对象在中心点深度值下的第一像素面积,包括:
利用激光雷达点云数据投影到所述目标对象的图像像素坐标上,获取所述目标对象的图像像素空间横坐标和图像像素空间纵坐标;
根据所述图像像素空间横坐标和所述图像像素空间纵坐标,确定所述目标对象的目标图像像素;
根据所述目标图像像素,确定所述目标对象的所述第一像素面积。
4.根据权利要求3所述的方法,其特征在于,所述根据所述图像像素空间横坐标和所述图像像素空间纵坐标,确定所述目标对象的目标图像像素,包括:
根据所述图像像素空间横坐标和所述图像像素空间纵坐标,生成去噪约束条件;
根据所述去噪约束条件对所述目标对象的图像像素进行预处理,去除有效识别范围之外的像素,得到所述目标图像像素。
5.根据权利要求3所述的方法,其特征在于,所述根据所述目标图像像素,确定所述目标对象的所述第一像素面积,包括:
根据所述目标图像像素,获取所述目标对象的中心点深度值;
根据所述中心点深度值和目标拟合多项式,确定所述第一像素面积。
6.根据权利要求5所述的方法,其特征在于,在所述根据所述中心点深度值和目标拟合多项式,确定所述第一像素面积之前,所述方法还包括:
获取历史中心点深度值;
调整初始拟合多项式中的函数阶数,得到由不同函数阶数组成的初始拟合多项式;
将所述历史中心点深度值分别输入包含不同函数阶数的初始拟合多项式内,确定出超参数;
根据所述超参数得到所述目标拟合多项式。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述第一像素面积和所述目标框内的第二像素面积,确定所述目标对象的实际尺寸与所述目标尺寸之间的包含关系,得到对所述目标对象的检测结果,包括:
在所述第二像素面积大于所述第一像素面积的情况下,确定所述实际尺寸包含所述目标尺寸,得到所述目标对象的所述检测结果为第一体积物体;
或者,
在所述第二像素面积小于或者等于所述第一像素面积的情况下,确定所述目标尺寸包含所述实际尺寸,得到所述目标对象的所述检测结果为第二体积物体。
8.一种目标尺寸下对象检测装置,其特征在于,所述装置包括:
第一确定模块,用于确定待检测的目标尺寸;
第一获取模块,用于根据所述目标尺寸获取像素面积为目标数值且所述像素面积垂直于目标框的目标对象,其中,所述像素面积是由所述目标尺寸确定的,所述目标框为选定所述目标对象时的外部轮廓;
第二确定模块,用于获取所述目标对象的图像像素空间横坐标和图像像素空间纵坐标,确定所述目标对象在中心点深度值下的第一像素面积;
第三确定模块,用于根据所述第一像素面积和所述目标框内的第二像素面积,确定所述目标对象的实际尺寸与所述目标尺寸之间的包含关系,得到对所述目标对象的检测结果。
9.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310624212.6A CN116630806A (zh) | 2023-05-30 | 2023-05-30 | 目标尺寸下对象检测方法、装置、计算机设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310624212.6A CN116630806A (zh) | 2023-05-30 | 2023-05-30 | 目标尺寸下对象检测方法、装置、计算机设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116630806A true CN116630806A (zh) | 2023-08-22 |
Family
ID=87613063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310624212.6A Pending CN116630806A (zh) | 2023-05-30 | 2023-05-30 | 目标尺寸下对象检测方法、装置、计算机设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116630806A (zh) |
-
2023
- 2023-05-30 CN CN202310624212.6A patent/CN116630806A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109737874B (zh) | 基于三维视觉技术的物体尺寸测量方法及装置 | |
CN110717942B (zh) | 图像处理方法和装置、电子设备、计算机可读存储介质 | |
JP5580164B2 (ja) | 光学情報処理装置、光学情報処理方法、光学情報処理システム、光学情報処理プログラム | |
JP5538617B2 (ja) | 複数カメラのキャリブレーション用の方法および構成 | |
CN109801333B (zh) | 体积测量方法、装置、系统及计算设备 | |
CN108381549B (zh) | 一种双目视觉引导机器人快速抓取方法、装置及存储介质 | |
CN109658454B (zh) | 一种位姿信息确定方法、相关装置及存储介质 | |
CN116433737A (zh) | 一种激光雷达点云与图像配准的方法、装置及智能终端 | |
US11880993B2 (en) | Image processing device, driving assistance system, image processing method, and program | |
CN112883955A (zh) | 货架布局检测方法、装置及计算机可读存储介质 | |
CN112802114A (zh) | 多视觉传感器融合装置及其方法和电子设备 | |
CN114821497A (zh) | 目标物位置的确定方法、装置、设备及存储介质 | |
EP3629292A1 (en) | Reference point selection for extrinsic parameter calibration | |
CN117848234A (zh) | 物体扫描机构、方法及相关设备 | |
CN113658279A (zh) | 相机内参和外参估算方法、装置、计算机设备及存储介质 | |
CN112668505A (zh) | 基于路侧相机的外参的三维感知信息获取方法和路侧设备 | |
CN111489384B (zh) | 基于互视角的遮挡评估方法及装置、设备、系统和介质 | |
CN114792343B (zh) | 图像获取设备的标定方法、获取图像数据的方法、装置 | |
CN116630806A (zh) | 目标尺寸下对象检测方法、装置、计算机设备、存储介质 | |
CN111630569A (zh) | 双目匹配的方法、视觉成像装置及具有存储功能的装置 | |
Stentoumis et al. | Implementing an adaptive approach for dense stereo-matching | |
CN115731256A (zh) | 一种顶点坐标的检测方法、装置、设备及存储介质 | |
CN109598677B (zh) | 一种三维图像拼接方法、装置、设备及可读存储介质 | |
CN113450335A (zh) | 一种路沿检测方法、路沿检测装置及路面施工车辆 | |
Uyanik et al. | A method for determining 3D surface points of objects by a single camera and rotary stage |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |