CN114119733A - 物体空间位置检测方法、装置、计算机设备及其存储介质 - Google Patents
物体空间位置检测方法、装置、计算机设备及其存储介质 Download PDFInfo
- Publication number
- CN114119733A CN114119733A CN202210097279.4A CN202210097279A CN114119733A CN 114119733 A CN114119733 A CN 114119733A CN 202210097279 A CN202210097279 A CN 202210097279A CN 114119733 A CN114119733 A CN 114119733A
- Authority
- CN
- China
- Prior art keywords
- irregular polygon
- image
- detection model
- vertex coordinates
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及图像处理技术领域,具体而言,涉及一种物体空间位置检测方法、装置、计算机设备及其存储介质;法包括:获取采集的图像;标记目标物体;采用目标检测模型识别所述图像中的空间信息,得到用于指示空间信息的不规则多边形预测框;在所述图像中展示所述不规则多边形预测框;根据所述不规则多边形预测框判断目标物体的空间位置;本申请实施例提供的技术方案中,通过构建无规则矩形预测框,获得无规则矩形预测框的个顶点坐标的极值,通过极值的比较,实现了物体所在空间信息的确定,从而增强了对于被检测物体的确认的准确度。
Description
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种物体空间位置检测方法、装置、计算机设备及其存储介质。
背景技术
目前城市化管理中,针对于占道经营以及人行道占道物体的清理属于较为重要的管理措施。
基于计算机技术的发展,目前针对于物体的识别不需要大量的人力进行处理,现有技术中多采用物体识别的计算机技术对于占道物体进行识别,并且通过警报的方式通知就近的城市管理人员。
目前采用的计算机识别技术多为语义分割技术来实现。语义分割主要是对整个场景进行语义分割,同时进行物体检测。利用预定义的逻辑关系,排除错误。例如,城市井盖不可能出现在天空,若井盖的检测框出现在语义分割图中天空部分,或与之有交集,则判定物体检测模型为误识别。效果较好的语义分割模型,都使用了较高的分辨率,边缘端设备由于性能限制无法使用。同时,由于现阶段语义分割对细小的物体以及物体边沿处的分割效果仍然不够理想,这也限制了它的使用范围。
尤其是针对沿街的商铺,商铺内拜访有较多的物品,在目前的语义分割和检测模型下,容易出现误判,即对室内空间的物体也误判为占道的物体。
发明内容
本申请实施例提供一种物体空间位置检测方法、装置、计算机设备及其存储介质,以通过构建不规则矩形预测框,通过语义分割的手段实现对于被检测物体处于室内室外位置的确定,提高了检测的准确性。
为了达到上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种物体空间位置检测方法,该方法包括:获取采集的图像;标记目标物体;采用目标检测模型识别所述图像中的空间信息,得到用于指示空间信息的不规则多边形预测框;在所述图像中展示所述不规则多边形预测框;根据所述不规则多边形预测框判断目标物体的空间位置。
进一步地,采用目标检测模型识别所述图像中的室内空间信息,得到用于指示空间信息的不规则多边形预测框,包括:基于得到采集的图像中的热图;将热图输入至所述目标检测模型,得到室内空间的中心点;基于预测得到的中心点得到用于指示空间信息的不规则外接矩形框;采用目标检测模型在所述外接矩形框范围内,回归不规则多边形预测框,得到不规则多边形预测框的顶点坐标。
进一步地,采用目标检测模型在所述外接矩形框范围内,回归不规则多边形预测框,得到不规则多边形预测框的顶点坐标,包括:识别图像中属于空间信息的像素单元;在外接矩形框范围内,回归识别出的像素单元,得到包围像素单元的不规则多边形预测框;确定多边形预测框的顶点坐标。
进一步地,采用不规则多边形预测框判断目标物体的空间位置,包括:
获取各不规则多边形预测框的顶点坐标在x坐标和y坐标的极大值和极小值,获取目标物体所在空间的x坐标和y坐标的极大值和极小值;比较不规则多边形预测框顶点坐标的各极值与目标物体所在空间的各极值。
进一步地,将图像输入所述目标检测模型之前,还包括:将训练样本的图像输入目标检测模型,得到目标检测模型输出的不规则多边形预测框的顶点坐标;根据不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及不规则多边形预测框的顶点坐标和第二参考值之间的差异,调整目标检测模型的模型参数;其中,第一参考值是采用不规则多边形对训练样本的图像中空间信息进行标注时,不规则多边形的顶点坐标值;第二参考值是采用矩形对训练样本的图像中空间信息进行标注时,矩形的参数值。
进一步地,根据不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及外接矩形框的顶点坐标和第二参考值之间的差异,调整目标检测模型的模型参数,包括:获取目标检测模型输出的不规则多边形预测框的顶点坐标和对应的第一预测误差;第一预测误差,指示顶点坐标的预测误差;根据第一参考值和顶点坐标,确定多边形预测框的第一实际误差;根据第一预测误差和所述第一实际误差之差得到第一损失函数值;调整目标检测模型的模型参数,以使第一损失函数值最小化。
进一步地,根据不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及外接矩形框的顶点坐标和第二参考值之间的差异,调整目标检测模型的模型参数,包括:获取目标检测模型输出的外接矩形框的顶点坐标和对应的第二预测误差;第二预测误差,指示参量的预测误差;根据第二参考值和顶点坐标,确定外接矩形框的第二实际误差;根据第二预测误差和第二实际误差之差得到第二损失函数值;调整目标检测模型的模型参数,以使第二损失函数值最小化。
进一步地,获取采集的图像,包括:获取采用鱼眼镜头采集的图像。
第二方面,本申请实施例还提供一种基于物体空间位置检测方法的装置,包括:获取模块,用于获取采集的图像;识别模块,用于采用目标检测模型识别所述图像中的空间信息,得到用于指示空间信息的不规则多边形预测框;展示模块,用于在所述图像中展示所述不规则多边形预测框。
第三方面,本申请实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述的物体空间位置检测方法
第四方面,本申请实施例还提供了一种计算机可读存储介质,存储介质内存储有计算机程序,计算机程序被处理器执行时实现本申请实施例第一方面提供的基于物体空间位置检测方法。
本申请实施例提供的技术方案中,通过构建无规则矩形预测框,获得无规则矩形预测框的个顶点坐标的极值,通过极值的比较,实现了物体所在空间信息的确定,从而增强了对于被检测物体的确认的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图中的方法、系统和/或程序将根据示例性实施例进一步描述。这些示例性实施例将参照图纸进行详细描述。这些示例性实施例是非限制的示例性实施例,其中示例数字在附图的各个视图中代表相似的机构。
图1是根据本申请的一些实施例所示的一种物体空间位置检测方法的流程图。
图2是根据本申请的一些实施例所示的一种基于物体空间位置检测装置的结构示意图;
图3是根据本申请的一些实施例所示的一种基于物体空间位置检测装置的无规则多边形矿结构示意图;
图4是根据本申请的一些实施例所示的物体空间位置检测示意图;
图5是根据本申请的一些实施例所示的现有技术中物体检测示意图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
在下面的详细描述中,通过实例阐述了许多具体细节,以便提供对相关指导的全面了解。然而,对于本领域的技术人员来说,显然可以在没有这些细节的情况下实施本申请。在其他情况下,公知的方法、程序、系统、组成和/或电路已经在一个相对较高水平上被描述,没有细节,以避免不必要的模糊本申请的方面。
本申请中使用流程图说明根据本申请的实施例的系统所执行的执行过程。应当明确理解的是,流程图的执行过程可以不按顺序执行。相反,这些执行过程可以以相反的顺序或同时执行。另外,可以将至少一个其他执行过程添加到流程图。一个或多个执行过程可以从流程图中删除。
本申请提供一些实施例为服务器,该服务器包括物体空间位置检测装置、存储器、处理器和通信单元。存储器、处理器以及通信单元各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。物体空间位置检测装置包括至少一个可以软件或固件(firmware)的形式存储于存储器中或固化在电子设备的操作系统(operating system,OS)中的软件功能模块。处理器用于执行存储器中存储的可执行模块,例如基于色谱分析的样品确定装置所包括的软件功能模块及计算机程序等。
其中,存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行所述程序。通信单元用于通过网络建立样品服务器与查询终端之间的通信连接,并用于通过网络收发数据。
处理器可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP))、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参照图1,是根据本申请的一些实施例所示的一种一种物体空间位置检测方法的流程图,具体可以包括以下步骤S1-步骤S5。在以下步骤S1-步骤S5的基础上,将对一些可选实施例进行说明,这些实施例应当理解为示例,不应理解为实现本方案所必不可少的技术特征。
步骤S1,获取采集的图像。
在申请本实施例中,对物体进行检测时,可以通过设置在道路旁侧的图像获取设备针对待检测对象进行图像拍摄,以根据拍摄图像对物体进行检测。
作为一种可能的实现方式,可以通过安装在道路旁侧的鱼眼镜头拍摄得到待检测位置的图像,以根据采集的图像对物体进行检测。
其中,鱼眼镜头,是一种焦距极短并且视角接近或等于180°的镜头。鱼眼镜头是属于超广角镜头中的一种特殊镜头,它的视角力求达到或超出人眼所能看到的范围。因此,鱼眼镜头与人们眼中的真实世界的景象存在很大的差别。
步骤S2,标记目标物体。
在本申请实施例中,对目标物体即对象进行标记,可以通过对目标物体以及周围空间进行标记,并针对标记结果形成对应的热图,在热图中能够清晰的得到目标物体即待检测物体的具体位置以及周围空间。
步骤S3,采用目标检测模型识别所述图像中的空间信息,得到用于指示空间信息的不规则多边形预测框。
采用目标检测模型在所接矩形框范围内,回归不规则多边形预测框,得到不规则多边形预测框的顶点坐标,包括:识别图像中属于空间信息的像素单元;在外接矩形框范围内,回归识别出的像素单元,得到包围像素单元的不规则多边形预测框;确定多边形预测框的顶点坐标。
步骤S4,在图像中展示所述不规则多边形预测框。
本申请实施例中,将采集的图像输入目标检测模型,得到用于指示被检测物体的不规则多边形预测框后,在图像中展示被检测物体的不规则多边形预测框,以使在判断物体的空间位置过程中能够根据图像中展示的不规则多边形预测框准确的判断被检测物体的所处的空间信息,从而提高了对物体检测的准确性。
作为一种示例,参见图4,在对物体进行检测过程中,现有的车位检测技术检测出来的矩形预测框只能是矩形,而此时“室内”环境却呈平行四边形。矩形框会将大量室外区域当作室内区域。参见图5所示,针对于本实施例提供的一种物体空间位置检测方法,能够使得显示的多边形准确的判断的待检测物体的空间位置,提高了检测结果的准确度。
本申请实施例的物体空间检测方法,通过获取采集的图像,采用目标检测模型识别图像中的物体,得到用于指示待检测物体的不规则多边形预测框,在图像中展示不规则多边形预测框。由于目标检测模型已经经过训练样本图像进行训练,因此,目标检测模型能够根据识别出图像中的物体,得到车位的不规则多边形预测框,使得在检测物体的过程中能够根据物体的不规则多边形预测框准确的判断物体所处的空间位置,避免了现有的检测方法检测出的物体预测框中包含室外空间之外的其他物体。
步骤S5,采用不规则多边形预测框判断目标物体的空间位置,包括:
获取各不规则多边形预测框的顶点坐标在x坐标和y坐标的极大值和极小值,获取目标物体所在空间的x坐标和y坐标的极大值和极小值;比较不规则多边形预测框顶点坐标的各极值与目标物体所在空间的各极值。
空间位置在本实施例中有两种情况,分别为“室内”和“室外”,其中“室内”所指被检测物体处于室内环境中,“室外”所指被检测物体处于室外环境中。
在本实施例中,针对于“室内”和“室外”的判断方法为:
参与图3,物体检测框由N个点构成,则物体检测框的x方向、y方向的极大及极小值分别为:
xmin_object,xmax_object, ymin_object, ymax_object;
在“室内”环境多边形的N个顶点的极值,分别为:
xmin_indoor, xmax_indoor, ymin_indoor, ymax_indoor;
针对被检测物体所处的空间环境,则通过以下的不等式进行确定,当它们之间满足如下关系,则可判定该物体处于室内,否则处于室外:
xmin_object >= xmin_indoor;
xmax_object <= xmax_indoor;
ymin_object >= ymin_indoor;
ymax_object <= ymax_indoor。
针对本实施例提供的一种物体空间检测方法,还另设置有一个步骤:调整目标检测模型。
在本申请实施例中,将训练样本的图像输入目标检测模型,得到目标检测模型输出的所述不规则多边形预测框的顶点坐标;根据不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及所述不规则多边形预测框的顶点坐标和第二参考值之间的差异,调整所述目标检测模型的模型参数;其中,所述第一参考值是采用不规则多边形对所述训练样本的图像中空间信息进行标注时,所述不规则多边形的顶点坐标值;所述第二参考值是采用矩形对所述训练样本的图像中空间信息进行标注时,所述矩形的参数值。
根据不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及外接矩形框的顶点坐标和第二参考值之间的差异,调整目标检测模型的模型参数,包括:获取目标检测模型输出的不规则多边形预测框的顶点坐标和对应的第一预测误差;第一预测误差,指示顶点坐标的预测误差;根据第一参考值和顶点坐标,确定多边形预测框的第一实际误差;根据第一预测误差和所述第一实际误差之差得到第一损失函数值;调整目标检测模型的模型参数,以使第一损失函数值最小化。
进一步地,根据不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及外接矩形框的顶点坐标和第二参考值之间的差异,调整目标检测模型的模型参数,包括:获取目标检测模型输出的外接矩形框的顶点坐标和对应的第二预测误差;第二预测误差,指示参量的预测误差;根据第二参考值和顶点坐标,确定外接矩形框的第二实际误差;根据第二预测误差和第二实际误差之差得到第二损失函数值;调整目标检测模型的模型参数,以使第二损失函数值最小化。
本申请实施例还提供一种物体空间检测装置,用以执行以上方法,请参照图2,是本申请实施例提供的物体空间检测方法的功能模块架构示意图,其包括:
获取模块110、识别模块120以及展示模块130。
获取模块110,用于获取采集的图像。
识别模块120,用于采用目标检测模型识别图像中的车位,得到用于指示车位的不规则多边形预测框。
展示模块130,用于在图像中展示不规则多边形预测框。
作为一种可能的实现方式,识别模块120,包括:
第一输入单元,用于将图像输入目标检测模型,得到物体空间检测的外接矩形框;
回归单元,用于采用目标检测模型在外接矩形框范围内,回归不规则多边形预测框,得到不规则多边形预测框的顶点坐标。
作为另一种可能的实现方式,回归单元,还用于:
识别所述图像中属于被检测物体空间内的像素单元;
在所述外接矩形框范围内,回归识别出的像素单元,得到包围所述像素单元的所述不规则多边形预测框;
确定所述多边形预测框的顶点坐标。
作为另一种可能的实现方式,外接矩形框的参量包括:中心点坐标
作为另一种可能的实现方式,识别模块120,还包括:
第二输入单元,用于将训练样本的图像输入目标检测模型,得到目标检测模型输出的不规则多边形预测框的顶点坐标;
调整单元,用于根据不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及外接矩形框的参量和第二参考值之间的差异,调整目标检测模型的模型参数;其中,第一参考值是采用不规则多边形对训练样本的图像中车位进行标注时,不规则多边形的顶点坐标值;第二参考值是采用矩形对训练样本的图像中车位进行标注时,矩形顶点的参数值。
作为另一种可能的实现方式,调整单元,还用于:
获取目标检测模型输出的不规则多边形预测框的顶点坐标和对应的第一预测误差;其中,第一预测误差,指示顶点坐标的预测误差;根据第一参考值和顶点坐标,确定多边形预测框的第一实际误差;根据第一预测误差和第一实际误差之差得到第一损失函数值;调整目标检测模型的模型参数,以使第一损失函数值最小化。
作为另一种可能的实现方式,调整单元,还用于:
获取目标检测模型输出的外接矩形框的参量和对应的第二预测误差;其中,第二预测误差,指示参量的预测误差;
根据第二参考值和参量,确定外接矩形框的第二实际误差;
根据第二预测误差和第二实际误差之差得到第二损失函数值;
调整目标检测模型的模型参数,以使第二损失函数值最小化。
作为另一种可能的实现方式,获取模块,用于:
获取采用鱼眼镜头采集的图像。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,当计算机程序在计算机上执行时,使得计算机执行本申请实施例提供的物体空间检测装置的检测方法。
需要理解的是,针对上述内容没有进行名词解释的技术术语,本领域技术人员可以根据上述所公开的内容进行前后推导毫无疑义地确定其所指代的含义,例如针对一些阈值、系数等术语,本领域技术人员可以根据前后的逻辑关系进行推导和确定,这些数值的取值范围可以根据实际情况进行选取,例如0.1~1,又例如1~10,再例如50~100,在此均不作限定。
本领域技术人员可以根据上述已公开的内容毫无疑义对一些预设的、基准的、预定的、设定的以及偏好标签的技术特征/技术术语进行确定,例如阈值、阈值区间、阈值范围等。对于一些未作解释的技术特征术语,本领域技术人员完全能够基于前后文的逻辑关系进行合理地、毫无疑义地推导,从而清楚、完整地实施上述技术方案。未作解释的技术特征术语的前缀,例如“第一”、“第二”、“示例”、 “目标”等,可以根据前后文进行毫无疑义地推导和确定。未作解释的技术特征术语的后缀,例如“集合”、“列表”等,也可以根据前后文进行毫无疑义地推导和确定。
本申请实施例公开的上述内容对于本领域技术人员而言是清楚完整的。应当理解,本领域技术人员基于上述公开的内容对未作解释的技术术语进行推导和分析的过程是基于本申请所记载的内容进行的,因此上述内容并不是对整体方案的创造性的评判。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可以对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定术语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同部分两次或多次提到的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的至少一个实施例中的某些特征、结构或特点可以进行适当的组合。
另外,本领域普通技术人员可以理解的是,本申请的各个方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可以被称为“单元”、“组件”或“系统”。此外,本申请的各方面可以表现为位于至少一个计算机可读介质中的计算机产品,所述产品包括计算机可读程序编码。
计算机可读信号介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等等、或合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤缆线、RF、或类似介质、或任何上述介质的组合。
本申请各方面执行所需的计算机程序码可以用一种或多种程序语言的任意组合编写,包括面向对象程序设计,如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET,Python等,或类似的常规程序编程语言,如"C"编程语言,Visual Basic,Fortran2003,Perl,COBOL 2002,PHP,ABAP,动态编程语言如Python,Ruby和Groovy或其它编程语言。所述程式设计编码可以完全在用户计算机上执行、或作为独立的软体包在用户计算机上执行、或部分在用户计算机上执行部分在远程计算机执行、或完全在远程计算机或服务器上执行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网络(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非申请专利范围中明确说明,本申请所述处理元件和序列的顺序、数位字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的申请专利范围并不仅限于披露的实施例,相反,申请专利范围旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件装置实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或行动装置上安装所描述的系统。
同样应当理解的是,为了简化本申请揭示的表述,从而帮助对至少一个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法幷不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
Claims (11)
1.一种物体空间位置检测方法,其特征在于,所述方法包括:
获取采集的图像;
标记目标物体;
采用目标检测模型识别所述图像中的空间信息,得到用于指示空间信息的不规则多边形预测框;
在所述图像中展示所述不规则多边形预测框;
根据所述不规则多边形预测框判断目标物体的空间位置。
2.根据权利要求1所述的物体空间位置检测方法,其特征在于,所述采用目标检测模型识别所述图像中的室内空间信息,得到用于指示空间信息的不规则多边形预测框,包括:
基于得到采集的图像中的热图;将所述热图输入至所述目标检测模型,得到室内空间的中心点;基于预测得到的中心点得到用于指示空间信息的不规则外接矩形框;采用所述目标检测模型在所述外接矩形框范围内,回归不规则多边形预测框,得到所述不规则多边形预测框的顶点坐标。
3.根据权利要求2所述的物体空间位置检测方法,其特征在于,所述采用所述目标检测模型在所述外接矩形框范围内,回归不规则多边形预测框,得到所述不规则多边形预测框的顶点坐标,包括:识别所述图像中属于空间信息的像素单元;在所述外接矩形框范围内,回归识别出的像素单元,得到包围所述像素单元的所述不规则多边形预测框;确定所述多边形预测框的顶点坐标。
4.根据权利要求2所述的物体空间位置检测方法,其特征在于,根据所述不规则多边形预测框判断目标物体的空间位置,包括:
获取各所述不规则多边形预测框的顶点坐标在x坐标和y坐标的极大值和极小值,获取目标物体所在空间的x坐标和y坐标的极大值和极小值;比较所述不规则多边形预测框顶点坐标的各极值与目标与所述目标物体所在空间的各极值。
5.根据权利要求2所述的物体空间位置检测方法,其特征在于,所述将所述热图输入所述目标检测模型之前,还包括:将训练样本的图像输入所述目标检测模型,得到所述目标检测模型输出的所述不规则多边形预测框的顶点坐标;根据所述不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及所述不规则多边形预测框的顶点坐标和第二参考值之间的差异,调整所述目标检测模型的模型参数;其中,所述第一参考值是采用不规则多边形对所述训练样本的图像中空间信息进行标注时,所述不规则多边形的顶点坐标值;所述第二参考值是采用矩形对所述训练样本的图像中空间信息进行标注时,所述矩形的参数值。
6.根据权利要求5所述的物体空间位置检测方法,其特征在于,所述根据所述不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及所述外接矩形框的顶点坐标和第二参考值之间的差异,调整所述目标检测模型的模型参数,包括:获取所述目标检测模型输出的所述不规则多边形预测框的顶点坐标和对应的第一预测误差;所述第一预测误差,所述顶点坐标的预测误差;根据所述第一参考值和所述顶点坐标,确定所述多边形预测框的第一实际误差;根据所述第一预测误差和所述第一实际误差之差得到第一损失函数值;调整所述目标检测模型的模型参数,以使所述第一损失函数值最小化。
7.根据权利要求5所述的物体空间位置检测方法,其特征在于,所述根据所述不规则多边形预测框的顶点坐标和第一参考值之间的差异,以及所述外接矩形框的顶点坐标和第二参考值之间的差异,调整所述目标检测模型的模型参数,包括:获取所述目标检测模型输出的所述外接矩形框的顶点坐标和对应的第二预测误差;所述第二预测误差,为所述顶点坐标的预测误差;根据所述第二参考值和所述顶点坐标,确定所述外接矩形框的第二实际误差;根据所述第二预测误差和所述第二实际误差之差得到第二损失函数值; 调整所述目标检测模型的模型参数,以使所述第二损失函数值最小化。
8.根据权利要求1-7任一项所述的物体空间位置检测方法,其特征在于,所述获取采集的图像,包括: 获取采用鱼眼镜头采集的图像。
9.一种物体空间位置检测装置,其特征在于,所述装置包括:获取模块,用于获取采集的图像;标记模块,用于标记目标物体;识别模块,用于采用目标检测模型识别所述图像中的空间信息,得到用于指示空间信息的不规则多边形预测框;展示模块,用于在所述图像中展示所述不规则多边形预测框;预测模块,用于根据不规则多边形预测框判断目标物体的空间位置。
10.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-8中任一所述的物体空间位置检测方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的物体空间位置检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210097279.4A CN114119733A (zh) | 2022-01-27 | 2022-01-27 | 物体空间位置检测方法、装置、计算机设备及其存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210097279.4A CN114119733A (zh) | 2022-01-27 | 2022-01-27 | 物体空间位置检测方法、装置、计算机设备及其存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114119733A true CN114119733A (zh) | 2022-03-01 |
Family
ID=80361802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210097279.4A Pending CN114119733A (zh) | 2022-01-27 | 2022-01-27 | 物体空间位置检测方法、装置、计算机设备及其存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114119733A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110276287A (zh) * | 2019-06-17 | 2019-09-24 | 百度在线网络技术(北京)有限公司 | 车位检测方法、装置、计算机设备以及存储介质 |
US20200294310A1 (en) * | 2019-03-16 | 2020-09-17 | Nvidia Corporation | Object Detection Using Skewed Polygons Suitable For Parking Space Detection |
CN111860166A (zh) * | 2020-06-18 | 2020-10-30 | 浙江大华技术股份有限公司 | 图像检测的方法、装置、计算机设备和存储介质 |
CN112183529A (zh) * | 2020-09-23 | 2021-01-05 | 创新奇智(北京)科技有限公司 | 四边形物体检测、模型训练方法、装置、设备及存储介质 |
CN113378834A (zh) * | 2021-06-28 | 2021-09-10 | 北京百度网讯科技有限公司 | 目标检测方法、装置、设备、存储介质以及程序产品 |
CN113837998A (zh) * | 2021-08-19 | 2021-12-24 | 佛山科学技术学院 | 一种基于深度学习的图片自动调整对齐的方法及装置 |
-
2022
- 2022-01-27 CN CN202210097279.4A patent/CN114119733A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200294310A1 (en) * | 2019-03-16 | 2020-09-17 | Nvidia Corporation | Object Detection Using Skewed Polygons Suitable For Parking Space Detection |
CN110276287A (zh) * | 2019-06-17 | 2019-09-24 | 百度在线网络技术(北京)有限公司 | 车位检测方法、装置、计算机设备以及存储介质 |
CN111860166A (zh) * | 2020-06-18 | 2020-10-30 | 浙江大华技术股份有限公司 | 图像检测的方法、装置、计算机设备和存储介质 |
CN112183529A (zh) * | 2020-09-23 | 2021-01-05 | 创新奇智(北京)科技有限公司 | 四边形物体检测、模型训练方法、装置、设备及存储介质 |
CN113378834A (zh) * | 2021-06-28 | 2021-09-10 | 北京百度网讯科技有限公司 | 目标检测方法、装置、设备、存储介质以及程序产品 |
CN113837998A (zh) * | 2021-08-19 | 2021-12-24 | 佛山科学技术学院 | 一种基于深度学习的图片自动调整对齐的方法及装置 |
Non-Patent Citations (2)
Title |
---|
徐征宇等: "基于深度学习目标检测的可行驶区域分割", 《现代信息科技》 * |
王景丹等: "基于智能检测车位信息的车辆识别算法", 《计算机科学与应用》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3806064B1 (en) | Method and apparatus for detecting parking space usage condition, electronic device, and storage medium | |
CN107067003B (zh) | 感兴趣区域边界的提取方法、装置、设备和计算机存储介质 | |
CN109977191B (zh) | 问题地图检测方法、装置、电子设备和介质 | |
CN106952303B (zh) | 车距检测方法、装置和系统 | |
WO2017020528A1 (zh) | 车道线的识别建模方法、装置、存储介质和设备及识别方法、装置、存储介质和设备 | |
CN110910341B (zh) | 一种输电线路锈蚀区缺陷检测方法及装置 | |
KR20200100806A (ko) | 테스트 결과를 결정하기 위한 캡처된 이미지의 분석 | |
CN109285181B (zh) | 用于识别图像的方法和装置 | |
CN109916415B (zh) | 道路类型确定方法、装置、设备及存储介质 | |
CN110910445B (zh) | 一种物件尺寸检测方法、装置、检测设备及存储介质 | |
CN109115242B (zh) | 一种导航评估方法、装置、终端、服务器及存储介质 | |
CN112364843A (zh) | 插拔式航拍图像目标定位检测方法、系统、设备 | |
CN111428374A (zh) | 零件缺陷检测方法、装置、设备及存储介质 | |
CN112149503A (zh) | 目标事件检测方法、装置和电子设备和可读介质 | |
CN110929661A (zh) | 一种基于卷积神经网络的可停靠车位检测方法及系统 | |
CN110111018B (zh) | 评估车辆感测能力的方法、装置、电子设备及存储介质 | |
CN110910379A (zh) | 一种残缺检测方法及装置 | |
CN113505643B (zh) | 违章目标物检测方法及相关装置 | |
CN113435350A (zh) | 一种交通标线检测方法、装置、设备和介质 | |
CN109345567A (zh) | 物体运动轨迹识别方法、装置、设备和存储介质 | |
CN110298320B (zh) | 一种视觉定位方法、装置及存储介质 | |
CN109740502B (zh) | 道路质量检测方法及装置 | |
CN114581890B (zh) | 确定车道线的方法、装置、电子设备和存储介质 | |
CN110298302A (zh) | 一种人体目标检测方法及相关设备 | |
CN114119733A (zh) | 物体空间位置检测方法、装置、计算机设备及其存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220301 |
|
RJ01 | Rejection of invention patent application after publication |