CN110781779A - 物体位置检测方法、装置、可读存储介质及电子设备 - Google Patents

物体位置检测方法、装置、可读存储介质及电子设备 Download PDF

Info

Publication number
CN110781779A
CN110781779A CN201910965138.8A CN201910965138A CN110781779A CN 110781779 A CN110781779 A CN 110781779A CN 201910965138 A CN201910965138 A CN 201910965138A CN 110781779 A CN110781779 A CN 110781779A
Authority
CN
China
Prior art keywords
line
line laser
image
pixels
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910965138.8A
Other languages
English (en)
Inventor
范坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Horizon Robotics Technology Research and Development Co Ltd
Original Assignee
Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Horizon Robotics Technology Research and Development Co Ltd filed Critical Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority to CN201910965138.8A priority Critical patent/CN110781779A/zh
Publication of CN110781779A publication Critical patent/CN110781779A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例公开了一种物体位置检测方法和装置,其中,该方法包括:获取摄像头拍摄的线激光图像;从线激光图像中确定表征线激光的线条;确定线条包括的像素的三维坐标;将线激光图像输入预先训练的物体识别模型,得到线激光图像中的目标物体图像的位置信息;基于线条包括的像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息。本公开实施例实现了将线激光识别和图像识别相结合进行目标检测,提高了目标检测的准确度,无需使用激光雷达、多摄像头等设备,降低了目标检测的成本。

Description

物体位置检测方法、装置、可读存储介质及电子设备
技术领域
本公开涉及计算机技术领域,尤其是一种物体位置检测方法、装置、计算机可读存储介质及电子设备。
背景技术
在自动驾驶领域,需要获得汽车周围环境情况的结构化信息,为了精确测量道路中障碍物的距离,需要使用多个传感器进行环境感知,将感知结果进一步处理以实现自主驾驶。目前,可以采用多种方案实现障碍物检测,例如激光雷达方案、多摄像头方案、毫米波雷达方案、超声波雷达方案等。
发明内容
本公开的实施例提供了一种物体位置检测方法、装置、计算机可读存储介质及电子设备。
本公开的实施例提供了一种物体位置检测方法,该方法包括:获取摄像头拍摄的线激光图像;从线激光图像中确定表征线激光的线条;确定线条包括的像素的三维坐标;将线激光图像输入预先训练的物体识别模型,得到线激光图像中的目标物体图像的位置信息;基于线条包括的像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息。
根据本公开实施例的另一个方面,提供了一种物体位置检测装置,该装置包括:获取模块,用于获取摄像头拍摄的线激光图像;第一确定模块,用于从线激光图像中确定表征线激光的线条;第二确定模块,用于确定线条包括的像素的三维坐标;识别模块,用于将线激光图像输入预先训练的物体识别模型,得到线激光图像中的目标物体图像的位置信息;第三确定模块,用于基于线条包括的像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息。
根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序用于执行上述物体位置检测方法。
根据本公开实施例的另一个方面,提供了一种电子设备,电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令,并执行指令以实现上述物体位置检测方法。
基于本公开的上述实施例,通过从线激光图像中确定线激光的线条,确定线条包括的像素的三维坐标,再利用物体识别模型,得到线激光图像中的目标物体图像的位置信息,最后基于像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息,从而实现了将线激光识别和图像识别相结合进行目标检测,提高了目标检测的准确度,无需使用激光雷达、多摄像头等设备,降低了目标检测的成本。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开所适用的系统图。
图2是本公开一示例性实施例提供的物体位置检测方法的流程示意图。
图3是本公开的实施例的物体位置检测方法的一个应用场景的示意图。
图4是本公开另一示例性实施例提供的物体位置检测方法的流程示意图。
图5是本公开的实施例的二维触觉反馈装置的结构示意图。
图6是本公开一示例性实施例提供的物体位置检测装置的结构示意图。
图7是本公开另一示例性实施例提供的物体位置检测装置的结构示意图。
图8是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
申请概述
目前的目标检测方法,通常使用激光雷达方案、多摄像头方案、毫米波雷达方案、超声波雷达方案等。激光雷达方案价格昂贵,难以普及,性价比低;多摄像头方案测距精度有限,图像处理计算量大耗能高;毫米波雷达只能进行测距,无法辨别障碍物;超声波雷达精度低,受天气影响大。
示例性系统
图1示出了可以应用本公开的实施例的物体位置检测方法或物体位置检测装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、网络102、服务器103、摄像头104和线激光发射器105。网络102用于在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。线激光发射器105可以用于发射线形结构光,摄像头104可以对线激光照射到的物体进行拍摄,得到线激光图像。需要说明的是,线激光发射器105可以发射红光、绿光等可见光波段的激光,也可以发射红外光、紫外光等非可见光波段的激光,相应的,摄像头可以是红外摄像头或紫外摄像头,可以在拍摄的图像上呈现线激光的线条。
用户可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。终端设备101上可以安装有各种通讯客户端应用,例如图像监控类应用、图像处理类应用、即时通信工具等。
终端设备101可以是各种电子设备,包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。
服务器103可以是提供各种服务的服务器,例如对终端设备101上传的线激光图像进行处理的后台图像处理服务器。后台图像处理服务器可以对接收到的图像处理进行处理,得到处理结果(例如目标物体的三维位置信息)。
需要说明的是,本公开的实施例所提供的物体位置检测方法可以由服务器103执行,也可以由终端设备101执行,相应地,物体位置检测装置可以设置于服务器103中,也可以设置于终端设备101中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。例如,终端设备可以是车载终端,摄像头和线激光发射器可以安装在车辆上,该车载终端无需与服务器交互,因此,上述系统架构可以不包括服务器。
示例性方法
图2是本公开一示例性实施例提供的物体位置检测方法的流程示意图。本实施例可应用在电子设备(如图1所示的终端设备101或服务器103)上,如图2所示,该方法包括如下步骤:
步骤201,获取摄像头拍摄的线激光图像。
在本实施例中,电子设备可以从本地或从远程获取摄像头(例如图1所示的摄像头104)拍摄的线激光图像。其中,线激光图像可以是摄像头对如图1所示的线激光发射器105发送的线激光所照射的物体拍摄的图像。作为示例,摄像头104和线激光发射器105可以安装在车辆上,线激光发射器105向车辆的前方发射线激光,同时摄像头104拍摄车辆前方的物体,摄像头104拍摄的图像中包括线激光在图像中呈现的线条。
步骤202,从线激光图像中确定表征线激光的线条。
在本实施例中,电子设备可以从线激光图像中确定表征线激光的线条。作为示例,电子设备可以根据线激光的线条的RGB值,从线激光图像中确定与线条的RGB值匹配的像素,组成连续线条的像素确定为线激光的线条。
步骤203,确定线条包括的像素的三维坐标。
在本实施例中,电子设备可以利用现有的基于线形结构光的光学三角法测量方法,确定线条包括的像素的三维坐标。通常,上述三维坐标可以是以摄像头所在的位置为原点建立的三维坐标系下的坐标。
步骤204,将线激光图像输入预先训练的物体识别模型,得到线激光图像中的目标物体图像的位置信息。
在本实施例中,电子设备可以将线激光图像输入预先训练的物体识别模型,得到线激光图像中的目标物体图像的位置信息。其中,目标物体图像可以是待检测的目标物体的图像,目标物体可以是各种物体,例如动物、人、车辆等。目标物体图像的位置信息可以用于表征目标物体图像在上述线激光图像中的位置。作为示例,假设目标物体为狗,目标物体图像的位置信息可以为在线激光图像上呈现的矩形框,矩形框内即狗的图像。
上述物体识别模型用于表征线激光图像与线激光中的目标物体图像的位置信息的对应关系。物体识别模型可以利用机器学习方法,对现有的目标检测网络(例如SSD(Single Shot MultiBox Detector)、DPM(Deformable Part Model)、RPN(RegionProposal Networks)等)进行训练得到的模型。
物体识别模型可以从输入其中的图像中,确定目标物体图像的位置。通常,物体识别模型输出的位置信息可以包括坐标信息,该坐标信息可以表征线激光图像中的区域。例如,位置信息可以包括矩形框的两个对角坐标,通过两个对角坐标,可以在线激光图像中确定一个矩形框,从而确定目标物体图像的位置。
步骤205,基于线条包括的像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息。
在本实施例中,电子设备可以基于线条包括的像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息。
具体地,作为示例,目标物体图像的位置信息可以是矩形框,电子设备可以确定线激光的线条中与矩形框重合的线条作为表征线激光覆盖的目标物体的线条,再基于表征线激光覆盖的目标物体的线条包括的像素的三维坐标,确定该目标物体的三维位置信息。例如,可以将上述表征线激光覆盖的目标物体的线条包括的像素的三维坐标中的x,y,z坐标分量分别取平均值,得到的坐标可以用于表征线激光覆盖的目标物体的三维位置。线激光覆盖的目标物体的三维位置信息可以包括所得到的坐标,还可以包括基于该坐标确定的其他信息,例如基于该坐标确定的目标物体与摄像头(即三维坐标系的原点)之间的距离。
本公开的上述实施例提供的方法,通过从线激光图像中确定线激光的线条,确定线条包括的像素的三维坐标,再利用物体识别模型,得到线激光图像中的目标物体图像的位置信息,最后基于像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息,从而实现了将线激光识别和图像识别相结合进行目标检测,提高了目标检测的准确度,无需使用激光雷达、多摄像头等设备,降低了目标检测的成本。
在一些可选的实现方式中,上述步骤202可以如下执行:
首先,将线激光图像转换为灰度图。
然后,基于灰度图中的像素的灰度值,从灰度图中确定线激光的线条。
作为示例,可以预先根据线激光的颜色值确定线激光的灰度值,从灰度图中提取与线激光的灰度值匹配的像素,并将连续排列为线状的像素确定为线激光的线条。
本实现方式通过将线激光图像转换为灰度图,基于灰度值确定线激光的线条,可以减少图像中的各种颜色对识别线激光的线条造成的影响,提高线激光识别的准确性。
在一些可选的实现方式中,电子设备可以按照如下步骤从上述灰度图中确定线激光的线条:
首先,确定线激光的分布方向。其中,分布方向可以包括垂直方向和水平方向,垂直方向的线激光可以在线激光图像上呈现垂直方向的直线,水平方向的线激光可以在线激光图像上呈现水平方向的直线。分布方向可以是预先设置的,电子设备可以根据预先设置的分布方向,确定以如下何种方式确定线激光的线条。
如果为垂直发射,电子设备可以基于灰度图中的每行像素的最大灰度值像素,从灰度图中确定线激光的线条。
具体地,在灰度图中,线激光的线条接近白色,像素的灰度值越大,颜色越接近白色。作为示例,可以将每行像素中的最大灰度值对应的像素提取出,将连续排列成线状的像素确定为线激光的线条。
如果为水平发射,电子设备可以基于灰度图中的每列像素的最大灰度值像素,从灰度图中确定线激光的线条。
作为示例,可以将每列像素中的最大灰度值对应的像素提取出,将连续排列成线状的像素确定为线激光的线条。
本实现方式通过提取最大灰度值对应的像素确定线激光的线条,可以简化线激光的线条的确定方式,有助于提高线激光识别的效率。
在一些可选的实现方式中,如果线激光的分布方向为垂直方向,电子设备可以按照如下步骤基于灰度图中的每行像素的最大灰度值像素,从灰度图中确定线激光的线条:
首先,将与每行像素中的最大灰度值像素左右相邻的预设数量个像素确定为线条像素。其中,上述预设数量可以是预先设置的常数,也可以是根据线激光图像的大小和预设的比例确定的数量。例如,线激光图像的宽度包括的像素数量为W,预设的比例为1%,则预设数量可以是W*1%。
然后,基于线条像素,确定用于表征线激光的有效条纹。其中,有效条纹可以是用于表征线激光的条纹。当电子设备根据线条像素确定出多条条纹时,可以将垂直分布且两两之间的水平距离小于或等于预设距离的条纹确定为有效条纹。
最后,对有效条纹进行拟合,得到有效条纹的中心线作为线激光的线条。具体地,电子设备可以利用各种拟合方式(例如高斯拟合)对有效条纹进行拟合。由于高斯曲线的特征是中心高,两侧低,因此,可以基于高斯拟合方式,确定有效线条的宽度方向上对应于高斯曲线中心的像素。
如果线激光的分布方向为水平方向,电子设备可以按照如下步骤基于灰度图中的每列像素的最大灰度值像素,从灰度图中确定线激光的线条:
首先,将与每列像素中的最大灰度值像素上下相邻的预设数量个像素确定为线条像素。
然后,基于线条像素,确定用于表征线激光的有效条纹。
最后,对有效条纹进行拟合,得到有效条纹的中心线作为线激光的线条。
其中,线激光的分布方向为水平方向时确定线激光的线条的方式与上述垂直方向时确定线激光的线条的方式基本相同,这里不再赘述。
本实现方式,通过确定有效条纹并对有效条纹进行拟合以得到线激光的条纹,可以更精确地确定线激光的线条所在的位置,提高线激光图像识别的准确性。
参见图3,图3是根据本实施例的物体位置检测方法的应用场景的一个示意图。在图3的应用场景中,电子设备301为车载终端,车辆上同时安装了摄像头302和线激光发射器303。线激光发射器301向前方发射水平方向的线激光,同时,摄像头302向车辆前方拍摄图像。电子设备301首先获取摄像头302拍摄的线激光图像304。然后,电子设备301从线激光图像304中确定表征线激光的线条3041。例如根据线激光的线条的RGB值,从线激光图像304中确定与线条的RGB值匹配的像素,组成连续线条的像素确定为线激光的线条3041。再然后,电子设备301利用基于线形结构光的光学三角法测量方法,确定线条包括的像素的三维坐标305。接着,电子设备301将线激光图像输入预先训练的物体识别模型306,得到线激光图像中的目标物体图像3042的位置信息307。最后,基于线条包括的像素的三维坐标305和位置信息307,确定线激光覆盖的目标物体的三维位置信息308。电子设备可以确定线激光的线条3041中与位置信息307表征的矩形框重合的线条作为表征线激光覆盖的目标物体的线条,再基于表征线激光覆盖的目标物体的线条包括的像素的三维坐标,确定该目标物体的三维位置信息308。
进一步参考图4,示出了物体位置检测方法的又一个实施例的流程示意图。如图4所示,在上述图2所示实施例的基础上,物体位置检测方法还可以包括如下步骤:
步骤206,基于三维位置信息,确定线激光覆盖的目标物体映射在二维触觉反馈装置上的二维坐标。
在本实施例中,针对二维触觉反馈装置的表面建立的二维坐标系可以与上述线激光图像对应的三维坐标系预先建立对应关系。基于该对应关系,上述三维坐标系中的任一点可以映射到上述二维坐标系中的一点或一个区域。
作为示例,二维触觉反馈装置可以安装在车辆的方向盘上,驾驶员在驾驶车辆时,手部与二维触觉反馈装置接触,从而感受二维触觉反馈装置产生的触觉信号。再例如,二维触觉反馈装置可以安装在手杖的把手上,使用者在手握把手时,手部可以与二维触觉反馈装置接触,从而感受二维触觉反馈装置产生的触觉信号。
步骤207,控制二维坐标对应的在二维触觉反馈装置上的位置产生触觉信号。
在本实施例中,二维触觉反馈装置可以包括多个触觉反馈区域,每个触觉反馈区域可以产生相应的触觉信息,每个触觉反馈区域可以对应于上述三维坐标系的一个区域,当上述步骤205确定出三维位置信息后,二维触觉反馈装置上对应的触觉反馈区域可以产生触觉信号。其中,触觉信号可以是各种类型的信号。作为示例,触觉信号可以是对用户手部施加的压力信号。如图5所示,二维触觉反馈装置包括矩形面板,该矩形面板包括5行4列的触觉反馈区域,每个触觉反馈区域可以包括至少一个触头,当确定出三维位置信息后,对应的触觉反馈区域(例如图中的坐标(3,2)对应的触觉反馈区域)包括的触头可以从二维触觉反馈装置的表面突出,用户的手部可以感受到该区域的突出动作,从而提醒用户该区域对应的三维区域有目标物体。
再例如,触觉信号还可以是对用户的手部施加的放电信号,触觉反馈区域可以包括放电装置,当确定出目标物体的三维位置信息后,对应的触觉反馈区域包括的放电装置可以产生轻微的放电,使用户的手部感受到轻微的触电感。
图4对应实施例提供的方法,通过利用线激光图像对应的三维坐标系和二维触觉反馈装置对应的二维坐标的对应关系,确定目标物体的三维位置映射到触觉反馈装置的相应位置,并在该位置产生触觉信号,从而可以使用户通过触觉快速地得知目标物体的大致位置,免于影响用户的视觉。为用户提供更丰富的展示目标物体的位置的方式。
在一些可选的实现方式中,物体识别模型还用于输出目标物体图像的类别信息。基于此,上述步骤204可以包括:
将线激光图像输入物体识别模型,得到线激光图像中的目标物体图像的位置信息和类别信息。本实现方式中,物体识别模型用于表征线激光图像与线激光中的目标物体图像的位置信息和类别信息的对应关系。类别信息用于表征目标物体图像的类别,类别信息可以包括但不限于以下至少一种形式的信息:文字、数字、符号等。
作为示例,物体识别模型可以包括MobileNet网络和SSD网络,其中,MobileNet网络用于提取线激光图像的特征,SSD网络用于检测线激光图像中的目标物体图像的位置,并对目标物体图像进行分类。该模型的损失函数可以由位置误差损失和类别置信度误差损失的加权和得到。其中,位置误差损失函数用于表征样本图像中标注的目标物体图像的位置与实际输出的目标物体图像的位置之间的差距,类别置信度误差损失可以用于表征对样本图像中的目标物体图像标注的类别信息与实际输出的类别信息之间的差距(例如属于某个类别的概率)。电子设备可以利用机器学习方法,将样本图像作为输入,将对输入的样本图像标注的目标物体图像的位置信息和类别信息作为期望输出,对上述包括MobileNet网络和SSD网络的初始模型进行训练。电子设备可以采用梯度下降法和反向传播法,基于初始模型的实际输出和期望输出,调整初始模型的参数,将每次调整参数后得到的模型作为下次训练的初始模型,并在满足预设的训练结束条件(例如损失函数的损失值收敛)的情况下,结束训练,从而训练得到物体识别模型。
本实现方式可以利用物体识别模型得到目标物体图像的位置信息和类别信息,从而有助于更准确地使用户得知目标物体的类型,提高了物体检测的全面性。
在一些可选的实现方式中,电子设备还可以基于线激光的线条通过的目标物体图像的类别信息,控制声音输出装置输出对应的声音信号。其中,声音信号与类别信息对应。作为示例,当线激光的线条通过的目标物体图像的类别信息用于表征目标物体为狗时,可以输出语音“狗”,当线激光的线条通过的目标物体图像的类别信息用于表征目标物体为猫时,可以输出语音“猫”。可选的,与类别信息对应的声音信号还可以是定制的其他类型的声音,例如,当目标物体为狗时,可以输出狗叫的声音,当目标物体为猫时,可以输出猫叫的声音。本实现方式通过输出声音信号,可以使用户及时地通过声音获知前方目标物体的类别,免于影响用户的视觉。
需要说明的是,本实现方式可以与上述步骤207向结合,这样,可以同时输出触觉信号和声音信号,使用户无需通过视觉观察即可得知目标物体的位置和类型。
示例性装置
图6是本公开一示例性实施例提供的物体位置检测装置的结构示意图。本实施例可应用在电子设备上,如图6所示,物体位置检测装置包括:获取模块601,用于获取摄像头拍摄的线激光图像;第一确定模块602,用于从线激光图像中确定表征线激光的线条;第二确定模块603,用于确定线条包括的像素的三维坐标;识别模块604,用于将线激光图像输入预先训练的物体识别模型,得到线激光图像中的目标物体图像的位置信息;第三确定模块605,用于基于线条包括的像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息。
在本实施例中,获取模块601可以从本地或从远程获取摄像头(例如图1所示的摄像头104)拍摄的线激光图像。其中,线激光图像可以是摄像头对如图1所示的线激光发射器105发送的线激光所照射的物体拍摄的图像。作为示例,摄像头104和线激光发射器105可以安装在车辆上,线激光发射器105向车辆的前方发射线激光,同时摄像头104拍摄车辆前方的物体,摄像头104拍摄的图像中包括线激光在图像中呈现的线条。
在本实施例中,第一确定模块602可以从线激光图像中确定表征线激光的线条。作为示例,第一确定模块602可以根据线激光的线条的RGB值,从线激光图像中确定与线条的RGB值匹配的像素,组成连续线条的像素确定为线激光的线条。
在本实施例中,第二确定模块603可以利用现有的基于线形结构光的光学三角法测量方法,确定线条包括的像素的三维坐标。通常,上述三维坐标可以是以摄像头所在的位置为原点建立的三维坐标系下的坐标。
在本实施例中,识别模块604可以将线激光图像输入预先训练的物体识别模型,得到线激光图像中的目标物体图像的位置信息。其中,目标物体图像可以是待检测的目标物体的图像,目标物体可以是各种物体,例如动物、人、车辆等。目标物体图像的位置信息可以用于表征目标物体图像在上述线激光图像中的位置。作为示例,假设目标物体为狗,目标物体图像的位置信息可以为在线激光图像上呈现的矩形框,矩形框内即狗的图像。
上述物体识别模型用于表征线激光图像与线激光中的目标物体图像的位置信息的对应关系。物体识别模型可以利用机器学习方法,对现有的目标检测网络(例如SSD(Single Shot MultiBox Detector)、DPM(Deformable Part Model)、RPN(RegionProposal Networks)等)进行训练得到的模型。
在本实施例中,第三确定模块605可以基于线条包括的像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息。
具体地,作为示例,目标物体图像的位置信息可以是矩形框,第三确定模块605可以确定线激光的线条中与矩形框重合的线条作为表征线激光覆盖的目标物体的线条,再基于表征线激光覆盖的目标物体的线条包括的像素的三维坐标,确定该目标物体的三维位置信息。例如,可以将上述表征线激光覆盖的目标物体的线条包括的像素的三维坐标中的x,y,z坐标分量分别取平均值,得到的坐标可以用于表征线激光覆盖的目标物体的三维位置。线激光覆盖的目标物体的三维位置信息可以包括所得到的坐标,还可以包括基于该坐标确定的其他信息,例如基于该坐标确定的目标物体与摄像头(即三维坐标系的原点)之间的距离。
参照图7,图7是本公开另一示例性实施例提供的物体位置检测装置的结构示意图。
在一些可选的实现方式中,物体位置检测装置还包括:第四确定模块606,用于基于三维位置信息,确定线激光覆盖的目标物体映射在二维触觉反馈装置上的二维坐标;第一控制模块607,用于控制二维坐标对应的在二维触觉反馈装置上的位置产生触觉信号。
在一些可选的实现方式中,物体识别模型还用于输出目标物体图像的类别信息;识别模块604进一步用于将线激光图像输入物体识别模型,得到线激光图像中的目标物体图像的位置信息和类别信息。
在一些可选的实现方式中,物体位置检测装置还可以包括:第二控制模块608,用于基于线激光的线条通过的目标物体图像的类别信息,控制声音输出装置输出对应的声音信号。
在一些可选的实现方式中,第一确定模块602可以包括:转换单元6021,用于将线激光图像转换为灰度图;确定单元6022,用于基于灰度图中的像素的灰度值,从灰度图中确定线激光的线条。
在一些可选的实现方式中,确定单元6022可以包括:第一确定子单元60221,用于确定线激光的分布方向;第二确定子单元60222,用于如果为垂直发射,基于灰度图中的每行像素的最大灰度值像素,从灰度图中确定线激光的线条;第三确定子单元60223,用于如果为水平发射,基于灰度图中的每列像素的最大灰度值像素,从灰度图中确定线激光的线条。
在一些可选的实现方式中,第二确定子单元60222可以进一步用于:将与每行像素中的最大灰度值像素左右相邻的预设数量个像素确定为线条像素;基于线条像素,确定用于表征线激光的有效条纹;对有效条纹进行拟合,得到有效条纹的中心线作为线激光的线条;第三确定子单元60223可以进一步用于:将与每列像素中的最大灰度值像素上下相邻的预设数量个像素确定为线条像素;基于线条像素,确定用于表征线激光的有效条纹;对有效条纹进行拟合,得到有效条纹的中心线作为线激光的线条。
本公开上述实施例提供的物体位置检测装置,通过从线激光图像中确定线激光的线条,确定线条包括的像素的三维坐标,再利用物体识别模型,得到线激光图像中的目标物体图像的位置信息,最后基于像素的三维坐标和位置信息,确定线激光覆盖的目标物体的三维位置信息,从而实现了将线激光识别和图像识别相结合进行目标检测,提高了目标检测的准确度,无需使用激光雷达、多摄像头等设备,降低了目标检测的成本。
示例性电子设备
下面,参考图8来描述根据本公开实施例的电子设备。该电子设备可以是如图1所示的终端设备101和服务器103中的任一个或两者、或与它们独立的单机设备,该单机设备可以与终端设备101和服务器103进行通信,以从它们接收所采集到的输入信号。
图8图示了根据本公开实施例的电子设备的框图。
如图8所示,电子设备800包括一个或多个处理器801和存储器802。
处理器801可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备800中的其他组件以执行期望的功能。
存储器802可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器801可以运行程序指令,以实现上文的本公开的各个实施例的物体位置检测方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备800还可以包括:输入装置803和输出装置804,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
例如,在该电子设备是终端设备101或服务器103时,该输入装置803可以是摄像头等设备,用于输入图像。在该电子设备是单机设备时,该输入装置803可以是通信网络连接器,用于从终端设备101和服务器103接收所输入的图像。
该输出装置804可以向外部输出各种信息,包括确定出的三维位置信息。该输出设备804可以包括例如显示器、扬声器、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图8中仅示出了该电子设备800中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备800还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的物体位置检测方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的物体位置检测方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种物体位置检测方法,包括:
获取摄像头拍摄的线激光图像;
从所述线激光图像中确定表征所述线激光的线条;
确定所述线条包括的像素的三维坐标;
将所述线激光图像输入预先训练的物体识别模型,得到所述线激光图像中的目标物体图像的位置信息;
基于所述线条包括的像素的三维坐标和所述位置信息,确定所述线激光覆盖的目标物体的三维位置信息。
2.根据权利要求1所述的方法,其中,所述方法还包括:
基于所述三维位置信息,确定所述线激光覆盖的目标物体映射在二维触觉反馈装置上的二维坐标;
控制所述二维坐标对应的在所述二维触觉反馈装置上的位置产生触觉信号。
3.根据权利要求1所述的方法,其中,所述物体识别模型还用于输出所述目标物体图像的类别信息;
所述方法还包括:
将所述线激光图像输入所述物体识别模型,得到所述线激光图像中的目标物体图像的位置信息和类别信息。
4.根据权利要求3所述的方法,其中,所述方法还包括:
基于所述线激光的线条通过的目标物体图像的类别信息,控制声音输出装置输出对应的声音信号。
5.根据权利要求1-4之一所述的方法,其中,所述从所述线激光图像中确定表征所述线激光的线条,包括:
将所述线激光图像转换为灰度图;
基于所述灰度图中的像素的灰度值,从所述灰度图中确定所述线激光的线条。
6.根据权利要求5所述的方法,其中,所述基于所述灰度图中的像素的灰度值,从所述灰度图中确定所述线激光的线条,包括:
确定所述线激光的分布方向;
如果为垂直发射,基于所述灰度图中的每行像素的最大灰度值像素,从所述灰度图中确定所述线激光的线条;
如果为水平发射,基于所述灰度图中的每列像素的最大灰度值像素,从所述灰度图中确定所述线激光的线条。
7.根据权利要求6所述的方法,其中,所述基于所述灰度图中的每行像素的最大灰度值像素,从所述灰度图中确定所述线激光的线条,包括:
将与所述每行像素中的最大灰度值像素左右相邻的预设数量个像素确定为线条像素;
基于所述线条像素,确定用于表征所述线激光的有效条纹;
对所述有效条纹进行拟合,得到所述有效条纹的中心线作为所述线激光的线条;
所述基于所述灰度图中的每列像素的最大灰度值像素,从所述灰度图中确定所述线激光的线条,包括:
将与所述每列像素中的最大灰度值像素上下相邻的预设数量个像素确定为线条像素;
基于所述线条像素,确定用于表征所述线激光的有效条纹;
对所述有效条纹进行拟合,得到所述有效条纹的中心线作为所述线激光的线条。
8.一种物体位置检测装置,包括:
获取模块,用于获取摄像头拍摄的线激光图像;
第一确定模块,用于从所述线激光图像中确定表征所述线激光的线条;
第二确定模块,用于确定所述线条包括的像素的三维坐标;
识别模块,用于将所述线激光图像输入预先训练的物体识别模型,得到所述线激光图像中的目标物体图像的位置信息;
第三确定模块,用于基于所述线条包括的像素的三维坐标和所述位置信息,确定所述线激光覆盖的目标物体的三维位置信息。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7任一所述的方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-7任一所述的方法。
CN201910965138.8A 2019-10-11 2019-10-11 物体位置检测方法、装置、可读存储介质及电子设备 Pending CN110781779A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910965138.8A CN110781779A (zh) 2019-10-11 2019-10-11 物体位置检测方法、装置、可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910965138.8A CN110781779A (zh) 2019-10-11 2019-10-11 物体位置检测方法、装置、可读存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN110781779A true CN110781779A (zh) 2020-02-11

Family

ID=69385094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910965138.8A Pending CN110781779A (zh) 2019-10-11 2019-10-11 物体位置检测方法、装置、可读存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN110781779A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111578845A (zh) * 2020-05-12 2020-08-25 创想智控科技(济南)有限公司 激光线的检测方法及装置、激光传感器、可读存储介质
CN111753741A (zh) * 2020-06-28 2020-10-09 北京小眼探索科技有限公司 基于深度学习的特种车辆辅助驾驶方法、装置及存储介质
CN113096186A (zh) * 2021-04-27 2021-07-09 中冶南方(武汉)自动化有限公司 基于机器视觉的钢包位置测量方法
CN115272351A (zh) * 2022-09-30 2022-11-01 煤炭科学研究总院有限公司 基于双目视觉和线激光的矿井无轨胶轮车超限检测方法
CN115632704A (zh) * 2022-09-21 2023-01-20 深圳越登智能技术有限公司 一种线激光的能量分布测试方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050149251A1 (en) * 2000-07-18 2005-07-07 University Of Minnesota Real time high accuracy geospatial database for onboard intelligent vehicle applications
CN102706880A (zh) * 2012-06-26 2012-10-03 哈尔滨工业大学 基于二维图像和深度信息的路面信息提取装置及使用该装置实现路面裂纹信息的检测方法
CN104236521A (zh) * 2013-06-14 2014-12-24 科沃斯机器人科技(苏州)有限公司 用于自移动机器人的线激光测距方法
CN104590113A (zh) * 2015-01-09 2015-05-06 浙江大学 一种人车信息联觉反馈方法
CN109472831A (zh) * 2018-11-19 2019-03-15 东南大学 面向压路机施工过程的障碍物识别测距系统及方法
CN109634279A (zh) * 2018-12-17 2019-04-16 武汉科技大学 基于激光雷达与单目视觉的物体定位方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050149251A1 (en) * 2000-07-18 2005-07-07 University Of Minnesota Real time high accuracy geospatial database for onboard intelligent vehicle applications
CN102706880A (zh) * 2012-06-26 2012-10-03 哈尔滨工业大学 基于二维图像和深度信息的路面信息提取装置及使用该装置实现路面裂纹信息的检测方法
CN104236521A (zh) * 2013-06-14 2014-12-24 科沃斯机器人科技(苏州)有限公司 用于自移动机器人的线激光测距方法
CN104590113A (zh) * 2015-01-09 2015-05-06 浙江大学 一种人车信息联觉反馈方法
CN109472831A (zh) * 2018-11-19 2019-03-15 东南大学 面向压路机施工过程的障碍物识别测距系统及方法
CN109634279A (zh) * 2018-12-17 2019-04-16 武汉科技大学 基于激光雷达与单目视觉的物体定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BALJIT KAUR,ET AL: "《A scene perception system for visually impaired based on object detection and classification using multi-modal DCNN》", 《ELECTRONIC IMAGING》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111578845A (zh) * 2020-05-12 2020-08-25 创想智控科技(济南)有限公司 激光线的检测方法及装置、激光传感器、可读存储介质
CN111753741A (zh) * 2020-06-28 2020-10-09 北京小眼探索科技有限公司 基于深度学习的特种车辆辅助驾驶方法、装置及存储介质
CN111753741B (zh) * 2020-06-28 2024-03-15 北京小眼探索科技有限公司 基于深度学习的特种车辆辅助驾驶方法、装置及存储介质
CN113096186A (zh) * 2021-04-27 2021-07-09 中冶南方(武汉)自动化有限公司 基于机器视觉的钢包位置测量方法
CN115632704A (zh) * 2022-09-21 2023-01-20 深圳越登智能技术有限公司 一种线激光的能量分布测试方法、装置、设备及介质
CN115632704B (zh) * 2022-09-21 2023-11-03 深圳越登智能技术有限公司 一种线激光的能量分布测试方法、装置、设备及介质
CN115272351A (zh) * 2022-09-30 2022-11-01 煤炭科学研究总院有限公司 基于双目视觉和线激光的矿井无轨胶轮车超限检测方法

Similar Documents

Publication Publication Date Title
US11106893B1 (en) System and method for evaluating the perception system of an autonomous vehicle
EP3627180B1 (en) Sensor calibration method and device, computer device, medium, and vehicle
US11468581B2 (en) Distance measurement method, intelligent control method, electronic device, and storage medium
CN110781779A (zh) 物体位置检测方法、装置、可读存储介质及电子设备
KR102406502B1 (ko) 차량의 협로 주행 안내 장치 및 방법
US9521317B2 (en) Method and apparatus for detecting obstacle based on monocular camera
US10217005B2 (en) Method, apparatus and device for generating target detection information
CN108377380B (zh) 影像扫描系统及其方法
CN110378360B (zh) 目标标定方法、装置、电子设备及可读存储介质
KR101995223B1 (ko) 보행자 검출 시스템 및 모듈, 방법, 컴퓨터프로그램
WO2022217988A1 (zh) 传感器配置方案确定方法、装置、计算机设备、存储介质及程序
CN114170826B (zh) 自动驾驶控制方法和装置、电子设备和存储介质
CN113096151B (zh) 对目标的运动信息进行检测的方法和装置、设备和介质
CN115147333A (zh) 一种目标检测方法及装置
CN114919584A (zh) 机动车定点目标测距方法、装置及计算机可读存储介质
CN110291771B (zh) 一种目标对象的深度信息获取方法及可移动平台
CN111678488B (zh) 测距方法、装置、计算机可读存储介质及电子设备
CN111401423B (zh) 用于自动驾驶车辆的数据处理方法和装置
CN113111692B (zh) 目标检测方法、装置、计算机可读存储介质及电子设备
JP6881986B2 (ja) データ圧縮装置、データ解凍装置、制御方法、プログラム及び記憶媒体
CN112528846A (zh) 障碍物检测的测评方法、装置、设备以及存储介质
CN118314548A (zh) 障碍物检测方法、装置、存储介质、电子设备及车辆
CN109859254B (zh) 自动驾驶中用于发送信息的方法和装置
CN113569800A (zh) 车道识别校验方法、装置、可读存储介质及电子设备
JP4716294B2 (ja) 車両周辺監視装置、車両、車両周辺監視プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200211

RJ01 Rejection of invention patent application after publication