CN109859216A - 基于深度学习的测距方法、装置、设备及存储介质 - Google Patents

基于深度学习的测距方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109859216A
CN109859216A CN201910119576.2A CN201910119576A CN109859216A CN 109859216 A CN109859216 A CN 109859216A CN 201910119576 A CN201910119576 A CN 201910119576A CN 109859216 A CN109859216 A CN 109859216A
Authority
CN
China
Prior art keywords
range images
observation
case
image
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910119576.2A
Other languages
English (en)
Other versions
CN109859216B (zh
Inventor
陈小明
张小龙
刘志愿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Future Perception Technology Co Ltd
Original Assignee
Shenzhen Future Perception Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Future Perception Technology Co Ltd filed Critical Shenzhen Future Perception Technology Co Ltd
Priority to CN201910119576.2A priority Critical patent/CN109859216B/zh
Publication of CN109859216A publication Critical patent/CN109859216A/zh
Application granted granted Critical
Publication of CN109859216B publication Critical patent/CN109859216B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于深度学习的测距方法、装置、设备及存储介质,该方法包括:在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;输出所述观测对象的目标位置。本发明解决现有技术中需要繁琐的标定过程才能测距的技术问题。

Description

基于深度学习的测距方法、装置、设备及存储介质
技术领域
本发明涉及深度学习技术领域,尤其涉及一种基于深度学习的测距方法、装置、设备及存储介质。
背景技术
目前,许多需要检测的场合如车检等都要用到光学测量来定位待跟踪物体的位置及姿态,在使用光学测量来定位待跟踪物体的位置及姿态过程中,主要原理是采用多个摄像头,根据摄像头之间的位置关系,摄像头与测距标志之间的位置关系通过三角测量等方法进行测距,然而,由于摄像头之间的位置关系,摄像头与测距标志之间的位置关系等常常需要繁琐的标定过程,降低了测距效率。
发明内容
本发明的主要目的在于提供一种基于深度学习的测距方法、装置、设备及存储介质,旨在解决现有技术中需要繁琐的标定过程才能测距的技术问题。
为实现上述目的,本发明提供一种基于深度学习的测距方法,所述基于深度学习的测距方法包括:
在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;
将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;
输出所述观测对象的目标位置。
可选地,所述将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置步骤之前包括:
获取预设的视觉测距图像的图像用例,挑选预设比例的所述图像用例设为第一用例,将所述图像用例中所述第一用例外的其他用例设为第二用例;
将所述第一用例作为训练用例进行所述预设深度学习网络模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数;
将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述预设深度学习网络模型。
可选地,所述将所述第一用例作为训练用例进行所述预设深度学习网络模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数步骤包括:
将所述第一用例作为训练用例输入至所述基础识别网络模型中;
对所述第一用例中的各个关联测距图像集合中的各个关联测距图像分别进行预设次数的卷积与最大池化交替处理,得到初始处理结果;
基于预设的各个各个观测点之间的位置关系、每个关联测距图像集合中所述初始处理结果中的图像大小,以及每个关联测距图像集合分别对应的观测对象的确定位置,有序调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数。
可选地,所述对所述第一用例中的各个关联测距图像集合中的各个关联测距图像分别进行预设次数的卷积与最大池化交替处理,得到初始处理结果步骤包括:
获取预设的各个观测对象的各个图像权值矩阵,根据所述各个图像权值矩阵对所述各个关联测距图像分别进行卷积处理,得到卷积处理结果;
对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果;
根据所述预设次数,对所述最大池化处理结果再次进行相应次数的卷积与最大池化交替处理,并进行预设激活函数的激活处理以得到初始处理结果。
可选地,所述对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果步骤包括:
将所述卷积处理结果分割为多个大小一致的预设尺寸的图像矩阵;
获取所述预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述预设尺寸的图像矩阵,以得到新的图像矩阵;
将所述新的图像矩阵设为所述最大池化处理结果。
可选地,所述在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合步骤包括:
在接收到两个观测点的双目摄像机针对同一观测对象分别捕获的两个待识别测距图像时,将所述两个待识别测距图像关联,得到目标关联测距图像集合;
在接收到两个以上观测点的多目摄像机针对同一观测对象分别捕获的多个待识别测距图像时,将所述多个待识别测距图像关联,得到目标关联测距图像集合。
本发明还提供一种基于深度学习的测距装置,所述基于深度学习的测距装置包括:
接收模块,用于在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;
输入模块,用于将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;
输出模块,用于输出所述观测对象的目标位置。
可选地,所述基于深度学习的测距装置包括:
获取模块,用于获取预设的视觉测距图像的图像用例,挑选预设比例的所述图像用例设为第一用例,将所述图像用例中所述第一用例外的其他用例设为第二用例;
调整训练模块,用于将所述第一用例作为训练用例进行所述预设深度学习网络模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数;
测试模块,用于将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述预设深度学习网络模型。
可选地,所述调整训练模块包括:
输入单元,用于将所述第一用例作为训练用例输入至所述基础识别网络模型中;
交替处理单元,用于对所述第一用例中的各个关联测距图像集合中的各个关联测距图像分别进行预设次数的卷积与最大池化交替处理,得到初始处理结果;
调整单元,用于基于预设的各个各个观测点之间的位置关系、每个关联测距图像集合中所述初始处理结果中的图像大小,以及每个关联测距图像集合分别对应的观测对象的确定位置,有序调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数。
可选地,所述交替处理单元包括:
获取子单元,用于获取预设的各个观测对象的各个图像权值矩阵,根据所述各个图像权值矩阵对所述各个关联测距图像分别进行卷积处理,得到卷积处理结果;
最大池化处理子单元,用于对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果;
激活子单元,用于根据所述预设次数,对所述最大池化处理结果再次进行相应次数的卷积与最大池化交替处理,并进行预设激活函数的激活处理以得到初始处理结果。
可选地,所述对最大池化处理子单元用于实现:
将所述卷积处理结果分割为多个大小一致的预设尺寸的图像矩阵;
获取所述预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述预设尺寸的图像矩阵,以得到新的图像矩阵;
将所述新的图像矩阵设为所述最大池化处理结果。
可选地,所述接收模块包括:
第一接收单元,用于在接收到两个观测点的双目摄像机针对同一观测对象分别捕获的两个待识别测距图像时,将所述两个待识别测距图像关联,得到目标关联测距图像集合;
第二接收单元,用于在接收到两个以上观测点的多目摄像机针对同一观测对象分别捕获的多个待识别测距图像时,将所述多个待识别测距图像关联,得到目标关联测距图像集合。
此外,为实现上述目的,本发明还提供一种基于深度学习的测距设备,所述基于深度学习的测距设备包括:存储器、处理器,通信总线以及存储在所述存储器上的基于深度学习的测距程序,
所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述基于深度学习的测距程序,以实现以下步骤:
在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;
将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;
输出所述观测对象的目标位置。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行以用于:
在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;
将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;
输出所述观测对象的目标位置。
本发明通过在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;输出所述观测对象的目标位置。在本申请中,深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型,也即深度学习网络模型是通过采集大量的图像样本以及对应的位置样本后,能够准确确定观测对象位置的模型,因而,在本申请中,不在需要繁琐的标定过程,也即,在深度学习网络模型的训练过程中,已经隐含了标定过程,因而,只要在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置即可,因而,减少了测距过程中标定的流程,进而解决了现有技术中需要繁琐的标定过程才能测距的技术问题。
附图说明
图1为本发明基于深度学习的测距方法第一实施例的流程示意图;
图2为本发明将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置步骤之前的细化流程示意图;
图3是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于深度学习的测距方法,在本发明基于深度学习的测距方法的第一实施例中,参照图1,所述基于深度学习的测距方法包括:
步骤S10,在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;
步骤S20,将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;
步骤S30,输出所述观测对象的目标位置。
具体步骤如下:
步骤S10,在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;
在本实施例中,基于深度学习的测距方法应用于基于深度学习的测距装置中,在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,可以对所述待识别测距图像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像,对所述待识别测距图像进行预处理的目的在于确保不同规格的待识别测距图像符合预设深度学习网络模型的初始输入规则。
预设对比度拉伸包括对待识别测距图像的影像图像与影像背景的亮度对比度的拉伸,该预设对比度可以是4倍不同亮度的对比度拉伸,另外,第一预设尺寸大小调整包括如大小缩小、大小扩大等操作。
用以具体实施例进行说明,在检测到两张不同大小的待识别测距图像时,若其中一张待识别测距图像大小为128*128*128的小图块,另一张待识别测距图像大小为64*64*64的小图块,而预设深度学习网络模型的初始输入图像块是100*100*100的规格要求时,对128*128*128的小图块进行缩小处理,对64*64*64的小图块进行扩大处理。
需要说明的是,是否存在预处理,以及是否存在预处理的其他方式,根据实际处理需求进行调整。
在本实施例中,在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合。
具体地,在测距过程中,各个观测点都对观测对象进行拍摄,实际上,是各个观测点的摄像头对观测对象进行拍摄,该各个观测点之间的位置关系,也即各个摄像头之间的位置关系是已知的,而摄像头的相机成像原理也是确定的,因而,能够根据相机的相机成像原理以及现有的各个观测点之间的位置关系,确定观测点的具体位置,但是目前,由于各个观测点之间的位置关系是会发生变化的,如由于年代久远摄像头偏离原来位置或者是由于人为因素如人为拉扯导致摄像头偏离原来位置,都会造成测距的不准确,在现有技术中,是不断进行摄像头的标定,因而,获取当前摄像头之间的误差,进而,进行测距,不断进行标定会造成操作的繁琐,并提升了对技术人员的要求,本实施例即是通过基于深度学习的测距方法进行测距,避免繁琐的标定过程。
具体地,在本实施例中,需要获取到各个观测点针对同一观测对象分别捕获的各个待识别测距图像,才能进行观测对象位置的确定,因而,为了避免错乱,需要将所述各个待识别测距图像关联,得到目标关联测距图像集合,具体关联方式包括:
方式一:通过确定的编号进行各个待识别测距图像关联;
方式二:根据各个待识别测距图像的观测对象的属性进行关联。
在关联各个待识别测距图像后,得到目标关联测距图像集合。
步骤S20,将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;
在得到目标关联测距图像集合后,将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型。具体地,所述预设深度学习网络模型是通过大数据训练完成后,得到的基于关联测距图像集合确定观测对象位置的模型。
具体地,参照图2,所述将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置步骤之前包括:
步骤S11,获取预设的视觉测距图像的图像用例,挑选预设比例的所述图像用例设为第一用例,将所述图像用例中所述第一用例外的其他用例设为第二用例;
获取预设的视觉测距图像的图像用例,例如,图像用例如下{[I11,I12,、、、y1],[I21,I22,、、、y2],...,[IN1,IN2,、、、yN]},其中,I11,I12、、、为各个观测点针对同一观测对象分别捕获的图像,y2为观测对象的实际位置,挑选预设比例的所述图像用例设为第一用例,将所述图像用例中所述第一用例外的其他用例设为第二用例;
在本实施例中,预先存储有视觉测距图像的图像用例,挑选预设比例的所述图像用例设为第一用例,将所述图像用例中所述第一用例外的其他用例设为第二用例,需要说明的是,该图像用例可以通过有放回方式组成多个第一用例以及对应多个第二用例,例如,共有N个图像用例,每次从中随机挑选70%的图像用例作为第一用例,剩下的30%的图像用例作为第一用例,以得到多个第一用例与多个第二用例,得到多个第一用例以及对应多个第二用例的目的在于确保训练模型过程中的客观性。
步骤S12,将所述第一用例作为训练用例进行所述预设深度学习网络模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数;
将所述第一用例作为训练用例进行所述预设深度学习网络模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数,其中,测距函数是预存的确定的,所述标定参数包括摄像头(相机)之间的位置距离等。
具体地,所述将所述第一用例作为训练用例进行所述预设深度学习网络模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数步骤包括:
步骤S121,将所述第一用例作为训练用例输入至所述基础识别网络模型中;
步骤S122,对所述第一用例中的各个关联测距图像集合中的各个关联测距图像分别进行预设次数的卷积与最大池化交替处理,得到初始处理结果;
在本实施例中,将所述第一用例作为训练用例输入至所述基础识别网络模型中,对所述第一用例中的各个关联测距图像集合中的各个关联测距图像进行预设次数的卷积与最大池化交替处理,得到初始处理结果,其中,预设次数可以为3次。
具体地,所述对所述第一用例中的各个关联测距图像集合中的各个关联测距图像分别进行预设次数的卷积与最大池化交替处理,得到初始处理结果步骤包括:
步骤A1,获取预设的各个观测对象的各个图像权值矩阵,根据所述各个图像权值矩阵对所述各个关联测距图像分别进行卷积处理,得到卷积处理结果;
其中,卷积过程可以理解为:图像的一部分的征象特征与其他部分是一样的,即是在这一部分学习的征象特征也能出现在相应另一部分上,因而将学习到的征象特征作为探测器,应用到这个图像的任意地方中去,即通过小范围图像所学习到的征象特征跟原本的大尺寸的图像作卷积,在数学上,卷积可以是相应图像的特性矩阵与预先的多个征象特征对应探测矩阵相乘最后再图像权值求和,得到卷积处理结果。
在本实施例中,获取预设的各个观测对象的各个图像权值矩阵,根据所述各个图像权值矩阵对所述各个关联测距图像分别进行卷积处理,得到卷积处理结果。
步骤A2,对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果;
对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果;
也即在得到卷积处理结果后,继续进行最大池化处理而不是平均池化处理。
所述对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果步骤包括:
步骤B1,将所述卷积处理结果分割为多个大小一致的预设尺寸的图像矩阵;
例如将所述卷积处理结果分割为多个5*5*5维的图像矩阵。
步骤B2,获取所述预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述预设尺寸的图像矩阵,以得到新的图像矩阵;
步骤B3,将所述新的图像矩阵设为所述最大池化处理结果。
具体地,获取所述预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述预设尺寸的图像矩阵,以得到新的图像矩阵,如5*5*5维的图像矩阵中最大像素值为1,则将1代替所述5*5*5维的图像矩阵,由于卷积处理结果中包括多个5*5*5维的图像矩阵,因而,最后能够得到新的图像矩阵。
步骤A3,根据所述预设次数,对所述最大池化处理结果再次进行相应次数的卷积与最大池化交替处理,并进行预设激活函数的激活处理以得到初始处理结果。
上述B1-B3为一次卷积以及最大池化交替处理过程,在本实施例中,需要进行预设次数的卷积以及最大池化的交替处理过程,并进行预设激活函数的激活处理以得到初始处理结果,其中,激活函数可以为为sigmoid函数。
步骤S123,基于预设的各个各个观测点之间的位置关系、每个关联测距图像集合中所述初始处理结果中的图像大小,以及每个关联测距图像集合分别对应的观测对象的确定位置,有序调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数。
在得到初始处理结果后,获取初始处理结果后得到的图像,以及图像大小,基于预设的各个各个观测点之间的位置关系、每个关联测距图像集合中所述初始处理结果中的图像大小,以及每个关联测距图像集合分别对应的观测对象的确定位置,有序调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数。
步骤S13,将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述预设深度学习网络模型。
在训练完成后,将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,若测试确定该调整训练后的所述基础识别网络模型的测试的测试准确度大于预设准确度时,将所述调整训练后的所述基础识别网络模型作为目标识别型,其中,若测试确定该调整训练后的所述基础识别网络模型的测试的测试准确度小于预设准确度时,继续训练调整所述调整训练后的所述基础识别网络模型,以最终训练得到预设深度学习网络模型。
在得到预设深度学习网络模型后,确定所述观测对象的目标位置即可。
步骤S30,输出所述观测对象的目标位置。
在确定所述观测对象的目标位置后,输出所述观测对象的目标位置即可。
本发明通过在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;输出所述观测对象的目标位置。在本申请中,深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型,也即深度学习网络模型是通过采集大量的图像样本以及对应的位置样本后,能够准确确定观测对象位置的模型,因而,在本申请中,不在需要繁琐的标定过程,也即,在深度学习网络模型的训练过程中,已经隐含了标定过程,因而,只要在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置即可,因而,减少了测距过程中标定的流程,进而解决了现有技术中需要繁琐的标定过程才能测距的技术问题。
进一步地,本发明提供基于深度学习的影像识别方法的另一实施例,在该实施例中,所述在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合步骤包括:
步骤C1,在接收到两个观测点的双目摄像机针对同一观测对象分别捕获的两个待识别测距图像时,将所述两个待识别测距图像关联,得到目标关联测距图像集合;
步骤C2,在接收到两个以上观测点的多目摄像机针对同一观测对象分别捕获的多个待识别测距图像时,将所述多个待识别测距图像关联,得到目标关联测距图像集合。
目标关联测距图像集合可以由两个待识别测距图像关联得到,也可以由多个即两个以上待识别测距图像关联得到,在接收到两个观测点的双目摄像机针对同一观测对象分别捕获的两个待识别测距图像时,将所述两个待识别测距图像关联,得到目标关联测距图像集合,在接收到两个以上观测点的多目摄像机针对同一观测对象分别捕获的多个待识别测距图像时,将所述多个待识别测距图像关联,得到目标关联测距图像集合,在本实施例中,在得到多目或者双目待识别测距图像时,均可以得到同一观测对象的目标位置。
参照图3,图3是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例基于深度学习的测距设备可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等终端设备。
如图3所示,该基于深度学习的测距设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该基于深度学习的测距设备还可以包括目标用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。目标用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选目标用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的基于深度学习的测距设备结构并不构成对基于深度学习的测距设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及基于深度学习的测距程序。操作系统是管理和控制基于深度学习的测距设备硬件和软件资源的程序,支持基于深度学习的测距程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与基于深度学习的测距设备中其它硬件和软件之间通信。
在图3所示的基于深度学习的测距设备中,处理器1001用于执行存储器1005中存储的基于深度学习的测距程序,实现上述任一项所述的基于深度学习的测距方法的步骤。
本发明基于深度学习的测距设备具体实施方式与上述基于深度学习的测距方法各实施例基本相同,在此不再赘述。
本发明还提供一种基于深度学习的测距装置,所述基于深度学习的测距装置包括:
接收模块,用于在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;
输入模块,用于将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;
输出模块,用于输出所述观测对象的目标位置。
本发明基于深度学习的测距装置具体实施方式与上述基于深度学习的测距方法各实施例基本相同,在此不再赘述。
本发明提供了一种存储介质,所述存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于深度学习的测距方法的步骤。
本发明存储介质具体实施方式与上述基于深度学习的测距方法各实施例基本相同,在此不再赘述。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利处理范围内。

Claims (10)

1.一种基于深度学习的测距方法,其特征在于,所述基于深度学习的测距方法包括:
在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;
将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;
输出所述观测对象的目标位置。
2.如权利要求1所述的基于深度学习的测距方法,其特征在于,所述将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置步骤之前包括:
获取预设的视觉测距图像的图像用例,挑选预设比例的所述图像用例设为第一用例,将所述图像用例中所述第一用例外的其他用例设为第二用例;
将所述第一用例作为训练用例进行所述预设深度学习网络模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数;
将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述预设深度学习网络模型。
3.如权利要求2所述的基于深度学习的测距方法,其特征在于,所述将所述第一用例作为训练用例进行所述预设深度学习网络模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数步骤包括:
将所述第一用例作为训练用例输入至所述基础识别网络模型中;
对所述第一用例中的各个关联测距图像集合中的各个关联测距图像分别进行预设次数的卷积与最大池化交替处理,得到初始处理结果;
基于预设的各个各个观测点之间的位置关系、每个关联测距图像集合中所述初始处理结果中的图像大小,以及每个关联测距图像集合分别对应的观测对象的确定位置,有序调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数。
4.如权利要求3所述的基于深度学习的测距方法,其特征在于,所述对所述第一用例中的各个关联测距图像集合中的各个关联测距图像分别进行预设次数的卷积与最大池化交替处理,得到初始处理结果步骤包括:
获取预设的各个观测对象的各个图像权值矩阵,根据所述各个图像权值矩阵对所述各个关联测距图像分别进行卷积处理,得到卷积处理结果;
对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果;
根据所述预设次数,对所述最大池化处理结果再次进行相应次数的卷积与最大池化交替处理,并进行预设激活函数的激活处理以得到初始处理结果。
5.如权利要求4所述的基于深度学习的测距方法,其特征在于,所述对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果步骤包括:
将所述卷积处理结果分割为多个大小一致的预设尺寸的图像矩阵;
获取所述预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述预设尺寸的图像矩阵,以得到新的图像矩阵;
将所述新的图像矩阵设为所述最大池化处理结果。
6.如权利要求1所述的基于深度学习的测距方法,其特征在于,所述在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合步骤包括:
在接收到两个观测点的双目摄像机针对同一观测对象分别捕获的两个待识别测距图像时,将所述两个待识别测距图像关联,得到目标关联测距图像集合;
在接收到两个以上观测点的多目摄像机针对同一观测对象分别捕获的多个待识别测距图像时,将所述多个待识别测距图像关联,得到目标关联测距图像集合。
7.一种基于深度学习的测距装置,其特征在于,所述基于深度学习的测距装置包括:
接收模块,用于在接收到各个观测点针对同一观测对象分别捕获的各个待识别测距图像时,将所述各个待识别测距图像关联,得到目标关联测距图像集合;
输入模块,用于将所述目标关联测距图像集合输入至预设深度学习网络模型中,以确定所述观测对象的目标位置,其中,所述预设深度学习网络模型是已经训练完成的基于关联测距图像集合确定观测对象位置的模型;
输出模块,用于输出所述观测对象的目标位置。
8.如权利要求7所述的基于深度学习的测距装置,其特征在于,所述基于深度学习的测距装置还包括:
获取模块,用于获取预设的视觉测距图像的图像用例,挑选预设比例的所述图像用例设为第一用例,将所述图像用例中所述第一用例外的其他用例设为第二用例;
调整训练模块,用于将所述第一用例作为训练用例进行所述预设深度学习网络模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述视觉测距图像的测距函数中的标定参数,以及校正拟合函数;
测试模块,用于将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述预设深度学习网络模型。
9.一种基于深度学习的测距设备,其特征在于,所述基于深度学习的测距设备包括:存储器、处理器,通信总线以及存储在所述存储器上的基于深度学习的测距程序,
所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述基于深度学习的测距程序,以实现如权利要求1至6中任一项所述的基于深度学习的测距方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有基于深度学习的测距程序,所述基于深度学习的测距程序被处理器执行时实现如权利要求1至6中任一项所述的基于深度学习的测距方法的步骤。
CN201910119576.2A 2019-02-16 2019-02-16 基于深度学习的测距方法、装置、设备及存储介质 Active CN109859216B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910119576.2A CN109859216B (zh) 2019-02-16 2019-02-16 基于深度学习的测距方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910119576.2A CN109859216B (zh) 2019-02-16 2019-02-16 基于深度学习的测距方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109859216A true CN109859216A (zh) 2019-06-07
CN109859216B CN109859216B (zh) 2021-06-25

Family

ID=66898114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910119576.2A Active CN109859216B (zh) 2019-02-16 2019-02-16 基于深度学习的测距方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109859216B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110336991A (zh) * 2019-06-28 2019-10-15 深圳数位传媒科技有限公司 一种基于双目相机的环境提示方法及装置
CN112137591A (zh) * 2020-10-12 2020-12-29 平安科技(深圳)有限公司 基于视频流的目标物位置检测方法、装置、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0665507A1 (en) * 1994-01-14 1995-08-02 Hughes Aircraft Company Position and orientation estimation neural network system and method
CN103852692A (zh) * 2014-03-12 2014-06-11 昆明理工大学 一种基于高频量衰减特性的特高压直流输电线路神经网络双端故障测距方法
CN105913410A (zh) * 2016-03-03 2016-08-31 华北电力大学(保定) 一种基于机器视觉的远距离运动物体高度测量的装置与方法
CN107392965A (zh) * 2017-07-24 2017-11-24 王华锋 一种基于深度学习和双目立体视觉相结合的测距方法
CN107844750A (zh) * 2017-10-19 2018-03-27 华中科技大学 一种水面全景图像目标检测识别方法
CN108596116A (zh) * 2018-04-27 2018-09-28 深圳市商汤科技有限公司 测距方法、智能控制方法及装置、电子设备和存储介质
CN108596058A (zh) * 2018-04-11 2018-09-28 西安电子科技大学 基于计算机视觉的行车障碍物测距方法
US10134146B2 (en) * 2016-01-14 2018-11-20 RetailNext, Inc. Detecting, tracking and counting objects in videos
CN109029363A (zh) * 2018-06-04 2018-12-18 泉州装备制造研究所 一种基于深度学习的目标测距方法
CN109345569A (zh) * 2018-10-30 2019-02-15 安徽虚空位面信息科技有限公司 基于多视角图像采集的人体运动捕捉系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0665507A1 (en) * 1994-01-14 1995-08-02 Hughes Aircraft Company Position and orientation estimation neural network system and method
CN103852692A (zh) * 2014-03-12 2014-06-11 昆明理工大学 一种基于高频量衰减特性的特高压直流输电线路神经网络双端故障测距方法
US10134146B2 (en) * 2016-01-14 2018-11-20 RetailNext, Inc. Detecting, tracking and counting objects in videos
CN105913410A (zh) * 2016-03-03 2016-08-31 华北电力大学(保定) 一种基于机器视觉的远距离运动物体高度测量的装置与方法
CN107392965A (zh) * 2017-07-24 2017-11-24 王华锋 一种基于深度学习和双目立体视觉相结合的测距方法
CN107844750A (zh) * 2017-10-19 2018-03-27 华中科技大学 一种水面全景图像目标检测识别方法
CN108596058A (zh) * 2018-04-11 2018-09-28 西安电子科技大学 基于计算机视觉的行车障碍物测距方法
CN108596116A (zh) * 2018-04-27 2018-09-28 深圳市商汤科技有限公司 测距方法、智能控制方法及装置、电子设备和存储介质
CN109029363A (zh) * 2018-06-04 2018-12-18 泉州装备制造研究所 一种基于深度学习的目标测距方法
CN109345569A (zh) * 2018-10-30 2019-02-15 安徽虚空位面信息科技有限公司 基于多视角图像采集的人体运动捕捉系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUSTINAS MISEIKIS ET AL: "Multi-Objective Convolutional Neural Networks for Robot Localisation and 3D Position Estimation in 2D Camera Images", 《2018 15TH INTERNATIONAL CONFERENCE ON UBIQUITOUS ROBOTS (UR)》 *
张达峰等: "基于深度学习的智能辅助驾驶系统", 《电子科技》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110336991A (zh) * 2019-06-28 2019-10-15 深圳数位传媒科技有限公司 一种基于双目相机的环境提示方法及装置
CN110336991B (zh) * 2019-06-28 2021-07-13 深圳数位传媒科技有限公司 一种基于双目相机的环境提示方法及装置
CN112137591A (zh) * 2020-10-12 2020-12-29 平安科技(深圳)有限公司 基于视频流的目标物位置检测方法、装置、设备及介质

Also Published As

Publication number Publication date
CN109859216B (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN109859216A (zh) 基于深度学习的测距方法、装置、设备及存储介质
CN104427252B (zh) 用于合成图像的方法及其电子设备
CN107491771A (zh) 人脸检测方法和装置
CN105874776A (zh) 图像处理设备和方法
CN108197618A (zh) 用于生成人脸检测模型的方法和装置
CN106791809B (zh) 一种测光方法及移动终端
CN107871011A (zh) 图像处理方法、装置、移动终端及计算机可读存储介质
CN108229288B (zh) 神经网络训练及衣服颜色检测方法、装置、存储介质、电子设备
CN107687841A (zh) 一种测距方法及装置
CN105959593B (zh) 一种拍照设备的曝光方法及拍照设备
CN107633526A (zh) 一种图像跟踪点获取方法及设备、存储介质
CN108337505A (zh) 信息获取方法和装置
CN108174185A (zh) 一种拍照方法、装置及终端
CN108091288A (zh) 显示屏均匀性的测试方法、终端及计算机可读存储介质
CN107967459A (zh) 卷积处理方法、装置及存储介质
CN107888838A (zh) 用于处理图像的方法及支持该方法的电子设备
CN110930329A (zh) 星空图像处理方法及装置
CN107341442A (zh) 运动控制方法、装置、计算机设备和服务机器人
CN110084113A (zh) 活体检测方法、装置、系统、服务器及可读存储介质
CN108230312A (zh) 一种图像分析方法、设备和计算机可读存储介质
CN110291775A (zh) 一种跟踪拍摄方法、设备及存储介质
Chang et al. SalGaze: Personalizing gaze estimation using visual saliency
CN107179181A (zh) 显示屏均匀性的测试方法、终端及计算机可读存储介质
CN109410211A (zh) 一种图像中目标物体的分割方法及装置
CN110427998A (zh) 模型训练、目标检测方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant