CN116228834B - 图像深度获取方法、装置、电子设备及存储介质 - Google Patents

图像深度获取方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116228834B
CN116228834B CN202211641500.4A CN202211641500A CN116228834B CN 116228834 B CN116228834 B CN 116228834B CN 202211641500 A CN202211641500 A CN 202211641500A CN 116228834 B CN116228834 B CN 116228834B
Authority
CN
China
Prior art keywords
optical flow
information
position value
initial
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211641500.4A
Other languages
English (en)
Other versions
CN116228834A (zh
Inventor
张志远
王煜安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apollo Zhilian Beijing Technology Co Ltd
Original Assignee
Apollo Zhilian Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apollo Zhilian Beijing Technology Co Ltd filed Critical Apollo Zhilian Beijing Technology Co Ltd
Priority to CN202211641500.4A priority Critical patent/CN116228834B/zh
Publication of CN116228834A publication Critical patent/CN116228834A/zh
Application granted granted Critical
Publication of CN116228834B publication Critical patent/CN116228834B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • G06T2207/30256Lane; Road marking

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本公开提供了一种图像深度获取方法、装置、电子设备及存储介质,具体为智能交通和深度学习技术领域。具体实现方案为:采集道路标志物的多帧图像,根据多帧图像,确定与道路标志物对应的目标光流信息,根据目标光流信息,从每帧图像中识别参考像素信息,以及根据多个参考像素信息,确定道路标志物的图像深度。可以基于光流估计提取道路标志物的目标光流信息以进行图像深度的求解,由于目标光流信息为准确的道路标志物的光流数据,从而可以有效提升道路标志物的图像深度求解的准确性,辅助提升道路标志物定位的准确性。

Description

图像深度获取方法、装置、电子设备及存储介质
技术领域
本公开涉及人工智能技术领域,具体涉及智能交通和深度学习技术领域,尤其涉及一种图像深度获取方法、装置、电子设备及存储介质。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术,以及机器学习、深度学习、大数据处理技术、知识图谱技术等几大方向。
相关技术中,通常是采用将感知到的道路标志物的图像数据与环境地图中的道路标志物数据进行匹配,以确定道路标志物的当前位姿。
发明内容
本公开提供了一种图像深度获取方法、装置、电子设备、存储介质及计算机程序产品。
根据本公开的第一方面,提供了一种图像深度获取方法,包括:采集道路标志物的多帧图像;根据多帧图像,确定与道路标志物对应的目标光流信息;根据目标光流信息,从每帧图像中识别参考像素信息;以及根据多个参考像素信息,确定道路标志物的图像深度。
根据本公开的第二方面,提供了一种图像深度获取装置,包括:获取模块,用于采集道路标志物的多帧图像;第一确定模块,用于根据多帧图像,确定与道路标志物对应的目标光流信息;识别模块,用于根据目标光流信息,从每帧图像中识别参考像素信息;以及第二确定模块,用于根据多个参考像素信息,确定道路标志物的图像深度。
根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开第一方面实施例的图像深度获取方法。
根据本公开的第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本公开第一方面实施例的图像深度获取方法。
根据本公开的第五方面,提出了一种计算机程序产品,包括计算机程序,当计算机程序由处理器执行时实现本公开第一方面实施例的图像深度获取方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是本公开实施例中的光流估计的处理流程图;
图3是本公开实施中的图像深度求解流程图;
图4是根据本公开第二实施例的示意图;
图5是根据本公开第三实施例的示意图;
图6是根据本公开第四实施例的示意图;
图7是根据本公开第五实施例的示意图;
图8是本公开实施例中的基于图像三角化的深度估计示意图;
图9是根据本公开第六实施例的示意图;
图10是根据本公开第七实施例的示意图;
图11示出了可以用来实施本公开的实施例的图像深度获取方法的示例电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本公开第一实施例的示意图。
其中,需要说明的是,本实施例的图像深度获取方法的执行主体为图像深度获取装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。
本公开实施例涉及人工智能技术领域,具体涉及和技术领域。
其中,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
智能交通,是将先进的科学技术(信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术、自动控制理论、运筹学、人工智能等)有效地综合运用于交通运输、服务控制和车辆制造,加强车辆、道路、使用者三者之间的联系的技术。
深度学习,是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
如图1所示,该图像深度获取方法,包括:
S101:采集道路标志物的多帧图像。
其中,道路标志物,是指车道旁的交通标志物,该道路标志物例如可以为车道旁的交通杆和交通牌等,或者还可以为道路上的任意交通标志图,对此不做限制。
本公开实施例中,在采集道路标志物的多帧图像时,可以在车辆行进过程中,利用装载在车辆中的车载摄像装置对道路标志物进行拍摄,以拍摄得到多帧包含道路标志物的图像,并将拍摄到的图像作为道路标志物的多帧图像,该道路标志物的多帧图像可以为连续多帧图像,在对图像进行处理时,可以以每连续两帧图像为单位进行处理。
另一些实施例中,在采集道路标志物的多帧图像时,如果车辆的行进速度较慢,则采集到的道路标志物的多帧图像可以不是连续帧图像,采集到的图像中均包含同一个道路标志物即可。
S102:根据多帧图像,确定与道路标志物对应的目标光流信息。
其中,目标光流信息,是指道路标志物中的所有像素点在多帧图像中形成的光流数据,该光流数据包含每一个道路标志物的像素点在多帧图像中形成的光流向量,光流向量为同一个道路标志物中的像素点在连续两帧图像中形成的位移向量,光流向量的起始点在连续两帧图像中的第一帧图像中,光流向量的终止点在连续两帧图像中的第二帧图像中。
本公开实施例在上述采集道路标志物的多帧图像之后,可以根据多帧图像,确定与道路标志物对应的目标光流信息。
本公开实施例中,在根据多帧图像,确定与道路标志物对应的目标光流信息时,可以对道路标志物的连续两帧图像进行光流估计处理,得到连续两帧图像中像素点的稠密光流数据,该稠密光流数据为对两帧图像中的每一个像素点做光流估计处理得到的光流数据,而后可以对多帧图像中的第一帧图像进行道路标志物的目标感知处理,以得到道路标志物的像素点在图像中的位置信息,根据位置信息从图像的稠密光流数据中,选取道路标志物中的像素点对应的像素光流数据,而后可以对像素光流数据中估计错误的异常光流数据进行去除处理,将去除异常光流数据后的像素光流数据作为与道路标志物对应的目标光流信息。
本公开实施例中,在对道路标志物的连续两帧图像进行光流估计处理,得到连续两帧图像中的稠密光流数据时,可以采用基于深度学习的光流估计神经网络(RecurrentAll-Pairs Field Transforms,RAFT)对连续两帧道路标志物的图像进行处理,以得到连续两帧图像中像素点的稠密光流数据。
举例而言,如图2所示,图2是本公开实施例中的光流估计的处理流程图,首先可以将连续两帧道路标志物的图像输入至基于深度学习的光流估计神经网络RAFT中进行图像中的像素特征提取,RAFT网络使用了两个共享权值的卷积神经网络分别对连续两帧图像进行特征编码处理,以从两幅图像中提取像素特征,卷积神经网络的架构由6个残差层组成,并且每隔一层分辨率就降低一半,同时通道数量也在增加,并且同样的卷积神经网络架构也用于上下文网络,上下文网络仅对第一帧图像进行纹理编码处理,从第一张图像中提取特征,上下文网络在归一化方法上与进行特征编码的特征提取器不同,特征提取器使用实例归一化,而上下文网络使用批处理归一化,而后可以对特征编码后得到的特征图进行视觉相似度计算,计算所有特征图对的内积,以得到一个称为相关卷的四维张量,该四维张量提供了关于像素位移的关键信息,在RAFT光流估计神经网络中进行图像处理时是计算两个特征图的全相关性,没有任何固定大小的窗口,而两个特征之间的相关性通过向量内积进行计算,将得到的四维张量的最后两个维度用大小为1、2、4、8的核进行池化,构建4层相关金字塔,利用相关性金字塔建立多尺度图像特征相似度,使突变运动更明显,同时金字塔同时提供了关于小位移和大位移的信息,而后可以对池化后的特征向量进行迭代更新处理,迭代更新是一个门控循环单元序列,具有共享权重的可训练卷积层,结合之前每一次计算的所有历史信息,对图像中像素点的光流进行多次迭代更新计算,每次更新迭代产生一个新的光流数据Δf,以使每一个迭代更新的新步骤中的光流预测更准确,fk+1k+Δf,在达到设定的残差标准后,将网络输出的光流数据作为连续两帧图像中所有对应位置上的像素点的稠密光流数据。
S103:根据目标光流信息,从每帧图像中识别参考像素信息。
其中,参考像素信息,是指从每一帧图像中提取的可以用于代表道路标志物的标识点信息,可以根据该参考像素信息求解道路标志物的图像深度。
本公开实施例在上述根据多帧图像,确定与道路标志物对应的目标光流信息之后,可以根据目标光流信息,从每帧图像中识别参考像素信息。
本公开实施例中,在根据目标光流信息,从每帧图像中识别参考像素信息时,可以对目标光流信息中道路标志物对应的像素光流向量进行分析,得到所有像素光流向量在第一帧图像中的起始点坐标值,以及所有像素光流向量在第二帧图像中的终止点坐标值,对所有起始点坐标值取平均值,得到平均坐标值对应的均值起始像素点,对所有终止点坐标值取平均值,得到平均坐标值对应的均值终止像素点,将计算求解得到的均值起始像素点和均值终止像素点作为参考像素信息,以实现目标光流信息,从每帧图像中识别参考像素信息。
S104:根据多个参考像素信息,确定道路标志物的图像深度。
其中,图像深度,是指可以用于标识道路标志物相对于车辆的三维空间位置的数据信息,该图像深度可以为道路标志物与车辆间距离信息。
本公开实施在上述根据目标光流信息,从每帧图像中识别参考像素信息之后,可以根据多个参考像素信息,确定道路标志物的图像深度。
本公开实施例中,在根据多个参考像素信息,确定道路标志物的图像深度时,可以获取多个参考像素信息中道路标志物对应的均值起始像素点和均值终止像素点,而后获取车载摄像装置中拍摄第一帧图像和第二帧图像时,车载摄像装置的相对位姿信息,根据相对位姿信息对均值起始像素点和均值终止像素点进行图像三角化处理,以得到道路标志物与车辆间距离信息,将该距离信息作为道路标志物的图像深度。
举例而言,如图3所示,图3是本公开实施中的图像深度求解流程图,首先可以将拍摄到的道路标志物的连续两帧图像输入至基于深度学习的光流估计神经网络中进行处理,得到神经网络输出的图像中所有像素点的稠密光流数据,而后对连续两帧图像中的第一帧图像进行目标感知处理,以得到道路标志物的像素点在图像中位置信息,实现对图像中道路标志物对应的像素点的局部稠密光流的选定,而后设置后端优化模块对局部稠密光流数据中的光流外点进行滤除,该光流外点为对图像像素点进行光流估计时出现估计错误的光流数据,得到道路标志物的像素点对应的目标光流信息,而后可以根据目标光流信息从每帧图像中分别提取一个用于代表道路标志物的目标点作为参考像素信息,而后对参考像素信息中的目标点进行图像三角化处理,以求解道路标志物的图像深度。
本实施例中,通过采集道路标志物的多帧图像,根据多帧图像,确定与道路标志物对应的目标光流信息,根据目标光流信息,从每帧图像中识别参考像素信息,以及根据多个参考像素信息,确定道路标志物的图像深度,可以基于光流估计提取道路标志物的目标光流信息以进行图像深度的求解,由于目标光流信息为准确的道路标志物的光流数据,从而可以有效提升道路标志物的图像深度求解的准确性,辅助提升道路标志物定位的准确性。
图4是根据本公开第二实施例的示意图。
如图4所示,该图像深度获取方法,包括:
S401:采集道路标志物的多帧图像。
S401描述说明可以示例参见上述实施例,在此不再赘述。
S402:根据多帧图像,确定与道路标志物对应的初始光流信息。
其中,初始光流信息,是指未对道路标志物中的像素点对应的局部稠密光流数据进行异常数据滤除之前的光流信息,该初始光流信息可以包括对道路标志物中的像素点进行光流估计后得到的所有光流向量。
本公开实施例中,在根据多帧图像,确定与道路标志物对应的初始光流信息时,可以将多帧图像输入至基于深度学习的光流估计神经网络中进行光流估计处理,得到图像中所有像素点的稠密光流数据,而后对第一帧图像进行道路标志物的目标感知处理,得到道路标志物的位置信息,根据位置信息提取道路标志物中的像素点对应的局部稠密光流数据,将该局部稠密光流数据作为与道路标志物对应的初始光流信息。
可选地,一些实施例中,多帧图像至少包括:相邻帧的第一图像和第二图像,道路标志物具有对应的多个像素点,在根据多帧图像,确定与道路标志物对应的初始光流信息时,可以确定每个像素点在第一图像中的第一位置值,确定每个像素点在第二图像中的第二位置值,根据第一位置信息和第二位置信息,生成与像素点对应的像素光流向量,将多个像素光流向量作为初始光流信息,从而可以基于深度学习对多帧图像进行光流估计处理,对道路标志物所在的局部稠密光流进行提取,以进行后续的道路标志物的图像深度求解,由于采用深度学习的方式进行光流估计,从而可以有效提升对道路标志物进行光流估计的时间效率。
其中,多帧图像至少包括:相邻帧的第一图像和第二图像,第一图像和第二图像为车辆行进过程中,车载摄像装置拍摄到的连续两帧图像。
其中,第一位置值,是指每个像素点在第一图像中的光流向量起始点的二维坐标值。
其中,第二位置值,是指每个像素点在第二图像中的光流向量终止点的二维坐标值。
其中,像素光流向量,是指道路标志物同一个位置的像素点在第一图像和第二图像中形成的位移向量,该像素光流向量的起始点在第一图像中,终止点在第二图像中。
本公开实施例中,在根据多帧图像,确定与道路标志物对应的初始光流信息时,可以确定道路标志物对应的每个像素点在第一图像中的光流向量起始点的二维坐标值作为对应像素点的第一位置值,确定道路标志物对应的每个像素点在第二图像中的光流向量终止点的二维坐标值作为对应像素点的第二位置值,而后可以根据第一位置值和第二位置值生成对应像素点的像素光流向量,将多个像素光流向量作为初始光流信息。
S403:从初始光流信息中识别异常光流信息。
其中,异常光流信息,是指对图像进行光流估计时,估计错误的光流信息。
本公开实施例中在上述根据多帧图像,确定与道路标志物对应的初始光流信息之后,可以从初始光流信息中识别异常光流信息。
本公开实施例中,在从初始光流信息中识别异常光流信息时,可以设置一个后端优化模块,对初始光流信息中的光流外点数据进行滤除处理,其中,光流外点数据为对图像进行光流估计时,估计错误的光流数据,利用后算优化模块中的光流外点识别算法识别估计错误的光流数据,并将该估计错误的光流数据作为异常光流信息。
可选地,一些实施例中,在从初始光流信息中识别异常光流信息时,可以对多个像素光流向量取均值,得到初始均值光流向量,根据初始均值光流向量,从初始光流信息中识别异常光流信息,由于估计正确的光流数据占主要的比重,光流数据中仅有少量的异常光流数据,从而初始均值光流向量可以较为准确的表示整体的正确光流,基于初始均值光流向量从初始光流信息中识别异常光流信息,可以保证异常光流信息识别的全面性和准确性。
其中,初始均值光流向量,是指对多个像素光流向量取均值得到的均值向量,由于估计正确的光流向量占初始光流信息中的像素光流向量的主要比重,仅有少量的异常像素光流向量,初始均值光流向量可以较为准确的表示整体的正确光流向量,初始均值光流向量可以用于识别初始光流信息中的异常光流信息。
本公开实施例中,在从初始光流信息中识别异常光流信息时,可以对多个像素光流向量取均值,得到计算后的均值向量,将该均值向量作为初始均值光流向量,根据初始均值光流向量,从初始光流信息中识别与初始均值光流向量偏离较远的异常光流向量,将识别到的异常光流向量作为异常光流信息,以实现根据初始均值光流向量,从初始光流信息中识别异常光流信息。
S404:对初始光流信息中异常光流信息进行去除,以得到目标光流信息。
本公开实施例在上述根据多帧图像,确定与道路标志物对应的初始光流信息,并从初始光流信息中识别异常光流信息之后,可以对初始光流信息中异常光流信息进行去除,以得到目标光流信息。
本公开实施例中,在对初始光流信息中异常光流信息进行去除,以得到目标光流信息时,可以对初始光流信息中的多个像素光流向量中的异常光流向量进行去除处理,将去除异常光流向量后的所有像素光流向量作为目标光流信息。
本实施例中,通过根据多帧图像,确定与道路标志物对应的初始光流信息,从初始光流信息中识别异常光流信息,对初始光流信息中异常光流信息进行去除,以得到目标光流信息,由于道路标志物的图像数据是全新环境下的感知数据,初始估计的光流可能在少数位置存在误差较大、甚至发散的现象,对对初始光流信息中异常光流信息进行去除,可以保证后续对道路标志物进行图像深度求解的准确性,同时无需使用训练数据标注的高昂成本对深度学习网络进行训练,有效提高了光流算法在此道路标志物的图像深度求解任务上的对新的环境的泛化能力。
S405:根据目标光流信息,从每帧图像中识别参考像素信息。
S406:根据多个参考像素信息,确定道路标志物的图像深度。
针对S405和S406描述说明可以示例参见上述实施例,在此不再赘述。
本实施例中,通过采集道路标志物的多帧图像,根据多帧图像,确定与道路标志物对应的目标光流信息,根据目标光流信息,从每帧图像中识别参考像素信息,以及根据多个参考像素信息,确定道路标志物的图像深度,可以基于光流估计提取道路标志物的目标光流信息以进行图像深度的求解,由于目标光流信息为准确的道路标志物的光流数据,从而可以有效提升道路标志物的图像深度求解的准确性,辅助提升道路标志物定位的准确性,通过根据多帧图像,确定与道路标志物对应的初始光流信息,从初始光流信息中识别异常光流信息,对初始光流信息中异常光流信息进行去除,以得到目标光流信息,由于道路标志物的图像数据是全新环境下的感知数据,初始估计的光流可能在少数位置存在误差较大、甚至发散的现象,对对初始光流信息中异常光流信息进行去除,可以保证后续对道路标志物进行图像深度求解的准确性,同时无需使用训练数据标注的高昂成本对深度学习网络进行训练,有效提高了光流算法在此道路标志物的图像深度求解任务上的对新的环境的泛化能力。
图5是根据本公开第三实施例的示意图。
如图5所示,该图像深度获取方法,包括:
S501:采集道路标志物的多帧图像。
S502:根据多帧图像,确定与道路标志物对应的初始光流信息。
S503:对多个像素光流向量取均值,得到初始均值光流向量。
针对S501至S503描述说明可以示例参见上述实施例,在此不再赘述。
S504:确定每个像素光流向量与初始均值光流向量之间的光流向量夹角。
本公开实施中,在根据初始均值光流向量,从初始光流信息中识别异常光流信息时,可以确定每个像素光流向量与初始均值光流向量之间的光流向量夹角,举例而言,设估计的初始光流信息中的像素光流向量的集合为F={f1,…,fi,…,fN},则初始均值光流向量为对于每个像素光流向量i=[1,N],计算第i个像素光流向量初始均值光流向量/>的夹角/>并将计算得到的夹角作为每个像素光流向量与初始均值光流向量之间的光流向量夹角。
S505:如果光流向量夹角大于夹角阈值,则确定光流向量夹角对应的像素光流向量为异常光流向量。
其中,异常光流向量,是指估计不准确的、受到遮挡物干扰的或者受相似背景环境影响的光流向量。
本公开实施例中,可以将每个像素光流向量与初始均值光流向量之间的光流向量夹角与夹角阈值εθ进行对比,如果光流向量夹角大于夹角阈值,则确定光流向量夹角对应的像素光流向量为异常光流向量。
举例而言,第i个像素光流向量与初始均值光流向量的光流向量夹角/> 如果|αi≤εθ|,则像素光流向量fi的估计正确的内点光流,否则,fi外点光流为,也即是本公开实施例中的异常光流向量。
S506:将至少一个异常光流向量作为异常光流信息。
本公开实施例在上述确定得到异常光流向量之后,可以将至少一个异常光流向量作为异常光流信息。
本实施例中,通过确定每个像素光流向量与初始均值光流向量之间的光流向量夹角,如果光流向量夹角大于夹角阈值,则确定光流向量夹角对应的像素光流向量为异常光流向量,将至少一个异常光流向量作为异常光流信息,由于观察到的正确的光流估计的方向应当是一致的,道路标志物上的局部光流方向也是一致的,通过每个像素光流向量与初始均值光流向量之间的光流向量夹角进行计算,并设置夹角阈值对突变的光流方向的对应的异常光流向量进行识别和滤除,可以保证异常光流信息识别和去除的准确性。
S507:对初始光流信息中异常光流信息进行去除,以得到目标光流信息。
S508:根据目标光流信息,从每帧图像中识别参考像素信息。
S509:根据多个参考像素信息,确定道路标志物的图像深度。
针对S507至S509描述说明可以示例参见上述实施例,在此不再赘述。
本实施例中,通过采集道路标志物的多帧图像,根据多帧图像,确定与道路标志物对应的目标光流信息,根据目标光流信息,从每帧图像中识别参考像素信息,以及根据多个参考像素信息,确定道路标志物的图像深度,可以基于光流估计提取道路标志物的目标光流信息以进行图像深度的求解,由于目标光流信息为准确的道路标志物的光流数据,从而可以有效提升道路标志物图像深度求解的准确性,辅助提升道路标志物定位的准确性,通过确定每个像素光流向量与初始均值光流向量之间的光流向量夹角,如果光流向量夹角大于夹角阈值,则确定光流向量夹角对应的像素光流向量为异常光流向量,将至少一个异常光流向量作为异常光流信息,由于观察到的正确的光流估计的方向应当是一致的,道路标志物上的局部光流方向也是一致的,通过每个像素光流向量与初始均值光流向量之间的光流向量夹角进行计算,并设置夹角阈值对突变的光流方向的对应的异常光流向量进行识别和滤除,可以保证异常光流信息识别和去除的准确性。
图6是根据本公开第四实施例的示意图。
如图6所示,该图像深度获取方法,包括:
S601:采集道路标志物的多帧图像。
S602:根据多帧图像,确定与道路标志物对应的初始光流信息。
S603:对多个像素光流向量取均值,得到初始均值光流向量。
针对S601至S603描述说明可以示例参见上述实施例,在此不再赘述。
S604:根据多个第一位置值,确定初始参考位置值。
其中,初始参考位置值,是指光流估计时整体正确的光流向量起始点的坐标值。
本公开实施例中,在根据多个第一位置值,确定初始参考位置值时,可以对多个第一位置值取平均值,以得到多个第一位置值的平均坐标值,将该平均坐标值作为初始参考位置值。
可选地,一些实施例中,在根据多个第一位置值,确定初始参考位置值时,可以对多个第一位置值取均值,得到第一结果位置值,将第一结果位置值作为初始参考位置值,从而可以确定像素光流向量起始点的平均坐标值作为初始参考位置值,由于估计正确的光流数据占主要的比重,光流数据中仅有少量的异常光流数据,从而初始参考位置值可以较为准确的表示整体的正确光流向量起始点的坐标值,从而可以较为准确的进行异常光流信息的滤除。
其中,第一结果位置值,是指对多个第一位置值取平均值之后得到的平均坐标值。
本公开实施例中,在根据多个第一位置值,确定初始参考位置值时,可以对多个第一位置值取均值,得到第一结果位置值,将第一结果位置值作为初始参考位置值。
S605:确定每个第一位置值与初始参考位置值之间的初始距离。
本公开实施例在上述根据多个第一位置值,确定初始参考位置值之后,可以确定每个第一位置值与初始参考位置值之间的初始距离,初始距离可以用于参与从初始光流信息中识别异常光流信息。
本公开实施例中,确定每个第一位置值与初始参考位置值之间的初始距离时,设初始光流信息中的像素光流向量的集合为F={f1,…,i,…,N},其相应的在第一帧中的起始点集合为S={s1,…,i,…,N},起始点的坐标值即为第一位置值,终止点集合为E={e1,…,i,…,N},终止点的坐标值即为第二位置值,则初始参考位置值为确定每个第一位置值与初始参考位置值之间的初始距离为/>
S606:根据初始均值光流向量和初始距离,从初始光流信息中识别异常光流信息。
本公开实施例在上述确定每个第一位置值与初始参考位置值之间的初始距离之后,可以根据初始均值光流向量和初始距离,从初始光流信息中识别异常光流信息。
本公开实施中,在根据初始均值光流向量和初始距离,从初始光流信息中识别异常光流信息时,可以根据初始均值光流向量和初始距离确定偏离初始均值光流向量的像素光流向量作为异常光流信息。
本实施例中,通过根据多个第一位置值,确定初始参考位置值,确定每个第一位置值与初始参考位置值之间的初始距离,根据初始均值光流向量和初始距离,从初始光流信息中识别异常光流信息,由于观察到的正确的光流估计的长度变化应该是连续的,道路标志物上的局部光流长度变化也应该是连续的,通过每个像素光流向量与初始均值光流向量之间的距离进行计算,并设置对应的阈值对不连续的光流变化长度的对应的异常光流向量进行识别和滤除,可以保证异常光流信息识别和去除的准确性。
可选地,一些实施例中,在根据初始均值光流向量和初始距离,从初始光流信息中识别异常光流信息时,可以确定初始均值光流向量的向量长度,确定每个初始距离与向量长度的距离比值,根据距离比值与设定比值阈值,从初始光流信息中识别异常光流信息,从而可以通过距离比值与设定比值阈值从初始光流信息中识别异常光流信息,保证对长度变化不连续的异常光流向量进行识别,保证异常光流信息识别的准确性。
本公开实施例中,在根据初始均值光流向量和初始距离,从初始光流信息中识别异常光流信息时,设初始光流信息中的像素光流向量的集合为F={f1,…,i,…,N},初始均值光流向量为确定每个初始距离与向量长度的距离比值为/>并设置设定比值阈值为εl,而后可以根据每个初始距离与向量长度的距离比值di与设定比值阈值为εl从像素光流向量中识别出向量长度变化不连续、产生突变的像素光流向量,将向量长度变化不连续、产生突变的像素光流向量作为初始光流信息中的异常光流信息。
可选地,一些实施例中,在根据距离比值与设定比值阈值,从初始光流信息中识别异常光流信息时,如果距离比值大于设定比值阈值,则确定与距离比值对应的像素光流向量为异常光流向量,将至少一个异常光流向量作为异常光流信息,从而可以通过设定比值阈值对每个像素光流向量对应的距离比值进行判断,以识别向量长度变化不连续、产生突变的像素光流向量作为异常光流向量,保证异常光流向量的识别准确性。
本公开实施中,在根据距离比值与设定比值阈值,从初始光流信息中识别异常光流信息时,可以将每一个像素光流向量对应的距离比值与设定距离阈值进行比对,如果距离比值大于设定比值阈值,则确定与距离比值对应的像素光流向量为异常光流向量,将至少一个异常光流向量作为异常光流信息。
举例而言,对于每个像素光流向量i=[1,N],如果距离比值di小于等于设定比值阈值εl,即|di≤εl|,像素光流向量fi为内点光流,也即是说,像素光流向量fi不是异常光流向量,否则,fi为外点光流,也即是说,像素光流向量fi为异常光流向量,将至少一个异常光流向量作为异常光流信息,以实现在根据距离比值与设定比值阈值,从初始光流信息中识别异常光流信息。
S607:根据目标光流信息,从每帧图像中识别参考像素信息。
可选地,一些实施例中,道路标志物具有对应的多个像素点,目标光流信息包括:与每个像素点对应的目标像素光流向量,每个目标像素光流向量在第一图像中具有的对应第一目标位置值,每个目标像素光流向量在第二图像中具有的对应第二目标位置值,第一图像和第二图像是多帧图像中相邻帧图像,从而可以对道路标志物实现像素级的图像处理,实现对道路标志物定位的精细化处理。
本公开实施例中,道路标志物具有对应的多个像素点,目标光流信息,是指对初始光流信息进行异常光流信息去除后得到的光流信息,目标光流信息包括:与每个像素点对应的目标像素光流向量,每个目标像素光流向量在第一图像中具有的对应第一目标位置值,第一目标位置值,是指目标像素光流向量在第一图像中的光流向量起始点,每个目标像素光流向量在第二图像中具有的对应第二目标位置值,第二目标位置值,是指目标像素光流向量在第二图像中的光流向量终止点,第一图像和第二图像是多帧图像中相邻帧图像。
S608:根据多个参考像素信息,确定道路标志物的图像深度。
针对S608描述说明可以示例参见上述实施例,在此不再赘述。
本实施例中,通过采集道路标志物的多帧图像,根据多帧图像,确定与道路标志物对应的目标光流信息,根据目标光流信息,从每帧图像中识别参考像素信息,以及根据多个参考像素信息,确定道路标志物的图像深度,可以基于光流估计提取道路标志物的目标光流信息以进行图像深度的求解,由于目标光流信息为准确的道路标志物的光流数据,从而可以有效提升道路标志物图像深度求解的准确性,辅助提升道路标志物定位的准确性,通过根据多个第一位置值,确定初始参考位置值,确定每个第一位置值与初始参考位置值之间的初始距离,根据初始均值光流向量和初始距离,从初始光流信息中识别异常光流信息,由于观察到的正确的光流估计的长度变化应该是连续的,道路标志物上的局部光流长度变化也应该是连续的,通过每个像素光流向量与初始均值光流向量之间的距离进行计算,并设置对应的阈值对不连续的光流变化长度的对应的异常光流向量进行识别和滤除,可以保证异常光流信息识别和去除的准确性。
图7是根据本公开第五实施例的示意图。
如图7所示,该图像深度获取方法,包括:
S701:采集道路标志物的多帧图像。
S702:根据多帧图像,确定与道路标志物对应的目标光流信息。
其中,多帧图像为基于车辆中的车载摄像装置拍摄得到。
针对S701至S703描述说明可以示例参见上述实施例,在此不再赘述。
S703:根据多个第一目标位置值,确定第一参考位置值。
其中,第一参考位置值,是指在第一图像中,可以用于代表道路标志物的目标像素点的坐标值。
本公开实施例中,在根据多个第一目标位置值,确定第一参考位置值时,可以对多个第一目标位置值取均值,以得到可以用于代表道路标志物的目标像素点的坐标值,将该坐标值作为第一参考位置值。
可选地,一些实施例中,在根据多个第一目标位置值,确定第一参考位置值时,可以对多个第一目标位置值取均值,得到第二结果位置值,将第二结果位置值作为第一参考位置值,从而可以确定多个第一目标位置的均值坐标值作为第一参考位置值,由于多个第一目标位置均为去除异常光流数据后的正确光流信息,从而可以保证在第一图像中确定得到的第一参考位置值的准确性,保证第一参考位置值对应的点可以代表第一图像中的道路标志物。
S704:根据多个第二目标位置值,确定第二参考位置值。
其中,第二参考位置值,是指在第二图像中,可以用于代表道路标志物的目标像素点的坐标值。
本公开实施例中,在根据多个第二目标位置值,确定第二参考位置值时,可以对多个第二目标位置值取均值,以得到可以用于代表道路标志物的目标像素点的坐标值,将该坐标值作为第二参考位置值。
可选地,一些实施例中,在根据多个第二目标位置值,确定第二参考位置值时,可以对多个第二目标位置值取均值,得到第三结果位置值,将第三结果位置值作为第二参考位置值,从而可以确定多个第二目标位置的均值坐标值作为第二参考位置值,由于多个第二目标位置均为去除异常光流数据后的正确光流信息,从而可以保证在第二图像中确定得到的第二参考位置值的准确性,保证第二参考位置值对应的点可以代表第二图像中的道路标志物。
S705:将第一参考位置值和第二参考位置值作为参考像素信息。
本公开实施例在上述根据多个第一目标位置值,确定第一参考位置值,并根据多个第二目标位置值,确定第二参考位置值之后,可以将第一参考位置值和第二参考位置值作为参考像素信息。
本实施例中,通过根据多个第一目标位置值,确定第一参考位置值,根据多个第二目标位置值,确定第二参考位置值,将第一参考位置值和第二参考位置值作为参考像素信息,从而可以通过第一目标位置值和第二目标位置值,确定在第一图像代表道路标志物的目标点的第一参考位置值,确定在第二图像代表道路标志物的目标点的第二参考位置值,根据第一参考位置值和第二参考位置值确定道路标志物的图像深度,可以保证图像深度计算的准确性,同时简化了计算流程。
S706:根据第一参考位置值和第二参考位置值,确定道路标志物与车载摄像装置之间的距离信息。
本公开实施例中,在根据第一参考位置值和第二参考位置值,确定道路标志物与车载摄像装置之间的距离信息时,可以对第一参考位置值和第二参考位置值进行图像三角化处理,以得到道路标志物与车载摄像装置之间的距离信息。
可选地,一些实施例中,在根据第一参考位置值和第二参考位置值,确定道路标志物与车载摄像装置之间的距离信息时,可以获取拍摄第一图像时,车载摄像装置的第一相对位姿信息,获取拍摄第二图像时,车载摄像装置的第二相对位姿信息,根据第一相对位姿信息和第二相对位姿信息,对第一参考位置值和第一参考位置值进行图像三角化处理,以得到距离信息,从而可以根据车载摄像装置的相对位置信息对第一参考位置值和第二参考位置值进行图像三角化处理,以得到道路标志物与车辆间的距离信息,保证距离求解的准确性。
本公开实施例中,在根据第一参考位置值和第二参考位置值,确定道路标志物与车载摄像装置之间的距离信息时,可以获取拍摄第一图像时,车载摄像装置的第一相对位姿信息,获取拍摄第二图像时,车载摄像装置的第二相对位姿信息,根据第一相对位姿信息和第二相对位姿信息,对第一参考位置值和第一参考位置值进行对极几何约束,求解以得到距离信息。
举例而言,如图8所示,图8是本公开实施例中的基于图像三角化的深度估计示意图,采用第一参考位置值对应的像素点p1为更新后的起始点、采用第二参考位置值对应的像素点p2作为更新后的终止点,设假设p1,p2的深度分别是d1,d2,根据对极几何约束,可得d1p12Rp2+,其中,R,t是两帧图像拍摄的相机的相对位姿信息,等式两边左乘的p1反对称矩阵可得到式子/>由此可解得d1,d2作为距离信息。
S707:将距离信息作为图像深度。
本公开实施例在上述根据第一参考位置值和第二参考位置值,确定道路标志物与车载摄像装置之间的距离信息,可以将距离信息作为图像深度。
本实施例中,通过根据第一参考位置值和第二参考位置值,确定道路标志物与车载摄像装置之间的距离信息,将距离信息作为图像深度,从而可以利用图像三角化方式处理第一参考位置值和第二参考位置值,以得到道路标志物与车载摄像装置之间的距离信息作为图像深度,以得到道路标志物的三维空间信息,保证道路标志物的位姿获取以及定位的准确性。
相关技术中,视觉定位技术通常是直接使用二维图像数据和三维地图,通过二维-三维匹配,完成图像位姿估计,本公开实施例提出的图像深度获取方法可以求解获取三维信息,为其与地图进行匹配以及位姿估计提供了新的选择,提高了定位精度,相较于使用基于关键点的图像匹配算法,本公开实施例提出的图像深度获取方法主张使用光流算法预测道路标志物在下一帧中的位置,从而可以避免关键点分布不可控的问题以及感知得到的初始目标标志物选定不准确的问题,相较于传统的光流估计方法的低时间效率,以及基于深度学习的光流估计方法弱泛化性,本公开实施例提出的图像深度获取方法设计了一种后端优化算法对光流估计外点进行滤除,在不影响深度估计任务应用的基础上,有效提高了光流算法在此任务上的对新的环境的泛化能力。
本实施例中,通过采集道路标志物的多帧图像,根据多帧图像,确定与道路标志物对应的目标光流信息,根据目标光流信息,从每帧图像中识别参考像素信息,以及根据多个参考像素信息,确定道路标志物的图像深度,可以基于光流估计提取道路标志物的目标光流信息以进行图像深度的求解,由于目标光流信息为准确的道路标志物的光流数据,从而可以有效提升道路标志物图像深度求解的准确性,辅助提升道路标志物定位的准确性,通过根据多个第一目标位置值,确定第一参考位置值,根据多个第二目标位置值,确定第二参考位置值,将第一参考位置值和第二参考位置值作为参考像素信息,从而可以通过第一目标位置值和第二目标位置值,确定在第一图像代表道路标志物的目标点的第一参考位置值,确定在第二图像代表道路标志物的目标点的第二参考位置值,根据第一参考位置值和第二参考位置值确定道路标志物的图像深度,可以保证图像深度计算的准确性,同时简化了计算流程,通过根据第一参考位置值和第二参考位置值,确定道路标志物与车载摄像装置之间的距离信息,将距离信息作为图像深度,从而可以利用图像三角化方式处理第一参考位置值和第二参考位置值,以得到道路标志物与车载摄像装置之间的距离信息作为图像深度,以得到道路标志物的三维空间信息,保证道路标志物的位姿获取以及定位的准确性。
图9是根据本公开第六实施例的示意图。
如图9所示,该图像深度获取装置90,包括:
获取模块901,用于采集道路标志物的多帧图像;
第一确定模块902,用于根据多帧图像,确定与道路标志物对应的目标光流信息;
识别模块903,用于根据目标光流信息,从每帧图像中识别参考像素信息;以及
第二确定模块904,用于根据多个参考像素信息,确定道路标志物的图像深度。
在本公开的一些实施例中,如图10所示,图10是根据本公开第七实施例的示意图,该图像深度获取装置100,包括:获取模块1001,第一确定模块1002,识别模块1003,第二确定模块1004,其中第一确定模块1002,包括:
确定子模块10021,用于根据多帧图像,确定与道路标志物对应的初始光流信息;
识别子模块10022,用于从初始光流信息中识别异常光流信息;以及
处理子模块10023,用于对初始光流信息中异常光流信息进行去除,以得到目标光流信息。
在本公开的一些实施例中,其中,多帧图像至少包括:相邻帧的第一图像和第二图像,道路标志物具有对应的多个像素点;
其中,确定子模块10021,具体用于:
确定每个像素点在第一图像中的第一位置值;
确定每个像素点在第二图像中的第二位置值;
根据第一位置信息和第二位置信息,生成与像素点对应的像素光流向量;以及
将多个像素光流向量作为初始光流信息。
在本公开的一些实施例中,其中,识别子模块10022,具体用于:
对多个像素光流向量取均值,得到初始均值光流向量;
根据初始均值光流向量,从初始光流信息中识别异常光流信息。
在本公开的一些实施例中,其中,识别子模块10022,还用于:
确定每个像素光流向量与初始均值光流向量之间的光流向量夹角;
如果光流向量夹角大于夹角阈值,则确定光流向量夹角对应的像素光流向量为异常光流向量;
将至少一个异常光流向量作为异常光流信息。
在本公开的一些实施例中,其中,识别子模块10022,还用于:
根据多个第一位置值,确定初始参考位置值;
确定每个第一位置值与初始参考位置值之间的初始距离;
根据初始均值光流向量和初始距离,从初始光流信息中识别异常光流信息。
在本公开的一些实施例中,其中,识别子模块10022,还用于:
确定初始均值光流向量的向量长度;
确定每个初始距离与向量长度的距离比值;
根据距离比值与设定比值阈值,从初始光流信息中识别异常光流信息。
在本公开的一些实施例中,其中,识别子模块10022,还用于:
如果距离比值大于设定比值阈值,则确定与距离比值对应的像素光流向量为异常光流向量;
将至少一个异常光流向量作为异常光流信息。
在本公开的一些实施例中,其中,识别子模块10022,还用于:
对多个第一位置值取均值,得到第一结果位置值;
将第一结果位置值作为初始参考位置值。
在本公开的一些实施例中,道路标志物具有对应的多个像素点,目标光流信息包括:与每个像素点对应的目标像素光流向量,每个目标像素光流向量在第一图像中具有的对应第一目标位置值,每个目标像素光流向量在第二图像中具有的对应第二目标位置值,第一图像和第二图像是多帧图像中相邻帧图像。
在本公开的一些实施例中,其中,识别模块1003,具体用于;
根据多个第一目标位置值,确定第一参考位置值;
根据多个第二目标位置值,确定第二参考位置值;
将第一参考位置值和第二参考位置值作为参考像素信息。
在本公开的一些实施例中,其中,识别模块1003,还用于:
对多个第一目标位置值取均值,得到第二结果位置值;
将第二结果位置值作为第一参考位置值。
在本公开的一些实施例中,识别模块1003,还用于:
对多个第二目标位置值取均值,得到第三结果位置值;
将第三结果位置值作为第二参考位置值。
在本公开的一些实施例中,多帧图像为基于车辆中的车载摄像装置拍摄得到;
其中,第二确定模块1004,具体用于:
根据第一参考位置值和第二参考位置值,确定道路标志物与车载摄像装置之间的距离信息;
将距离信息作为图像深度。
在本公开的一些实施例中,其中,第二确定模块1004,还用于:
获取拍摄第一图像时,车载摄像装置的第一相对位姿信息;
获取拍摄第二图像时,车载摄像装置的第二相对位姿信息;
根据第一相对位姿信息和第二相对位姿信息,对第一参考位置值和第一参考位置值进行图像三角化处理,以得到距离信息。
可以理解的是,本实施例附图10中的图像深度获取装置100与上述实施例中的图像深度获取装置90,获取模块1001与上述实施例中的获取模块901,第一确定模块1002与上述实施例中的第一确定模块902,识别模块1003与上述实施例中的识别模块903,第二确定模块1004与上述实施例中的第二确定模块904可以具有相同的功能和结构。
需要说明的是,前述对图像深度获取方法的解释说明也适用于本实施例的图像深度获取装置,在此不再赘述。
本实施例中,通过采集道路标志物的多帧图像,根据多帧图像,确定与道路标志物对应的目标光流信息,根据目标光流信息,从每帧图像中识别参考像素信息,以及根据多个参考像素信息,确定道路标志物的图像深度,可以基于光流估计提取道路标志物的目标光流信息以进行图像深度的求解,由于目标光流信息为准确的道路标志物的光流数据,从而可以有效提升道路标志物图像深度求解的准确性,辅助提升道路标志物定位的准确性。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图11示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,设备1100包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、鼠标等;输出单元1107,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理,例如图像深度获取方法。例如,在一些实施例中,图像深度获取方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时,可以执行上文描述的图像深度获取方法的一个或多个步骤。备选地,在其他实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像深度获取方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网及区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (26)

1.一种图像深度获取方法,所述方法包括:
采集道路标志物的多帧图像,所述多帧图像至少包括:相邻帧的第一图像和第二图像,所述道路标志物具有对应的多个像素点;
确定每个所述像素点在所述第一图像中的第一位置值;
确定每个所述像素点在所述第二图像中的第二位置值;
根据所述第一位置信息和所述第二位置信息,生成与所述像素点对应的像素光流向量;
将多个所述像素光流向量作为初始光流信息;
对多个所述像素光流向量取均值,得到初始均值光流向量;
根据所述初始均值光流向量,从所述初始光流信息中识别异常光流信息;以及
对所述初始光流信息中所述异常光流信息进行去除,以得到目标光流信息;
根据所述目标光流信息,从每帧所述图像中识别参考像素信息;以及
根据多个所述参考像素信息,确定所述道路标志物的图像深度。
2.根据权利要求1所述的方法,其中,所述根据所述初始均值光流向量,从所述初始光流信息中识别所述异常光流信息,包括:
确定每个所述像素光流向量与所述初始均值光流向量之间的光流向量夹角;
如果所述光流向量夹角大于夹角阈值,则确定所述光流向量夹角对应的像素光流向量为异常光流向量;
将至少一个所述异常光流向量作为所述异常光流信息。
3.根据权利要求1所述的方法,其中,所述根据所述初始均值光流向量,从所述初始光流信息中识别所述异常光流信息,包括:
根据多个所述第一位置值,确定初始参考位置值;
确定每个所述第一位置值与所述初始参考位置值之间的初始距离;
根据所述初始均值光流向量和所述初始距离,从所述初始光流信息中识别异常光流信息。
4.根据权利要求3所述的方法,其中,所述根据所述初始均值光流向量和所述初始距离,从所述初始光流信息中识别异常光流信息,包括:
确定所述初始均值光流向量的向量长度;
确定每个所述初始距离与所述向量长度的距离比值;
根据所述距离比值与设定比值阈值,从所述初始光流信息中识别所述异常光流信息。
5.根据权利要求4所述的方法,其中,所述根据所述距离比值与设定比值阈值,从所述初始光流信息中识别所述异常光流信息,包括:
如果所述距离比值大于所述设定比值阈值,则确定与所述距离比值对应的像素光流向量为异常光流向量;
将至少一个所述异常光流向量作为所述异常光流信息。
6.根据权利要求3所述的方法,其中,所述根据多个所述第一位置值,确定初始参考位置值,包括:
对多个所述第一位置值取均值,得到第一结果位置值;
将所述第一结果位置值作为所述初始参考位置值。
7.根据权利要求1所述的方法,所述道路标志物具有对应的多个像素点,所述目标光流信息包括:与每个所述像素点对应的目标像素光流向量,每个所述目标像素光流向量在第一图像中具有的对应第一目标位置值,每个所述目标像素光流向量在第二图像中具有的对应第二目标位置值,所述第一图像和所述第二图像是所述多帧图像中相邻帧图像。
8.根据权利要求7所述的方法,其中,所述根据所述目标光流信息,从每帧所述图像中识别参考像素信息,包括;
根据多个所述第一目标位置值,确定第一参考位置值;
根据多个所述第二目标位置值,确定第二参考位置值;
将所述第一参考位置值和所述第二参考位置值作为所述参考像素信息。
9.根据权利要求8所述的方法,其中,所述根据多个所述第一目标位置值,确定第一参考位置值,包括:
对多个所述第一目标位置值取均值,得到第二结果位置值;
将所述第二结果位置值作为所述第一参考位置值。
10.根据权利要求8所述的方法,其中,所述根据多个所述第二目标位置值,确定第二参考位置值,包括:
对多个所述第二目标位置值取均值,得到第三结果位置值;
将所述第三结果位置值作为所述第二参考位置值。
11.根据权利要求8所述的方法,所述多帧图像为基于车辆中的车载摄像装置拍摄得到;
其中,所述根据多个所述参考像素信息,确定所述道路标志物的图像深度,包括:
根据所述第一参考位置值和所述第二参考位置值,确定所述道路标志物与车载摄像装置之间的距离信息;
将所述距离信息作为所述图像深度。
12.根据权利要求11所述的方法,其中,所述根据所述第一参考位置值和所述第二参考位置值,确定所述道路标志物与车载摄像装置之间的距离信息,包括:
获取拍摄所述第一图像时,所述车载摄像装置的第一相对位姿信息;
获取拍摄所述第二图像时,所述车载摄像装置的第二相对位姿信息;
根据所述第一相对位姿信息和所述第二相对位姿信息,对所述第一参考位置值和所述第一参考位置值进行图像三角化处理,以得到所述距离信息。
13.一种图像深度获取装置,包括:
获取模块,用于采集道路标志物的多帧图像,所述多帧图像至少包括:相邻帧的第一图像和第二图像,所述道路标志物具有对应的多个像素点;
第一确定模块,用于根据所述多帧图像,确定与所述道路标志物对应的目标光流信息;
识别模块,用于根据所述目标光流信息,从每帧所述图像中识别参考像素信息;以及
第二确定模块,用于根据多个所述参考像素信息,确定所述道路标志物的图像深度;
所述第一确定模块,包括:
确定子模块,用于确定每个所述像素点在所述第一图像中的第一位置值;确定每个所述像素点在所述第二图像中的第二位置值;根据所述第一位置信息和所述第二位置信息,生成与所述像素点对应的像素光流向量;将多个所述像素光流向量作为初始光流信息;
识别子模块,用于对多个所述像素光流向量取均值,得到初始均值光流向量;根据所述初始均值光流向量,从所述初始光流信息中识别异常光流信息;以及
处理子模块,用于对所述初始光流信息中所述异常光流信息进行去除,以得到所述目标光流信息。
14.根据权利要求13所述的装置,其中,所述识别子模块,还用于:
确定每个所述像素光流向量与所述初始均值光流向量之间的光流向量夹角;
如果所述光流向量夹角大于夹角阈值,则确定所述光流向量夹角对应的像素光流向量为异常光流向量;
将至少一个所述异常光流向量作为所述异常光流信息。
15.根据权利要求13所述的装置,其中,所述识别子模块,还用于:
根据多个所述第一位置值,确定初始参考位置值;
确定每个所述第一位置值与所述初始参考位置值之间的初始距离;
根据所述初始均值光流向量和所述初始距离,从所述初始光流信息中识别异常光流信息。
16.根据权利要求15所述的装置,其中,所述识别子模块,还用于:
确定所述初始均值光流向量的向量长度;
确定每个所述初始距离与所述向量长度的距离比值;
根据所述距离比值与设定比值阈值,从所述初始光流信息中识别所述异常光流信息。
17.根据权利要求16所述的装置,其中,所述识别子模块,还用于:
如果所述距离比值大于所述设定比值阈值,则确定与所述距离比值对应的像素光流向量为异常光流向量;
将至少一个所述异常光流向量作为所述异常光流信息。
18.根据权利要求15所述的装置,其中,所述识别子模块,还用于:
对多个所述第一位置值取均值,得到第一结果位置值;
将所述第一结果位置值作为所述初始参考位置值。
19.根据权利要求13所述的装置,所述道路标志物具有对应的多个像素点,所述目标光流信息包括:与每个所述像素点对应的目标像素光流向量,每个所述目标像素光流向量在第一图像中具有的对应第一目标位置值,每个所述目标像素光流向量在第二图像中具有的对应第二目标位置值,所述第一图像和所述第二图像是所述多帧图像中相邻帧图像。
20.根据权利要求19所述的装置,其中,所述识别模块,具体用于;
根据多个所述第一目标位置值,确定第一参考位置值;
根据多个所述第二目标位置值,确定第二参考位置值;
将所述第一参考位置值和所述第二参考位置值作为所述参考像素信息。
21.根据权利要求20所述的装置,其中,所述识别模块,还用于:
对多个所述第一目标位置值取均值,得到第二结果位置值;
将所述第二结果位置值作为所述第一参考位置值。
22.根据权利要求20所述的装置,其中,所述识别模块,还用于:
对多个所述第二目标位置值取均值,得到第三结果位置值;
将所述第三结果位置值作为所述第二参考位置值。
23.根据权利要求20所述的装置,所述多帧图像为基于车辆中的车载摄像装置拍摄得到;
其中,所述第二确定模块,具体用于:
根据所述第一参考位置值和所述第二参考位置值,确定所述道路标志物与车载摄像装置之间的距离信息;
将所述距离信息作为所述图像深度。
24.根据权利要求23所述的装置,其中,所述第二确定模块,还用于:
获取拍摄所述第一图像时,所述车载摄像装置的第一相对位姿信息;
获取拍摄所述第二图像时,所述车载摄像装置的第二相对位姿信息;
根据所述第一相对位姿信息和所述第二相对位姿信息,对所述第一参考位置值和所述第一参考位置值进行图像三角化处理,以得到所述距离信息。
25.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-12中任一项所述的方法。
26.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-12中任一项所述的方法。
CN202211641500.4A 2022-12-20 2022-12-20 图像深度获取方法、装置、电子设备及存储介质 Active CN116228834B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211641500.4A CN116228834B (zh) 2022-12-20 2022-12-20 图像深度获取方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211641500.4A CN116228834B (zh) 2022-12-20 2022-12-20 图像深度获取方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN116228834A CN116228834A (zh) 2023-06-06
CN116228834B true CN116228834B (zh) 2023-11-03

Family

ID=86570536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211641500.4A Active CN116228834B (zh) 2022-12-20 2022-12-20 图像深度获取方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116228834B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930609A (zh) * 2010-08-24 2010-12-29 东软集团股份有限公司 接近的目标物检测方法及装置
CN107465911A (zh) * 2016-06-01 2017-12-12 东南大学 一种深度信息提取方法及装置
CN107481279A (zh) * 2017-05-18 2017-12-15 华中科技大学 一种单目视频深度图计算方法
CN107729799A (zh) * 2017-06-13 2018-02-23 银江股份有限公司 基于深度卷积神经网络的人群异常行为视觉检测及分析预警系统
CN110264525A (zh) * 2019-06-13 2019-09-20 惠州市德赛西威智能交通技术研究院有限公司 一种基于车道线与目标车辆的相机标定方法
CN111127584A (zh) * 2019-11-19 2020-05-08 奇点汽车研发中心有限公司 建立视觉地图的方法和装置、电子设备和存储介质
CN111127522A (zh) * 2019-12-30 2020-05-08 亮风台(上海)信息科技有限公司 基于单目相机的深度光流预测方法、装置、设备及介质
CN112907557A (zh) * 2021-03-15 2021-06-04 腾讯科技(深圳)有限公司 道路检测方法、装置、计算设备及存储介质
CN112967228A (zh) * 2021-02-02 2021-06-15 中国科学院上海微系统与信息技术研究所 目标光流信息的确定方法、装置、电子设备及存储介质
CN113379813A (zh) * 2021-06-08 2021-09-10 北京百度网讯科技有限公司 深度估计模型的训练方法、装置、电子设备及存储介质
CN114398158A (zh) * 2021-11-30 2022-04-26 际络科技(上海)有限公司 驾驶任务处理方法、装置、电子设备及存储介质
CN114639171A (zh) * 2022-05-18 2022-06-17 松立控股集团股份有限公司 一种停车场全景安全监控方法
CN114729813A (zh) * 2020-01-03 2022-07-08 御眼视觉技术有限公司 用于车辆导航的系统和方法
CN115187638A (zh) * 2022-09-07 2022-10-14 南京逸智网络空间技术创新研究院有限公司 一种基于光流遮罩的无监督单目深度估计方法
WO2022247630A1 (zh) * 2021-05-28 2022-12-01 北京字跳网络技术有限公司 图像处理方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112560684B (zh) * 2020-12-16 2023-10-24 阿波罗智联(北京)科技有限公司 车道线检测方法、装置、电子设备、存储介质以及车辆
US20220277647A1 (en) * 2021-02-26 2022-09-01 Toyota Motor Engineering & Manufacturing North America, Inc. Systems and methods for analyzing the in-lane driving behavior of a road agent external to a vehicle

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930609A (zh) * 2010-08-24 2010-12-29 东软集团股份有限公司 接近的目标物检测方法及装置
CN107465911A (zh) * 2016-06-01 2017-12-12 东南大学 一种深度信息提取方法及装置
CN107481279A (zh) * 2017-05-18 2017-12-15 华中科技大学 一种单目视频深度图计算方法
CN107729799A (zh) * 2017-06-13 2018-02-23 银江股份有限公司 基于深度卷积神经网络的人群异常行为视觉检测及分析预警系统
CN110264525A (zh) * 2019-06-13 2019-09-20 惠州市德赛西威智能交通技术研究院有限公司 一种基于车道线与目标车辆的相机标定方法
CN111127584A (zh) * 2019-11-19 2020-05-08 奇点汽车研发中心有限公司 建立视觉地图的方法和装置、电子设备和存储介质
CN111127522A (zh) * 2019-12-30 2020-05-08 亮风台(上海)信息科技有限公司 基于单目相机的深度光流预测方法、装置、设备及介质
CN114729813A (zh) * 2020-01-03 2022-07-08 御眼视觉技术有限公司 用于车辆导航的系统和方法
CN112967228A (zh) * 2021-02-02 2021-06-15 中国科学院上海微系统与信息技术研究所 目标光流信息的确定方法、装置、电子设备及存储介质
CN112907557A (zh) * 2021-03-15 2021-06-04 腾讯科技(深圳)有限公司 道路检测方法、装置、计算设备及存储介质
WO2022247630A1 (zh) * 2021-05-28 2022-12-01 北京字跳网络技术有限公司 图像处理方法、装置、电子设备及存储介质
CN113379813A (zh) * 2021-06-08 2021-09-10 北京百度网讯科技有限公司 深度估计模型的训练方法、装置、电子设备及存储介质
WO2022257487A1 (zh) * 2021-06-08 2022-12-15 北京百度网讯科技有限公司 深度估计模型的训练方法, 装置, 电子设备及存储介质
CN114398158A (zh) * 2021-11-30 2022-04-26 际络科技(上海)有限公司 驾驶任务处理方法、装置、电子设备及存储介质
CN114639171A (zh) * 2022-05-18 2022-06-17 松立控股集团股份有限公司 一种停车场全景安全监控方法
CN115187638A (zh) * 2022-09-07 2022-10-14 南京逸智网络空间技术创新研究院有限公司 一种基于光流遮罩的无监督单目深度估计方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Multi‐task deep learning with optical flow features for self‐driving cars;Yuan Hu等;《IET Intelligent Transport Systems》;1-11 *
交通监控场景下的相机标定与车辆速度测量;武非凡等;计算机应用研究(08);2417-2421 *
深度学习光流计算技术研究进展;张聪炫;周仲凯;陈震;葛利跃;黎明;江少锋;陈昊;;电子学报(09);1841-1849 *

Also Published As

Publication number Publication date
CN116228834A (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN109559320B (zh) 基于空洞卷积深度神经网络实现视觉slam语义建图功能的方法及系统
CN107735797B (zh) 用于确定第一坐标系与第二坐标系之间的运动的方法
CN113674421B (zh) 3d目标检测方法、模型训练方法、相关装置及电子设备
CN111402294A (zh) 目标跟踪方法、装置、计算机可读存储介质和计算机设备
CN111209770A (zh) 一种车道线识别方法及装置
CN112862006B (zh) 图像深度信息获取模型的训练方法、装置及电子设备
CN113112525A (zh) 目标跟踪方法、网络模型及其训练方法、设备和介质
CN116188893A (zh) 基于bev的图像检测模型训练及目标检测方法和装置
CN113592015B (zh) 定位以及训练特征匹配网络的方法和装置
CN111476812A (zh) 地图分割方法、装置、位姿估计方法和设备终端
CN111563916B (zh) 基于立体视觉的长时无人机跟踪定位方法、系统、装置
CN115953434B (zh) 轨迹匹配方法、装置、电子设备和存储介质
CN116228834B (zh) 图像深度获取方法、装置、电子设备及存储介质
CN115239776B (zh) 点云的配准方法、装置、设备和介质
CN114913330B (zh) 点云部件分割方法、装置、电子设备与存储介质
CN116363628A (zh) 标志检测方法、装置、非易失性存储介质及计算机设备
CN116012875A (zh) 一种人体姿态估计方法及相关装置
CN113721240B (zh) 一种目标关联方法、装置、电子设备及存储介质
CN115439692A (zh) 一种图像处理方法、装置、电子设备及介质
CN113763468B (zh) 一种定位方法、装置、系统及存储介质
CN112132960B (zh) 一种三维重建方法、装置和电子设备
CN114972465A (zh) 图像目标深度的检测方法、装置、电子设备和存储介质
CN114399532A (zh) 一种相机位姿确定方法和装置
CN110245553B (zh) 路面测距方法及装置
CN115049895B (zh) 一种图像属性识别方法、属性识别模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant