CN105163103A - 用层叠结构来表示立体图像以分析图像中的目标的技术 - Google Patents

用层叠结构来表示立体图像以分析图像中的目标的技术 Download PDF

Info

Publication number
CN105163103A
CN105163103A CN201410264246.XA CN201410264246A CN105163103A CN 105163103 A CN105163103 A CN 105163103A CN 201410264246 A CN201410264246 A CN 201410264246A CN 105163103 A CN105163103 A CN 105163103A
Authority
CN
China
Prior art keywords
target
structure chart
different
order
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410264246.XA
Other languages
English (en)
Other versions
CN105163103B (zh
Inventor
陈超
鲁耀杰
师忠超
刘殿超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to CN201410264246.XA priority Critical patent/CN105163103B/zh
Priority to US14/731,577 priority patent/US9679205B2/en
Priority to JP2015118580A priority patent/JP6561605B2/ja
Publication of CN105163103A publication Critical patent/CN105163103A/zh
Application granted granted Critical
Publication of CN105163103B publication Critical patent/CN105163103B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

公开了一种用层叠结构来表示立体图像以分析图像中的目标的方法和系统,该方法包括:针对输入的立体图像,基于立体图像中的第一类相关特征、准则或模型,来生成至少一个第一第一级结构图,其中,不同的第一第一级结构图是利用该第一类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第一第一级结构图在不同第一分割程度上包括目标;至少部分地结合所述至少一个第一第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。

Description

用层叠结构来表示立体图像以分析图像中的目标的技术
技术领域
本发明涉及立体视觉图像处理领域,且更具体地,涉及用层叠结构来表示立体图像以分析立体图像中的目标的方法和系统。
背景技术
现今,基于立体视觉的3维图像分析和处理技术越来越成为研究的热点。例如,可靠的3维立体道路环境理解对于车辆的自主驾驶十分重要。3维立体道路环境识别任务可以主要包括路面估计,消失点计算,目标检测等,其中,目标的分析和检测作为最为重要的部分,对车的自主控制有着直接的影响。
当前基于立体图像的单帧信息的目标分析和检测方法主要有两类:(1)基于滑动窗口及其改进的相关方法;(2)基于分割/聚类的方法。第一类方法通常较为简单,但计算量非常大。相比于第一类方法,第二类方法在实时性方法有显著的优势,并且其对目标外观变化有较强的鲁棒性。但是第二类方法难于采用统一的特征或一致的准则进行准确的聚类分割:太宽松的聚类条件容易导致相邻的目标错误的合并在一起形成过合并的结果;太严格的聚类条件可能错误的将一个目标分裂为几个小块形成过分割的结果。
本发明针对以上问题,采用提出的新方法进行目标分析和检测,以得到更精确的目标位置。
发明内容
根据本公开的一个方面,提供一种用层叠结构来表示立体图像以分析图像中的目标的方法,包括:针对输入的立体图像,基于立体图像中的第一类相关特征、准则或模型,来生成至少一个第一第一级结构图,其中,不同的第一第一级结构图是利用该第一类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第一第一级结构图在不同第一分割程度上包括目标;至少部分地结合所述至少一个第一第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。
根据本公开的另一方面,提供一种用层叠结构来表示立体图像以分析图像中的目标的系统,包括:第一第一级生成装置,被配置为针对输入的立体图像,基于立体图像中的第一类相关特征、准则或模型,来生成至少一个第一第一级结构图,其中,不同的第一第一级结构图是利用该第一类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第一第一级结构图在不同第一分割程度上包括目标;第一第一级分析装置,被配置为至少部分地结合所述至少一个第一第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。
附图说明
图1示出了应用本发明的技术的示例硬件结构。
图2示出了根据本发明的一个实施例的用层叠结构来表示立体图像以分析图像中的目标的方法的示例流程图。
图3示出了根据本发明的另一个实施例的用层叠结构来表示立体图像以分析图像中的目标的方法的示例流程图。
图4A示出了根据本发明的再一个实施例的用层叠结构来表示立体图像以分析图像中的目标的具体方法的示例流程图。图4B示出了应用图4A所示的方法的过程的直观示意图。
图5示出了如图4A所示地基于不同类相关特征、准则或模型来生成多系列低级层叠结构金字塔(CSP)的结构图的过程的流程图。
图6A-6E示出了基于一类相关特征、准则或模型(即,空间相邻性特征)生成一系列低级层叠结构金字塔(CSP)的示例结构图、以及结合该一系列低级结构图来得到包括目标的低级目标分析结果的结构图的过程的示意图。
图7A示出了结合关于空间相邻性特征的一系列低级结构图以及关于灰度一致性特征的一系列结构图来得到另一种包括目标的低级目标分析结果的结构图的过程的示意图。图7B示出了结合关于空间相邻性特征的一系列低级结构图以及关于灰度一致性特征的一系列结构图来得到另一种包括目标的低级目标分析结果的结构图的过程涉及的图像例子的示意图。
图8A示出了基于图7A所示的另一种包括目标的低级目标分析结果的结构图来生成一系列高级结构图。图8B示出了基于图8A所示的一系列高级结构图来得到一系列高级层叠结构金字塔(CSP)的结构图。
图9示出了结合图8A所示的一系列高级结构图来生成包括目标的高级目标分析结果的结构图。
图10示出了根据本发明的一个实施例的用层叠结构来表示立体图像以分析图像中的目标的系统的示例方框图。
具体实施方式
现在将详细参照本发明的具体实施例,在附图中例示了本发明的例子。尽管将结合具体实施例描述本发明,但将理解,不是想要将本发明限于所述的实施例。相反,想要覆盖由所附权利要求限定的在本发明的精神和范围内包括的变更、修改和等价物。应注意,这里描述的方法步骤都可以由任何功能块或功能布置来实现,且任何功能块或功能布置可被实现为物理实体或逻辑实体、或者两者的组合。
为了使本领域技术人员更好地理解本发明,下面结合附图和具体实施方式对本发明作进一步详细说明。
图1示出了应用本发明的技术的示例硬件结构。
如图1所示,立体相机(例如双目相机)可以将拍摄到的立体图像传输到解码器,解码器可以将其解码并转换为任何需要的图像、例如视差图、灰度图等,数字信号处理器则可以将目标图像(包括但不限于视差图、灰度图)作为输入,并与存储设备交互来进行处理以输出检测到的目标和其他相关数据到车辆控制模块,而车辆控制模块可以根据检测到的目标和其他相关数据来进行车辆的控制,例如识别行人、车辆、道路、自主驾驶等。其中,数字信号处理器可以连接输入设备(双目相机与解码器)、输出设备(车辆控制模块)以及存储设备。而本公开提出的方法就可以运行于该数字信号处理器当中。
图2示出了根据本发明的一个实施例的用层叠结构来表示立体图像以分析图像中的目标的方法的示例流程图。
图2所示的用层叠结构来表示立体图像以分析图像中的目标的方法200包括:步骤S201,针对输入的立体图像,基于立体图像中的第一类相关特征、准则或模型,来生成至少一个第一第一级结构图,其中,不同的第一第一级结构图是利用该第一类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第一第一级结构图在不同第一分割程度上包括目标;步骤S202,至少部分地结合所述至少一个第一第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。
在此,还可以将输入的立体图像进行预处理,例如,将其转换为视差图、灰度图、或进行边缘检测得到边缘检测图,以便于如上所述地、基于立体图像中的第一类相关特征、准则或模型,来生成至少一个第一第一级结构图。
在一个实施例中,第一类相关特征、准则或模型可以包括用于聚类的基于空间相邻性特征、灰度一致性特征或边缘连续性特征或轮廓特征。在一个实施例中,该第一类相关特征、准则或模型的不同严格程度包括在空间相邻性特征的情况下的基于固定视差中心或基于可移动视差中心的不同空间视差(或距离或深度)阈值的聚类、在灰度一致性特征的情况下的基于不同灰度差阈值的聚类、或在边缘连续性特征的基于不同边缘连续性阈值的聚类、在轮廓特征的情况下的基于不同的轮廓包含关系的聚类等。例如,如果要检测的对象、例如人、车一般是竖直站立的,则可以对视差图的视差(或距离或深度)参数设置一个视差(或距离或深度)阈值(该阈值可以比较小,因为对象假设为竖直的),并根据该视差(或距离或深度)阈值,对视差图进行基于固定视差中心或基于可移动视差中心的聚类,来聚类在视差值(或距离或深度值)上小于视差(或距离或深度)阈值的一些像素点以形成分割区域。这种分割区域由于视差(或距离或深度)阈值的取值大小而形成过分割、过合并或合适大小的情形。另外,由于选择是基于固定视差中心还是基于可移动视差中心来进行上述聚类,也可以形成更小或更大的聚类分割区域。
从而,可见,通过对第一类相关特征、准则或模型的不同严格程度的选择,来得到在不同分割程度上包括目标的聚类结构图,可以形成有层次感的一系列聚类结构图,它们或多或少、或大或小地包括了要检测的对象。当然,除了基于空间相邻性特征来进行聚类的情况,也可以在灰度一致性特征的情况下的基于不同灰度差阈值、或在边缘连续性特征的基于不同边缘连续性阈值来得到另外的几个系列的有层次感的聚类结构图,它们也或多或少、或大或小地包括了要检测的对象。
如果将这些不同分割程度的结构图按照分割程度更粗到分割程度更细的顺序从上到下排列,则可以构建类似于层叠结构金字塔(CascadeStructurePyramids,CSP)的结构,其中相对于金字塔底部的结构图,位于金字塔顶部的结构图中的信息通常更少、更抽象。之所以称其为金字塔,正是因为按稠密表示法,位于CSP顶部的结构图更加抽象、数据量更小,比位于CSP底部的结构图更“小”,正如一个金字塔形。当然,该构建金字塔的步骤是可选的,仅是为了更直观地向读者表达本发明的构思而已。
如此,由于不同的第一第一级结构图是利用该第一类相关特征、准则或模型的不同严格程度来生成的,因此这种不同的第一级结构图可以包括不同分割程度的目标,例如,有个(些)结构图可能包括较多过分割的目标(即,一个实际对象可能被分割为过多小区域)和较少过合并的目标(即,多个实际对象可能被合并为一个大区域),有个(些)结构图可能包括较少过分割的目标和可能包括较多过合并(即欠分割)的目标,当然,有个(些)结构图也可能包括正好大小合适的包括实际对象的分割目标和可能的少量过分割、过合并的分割目标。通过分析这些不同分割程度的结构图,可以相互校正一些过分割和过合并的分割目标,从而得到较为精准的分割目标。
在一个实施例中,可以通过所述在不同第一分割程度上包括目标的至少一个第一第一级结构图互相校正,基于目标的特征,来确定在哪种第一分割程度上分割的目标更准确,从而得到包括在确定的第一分割程度上分割的目标的第一级目标分析结果的结构图。例如,在基于空间相邻性特征来聚类的情况下,不同的第一第一级结构图具有不同分割程度的分割目标。假设要检测的对象是公交车,则例如目标的特征可以包括典型的公交车的高度、宽度的平均值、公交车背面的各个像素点的视差值(或距离或深度值)差较小(因为公交车背面典型地是竖直的且由于双目相机拍摄的前方公交车背面通常是背面面对着双目相机的,因此公交车背面的像素点在视差图上的视差值(或距离或深度值)大致接近)、和/或公交车侧面的垂直线上的各个像素点的视差值(或距离或深度值)差较小(同样因为公交车侧面典型地是竖直的)、分割目标的内部某些点的视差值(或距离或深度值)与其他点的差异不大等等。如此,可以基于公交车这个具体对象的特征,来确定大小近似于预定大小的分割目标、具有大致接近的视差值(或距离或深度值)差的分割目标、和/或在垂直线方向上具有大致接近的视差值(或距离或深度值)差的分割目标是更准确的分割目标,从而确定该分割目标为目标分析结果(即所检测的对象的位置),且可以根据分割目标的内部某些块的视差值(或距离或深度值)与其他块的视差值(或距离或深度值)相差较大,则可以认为该分割目标可以被进一步分割等等。
如此,可以通过得到针对某一类相关特征、准则或模型、在不同分割程度上包括目标的分割结构图,例如、包括过分割区域的结构图、过合并区域的结构图、正好恰当的区域的结构图等等,来分析以互相校正、并基于目标的特征来确定哪种分割程度上分割的目标更准确,从而得到较为精准的分割目标。
注意,在本文中,示例地而非限制地通常使用术语“对象”来表示要实际检测的实际物体,而使用术语“目标”或“分割(的)目标”或“分割(的)区域”来表示对立体图像进行处理而得到的目标检测结果,这种目标检测结果不一定是对象的实际真实位置,而是如上所述可以根据不同的目标检测方式和/或变化的目标检测精确程度而改变的。
图3示出了根据本发明的另一个实施例的用层叠结构来表示立体图像以分析图像中的目标的方法的示例流程图。
图3所示的方法300包括:步骤S301,针对输入的立体图像,基于立体图像中的第一类相关特征、准则或模型,来生成至少一个第一第一级结构图,其中,不同的第一第一级结构图是利用该第一类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第一第一级结构图在不同第一分割程度上包括目标;步骤302,针对输入的立体图像,基于与所述第一类相关特征、准则或模型不同的第二类相关特征、准则或模型,来生成至少一个第二第一级结构图,其中,不同的第二第一级结构图是利用该第二类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第二第一级结构图在不同第二分割程度上包括目标;步骤303,至少部分地结合所述至少一个第一第一级结构图和所述至少一个第二第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。
从而,可见,在步骤301中通过对第一类相关特征、准则或模型的不同严格程度的选择,来得到在不同分割程度上包括目标的聚类结构图,可以形成有层次感的一系列第一第一级聚类结构图。同时,在步骤302中通过对第二类相关特征、准则或模型的不同严格程度的选择,来得到在不同分割程度上包括目标的聚类结构图,可以形成有层次感的一系列第二第一级聚类结构图。
如果将这些不同分割程度的结构图按照分割程度更粗到分割程度更细的顺序从上到下排列,则可以构建两个类似于层叠结构金字塔(CascadeStructurePyramids,CSP)的结构,包括针对第一类相关特征、准则或模型的第一个第一级CSP金字塔和针对第二类相关特征、准则或模型的第二个第一级CSP金字塔。注意,这两个金字塔都是第一级的。
然后,如上述,由于不同的第一第一级结构图可以包括针对第一类标准(例如,相关特征、准则或模型)的不同分割程度的目标,例如,有个(些)第一第一级结构图可能包括较多过分割的目标和较少过合并的目标,有个(些)第一第一级结构图可能包括较少过分割的目标和可能包括较多过合并的目标,当然,有个(些)第一第一级结构图也可能包括正好大小合适的包括实际对象的分割目标和可能的少量过分割、过合并的分割目标;同时由于不同的第二第一级结构图可以包括针对第二类标准的不同分割程度的目标,例如,有个(些)第二第一级结构图可能包括较多过分割的目标和较少过合并的目标,有个(些)第二第一级结构图可能包括较少过分割的目标和可能包括较多过合并的目标,当然,有个(些)第二第一级结构图也可能包括正好大小合适的包括实际对象的分割目标和可能的少量过分割、过合并的分割目标。通过分析这些不同标准的、且在不同标准下的不同分割程度的结构图,更可以相互校正一些过分割和过合并的分割目标,从而得到较为精准的分割目标。
在一个实施例中,可以通过所述至少一个第二第一级结构图来校正所述至少一个第一第一级结构图,基于目标的特征,来确定在不同第一分割程度和不同第二分割程度中哪种分割程度上分割的目标更准确,从而得到包括在确定的分割程度上分割的目标的第一级目标分析结果的结构图。例如,在第一类标准是基于空间相邻性特征来聚类、且第一类标准是基于灰度一致性特征来聚类的情况下,假设要检测的对象是公交车,则例如目标的特征可以包括如上所述地典型的公交车的高度、宽度的平均值、公交车背面的各个像素点的视差值(或距离或深度值)差较小、和/或公交车侧面的垂直线上的各个像素点的视差值(或距离或深度值)差较小,还可以包括例如公交车背面的水平方向上灰度基本一致等等。如此,可以基于公交车这个具体对象的特征,来确定大小近似于预定大小的分割目标、具有大致接近的视差值(或距离或深度值)差的分割目标、和/或在垂直线方向上具有大致接近的视差值(或距离或深度值)差、且背面的水平方向上灰度基本一致的分割目标是更准确的分割目标,或将不同第一级结构图或不同第二第一级结构图中的分割的目标进行合并或分割以达到在该确定的分割程度上分割的目标,从而确定该分割目标为目标分析结果(即所检测的对象的位置)。
如此,可以通过得到针对某两类相关特征、准则或模型、在不同分割程度上包括目标的分割结构图,例如、包括过分割区域的结构图、过合并区域的结构图、正好恰当的区域的结构图等等,来分析以互相校正、并基于目标的特征来确定哪种相关特征、准则或模型下、哪种分割程度上分割的目标更准确,从而得到较为精准的分割目标。
在一个实施例中,目标的特征可以包括目标的左右对称的特性、目标的水平方向上灰度一致的特性、或目标的包含内部轮廓的特性等。当然,这些特征仅是示例而非限制,目标的特征还可以包括很多其他与具体目标有关的图形和图形方面的特征,比如,人头肩的“Ω”形,本领域技术人员也可以构思这些特征,在此不一一举例。
方法进行到此,也可以告一段落,即不进行图3所示的步骤304和步骤305也能得到一定精准程度的分割目标分析结果。当然,上述分析仍是第一级金字塔的目标分析,其与图2所示的实施例相比,仅是多了一个第一级金字塔来辅助另一第一级金字塔的目标分析。
接下来,为了得到更精准的分割目标结果,该方法300还可以包括第一级金字塔的目标分析,其包括:步骤304,针对所述第一级目标分析结果的结构图,基于与所述第一类或第二类相关特征、准则或模型都不同的第三类相关特征、准则或模型,来生成至少一个第二级结构图,其中,不同的第一级结构图是利用该第三类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第二级结构图在不同第三拟合程度上包括目标;步骤305,至少部分地结合所述至少一个第二级结构图来分析立体图像中的目标,以得到包括目标的第二级目标分析结果的结构图。
如此,基于第一级目标分析结果的结构图来构造针对第三类相关特征、准则或模型的一系列第二级结构图,以可选地构成第二级金字塔,从而利用包括过分割区域、过合并区域、正好恰当的区域等等的第二级金字塔的结构图,来分析以互相校正、并基于目标的特征来确定哪种分割程度上分割的目标更准确,从而得到较为精准的分割目标。在此,由于该第二级金字塔是利用已经较为准确的第一级目标分析结果的结构图来进一步构造的,因此,对第二级金字塔的结构图的分析和校正而得到的分割目标的结构图则可能更为准确。
在一个实施例中,该第三类相关特征、准则或模型可以包括基于几何特征的竖直线拟合模型、平面拟合模型或立方体拟合模型。具体地,例如,竖直线拟合模型是例如将第一级的分割目标所构成的块拟合为一条或多条竖直线,其中在每条竖直线上,结构图中的分割目标所构成的块都具有相似的视差值(距离值或深度值);平面拟合模型是例如将第一级的分割目标所构成的块拟合为一个或多个平面;立方体拟合模型是例如将第一级的分割目标所构成的块拟合为一个或多个立方体。
在一个实施例中,可以通过所述在不同第三拟合程度上包括目标的至少一个第二级结构图互相校正,基于目标的特征,来确定在哪种第三拟合程度上分割的目标更准确,从而得到包括在确定的第三拟合程度上分割的目标的第二级目标分析结果的结构图。例如,假设要检测的对象是公交车,则例如目标的特征可以包括公交车背面的垂直线上的分割块的视差值(或距离或深度值)差较小、公交车背面和侧面是两个面、和/或整个公交车是一个立方体等。如此,可以基于公交车这个具体对象的特征,来确定公交车背面的垂直线上的各个分割块的视差值(或距离或深度值)差较小、公交车背面和侧面是两个面、和/或整个公交车是一个立方体的分割目标是更准确的分割目标,或将不同第一级结构图中的分割的目标进行合并或分割、甚至是进一步拟合以达到在该确定的分割程度上分割的目标,从而确定该分割目标为目标分析结果(即所检测的对象的位置)。
如此,可以看出经过2级金字塔结构之后,可以在第一级金字塔结构的初步目标分析结果的基础上进行进一步的目标分析结果,从而使得目标分析结果更加准确。
以上仅描述了2个第一级金字塔结构图和1个第二级金字塔结构图,当然本实施例不限于此,实际上,多于2个第一级金字塔结构、多于1个第二级金字塔结构图也是可行的,且多于1个第三级、第四级、第n(n是正整数)级金字塔结构图都是可行的。具体地,利用至少一个第一级金字塔结构相互校正来得到作为第一级目标分析结果的结构图,然后,利用第一级目标分析结果作为基础来构造至少一个第二级金字塔结构图,并利用至少一个第二级金字塔结构相互校正来得到作为第二级目标分析结果的结构图,然后,利用第二级目标分析结果作为基础来构造至少一个第三级金字塔结构图,并利用至少一个第三级金字塔结构相互校正来得到作为第三级目标分析结果的结构图,以此类推,在此不赘述。
以下,将利用一个实际例子来详细地描述本技术的更多具体细节。
图4A示出了根据本发明的再一个实施例的用层叠结构来表示立体图像以分析图像中的目标的具体方法的示例流程图。图4B示出了应用图4A所示的方法的过程的直观示意图。
如图4A所示的具体方法包括如下步骤:步骤401,对输入的立体图像进行低级CSP构建;步骤402,对低级CSP进行校正和融合;步骤403,基于低级进行高级CSP构建;步骤404,对高级CSP进行分析以校正高级CSP,并得到检测的目标的位置信息。
如图4B所示,在该实施例中,分低级和高级两级金字塔结构CSP,每级金字塔结构CSP中又包括三个结构图。例如图4B所示,低级CSP包括金字塔A和金字塔B,高级CSP包括金字塔C和金字塔D。低级的金字塔A包括三个低级层叠结构图(LowLevelCascadeStructure,LLCS)i、j、k,低级的金字塔B包括三个低级层叠结构图(LLCS)l、m、n,高级的金字塔C包括三个高级层叠结构图(HighLevelCascadeStructure,HLCS)o、p、q,高级的金字塔D包括三个高级层叠结构图(HLCS)r、s、t。
注意,在本文中,为了便于理解,使用术语“级”指的是多个金字塔组成的大结构(如图4B的上下两级大结构),而“层”指的是一个金字塔内部的结构图(如图4B的一个金字塔内的三层结构)。
图5示出了如图4A所示地基于不同类相关特征、准则或模型来生成多系列低级层叠结构金字塔(CSP)的结构图的过程的流程图。
低级CSP构建流程图的例子如图5所示,包括而非限制地构建以下CSP:步骤S501,基于空间相邻性特征的CSP构建;步骤S502,基于灰度一致性特征的CSP构建;步骤S503,基于边缘连续性特征的CSP构建。其他相关特征、准则或模型在此未一一举例,但本领域技术人员可以构思其他相关特征、准则或模型来构造CSP。本文仅以基于空间相邻性特征的CSP的构建为例进行说明,其他CSP可以基于各自选择的特征采用相应的聚类方法来进行构建。
图6A-6E示出了基于一类相关特征、准则或模型(即,举例的空间相邻性特征)生成一系列低级层叠结构金字塔(CSP)的示例结构图、以及结合该一系列低级结构图来得到包括目标的低级目标分析结果的结构图的过程的示意图。
图6A示出了从输入的立体图像中转换得到的原始灰度图像(如图6A的(a)所示)和原始视差图像(如图6A的(b)所示)。
在图4的步骤402中,可以进行例如基于空间相邻性特征的低层CSP构建:对输入的视差图进行处理,以得到非限制地包括以下一系列结构图(如图6B所示):
1)基于固定视差中心的聚类图。
在该结构图中,每一个分割区域都具有固定的视差值中心(该分割区域形成时,第一个加入该分割区域的像素点的视差值作为该分割区域的视差值中心),新加入的像素点需要与分割区域的视差值中心(在实际视差值(或距离或深度值)上)接近,并且与该分割区域的位置相邻。如图6B中的(a)所示,白色框表示聚类的小块,每个块即为一个分割区域,其中包含视差,位置,大小等信息。该结构图示例地位于CSP的底层,因为以此方式得到的结构图中的分割区域较细小、较具体、信息和数据量较大。
2)基于可移动视差中心的聚类图。
在该结构图中,每一个分割区域的视差值中心的是可偏移的。该分割区域形成时,第一个加入该分割区域的像素点的视差值作为该分割区域的视差值中心。新加入某一分割区域的像素点只需要与该分割区域中与其相邻的边界点的视差值接近即可,然后将视差值中心向该新加入的像素点的视差值方向偏移,因为该视差值中心是基于分割区域中的已有的像素点和新加入的像素点的视差值来计算的。因此每个新加入的像素点都会对该分割区域的视差值中心产生影响。该结构图位于CSP的中层,因为其中的分割区域相比于图6B(a)的底层来说更大、更抽象、信息和数据量更小,如图6B的(b)所示。
3)基于大邻域的聚类图。
在该结构图中,与基于可移动视差中心的聚类图采用类似的准则,只是控制视差值差的阈值参数为大一些和/或使得邻域尺寸更大,使聚类在一个更大的邻域范围内进行,从而得到较大的分割区域。该结构图位于CSP的顶层,因为其中的分割区域相比于图6B(b)的中层来说更大、更抽象、信息和数据量更小,如图6B的(c)所示。
即,上述3种情况都是基于空间相邻性特征的不同分割程度,从而可以得到3种具有不同分割程度的目标的结构图。如图6C所示,底层的结构图可能包括较多过分割的目标(即,一个实际对象可能被分割为过多小区域)和较少过合并的目标(即,多个实际对象可能被合并为一个大区域),顶层的结构图可能包括较少过分割的目标和可能包括较多过合并(即欠分割)的目标,当然,中层的结构图也可能包括正好大小合适的包括实际对象的分割目标和可能的少量过分割、过合并的分割目标。
当然,3层的结构图仅是示例,实际上也可以构建2层或多于3层的结构图。
可选地,可以将以上结构图按由低到高的顺序构成基于空间相邻性特征的CSP金字塔,如图6D的(a)和(b)所示。这些结构图都可以由一些本领域常用的聚类方法得到,如连接部件标记算法(ConnectedComponentLabeling),区域生长算法(RegionGrowing)等。更多关于连接部件标记算法(ConnectedComponentLabeling)的介绍可以参考以下内容:http://en.wikipedia.org/wiki/Connected-component_labeling。在此不详细介绍这些本领域常用的聚类方法。
如此构建的CSP金字塔可以有多种应用,例如通过分析这些不同分割程度的结构图(如图6D的(b)所示),可以相互校正一些过分割和过合并的分割目标,从而得到较为精准的分割目标(如图6D的(c)所示)。
以下,分别以车道线检测和车辆检测为例来说明如何进行相互校正。
图6C和6D的(b)显示了取自基于空间相邻性特征的不同分割程度而得到的不同层CSP的结构图。在CSP底层的结构图(基于固定视差中心的聚类图)中,车辆和车道线都是过分割的。在CSP的中层结构图,车辆的右部是过分割的,同时其左部是过合并的(与车道线合并在一起)。在CSP顶层的结构图(基于大邻域的聚类图)中,车辆和车道线都是过合并的。
针对不同的应用,可以选取合适的特征参数(例如聚类中心的设置)与聚类参数(例如阈值大小)来控制该级CSP中各层结构图的过分割与过合并程度。在后面的步骤中,该级CSP中的这些结构图会综合考虑并处理以得到较为精确的目标位置。
一种可选的考虑方式例如图6E所示,其中假设(a)中的白色粗框表示基于空间相邻性特征得到的底层结构图中的两个聚类块,而白色粗虚线框表示基于空间相邻性特征得到的顶层结构图中的一个聚类块,此时可能不知道哪些聚类块是过合并的而哪些聚类块是过分割的。但是,通过画面中的各个对象的视差分析,如果在底层结构图中的两个聚类块之间存在视差值(或距离或深度值)与这两个聚类块不同的区域,则考虑该两个聚类块是合适分割的,因为其中间存在远处的背景(或其他对象),因此白色粗虚线框的那一个聚类块则可能是过合并的,故可以将顶层结构图中该过合并的聚类块从两个前景目标与背景的交接处分割开,而底层结构图中的两个前景目标块可以被保留下来,而不进行合并或分割等进一步操作。
如此,类似地,按照画面中的各个对象的具体特征,能够综合考虑该级CSP中的这些结构图并进行进一步合并或分割或保留操作以得到较为精确的目标位置。当然,图6E所示的方式仅是示例而非限制,本领域技术人员可以根据对象的具体特征来构思其他进行进一步合并或分割或保留操作的条件。
注意,CSP中的这些示例结构图像只是为了显示而采用了稀疏的表示方法。事实上,系统在内部处理的时候对CSP中的结构图可以采用稠密的表示方法。在稠密表示方法中,采用包含了各个块信息以及相邻块之间关系的图结构来表示聚类结果。因此,在CSP中,顶部结构图更加的抽象、具有更小的数据量,能够看起来更“小",形如金字塔。
在图4的步骤402中,可以进行低级CSP融合。
在该步骤中,如果仅存在一个针对空间相邻性特征的低级CSP,可以仅结合针对空间相邻性特征的低级CSP中的三层结构图来进行分割区域(即聚类结果)的进一步的合并、分割以校正结构图的分割目标,如图6D所示。
而该步骤中,如果存在多于一个低级CSP,可以结合不同低级CSP的不同层之间的结构图,进行进一步的合并、分割以校正结构图的分割目标,来适应不同应用的需要。
以下,以基于空间相邻性特征的低级CSP与基于灰度一致性特征的低级CSP(即两个低级CSP)的融合校正为例进行说明,如图7A所示。图7A示出了结合关于空间相邻性特征的一系列低级结构图以及关于灰度一致性特征的一系列结构图来得到另一种包括目标的低级目标分析结果的结构图的过程的示意图。
融合校正操作所需处理的感兴趣区域(RegionofInterest,ROI)可在基于空间相邻性特征的CSP的高层结构图(过合并的聚类图)中确定,如图7A的左上图中的方框所示。结合基于空间相邻性特征的CSP的低级结构图(图7A中的左下图)与基于灰度一致性特征的CSP的低级结构图(图7A中的中间下部图像),将该基于灰度一致性特征的CSP的低级结构图中的小聚类区块作为基本数据元素,这些空间相邻性特征的CSP的低级结构图或基于灰度一致性特征的CSP的低级结构图中的小聚类块分别具有相似的视差值或相似的灰度值。在先前确定的ROI内,以这些结构图中的小聚类块作为基本数据元素输入,根据要检测的车辆的特征,确定何种分割程度是准确的,从而进行进一步的分割和合并处理,可以得到校正后的结构图,如图7A中的右图所示。
具体地,一种可选的方式例如图7B所示,图7B示出了结合关于空间相邻性特征的一系列低级结构图以及关于灰度一致性特征的一系列结构图来得到另一种包括目标的低级目标分析结果的结构图的过程涉及的图像例子的示意图。
图7B的(a)中的白色框表示基于空间相邻性特征得到的底层结构图的聚类块,白色虚线框表示基于空间相邻性特征得到的顶层结构图确定的ROI。图7B中的(b)表示基于灰度一致性特征得到的结构图。图7B的(c)中上方和下方的水平黑线表示此处水平灰度一致性校验失败,不能将图7B(a)中的两个白色框的块合并为一个块;下方的水平灰线表示此处水平灰度一致性校验通过,可以将图7B(a)中的两个白色框的块合并为一个块。
如此,类似地,按照画面中的各个对象的具体特征,能够综合考虑该低级CSP中的这些两类一系列结构图(即一个或多个空间相邻性特征的结构图和一个或多个基于灰度一致性的结构图)并进行进一步合并或分割或保留操作以得到较为精确的目标位置。当然,图7B所示的方式仅是示例而非限制,本领域技术人员可以根据对象的具体特征来构思其他进行进一步合并或分割或保留操作的条件。
在图4所示的步骤S403中,进行高级CSP构建。
在该步骤中,基于高级相关特征、准则或模型,以未校正的低级CSP(例如图6B所示的)或校正后的低级CSP(例如图7A中的右图所示)作为输入,构建高级CSP。在这里仅以对校正后的低级CSP、基于几何结构模型的高级CSP为例进行说明。
图8A示出了基于图7A所示的另一种包括目标的低级目标分析结果的结构图来生成一系列高级结构图。图8B示出了基于图8A所示的一系列高级结构图来得到一系列高级层叠结构金字塔(CSP)的结构图。
图8A所示的基于几何结构模型的CSP的是基于低级CSP生成的:在低级CSP的高级结构图中可以确定待处理的感兴趣区(Regionofinterest,ROI),在该ROI内以低级CSP的低级结构图中的数据作为基本元素输入,进行几何模型的参数拟合。构造基于几何结构模型的CSP可以包括但非限制为以下结构图:
c1)基于竖直线模型的结构图
如图8A的(a)中的白色竖直线所示,将低级的分割目标所构成的块拟合为一条或多条竖直线,在每条竖直线上,来自低级CSP的低级结构图中的分割块都具有相似的视差值(即,距离值或深度值)。
c2)基于平面模型的结构图
如图8A的(b)中的白色平面所示,将低级分割目标所构成的块拟合为一个或多个平面。这里有两个平面:车辆正面的平面与车辆侧方的平面。
c3)基于立方体模型的结构图
如图8A的(c)中的白色立方体所示,将第一级的分割目标所构成的块拟合为一个或多个立方体。这里用一个立方体来表示车辆位置。
将以上这些结构图按由低到高的顺序结合起来共同构成基于几何结构模型的CSP,如图8B所示。当然,该排列成金字塔以便于读者理解的步骤不是必需的。
在图4的步骤S404中,进行高级CSP分析以得到检测目标。
在该步骤中,对CSP的高级结构图中的几何模型进行分解,对CSP的低级结构图中的几何模型进行综合,以得到检测目标,如图9所示。图9示出了结合图8A所示的一系列高级结构图来生成包括目标的高级目标分析结果的结构图。
作为示例而非限制,具体地,首先,基于中层结构图(左中图)中的平面模型数据,对顶层结构图(左下图)中的立方体模型数据进行分析。可以看到,在该立方体内有若干平面,这些平面的分布不满足立方体模型,所以可以将该立方体分解为平面。然后基于底层结构图(左上图)中的竖直线模型数据,来校验这些平面模型数据。最前面的平面覆盖若干其他平面,故该平面不满足平面模型的数据分布(左边的车辆与右边的摩托车具有相似的视差值,即距离或深度值,它们共同构成了最前方的那个平面,但是在其内部存在一些其他物体构成的平面),故可以将最前面的平面分解为竖直线模型数据。与此同时,基于竖直线模型数据,对其他的几个平面进行校验,发现它们的分布满足平面模型分布,故可以将这些平面保留。到目前为止,可以如上所述地采用自顶向下的方法将模型进行分解,接下来,可以将采用自底向上的方法进行模型的综合。由立方体模型与平面模型分解得到的竖直线模型数据,可以经过拟合形成新的平面;这些平面进行一步的拟合,可以与先前保留下来的平面组合形成新的更精确的立方体,如图9中的右图所示。这些新的立方体可以作为目标位置的更精确表示的高级结果而输出。如此,示例地进行了各个层次的高级结构图之间的相互校正。
当然上述方式仅是一种示例而非限制,本领域技术人员可以通过各个层次的高级结构图以及要检测的对象的特征来设计各种各样的校正方式。
要注意,以上对图6到图9的具体例子的描述仅是示例而非限制,本领域技术人员也设计基于不同特征、准则或模型来构建各种金字塔,也可以设计各种各样层次和级别的金字塔,来对要检测的对象进行各种准确程度的分析和检测,在此不一一举例。
图10示出了根据本发明的一个实施例的用层叠结构来表示立体图像以分析图像中的目标的系统的示例方框图。
图10所示的用层叠结构来表示立体图像以分析图像中的目标的系统1000包括:第一第一级生成装置1001,被配置为针对输入的立体图像,基于立体图像中的第一类相关特征、准则或模型,来生成至少一个第一第一级结构图,其中,不同的第一第一级结构图是利用该第一类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第一第一级结构图在不同第一分割程度上包括目标;第一第一级分析装置1002,被配置为至少部分地结合所述至少一个第一第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。
如此,可以通过得到针对某一类相关特征、准则或模型、在不同分割程度上包括目标的分割结构图,例如、包括过分割区域的结构图、过合并区域的结构图、正好恰当的区域的结构图等等,来分析以互相校正、并基于目标的特征来确定哪种分割程度上分割的目标更准确,从而得到较为精准的分割目标。
在一个实施例中,该系统1000还可以包括:第二第一级生成装置(图中未示出),被配置为针对输入的立体图像,基于与所述第一类相关特征、准则或模型不同的第二类相关特征、准则或模型,来生成至少一个第二第一级结构图,其中,不同的第二第一级结构图是利用该第二类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第二第一级结构图在不同第二分割程度上包括目标;第二第一级分析装置(图中未示出),被配置为至少部分地结合所述至少一个第一第一级结构图和所述至少一个第二第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。
该系统1000还可以包括:第二级生成装置,被配置为针对所述第一级目标分析结果的结构图,基于与所述第一类或第二类相关特征、准则或模型都不同的第三类相关特征、准则或模型,来生成至少一个第二级结构图,其中,不同的第二级结构图是利用该第三类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第二级结构图在不同第三拟合程度上包括目标;第二级分析装置,被配置为至少部分地结合所述至少一个第二级结构图来分析立体图像中的目标,以得到包括目标的第二级目标分析结果的结构图。
在一个实施例中,所述第一类或第二类相关特征、准则或模型可以包括用于聚类的基于空间相邻性特征、灰度一致性特征、边缘连续性特征、或轮廓特征等的聚类。所述第一类或第二类相关特征、准则或模型的不同严格程度可以包括在空间相邻性特征的情况下的基于固定视差中心或基于可移动视差中心的不同空间视差(即,距离)阈值的聚类、在灰度一致性特征的情况下的基于不同灰度差阈值的聚类、或在边缘连续性特征的基于不同边缘连续性阈值的聚类、或在轮廓特征的情况下的基于不同的轮廓包含关系的聚类等。所述第三类相关特征、准则或模型可以包括竖直线拟合模型、平面拟合模型或立方体拟合模型。
在一个实施例中,第一第一级分析装置可以被配置为:通过所述在不同第一分割程度上包括目标的至少一个第一第一级结构图互相校正,基于目标的特征,来确定在哪种第一分割程度上分割的目标更准确,从而得到包括在确定的第一分割程度上分割的目标的第一级目标分析结果的结构图。
在一个实施例中,第二第一级分析装置可以被配置为:通过所述至少一个第二第一级结构图来校正所述至少一个第一第一级结构图,基于目标的特征,来确定在不同第一分割程度和不同第二分割程度中哪种分割程度上分割的目标更准确,从而得到包括在确定的分割程度上分割的目标的第一级目标分析结果的结构图。
第一第一级分析装置可以被配置为:通过所述在不同第三拟合程度上包括目标的至少一个第二级结构图互相校正,基于目标的特征,来确定在哪种第三拟合程度上分割的目标更准确,从而得到包括在确定的第三拟合程度上分割的目标的第二级目标分析结果的结构图。
第二第一级分析装置可以被配置为:在根据目标的特征确定在不同第一分割程度和不同第二分割程度中哪种分割程度上分割的目标更准确之后,将所述不同第一第一级结构图或不同第二第一级结构图中的分割的目标进行合并或分割以达到在该确定的分割程度上分割的目标。
第二级分析装置可以被配置为:在根据目标的特征确定在不同第三拟合程度中哪种分割程度上分割的目标更准确之后,将所述不同第二级结构图中的分割的目标进行合并或分割以达到在该确定的分割程度上分割的目标。
在一个实施例中,目标的特征可以包括目标的左右对称的特性、目标的水平方向上灰度一致的特性、或目标的包含内部轮廓的特性等。
如此,可以看出经过2级金字塔结构之后,可以在第一级金字塔结构的初步目标分析结果的基础上进行进一步的目标分析结果,从而使得目标分析结果更加准确。
注意,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本发明的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本发明为必须采用上述具体的细节来实现。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
本公开中的步骤流程图以及以上方法描述仅作为例示性的例子并且不意图要求或暗示必须按照给出的顺序进行各个实施例的步骤。如本领域技术人员将认识到的,可以按任意顺序进行以上实施例中的步骤的顺序。诸如“其后”、“然后”、“接下来”等等的词语不意图限制步骤的顺序;这些词语仅用于引导读者通读这些方法的描述。此外,例如使用冠词“一个”、“一”或者“该”对于单数的要素的任何引用不被解释为将该要素限制为单数。
另外,本文中的各个实施例中的步骤和装置并非仅限定于某个实施例中实行,事实上,可以根据本发明的概念来结合本文中的各个实施例中相关的部分步骤和部分装置以构思新的实施例,而这些新的实施例也包括在本发明的范围内。
以上所述的方法的各个操作可以通过能够进行相应的功能的任何适当的手段而进行。该手段可以包括各种硬件和/或软件组件和/或模块,包括但不限于电路、专用集成电路(ASIC)或处理器。
可以利用被设计用于进行在此所述的功能的通用处理器、数字信号处理器(DSP)、ASIC、场可编程门阵列信号(FPGA)或其他可编程逻辑器件(PLD)、离散门或晶体管逻辑、离散的硬件组件或者其任意组合而实现或进行所述的各个例示的逻辑块、模块和电路。通用处理器可以是微处理器,但是作为替换,该处理器可以是任何商业上可获得的处理器、控制器、微控制器或状态机。处理器还可以实现为计算设备的组合,例如DSP和微处理器的组合,多个微处理器、与DSP核协作的一个或多个微处理器或任何其他这样的配置。
结合本公开描述的方法或算法的步骤可以直接嵌入在硬件中、处理器执行的软件模块中或者这两种的组合中。软件模块可以存在于任何形式的有形存储介质中。可以使用的存储介质的一些例子包括随机存取存储器(RAM)、只读存储器(ROM)、快闪存储器、EPROM存储器、EEPROM存储器、寄存器、硬碟、可移动碟、CD-ROM等。存储介质可以耦接到处理器以便该处理器可以从该存储介质读取信息以及向该存储介质写信息。在替换方式中,存储介质可以与处理器是整体的。软件模块可以是单个指令或者许多指令,并且可以分布在几个不同的代码段上、不同的程序之间以及跨过多个存储介质。
在此公开的方法包括用于实现所述的方法的一个或多个动作。方法和/或动作可以彼此互换而不脱离权利要求的范围。换句话说,除非指定了动作的具体顺序,否则可以修改具体动作的顺序和/或使用而不脱离权利要求的范围。
所述的功能可以按硬件、软件、固件或其任意组合而实现。如果以软件实现,功能可以作为一个或多个指令存储在切实的计算机可读介质上。存储介质可以是可以由计算机访问的任何可用的切实介质。通过例子而不是限制,这样的计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光碟存储、磁碟存储或其他磁存储器件或者可以用于携带或存储指令或数据结构形式的期望的程序代码并且可以由计算机访问的任何其他切实介质。如在此使用的,碟(disk)和盘(disc)包括紧凑盘(CD)、激光盘、光盘、数字通用盘(DVD)、软碟和蓝光盘,其中碟通常磁地再现数据,而盘利用激光光学地再现数据。
因此,计算机程序产品可以进行在此给出的操作。例如,这样的计算机程序产品可以是具有有形存储(和/或编码)在其上的指令的计算机可读的有形介质,该指令可由一个或多个处理器执行以进行在此所述的操作。计算机程序产品可以包括包装的材料。
软件或指令也可以通过传输介质而传输。例如,可以使用诸如同轴电缆、光纤光缆、双绞线、数字订户线(DSL)或诸如红外、无线电或微波的无线技术的传输介质从网站、服务器或者其他远程源传输软件。
此外,用于进行在此所述的方法和技术的模块和/或其他适当的手段可以在适当时由用户终端和/或基站下载和/或其他方式获得。例如,这样的设备可以耦接到服务器以促进用于进行在此所述的方法的手段的传送。或者,在此所述的各种方法可以经由存储部件(例如RAM、ROM、诸如CD或软碟等的物理存储介质)提供,以便用户终端和/或基站可以在耦接到该设备或者向该设备提供存储部件时获得各种方法。此外,可以利用用于将在此所述的方法和技术提供给设备的任何其他适当的技术。
其他例子和实现方式在本公开和所附权利要求的范围和精神内。例如,由于软件的本质,以上所述的功能可以使用由处理器、硬件、固件、硬连线或这些的任意的组合执行的软件实现。实现功能的特征也可以物理地位于各个位置,包括被分发以便功能的部分在不同的物理位置处实现。而且,如在此使用的,包括在权利要求中使用的,在以“至少一个”开始的项的列举中使用的“或”指示分离的列举,以便例如“A、B或C的至少一个”的列举意味着A或B或C,或AB或AC或BC,或ABC(即A和B和C)。此外,措辞“示例的”不意味着描述的例子是优选的或者比其他例子更好。
可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外,本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而,所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本发明。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本发明的范围。因此,本发明不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本发明的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种用层叠结构来表示立体图像以分析图像中的目标的方法,包括:
针对输入的立体图像,基于立体图像中的第一类相关特征、准则或模型,来生成至少一个第一第一级结构图,其中,不同的第一第一级结构图是利用该第一类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第一第一级结构图在不同第一分割程度上包括目标;
至少部分地结合所述至少一个第一第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。
2.根据权利要求1所述的方法,还包括:
针对输入的立体图像,基于与所述第一类相关特征、准则或模型不同的第二类相关特征、准则或模型,来生成至少一个第二第一级结构图,其中,不同的第二第一级结构图是利用该第二类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第二第一级结构图在不同第二分割程度上包括目标;
至少部分地结合所述至少一个第一第一级结构图和所述至少一个第二第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。
3.根据权利要求1或2所述的方法,还包括:
针对所述第一级目标分析结果的结构图,基于与所述第一类或第二类相关特征、准则或模型都不同的第三类相关特征、准则或模型,来生成至少一个第二级结构图,其中,不同的第二级结构图是利用该第三类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第二级结构图在不同第三拟合程度上包括目标;
至少部分地结合所述至少一个第二级结构图来分析立体图像中的目标,以得到包括目标的第二级目标分析结果的结构图。
4.根据权利要求3所述的方法,其中,
所述第一类或第二类相关特征、准则或模型包括用于聚类的空间相邻性特征、灰度一致性特征、边缘连续性特征、或轮廓特征,
所述第一类或第二类相关特征、准则或模型的不同严格程度包括在空间相邻性特征的情况下的基于固定视差中心或基于可移动视差中心的不同空间视差阈值的聚类、在灰度一致性特征的情况下的基于不同灰度差阈值的聚类、在边缘连续性特征的基于不同边缘连续性阈值、或在轮廓特征的情况下的基于不同的轮廓包含关系的聚类;
所述第三类相关特征、准则或模型包括竖直线拟合模型、平面拟合模型或立方体拟合模型。
5.根据权利要求1或2所述的方法,
其中,所述至少部分地结合所述至少一个第一第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图的步骤包括:
通过所述在不同第一分割程度上包括目标的至少一个第一第一级结构图互相校正,基于目标的特征,来确定在哪种第一分割程度上分割的目标更准确,从而得到包括在确定的第一分割程度上分割的目标的第一级目标分析结果的结构图,
其中,至少部分地结合所述至少一个第一第一级结构图和所述至少一个第二第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图的步骤包括:
通过所述至少一个第二第一级结构图来校正所述至少一个第一第一级结构图,基于目标的特征,来确定在不同第一分割程度和不同第二分割程度中哪种分割程度上分割的目标更准确,从而得到包括在确定的分割程度上分割的目标的第一级目标分析结果的结构图。
6.根据权利要求3所述的方法,其中,
至少部分地结合所述至少一个第二级结构图来分析立体图像中的目标,以得到包括目标的第二级目标分析结果的结构图的步骤包括:
通过所述在不同第三拟合程度上包括目标的至少一个第二级结构图互相校正,基于目标的特征,来确定在哪种第三拟合程度上分割的目标更准确,从而得到包括在确定的第三拟合程度上分割的目标的第二级目标分析结果的结构图。
7.根据权利要求5所述的方法,其中,所述互相校正步骤包括:
在根据目标的特征确定在不同第一分割程度和不同第二分割程度中哪种分割程度上分割的目标更准确之后,将所述不同第一第一级结构图或不同第二第一级结构图中的分割的目标进行合并或分割以达到在该确定的分割程度上分割的目标。
8.根据权利要求6所述的方法,其中,所述互相校正步骤包括:
在根据目标的特征确定在不同第三拟合程度中哪种分割程度上分割的目标更准确之后,将所述不同第二级结构图中的分割的目标进行合并或分割以达到在该确定的分割程度上分割的目标。
9.根据权利要求5所述的方法,其中,目标的特征包括目标的左右对称的特性、目标的水平方向上灰度一致的特性、或目标的包含内部轮廓的特性。
10.一种用层叠结构来表示立体图像以分析图像中的目标的系统,包括:
第一第一级生成装置,被配置为针对输入的立体图像,基于立体图像中的第一类相关特征、准则或模型,来生成至少一个第一第一级结构图,其中,不同的第一第一级结构图是利用该第一类相关特征、准则或模型的不同严格程度来生成的,且所述不同的第一第一级结构图在不同第一分割程度上包括目标;
第一第一级分析装置,被配置为至少部分地结合所述至少一个第一第一级结构图来分析立体图像中的目标,以得到包括目标的第一级目标分析结果的结构图。
CN201410264246.XA 2014-06-13 2014-06-13 用层叠结构来表示立体图像以分析图像中的目标的技术 Expired - Fee Related CN105163103B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410264246.XA CN105163103B (zh) 2014-06-13 2014-06-13 用层叠结构来表示立体图像以分析图像中的目标的技术
US14/731,577 US9679205B2 (en) 2014-06-13 2015-06-05 Method and system for displaying stereo image by cascade structure and analyzing target in image
JP2015118580A JP6561605B2 (ja) 2014-06-13 2015-06-11 目標分析方法及び目標分析システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410264246.XA CN105163103B (zh) 2014-06-13 2014-06-13 用层叠结构来表示立体图像以分析图像中的目标的技术

Publications (2)

Publication Number Publication Date
CN105163103A true CN105163103A (zh) 2015-12-16
CN105163103B CN105163103B (zh) 2017-10-27

Family

ID=54803845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410264246.XA Expired - Fee Related CN105163103B (zh) 2014-06-13 2014-06-13 用层叠结构来表示立体图像以分析图像中的目标的技术

Country Status (3)

Country Link
US (1) US9679205B2 (zh)
JP (1) JP6561605B2 (zh)
CN (1) CN105163103B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766056A (zh) * 2020-12-30 2021-05-07 厦门大学 一种基于深度神经网络的弱光环境车道线检测方法、装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6970577B2 (ja) * 2017-09-29 2021-11-24 株式会社デンソー 周辺監視装置および周辺監視方法
US10706308B2 (en) * 2018-08-07 2020-07-07 Accenture Global Solutions Limited Image processing for automated object identification
CN112287807B (zh) * 2020-10-27 2022-06-07 武汉大学 一种基于多分支金字塔神经网络的遥感影像道路提取方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509097A (zh) * 2011-09-29 2012-06-20 北京新媒传信科技有限公司 一种图像分割方法和装置
CN103295224A (zh) * 2013-03-14 2013-09-11 北京工业大学 一种基于均值漂移和分水岭的乳腺超声图像自动分割方法
CN103390164A (zh) * 2012-05-10 2013-11-13 南京理工大学 基于深度图像的对象检测方法及其实现装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10201523A1 (de) * 2002-01-17 2003-07-31 Bosch Gmbh Robert Verfahren und Vorrichtung zur Verdeckungsdetektion bei Bildsensorsystemen
KR100834577B1 (ko) * 2006-12-07 2008-06-02 한국전자통신연구원 스테레오 비전 처리를 통해 목표물 검색 및 추종 방법, 및이를 적용한 가정용 지능형 서비스 로봇 장치
US8363909B2 (en) 2007-03-20 2013-01-29 Ricoh Company, Limited Image processing apparatus, image processing method, and computer program product
CN101271515B (zh) * 2007-03-21 2014-03-19 株式会社理光 能识别多角度目标的图像检测装置
CN101271514B (zh) 2007-03-21 2012-10-10 株式会社理光 一种快速目标检测和目标输出的图像检测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509097A (zh) * 2011-09-29 2012-06-20 北京新媒传信科技有限公司 一种图像分割方法和装置
CN103390164A (zh) * 2012-05-10 2013-11-13 南京理工大学 基于深度图像的对象检测方法及其实现装置
CN103295224A (zh) * 2013-03-14 2013-09-11 北京工业大学 一种基于均值漂移和分水岭的乳腺超声图像自动分割方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
龙翔等: "运动图像多尺度分割方法及其参数估计", 《运动图像多尺度分割方法及其参数估计 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766056A (zh) * 2020-12-30 2021-05-07 厦门大学 一种基于深度神经网络的弱光环境车道线检测方法、装置
CN112766056B (zh) * 2020-12-30 2023-10-27 厦门大学 一种基于深度神经网络的弱光环境车道线检测方法、装置

Also Published As

Publication number Publication date
US9679205B2 (en) 2017-06-13
JP6561605B2 (ja) 2019-08-21
US20150363633A1 (en) 2015-12-17
JP2016004585A (ja) 2016-01-12
CN105163103B (zh) 2017-10-27

Similar Documents

Publication Publication Date Title
EP3510561B1 (en) Predicting depth from image data using a statistical model
US9378424B2 (en) Method and device for detecting road region as well as method and device for detecting road line
US8681150B2 (en) Method, medium, and system with 3 dimensional object modeling using multiple view points
US9242601B2 (en) Method and device for detecting drivable region of road
JP6496987B2 (ja) 目標検出方法及び目標検出装置
JP6131704B2 (ja) 連続型道路分割体の検知方法及び連続型道路分割体の検知装置
US10249052B2 (en) Stereo correspondence model fitting
CN104166834B (zh) 路面检测方法和装置
CN101582171B (zh) 一种创建深度图的方法及装置
EP3182369A1 (en) Stereo matching method, controller and system
US20200184727A1 (en) Localization method and apparatus based on 3d color map
KR102097869B1 (ko) 자가 지도 학습을 이용한 딥러닝 기반 도로 영역 추정 장치 및 방법
EP3926360A1 (en) Neural network based methods and systems for object detection using concatenated lidar, radar and camera data sets
CN105163103A (zh) 用层叠结构来表示立体图像以分析图像中的目标的技术
CN104537668A (zh) 一种快速视差图像计算方法及装置
CN102307308B (zh) 一种在触摸屏上生成立体图像的方法和设备
CN112989877A (zh) 点云数据中标注对象的方法及装置
Saif et al. Vision based 3D Object Detection using Deep Learning: Methods with Challenges and Applications towards Future Directions
Shin et al. Evaluation of two stereo matchers on long real-world video sequences
CN104252707A (zh) 对象检测方法和装置
Saleem et al. Effects of ground manifold modeling on the accuracy of stixel calculations
JP6800901B2 (ja) 物体領域識別装置、物体領域識別方法およびプログラム
CN107305688A (zh) 检测道路消失点的方法、装置和系统
Cui et al. Homography‐based traffic sign localisation and pose estimation from image sequence
CN104123715A (zh) 配置视差值的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171027

Termination date: 20200613

CF01 Termination of patent right due to non-payment of annual fee