CN113808251B - 一种基于语义分割的稠密重建的方法、系统、装置和介质 - Google Patents
一种基于语义分割的稠密重建的方法、系统、装置和介质 Download PDFInfo
- Publication number
- CN113808251B CN113808251B CN202110907252.2A CN202110907252A CN113808251B CN 113808251 B CN113808251 B CN 113808251B CN 202110907252 A CN202110907252 A CN 202110907252A CN 113808251 B CN113808251 B CN 113808251B
- Authority
- CN
- China
- Prior art keywords
- depth
- semantic
- point cloud
- map
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000011218 segmentation Effects 0.000 title claims abstract description 36
- 238000005457 optimization Methods 0.000 claims abstract description 22
- 238000004590 computer program Methods 0.000 claims description 18
- 238000003860 storage Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 230000002285 radioactive effect Effects 0.000 claims description 5
- 239000012467 final product Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 13
- 230000003749 cleanliness Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Image Processing (AREA)
Abstract
本申请涉及一种基于语义分割的稠密重建的方法、系统、装置和介质,其中,该方法包括:对场景图像进行语义分割,得到语义图,提取语义图的语义信息,并根据语义信息类别,将语义信息进行分类,得到二次分类的语义标签集合;接着,通过语义标签集合,对深度图的深度优化操作进行辅助处理,得到处理后的深度图;最后,对处理后的深度图进行点云生成,最终生成目标稠密点云。通过本申请,解决了在对场景图像进行稠密重建时,存在生成的点云区域噪声较多、质量不高的问题,不仅提升了点云的干净度,降低了点云噪点数目,还提升了深度和点云的正确性。
Description
技术领域
本申请涉及视觉图像技术领域,特别是涉及一种基于语义分割的稠密重建的方法、系统、装置和介质。
背景技术
随着计算机技术的快速发展,三维重建技术也在越来越多的领域应用,如常见的导航领域。三维重建技术是计算机视觉的重要技术之一,基于视觉的三维重建技术通过深度数据获取、预处理、点云配准与融合、生成物体表面等过程,把真实场景刻画成符合计算机逻辑表达的数学模型。具体地,视觉三维重建的流程主要包括场景定位定姿、稠密重建、表面重建和纹理贴图,其中,稠密重建是三维重建技术中很重要的一部分,影响后续地图重建的准确性。
在相关技术中,在对场景图像进行稠密重建时,一些干扰信息或者动态物体会导致在立体匹配产出深度图的阶段,产生很多的噪点和错误值,如果这些错误值无法被修正,会引起稠密点云具有较多杂乱噪点和错误。此外,在稠密重建的点云使用中,如数字孪生,数字展览,交通管控系统或模型搭建时,无法对点云中的动态物体,或者影响点云观赏性以及长期变动的部分进行智能去除。
目前针对相关技术中,在对场景图像进行稠密重建时,存在生成的点云区域噪声较多、质量不高的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种基于语义分割的稠密重建的方法、系统、装置和介质,以至少解决相关技术中在对场景图像进行稠密重建时,存在生成的点云区域噪声较多、质量不高的问题。
第一方面,本申请实施例提供了一种基于语义分割的稠密重建的方法,所述方法包括:
对场景图像进行语义分割,得到语义图,提取所述语义图的语义信息,并根据语义信息类别,将所述语义信息进行分类,得到二次分类的语义标签集合;
通过所述语义标签集合,对深度图的深度优化操作进行辅助处理,得到处理后的深度图;
对所述处理后的深度图进行点云生成,最终生成目标稠密点云。
在其中一些实施例中,所述根据语义信息类别,将所述语义信息进行分类,得到二次分类的语义标签集合包括:
可根据最终生成物稠密点云的不同用途划分标签,对所述语义信息进行分类,其中,所述标签包括但不限于固定物标签、动态物标签、无效标签或变动标签。
在其中一些实施例中,所述通过所述语义标签集合,对深度图的深度优化操作进行辅助处理包括:
选取所述语义标签集合中所述动态物标签和所述无效标签,并对所述动态物标签和所述无效标签对应区域的深度进行无效化;
或根据所述语义信息,设置并剔除所述深度图中的异常深度值,以去除放射性噪点。
在其中一些实施例中,对所述动态物标签和所述无效标签对应区域的深度进行无效化包括:
将所述深度图的语义区域中具有所述动态物标签或所述无效标签的区域像素值,赋值为0,其余区域赋值为1,得到二进制掩码图。
在其中一些实施例中,在得到二进制掩码图之后,所述方法包括:
将所述二进制掩码图中的赋值为0的区域进行图像膨胀,获得目标二进制掩码图,并将所述目标二进制掩码图与所述深度图进行叠加,得到处理后的深度图。
在其中一些实施例中,根据所述语义信息,设置并剔除所述深度图中的异常深度值包括:
对同一张深度图中连通的语义区域,根据所述语义信息类别,进行深度限定。
在其中一些实施例中,根据所述语义信息类别,进行深度限定包括:
对同一张深度图中,被语义类别标定为平面的区域进行限定,其中,在所述平面像素点的深度值严重偏离一般平面具有的高斯噪声深度值的情况下,对所述平面中深度值偏离较大的点进行无效化处理;
对同一张深度图中,同一区域的小物体类型的深度进行集中区间限定,以所述集中区间的深度值中位数为基准,若存在深度值偏离较大的像素点,则对所述深度值偏离较大的像素点进行无效化处理;
对特殊类型的语义标签区域,允许所述区域的深度值超过预设阈值,对其余语义标签像素深度值超过预设阈值的区域做无效化处理。
第二方面,本申请实施例提供了一种基于语义分割的稠密重建的系统,所述系统包括:
语义标签模块,用于对场景图像进行语义分割,得到语义图,提取所述语义图的语义信息,并根据语义信息类别,将所述语义信息进行分类,得到二次分类的语义标签集合;
深度优化模块,用于通过所述语义标签集合,对深度图的深度优化操作进行辅助处理,得到处理后的深度图;
点云生成模块,用于对所述处理后的深度图进行点云生成,最终生成目标稠密点云。
第三方面,本申请实施例提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的基于语义分割的稠密重建的方法。
第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的基于语义分割的稠密重建的方法。
相比于相关技术,本申请实施例提供的基于语义分割的稠密重建的方法,对场景图像进行语义分割,得到语义图,提取语义图的语义信息,并根据语义信息类别,将语义信息进行分类,得到二次分类的语义标签集合;接着,通过语义标签集合,对深度图的深度优化操作进行辅助处理,得到处理后的深度图;最后,对处理后的深度图进行点云生成,最终生成目标稠密点云。
本申请的有益效果在于通过语义分割和语义分类,对场景图像的不同类型的语义采取不同的分类策略,获取语义标签集合,并通过具有不同语义标签集合的语义图对深度图的深度优化进行辅助策略改进,优化了稠密点云的质量,具体在以下两个方面有提升:
1、去除了动态物体对点云的干扰,此外,还去除了由于误匹配生成的错误深度值,进而去除了点云放射性噪声,及其对点云质量的干扰,提升了点云的干净度,并降低了点云噪点数目。
2、通过语义信息,提升了边缘处的深度图和点云的精确性,还通过平面假设,提升了平面区域,包括水面,地面,反光区域等的点云深度正确性
解决了在对场景图像进行稠密重建时,存在生成的点云区域噪声较多、质量不高的问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的基于语义分割的稠密重建的方法的流程图;
图2是根据本申请实施例的未经过语义优化处理的点云示意图;
图3是根据本申请实施例的经过语义优化处理的点云示意图;
图4是根据本申请实施例的基于语义分割的稠密重建的系统的结构框图;
图5是根据本申请实施例的电子设备的内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本申请实施例提供了一种基于语义分割的稠密重建的方法,图1是根据本申请实施例的基于语义分割的稠密重建的方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,对场景图像进行语义分割,得到语义图,提取语义图的语义信息,并根据语义信息类别,将语义信息进行分类,得到二次分类的语义标签集合;
可选的,本实施例中,可根据最终生成物稠密点云的不同用途划分标签,对语义信息进行分类,其中,标签包括但不限于固定物标签、动态物标签、无效标签或变动标签等。具体地,固定物标签的物体包括:建筑物、地面、路面、桥、街道、门、窗、架子或天花板等,动态物标签的物体包括:人、汽车、摩托车、自行车、船或旗子等,无效标签的物体包括:天空、水、湖、河、镜子或屏幕等,变动标签的物体包括:山、树、草、盆景、藤蔓、海报、衣服或织物等。在实际使用中,通常以实际需求,赋予每个语义信息对应的二次分类标签。需要说明的是,除上述分类方式之外,还可以通过其他方式对语义信息进行分类,这里不做具体限定。
本实施例用过通过语义分割和语义分类,对场景图像的不同类型的语义采取不同的分类策略,获取语义标签集合,有助于提高对深度图的优化效率和优化质量;
步骤S102,通过语义标签集合,对深度图的深度优化操作进行辅助处理,得到处理后的深度图;
优选的,本实施例可采用多种策略对深度图的深度优化操作进行辅助处理。可选地有,策略一:可选取语义标签集合中动态物标签和无效标签,并对动态物标签和无效标签对应区域的深度进行无效化;或策略二:根据语义信息,设置并剔除深度图中的异常深度值,以去除放射性噪点。
针对策略一,将深度图的语义区域中具有动态物标签或无效标签的区域像素值,赋值为0,其余区域赋值为1,得到二进制掩码图;
优选的,在得到二进制掩码图之后,将该二进制掩码图中的赋值为0的区域进行图像膨胀,获得目标二进制掩码图,具体地,对二进制掩码图的赋值为0的区域进行图像膨胀操作,获得目标二进制掩码图,称为Mask。其中,膨胀核的大小可设置为r*r,r=0.01*原图像较短边长度,且这里的0.01为自定义倍数,可根据实际情况进行调整修改;
进一步地,将目标二进制掩码图与深度图进行叠加,得到处理后的深度图。
其中,该处理后的深度图计算公式如下式1所示:
其中,Mask(i,j)=1代表像素坐标(i,j)的掩码值为1;Depthold(i,j)代表原始深度图对应的像素深度值;Depthnew(i,j)代表新生成的处理后的深度图对应的像素深度值。
通过策略一的方法,将深度图中的动态物体和无效区域如天空,水体,湖面等进行无效化,从而使得最终点云中不包括这些容易产生噪声的无效内容,减少噪声点,提升了点云的质量。
针对策略二,可选的,本实施例可以对同一张深度图中连通的语义区域,根据语义信息类别,进行深度限定。
可选的,具体限定策略包括但不限于如下方式:
1、对同一张深度图中,被语义类别标定为平面的区域进行限定,其中,在平面像素点的深度值严重偏离一般平面具有的高斯噪声深度值的情况下,对所述平面中深度值偏离较大的点进行无效化处理。例如,在同一张图中,被语义标注为地面、水面等区域部分,接近于平面,因此其深度值的点需符合一般平面的高斯噪声深度值。如有深度值偏离较大的像素点时,则认为其是噪声,对其进行无效化操作,例如设置其深度值为-1;
2、对同一张深度图中,同一区域的小物体类型的深度进行集中区间限定,以集中区间像素点的深度值中位数为基准,如存在深度值偏离较大的像素点时,则对该深度值偏离较大的像素点进行无效化处理。例如,对于床、桌子、家具和轿车等同一区域的小物体类型,他们的像素深度的最大值和最小值之间的差应小于5-10米,以该区域的深度值中位数为基准,如有深度值偏离较大的像素点,则认为其是噪声,对其进行无效化操作;
3、对特殊类型的语义标签区域,允许该区域的深度值超过预设阈值,对其余语义标签像素深度值超过预设阈值的区域做无效化处理。例如,对于个别特殊类型的语义标签,如山、路、水面或地面等现实中可能体积较大的语义标签区域,可允许其深度值超过预设阈值,如30米。而对于其余语义标签区域,由于其对应的实际物体的体积限制,因此,如果深度过大,距离过远,那么观测得到的结果也可能不准确,因此,如果其余语义标签区域得到的像素深度若过大需做无效化处理。
需要说明的是,上述限定策略并不固定,可进行自由组合。
通过策略二,本实施例根据语义信息,对各类语义信息构成的区域,加以多种深度值的限制,来提升这些区域的深度质量并去除噪点。不仅提升了边缘处的深度图和点云的精确性,还通过平面假设,提升了平面区域,包括水面,地面,反光区域等的点云深度正确性;
步骤S103,对处理后的深度图进行点云生成,最终生成目标稠密点云。优选的,本实施例中对处理后得到的深度图进行点云生成,最终经过计算得到目标稠密点云。其中,经过上述步骤中无效化处理的深度区域不参与计算。
通过上述步骤S101至步骤S103,本申请实施例通过语义分割和语义分类,对场景图像的不同类型的语义采取不同的分类策略,获取语义标签集合,并通过具有不同语义标签集合的语义图对深度图的深度优化进行辅助策略改进,优化了稠密点云的质量,解决了在对场景图像进行稠密重建时,存在生成的点云区域噪声较多、质量不高的问题。不仅提升了点云的干净度,降低了点云噪点数目,还提升了深度和点云的正确性。
图2是根据本申请实施例的未经过语义优化处理的点云示意图,图3是根据本申请实施例的经过语义优化处理的点云示意图,如图2所示为通过常规三维重建方法获得的点云图,图中含有较多天空边缘噪点和动态行人,点云图的质量不高;根据上述策略对场景图像中的动态标签的物体如行人和边缘噪点进行深度优化处理,可最终得到如图3所示的优化点云图。通过两者对比,可显著发现,经过语义信息优化场景深度图后,最终生成得到的点云图质量有着很大的提升,不仅提升了点云的干净度,降低了点云噪点数目,还提升了点云深度的准确性。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例还提供了一种基于语义分割的稠密重建的系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本申请实施例的基于语义分割的稠密重建的系统的结构框图,如图4所示,该系统包括语义标签模块41、深度优化模块42和点云生成模块43:
语义标签模块41,用于对场景图像进行语义分割,得到语义图,提取语义图的语义信息,并根据语义信息类别,将语义信息进行分类,得到二次分类的语义标签集合;深度优化模块42,用于通过语义标签集合,对深度图的深度优化操作进行辅助处理,得到处理后的深度图;点云生成模块43,用于对处理后的深度图进行点云生成,最终生成目标稠密点云。
通过上述系统,本申请实施例通过语义标签模块41对场景图像进行语义分割和语义分类,并对场景图像的不同类型的语义采取不同的分类策略,获取语义标签集合;接着,深度优化模块42通过具有不同语义标签集合的语义图对深度图的深度优化进行辅助策略改进,优化了稠密点云的质量;最终通过点云生成模块43生成了目标稠密点云。解决了在对场景图像进行稠密重建时,存在生成的点云区域噪声较多、质量不高的问题。不仅提升了点云的干净度,降低了点云噪点数目,还提升了深度和点云的正确性。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
此外,需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
本实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
另外,结合上述实施例中的基于语义分割的稠密重建的方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种基于语义分割的稠密重建的方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于语义分割的稠密重建的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,图5是根据本申请实施例的电子设备的内部结构示意图,如图5所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图5所示。该电子设备包括通过内部总线连接的处理器、网络接口、内存储器和非易失性存储器,其中,该非易失性存储器存储有操作系统、计算机程序和数据库。处理器用于提供计算和控制能力,网络接口用于与外部的终端通过网络连接通信,内存储器用于为操作系统和计算机程序的运行提供环境,计算机程序被处理器执行时以实现一种基于语义分割的稠密重建的方法,数据库用于存储数据。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (4)
1.一种基于语义分割的稠密重建的方法,其特征在于,所述方法包括:
对场景图像进行语义分割,得到语义图,提取所述语义图的语义信息,并可根据最终生成物稠密点云的不同用途划分标签,对所述语义信息进行分类,其中,所述标签包括但不限于固定物标签、动态物标签、无效标签或变动标签;
选取所述动态物标签和所述无效标签,并对所述动态物标签和所述无效标签对应区域的深度进行无效化;或根据所述语义信息,设置并剔除深度图中的异常深度值,以去除放射性噪点;
对所述动态物标签和所述无效标签对应区域的深度进行无效化包括:将深度图的语义区域中具有所述动态物标签或所述无效标签的区域像素值,赋值为0,其余区域赋值为1,得到二进制掩码图;将所述二进制掩码图中的黑色区域进行图像膨胀,获得目标二进制掩码图,并将所述目标二进制掩码图与所述深度图进行叠加,得到处理后的深度图;
根据所述语义信息,设置并剔除深度图中的异常深度值,包括:对同一张深度图中连通的语义区域,根据所述语义信息类别,进行深度限定,其中,根据所述语义信息类别,进行深度限定包括:对同一张深度图中,被语义类别标定为平面的区域进行限定,其中,在所述平面像素点的深度值严重偏离一般平面具有的高斯噪声深度值的情况下,对所述平面进行无效化处理;对同一张深度图中,同一区域的小物体类型的深度进行集中区间限定,以所述集中区间的深度值中位数为基准,如存在偏离较大的深度值,则对所述集中区间进行无效化处理;对特殊类型的语义标签区域,允许所述区域的深度值超过预设阈值,对其余语义标签像素深度值超过预设阈值的区域做无效化处理;
对所述处理后的深度图进行点云生成,最终生成目标稠密点云。
2.一种基于语义分割的稠密重建的系统,其特征在于,所述系统包括:
语义标签模块,用于对场景图像进行语义分割,得到语义图,提取所述语义图的语义信息,并可根据最终生成物稠密点云的不同用途划分标签,对所述语义信息进行分类,其中,所述标签包括但不限于固定物标签、动态物标签、无效标签或变动标签;
深度优化模块,用于选取所述动态物标签和所述无效标签,并对所述动态物标签和所述无效标签对应区域的深度进行无效化;或根据所述语义信息,设置并剔除深度图中的异常深度值,以去除放射性噪点;其中,对所述动态物标签和所述无效标签对应区域的深度进行无效化包括:将深度图的语义区域中具有所述动态物标签或所述无效标签的区域像素值,赋值为0,其余区域赋值为1,得到二进制掩码图;将所述二进制掩码图中的黑色区域进行图像膨胀,获得目标二进制掩码图,并将所述目标二进制掩码图与所述深度图进行叠加,得到处理后的深度图;根据所述语义信息,设置并剔除深度图中的异常深度值,包括:对同一张深度图中连通的语义区域,根据所述语义信息类别,进行深度限定,其中,根据所述语义信息类别,进行深度限定包括:对同一张深度图中,被语义类别标定为平面的区域进行限定,其中,在所述平面像素点的深度值严重偏离一般平面具有的高斯噪声深度值的情况下,对所述平面进行无效化处理;对同一张深度图中,同一区域的小物体类型的深度进行集中区间限定,以所述集中区间的深度值中位数为基准,如存在偏离较大的深度值,则对所述集中区间进行无效化处理;对特殊类型的语义标签区域,允许所述区域的深度值超过预设阈值,对其余语义标签像素深度值超过预设阈值的区域做无效化处理;
点云生成模块,用于对所述处理后的深度图进行点云生成,最终生成目标稠密点云。
3.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1所述的基于语义分割的稠密重建的方法。
4.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1所述的基于语义分割的稠密重建的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110907252.2A CN113808251B (zh) | 2021-08-09 | 2021-08-09 | 一种基于语义分割的稠密重建的方法、系统、装置和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110907252.2A CN113808251B (zh) | 2021-08-09 | 2021-08-09 | 一种基于语义分割的稠密重建的方法、系统、装置和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113808251A CN113808251A (zh) | 2021-12-17 |
CN113808251B true CN113808251B (zh) | 2024-04-12 |
Family
ID=78942871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110907252.2A Active CN113808251B (zh) | 2021-08-09 | 2021-08-09 | 一种基于语义分割的稠密重建的方法、系统、装置和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113808251B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114440856A (zh) * | 2022-01-21 | 2022-05-06 | 北京地平线信息技术有限公司 | 一种构建语义地图的方法及装置 |
CN114332104B (zh) * | 2022-03-09 | 2022-07-29 | 南方电网数字电网研究院有限公司 | 电网输电场景rgb点云语义分割多阶段模型联合优化方法 |
CN114627426B (zh) * | 2022-05-13 | 2022-08-23 | 盈嘉互联(北京)科技有限公司 | 一种融合建筑数字孪生语义图的图像检测方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622768A (zh) * | 2012-03-14 | 2012-08-01 | 清华大学 | 一种平面视频的深度图求取方法 |
WO2019019019A1 (zh) * | 2017-07-25 | 2019-01-31 | 深圳前海达闼云端智能科技有限公司 | 训练数据生成方法、生成装置及其图像语义分割方法 |
CN110097553A (zh) * | 2019-04-10 | 2019-08-06 | 东南大学 | 基于即时定位建图与三维语义分割的语义建图系统 |
CN111325843A (zh) * | 2020-03-09 | 2020-06-23 | 北京航空航天大学 | 一种基于语义逆深度滤波的实时语义地图构建方法 |
CN111462135A (zh) * | 2020-03-31 | 2020-07-28 | 华东理工大学 | 基于视觉slam与二维语义分割的语义建图方法 |
CN111754583A (zh) * | 2020-05-29 | 2020-10-09 | 江苏大学 | 一种车载三维激光雷达和相机外参联合标定的自动化方法 |
CN111968129A (zh) * | 2020-07-15 | 2020-11-20 | 上海交通大学 | 具有语义感知的即时定位与地图构建系统及方法 |
AU2020103901A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field |
WO2021070651A1 (ja) * | 2019-10-10 | 2021-04-15 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
WO2021078179A1 (zh) * | 2019-10-22 | 2021-04-29 | 华为技术有限公司 | 图像显示方法及设备 |
WO2021102948A1 (zh) * | 2019-11-29 | 2021-06-03 | 深圳市大疆创新科技有限公司 | 图像处理方法及装置 |
CN112949640A (zh) * | 2021-01-29 | 2021-06-11 | 罗普特科技集团股份有限公司 | 点云语义分割方法、装置、计算设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10650531B2 (en) * | 2018-03-16 | 2020-05-12 | Honda Motor Co., Ltd. | Lidar noise removal using image pixel clusterings |
CN110889851B (zh) * | 2018-09-11 | 2023-08-01 | 苹果公司 | 针对深度和视差估计的语义分割的稳健用途 |
-
2021
- 2021-08-09 CN CN202110907252.2A patent/CN113808251B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622768A (zh) * | 2012-03-14 | 2012-08-01 | 清华大学 | 一种平面视频的深度图求取方法 |
WO2019019019A1 (zh) * | 2017-07-25 | 2019-01-31 | 深圳前海达闼云端智能科技有限公司 | 训练数据生成方法、生成装置及其图像语义分割方法 |
CN110097553A (zh) * | 2019-04-10 | 2019-08-06 | 东南大学 | 基于即时定位建图与三维语义分割的语义建图系统 |
WO2021070651A1 (ja) * | 2019-10-10 | 2021-04-15 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
WO2021078179A1 (zh) * | 2019-10-22 | 2021-04-29 | 华为技术有限公司 | 图像显示方法及设备 |
WO2021102948A1 (zh) * | 2019-11-29 | 2021-06-03 | 深圳市大疆创新科技有限公司 | 图像处理方法及装置 |
CN111325843A (zh) * | 2020-03-09 | 2020-06-23 | 北京航空航天大学 | 一种基于语义逆深度滤波的实时语义地图构建方法 |
CN111462135A (zh) * | 2020-03-31 | 2020-07-28 | 华东理工大学 | 基于视觉slam与二维语义分割的语义建图方法 |
CN111754583A (zh) * | 2020-05-29 | 2020-10-09 | 江苏大学 | 一种车载三维激光雷达和相机外参联合标定的自动化方法 |
CN111968129A (zh) * | 2020-07-15 | 2020-11-20 | 上海交通大学 | 具有语义感知的即时定位与地图构建系统及方法 |
AU2020103901A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field |
CN112949640A (zh) * | 2021-01-29 | 2021-06-11 | 罗普特科技集团股份有限公司 | 点云语义分割方法、装置、计算设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
一种由粗至精的RGB-D室内场景语义分割方法;刘天亮;冯希龙;顾雁秋;戴修斌;罗杰波;;东南大学学报(自然科学版)(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113808251A (zh) | 2021-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113808251B (zh) | 一种基于语义分割的稠密重建的方法、系统、装置和介质 | |
Lu et al. | Multi-scale adversarial network for underwater image restoration | |
Zhou et al. | BOMSC-Net: Boundary optimization and multi-scale context awareness based building extraction from high-resolution remote sensing imagery | |
CN112115783A (zh) | 基于深度知识迁移的人脸特征点检测方法、装置及设备 | |
Zhang et al. | Saliency detection via local structure propagation | |
Liu et al. | Painting completion with generative translation models | |
Jiang et al. | Deep edge map guided depth super resolution | |
Guo et al. | Salient object detection from low contrast images based on local contrast enhancing and non-local feature learning | |
CN109190662A (zh) | 一种基于关键点回归的车辆三维检测方法、系统、终端和存储介质 | |
Gu et al. | Thermal image colorization using Markov decision processes | |
Lv et al. | Memory‐augmented neural networks based dynamic complex image segmentation in digital twins for self‐driving vehicle | |
Zhou et al. | A superior image inpainting scheme using Transformer-based self-supervised attention GAN model | |
Chen et al. | A simplified ICA-based local similarity stereo matching | |
Huang et al. | Robust simultaneous localization and mapping in low‐light environment | |
Gao et al. | CI-Net: A joint depth estimation and semantic segmentation network using contextual information | |
Vasu et al. | Topoal: An adversarial learning approach for topology-aware road segmentation | |
Tang et al. | Salient object detection via two-stage absorbing Markov chain based on background and foreground | |
Serati et al. | Digital surface model generation from high-resolution satellite stereo imagery based on structural similarity | |
Zihao et al. | Outlier removal based on Chauvenet’s criterion and dense disparity refinement using least square support vector machine | |
Lee et al. | Determination of building model key points using multidirectional shaded relief images generated from airborne LiDAR data | |
Amirkolaee et al. | Convolutional neural network architecture for digital surface model estimation from single remote sensing image | |
Mao et al. | City object detection from airborne Lidar data with OpenStreetMap‐tagged superpixels | |
Zhang et al. | Region of interest extraction via common salient feature analysis and feedback reinforcement strategy for remote sensing images | |
Wang et al. | Mapping road based on multiple features and B-GVF snake | |
Zhang et al. | Land Cover Change Detection Based on Vector Polygons and Deep Learning With High Resolution Remote Sensing Images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |