CN112132845A - 三维模型的单体化方法、装置、电子设备和可读介质 - Google Patents
三维模型的单体化方法、装置、电子设备和可读介质 Download PDFInfo
- Publication number
- CN112132845A CN112132845A CN202010814347.5A CN202010814347A CN112132845A CN 112132845 A CN112132845 A CN 112132845A CN 202010814347 A CN202010814347 A CN 202010814347A CN 112132845 A CN112132845 A CN 112132845A
- Authority
- CN
- China
- Prior art keywords
- dimensional model
- semantic segmentation
- target object
- top view
- boundary line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000011218 segmentation Effects 0.000 claims abstract description 88
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 238000010801 machine learning Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 12
- 239000000178 monomer Substances 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了三维模型的单体化方法、装置、电子设备和可读介质。该方法的实施例包括:获取三维模型的俯视图;对所述俯视图进行语义分割,基于语义分割结果,确定待进行单体化的目标对象;从所述俯视图中获取所述目标对象的边界线;基于所述边界线,对所述三维模型中的所述目标对象进行单体化。该实施方式提高了在三维模型单体化过程中的信息利用率,从而提高了三维模型单体化的准确性。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及三维模型的单体化方法、装置、电子设备和可读介质。
背景技术
随着计算机技术的发展,通过倾斜摄影测量技术,可对实景进行三维建模,从而得到三维模型。然而,通过倾斜摄影所得到的三维模型中,各对象(如建筑物、植物、道路等)是连在一起的,因而需要一些目标对象(如建筑物)进行单体化,使目标对象相互独立,以便于针对单个目标对象进行属性设置等。
现有技术中,通常仅利用点云数据进行三维模型的单体化。例如,可通过对点云数据进行滤波、分类等,识别出目标对象,从而对目标对象进行单体化。然而,点云数据仅包含三维形状信息,不包含原有图像中的颜色、轮廓等信息,因而使用这种方式进行三维模型的单体化,无法对原有图像中的信息进行充分利用,导致单体化的准确性较低。
发明内容
本申请实施例提出了三维模型的单体化方法、装置、电子设备和可读介质,以提高在三维模型单体化过程中的信息利用率,从而提高三维模型单体化的准确性。
第一方面,本申请实施例提供了一种三维模型的单体化方法,该方法包括:获取三维模型的俯视图;对所述俯视图进行语义分割,基于语义分割结果,确定待进行单体化的目标对象;从所述俯视图中获取所述目标对象的边界线;基于所述边界线,对所述三维模型中的所述目标对象进行单体化。
第二方面,本申请实施例提供了一种三维模型的单体化装置,该装置包括:第一获取单元,被配置成获取三维模型的俯视图;语义分割单元,被配置成对所述俯视图进行语义分割,基于语义分割结果,确定待进行单体化的目标对象;第二获取单元,被配置成从所述俯视图中获取所述目标对象的边界线;单体化单元,被配置成基于所述边界线,对所述三维模型中的所述目标对象进行单体化。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述第一方面中所描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面中所描述的方法。
本申请实施例提供的三维模型的单体化方法、装置、电子设备和可读介质,通过获取三维模型的俯视图,并对俯视图进行语义分割,从而可基于语义分割结果,确定待进行单体化的目标对象。之后,通过从俯视图中获取目标对象的边界线,从而可基于该边界线对三维模型中的目标对象进行单体化。由于三维模型的俯视图中包含了颜色、轮廓等多种信息,因而采用对俯视图进行语义分割的方式进行目标对象的单体化,提高了三维模型单体化过程中的信息利用率,从而提高了三维模型单体化的准确性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本申请的三维模型的单体化方法的一个实施例的流程图;
图2是根据本申请的三维模型的单体化方法的又一个实施例的流程图;
图3是根据本申请的三维模型的单体化装置的一个实施例的结构示意图;
图4是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了根据本申请的三维模型的单体化方法的一个实施例的流程100。该三维模型的单体化方法可应用于各种电子设备,可包括但不限于服务器、智能手机、平板电脑、膝上型便携计算机、车载电脑、台式计算机等。
上述电子设备中可以安装有三维模型编辑工具(如3D Studio Max、Houdin等),以便于进行三维模型的制作和编辑。
该三维模型的单体化方法,包括以下步骤:
步骤101,获取三维模型的俯视图。
在本实施例中,三维模型的单体化方法的执行主体(如上述电子设备)可以首先获取三维模型的俯视图。此处的三维模型可以是待进行单体化的三维模型。实践中,可首先将三维模型文件导入三维模型编辑工具,以显示三维模型。而后,在三维模型工具中调整该三维模型,得到三维模型的俯视图。三维模型的俯视图也为三维模型的正投影图。
在本实施例的一些可选的实现方式中,可通过如下步骤获取三维模型的俯视图:
第一步,通过倾斜摄影生成三维模型。
倾斜摄影是通过从一个垂直、四个倾斜、五个不同的视角同步采集影像,获取到丰富的建筑物顶面及侧视的高分辨率纹理的技术。在通过倾斜摄影所采集的影像的基础上,可结合定位、融合、建模等技术,生成真实的三维模型,如包含建筑物、植物、道路等的三维城市模型。
通过倾斜摄影建立三维模型,其建模机制在于首先从所拍摄的影像像对中生成稠密的点云,然后对点云进行抽稀,再构建三角网,最后进行贴图。此过程中,不会把建筑、植物、道路等地物区分出来,因此构建出来的是一个连续的不规则三角网(TriangulatedIrregular Network,TIN)。此时的三维模型为一整体,因而无法从其中选中单个对象(如单个建筑物),更无法对单个对象(如单个建筑物)执行赋予属性、查询属性等基本操作。因此,需要对通过倾斜摄影所得到的三维模型进行单体化。
第二步,确定三维模型的地平面。
此处,可以将通过倾斜摄影生成的三维模型导入三维模型编辑工具,三维模型编辑工具可自动识别三维模型的地平面。
第三步,基于上述地平面对上述三维模型进行旋转,生成上述三维模型的俯视图。
步骤102,对俯视图进行语义分割,基于语义分割结果,确定待进行单体化的目标对象。
在本实施例中,三维模型的俯视图是一个二维图像,且该图像中包含三维模型中的对象在俯视角度的轮廓、形状、颜色等信息。上述执行主体可以对三维模型的俯视图进行语义分割,得到语义分割结果。语义分割结果中可以包括俯视图中的对象的类别信息。由于三维模型中的每一个对象在俯视图中均有对应的区域,因为三维模型中的对象即为俯视图中的对象。此处,对象可以指各种物体,如建筑物、植物、道路等。
需要说明的是,语义分割是对图像中的每一个像素点按照语义进行分类的方式。在对图像进行语义分割后,即可得到图像中各个像素点的语义类别。例如,若图像中呈现有建筑物、植物和地面,则对图像进行语义分割后,可以确定出建筑物区域、植物区域和地面区域。
不同语义类别可以使用不同的像素值进行标识。例如,建筑物区域中的各个像素点的语义类别可以使用白色对应的像素值(如RGB(255,255,255))进行标识;植物区域中的各个像素点的语义类别可以使用绿色对应的像素值(如RGB(0,255,0))进行标识,地面区域中的各个像素点的语义类别可以使用黑色对应的像素值(RGB(0,0,0))进行标识。由此,即可得到一张各个像素点均标识有新的像素值的图像。该图像即为语义分割结果,也可称为语义分割图像。
在本实施例中,由于语义分割结果中包含俯视图中的对象的类别信息,因而,在得到语义分割结果后,可以基于语义分割结果,确定出待进行单体化的目标对象。例如,若需要对建筑物进行单体化,则可以将类别为建筑物的对象作为目标对象。
在本实施例的一些可选的实现方式中,上述执行主体可以借助预先训练的语义分割模型,进行语义分割,从而确定目标对象。具体的,可以首先将上述俯视图输入至预先训练的语义分割模型,得到语义分割结果,上述语义分割结果中包括上述俯视图中的对象的类别信息。而后,可以将类别信息指示的类别为目标类别的对象确定为目标对象。目标类别即为待进行单体化的对象的类别,如建筑物类。
需要说明的是,上述执行主体还可以采用其他分割方式对三维模型的俯视图进行语义分割,不限于使用上述语义分割模型。作为示例,可以借助预先训练的目标检测模型进行目标检测,目标检测模型可以进行多目标检测,可同时检测出图像中的建筑物和植物的所在区域和类别,从而可基于该检测结果,对三维模型的俯视图进行分割。
在本实施例的一些可选的实现方式中,在确定出待进行单体化的目标对象之后,上述执行主体还可以基于语义分割结果,确定待删除对象,进而在三维模型中删除上述待删除对象,从而减少影响单体化的无用数据,以进一步提高单体化的准确性。
作为示例,若三维模型为三维城市模型,则三维模型中的对象通常包括但不限于建筑物、植物、停车场、道路等等。在需要对建筑物进行单体化时,由于植物可能与建筑物一样高,因而植物会对建筑物的单体化过程产生影响。由此,可将植物作为待删除对象,从俯视图中获取植物的边界线、位置等信息,并将该信息映射到三维模型中,以便在三维模型中确定出植物对应的区域,从而删除该区域中的数据。
在对三维模型中的目标对象进行单体化之前,删除三维模型中的待删除对象,不仅可以提高单体化的准确性,还可提高三维模型中的对象的整洁性,避免无用对象造成视觉干扰。
步骤103,从俯视图中获取目标对象的边界线。
在本实施例中,由于已得到三维模型的俯视图的语义分割结果,语义分割结果中的不同区域的分割线,即为不同对象的边界线。由此,可从俯视图中获取目标对象的边界线。此处,具体可获取目标对象的边界线在俯视图中的坐标。
步骤104,基于边界线,对三维模型中的目标对象进行单体化。
在本实施例中,在得到目标对象在三维模型的俯视图中的边界线的位置后,即可得到其在三维模型中的边界线的位置。已知边界线的位置,即可确定出三维模型中的目标对象所在区域。通过对三维模型中的各目标对象所在区域进行分割,即可实现三维模型的单体化。单体化后的三维模型中的每一个目标对象可单独被选中,并且,可对任意独立的目标对象执行赋予属性、查询属性等基本操作。
具体地,三维模型可采用三维笛卡尔坐标系,包含X轴、Y轴以及Z轴。三维模型的俯视图可采用二维笛卡尔坐标系,包含X轴和Y轴。由于对三维模型的俯视图进行语义分割时通常需要对其进行缩放以及平移等,因而可预先基于平移缩放关系确定三维笛卡尔坐标系中的坐标与二维笛卡尔坐标系中的坐标的转换关系,从而在已知目标对象的边界线在二维笛卡尔坐标系中的位置的情况下,通过该转换关系确定其在三维笛卡尔坐标系中的位置,从而将该位置作为三维模型中的目标对象的边界,对三维模型中的目标对象进行单体化。
在本实施例的一些可选的实现方式中,上述执行主体可以首先将上述边界线映射至上述三维模型中,得到上述三维模型中的上述目标对象的边界面。而后,基于上述边界面对上述三维模型中的上述目标对象进行单体化。
本申请的上述实施例提供的方法,通过获取三维模型的俯视图,并对俯视图进行语义分割,从而可基于语义分割结果,确定待进行单体化的目标对象。之后,通过从俯视图中获取目标对象的边界线,从而可基于该边界线对三维模型中的目标对象进行单体化。由于三维模型的俯视图中包含了颜色、轮廓等多种信息,因而采用对俯视图进行语义分割的方式进行目标对象的单体化,提高了三维模型单体化过程中的信息利用率,从而提高了三维模型单体化的准确性。
进一步参考图2,其示出了三维模型的单体化方法的又一个实施例的流程200。该三维模型的单体化方法的流程200,包括以下步骤:
步骤201,获取三维模型的俯视图。
本实施例的步骤201可参见图1对应实施例的步骤101,此处不再赘述。
步骤202,将俯视图输入至预先训练的语义分割模型,得到语义分割结果。
在本实施例中,上述执行主体可以借助预先训练的语义分割模型,进行语义分割。具体的,可以首先将上述俯视图输入至预先训练的语义分割模型,得到语义分割结果。上述语义分割结果中包括上述俯视图中的对象的类别信息。通过语义分割模型对俯视图进行语义分割,可提高语义分割的效率以及准确性。
在本实施例的一些可选的实现方式中,上述语义分割模型可以通过如下步骤训练得到:
第一步,获取样本集。
上述样本集中可以包括大量的样本。每一个样本可以包括样本图像和样本图像的语义分割结果。此处的样本图像可以是样本三维模型的俯视图。样本三维模型可以是也可通过倾斜摄影等方式得到。
第二步,将样本集中的样本图像作为神经网络的输入,基于所输入的样本图像的语义分割结果,利用机器学习方法(如有监督学习方式)对神经网络进行训练,得到语义分割模型。
此处,神经网络可以是各种能够对图像进行特征提取的网络,如各种结构的卷积神经网络(Convolutional Neural Network,CNN)。
在训练过程中,可以逐一地将样本图像样本输入至神经网络,得到神经网络输出的结果。而后,可以基于输出的结果与所输入的样本图像的真实的语义分割结果,确定损失值。上述损失值可以用于表征所输出的结果与真实的语义分割结果的差异。损失值越大,则差异越大。上述损失值可以基于欧氏距离、交叉熵损失函数等常用的损失函数确定。之后,可以利用该损失值,更新神经网络的参数。由此,每输入一个样本图像样本,可以基于该样本图像样本对应的语义分割结果,对神经网络的参数进行一次更新,直至训练完成。
实践中,可以通过多种方式确定是否训练完成。作为示例,当神经网络输出的图像与相应的语义分割结果的相似度达到预设值时(例如98%)时,可以确定训练完成。作为又一示例,若神经网络的训练次数等于预设次数时,可以确定训练完成。此处,当确定训练完成,即可将训练后的神经网络确定为语义分割模型。
步骤203,将类别信息所指示的类别为目标类别的对象确定为待进行单体化的目标对象。
在本实施例中,由于语义分割结果中包含俯视图中的对象的类别信息,因而,在得到语义分割结果后,上述执行主体可以将类别信息所指示的类别为目标类别的对象确定为目标对象。目标类别即为待进行单体化的对象的类别。
例如,若三维模型为三维城市模型,则通常需要对建筑物进行单体化。此时,建筑物即为目标对象。
步骤204,基于语义分割结果,确定待删除对象。
在本实施例中,在确定出待进行单体化的目标对象之后,上述执行主体还可以基于语义分割结果,确定待删除对象,待删除对象可以是对目标对象造成干扰的对象。
作为示例,若三维模型为三维城市模型,则三维模型的俯视图中的对象通常包括但不限于建筑物、植物、停车场、道路等等。在对建筑物进行单体化时,由于植物可能与建筑物一样高,因而植物会对建筑物的单体化过程产生影响。由此,可将植物作为待删除对象。
步骤205,在所述三维模型中,删除待删除对象。
在本实施例中,上述执行主体可以从俯视图中获取待删除对象的边界线、位置等信息,并将该信息映射到三维模型中,以便在三维模型中确定出待删除对象对应的区域,从而删除该区域中的数据。
在对三维模型中的目标对象进行单体化之前,通过删除三维模型中的待删除对象,不仅可以提高单体化的准确性,还可提高三维模型中的对象的整洁性,避免无用对象造成视觉干扰。
步骤206,从俯视图中获取目标对象的边界线。
本实施例的步骤206可参见图1对应实施例的步骤103,此处不再赘述。
步骤207,基于边界线,对三维模型中的目标对象进行单体化。
本实施例的步骤207可参见图1对应实施例的步骤104,此处不再赘述。
从图2中可以看出,与图1对应的实施例相比,本实施例中的三维模型的单体化方法的流程200涉及了通过语义分割模型对三维模型的俯视图进行语义分割的步骤,以及在单体化之前删除三维模型中的待删除对象的步骤。由此,本实施例描述的方案可以提高语义分割的效率以及准确性,进而进一步提高三维模型单体化的准确性。同时,在对三维模型中的目标对象进行单体化之前删除三维模型中的待删除对象,还可提高三维模型中的对象的整洁性,避免无用对象造成视觉干扰。
进一步参考图3,作为对上述各图所示方法的实现,本申请提供了一种三维模型的单体化装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例的三维模型的单体化装置300包括:第一获取单元301,被配置成获取三维模型的俯视图;语义分割单元302,被配置成对上述俯视图进行语义分割,基于语义分割结果,确定待进行单体化的目标对象;第二获取单元303,被配置成从上述俯视图中获取上述目标对象的边界线;单体化单元304,被配置成基于上述边界线,对上述三维模型中的上述目标对象进行单体化。
在本实施例的一些可选的实现方式中,上述第一获取单元301,进一步被配置成:通过倾斜摄影生成三维模型;确定上述三维模型的地平面;基于上述地平面对上述三维模型进行旋转,生成上述三维模型的俯视图。
在本实施例的一些可选的实现方式中,上述语义分割单元302,进一步被配置成:将上述俯视图输入至预先训练的语义分割模型,得到语义分割结果,上述语义分割结果中包括上述俯视图中的对象的类别信息;将类别信息所指示的类别为目标类别的对象确定为待进行单体化的目标对象。
在本实施例的一些可选的实现方式中,上述语义分割模型通过如下步骤训练得到:获取样本集,上述样本集中的样本包括样本图像和样本图像的语义分割结果,上述样本图像为样本三维模型的俯视图;将上述样本集中的样本图像作为神经网络的输入,基于所输入的样本图像的语义分割结果,利用机器学习方法对上述神经网络进行训练,得到语义分割模型。
在本实施例的一些可选的实现方式中,上述装置还包括:删除单元,被配置成:基于上述语义分割结果,确定待删除对象;在上述三维模型中,删除上述待删除对象。
在本实施例的一些可选的实现方式中,上述单体化单元304,进一步被配置成:将上述边界线映射至上述三维模型中,得到上述三维模型中的上述目标对象的边界面;基于上述边界面对上述三维模型中的上述目标对象进行单体化。
在本实施例的一些可选的实现方式中,上述三维模型为三维城市模型,上述目标对象包括建筑物。
本申请的上述实施例提供的装置,通过获取三维模型的俯视图,并对俯视图进行语义分割,从而可基于语义分割结果,确定待进行单体化的目标对象。之后,通过从俯视图中获取目标对象的边界线,从而可基于该边界线对三维模型中的目标对象进行单体化。由于三维模型的俯视图中包含了颜色、轮廓等多种信息,因而采用对俯视图进行语义分割的方式进行目标对象的单体化,提高了三维模型单体化过程中的信息利用率,从而提高了三维模型单体化的准确性。
下面参考图4,其示出了适于用来实现本申请实施例的电子设备的计算机系统400的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统400包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统400操作所需的各种程序和数据。CPU401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取三维模型的俯视图;对所述俯视图进行语义分割,基于语义分割结果,确定待进行单体化的目标对象;从所述俯视图中获取所述目标对象的边界线;基于所述边界线,对所述三维模型中的所述目标对象进行单体化。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种三维模型的单体化方法,其特征在于,所述方法包括:
获取三维模型的俯视图;
对所述俯视图进行语义分割,基于语义分割结果,确定待进行单体化的目标对象;
从所述俯视图中获取所述目标对象的边界线;
基于所述边界线,对所述三维模型中的所述目标对象进行单体化。
2.根据权利要求1所述的方法,其特征在于,所述获取三维模型的俯视图,包括:
通过倾斜摄影生成三维模型;
确定所述三维模型的地平面;
基于所述地平面对所述三维模型进行旋转,生成所述三维模型的俯视图。
3.根据权利要求1所述的方法,其特征在于,所述对所述俯视图进行语义分割,基于语义分割结果,确定待进行单体化的目标对象,包括:
将所述俯视图输入至预先训练的语义分割模型,得到语义分割结果,所述语义分割结果中包括所述俯视图中的对象的类别信息;
将类别信息所指示的类别为目标类别的对象确定为待进行单体化的目标对象。
4.根据权利要求3所述的方法,其特征在于,所述语义分割模型通过如下步骤训练得到:
获取样本集,所述样本集中的样本包括样本图像和样本图像的语义分割结果,所述样本图像为样本三维模型的俯视图;
将所述样本集中的样本图像作为神经网络的输入,基于所输入的样本图像的语义分割结果,利用机器学习方法对所述神经网络进行训练,得到语义分割模型。
5.根据权利要求1所述的方法,其特征在于,在所述确定待进行单体化的目标对象之后,所述方法还包括:
基于所述语义分割结果,确定待删除对象;
在所述三维模型中,删除所述待删除对象。
6.根据权利要求1所述的方法,其特征在于,所述基于所述边界线,对所述三维模型中的所述目标对象进行单体化,包括:
将所述边界线映射至所述三维模型中,得到所述三维模型中的所述目标对象的边界面;
基于所述边界面对所述三维模型中的所述目标对象进行单体化。
7.根据权利要求1-6之一所述的方法,其特征在于,所述三维模型为三维城市模型,所述目标对象包括建筑物。
8.一种三维模型的单体化装置,其特征在于,所述装置包括:
第一获取单元,被配置成获取三维模型的俯视图;
语义分割单元,被配置成对所述俯视图进行语义分割,基于语义分割结果,确定待进行单体化的目标对象;
第二获取单元,被配置成从所述俯视图中获取所述目标对象的边界线;
单体化单元,被配置成基于所述边界线,对所述三维模型中的所述目标对象进行单体化。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010814347.5A CN112132845A (zh) | 2020-08-13 | 2020-08-13 | 三维模型的单体化方法、装置、电子设备和可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010814347.5A CN112132845A (zh) | 2020-08-13 | 2020-08-13 | 三维模型的单体化方法、装置、电子设备和可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112132845A true CN112132845A (zh) | 2020-12-25 |
Family
ID=73851579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010814347.5A Pending CN112132845A (zh) | 2020-08-13 | 2020-08-13 | 三维模型的单体化方法、装置、电子设备和可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132845A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112687003A (zh) * | 2020-12-29 | 2021-04-20 | 青岛海信网络科技股份有限公司 | 一种建筑物模型的单体化方法及装置 |
CN114648640A (zh) * | 2022-05-23 | 2022-06-21 | 深圳市其域创新科技有限公司 | 一种目标物单体化方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921161A (zh) * | 2018-06-08 | 2018-11-30 | Oppo广东移动通信有限公司 | 模型训练方法、装置、电子设备和计算机可读存储介质 |
US20190147254A1 (en) * | 2017-11-15 | 2019-05-16 | Uber Technologies, Inc. | Autonomous Vehicle Lane Boundary Detection Systems and Methods |
CN110060230A (zh) * | 2019-01-18 | 2019-07-26 | 商汤集团有限公司 | 三维场景分析方法、装置、介质及设备 |
CN111178083A (zh) * | 2019-12-12 | 2020-05-19 | 广州地理研究所 | 一种bim和gis的语义匹配方法及装置 |
CN111310853A (zh) * | 2020-03-06 | 2020-06-19 | 埃洛克航空科技(北京)有限公司 | 一种基于神经网络与高程融合的单体化识别算法 |
CN111340822A (zh) * | 2020-02-24 | 2020-06-26 | 武汉大学 | 一种多尺度自适应机载LiDAR点云建筑物单体化分割方法 |
-
2020
- 2020-08-13 CN CN202010814347.5A patent/CN112132845A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190147254A1 (en) * | 2017-11-15 | 2019-05-16 | Uber Technologies, Inc. | Autonomous Vehicle Lane Boundary Detection Systems and Methods |
CN108921161A (zh) * | 2018-06-08 | 2018-11-30 | Oppo广东移动通信有限公司 | 模型训练方法、装置、电子设备和计算机可读存储介质 |
CN110060230A (zh) * | 2019-01-18 | 2019-07-26 | 商汤集团有限公司 | 三维场景分析方法、装置、介质及设备 |
CN111178083A (zh) * | 2019-12-12 | 2020-05-19 | 广州地理研究所 | 一种bim和gis的语义匹配方法及装置 |
CN111340822A (zh) * | 2020-02-24 | 2020-06-26 | 武汉大学 | 一种多尺度自适应机载LiDAR点云建筑物单体化分割方法 |
CN111310853A (zh) * | 2020-03-06 | 2020-06-19 | 埃洛克航空科技(北京)有限公司 | 一种基于神经网络与高程融合的单体化识别算法 |
Non-Patent Citations (3)
Title |
---|
熊汉: "基于2D-3D语义传递的室内三维点云模型语义分割", 武汉大学学报 信息科学版, vol. 43, no. 12, pages 1 - 4 * |
陈思;冯学兵;刘阳;: "基于倾斜摄影实景三维模型单体化分类与应用", 北京测绘, no. 04 * |
陈良超;詹勇;王俊勇;: "一种倾斜摄影实景三维模型单体化方法", 测绘通报, no. 06 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112687003A (zh) * | 2020-12-29 | 2021-04-20 | 青岛海信网络科技股份有限公司 | 一种建筑物模型的单体化方法及装置 |
CN114648640A (zh) * | 2022-05-23 | 2022-06-21 | 深圳市其域创新科技有限公司 | 一种目标物单体化方法、装置、设备及存储介质 |
WO2023226654A1 (zh) * | 2022-05-23 | 2023-11-30 | 深圳市其域创新科技有限公司 | 一种目标物单体化方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102126724B1 (ko) | 포인트 클라우드 데이터를 복구하기 위한 방법 및 장치 | |
CN109285220B (zh) | 一种三维场景地图的生成方法、装置、设备及存储介质 | |
CN110428490B (zh) | 构建模型的方法和装置 | |
CN112258519B (zh) | 一种高精度地图制作中道路的让行线自动化提取方法及装置 | |
CN112336342B (zh) | 手部关键点检测方法、装置及终端设备 | |
US20230186562A1 (en) | Method and system for 3d modeling based on volume estimation | |
CN108765584A (zh) | 激光点云数据集增广方法、装置及可读存储介质 | |
US11182942B2 (en) | Map generation system and method for generating an accurate building shadow | |
US20230005278A1 (en) | Lane extraction method using projection transformation of three-dimensional point cloud map | |
CN112132845A (zh) | 三维模型的单体化方法、装置、电子设备和可读介质 | |
CN116205978A (zh) | 三维目标物体映射图像确定方法、装置、设备及存储介质 | |
KR20200136723A (ko) | 가상 도시 모델을 이용하여 객체 인식을 위한 학습 데이터 생성 방법 및 장치 | |
CN115457212A (zh) | 树木影像图处理方法、装置、终端设备及存储介质 | |
CN115330940A (zh) | 一种三维重建方法、装置、设备和介质 | |
Rahmat et al. | Android-based automatic detection and measurement system of highway billboard for tax calculation in Indonesia | |
CN116597270A (zh) | 基于注意力机制集成学习网络的道路损毁目标检测方法 | |
CN112435274A (zh) | 一种基于面向对象分割的遥感影像面状地物提取方法 | |
US20230048643A1 (en) | High-Precision Map Construction Method, Apparatus and Electronic Device | |
CN115565072A (zh) | 一种道路垃圾识别和定位方法、装置、电子设备及介质 | |
CN110363847B (zh) | 一种基于点云数据的地图模型构建方法和装置 | |
CN108805121B (zh) | 一种车牌检测定位方法、装置、设备及计算机可读介质 | |
CN113808142B (zh) | 一种地面标识的识别方法、装置、电子设备 | |
CN109118576A (zh) | 基于bds位置服务的大型场景三维重建系统及重建方法 | |
CN110119721B (zh) | 用于处理信息的方法和装置 | |
CN113870412A (zh) | 一种航空场景图像的处理方法、装置以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100089 room 307, 3 / F, supporting public building, Mantingfangyuan community, Qingyun Li, Haidian District, Beijing Applicant after: Beijing Wuyi Vision digital twin Technology Co.,Ltd. Address before: 100089 room 307, 3 / F, supporting public building, Mantingfangyuan community, Qingyun Li, Haidian District, Beijing Applicant before: DANGJIA MOBILE GREEN INTERNET TECHNOLOGY GROUP Co.,Ltd. |
|
CB02 | Change of applicant information |