CN104240247B - 一种基于单张图片的建筑物俯视轮廓的快速提取方法 - Google Patents

一种基于单张图片的建筑物俯视轮廓的快速提取方法 Download PDF

Info

Publication number
CN104240247B
CN104240247B CN201410458631.8A CN201410458631A CN104240247B CN 104240247 B CN104240247 B CN 104240247B CN 201410458631 A CN201410458631 A CN 201410458631A CN 104240247 B CN104240247 B CN 104240247B
Authority
CN
China
Prior art keywords
line segments
line segment
picture
building
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410458631.8A
Other languages
English (en)
Other versions
CN104240247A (zh
Inventor
熊曦
杨铮
刘云浩
孙家广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruan Internet Of Things Technology Group Co ltd
Run Technology Co ltd
Original Assignee
WUXI RUIAN TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUXI RUIAN TECHNOLOGY CO LTD filed Critical WUXI RUIAN TECHNOLOGY CO LTD
Priority to CN201410458631.8A priority Critical patent/CN104240247B/zh
Publication of CN104240247A publication Critical patent/CN104240247A/zh
Application granted granted Critical
Publication of CN104240247B publication Critical patent/CN104240247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开一种基于单张图片的建筑物俯视轮廓的快速提取方法,该方法无需事先进行机器学习或者基于多张图片的三维重构,仅通过单张图片就可以提取出图片内目标建筑物的俯视轮廓,在不失准确度的情况下,极大地提高了提取的速度。

Description

一种基于单张图片的建筑物俯视轮廓的快速提取方法
技术领域
本发明涉及计算机视觉领域,尤其涉及一种基于单张图片的建筑物俯视轮廓的快速提取方法。
背景技术
三维重构在计算机视觉领域一直以来是个被深入研究但依然还存在很多未解问题的话题。三维重构在各种应用场合、生活场景中都起到了重要的作用,例如机器人的视觉导航、城市三维地图的重建等。从非俯视图片中提取建筑物顶部轮廓在某种程度上可以视为三维重构的子问题。现有的某些基于多张图片或者视频(等价于多张图片)的三维重构的技术方案是利用空间几何关系的约束(例如三角定位法)来估算图片里每个特征点的深度来进行三维重构。而基于单张图片的三维重构往往需要复杂的机器学习或者基于一些假设的求解线性规划的方法。其中一种方法认为大多数三维场景可以被分割为许多小块的近似平面,因此输入一张图片后,它先用超像素分割算法把图片里的三维场景分割为许多近似平面的超像素,然后对于每个超像素平面,它试图推测其位置和朝向。对于人们来讲,超像素的位置信息可以从不同的视觉深度线索来判断,比如草坪的材质从近处看和从远处看就不太一样;绿色的部分更可能是地上的草;蓝色的部分更可能是天空等等。因此文中通过有指导学习的方法先事学习这些视觉线索和不同深度之间的关系。具体的学习算法采用了马尔科夫条件随机场,这样就可以考虑邻近超像素平面之间相对深度的约束。例如两块相邻的图块更可能是同一个深度或者甚至是共平面的,而不是相距很远的。然后再根据事先学习好的知识推断图片中每个超像素块的三维关系。但是,这种方法的计算量大,常常需要较大的时延来计算出结果,且精度低,需要事先进行有指导学习。
发明内容
本发明的目的在于通过一种基于单张图片的建筑物俯视轮廓的快速提取方法,来解决以上背景技术部分提到的问题。
为达此目的,本发明采用以下技术方案:
一种基于单张图片的建筑物俯视轮廓的快速提取方法,假设图片中目标建筑为最高建筑,且图片里的场景符合曼哈顿世界假设,该方法步骤如下:
A、利用线段检测算法从图片中检测出所有线段;
B、从图片顶部开始,查找建筑物上最高的线段即目标建筑顶部轮廓的线段,并选取找到的第一根线段的端点作为根节点;
C、依据线段相对水平面上两个消点的位置,将从所述根节点起查找出的所有线段分为两类;
D、根据步骤C中的两类线段生成两条新线段,其中,所述两条新线段的方向为每类线段的平均方向,两条新线段的长度为每类线段中最长线段的长度;
E、把所述两个新线段链接到根节点上,并将所述两个新线段的另一个端点作为新的根节点,重新执行步骤C,开始重复添加新的线段,直至从所述新的根节点起再也找不到新的线段,从而得到所述目标建筑顶部轮廓线段的链表;
F、根据线段所属消点的类型以及线段的朝向校正它们之间的夹角,获得目标建筑物的俯视轮廓。
特别地,所述步骤F中根据线段所属消点的类型以及线段的朝向校正它们之间的夹角,具体包括:
根据线段所属消点的类型以及线段的朝向校正它们之间的夹角,计算公式如下:
其中,wi分别是第i根线段和第i+1根线段矫正之前和矫正之后的夹角,vi是第i根线段所属消点的类型,对于每次夹角的矫正都计算出一个相应的旋转矩阵Ri,当计算完所有夹角矫正的旋转矩阵后,顺序地把每根线段乘上相应的旋转矩阵,即对于第i根线段,它的旋转矩阵是
本发明提出的基于单张图片的建筑物俯视轮廓的快速提取方法无需事先进行机器学习或者基于多张图片的三维重构,仅通过单张图片就可以提取出图片内目标建筑物的俯视轮廓,在不失准确度的情况下,极大地提高了提取的速度。
附图说明
图1为本发明实施例提供的基于单张图片的建筑物俯视轮廓的快速提取方法流程图;
图2a、图2b、图2c分别为本发明实施例提供的示例图片一的原始图像、整体轮廓及目标建筑的俯视轮廓;
图3a、图3b、图3c分别为本发明实施例提供的示例图片二的原始图像、整体轮廓及目标建筑的俯视轮廓;
图4a、图4b、图4c分别为本发明实施例提供的示例图片三的原始图像、整体轮廓及目标建筑的俯视轮廓。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
首先,对针孔相机模型Pinhole Camera Model)进行简要说明。在针孔相机模型中,相机的孔径被视为一个点并且没有透镜用于聚焦光线。通过这种方式,可以忽略由透镜以及固定大小的孔径造成相片中未对准焦的模糊或者几何扭曲。在针孔相机模型中,现实中平行的线段,比如建筑物或者窗户的边缘,被投射到相片上会汇聚为一个点,简称消点(Vanishing Points)。
其次,对曼哈顿世界假设进行简要说明。大部分人造的场景都符合“曼哈顿世界假设”,在曼哈顿世界假设中,现实中所有的线条都平行于三个相互交正的方向。想象一下纽约曼哈顿区的建筑,高耸而又方正的大厦边缘、其窗户边缘和其楼体上的线条,基本上属于三个方向之一:在水平面上互相垂直的X、Y两个方向,以及垂直于水平面的Z方向。
基于曼哈顿世界假设,可以把图片里的所有线段比如建筑物的边缘、窗户的边缘等分为三类,每一类在远处都会汇聚成一个消点即消点,之后会根据消点的位置以及线段的所属消点种类来提取目标建筑的顶部轮廓。基本过程如下:首先计算消点的位置。采用了一个已有的技术来估算三个互相正交方向上的消点。具体来讲,该技术把一堆线段作为输入,并通过不断地迭代来估算消点,每次迭代我们都随机假设一个消点,然后每个线段要么指向那个消点要么不属于那个消点,当找到一组更好的消点的可能性低于某个阈值时则迭代停止。其次,在求出三个消点后,再根据图片中的线段朝向哪个消点把这些线段分为三类。需要说明的是,由于图片里的线段是在相机坐标空间下的,为了计算图片里这些线段在世界坐标空间下的位置,需要得到相机矩阵K,K由相机的内部和外部的参数共同决定:
其中f是相机的等效焦距,u和v是平移参数,在K中省去了由于透视转换造成的扭曲参数。而通过之前估算出的三个消点位置可以得到一个矩阵Q,也就是KKT,通过对Q的Cholesky分解可以算出K,根据K从而反推出图片中线段在世界坐标空间下的空间位置。
接下来具体说明本发明基于单张图片的建筑物俯视轮廓的快速提取方法的过程。本发明依据了两个假设,其一是假设图片中目标建筑为最高建筑,因此所需要提取的目标建筑的顶部轮廓的线段应该是图片里最高的线段。其二是假设图片里的场景符合曼哈顿世界假设,因此图片里的不同的线段在现实空间中要么互相平行、要么互相垂直。
如图1所示,基于上述两点假设,本实施例中基于单张图片的建筑物俯视轮廓的快速提取方法具体包括如下步骤:
S101、利用线段检测算法从图片中检测出所有线段。线段检测算法的实现方法有多种,在此不再赘述。
S102、从图片顶部开始,查找建筑物上最高的线段即目标建筑顶部轮廓的线段,并选取找到的第一根线段的端点作为根节点。
S103、依据线段相对水平面上两个消点的位置,将从所述根节点起查找出的所有线段分为两类。从根节点起,找到附近一定范围内足够数量的线段,并依据它们相对水平面上两个消点的位置把这些线段分为两类。
S104、根据步骤S103中的两类线段生成两条新线段。所述两条新线段的方向为每类线段的平均方向,两条新线段的长度为每类线段中最长线段的长度。
S105、把所述两个新线段链接到根节点上,并将所述两个新线段的另一个端点作为新的根节点,重新执行步骤S103,开始重复添加新的线段,直至从所述新的根节点起,再也找不到新的线段,从而得到所述目标建筑顶部轮廓线段的链表。链表的格式为:以线段为AB、BC为例,AB线段连着其一个B端点,该B端点连着下一根线段BC,BC线段继续连着其另一个端点C……依次类推。其中,所述步骤S103和步骤S104的目的为了排除图片噪点的干扰。
S106、根据线段所属消点的类型以及线段的朝向校正它们之间的夹角,获得目标建筑物的俯视轮廓。根据线段所属消点的类型以及线段的朝向校正它们之间的夹角,计算公式如下:
其中,wi分别是第i根线段和第i+1根线段矫正之前和矫正之后的夹角,vi是第i根线段所属消点的类型,对于每次夹角的矫正都计算出一个相应的旋转矩阵Ri,当计算完所有夹角矫正的旋转矩阵后,顺序地把每根线段乘上相应的旋转矩阵,即对于第i根线段,它的旋转矩阵是
本实施例中基于单张图片的建筑物俯视轮廓的快速提取方法已经在多个城市(北京、上海、无锡、香港)的多个地点拍摄了五十多张建筑物图片用于实验,而且如图2a、图2b、图2c,图3a、图3b、图3c及图4a、图4b、图4c所示,提取出的建筑物俯视轮廓非常准确。
本发明的技术方案无需事先进行机器学习或者基于多张图片的三维重构,仅通过单张图片就可以提取出图片内目标建筑物的俯视轮廓,在不失准确度的情况下,极大地提高了提取的速度。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (2)

1.一种基于单张图片的建筑物俯视轮廓的快速提取方法,其特征在于,假设图片中目标建筑为最高建筑,且图片里的场景符合曼哈顿世界假设,该方法步骤如下:
A、利用线段检测算法从图片中检测出所有线段;
B、从图片顶部开始,查找建筑物上最高的线段即目标建筑顶部轮廓的线段,并选取找到的第一根线段的端点作为根节点;
C、依据线段相对水平面上两个消点的位置,将从所述根节点起查找出的所有线段分为两类;
D、根据步骤C中的两类线段生成两条新线段,其中,所述两条新线段的方向为每类线段的平均方向,两条新线段的长度为每类线段中最长线段的长度;
E、把所述两条新线段链接到根节点上,并将所述两个新线段的另一个端点作为新的根节点,重新执行步骤C,开始重复添加新的线段,直至从所述新的根节点起再也找不到新的线段,从而得到所述目标建筑顶部轮廓线段的链表;
F、根据线段所属消点的类型以及线段的朝向校正它们之间的夹角,获得目标建筑物的俯视轮廓。
2.根据权利要求1所述的基于单张图片的建筑物俯视轮廓的快速提取方法,其特征在于,所述步骤F中根据线段所属消点的类型以及线段的朝向校正它们之间的夹角,具体包括:计算公式如下:
w i = &pi; 2 , v i &NotEqual; v i + 1 , | w &OverBar; i - &pi; 2 | < | w &OverBar; i + &pi; 2 | - &pi; 2 , v i &NotEqual; v i + 1 , | w &OverBar; i - &pi; 2 | &GreaterEqual; | w &OverBar; i + &pi; 2 | 0 , v i = v i + 1
其中,wi分别是第i根线段和第i+1根线段矫正之前和矫正之后的夹角,vi是第i根线段所属消点的类型,对于每次夹角的矫正都计算出一个相应的旋转矩阵Ri,当计算完所有夹角矫正的旋转矩阵后,顺序地把每根线段乘上相应的旋转矩阵,即对于第i根线段,它的旋转矩阵是Rk,k+1
CN201410458631.8A 2014-09-10 2014-09-10 一种基于单张图片的建筑物俯视轮廓的快速提取方法 Active CN104240247B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410458631.8A CN104240247B (zh) 2014-09-10 2014-09-10 一种基于单张图片的建筑物俯视轮廓的快速提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410458631.8A CN104240247B (zh) 2014-09-10 2014-09-10 一种基于单张图片的建筑物俯视轮廓的快速提取方法

Publications (2)

Publication Number Publication Date
CN104240247A CN104240247A (zh) 2014-12-24
CN104240247B true CN104240247B (zh) 2017-04-12

Family

ID=52228253

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410458631.8A Active CN104240247B (zh) 2014-09-10 2014-09-10 一种基于单张图片的建筑物俯视轮廓的快速提取方法

Country Status (1)

Country Link
CN (1) CN104240247B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700355A (zh) * 2015-03-31 2015-06-10 百度在线网络技术(北京)有限公司 室内二维平面图的生成方法、装置和系统
US10073849B2 (en) * 2016-08-30 2018-09-11 Alfred X. Xin Method and system of dynamically generating interior location map with information
CN112037220A (zh) * 2020-09-27 2020-12-04 上海商汤智能科技有限公司 一种图像处理方法、装置、设备和存储介质
CN112149585A (zh) * 2020-09-27 2020-12-29 上海商汤智能科技有限公司 一种图像处理方法、装置、设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609938A (zh) * 2012-01-16 2012-07-25 浙江大学 一种从单幅图像检测道路消失点的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609938A (zh) * 2012-01-16 2012-07-25 浙江大学 一种从单幅图像检测道路消失点的方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
MAPAlM: a system for inducing and visualizing hierarchy in websites;David Durand 等;《HYPERTEXT "98. Proceedings of the Ninth ACM Conference on Hypertext and Hypermedia: Links, Objects,Time and Space - Structure in Hypermedia Systems》;19981231;66-76 *
Projective and Object Space Geometry for Monocular Building Extraction;J. Chris McGlone 等;《IEEE Computer Society Conference on Computer Vision & Pattern Recognition》;19940623;54-61 *
Single-View 3D Scene Parsing by Attributed Grammar;Xiaobai Liu 等;《2014 IEEE Conference on Computer Vision and Pattern Recognition》;20140628;684-691 *
Towards detection of orthogonal planes in monocular images of indoor environments;Branislav Micusik 等;《Robotics and Automation, 2008. ICRA 2008. IEEE International Conference on》;20080323;999-1004 *
Vanishing Point Detection in Complex Man-made Worlds;Horst Wildenauer 等;《Image Analysis and Processing, 2007. ICIAP 2007. 14th International Conference on》;20070914;615-622 *
从航空影像中自动提取高层建筑物;唐亮 等;《计算机学报》;20050712;第28卷(第7期);1199-1204 *
城市建筑物框架轮廓三维自动重构研究;李畅 等;《计算机工程与应用》;20110311;第47卷(第8期);4-6 *

Also Published As

Publication number Publication date
CN104240247A (zh) 2014-12-24

Similar Documents

Publication Publication Date Title
CN111968129B (zh) 具有语义感知的即时定位与地图构建系统及方法
US11763485B1 (en) Deep learning based robot target recognition and motion detection method, storage medium and apparatus
CN108520554B (zh) 一种基于orb-slam2的双目三维稠密建图方法
CN107481270B (zh) 乒乓球目标跟踪和轨迹预测方法、装置、存储介质和计算机设备
CN110631554B (zh) 机器人位姿的确定方法、装置、机器人和可读存储介质
CN105096386B (zh) 大范围复杂城市环境几何地图自动生成方法
US10580204B2 (en) Method and device for image positioning based on 3D reconstruction of ray model
KR101854554B1 (ko) 건축물 높이 산출 방법, 장치 및 저장 매체
US7860276B2 (en) Image processing device and method
CN102411778B (zh) 一种机载激光点云与航空影像的自动配准方法
CN111540005B (zh) 基于二维栅格地图的回环检测方法
CN109410316B (zh) 物体的三维重建的方法、跟踪方法、相关装置及存储介质
CN104240247B (zh) 一种基于单张图片的建筑物俯视轮廓的快速提取方法
US11367195B2 (en) Image segmentation method, image segmentation apparatus, image segmentation device
CN109035330A (zh) 箱体拟合方法、设备和计算机可读存储介质
CN110189390B (zh) 一种单目视觉slam方法及系统
US20120155745A1 (en) Apparatus and method for extracting correspondences between aerial images
CN104408725A (zh) 一种基于tld优化算法的目标重捕获系统及方法
CN109425348A (zh) 一种同时定位与建图的方法和装置
WO2018176929A1 (zh) 一种图像背景虚化方法及装置
CN111161334B (zh) 一种基于深度学习的语义地图构建方法
CN109255809A (zh) 一种光场图像深度估计方法及装置
CN112819937B (zh) 一种自适应多对象光场三维重建方法、装置及设备
CN112270748B (zh) 基于图像的三维重建方法及装置
WO2024051591A1 (zh) 用于估算视频旋转的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 214135 Room 501, A District, Qingyuan Road, Wuxi science and Technology Park, Wuxi New District, Jiangsu

Patentee after: RUN TECHNOLOGY CO.,LTD.

Address before: 214135 Room 501, A District, Qingyuan Road, Wuxi science and Technology Park, Wuxi New District, Jiangsu

Patentee before: WUXI RUN TECHNOLOGY CO.,LTD.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 201800 room j1958, building 6, 1288 Yecheng Road, Jiading District, Shanghai

Patentee after: Ruan Internet of things Technology Group Co.,Ltd.

Address before: 214135 Room 501, A District, Qingyuan Road, Wuxi science and Technology Park, Wuxi New District, Jiangsu

Patentee before: RUN TECHNOLOGY CO.,LTD.