CN114973297A - 一种平面户型图的墙体区域识别方法、系统、设备及介质 - Google Patents
一种平面户型图的墙体区域识别方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN114973297A CN114973297A CN202210689854.XA CN202210689854A CN114973297A CN 114973297 A CN114973297 A CN 114973297A CN 202210689854 A CN202210689854 A CN 202210689854A CN 114973297 A CN114973297 A CN 114973297A
- Authority
- CN
- China
- Prior art keywords
- wall
- layer
- identification
- network model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000011218 segmentation Effects 0.000 claims abstract description 98
- 238000012549 training Methods 0.000 claims abstract description 82
- 238000005070 sampling Methods 0.000 claims description 21
- 238000010606 normalization Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 230000017105 transposition Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001994 activation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉图像处理技术领域,尤其涉及一种平面户型图的墙体区域识别方法、系统、设备及介质,其中方法包括步骤A:构建训练数据集,包括对平面户型图的墙体信息进行标注,构建墙体分割训练数据;步骤B:构建语义分割网络模型,由首卷积层、编码器、解码器和输出层组成的语义分割网络模型;步骤C:训练语义分割网络模型,将步骤A中得到的墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;步骤D:模型识别墙体信息,将待识别的平面户型图输入至训练好的墙体识别模型进行识别,得到墙体信息。本发明解决现有的墙体识别方法的识别精度不高,且对不同样式的户型图下存在漏识别和误识别的问题。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种平面户型图的墙体区域识别方法、系统、设备及介质。
背景技术
墙体区域识别是户型识别的关键,精准的墙体识别结果意味着设计师可以有效地减少手工绘制和修改的时间成本,从而能提升整体的设计效率。
但目前的墙体区域识别方法存在以下问题:首先由于平面户型图的来源不同,从而导致平面户型图的风格迥异,平面户型图的样式也是大为不同。其次在不同的平面户型图中,墙体的表示方式也是千差万别,而且平面户型图中的家具贴图、地板纹理、甚至图片水印也会对墙体区域的识别产生极大的干扰,从而提高了户型识别任务的难度。
发明内容
本发明的目的在于提出一种平面户型图的墙体区域识别方法、系统、设备及介质,以解决现有的墙体识别方法的识别精度不高,且对于不同样式的户型图下存在漏识别和误识别的问题。
为达此目的,本发明采用以下技术方案:
一种平面户型图的墙体区域识别方法,包括以下步骤:
步骤A:构建训练数据集,包括对平面户型图的墙体信息进行标注,构建墙体分割训练数据;
步骤B:构建语义分割网络模型,由首卷积层、编码器、解码器和输出层组成的语义分割网络模型;
步骤C:训练语义分割网络模型,将步骤A中得到的墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;
步骤D:模型识别墙体信息,将待识别的平面户型图输入至训练好的墙体识别模型进行识别,得到墙体信息。
优选的,在所述步骤A中,构建训练数据集包括以下步骤:
步骤A1:获取不同来源、不同风格、不同样式、不同大小的各类平面户型图;
步骤A2:通过开源软件Labelme或者其他带蒙版标注功能的软件,人工标记得到每张户型图中所有墙体标记区域的轮廓点二维坐标;
其中,所述墙体标记区域包括含有墙体样式的区域、含有内嵌在墙上的系列门区域和内嵌在墙上系列窗区域;
步骤A3:将墙体轮廓坐标转换成和平面户型图大小一致的二维标签。
优选的,在所述步骤A3中,将墙体轮廓坐标转换成和平面户型图大小一致的二维标签,包括以下步骤:
步骤A31:创建一张和平面户型图的分辨率大小一致的单通道空白蒙版图;
步骤A32:读取标记得到的墙体区域轮廓点的二维坐标;
步骤A33:根据轮廓点的坐标信息在蒙版图上的对应位置绘制填充的封闭的多边形,最终在空白蒙版图上得到仅包含墙体区域的二维标签;
其中,基于输入的平面户型图的分辨率确定语义分割网络模型的分割精度。
优选的,在所述步骤B中,所述首卷积层包括两层重复的普通卷积层、归一化层和激活层;
所述编码器包括四层下采样层,每个所述下采样层包括两层重复的卷积层、激活层、归一化层和一层最大池化层,平面户型图每次经过所述最大池化层后,特征的宽和高缩减为原来的一半,特征的通道数翻倍;
所述解码器包括4层上采样层,每个所述上采样层包含一层转置卷积层、两层重复的卷积层、激活层和归一化层,其中,每次上采样层之后都会和对应大小的下采样层特征图进行长连接之后再作为下一次上采样层的输入,每次转置卷积之后,特征的宽高扩大到原来的两倍,特征的通道数减少为原来的一半,长连接负责将下采样之前的特征和上采样之后的编码解码特征进行融合,融合后的特征不仅包含了编码前的原始特征信息,也包含了编码解码后的高维特征信息,上采样层不仅将编码后的特征恢复成原始尺寸,同时融合了编码前后的特征信息;
所述输出层包括一层普通卷积层和sigmoid层,普通卷积层提取的特征经过sigmoid激活映射到[0,1]之间,即为提取的墙体二维特征;
其中,所有普通卷积层都采用3x3大小的卷积核,激活层使用LeakyRelu进行激活,归一化层使用InstanceNorm进行归一化。
优选的,在步骤C中,训练语义分割网络模型包括以下步骤:
步骤C1:对步骤A中得到的墙体分割训练数据同步进行数据增强,获得增强型墙体分割训练数据;其中,包括数据增强方式包括左右翻转、上下翻转、角度旋转、图像平移、尺寸裁剪、比例缩放、随机噪声、高斯模糊、颜色扰动、亮度扰动和混类增强,且每次执行数据增强操作时,随机选择若干种数据增强方式进行组合;
步骤C2:将增强型墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型。
优选的,在所述步骤D中,模型识别墙体信息,包括以下步骤:
步骤D1:记录待识别平面户型图的原始分辨率尺寸;
步骤D2:将待识别的平面户型图的分辨率进行缩放,获得缩放的户型图;
步骤D3:将缩放的平面户型图输入至训练好的墙体识别模型,得到预测的墙体信息;
步骤D4:将墙体信息经过阈值二值化,得到墙体的分割结果图;
步骤D5:将分割结果图缩放回记录的原始分辨率尺寸大小,即为最终平面户型图的墙体识别结果。
一种平面户型图的墙体区域识别系统,包括样本模块、网络模块、训练模块和识别模块;
所述样本模块用于构建训练数据集,包括对平面户型图的墙体信息进行标注,构建墙体分割训练数据;
所述网络模块用于构建语义分割网络模型;
所述训练模块用于训练语义分割网络模型,将墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;
所述识别模块用于模型识别墙体信息,将待识别的平面户型图输入至训练好的墙体识别模型进行识别,得到墙体信息。
一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时如上述所述的平面户型图的墙体区域识别方法的步骤。
一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的平面户型图的墙体区域识别方法。
与现有技术相比,上述技术方案具有以下有益效果:首先构建训练数据集,包括对平面户型图的墙体信息进行标注,构建墙体分割训练数据;其次构建语义分割网络模型,由首卷积层、编码器、解码器和输出层组成的语义分割网络模型;接着训练语义分割网络模型,将上述中得到的墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;最后模型识别墙体信息,将待识别的不同样式的平面户型图输入至训练好的墙体识别模型进行识别,能准确获取的平面户型图上的墙体信息,以减少人工绘制和修改的成本。
附图说明
图1是本发明平面户型图的墙体区域识别方法的流程示意图;
图2是本发明平面户型图的墙体区域识别方法的原理示意图;
图3是本发明平面户型图的墙体区域识别方法的语义分割网络模型的结构示意图;
图4是本发明平面户型图的墙体区域识别系统的结构示意图;
图5是本发明平面户型图的墙体区域识别设备的结构示意图;
附图中:样本模块1、网络模块2、训练模块3和识别模块4、存储器5、处理器6、计算机程序7。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
如图1-2所示,一种平面户型图的墙体区域识别方法,包括以下步骤:
步骤A:构建训练数据集,包括对平面户型图的墙体信息进行标注,构建墙体分割训练数据;
步骤B:构建语义分割网络模型,由首卷积层、编码器、解码器和输出层组成的语义分割网络模型;
步骤C:训练语义分割网络模型,将步骤A中得到的墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;
步骤D:模型识别墙体信息,将待识别的平面户型图输入至训练好的墙体识别模型进行识别,得到墙体信息。
由于目前的墙体区域识别方法存在以下问题:首先由于平面户型图的来源不同,从而导致平面户型图的风格迥异,平面户型图的样式也是大为不同。其次在不同的平面户型图中,墙体的表示方式也是千差万别,而且平面户型图中的家具贴图、地板纹理、甚至图片水印也会对墙体区域的识别产生极大的干扰,从而提高了户型识别任务的难度。因此,本发明提出一种平面户型图的墙体区域识别方法。
在本实施例中,首先构建训练数据集,包括对平面户型图的墙体信息进行标注,构建墙体分割训练数据;其次构建语义分割网络模型,由首卷积层、编码器、解码器和输出层组成的语义分割网络模型;接着训练语义分割网络模型,将步骤A中得到的墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;最后模型识别墙体信息,将待识别的不同样式的平面户型图输入至训练好的墙体识别模型进行识别,能准确获取的平面户型图上的墙体信息,以减少人工绘制和修改的成本。
更进一步的说明,在所述步骤A中,构建训练数据集包括以下步骤:
步骤A1:获取不同来源、不同风格、不同样式、不同大小的各类平面户型图;
步骤A2:通过开源软件Labelme或者其他带蒙版标注功能的软件,人工标记得到每张平面户型图中所有墙体标记区域的轮廓点二维坐标;
其中,所述墙体标记区域包括含有墙体样式的区域、含有内嵌在墙上的系列门区域和内嵌在墙上系列窗区域;
步骤A3:将墙体轮廓坐标转换成和户型图大小一致的二维标签。
需要说明的是,内嵌在墙上的系列门区域包括单开门、双开门、推拉门、折叠门和阳台门等内嵌在墙上的系列门区域;内嵌在墙上的系列窗区域包括平窗、飘窗、转角窗、转角飘窗等内嵌在墙上的系列窗区域。
更进一步的说明,在所述步骤A3中,将墙体轮廓坐标转换成和平面户型图大小一致的二维标签,包括以下步骤:
步骤A31:创建一张和平面户型图的分辨率大小一致的单通道空白蒙版图;
步骤A32:读取标记得到的墙体区域轮廓点的二维坐标;
步骤A33:根据轮廓点的坐标信息在蒙版图上的对应位置绘制填充的封闭的多边形,最终在空白蒙版图上得到仅包含墙体区域的二维标签;
其中,基于输入的平面户型图的分辨率确定语义分割网络模型的分割精度。
需要说明的是,输入的平面户型图的分辨率决定着语义分割网络模型的分割精度,通常情况下,分辨率越大,分割的精度会越高。但随着分辨率的提高,对硬件计算资源的要求就越高,同时也会增加计算的时间,在考虑分割精度、硬件需求和计算时间的条件下,在优选的实施例中,平面户型图和墙体二维标签图均采用1024x1024的分辨率。
更进一步的说明,如图3所示,在所述步骤B中,所述首卷积层包括两层重复的普通卷积层、归一化层和激活层;
所述编码器包括四层下采样层,每个所述下采样层包括两层重复的卷积层、激活层、归一化层和一层最大池化层,平面户型图每次经过所述最大池化层后,特征的宽和高缩减为原来的一半,特征的通道数翻倍,能够在下采样层中进一步地扩大了感受野并提取图像高维特征;
所述解码器包括4层上采样层,每个所述上采样层包含一层转置卷积层、两层重复的卷积层、激活层和归一化层,其中,每次上采样层之后都会和对应大小的下采样层特征图进行长连接之后再作为下一次上采样层的输入,每次转置卷积之后,特征的宽高扩大到原来的两倍,特征的通道数减少为原来的一半,长连接负责将下采样之前的特征和上采样之后的编码解码特征进行融合,融合后的特征不仅包含了编码前的原始特征信息,也包含了编码解码后的高维特征信息,上采样层不仅将编码后的特征恢复成原始尺寸,同时融合了编码前后的特征信息,这样不仅从多尺度中探索了更多的信息,也减少了编码器和解码器之间的语义差距,同时梯度误差也更容易传递到低层特征;其中需要说明的是,特征(feature matrix)也称为特征矩阵,是指图像矩阵映射在高维上的特征向量,表示的是图像在高维上的统计描述,其中映射的方式即为经过的卷积、激活、归一化、池化操作;
所述输出层包括一层普通卷积层和sigmoid层,普通卷积层提取的特征经过sigmoid激活映射到[0,1]之间,即为提取的墙体二维特征;
其中,所有普通卷积层都采用3x3大小的卷积核,激活层使用LeakyRelu进行激活,归一化层使用InstanceNorm进行归一化。
更进一步的说明,在步骤C中,训练语义分割网络模型包括以下步骤:
步骤C1:对步骤A中得到的墙体分割训练数据同步进行数据增强,获得增强型墙体分割训练数据;其中,包括数据增强方式包括左右翻转、上下翻转、角度旋转、图像平移、尺寸裁剪、比例缩放、随机噪声、高斯模糊、颜色扰动、亮度扰动和混类增强,且每次执行数据增强操作时,随机选择若干种数据增强方式进行组合;
步骤C2:将增强型墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型。
本实施例不仅能够强化训练语义分割网络模型模型,同时也能够降低获取训练图像成本。
更进一步的说明,在所述步骤D中,模型识别墙体信息,包括以下步骤:
步骤D1:记录待识别平面户型图的原始分辨率尺寸;
步骤D2:将待识别的平面户型图的分辨率进行缩放,获得缩放的平面户型图;
步骤D3:将缩放的平面户型图输入至训练好的墙体识别模型,得到预测的墙体信息;
步骤D4:将墙体信息经过阈值二值化,得到墙体的分割结果图;
步骤D5:将分割结果图缩放回记录的原始分辨率尺寸大小,即为最终平面户型图的墙体识别结果。
在本实施例中,将待识别的平面户型图输入训练后的墙体识别模型,能准确获取不同样式的平面户型图上的墙体信息,以减少人工绘制和修改的成本。
如图2所示,一种平面户型图的墙体区域识别系统,包括样本模块1、网络模块2、训练模块3和识别模块4;
所述样本模块1用于构建训练数据集,包括对平面户型图的墙体信息进行标注,构建墙体分割训练数据;
所述网络模块2用于构建语义分割网络模型;
所述训练模块3用于训练语义分割网络模型,将墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;
所述识别模块4用于模型识别墙体信息,将待识别的平面户型图输入至训练好的墙体识别模型进行识别,得到墙体信息。
在可选的一个实施例中,所述样本模块1包括样本获取子模块、样本标记子模块和样本转换子模块,所述样本获取子模块用于获取不同来源、不同风格、不同样式、不同大小的各类平面户型图;所述样本标记子模块用于通过开源软件Labelme或者其他带蒙版标注功能的软件,人工标记得到每张平面户型图中所有墙体标记区域的轮廓点二维坐标;所述样本转换子模块用于将墙体轮廓坐标转换成和平面户型图大小一致的二维标签;
在可选的一个实施例中,所述训练模块3包括训练增强子模块和训练收敛子模块,所述训练增强子模块用于对步骤A中得到的墙体分割训练数据同步进行数据增强,获得增强型墙体分割训练数据;其中,包括数据增强方式包括左右翻转、上下翻转、角度旋转、图像平移、尺寸裁剪、比例缩放、随机噪声、高斯模糊、颜色扰动、亮度扰动和混类增强,且每次执行数据增强操作时,随机选择若干种数据增强方式进行组合;所述训练收敛子模块用于将增强型墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;
所述识别模块4包括识别记录子模块、识别缩放子模块、识别获取子模块、识别分割子模块和识别结果子模块,所述识别记录子模块用于记录待识别平面户型图的原始分辨率尺寸;所述识别缩放子模块用于将待识别的平面户型图的分辨率进行缩放,获得缩放的平面户型图;所述识别获取子模块用于将缩放的平面户型图输入至训练好的墙体识别模型,得到预测的墙体信息;所述识别分割子模块用于将墙体信息经过阈值二值化,得到墙体的分割结果图;所述识别结果子模块用于将分割结果图缩放回记录的原始分辨率尺寸大小,即为最终平面户型图的墙体识别结果。
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
如图4-5所示,一种终端设备,包括存储器5、处理器6以及存储在所述存储器5中并可在所述处理器上运行的计算机程序7,所述处理器6执行所述计算机程序7时如上述所述的平面户型图的墙体区域识别方法的步骤。
一种存储介质,所述存储介质存储有计算机程序7,所述计算机程序7被处理器6执行时实现如上述所述的平面户型图的墙体区域识别方法。
就本说明书而言,"计算机存储介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(控制方法),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。
Claims (9)
1.一种平面户型图的墙体区域识别方法,其特征在于,包括以下步骤:
步骤A:构建训练数据集,包括对平面户型图的墙体信息进行标注,构建墙体分割训练数据;
步骤B:构建语义分割网络模型,由首卷积层、编码器、解码器和输出层组成的语义分割网络模型;
步骤C:训练语义分割网络模型,将步骤A中得到的墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;
步骤D:模型识别墙体信息,将待识别的平面户型图输入至训练好的墙体识别模型进行识别,得到墙体信息。
2.根据权利要求1所述一种平面户型图的墙体区域识别方法,其特征在于:在所述步骤A中,构建训练数据集包括以下步骤:
步骤A1:获取不同来源、不同风格、不同样式、不同大小的各类平面户型图;
步骤A2:通过开源软件Labelme或者其他带蒙版标注功能的软件,人工标记得到每张户型图中所有墙体标记区域的轮廓点二维坐标;
其中,所述墙体标记区域包括含有墙体样式的区域、含有内嵌在墙上的系列门区域和内嵌在墙上系列窗区域;
步骤A3:将墙体轮廓坐标转换成和平面户型图大小一致的二维标签。
3.根据权利要求2所述一种平面户型图的墙体区域识别方法,其特征在于:在所述步骤A3中,将墙体轮廓坐标转换成和平面户型图大小一致的二维标签,包括以下步骤:
步骤A31:创建一张和平面户型图的分辨率大小一致的单通道空白蒙版图;
步骤A32:读取标记得到的墙体区域轮廓点的二维坐标;
步骤A33:根据轮廓点的坐标信息在蒙版图上的对应位置绘制填充的封闭的多边形,最终在空白蒙版图上得到仅包含墙体区域的二维标签;
其中,基于输入的平面户型图的分辨率确定语义分割网络模型的分割精度。
4.根据权利要求1所述一种平面户型图的墙体区域识别方法,其特征在于:在所述步骤B中,所述首卷积层包括两层重复的普通卷积层、归一化层和激活层;
所述编码器包括四层下采样层,每个所述下采样层包括两层重复的卷积层、激活层、归一化层和一层最大池化层,平面户型图每次经过所述最大池化层后,图像的特征矩阵的宽和高缩减为原来的一半,特征的通道数翻倍;
所述解码器包括4层上采样层,每个所述上采样层包含一层转置卷积层、两层重复的卷积层、激活层和归一化层,其中,每次上采样层之后都会和对应大小的下采样层特征图进行长连接之后再作为下一次上采样层的输入,每次转置卷积之后,特征的宽高扩大到原来的两倍,特征的通道数减少为原来的一半,长连接负责将下采样之前的特征和上采样之后的编码解码特征进行融合,融合后的特征不仅包含了编码前的原始特征信息,也包含了编码解码后的高维特征信息,上采样层不仅将编码后的特征恢复成原始尺寸,同时融合了编码前后的特征信息;
所述输出层包括一层普通卷积层和sigmoid层,普通卷积层提取的特征经过sigmoid激活映射到[0,1]之间,即为提取的墙体二维特征;
其中,所有普通卷积层都采用3x3大小的卷积核,激活层使用LeakyRelu进行激活,归一化层使用InstanceNorm进行归一化。
5.根据权利要求1所述一种平面户型图的墙体区域识别方法,其特征在于:在步骤C中,训练语义分割网络模型包括以下步骤:
步骤C1:对步骤A中得到的墙体分割训练数据同步进行数据增强,获得增强型墙体分割训练数据;其中,包括数据增强方式包括左右翻转、上下翻转、角度旋转、图像平移、尺寸裁剪、比例缩放、随机噪声、高斯模糊、颜色扰动、亮度扰动和混类增强,且每次执行数据增强操作时,随机选择若干种数据增强方式进行组合;
步骤C2:将增强型墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型。
6.根据权利要求1所述一种平面户型图的墙体区域识别方法,其特征在于:在所述步骤D中,模型识别墙体信息,包括以下步骤:
步骤D1:记录待识别平面户型图的原始分辨率尺寸;
步骤D2:将待识别的平面户型图的分辨率进行缩放,获得缩放的户型图;
步骤D3:将缩放的平面户型图输入至训练好的墙体识别模型,得到预测的墙体信息;
步骤D4:将墙体信息经过阈值二值化,得到墙体的分割结果图;
步骤D5:将分割结果图缩放回记录的原始分辨率尺寸大小,即为最终平面户型图的墙体识别结果。
7.一种平面户型图的墙体区域识别系统,其特征在于:包括样本模块、网络模块、训练模块和识别模块;
所述样本模块用于构建训练数据集,包括对平面户型图的墙体信息进行标注,构建墙体分割训练数据;
所述网络模块用于构建语义分割网络模型;
所述训练模块用于训练语义分割网络模型,将墙体分割训练数据输入至语义分割网络模型进行训练,当语义分割网络模型训练至收敛时,得到墙体识别模型;
所述识别模块用于模型识别墙体信息,将待识别的平面户型图输入至训练好的墙体识别模型进行识别,得到墙体信息。
8.一种终端设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时如权利要求1至6中任意一项所述的平面户型图的墙体区域识别方法的步骤。
9.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述的平面户型图的墙体区域识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210689854.XA CN114973297A (zh) | 2022-06-17 | 2022-06-17 | 一种平面户型图的墙体区域识别方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210689854.XA CN114973297A (zh) | 2022-06-17 | 2022-06-17 | 一种平面户型图的墙体区域识别方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114973297A true CN114973297A (zh) | 2022-08-30 |
Family
ID=82964026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210689854.XA Pending CN114973297A (zh) | 2022-06-17 | 2022-06-17 | 一种平面户型图的墙体区域识别方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114973297A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108643586A (zh) * | 2018-04-17 | 2018-10-12 | 同济大学 | 一种装配式墙体支撑体系的运输吊装装置及使用方法 |
CN108763813A (zh) * | 2018-06-08 | 2018-11-06 | 杭州群核信息技术有限公司 | 一种基于深度学习识别临摹图中墙体的方法和装置 |
US20190130233A1 (en) * | 2017-10-30 | 2019-05-02 | Rakuten, Inc. | Method and apparatus for improved segmentation and recognition of images |
CN110059750A (zh) * | 2019-04-17 | 2019-07-26 | 广东三维家信息科技有限公司 | 户型形状识别方法、装置和设备 |
CN110096949A (zh) * | 2019-03-16 | 2019-08-06 | 平安城市建设科技(深圳)有限公司 | 户型图智能识别方法、装置、设备及计算机可读存储介质 |
CN110874591A (zh) * | 2020-01-20 | 2020-03-10 | 广东博智林机器人有限公司 | 一种图像定位方法、装置、设备及存储介质 |
CN110956196A (zh) * | 2019-10-11 | 2020-04-03 | 东南大学 | 一种城市建筑物窗墙比自动识别方法 |
CN111340954A (zh) * | 2020-02-18 | 2020-06-26 | 广东三维家信息科技有限公司 | 户型墙体绘制方法及其模型训练的方法、装置 |
CN113239785A (zh) * | 2021-05-11 | 2021-08-10 | 百安居信息技术(上海)有限公司 | 一种基于卷积神经网络的户型自动识别的方法、系统、存储介质及电子设备 |
CN114283440A (zh) * | 2021-12-01 | 2022-04-05 | 科大讯飞华南人工智能研究院(广州)有限公司 | 户型图识别方法、装置、电子设备及存储介质 |
-
2022
- 2022-06-17 CN CN202210689854.XA patent/CN114973297A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190130233A1 (en) * | 2017-10-30 | 2019-05-02 | Rakuten, Inc. | Method and apparatus for improved segmentation and recognition of images |
CN108643586A (zh) * | 2018-04-17 | 2018-10-12 | 同济大学 | 一种装配式墙体支撑体系的运输吊装装置及使用方法 |
CN108763813A (zh) * | 2018-06-08 | 2018-11-06 | 杭州群核信息技术有限公司 | 一种基于深度学习识别临摹图中墙体的方法和装置 |
CN110096949A (zh) * | 2019-03-16 | 2019-08-06 | 平安城市建设科技(深圳)有限公司 | 户型图智能识别方法、装置、设备及计算机可读存储介质 |
CN110059750A (zh) * | 2019-04-17 | 2019-07-26 | 广东三维家信息科技有限公司 | 户型形状识别方法、装置和设备 |
CN110956196A (zh) * | 2019-10-11 | 2020-04-03 | 东南大学 | 一种城市建筑物窗墙比自动识别方法 |
CN110874591A (zh) * | 2020-01-20 | 2020-03-10 | 广东博智林机器人有限公司 | 一种图像定位方法、装置、设备及存储介质 |
CN111340954A (zh) * | 2020-02-18 | 2020-06-26 | 广东三维家信息科技有限公司 | 户型墙体绘制方法及其模型训练的方法、装置 |
CN113239785A (zh) * | 2021-05-11 | 2021-08-10 | 百安居信息技术(上海)有限公司 | 一种基于卷积神经网络的户型自动识别的方法、系统、存储介质及电子设备 |
CN114283440A (zh) * | 2021-12-01 | 2022-04-05 | 科大讯飞华南人工智能研究院(广州)有限公司 | 户型图识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
张哲晗;方薇;杜丽丽;乔延利;张冬英;丁国绅;: "基于编码-解码卷积神经网络的遥感图像语义分割", 光学学报, no. 03, 10 February 2020 (2020-02-10) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7206309B2 (ja) | 画像質問応答方法、装置、コンピュータ装置、媒体及びプログラム | |
Rethage et al. | Fully-convolutional point networks for large-scale point clouds | |
US20200065626A1 (en) | Systems and methods for deep model translation generation | |
CA3204361A1 (en) | Image processing method, image processing apparatus, and non-transitory storage medium | |
Lin et al. | STAN: A sequential transformation attention-based network for scene text recognition | |
CN116229057B (zh) | 一种基于深度学习的三维激光雷达点云语义分割的方法和装置 | |
CN111488826A (zh) | 一种文本识别方法、装置、电子设备和存储介质 | |
CN113762269A (zh) | 基于神经网络的中文字符ocr识别方法、系统、介质及应用 | |
CN110879972B (zh) | 一种人脸检测方法及装置 | |
CN114581905B (zh) | 一种基于语义增强机制的场景文本识别方法及系统 | |
CN112419372B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111914654A (zh) | 一种文本版面分析方法、装置、设备和介质 | |
CN117893859A (zh) | 多模态文本图像分类方法、装置、电子设备及存储介质 | |
CN114266860A (zh) | 三维人脸模型建立方法、装置、电子设备及存储介质 | |
CN117541668A (zh) | 虚拟角色的生成方法、装置、设备及存储介质 | |
CN117911430A (zh) | 基于transformer的交互式微生物图像分割方法与装置 | |
CN117746186A (zh) | 低秩自适应模型的训练方法、文本生成图像方法、系统 | |
CN116266259A (zh) | 图像文字结构化输出方法、装置、电子设备和存储介质 | |
CN113807218B (zh) | 版面分析方法、装置、计算机设备和存储介质 | |
CN117132997B (zh) | 一种基于多头注意力机制和知识图谱的手写表格识别方法 | |
CN112597925B (zh) | 手写字迹的识别/提取、擦除方法及擦除系统、电子设备 | |
CN117710295A (zh) | 图像处理方法、装置、设备、介质及程序产品 | |
CN111339919B (zh) | 一种基于多任务协作的镜子检测方法 | |
CN113239785A (zh) | 一种基于卷积神经网络的户型自动识别的方法、系统、存储介质及电子设备 | |
CN114973297A (zh) | 一种平面户型图的墙体区域识别方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |