CN111444884A - 图像中的构件识别方法、设备及计算机可读存储介质 - Google Patents
图像中的构件识别方法、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111444884A CN111444884A CN202010324537.9A CN202010324537A CN111444884A CN 111444884 A CN111444884 A CN 111444884A CN 202010324537 A CN202010324537 A CN 202010324537A CN 111444884 A CN111444884 A CN 111444884A
- Authority
- CN
- China
- Prior art keywords
- image
- component
- convolution
- target
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000013528 artificial neural network Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 24
- 230000001537 neural effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 12
- 238000012937 correction Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000011960 computer-aided design Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像中的构件识别方法、设备及计算机可读存储介质,图像中的构件识别方法包括步骤:获取待识别图像,对所述待识别图像进行预处理操作,得到目标识别图像;通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果;根据所述目标卷积结果识别所述待识别图像中各个构件的构件种类。本发明实现了通过深度可分离卷积来识别图像中的构件,在识别图像中的构件过程中,不再需要使用有参层来学习识别图像中构件过程中输入和输出之间的关系,从而提高了识别图像中构件的识别效率。
Description
技术领域
本发明涉及图像中的构件识别设备技术领域,尤其涉及一种图像中的构件识别方法、设备及计算机可读存储介质。
背景技术
目前常用的识别建筑图纸构件的种类的方法为:采用ResNet(Residual NeuralNetwork)的端到端的训练方式,ResNet网络采用常规计算机视觉领域的残差概念,将它应用在了CNN(Convolutional Neural Networks,卷积神经网络)模型的构建当中,它通过使用多个有参层来学习输入和输出之间的残差表示,而非像一般CNN网络(如Alexnet/VGG等)那样使用有参层来直接尝试学习输入和输出之间的映射。实验表明使用一般意义上的有参层来直接学习残差比直接学习输入和输出间的映射要容易得多(收敛速度更快),也有效得多(可通过使用更多的层来达到更高的分类精度),但是ResNet模型参数较多,模型计算复杂度较高,从而导致对建筑图纸对应图像中构件种类识别的效率低下。由此可知,目前建筑图纸对应图像中构件的种类识别效率低下。
发明内容
本发明的主要目的在于提供一种图像中的构件识别方法、设备及计算机可读存储介质,旨在解决现有的建筑图纸对应图像中构件的种类识别效率低下的技术问题。
为实现上述目的,本发明提供一种图像中的构件识别方法,所述图像中的构件识别方法包括步骤:
获取待识别图像,对所述待识别图像进行预处理操作,得到目标识别图像;
通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果;
根据所述目标卷积结果识别所述待识别图像中各个构件的构件种类。
可选地,所述通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果的步骤包括:
通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行逐点卷积操作,得到初始卷积结果;
通过所述深度可分离卷积对所述初始卷积结果进行深度卷积操作,得到目标卷积结果。
可选地,所述通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果的步骤之前,还包括:
通过神经结构搜索设置卷积神经网络中深度可分离卷积的卷积参数;
所述通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果的步骤包括:
基于所述卷积参数,通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果。
可选地,所述根据所述目标卷积结果识别所述待识别图像中各个构件的构件种类的步骤包括:
获取所述目标卷积结果中各个构件的构件特征数据,以及获取预存的各种类构件对应的目标特征数据;
将所述构件特征数据与所述目标特征数据进行对比,并根据对比所得的对比结果确定所述待识别图像中各个构件的构件种类。
可选地,所述获取待识别图像,对所述待识别图像进行预处理操作,得到目标识别图像的步骤之后,还包括:
调用预设的坐标解析应用,通过所述坐标解析应用解析所述目标识别图像,得到所述目标识别图像中各个构件的构件坐标。
可选地,所述调用预设的坐标解析应用,通过所述坐标解析应用解析所述目标识别图像,得到所述目标识别图像中各个构件的构件坐标的步骤之后,还包括:
根据所述构件坐标确定所述待识别图像中每两个构件之间的位置关系,并获取预设的各类构件对应的位置错误关系;
将所述位置关系与所述位置错误关系进行对比,根据所得的对比结果确定所述待识别图像中是否存在位置关系错误的构件。
可选地,所述获取待识别图像,对所述待识别图像进行预处理操作,得到目标识别图像的步骤包括:
获取待识别图像,调节所述待识别图像的亮度,得到目标识别图像。
可选地,所述获取待识别图像,调节所述待识别图像的亮度,得到目标识别图像的步骤包括:
获取待识别图像,调节所述待识别图像的亮度,得到调节亮度后的待识别图像;
将调节亮度后的待识别图像转换为灰度图像,得到目标识别图像。
此外,为实现上述目的,本发明还提供一种图像中的构件识别设备,所述图像中的构件识别设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的图像中的构件识别程序,所述图像中的构件识别程序被所述处理器执行时实现如联邦学习服务器对应的图像中的构件识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有图像中的构件识别程序,所述图像中的构件识别程序被处理器执行时实现如上所述的图像中的构件识别方法的步骤。
本发明通过获取待识别图像,对待识别图像进行预处理操作,得到目标识别图像,通过卷积神经网络中的深度可分离卷积对目标识别图像进行卷积操作,得到目标卷积结果,根据目标卷积结果识别待识别图像中各个构件的构件种类。实现了通过深度可分离卷积来识别图像中的构件,在识别图像中的构件过程中,不再需要使用有参层来学习识别图像中构件过程中输入和输出之间的关系,从而提高了识别图像中构件的识别效率。
附图说明
图1是本发明图像中的构件识别方法第一实施例的流程示意图;
图2是本发明图像中的构件识别方法第三实施例的流程示意图;
图3是本发明实施例方案涉及的硬件运行环境的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种图像中的构件识别方法,参照图1,图1为本发明图像中的构件识别方法第一实施例的流程示意图。
本发明实施例提供了图像中的构件识别方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图像中构件的识别方法应用于服务器或者终端中,终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)等移动终端,以及诸如数字TV、台式计算机等固定终端。在图像中构件的识别方法的各个实施例中,为了便于描述,省略执行主体进行阐述各个实施例。图像中的构件识别方法包括:
步骤S10,获取待识别图像,对所述待识别图像进行预处理操作,得到目标识别图像。
获取待识别图像,其中,该待识别图像可以是预先存储的,也可以是在需要待识别图像时,拍摄或者扫描建筑图纸,以得到建筑图纸对应的待识别图像,即本实施例中的待识别图像是建筑图纸对应的图像。具体地,可在侦测到获取指令时获取待识别图像,该获取指令可为用户根据需要而触发,也可以是通过定时任务触发。可以理解的是,当需要通过摄像装置获取待识别图像时,在侦测到获取指令时,通过获取指令启动摄像装置拍摄建筑图纸,得到建筑图纸对应的待识别图像。当获取到待识别图像后,对待识别图像进行预处理操作,得到预处理后的待识别图像,在本实施例中,为了便于描述,将预处理后的待识别图像记为目标识别图像。
进一步地,步骤S10包括:
步骤a,获取待识别图像,调节所述待识别图像的亮度,得到目标识别图像。
获取待识别图像,调节待识别图像的亮度,以得到目标识别图像,即调整待识别图像的亮度是预处理操作的一种。需要说明的是,由于建筑图纸多为底色为黑色等较暗的彩色,因此需要先调节待识别图像的亮度,对待识别图像进行色彩增强,以降低后续识别待识别图像中各种类构件的难度。具体地,本实施例可通过Gamma(伽玛)校正调节待识别图像的亮度,对待识别图像进行色彩增强。Gamma校正就是对待识别图像的伽玛曲线进行编辑,以对待识别图像进行非线性色调编辑的方法,检出待识别图像信号中的深色部分和浅色部分,并使两者比例增大,从而提高待识别图像对比度效果。本实施例中,Gamma校正数学表达为指数方式,**符号代表指数运算,Gamma校正的数学表达式为:R1=R**gamma,G1=G**gamma,B1=B**gamma,其中,R1代表Gamma校正后图像中的红色通道,即目标识别图像中的红色通道;G1代表Gamma校正后图像中的绿色通道,即目标识别图像中的绿色通道;B1代表Gamma校正后图像中的蓝色通道,即目标识别图像中的蓝色通道;R代表Gamma校正前图像中的红色通道,即待识别图像中的红色通道;G代表Gamma校正前图像中的绿色通道,即待识别图像中的绿色通道;B代表Gamma校正前图像中的蓝色通道,即待识别图像中的蓝色通道。可以理解的是,本实施例也可采用其它方式调节待识别图像的亮度,以对待识别图像进行色彩增强,如可以将待识别图像中的蓝色通道、红色通道和绿色通道对应的值在原来的基础上增加一定的值。
进一步地,步骤a包括:
步骤a1,获取待识别图像,调节所述待识别图像的亮度,得到调节亮度后的待识别图像。
步骤a2,将调节亮度后的待识别图像转换为灰度图像,得到目标识别图像。
进一步地,为了降低识别待识别图像中各种类构件的识别难度,在获取到待识别图像后,先调节待识别图像的亮度,得到调节亮度后的待识别图像,并将调整亮度后的待识别图像转换为灰度图像,得到目标识别图像,可以理解的是,目标识别图像就是转换成灰度图像的待识别图像。需要说明的是,在将调节亮度后的待识别图像转换为灰度图像过程中,为了避免低速的浮点运算,需要采用整数算法。具体地,对调整亮度后的待识别图像进行二值化处理,以将调节亮度后的待识别图像转换为灰度图像。若目标识别图像中的某个像素点表示为Gray,则将调节亮度后的待识别图像转换为灰度图像的公式可表示为:Gray=(R1*299+G1*587+B1*114+500)/1000。其中,由于将调节亮度后的待识别图像转换为灰度图像的公式中各个通道对应的相乘系数(299、587、114)都是3位精度,因此将待识别图像中的像素缩放1000倍来实现整数运算。可以理解的是,当相乘系数是4位精度时,可将待识别图像中的像素缩放10000倍来实现整数运算。进一步地,在本实施例中,预处理操作包括但不限于亮度调节操作和灰度转换操作,如还可以包括降噪操作。
步骤S20,通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果。
当得到目标识别图像后,获取预先存储的卷积神经网络,通过卷积神经网络中的深度可分离卷积对目标识别图像进行卷积操作,得到目标识别图像对应的目标卷积结果。卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一,卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类。具体地,本实施例中的卷积神经网络为轻量级的卷积神经网络,如mobilenet,在mobilenet中,会有深度可分离卷积。
进一步地,所述步骤S20包括:
步骤b,通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行逐点卷积操作,得到初始卷积结果。
进一步地,深度可分离卷积将传统的卷积分解为一个深度卷积(depthwi seconvolution)和一个1*1的逐点卷积(pointwise convolution)。因此,当得到目标识别图像后,通过卷积神经网络中的深度可分离卷积对目标识别图像进行逐点卷积操作,即按照卷积操作对应卷积核的通道数对目标识别图像进行按位相乘的计算,此时保持卷积核的通道数不变,得到初始卷积结果。需要说明的是,每一卷积操作都存在对应的卷积核,通过对目标识别图像进行卷积操作,可以得到目标识别图像对应的特征图。按位相乘的计算过程就是不同通道对应的特征矩阵之间相乘。在本实施例中,初始卷积结果是以矩阵的形式表现的。
步骤c,通过所述深度可分离卷积对所述初始卷积结果进行深度卷积操作,得到目标卷积结果。
当得到初始卷积结果后,通过深度可分离卷积对初始卷积结果进行深度卷积操作,得到目标卷积结果,即使用1*1的卷积核对初始卷积结果进行卷积运算,得到目标卷积结果。需要说明的是,在对初始卷积结果进行深度卷积操作过程中,卷积核的通道数可以改变。
需要说明的是,传统的卷积操作(现有的卷积操作)是将每个卷积核与每张特征图进行按位相乘后进行相加,对应的计算量为:DF*DF*DK*DK*M*N,其中,DF为特征图尺寸,DK为卷积操作对应卷积核尺寸,M为卷积核的输入通道数,N为卷积核的输出通道数。本实施例通过深度可分离卷积进行卷积操作的计算量为:DK*DK*M*DF*DF+1*1*M*N*DF*DF。通过计算传统卷积操作对应计算量与本实施例中计算量之间的比值可以知道,本申请中通过深度可分离卷积得到目标卷积结果的计算量比现有的卷积操作要小。在本实施例中,目标卷积结果是以矩阵的形式表现的。
步骤S30,根据所述目标卷积结果识别所述待识别图像中各个构件的构件种类。
当得到目标卷积结果后,根据目标卷积结果识别待识别图像中各个构件的构件种类,即识别待识别图像中各个构件是门、窗户还是床等。可以理解的是,构件种类包括但不限于门、窗户、桌子和床。
进一步地,步骤S30包括:
步骤d,获取所述目标卷积结果中各个构件的构件特征数据,以及获取预存的各种类构件对应的目标特征数据。
步骤e,将所述构件特征数据与所述目标特征数据进行对比,并根据对比所得的对比结果确定所述待识别图像中各个构件的构件种类。
进一步地,当得到目标卷积结果后,获取目标卷积结果中各个构件的构件特征数据,以及获取预先存储的各类构件的对应的目标特征数据。可以理解的是,不同种类的构件对应的特征数据是不一样的。当得到目标卷积结果中各个构件的构件特征数据和目标特征数据后,将构件特征数据对目标特征数据进行对比,得到对比结果,并根据对比所得的对比结果确定待识别图像中各个构件的构件种类。具体地,计算目标卷积结果中各个构件的构件特征数据与各目标特征数据之间的相似度,将相似度大于或者等于预设相似度对应的目标特征数据的构件种类确定为待确定构件种类,并检测是否存在至少两个待确定构件种类。若检测到存在至少两个待确定构件种类,则将最大相似度对应的待确定构件种类确定为待识别图像中对应构件的构件种类;若检测到只存在一个待确定构件种类,则将该待确定构件种类确定为待识别图像中对应构件的构件种类;若目标卷积结果中某个构件的构件特征数据与所有目标特征数据之间的相似度都小于预设相似度,则确定该构件的构件种类识别失败。在本实施例,不限于预设相似度的大小,如可将预设相似度设置为65%、70%或者85%等。
为了便于理解的,举例说明。如一共获取到5类构件对应的目标特征数据,分别为a、b、c、d和e目标特征数据,此时将目标卷积结果中A构件的A构件特征数据与a、b、c、d和e目标特征数据进行对比,得到A构件特征数据分别与a、b、c、d和e目标特征数据之间的相似度,A构件特征数据分别与a、b、c、d和e目标特征数据之间的相似度可记为A1、A2、A3、A4和A5,若确定只有A2和A5大于预设相似度,且A2大于A5,则可确定A2对应的种类记为A构件的种类,如若A2为窗户,则可确定A构件为窗户。
本实施例通过获取待识别图像,对待识别图像进行预处理操作,得到目标识别图像,通过卷积神经网络中的深度可分离卷积对目标识别图像进行卷积操作,得到目标卷积结果,根据目标卷积结果识别待识别图像中各个构件的构件种类。实现了通过深度可分离卷积来识别图像中的构件,在识别图像中的构件过程中,不再需要使用有参层来学习识别图像中构件过程中输入和输出之间的关系,从而提高了识别图像中构件的识别效率。
进一步地,提出本发明图像中的构件识别方法第二实施例。所述图像中的构件识别方法第二实施例与所述图像中的构件识别方法第一实施例的区别在于,所述图像中的构件识别方法还包括:
步骤f,通过神经结构搜索设置卷积神经网络中深度可分离卷积的卷积参数。
当确定卷积神经网络中的可分离卷积后,通过神经结构搜索(NAS,NeuralArchitecture Search)设置卷积神经网络中深度可分离卷积的卷积参数,其中,卷积参数包括但不限于卷积尺寸和卷积步长。具体地,在本实施例中,利用NASNET将深度可分离卷积中的初始卷积参数和权重连接,基于初始卷积参数和权重,采用深度学习的方式进行搜索计算得到最终的卷积参数,该最终的卷积参数就是后面深度可分离卷积对目标识别图像进行卷积操作时所用的卷积参数。初始卷积参数和对应权重可预先设置好,本实施例对初始卷积参数和其对应的权重大小不做具体限制。可以理解的是,深度可分离卷积中每次卷积操作对应的卷积参数可以相同,也可以不相同。
所述步骤S20包括:
步骤g,基于所述卷积参数,通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果。
当确定深度可分离卷积对应的卷积参数后,基于所确定的卷积参数,通过卷积神经网络中的深度可分离卷积对目标识别图像进行卷积操作,得到目标卷积结果。
本实施例通过神经结构搜索设置深度可分离卷积的卷积参数,并根据所设置的卷积参数,通过深度可分离卷积对目标识别图像进行卷积操作,以通过卷积操作更准确地提取目标识别图像中的特征,从而提高了目标识别图像中构件识别的准确率。
进一步地,提出本发明图像中的构件识别方法第三实施例。所述图像中的构件识别方法第三实施例与所述图像中的构件识别方法第一和/或第二实施例的区别在于,参照图2,所述图像中的构件识别方法还包括:
步骤S40,调用预设的坐标解析应用,通过所述坐标解析应用解析所述目标识别图像,得到所述目标识别图像中各个构件的构件坐标。
当的目标识别图像后,调用预先设置好的坐标解析应用,通过坐标解析应用解析目标识别图像,得到目标识别图像中各个构件的构件坐标。在本实施例中,坐标解析应用可为CAD(Computer Aided Design,计算机辅助设计)应用,具体地,调用CAD应用,通过CAD应用的API(Application Progra mming Interface,应用程序接口)库来识别目标识别图像中各个构件的构件坐标。需要说明的是,本实施例也可采用其它和CAD应用具备相同功能的坐标解析应用来解析目标识别图像,得到目标识别图像中各个构件的构件坐标。如也可在待识别图像中建立坐标系,根据待识别图像中各个构件在坐标系中的位置来确定待识别图像中各个构件的构件坐标,本实施例不限制坐标系的建立方式。
需要说明的是,本实施例不限制步骤S20、步骤S30和步骤S40之间执行的先后顺序,步骤S40可以在步骤S20和步骤S30之后执行,也可在步骤S20和步骤S30之前执行,或者在步骤S20和步骤S30之间执行。
进一步地,所述图像中的构件识别方法还包括:
步骤h,根据所述构件坐标确定所述待识别图像中每两个构件之间的位置关系,并获取预设的各类构件对应的位置错误关系。
当识别出待识别图像中的各个构件的构件种类,以及确定各个构件的构件坐标后,根据各个构件对应的构件种类和构件坐标确定待识别图像中每两个构件之间的位置关系。可以理解的是,因为识别出待识别图像中各个构件的构件种类和构件坐标,即知道待识别图像中的各个构件是门、窗户还是床等,以及各个构件所在的位置,因此可以确定待识别图像中每两个构件之间的位置关系。获取预先设置好的位置错误关系,该位置错误关系为在设计建筑图纸时,禁止出现的构件之间的位置关系,如位置错误关系包括但不限于门和床相对和消防栓设置在停车位中。
步骤i,将所述位置关系与所述位置错误关系进行对比,根据所得的对比结果确定所述待识别图像中是否存在位置关系错误的构件。
当确定待识别图像中每两个构件之间的位置关系,且获取到位置错误关系后,将待识别图像中每两个构件之间的位置关系与位置错误关系进行对比,得到对比结果。其中,对比结果包括两种,一种是待识别图像中存在至少一组构件之间的位置关系与位置错误关系相同,一组构件为包括两个构件,另一种是待识别图像中未存在任何两个构件之间的位置关系与位置错误关系相同。当得到对比结果后,根据对比结果确定待识别图像中是否存在位置关系错误的构件。如当待识别图像中的门和床之间的位置关系是门和床相对,则可确定待识别图像中的门和床之间的位置关系与位置错误关系相同。
本实施例通过确定待识别图像中各个构件之间的位置关系,根据位置关系和预设的位置错误关系确定待识别图像中是否存在位置关系错误的构件,从而可以快速识别出待识别图像中位置关系错误的构件。
进一步地,当确定待识别图像中存在位置关系错误的构件,则生成提示信息,并输出该提示信息,以根据该提示信息提示用户待识别图像中存在位置关系错误的构件。需要说明的是,在输出提示信息时,可以将待识别图像中一起输出,并在待识别图像中以特定的方式标注位置关系错误的构件,如将位置关系错误的构件的构件轮廓以红色或者蓝色等特定颜色显示。进一步地,在生成提示信息后,也可以将提示信息发送给移动终端。当移动终端接收到提示信息后,移动终端输出该提示信息,以根据该提示信息提示移动终端用户待识别图像中存在位置关系错误的构件。
进一步地,若确定待识别图像中未存在位置关系错误的构件,则生成待识别图像中未存在位置关系错误的构件的提示信息,以根据该提示信息提示用户待识别图像中未存在位置关系错误的构件。
通过在确定待识别图像中存在位置关系错误的构件后,输出提示信息提示用户待识别图像中存在位置关系错误的构件,以便于用户快速知道待识别图像对应建筑图纸中存在问题的地方,从而提高了建筑图纸的正确性,即提高了建筑图像对应的待识别图像的正确性。
此外,本发明还提供一种图像中的构件识别设备,如图3所示,图3是本发明实施例方案涉及的硬件运行环境的结构示意图。
需要说明的是,图3即可为图像中的构件识别设备的硬件运行环境的结构示意图。本发明实施例图像中的构件识别设备可以是PC,便携计算机等终端设备。
如图3所示,该图像中的构件识别设备可以包括:处理器1001,例如CPU,存储器1005,用户接口1003,网络接口1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图3中示出的图像中的构件识别设备结构并不构成对图像中的构件识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及图像中的构件识别程序。其中,操作系统是管理和控制图像中的构件识别设备硬件和软件资源的程序,支持图像中的构件识别程序以及其它软件或程序的运行。
在图3所示的图像中的构件识别设备中,用户接口1003主要用于连接移动终端,与移动终端进行数据通信,如发送提示信息给移动终端,或者接收移动终端发送的获取待识别图像的获取指令;网络接口1004主要用于后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的图像中的构件识别程序,并执行如上所述的图像中的构件识别方法的步骤。
本发明图像中的构件识别设备具体实施方式与上述图像中的构件识别方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有图像中的构件识别程序,所述图像中的构件识别程序被处理器执行时实现如上所述的图像中的构件识别方法的步骤。
本发明计算机可读存储介质具体实施方式与上述图像中的构件识别方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种图像中的构件识别方法,其特征在于,所述图像中的构件识别方法包括以下步骤:
获取待识别图像,对所述待识别图像进行预处理操作,得到目标识别图像;
通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果;
根据所述目标卷积结果识别所述待识别图像中各个构件的构件种类。
2.如权利要求1所述的图像中的构件识别方法,其特征在于,所述通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果的步骤包括:
通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行逐点卷积操作,得到初始卷积结果;
通过所述深度可分离卷积对所述初始卷积结果进行深度卷积操作,得到目标卷积结果。
3.如权利要求1所述的图像中的构件识别方法,其特征在于,所述通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果的步骤之前,还包括:
通过神经结构搜索设置卷积神经网络中深度可分离卷积的卷积参数;
所述通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果的步骤包括:
基于所述卷积参数,通过卷积神经网络中的深度可分离卷积对所述目标识别图像进行卷积操作,得到目标卷积结果。
4.如权利要求1所述的图像中的构件识别方法,其特征在于,所述根据所述目标卷积结果识别所述待识别图像中各个构件的构件种类的步骤包括:
获取所述目标卷积结果中各个构件的构件特征数据,以及获取预存的各种类构件对应的目标特征数据;
将所述构件特征数据与所述目标特征数据进行对比,并根据对比所得的对比结果确定所述待识别图像中各个构件的构件种类。
5.如权利要求1所述的图像中的构件识别方法,其特征在于,所述获取待识别图像,对所述待识别图像进行预处理操作,得到目标识别图像的步骤之后,还包括:
调用预设的坐标解析应用,通过所述坐标解析应用解析所述目标识别图像,得到所述目标识别图像中各个构件的构件坐标。
6.如权利要求5所述的图像中的构件识别方法,其特征在于,所述调用预设的坐标解析应用,通过所述坐标解析应用解析所述目标识别图像,得到所述目标识别图像中各个构件的构件坐标的步骤之后,还包括:
根据所述构件坐标确定所述待识别图像中每两个构件之间的位置关系,并获取预设的各类构件对应的位置错误关系;
将所述位置关系与所述位置错误关系进行对比,根据所得的对比结果确定所述待识别图像中是否存在位置关系错误的构件。
7.如权利要求1至6任一项所述的图像中的构件识别方法,其特征在于,所述获取待识别图像,对所述待识别图像进行预处理操作,得到目标识别图像的步骤包括:
获取待识别图像,调节所述待识别图像的亮度,得到目标识别图像。
8.如权利要求7所述的图像中的构件识别方法,其特征在于,所述获取待识别图像,调节所述待识别图像的亮度,得到目标识别图像的步骤包括:
获取待识别图像,调节所述待识别图像的亮度,得到调节亮度后的待识别图像;
将调节亮度后的待识别图像转换为灰度图像,得到目标识别图像。
9.一种图像中的构件识别设备,其特征在于,所述图像中的构件识别设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的图像中的构件识别程序,所述图像中的构件识别程序被所述处理器执行时实现如权利要求1至8中任一项所述的图像中的构件识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有图像中的构件识别程序,所述图像中的构件识别程序被处理器执行时实现如权利要求1至8中任一项所述的图像中的构件识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010324537.9A CN111444884A (zh) | 2020-04-22 | 2020-04-22 | 图像中的构件识别方法、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010324537.9A CN111444884A (zh) | 2020-04-22 | 2020-04-22 | 图像中的构件识别方法、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111444884A true CN111444884A (zh) | 2020-07-24 |
Family
ID=71657855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010324537.9A Pending CN111444884A (zh) | 2020-04-22 | 2020-04-22 | 图像中的构件识别方法、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111444884A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819714A (zh) * | 2021-01-29 | 2021-05-18 | 深圳市商汤科技有限公司 | 目标对象曝光方法、装置、存储介质及设备 |
CN113212889A (zh) * | 2021-02-26 | 2021-08-06 | 深圳市云鼠科技开发有限公司 | 包装视觉捡漏装置、方法、计算机设备及存储介质 |
CN113283308A (zh) * | 2021-04-30 | 2021-08-20 | 杭州品茗安控信息技术股份有限公司 | 一种工程图纸的图像识别方法、系统及相关装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063666A (zh) * | 2018-08-14 | 2018-12-21 | 电子科技大学 | 基于深度可分离卷积的轻量化人脸识别方法及系统 |
CN110188862A (zh) * | 2019-04-12 | 2019-08-30 | 北京迈格威科技有限公司 | 用于数据处理的模型超参数的搜索方法、装置、系统 |
CN110210609A (zh) * | 2019-06-12 | 2019-09-06 | 北京百度网讯科技有限公司 | 基于神经框架搜索的模型训练方法、装置以及终端 |
US20190371102A1 (en) * | 2018-05-29 | 2019-12-05 | Schlage Lock Company Llc. | Automated architectural specification generation and hardware identification |
CN110647893A (zh) * | 2019-09-20 | 2020-01-03 | 北京地平线机器人技术研发有限公司 | 目标对象识别方法、装置、存储介质和设备 |
CN110765322A (zh) * | 2019-10-31 | 2020-02-07 | 国网河北省电力有限公司电力科学研究院 | 一种电力系统二次设备信息和状态自动检查系统及方法 |
CN110889487A (zh) * | 2018-09-10 | 2020-03-17 | 富士通株式会社 | 神经网络架构搜索装置和方法及计算机可读记录介质 |
CN110909650A (zh) * | 2019-11-15 | 2020-03-24 | 清华大学 | 基于领域知识和目标检测的cad图纸识别方法和装置 |
-
2020
- 2020-04-22 CN CN202010324537.9A patent/CN111444884A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190371102A1 (en) * | 2018-05-29 | 2019-12-05 | Schlage Lock Company Llc. | Automated architectural specification generation and hardware identification |
CN109063666A (zh) * | 2018-08-14 | 2018-12-21 | 电子科技大学 | 基于深度可分离卷积的轻量化人脸识别方法及系统 |
CN110889487A (zh) * | 2018-09-10 | 2020-03-17 | 富士通株式会社 | 神经网络架构搜索装置和方法及计算机可读记录介质 |
CN110188862A (zh) * | 2019-04-12 | 2019-08-30 | 北京迈格威科技有限公司 | 用于数据处理的模型超参数的搜索方法、装置、系统 |
CN110210609A (zh) * | 2019-06-12 | 2019-09-06 | 北京百度网讯科技有限公司 | 基于神经框架搜索的模型训练方法、装置以及终端 |
CN110647893A (zh) * | 2019-09-20 | 2020-01-03 | 北京地平线机器人技术研发有限公司 | 目标对象识别方法、装置、存储介质和设备 |
CN110765322A (zh) * | 2019-10-31 | 2020-02-07 | 国网河北省电力有限公司电力科学研究院 | 一种电力系统二次设备信息和状态自动检查系统及方法 |
CN110909650A (zh) * | 2019-11-15 | 2020-03-24 | 清华大学 | 基于领域知识和目标检测的cad图纸识别方法和装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819714A (zh) * | 2021-01-29 | 2021-05-18 | 深圳市商汤科技有限公司 | 目标对象曝光方法、装置、存储介质及设备 |
CN113212889A (zh) * | 2021-02-26 | 2021-08-06 | 深圳市云鼠科技开发有限公司 | 包装视觉捡漏装置、方法、计算机设备及存储介质 |
CN113212889B (zh) * | 2021-02-26 | 2023-11-03 | 深圳市云鼠科技开发有限公司 | 包装视觉检漏装置、方法、计算机设备及存储介质 |
CN113283308A (zh) * | 2021-04-30 | 2021-08-20 | 杭州品茗安控信息技术股份有限公司 | 一种工程图纸的图像识别方法、系统及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108022212B (zh) | 高分辨率图片生成方法、生成装置及存储介质 | |
CN111444884A (zh) | 图像中的构件识别方法、设备及计算机可读存储介质 | |
US9344690B2 (en) | Image demosaicing | |
CN111444885B (zh) | 图像中构件的识别方法、设备及计算机可读存储介质 | |
CN110717868B (zh) | 视频高动态范围反色调映射模型构建、映射方法及装置 | |
CN109803172B (zh) | 一种直播视频的处理方法、装置及电子设备 | |
CN113344826B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN113822116A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN112767354A (zh) | 基于图像分割的缺陷检测方法、装置、设备及存储介质 | |
CN109615620B (zh) | 图像压缩度识别方法、装置、设备及计算机可读存储介质 | |
JP2021189527A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN107220934A (zh) | 图像重建方法及装置 | |
CN111047618A (zh) | 基于多尺度的无参考屏幕内容图像质量评估方法 | |
CN113052768B (zh) | 一种处理图像的方法、终端及计算机可读存储介质 | |
CN117315758A (zh) | 面部表情的检测方法、装置、电子设备及存储介质 | |
US20230222639A1 (en) | Data processing method, system, and apparatus | |
Buzzelli et al. | Consensus-driven illuminant estimation with GANs | |
CN113724282A (zh) | 图像处理方法和相关产品 | |
CN115565213B (zh) | 图像处理方法及装置 | |
CN115512203A (zh) | 信息检测方法、装置、设备及存储介质 | |
CN116977190A (zh) | 图像处理方法、装置、设备、存储介质及程序产品 | |
CN111476731B (zh) | 图像矫正方法、装置、存储介质及电子设备 | |
CN112581401A (zh) | 一种raw图片的获取方法、装置及电子设备 | |
CN113822809A (zh) | 暗光增强方法及其系统 | |
CN111260623A (zh) | 图片评价方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200724 |
|
RJ01 | Rejection of invention patent application after publication |