CN118015648A - 图纸信息提取方法、装置、设备及存储介质 - Google Patents
图纸信息提取方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN118015648A CN118015648A CN202311865009.4A CN202311865009A CN118015648A CN 118015648 A CN118015648 A CN 118015648A CN 202311865009 A CN202311865009 A CN 202311865009A CN 118015648 A CN118015648 A CN 118015648A
- Authority
- CN
- China
- Prior art keywords
- information
- model
- primitive
- extraction
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 140
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 8
- 238000011176 pooling Methods 0.000 description 7
- 238000003062 neural network model Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000011960 computer-aided design Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本公开涉及一种图纸信息提取方法、装置、设备及存储介质,该方法包括:获取待处理图纸;基于预训练的图元提取模型从所述待处理图纸中提取图元信息;基于所述图元信息和预训练的关系提取模型提取所述待处理图纸中图元之间的关系信息;基于所述图元信息、所述关系信息和预训练的构件识别模型确定各个图元对应的构件名称。本公开通过设置图元提取模型从待处理图纸中提取图元信息,设置关系提取模型提取图元之间的关系信息,再设置构件识别模型确定图元的构件名称,能够实现对待处理图纸中包含的信息的自动提取,相较于传统的人工提取图纸信息的方式,提高了信息提取的整体速度和准确率,方便后续基于提取得到的图纸信息快速建立准确的三维模型。
Description
技术领域
本公开涉及建筑信息技术领域,尤其涉及一种图纸信息提取方法、装置、设备及存储介质。
背景技术
建筑信息模型(Building Information Modeling,BIM)技术的发展被视为建筑行业的第二次革命,使建筑设计从二维平面提升到三维空间,建立虚拟的建筑工程三维模型,能够提高生产效率和交付质量,同时方便对原始的建筑信息进行完善的保存,并在后续的建筑运维、商业运营过程中得到应用。但是,由于BIM模型的制作非常复杂,当前建筑行业还是普遍应用计算机辅助设计(Computer Aided Design,CAD)软件制图,想要建立三维模型需要先从CAD图纸中提取建筑信息,而目前提取建筑信息主要通过人工实现,提取效率和准确度有待提升。
发明内容
为了解决上述技术问题,本公开提供了一种图纸信息提取方法、装置、设备及存储介质。
本公开实施例的第一方面提供了一种图纸信息提取方法,该方法包括:
获取待处理图纸;
基于预训练的图元提取模型从所述待处理图纸中提取图元信息;
基于所述图元信息和预训练的关系提取模型提取所述待处理图纸中图元之间的关系信息;
基于所述图元信息、所述关系信息和预训练的构件识别模型确定各个图元对应的构件名称。
本公开实施例的第二方面提供了一种图纸信息提取装置,该装置包括:
获取模块,用于获取待处理图纸;
第一提取模块,用于基于预训练的图元提取模型从所述待处理图纸中提取图元信息;
第二提取模块,用于基于所述图元信息和预训练的关系提取模型提取所述待处理图纸中图元之间的关系信息;
构件识别模块,用于基于所述图元信息、所述关系信息和预训练的构件识别模型确定各个图元对应的构件名称。
本公开实施例的第三方面提供了一种计算机设备,包括存储器和处理器,以及计算机程序,其中,存储器中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的图纸信息提取方法。
本公开实施例的第四方面提供了一种计算机可读存储介质,存储介质中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的图纸信息提取方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
在本公开实施例提供的图纸信息提取方法、装置、设备及存储介质中,通过获取待处理图纸,基于预训练的图元提取模型从待处理图纸中提取图元信息,基于图元信息和预训练的关系提取模型提取待处理图纸中图元之间的关系信息,基于图元信息、关系信息和预训练的构件识别模型确定各个图元对应的构件名称,能够通过图元提取模型从待处理图纸中提取到图元信息,通过关系提取模型从待处理图纸中提取到图元之间的关系信息,再通过构件识别模型确定各个图元对应的构件名称,实现了对待处理图纸中包含的信息的自动提取,相较于传统的人工提取图纸信息的方式,提高了信息提取的整体速度和准确率,方便后续基于提取得到的图纸信息快速建立准确的三维模型。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种图纸信息提取方法的流程图;
图2是本公开实施例提供的一种图纸信息提取装置的结构示意图;
图3是本公开实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
图1是本公开实施例提供的一种图纸信息提取方法的流程图,该方法可以由一种图纸信息提取装置执行。如图1所示,本实施例提供的图纸信息提取方法包括如下步骤:
S101、获取待处理图纸。
本公开实施例中的待处理图纸可以理解为需要提取结构信息的CAD图纸,示例的,待处理图纸可以是CAD软件对应的格式的图纸,也可以是图像格式的图纸,具体可以为灰度图像或RGB图像,在此不做限定。
本公开实施例中,图纸信息提取装置可以获取需要提取结构信息的待处理图纸。
在本公开实施例的一种示例性的实施方式中,图纸信息提取装置可以获取用户通过预设的图纸上传接口上传的待处理图纸,其中,待处理图纸可以为同一对象的多张图纸,用户在上传待处理图纸时,可以对图纸的图层、视角等信息进行标注。
S102、基于预训练的图元提取模型从待处理图纸中提取图元信息。
本公开实施例中的图元信息可以理解为图元的类型信息,比如线段、弧、圆形等,图元提取模型可以理解为分类模型,用于确定待处理图纸中的图元信息。
本公开实施例中,图纸信息提取装置可以在获得待处理图纸后,将待处理图纸输入预训练的图元提取模型,得到图元提取模型输出的从待处理图纸中提取的图元信息。
S103、基于图元信息和预训练的关系提取模型提取待处理图纸中图元之间的关系信息。
本公开实施例中的关系信息可以包括位置关系信息和数量关系信息,示例的,位置关系信息可以包括连接、邻近、对齐等信息,数量关系信息可以包括距离、角度差异等信息,在此不做限定。
本公开实施例中,图纸信息提取装置可以在得到图元提取模型输出的图元信息后,将图元信息与待处理图纸输入预训练的关系提取模型,得到关系提取模型输出的待处理图纸中各个图元之间的关系信息。
在本公开实施例的一种示例性的实施方式中,图纸信息提取装置可以在得到图元信息后,根据图元信息对待处理图纸进行标注,并将经过标注的待处理图纸输入关系提取模型得到关系信息。
S104、基于图元信息、关系信息和预训练的构件识别模型确定各个图元对应的构件名称。
本公开实施例中的构件名称可以理解为图元所属的结构部件的信息,示例的,构件名称可以为开关、栏杆、台阶等,在此不做限定。
本公开实施例中,图纸信息提取装置可以在得到图元信息和图元之间的关系信息后,将图元信息和图元之间的关系信息输入预训练的构件识别模型,得到构件识别模型输出的待处理图纸中各个图元对应的构件名称,从而方便后续建立三维模型时根据构件名称选择对应的构件模型,在构件模型的基础上进行调整和组合,建立待处理图纸对应的整体的三维模型。
本公开实施例通过获取待处理图纸,基于预训练的图元提取模型从待处理图纸中提取图元信息,基于图元信息和预训练的关系提取模型提取待处理图纸中图元之间的关系信息,基于图元信息、关系信息和预训练的构件识别模型确定各个图元对应的构件名称,能够通过图元提取模型从待处理图纸中提取到图元信息,通过关系提取模型从待处理图纸中提取到图元之间的关系信息,再通过构件识别模型确定各个图元对应的构件名称,实现了对待处理图纸中包含的信息的自动提取,相较于传统的人工提取图纸信息的方式,提高了信息提取的整体速度和准确率,方便后续基于提取得到的图纸信息快速建立准确的三维模型。
在本公开一些实施例中,图元提取模型为深度学习卷积神经网络模型,图元提取模型是基于如下步骤训练得到的:
从预设的建筑图形库中获取建筑图元以及对应的类别信息;
将建筑图元确定为训练数据输入图元提取模型,基于图元提取模型的输出结果以及建筑图元对应的类别信息构建交叉熵损失函数,采用随机梯度下降法对图元提取模型的模型参数进行调整。
具体地,图纸信息提取装置可以从预设的建筑图形库中获取建筑图元和对应的类别信息,将其确定为训练数据对图元提取模型进行训练,其中,建筑图元可以是根据CAD软件中预设的建筑图形得到的,类别信息可以是预先标注的,在训练过程中,将建筑图元输入深度学习卷积神经网络模型,通过前向传播得到模型的输出结果,并将该输出结果与建筑图元对应的类别信息进行比较,使用交叉熵损失函数计算输出结果与真实的类别信息之间的差异,通过反向传播,使用随机梯度下降法更新模型参数,具体可以更新模型的权重和偏置,在损失值满足预设条件后,采用预设的训练数据集对模型性能进行评估,具体可以计算模型的准确度、精确度、召回率等,并在上述指标满足预设条件后,确定图元提取模型训练完毕。
可选的,图元提取模型可以使用AlexNet神经网络的架构,包括卷积层、采样层和全连接层,输入图像多个卷积层和采样层,最后输入到全连接层中获得输出。每个卷积层由多个卷积核组成,每个卷积核在图像上滑动,通过局部的卷积操作,提取特定的特征。卷积层可以多层堆叠,以增加模型的深度和表达能力。其中,卷积层可以使用不同的卷积和对输入图像进行卷积操作,产生特征图,并将修正线性单元(Rectified Linear Unit,ReLU)作为激活函数。在卷积操作过程中,使用卷积和对输入特征图进行滑动窗口计算,每次计算都会得到一个输出值,具体的卷积计算公式如下:
Output[i,j,k]=ReLU(sum(Input[m,n,l]*Kernel[x,y,l,k]+Bias[k]))
其中,Output[i,j,k]表示卷积层输出的特征图的第(i,j,k)个元素,Input[m,n,l]表示上一层的第(m,n,l)个特征图,Kernel[x,y,l,k]表示卷积核的第(x,y,l,k)个元素,Bias[k]表示卷积核的偏置项。
上述公式中,卷积核为四维,有两个空间维度(x,y)、一个输入通道维度l和一个输出通道维度k。卷积操作首先将输入特征图与对应的卷积核进行点乘,然后将所有点乘结果求和并加上对应的偏置项,最后通过ReLU激活函数获得输出特征图的值。
AlexNet中的卷积操作通常会使用较大的卷积核和较大的步幅,这样可以在一定程度上减少特征图的空间尺寸,并增加感受野的大小,从而捕获更丰富的特征信息。通过多层卷积层的堆叠,能够提取图像的多层次特征,从而实现对复杂图像的准确分类和识别。
图元提取模型中,每个卷积层之后可以设置一个池化层,对卷积层输出的特征图进行下采样处理,具体可以采用最大池化的方式,按照固定的窗口大小在输入的特征图上滑动,并在每个窗口内选择最大值作为输出特征图的像素值,以提高模型的性能和鲁棒性,最大池化操作的公式如下:
Output[i,j,k]=max(Input[i*streide):(i*stride+pool_size),(j*stride):(j*stride+pool_size),k])
其中,Output[i,j,k]表示池化层输出的特征图的第(i,j,k)个元素,Input[(i*stride):(i*stride+pool_size),(j*stride):(j*stride+pool_size),k表示输入特征图中的一个池化窗口,stride表示窗口的滑动步幅,pool_size表示池化窗口的大小。
图元提取模型的全连接层负责将卷积层输出的特征进行适当的降维,并输出最终的预测结果。全连接层将池化层的输出连接到一个或多个全连接层。全连接层的节点数根据任务的需要确定。每个节点都与前一层的所有节点连接,并计算加权和。为了防止过拟合,可以在全连接层之间添加Dropout层。Dropout层随机地将一些神经元的输出置零,减少神经元之间的依赖关系,提高模型的泛化能力。在CAD图纸信息获取系统中,可以在全连接层之间添加Dropout层,可以根据实际情况调整Dropout层的比例。
在本公开一些实施例中,图纸信息提取装置可以在从预设的建筑图形库中获取建筑图元以及对应的类别信息之后,对建筑图元进行预处理,预处理包括图像缩放处理、图像归一化处理和图像裁剪处理中的至少一种。
具体地,图纸信息提取装置可以在获得建筑图元后,对建筑图元进行图像缩放处理、图像归一化处理和图像裁剪处理中的至少一种预处理,并将经过预处理的建筑图元输入图元提取模型,从而确保输入图元提取模型的图像具有相同的尺寸和特征表示。
在本公开一些实施例中,关系提取模型为图卷积神经网络模型,关系提取模型包括多尺度卷积层和自适应卷积层,关系提取模型是基于如下步骤训练得到的:
将标注有图元信息的训练样本图纸输入关系提取模型进行监督学习,基于关系提取模型的输出结果以及训练样本图纸中各个图元之间的关系信息,对关系提取模型的模型参数进行调整,其中,多尺度卷积层中不同卷积核对应的权重是基于注意力机制确定的。
其中,多尺度卷积层包含多个并行的卷积分支,每个分支使用不同大小的卷积核,在不同的邻域范围内聚合信息,从而在同一层中捕获不同尺度的特征。自适应卷积层能够根据输入图像的特点,采用注意力机制自动调整卷积核对应的权重。在关系提取模型中,多尺度卷积层输出的特征会输入至自适应卷积层,自适应卷积层根据多尺度卷积层中各个卷积核对应的权重对特征进行加权处理,从而聚合在不同尺度、不同子空间中输入图像的不同特征,增加模型的表达能力。
具体地,图纸信息提取装置可以获取标注有图元信息的训练样本图纸以及训练样本图纸中各个图元之间预先确定的关系信息,将标注有图元信息的训练样本图纸输入图卷积神经网络模型,得到模型的输出结果,根据输出结果与预先确定的各个图元之间的关系信息的差异构建损失函数,调整模型参数以使模型损失值满足预设条件。可选的,关系提取模型的模型验证过程与图元提取模型类似,此处不再赘述。
在本公开一些实施例中,构件识别模型的模型结构可以与关系提取模型相同,均为图卷积神经网络模型,均包括多尺度卷积层和自适应卷积层,但经过训练的构件识别模型与关系提取模型的模型参数不同。
可选的,在构件识别模型的模型结构与关系提取模型相同时,构件识别模型可以是基于如下步骤训练得到的:预先收集有标签的训练数据,训练数据包括图元信息和图元之间的关系信息,标签为图元对应的构件名称,将训练数据输入构件识别模型进行监督学习,基于构件识别模型的输出结果以及图元对应的标签,对构件识别模型的模型参数进行调整,具体可以根据输出结果与图元对应的标签之间的差异构建损失函数,调整模型参数以使模型损失值满足预设条件。其中,多尺度卷积层中不同卷积核对应的权重也是基于注意力机制确定的,构件识别模型的模型验证过程与图元提取模型和关系提取模型类似,此处不再赘述。
在本公开一些实施例中,构件识别模型也可以是图卷积神经网络模型之外的其他多分类模型,比如决策树模型、支持向量机模型等,同样将图元信息和图元之间的关系信息作为训练数据,将预先确定的图元对应的构件名称确定为标签,对模型进行训练,以使模型具备相应的分类能力。
在本公开一些实施例中,图纸信息提取装置可以对待处理图纸进行文本识别处理,得到待处理图纸包含的文本信息。
具体地,图纸信息提取装置可以对待处理图纸中包含的文本进行识别,比如对图纸说明、图例说明等进行识别处理,充分提取待处理图纸中包含的文本信息。
在本公开一些实施例中,图纸信息提取装置可以在对待处理图纸进行文本识别处理,得到待处理图纸包含的文本信息之后,对文本信息进行语义理解处理,结合图元信息、关系信息和构件名称建立待处理图纸对应的三维模型。
具体地,图纸信息提取装置可以在从待处理图纸中识别得到文本信息后,对文本信息进行语义理解处理,得到语义信息,根据语义信息、图元信息、关系信息和各个图元对应的构件名称建立待处理图纸对应的三维模型。
可选的,图纸信息提取装置可以基于预训练的自然语言处理(Natural LanguageProcessing,NLP)模型对文本信息进行语义理解处理,并采用预先编写的建模脚本,根据图元信息和构件名称选择对应的基础组件,根据关系信息对基础组建进行调整和组合,最后根据语义信息对构件的三维模型进行调整,得到待处理图纸对应的三维模型,实现基于CAD二维图纸的自动建模,进一步提高了建模速度和准确率。
图2是本公开实施例提供的一种图纸信息提取装置的结构示意图。如图2所示,该图纸信息提取装置200包括:获取模块210,第一提取模块220,第二提取模块230,构建识别模块240,其中,获取模块210,用于获取待处理图纸;第一提取模块220,用于基于预训练的图元提取模型从所述待处理图纸中提取图元信息;第二提取模块230,用于基于所述图元信息和预训练的关系提取模型提取所述待处理图纸中图元之间的关系信息;构件识别模块240,用于基于所述图元信息、所述关系信息和预训练的构件识别模型确定各个图元对应的构件名称。
可选的,所述图元提取模型为深度学习卷积神经网络模型,所述图纸信息提取装置200还包括第一训练模块,所述第一训练模块,包括:第一获取单元,用于从预设的建筑图形库中获取建筑图元以及对应的类别信息;第一调整单元,用于将所述建筑图元确定为训练数据输入所述图元提取模型,基于所述图元提取模型的输出结果以及所述建筑图元对应的类别信息构建交叉熵损失函数,采用随机梯度下降法对所述图元提取模型的模型参数进行调整。
可选的,所述第一训练模块,还包括:预处理单元,用于对所述建筑图元进行预处理,所述预处理包括图像缩放处理、图像归一化处理和图像裁剪处理中的至少一种。
可选的,所述关系提取模型为图卷积神经网络模型,所述关系提取模型包括多尺度卷积层和自适应卷积层,所述图纸信息提取装置200还包括第二训练模块,所述第二训练模块具体用于:将标注有图元信息的训练样本图纸输入所述关系提取模型进行监督学习,基于所述关系提取模型的输出结果以及所述训练样本图纸中各个图元之间的关系信息,对所述关系提取模型的模型参数进行调整,其中,所述多尺度卷积层中不同卷积核对应的权重是基于注意力机制确定的。
可选的,所述关系信息包括位置关系信息和数量关系信息。
可选的,所述图纸信息提取装置200还包括识别模块,用于对所述待处理图纸进行文本识别处理,得到所述待处理图纸包含的文本信息。
可选的,所述图纸信息提取装置200还包括建立模块,用于对所述文本信息进行语义理解处理,结合所述图元信息、所述关系信息和所述构件名称建立所述待处理图纸对应的三维模型。
本实施例提供的图纸信息提取装置能够执行上述任一实施例所述的方法,其执行方式和有益效果类似,在这里不再赘述。
图3是本公开实施例提供的一种计算机设备的结构示意图。
如图3所示,该计算机设备可以包括处理器310以及存储有计算机程序指令的存储器320。
具体地,上述处理器310可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器320可以包括用于信息或指令的大容量存储器。举例来说而非限制,存储器320可以包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个及其以上这些的组合。在合适的情况下,存储器320可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器320可在综合网关设备的内部或外部。在特定实施例中,存储器320是非易失性固态存储器。在特定实施例中,存储器320包括只读存储器(Read-Only Memory,ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable ROM,PROM)、可擦除PROM(Electrical Programmable ROM,EPROM)、电可擦除PROM(Electrically ErasableProgrammable ROM,EEPROM)、电可改写ROM(Electrically Alterable ROM,EAROM)或闪存,或者两个或及其以上这些的组合。
处理器310通过读取并执行存储器320中存储的计算机程序指令,以执行本公开实施例所提供的图纸信息提取方法的步骤。
在一个示例中,该计算机设备还可包括收发器330和总线340。其中,如图3所示,处理器310、存储器320和收发器330通过总线340连接并完成相互间的通信。
总线340包括硬件、软件或两者。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(ExtendedIndustry Standard Architecture,EISA)总线、前端总线(Front Side BUS,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industrial Standard Architecture,ISA)总线、无限带宽互连、低引脚数(Low Pin Count,LPC)总线、存储器总线、微信道架构(MicroChannel Architecture,MCA)总线、外围控件互连(Peripheral Component Interconnect,PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial Advanced TechnologyAttachment,SATA)总线、视频电子标准协会局部(Video Electronics StandardsAssociation Local Bus,VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线340可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
本公开实施例还提供了一种计算机可读存储介质,该存储介质可以存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现本公开实施例所提供的图纸信息提取方法。
上述的存储介质可以例如包括计算机程序指令的存储器320,上述指令可由图纸信息提取设备的处理器310执行以完成本公开实施例所提供的图纸信息提取方法。可选的,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(Random Access Memory,RAM)、光盘只读存储器(Compact DiscROM,CD-ROM)、磁带、软盘和光数据存储设备等。上述计算机程序可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种图纸信息提取方法,其特征在于,所述方法包括:
获取待处理图纸;
基于预训练的图元提取模型从所述待处理图纸中提取图元信息;
基于所述图元信息和预训练的关系提取模型提取所述待处理图纸中图元之间的关系信息;
基于所述图元信息、所述关系信息和预训练的构件识别模型确定各个图元对应的构件名称。
2.根据权利要求1所述的方法,其特征在于,所述图元提取模型为深度学习卷积神经网络模型,所述图元提取模型是基于如下步骤训练得到的:
从预设的建筑图形库中获取建筑图元以及对应的类别信息;
将所述建筑图元确定为训练数据输入所述图元提取模型,基于所述图元提取模型的输出结果以及所述建筑图元对应的类别信息构建交叉熵损失函数,采用随机梯度下降法对所述图元提取模型的模型参数进行调整。
3.根据权利要求2所述的方法,其特征在于,所述从预设的建筑图形库中获取建筑图元以及对应的类别信息之后,所述方法还包括:
对所述建筑图元进行预处理,所述预处理包括图像缩放处理、图像归一化处理和图像裁剪处理中的至少一种。
4.根据权利要求1所述的方法,其特征在于,所述关系提取模型为图卷积神经网络模型,所述关系提取模型包括多尺度卷积层和自适应卷积层,所述关系提取模型是基于如下步骤训练得到的:
将标注有图元信息的训练样本图纸输入所述关系提取模型进行监督学习,基于所述关系提取模型的输出结果以及所述训练样本图纸中各个图元之间的关系信息,对所述关系提取模型的模型参数进行调整,其中,所述多尺度卷积层中不同卷积核对应的权重是基于注意力机制确定的。
5.根据权利要求1所述的方法,其特征在于,所述关系信息包括位置关系信息和数量关系信息。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述待处理图纸进行文本识别处理,得到所述待处理图纸包含的文本信息。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
对所述文本信息进行语义理解处理,结合所述图元信息、所述关系信息和所述构件名称建立所述待处理图纸对应的三维模型。
8.一种图纸信息提取装置,其特征在于,所述装置包括:
获取模块,用于获取待处理图纸;
第一提取模块,用于基于预训练的图元提取模型从所述待处理图纸中提取图元信息;
第二提取模块,用于基于所述图元信息和预训练的关系提取模型提取所述待处理图纸中图元之间的关系信息;
构件识别模块,用于基于所述图元信息、所述关系信息和预训练的构件识别模型确定各个图元对应的构件名称。
9.一种计算机设备,其特征在于,包括:存储器;处理器;以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-7中任一项所述的图纸信息提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311865009.4A CN118015648A (zh) | 2023-12-29 | 2023-12-29 | 图纸信息提取方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311865009.4A CN118015648A (zh) | 2023-12-29 | 2023-12-29 | 图纸信息提取方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118015648A true CN118015648A (zh) | 2024-05-10 |
Family
ID=90945300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311865009.4A Pending CN118015648A (zh) | 2023-12-29 | 2023-12-29 | 图纸信息提取方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118015648A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517223A (zh) * | 2019-07-11 | 2019-11-29 | 万翼科技有限公司 | 图纸审查方法、装置、计算机设备和存储介质 |
CN114239124A (zh) * | 2022-02-28 | 2022-03-25 | 江西少科智能建造科技有限公司 | 一种建筑图纸构件识别方法、系统、存储介质及设备 |
CN115457591A (zh) * | 2022-09-30 | 2022-12-09 | 国网天津市电力公司 | 一种电网厂站主接线图拓扑关系的识别方法 |
CN117133011A (zh) * | 2023-08-17 | 2023-11-28 | 上海帮图信息科技有限公司 | 一种审查建筑图纸的方法、存储介质和电子设备 |
-
2023
- 2023-12-29 CN CN202311865009.4A patent/CN118015648A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517223A (zh) * | 2019-07-11 | 2019-11-29 | 万翼科技有限公司 | 图纸审查方法、装置、计算机设备和存储介质 |
CN114239124A (zh) * | 2022-02-28 | 2022-03-25 | 江西少科智能建造科技有限公司 | 一种建筑图纸构件识别方法、系统、存储介质及设备 |
CN115457591A (zh) * | 2022-09-30 | 2022-12-09 | 国网天津市电力公司 | 一种电网厂站主接线图拓扑关系的识别方法 |
CN117133011A (zh) * | 2023-08-17 | 2023-11-28 | 上海帮图信息科技有限公司 | 一种审查建筑图纸的方法、存储介质和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110245659B (zh) | 基于前背景相互关系的图像显著对象分割方法及装置 | |
CN109522942B (zh) | 一种图像分类方法、装置、终端设备和存储介质 | |
CN111814810A (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN108763325A (zh) | 一种网络对象处理方法及装置 | |
CN108021806B (zh) | 一种恶意安装包的识别方法和装置 | |
CN110135505B (zh) | 图像分类方法、装置、计算机设备及计算机可读存储介质 | |
CN110148117B (zh) | 基于电力图像的电力设备缺陷识别方法、装置与存储介质 | |
CN109753996B (zh) | 基于三维轻量化深度网络的高光谱图像分类方法 | |
CN107516102B (zh) | 图像数据分类与建立分类模型方法、装置及系统 | |
EP4145345A1 (en) | Data annotation method and device, and fine granularity identification method and device | |
CN113111716B (zh) | 一种基于深度学习的遥感影像半自动标注方法和装置 | |
CN112001403A (zh) | 一种图像轮廓检测方法及系统 | |
CN116416416A (zh) | 虚拟试衣模型的训练方法、虚拟试衣方法及电子设备 | |
CN114861842B (zh) | 少样本目标检测方法、装置和电子设备 | |
CN113011532A (zh) | 分类模型训练方法、装置、计算设备及存储介质 | |
CN112884147A (zh) | 神经网络训练方法、图像处理方法、装置及电子设备 | |
CN113920147B (zh) | 基于深度学习的遥感影像建筑物提取方法及设备 | |
CN113284122B (zh) | 基于深度学习的卷纸包装缺陷检测方法、装置及存储介质 | |
CN111144425A (zh) | 检测拍屏图片的方法、装置、电子设备及存储介质 | |
CN110866552B (zh) | 基于全卷积空间传播网络的高光谱图像分类方法 | |
CN110889290B (zh) | 文本编码方法和设备、文本编码有效性检验方法和设备 | |
CN109558883B (zh) | 叶片特征提取方法及装置 | |
CN116503670A (zh) | 图像分类及模型训练方法、装置和设备、存储介质 | |
CN118015648A (zh) | 图纸信息提取方法、装置、设备及存储介质 | |
CN115984671A (zh) | 模型在线更新方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |