CN116740750A

CN116740750A - 一种基于工程图纸的尺寸信息识别的重构方法及装置

Info

Publication number: CN116740750A
Application number: CN202310791979.8A
Authority: CN
Inventors: 王海楠; 唐一铭; 黄祥; 汤文娟; 顾徐; 杜彪; 王浩羽; 霍丹江
Original assignee: Jiangsu Fangtian Power Technology Co Ltd
Current assignee: Jiangsu Fangtian Power Technology Co Ltd
Priority date: 2023-06-30
Filing date: 2023-06-30
Publication date: 2023-09-12

Abstract

本发明公开了一种基于工程图纸的尺寸信息识别的重构方法及装置，对矢量化后的的扫描工程图纸作字符分离，再组合成完整的标注字符串，合并为标注文本区域；对标注文本区域作字符识别，对字符识别后的得到的结果进行清洗预处理，得到清洗后的候选尺寸数字集；进行解析、定位、提取，并去除杂质线段，分析和处理不同类型直线及其组合，输出起始与终点坐标信息；确定工程图纸中尺寸结构的尺寸信息；利用所述工程图纸中尺寸结构的尺寸信息进行矢量化图纸到二维翻模图纸的转化的坐标重建，得到真实坐标系统下完整的二维工程图。优点：不仅提高了尺寸结构信息提取的准确率，还给出一种基于整体的尺寸重建方法，使尺寸标注与图形保持严格一致。

Description

一种基于工程图纸的尺寸信息识别的重构方法及装置

技术领域

本发明涉及一种基于工程图纸的尺寸信息识别的重构方法及装置，属于工程图矢量化技术领域。

背景技术

工程图矢量化是将工程图的扫描位图表达转化为可供CAD系统使用的包括线条、字符串的几何表示及编码表示的图形描述的过程。工程图的几何信息表达产品的结构形状，而各部分的大小和相对位置则通过尺寸标注来确定。尺寸标注系统无论是在传统的手绘图纸还是在现今已经普遍使用的CAD系统中都是最重要的组成元素之一。它正确反映了形体的几何性质和逻辑关系，包括位置、大小以及形体之间的约束等信息，是目前参数化设计领域研究的热点。因此，如何以尺寸信息为研究对象进行修改、重用便成为了一个重要的问题。

尺寸结构提取是从位图中在直线识别和字符串识别的基础上，找出属于同一尺寸结构的部分，并对其坐标转化，以方便后续工程图三维提取的工作。它是正确理解工程图的基础。尺寸结构提取是工程图矢量化过程中一个重要的也是比较难处理的一个环节。导致尺寸结构难以准确提取的原因主要是直线和字符串的方向复杂性和扫描工程图的位图内容的复杂性。工程图纸的扫描位图中会含有很多噪音及退化现象，从而影响箭头的识别；另外，字线粘连、字字粘连等现象严重影响尺寸数字的识别。与此同时，尺寸重建是指在识别尺寸之后，调整尺寸标注与被标识图形对象的关系使之保持一致的工作，即：如将矢量化结果输入CAD系统中重新对尺寸标识对象进行自动标注尺寸，会得到同样的尺寸数字。矢量化处理后的图纸在引入CAD系统进一步使用前，必须经过尺寸重建才能保证与CAD系统所用的尺寸标注系统相一致。因此，尺寸重建对工程图的复用具有重要意义。

发明内容

本发明所要解决的技术问题是克服现有技术的缺陷，提供一种基于工程图纸的尺寸信息识别的重构方法及装置。

为解决上述技术问题，本发明提供一种基于工程图纸的尺寸信息识别的重构方法，包括：

步骤1，获取矢量化后的扫描工程图纸，对矢量化后的的扫描工程图纸，作字符分离，将分离出来的字符组合成完整的标注字符串，并合并为标注文本区域；

步骤2，对所述标注文本区域作字符识别，对字符识别后的得到的结果进行清洗预处理，得到清洗后的候选尺寸数字集；

步骤3，基于矢量化后的扫描工程图纸对直线以及相关联的图元信息进行解析、定位、提取，并去除杂质线段，分析和处理不同类型直线及其组合，输出起始与终点坐标信息；

步骤4，以步骤2中得到的候选尺寸数字集中的候选尺寸数字出发，结合所述不同类型直线的起始与终点坐标信息，利用图元与标注信息之间的逻辑联系，确定工程图纸中尺寸结构的尺寸信息；

步骤5，利用所述工程图纸中尺寸结构的尺寸信息进行矢量化图纸到二维翻模图纸的转化的坐标重建，得到真实坐标系统下完整的二维工程图。

进一步的，所述获取矢量化后的扫描工程图纸，对矢量化后的的扫描工程图纸，作字符分离，包括：

读取原始扫描工程图，并对原始扫描工程图矢量化处理，得到矢量化后的扫描图纸；

对矢量化后的扫描图纸中每个像素P遍历其八邻域像素，通过预先设定的图像邻域值判断像素的轮廓线；

根据所述判断的结果，对矢量化后的扫描图纸自上而下、自左向右进行轮廓线跟踪，获得每个连通体的轮廓，建立字符区域候选；

建立字符区域候选的上下限阈值将字符区域分离出来。

进一步的，所述获取矢量化后的扫描工程图纸，所述图像邻域值为：

其中，NC表示图像邻域值，i表示方向，n_i表示黑白像素，n_i＝1或0，若第i个方向对应的像素为黑像素，则n_i=1；若第i个方向对应的像素为白像素，则n_i＝0。

进一步的，所述获取矢量化后的扫描工程图纸，所述步骤2，包括：

步骤2-1，搭建改进的卷积神经网络Lenet-5，利用所述改进的卷积神经网络Lenet-5参照BP算法对预先获取的历史工程图纸数据集中的训练图片进行预训练，得到预训练好的卷积神经网络Lenet-5模型；

步骤2-2，使用预训练好的改进的卷积神经网络Lenet-5模型，输入所述标注文本区域，输出识别出的工图光学字符识别结果O；

步骤2-3，对结果O进行数据清洗，去除其中的文字类字符串，文字数字夹杂字符串，带标点符号字符串吗，只保留大于阈值δ的正整数字符串，输出清洗后的候选尺寸数字集S。

进一步的，所述获取矢量化后的扫描工程图纸，所述搭建改进的卷积神经网络Lenet-5的激活函数，包括：

获取原始卷积神经网络Lenet-5；

对所述原始卷积神经网络Lenet-5进行如下改动，包括：

将所述原始卷积神经网络Lenet-5的Sigmoid激活函数替换为Leaky-ReLU-Tanh激活函数；将所述原始卷积神经网络Lenet-5的特征下采样池化改为随机子抽样池化；

在卷积层连接方式上进行如下优化；学习阶段引入改进的Dropout算法，对于每个训练批次，随机生成一个与网络中每个神经元相对应的二进制向量，其中每个元素都有p的概率设置为1，(1-p)的概率设置为0，p是一个超参数；将随机生成的二进制向量与每个神经元的输出相乘，将使一些神经元的输出为零，并且其余神经元的输出将按比例缩小；进行反向传播时，只更新未被失活的神经元的权重。

进一步的，所述步骤3，包括：

步骤3-1，读取图元矢量化之后所有图元的坐标，取由直线组构成的图元，所述直线组构成的图元分为：带有箭头的直线组和没有箭头的直线组，所述带有箭头的直线组分为水平方向直线、垂直方向直线、倾斜直线和带有水平线的折现；

步骤3-2，读取带有箭头的直线组的起始坐标、终点坐标和一个直线组上任意点坐标，组成三点坐标，交换三点坐标的顺序，使得直线组坐标满足直观上从左至右读入顺序，规定旋转方向为顺时针方向；

步骤3-3，根据三点坐标判断直线组是否为带有水平线的折线，若为折线，则找出其中水平方向的线段l₁，记为类型T₁；若为直线，则记为线段l₂，计算线段l₂的倾角θ，记为类型T₂；

重复步骤3-3直至遍历所有带有箭头的直线组，输出起始坐标、终点坐标及类型标记。

进一步的，所述步骤3-3中，

处理类型T₁时，按照水平方向的线段l₁的长度、为高度h，自水平方向向上截取子图，同时去除线段l₁，以免对字符串识别造成影响。；

处理类型T₂时，以线段l₂上方为正方向，取线段l₂中垂线的正方向延伸h后得到坐标点(C₁,C₂)，截取通过线段l₂起点、终点和(C₁,C₂)的矩形子图，将矩形子图顺时针旋转θ度，到水平方向。

进一步的，所述步骤4，包括：

步骤4-1，从候选尺寸数字集S中选一个未匹配的尺寸数字s的字符图像区域r，进入步骤4-2；

步骤4-2，通过所述字符图像区域r的边框坐标(x₁,y₁)与(x₂,y₂)确定字符方向，若x₁＜x₂且y₁＜y₂，则标记方向d为0，表示工程图纸底部尺寸数字；若x₁＜x₂且y₁＞y₂，则标记方向d为1，表示工程图纸右部尺寸数字；若x₁＞x₂且y₁＞y₂，则标记方向d为2，表示工程图纸上部尺寸数字；若x₁＞x₂且y₁＜y₂，则标记方向d为3，表示工程图纸左部尺寸数字；进入步骤4-3；

步骤4-3，若d＝0，向下查找最近直线；若d＝1，向右查找最近直线；若d＝2，向上查找最近直线；若d＝3，向上查找最近直线；记录直线矢量P＝(x₁,y1,x2,y1)，表示直线P的起点与终点坐标；进入步骤4-4；

步骤4-4，沿尺寸数字s方向d同侧查找相邻尺寸数字，得到相邻尺寸数字集S′，S′＝{s₁,s₂,…,s_n}；若沿方向d顺时针旋转90°和逆时针旋转90°方向分别查找与直线P相交且距离s最近的直线，标记为尺寸界线Q₁、Q₂；若/>沿方向d顺时针旋转90°和逆时针旋转90°方向分别查找与直线P相交且距离s最远的直线，标记为尺寸界线Q₁、Q₂，记录直线Q₁，Q₂的起点与终点坐标；转入步骤4-5；

步骤4-5，重复步骤4-1至4-5，直到候选尺寸数字集S中的所有尺寸数字s均查找到了对应的尺寸线H以及尺寸界线Q₁,Q₂，输出完整的尺寸结构信息A，A＝[s,H,Q₁,Q₂]。

进一步的，所述步骤4-4中，

工程图纸中的尺寸线和尺寸界线基本垂直，因此需要判断两条垂直线段是否相交，具体包括：

若P₁P₂跨立Q₁Q₂，则矢量(P₁-Q₁)和(P₂-Q₁)位于矢量(Q₂-Q₁)的两侧，即(P₁-Q₁)×(Q₂-Q₁)*P₂-Q₁)×(Q₂-Q₁)＜0上式可改写成(P₁-Q₁)×(Q₂-Q₁)*Q₂-Q₁)×(P₂-Q₁)＞0当(P₁-Q₁)×(Q₂-Q₁)＝0时，说明(P₁-Q₁)和(Q₂-Q₁)共线；同理，(Q₂-Q₁)×(P₂-Q₁)＝0说明P₂一定在线段Q₁Q₂上；所以判断P₁P₂跨立Q₁Q₂的依据是：(P₁-Q₁)×(Q₂-Q₁)*Q₂-Q₁)×(P₂-Q₁)≥0；其中*表示数量乘法，×表示矢量乘法。

进一步的，所述步骤5，包括：

步骤5-1，在矢量化后的扫描工程图纸中建立坐标网格，具体包括：建立一系列与坐标轴平行的直线，这些直线穿过工程图中存在尺寸标识的几何对象的顶点，并与相应的尺寸标识界线重合；将几何对象用一组坐标点表示，每个坐标点包含X和Y两个坐标变量，得到一个坐标图谱；转入步骤5-2；

步骤5-2，在坐标图谱的基础上建立网格关联图，并把所有通过尺寸标识直接或间接关联在一起的几何单元，网格关联图上的网格线所组成的集合称为关联网格线集，其中，所述关联图是一个无向图，关联图的每个顶点对应于一条网格线，关联图的每条边对应于一个尺寸标识，该尺寸标识同时关联于该边两端点所对应的网格线；对网格关联图中的所有边进行深度优先遍历，从而对关联网格线集递归地调整坐标网格位置，使其满足尺寸约束；转入步骤5-3；

步骤5-3，对每一个几何对象，从其关联的网格线上取得定义点的坐标，再由这些定义点重建对象的几何表示，最终输出真实坐标系统下完整的二维工程图。

进一步的，所述工程图纸为CAD工程图纸。

一种基于工程图纸的尺寸信息识别的重构装置，包括：

获取模块，用于获取矢量化后的扫描工程图纸，对矢量化后的的扫描工程图纸，作字符分离，将分离出来的字符组合成完整的标注字符串，并合并为标注文本区域；

预处理模块，用于对所述标注文本区域作字符识别，对字符识别后的得到的结果进行清洗预处理，得到清洗后的候选尺寸数字集；

处理模块，用于基于矢量化后的扫描工程图纸对直线以及相关联的图元信息进行解析、定位、提取，并去除杂质线段，分析和处理不同类型直线及其组合，输出起始与终点坐标信息；

确定模块，用于以所述候选尺寸数字集中的候选尺寸数字出发，结合所述不同类型直线的起始与终点坐标信息，利用图元与标注信息之间的逻辑联系，确定工程图纸中尺寸结构的尺寸信息；

重构模块，用于利用所述工程图纸中尺寸结构的尺寸信息进行矢量化图纸到二维翻模图纸的转化的坐标重建，得到真实坐标系统下完整的二维工程图。

一种存储一个或多个程序的计算机可读存储介质，所述一个或多个程序包括指令，所述指令当由计算设备执行时，使得所述计算设备执行所述的方法中的任一方法。

一种计算机设备，包括，

一个或多个处理器、存储器以及一个或多个程序，其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序包括用于执行所述的方法中的任一方法的指令。

本发明所达到的有益效果：

本发明通过对工程图纸进行一体式的字符分离与识别，直线提取，在不增大计算资源成本的情况下，不仅提高了尺寸结构信息提取的准确率，还给出一种基于整体的尺寸重建方法，使尺寸标注与图形保持严格一致。

附图说明

图1是本发明的流程示意图；

图2是图纸中不同直线组合是否通过跨立实验的示意图；

图3(a)是扫描原图，图3(b)是由标注文本区域出发搜索得到尺寸线示意图，图3(c)是尺寸界线示意图，图3(d)是(b)和(c)组合后的尺寸结构示意图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

如图1所示，本发明公开了一种基于工程图纸的尺寸信息识别方法，具体方法包括如下步骤：

步骤1，针对矢量化后的扫描图纸，作字符分离，将分离出来的字符组合成完整的标注字符串，进一步合并为标注文本区域，作为后续文本区域出发的尺寸标注几何重建的出发点，并转入步骤2；

步骤2，在步骤1对分离出的文本区域作字符识别，并去除干扰因素的文本数据进行清洗预处理，并将预处理的结果作为待选的尺寸数字输出保存；

步骤3，基于工程图纸信息对直线以及相关联的图元信息进行解析、定位、提取，并去除杂质线段，输出直线的起始与终点坐标作为结果保存；

步骤4，以步骤2中得到的结果出发，结合步骤3得到的直线信息，利用图元与标注信息之间的逻辑联系，实现工程图纸中尺寸结构的定位与提取；

步骤5，利用步骤4中输出的尺寸信息重建坐标，实现矢量化图纸到二维翻模图纸的转化，将得到的可实际利用工程图纸图元与坐标信息作为结果保存输出。

优选的，步骤1包括：

步骤1-1，读取原始CAD扫描工程图，并对数据矢量化；

步骤1-2，对每个像素P遍历其八邻域像素，通过定义邻域值判断像素的轮廓线；

设定的图像邻域值为：

其中，若第i个方向对应的像素为黑像素(前景像素)，则n_i＝1；为白像素(背景像素)则n_i=0.可以看出，若NC=255，则像素P为内点；若NC＝0，则P为噪音点，删除；轮廓线上的点NC值则介于二者之间；

步骤1-3，对扫描图自上而下、自左向右进行轮廓线跟踪，获得每个连通体的轮廓，建立字符区域候选；

步骤1-4，利用小尺寸的特征(尺寸数字一般像素值较固定的特征)建立字符区域的上下限阈值将字符区域分离出来。

步骤2包括：

步骤2-1，搭建Lenet-5网络，首层为卷积层；第二层为下采样层，包括池化层和激活函数算法。池化层采用随即子抽样池化，激活函数采用Leaky-ReLU-Tanh算法；第三层为卷积层；第四层为下采样层；第五层为卷积层；第六层为全连接层；将所述原始卷积神经网络Lenet-5的特征下采样池化改为随机子抽样池化；在卷积层连接方式上进行了优化：学习阶段引入了改进的Dropout算法，对于每个训练批次，随机生成一个与网络中每个神经元相对应的二进制向量，其中每个元素都有p的概率设置为1，(1-p)的概率设置为0。p是一个超参数，通常设置为0.5。将随机生成的二进制向量与每个神经元的输出相乘。这将使一些神经元的输出为零，并且其余神经元的输出将按比例缩小。进行反向传播时，只更新未被失活的神经元的权重。从而减少过拟合，增强训练网络的鲁棒性，也提高了运算效率。

步骤2-2，对工程图纸光学字符数据集做预训练来优化步骤2-1搭建的神经网络参数，参照BP算法，第一个阶段为正向传播。从先前的样本集中获得一个类字符(X,Y_P)，其中X为样本的输入，Y_P为样本的目标理想输出，将样本X输入到正向网络中。计算样本X的实际输出。输入样本X传入到网络中经过逐层的转换最终将参数传到输出层，网络完成每层的权值矩阵相乘，最后得到实际的输出O_P。第二阶段为反向传播阶段。计算训练后的值O_P与相对样本预期值Y_P的偏差。遵照极小误差法对参数矩阵进行反向调节，训练最终参数，将网络训练到相对稳定为止；

步骤2-3，使用预训练好的模型M，输入步骤1的结果，输出识别出的工图光学字符识别结果O＝[[x_i1,y_i1,x_i2,y_i2,x_i3,y_i3,x_i4,y_i4,′str_i′,pr_i]]；

步骤2-4，对结果O进行数据清洗，去除其中的文字类字符串，文字数字夹杂字符串，带标点符号字符串；只保留大于阈值δ的正整数字符串。输出清洗后的候选尺寸数字集S。

步骤3包括：

步骤3-1，读取图元矢量化之后所有图元的坐标。矢量化之后的图元由各种几何体组成。仅取其中由直线组构成的图元，直线组构成的图元分为：有箭头的直线组和没有箭头的直线组。带有箭头的直线组又可以细分为水平方向直线，垂直方向直线，倾斜直线和带有水平线的折现，输出图元坐标；

步骤3-2，读取带有箭头的直线组的起始坐标，终点坐标和一个直线组上任意点坐标。交换三个坐标的顺序，使得直线组坐标满足直观上从左至右读入顺序，规定旋转方向为顺时针方向；

步骤3-3，根据3点坐标判断直线组是否为带有水平线的折线。若为折线，则找出其中水平方向的线段l₁，记为类型T₁；若为直线组(即为直线)，则记为线段l₂，计算线段l₂的倾角θ，记为类型T₂；

处理类型T₁时，按照水平方向的线段l₁的长度、高度h，自水平方向向上截取子图，同时去除线段l₁，以免对字符串识别造成影响；

处理类型T₂时，以线段l₂上方为正方向，取线段l₂中垂线的正方向延伸h后得到坐标点(C₁,C₂)，截取通过线段l₂起点、终点和(C₁,C₂)的矩形子图，将矩形子图顺时针旋转θ度，到水平方向；

步骤3-4，重复步骤3-3直至遍历所有带有箭头的直线组。

步骤4包括：

步骤4-1，从候选尺寸数字集S中选一个未匹配的尺寸数字s的字符图像区域r，

步骤4-2，通过字符图像区域边框坐标(x₁,y₁)与(x₂,y₂)确定字符方向，若x₁＜x₂且y₁＜y₂，则标记方向d为0，表示工程图纸底部尺寸数字；若x₁<x₂且y₁>y₂，则标记方向d为1，表示工程图纸右部尺寸数字；若x₁＞x₂且y₁＞y₂，则标记方向d为2，表示工程图纸上部尺寸数字；若x₁＞x₂且y₁＜y₂，则标记方向d为3，表示工程图纸左部尺寸数字；

步骤4-3，若d＝0，向下查找最近直线；若d＝1，向右查找最近直线；若d＝2，向上查找最近直线；若d＝3，向上查找最近直线；记录直线矢量P＝(x₁,y1,x2,y1)，表示直线P的起点与终点坐标；

步骤4-4，沿尺寸数字s方向d同侧查找相邻尺寸数字S′＝{s₁,s₂,…,s_n}。若S′≠,沿方向d顺时针旋转90°和逆时针旋转90°方向分别查找与P相交且距离s最近的直线，标记为尺寸界线Q₁，Q₂。若S′＝,沿方向d顺时针旋转90°和逆时针旋转90°方向分别查找与P相交且距离s最远的直线，标记为尺寸界线Q₁，Q₂。记录直线Q₁，Q₂的起点与终点坐标；

步骤4-5，重复步骤4-1至4-5，直到候选尺寸数字集S中的所有尺寸数字s均查找到了对应的尺寸线H，以及尺寸界线Q₁,Q₂。如图3(a)、图3(b)、图3(c)和图3(d)所示，将以上信息拼接在一起，输出完整的尺寸结构信息A＝[s,H,Q₁,Q₂]。

所述步骤4-4中，

如图2所示，工程图纸中的尺寸线和尺寸界线基本垂直，因此需要判断两条垂直线段是否相交，具体包括：

若P₁P₂跨立Q₁Q₂，则矢量(P₁-Q₁)和(P₂-Q₁)位于矢量(Q₂-Q₁)的两侧，即(P₁-Q₁)×(Q₂-Q₁)*P₂-Q₁)×(Q₂-Q₁)＜0上式可改写成(P₁-Q₁)×

(Q₂-Q₁)*Q₂-Q₁)×(P₂-Q₁)＞0当(P₁-Q₁)×(Q₂-Q₁)＝0时，说明(P₁-Q₁)和(Q₂-Q₁)共线；同理，(Q₂-Q₁)×(P₂-Q₁)＝0说明P₂一定在线段Q₁Q₂上；所以判断P₁P₂跨立Q₁Q₂的依据是：(P₁-Q₁)×(Q₂-Q₁)*Q₂-Q₁)×(P₂-Q₁)≥0；其中*表示数量乘法，×表示矢量乘法。

步骤5包括：

步骤5-1，在工程图纸中建立坐标网格，即一系列与坐标轴平行的直线，这些直线穿过工程图中存在尺寸标识的几何对象的顶点，并与相应的尺寸标识界线重合。网格线逻辑上代表了实际几何对象的坐标位置，将几何对象用一组坐标点表示，每个坐标点包含X和Y两个坐标变量；

步骤5-2，根据尺寸线的方向将长度型尺寸标识分为水平D_H,垂直D_V和倾斜D_O三个集合；

步骤5-3，对D_H中的每一尺寸标识d的每一条尺寸界线w，在G_V中寻找与w间距小于阈值ε的网格线g。如果找不到g，则在w位置创建一条新的网格线g，并将其加入到G_V中；

步骤5-4，将d加入网格线g的尺寸标识集合中；

步骤5-5，建立网格关联图，并把所有通过尺寸标识直接或间接关联在一起的网格线所组成的集合称为关联网格线集BGS(bound grid set)。对网格关联图中的所有边进行深度优先遍历，从而对关联网格线集递归地调整坐标网格位置，使其满足尺寸约束；

步骤5-6，对每一个几何对象，从其关联的网格线上取得定义点的坐标，再由这些定义点重建对象的几何表示，最终输出真实坐标系统下完整的二维工程图。

相应的本发明还提供一种基于工程图纸的尺寸信息识别的重构装置，包括：

相应的本发明还提供一种存储一个或多个程序的计算机可读存储介质，所述一个或多个程序包括指令，所述指令当由计算设备执行时，使得所述计算设备执行所述的方法中的任一方法。

相应的本发明还提供一种计算机设备，包括，

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于工程图纸的尺寸信息识别的重构方法，其特征在于，包括：

2.根据权利要求1所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述获取矢量化后的扫描工程图纸，对矢量化后的的扫描工程图纸，作字符分离，包括：

建立字符区域候选的上下限阈值将字符区域分离出来。

3.根据权利要求2所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述获取矢量化后的扫描工程图纸，所述图像邻域值为：

其中，NC表示图像邻域值，i表示方向，n_i表示黑白像素，n_i＝1或0，若第i个方向对应的像素为黑像素，则n_i＝1；若第i个方向对应的像素为白像素，则n_i＝0。

4.根据权利要求1所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述获取矢量化后的扫描工程图纸，所述步骤2，包括：

5.根据权利要求4所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述获取矢量化后的扫描工程图纸，所述搭建改进的卷积神经网络Lenet-5的激活函数，包括：

获取原始卷积神经网络Lenet-5；

对所述原始卷积神经网络Lenet-5进行如下改动，包括：

6.根据权利要求1所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述步骤3，包括：

7.根据权利要求7所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述步骤3-3中，

8.根据权利要求1所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述步骤4，包括：

步骤4-3，若d＝0，向下查找最近直线；若d＝1，向右查找最近直线；若d＝2，向上查找最近直线；若d＝3，向上查找最近直线；记录直线矢量P(x₁,y1,x2,y1，表示直线P的起点与终点坐标；进入步骤4-4；

9.根据权利要求8所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述步骤4-4中，

工程图纸中的尺寸线和尺寸界线基本垂直，因此需要判断两条垂直线段是否相交。如图2所示，对线段进行跨立实验，具体包括：

10.根据权利要求1所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述步骤5，包括：

11.根据权利要求1所述的基于工程图纸的尺寸信息识别的重构方法，其特征在于，所述工程图纸为CAD工程图纸。

12.一种基于工程图纸的尺寸信息识别的重构装置，其特征在于，包括：

13.一种存储一个或多个程序的计算机可读存储介质，其特征在于，所述一个或多个程序包括指令，所述指令当由计算设备执行时，使得所述计算设备执行根据权利要求1至11所述的方法中的任一方法。

14.一种计算机设备，其特征在于，包括，

一个或多个处理器、存储器以及一个或多个程序，其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序包括用于执行根据权利要求1至11所述的方法中的任一方法的指令。