CN113065475A - 一种cad图例快速精准识别方法 - Google Patents

一种cad图例快速精准识别方法 Download PDF

Info

Publication number
CN113065475A
CN113065475A CN202110376232.7A CN202110376232A CN113065475A CN 113065475 A CN113065475 A CN 113065475A CN 202110376232 A CN202110376232 A CN 202110376232A CN 113065475 A CN113065475 A CN 113065475A
Authority
CN
China
Prior art keywords
cad
legend
standard
feature vector
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110376232.7A
Other languages
English (en)
Other versions
CN113065475B (zh
Inventor
贺柏忠
吴旻晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xiaocai Technology Co ltd
Original Assignee
Shanghai Xiaocai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xiaocai Technology Co ltd filed Critical Shanghai Xiaocai Technology Co ltd
Priority to CN202110376232.7A priority Critical patent/CN113065475B/zh
Publication of CN113065475A publication Critical patent/CN113065475A/zh
Application granted granted Critical
Publication of CN113065475B publication Critical patent/CN113065475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/422Technical drawings; Geographical maps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明公开了一种CAD图例快速精准识别方法。此种CAD图例快速精准识别方法包括:获取CAD图块;将该CAD图块模板化,得到CAD图块的几何特征向量和文本特征向量;将经模板化的CAD图块与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较,其中,该特征模板数据包括几何特征向量项数据和文本特征向量项数据;基于比较的结果,识别与CAD图块对应的标准CAD图例。

Description

一种CAD图例快速精准识别方法
技术领域
本申请总体上涉及计算机辅助设计(CAD)图形领域,并且具体地涉及基于标准的CAD图例特征模板来实现对CAD图例的快速精准识别的方法。
背景技术
图纸是工程师的语言,CAD图例作为图形符号,以图形为主要特征,是图纸中非常重要的基本元素,用以传递不依赖语言的某种信息,表达一定事物或概念,广泛应用在社会生产和生活的各个领域,涉及到各个部门、各个行业。我国从60年代初就开始制定覆盖各个行业或各个专业的图例符号标准,并通过颁布各类制图规范、标准图集的方式不断更新和完善,因此正确识别和掌握标准CAD图例是所有工程师或相关从业人员必备的基本技能。
标准CAD图例数量有近万个,结构相对规范简单(主要由直线段、圆/圆弧、填充、文字、箭头等组成),部分存在很高的相似性,并且在CAD图纸中以图块实体的方式体现。常规的CAD图例识别方法通常直接对CAD图纸进行扫描,并提取其中CAD图块的结构元素、各元素的端点/交点坐标、长度/角度、文字等矢量数据来表征其中的CAD图元,由此达到识图的目的。然而,由于每张CAD图纸比例、视图、翻转、坐标等因素不一致,并且工程人员制图的水平或习惯不同,不同CAD图纸中的CAD图例的结构和几何形状往往会存在一定的变形。这造成对CAD图纸中各CAD图块的识别率和效率很低并且稳健性很差。
因此,需要建立一套标准的CAD图例特征模板,以此类CAD图例特征模板为基础构建标准CAD图例数据库,并基于CAD图例特征模板对CAD图块进行特征提取和模板化,由此实现对CAD图例的快速精准识别。
发明内容
发明人通过对标准CAD图例的特征进行分析和研究,提出了一种CAD图例快速精准识别方法。本发明基于CAD图例的几何特征和文本特征建立一套标准的CAD图例特征模板;对标准CAD图例进行特征提取,依照所述标准的CAD图例特征模板建立标准CAD图例数据库;并且由此,依照所述标准的CAD图例特征模板对CAD图纸中的图块进行处理,并将其与标准图例数据库中的数据进行比较,从而能够实现对CAD图纸中CAD图例的快速精确识别。
在示例1中,本发明公开了一种CAD图例识别方法,所述方法包括:获取CAD图块;将所述CAD图块模板化,得到所述CAD图块的几何特征向量和所述CAD图块的文本特征向量;将经模板化的CAD图块与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较,其中,所述特征模板数据包括几何特征向量项数据和文本特征向量项数据;基于所述比较的结果,识别与所述CAD图块对应的标准CAD图例。
示例2是如示例1所述的方法,其中,对CAD图块模板化包括:对所述CAD图块进行预处理;提取所述CAD图块的结构元素,并对所述结构元素进行分类;基于所述结构元素的位置,将所述CAD图块划分为弹性网格;对所述结构元素进行计数,以获得每个弹性网格内属于每种结构元素类别的结构元素的数量;以及基于所述弹性网格、所述结构元素的类别以及所述每个弹性网格内属于每种结构元素类别的结构元素的数量,建立所述CAD图块的几何特征向量。
示例3是如示例2所述的方法,其中,将所述CAD图块模板化进一步包括:对所述CAD图块进行预处理;提取所述CAD图块所包含的文字或字符元素;以及基于所述文字或字符元素,建立所述CAD图块的文本特征向量。
示例4是如示例1所述的方法,其中,将经模板化的CAD图块与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较包括:从经模板化的CAD图块提取所述CAD图块的几何特征向量和文本特征向量,并且从所述标准CAD图例数据库提取所述标准CAD图例的几何特征向量项数据和文本特征向量项数据;计算所述CAD图块的几何特征向量与所述标准CAD图例的几何特征向量项数据之间的第一欧式距离;如果所述第一欧式距离为零,则将所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据进行字符串比较;如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据相同,则将所述CAD图块识别为所述标准CAD图例,并且显示所述标准CAD图例的名称属性;以及如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据不相同,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
示例5是如示例4所述的方法,其中,将经模板化的CAD图块与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较进一步包括如果所述第一欧式距离不为零,则对所述CAD图块进行仿射变换,得到经变换的CAD图块;将所述经变换的CAD图块模板化,得到所述经变换的CAD图块的几何特征向量;计算所述经变换的CAD图块的几何特征向量与所述标准CAD图例的几何特征向量项数据之间的第二欧式距离;如果所述第二欧式距离为零,则将所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据进行字符串比较;如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据相同,则将所述CAD图块识别为所述标准CAD图例,并且显示所述标准CAD图例的名称属性;以及如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据不相同,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
示例6是如示例5所述的方法,其中,将经模板化的CAD图块与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较进一步包括:如果所述第二欧式距离不为零,则将所述CAD图块的几何特征向量与所述标准CAD图例的几何特征向量项数据进行余弦相似度比较,得到第一余弦相似度值;如果所述第一余弦相似度值大于或等于第一余弦相似度阈值,则将所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据进行字符串比较;如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据相同,则将所述CAD图块识别为所述标准CAD图例,并且显示所述标准CAD图例的名称属性;以及如果所述CAD图块的文本特征向量项数据与所述标准CAD图例的文本特征向量项数据不相同,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
示例7是如示例6所述的方法,其中,将经模板化的CAD图块与标准CAD图例库中的标准CAD图例的特征模板数据进行比较进一步包括:如果所述第一余弦相似度值小于所述第一余弦相似度阈值且大于或等于第二余弦相似度阈值,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似,其中,所述第二余弦相似度阈值低于所述第一余弦相似度阈值。
示例8是如示例7所述的方法,其中,将所述CAD图块的特征模板与标准CAD图例库中的标准CAD图例的特征模板进行比较进一步包括:如果所述第一余弦相似度值小于所述第二余弦相似度阈值,则将所述经变换的CAD图块的几何特征向量与所述标准CAD图例的几何特征向量项数据进行余弦相似度比较,得到第二余弦相似度值;如果所述第二余弦相似度值大于或等于所述第一余弦相似度阈值,则将所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据进行字符串比较;如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据相同,则将所述CAD图块识别为所述标准CAD图例,并且显示所述标准CAD图例的名称属性;以及如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据不相同,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
示例9是如示例8所述的方法,其中,将经模板化的CAD图块与标准CAD图例库中的标准CAD图例的特征模板数据进行比较进一步包括:如果所述第二余弦相似度值小于所述第一余弦相似度阈值且大于或等于所述第二余弦相似度阈值,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
示例10是如示例8所述的方法,其中,将所述CAD图块的特征模板与标准CAD图例库中的标准CAD图例的特征模板进行比较进一步包括:如果所述第二余弦相似度值小于所述第二余弦相似度阈值,则显示无法识别所述CAD图块,并且显示近似标准CAD图例列表。
附图说明
图1图示出一种常规CAD图块的图形。
图2A图示出根据本发明对一种示例CAD图例进行弹性网格划分的实施例;并且图2B图示出根据图2A中的弹性网格划分得到该CAD图例的几何特征表的实施例。
图3图示出根据本发明的用于依据标准的CAD图例特征模板建立标准CAD图例数据库的方法。
图4图示出根据本发明的用于依据标准的CAD图例特征模板来识别CAD图块的过程。
图5进一步图示出根据本发明的依据标准的CAD图例特征模板来识别CAD图块的过程。
图6图示出CAD图例绘制的各种情形。
图7进一步图示出根据本发明的依据标准的CAD图例特征模板来识别CAD图块的过程。
图8进一步图示出根据本发明的用于依据标准的CAD图例特征模板来识别CAD图块的过程。
具体实施方式
CAD图例是一种矢量图形,构成CAD图例的图形结构元素和文本元素代表了CAD图例的主要特征。本发明提出了一套标准的CAD图例特征模板来反映CAD图例的结构特征和文本特征,使得能够利用适应于所有CAD图例的此种标准的CAD图例特征模板来进行统一的特征提取、比较和识别。
标准的CAD图例特征模板
本发明提出的标准的CAD图例特征模板由CAD图例几何特征模板和CAD文本特征模板构成,可表示为:CAD图例几何特征模板(CAD图例几何特征矩阵ACiGj或CAD图例几何特征向量VCiGj)+CAD图例文本特征模板(CAD图例文本特征向量T)。
标准的CAD图例几何特征模板
具体而言,针对CAD图例的几何特征,发明人对现有CAD图例进行统计分析,将CAD图例的结构元素分为10类,如表1所示:
表1:CAD图例的结构元素统一分类表
Figure BDA0003011272910000061
Figure BDA0003011272910000071
另外,a)将圆视为上开口圆弧+下开口圆弧组成;b)将椭圆视为圆心为长轴和短轴交点、直径为短轴长的圆;c)将多段线打散为各个线段;d)将虚线等线型均视为细实线,不对其进行区分;e)样条曲线等打散为各个圆弧;f)将图案填充和颜色填充均视为填充,不对其进行区分。标准CAD图例的矢量图形中往往存在由多个共线的短线段组成的一个较长线段,通常CAD软件将其视为是两个线段实体:如果存在共同端点且共线的线段,则合并为一个新的线段;对于存在端点相交且共圆的圆弧,则将其合并为一个新的圆弧。例如图1中所示的情形,将线段ab和线段cd合并为新的线段ab。
根据构成CAD图例的结构元素分布,将CAD图例的划分为M×N个弹性网格,然后在弹性网格的基础上提取CAD图例的结构元素,由此能够有效反映各类结构元素在CAD图例中的位置分布。通过对标准CAD图例的统计分析发现,构成CAD图例的结构元素数量较少,并且考虑到识别的速度,本发明优选地设定弹性网格的数量M×N为3×3,或者替代地,M、N也可以是其他较小的奇数。
具体而言,设CAD图例的图形表示为F(x,y),其中x为图形的水平坐标轴X上的坐标,y为垂直坐标轴Y上的坐标,所要划分的全局弹性网格数量为M×N。另外,设Fc(x,y)为CAD图例的结构元素特征点,其中,对于线段/圆弧/箭头类结构元素,采用其中点作为元素特征点,对于填充,采用其质心作为元素特征点;结构元素特征点Fc(x,y)在X和Y轴上的投影点分别为Fp(i,0)和Fp(0,j),统计投影点的数量分别为Sx=count(Fp(i,0))和Sy=count(Fp(0,j));M×N个弹性网格的垂直和水平方向的网格划分线分别在X和Y轴上的投影点分别为Fd(m,0)和Fd(0,n)。由此,可以确定弹性网格划分线的坐标。基于X轴的弹性网格划分(即,垂直方向划分线的确定)具体包括:
将结构元素特征点Fc(x,y)在X轴投影点Fp(i,0)的数量Sx进行M等分,考虑到Sx不一定为M的倍数,故向上取整,得到d=roundup(Sx*1/M,0);
将投影点Fp(i,0)按i的大小进行升序排列,获得一个投影点序列{Fp1,Fp2,.。。Fps},其中,如果投影点重合,则令重合的所有投影点坐标Fp(i,0)中的横坐标i均加上一个范围在i和下一个点非重合投影点坐标i’之间的随机数;
确定垂直方向划分线在X轴上的投影点Fd(m,0)坐标m:第一条划分线Fd1(m,0)的坐标m为:id<md1<id+1(id为Fpd(id,0)的X坐标,d=roundup(Sx*1/M,0),Sx>=1;id+1为Fp(d+1)(id+1,0)的X坐标);第二条划分线Fd2(m,0)m的坐标为:i2*d<md2<i2*d+1(id为Fpd(id,0)的X坐标,d=roundup(Sx*1/3,0),Sx>1;如果Sx=1,md1<md2即可;如果Sx<2*d+1,即投影点(i2*d+1,0)不存在,则i2*d<md2即可)。基于Y轴的网格划分方法同上。
对已构建的M×N个弹性网格,对这些弹性网格按X轴从左到右、Y轴从下到上的统一的规则进行编号:{G1,G2,G3,…,GM×N},同时结合CAD图例的结构元素统一分类表(见表1:CAD图例的结构元素统一分类表),构建一个以结构元素类别Ci为行、弹性网格Gj为列,该弹性网格内结构元素特征点(即,结构元素的中点或质心)数量aCiGj为数值的标准的CAD图例几何特征表Ci×Gj,其中i=(1,2,3,4…,10),j=(1,2,3,4…,M×N),如表2所示:
表2:标准的CAD图例几何特征表
Figure BDA0003011272910000091
由此,可将CAD图例特征表(表2)视为如下所示的几何特征矩阵ACiGj,作为标准的CAD图例几何特征模板:
Figure BDA0003011272910000092
几何特征矩阵ACiGj可由一个包含10×(M×N)个元素的向量VCiGj表示:VCiGj=[aC1G1,aC2G1,aC3G1,…,aC1G2,aC2G2,…,aCiGj]。向量VCiGj同样充分反映了构成CAD图例的结构元素的类别特征、数量、位置和分布,由此也可用于表示标准的CAD图例几何特征模板。
作为示例,图2A中图示出对示例CAD图例进行的弹性网格划分,并且图2B图示出基于图2A的弹性网格划分获得的CAD图例的几何特征表。
对于每一个CAD图例,均可以按CAD图例的结构元素统一分类表提取结构元素,按以上统一的规则构建弹性网格,再分别判断每个网格内所包含的各类结构元素(判断标准按结构元素的特征点(即线段/圆弧中点或填充质心)的是否位于网格内),然后分别计算每个网格内结构元素的种类及对应的结构元素的数量,填入CAD图例几何特征表,由此获得CAD图例的几何特征矩阵或几何特征向量。
标准的CAD图例文本特征模板
将CAD图例中所含文字或字符单独作为另一项特征进行处理。本发明所提出的标准的CAD图例文本特征模板可以采用文本特征向量T来表示。通过提取CAD图例中所包含的文字或字符,可以将文本特征向量表示为T=(“文本1”,“文本2”,…)。
如此,标准的CAD图例特征模板构造为:CAD图例特征矩阵ACiGj或CAD图例特征向量VCiGj+表示CAD图例所含文字或符号的文本特征向量T,可以应用于所有CAD图例,进行标准CAD图例的统一存取,以及CAD图纸中CAD图块的统一的特征提取、比较和识别。
依照标准的CAD图例特征模板建立标准CAD图例数据库
标准CAD图例按其应用领域可分为技术文件(主要指图纸)所使用的图例和设备表示所使用的图例,技术文件用CAD图例主要表示对象和/或功能,或者表明设计、生产、检验和安装的特定指示,而设备用CAD图例则用于各种设备上,作为操作指示或用来显示设备的功能或工作状态。现行的含有技术文件用CAD图例和设备用CAD图例的国家或行业标准约100余项,所含标准CAD图例约10000余个。这些标准CAD图例通常具有如下特点:a)几何形状比较简洁,抽象化、概念化;b)图形实体属于CAD格式的矢量图形;c)大小不固定,随工程制图的要求而定,具有一定规则的几何外型;d)图形中所含文字或字符非常简洁,多用词或字母表示。
发明人对国家或行业标准所规定的标准CAD图例进行收集整理,依据本发明所提出的标准的CAD图例特征模板对这些标准CAD图例进行模板化,建立一个标准CAD图例数据库。
图3图示出根据本发明对标准CAD图例进行模板化的方法的流程图。该方法开始于框302,在框302处,对标准CAD图例进行预处理。对标准CAD图例进行预处理包括对构成该标准CAD图例的矢量图形中的CAD实体的提取和处理。随后,方法进行到框304,在框304处,提取标准CAD图例的结构元素以及文字或字符元素,并按照标准的CAD图例特征模板中定义的结构元素统一分类表(参见表1)对所提取的结构元素进行分类。方法继续进行至框306,在框306处,按照标准的CAD图例特征模板中定义的弹性网格划分规则将标准CAD图例划分为M×N个弹性网格。随后,方法进行至框308,在框308处,计算每个弹性网格内属于每种结构元素类别的结构元素数量。具体而言,基于结构元素特征点是否位于该弹性网格内来判定标准CAD图例的每个弹性网格内所包括的结构元素,随后根据结构元素统一分类表确定该结构元素的所属类别并对每个弹性网格内每种结构元素类别下的结构元素进行计数。方法继续进行至框310,在框310处,依据标准的CAD图例几何特征模板,依次将所得到的计数存入几何特征矩阵或几何特征向量。另外,方法还包括在框312处,依据标准的CAD图例文本特征模板,将在框302处提取的文字或字符元素存入文本特征向量。最后,方法进行至框314,在框314处,建立标准CAD图例数据库。作为非限制性实施例,本发明将标准CAD图例的数据结构定义为:
Figure BDA0003011272910000111
Figure BDA0003011272910000121
其中,“symbol code”为标准CAD图例的统一编码,由以16进制表示的4个字节组成。考虑到与ASCII字符、GB18030汉字编码等兼容,第一个字节取值范围为D0到D9,第二个字节为30到39,第三个字节为01到FE,第四个字节为01到FE。对于第一个字节,D0代表国标CAD图例数据库,D1代表扩展的国标或行标CAD图例数据库,D2代表企业标准CAD图例数据库,D3-D9备用;对于第二个字节,30代表现行标准,30-39备用;后两个字节保留00和FF,均为01到FE,一般可按图例名称的拼音升序排序,由此可支持64009个各种标准CAD图例,可满足现行及未来可扩展性的需要。另外,“name”为标准CAD图例的名称;“English name”为标准CAD图例的英文名称;“Characteristics vector”为标准CAD图例的几何特征向量VCiGj;“text vector”为标准CAD图例所含文字或符号构成的文本特征向量T;“view”为标准CAD图例的视图(如基本视图、平面、立面、轴测等),目前暂采用基本视图,并且可扩充采用其他视图;“description”为对标准CAD图例的备注说明;“status”为标准CAD图例的状态,其中true代表该标准CAD图例可使用,false代表标准CAD图例已停用或废止。
由此,根据本发明提出的标准的CAD图例特征模板对标准CAD图例进行模板化,建立标准CAD图例的几何特征向量和文本特征向量,然后按照上述数据结构存入数据库,可得到完整且高效的标准CAD图例数据库。包含现行的约10000个国标CAD图例基本图形的标准CAD图例数据库大小约4M-5M,由于其所占资源较少,因此可常驻计算机内存,从而在进行计算机自动识别时实现对CAD图例的快速、实时的索引、比较和识别。
对CAD图例的快速精准识别
基于已建立的标准CAD图例数据库,当我们打开一张CAD图纸,选中图纸中的某个图块A时,即可按标准的CAD图例特征模板对该图块A进行模板化,得到该图块A的几何特征向量和文本特征向量,并将其与标准CAD图例数据库中的数据进行比较,从而实现快速、精准的识别。
图4图示出根据本发明的用于识别CAD图例的方法。该方法开始于框402,在框402处,例如通过鼠标选中或滑过CAD图纸中某个图块,在该CAD图纸中获取CAD图块A。随后,方法进行至框404,在框404处,依据标准的CAD图例特征模板,对该CAD图块A进行模板化。具体而言,计算机可自动地按照本发明所提出的标准的CAD图例特征模板,按照预先设定的步骤和方法对CAD图块A进行预处理、结构元素以及文字或符号元素提取、弹性网格划分,从而获得该CAD图块A的几何特征向量Va和文本特征向量Ta。随后,方法进行至框406,在框406处,将在框404处获得的经模板化的CAD图块A与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较。所述比较将在下文进一步详细讨论。最后,方法进行至框408,在框408处,根据框406处进行的比较,输出对CAD图块A的识别结果。
图5进一步图示出根据本发明的将经模板化的CAD图块A与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较(如上文在框406处所描述)的过程。如图5中所图示,该过程开始于框501,在框501处,提取CAD图块A的几何特征向量Va和文本特征向量Ta。随后,过程进行至框502,在框502处,将CAD图块A的几何特征向量与标准CAD图例数据库中的各个标准CAD图例的几何特征向量项数据VCiGj(“Characteristics vector”:[aC1G1,aC2G1,aC3G1,…,aC1G2,aC2G2,…,aCiGj])按以下公式(1)分别进行欧式距离计算:
d(VaVCiGj)=sqrt[∑((Va-VCiGj)2)](i=1,2,…,CiGj)(1)
随后,过程进行至框504,在框504处,判定框502处所计算的欧式距离是否为零。如果在框504处判定所计算的欧式距离为零,则过程进行至框506,在框506处,将CAD图块A的文本特征向量Ta分别与欧式距离为零的VCiGj对应的标准CAD图例的文本特征向量项数据T(“text vector”:[“文本1”,“文本2”,…])逐一进行文本字符串比较(不区分大小写)。随后,过程进行至框508,在框508处,判定图块A的文本特征向量Ta是否与标准CAD图例的文本特征向量项数据T完全相同。如果完全相同,则过程进行至框510,在框510处,将图块A识别为对应的标准CAD图例,对CAD图块识别完成,停止计算并在鼠标光标处显示对应的标准CAD图例的名称属性作为该图块A的名称属性。如果在框508处判定文本字符串比较结果为不相同,则过程进行至框512,在框512处,将CAD图块A识别为与特征向量欧式距离为零的对应标准CAD图例相似,对CAD图块A的识别完成,停止计算并在鼠标光标处显示对应的标准CAD图例的名称属性列表并注明相似。因为构建标准CAD图例的特征集合时所采用的特征提取方法已考虑到了图形的变形等因素,上述识别过程已经可满足大部分图例的实时识别。附加地,如果在框504处判定所计算的欧式距离不为零,则过程进行至框514,在框514处对CAD图块A进行仿射变换,得到经变换的CAD图块A’,并随后对经变换的CAD图块A’进行识别。
在CAD图纸中绘制CAD图例可能存在多种情形,例如是否为轴测图或系统图,是否被延线上下或左右翻转。由此,可对CAD图块A进行仿射变换,并对经变换的图块A’进行识别。图6中图示出CAD图例绘制的16种主要情形。另外,由于图6中3.1.-3.4.及4.1-4.4.这八种情形中角度可能存在与X轴夹角30度或与X轴夹角45度两种情况,由此需要考虑情形实际应为16+8=24种。
设图块A的图形为F(x,y),进行仿射变换后得到的经变换的CAD图块A’的图形为F(x’,y’);x,y为原坐标;x’,y’为经变换的CAD图例的坐标,则仿射变换矩阵表达式为:
Figure BDA0003011272910000141
其中,参数ai(i=1,2,3,4)反映了图形的各种变换,对于图6中所图示的CAD图例绘制时的24种情形,其对应的变换矩阵分别为:
Figure BDA0003011272910000151
图7图示出根据本发明用于对经变换的CAD图块A’进行识别的过程。该过程开始于框702,在框702处,与上述框404处所描述的类似地,依据标准的CAD图例特征模板,对经变换的CAD图块A’进行模板化。具体而言,计算机可自动地按照本发明所提出的标准的CAD图例特征模板,按照预先设定的步骤和方法对经变换的CAD图块A’进行预处理、结构元素提取、弹性网格划分,从而获得经变换的CAD图块A’的几何特征向量Va’。由于放射变换不会影响CAD图块中所包含的文字或符号,因此可省略提取获得经变换的CAD图块A’的文本特征向量的步骤而直接采用CAD图块A的文本特征向量Ta。随后,过程进行至框704,在框704处,将Va’分别与标准CAD图例数据库中的各个标准CAD图例的几何特征向量项数据VCiGj进行欧式距离计算。随后,过程进行至框706,在框706处,判定框704处所计算的欧式距离是否为零。如果在框706处判定所计算的欧式距离为零,则过程进行至框708,在框708处,将文字符号向量Ta与所计算的欧式距离为零的对应标准CAD图例的文本特征向量项数据逐一进行文本字符串比较。随后,过程进行至框710,在框710处,判定文字符号向量Ta与对应的标准CAD图例的文本特征向量项数据是否完全相同。如果在框710处判定完全相同,则过程进行至框712,在框712处,将图块A识别为对应的标准CAD图例,对CAD图块识别完成,停止计算并在鼠标光标处显示对应的标准CAD图例的名称属性作为该图块A的名称属性。如果在框710处判定文本字符串比较结果为不相同,则过程进行至框714,在框714处,将CAD图块A识别为与对应的标准CAD图例相似,对CAD图块A的识别完成,停止计算并在鼠标光标处显示对应的标准CAD图例的名称属性列表并注明相似。如果在框706处判定所计算的欧式距离不为零,则过程进行至框716,在框716处,将CAD图块A与标准CAD图例数据库中的标准CAD图例进行余弦相似度比较。
图8进一步图示出根据本发明的用于将CAD图块A与标准CAD图例数据库中的标准CAD图例进行余弦相似度比较的过程。如图8中所图示,该过程开始于框802,在框802处,将CAD图块A的几何特征向量Va与标准CAD图例数据库中的各个标准CAD图例的几何特征向量项数据VCiGj按以下公式(2)逐一进行余弦相似度计算:
Figure BDA0003011272910000161
随后,过程进行至框804,在框804处,将在框802处计算的余弦相似度值分别与第一阈值和第二阈值进行比较。如果在框804处确定余弦相似度值大于或等于第一阈值(例如,余弦相似度>=0.98),过程将进行至框806。在框806处,将CAD图块A的文本特征向量Ta与同上述所计算的余弦相似度值大于或等于第一阈值对应的标准CAD图例的文本特征向量项数据T逐一进行文本字符串比较。该文本字符串比较过程(如框806-框812处所描述)与上文所描述的图5的框506-512和图7的框708-714类似,此处不再详细描述。如果在框804处确定余弦相似度值小于第一阈值且大于或等于第二阈值(例如,0.90≤余弦相似度值<0.98),则过程进行至框814。在框814处,将CAD图块A识别为与对应的标准CAD图例相似,对CAD图块A的识别完成,停止计算并在鼠标光标处显示对应的标准CAD图例的名称属性列表并注明相似。如果在框804处确定余弦相似度值小于第二阈值(例如,余弦相似度值<0.90),则过程进行至框816。在框816处,将经变换的图块A’的几何特征向量Va’与标准CAD图例数据库中的各个标准CAD图例的几何特征向量项数据VCiGj按公式(2)逐一进行余弦相似度计算。随后过程进行至框818,在框818处,将在框816处计算的余弦相似度值分别与上文所述的第一阈值和第二阈值进行比较。如果在框818处确定余弦相似度值大于或等于第一阈值,则过程进行至框820。在框820处,将CAD图块A的文本特征向量与同上述所计算的余弦相似度值大于或等于第一阈值对应的标准CAD图例的文本特征向量项数据T逐一进行文本字符串比较。该文本字符串比较过程(如框820-框826处所描述)与上文所描述的图5的框506-512和图7的框708-714类似,此处不再详细描述。如果在框818处确定余弦相似度值小于第一阈值且大于或等于第二阈值,则过程进行至框828。在框828处,将CAD图块A识别为与对应的标准CAD图例相似,对CAD图块A的识别完成,停止计算并在鼠标光标处显示对应的标准CAD图例的名称属性列表并注明相似。如果在框818处确定余弦相似度值小于第二阈值,则过程进行至框830,在CAD图块A处显示无法识别,并显示余弦相似度值最高的三个(或其他数量的)标准CAD图例的名称属性。
综上所述,本发明通过对标准CAD图例的特征进行分析和研究,提出构建一套标准的CAD图例特征模板并具体描述了此种标准的CAD图例模板的构建规范。本发明还描述了依据此种标准的CAD图例模板及其构建规范对标准CAD图例进行特征提取,建立标准CAD图例数据库。由此,依据此种标准的CAD图例模板及其构建规范,能够在浏览或审查CAD图纸时自动地将CAD图纸中的CAD图块模板化,从而与标准CAD图例数据库中的数据进行比较,实现对CAD图例的快速精准识别。本发明提出的标准的CAD图例模板能有效体现CAD图例的特征,又能适应旋转偏移缩放的不变性,同时具有较强的稳健性以及较低的计算复杂度,使得对CAD图例的识别正确率和识别速度可达到实用性的要求。

Claims (10)

1.一种CAD图例识别方法,所述方法包括:
获取CAD图块;
将所述CAD图块模板化,得到所述CAD图块的几何特征向量和所述CAD图块的文本特征向量;
将经模板化的CAD图块与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较,其中,所述特征模板数据包括几何特征向量项数据和文本特征向量项数据;
基于所述比较的结果,识别与所述CAD图块对应的标准CAD图例。
2.如权利要求1所述的方法,其特征在于,将所述CAD图块模板化包括:
对所述CAD图块进行预处理;
提取所述CAD图块的结构元素,并对所述结构元素进行分类;
基于所述结构元素的位置,将所述CAD图块划分为弹性网格;
对所述结构元素进行计数,以获得每个弹性网格内属于每种结构元素类别的结构元素的数量;以及
基于所述弹性网格、所述结构元素的类别以及所述每个弹性网格内属于每种结构元素类别的结构元素的数量,建立所述CAD图块的几何特征向量。
3.如权利要求2所述的方法,其特征在于,将所述CAD图块模板化进一步包括:
对所述CAD图块进行预处理;
提取所述CAD图块所包含的文字或字符元素;以及
基于所述文字或字符元素,建立所述CAD图块的文本特征向量。
4.如权利要求1所述的方法,其特征在于,将经模板化的CAD图块与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较包括:
从经模板化的CAD图块提取所述CAD图块的几何特征向量和文本特征向量,并且从所述标准CAD图例数据库提取所述标准CAD图例的几何特征向量项数据和文本特征向量项数据;
计算所述CAD图块的几何特征向量与所述标准CAD图例的几何特征向量项数据之间的第一欧式距离;
如果所述第一欧式距离为零,则将所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据进行字符串比较;
如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据相同,则将所述CAD图块识别为所述标准CAD图例,并且显示所述标准CAD图例的名称属性;以及
如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据不相同,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
5.如权利要求4所述的方法,其特征在于,将经模板化的CAD图块与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较进一步包括:
如果所述第一欧式距离不为零,则对所述CAD图块进行仿射变换,得到经变换的CAD图块;
将所述经变换的CAD图块模板化,得到所述经变换的CAD图块的几何特征向量;
计算所述经变换的CAD图块的几何特征向量与所述标准CAD图例的几何特征向量项数据之间的第二欧式距离;
如果所述第二欧式距离为零,则将所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据进行字符串比较;
如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据相同,则将所述CAD图块识别为所述标准CAD图例,并且显示所述标准CAD图例的名称属性;以及
如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据不相同,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
6.如权利要求5所述的方法,其特征在于,将经模板化的CAD图块与标准CAD图例数据库中的标准CAD图例的特征模板数据进行比较进一步包括:
如果所述第二欧式距离不为零,则将所述CAD图块的几何特征向量与所述标准CAD图例的几何特征向量项数据进行余弦相似度比较,得到第一余弦相似度值;
如果所述第一余弦相似度值大于或等于第一余弦相似度阈值,则将所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据进行字符串比较;
如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据相同,则将所述CAD图块识别为所述标准CAD图例,并且显示所述标准CAD图例的名称属性;以及
如果所述CAD图块的文本特征向量项数据与所述标准CAD图例的文本特征向量项数据不相同,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
7.如权利要求6所述的方法,其特征在于,将经模板化的CAD图块与标准CAD图例库中的标准CAD图例的特征模板数据进行比较进一步包括:
如果所述第一余弦相似度值小于所述第一余弦相似度阈值且大于或等于第二余弦相似度阈值,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似,
其中,所述第二余弦相似度阈值低于所述第一余弦相似度阈值。
8.如权利要求7所述的方法,其特征在于,将所述CAD图块的特征模板与标准CAD图例库中的标准CAD图例的特征模板进行比较进一步包括:
如果所述第一余弦相似度值小于所述第二余弦相似度阈值,则将所述经变换的CAD图块的几何特征向量与所述标准CAD图例的几何特征向量项数据进行余弦相似度比较,得到第二余弦相似度值;
如果所述第二余弦相似度值大于或等于所述第一余弦相似度阈值,则将所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据进行字符串比较;
如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据相同,则将所述CAD图块识别为所述标准CAD图例,并且显示所述标准CAD图例的名称属性;以及
如果所述CAD图块的文本特征向量与所述标准CAD图例的文本特征向量项数据不相同,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
9.如权利要求8所述的方法,其特征在于,将经模板化的CAD图块与标准CAD图例库中的标准CAD图例的特征模板数据进行比较进一步包括:
如果所述第二余弦相似度值小于所述第一余弦相似度阈值且大于或等于所述第二余弦相似度阈值,则将所述CAD图块识别为与所述标准CAD图例相似,并且显示所述标准CAD图例的名称属性并注明所述CAD图块与所述标准CAD图例相似。
10.如权利要求8所述的方法,其特征在于,将所述CAD图块的特征模板与标准CAD图例库中的标准CAD图例的特征模板进行比较进一步包括:
如果所述第二余弦相似度值小于所述第二余弦相似度阈值,则显示无法识别所述CAD图块,并且显示近似标准CAD图例列表。
CN202110376232.7A 2021-04-08 2021-04-08 一种cad图例快速精准识别方法 Active CN113065475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110376232.7A CN113065475B (zh) 2021-04-08 2021-04-08 一种cad图例快速精准识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110376232.7A CN113065475B (zh) 2021-04-08 2021-04-08 一种cad图例快速精准识别方法

Publications (2)

Publication Number Publication Date
CN113065475A true CN113065475A (zh) 2021-07-02
CN113065475B CN113065475B (zh) 2023-11-07

Family

ID=76566121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110376232.7A Active CN113065475B (zh) 2021-04-08 2021-04-08 一种cad图例快速精准识别方法

Country Status (1)

Country Link
CN (1) CN113065475B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559705A (zh) * 2013-10-23 2014-02-05 浙江工业大学 一种比较不同植物形态相似度的计算机方法
CN106250582A (zh) * 2016-07-15 2016-12-21 北京道亨时代科技有限公司 一种从非标准格式地下管线图文件中识别地下管线的方法
CN108985232A (zh) * 2018-07-18 2018-12-11 平安科技(深圳)有限公司 人脸图像比对方法、装置、计算机设备及存储介质
CN109255041A (zh) * 2018-08-22 2019-01-22 国网山西省电力公司 一种电气图纸的智能识别方法
EP3454233A1 (de) * 2017-09-08 2019-03-13 CADBAS GmbH Verfahren zum auffinden von technischen lösungselementen zur verwendung bei der konstruktion von industriellen erzeugnissen
CN110738216A (zh) * 2019-09-04 2020-01-31 南京理工大学 基于改进surf算法的药品识别方法
CN111177445A (zh) * 2019-12-30 2020-05-19 湖南特能博世科技有限公司 标准图元的确定方法、图元识别方法、装置和电子设备
CN111915480A (zh) * 2020-07-16 2020-11-10 北京字节跳动网络技术有限公司 生成特征提取网络的方法、装置、设备和计算机可读介质
CN112116011A (zh) * 2020-09-21 2020-12-22 上海晓材科技有限公司 一种用于cad图形的特征编码方法和相似度比较方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559705A (zh) * 2013-10-23 2014-02-05 浙江工业大学 一种比较不同植物形态相似度的计算机方法
CN106250582A (zh) * 2016-07-15 2016-12-21 北京道亨时代科技有限公司 一种从非标准格式地下管线图文件中识别地下管线的方法
EP3454233A1 (de) * 2017-09-08 2019-03-13 CADBAS GmbH Verfahren zum auffinden von technischen lösungselementen zur verwendung bei der konstruktion von industriellen erzeugnissen
CN108985232A (zh) * 2018-07-18 2018-12-11 平安科技(深圳)有限公司 人脸图像比对方法、装置、计算机设备及存储介质
CN109255041A (zh) * 2018-08-22 2019-01-22 国网山西省电力公司 一种电气图纸的智能识别方法
CN110738216A (zh) * 2019-09-04 2020-01-31 南京理工大学 基于改进surf算法的药品识别方法
CN111177445A (zh) * 2019-12-30 2020-05-19 湖南特能博世科技有限公司 标准图元的确定方法、图元识别方法、装置和电子设备
CN111915480A (zh) * 2020-07-16 2020-11-10 北京字节跳动网络技术有限公司 生成特征提取网络的方法、装置、设备和计算机可读介质
CN112116011A (zh) * 2020-09-21 2020-12-22 上海晓材科技有限公司 一种用于cad图形的特征编码方法和相似度比较方法

Also Published As

Publication number Publication date
CN113065475B (zh) 2023-11-07

Similar Documents

Publication Publication Date Title
US20210150080A1 (en) Synthetic data generation for machine learning tasks on floor plan drawings
AU2006252025B2 (en) Recognition of parameterised shapes from document images
US7653245B2 (en) System and method for coding and retrieval of a CAD drawing from a database
CN108710628B (zh) 一种基于草图交互的面向多模态数据的可视分析方法和系统
KR20060049081A (ko) 계층적 리스트 및 아웃라인을 파싱하기 위한 방법 및시스템
AU2006252019A1 (en) Method and Apparatus for Dynamic Connector Analysis
CN113052023A (zh) Cad图纸解析方法、装置、设备及存储介质
CN114419304A (zh) 一种基于图神经网络的多模态文档信息抽取方法
CN110728307A (zh) 自生成数据集与标签实现x光影像图小样本字符识别方法
CN109389050B (zh) 一种流程图连接关系识别方法
CN115713605A (zh) 一种基于图像学习的商业类建筑群自动建模方法
CN114399784A (zh) 一种基于cad图纸的自动识别方法及装置
Al-Maadeed et al. Automatic handedness detection from off-line handwriting
CN113065475B (zh) 一种cad图例快速精准识别方法
EP3961425A1 (en) System and method for providing access to multimodal content in a technical document
Mishchenko et al. Model-Based Recognition and Extraction of Information from Chart Images.
Wang et al. DeepStroke: understanding glyph structure with semantic segmentation and tabu search
CN111144114A (zh) 一种文本识别方法及装置
US11947336B2 (en) Apparatus and methods for superimposing two-dimensional prints onto three-dimensional models of a part for manufacture
CN117392269B (zh) 一种管网图纸数据提取方法及装置
CN113192195B (zh) 一种受损地形坐标数据的修复方法
US11557112B1 (en) Methods and systems for feature recognition of two-dimensional prints for manufacture
US11687687B1 (en) Apparatuses and methods for superimposition of a cross-sectional drawing over a three-dimensional model
CN114116989B (zh) 一种基于ocr识别的格式化文档生成方法及系统
JP7165970B2 (ja) 学習データ生成装置および学習データ生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant