CN115116084A - 引注识别方法、装置、设备及存储介质 - Google Patents
引注识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115116084A CN115116084A CN202210877437.8A CN202210877437A CN115116084A CN 115116084 A CN115116084 A CN 115116084A CN 202210877437 A CN202210877437 A CN 202210877437A CN 115116084 A CN115116084 A CN 115116084A
- Authority
- CN
- China
- Prior art keywords
- text
- line segment
- target
- position information
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/184—Extraction of features or characteristics of the image by analysing segments intersecting the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及一种引注识别方法、装置、设备及存储介质,涉及图纸识别领域。该引注识别方法包括:提取图纸中文本的第一位置信息和线段的第二位置信息;根据第一位置信息和第二位置信息,查找文本附近的第一预设区域内的目标线段;从目标线段中查找符合引注条件的目标基线,并确定目标基线对应的目标引线;获取目标基线的第三位置信息,并根据第三位置信息和第一位置信息,查找目标基线附近的第二预设区域内的完整文本;从完整文本中查找符合引注条件的目标文本;将目标基线、目标引线和目标文本识别为引注。本申请用以解决图纸中引注查找效率低的问题。
Description
技术领域
本申请涉及图纸识别领域,尤其涉及一种引注识别方法、装置、设备及存储介质。
背景技术
CAD(Computer Aided Design,计算机辅助设计)图纸中包括大量引注,引注一般包括线段和文本,用于指示建筑构件或空间的属性信息。
CAD图纸中的引注需要人工查找,无法快速查找出CAD图纸中的各个引注,查找引注的效率低,而且容易遗漏,耗费人力。
发明内容
本申请提供了一种引注识别方法、装置、设备及存储介质,用以解决图纸中引注查找效率低的问题。
第一方面,本申请实施例提供了一种引注识别方法,包括:
提取图纸中文本的第一位置信息和线段的第二位置信息;
根据所述第一位置信息和所述第二位置信息,查找所述文本附近的第一预设区域内的目标线段;
从所述目标线段中查找符合引注条件的目标基线,并确定所述目标基线对应的目标引线;
获取所述目标基线的第三位置信息,并根据所述第三位置信息和所述第一位置信息,查找所述目标基线附近的第二预设区域内的完整文本;
从所述完整文本中查找符合所述引注条件的目标文本;
将所述目标基线、所述目标引线和所述目标文本识别为引注。
可选地,所述从所述目标线段中查找符合引注条件的目标基线,并确定所述目标基线对应的目标引线,包括:
获取所述目标线段的顶点信息;
根据所述目标线段的顶点信息,确定候选基线和候选引线;
获取所述候选基线的第四位置信息,并根据所述第一位置信息和所述第四位置信息,从所述候选基线中确定符合所述引注条件的所述目标基线;
将所述目标基线对应的所述候选引线作为所述目标引线。
可选地,所述顶点信息包括顶点连接的线段数量;
所述根据所述目标线段的顶点信息,确定候选基线和候选引线,包括:
根据所述目标线段的两个顶点分别连接的线段数量,确定所述目标线段的两个顶点各自的类别,其中,所述类别包括起点、折点和终点中的一种;
在所述目标线段的两个顶点各自的类别分别为起点和折点的情况下,获取所述折点连接的候选顶点以及所述候选顶点的属性信息,获取所述折点的属性信息,将与所述折点的属性信息一致的除所述起点外的所述候选顶点作为终点,将所述目标线段作为所述候选基线,将所述折点和所述终点连接形成的线段作为所述候选引线;
在所述目标线段的两个顶点各自的类别分别为起点和终点的情况下,将所述目标线段作为所述候选基线,所述候选引线为空。
可选地,所述根据所述目标线段的两个顶点分别连接的线段数量,确定所述目标线段的两个顶点各自的类别,包括:
在所述目标线段的两个顶点分别连接的线段数量都等于1的情况下,确定所述目标线段的两个顶点各自的类别分别为起点和终点;
在所述目标线段中一个顶点连接的线段数量等于1,且另一个顶点连接的线段数量大于或等于2的情况下,确定所述一个顶点的类别为起点,确定所述另一个顶点的类别为折点。
可选地,所述根据所述第一位置信息和所述第四位置信息,从所述候选基线中确定符合所述引注条件的所述目标基线,包括:
根据所述第一位置信息,获取所述文本的书写方向;
根据所述第四位置信息,获取所述候选基线的方向;
计算所述文本的书写方向和所述候选基线的方向之间的夹角;
根据所述第一位置信息和所述第四位置信息,获取所述文本在所述候选基线上的投影;
根据所述第一位置信息和所述第四位置信息,获取所述文本和所述候选基线之间的垂直距离;
将所述夹角小于第一阈值、所述投影大于第二阈值且所述垂直距离小于第三阈值的所述候选基线,作为所述目标基线。
可选地,所述线段的第二位置信息包括所述线段中一个顶点的第一线段横坐标值和第一线段纵坐标值,以及另一个顶点的第二线段横坐标值和第二线段纵坐标值;
所述根据所述第一位置信息和所述第二位置信息,查找所述文本附近的第一预设区域内的目标线段,包括:
将各个线段按照所述第一线段横坐标值从小到大进行排序,获得第一线段排序序列,将各个线段按照所述第一线段纵坐标值从小到大进行排序,获得第二线段排序序列,将各个线段按照所述第二线段横坐标值从小到大进行排序,获得第三线段排序序列,将各个线段按照所述第二线段纵坐标值从小到大进行排序,获得第四线段排序序列;
根据所述第一位置信息,获取所述文本附近的第一预设区域的第一预设线段横坐标值、第一预设线段纵坐标值、第二预设线段横坐标值和第二预设线段纵坐标值;
根据所述第一预设线段横坐标值和所述第二预设线段横坐标值,从所述第一线段排序序列中确定第一线段集合,从所述第三线段排序序列中确定第二线段集合,根据所述第一预设线段纵坐标值和所述第二预设线段纵坐标值,从所述第二线段排序序列中确定第三线段集合,从所述第四线段排序序列中确定第四线段集合;
将所述第一线段集合、所述第二线段集合、所述第三线段集合和所述第四线段集合的交集,作为所述目标线段。
可选地,所述文本的第一位置信息包括所述文本中预设对角线中一个顶点的第一文本横坐标值和第一文本纵坐标值,以及另一个顶点的第二文本横坐标值和第二文本纵坐标值;
所述根据所述第三位置信息和所述第一位置信息,查找所述目标基线附近的第二预设区域内的完整文本,包括:
将各个文本按照所述第一文本横坐标值从小到大进行排序,获得第一文本排序序列,将各个文本按照所述第一文本纵坐标值从小到大进行排序,获得第二文本排序序列,将各个文本按照所述第二文本横坐标值从小到大进行排序,获得第三文本排序序列,将各个文本按照所述第二文本纵坐标值从小到大进行排序,获得第四文本排序序列;
根据所述第三位置信息,获取所述目标基线附近的第二预设区域的第一预设文本横坐标值、第一预设文本纵坐标值、第二预设文本横坐标值和第二预设文本纵坐标值;
根据所述第一预设文本横坐标值和所述第二预设文本横坐标值,从所述第一文本排序序列中确定第一文本集合,从所述第三文本排序序列中确定第二文本集合,根据所述第一预设文本纵坐标值和所述第二预设文本纵坐标值,从所述第二文本排序序列中确定第三文本集合,从所述第四文本排序序列中确定第四文本集合;
将所述第一文本集合、所述第二文本集合、所述第三文本集合和所述第四文本集合的交集,作为所述完整文本。
第二方面,本申请实施例提供了一种引注识别装置,包括:
提取模块,用于提取图纸中文本的第一位置信息和线段的第二位置信息;
第一查找模块,用于根据所述第一位置信息和所述第二位置信息,查找所述文本附近的第一预设区域内的目标线段;
第二查找模块,用于从所述目标线段中查找符合引注条件的目标基线,并确定所述目标基线对应的目标引线;
第三查找模块,用于获取所述目标基线的第三位置信息,并根据所述第三位置信息和所述第一位置信息,查找所述目标基线附近的第二预设区域内的完整文本;
第四查找模块,用于从所述完整文本中查找符合所述引注条件的目标文本;
识别模块,用于将所述目标基线、所述目标引线和所述目标文本识别为引注。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中所存储的程序,实现第一方面所述的引注识别方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的引注识别方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例中,提取图纸中文本的第一位置信息和线段的第二位置信息,根据第一位置信息和第二位置信息,查找文本附近的第一预设区域内的目标线段,从目标线段中查找符合引注条件的目标基线,并确定目标基线对应的目标引线,获取目标基线的第三位置信息,并根据第三位置信息和第一位置信息,查找目标基线附近的第二预设区域内的完整文本,从完整文本中查找符合引注条件的目标文本,将目标基线、目标引线和目标文本识别为引注。本申请先查找文本附近的第一预设区域内的目标线段,从目标线段中查找符合引注条件的目标基线,再查找目标基线附近的第二预设区域内的完整文本,从完整文本中查找符合引注条件的目标文本,能够自动查找引注,查找到的引注符合引注条件,无需人工查找引注,提升引注查找的效率以及准确率,避免遗漏引注。而且,在查找到目标基线后,继续查找目标基线附近的第二预设区域内的完整文本,从完整文本中查找符合引注条件的目标文本,能够避免遗漏引注中的文本,确保查找到的引注的完整性。解决了图纸中引注查找效率低的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中引注识别的方法流程示意图;
图2为本申请一个具体实施例中单基线单引线的引注、单基线多引线的引注以及单基线引注的示意图;
图3为本申请一个具体实施例中查找目标基线和目标引线的方法流程示意图;
图4为本申请一个具体实施例中从候选基线中确定符合引注条件的目标基线的方法流程示意图;
图5为本申请实施例中引注识别装置的结构示意图;
图6为本申请实施例中电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例中,提供了一种引注识别方法,该方法可以应用于服务器,当然,也可以应用于其他电子设备,例如终端(手机、平板电脑等)。本申请实施例中,以将该方法应用于服务器为例进行说明。
本申请实施例中,如图1所示,引注识别的方法流程主要包括:
步骤101,提取图纸中文本的第一位置信息和线段的第二位置信息。
提取图纸中文本的第一位置信息和线段的第二位置信息,可以是先对图纸中图元进行预处理,提取格式化所需的线段、圆弧和文本图元,合并重复的线段并消除同顶点线段间的误差值,然后针对预处理后的图元,提取文本的第一位置信息和线段的第二位置信息。
步骤102,根据第一位置信息和第二位置信息,查找文本附近的第一预设区域内的目标线段。
文本附近的第一预设区域,可以是和文本之间的距离小于第一距离阈值的点形成的第一预设区域。第一距离阈值,可以是经验值,也可以是多次试验得到的数值。
一个具体实施例中,线段的第二位置信息包括线段中一个顶点的第一线段横坐标值和第一线段纵坐标值,以及另一个顶点的第二线段横坐标值和第二线段纵坐标值。
一个具体实施例中,根据第一位置信息和第二位置信息,查找文本附近的第一预设区域内的目标线段,包括:将各个线段按照第一线段横坐标值从小到大进行排序,获得第一线段排序序列,将各个线段按照第一线段纵坐标值从小到大进行排序,获得第二线段排序序列,将各个线段按照第二线段横坐标值从小到大进行排序,获得第三线段排序序列,将各个线段按照第二线段纵坐标值从小到大进行排序,获得第四线段排序序列;根据第一位置信息,获取文本附近的第一预设区域的第一预设线段横坐标值、第一预设线段纵坐标值、第二预设线段横坐标值和第二预设线段纵坐标值;根据第一预设线段横坐标值和第二预设线段横坐标值,从第一线段排序序列中确定第一线段集合,从第三线段排序序列中确定第二线段集合,根据第一预设线段纵坐标值和第二预设线段纵坐标值,从第二线段排序序列中确定第三线段集合,从第四线段排序序列中确定第四线段集合;将第一线段集合、第二线段集合、第三线段集合和第四线段集合的交集,作为目标线段。
将各个线段按照线段的4个坐标值,排序得到第一线段排序序列、第二线段排序序列、第三线段排序序列和第四线段排序序列,方便后续根据第一预设区域的4个坐标值查找目标线段,无需将每个线段的坐标值都与第一预设区域的坐标值进行比较,尤其是图纸中线段数量非常多的情况下,能够在很大程度上提升目标线段的查找效率,进而提升引注查找的效率。
具体地,根据第一预设线段横坐标值和第二预设线段横坐标值,从第一线段排序序列中确定第一线段集合,从第三线段排序序列中确定第二线段集合,根据第一预设线段纵坐标值和第二预设线段纵坐标值,从第二线段排序序列中确定第三线段集合,从第四线段排序序列中确定第四线段集合,可以是在第一线段排序序列中查找第一线段横坐标值大于第一预设线段横坐标值且小于第二预设线段横坐标值的线段,作为第一线段集合,在第三线段排序序列中查找第二线段横坐标值大于第一预设线段横坐标值且小于第二预设线段横坐标值的线段,作为第二线段集合,在第二线段排序序列中查找第一线段纵坐标值大于第一预设线段纵坐标值且小于第二预设线段纵坐标值的线段,作为第三线段集合,在第四线段排序序列中查找第二线段纵坐标值大于第一预设线段纵坐标值且小于第二预设线段纵坐标值的线段,作为第四线段集合;其中,第一预设线段横坐标值小于第二预设线段横坐标值,第一预设线段纵坐标值小于第二预设线段纵坐标值。
具体地,可以是采用二分法,确定第一线段集合、第二线段集合、第三线段集合和第四线段集合。能够进一步提升目标线段的查找效率。
具体地,在将各个线段按照第一线段横坐标值从小到大进行排序,获得第一线段排序序列,将各个线段按照第一线段纵坐标值从小到大进行排序,获得第二线段排序序列,将各个线段按照第二线段横坐标值从小到大进行排序,获得第三线段排序序列,将各个线段按照第二线段纵坐标值从小到大进行排序,获得第四线段排序序列之前,可以先将各个线段的4个坐标值进行排序,优先确保排序后的第一线段横坐标值小于第二线段横坐标值,在第一线段横坐标值等于第二线段横坐标值的情况下,确保第一线段纵坐标值小于第二线段纵坐标值,方便后续根据第一预设区域的4个坐标值查找目标线段,进一步提升目标线段的查找效率。
步骤103,从目标线段中查找符合引注条件的目标基线,并确定目标基线对应的目标引线。
其中,符合引注条件是指满足引注的几何特征。
一个具体实施例中,把引注定义为由基线、引线和文本组成,基线是指水平的线,引线是指斜线,也可能只有基线和文本,文本在基线的周围,且文本和基线之间的距离有一定的阈值。引注的基线和引线可以分为起点、折点和终点,其中终点也叫指向点,指向建筑构件或空间。如图2所示,为单基线单引线的引注、单基线多引线的引注以及单基线引注的示意图。其中,起点连接的线段数量等于1,终点连接的线段数量等于1,折点连接的线段数量大于或等于2。
一个具体实施例中,如图3所示,从目标线段中查找符合引注条件的目标基线,并确定目标基线对应的目标引线,包括:
步骤301,获取目标线段的顶点信息。
步骤302,根据目标线段的顶点信息,确定候选基线和候选引线。
一个具体实施例中,顶点信息包括顶点连接的线段数量。根据目标线段的顶点信息,确定候选基线和候选引线,包括:根据目标线段的两个顶点分别连接的线段数量,确定目标线段的两个顶点各自的类别,其中,类别包括起点、折点和终点中的一种;在目标线段的两个顶点各自的类别分别为起点和折点的情况下,获取折点连接的候选顶点以及候选顶点的属性信息,获取折点的属性信息,将与折点的属性信息一致的除起点外的候选顶点作为终点,将目标线段作为候选基线,将折点和终点连接形成的线段作为候选引线;在目标线段的两个顶点各自的类别分别为起点和终点的情况下,将目标线段作为候选基线,候选引线为空。
可以预先构建“顶点-该顶点连接的线段数量”的哈希表-1,用于查询某个线段顶点连接的线段数量;构建“顶点-与该顶点连接的顶点”的哈希表-2,用于查询与某个线段顶点相连接的顶点及相连接的顶点的属性信息,其中,属性信息包括图层、颜色和线型信息。
在目标线段的两个顶点各自的类别分别为起点和折点的情况下,获取折点的属性信息,将与折点的属性信息一致的除起点外的候选顶点作为终点,能够根据属性信息,进一步排除干扰线段,确保查找到的候选引线的准确性。
在目标线段的两个顶点各自的类别分别为起点和折点的情况下,表明查找的引注是单基线单引线的引注或者单基线多引线的引注。在目标线段的两个顶点各自的类别分别为起点和终点的情况下,表明查找的引注是单基线引注。
一个具体实施例中,根据目标线段的两个顶点分别连接的线段数量,确定目标线段的两个顶点各自的类别,包括:在目标线段的两个顶点分别连接的线段数量都等于1的情况下,确定目标线段的两个顶点各自的类别分别为起点和终点;在目标线段中一个顶点连接的线段数量等于1,且另一个顶点连接的线段数量大于或等于2的情况下,确定一个顶点的类别为起点,确定另一个顶点的类别为折点。
在目标线段的两个顶点分别连接的线段数量都等于1的情况下,表明查找的引注是单基线引注。在目标线段中一个顶点连接的线段数量等于1,且另一个顶点连接的线段数量大于或等于2的情况下,表明查找的引注是单基线单引线的引注或者单基线多引线的引注。其中,在目标线段中一个顶点连接的线段数量等于1,且另一个顶点连接的线段数量等于2的情况下,表明查找的引注是单基线单引线的引注;在目标线段中一个顶点连接的线段数量等于1,且另一个顶点连接的线段数量大于2的情况下,表明查找的引注是单基线多引线的引注。
步骤303,获取候选基线的第四位置信息,并根据第一位置信息和第四位置信息,从候选基线中确定符合引注条件的目标基线。
一个具体实施例中,如图4所示,根据第一位置信息和第四位置信息,从候选基线中确定符合引注条件的目标基线,包括:
步骤401,根据第一位置信息,获取文本的书写方向。
根据第一位置信息,获取文本的书写方向,可以是根据文本的四个顶点的坐标,确定文本的书写方向。
步骤402,根据第四位置信息,获取候选基线的方向。
步骤403,计算文本的书写方向和候选基线的方向之间的夹角。
步骤404,根据第一位置信息和第四位置信息,获取文本在候选基线上的投影。
步骤405,根据第一位置信息和第四位置信息,获取文本和候选基线之间的垂直距离。
步骤406,将夹角小于第一阈值、投影大于第二阈值且垂直距离小于第三阈值的候选基线,作为目标基线。
其中,第一阈值可以是经验值,也可以是多次试验得到的数值,第二阈值可以是经验值,也可以是多次试验得到的数值,第三阈值可以是经验值,也可以是多次试验得到的数值。例如,第一阈值为5度,第二阈值为0.75,第三阈值为文本高度。夹角小于第一阈值,是指文本的书写方向和候选基线近似平行。
将夹角小于第一阈值、投影大于第二阈值且垂直距离小于第三阈值的候选基线,作为目标基线,能够选择出满足引注的几何特征的目标基线,进一步排除干扰线段,确保查找到的目标基线的准确性。
步骤304,将目标基线对应的候选引线作为目标引线。
具体地,将目标基线连接的候选引线作为目标引线。
步骤104,获取目标基线的第三位置信息,并根据第三位置信息和第一位置信息,查找目标基线附近的第二预设区域内的完整文本。
目标基线附近的第二预设区域,可以是和目标基线之间的距离小于第二距离阈值的点形成的第二预设区域。第二距离阈值,可以是经验值,也可以是多次试验得到的数值。
在查找到目标基线后,继续查找目标基线附近的第二预设区域内的完整文本,能够避免遗漏引注中的文本,确保查找到的引注的完整性。
一个具体实施例中,文本的第一位置信息包括文本中预设对角线中一个顶点的第一文本横坐标值和第一文本纵坐标值,以及另一个顶点的第二文本横坐标值和第二文本纵坐标值。
图纸中文本解析出来是由4个顶点围合成的包围盒,可以把文本的查找近似等同于文本中预设对角线的查找。其中,预设对角线可以是文本的左下顶点和右上顶点连接形成的线段,也可以是文本的左上顶点和右下顶点连接形成的线段。
一个具体实施例中,根据第三位置信息和第一位置信息,查找目标基线附近的第二预设区域内的完整文本,包括:将各个文本按照第一文本横坐标值从小到大进行排序,获得第一文本排序序列,将各个文本按照第一文本纵坐标值从小到大进行排序,获得第二文本排序序列,将各个文本按照第二文本横坐标值从小到大进行排序,获得第三文本排序序列,将各个文本按照第二文本纵坐标值从小到大进行排序,获得第四文本排序序列;根据第三位置信息,获取目标基线附近的第二预设区域的第一预设文本横坐标值、第一预设文本纵坐标值、第二预设文本横坐标值和第二预设文本纵坐标值;根据第一预设文本横坐标值和第二预设文本横坐标值,从第一文本排序序列中确定第一文本集合,从第三文本排序序列中确定第二文本集合,根据第一预设文本纵坐标值和第二预设文本纵坐标值,从第二文本排序序列中确定第三文本集合,从第四文本排序序列中确定第四文本集合;将第一文本集合、第二文本集合、第三文本集合和第四文本集合的交集,作为完整文本。
将各个文本按照预设对角线的4个坐标值,排序得到第一文本排序序列、第二文本排序序列、第三文本排序序列和第四文本排序序列,方便后续根据第二预设区域的4个坐标值查找完整文本,无需将每个文本的坐标值都与第二预设区域的坐标值进行比较,尤其是图纸中文本数量非常多的情况下,能够在很大程度上提升完整文本的查找效率,进而提升引注查找的效率。
具体地,根据第一预设文本横坐标值和第二预设文本横坐标值,从第一文本排序序列中确定第一文本集合,从第三文本排序序列中确定第二文本集合,根据第一预设文本纵坐标值和第二预设文本纵坐标值,从第二文本排序序列中确定第三文本集合,从第四文本排序序列中确定第四文本集合,可以是在第一文本排序序列中查找第一文本横坐标值大于第一预设文本横坐标值且小于第二预设文本横坐标值的文本,作为第一文本集合,在第三文本排序序列中查找第二文本横坐标值大于第一预设文本横坐标值且小于第二预设文本横坐标值的文本,作为第二文本集合,在第二文本排序序列中查找第一文本纵坐标值大于第一预设文本纵坐标值且小于第二预设文本纵坐标值的文本,作为第三文本集合,在第四文本排序序列中查找第二文本纵坐标值大于第一预设文本纵坐标值且小于第二预设文本纵坐标值的文本,作为第四文本集合;其中,第一预设文本横坐标值小于第二预设文本横坐标值,第一预设文本纵坐标值小于第二预设文本纵坐标值。
具体地,可以是采用二分法,确定第一文本集合、第二文本集合、第三文本集合和第四文本集合。能够进一步提升完整文本的查找效率。
步骤105,从完整文本中查找符合引注条件的目标文本。
从完整文本中查找符合引注条件的目标文本的具体过程和从候选基线中确定符合引注条件的目标基线的具体过程类似。
从完整文本中查找符合引注条件的目标文本,包括:获取完整文本的书写方向,获取目标基线的方向,计算完整文本的书写方向和目标基线的方向之间的夹角,获取完整文本在目标基线上的投影,获取完整文本和目标基线之间的垂直距离,将夹角小于第一阈值、投影大于第二阈值且垂直距离小于第三阈值的完整文本,作为目标文本。
将夹角小于第一阈值、投影大于第二阈值且垂直距离小于第三阈值的完整文本,作为目标文本,能够选择出满足引注的几何特征的目标文本,进一步排除干扰文本,确保查找到的目标文本的准确性。
步骤106,将目标基线、目标引线和目标文本识别为引注。
综上,本申请先查找文本附近的第一预设区域内的目标线段,从目标线段中查找符合引注条件的目标基线,再查找目标基线附近的第二预设区域内的完整文本,从完整文本中查找符合引注条件的目标文本,能够自动查找引注,查找到的引注符合引注条件,无需人工查找引注,提升引注查找的效率以及准确率,避免遗漏引注。而且,在查找到目标基线后,继续查找目标基线附近的第二预设区域内的完整文本,从完整文本中查找符合引注条件的目标文本,能够避免遗漏引注中的文本,确保查找到的引注的完整性。解决了图纸中引注查找效率低的问题。
基于同一构思,本申请实施例中提供了一种引注识别装置,该装置的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图5所示,该装置主要包括:
提取模块501,用于提取图纸中文本的第一位置信息和线段的第二位置信息;
第一查找模块502,用于根据所述第一位置信息和所述第二位置信息,查找所述文本附近的第一预设区域内的目标线段;
第二查找模块503,用于从所述目标线段中查找符合引注条件的目标基线,并确定所述目标基线对应的目标引线;
第三查找模块504,用于获取所述目标基线的第三位置信息,并根据所述第三位置信息和所述第一位置信息,查找所述目标基线附近的第二预设区域内的完整文本;
第四查找模块505,用于从所述完整文本中查找符合所述引注条件的目标文本;
识别模块506,用于将所述目标基线、所述目标引线和所述目标文本识别为引注。
基于同一构思,本申请实施例中还提供了一种电子设备,如图6所示,该电子设备主要包括:处理器601、存储器602和通信总线603,其中,处理器601和存储器602通过通信总线603完成相互间的通信。其中,存储器602中存储有可被处理器601执行的程序,处理器601执行存储器602中存储的程序,实现如下步骤:
提取图纸中文本的第一位置信息和线段的第二位置信息;根据第一位置信息和第二位置信息,查找文本附近的第一预设区域内的目标线段;从目标线段中查找符合引注条件的目标基线,并确定目标基线对应的目标引线;获取目标基线的第三位置信息,并根据第三位置信息和第一位置信息,查找目标基线附近的第二预设区域内的完整文本;从完整文本中查找符合引注条件的目标文本;将目标基线、目标引线和目标文本识别为引注。
上述电子设备中提到的通信总线603可以是外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。该通信总线603可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器602可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器601的存储装置。
上述的处理器601可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等,还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算机上运行时,使得计算机执行上述实施例中所描述的引注识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种引注识别方法,其特征在于,包括:
提取图纸中文本的第一位置信息和线段的第二位置信息;
根据所述第一位置信息和所述第二位置信息,查找所述文本附近的第一预设区域内的目标线段;
从所述目标线段中查找符合引注条件的目标基线,并确定所述目标基线对应的目标引线;
获取所述目标基线的第三位置信息,并根据所述第三位置信息和所述第一位置信息,查找所述目标基线附近的第二预设区域内的完整文本;
从所述完整文本中查找符合所述引注条件的目标文本;
将所述目标基线、所述目标引线和所述目标文本识别为引注。
2.根据权利要求1所述的引注识别方法,其特征在于,所述从所述目标线段中查找符合引注条件的目标基线,并确定所述目标基线对应的目标引线,包括:
获取所述目标线段的顶点信息;
根据所述目标线段的顶点信息,确定候选基线和候选引线;
获取所述候选基线的第四位置信息,并根据所述第一位置信息和所述第四位置信息,从所述候选基线中确定符合所述引注条件的所述目标基线;
将所述目标基线对应的所述候选引线作为所述目标引线。
3.根据权利要求2所述的引注识别方法,其特征在于,所述顶点信息包括顶点连接的线段数量;
所述根据所述目标线段的顶点信息,确定候选基线和候选引线,包括:
根据所述目标线段的两个顶点分别连接的线段数量,确定所述目标线段的两个顶点各自的类别,其中,所述类别包括起点、折点和终点中的一种;
在所述目标线段的两个顶点各自的类别分别为起点和折点的情况下,获取所述折点连接的候选顶点以及所述候选顶点的属性信息,获取所述折点的属性信息,将与所述折点的属性信息一致的除所述起点外的所述候选顶点作为终点,将所述目标线段作为所述候选基线,将所述折点和所述终点连接形成的线段作为所述候选引线;
在所述目标线段的两个顶点各自的类别分别为起点和终点的情况下,将所述目标线段作为所述候选基线,所述候选引线为空。
4.根据权利要求3所述的引注识别方法,其特征在于,所述根据所述目标线段的两个顶点分别连接的线段数量,确定所述目标线段的两个顶点各自的类别,包括:
在所述目标线段的两个顶点分别连接的线段数量都等于1的情况下,确定所述目标线段的两个顶点各自的类别分别为起点和终点;
在所述目标线段中一个顶点连接的线段数量等于1,且另一个顶点连接的线段数量大于或等于2的情况下,确定所述一个顶点的类别为起点,确定所述另一个顶点的类别为折点。
5.根据权利要求2所述的引注识别方法,其特征在于,所述根据所述第一位置信息和所述第四位置信息,从所述候选基线中确定符合所述引注条件的所述目标基线,包括:
根据所述第一位置信息,获取所述文本的书写方向;
根据所述第四位置信息,获取所述候选基线的方向;
计算所述文本的书写方向和所述候选基线的方向之间的夹角;
根据所述第一位置信息和所述第四位置信息,获取所述文本在所述候选基线上的投影;
根据所述第一位置信息和所述第四位置信息,获取所述文本和所述候选基线之间的垂直距离;
将所述夹角小于第一阈值、所述投影大于第二阈值且所述垂直距离小于第三阈值的所述候选基线,作为所述目标基线。
6.根据权利要求1至5任一项所述的引注识别方法,其特征在于,所述线段的第二位置信息包括所述线段中一个顶点的第一线段横坐标值和第一线段纵坐标值,以及另一个顶点的第二线段横坐标值和第二线段纵坐标值;
所述根据所述第一位置信息和所述第二位置信息,查找所述文本附近的第一预设区域内的目标线段,包括:
将各个线段按照所述第一线段横坐标值从小到大进行排序,获得第一线段排序序列,将各个线段按照所述第一线段纵坐标值从小到大进行排序,获得第二线段排序序列,将各个线段按照所述第二线段横坐标值从小到大进行排序,获得第三线段排序序列,将各个线段按照所述第二线段纵坐标值从小到大进行排序,获得第四线段排序序列;
根据所述第一位置信息,获取所述文本附近的第一预设区域的第一预设线段横坐标值、第一预设线段纵坐标值、第二预设线段横坐标值和第二预设线段纵坐标值;
根据所述第一预设线段横坐标值和所述第二预设线段横坐标值,从所述第一线段排序序列中确定第一线段集合,从所述第三线段排序序列中确定第二线段集合,根据所述第一预设线段纵坐标值和所述第二预设线段纵坐标值,从所述第二线段排序序列中确定第三线段集合,从所述第四线段排序序列中确定第四线段集合;
将所述第一线段集合、所述第二线段集合、所述第三线段集合和所述第四线段集合的交集,作为所述目标线段。
7.根据权利要求6所述的引注识别方法,其特征在于,所述文本的第一位置信息包括所述文本中预设对角线中一个顶点的第一文本横坐标值和第一文本纵坐标值,以及另一个顶点的第二文本横坐标值和第二文本纵坐标值;
所述根据所述第三位置信息和所述第一位置信息,查找所述目标基线附近的第二预设区域内的完整文本,包括:
将各个文本按照所述第一文本横坐标值从小到大进行排序,获得第一文本排序序列,将各个文本按照所述第一文本纵坐标值从小到大进行排序,获得第二文本排序序列,将各个文本按照所述第二文本横坐标值从小到大进行排序,获得第三文本排序序列,将各个文本按照所述第二文本纵坐标值从小到大进行排序,获得第四文本排序序列;
根据所述第三位置信息,获取所述目标基线附近的第二预设区域的第一预设文本横坐标值、第一预设文本纵坐标值、第二预设文本横坐标值和第二预设文本纵坐标值;
根据所述第一预设文本横坐标值和所述第二预设文本横坐标值,从所述第一文本排序序列中确定第一文本集合,从所述第三文本排序序列中确定第二文本集合,根据所述第一预设文本纵坐标值和所述第二预设文本纵坐标值,从所述第二文本排序序列中确定第三文本集合,从所述第四文本排序序列中确定第四文本集合;
将所述第一文本集合、所述第二文本集合、所述第三文本集合和所述第四文本集合的交集,作为所述完整文本。
8.一种引注识别装置,其特征在于,包括:
提取模块,用于提取图纸中文本的第一位置信息和线段的第二位置信息;
第一查找模块,用于根据所述第一位置信息和所述第二位置信息,查找所述文本附近的第一预设区域内的目标线段;
第二查找模块,用于从所述目标线段中查找符合引注条件的目标基线,并确定所述目标基线对应的目标引线;
第三查找模块,用于获取所述目标基线的第三位置信息,并根据所述第三位置信息和所述第一位置信息,查找所述目标基线附近的第二预设区域内的完整文本;
第四查找模块,用于从所述完整文本中查找符合所述引注条件的目标文本;
识别模块,用于将所述目标基线、所述目标引线和所述目标文本识别为引注。
9.一种电子设备,其特征在于,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中所存储的程序,实现权利要求1至7任一项所述的引注识别方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的引注识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210877437.8A CN115116084A (zh) | 2022-07-25 | 2022-07-25 | 引注识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210877437.8A CN115116084A (zh) | 2022-07-25 | 2022-07-25 | 引注识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115116084A true CN115116084A (zh) | 2022-09-27 |
Family
ID=83335334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210877437.8A Pending CN115116084A (zh) | 2022-07-25 | 2022-07-25 | 引注识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115116084A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116188629A (zh) * | 2022-12-12 | 2023-05-30 | 贝壳找房(北京)科技有限公司 | 生成装修图纸引注的方法、电子设备及介质 |
-
2022
- 2022-07-25 CN CN202210877437.8A patent/CN115116084A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116188629A (zh) * | 2022-12-12 | 2023-05-30 | 贝壳找房(北京)科技有限公司 | 生成装修图纸引注的方法、电子设备及介质 |
CN116188629B (zh) * | 2022-12-12 | 2024-02-27 | 贝壳找房(北京)科技有限公司 | 生成装修图纸引注的方法、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11810383B2 (en) | System and method for determination of label values in unstructured documents | |
US9910842B2 (en) | Interactively predicting fields in a form | |
US11182544B2 (en) | User interface for contextual document recognition | |
CN110796016A (zh) | 工程图纸识别方法、电子设备及相关产品 | |
CN111310426A (zh) | 基于ocr的表格版式恢复方法、装置及存储介质 | |
CN115116084A (zh) | 引注识别方法、装置、设备及存储介质 | |
CN111783561A (zh) | 审图结果修正方法、电子设备及相关产品 | |
CN109871743B (zh) | 文本数据的定位方法及装置、存储介质、终端 | |
CN111523531A (zh) | 文字处理方法、装置、电子设备及计算机可读存储介质 | |
CN114283190A (zh) | 梁线拼接方法、装置、设备及存储介质 | |
CN114445844A (zh) | 板构件识别方法、装置、设备及存储介质 | |
CN110688995B (zh) | 地图查询的处理方法,计算机可读存储介质和移动终端 | |
CN113743187A (zh) | 工程图纸中的图例识别方法、装置、电子设备和存储介质 | |
CN111427544B (zh) | 软件需求文档的生成方法、装置、存储介质及电子设备 | |
CN110929647B (zh) | 一种文本检测方法、装置、设备及存储介质 | |
CN111783180B (zh) | 图纸拆分方法及相关装置 | |
CN115082951A (zh) | 梁构件识别方法、装置、设备及存储介质 | |
CN115544620A (zh) | 图纸中门窗表解析方法、装置、设备及存储介质 | |
KR20230083971A (ko) | 이미지 내에 포함된 텍스트를 번역하고 편집하는 방법 및 이를 수행하는 장치 | |
CN114187448A (zh) | 文档图像识别方法和装置、电子设备、计算机可读介质 | |
CN114443003A (zh) | 一种构件渲染方法、装置、电子设备及存储介质 | |
CN113298079A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN111881050A (zh) | 一种文本图层的剪裁方法、装置及电子设备 | |
CN110414579A (zh) | 元数据模型合标性检查方法及装置、存储介质 | |
CN111178072A (zh) | 一种法律条文的确定方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230705 Address after: A601, Zhongke Naneng Building, No. 06 Yuexing 6th Road, Gaoxin District Community, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, 518063 Applicant after: Shenzhen Wanyi Digital Technology Co.,Ltd. Address before: 519085 room 105-24914, No.6 Baohua Road, Hengqin New District, Zhuhai City, Guangdong Province (centralized office area) Applicant before: WANYI TECHNOLOGY Co.,Ltd. |