CN102592108A - 图签信息提取方法和装置 - Google Patents
图签信息提取方法和装置 Download PDFInfo
- Publication number
- CN102592108A CN102592108A CN201110005301XA CN201110005301A CN102592108A CN 102592108 A CN102592108 A CN 102592108A CN 201110005301X A CN201110005301X A CN 201110005301XA CN 201110005301 A CN201110005301 A CN 201110005301A CN 102592108 A CN102592108 A CN 102592108A
- Authority
- CN
- China
- Prior art keywords
- connecting line
- line
- length
- target
- confirm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种图签信息提取方法和装置,其中,该方法包括:确定预定关键字在模板中的位置,根据预定关键字之间的参考连接线与其他连接线确定预定关键字之间的位置关系,其中,位置关系包括参考连接线与其他连接线间的长度比和角度,参考连接线为预定关键字中第一指定关键字与第二指定关键字之间的连接线,其他连接线为第一指定关键字与第二指定关键字之外的其他关键字之间的连接线;根据模板中预定关键字之间的位置关系,确定满足预定要求的电子图纸中的图签,从图签中提取所有关键字对应的属性值,其中,预定要求是指:该图签中的预定关键字之间的相对位置满足位置关系。本发明能够有效提高处理效率,减少人工操作量。
Description
技术领域
本发明涉及通信领域,尤其涉及一种图签信息提取方法和装置。
背景技术
设计图纸是通信建设工程建设的重要依据,随着电子绘图软件在设计单位中的使用日益普及,电子图纸量急剧增长。对电子图纸中的图签信息进行快速准确地提取、归档和检索,使设计单位能够对工程资料进行有效管理,其意义十分重要。
设计图纸的图签是指在图中对图纸基本信息进行描述的固定格式部分,图纸图签中包含了工程图纸中许多重要的信息,如图1所示,图签主要包含图纸中的一些必要信息和有关责任人的信息。
目前,对电子图纸中图签信息的提取主要还是依赖人工完成,且一个电子图档文件里可能包含多张电子图纸,使得信息提取工作单调繁琐,效率低下。而在多个电子图纸中,很可能出现某些图签信息在一些图纸中的位置相同或近似的情况,也就是说,这些图纸中上述图签信息的分布是类似的,但是,对于这种情况,同样需要单纯借助人工的方式完成信息的提取,导致操作人员的大量重复劳动。
针对相关技术中图签信息提取依赖人工方式而导致提取操作的工作量大、效率低的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中图签信息提取依赖人工方式而导致提取操作的工作量大、效率低的问题,本发明提出了一种图签信息提取方法和装置,能够有效提高处理效率,减少人工操作量。
本发明的技术方案是这样实现的:
一种图签信息提取方法,其特征在于,包括:
确定预定关键字在模板中的位置,根据所述预定关键字之间的参考连接线与其他连接线确定所述预定关键字之间的位置关系,其中,所述位置关系包括所述参考连接线与所述其他连接线间的长度比和角度,所述参考连接线为所述预定关键字中第一指定关键字与第二指定关键字之间的连接线,所述其他连接线为所述第一指定关键字与第二指定关键字之外的其他关键字之间的连接线;
根据所述模板中所述预定关键字之间的位置关系,确定满足预定要求的电子图纸中的图签,从所述图签中提取所有关键字对应的属性值,其中,所述预定要求是指:该图签中的预定关键字之间的相对位置满足所述位置关系。
其中,从所述图签中提取所有关键字对应的属性值的操作包括:
确定所述模板中两个关键字之间的第一连接线的长度,并确定电子图纸中所述两个关键字之间的第二连接线的长度;
确定所述模板中所述两个关键字对应的属性值所在的区域,并根据所述第一连接线与所述第二连接线之间的长度比和角度差确定所述电子图纸中所述两个关键字所对应的属性值所在的目标区域。
具体地,确定所述模板中所述两个关键字对应的属性值所在的区域包括:
对于所述模板中所述两个关键字中的每个关键字,确定该关键字对应的属性值所在的矩形参考区域,确定所述参考区域的一个对角线的一个顶点与该关键字所在区域的参照点之间形成的第一定位连线,并确定所述对角线另一顶点与所述参照点之间形成的第二定位连线,确定两个定位连线的长度以及所述两个定位连线之间的角度。
优选地,根据所述第一连接线与所述第二连接线之间的长度比和角度差确定所述电子图纸中所述两个关键字所对应的属性值所在的目标区域的操作包括:
对于所述电子图纸中的每个关键字,确定该关键字所在区域中目标参照点的位置,其中,所述目标参照点、与所述模板中该关键字所在区域中的参照点在各自所在区域中的相对位置相同;
以所述目标参照点为起点形成第一目标连接线和第二目标连线,并以所述第一目标连线和所述第二目标连线的终点之间的连线作为所述目标区域的对角线,并将根据该对角线形成的矩形区域确定为所述目标区域;
其中,所述第一定位连线的长度与所述第一目标连线的长度比、以及所述第二定位连线的长度与所述第二目标连线的长度比,满足所述第一连接线与所述第二连接线之间的长度比;所述第一目标连接线和所述第二目标连线之间的角度,与所述第一定位连线与所述第二定位连线之间的角度相同;所述第一定位连线的长度与所述第一目标连线之间的角度差、以及所述第二定位连线的长度与所述第二目标连线之间的角度差,均满足所述第一连接线与所述第二连接线之间的角度差。
其中,所述参照点和所述目标参照点均为各自所在区域的中心点、或者均为各自所在区域的一个边界点。
一种图签信息提取装置,其特征在于,包括:
确定模块,用于确定预定关键字在模板中的位置,根据所述预定关键字之间的参考连接线与其他连接线确定所述预定关键字之间的位置关系,其中,所述位置关系包括所述参考连接线与所述其他连接线间的长度比和角度,所述参考连接线为所述预定关键字中第一指定关键字与第二指定关键字之间的连接线,所述其他连接线为所述第一指定关键字与第二指定关键字之外的其他关键字之间的连接线;
提取模块,用于根据所述模板中所述预定关键字之间的位置关系,确定满足预定要求的电子图纸中的图签,从所述图签中提取所有关键字对应的属性值,其中,所述预定要求是指:该图签中的预定关键字之间的相对位置满足所述位置关系。
其中,所述提取模块包括:
第一确定子模块,用于确定所述模板中两个关键字之间的第一连接线的长度,并确定电子图纸中所述两个关键字之间的第二连接线的长度;
第二确定子模块,用于确定所述模板中所述两个关键字对应的属性值所在的区域,并根据所述第一连接线与所述第二连接线之间的长度比和角度差确定所述电子图纸中所述两个关键字所对应的属性值所在的目标区域。
具体地,所述第一确定子模块用于对于所述模板中所述两个关键字中的每个关键字,确定该关键字对应的属性值所在的矩形参考区域,确定所述参考区域的一个对角线的一个顶点与该关键字所在区域的参照点之间形成的第一定位连线,并确定所述对角线另一顶点与所述参照点之间形成的第二定位连线,确定两个定位连线的长度以及所述两个定位连线之间的角度。
优选地,所述第二确定子模块用于对于所述电子图纸中的每个关键字,确定该关键字所在区域中目标参照点的位置,其中,所述目标参照点、与所述模板中该关键字所在区域中的参照点在各自所在区域中的相对位置相同;
并且,所述第二确定子模块还用于以所述目标参照点为起点形成第一目标连接线和第二目标连线,并以所述第一目标连线和所述第二目标连线的终点之间的连线作为所述目标区域的对角线,并将根据该对角线形成的矩形区域确定为所述目标区域;
其中,所述第一定位连线的长度与所述第一目标连线的长度比、以及所述第二定位连线的长度与所述第二目标连线的长度比,满足所述第一连接线与所述第二连接线之间的长度比;所述第一目标连接线和所述第二目标连线之间的角度,与所述第一定位连线与所述第二定位连线之间的角度相同;所述第一定位连线的长度与所述第一目标连线之间的角度差、以及所述第二定位连线的长度与所述第二目标连线之间的角度差,均满足所述第一连接线与所述第二连接线之间的角度差。
其中,所述参照点和所述目标参照点均为各自所在区域的中心点、或者均为各自所在区域的一个边界点。
借助于本发明的上述技术方案,通过在模板中确定需要提取的关键字(例如,可以是图签信息对应的关键字)的相对位置关系,就能够在多个图纸中提取满足上述位置关系的图签中的所有关键字对应的属性值,从而能够基于多个电子图纸之间的共性自动提取图签信息,能够有效提高处理效率,减少人工操作量,并且能够适用于电子图纸中多种不同的关键字组合对应的信息提取;并且,本发明的方案无需处理图纸中的线条信息,而是直接处理其中的矢量,因此无需进行大量计算和信息的排列,也无需寻找单元格,因此处理过程较为简单;此外,由于本发明是根据关键字之间的相对位置关系进行提取,因此,即使电子图纸相对于模板出现旋转和缩放,本发明同样能够对其进行识别和提取。
附图说明
图1是现有技术中图签信息的示例图;
图2是根据本发明实施例的图签信息提取方法的流程图;
图3是根据本发明实施例的图签信息提取方法的详细处理流程图;
图4是根据本发明实施例的图签信息的示例图;
图5是根据本发明实施例的图签信息提取装置的结构框图。
具体实施方式
针对相关技术中图签信息提取依赖人工方式而导致提取操作的工作量大、效率低的问题,本发明提出在模板中确定需要提取的关键字(例如,可以是图签信息中预先设置的关键字)的相对位置关系,之后在多个图纸中提取满足上述位置关系的关键字所归属的图签,并提取该图签中所有关键字对应的属性值,从而能够基于多个电子图纸之间的共性自动提取图签信息,通过自动化的提取代替人工操作,提高处理效率并降低工作量。
下面将结合附图,描述本发明的实施例。
图2是根据本发明实施例的图签信息提取方法的流程图,如图2所示,该方法包括:
步骤S201,确定预定关键字在模板中的位置,根据预定关键字之间的参考连接线与其他连接线确定预定关键字之间的位置关系,其中,位置关系包括参考连接线与其他连接线间的长度比和角度,参考连接线为预定关键字中第一指定关键字与第二指定关键字之间的连接线,其他连接线为第一指定关键字与第二指定关键字之外的其他关键字之间的连接线。
步骤S203,根据模板中预定关键字之间的位置关系,确定满足预定要求的电子图纸中的图签,从图签中提取所有关键字对应的属性值,其中,预定要求是指:该图签中的预定关键字之间的相对位置满足位置关系。
其中,从图签中提取所有关键字对应的属性值的操作包括:
确定模板中两个关键字之间的第一连接线的长度,并确定电子图纸中两个关键字之间的第二连接线的长度;
确定模板中两个关键字对应的属性值所在的区域,并根据第一连接线与第二连接线之间的长度比和角度差确定电子图纸中两个关键字所对应的属性值所在的目标区域。
其中,确定模板中两个关键字对应的属性值所在的区域包括:
对于模板中两个关键字中的每个关键字,确定该关键字对应的属性值所在的矩形参考区域,确定参考区域的一个对角线的一个顶点与该关键字所在区域的参照点之间形成的第一定位连线,并确定对角线另一顶点与参照点之间形成的第二定位连线,确定两个定位连线的长度以及两个定位连线之间的角度。
具体地,根据第一连接线与第二连接线之间的长度比和角度差确定电子图纸中两个关键字所对应的属性值所在的目标区域的操作包括:对于电子图纸中的每个关键字,确定该关键字所在区域中目标参照点的位置,其中,目标参照点、与模板中该关键字所在区域中的参照点在各自所在区域中的相对位置相同;以目标参照点为起点形成第一目标连接线和第二目标连线,并以第一目标连线和第二目标连线的终点之间的连线作为目标区域的对角线,并将根据该对角线形成的矩形区域确定为目标区域;其中,第一定位连线的长度与第一目标连线的长度比、以及第二定位连线的长度与第二目标连线的长度比,满足第一连接线与第二连接线之间的长度比;第一目标连接线和第二目标连线之间的角度,与第一定位连线与第二定位连线之间的角度相同;第一定位连线的长度与第一目标连线之间的角度差、以及第二定位连线的长度与第二目标连线之间的角度差,均满足第一连接线与第二连接线之间的角度差。
优选地,参照点和目标参照点均为各自所在区域的中心点、或者均为各自所在区域的一个边界点。
借助于本发明的上述技术方案,通过在模板中确定需要提取的关键字(例如,可以是图签信息对应的关键字)的相对位置关系,就能够在多个图纸中提取满足上述位置关系的图签中的所有关键字对应的属性值,从而能够基于多个电子图纸之间的共性自动提取图签信息,能够有效提高处理效率,减少人工操作量,并且能够适用于电子图纸中多种不同的关键字组合对应的信息提取;并且,本发明的方案无需处理图纸中的线条信息,而是直接处理其中的矢量,因此无需进行大量计算和信息的排列,也无需寻找单元格,因此处理过程较为简单;此外,由于本发明是根据关键字之间的相对位置关系进行提取,因此,即使电子图纸相对于模板出现旋转和缩放,本发明同样能够对其进行识别和提取。
本发明从分析图签中的关键字组矢量关系入手,由于一个电子图档文件中可能存在多张图纸即含有多个图签,先使用聚类算法对多张电子图纸中的图签信息进行匹配,并对图签个数和旋转情况做出分析,获取每个图签的基本信息;再通过模板中其他关键字的与关键字组核心位置的相对矢量值,获取该位置范围内的文本信息,最终完成所有图签的提取。
图3是根据本发明实施例的图签信息提取方法的详细处理流程图,如图3所示,包括以下处理:
步骤S301,读取电子图纸文件。
步骤S302,读取模板配置文件。
步骤S303,获取电子图纸中的全部文字对象信息,从模板配置文件中提取图签关键字组,按关键字组中关键字内容在该全部文字对象信息中抽取相应的文本对象,并获取每个关键字在电子图纸中位置和方向信息。例如,如图4所示,模板配置文件中的关键字组为:部门主管、设计人和图号,为之后获取其他数据值方便考虑,可以选择一个核心关键字,在这里可以取“部门主管”为核心关键字,这里定义文字的左上角位置为文本位置。
步骤S304,以矢量位置关系为依据,对关键字组进行聚类分组,即按照模板配置文件中的关键字的名称和相对矢量位置,对电子图纸中的全部文字对象信息按照聚类准则进行分组,并通过匹配算法获取分组结果;其中,以图4为例,模板配置文件中的相对矢量位置(即上文所述的预定关键字之间的位置关系)可以为两个从关键字到主关键字的相对矢量,包括其距离值、角度值等,例如,距离值可以为部门主管和图号间的线段长度与部门主管和设计人间的线段长度之比s(这里,部门主管即上文所述的第一指定关键字,设计人即上文所述的第二指定关键字,部门主管和设计人间的线段长度即上文所述的参考连接线),s为预设的范围值,角度值可以为部门主管和图号之间的线段与部门主管和设计人间的线段形成的夹角x,x为预设的范围值,其中,x和s的范围可以根据需要灵活设置;
对聚类分组信息按照聚类准则进行计算,主要根据矢量相对性准测判断各分组内的分布是否符合关键字分布规则,这里,矢量相对性准则的计算准则设计不局限于模板数据的准确计算,而是包含适应图签缩放、旋转和一定程度下的拖动变形的综合计算准则。例如,如果某个电子图纸中的图签中包含关键字:部门主管、设计人和图号,另外,该电子图纸中,部门主管和图号间的线段长度与部门主管和设计人间的线段长度之比在上述s的预设范围内(即距离值满足条件),且部门主管和图号之间的线段与部门主管和设计人间的线段形成的夹角在上述x的预设范围内(即角度值满足条件),则认为该电子图纸中有关键字组符合聚类准则,也就是说距离值和角度值均需要满足预设条件,才认为该电子图纸存在符合聚类准则的合法图签。通过以上计算后归纳聚类分析结果,判断电子图纸文件是否有符合聚类准则的分组,如果符合聚类准则的分组则具有符合标准的图签,进入步骤S305,否则转到步骤S307。
步骤S305,从模板中获取其他图签内容文本对象的相对矢量组,基于关键字组中的核心关键字位置信息以及该组的缩放、旋转程度重新计算相对矢量值,并依此计算相应文本的位置范围,在此范围内寻找文本对象。这里的相对矢量组定义为该文本的左上角和右下角位置与主关键字的相对矢量,这样,即使电子图纸相对于模板出现旋转,也能够从电子图纸中提取关键字对应的属性值。
步骤S306,将读取的图签文本属性值记录到结果列表中存储。
步骤S307,判断是否有其他的模板配置文件,如果有则进入步骤S302,否则进入步骤S308。
步骤S308,将综合结果列表显示给用户。
六、本申请提案的关键点和欲保护点
通过对标准图签中关键字组建立相对矢量模型,按模型对图纸中的关键字组进行提取,通过聚类算法进行智能匹配并获取合法分组结果解决多图签信息提取问题,并按照旋转和缩放程度计算相对矢量方法获取其他文本位置范围,并读取其信息值。
图4是根据本发明实施例的图签信息提取装置的结构框图,如图4所示,该装置可以包括:
确定模块1,用于确定预定关键字在模板中的位置,根据预定关键字之间的参考连接线与其他连接线确定预定关键字之间的位置关系,其中,位置关系包括参考连接线与其他连接线间的长度比和角度,参考连接线为预定关键字中第一指定关键字与第二指定关键字之间的连接线,其他连接线为第一指定关键字与第二指定关键字之外的其他关键字之间的连接线;
提取模块2,用于根据模板中预定关键字之间的位置关系,确定满足预定要求的电子图纸中的图签,从图签中提取所有关键字对应的属性值,其中,预定要求是指:该图签中的预定关键字之间的相对位置满足位置关系。
其中,上述提取模块2包括第一确定子模块(图中未示出)和第二确定子模块(图中未示出),其中,第一确定子模块,用于确定模板中两个关键字之间的第一连接线的长度,并确定电子图纸中两个关键字之间的第二连接线的长度;第二确定子模块,用于确定模板中两个关键字对应的属性值所在的区域,并根据第一连接线与第二连接线之间的长度比和角度差确定电子图纸中两个关键字所对应的属性值所在的目标区域。
具体地,第一确定子模块用于对于模板中两个关键字中的每个关键字,确定该关键字对应的属性值所在的矩形参考区域,确定参考区域的一个对角线的一个顶点与该关键字所在区域的参照点之间形成的第一定位连线,并确定对角线另一顶点与参照点之间形成的第二定位连线,确定两个定位连线的长度以及两个定位连线之间的角度。
具体地,第二确定子模块用于对于电子图纸中的每个关键字,确定该关键字所在区域中目标参照点的位置,其中,目标参照点、与模板中该关键字所在区域中的参照点在各自所在区域中的相对位置相同;并且,第二确定子模块还用于以目标参照点为起点形成第一目标连接线和第二目标连线,并以第一目标连线和第二目标连线的终点之间的连线作为目标区域的对角线,并将根据该对角线形成的矩形区域确定为目标区域;其中,第一定位连线的长度与第一目标连线的长度比、以及第二定位连线的长度与第二目标连线的长度比,满足第一连接线与第二连接线之间的长度比;第一目标连接线和第二目标连线之间的角度,与第一定位连线与第二定位连线之间的角度相同;第一定位连线的长度与第一目标连线之间的角度差、以及第二定位连线的长度与第二目标连线之间的角度差,均满足第一连接线与第二连接线之间的角度差。
优选地,参照点和目标参照点均为各自所在区域的中心点、或者均为各自所在区域的一个边界点。
综上所述,借助于本发明的上述技术方案,通过在模板中确定需要提取的关键字(例如,可以是图签信息对应的关键字)的相对位置关系,就能够在多个图纸中提取满足上述位置关系的图签中的所有关键字对应的属性值,从而能够基于多个电子图纸之间的共性自动提取图签信息,能够有效提高处理效率,减少人工操作量,并且能够适用于电子图纸中多种不同的关键字组合对应的信息提取;并且,本发明的方案可以直接获取文本对象内容,不需要读图纸中大量的直线信息,也不需要对此类信息进行排序,节省了大量的运算量;另外,由于在处理过程中直接利用相对矢量值进行比对和分析,不需要通过对直线交叉来寻找单元格,因此不需要进行范围内的直线搜索,也不需要进行交叉点的判断和计算,计算量大大减少;直接基于相对矢量关系,与用户的绘图习惯和方式基本无关,不会出现现有技术中由于不同对象引起的错判漏判现象;通过聚类算法提高对多图签情况下信息提取准确率;另外,本发明的方案能够在图纸中识别每个图签的缩放和旋转程度,可以对有缩放和旋转情况下的图纸图签进行有效的信息提取,具有良好的应变性能。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种图签信息提取方法,其特征在于,包括:
确定预定关键字在模板中的位置,根据所述预定关键字之间的参考连接线与其他连接线确定所述预定关键字之间的位置关系,其中,所述位置关系包括所述参考连接线与所述其他连接线间的长度比和角度,所述参考连接线为所述预定关键字中第一指定关键字与第二指定关键字之间的连接线,所述其他连接线为所述第一指定关键字与第二指定关键字之外的其他关键字之间的连接线;
根据所述模板中所述预定关键字之间的位置关系,确定满足预定要求的电子图纸中的图签,从所述图签中提取所有关键字对应的属性值,其中,所述预定要求是指:该图签中的预定关键字之间的相对位置满足所述位置关系。
2.根据权利要求1所述的图签信息提取方法,其特征在于,从所述图签中提取所有关键字对应的属性值的操作包括:
确定所述模板中两个关键字之间的第一连接线的长度,并确定电子图纸中所述两个关键字之间的第二连接线的长度;
确定所述模板中所述两个关键字对应的属性值所在的区域,并根据所述第一连接线与所述第二连接线之间的长度比和角度差确定所述电子图纸中所述两个关键字所对应的属性值所在的目标区域。
3.根据权利要求2所述的图签信息提取方法,其特征在于,确定所述模板中所述两个关键字对应的属性值所在的区域包括:
对于所述模板中所述两个关键字中的每个关键字,确定该关键字对应的属性值所在的矩形参考区域,确定所述参考区域的一个对角线的一个顶点与该关键字所在区域的参照点之间形成的第一定位连线,并确定所述对角线另一顶点与所述参照点之间形成的第二定位连线,确定两个定位连线的长度以及所述两个定位连线之间的角度。
4.根据权利要求3所述的图签信息提取方法,其特征在于,根据所述第一连接线与所述第二连接线之间的长度比和角度差确定所述电子图纸中所述两个关键字所对应的属性值所在的目标区域的操作包括:
对于所述电子图纸中的每个关键字,确定该关键字所在区域中目标参照点的位置,其中,所述目标参照点、与所述模板中该关键字所在区域中的参照点在各自所在区域中的相对位置相同;
以所述目标参照点为起点形成第一目标连接线和第二目标连线,并以所述第一目标连线和所述第二目标连线的终点之间的连线作为所述目标区域的对角线,并将根据该对角线形成的矩形区域确定为所述目标区域;
其中,所述第一定位连线的长度与所述第一目标连线的长度比、以及所述第二定位连线的长度与所述第二目标连线的长度比,满足所述第一连接线与所述第二连接线之间的长度比;所述第一目标连接线和所述第二目标连线之间的角度,与所述第一定位连线与所述第二定位连线之间的角度相同;所述第一定位连线的长度与所述第一目标连线之间的角度差、以及所述第二定位连线的长度与所述第二目标连线之间的角度差,均满足所述第一连接线与所述第二连接线之间的角度差。
5.根据权利要求4所述的图签信息提取方法,其特征在于,所述参照点和所述目标参照点均为各自所在区域的中心点、或者均为各自所在区域的一个边界点。
6.一种图签信息提取装置,其特征在于,包括:
确定模块,用于确定预定关键字在模板中的位置,根据所述预定关键字之间的参考连接线与其他连接线确定所述预定关键字之间的位置关系,其中,所述位置关系包括所述参考连接线与所述其他连接线间的长度比和角度,所述参考连接线为所述预定关键字中第一指定关键字与第二指定关键字之间的连接线,所述其他连接线为所述第一指定关键字与第二指定关键字之外的其他关键字之间的连接线;
提取模块,用于根据所述模板中所述预定关键字之间的位置关系,确定满足预定要求的电子图纸中的图签,从所述图签中提取所有关键字对应的属性值,其中,所述预定要求是指:该图签中的预定关键字之间的相对位置满足所述位置关系。
7.根据权利要求6所述的图签信息提取装置,其特征在于,所述提取模块包括:
第一确定子模块,用于确定所述模板中两个关键字之间的第一连接线的长度,并确定电子图纸中所述两个关键字之间的第二连接线的长度;
第二确定子模块,用于确定所述模板中所述两个关键字对应的属性值所在的区域,并根据所述第一连接线与所述第二连接线之间的长度比和角度差确定所述电子图纸中所述两个关键字所对应的属性值所在的目标区域。
8.根据权利要求7所述的图签信息提取装置,其特征在于,所述第一确定子模块用于对于所述模板中所述两个关键字中的每个关键字,确定该关键字对应的属性值所在的矩形参考区域,确定所述参考区域的一个对角线的一个顶点与该关键字所在区域的参照点之间形成的第一定位连线,并确定所述对角线另一顶点与所述参照点之间形成的第二定位连线,确定两个定位连线的长度以及所述两个定位连线之间的角度。
9.根据权利要求8所述的图签信息提取装置,其特征在于,所述第二确定子模块用于对于所述电子图纸中的每个关键字,确定该关键字所在区域中目标参照点的位置,其中,所述目标参照点、与所述模板中该关键字所在区域中的参照点在各自所在区域中的相对位置相同;
并且,所述第二确定子模块还用于以所述目标参照点为起点形成第一目标连接线和第二目标连线,并以所述第一目标连线和所述第二目标连线的终点之间的连线作为所述目标区域的对角线,并将根据该对角线形成的矩形区域确定为所述目标区域;
其中,所述第一定位连线的长度与所述第一目标连线的长度比、以及所述第二定位连线的长度与所述第二目标连线的长度比,满足所述第一连接线与所述第二连接线之间的长度比;所述第一目标连接线和所述第二目标连线之间的角度,与所述第一定位连线与所述第二定位连线之间的角度相同;所述第一定位连线的长度与所述第一目标连线之间的角度差、以及所述第二定位连线的长度与所述第二目标连线之间的角度差,均满足所述第一连接线与所述第二连接线之间的角度差。
10.根据权利要求9所述的图签信息提取装置,其特征在于,所述参照点和所述目标参照点均为各自所在区域的中心点、或者均为各自所在区域的一个边界点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110005301.XA CN102592108B (zh) | 2011-01-04 | 2011-01-04 | 图签信息提取方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110005301.XA CN102592108B (zh) | 2011-01-04 | 2011-01-04 | 图签信息提取方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102592108A true CN102592108A (zh) | 2012-07-18 |
CN102592108B CN102592108B (zh) | 2014-09-10 |
Family
ID=46480726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110005301.XA Active CN102592108B (zh) | 2011-01-04 | 2011-01-04 | 图签信息提取方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102592108B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092864A (zh) * | 2017-03-27 | 2017-08-25 | 成都优译信息技术股份有限公司 | 基于聚类分析的图纸文本读取方法及系统 |
CN110399509A (zh) * | 2019-06-10 | 2019-11-01 | 万翼科技有限公司 | 一种智能识图系统及方法 |
CN113837068A (zh) * | 2021-09-23 | 2021-12-24 | 纬衡浩建科技(深圳)有限公司 | Pdf表格文字识别方法和装置 |
CN107908843B (zh) * | 2017-11-07 | 2022-05-27 | 杭州格原信息技术有限公司 | 基于图签信息提取的管理系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1188946A (zh) * | 1996-12-27 | 1998-07-29 | 富士通株式会社 | 从图像中提取管理信息的设备与方法 |
CN1584920A (zh) * | 2004-06-04 | 2005-02-23 | 北京大学计算机科学技术研究所 | 一种已知表格的版面自动定向和定位方法 |
CN101388079A (zh) * | 2008-10-17 | 2009-03-18 | 纬衡浩建科技(深圳)有限公司 | 一种图签识别方法 |
-
2011
- 2011-01-04 CN CN201110005301.XA patent/CN102592108B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1188946A (zh) * | 1996-12-27 | 1998-07-29 | 富士通株式会社 | 从图像中提取管理信息的设备与方法 |
CN1584920A (zh) * | 2004-06-04 | 2005-02-23 | 北京大学计算机科学技术研究所 | 一种已知表格的版面自动定向和定位方法 |
CN101388079A (zh) * | 2008-10-17 | 2009-03-18 | 纬衡浩建科技(深圳)有限公司 | 一种图签识别方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092864A (zh) * | 2017-03-27 | 2017-08-25 | 成都优译信息技术股份有限公司 | 基于聚类分析的图纸文本读取方法及系统 |
CN107092864B (zh) * | 2017-03-27 | 2020-02-21 | 成都优译信息技术股份有限公司 | 基于聚类分析的图纸文本读取方法及系统 |
CN107908843B (zh) * | 2017-11-07 | 2022-05-27 | 杭州格原信息技术有限公司 | 基于图签信息提取的管理系统 |
CN110399509A (zh) * | 2019-06-10 | 2019-11-01 | 万翼科技有限公司 | 一种智能识图系统及方法 |
CN113837068A (zh) * | 2021-09-23 | 2021-12-24 | 纬衡浩建科技(深圳)有限公司 | Pdf表格文字识别方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN102592108B (zh) | 2014-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102722709B (zh) | 一种垃圾图片识别方法和装置 | |
AU2017408801A1 (en) | User keyword extraction device and method, and computer-readable storage medium | |
CN102893275A (zh) | 自动社交网络图挖掘和可视化 | |
CN104008166A (zh) | 一种基于形态和语义相似度的对话短文本聚类方法 | |
CN101329731A (zh) | 图像中数学公式的自动识别方法 | |
CN102592108B (zh) | 图签信息提取方法和装置 | |
US20050210434A1 (en) | Process for the production of an electrical wiring diagram | |
CN111144300B (zh) | 一种基于图像识别的pdf表格结构识别方法 | |
CN101388079B (zh) | 一种图签识别方法 | |
CN105205636A (zh) | 一种计算物料需求计划mrp的方法及装置 | |
Lu et al. | A semi-automatic approach to detect structural components from CAD drawings for constructing as-is BIM objects | |
CN103678460A (zh) | 用于识别适于在多语言环境中进行通信的非文本元素的方法和系统 | |
CN103678280A (zh) | 翻译任务碎片化的方法 | |
CN110032736A (zh) | 一种文本分析方法、装置及存储介质 | |
CN104615639A (zh) | 一种用于提供图片的呈现信息的方法和设备 | |
Dehbi et al. | Robust and fast reconstruction of complex roofs with active sampling from 3D point clouds | |
CN106802958B (zh) | Cad数据到gis数据的转换方法及系统 | |
CN103678554A (zh) | 字符替换的方法和装置 | |
US20160364908A1 (en) | Analysis Model Creation Assistance System, Analysis Model Creation Assistance Device and Analysis Model Creation Assistance Program | |
CN104504221A (zh) | 一种评审数据处理方法和系统 | |
CN101814141A (zh) | 存储介质、字符识别方法以及字符识别设备 | |
CN104268545A (zh) | 一种电子档版式文件中的表格区域识别与内容栅格化方法 | |
CN105260878A (zh) | 辅助定密方法和装置 | |
CN102479150A (zh) | 一种软件可信评估的方法 | |
CN116257922B (zh) | 一种水利设施模型的编码方法、装置、终端设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |