CN107315817A - 电子图纸文本匹配方法、装置、存储介质和计算机设备 - Google Patents

电子图纸文本匹配方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN107315817A
CN107315817A CN201710523901.2A CN201710523901A CN107315817A CN 107315817 A CN107315817 A CN 107315817A CN 201710523901 A CN201710523901 A CN 201710523901A CN 107315817 A CN107315817 A CN 107315817A
Authority
CN
China
Prior art keywords
text
pel
combine
coordinate
original text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710523901.2A
Other languages
English (en)
Other versions
CN107315817B (zh
Inventor
周滔
陈晓
苗洪雷
罗建文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HNAC Technology Co Ltd
Original Assignee
HNAC Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HNAC Technology Co Ltd filed Critical HNAC Technology Co Ltd
Priority to CN201710523901.2A priority Critical patent/CN107315817B/zh
Publication of CN107315817A publication Critical patent/CN107315817A/zh
Application granted granted Critical
Publication of CN107315817B publication Critical patent/CN107315817B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种电子图纸文本匹配方法、装置、存储介质和计算机设备,电子图纸文本匹配方法包括:获取电子图纸中的预设类型的图元;依次以获取的各个图元为中心查找预设范围内的预设类型的图元;根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和对应图元内容不符合预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合预设格式的组合文本;获取各组合文本的坐标和各初始文本的坐标;根据组合文本的坐标和初始文本的坐标获取各初始文本配对的组合文本。如此,可自动完成电子图纸中初始文本和组合文本的匹配,匹配效率高且配对准确性高。

Description

电子图纸文本匹配方法、装置、存储介质和计算机设备
技术领域
本发明涉及数据处理技术领域,特别是涉及一种电子图纸文本匹配方法、装置、存储介质和计算机设备。
背景技术
电气设备的生产,首先需由技术部门设计电路图纸,然后将电路图纸交付给生产部门。电路图纸中可用文本注释多种信息,例如大多电路图纸中都会用注释文本标识电缆上套的号码管。电缆有两头,两头各套一个号码管,即一根电缆对应了两个号码管;生产部门的工作人员需要从电路图纸中找出各电缆对应的两个号码管的注释文本。
如图1所示,为电路图纸中的号码管的标记号码,其中方形框内1PJ可对应①、②、③、④、⑤等组合得到号码,比如1PJ:①、1PJ:②,得到电缆一端号码管的号码,方形框外的如T1-1:8、T3:5等为电缆另一端的号码管的号码,其对应关系1PJ:①对应T1-1:8。
通常,电路图纸采用电子图纸,比如CAD(Computer Aided Design计算机辅助设计)图纸。传统的从电子图纸中提取注释文本的方式,是由工作人员从电子图纸中查找同一电缆的两个号码管的注释文本,然后手动对应存入文档。这个人工匹配文本的过程要耗费大量时间和人力,匹配效率低。
发明内容
基于此,有必要针对传统的文本匹配效率低的问题,提供一种匹配效率高的电子图纸文本匹配方法、装置、存储介质和计算机设备。
一种电子图纸文本匹配方法,包括:
获取电子图纸中的预设类型的图元;
依次以获取的各个图元为中心查找预设范围内的所述预设类型的图元;
根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和对应图元内容不符合所述预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合所述预设格式的组合文本;
获取各组合文本的坐标和各初始文本的坐标;
根据所述组合文本的坐标和所述初始文本的坐标,获取各初始文本配对的组合文本。
一种电子图纸文本匹配装置,包括:
图元获取模块,用于获取电子图纸中的预设类型的图元;
图元查找模块,用于依次以获取的各个图元为中心查找预设范围内的所述预设类型的图元;
文本生成模块,用于根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和对应图元内容不符合所述预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合所述预设格式的组合文本;
坐标获取模块,用于获取各组合文本的坐标和各初始文本的坐标;
文本配对模块,用于根据所述组合文本的坐标和所述初始文本的坐标,获取各初始文本配对的组合文本。
上述电子图纸文本匹配方法和装置,通过获取电子图纸中的预设类型的图元,依次以获取的各个图元为中心查找预设范围内的预设类型的图元,根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和不符合预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合预设格式的组合文本,这样每查找一次,可得到作为中心的图元对应的组合文本和初始文本;然后获取各组合文本的坐标和各初始文本的坐标,根据组合文本的坐标和初始文本的坐标获取各初始文本配对的组合文本。如此,可自动完成电子图纸中初始文本和组合文本的匹配,不需要人工去查看图纸查找配对的文本,且减少了文本配对的时间,匹配效率高。同时,还可避免人工配导致的错误问题,配对准确性高。
一种存储介质,存储有计算机程序,存储的计算机程序被处理器执行时实现上述电子图纸文本匹配方法的步骤。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述电子图纸文本匹配方法的步骤。
上述存储介质和计算机设备,由于采用了上述电子图纸文本匹配方法,同理可自动完成电子图纸中初始文本和组合文本的匹配,不需要人工去查看图纸查找配对的文本,且减少了文本配对的时间,匹配效率高,配对准确性高。
附图说明
图1为一电子图纸的示意图;
图2为一实施例中电子图纸文本匹配方法的流程图;
图3为另一实施例中电子图纸文本匹配方法的流程图;
图4为一实施例中电子图纸文本匹配装置的结构图。
具体实施方式
参考图2,一实施例中的电子图纸文本匹配方法,包括以下步骤。
S110:获取电子图纸中的预设类型的图元。
图元为生成电子图纸的图形软件包中用来描述各种图形元素的函数;电子图纸中一般对应有多种类型的图元,比如文本、点、线等。根据电子图纸的文档格式解析对应文档后识别不同类型的图元对应的图元内容;比如,一个CAD图的一个文本框内标注X1,则该文本类型的图元对应的图元内容为X1。其中,预设类型可以为文本类型;预设类型也可以为其他类型,比如对应图元内容为文本的贴图类型。
具体地,步骤S110可以是从电子图纸的初始位置开始按照预设方向查找,依次得到预设类型的图元;比如,从电子图纸的左上角开始,按照从左往右、先上后下的方向扫描电子图纸,以查找预设类型的图元。可以理解,步骤S110还可以是按照其他方式,比如,先获取电子图纸中所有的图元,然后从所有图元中选取预设类型的图元。
S130:依次以获取的各个图元为中心查找预设范围内的预设类型的图元。
以一个预设类型的图元为中心进行查找时,预设类型的其他图元均若在预设范围内则可被查找到;换另一个预设类型的图元为中心进行查找时,前一个为中心的图元若在预设范围内则可被查找到。一个预设类型的图元可对应查找到多个预设类型的其他图元。
预设范围可以根据实际情况设置。具体地,以获取的图元为中心查找预设范围内的预设类型的图元,可以是以获取的图元为圆心、查找预设圆面积内的预设类型的图元,还可以是以获取的图元为中心、查找预设方形面积内的预设类型的图元。
S150:根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和对应图元内容不符合预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合预设格式的组合文本。
预设格式指预先约定的用于表示文本的格式,可以根据实际需要设置。查找到作为中心的图元对应的其他预设类型的图元后,可通过识别查找到的图元得到图元内容,对图元内容进行格式分析,若图元内容符合预设格式,则表示查找到的图元本身为文本,此时可作为初始文本;若图元内容不符合预设格式,则将对应图元作为基础图元用于与对应作为中心的图元生成组合文本。
S170:获取各组合文本的坐标和各初始文本的坐标。
电子图纸中每个图元都有一个坐标属性;例如,CAD图中每个图元对应有一个坐标属性。步骤S170具体可根据图元的坐标属性获取组合文本和初始文本的坐标。
S190:根据组合文本的坐标和初始文本的坐标,获取各初始文本配对的组合文本。
坐标可用于标识对应的文本在电子图纸中的位置,根据组合文本和初始文本的坐标获取初始文本和组合文本的位置关系,从而可根据组合文本和初始文本之间的位置关系确定配对关系。一个初始文本可配对一个组合文本。
上述电子图纸文本匹配方法,通过获取电子图纸中的预设类型的图元,依次以获取的各个图元为中心查找预设范围内的预设类型的图元,根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和不符合预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合预设格式的组合文本,这样每查找一次,可得到作为中心的图元对应的组合文本和初始文本;然后获取各组合文本的坐标和各初始文本的坐标,根据组合文本的坐标和初始文本的坐标获取各初始文本配对的组合文本。如此,可自动完成电子图纸中初始文本和组合文本的匹配,不需要人工去查看图纸查找配对的文本,且减少了文本配对的时间,匹配效率高。同时,还可避免人工匹配导致的错误问题,配对准确性高。
具体地,文本可以为号码。上述电子图纸文本匹配方法具体可应用于对电子图纸中电缆两端的号码管的号码配对,然后对应存储。例如,可以应用于CAD图纸中电缆号码管的号码匹配和提取,处理效率和准确性高。
在一实施例中,参考图3,步骤S150具体包括步骤(a1)和步骤(a2)。
步骤(a1):将对应查找到的图元分类为对应图元内容符合预设格式的第一原文本和对应图元内容不符合预设格式的基础图元,并从第一原文本中提取符合预设条件的第一原文本得到初始文本。
步骤(a2):根据作为中心的图元与对应查找到的基础图元组成对应图元内容符合预设格式的第二原文本,并从第二原文本中提取符合预设条件的第二原文本得到组合文本。
预设条件可以根据实际需要具体设置。将查找到的图元分为两类,一类为对应图元内容符合预设条件的第一原文本,不需要组合;另一类为对应图元内容不符合预设格式的基础图元,基础图元与作为中心的图元生成第二原文本。第一原文本和第二原文本可能符合预设条件,也可能不符合预设条件。比如,第一原文本和第二原文本为号码,预设条件为号码的末尾是数字,若第一原文本的末尾为数字,则提取作为初始文本,若第二原文本的末尾为数字,则提取作为组合文本。
通过在获取坐标之前,将对第一原文本和第二原文本进行筛选,去除不符合预设条件的第一原文本和第二原文本,使得得到的初始文本和组合文本均符合预设条件,可提高需获取坐标的组合文本和初始文本的准确性,从而提高匹配的准确性。
具体地,步骤S150之后,还可以根据各中心的图元对应的初始文本和组合文本生成各中心的图元对应的号码列表。即,每一次以图元为中心获取得到初始文本和组合文本后,生成组合文本和初始文本组成的号码列表,作为中心的图元对应的号码列表;一个图元对应一个号码列表。
在一实施例中,预设格式为依次按照标点符号前数据、标点符号、标点符号后数据组成文本的格式。具体地,标点符号可以为冒号,比如,符合预设格式的文本为X1:X2,其中,X1为标点符号前数据,X2为标点符号后数据。可以理解,在其他实施例中,标点符号还可以为其他,比如分号、点号等。
具体地,本实施例中,继续参考图3,步骤S170包括步骤S171和步骤S172。
S171:获取初始文本对应的图元坐标,得到初始文本的坐标。
图元坐标指图元的坐标属性所对应的坐标值,每一个图元对应有一个图元坐标。初始文本为对应图元内容符合预设格式的图元,没有经过组合,因此,直接将初始文本的图元坐标对应为初始文本的坐标。
S172:获取组合文本中标点符号后数据的图元坐标,得到对应组合文本的坐标。
组合文本为作为中心的图元与查找到的基础图元组合得到。一般将基础图元作为标点符号后数据,中心的图元和基础图元各对应有一个图元坐标;将标点符号后数据的图元坐标作为组合文本的坐标,统一各组合文本的坐标确定规则。可以理解,在其他实施例中,也可以获取组合文本中标点符号前数据的图元坐标得到对应组合文本的坐标。
在一实施例中,继续参考图3,步骤S170之后,步骤S190之前,还包括步骤S181和步骤S182。
S181:获取坐标相同的多个初始文本得到相同初始文本组,保留同一相同初始文本组中任意一个初始文本并删除同组内的其他初始文本。
由于初始文本对应为单个的图元,因此比较初始文本的坐标是否相同,即可检测初始文本是否为相同。从相同初始文本组中任选一个初始文本保留同时删除同组内的其他初始文本,可对初始文本去重处理。
S182:获取坐标和组成组合文本的图元均相同的多个组合文本得相同组合文本组,保留同一相同组合文本组中任意一个组合文本并删除同组内的其他组合文本。
组合文本对应有两个图元,坐标相同的初始文本有可能不是相同的组合文本,因此,通过比较组合文本的坐标和组成组合文本的图元来综合确定是否为同一个。比如,第一个组合文本为X1:X2,第二个组合文本为X3:X2,第一个组合文本的和第二个组合文本的坐标均等于图元X2的图元坐标,两者坐标相同;但是组成第一个组合文本的图元有X1和X2,组成第二个组合文本的图元有X3和X2,X1不同于X3,因此第一个组合文本和第二个组合文本不同。从相同组合文本组中任选一个组合文本保留同时删除同组内的其他组合文本,可对组合文本去重处理。
通过在步骤S190之前对初始文本和组合文本进行去重处理,可去除多余数据、减小初始文本和组合文本的数据量,匹配过程需要比对的数据量减少,从而提高配对效率。
在一实施例中,继续参考图3,步骤S190包括S191和步骤S192。
S191:根据各组合文本的坐标和各初始文本的坐标获取各组合文本和各初始文本之间的坐标距离。
获取到组合文本和初始文本的坐标后,可计算初始文本的坐标和组合文本对应的坐标之间的距离,作为对应的初始文本和组合文本之间的坐标距离。
S192:选取与各初始文本的坐标距离最小的组合文本,得到各初始文本配对的组合文本并对应存储。
一个初始文本对应的多个坐标距离,分别为初始文本与各个初始文本之间的坐标距离。坐标距离越小,则初始文本与组合文本之间的距离越近;初始文本对应的坐标距离最小的组合文本,与初始文本的距离最近,可作为与初始文本匹配的组合文本。
通过根据初始文本和组合文本的坐标计算坐标距离,选取最小的坐标距离进行初始文本和组合文本的配对存储,方便快捷,且准确性好。可以理解,在其他实施例中,步骤S190也可以采用其他方式进行配对。
在一实施例中,步骤S192包括步骤(a1)至步骤(a3)。
步骤(a1):选取与当前的初始文本的坐标距离最小的组合文本,得到当前的初始文本配对的组合文本并对应存储。
初始文本有多个,可依次对各个初始文本进行配对。具体地,在步骤(a1)之前,还可以包括排序步骤:根据预设规则对所有的初始文本进行排序。预设规则根据实际需要设置,比如,可以是按照获取初始文本的时间先后进行排序。
步骤(a2):从初始文本和组合文本组成的号码集合中删除已配对的初始文本和对应的组合文本得到新的号码集合。
步骤(a3):从新的号码集合中选取下一个初始文本得到新的当前的初始文本,并返回步骤(a1),直到当前的初始文本为最后一个初始文本。
对多个初始文本循环配对的过程中,当前的初始文本找到配对的组合文本并对应存储后,从号码集合中删除,可避免已配对的文本对后续配对过程有干扰,确保配对文本的唯一性,提高配对的准确性。
一种存储介质,存储有计算机程序,存储的计算机程序被处理器执行时实现上述电子图纸文本匹配方法的步骤。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述电子图纸文本匹配方法的步骤。
上述存储介质和计算机设备,由于采用了上述电子图纸文本匹配方法,同理可自动完成电子图纸中初始文本和组合文本的匹配,不需要人工去查看图纸查找配对的文本,且减少了文本配对的时间,匹配效率高,配对准确性高。
参考图4,一种电子图纸文本匹配装置,包括图元获取模块110、图元查找模块130、文本生成模块150、坐标获取模块170和文本配对模块190。
图元获取模块110用于获取电子图纸中的预设类型的图元。
图元查找模块130用于依次以获取的各个图元为中心查找预设范围内的预设类型的图元。
文本生成模块150用于根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和对应图元内容不符合预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合预设格式的组合文本。
坐标获取模块170用于获取各组合文本的坐标和各初始文本的坐标。
文本配对模块190用于根据组合文本的坐标和初始文本的坐标,获取各初始文本配对的组合文本。
上述电子图纸文本匹配装置,通过图元获取模块110获取电子图纸中的预设类型的图元,图元查找模块130依次以获取的各个图元为中心查找预设范围内的预设类型的图元,文本生成模块150根据对应查找到的图元获取符合预设格式的初始文本和不符合预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成符合预设格式的组合文本,这样每查找一次,可得到为中心的图元对应的组合文本和初始文本;然后坐标获取模块170获取得到的各组合文本的坐标和各初始文本的坐标,文本配对模块190根据组合文本的坐标和初始文本的坐标获取各初始文本配对的组合文本。如此,可自动完成电子图纸中初始文本和组合文本的匹配,不需要人工去查看图纸查找配对的文本,且减少了配对的时间,匹配效率高。同时,还可避免人工匹配导致的错误问题,配对准确性高。
文本生成模块150和坐标获取模块170可采用上述电子图纸文本匹配方法中所述的方法具体实现获取初始文本和组合文本的坐标,在此不做赘述。
在一实施例中,上述电子图纸文本匹配装置还包括初始文本筛选模块(图未示)和组合文本筛选模块(图未示)。
初始文本筛选模块用于在坐标获取模块获取各组合文本和各初始文本的坐标后,文本配对模块获取各初始文本配对的组合文本之前,获取坐标相同的多个初始文本得到相同初始文本组,保留同一相同初始文本组中任意一个初始文本并删除同组内的其他初始文本;
组合文本筛选模块用于在坐标获取模块获取各组合文本和各初始文本的坐标后,文本配对模块获取各初始文本配对的组合文本之前,获取坐标和组成组合文本的图元均相同的多个组合文本得相同组合文本组,保留同一相同组合文本组中任意一个组合文本并删除同组内的其他组合文本。
通过在文本匹配之前对初始文本和组合文本进行去重处理,可去除多余数据、减小初始文本和组合文本的的数据量,匹配过程需要比对的数据量减少,从而提高配对效率。
在一实施例中,文本配对模块190包括距离计算单元(图未示)和配对存储单元(图未示)。
距离计算单元用于根据各组合文本的坐标和各初始文本的坐标获取各组合文本和各初始文本之间的坐标距离。
配对存储单元用于选取与各初始文本的坐标距离最小的组合文本,得到各初始文本配对的组合文本并对应存储。
通过根据初始文本和组合文本的坐标计算坐标距离,选取最小的坐标距离进行初始文本和组合文本的配对存储,方便快捷,且准确性好。
具体地,配对存储单元可采用上述电子图纸文本匹配方法中所述的方法实现对应功能,在此不做赘述。
以具体应用例中,采用上述电子图纸文本匹配方法提取图1中的配对号码。获取文本类型的图元。以“1PJ”为中心查找文本类型的其他图元,将得到以下列表:
1PJ:A;
1PJ:B;
1PJ:2;
1PJ:3;
1PJ:1;
1PJ:4;
1PJ:10;
2PJ:12;
T17:1;
2PJ:13;
T17:2;
T1-1:8;
T3:6;
T1-1:11;
T3:13;
T1-1:10;
T3:21;
T1-1:15;
其中,从2PJ:12开始,之后的号码为初始文本,2PJ:12之前的号码为组合文本。同样以“2PJ”为中心查找文本类型的图元也会得出一个列表。各个图元对应的列表组成号码集合。最终,根据号码集合中的各组合文本和初始文本的坐标进行配对,则得到各初始文本对应的组合文本,比如1PJ:4~T3:13。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种电子图纸文本匹配方法,其特征在于,包括:
获取电子图纸中的预设类型的图元;
依次以获取的各个图元为中心查找预设范围内的所述预设类型的图元;
根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和对应图元内容不符合所述预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合所述预设格式的组合文本;
获取各组合文本的坐标和各初始文本的坐标;
根据所述组合文本的坐标和所述初始文本的坐标,获取各初始文本配对的组合文本。
2.根据权利要求1所述的电子图纸文本匹配方法,其特征在于,所述根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和对应图元内容不符合所述预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合所述预设格式的组合文本,包括:
将对应查找到的图元分类为对应图元内容符合所述预设格式的第一原文本和对应图元内容不符合所述预设格式的基础图元,并从所述第一原文本中提取符合预设条件的第一原文本得到所述初始文本;
根据作为中心的图元与对应查找到的基础图元组成对应图元内容符合所述预设格式的第二原文本,并从所述第二原文本中提取符合所述预设条件的第二原文本得到所述组合文本。
3.根据权利要求1所述的电子图纸文本匹配方法,其特征在于,所述获取各组合文本的坐标和各初始文本的坐标之后,所述根据所述组合文本的坐标和所述初始文本的坐标,获取各初始文本配对的组合文本之前,还包括:
获取坐标相同的多个初始文本得到相同初始文本组,保留同一相同初始文本组中任意一个初始文本并删除同组内的其他初始文本;
获取坐标和组成所述组合文本的图元均相同的多个组合文本得相同组合文本组,保留同一相同组合文本组中任意一个组合文本并删除同组内的其他组合文本。
4.根据权利要求1所述的电子图纸文本匹配方法,其特征在于,所述根据所述组合文本的坐标和所述初始文本的坐标,获取各初始文本配对的组合文本,包括:
根据各组合文本的坐标和各初始文本的坐标获取各组合文本和各初始文本之间的坐标距离;
选取与各初始文本的坐标距离最小的组合文本,得到各初始文本配对的组合文本并对应存储。
5.根据权利要求4所述的电子图纸文本匹配方法,其特征在于,所述选取与各初始文本的坐标距离最小的组合文本,得到各初始文本配对的组合文本并对应存储,包括:
选取与当前的初始文本的坐标距离最小的组合文本,得到当前的初始文本配对的组合文本并对应存储;
从所述初始文本和所述组合文本组成的号码集合中删除已配对的初始文本和对应的组合文本得到新的号码集合;
从新的号码集合中选取下一个初始文本得到新的当前的初始文本,并返回所述选取与当前的初始文本的坐标距离最小的组合文本,得到当前的初始文本配对的组合文本并对应存储的步骤,直到当前的初始文本为最后一个初始文本。
6.根据权利要求1所述的电子图纸文本匹配方法,其特征在于,所述预设格式为依次按照标点符号前数据、标点符号、标点符号后数据组成文本的格式,所述获取各组合文本的坐标和各初始文本的坐标,包括:
获取所述初始文本对应的图元坐标,得到所述初始文本的坐标;
获取所述组合文本中所述标点符号后数据的图元坐标,得到对应组合文本的坐标。
7.一种存储介质,存储有计算机程序,其特征在于,存储的计算机程序被处理器执行时实现如权利要求1-6中任一项所述方法的步骤。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6任一项所述方法的步骤。
9.一种电子图纸文本匹配装置,其特征在于,包括:
图元获取模块,用于获取电子图纸中的预设类型的图元;
图元查找模块,用于依次以获取的各个图元为中心查找预设范围内的所述预设类型的图元;
文本生成模块,用于根据对应查找到的图元获取对应图元内容符合预设格式的初始文本和对应图元内容不符合所述预设格式的基础图元,并根据作为中心的图元与对应查找到的基础图元生成对应图元内容符合所述预设格式的组合文本;
坐标获取模块,用于获取各组合文本的坐标和各初始文本的坐标;
文本配对模块,用于根据所述组合文本的坐标和所述初始文本的坐标,获取各初始文本配对的组合文本。
10.根据权利要求9所述的电子图纸文本匹配装置,其特征在于,还包括:
初始文本筛选模块,用于在所述坐标获取模块获取各组合文本和各初始文本的坐标后,所述文本配对模块获取各初始文本配对的组合文本之前,获取坐标相同的多个初始文本得到相同初始文本组,保留同一相同初始文本组中任意一个初始文本并删除同组内的其他初始文本;
组合文本筛选模块,用于在所述坐标获取模块获取各组合文本和各初始文本的坐标后,所述文本配对模块获取各初始文本配对的组合文本之前,获取坐标和组成所述组合文本的图元均相同的多个组合文本得相同组合文本组,保留同一相同组合文本组中任意一个组合文本并删除同组内的其他组合文本。
CN201710523901.2A 2017-06-30 2017-06-30 电子图纸文本匹配方法、装置、存储介质和计算机设备 Active CN107315817B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710523901.2A CN107315817B (zh) 2017-06-30 2017-06-30 电子图纸文本匹配方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710523901.2A CN107315817B (zh) 2017-06-30 2017-06-30 电子图纸文本匹配方法、装置、存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN107315817A true CN107315817A (zh) 2017-11-03
CN107315817B CN107315817B (zh) 2020-06-02

Family

ID=60179834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710523901.2A Active CN107315817B (zh) 2017-06-30 2017-06-30 电子图纸文本匹配方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN107315817B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147429A (zh) * 2019-04-15 2019-08-20 平安科技(深圳)有限公司 文本比较方法、装置、计算机设备和存储介质
CN110765893A (zh) * 2019-09-30 2020-02-07 万翼科技有限公司 图纸文件识别方法、电子设备及相关产品
CN111144114A (zh) * 2019-12-19 2020-05-12 广联达科技股份有限公司 一种文本识别方法及装置
CN111160144A (zh) * 2019-12-16 2020-05-15 广东施富电气实业有限公司 电气图纸图文结合的元器件识别方法、系统及存储介质
CN111177448A (zh) * 2019-12-30 2020-05-19 湖南特能博世科技有限公司 离散图形组合方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693334A (zh) * 2012-03-01 2012-09-26 成都鹏业软件股份有限公司 基于cad电子图纸的动态构件识别方法
CN103500257A (zh) * 2013-10-16 2014-01-08 苏州利驰电子商务有限公司 Dwg格式图纸识别方法及系统
CN103514303A (zh) * 2013-10-29 2014-01-15 苏州利驰电子商务有限公司 电气元件接线图识别方法及系统
CN106599324A (zh) * 2017-01-20 2017-04-26 深圳市晋铭航空技术有限公司 一种cad数据抓取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693334A (zh) * 2012-03-01 2012-09-26 成都鹏业软件股份有限公司 基于cad电子图纸的动态构件识别方法
CN102693334B (zh) * 2012-03-01 2015-07-29 成都鹏业软件股份有限公司 基于cad电子图纸的动态构件识别方法
CN103500257A (zh) * 2013-10-16 2014-01-08 苏州利驰电子商务有限公司 Dwg格式图纸识别方法及系统
CN103514303A (zh) * 2013-10-29 2014-01-15 苏州利驰电子商务有限公司 电气元件接线图识别方法及系统
CN106599324A (zh) * 2017-01-20 2017-04-26 深圳市晋铭航空技术有限公司 一种cad数据抓取方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147429A (zh) * 2019-04-15 2019-08-20 平安科技(深圳)有限公司 文本比较方法、装置、计算机设备和存储介质
CN110147429B (zh) * 2019-04-15 2023-08-15 平安科技(深圳)有限公司 文本比较方法、装置、计算机设备和存储介质
CN110765893A (zh) * 2019-09-30 2020-02-07 万翼科技有限公司 图纸文件识别方法、电子设备及相关产品
CN110765893B (zh) * 2019-09-30 2022-03-22 万翼科技有限公司 图纸文件识别方法、电子设备及相关产品
CN111160144A (zh) * 2019-12-16 2020-05-15 广东施富电气实业有限公司 电气图纸图文结合的元器件识别方法、系统及存储介质
CN111160144B (zh) * 2019-12-16 2023-04-07 广东施富电气实业有限公司 电气图纸图文结合的元器件识别方法、系统及存储介质
CN111144114A (zh) * 2019-12-19 2020-05-12 广联达科技股份有限公司 一种文本识别方法及装置
CN111144114B (zh) * 2019-12-19 2023-07-18 广联达科技股份有限公司 一种文本识别方法及装置
CN111177448A (zh) * 2019-12-30 2020-05-19 湖南特能博世科技有限公司 离散图形组合方法、装置及电子设备
CN111177448B (zh) * 2019-12-30 2023-05-12 湖南特能博世科技有限公司 离散图形组合方法、装置及电子设备

Also Published As

Publication number Publication date
CN107315817B (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
CN107315817A (zh) 电子图纸文本匹配方法、装置、存储介质和计算机设备
CN111582169B (zh) 图像识别数据纠错方法、装置、计算机设备和存储介质
Al-Zaidy et al. A machine learning approach for semantic structuring of scientific charts in scholarly documents
US10956731B1 (en) Heading identification and classification for a digital document
CN103020619B (zh) 一种自动切分电子化笔记本中手写条目的方法
CN105493078B (zh) 彩色草图图像搜索
Wilkinson et al. Neural Ctrl-F: segmentation-free query-by-string word spotting in handwritten manuscript collections
CN104199842B (zh) 一种基于局部特征邻域信息的相似图片检索方法
EP3104302A1 (en) A method of digitalising engineering documents
US20210240932A1 (en) Data extraction and ordering based on document layout analysis
CN106844482B (zh) 一种基于搜索引擎的检索信息匹配方法及装置
CN109213886B (zh) 基于图像分割和模糊模式识别的图像检索方法及系统
Sharma et al. High‐level feature aggregation for fine‐grained architectural floor plan retrieval
CN105468732A (zh) 一种图像关键词检查方法及装置
CN111680506A (zh) 数据库表的外键映射方法、装置、电子设备和存储介质
Jiang et al. Gestalt-based feature similarity measure in trademark database
Kalaiarasi et al. Clustering of near duplicate images using bundled features
CN112445926B (zh) 一种图像检索方法以及装置
CN108121806A (zh) 一种基于局部特征匹配的图像搜索方法及系统
US20230138491A1 (en) Continuous learning for document processing and analysis
Kallimani et al. Extraction and interpretation of charts in technical documents
CN116343237A (zh) 基于深度学习和知识图谱的票据识别方法
Jessen et al. Text localization in scientific figures using fully convolutional neural networks on limited training data
Joshi et al. Image retrieval system using intuitive descriptors
Diem et al. Semi-automated document image clustering and retrieval

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant