CN106599324B - 一种cad数据抓取方法 - Google Patents

一种cad数据抓取方法 Download PDF

Info

Publication number
CN106599324B
CN106599324B CN201710041327.7A CN201710041327A CN106599324B CN 106599324 B CN106599324 B CN 106599324B CN 201710041327 A CN201710041327 A CN 201710041327A CN 106599324 B CN106599324 B CN 106599324B
Authority
CN
China
Prior art keywords
primitive
data
serial number
valid
cad
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710041327.7A
Other languages
English (en)
Other versions
CN106599324A (zh
Inventor
李华林
丁文勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jinming Aviation Technology Co ltd
Original Assignee
Shenzhen Jinming Aviation Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jinming Aviation Technology Co ltd filed Critical Shenzhen Jinming Aviation Technology Co ltd
Priority to CN201710041327.7A priority Critical patent/CN106599324B/zh
Publication of CN106599324A publication Critical patent/CN106599324A/zh
Application granted granted Critical
Publication of CN106599324B publication Critical patent/CN106599324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种CAD数据抓取方法,包括:步骤S1,新建一个与CAD文件相关联的EXCEL表格;步骤S2,控制并提示选择CAD文件的图元,直到所选择的图元有效则跳至步骤S3;步骤S3,分析所述图元中的数据,得到图元中数据的有效内容;步骤S4,将得到图元中数据的有效内容按顺序输出至所述EXCEL表格中;步骤S5,判断是否已经完成需要的所有图元的数据抓取,若否则返回步骤S2,若是则结束。本发明通过新建一个与CAD文件相关联的EXCEL表格,然后通过CAD软件自带的拾取图元函数选择所述CAD文件中的图元,再分析得到图元中数据的有效内容,最后将其按顺序输出,能够通获得准确无误的抓取数据,操作简易且有效。

Description

一种CAD数据抓取方法
技术领域
本发明涉及一种数据抓取方法,尤其涉及一种CAD数据抓取方法。
背景技术
目前,CAD文件中图元的数据导出不外乎两种方法,第一种是通过CAD软件内部功能,但结果是没有针对性,需要用户花大量的时间对这些杂乱的数据进行整理,而且在整理和查找使用数据的过程中出错的机会很大,使用起来非常麻烦;第二种是通过电脑的基本操作“复制、粘贴”来实现图元中数据的提取,操作繁琐且非常容易出错。其中,CAD文件里面不同方式画出来的图会变成不同图元,比如多段线、直线、块、单行文字、多行文字以及标注等,在CAD文件中其实就是对应的一个个图元。
发明内容
本发明所要解决的技术问题是需要提供一种操作简单且能够将图元对应数据准确无误导出至EXCEL表格中的CAD数据抓取方法。
对此,本发明提供一种CAD数据抓取方法,包括以下步骤:
步骤S1,初始化,并新建一个与CAD文件相关联的EXCEL表格;
步骤S2,控制并提示选择CAD文件中的图元,直到所选择的图元有效则跳转至步骤S3;
步骤S3,分析所述图元中的数据,得到图元中数据的有效内容;
步骤S4,将得到图元中数据的有效内容按顺序输出至所述EXCEL表格中;
步骤S5,判断是否已经完成需要的所有图元的数据抓取,若否则返回步骤S2,若是则结束。
本发明的进一步改进在于,所述步骤S2包括以下子步骤:
步骤S201,控制并提示选择CAD文件中的序号文字图元;
步骤S202,判断所述序号文字图元是否为有效序号,若否则返回步骤S201,若是则跳转至步骤S203;
步骤S203,控制并提示选择CAD文件中有效序号对应的标注图元;
步骤S204,判断所述标注图元是否为有效标注,若否则返回步骤S203,若是则跳转至步骤S3。
本发明的进一步改进在于,所述步骤S202中,若所述序号文字图元为阿拉伯数字,则判定该序号文字图元为有效序号。
本发明的进一步改进在于,所述步骤S204中,若所述标注图元符合CAD文件中标注的格式,则判定该标注图元为有效标注。
本发明的进一步改进在于,所述步骤S3中,通过正则表达式替换所述图元中的有效标注后,得到有效序号和正则表达式替换后的有效标注,并以此作为所述图元中数据的有效内容。
本发明的进一步改进在于,所述步骤S3中,通过正则表达式替换所述图元中的有效标注的数据包括:将所述图元中的有效标注的字符属性符号和指标符号替换为空格。
本发明的进一步改进在于,所述步骤S1包括以下子步骤:
步骤S101,初始化,并新建一个EXCEL表格;
步骤S102,获取所述EXCEL表格的变量名;
步骤S103,通过CAD文件中的可扩展接口记录所述EXCEL表格的变量名,以完成所述CAD文件与EXCEL表格之间的关联。
本发明的进一步改进在于,所述步骤S2中,通过CAD软件自带的拾取图元函数选择所述CAD文件中的图元,并发出拾取提示信息。
本发明的进一步改进在于,所述步骤S4中,将所述步骤S3中得到的有效序号和正则表达式替换后的有效标注一并输入至所述EXCEL表格的同一行中。
本发明的进一步改进在于,所述步骤S5中,判断当前图元是否为用户选择的最后一个图元,若否则返回步骤S2,若是则结束。
与现有技术相比,本发明的有益效果在于:通过新建一个与CAD文件相关联的EXCEL表格,然后通过CAD软件自带的拾取图元函数选择所述CAD文件中的文字序号图元和标注图元,再分析得到图元中数据的有效内容,最后将其按顺序输出至所述EXCEL表格中,这样,就能够通过所述CAD数据抓取方法获得准确无误的数据,操作简易,能够明显提高技术人员的工作效率,避免错误数据的输出。
附图说明
图1是本发明一种实施例的工作流程示意图;
图2是本发明一种实施例的详细工作流程示意图。
具体实施方式
下面结合附图,对本发明的较优的实施例作进一步的详细说明。
如图1所示,本例提供一种CAD数据抓取方法,包括以下步骤:
步骤S1,初始化,并新建一个与CAD文件相关联的EXCEL表格;
步骤S2,控制并提示选择CAD文件中的图元,直到所选择的图元有效则跳转至步骤S3;
步骤S3,分析所述图元中的数据,得到图元中数据的有效内容;
步骤S4,将得到图元中数据的有效内容按顺序输出至所述EXCEL表格中;
步骤S5,判断是否已经完成需要的所有图元的数据抓取,若否则返回步骤S2,若是则结束。
本例所述步骤S1中,所述初始化指的是初始化CAD文件与EXCEL表格之间的数据交换,同时新建一个与CAD文件相关联的EXCEL表格。在实现过程中,由于CAD软件和EXCEL表格本身都预留了可扩展接口,直接利用这种预留的可扩展接口就可以对其初始化;在新建一个EXCEL表格时,在建立EXCEL表格的同时能够获取一个对应该新建EXCEL表格的变量名xlapp,通过软件程序记录下该变量名xlapp即可完成CAD文件与EXCEL表格之间的关联关系。
也就是说,本例所述步骤S1包括以下子步骤:
步骤S101,初始化,并新建一个EXCEL表格;
步骤S102,获取所述EXCEL表格的变量名;
步骤S103,通过CAD文件中的可扩展接口记录所述EXCEL表格的变量名,以完成所述CAD文件与EXCEL表格之间的关联。
本例所述步骤S2中,通过CAD软件自带的拾取图元函数选择所述CAD文件中的图元,并发出拾取提示信息。
由于CAD软件本身包括了自带的拾取图元函数,即entsel函数,在实现过程中,通过点选序号文字图元和标注图元就能够采用该CAD软件自带的拾取图元函数实现函数调用,进而通过拾取图元函数的函数调用选择CAD文件中的图元,这个操作过程很简单。
如图2所示,更为具体的,本例所述步骤S2优选包括以下子步骤:
步骤S201,通过所述拾取图元函数控制并提示选择CAD文件中的序号文字图元;
步骤S202,判断所述序号文字图元是否为有效序号,若否则返回步骤S201,若是则跳转至步骤S203;
步骤S203,通过所述拾取图元函数控制并提示选择CAD文件中有效序号对应的标注图元;
步骤S204,判断所述标注图元是否为有效标注,若否则返回步骤S203,若是则跳转至步骤S3。
本例所述步骤S202中,若所述序号文字图元为阿拉伯数字,则判定该序号文字图元为有效序号。
在实际应用中,CAD文件里面有很多种图元,例如多段线、序号文字、标注、直线和块等。当用户点击一个图元后,可以获取这个图元的各种属性,包括其图元类型和文字内容。那么,本例所述步骤S202中,通过点击图元获取其图元的数据,首先判断拾取的这个图元的数据是不是序号文字图元,若是序号文字图元则接着判断该序号文字图元是不是阿拉伯数字,这两个条件中的任意一个条件不符合,即跳转至步骤S201,直到达到拾取的这个图元是序号文字图元且该序号文字图元为阿拉伯数字这两个条件,则判定该序号文字图元为有效序号,此时自动记录拾取和识别到的序号文字(即为序号)。
本例所述步骤S204中,若所述标注图元符合CAD文件中标注的格式,则判定该标注图元为有效标注。也就是说,所述步骤S204的原理与步骤S202基本一致,是将步骤S202的判断序号文字图元是否为阿拉伯数字替换为步骤S204的判断标注图元是否为CAD文件中的标准标注,若是则满足。
值得一提的是,本例所述步骤S3中,通过正则表达式替换所述图元中的有效标注后,得到有效序号和正则表达式替换后的有效标注,并以此作为所述图元中数据的有效内容。
之所以需要设置所述步骤S3,是因为通过所述步骤S204得到有效标注后,由于CAD文件中的标注图元本身存在一定的格式,比如某一个标注图元所获取的文字内容可能为“\\A1;
Figure BDA0001214745280000041
9.6\\S+0.05^-0.00;{\\fSimSun|b0|i0|c134|p2;通\\PRa1.6”,这一段乱码就是从标注图元所获取的文字信息,但这种文字信息不是用户平常的标准描述,因此,本例通过正则表达式去除干扰信息,将有效标注变成正则表达式替换后的有效标注,进而得到用户需要的标准信息。
从上面可以看到,有效标注中除了文字内容之外,还包括了一些特殊字符以及CAD后台的字符属性符号和指标符号等内容,进而使得步骤S204得到的有效标注含有很多乱码。而本例对这些CAD后台的字符属性符号和指标符号等格式符号信息并不关注,只是需要提出有效的文字内容即可。比如“\\A1;
Figure BDA0001214745280000051
9.6\\S+0.05^-0.00;{\\fSimSun|b0|i0|c134|p2;通\\PRa1.6”的有效的文字内容其实就是“
Figure BDA0001214745280000057
9.6+0.05^-0.00”,因此,本例优选利用正则表达式将不必要的内容替换掉。
具体的,所述步骤S3中,通过正则表达式替换所述图元中的有效标注的数据包括:将所述图元中的有效标注的字符属性符号和指标符号替换为空格。
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。
本例所述步骤S3中,通过正则表达式替换所述图元中的有效标注的数据还能够进一步包括:将特殊符号
Figure BDA0001214745280000052
替换为D,并将堆迭格式^替换为\,进而将“
Figure BDA0001214745280000053
9.6+0.05^-0.00”替换为更加通用的“D9.6+0.05\-0.00”。当然,这个特殊符号
Figure BDA0001214745280000054
和堆迭格式^的替换,属于优选的步骤,在实际应用中,还可以将特殊符号
Figure BDA0001214745280000055
和堆迭格式^替换为其他用户自定义的习惯符号。
因此,所述步骤S3分析所述图元中的数据,得到图元中数据的有效内容;其实就是分析并去除所述有效标注中的干扰信息,即去除CAD后台的字符属性符号和指标符号等格式符号信息,或去除CAD后台的字符属性符号和指标符号并去除特殊符号
Figure BDA0001214745280000056
和堆迭格式^,进而得到正则表达式替换后的有效标注,使得抓取的数据简单易懂。
本例所述步骤S4中,将所述步骤S3中得到的有效序号和正则表达式替换后的有效标注一并输入至所述EXCEL表格的同一行中。比如第i个有效序号和第i个有效序号对应的正则表达式替换后的有效标注,则输入至所述EXCEL表格的第i行中,以便下一项序号文字图元和标注图元的有效内容能够输出至下一行(i+1)中,i为自然数。
本例所述步骤S5中,判断当前图元是否为用户选择的最后一个图元,若否则返回步骤S2,若是则结束。也就是说,所述步骤S5其实就是循环执行步骤S2至步骤S4,直到根据用户需要终止速搜CAD数据的抓取为止。
综上,本例通过新建一个与CAD文件相关联的EXCEL表格,启动EXCEL表格的功能,然后通过CAD软件自带的拾取图元函数选择所述CAD文件中的文字序号图元和标注图元,再分析得到图元中数据的有效内容,最后将其按顺序输出至所述EXCEL表格中,这样,就能够通过所述CAD数据抓取方法获得准确无误的数据,操作简易且有效,能够明显提高技术人员的工作效率,避免错误数据的输出。事实上,申请人所在公司已对本例所述CAD数据抓取方法进行了测试实验,实验表明其效果相当好,同样的工作量能节省80%以上的时间。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (3)

1.一种CAD数据抓取方法,其特征在于,包括以下步骤:
步骤S1,初始化,并新建一个与CAD文件相关联的EXCEL表格;
步骤S2,控制并提示选择CAD文件中的图元,直到所选择的图元有效则跳转至步骤S3;
步骤S3,分析所述图元中的数据,得到图元中数据的有效内容;
步骤S4,将得到图元中数据的有效内容按顺序输出至所述EXCEL表格中;
步骤S5,判断是否已经完成需要的所有图元的数据抓取,若否则返回步骤S2,若是则结束;所述步骤S2包括以下子步骤:
步骤S201,控制并提示选择CAD文件中的序号文字图元;
步骤S202,判断所述序号文字图元是否为有效序号,若否则返回步骤S201,若是则跳转至步骤S203;
步骤S203,控制并提示选择CAD文件中有效序号对应的标注图元;
步骤S204,判断所述标注图元是否为有效标注,若否则返回步骤S203,若是则跳转至步骤S3;
所述步骤S202中,通过点击图元获取其图元的数据,首先判断拾取的这个图元的数据是不是序号文字图元,若是序号文字图元则接着判断该序号文字图元是不是阿拉伯数字,这两个条件中的任意一个条件不符合,即跳转至步骤S201,直到达到拾取的这个图元是序号文字图元且该序号文字图元为阿拉伯数字,则判定该序号文字图元为有效序号,此时跳转至步骤S203自动记录拾取和识别到的序号;
所述步骤S3中,通过正则表达式替换所述图元中的有效标注后,得到有效序号和正则表达式替换后的有效标注,并以此作为所述图元中数据的有效内容,通过正则表达式替换所述图元中的有效标注的数据包括:将所述图元中的有效标注的字符属性符号和指标符号替换为空格;将特殊符号∅替换为D,并将堆迭格式^替换为\;
所述步骤S202中,若所述序号文字图元为阿拉伯数字,则判定该序号文字图元为有效序号;所述步骤S204中,若所述标注图元符合CAD文件中标注的格式,则判定该标注图元为有效标注;所述步骤S4中,将所述步骤S3中得到的有效序号和正则表达式替换后的有效标注一并输入至所述EXCEL表格的同一行中;所述步骤S5中,判断当前图元是否为用户选择的最后一个图元,若否则返回步骤S2,若是则结束。
2.根据权利要求1所述的CAD数据抓取方法,其特征在于,所述步骤S1包括以下子步骤:
步骤S101,初始化,并新建一个EXCEL表格;
步骤S102,获取所述EXCEL表格的变量名;
步骤S103,通过CAD文件中的可扩展接口记录所述EXCEL表格的变量名,以完成所述CAD文件与EXCEL表格之间的关联。
3.根据权利要求1所述的CAD数据抓取方法,其特征在于,所述步骤S2中,通过CAD软件自带的拾取图元函数选择所述CAD文件中的图元,并发出拾取提示信息。
CN201710041327.7A 2017-01-20 2017-01-20 一种cad数据抓取方法 Active CN106599324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710041327.7A CN106599324B (zh) 2017-01-20 2017-01-20 一种cad数据抓取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710041327.7A CN106599324B (zh) 2017-01-20 2017-01-20 一种cad数据抓取方法

Publications (2)

Publication Number Publication Date
CN106599324A CN106599324A (zh) 2017-04-26
CN106599324B true CN106599324B (zh) 2020-04-07

Family

ID=58585941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710041327.7A Active CN106599324B (zh) 2017-01-20 2017-01-20 一种cad数据抓取方法

Country Status (1)

Country Link
CN (1) CN106599324B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107315817B (zh) * 2017-06-30 2020-06-02 华自科技股份有限公司 电子图纸文本匹配方法、装置、存储介质和计算机设备
CN108763382A (zh) * 2018-05-18 2018-11-06 中铁山桥集团有限公司 一种将CAD程序中的图表内容导入到Excel程序中的方法
CN110083887A (zh) * 2019-04-08 2019-08-02 上海电气研砼建筑科技集团有限公司 一种cad图形库物料统计系统
CN114117618B (zh) * 2021-12-10 2024-10-18 万投(海南)企业管理有限公司 一种基于bim的梁自动化校核方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010108473A (ja) * 2008-09-30 2010-05-13 Sanmi:Kk 図面作成ソフト、家具の加工・見積ソフト
CN102831267A (zh) * 2012-08-10 2012-12-19 广州普邦园林股份有限公司 一种基于cad软件的施工图自动编排目录的方法
CN104954133A (zh) * 2015-05-07 2015-09-30 深圳市共进电子股份有限公司 证书写入校验方法及装置
CN105159685A (zh) * 2015-09-28 2015-12-16 武汉中冶易新科技有限公司 一种提取CAD图纸明细内容至Excel表格的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010108473A (ja) * 2008-09-30 2010-05-13 Sanmi:Kk 図面作成ソフト、家具の加工・見積ソフト
CN102831267A (zh) * 2012-08-10 2012-12-19 广州普邦园林股份有限公司 一种基于cad软件的施工图自动编排目录的方法
CN104954133A (zh) * 2015-05-07 2015-09-30 深圳市共进电子股份有限公司 证书写入校验方法及装置
CN105159685A (zh) * 2015-09-28 2015-12-16 武汉中冶易新科技有限公司 一种提取CAD图纸明细内容至Excel表格的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CAD绘图与Excel函数应用有机结合,快速处理煤矿供电系统图电缆数据_马俊;马俊、刘院;《科技与管理》;20141231;第111-112页 *
供配电CAD 工程图中文本和数据的智能识别与匹配;宋晓波、陈宇拓;《电脑编程技巧与维护》;20120831;第116-117页 *

Also Published As

Publication number Publication date
CN106599324A (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
CN109948134B (zh) 一种报告自动生成方法、系统及电子设备和存储介质
CN106599324B (zh) 一种cad数据抓取方法
US9449031B2 (en) Sorting and filtering a table with image data and symbolic data in a single cell
CN101122899B (zh) 报表的生成方法和设备
CN110765770A (zh) 一种合同自动生成方法及装置
US20090024667A1 (en) Information processing device, file data merging method, file naming method, and file data output method
JP2008276766A (ja) フォーム自動埋込方法及び装置
CN100444591C (zh) 获取网页关键字的方法及其应用系统
CN110515951B (zh) 一种bom标准化方法、系统及电子设备和存储介质
US20140245121A1 (en) Creating and Switching a View of a Collection Including Image Data and Symbolic Data
CN110728123B (zh) 一种报表生成方法、系统及相关设备
CN101008940B (zh) 自动处理字体缺失的方法与装置
CN104978333A (zh) 基于Excel统计报表与web技术自动匹配方法
CN107463537A (zh) 一种对文本信息进行结构化处理的方法
JP2005216203A (ja) 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置
CN104123074A (zh) 关注区域推定装置、方法及程序
CN101968782A (zh) 报表表样转换系统及方法
CN107562450A (zh) 一种地方志资源跨平台可视化方法
CN111898351B (zh) 基于Aviator的Excel数据自动导入方法、装置、终端设备及存储介质
CN106980607B (zh) 段落识别方法、装置和终端设备
CN108960054A (zh) 一种基于图文识别的通关数据生成系统及方法
US20100023517A1 (en) Method and system for extracting data-points from a data file
CN111241096A (zh) 一种excel文档的文本提取方法、系统、终端及存储介质
CN110503378A (zh) 一种bom标准化方法、系统及电子设备和存储介质
JP6445645B1 (ja) 帳票情報認識装置および帳票情報認識方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 518000 Room 201, No. 7, Xintian Community Innovation Industrial Park, Guanhu street, Longhua District, Shenzhen, Guangdong Province

Patentee after: Shenzhen Jinming Aviation Technology Co.,Ltd.

Country or region after: China

Address before: 518000 1st and 4th floors of building h, factory building 7, innovation industrial park, Jingtian Road, Laocun community, Guanlan office, Longhua New District, Shenzhen City, Guangdong Province

Patentee before: SHENZHEN JINMING AVIATION TECHNOLOGY Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address