CN108509633A - 一种基于CAD导出Excel数据的物件归类分析系统及方法 - Google Patents
一种基于CAD导出Excel数据的物件归类分析系统及方法 Download PDFInfo
- Publication number
- CN108509633A CN108509633A CN201810314941.0A CN201810314941A CN108509633A CN 108509633 A CN108509633 A CN 108509633A CN 201810314941 A CN201810314941 A CN 201810314941A CN 108509633 A CN108509633 A CN 108509633A
- Authority
- CN
- China
- Prior art keywords
- data
- cad
- classification
- analysis
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/20—Software design
- G06F8/22—Procedural
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据分析技术领域,尤其是一种基于CAD导出Excel数据的物件归类分析系统及方法。本发明通过把CAD的数据按Excel表的格式进行导出,再对相应的数据进行空间、大小、位置等数据格式化的处理,从而形成可类比的数据格式;用类卷积神经网络的算法,对大量的CAD设计进行归类划分,使用分类的方法把新获取的物件的数据通过对比归类,从而为CAD设计者从大量的数据中归类分析设计的大概类型、预测行业设计趋势。本方法为设计者提供一种有效的分析方法的同时,还解决了设计者担心设计的方案被他人获取后造成损失的问题;可以用于CAD设计数据的处理。
Description
技术领域
本发明涉及数据分析技术领域,尤其是一种基于CAD导出Excel数据的物件归类分析系统及方法。
背景技术
随着CAD设计的发展,各种CAD设计公司保存了越来越多的CAD数据。大量的历史数据,从外人看来,杂乱无章;如果需要只能一个个文档打开并查看具体的历史设计形状。这对于个人来说,是一个繁重的工作。另外一方面,数据是一座金矿,拥有大量的数据,则相当于拥有一座金矿,但需要从中挖掘出有用的数据,比如:
1.对大量的CAD数据进行分类,相同的类别从中获取共同的特性;获取明显的数据特征,对于以后的设计有办好的参考意义。同时对于相同的物件的归类,可以使想查找资料的人员,从大量的CAD文件中,获取相关的类别;减少查找资料的时间。
2.得出大量的CAD数据的特征后,对于新的CAD物件数据,可快速导入并生成统计数据,分析后续各CAD设计的物件发展趋势。随着现代生产工艺的发展,越来越多的产品的生产,首先需要按CAD设计出模型,再进行大量的生产。如果能在获取了相关的CAD设计数据后,统计出某种物件的设计数据,基本可以判断出后续可能要流行的物件;就可以先人一步实现生产的预测,从而实现比其他人快速铺开生产的条件,从而实现市场的占领。
基于以上的两个好处,从大量的CAD数据中分析出特征,然后进行分类、差别具有很好的经济价值,是一个实现经济价值的创新点。但对于CAD人员来说,他们对于专业的分析过程不熟悉,需专业的数据分析人员建立专业的分析系统。从另外一方面,如果他们把CAD的数据毫无保留地拿出来,又担心设计创新点的抄袭,造成他们设计的版权的外泄。
发明内容
本发明解决的技术问题在于提供一种基于CAD导出Excel数据的物件归类分析系统及方法;实现对大量的CAD设计进行归类划分,把新获取的物件的数据通过对比归类,从而为CAD设计者从大量的数据中归类分析设计的大概类型、预测行业设计趋势。
本发明解决上述技术问题的技术方案是:
所述的系统包括分布式数据存储处理模块、物件大小标准化模块、物件位置标准化模块、卷积神经网络分析模块和CAD物件识别模块;
所述的分布式数据存储处理模块,提供分布式存储、处理,用于大数据量的存储计算;
所述的物件大小标准化模块,设计统一大小的标准化,以规范不同物件大小不一,用于图形设计;
所述的物件位置标准化模块,统一物件的坐标位置,格式化物件各位置的数据;
所述的卷积神经网络分析模块,对统一了大小、位置的物件数据进行卷积数据输入识别,输出分析结果后的类别;
所述的CAD物件识别模块,基于卷积神经网络分析结果,输入新的物件数据,识别出新物件的类型,统计新增加数据结果。
所述的方法包括如下步骤:
步骤1:搭建大数据存储、处理平台Hadoop+Spark,建立起基于分布式大数据处理的运行平台;
步骤2:基于分析的CAD物件的特征,设定一个大小合适的统一尺寸,并把所有的CAD数据,按比例转换为统一的大小;
步骤3:基于统一大小后的物件CAD数据,规定以左下角为[0,0]的位置,转换所有的CAD物件的位置为统一的位置;
步骤4:基于统一大小与位置后的数据,调用Spark MLlib中的ConvolutionalNetwork算法,实现所有CAD物件数据的归类,形成特殊有明显区别的各类别;
步骤5:通过对各类别的数据进行识别,形成明确的类别类型及特征,保存至系统上,用于后续的类别再细分及新物件预测;
步骤6:对于各类别的数据,可通过调整参数形成新的子类别的归类,再通过识别形成新的更细的CAD物件分类,用于更细致的物件区分;
步骤7、分类完成后,当有新的数据物件时,通过输入新的CAD物件的数据,系统快速实现数据类别的统计,从而输出统计结果,用于CAD设计者的趋势分析。
所述的Hadoop用于大数据量的存储,Spark用于大数据运算、大数据分析的分布式处理,在数据格式化、训练的过程所有数据是按离线的方式进行处理。
所述的统一大小是指定物件的大小范围,把各物件的实际大小,与统一大小的数据进行按比例缩放,形成相同比例的数据格式。
所述的统一大小是指定物件的大小范围,把各物件的实际大小,与统一大小的数据进行按比例缩放,形成相同比例的数据格式。
通过数据格式化到数据分析归类,形成物件归类;在归类的基础上,后续有其他的物件的数据输入,系统对新物件的数据按大小标准化、位置标准化后,代入各物件类型的特征进行归类,从而快速进行物件的判断统计,再形成对各物件的流行趋势做出预测。
本发明的有益效果是:
本方法通过基于从CAD导出的Excel数据进行分析,在为设计者提供一种有效的分析方法的同时,还解决了设计者担心设计的方案被他人获取后造成损失的问题,因为输出的CAD数据设计者可以通过减少一些详细的参数而不会影响整个系统的归类分析精度,所以在实现为设计者提供一种高效的数据分析方法的同时,为设计者实现数据的价值体现,对促进CAD数据的利用,提升数据的利用价值效益。
附图说明
下面结合附图对本发明进一步说明:
附图1是本发明物件大小统一流程;
附图2是本发明物件位置统一流程;
附图3是本发明卷积网络原理。
具体实施方式
见图1-3所示,本发明方法通过把CAD的数据按Excel表的格式进行导出,再对相应的数据进行空间、大小、位置等数据的处理,从而形成可类比的数据格式,采用类卷积神经网络的算法,对大量的CAD设计进行归类划分,也可使用分类的方法把新获取的物件的数据通过对比归类,从而为CAD设计者从大量的数据中归类分析设计的大概类型、预测行业设计趋势。
本发明CAD导出Excel数据,是按CAD图上的各设计导出的坐标加权值的数据,数据各种各样,大小不一、位置随便存放,所以为了能把各类数据能进行统一的识别并进行分析归类,CAD导出Excle数据的物件归类分析方法包括:
分布式数据存储处理系统:提供强大的分布式存储、处理的系统,用于大数据量的存储计算;
物件大小标准化模块:设计统一大小的标准化,以规范不同物件大小不一,用于图形设计;
物件位置标准化模块:统一物件的坐标位置,格式化物件各位置的数据;
卷积神经网络分析模块:对统一了大小、位置的物件数据进行卷积数据输入识别,输出分析结果后的类别;
CAD物件识别模块:基于卷积神经网络分析结果,输入新的物件数据,识别出新物件的类型,统计新增加数据结果;
所述基于CAD导出Excel数据的物件归类分析是一个完整的系统,从数据的格式化、到数据处理、训练数据、识别数据,都有完整的输入输出,整个系统除了为归类的物件进行指明所属的类别,其他过程都由机器自动运行,实现自动分析归类。
整个分析过程基于强大的分布式数据存储处理系统,采用Hadoop+Spark的架构,Hadoop用于大数据量的存储,Spark用于大数据运算、大数据分析的分布式处理,在数据格式化、训练的过程所有数据是按离线的方式进行处理。
提供的大量的CAD数据,各物件的大小设计是不一样的,对于不同的物件,不管物件有多大多小,可以快速进行分类,但是对于相同类似的物件,输出的数据大小不一,物件间的数据无可比性,无法进行物件类型的比对,所以需对各物件的数据的大小按比例进行统一,形成可以对比的数据;统一大小的方法是,指定物件的大小范围,把各物件的实际大小,与统一大小的数据进行按比例缩放,形成相同比例的数据格式。
提供的CAD的Excel数据,是按物件在CAD上的坐标位置直接输出各坐标值及权重值,由于各物件设计的开始坐标值不一样,对比各物件的各坐标值的数据,就需要对其坐标值进行统一,通过对多个物件的比较分析,得出以左下角为[0,0]的坐标值,进行各物件的坐标值的统一。
大量转换为Excel格式的CAD数据,按各物件的唯一标识上传至HDFS分布式存储上,通过Spark的Scala对所有的物件进行大小统一、位置统一的处理,两个模块的处理形成两种格式的数据,分别存储于不同的位置,第二个数据的处理是依赖于第一个数据处理的结果,从而形成可用于进一步分析的数据格式。
经过大小、位置格式化后的数据,形成了通过坐标加权重值的方法,描述物件大概轮廓的数据,这样的数据通过分析,可通过调用Spark MLlib中的Convolutional Network算法,对各物件的数据进行对比,区分出各物件的特点,按各物件的特点类似的进行归类。
从数据格式分到数据分析归类,形成的各类型系统是无法识别哪一类是什么物件的,这时需由人通过识别的方法对,所有类别的物件进行一一识别,并分析出类别不一致的物件,从中提取出数据的明显特征,用于后续的数据归类。
数据在分类出第一层的类别后,可通过对其中的各类别,再进行计算分类,从类别中再区分类别,从而形成细分的类别,实现对物件更加细分的区别。
通过数据格式化到数据分析归类,形成物件归类,在归类的基础上,后续有其他的物件的数据输入,系统对新物件的数据按大小标准化、位置标准化后,代入各物件类型的特征进行归类,从而快速进行物件的判断统计,从而在形成对各物件的流行趋势做出预测。
以大量的历史CAD数据为基础,通过大数据的分析,得出各CAD设计物件的特征,从而形成一个能判断物件的系统,对于新物件的数据输入进行按特征分析,从而在形成的大量历史数据中获取价值,也为CAD的设计者提供一个趋势分析的方向,实现大数据分析的价值。
综合而言,本发明基于CAD导出Excel数据的物件归类分析方法的流程步骤为:
步骤1:搭建大数据存储、处理平台Hadoop+Spark,建立起基于分布式大数据处理的运行平台;
步骤2:基于分析的CAD物件的特征,设定一个大小合适的统一尺寸,并把所有的CAD数据,按比例转换为统一的大小;
步骤3:基于统一大小后的物件CAD数据,规定以左下角为[0,0]的位置,转换所有的CAD物件的位置为统一的位置;
步骤4:基于统一了大小与位置后的数据,调用Spark MLlib中的ConvolutionalNetwork算法,实现所有CAD物件数据的归类,形成各特殊有明显区别的各类别;
步骤5:通过对各类别的数据进行人工识别,形成明确的类别类型及特征,保存至系统上,用于后续的类别再细分及新物件预测;
步骤6:对于各类别的数据,可通过调整参数形成新的子类别的归类,再通过识别形成新的更细的CAD物件分类,用于更细致的物件区分;
步骤7、分类完成后,当有新的数据物件时,通过输入新的CAD物件的数据,系统可快速实现数据类别的统计,从而输出统计结果,用于CAD设计者的趋势分析。
本发明的上述系统和方法利用了CAD可以导成Excel表数据的方法,使用户在导出各CAD的Excel表数据后可修改Excel表的个别数据而不影响各物件形状的分析的特点,很好地解决了大数据分析CAD物件特性的过程,从而为CAD设计人员,设计形成了一个有用的物件归类、预测分析的方法。
Claims (6)
1.一种基于CAD导出Excel数据的物件归类分析系统,其特征在于:所述的系统包括分布式数据存储处理模块、物件大小标准化模块、物件位置标准化模块、卷积神经网络分析模块和CAD物件识别模块;
所述的分布式数据存储处理模块,提供分布式存储、处理,用于大数据量的存储计算;
所述的物件大小标准化模块,设计统一大小的标准化,以规范不同物件大小不一,用于图形设计;
所述的物件位置标准化模块,统一物件的坐标位置,格式化物件各位置的数据;
所述的卷积神经网络分析模块,对统一了大小、位置的物件数据进行卷积数据输入识别,输出分析结果后的类别;
所述的CAD物件识别模块,基于卷积神经网络分析结果,输入新的物件数据,识别出新物件的类型,统计新增加数据结果。
2.一种基于CAD导出Excel数据的物件归类分析方法,其特征在于:所述的方法包括如下步骤:
步骤1:搭建大数据存储、处理平台Hadoop+Spark,建立起基于分布式大数据处理的运行平台;
步骤2:基于分析的CAD物件的特征,设定一个大小合适的统一尺寸,并把所有的CAD数据,按比例转换为统一的大小;
步骤3:基于统一大小后的物件CAD数据,规定以左下角为[0,0]的位置,转换所有的CAD物件的位置为统一的位置;
步骤4:基于统一大小与位置后的数据,调用Spark MLlib中的Convolutional Network算法,实现所有CAD物件数据的归类,形成特殊有明显区别的各类别;
步骤5:通过对各类别的数据进行识别,形成明确的类别类型及特征,保存至系统上,用于后续的类别再细分及新物件预测;
步骤6:对于各类别的数据,可通过调整参数形成新的子类别的归类,再通过识别形成新的更细的CAD物件分类,用于更细致的物件区分;
步骤7、分类完成后,当有新的数据物件时,通过输入新的CAD物件的数据,系统快速实现数据类别的统计,从而输出统计结果,用于CAD设计者的趋势分析。
3.根据权利要求2所述的方法,其特征在于:
所述的Hadoop用于大数据量的存储,Spark用于大数据运算、大数据分析的分布式处理,在数据格式化、训练的过程所有数据是按离线的方式进行处理。
4.根据权利要求2所述的方法,其特征在于:
所述的统一大小是指定物件的大小范围,把各物件的实际大小,与统一大小的数据进行按比例缩放,形成相同比例的数据格式。
5.根据权利要求3所述的方法,其特征在于:
所述的统一大小是指定物件的大小范围,把各物件的实际大小,与统一大小的数据进行按比例缩放,形成相同比例的数据格式。
6.根据权利要求2至5任一项所述的方法,其特征在于:
通过数据格式化到数据分析归类,形成物件归类;在归类的基础上,后续有其他的物件的数据输入,系统对新物件的数据按大小标准化、位置标准化后,代入各物件类型的特征进行归类,从而快速进行物件的判断统计,再形成对各物件的流行趋势做出预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810314941.0A CN108509633B (zh) | 2018-04-10 | 2018-04-10 | 一种基于CAD导出Excel数据的物件归类分析系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810314941.0A CN108509633B (zh) | 2018-04-10 | 2018-04-10 | 一种基于CAD导出Excel数据的物件归类分析系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108509633A true CN108509633A (zh) | 2018-09-07 |
CN108509633B CN108509633B (zh) | 2022-02-18 |
Family
ID=63381255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810314941.0A Active CN108509633B (zh) | 2018-04-10 | 2018-04-10 | 一种基于CAD导出Excel数据的物件归类分析系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108509633B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020362A (zh) * | 2012-12-18 | 2013-04-03 | 杜昌立 | 一种基于cad平台对电子产品的线束的处理方法 |
CN103886144A (zh) * | 2014-03-10 | 2014-06-25 | 陕西省电力设计院 | 一种电缆及光缆长度统计方法 |
CN106202708A (zh) * | 2016-07-08 | 2016-12-07 | 增城市城乡规划测绘院 | 一种将勘察测绘得出的cad地形图快速入库的方法 |
CN107220465A (zh) * | 2017-07-04 | 2017-09-29 | 山东爱普电气设备有限公司 | 基于Auto CAD的开关柜钣金物料选型清单的自动生成方法 |
CN107292744A (zh) * | 2017-06-07 | 2017-10-24 | 前海梧桐(深圳)数据有限公司 | 基于机器学习的投资趋势分析方法及其系统 |
-
2018
- 2018-04-10 CN CN201810314941.0A patent/CN108509633B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020362A (zh) * | 2012-12-18 | 2013-04-03 | 杜昌立 | 一种基于cad平台对电子产品的线束的处理方法 |
CN103886144A (zh) * | 2014-03-10 | 2014-06-25 | 陕西省电力设计院 | 一种电缆及光缆长度统计方法 |
CN106202708A (zh) * | 2016-07-08 | 2016-12-07 | 增城市城乡规划测绘院 | 一种将勘察测绘得出的cad地形图快速入库的方法 |
CN107292744A (zh) * | 2017-06-07 | 2017-10-24 | 前海梧桐(深圳)数据有限公司 | 基于机器学习的投资趋势分析方法及其系统 |
CN107220465A (zh) * | 2017-07-04 | 2017-09-29 | 山东爱普电气设备有限公司 | 基于Auto CAD的开关柜钣金物料选型清单的自动生成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108509633B (zh) | 2022-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852395B (zh) | 一种基于自主学习和深度学习的矿石粒度检测方法和系统 | |
CN106156791A (zh) | 业务数据分类方法和装置 | |
CN104020676B (zh) | 基于仿真模拟技术的服装流水线编排方法 | |
CN108629319B (zh) | 图像检测方法及系统 | |
CN104778458B (zh) | 一种基于纹理特征的纺织品花纹检索方法 | |
CN104268600B (zh) | 一种基于Minkowski距离的矿物浮选泡沫图像纹理分析及工况识别方法 | |
CN109300001A (zh) | 服装裁剪工艺分析方法、装置、电子设备及存储介质 | |
CN109214642B (zh) | 一种建筑施工工序约束的自动抽取和分类方法及系统 | |
CN101808339A (zh) | 一种应用k-means和先验知识的话务小区自适应分类方法 | |
CN101777125A (zh) | 一种高分辨率遥感图像复杂类别的监督分类方法 | |
CN108241925A (zh) | 一种基于离群点检测的离散制造机械产品质量溯源方法 | |
Mu et al. | Research on ancient ceramic identification by artificial intelligence | |
CN110598634A (zh) | 一种基于图例库的机房草图识别方法及其装置 | |
CN107305640A (zh) | 一种不均衡数据分类的方法 | |
CN105785954B (zh) | 基于质量状态任务网络的制造系统任务可靠性建模方法 | |
CN103902706B (zh) | 一种基于svm的大数据分类预测方法 | |
Poonnoy et al. | Classification of boiled shrimp's shape using image analysis and artificial neural network model | |
CN104036232B (zh) | 一种基于图像边缘特征分析的领带花型检索方法 | |
CN113743523B (zh) | 一种视觉多特征引导的建筑垃圾精细分类方法 | |
Sidehabi et al. | The Development of Machine Vision System for Sorting Passion Fruit using Multi-Class Support Vector Machine. | |
CN107038456A (zh) | 一种基于l1范数的概率线性判别分析的图像分类方法 | |
CN109858501A (zh) | 一种两相流流型特征提取方法 | |
CN108509633A (zh) | 一种基于CAD导出Excel数据的物件归类分析系统及方法 | |
CN105787113A (zh) | 一种基于plm数据库面向dpipp工艺信息的挖掘算法 | |
CN113191320A (zh) | 一种基于深度学习的食品安全指标监测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 19 / F, Cloud Computing Center, Chinese Academy of Sciences, No.1 Kehui Road, Songshanhu high tech Industrial Development Zone, Dongguan City, Guangdong Province, 523000 Applicant after: G-CLOUD TECHNOLOGY Co.,Ltd. Address before: 523808 No. 14 Building, Songke Garden, Songshan Lake Science and Technology Industrial Park, Dongguan City, Guangdong Province Applicant before: G-CLOUD TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |