CN108491885A - 一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置 - Google Patents

一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置 Download PDF

Info

Publication number
CN108491885A
CN108491885A CN201810264906.2A CN201810264906A CN108491885A CN 108491885 A CN108491885 A CN 108491885A CN 201810264906 A CN201810264906 A CN 201810264906A CN 108491885 A CN108491885 A CN 108491885A
Authority
CN
China
Prior art keywords
model
autocad
segments
feature
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810264906.2A
Other languages
English (en)
Inventor
陈境焕
李海燕
黄运保
李璞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201810264906.2A priority Critical patent/CN108491885A/zh
Publication of CN108491885A publication Critical patent/CN108491885A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置,其中方法包括:获取目标图块和非目标图块作为图块数据库;随机抽取训练集和测试集;确定与图块对应的特征;根据特征训练多项式模型、伯努利模型和混合模型;并测试得到模型准确率最高的模型作为最终模型,构造朴素贝叶斯分类器对待识别图块进行识别。本发明通过将数据库分为训练集和测试集,然后通过训练集训练多项式模型、伯努利模型和混合模型,通过测试集得到对应的模型准确率,根据模型准确率选择最好的模型进行构建用于识别autoCAD图块的朴素贝叶斯分类器,使得该朴素贝叶斯分类器能够有较高的准确率,识别效率高,解决了现有技术识别准确率低的技术问题。

Description

一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置
技术领域
本发明涉及图块识别技术领域,尤其涉及一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置。
背景技术
autoCAD是现在比较流行的计算机辅助设计软件,其涉及的领域多,应用相当广泛。我们通过autoCAD进行二次开发,能够让autoCAD的功能更专用化,使得autoCAD快速满足不同对象的需求,实现高效的辅助设计。其中,autoCAD图块的识别,其中的一个技术关键。AutoCAD图块是由多个图元组合而成。现有的技术是通过对autoCAD图块的准确识别,比如:通过图块的名称,或准确判定图块的各个图元组成部分去识别图块。
但是,由于很多行业的图块没有特定的标准,所以不同的公司,对相同意义的图块的画法或名称是不一致的,这样导致autoCAD图块的快速识别难度增加。比如:中兴通信发布的Qcell、pBrige有源室分系统模块,因为没有一定的行业标准,所以不同的电信设计院对Qcell、pBrige模块在autoCAD上的表示方式不一致,有一些差异,但是大体是相似的(即它们都有很多相同的特征,但是又有不相同的部分)。这对autoCAD程序识别不同电信设计院画出来的Qcell、pBrige图元增加了很大的难度。其他的autoCAD图元也有类似问题,如电路元器件,因为没有行业标准,或者即便有行业标准,因为有些autoCAD文件过大,设计人员容易出现操作错误(或不按照行业标准来操作),导致最终的图块跟目标的图块有所差异,这也会导致autoCAD程序识别不出来,或者识别错误,大大增加了识别的程序识别的难度。这些图块如图(3)所示。
对于pBrige这一类的autoCAD图块,它们有很多共同的特征,但是表示方式又不完全一样,对于prru这类的autoCAD图块也是如此。那么一般的识别程序则识别不出来,或者识别难度很大,再给另外一个同类的autoCAD图块,又会出现识别不出来,或者识别难度很大的情况。因此,一般的识别程序识别容差率很小,导致识别准确率很低。
发明内容
本发明提供了一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置,用于解决一般的识别程序识别准确率很低的技术问题。
本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,包括:
S1:获取目标autoCAD图块和非目标autoCAD图块作为图块数据库;
S2:将图块数据库中的目标autoCAD图块和非目标autoCAD图块随机抽取三分之二作为训练集,剩下三分之一作为测试集;
S3:根据图块数据库中的目标autoCAD图块确定与autoCAD图块对应的特征;
S4:根据训练集中的autoCAD图块和与autoCAD图块对应的特征训练多项式模型、伯努利模型和混合模型;
S5:将测试集中的autoCAD图块测试训练后的多项式模型、伯努利模型和混合模型,得到模型准确率;
S6:选择模型准确率最高的模型作为最终模型,构造用于识别autoCAD图块的朴素贝叶斯分类器;
S7:通过朴素贝叶斯分类器对待识别图块进行识别。
优选地,所述步骤S4具体包括:
构建多项式模型、伯努利模型和混合模型;
根据训练集中的autoCAD图块计算多项式模型、伯努利模型和混合模型中的P(xi|Y)和P(xi|S);
其中,所述多项式模型为:
若P(Y|X)大于P(S|X),则判断待识别图块为目标autoCAD图块;
若P(Y|X)小于P(S|X),则判断待识别图块为非目标autoCAD图块;
其中,Y表示训练集中的目标autoCAD图块,S表示训练集中的非目标autoCAD图块,X=[x1,x2,....xm]为待识别图块对应的各个特征x1,x2,…xm的集合,xi表示集合X中的特征,i=1,2,…m,ki表示图块中特征xi重复出现的个数,
所述伯努利模型为:
P(Y|X)=P(Y|<x1,x2,…xm>)∝P(x1|Y)P(xi|Y)…P(xm|Y)P(Y);
P(S|X)=P(S|<x1,x2,…xm>)∝P(x1|S)P(xi|S)…P(xm|S)P(S);
若P(Y|X)大于P(S|X),则判断待识别图块为目标autoCAD图块;
若P(Y|X)小于P(S|X),则判断待识别图块为非目标autoCAD图块;
其中,Y表示训练集中的目标autoCAD图块,S表示训练集中的非目标autoCAD图块,X=[x1,x2,....xm]为训练集图块及待识别图块对应的各个特征x1,x2,…xm的集合,xi表示集合X中的特征,i=1,2,…m,
所述混合模型为:
当训练所述混合模型时,通过以下公式计算P(xi|Y)和P(xi|S):
当通过所述混合模型识别待识别图块时,ki等于1;
若P(Y|X)大于P(S|X),则判断待识别图块为目标autoCAD图块;
若P(Y|X)小于P(S|X),则判断待识别图块为非目标autoCAD图块。
优选地,所述步骤S5具体包括:
根据测试集中的autoCAD图块确定多项式模型中的ki及伯努利模型中特征xi的出现情况,结合训练获得的P(xi|Y)和P(xi|S)计算出多项式模型、伯努利模型和混合模型对测试集中的autoCAD图块的判断结果;
根据判断结果与测试集中的autoCAD图块的已知分类对比计算出多项式模型、伯努利模型和混合模型的模型准确率。
优选地,所述步骤S4还包括数据平滑处理步骤,所述数据平滑处理步骤为:
当检测到计算过程中出现P(xi|Y)=0或P(xi|S)=0时,将计算过程中的分子分母同时加一并重新计算P(xi|Y)或P(xi|S)。
优选地,所述多项式模型、伯努利模型和混合模型还包括权重处理步骤,所述权重处理步骤为:
将待识别图块中预设的特征xi的权重系数α乘以对应的P(xi|Y)或P(xi|S)。
优选地,所述多项式模型、伯努利模型和混合模型还包括相似数据处理步骤,所述相似数据处理步骤为:
将待识别图块中预设的特征xi的相似系数β乘以对应的P(xi|Y)或P(xi|S)。
优选地,所述步骤S5之后还包括:
判断多项式模型、伯努利模型和混合模型的模型准确率是否都小于预设的最小阈值,若是,则重新选取特征xi、修改权重系数α和修改相似系数β并返回步骤S4。
优选地,所述步骤S3中与autoCAD图块对应的特征具体为:autoCAD图块中的各个图元。
优选地,所述步骤S6具体包括:
比较多项式模型、伯努利模型和混合模型的模型准确率,选择模型准确率最高对应的模型作为最终模型;
将最终模型及其对应的特征、P(xi|Y)、P(xi|S)、权重系数α和修改相似系数β组成用于识别autoCAD图块的朴素贝叶斯分类器。
本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别装置,包括:
存储器,用于存储指令;
处理器,耦合到所述存储器,所述处理器被配置为基于所述存储器存储的指令执行实现如上述的方法。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,包括:获取目标autoCAD图块和非目标autoCAD图块作为图块数据库;将图块数据库中的目标autoCAD图块和非目标autoCAD图块随机抽取三分之二作为训练集,剩下三分之一作为测试集;根据图块数据库中的目标autoCAD图块确定与autoCAD图块对应的特征;根据训练集中的autoCAD图块和与autoCAD图块对应的特征训练多项式模型、伯努利模型和混合模型;将测试集中的autoCAD图块测试训练后的多项式模型、伯努利模型和混合模型,得到模型准确率;选择模型准确率最高的模型作为最终模型,构造用于识别autoCAD图块的朴素贝叶斯分类器;通过朴素贝叶斯分类器对待识别图块进行识别。本发明通过将数据库分为训练集和测试集,然后通过训练集训练多项式模型、伯努利模型和混合模型,通过测试集得到对应的模型准确率,根据模型准确率选择最好的模型进行构建用于识别autoCAD图块的朴素贝叶斯分类器,使得该朴素贝叶斯分类器能够有较高的准确率,识别效率高,解决了现有技术识别准确率低的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法的一个实施例的示意图;
图2为本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法的另一个实施例的示意图;
图3为本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法中autoCAD图块的示意图。
具体实施方式
本发明提供了一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置,用于解决一般的识别程序识别准确率很低的技术问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法的一个实施例,包括:
101:获取目标autoCAD图块和非目标autoCAD图块作为图块数据库;
102:将图块数据库中的目标autoCAD图块和非目标autoCAD图块随机抽取三分之二作为训练集,剩下三分之一作为测试集;
103:根据图块数据库中的目标autoCAD图块确定与autoCAD图块对应的特征;
104:根据训练集中的autoCAD图块和与autoCAD图块对应的特征训练多项式模型、伯努利模型和混合模型;
105:将测试集中的autoCAD图块测试训练后的多项式模型、伯努利模型和混合模型,得到模型准确率;
106:选择模型准确率最高的模型作为最终模型,构造用于识别autoCAD图块的朴素贝叶斯分类器;
107:通过朴素贝叶斯分类器对待识别图块进行识别。
本发明通过将数据库分为训练集和测试集,然后通过训练集训练多项式模型、伯努利模型和混合模型,通过测试集得到对应的模型准确率,根据模型准确率选择最好的模型进行构建用于识别autoCAD图块的朴素贝叶斯分类器,使得该朴素贝叶斯分类器能够有较高的准确率,识别效率高,解决了现有技术识别准确率低的技术问题。
以上是对本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法的一个实施例进行详细的描述,以下将对本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法的另一个实施例进行详细的描述。
请参阅图2,本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别方法的另一个实施例,包括:
201:获取目标autoCAD图块和非目标autoCAD图块作为图块数据库;
202:将图块数据库中的目标autoCAD图块和非目标autoCAD图块随机抽取三分之二作为训练集,剩下三分之一作为测试集;
采取三分之一,是因为很多机器学习算法对于手上现有的数据,都是先用三分之二取训练模型,然后利用剩下的三分之一已知道类型的数据去验证建立的分类器是否能准确分类。
203:根据图块数据库中的目标autoCAD图块确定与autoCAD图块对应的特征;
需要说明的是,与autoCAD图块对应的特征具体为:autoCAD图块中的各个图元。比如图3所示的图块,其中1cm*1cm的矩形就是一个特征,而大的矩形4cm*10cm又是另外一个特征。目标autoCAD图块可以是训练集中的图块特征加上测试集中待分类特征的集合,也可以是仅有目标autoCAD图块中的待识别图块,采用哪些图块根据模型决定。
204:构建多项式模型、伯努利模型和混合模型;
205:根据训练集中的autoCAD图块计算多项式模型、伯努利模型和混合模型中的P(xi|Y)和P(xi|S)。
步骤204和步骤205主要实现:根据训练集中的autoCAD图块和与autoCAD图块对应的特征训练多项式模型、伯努利模型和混合模型。
以下对多项式模型、伯努利模型和混合模型进行详细的描述,这些模型具备多个方程式,将待识别图块输入这些模型,可以算得图块的类别是目标图块还是非目标图块。
多项式模型为:
若P(Y|X)大于P(S|X),则判断待识别图块为目标autoCAD图块;
若P(Y|X)小于P(S|X),则判断待识别图块为非目标autoCAD图块;
其中,Y表示训练集中的目标autoCAD图块,S表示训练集中的非目标autoCAD图块,X=[x1,x2,....xm]为待识别图块对应的各个特征x1,x2,…xm的集合,xi表示集合X中的特征,i=1,2,…m,ki表示图块中特征xi重复出现的个数,
P(Y)是先验概率,这个是已知的,比如你用一个训练集取训练,这个训练集上面的有图块,属于目标图块和不属于目标图库的概率,我们是能够已知的。比如需要识别的是图块A类,即目标图块是A类,那么我们的训练集中有10个图块,其中7个是A类,3个不是,那么就知道先验概率P(Y)了,P(Y)=7/10,P(S)=3/10。
伯努利模型为:
P(Y|X)=P(Y|<x1,x2,…xm>)∝P(x1|Y)P(xi|Y)…P(xm|Y)P(Y);
P(S|X)=P(S|<x1,x2,…xm>)∝P(x1|S)P(xi|S)…P(xm|S)P(S);
这里的分子分母+1是应用了平滑处理;
若P(Y|X)大于P(S|X),则判断待识别图块为目标autoCAD图块;
若P(Y|X)小于P(S|X),则判断待识别图块为非目标autoCAD图块;
其中,Y表示训练集中的目标autoCAD图块,S表示训练集中的非目标autoCAD图块,X=[x1,x2,....xm]为训练集图块及待识别图块对应的各个特征x1,x2,…xm的集合,xi表示集合X中的特征,i=1,2,…m,
需要说明的是,伯努利模型的计算方法是将重复出现的特征视为其只出现一次,并且特征xi只有出现(为1)或者没有出现(为0)两种情况。设X=[x1,x2,....xm]为整个分类系统的特征类总和(即包括训练集特征和待分类的图块特征,因为有些特征是训练集有但是待识别图块的特征没有)。
该伯努利模型和多项式模型的不同之处在于:在计算P(Y|X)和P(S|X)时,特征向量X是指训练集特征向量和待分类特征向量的总和,即待分类特征向量中不含xj特征,也要计算P(xj|Y)和P(xj|S)概率,只不过它的计算公式是P(xi|Y)=1-P(xi=1|Y)和P(xi|S)=1-P(xi=1|S)。而对于多项式模型来说P(Y|X)和P(S|X)中的X特征向量是由待识别图块确定的。
混合模型为:
当训练混合模型时,通过以下公式计算P(xi|Y)和P(xi|S):
当通过混合模型识别待识别图块时,ki等于1;
若P(Y|X)大于P(S|X),则判断待识别图块为目标autoCAD图块;
若P(Y|X)小于P(S|X),则判断待识别图块为非目标autoCAD图块。
需要说明的是,这些模型都用到了贝叶斯原理,属于贝叶斯分类器中的模型,以下将对贝叶斯进行详细的解释:
贝叶斯公式:
P(Y,X)=P(Y|X)P(X)=P(X|Y)P(Y);
其中P(Y)叫做先验概率,P(Y|X)叫做后验概率,P(Y,X)叫做联合概率。
在二分类问题(只需要判断是否),我们把Y理解成“属于某类”的标签,把X理解成特征向量X=[x1,x2,....xm]。因为假设图块中X向量中x1,x2,....xm是相互独立的(autoCAD图块的各个组成图元理论上也是相互独立的,这刚好满足朴素贝叶斯的相互独立原则),并且这些特征的顺序也没有硬性要求,这也使得这种识别方法刚好满足朴素贝叶斯公式。把属于我们需要的图块记作记作Y(即目标autoCAD图块),而不属于这类图块记作S(即非目标autoCAD图块),则:
根据上式的分母一致情况将上式转化为:
P(Y|X)∝P(<x1,x2,…xm>|Y);
P(S|X)∝P(<x1,x2,…xm>|S);
若P(<x1,x2,…xm>|Y)大于P(<x1,x2,…xm>|S),则属于该类(即属于目标autoCAD图块),反之则不属于。
对于P(Y|X)∝P(<x1,x2,…xm>|Y)和P(S|X)∝P(<x1,x2,…xm>|S)的求法,可以根据多项式模型、伯努利模型和混合模型进行计算。
进行模型计算的时候需要应用数据平滑处理步骤,数据平滑处理步骤为:
当检测到计算过程中出现P(xi|Y)=0或P(xi|S)=0时,将计算过程中的分子分母同时加一并重新计算P(xi|Y)或P(xi|S)。如上述伯努利模型中的计算公式中分子分母有+1的情况是为了防止出现概率为0导致模型不可用的情况。
多项式模型、伯努利模型和混合模型还包括权重处理步骤,所述权重处理步骤为:
将待识别图块中预设的特征xi的权重系数α乘以对应的P(xi|Y)或P(xi|S)。
多项式模型、伯努利模型和混合模型还包括相似数据处理步骤,所述相似数据处理步骤为:
将待识别图块中预设的特征xi的相似系数β乘以对应的P(xi|Y)或P(xi|S)。
其中,权重系数α和相似系数β都是预先对每个特征设定的数值,以下对权重系数α和相似系数β进行详细的解释:
当我们需要识别的图块中,有些特征是必须的(或者说很重要的),那么我们在识别过程中,给它乘以权重系数α,这样会使得识别精确度提高。如当特征xi需要增加权重系数时,模型计算公式变为:
P(Y|X)=P(Y|<x1,x2,…xm>)∝P(x1|Y)[αP(xi|Y)]…P(xm|Y)P(Y);
模型其他公式依次类推,权重系数α的值一般取1.1至1.2之间;
如果需要识别的图块中的某个特征与训练集中的某个特征很接近,比如特征xi在训练集中是用多段线画出来的大小为1cm*1cm矩形,而待识别的图块中该特征同样大小的矩形是用直线画出来的,或者是用多段线画出来的,但是大小略有偏差等,对于这些相近似的特征,我们需要乘以一个相似系数β,将模型计算公式进行修改为:
P(Y|X)=P(Y|<x1,x2,…xm>)∝P(x1|Y)[βP(xi|Y)]…P(xm|Y)P(Y);
模型其他公式以此类推,相似系数β的值一般取1至0.9之间。
206:根据测试集中的autoCAD图块确定多项式模型中的ki及伯努利模型中特征xi的出现情况,结合训练获得的P(xi|Y)和P(xi|S)计算出多项式模型、伯努利模型和混合模型对测试集中的autoCAD图块的判断结果;
这些模型最后是计算P(Y|X)和P(S|X),比较大小而得出是否属于目标类型的。而训练的过程,是为了得出P(xi|Y)和P(xi|S)的概率。得出这些概率之后,当遇到待识别的图块,就结合待识别图块情况按照计算出来的概率代入公式,计算出P(Y|X)和P(S|X),进而判断是否是目标类型。
207:根据判断结果与测试集中的autoCAD图块的已知分类对比计算出多项式模型、伯努利模型和混合模型的模型准确率。
步骤206和步骤207主要实现:将测试集中的autoCAD图块测试训练后的多项式模型、伯努利模型和混合模型,得到模型准确率。
208:判断多项式模型、伯努利模型和混合模型的模型准确率是否都小于预设的最小阈值,若是,则重新选取特征xi、修改权重系数α和修改相似系数β并返回步骤204。
如图(3)的图块,那个1cm*1cm的矩形就特别重要,需要加权重系数。如果识别精度太低,我们是否应该在那个4cm*10cm的矩形的特征概率上也加上权重系数。又或者相似系数取得不对。甚至是模型取得不对?这些都是要去修改,改到最终识别的精度达到要求。
209:比较多项式模型、伯努利模型和混合模型的模型准确率,选择模型准确率最高对应的模型作为最终模型;
210:将最终模型及其对应的特征、P(xi|Y)、P(xi|S)、权重系数α和修改相似系数β组成用于识别autoCAD图块的朴素贝叶斯分类器;
步骤209和步骤210主要实现:选择模型准确率最高的模型作为最终模型,构造用于识别autoCAD图块的朴素贝叶斯分类器;
211:通过朴素贝叶斯分类器对待识别图块进行识别。
需要说明的是,本发明中的autoCAD图块主要是指如图3所示的图块。
以下将对本发明实施例的方法进行简单阐述:
1.收集目标autoCAD图块和非目标autoCAD图块作为图块数据库,其中非目标autoCAD图块应该与目标autoCAD图块有明显差别。
2.将图块数据库分为两部分,其中三分之二作为训练集,三分之一作为测试集。
3.确定图块数据库的特征(根据目标图块去确定需要设定哪些特征),相似系数、权重系数和朴素贝叶斯模型(多项式模型和伯努利模型),并用其中三分之二的图块库去训练。
4.用剩下的三分之一图块库去测试第三步得到的朴素贝叶斯模型。然后反过来修改第三步的相似系数、权重系数以及修改朴素贝叶斯模型。通过比较识别精度,最终确定用多项式模型还是伯努利模型。
5.朴素贝叶斯分类器构造完成之后,把待识别的autoCAD图块提取特征后,用贝叶斯分类器,通过计算概率去实现分类。
以下将对本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别装置进行详细的描述。
本发明提供的一种基于朴素贝叶斯分类器的autoCAD图块识别装置,包括:
存储器,用于存储指令;
处理器,耦合到所述存储器,所述处理器被配置为基于所述存储器存储的指令执行实现如上述的方法。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于朴素贝叶斯分类器的autoCAD图块识别方法,其特征在于,包括:
S1:获取目标autoCAD图块和非目标autoCAD图块作为图块数据库;
S2:将图块数据库中的目标autoCAD图块和非目标autoCAD图块随机抽取三分之二作为训练集,剩下三分之一作为测试集;
S3:根据图块数据库中的目标autoCAD图块确定与autoCAD图块对应的特征;
S4:根据训练集中的autoCAD图块和与autoCAD图块对应的特征训练多项式模型、伯努利模型和混合模型;
S5:将测试集中的autoCAD图块测试训练后的多项式模型、伯努利模型和混合模型,得到模型准确率;
S6:选择模型准确率最高的模型作为最终模型,构造用于识别autoCAD图块的朴素贝叶斯分类器;
S7:通过朴素贝叶斯分类器对待识别图块进行识别。
2.根据权利要求1所述的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,其特征在于,所述步骤S4具体包括:
构建多项式模型、伯努利模型和混合模型;
根据训练集中的autoCAD图块计算多项式模型、伯努利模型和混合模型中的P(xi|Y)和P(xi|S);
其中,所述多项式模型为:
若P(Y|X)大于P(S|X),则判断待识别图块为目标autoCAD图块;
若P(Y|X)小于P(S|X),则判断待识别图块为非目标autoCAD图块;
其中,Y表示训练集中的目标autoCAD图块,S表示训练集中的非目标autoCAD图块,X=[x1,x2,....xm]为待识别图块对应的各个特征x1,x2,…xm的集合,xi表示集合X中的特征,i=1,2,…m,ki表示图块中特征xi重复出现的个数,
所述伯努利模型为:
P(Y|X)=P(Y|<x1,x2,…xm>)∝P(x1|Y)P(xi|Y)…P(xm|Y)P(Y);
P(S|X)=P(S|<x1,x2,…xm>)∝P(x1|S)P(xi|S)…P(xm|S)P(S);
若P(Y|X)大于P(S|X),则判断待识别图块为目标autoCAD图块;
若P(Y|X)小于P(S|X),则判断待识别图块为非目标autoCAD图块;
其中,Y表示训练集中的目标autoCAD图块,S表示训练集中的非目标autoCAD图块,X=[x1,x2,....xm]为训练集图块及待识别图块对应的各个特征x1,x2,…xm的集合,xi表示集合X中的特征,i=1,2,…m,
所述混合模型为:
当训练所述混合模型时,通过以下公式计算P(xi|Y)和P(xi|S):
当通过所述混合模型识别待识别图块时,ki等于1;
若P(Y|X)大于P(S|X),则判断待识别图块为目标autoCAD图块;
若P(Y|X)小于P(S|X),则判断待识别图块为非目标autoCAD图块。
3.根据权利要求1所述的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,其特征在于,所述步骤S5具体包括:
根据测试集中的autoCAD图块确定多项式模型中的ki及伯努利模型中特征xi的出现情况,结合训练获得的P(xi|Y)和P(xi|S)计算出多项式模型、伯努利模型和混合模型对测试集中的autoCAD图块的判断结果;
根据判断结果与测试集中的autoCAD图块的已知分类对比计算出多项式模型、伯努利模型和混合模型的模型准确率。
4.根据权利要求1所述的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,其特征在于,所述步骤S4还包括数据平滑处理步骤,所述数据平滑处理步骤为:
当检测到计算过程中出现P(xi|Y)=0或P(xi|S)=0时,将计算过程中的分子分母同时加一并重新计算P(xi|Y)或P(xi|S)。
5.根据权利要求1所述的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,其特征在于,所述多项式模型、伯努利模型和混合模型还包括权重处理步骤,所述权重处理步骤为:
将待识别图块中预设的特征xi的权重系数α乘以对应的P(xi|Y)或P(xi|S)。
6.根据权利要求1所述的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,其特征在于,所述多项式模型、伯努利模型和混合模型还包括相似数据处理步骤,所述相似数据处理步骤为:
将待识别图块中预设的特征xi的相似系数β乘以对应的P(xi|Y)或P(xi|S)。
7.根据权利要求1所述的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,其特征在于,所述步骤S5之后还包括:
判断多项式模型、伯努利模型和混合模型的模型准确率是否都小于预设的最小阈值,若是,则重新选取特征xi、修改权重系数α和修改相似系数β并返回步骤S4。
8.根据权利要求1所述的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,其特征在于,所述步骤S3中与autoCAD图块对应的特征具体为:autoCAD图块中的各个图元。
9.根据权利要求1所述的一种基于朴素贝叶斯分类器的autoCAD图块识别方法,其特征在于,所述步骤S6具体包括:
比较多项式模型、伯努利模型和混合模型的模型准确率,选择模型准确率最高对应的模型作为最终模型;
将最终模型及其对应的特征、P(xi|Y)、P(xi|S)、权重系数α和修改相似系数β组成用于识别autoCAD图块的朴素贝叶斯分类器。
10.一种基于朴素贝叶斯分类器的autoCAD图块识别装置,其特征在于,包括:
存储器,用于存储指令;
处理器,耦合到所述存储器,所述处理器被配置为基于所述存储器存储的指令执行实现如权利要求1至9中任一项所述的方法。
CN201810264906.2A 2018-03-28 2018-03-28 一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置 Pending CN108491885A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810264906.2A CN108491885A (zh) 2018-03-28 2018-03-28 一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810264906.2A CN108491885A (zh) 2018-03-28 2018-03-28 一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置

Publications (1)

Publication Number Publication Date
CN108491885A true CN108491885A (zh) 2018-09-04

Family

ID=63316562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810264906.2A Pending CN108491885A (zh) 2018-03-28 2018-03-28 一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置

Country Status (1)

Country Link
CN (1) CN108491885A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871770A (zh) * 2019-01-17 2019-06-11 平安城市建设科技(深圳)有限公司 房产证识别方法、装置、设备及存储介质
CN111611945A (zh) * 2020-05-25 2020-09-01 江西金格科技股份有限公司 一种通用的AutoCAD图框识别方法
CN115019029A (zh) * 2022-08-08 2022-09-06 杭州实在智能科技有限公司 一种基于神经自动机的rpa元素智能定位方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090080731A1 (en) * 2007-09-26 2009-03-26 Siemens Medical Solutions Usa, Inc. System and Method for Multiple-Instance Learning for Computer Aided Diagnosis
CN101882225A (zh) * 2009-12-29 2010-11-10 北京中科辅龙计算机技术股份有限公司 基于模板的工程图纸材料信息提取方法
CN106067038A (zh) * 2016-05-27 2016-11-02 大连楼兰科技股份有限公司 基于人工智能有监督学习朴素贝叶斯方法建立分车型远程定损系统及方法
CN107463533A (zh) * 2017-08-17 2017-12-12 广东工业大学 一种基于pca与cnn的三维cad实体模型制造特征识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090080731A1 (en) * 2007-09-26 2009-03-26 Siemens Medical Solutions Usa, Inc. System and Method for Multiple-Instance Learning for Computer Aided Diagnosis
CN101882225A (zh) * 2009-12-29 2010-11-10 北京中科辅龙计算机技术股份有限公司 基于模板的工程图纸材料信息提取方法
CN106067038A (zh) * 2016-05-27 2016-11-02 大连楼兰科技股份有限公司 基于人工智能有监督学习朴素贝叶斯方法建立分车型远程定损系统及方法
CN107463533A (zh) * 2017-08-17 2017-12-12 广东工业大学 一种基于pca与cnn的三维cad实体模型制造特征识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
布国亮: "基于特征的二维图纸识别技术技系统集成", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
李丹: "基于朴素贝叶斯方法的中文文本分类研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871770A (zh) * 2019-01-17 2019-06-11 平安城市建设科技(深圳)有限公司 房产证识别方法、装置、设备及存储介质
CN111611945A (zh) * 2020-05-25 2020-09-01 江西金格科技股份有限公司 一种通用的AutoCAD图框识别方法
CN115019029A (zh) * 2022-08-08 2022-09-06 杭州实在智能科技有限公司 一种基于神经自动机的rpa元素智能定位方法
CN115019029B (zh) * 2022-08-08 2022-11-04 杭州实在智能科技有限公司 一种基于神经自动机的rpa元素智能定位方法

Similar Documents

Publication Publication Date Title
Melekhov et al. Dgc-net: Dense geometric correspondence network
Zafeiriou et al. The menpo facial landmark localisation challenge: A step towards the solution
CN110021051B (zh) 一种基于生成对抗网络通过文本指导的人物图像生成方法
CN110188760B (zh) 一种图像处理模型训练方法、图像处理方法及电子设备
Hong et al. Image-based three-dimensional human pose recovery by multiview locality-sensitive sparse retrieval
CN110533024B (zh) 基于多尺度roi特征的双二次池化细粒度图像分类方法
CN110837836A (zh) 基于最大化置信度的半监督语义分割方法
Tang et al. Facial landmark detection by semi-supervised deep learning
EP3905194A1 (en) Pose estimation method and apparatus
CN108446672B (zh) 一种基于由粗到细脸部形状估计的人脸对齐方法
US11915362B2 (en) UV mapping on 3D objects with the use of artificial intelligence
CN108198172B (zh) 图像显著性检测方法和装置
CN112036260B (zh) 一种自然环境下多尺度子块聚合的表情识别方法及系统
CN108491885A (zh) 一种基于朴素贝叶斯分类器的autoCAD图块识别方法及装置
CN108154156B (zh) 基于神经主题模型的图像集成分类方法及装置
CN115860091B (zh) 一种基于正交约束的深度特征描述符学习方法
Li et al. Multi-attribute regression network for face reconstruction
Kim et al. Adversarial confidence estimation networks for robust stereo matching
Sun et al. Deep Evolutionary 3D Diffusion Heat Maps for Large-pose Face Alignment.
Jiang et al. Mask removal: Face inpainting via attributes
Xie et al. pmbqa: Projection-based blind point cloud quality assessment via multimodal learning
CN107004136B (zh) 用于估计人脸图像的人脸关键点的方法和系统
Chang et al. Highly articulated kinematic structure estimation combining motion and skeleton information
JP4957924B2 (ja) 文書画像特徴量生成装置、文書画像特徴量生成方法及び文書画像特徴量生成用プログラム
Ghosh et al. Evolving bayesian graph for three-dimensional vehicle model building from video

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180904

RJ01 Rejection of invention patent application after publication