CN107577738A - 一种通过svm文本挖掘处理数据的fmeca方法 - Google Patents
一种通过svm文本挖掘处理数据的fmeca方法 Download PDFInfo
- Publication number
- CN107577738A CN107577738A CN201710748331.7A CN201710748331A CN107577738A CN 107577738 A CN107577738 A CN 107577738A CN 201710748331 A CN201710748331 A CN 201710748331A CN 107577738 A CN107577738 A CN 107577738A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- fmeca
- classification
- svm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明公开了一种通过SVM文本挖掘处理数据的FMECA方法,包括以下步骤:S1、搜集FMECA分析的故障数据;S2、将不利于模型建立的数据删除;S3、将整理的非结构化数据处理成能够用于SVM分析的结构化数据;S4、选取部分经过预处理的数据作为训练样本,余下部分为测试样本;S5、建立预测模型:通过训练样本建立预测模型,使数据通过预测模型预测输出故障模式;S6、验证模型,修改参数:通过测试样本验证建立预测模型的准确度,修改参数调整出最佳模型;S7、完善FMEA;S8、生成FMEA报告表;S9、生成CA报告表。本发明利用SVM文本挖掘对故障数据进行结构化处理,无需耗费大量人力分析数据,只需简单的设置即可完成故障模式的提取,分析成本降低,数据利用率显著提高。
Description
技术领域
本发明属于可靠性分析领域,特别涉及一种通过SVM文本挖掘处理数据的FMECA方法。
背景技术
故障模式、影响及危害性分析(FMECA)是工程应用中最常用的一种可靠性分析方法,也是一个有效的预防性分析工具,通过分析产品的所有可能产生的失效模式、后果及其原因,并按照每一种故障模式发生的概率、检测的难易程度以及危害程度予以分类,找到相应的改进措施,从而避免实际失效的发生的一种归纳分析方法。FMECA分析方法由故障模式、影响分析(FMEA)和危害性分析(CA)两部分组成,FMEA属于定性分析,CA是在FMEA的基础上依靠一定数据进行定量分析。只有在进行FMEA的基础上,才能进行CA。目前,FMECA技术已经被广泛应用于航空、航天、电子、电气、机械等领域,FMECA也被认为是实用、高效的可靠性分析技术。
根据FMECA分析理论,通过分析所得数据对产品使用阶段中可能或实际发生的故障、原因及其影响进行分析。其中故障是指产品不能或将不能完成预定功能的事件或状态。对于某些不可修复的产品,如电子元器件,导弹等,称之为失效;故障模式是指产品或系统故障的表现形式,通常指能被观察到的故障现象,如涡轮轴断裂、铜套磨损等;故障原因包括直接原因和间接原因。直接原因是指引起零部件故障的物理、化学变化的内在原因,间接原因是指导致本故障的其他环境和人为因素等;故障影响是指故障模式对产品或系统的使用、功能或状态所导致的后果,这些后果是指对产品与人的安全、使用、任务功能、环境、经济等各方面的综合后果。
FMECA分析的一般包括制定FMECA的计划及相关工作、定义系统、确定产品所有可能的故障模式、确定每个故障模式可能的原因及其发生的概率等级、确定每个故障模式可能的影响、确定每个故障模式可能的检测方法、确定每个故障模式可能发生的概率等级与严酷度等级或危害度/风险优先数的大小、确定薄弱环节及关键项目、生成FMECA报告等10个基本步骤。
故障模式分析是FMECA的基础。它的目的是根据被分析产品的硬件或功能特性,假设产品所有可能的故障模式,进而对每个假设的故障模式进行分析。对于具体产品,应结合产品功能、任务和使用环境等,给出产品故障判别的准则,即故障判据,他是判断产品故障与非故障的标准。产品的故障模式一般可以通过试验、统计、分析、预测和参考相似产品等方法获取,对于现有型号的产品,可以参考该产品在以往的生产和使用的过程中所发生的故障模式,再依照该产品不同的使用条件进行分析修正,进而得到该产品的故障模式;对于新研制的产品,可根据该产品的功能原理和结构特点,结合设计人员的经验知识,对产品的故障模式进行分析和预测,也可以参照与该产品功能、结构相似的产品所发生的故障模式,分析判断该产品的故障模式。
现如今的传统方法主要存在以下几个主要问题:
①由于网络的快速发展,用于FMECA分析的数据量显著增加,导致分析过程所需成本成倍提高,对于相对复杂的系统,工作量巨大,个人及规模小的团队无法短时间内完成。
②各种渠道的数据由不同书写人员书写,具有不同的书写规范,不同公司的售后反馈信息也有各自的框架,人力分析这些不同结构的数据很容易忽略某些故障模式,导致故障模式分析不全。
③在FMECA分析过程中,有很多包含在FMECA文本中的可靠性信息没有得到很好的探索和应用到改善可靠性的行动中,数据的应用效率低。
针对以上传统FMECA方法中存在的问题,急需针对FMECA分析数据提出一种能够解决数量大、种类多、分析成本高的方法,基于此,对分析数据进行文本挖掘很有必要。文本分类和聚类是文本挖掘最重要、最基本的挖掘功能。常用的文本分类方法有基于概率模型的方法,如朴素Bayes方法;隐马尔可夫模型;基于关系学习的决策树方法;基于统计学习的支持向量机方法(SVM);基于向量空间模型的K-近邻分类法和神经网络方法。
发明内容
本发明的目的在于克服现有技术的不足,提供一种利用SVM文本挖掘对故障数据进行结构化处理,通过分析故障数据中提取的特征元素建立准确的故障模式预测模型,准确预测故障数据所对应的故障模式,进而分析的出故障原因,完善并生成FMEA报告表的通过SVM文本挖掘处理数据的FMECA方法。
本发明的目的是通过以下技术方案来实现的:一种通过SVM文本挖掘处理数据的FMECA方法,包括以下步骤:
S1、数据准备:搜集用于FMECA分析的故障数据,并将其导入FMECA分析软件;
S2、数据整理:将不利于模型建立的数据删除;
S3、数据预处理:将整理的非结构化数据处理成能够用于SVM分析的结构化数据;
S4、样本分类:选取部分经过预处理的数据作为训练样本,用于分类模型建立,余下部分为测试样本,用于测试模型的准确度;
S5、建立预测模型:通过训练样本建立预测模型,使数据通过预测模型预测输出故障模式;
S6、验证模型,修改参数:通过测试样本验证建立预测模型的准确度,修改参数调整出最佳模型;
S7、完善FMEA:分析找出的每个故障模式对应的原因、概率等级、产生的影响、故障检测方法、改进措施,再按照FMECA指标计算严酷度和风险优先数;
S8、生成FMEA报告表:根据分析结果生成FMEA报告表;
S9、生成CA报告表:根据风险优先数生成CA报告表。
进一步地,所述步骤S1具体实现方法为:在R语言中载入rJava、xlsxjars和xlsx三个包,通过read命令将数据导入到R语言软件中;如果是中文数据,则将encoding参数设置为“UTF-8”。
进一步地,所述步骤S2具体实现方法为:将出现的频次只有1或2的数据删除。
进一步地,所述步骤S3包括以下子步骤:
S31、转化数据类型:将原始数据(文本资料)转化成字符型数据;
S32、分词处理:将字符型数据进行分词处理,转化成词集数据;由于文本资料包含语义信息,计算机不能直接分析,需要将文本分成简单的词汇最为分析的特征元素,在R中载入Rwoedseg包并通过其中的segmentCN函数来实现;
S33、建立语料库:根据分词处理过后的词集数据创建语料库,用于存储数据;在R中载入NLP和tm包并通过Corpus()函数实现;
S34、清洗数据:将没有任何意义的词语删除;通常是一些介词和叹词之类,比如“的、地、得、嗯、啊”等停止词以及一些空白、标点符号等;可以通过tm_map()函数进行删除,其中停止词库需要根据分析目的来编辑和导入;
S35、建立TMD矩阵:将清洗过后的数据转化成TMD矩阵(词语×文档的矩阵),矩阵的行表示文本数据的标签,列表示特征元(词),通过SnowballC包中的DocumentTermMatrix()函数来实现,其中参数romovePunctuation设置为T,根据数据的元素来设置minDocFreq以及wordLengths,数据的区分度大,weighting参数设置为TF,反之设置为TfIdf。
S36、降维去噪:文本挖掘数据处理过后维数高达数万,有很多噪音项,通过删除稀疏词条来达到降维去噪的目的,通过SnowballC包的removeSparseTerms()函数实现。
进一步地,所述步骤S4具体实现方法为:将预处理的数据分成两个数据集,其中一个作为训练集用来建立预测模型,一个作为测试集用来检验模型的准确度;根据文本的数量尽心分类,取总样本的70~90%作为训练集,余下的为测试集。
进一步地,所述步骤S5具体实现方法为:寻找一个满足分类要求的最优分类超平面,使得该超平面在保证分类精度的同时,能够使超平面两侧的空白区域最大化;具体包括以下子步骤:
S51、进行二分类,具体实现方法为:定义样本集:
i表示第i个样本;表示第i个样本的特征元素;l表示样本数量;yi表示第i个样本所属类别;
定义超平面及约束条件分别为:
式中为超平面对应的法向量;为特征元素组成的向量;b表示超平面方程的常数项;
构造超平面问题转化为在约束条件下求公式(4)的极值问题:
表示的转置;
求解约束最优化问题,引入Lagrange因子,变成如公式(5)所示的Lagrange函数:
式(5)中ai>0,ai表示第i个Lagrange系数;求极小值就转化为求和b的L氏函数的极小值;首先,求L对和b的偏微分并令其等于0,如公式(6)所示:
再将其转化为对偶问题:在公式(7)的约束条件下:
求公式(8)的最大值:
公式(8)中,表示两个特征向量的内积;求出使得(8)式最大值的ai,i=1,2,...l;
根据公式(9)求出ω:
然后根据公式(10)求出b:
即求出最佳超平面
S52、重复步骤S51的二分类操作,完成多类别分类。多类别分类主要有两类,直接法和间接法;间接法有两种,一对一方法和一对多方法,本次采用的是一对多方法。
进一步地,所述步骤S6具体实现方法为:将测试组的数据通过预测模型预测输出预测的失效模式,与测试组实际的失效模式进行对比,计算准确率,通过调整函数中的参数来调整模型,将准确率最高的模型作为最优预测模型。
本发明的有益效果:本发明利用SVM文本挖掘对故障数据进行结构化处理,通过分析故障数据中提取的特征元素建立准确的故障模式预测模型,准确预测故障数据所对应的故障模式,进而分析的出故障原因、检测方法等,完善并生成FMEA报告表。该方法相对于现有技术,应用计算机对数据进行分析处理,无需耗费大量人力分析数据,只需简单的设置即可完成故障模式的提取,因此分析成本降低。该方法应用SVM文本挖掘分类方法,通过提取文本数据中特征元素来建立模型,能够快速、准确的提取出故障模式,在大数据量的情况下,不会遗漏故障模式。该方法将大量的数据进行结构化处理用于文本挖掘,充分利用了本本数据以及文本中可靠性相关的信息,因此,数据利用率显著提高。
附图说明
图1为本发明的通过SVM文本挖掘处理数据的FMECA方法的流程图;
图2为本发明数据预处理的流程图;
图3是本发明应用的SVM文本挖掘方法的分类示意图。
具体实施方式
下面结合附图进一步说明本发明的技术方案。
如图1所示,一种通过SVM文本挖掘处理数据的FMECA方法,其特征在于,包括以下步骤:
S1、数据准备:搜集用于FMECA分析的故障数据,并将其导入FMECA分析软件;具体实现方法为:在R语言中载入rJava、xlsxjars和xlsx三个包,通过read命令将数据导入到R语言软件中;如果是中文数据,则将encoding参数设置为“UTF-8”。
S2、数据整理:将不利于模型建立的数据删除;一般设备的故障模式很多,有一些故障发生是极小概率事件,导致其出现概率极低,数据出现的频次只有1或2,无论将它分配到预测样本集还是测试样本集都会导致预测模型准确率的下降,故将出现的频次只有1或2的数据删除或单独提出。通过编写计数函数来实现,其中count值设为<=2。
S3、数据预处理:将整理的非结构化数据处理成能够用于SVM分析的结构化数据;具体流程如图2所示,包括以下子步骤:
S31、转化数据类型:将原始数据(文本资料)转化成字符型数据,通过as.character()命令实现;
S32、分词处理:将字符型数据进行分词处理,转化成词集数据;由于文本资料包含语义信息,计算机不能直接分析,需要将文本分成简单的词汇最为分析的特征元素,在R中载入Rwoedseg包并通过其中的segmentCN函数来实现;
S33、建立语料库:根据分词处理过后的词集数据创建语料库,用于存储数据;在R中载入NLP和tm包并通过Corpus()函数实现;
S34、清洗数据:将没有任何意义的词语删除;文本中有许多词语语意本是是没有任何意义的,通常是一些介词和叹词之类,比如“的、地、得、嗯、啊”等停止词以及一些空白、标点符号等;通过tm_map()函数进行删除,其中停止词库需要根据分析目的来编辑和导入;
S35、建立TMD矩阵:将清洗过后的数据转化成TMD矩阵(词语×文档的矩阵),矩阵的行表示文本数据的标签,列表示特征元(词),通过SnowballC包中的DocumentTermMatrix()函数来实现,其中参数romovePunctuation设置为T,根据数据的元素来设置minDocFreq以及wordLengths,数据的区分度大,weighting参数设置为TF,反之设置为TfIdf。
S36、降维去噪:文本挖掘数据处理过后维数高达数万,有很多噪音项,通过删除稀疏词条来达到降维去噪的目的,通过SnowballC包的removeSparseTerms()函数实现。
S4、样本分类:选取部分经过预处理的数据作为训练样本,用于分类模型建立,余下部分为测试样本,用于测试模型的准确度;具体实现方法为:将预处理的数据分成两个数据集,其中一个作为训练集用来建立预测模型,一个作为测试集用来检验模型的准确度;通常根据文本的数量尽心分类,取总样本的70~90%作为训练集,余下的为测试集。通过R语言的sample()函数可以实现随机抽取数据作为训练集和样本集。
S5、建立预测模型:通过训练样本建立预测模型,使数据通过预测模型预测输出故障模式;具体实现方法为:将训练样本集通过SVM方法进行分类,类别即为失效模式;SVM原理如图3所示,寻找一个满足分类要求的最优分类超平面,使得该超平面在保证分类精度的同时,能够使超平面两侧的空白区域最大化;具体包括以下子步骤:
S51、进行二分类,具体实现方法为:定义样本集:
i表示第i个样本;表示第i个样本的特征元素;l表示样本数量;yi表示第i个样本所属类别;
定义超平面及约束条件分别为:
式中为超平面对应的法向量;为特征元素组成的向量;b表示超平面方程的常数项;
构造超平面问题转化为在约束条件下求公式(4)的极值问题:
表示的转置;
求解约束最优化问题,引入Lagrange因子,变成如公式(5)所示的Lagrange函数:
式(5)中ai>0,ai表示第i个Lagrange系数;求极小值就转化为求和b的L氏函数的极小值;首先,求L对和b的偏微分并令其等于0,如公式(6)所示:
再将其转化为对偶问题:在公式(7)的约束条件下:
求公式(8)的最大值:
公式(8)中,表示两个特征向量的内积;求出使得(8)式最大值的ai,i=1,2,...l;
根据公式(9)求出ω:
然后根据公式(10)求出b:
即求出最佳超平面
S52、重复步骤S51的二分类操作,完成多类别分类。多类别分类主要有两类,直接法和间接法,间接法有两种,一对一方法和一对多方法,本次采用的是一对多方法。
在R语言中,可以通过“e1071”包的svm()函数以及“kernlab”包中的ksvm()函数来实现SVM分类方法。由于文本挖掘数据更适合线性核函数映射,所以kernel参数值为在svm()中为linear,在ksvm()中为polydot。
S6、验证模型,修改参数:通过测试样本验证建立预测模型的准确度,修改参数调整出最佳模型;具体实现方法为:将测试组的数据通过预测模型预测输出预测的失效模式,与测试组实际的失效模式进行对比,计算准确率,通过调整函数中的参数来调整模型,将准确率最高的模型作为最优预测模型。根据分析结果可以通过软件编写生成FMEA报告表和CA报告表,也可以直接利用分析数据填写FMEA及CA报告表。
S7、完善FMEA:分析找出的每个故障模式对应的原因、概率等级、产生的影响、故障检测方法、改进措施,再按照FMECA指标计算严酷度和风险优先数;
S8、生成FMEA报告表:根据分析结果生成FMEA报告表;
S9、生成CA报告表:根据风险优先数生成CA报告表。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (7)
1.一种通过SVM文本挖掘处理数据的FMECA方法,其特征在于,包括以下步骤:
S1、数据准备:搜集用于FMECA分析的故障数据,并将其导入FMECA分析软件;
S2、数据整理:将不利于模型建立的数据删除;
S3、数据预处理:将整理的非结构化数据处理成能够用于SVM分析的结构化数据;
S4、样本分类:选取部分经过预处理的数据作为训练样本,用于分类模型建立,余下部分为测试样本,用于测试模型的准确度;
S5、建立预测模型:通过训练样本建立预测模型,使数据通过预测模型预测输出故障模式;
S6、验证模型,修改参数:通过测试样本验证建立预测模型的准确度,修改参数调整出最佳模型;
S7、完善FMEA:分析找出的每个故障模式对应的原因、概率等级、产生的影响、故障检测方法、改进措施,再按照FMECA指标计算严酷度和风险优先数;
S8、生成FMEA报告表:根据分析结果生成FMEA报告表;
S9、生成CA报告表:根据风险优先数生成CA报告表。
2.根据权利要求1所述的通过SVM文本挖掘处理数据的FMECA方法,其特征在于,所述步骤S1具体实现方法为:在R语言中载入rJava、xlsxjars和xlsx三个包,通过read命令将数据导入到R语言软件中;如果是中文数据,则将encoding参数设置为“UTF-8”。
3.根据权利要求1所述的通过SVM文本挖掘处理数据的FMECA方法,其特征在于,所述步骤S2具体实现方法为:将出现的频次只有1或2的数据删除。
4.根据权利要求1所述的通过SVM文本挖掘处理数据的FMECA方法,其特征在于,所述步骤S3包括以下子步骤:
S31、转化数据类型:将原始数据转化成字符型数据;
S32、分词处理:将字符型数据进行分词处理,转化成词集数据;
S33、建立语料库:根据分词处理过后的词集数据创建语料库,用于存储数据;
S34、清洗数据:将没有任何意义的词语删除;
S35、建立TMD矩阵:将清洗过后的数据转化成TMD矩阵,矩阵的行表示文本数据的标签,列表示特征元;
S36、降维去噪:通过删除稀疏词条来达到降维去噪的目的。
5.根据权利要求1所述的通过SVM文本挖掘处理数据的FMECA方法,其特征在于,所述步骤S4具体实现方法为:将预处理的数据分成两个数据集,其中一个作为训练集用来建立预测模型,一个作为测试集用来检验模型的准确度;根据文本的数量尽心分类,取总样本的70~90%作为训练集,余下的为测试集。
6.根据权利要求1所述的通过SVM文本挖掘处理数据的FMECA方法,其特征在于,所述步骤S5具体实现方法为:寻找一个满足分类要求的最优分类超平面,使得该超平面在保证分类精度的同时,能够使超平面两侧的空白区域最大化;具体包括以下子步骤:
S51、进行二分类,具体实现方法为:定义样本集:
<mrow>
<mo>(</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>,</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mn>...</mn>
<mo>,</mo>
<mi>l</mi>
<mo>,</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>&Element;</mo>
<msup>
<mi>R</mi>
<mi>n</mi>
</msup>
<mo>,</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>&Element;</mo>
<mo>{</mo>
<mn>1</mn>
<mo>,</mo>
<mo>-</mo>
<mn>1</mn>
<mo>}</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
i表示第i个样本;表示第i个样本的特征元素;l表示样本数量;yi表示第i个样本所属类别;
定义超平面及约束条件分别为:
<mrow>
<mo>(</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>&CenterDot;</mo>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
<mo>+</mo>
<mi>b</mi>
<mo>=</mo>
<mn>0</mn>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>&lsqb;</mo>
<mrow>
<mo>(</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>&CenterDot;</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>b</mi>
<mo>&rsqb;</mo>
<mo>&GreaterEqual;</mo>
<mn>1</mn>
<mo>,</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mn>...</mn>
<mo>,</mo>
<mi>l</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
式中为超平面对应的法向量;为特征元素组成的向量;b表示超平面方程的常数项;
构造超平面问题转化为在约束条件下求公式(4)的极值问题:
<mrow>
<mi>min</mi>
<mi>&Phi;</mi>
<mrow>
<mo>(</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>|</mo>
<mo>|</mo>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<mrow>
<mo>(</mo>
<msup>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>&prime;</mo>
</msup>
<mo>&CenterDot;</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
表示的转置;
求解约束最优化问题,引入Lagrange因子,变成如公式(5)所示的Lagrange函数:
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>,</mo>
<mi>b</mi>
<mo>,</mo>
<mi>a</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>{</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>&lsqb;</mo>
<mrow>
<mo>(</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>&CenterDot;</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>b</mi>
<mo>&rsqb;</mo>
<mo>-</mo>
<mn>1</mn>
<mo>}</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
式(5)中ai>0,ai表示第i个Lagrange系数;求极小值就转化为求和b的L氏函数的极小值;首先,求L对和b的偏微分并令其等于0,如公式(6)所示:
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
</mrow>
</mfrac>
<mo>=</mo>
<mn>0</mn>
<mo>&DoubleRightArrow;</mo>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>l</mi>
</munderover>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>b</mi>
</mrow>
</mfrac>
<mo>=</mo>
<mn>0</mn>
<mo>&DoubleRightArrow;</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>l</mi>
</munderover>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>a</mi>
</mrow>
</mfrac>
<mo>=</mo>
<mn>0</mn>
<mo>&DoubleRightArrow;</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>&CenterDot;</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>+</mo>
<mi>b</mi>
<mo>-</mo>
<mn>1</mn>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
再将其转化为对偶问题:在公式(7)的约束条件下:
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>l</mi>
</munderover>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mn>0</mn>
<mo>,</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>&GreaterEqual;</mo>
<mn>0</mn>
<mo>,</mo>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<mi>l</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
求公式(8)的最大值:
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>max</mi>
<mi>a</mi>
</msub>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>a</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>l</mi>
</munderover>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>l</mi>
</munderover>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>j</mi>
</msub>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<msub>
<mi>a</mi>
<mi>j</mi>
</msub>
<mo><</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>j</mi>
</msub>
<mo>></mo>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
公式(8)中,表示两个特征向量的内积;求出使得(8)式最大值的ai,i=1,2,...l;
根据公式(9)求出ω:
<mrow>
<mi>&omega;</mi>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>l</mi>
</munderover>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>i</mi>
</msub>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>9</mn>
<mo>)</mo>
</mrow>
</mrow>
然后根据公式(10)求出b:
<mrow>
<mi>b</mi>
<mo>=</mo>
<mo>-</mo>
<mfrac>
<mrow>
<msub>
<mi>max</mi>
<mrow>
<mi>i</mi>
<mo>:</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mn>1</mn>
</mrow>
</msub>
<msup>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>&prime;</mo>
</msup>
<mo>&CenterDot;</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>+</mo>
<msub>
<mi>min</mi>
<mrow>
<mi>i</mi>
<mo>:</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msub>
<msup>
<mover>
<mi>&omega;</mi>
<mo>&OverBar;</mo>
</mover>
<mo>&prime;</mo>
</msup>
<mo>&CenterDot;</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
</mrow>
<mn>2</mn>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>10</mn>
<mo>)</mo>
</mrow>
</mrow>
即求出最佳超平面
S52、重复步骤S51的二分类操作,完成多类别的分类。
7.根据权利要求1所述的通过SVM文本挖掘处理数据的FMECA方法,其特征在于,所述步骤S6具体实现方法为:将测试组的数据通过预测模型预测输出预测的失效模式,与测试组实际的失效模式进行对比,计算准确率,通过调整函数中的参数来调整模型,将准确率最高的模型作为最优预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710748331.7A CN107577738A (zh) | 2017-08-28 | 2017-08-28 | 一种通过svm文本挖掘处理数据的fmeca方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710748331.7A CN107577738A (zh) | 2017-08-28 | 2017-08-28 | 一种通过svm文本挖掘处理数据的fmeca方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107577738A true CN107577738A (zh) | 2018-01-12 |
Family
ID=61029656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710748331.7A Pending CN107577738A (zh) | 2017-08-28 | 2017-08-28 | 一种通过svm文本挖掘处理数据的fmeca方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107577738A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111553375A (zh) * | 2019-02-08 | 2020-08-18 | Sap欧洲公司 | 使用变换以验证计算机视觉质量 |
CN111881259A (zh) * | 2020-07-30 | 2020-11-03 | 贵州电网有限责任公司 | 一种基于文本挖掘的设备故障概率评估方法及系统 |
CN115858474A (zh) * | 2023-02-27 | 2023-03-28 | 环球数科集团有限公司 | 一种基于aigc的文件整理系统 |
CN115985046A (zh) * | 2022-11-23 | 2023-04-18 | 南方医科大学南方医院 | 一种婴儿培养箱状态实时检测及预警系统及其实现方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090157573A1 (en) * | 2006-01-23 | 2009-06-18 | The Trustees Of Columbia University In The City Of New York | System And Method For Grading Electricity Distribution Network Feeders Susceptible To Impending Failure |
CN102231080A (zh) * | 2011-06-28 | 2011-11-02 | 电子科技大学 | 一种基于故障物理的航天器用谐波齿轮的可靠性分析方法 |
CN102982400A (zh) * | 2011-08-03 | 2013-03-20 | 通用电气公司 | 用于风险管理系统的系统 |
CN103186708A (zh) * | 2011-12-31 | 2013-07-03 | 电子科技大学 | 一种采用两个rpn数的故障模式影响及危害性分析方法 |
JP5288954B2 (ja) * | 2008-09-09 | 2013-09-11 | 中部電力株式会社 | 無停電電源装置 |
CN103745229A (zh) * | 2013-12-31 | 2014-04-23 | 北京泰乐德信息技术有限公司 | 一种基于svm的轨道交通故障诊断方法及系统 |
CN106407406A (zh) * | 2016-09-22 | 2017-02-15 | 国信优易数据有限公司 | 一种文本处理方法和系统 |
-
2017
- 2017-08-28 CN CN201710748331.7A patent/CN107577738A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090157573A1 (en) * | 2006-01-23 | 2009-06-18 | The Trustees Of Columbia University In The City Of New York | System And Method For Grading Electricity Distribution Network Feeders Susceptible To Impending Failure |
JP5288954B2 (ja) * | 2008-09-09 | 2013-09-11 | 中部電力株式会社 | 無停電電源装置 |
CN102231080A (zh) * | 2011-06-28 | 2011-11-02 | 电子科技大学 | 一种基于故障物理的航天器用谐波齿轮的可靠性分析方法 |
CN102982400A (zh) * | 2011-08-03 | 2013-03-20 | 通用电气公司 | 用于风险管理系统的系统 |
CN103186708A (zh) * | 2011-12-31 | 2013-07-03 | 电子科技大学 | 一种采用两个rpn数的故障模式影响及危害性分析方法 |
CN103745229A (zh) * | 2013-12-31 | 2014-04-23 | 北京泰乐德信息技术有限公司 | 一种基于svm的轨道交通故障诊断方法及系统 |
CN106407406A (zh) * | 2016-09-22 | 2017-02-15 | 国信优易数据有限公司 | 一种文本处理方法和系统 |
Non-Patent Citations (1)
Title |
---|
张荣玉: "基于文本挖掘的航天工程技术风险分类研究", 《道客巴巴》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111553375A (zh) * | 2019-02-08 | 2020-08-18 | Sap欧洲公司 | 使用变换以验证计算机视觉质量 |
CN111553375B (zh) * | 2019-02-08 | 2024-04-05 | Sap欧洲公司 | 使用变换以验证计算机视觉质量 |
CN111881259A (zh) * | 2020-07-30 | 2020-11-03 | 贵州电网有限责任公司 | 一种基于文本挖掘的设备故障概率评估方法及系统 |
CN111881259B (zh) * | 2020-07-30 | 2023-06-20 | 贵州电网有限责任公司 | 一种基于文本挖掘的设备故障概率评估方法及系统 |
CN115985046A (zh) * | 2022-11-23 | 2023-04-18 | 南方医科大学南方医院 | 一种婴儿培养箱状态实时检测及预警系统及其实现方法 |
CN115985046B (zh) * | 2022-11-23 | 2024-04-16 | 南方医科大学南方医院 | 一种婴儿培养箱状态实时检测及预警系统及其实现方法 |
CN115858474A (zh) * | 2023-02-27 | 2023-03-28 | 环球数科集团有限公司 | 一种基于aigc的文件整理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220405592A1 (en) | Multi-feature log anomaly detection method and system based on log full semantics | |
CN109800310B (zh) | 一种基于结构化表达的电力运维文本分析方法 | |
Haque et al. | Non-functional requirements classification with feature extraction and machine learning: An empirical study | |
CN102831184B (zh) | 根据对社会事件的文字描述来预测社会情感的方法及系统 | |
CN107862046A (zh) | 一种基于短文本相似度的税务商品编码分类方法及系统 | |
CN107577738A (zh) | 一种通过svm文本挖掘处理数据的fmeca方法 | |
CN111079430A (zh) | 一种组合深度学习和概念图谱的电力故障事件抽取方法 | |
CN113742733B (zh) | 阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置 | |
KR20160149050A (ko) | 텍스트 마이닝을 활용한 순수 기업 선정 장치 및 방법 | |
Wang et al. | Active Learning for Black-Box Semantic Role Labeling with Neural Factors. | |
KR102608867B1 (ko) | 업계 텍스트를 증분하는 방법, 관련 장치 및 매체에 저장된 컴퓨터 프로그램 | |
Bortnikova et al. | Queries classification using machine learning for implementation in intelligent manufacturing | |
Bortnikova et al. | Search Query Classification Using Machine Learning for Information Retrieval Systems in Intelligent Manufacturing. | |
CN112559741B (zh) | 核电设备缺陷记录文本分类方法、系统、介质及电子设备 | |
CN110704638A (zh) | 一种基于聚类算法的电力文本词典构造方法 | |
CN112215002A (zh) | 一种基于改进朴素贝叶斯的电力系统文本数据分类方法 | |
CN111737993A (zh) | 一种配电网设备的故障缺陷文本提取设备健康状态方法 | |
Sreejith et al. | N-gram based algorithm for distinguishing between Hindi and Sanskrit texts | |
CN106991171A (zh) | 基于智慧校园信息服务平台的话题发现方法 | |
CN111242170A (zh) | 食品检验检测项目预知方法及装置 | |
CN114202038B (zh) | 一种基于dbm深度学习的众包缺陷分类方法 | |
Pei | Construction of a legal system of corporate social responsibility based on big data analysis technology | |
Suhasini et al. | A Hybrid TF-IDF and N-Grams Based Feature Extraction Approach for Accurate Detection of Fake News on Twitter Data | |
Abdulla et al. | Fake News Detection: A Graph Mining Approach | |
Liu et al. | The runtime system problem identification method based on log analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180112 |
|
RJ01 | Rejection of invention patent application after publication |