CN109871992A - 基于r-svm的tft-lcd工业智能预测方法 - Google Patents
基于r-svm的tft-lcd工业智能预测方法 Download PDFInfo
- Publication number
- CN109871992A CN109871992A CN201910092644.0A CN201910092644A CN109871992A CN 109871992 A CN109871992 A CN 109871992A CN 201910092644 A CN201910092644 A CN 201910092644A CN 109871992 A CN109871992 A CN 109871992A
- Authority
- CN
- China
- Prior art keywords
- data
- svm
- model
- column
- dimensionality reduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于R‑SVM的TFT‑LCD工业智能预测方法,本发明将传统svm与随机森林的思想进行了结合,使最终预测结果,更加具有鲁棒性,更可靠。同时,svm本身就适用于高维数据,大型特征空间的训练,在小样本数据上表现较好。实现该方法的核心过程在于样本与特征集合的构建并与最终svm的结合上。传统的svm模型对于特征与样本集合不做太多的筛选与判断,对于整个样本集合都选择直接放入模型中进行训练。基于随机森林的思想,本发明考虑在模型训练的过程中,组成多个不同的样本集与特征集并且结合传统的svm模型进行训练。将训练得到的多个svm模型再对最后的验证集分别进行预测,取所有预测的均值作为最终的预测结果。
Description
技术领域
本发明是一种基于R-SVM的TFT-LCD薄膜晶体管液晶显示器)工业智能预测方法。
背景技术
半导体产业是一个信息化程度高的产业。高度的信息化给数据分析创造了可能性。基于数据的分析可以帮助半导体产业更好的利用生产信息,提高产品质量。现有的解决方案是,生产机器生产完成后,对产品质量做非全面的抽测,进行产品质量检核。这往往会出现以下状况,一是不能即时的知道质量的好坏,当发现质量不佳的产品时,要修正通常都为时以晚,二是在没有办法全面抽测的状况下,存在很大漏检的风险。在机器学习,人工智能快速发展的今天,希望由机器生产参数去预测产品的质量,来达到生产结果即时性以及全面性。更进一步的,可基于预先知道的结果,去做对应的决策及应变,对客户负责,也对制造生产更加敏感。传统的机器学习方法都对数据型预测做出了很大的贡献。单一性的方法有线性回归,实现简单,计算简单并且可解释性强,适用于连续型数据的预测;Svm可解决高维问题,大型特征空间,提高泛化能力;决策树计算简单,易于理解,适用于有缺失属性的样本,高效应对大数据集;knn理论成熟,思想简单等。集成算法包括bagging与boosting类的多种算法。其中运行效果较好的是随机森林方法,解决了决策树的过拟合问题,并且提高了模型的鲁棒性,发挥了较好的作用。集成算法在单一算法的基础上有了一些进步,但是也存在自身的弊端。例如随机森林在解决回归问题时,并不像分类问题的效果那么理想。尤其是在处理小样本数据的时候,效果也是不甚满意。
发明内容
考虑到上述问题,本发明提出了一种基于随机svm的工业智能预测方法。由于上述方法改变了传统的svm训练方式,将传统svm与随机森林的思想进行了结合,使最终预测结果,更加具有鲁棒性,更可靠。同时,svm本身就适用于高维数据,大型特征空间的训练,在小样本数据上表现较好。
本发明采用的技术方案为基于R-SVM的TFT-LCD工业智能预测方法,本方法数据来源于阿里天池工业智能制造质量预测公开数据集,数据列包括生产TFT-LCD的工业制作过程。共有8029列,600个样本。
该方法的实现过程包括如下步骤:
步骤1,数据预处理;
步骤2,pca降维;
步骤3,模型搭建;
步骤4,多模型判断优异;
步骤5,模型预测;
步骤6,mse判定。
步骤1,数据预处理。在数据预处理部分,首先对8029列数据中的离散型数据进行了处理。根据离散型数据列与最终Y值的影响做了一元方差分析。根据离散型列值分析对数据进行了encoder型编码。对数据样本进行去空,重复列去重,对单个空缺值进行填补(使用前一值进行补充)。
步骤2,PCA降维。在降维阶段,使用pca降维技术,因为数据中没有关于各个列值的具体说明,所以直接采用pca降维的方法。在降维过程中,前300列包含有数据98%以上的信息,在降维阶段保留前300列的数据信息。
步骤3,模型搭建。模型搭建的过程中采用了多种方式对模型进行构造与比对。首先使用k折交叉验证对数据进行训练集与测试集的划分,对划分后的数据进行归一化,为后期模型训练准备数据。
步骤4,模型选定。采用机器学习方法对整个数据样本进行了预测。
MSE是真实值与预测值的均方误差,n是样本个数,是预测值,Yi是真实值。
在降维之后的特征中随机选择出250列特征值,并从500个训练集中抽出300条做为每一个svm模型的训练集,训练出了15个svm模型。组合形成R-SVM模型。
步骤5,mse判定。将训练好的15个svm模型对测试集进行预测,将结果取均值。根据mse判定方法,计算出R-SVM模型的均方误差。
实现该方法的核心过程在于样本与特征集合的构建并与最终svm的结合上。传统的svm模型对于特征与样本集合不做太多的筛选与判断,对于整个样本集合都选择直接放入模型中进行训练。基于随机森林的思想,本发明考虑在模型训练的过程中,组成多个不同的样本集与特征集并且结合传统的svm模型进行训练。将训练得到的多个svm模型再对最后的验证集分别进行预测,取所有预测的均值作为最终的预测结果。
附图说明
图1是本发明的总体流程示意图。
图2是本发明中object数据的单元素分析结果图。
图3是本发明中PCA降维数据列信息含量图。
图4是本发明svm的集合模型结构图。
具体实施方式
以下结合附图和实施例对本发明进行详细说明。
数据描述:本发明数据来源于阿里天池工业智能制造质量预测公开数据集,数据列包括生产TFT-LCD的工业制作过程。共有8029列,600个样本。
以下将结合附图所示的具体实施方式对本发明进行详细描述。
图1是本发明基于R-SVM的TFT-LCD工业智能预测方法的流程示意图,如图1所示,整个操作过程包括:
步骤1,数据预处理,;
步骤2,pca降维;
步骤3,模型搭建,;
步骤4,多模型判断优异;
步骤5,模型预测;
步骤6,mse判定。
以下对每个步骤进行详细说明:
步骤1,数据预处理。在数据预处理部分,本实例首先对8029列数据中的离散型数据进行了处理。根据离散型数据列与最终Y值的影响做了一元方差分析。方差分析结果如图2所示。根据离散型列值分析对数据进行了encoder型编码。对数据样本进行去空,重复列去重,对单个空缺值进行填补(使用前一值进行补充)。
步骤2,PCA降维。在降维阶段,本实例使用的是pca降维技术,因为数据中没有关于各个列值的具体说明,所以直接采用了pca降维的方法,对列值不需要过多的解释。在降维过程中,发现前300列包含有数据98%以上的信息,如图3所示。所以在降维阶段保留前300列的数据信息。
步骤3,模型搭建。模型搭建的过程中本实例采用了多种方式对模型进行构造与比对。首先使用k折交叉验证对数据进行训练集与测试集的划分,对划分后的数据进行归一化,为后期模型训练准备数据。
步骤4,模型选定。本实例首先采用了传统的机器学习方法对整个数据样本进行了预测,预测结果如表1所示。
MSE是真实值与预测值的均方误差,n是样本个数,是预测值,Yi是真实值。
根据表1可知,传统算法中svm与随机森林得到的结果最好。所以本发明将随机森林的思想运用于svm中。在降维之后的特征中随机选择出250列特征值,并从500个训练集中抽出300条做为每一个svm模型的训练集,训练出了15个svm模型。组合形成R-SVM模型。
步骤5,mse判定。将训练好的15个svm模型对测试集进行预测,将结果取均值。根据mse判定方法,计算出R-SVM模型的均方误差。根据数据结果发现本发明中的RSVM模型较其他模型相比,mse下降了2个百分点,优化效果明显。
表1
Claims (2)
1.基于R-SVM的TFT-LCD工业智能预测方法,其特征在于:本方法数据来源于阿里天池工业智能制造质量预测公开数据集,数据列包括生产TFT-LCD的工业制作过程。共有8029列,600个样本;
该方法的实现过程包括如下步骤,
步骤1,数据预处理;
步骤2,pca降维;
步骤3,模型搭建;
步骤4,多模型判断优异;
步骤5,模型预测;
步骤6,mse判定。
2.根据权利要求1所述的基于R-SVM的TFT-LCD工业智能预测方法,其特征在于:步骤1,数据预处理;在数据预处理部分,首先对8029列数据中的离散型数据进行了处理;根据离散型数据列与最终Y值的影响做了一元方差分析;根据离散型列值分析对数据进行了encoder型编码;对数据样本进行去空,重复列去重,对单个空缺值进行填补;
步骤2,PCA降维;在降维阶段,使用pca降维技术,因为数据中没有关于各个列值的具体说明,所以直接采用pca降维的方法;在降维过程中,前300列包含有数据98%以上的信息,在降维阶段保留前300列的数据信息;
步骤3,模型搭建;模型搭建的过程中采用了多种方式对模型进行构造与比对;首先使用k折交叉验证对数据进行训练集与测试集的划分,对划分后的数据进行归一化,为后期模型训练准备数据;
步骤4,模型选定;采用机器学习方法对整个数据样本进行了预测;
MSE是真实值与预测值的均方误差,n是样本个数,是预测值,Yi是真实值;
在降维之后的特征中随机选择出250列特征值,并从500个训练集中抽出300条做为每一个svm模型的训练集,训练出了15个svm模型;组合形成R-SVM模型;
步骤5,mse判定;将训练好的15个svm模型对测试集进行预测,将结果取均值;根据mse判定方法,计算出R-SVM模型的均方误差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910092644.0A CN109871992A (zh) | 2019-01-30 | 2019-01-30 | 基于r-svm的tft-lcd工业智能预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910092644.0A CN109871992A (zh) | 2019-01-30 | 2019-01-30 | 基于r-svm的tft-lcd工业智能预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109871992A true CN109871992A (zh) | 2019-06-11 |
Family
ID=66918300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910092644.0A Pending CN109871992A (zh) | 2019-01-30 | 2019-01-30 | 基于r-svm的tft-lcd工业智能预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109871992A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110321960A (zh) * | 2019-07-09 | 2019-10-11 | 上海新增鼎网络技术有限公司 | 一种工厂生产要素的预测方法及系统 |
CN111401471A (zh) * | 2020-04-08 | 2020-07-10 | 中国人民解放军国防科技大学 | 一种航天器姿态异常检测方法及系统 |
CN113798315A (zh) * | 2021-10-16 | 2021-12-17 | 北京航空航天大学 | 基于机器学习的热强化sve技术气体排放控制方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102058413A (zh) * | 2010-12-03 | 2011-05-18 | 上海交通大学 | 基于连续小波变换的脑电信号警觉度检测方法 |
CN102841979A (zh) * | 2012-06-26 | 2012-12-26 | 广州市新之地环保产业有限公司 | 一种基于pca-ga-svr的污泥回流量预测方法 |
CN105023022A (zh) * | 2015-07-09 | 2015-11-04 | 深圳天珑无线科技有限公司 | 跌倒检测方法及系统 |
CN106250914A (zh) * | 2016-07-22 | 2016-12-21 | 华侨大学 | 基于结构稀疏多核学习的多模态数据特征筛选和分类方法 |
CN106446940A (zh) * | 2016-09-13 | 2017-02-22 | 大连理工大学 | 一种基于支持向量机的超级电容器电容值退化趋势的预测方法 |
CN107122526A (zh) * | 2017-04-06 | 2017-09-01 | 大连大学 | 基于异态特征子集集成算法的试验段马赫数建模方法 |
CN107509202A (zh) * | 2017-07-10 | 2017-12-22 | 东南大学 | 一种基于接入用户数变化预测的超密集网络资源分配方法 |
CN108564117A (zh) * | 2018-03-30 | 2018-09-21 | 华南理工大学 | 一种基于svm的贫困生辅助认定方法 |
-
2019
- 2019-01-30 CN CN201910092644.0A patent/CN109871992A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102058413A (zh) * | 2010-12-03 | 2011-05-18 | 上海交通大学 | 基于连续小波变换的脑电信号警觉度检测方法 |
CN102841979A (zh) * | 2012-06-26 | 2012-12-26 | 广州市新之地环保产业有限公司 | 一种基于pca-ga-svr的污泥回流量预测方法 |
CN105023022A (zh) * | 2015-07-09 | 2015-11-04 | 深圳天珑无线科技有限公司 | 跌倒检测方法及系统 |
CN106250914A (zh) * | 2016-07-22 | 2016-12-21 | 华侨大学 | 基于结构稀疏多核学习的多模态数据特征筛选和分类方法 |
CN106446940A (zh) * | 2016-09-13 | 2017-02-22 | 大连理工大学 | 一种基于支持向量机的超级电容器电容值退化趋势的预测方法 |
CN107122526A (zh) * | 2017-04-06 | 2017-09-01 | 大连大学 | 基于异态特征子集集成算法的试验段马赫数建模方法 |
CN107509202A (zh) * | 2017-07-10 | 2017-12-22 | 东南大学 | 一种基于接入用户数变化预测的超密集网络资源分配方法 |
CN108564117A (zh) * | 2018-03-30 | 2018-09-21 | 华南理工大学 | 一种基于svm的贫困生辅助认定方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110321960A (zh) * | 2019-07-09 | 2019-10-11 | 上海新增鼎网络技术有限公司 | 一种工厂生产要素的预测方法及系统 |
CN111401471A (zh) * | 2020-04-08 | 2020-07-10 | 中国人民解放军国防科技大学 | 一种航天器姿态异常检测方法及系统 |
CN111401471B (zh) * | 2020-04-08 | 2023-04-18 | 中国人民解放军国防科技大学 | 一种航天器姿态异常检测方法及系统 |
CN113798315A (zh) * | 2021-10-16 | 2021-12-17 | 北京航空航天大学 | 基于机器学习的热强化sve技术气体排放控制方法 |
CN113798315B (zh) * | 2021-10-16 | 2022-07-29 | 北京航空航天大学 | 基于机器学习的热强化sve技术气体排放控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109871992A (zh) | 基于r-svm的tft-lcd工业智能预测方法 | |
Harvey et al. | Automated feature design for numeric sequence classification by genetic programming | |
US8626682B2 (en) | Automatic data cleaning for machine learning classifiers | |
CN107392241B (zh) | 一种基于加权列抽样XGBoost的图像目标分类方法 | |
CN112070128B (zh) | 一种基于深度学习的变压器故障诊断方法 | |
CN108921285B (zh) | 基于双向门控循环神经网络的电能质量扰动的分类方法 | |
CN112381788B (zh) | 一种基于双分支匹配网络的零部件表面缺陷增量检测方法 | |
CN110516818A (zh) | 一种基于集成学习技术的高维度数据预测方法 | |
CN109271374A (zh) | 一种基于机器学习的数据库健康度打分方法和打分系统 | |
CN111026058B (zh) | 基于瓦瑟斯坦距离和自编码器的半监督深度学习故障诊断方法 | |
CN111898461A (zh) | 一种时序行为片段生成方法 | |
CN111737907A (zh) | 一种基于深度学习和dga的变压器故障诊断方法及装置 | |
CN110837874A (zh) | 基于时间序列分类的业务数据异常检测方法 | |
Ünal et al. | Fruit recognition and classification with deep learning support on embedded system (fruitnet) | |
CN110569883B (zh) | 基于Kohonen网络聚类和ReliefF特征选择的空气质量指数预测方法 | |
CN112817954A (zh) | 一种基于多种方法集成学习的缺失值插补方法 | |
CN113111183A (zh) | 一种牵引供电设备缺陷等级分类方法 | |
CN114330500B (zh) | 基于storm平台的电网电力设备在线并行诊断方法及系统 | |
CN109472316B (zh) | 一种基于深度学习的滤棒装盒质量识别方法 | |
CN111275136A (zh) | 基于小样本下的故障预测系统及其预警方法 | |
CN115812210A (zh) | 用于增强机器学习分类任务的性能的方法和设备 | |
CN116934687A (zh) | 一种基于半监督辅助学习语义分割的注塑制品表面缺陷检测方法 | |
CN114266337A (zh) | 一种基于残差网络的烟叶智能分级模型及利用该模型分级的方法 | |
Rong et al. | A vehicle type recognition method based on sparse auto encoder | |
CN110955811B (zh) | 基于朴素贝叶斯算法的电力数据分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190611 |