CN109871992A - 基于r-svm的tft-lcd工业智能预测方法 - Google Patents

基于r-svm的tft-lcd工业智能预测方法 Download PDF

Info

Publication number
CN109871992A
CN109871992A CN201910092644.0A CN201910092644A CN109871992A CN 109871992 A CN109871992 A CN 109871992A CN 201910092644 A CN201910092644 A CN 201910092644A CN 109871992 A CN109871992 A CN 109871992A
Authority
CN
China
Prior art keywords
data
svm
model
column
dimensionality reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910092644.0A
Other languages
English (en)
Inventor
张涛
冯宇婷
郝兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201910092644.0A priority Critical patent/CN109871992A/zh
Publication of CN109871992A publication Critical patent/CN109871992A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于R‑SVM的TFT‑LCD工业智能预测方法,本发明将传统svm与随机森林的思想进行了结合,使最终预测结果,更加具有鲁棒性,更可靠。同时,svm本身就适用于高维数据,大型特征空间的训练,在小样本数据上表现较好。实现该方法的核心过程在于样本与特征集合的构建并与最终svm的结合上。传统的svm模型对于特征与样本集合不做太多的筛选与判断,对于整个样本集合都选择直接放入模型中进行训练。基于随机森林的思想,本发明考虑在模型训练的过程中,组成多个不同的样本集与特征集并且结合传统的svm模型进行训练。将训练得到的多个svm模型再对最后的验证集分别进行预测,取所有预测的均值作为最终的预测结果。

Description

基于R-SVM的TFT-LCD工业智能预测方法
技术领域
本发明是一种基于R-SVM的TFT-LCD薄膜晶体管液晶显示器)工业智能预测方法。
背景技术
半导体产业是一个信息化程度高的产业。高度的信息化给数据分析创造了可能性。基于数据的分析可以帮助半导体产业更好的利用生产信息,提高产品质量。现有的解决方案是,生产机器生产完成后,对产品质量做非全面的抽测,进行产品质量检核。这往往会出现以下状况,一是不能即时的知道质量的好坏,当发现质量不佳的产品时,要修正通常都为时以晚,二是在没有办法全面抽测的状况下,存在很大漏检的风险。在机器学习,人工智能快速发展的今天,希望由机器生产参数去预测产品的质量,来达到生产结果即时性以及全面性。更进一步的,可基于预先知道的结果,去做对应的决策及应变,对客户负责,也对制造生产更加敏感。传统的机器学习方法都对数据型预测做出了很大的贡献。单一性的方法有线性回归,实现简单,计算简单并且可解释性强,适用于连续型数据的预测;Svm可解决高维问题,大型特征空间,提高泛化能力;决策树计算简单,易于理解,适用于有缺失属性的样本,高效应对大数据集;knn理论成熟,思想简单等。集成算法包括bagging与boosting类的多种算法。其中运行效果较好的是随机森林方法,解决了决策树的过拟合问题,并且提高了模型的鲁棒性,发挥了较好的作用。集成算法在单一算法的基础上有了一些进步,但是也存在自身的弊端。例如随机森林在解决回归问题时,并不像分类问题的效果那么理想。尤其是在处理小样本数据的时候,效果也是不甚满意。
发明内容
考虑到上述问题,本发明提出了一种基于随机svm的工业智能预测方法。由于上述方法改变了传统的svm训练方式,将传统svm与随机森林的思想进行了结合,使最终预测结果,更加具有鲁棒性,更可靠。同时,svm本身就适用于高维数据,大型特征空间的训练,在小样本数据上表现较好。
本发明采用的技术方案为基于R-SVM的TFT-LCD工业智能预测方法,本方法数据来源于阿里天池工业智能制造质量预测公开数据集,数据列包括生产TFT-LCD的工业制作过程。共有8029列,600个样本。
该方法的实现过程包括如下步骤:
步骤1,数据预处理;
步骤2,pca降维;
步骤3,模型搭建;
步骤4,多模型判断优异;
步骤5,模型预测;
步骤6,mse判定。
步骤1,数据预处理。在数据预处理部分,首先对8029列数据中的离散型数据进行了处理。根据离散型数据列与最终Y值的影响做了一元方差分析。根据离散型列值分析对数据进行了encoder型编码。对数据样本进行去空,重复列去重,对单个空缺值进行填补(使用前一值进行补充)。
步骤2,PCA降维。在降维阶段,使用pca降维技术,因为数据中没有关于各个列值的具体说明,所以直接采用pca降维的方法。在降维过程中,前300列包含有数据98%以上的信息,在降维阶段保留前300列的数据信息。
步骤3,模型搭建。模型搭建的过程中采用了多种方式对模型进行构造与比对。首先使用k折交叉验证对数据进行训练集与测试集的划分,对划分后的数据进行归一化,为后期模型训练准备数据。
步骤4,模型选定。采用机器学习方法对整个数据样本进行了预测。
MSE是真实值与预测值的均方误差,n是样本个数,是预测值,Yi是真实值。
在降维之后的特征中随机选择出250列特征值,并从500个训练集中抽出300条做为每一个svm模型的训练集,训练出了15个svm模型。组合形成R-SVM模型。
步骤5,mse判定。将训练好的15个svm模型对测试集进行预测,将结果取均值。根据mse判定方法,计算出R-SVM模型的均方误差。
实现该方法的核心过程在于样本与特征集合的构建并与最终svm的结合上。传统的svm模型对于特征与样本集合不做太多的筛选与判断,对于整个样本集合都选择直接放入模型中进行训练。基于随机森林的思想,本发明考虑在模型训练的过程中,组成多个不同的样本集与特征集并且结合传统的svm模型进行训练。将训练得到的多个svm模型再对最后的验证集分别进行预测,取所有预测的均值作为最终的预测结果。
附图说明
图1是本发明的总体流程示意图。
图2是本发明中object数据的单元素分析结果图。
图3是本发明中PCA降维数据列信息含量图。
图4是本发明svm的集合模型结构图。
具体实施方式
以下结合附图和实施例对本发明进行详细说明。
数据描述:本发明数据来源于阿里天池工业智能制造质量预测公开数据集,数据列包括生产TFT-LCD的工业制作过程。共有8029列,600个样本。
以下将结合附图所示的具体实施方式对本发明进行详细描述。
图1是本发明基于R-SVM的TFT-LCD工业智能预测方法的流程示意图,如图1所示,整个操作过程包括:
步骤1,数据预处理,;
步骤2,pca降维;
步骤3,模型搭建,;
步骤4,多模型判断优异;
步骤5,模型预测;
步骤6,mse判定。
以下对每个步骤进行详细说明:
步骤1,数据预处理。在数据预处理部分,本实例首先对8029列数据中的离散型数据进行了处理。根据离散型数据列与最终Y值的影响做了一元方差分析。方差分析结果如图2所示。根据离散型列值分析对数据进行了encoder型编码。对数据样本进行去空,重复列去重,对单个空缺值进行填补(使用前一值进行补充)。
步骤2,PCA降维。在降维阶段,本实例使用的是pca降维技术,因为数据中没有关于各个列值的具体说明,所以直接采用了pca降维的方法,对列值不需要过多的解释。在降维过程中,发现前300列包含有数据98%以上的信息,如图3所示。所以在降维阶段保留前300列的数据信息。
步骤3,模型搭建。模型搭建的过程中本实例采用了多种方式对模型进行构造与比对。首先使用k折交叉验证对数据进行训练集与测试集的划分,对划分后的数据进行归一化,为后期模型训练准备数据。
步骤4,模型选定。本实例首先采用了传统的机器学习方法对整个数据样本进行了预测,预测结果如表1所示。
MSE是真实值与预测值的均方误差,n是样本个数,是预测值,Yi是真实值。
根据表1可知,传统算法中svm与随机森林得到的结果最好。所以本发明将随机森林的思想运用于svm中。在降维之后的特征中随机选择出250列特征值,并从500个训练集中抽出300条做为每一个svm模型的训练集,训练出了15个svm模型。组合形成R-SVM模型。
步骤5,mse判定。将训练好的15个svm模型对测试集进行预测,将结果取均值。根据mse判定方法,计算出R-SVM模型的均方误差。根据数据结果发现本发明中的RSVM模型较其他模型相比,mse下降了2个百分点,优化效果明显。
表1

Claims (2)

1.基于R-SVM的TFT-LCD工业智能预测方法,其特征在于:本方法数据来源于阿里天池工业智能制造质量预测公开数据集,数据列包括生产TFT-LCD的工业制作过程。共有8029列,600个样本;
该方法的实现过程包括如下步骤,
步骤1,数据预处理;
步骤2,pca降维;
步骤3,模型搭建;
步骤4,多模型判断优异;
步骤5,模型预测;
步骤6,mse判定。
2.根据权利要求1所述的基于R-SVM的TFT-LCD工业智能预测方法,其特征在于:步骤1,数据预处理;在数据预处理部分,首先对8029列数据中的离散型数据进行了处理;根据离散型数据列与最终Y值的影响做了一元方差分析;根据离散型列值分析对数据进行了encoder型编码;对数据样本进行去空,重复列去重,对单个空缺值进行填补;
步骤2,PCA降维;在降维阶段,使用pca降维技术,因为数据中没有关于各个列值的具体说明,所以直接采用pca降维的方法;在降维过程中,前300列包含有数据98%以上的信息,在降维阶段保留前300列的数据信息;
步骤3,模型搭建;模型搭建的过程中采用了多种方式对模型进行构造与比对;首先使用k折交叉验证对数据进行训练集与测试集的划分,对划分后的数据进行归一化,为后期模型训练准备数据;
步骤4,模型选定;采用机器学习方法对整个数据样本进行了预测;
MSE是真实值与预测值的均方误差,n是样本个数,是预测值,Yi是真实值;
在降维之后的特征中随机选择出250列特征值,并从500个训练集中抽出300条做为每一个svm模型的训练集,训练出了15个svm模型;组合形成R-SVM模型;
步骤5,mse判定;将训练好的15个svm模型对测试集进行预测,将结果取均值;根据mse判定方法,计算出R-SVM模型的均方误差。
CN201910092644.0A 2019-01-30 2019-01-30 基于r-svm的tft-lcd工业智能预测方法 Pending CN109871992A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910092644.0A CN109871992A (zh) 2019-01-30 2019-01-30 基于r-svm的tft-lcd工业智能预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910092644.0A CN109871992A (zh) 2019-01-30 2019-01-30 基于r-svm的tft-lcd工业智能预测方法

Publications (1)

Publication Number Publication Date
CN109871992A true CN109871992A (zh) 2019-06-11

Family

ID=66918300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910092644.0A Pending CN109871992A (zh) 2019-01-30 2019-01-30 基于r-svm的tft-lcd工业智能预测方法

Country Status (1)

Country Link
CN (1) CN109871992A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321960A (zh) * 2019-07-09 2019-10-11 上海新增鼎网络技术有限公司 一种工厂生产要素的预测方法及系统
CN111401471A (zh) * 2020-04-08 2020-07-10 中国人民解放军国防科技大学 一种航天器姿态异常检测方法及系统
CN113798315A (zh) * 2021-10-16 2021-12-17 北京航空航天大学 基于机器学习的热强化sve技术气体排放控制方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102058413A (zh) * 2010-12-03 2011-05-18 上海交通大学 基于连续小波变换的脑电信号警觉度检测方法
CN102841979A (zh) * 2012-06-26 2012-12-26 广州市新之地环保产业有限公司 一种基于pca-ga-svr的污泥回流量预测方法
CN105023022A (zh) * 2015-07-09 2015-11-04 深圳天珑无线科技有限公司 跌倒检测方法及系统
CN106250914A (zh) * 2016-07-22 2016-12-21 华侨大学 基于结构稀疏多核学习的多模态数据特征筛选和分类方法
CN106446940A (zh) * 2016-09-13 2017-02-22 大连理工大学 一种基于支持向量机的超级电容器电容值退化趋势的预测方法
CN107122526A (zh) * 2017-04-06 2017-09-01 大连大学 基于异态特征子集集成算法的试验段马赫数建模方法
CN107509202A (zh) * 2017-07-10 2017-12-22 东南大学 一种基于接入用户数变化预测的超密集网络资源分配方法
CN108564117A (zh) * 2018-03-30 2018-09-21 华南理工大学 一种基于svm的贫困生辅助认定方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102058413A (zh) * 2010-12-03 2011-05-18 上海交通大学 基于连续小波变换的脑电信号警觉度检测方法
CN102841979A (zh) * 2012-06-26 2012-12-26 广州市新之地环保产业有限公司 一种基于pca-ga-svr的污泥回流量预测方法
CN105023022A (zh) * 2015-07-09 2015-11-04 深圳天珑无线科技有限公司 跌倒检测方法及系统
CN106250914A (zh) * 2016-07-22 2016-12-21 华侨大学 基于结构稀疏多核学习的多模态数据特征筛选和分类方法
CN106446940A (zh) * 2016-09-13 2017-02-22 大连理工大学 一种基于支持向量机的超级电容器电容值退化趋势的预测方法
CN107122526A (zh) * 2017-04-06 2017-09-01 大连大学 基于异态特征子集集成算法的试验段马赫数建模方法
CN107509202A (zh) * 2017-07-10 2017-12-22 东南大学 一种基于接入用户数变化预测的超密集网络资源分配方法
CN108564117A (zh) * 2018-03-30 2018-09-21 华南理工大学 一种基于svm的贫困生辅助认定方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321960A (zh) * 2019-07-09 2019-10-11 上海新增鼎网络技术有限公司 一种工厂生产要素的预测方法及系统
CN111401471A (zh) * 2020-04-08 2020-07-10 中国人民解放军国防科技大学 一种航天器姿态异常检测方法及系统
CN111401471B (zh) * 2020-04-08 2023-04-18 中国人民解放军国防科技大学 一种航天器姿态异常检测方法及系统
CN113798315A (zh) * 2021-10-16 2021-12-17 北京航空航天大学 基于机器学习的热强化sve技术气体排放控制方法
CN113798315B (zh) * 2021-10-16 2022-07-29 北京航空航天大学 基于机器学习的热强化sve技术气体排放控制方法

Similar Documents

Publication Publication Date Title
CN109871992A (zh) 基于r-svm的tft-lcd工业智能预测方法
Harvey et al. Automated feature design for numeric sequence classification by genetic programming
US8626682B2 (en) Automatic data cleaning for machine learning classifiers
CN107392241B (zh) 一种基于加权列抽样XGBoost的图像目标分类方法
CN112070128B (zh) 一种基于深度学习的变压器故障诊断方法
CN108921285B (zh) 基于双向门控循环神经网络的电能质量扰动的分类方法
CN112381788B (zh) 一种基于双分支匹配网络的零部件表面缺陷增量检测方法
CN110516818A (zh) 一种基于集成学习技术的高维度数据预测方法
CN109271374A (zh) 一种基于机器学习的数据库健康度打分方法和打分系统
CN111026058B (zh) 基于瓦瑟斯坦距离和自编码器的半监督深度学习故障诊断方法
CN111898461A (zh) 一种时序行为片段生成方法
CN111737907A (zh) 一种基于深度学习和dga的变压器故障诊断方法及装置
CN110837874A (zh) 基于时间序列分类的业务数据异常检测方法
Ünal et al. Fruit recognition and classification with deep learning support on embedded system (fruitnet)
CN110569883B (zh) 基于Kohonen网络聚类和ReliefF特征选择的空气质量指数预测方法
CN112817954A (zh) 一种基于多种方法集成学习的缺失值插补方法
CN113111183A (zh) 一种牵引供电设备缺陷等级分类方法
CN114330500B (zh) 基于storm平台的电网电力设备在线并行诊断方法及系统
CN109472316B (zh) 一种基于深度学习的滤棒装盒质量识别方法
CN111275136A (zh) 基于小样本下的故障预测系统及其预警方法
CN115812210A (zh) 用于增强机器学习分类任务的性能的方法和设备
CN116934687A (zh) 一种基于半监督辅助学习语义分割的注塑制品表面缺陷检测方法
CN114266337A (zh) 一种基于残差网络的烟叶智能分级模型及利用该模型分级的方法
Rong et al. A vehicle type recognition method based on sparse auto encoder
CN110955811B (zh) 基于朴素贝叶斯算法的电力数据分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190611