CN113076974A - 多层感知机构建缺失值填补与分类并行的多任务学习方法 - Google Patents
多层感知机构建缺失值填补与分类并行的多任务学习方法 Download PDFInfo
- Publication number
- CN113076974A CN113076974A CN202110255540.4A CN202110255540A CN113076974A CN 113076974 A CN113076974 A CN 113076974A CN 202110255540 A CN202110255540 A CN 202110255540A CN 113076974 A CN113076974 A CN 113076974A
- Authority
- CN
- China
- Prior art keywords
- output
- classification
- sample
- layer
- filling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Complex Calculations (AREA)
Abstract
本发明提供多层感知机构建缺失值填补与分类并行的多任务学习方法,涉及多任务学习方法技术领域。该多层感知机构建缺失值填补与分类并行的多任务学习方法,包括:S1、令{(xi,ti)|xi∈Rs;ti∈Rc,i=1,2,…,n}表示带类标签的不完整数据集,S2、据其他输入值展开求解,S3、在分类任务中,用zij表示输出层j+m个神经元的输出值,S4、模型训练时,在完整样本的基础上进行,开始参与填补计算时,分两种情况。该多层感知机构建缺失值填补与分类并行的多任务学习方法,通过多任务学习填补模型,可以实现不完整数据集在同一个网络上并行填补缺失值和样本分类,在计算的时候,拟合和分类任务共享了部分网络参数,所以模型可以权衡多任务的前提下更高效的学习数据内所蕴含的有效信息。
Description
技术领域
本发明涉及多任务学习方法技术领域,特别的为多层感知机构建缺失值填补与分类并行的多任务学习方法。
背景技术
工业生产过程中,需要监控不同工段、不同部位传感器的数据,当数据变量在采集的过程中,往往存在一定误差,而变量的准确预测可以为系统的调度及决策提供重要指导,也是预测控制技术的重要组成部分。目前,基于数据的预测方法被广泛应用于生产过程变量预测中,然而鉴于工业数据普遍具有高噪声、含缺失点等特点,难以准确拟合过程变量之间的复杂非线性关系,从而使得对模型精度的提升提出了巨大挑战。
综上所述,研发多层感知机构建缺失值填补与分类并行的多任务学习方法,仍是多任务学习方法技术领域中急需解决的关键问题。
发明内容
本发明提供的发明目的在于提供多层感知机构建缺失值填补与分类并行的多任务学习方法,解决上述背景技术中的问题。
为实现以上目的,本发明通过以下技术方案予以实现:多层感知机构建缺失值填补与分类并行的多任务学习方法,包括以下步骤:
S1、令{(xi,ti)|xi∈Rs;ti∈Rc,i=1,2,…,n}表示带类标签的不完整数据集;
S4、模型训练时,在完整样本的基础上进行,开始参与填补计算时,分两种情况:第一种,当不完整样本的类标签已知时,第二种,当不完整样本的类标签未知时。
进一步的,在S1操作步骤中,其中:
s—属性个数;
c—类的数量;
n—样本数量;
xi=[xi1,xi2,…xis]T是数据集中第i个样本;
ti=[ti1,ti2,…tic]T是样本xi的类标签。
进一步的,在S2操作步骤中,针对第j(1≤j≤m)个输出层神经元,第k个隐藏层神经元的输出式为:
其中:
φ(·)表示隐藏层激活函数;
通过上式计算,不完整数据属性拟合时的网络输出为:
其中:
θ(·)表示输出层激活函数;
进一步的,在S3操作步骤中,针对j+m个输出神经元,隐藏层中第k个神经元的输出值如下计算:
网络输出zij的计算方式为:
其中mij的计算公式如下:
网络训练时,多任务学习模型的代价函数为:
E=λEM+(1-λ)Es
其中,λ表示两个任务在训练时的权重分配,EM表示分类误差,ES表示不完整属性的拟合误差,具体表达式为:
NCO表示数据集中完整样本的序号集合。
进一步的,在S4操作步骤中,具体步骤如下:
S401、对不完整样本xi进行预填补;
S404、根据输出zi计算样本xi属于j类的概率pj=zij;
S405、设置j←j+1,并返回S402步骤;
S407、将所求的的类别和预填补后的样本输入网络,同时将与缺失值对应的网络输出作为填补值。
本发明提供了多层感知机构建缺失值填补与分类并行的多任务学习方法。具备以下有益效果:
1、通过多任务学习填补模型,可以实现不完整数据集在同一个网络上并行填补缺失值和样本分类。
2、在计算的时候,拟合和分类任务共享了部分网络参数,所以模型可以权衡多任务的前提下更高效的学习数据内所蕴含的有效信息。
具体实施方式
多层感知机构建缺失值填补与分类并行的多任务学习方法,包括以下步骤:
对不完整数据集进行有效填补后,模型会因为数据质量的提高而获得很好的分类性能。
同一类型中的样本在属性取值或属性间关联方面存在一定的相似性,分类信息有利于模型在运行不完整样本与同类样本间的共性和差异性,从而辅助有效填补。
步骤一、令{(xi,ti)|xi∈Rs;ti∈Rc,i=1,2,…,n}表示带类标签的不完整数据集;
其中:
s—属性个数;
c—类的数量;
n—样本数量;
xi=[xi1,xi2,…xis]T是数据集中第i个样本;
ti=[ti1,ti2,…tic]T是样本xi的类标签。
针对第j(1≤j≤m)个输出层神经元,第k个隐藏层神经元的输出式为:
其中:
φ(·)表示隐藏层激活函数;
通过上式计算,不完整数据属性拟合时的网络输出为:
其中:
θ(·)表示输出层激活函数;
步骤三、在分类任务中,用zij表示输出层j+m个神经元的输出值,通过多次试验后分析,在实际运行中需要剔除输入中的类标签ti,并利用泰勒级数对xi展开,同时函数变量变种为用于标记输入中每个元素是否参与运算;
针对j+m个输出神经元,隐藏层中第k个神经元的输出值如下计算:
网络输出zij的计算方式为:
其中mij的计算公式如下:
网络训练时,多任务学习模型的代价函数为:
E=λEM+(1-λ)Es
其中,λ表示两个任务在训练时的权重分配,EM表示分类误差,ES表示不完整属性的拟合误差,具体表达式为:
NCO表示数据集中完整样本的序号集合;
步骤四、模型训练时,在完整样本的基础上进行,开始参与填补计算时,分两种情况:第一种,当不完整样本的类标签已知时,将预填补后的样本与类标签同时输入模型,并将缺失值对应的网络输出作为填补值,第二种,当不完整样本的类标签未知时,需要依次对每种类标签的取值进行最优化计算,将计算后的优化值作为实际的填补值。
具体步骤如下:
401)、对不完整样本xi进行预填补;
404)、根据输出zi计算样本xi属于j类的概率pj=zij;
405)、设置j←j+1,并返回步骤402步;
407)、将所求的的类别和预填补后的样本输入网络,同时将与缺失值对应的网络输出作为填补值。
该模型既能通过分类任务从数据中心提炼每个类的特点,又可以根据不完整数据集的属性拟合挖掘相互的关联关系,从而更好的辅助分类进行决策,各任务间相互关联使模型的精度大大的提升。
以上的仅是本发明的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (5)
1.层感知多机构建缺失值填补与分类并行的多任务学习方法,其特征在于,包括以下步骤:
S1、令{(xi,ti)|xi∈Rs;ti∈Rc,i=1,2,…,n}表示带类标签的不完整数据集;
S3、在分类任务中,用zij表示输出层j+m个神经元的输出值,在实际运行中需要剔除输入中的类标签ti,并利用泰勒级数对xi展开,同时函数变量变种为rM=[r1 T,r2 T],r1=[1],r2=[0],用于标记输入中每个元素是否参与运算;
S4、模型训练时,在完整样本的基础上进行,开始参与填补计算时,分两种情况:第一种,当不完整样本的类标签已知时,第二种,当不完整样本的类标签未知时。
2.根据权利要求1所述的多层感知机构建缺失值填补与分类并行的多任务学习方法,其特征在于:在S1操作步骤中,其中:
s—属性个数;
c—类的数量;
n—样本数量;
xi=[xi1,xi2,…xis]T是数据集中第i个样本;
ti=[ti1,ti2,…tic]T是样本xi的类标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110255540.4A CN113076974A (zh) | 2021-03-09 | 2021-03-09 | 多层感知机构建缺失值填补与分类并行的多任务学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110255540.4A CN113076974A (zh) | 2021-03-09 | 2021-03-09 | 多层感知机构建缺失值填补与分类并行的多任务学习方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113076974A true CN113076974A (zh) | 2021-07-06 |
Family
ID=76612628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110255540.4A Withdrawn CN113076974A (zh) | 2021-03-09 | 2021-03-09 | 多层感知机构建缺失值填补与分类并行的多任务学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113076974A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060184475A1 (en) * | 2005-02-16 | 2006-08-17 | Sriram Krishnan | Missing data approaches in medical decision support systems |
CN108228716A (zh) * | 2017-12-05 | 2018-06-29 | 华南理工大学 | 基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法 |
CN108596409A (zh) * | 2018-07-16 | 2018-09-28 | 江苏智通交通科技有限公司 | 提升交通危险人员事故风险预测精度的方法 |
CN109919364A (zh) * | 2019-02-18 | 2019-06-21 | 华南理工大学 | 基于自适应降噪和集成lstm的多变量时间序列预测方法 |
CN110309907A (zh) * | 2019-06-06 | 2019-10-08 | 大连理工大学 | 一种基于去跟踪自编码器的动态缺失值填补方法 |
CN110460600A (zh) * | 2019-08-13 | 2019-11-15 | 南京理工大学 | 可抵御生成对抗网络攻击的联合深度学习方法 |
-
2021
- 2021-03-09 CN CN202110255540.4A patent/CN113076974A/zh not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060184475A1 (en) * | 2005-02-16 | 2006-08-17 | Sriram Krishnan | Missing data approaches in medical decision support systems |
CN108228716A (zh) * | 2017-12-05 | 2018-06-29 | 华南理工大学 | 基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法 |
CN108596409A (zh) * | 2018-07-16 | 2018-09-28 | 江苏智通交通科技有限公司 | 提升交通危险人员事故风险预测精度的方法 |
CN109919364A (zh) * | 2019-02-18 | 2019-06-21 | 华南理工大学 | 基于自适应降噪和集成lstm的多变量时间序列预测方法 |
CN110309907A (zh) * | 2019-06-06 | 2019-10-08 | 大连理工大学 | 一种基于去跟踪自编码器的动态缺失值填补方法 |
CN110460600A (zh) * | 2019-08-13 | 2019-11-15 | 南京理工大学 | 可抵御生成对抗网络攻击的联合深度学习方法 |
Non-Patent Citations (1)
Title |
---|
吴霞: "基于缺失值变量的不完整数据填补与分类研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111079836B (zh) | 基于伪标签方法和弱监督学习的过程数据故障分类方法 | |
CN111950191B (zh) | 基于混合深度神经网络的回转窑烧结温度预测方法 | |
CN108875771B (zh) | 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法 | |
CN111881342A (zh) | 一种基于图孪生网络的推荐方法 | |
CN113704075B (zh) | 一种基于故障日志的高性能计算系统故障预测方法 | |
CN111046961B (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN111638034B (zh) | 基于深度学习的应变天平温度梯度误差补偿方法及系统 | |
CN113869563A (zh) | 一种基于故障特征迁移的航空涡扇发动机剩余寿命预测方法 | |
CN106610584A (zh) | 一种基于神经网络与专家系统的再制造工序质量控制方法 | |
CN110580213A (zh) | 一种基于循环标记时间点过程的数据库异常检测方法 | |
CN115905848A (zh) | 基于多模型融合的化工过程故障诊断方法及系统 | |
CN114330549A (zh) | 一种基于深度图网络的化工过程故障诊断方法 | |
Zhao et al. | A neural architecture search method based on gradient descent for remaining useful life estimation | |
CN104899507A (zh) | 一种网络高维大数据异常入侵的检测方法 | |
CN114548494A (zh) | 一种可视化造价数据预测智能分析系统 | |
CN109164794A (zh) | 基于偏f值selm的多变量工业过程故障分类方法 | |
Mete et al. | Predicting semantic building information (BIM) with Recurrent Neural Networks | |
Liu et al. | MRD-NETS: multi-scale residual networks with dilated convolutions for classification and clustering analysis of spacecraft electrical signal | |
CN113076974A (zh) | 多层感知机构建缺失值填补与分类并行的多任务学习方法 | |
Cui et al. | Prediction of Aeroengine Remaining Useful Life Based on SE-BiLSTM | |
CN115331756A (zh) | 基于生成对抗网络的水泥熟料游离氧化钙数据的预测方法 | |
CN113987704A (zh) | 基于自动多微分学习深度网络的航空发动机寿命预测方法 | |
CN112488146A (zh) | 基于深度学习的飞机危险识别与趋势预测方法 | |
CN113887125A (zh) | 一种复杂仿真系统运行有效性评估方法 | |
CN113435055A (zh) | 盾构刀盘扭矩领域自适应迁移预测方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210706 |