CN113076974A - 多层感知机构建缺失值填补与分类并行的多任务学习方法 - Google Patents

多层感知机构建缺失值填补与分类并行的多任务学习方法 Download PDF

Info

Publication number
CN113076974A
CN113076974A CN202110255540.4A CN202110255540A CN113076974A CN 113076974 A CN113076974 A CN 113076974A CN 202110255540 A CN202110255540 A CN 202110255540A CN 113076974 A CN113076974 A CN 113076974A
Authority
CN
China
Prior art keywords
output
classification
sample
layer
filling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110255540.4A
Other languages
English (en)
Inventor
赵宏哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Magellan Technology Ltd
Original Assignee
Magellan Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Magellan Technology Ltd filed Critical Magellan Technology Ltd
Priority to CN202110255540.4A priority Critical patent/CN113076974A/zh
Publication of CN113076974A publication Critical patent/CN113076974A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供多层感知机构建缺失值填补与分类并行的多任务学习方法,涉及多任务学习方法技术领域。该多层感知机构建缺失值填补与分类并行的多任务学习方法,包括:S1、令{(xi,ti)|xi∈Rs;ti∈Rc,i=1,2,…,n}表示带类标签的不完整数据集,S2、据其他输入值展开求解,S3、在分类任务中,用zij表示输出层j+m个神经元的输出值,S4、模型训练时,在完整样本的基础上进行,开始参与填补计算时,分两种情况。该多层感知机构建缺失值填补与分类并行的多任务学习方法,通过多任务学习填补模型,可以实现不完整数据集在同一个网络上并行填补缺失值和样本分类,在计算的时候,拟合和分类任务共享了部分网络参数,所以模型可以权衡多任务的前提下更高效的学习数据内所蕴含的有效信息。

Description

多层感知机构建缺失值填补与分类并行的多任务学习方法
技术领域
本发明涉及多任务学习方法技术领域,特别的为多层感知机构建缺失值填补与分类并行的多任务学习方法。
背景技术
工业生产过程中,需要监控不同工段、不同部位传感器的数据,当数据变量在采集的过程中,往往存在一定误差,而变量的准确预测可以为系统的调度及决策提供重要指导,也是预测控制技术的重要组成部分。目前,基于数据的预测方法被广泛应用于生产过程变量预测中,然而鉴于工业数据普遍具有高噪声、含缺失点等特点,难以准确拟合过程变量之间的复杂非线性关系,从而使得对模型精度的提升提出了巨大挑战。
综上所述,研发多层感知机构建缺失值填补与分类并行的多任务学习方法,仍是多任务学习方法技术领域中急需解决的关键问题。
发明内容
本发明提供的发明目的在于提供多层感知机构建缺失值填补与分类并行的多任务学习方法,解决上述背景技术中的问题。
为实现以上目的,本发明通过以下技术方案予以实现:多层感知机构建缺失值填补与分类并行的多任务学习方法,包括以下步骤:
S1、令{(xi,ti)|xi∈Rs;ti∈Rc,i=1,2,…,n}表示带类标签的不完整数据集;
S2、在不完整数据集的拟合任务中,输出层第j中,1≤j≤m个神经元用于拟合符号为aj的不完整属性,神经元在计算输出yij时,需剔除输入所包含的
Figure BDA0002968197440000011
并根据其他输入值展开求解;
Figure BDA0002968197440000012
其中r1j种除第aj置0外其余均设定成1,同时r2=[1]c*1
Figure BDA0002968197440000021
用于标记
Figure BDA0002968197440000022
中每个元素是否参与计算;
S3、在分类任务中,用zij表示输出层j+m个神经元的输出值,在实际运行中需要剔除输入中的类标签ti,并利用泰勒级数对xi展开,同时函数变量变种为
Figure BDA0002968197440000023
用于标记输入
Figure BDA0002968197440000024
中每个元素是否参与运算;
S4、模型训练时,在完整样本的基础上进行,开始参与填补计算时,分两种情况:第一种,当不完整样本的类标签已知时,第二种,当不完整样本的类标签未知时。
进一步的,在S1操作步骤中,其中:
s—属性个数;
c—类的数量;
n—样本数量;
xi=[xi1,xi2,…xis]T是数据集中第i个样本;
ti=[ti1,ti2,…tic]T是样本xi的类标签。
进一步的,在S2操作步骤中,针对第j(1≤j≤m)个输出层神经元,第k个隐藏层神经元的输出式为:
Figure BDA0002968197440000025
其中:
φ(·)表示隐藏层激活函数;
Figure BDA0002968197440000026
表示输入层神经元与隐藏层神经元的连接权重;
Figure BDA0002968197440000027
表示隐藏层神经元的阈值;
通过上式计算,不完整数据属性拟合时的网络输出为:
Figure BDA0002968197440000028
其中:
θ(·)表示输出层激活函数;
Figure BDA0002968197440000031
表示隐藏层神经元与输出层神经元的连接权重;
Figure BDA0002968197440000032
表示输出层神经元的阈值。
进一步的,在S3操作步骤中,针对j+m个输出神经元,隐藏层中第k个神经元的输出值如下计算:
Figure BDA0002968197440000033
网络输出zij的计算方式为:
Figure BDA0002968197440000034
其中mij的计算公式如下:
Figure BDA0002968197440000035
由于求解
Figure BDA0002968197440000036
时,输入中类标签ti已经剔除,所以可以有效的避免模型的过拟合。
网络训练时,多任务学习模型的代价函数为:
E=λEM+(1-λ)Es
其中,λ表示两个任务在训练时的权重分配,EM表示分类误差,ES表示不完整属性的拟合误差,具体表达式为:
Figure BDA0002968197440000037
Figure BDA0002968197440000038
NCO表示数据集中完整样本的序号集合。
进一步的,在S4操作步骤中,具体步骤如下:
S401、对不完整样本xi进行预填补;
S402、设不完整样本xi属于第j类,对应的类标签为
Figure BDA0002968197440000041
Figure BDA0002968197440000042
中除了j个元素为1外,其余全为0;
S403、将预填补后的xi
Figure BDA0002968197440000043
输入模型,计算网络输出yi和zi
S404、根据输出zi计算样本xi属于j类的概率pj=zij
S405、设置j←j+1,并返回S402步骤;
S406、计算最大概率值
Figure BDA0002968197440000044
该概率值对应的类别就是网络最终预测的样本类别;
S407、将所求的的类别和预填补后的样本输入网络,同时将与缺失值对应的网络输出作为填补值。
本发明提供了多层感知机构建缺失值填补与分类并行的多任务学习方法。具备以下有益效果:
1、通过多任务学习填补模型,可以实现不完整数据集在同一个网络上并行填补缺失值和样本分类。
2、在计算的时候,拟合和分类任务共享了部分网络参数,所以模型可以权衡多任务的前提下更高效的学习数据内所蕴含的有效信息。
具体实施方式
多层感知机构建缺失值填补与分类并行的多任务学习方法,包括以下步骤:
对不完整数据集进行有效填补后,模型会因为数据质量的提高而获得很好的分类性能。
同一类型中的样本在属性取值或属性间关联方面存在一定的相似性,分类信息有利于模型在运行不完整样本与同类样本间的共性和差异性,从而辅助有效填补。
步骤一、令{(xi,ti)|xi∈Rs;ti∈Rc,i=1,2,…,n}表示带类标签的不完整数据集;
其中:
s—属性个数;
c—类的数量;
n—样本数量;
xi=[xi1,xi2,…xis]T是数据集中第i个样本;
ti=[ti1,ti2,…tic]T是样本xi的类标签。
步骤二、在不完整数据集的拟合任务中,输出层第j中,1≤j≤m个神经元用于拟合符号为aj的不完整属性,神经元在计算输出yij时,需剔除输入所包含的
Figure BDA0002968197440000051
并根据其他输入值展开求解;
Figure BDA0002968197440000052
其中r1j种除第aj置0外其余均设定成1,同时r2=[1]c*1
Figure BDA0002968197440000053
用于标记
Figure BDA0002968197440000054
中每个元素是否参与计算;
针对第j(1≤j≤m)个输出层神经元,第k个隐藏层神经元的输出式为:
Figure BDA0002968197440000055
其中:
φ(·)表示隐藏层激活函数;
Figure BDA0002968197440000056
表示输入层神经元与隐藏层神经元的连接权重;
Figure BDA0002968197440000057
表示隐藏层神经元的阈值;
通过上式计算,不完整数据属性拟合时的网络输出为:
Figure BDA0002968197440000058
其中:
θ(·)表示输出层激活函数;
Figure BDA0002968197440000059
表示隐藏层神经元与输出层神经元的连接权重;
Figure BDA00029681974400000510
表示输出层神经元的阈值;
步骤三、在分类任务中,用zij表示输出层j+m个神经元的输出值,通过多次试验后分析,在实际运行中需要剔除输入中的类标签ti,并利用泰勒级数对xi展开,同时函数变量变种为
Figure BDA0002968197440000061
用于标记输入
Figure BDA0002968197440000062
中每个元素是否参与运算;
针对j+m个输出神经元,隐藏层中第k个神经元的输出值如下计算:
Figure BDA0002968197440000063
网络输出zij的计算方式为:
Figure BDA0002968197440000064
其中mij的计算公式如下:
Figure BDA0002968197440000065
由于求解
Figure BDA0002968197440000066
时,输入中类标签ti已经剔除,所以可以有效的避免模型的过拟合。
网络训练时,多任务学习模型的代价函数为:
E=λEM+(1-λ)Es
其中,λ表示两个任务在训练时的权重分配,EM表示分类误差,ES表示不完整属性的拟合误差,具体表达式为:
Figure BDA0002968197440000067
Figure BDA0002968197440000068
NCO表示数据集中完整样本的序号集合;
步骤四、模型训练时,在完整样本的基础上进行,开始参与填补计算时,分两种情况:第一种,当不完整样本的类标签已知时,将预填补后的样本与类标签同时输入模型,并将缺失值对应的网络输出作为填补值,第二种,当不完整样本的类标签未知时,需要依次对每种类标签的取值进行最优化计算,将计算后的优化值作为实际的填补值。
具体步骤如下:
401)、对不完整样本xi进行预填补;
402)、设不完整样本xi属于第j类,对应的类标签为
Figure BDA0002968197440000071
Figure BDA0002968197440000072
中除了j个元素为1外,其余全为0;
403)、将预填补后的xi
Figure BDA0002968197440000073
输入模型,计算网络输出yi和zi
404)、根据输出zi计算样本xi属于j类的概率pj=zij
405)、设置j←j+1,并返回步骤402步;
406)、计算最大概率值
Figure BDA0002968197440000074
该概率值对应的类别就是网络最终预测的样本类别;
407)、将所求的的类别和预填补后的样本输入网络,同时将与缺失值对应的网络输出作为填补值。
该模型既能通过分类任务从数据中心提炼每个类的特点,又可以根据不完整数据集的属性拟合挖掘相互的关联关系,从而更好的辅助分类进行决策,各任务间相互关联使模型的精度大大的提升。
以上的仅是本发明的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (5)

1.层感知多机构建缺失值填补与分类并行的多任务学习方法,其特征在于,包括以下步骤:
S1、令{(xi,ti)|xi∈Rs;ti∈Rc,i=1,2,…,n}表示带类标签的不完整数据集;
S2、在不完整数据集的拟合任务中,输出层第j中,1≤j≤m个神经元用于拟合符号为aj的不完整属性,神经元在计算输出yij时,需剔除输入所包含的
Figure FDA0002968197430000011
并根据其他输入值展开求解;
Figure FDA0002968197430000012
其中r1j种除第aj置0外其余均设定成1,同时r2=[1]c*1
Figure FDA0002968197430000013
用于标记
Figure FDA0002968197430000014
中每个元素是否参与计算;
S3、在分类任务中,用zij表示输出层j+m个神经元的输出值,在实际运行中需要剔除输入中的类标签ti,并利用泰勒级数对xi展开,同时函数变量变种为rM=[r1 T,r2 T],r1=[1],r2=[0],用于标记输入
Figure FDA0002968197430000015
中每个元素是否参与运算;
S4、模型训练时,在完整样本的基础上进行,开始参与填补计算时,分两种情况:第一种,当不完整样本的类标签已知时,第二种,当不完整样本的类标签未知时。
2.根据权利要求1所述的多层感知机构建缺失值填补与分类并行的多任务学习方法,其特征在于:在S1操作步骤中,其中:
s—属性个数;
c—类的数量;
n—样本数量;
xi=[xi1,xi2,…xis]T是数据集中第i个样本;
ti=[ti1,ti2,…tic]T是样本xi的类标签。
3.根据权利要求1所述的多层感知机构建缺失值填补与分类并行的多任务学习方法,其特征在于:在S2操作步骤中,针对第j(1≤j≤m)个输出层神经元,第k个隐藏层神经元的输出式为:
Figure FDA0002968197430000021
其中:
φ(·)表示隐藏层激活函数;
Figure FDA0002968197430000022
表示输入层神经元与隐藏层神经元的连接权重;
Figure FDA0002968197430000023
表示隐藏层神经元的阈值;
通过上式计算,不完整数据属性拟合时的网络输出为:
Figure FDA0002968197430000024
其中:
θ(·)表示输出层激活函数;
Figure FDA0002968197430000025
表示隐藏层神经元与输出层神经元的连接权重;
Figure FDA0002968197430000026
表示输出层神经元的阈值。
4.根据权利要求1所述的多层感知机构建缺失值填补与分类并行的多任务学习方法,其特征在于:在S3操作步骤中,针对j+m个输出神经元,隐藏层中第k个神经元的输出值如下计算:
Figure FDA0002968197430000027
网络输出zij的计算方式为:
Figure FDA0002968197430000028
其中mij的计算公式如下:
Figure FDA0002968197430000029
网络训练时,多任务学习模型的代价函数为:
E=λEM+(1-λ)Es
其中,λ表示两个任务在训练时的权重分配,EM表示分类误差,ES表示不完整属性的拟合误差,具体表达式为:
Figure FDA0002968197430000031
Figure FDA0002968197430000032
NCO表示数据集中完整样本的序号集合。
5.根据权利要求1所述的多层感知机构建缺失值填补与分类并行的多任务学习方法,其特征在于:在S4操作步骤中,具体步骤如下:
S401、对不完整样本xi进行预填补;
S402、设不完整样本xi属于第j类,对应的类标签为
Figure FDA0002968197430000033
Figure FDA0002968197430000034
中除了j个元素为1外,其余全为0;
S403、将预填补后的xi
Figure FDA0002968197430000035
输入模型,计算网络输出yi和zi
S404、根据输出zi计算样本xi属于j类的概率pj=zij
S405、设置j←j+1,并返回S402步骤;
S406、计算最大概率值
Figure FDA0002968197430000036
该概率值对应的类别就是网络最终预测的样本类别;
S407、将所求的的类别和预填补后的样本输入网络,同时将与缺失值对应的网络输出作为填补值。
CN202110255540.4A 2021-03-09 2021-03-09 多层感知机构建缺失值填补与分类并行的多任务学习方法 Withdrawn CN113076974A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110255540.4A CN113076974A (zh) 2021-03-09 2021-03-09 多层感知机构建缺失值填补与分类并行的多任务学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110255540.4A CN113076974A (zh) 2021-03-09 2021-03-09 多层感知机构建缺失值填补与分类并行的多任务学习方法

Publications (1)

Publication Number Publication Date
CN113076974A true CN113076974A (zh) 2021-07-06

Family

ID=76612628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110255540.4A Withdrawn CN113076974A (zh) 2021-03-09 2021-03-09 多层感知机构建缺失值填补与分类并行的多任务学习方法

Country Status (1)

Country Link
CN (1) CN113076974A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060184475A1 (en) * 2005-02-16 2006-08-17 Sriram Krishnan Missing data approaches in medical decision support systems
CN108228716A (zh) * 2017-12-05 2018-06-29 华南理工大学 基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法
CN108596409A (zh) * 2018-07-16 2018-09-28 江苏智通交通科技有限公司 提升交通危险人员事故风险预测精度的方法
CN109919364A (zh) * 2019-02-18 2019-06-21 华南理工大学 基于自适应降噪和集成lstm的多变量时间序列预测方法
CN110309907A (zh) * 2019-06-06 2019-10-08 大连理工大学 一种基于去跟踪自编码器的动态缺失值填补方法
CN110460600A (zh) * 2019-08-13 2019-11-15 南京理工大学 可抵御生成对抗网络攻击的联合深度学习方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060184475A1 (en) * 2005-02-16 2006-08-17 Sriram Krishnan Missing data approaches in medical decision support systems
CN108228716A (zh) * 2017-12-05 2018-06-29 华南理工大学 基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法
CN108596409A (zh) * 2018-07-16 2018-09-28 江苏智通交通科技有限公司 提升交通危险人员事故风险预测精度的方法
CN109919364A (zh) * 2019-02-18 2019-06-21 华南理工大学 基于自适应降噪和集成lstm的多变量时间序列预测方法
CN110309907A (zh) * 2019-06-06 2019-10-08 大连理工大学 一种基于去跟踪自编码器的动态缺失值填补方法
CN110460600A (zh) * 2019-08-13 2019-11-15 南京理工大学 可抵御生成对抗网络攻击的联合深度学习方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴霞: "基于缺失值变量的不完整数据填补与分类研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Similar Documents

Publication Publication Date Title
CN111079836B (zh) 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN111950191B (zh) 基于混合深度神经网络的回转窑烧结温度预测方法
CN108875771B (zh) 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法
CN111881342A (zh) 一种基于图孪生网络的推荐方法
CN113704075B (zh) 一种基于故障日志的高性能计算系统故障预测方法
CN111046961B (zh) 基于双向长短时记忆单元和胶囊网络的故障分类方法
CN111638034B (zh) 基于深度学习的应变天平温度梯度误差补偿方法及系统
CN113869563A (zh) 一种基于故障特征迁移的航空涡扇发动机剩余寿命预测方法
CN106610584A (zh) 一种基于神经网络与专家系统的再制造工序质量控制方法
CN110580213A (zh) 一种基于循环标记时间点过程的数据库异常检测方法
CN115905848A (zh) 基于多模型融合的化工过程故障诊断方法及系统
CN114330549A (zh) 一种基于深度图网络的化工过程故障诊断方法
Zhao et al. A neural architecture search method based on gradient descent for remaining useful life estimation
CN104899507A (zh) 一种网络高维大数据异常入侵的检测方法
CN114548494A (zh) 一种可视化造价数据预测智能分析系统
CN109164794A (zh) 基于偏f值selm的多变量工业过程故障分类方法
Mete et al. Predicting semantic building information (BIM) with Recurrent Neural Networks
Liu et al. MRD-NETS: multi-scale residual networks with dilated convolutions for classification and clustering analysis of spacecraft electrical signal
CN113076974A (zh) 多层感知机构建缺失值填补与分类并行的多任务学习方法
Cui et al. Prediction of Aeroengine Remaining Useful Life Based on SE-BiLSTM
CN115331756A (zh) 基于生成对抗网络的水泥熟料游离氧化钙数据的预测方法
CN113987704A (zh) 基于自动多微分学习深度网络的航空发动机寿命预测方法
CN112488146A (zh) 基于深度学习的飞机危险识别与趋势预测方法
CN113887125A (zh) 一种复杂仿真系统运行有效性评估方法
CN113435055A (zh) 盾构刀盘扭矩领域自适应迁移预测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210706