CN115687899A - 基于高维度纺纱数据的混合特征选择方法 - Google Patents

基于高维度纺纱数据的混合特征选择方法 Download PDF

Info

Publication number
CN115687899A
CN115687899A CN202211082497.7A CN202211082497A CN115687899A CN 115687899 A CN115687899 A CN 115687899A CN 202211082497 A CN202211082497 A CN 202211082497A CN 115687899 A CN115687899 A CN 115687899A
Authority
CN
China
Prior art keywords
parameter
parameters
value
spinning
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211082497.7A
Other languages
English (en)
Other versions
CN115687899B (zh
Inventor
汪俊亮
许秋灏
张洁
徐楚桥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN202211082497.7A priority Critical patent/CN115687899B/zh
Publication of CN115687899A publication Critical patent/CN115687899A/zh
Application granted granted Critical
Publication of CN115687899B publication Critical patent/CN115687899B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于高维度纺纱数据的混合特征选择方法,首先采用一种网络去卷积算法进行去除链式噪声所造成的噪声关联,之后再采用直接关联互信息值通过预筛选目标函数进行筛选一组最大相关、最大互补、最小冗余的关初选键参数子集。最后采用预测精度以及辨识度共同作为评估标准采用遗传算法进行搜索,并得到两者之间的最优占比,进而得到最终关键参数子集。本发明所提出的方法额外考虑的参数之间的互补性,以及纺纱生产过程中真实存在的噪声误差影响等,以提高纺纱能耗的预测精度。本发明提供的方法也可以应用到工况多变的类似工业场景中,帮助制造企业节能降耗,实现绿色生产。

Description

基于高维度纺纱数据的混合特征选择方法
技术领域
本发明涉及一种纺纱参数提取方法,具体涉及一种基于高维度纺纱数据的混合特征选择方法,属于纺纱能耗预测领域。
背景技术
纺纱是典型的能耗密集型民生行业。随着人工智能以及数据感知的发展,大量的纺纱制造过程参数被保留并用于质量预测,采用质量预测方法,能够对纺纱制造过程进行质量回溯,找出能耗异常的根源,是抑制能耗异常最有效的手段之一。但是环锭纺纱生产工艺流程长,影响生产能耗的影响参数多,并且关键参数不显著,这将影响能耗预测的精确度。采用大数据关联分析通过海量数据拟合参数间的作用关系,揭示参数间的作用规律,可进一步识别影响生产能耗的关键参数,是准确实现纺纱能耗预测的基础。然而,纺纱数据存在典型的高维度特性,影响成纱能耗的潜在因素达1000多个,这对参数间的关联分析提出了挑战。
为了解决这一问题,有些学者提出了混合特征选择方法,通过信息熵的方法进行初步确定关键参数子集,然后采用遗传算法以上一步选择的参数作为最大搜索范围进行精选参数,以得到尽可能少的冗余参数,并得到与目标变量高度相关的关键参数子集。例如,吕佑龙副教授提出的针对晶圆允收测试参数的混合式特征选择方法。该方法首先采用利用互信息计算各晶圆允收测试参数与良率的相关性与冗余性,并依据最大相关、最小冗余性初步筛选关键参数子集,之后再以最少参数个数以及预测精度作为评估标准采用遗传算法进行筛选参数,最后得到关键参数子集。
发明内容
本发明的目的是:实现纺纱能耗预测的关键参数提取,通过混合特征选择的方法得到一组冗余变量尽可能少、能够有效分辨能耗正常与异常且预测精度的参数子集,辅助进行进一步智能调控,以帮助降低纺纱能耗。
为了达到上述目的,本发明的技术方案是提供了一种基于高维度纺纱数据的混合特征选择方法,能够消除由于纺纱工序加工产生的传递误差并挑选出对于纺纱能耗异常有重要影响的参数,进而准确识别影响纺纱能耗的关键参数,其特征在于,包括以下步骤:
步骤一:收集并记录不同纺纱能耗下环锭纺纱生产过程中对纺纱能耗有潜在影响的候选参数数据,将所有潜在候选参数数据整合为一个完整的数据集;
步骤二:基于步骤一得到的数据集生成训练数据集,对混合特征选择算法模型进行训练,混合特征选择算法模型采用以下步骤生成最终的关键参数子集:
步骤201:计算各个候选参数与纺纱能耗相关的互信息值;
步骤202:基于步骤201获得的互信息值构建与观测到的关联关系对应的观测矩阵Gobs,有:
Figure BDA0003833915600000021
式中,I(xK;xK)表示步骤201计算得到的第K个候选参数xK与第K个候选参数xK的互信息值;
步骤203、基于直接关联矩阵Gdir的特征值λdir与观测矩阵Gobs的特征值λobs之间的关系,利用网络去卷积算法由观测矩阵Gobs计算到剔除了噪声关联的直接关联矩阵Gdir,其中:
直接关联矩阵Gdir的特征值λdir与观测矩阵Gobs的特征值λobs之间的关系表示为下式:
Figure BDA0003833915600000022
直接关联矩阵Gdir表示为:
Figure BDA0003833915600000023
I′(xK;xK)表示第K个候选参数xK与第K个候选参数xK的直接关联互信息值;
步骤204:将各个候选参数相互之间的直接关联互信息值由高到底排序,依据排序结果后从候选参数中选出候选关键特征参数组成预选的关键特征子集;
步骤205:在剔除了噪声关联关系之后,计算各个候选参数与预选的关键特征子集的相关性、冗余性、互补性,并通过测度函数判定待选参数是否为关键参数,最终确定初选的关键参数子集;
步骤206:初选的关键参数子集为最大搜索范围,通过遗传算法并以预测精度以及辨识度作为评估每次迭代生成的新的关键参数子集,以进行关键参数子集的精选;达到终止条件后,评估结果最优的关键参数子集即为最终的关键参数子集。
优选地,所述潜在候选参数包括环境参数、工艺参数、设备参数、原料参数、人员参数。
优选地,步骤201中,
两个参数x、y之间的相关性用互信息值I(x;y)来度量,则有:
Figure BDA0003833915600000031
式中,xi表示参数x的第i个参数值,p(xi)表示参数x的值为xi的概率,yj表示参数y的第j个参数值,p(yj)表示参数y的值为yj的概率,p(xi,yj)表示参数x的值为xi且参数y的值为yj的概率。
优选地,在所述步骤202之后,并所述步骤203之前,还包括以下步骤:
对观测矩阵Gobs进行线性缩放,如下式所示:
G′obs=αGobs
式中,G′obs为经过线性缩放后的观测矩阵,α为线性系数,且
Figure BDA0003833915600000032
Figure BDA0003833915600000033
Figure BDA0003833915600000034
分别是Gobs的特征值中最大正值和最小负值,β为预先确定的权重系数。
优选地,步骤205中,所述测度函数如下式所示:
Figure BDA0003833915600000035
式中,α、β是权值参数,且满足(α+β)∈[0,1];|S|表示预选的关键特征子集S中的参数个数;CT表示性能指标;xk表示第k个候选参数;I(xk;fs|CT)表示已知性能指标CT的情况下,第k个候选参数xk与预选的关键特征子集S中的第s个参数fs之间的互信息值。
优选地,步骤206中,采用下式评估每次迭代生成的新的关键参数子集:
Figure BDA0003833915600000041
式中,θ、η分别表示预测精度以及辨识度在适应度值函数中各占的比重,θ=sigmoid(MSE),且θ+η=1;MSE表示预测精度,
Figure BDA0003833915600000042
Figure BDA0003833915600000043
m代表的是测试样本集中测试样本的数目,ytesti代表的是测试样本集中的第i个标签样本,
Figure BDA0003833915600000044
表示
Figure BDA0003833915600000045
所对应的混合特征选择算法模型的预测结果;μi1、σi1以及μi2、σi2分别代表的是一个特征中非能耗异常以及能耗异常一类的均值以及方差;L为一组特征子集的总个数;
随着遗传算法的不断迭代,θ、η的变化如下式:
Figure BDA0003833915600000046
η=1-θ
式中,pace代表的是步长;
Figure BDA0003833915600000047
为θ对应函数的导数。
本发明提出了基于高维度纺纱数据的混合特征选择方法,采用信息熵理论与遗传算法相结合的方法。首先采用一种网络去卷积算法进行去除链式噪声所造成的噪声关联,之后再采用直接关联互信息值通过预筛选目标函数进行筛选一组最大相关、最大互补、最小冗余的关初选键参数子集。最后采用预测精度以及辨识度共同作为评估标准采用遗传算法进行搜索,并得到两者之间的最优占比,进而得到最终关键参数子集。
与前人提出混合特征选择方法不同的是,本发明所提出的方法额外考虑的参数之间的互补性,以及纺纱生产过程中真实存在的噪声误差影响等,以提高纺纱能耗的预测精度。在实际的纺纱能耗数据上实验结果表明,本发明所提出的方法表现出更高的准确性并能够准确识别出对于能耗正常与异常由关键影响的工序步骤,意味着更大的节能潜力。本发明提供的方法也可以应用到工况多变的类似工业场景中,帮助制造企业节能降耗,实现绿色生产。综上,与最新方法相比,本发明提供的方法能够更加准确、全面的筛选关键参数。
附图说明
图1是方法实现流程图;
图2是直接关联网络与观测到的关联网络演化图,图2最左边是各个具有直接相关关系的纺纱制造参数所形成关联网络,表示为Gdir;图2中间部分表示的是由于制造过程中因为加工误差或其他因素导致各个参数会产生一些噪声关联网络,表示为Gindir,图中虚线所示;最终就会形成我们所观测到的关联关系网络,表示为Gobs,如图2最右边所示;
图3是网络去卷积方法。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明受吕佑龙副教授提出的针对晶圆允收测试参数的混合式特征选择方法的启发,本发明在去除传递误差所造成参数之间的关系噪声的影响下,考虑参数间的相关性与冗余性,还考虑参数之间的互补性,并以最大相关、最大互补、最小冗余作为评估标准,并设计目标函数进行初选参数。之后,本发明再以辨识度、预测精度两者共同作为评估标准并以遗传算法进行精选参数,最终得到关键参数子集。
具体而言,本发明提供的一种基于高维度纺纱数据的混合特征选择方法通过深度迁移学习来监测纺纱过程中的能效异常,包括以下步骤:
步骤一:数据采集
从新建纺纱厂收集目标数据集,本实施例中,每5秒钟从连接到细纱机的智能电表收集其记录的能效时间序列。
同时,收集环锭纺纱生产过程中对纺纱能耗有潜在影响的候选参数数据(包括环境参数、工艺参数、设备参数、原料参数、人员参数等1000多个候选参数数据),将所有潜在候选参数数据整合为一个完整的训练集。
步骤二:建立模型
使用Python编程语言和sklearn工具包建立如附图1所示的混合特征选择算法模型,固件应高于以下配置:Core i7 CPU@2.20GHz和8GB RAM。
混合特征选择算法模型采用以下步骤生成最终的关键参数子集:
步骤201:计算各个候选参数与纺纱能耗相关的互信息值。
两个参数x、y之间的相关性用互信息值I(x;y)来度量,x={x1,x2,…xn}, y={y1,y2,…ym},其计算方式如公式(1)所示:
I(x;y)=H(x)-H(x|y) (1)
式(1)中,H(x)指参数x的信息熵,
Figure BDA0003833915600000061
xi表示参数x的第i个参数值,p(xi)表示参数x的值为xi的概率;H(x|y)指参数x相对于已知的参数y的条件熵,其度量方法如公式(2)所示。
H(x|y)=H({x,y})-H(y) (2)
式(2)中,H(y)指参数y的信息熵,H({x,y})指参数x和参数y的联合熵,其度量方法见公式(3)。
Figure BDA0003833915600000062
式(2)中,yj表示参数y的第j个参数值,p(xi,yj)表示参数x的值为xi且参数y 的值为yj的概率。
由公式(3),可推导出公式(1)用公式(4)表示。
Figure BDA0003833915600000063
步骤202:基于步骤201获得的互信息值构建与观测到的关联关系对应的观测矩阵Gobs,并建立观测矩阵Gobs与直接关联矩阵Gdir的关系,如公式(5)、(6) 所示。
Figure BDA0003833915600000064
Gobs=Gdir+Gindir (6)
式中:xk表示第k个候选参数,k=1,2,3,....,K,共K个候选参数;利用网络去卷积算法,将矩阵Gindir用直接关联网络矩阵Gdir的n次方和来表示,n∈(1,∞),如公式(7)所示。
Figure BDA0003833915600000065
将公式(7)代入公式(6)可得观测矩阵Gobs与直接关联矩阵Gdir的关系式,如公式(8)所示。
Figure BDA0003833915600000071
若公式(8)中直接关联矩阵Gdir元素经过线性缩放可以变换到(0,1)区间,那么上述等比序列可以化为如公式(9)所示形式。
Figure BDA0003833915600000072
公式(9)中,I为单位矩阵,维数与观测矩阵Gobs及直接关联矩阵Gdir与一致。
步骤203:分别对直接关联矩阵Gdir及观测矩阵Gobs进行特征值分解,假设直接关联矩阵Gdir及观测矩阵Gobs可以分别分解并表示成如公式(10)所示形式。
Figure BDA0003833915600000073
公式(10)中:U为特征向量,通过对直接关联矩阵Gdir及观测矩阵Gobs进行特征值分解获得;
Δdir和Δobs分别为由直接关联矩阵Gdir的特征值λdir和观测矩阵Gobs的特征值λobs构成的对角矩阵,如公式(11)所示。
Figure BDA0003833915600000074
Figure BDA0003833915600000075
表示观测矩阵Gobs的第L个特征值,
Figure BDA0003833915600000077
表示直接关联矩阵Gdir的第L个特征值。
将公式(11)代入公式(10)中,可得:
Figure BDA0003833915600000076
由此可得λdir和λobs的关系如公式(13)所示。
Figure BDA0003833915600000081
这样就得到了直接关联矩阵Gdir与观测矩阵Gobs的对应关系,如附图3所示。
为保证公式(7)中等比数列收敛,直接关联矩阵Gdir的特征值需要满足 |λdir|<1,则需要对观测矩阵Gobs进行如公式(14)所示的线性缩放。
G′obs=αGobs (14)
公式(14)中,G′obs为经过线性缩放后的观测矩阵,α为线性系数,且
Figure BDA0003833915600000082
Figure BDA0003833915600000083
Figure BDA0003833915600000084
分别是Gobs的特征值中最大正值和最小负值,β为权重系数,本实施例中选为0.5。
最终得到通过观测矩阵与直接关联矩阵特征值之间的对应关系得到了剔除了噪声关联的直接关联矩阵Gdir,如公式(15)所示。
Figure BDA0003833915600000085
式中,I′(xn;xn)表示第K个候选参数xK与第K个候选参数xK的直接关联互信息值。
步骤204:将各个候选参数相互之间的直接关联互信息值由高到底排序,依据排序结果后从候选参数中选出候选关键特征参数组成预选的关键特征子集。
步骤205:在剔除了噪声关联关系之后,计算各个候选参数与预选的关键特征子集的相关性、冗余性、互补性,并通过测度函数判定待选参数是否为关键参数,最终确定初选的关键参数子集。
步骤205具体包括以下步骤:
在已知目标参数——纺纱能耗z的情况下,z={z1,z2,…zl},候选参数x与候选参数y的互补性用条件互信息I(x;y|z)表示,其度量方法见公式(16)。
Figure BDA0003833915600000086
p(xi,yj|zk)表示当纺纱能耗z的值为zk时,候选参数x的值取为xi且候选参数 y的值取为yj的概率;p(xi|zk)表示当纺纱能耗z的值为zk时,候选参数x的值取为xi的概率;p(yj|zk)表示当纺纱能耗z的值为zk时,候选参数y的值取为yj的概率。
纺纱能耗z为性能指标CT,在纺纱能耗等关键影响参数的识别中,第k个候选参数xk和性能指标CT之间的相关性用两者之间的互信息I(xk;CT)来描述。第k 个候选参数xk与步骤204获得的预选的关键特征子集S之间的冗余性用候选参数和关键参数之间的互信息I(xk;S)来描述。在本发明中,I(xk;S)由第k个候选参数 xk与预选的关键特征子集S中的参数之间的平均互信息值来近似,其度量方法见公式(17)所示。第k个候选参数xk与预选的关键特征子集S之间的互补性可以用条件互信息I(xk;S|CT)来描述,其由已知性能指标CT的情况下,第k个候选参数xk与预选的关键特征子集S中的参数之间的平均互信息值来近似,其度量方法见公式 (18)。
Figure BDA0003833915600000091
Figure BDA0003833915600000092
式中,fs表示预选的关键特征子集S中的第s个参数。
最终,本发明所确定的关键参数影响力指标充分考虑了候选参数与性能指标 CT之间的相关性、候选参数与预选的关键特征子集S之间的冗余性与互补性,入选测度的详细描述见公式(19)。
Figure BDA0003833915600000093
公式(19)中,α、β是权值参数,且满足(+β)∈[0,1];|S|表示预选的关键特征子集S中的参数个数。
通过公式(19)所示的测度函数判定各个候选参数是否为关键参数,所有被判定为关键参数的候选参数组成初选的关键参数子集。
步骤206:初选的关键参数子集为最大搜索范围,通过遗传算法并以预测精度以及辨识度作为评估每次迭代生成的新的关键参数子集,以进行关键参数子集的精选。达到终止条件后,评估结果最优的关键参数子集即为最终的关键参数子集。
步骤206具体包括以下步骤:
通过遗传算法并以预测精度以及辨识度作为评估每次迭代生成的新的关键参数子集,以进行关键参数子集的精选采用公式(20)。
Figure BDA0003833915600000101
式中,θ、η分别表示预测精度以及辨识度在适应度值函数中各占的比重,θ=sigmoid(MSE),且θ+η=1;MSE表示预测精度,
Figure BDA0003833915600000102
Figure BDA0003833915600000103
m代表的是测试样本集中测试样本的数目,ytesti代表的是测试样本集中的第i个标签样本,
Figure BDA0003833915600000104
表示
Figure BDA0003833915600000105
所对应的混合特征选择算法模型的预测结果;μi1、σi1以及μi2、σi2分别代表的是一个特征中非能耗异常以及能耗异常一类的均值以及方差;L为一组特征子集的总个数。
随着遗传算法的不断迭代,θ、η的变化如公式(21),(22)所示。
Figure BDA0003833915600000106
η=1-θ (22)
式中,pace代表的是步长,本实施例中设置为0.01;
Figure BDA0003833915600000107
为θ对应函数的导数。
步骤三:训练模型
将目标数据集分为两部分:将采集得到目标数据集中80%的样本作为用于训练的目标数据集,20%的样本作为用于测试的目标数据集。在训练部分,将训练集以及对应的目标数据集用于混合特征选择算法模型的训练,并得到一组关键参数子集。
步骤四:参数验证
首先通过专家验证的方法,判断所提取的关键参数子集中的参数是否为影响能耗的关键参数。此外,为了更加全面地验证被选取的参数,统计参数准确度 Accuracy、G-Mean等评价指标,对提取的关键参数子集进行性能评估。定义如下:
Figure BDA0003833915600000108
Figure BDA0003833915600000109
Figure BDA00038339156000001010
Figure BDA00038339156000001011
式中,TP表示真阳:预测为正常值,实际为正常值;FP表示假阳:预测为正常值,实际为异常值;FN表示假阴:预测为异常值,实际为正常值;TN表示真阴:预测为异常值,实际为异常值。
Recall值越高,将实际正常数据识别为异常的误报越少。Specificity值越高,将异常数据识别为正常数据的漏报越少。G-Mean是由Specificity和Recall形成的综合度量指标,它综合反映了模型对于误报和漏报的性能。

Claims (6)

1.一种基于高维度纺纱数据的混合特征选择方法,能够消除由于纺纱工序加工产生的传递误差并挑选出对于纺纱能耗异常有重要影响的参数,进而准确识别影响纺纱能耗的关键参数,其特征在于,包括以下步骤:
步骤一:收集并记录不同纺纱能耗下环锭纺纱生产过程中对纺纱能耗有潜在影响的候选参数数据,将所有潜在候选参数数据整合为一个完整的数据集;
步骤二:基于步骤一得到的数据集生成训练数据集,对混合特征选择算法模型进行训练,混合特征选择算法模型采用以下步骤生成最终的关键参数子集:
步骤201:计算各个候选参数与纺纱能耗相关的互信息值;
步骤202:基于步骤201获得的互信息值构建与观测到的关联关系对应的观测矩阵Gobs,有:
Figure FDA0003833915590000011
式中,I(xK;xK)表示步骤201计算得到的第K个候选参数xK与第K个候选参数xK的互信息值;
步骤203、基于直接关联矩阵Gdir的特征值λdir与观测矩阵Gobs的特征值λobs之间的关系,利用网络去卷积算法由观测矩阵Gobs计算到剔除了噪声关联的直接关联矩阵Gdir,其中:
直接关联矩阵Gdir的特征值λdir与观测矩阵Gobs的特征值λobs之间的关系表示为下式:
Figure FDA0003833915590000012
直接关联矩阵Gdir表示为:
Figure FDA0003833915590000013
I′(xK;xK)表示第K个候选参数xK与第K个候选参数xK的直接关联互信息值;
步骤204:将各个候选参数相互之间的直接关联互信息值由高到底排序,依据排序结果后从候选参数中选出候选关键特征参数组成预选的关键特征子集;
步骤205:在剔除了噪声关联关系之后,计算各个候选参数与预选的关键特征子集的相关性、冗余性、互补性,并通过测度函数判定待选参数是否为关键参数,最终确定初选的关键参数子集;
步骤206:初选的关键参数子集为最大搜索范围,通过遗传算法并以预测精度以及辨识度作为评估每次迭代生成的新的关键参数子集,以进行关键参数子集的精选;达到终止条件后,评估结果最优的关键参数子集即为最终的关键参数子集。
2.如权利要求1所述的一种基于高维度纺纱数据的混合特征选择方法,其特征在于,所述潜在候选参数包括环境参数、工艺参数、设备参数、原料参数、人员参数。
3.如权利要求1所述的一种基于高维度纺纱数据的混合特征选择方法,其特征在于,步骤201中,
两个参数x、y之间的相关性用互信息值I(x;y)来度量,则有:
Figure FDA0003833915590000021
式中,xi表示参数x的第i个参数值,p(xi)表示参数x的值为xi的概率,yj表示参数y的第j个参数值,p(yj)表示参数y的值为yj的概率,p(xi,yj)表示参数x的值为xi且参数y的值为yj的概率。
4.如权利要求1所述的一种基于高维度纺纱数据的混合特征选择方法,其特征在于,在所述步骤202之后,并所述步骤203之前,还包括以下步骤:
对观测矩阵Gobs进行线性缩放,如下式所示:
G′obs=αGobs
式中,G′obs为经过线性缩放后的观测矩阵,α为线性系数,且
Figure FDA0003833915590000022
Figure FDA0003833915590000023
Figure FDA0003833915590000024
分别是Gobs的特征值中最大正值和最小负值,β为预先确定的权重系数。
5.如权利要求1所述的一种基于高维度纺纱数据的混合特征选择方法,其特征在于,步骤205中,所述测度函数如下式所示:
Figure FDA0003833915590000031
式中,α、β是权值参数,且满足(α+β)∈[0,1];|S|表示预选的关键特征子集S中的参数个数;CT表示性能指标;xk表示第k个候选参数;I(xk;fs|CT)表示已知性能指标CT的情况下,第k个候选参数xk与预选的关键特征子集S中的第s个参数fs之间的互信息值。
6.如权利要求1所述的一种基于高维度纺纱数据的混合特征选择方法,其特征在于,步骤206中,采用下式评估每次迭代生成的新的关键参数子集:
Figure FDA0003833915590000032
式中,θ、η分别表示预测精度以及辨识度在适应度值函数中各占的比重,θ=sigmoid(MSE),且θ+η=1;MSE表示预测精度,
Figure FDA0003833915590000033
Figure FDA0003833915590000034
m代表的是测试样本集中测试样本的数目,ytesti代表的是测试样本集中的第i个标签样本,
Figure FDA0003833915590000035
表示
Figure FDA0003833915590000036
所对应的混合特征选择算法模型的预测结果;μi1、σi1以及μi2、σi2分别代表的是一个特征中非能耗异常以及能耗异常一类的均值以及方差;L为一组特征子集的总个数;
随着遗传算法的不断迭代,θ、η的变化如下式:
Figure FDA0003833915590000037
η=1-θ
式中,pace代表的是步长;
Figure FDA0003833915590000038
为θ对应函数的导数。
CN202211082497.7A 2022-09-06 2022-09-06 基于高维度纺纱数据的混合特征选择方法 Active CN115687899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211082497.7A CN115687899B (zh) 2022-09-06 2022-09-06 基于高维度纺纱数据的混合特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211082497.7A CN115687899B (zh) 2022-09-06 2022-09-06 基于高维度纺纱数据的混合特征选择方法

Publications (2)

Publication Number Publication Date
CN115687899A true CN115687899A (zh) 2023-02-03
CN115687899B CN115687899B (zh) 2024-05-14

Family

ID=85061499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211082497.7A Active CN115687899B (zh) 2022-09-06 2022-09-06 基于高维度纺纱数据的混合特征选择方法

Country Status (1)

Country Link
CN (1) CN115687899B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105321172A (zh) * 2015-08-31 2016-02-10 哈尔滨工业大学 一种sar、红外、可见光图像融合方法
CN106991446A (zh) * 2017-04-06 2017-07-28 哈尔滨理工大学 一种互信息的组策略嵌入式动态特征选择方法
CN111639673A (zh) * 2020-04-27 2020-09-08 沃太能源南通有限公司 一种处理混合特征数据的自解释规约建模方法
CN112860819A (zh) * 2021-03-19 2021-05-28 西南交通大学 一种基于邻域条件互信息的交互特征选择方法
CN114692677A (zh) * 2022-03-07 2022-07-01 电子科技大学 一种基于多目标特征选择的焊接缺陷识别方法
CN114818845A (zh) * 2022-01-18 2022-07-29 西安电子科技大学 一种噪声稳健的高分辨距离像特征选择方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105321172A (zh) * 2015-08-31 2016-02-10 哈尔滨工业大学 一种sar、红外、可见光图像融合方法
CN106991446A (zh) * 2017-04-06 2017-07-28 哈尔滨理工大学 一种互信息的组策略嵌入式动态特征选择方法
CN111639673A (zh) * 2020-04-27 2020-09-08 沃太能源南通有限公司 一种处理混合特征数据的自解释规约建模方法
CN112860819A (zh) * 2021-03-19 2021-05-28 西南交通大学 一种基于邻域条件互信息的交互特征选择方法
CN114818845A (zh) * 2022-01-18 2022-07-29 西安电子科技大学 一种噪声稳健的高分辨距离像特征选择方法
CN114692677A (zh) * 2022-03-07 2022-07-01 电子科技大学 一种基于多目标特征选择的焊接缺陷识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吕佑龙;许鸿伟;郑城;张洁;郑鹏;: "基于混合式特征选择模型的晶圆允收测试关键参数识别方法", 中国机械工程, no. 16 *

Also Published As

Publication number Publication date
CN115687899B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
CN113256066B (zh) 基于PCA-XGBoost-IRF的作业车间实时调度方法
CN108182445B (zh) 基于大数据智能核独立元分析的过程故障识别方法
CN112085252B (zh) 一种关于集合类型决策效果的反事实预测方法
CN113255848B (zh) 基于大数据学习的水轮机空化声信号辨识方法
CN106843195B (zh) 基于自适应集成半监督费舍尔判别的故障分类方法
CN108875772B (zh) 一种基于堆叠稀疏高斯伯努利受限玻尔兹曼机和强化学习的故障分类模型及方法
CN111191726B (zh) 一种基于弱监督学习多层感知器的故障分类方法
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
CN114881101B (zh) 一种基于仿生搜索的电力系统典型场景关联特征选择方法
CN113052271B (zh) 基于深度神经网络的生物发酵数据预测方法
CN112418476A (zh) 一种超短期电力负荷预测方法
CN114429152A (zh) 基于动态指数对抗性自适应的滚动轴承故障诊断方法
CN114266297A (zh) 火电装备语义知识库、构建方法及零样本故障诊断方法
CN110427019B (zh) 一种基于多变量判别分析的工业过程故障分类方法及控制装置
CN117392450A (zh) 一种基于进化多尺度特征学习的钢铁材料质量解析方法
CN114004530A (zh) 基于排序支撑向量机的企业电力信用分建模方法及系统
CN112329868A (zh) 基于clara聚类的制造加工设备群能效状态评价方法
CN115687899A (zh) 基于高维度纺纱数据的混合特征选择方法
CN116383747A (zh) 基于多时间尺度深度卷积生成对抗网络的异常检测方法
CN115575127A (zh) 一种基于鲸鱼优化lssvm的轴承剩余寿命预测方法
CN116224950A (zh) 面向无人生产线自组织重构的智能故障诊断方法和系统
CN115618708A (zh) 基于增量式Informer算法的设备健康状态预测方法
CN115409317A (zh) 基于特征选择和机器学习的台区线损检测方法及装置
CN114252266A (zh) 一种基于dbn-svdd模型的滚动轴承性能退化评估方法
CN114298413A (zh) 一种水电机组振摆趋势预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant