CN110728327B - 一种具有可解释性的直推学习方法及系统 - Google Patents

一种具有可解释性的直推学习方法及系统 Download PDF

Info

Publication number
CN110728327B
CN110728327B CN201910994868.0A CN201910994868A CN110728327B CN 110728327 B CN110728327 B CN 110728327B CN 201910994868 A CN201910994868 A CN 201910994868A CN 110728327 B CN110728327 B CN 110728327B
Authority
CN
China
Prior art keywords
affinity matrix
sample set
integrated
unit
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910994868.0A
Other languages
English (en)
Other versions
CN110728327A (zh
Inventor
吕文君
康宇
李泽瑞
昌吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Zhongke Liheng Intelligent Technology Co ltd
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN201910994868.0A priority Critical patent/CN110728327B/zh
Publication of CN110728327A publication Critical patent/CN110728327A/zh
Application granted granted Critical
Publication of CN110728327B publication Critical patent/CN110728327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种具有可解释性的直推学习方法及系统,属于数据处理技术领域,包括:获取数据的样本集合,将样本集合划分为有标注样本集合和无标注样本集合;基于数据同质性假设对样本集合进行处理,构造集成亲和矩阵和亲和矩阵集成系数;利用集成亲和矩阵对无标注集合中的图像进行伪标注,得到伪标注样本集合;利用有标注样本集合和伪标注样本集合,对决策树模型进行训练;对亲和矩阵集成系数进行更新,直至亲和矩阵逼近最优,输出决策树模型;利用决策树模型对实时采集的图像进行标记分类。本发明构建的直推学习分类模型具有可解释性,适用于对风险极其敏感的场景。

Description

一种具有可解释性的直推学习方法及系统
技术领域
本发明涉及数据处理技术领域,特别涉及一种具有可解释性的直推学习方法及系统。
背景技术
在传统的监督学习中,学习器通过对大量有标记的训练示例进行学习,从而建立模型用于预测未见示例的标记。随着数据采集和存储技术的飞速发展,获取大量未标记示例已相当容易,而获取大量有标记示例则相对困难,因而半监督学习应运而生。
针对半监督学习中的直推学习问题,在很多工业场合,对风险极其敏感,机器学习的可解释性就显得非常重要。目前,机器学习方法普遍是基于黑盒模型的设计和基于拉普拉斯支持向量机的设计,但基于黑盒模型的设计,可解释性较弱,基于拉普拉斯支持向量机的设计,难以对其进行解释。
发明内容
本发明的目的在于克服上述背景技术中的不足,使得直推学习分类模型具备可解释性,提高数据标签分类准确性。
为实现以上目的,一方面,采用一种具有可解释性的直推学习方法,包括如下步骤:
获取数据的样本集合,将样本集合划分为有标注样本集合和无标注样本集合;
基于数据同质性假设对样本集合进行处理,构造集成亲和矩阵和亲和矩阵集成系数;
利用集成亲和矩阵对无标注集合中的数据进行伪标注,得到伪标注样本集合;
利用有标注样本集合和伪标注样本集合,对决策树模型f进行训练;
对亲和矩阵集成系数进行更新,直至亲和矩阵逼近最优,输出决策树模型;
利用决策树模型对实时采集的数据进行标记分类。
进一步地,所述获取数据的样本集合,包括:
采集数据;
对数据进行特征提取,得到特征向量,将特征向量作为样本构建所述样本集合。
进一步地,所述基于数据同质性假设对样本集合进行处理,构造集成亲和矩阵和亲和矩阵集成系数,包括:
基于数据同质性假设对样本集合进行处理,构造候选亲和矩阵集合
Figure GDA0002950550350000021
m为候选亲和矩阵的数量;
对候选亲和矩阵集合中的候选亲和矩阵进行线性加权,得到所述集成亲和矩阵A;
构造所述亲和矩阵集成系数{μk,k=1,2,...,m},且
Figure GDA0002950550350000022
进一步地,所述候选亲和矩阵Ak中的第(i,j)个元素ωi,j的计算公式为:
Figure GDA0002950550350000023
其中,i,j=1,2,...,n,t>0为高斯核宽度,
Figure GDA0002950550350000024
为距离xj最近的k个样本的集合,
Figure GDA0002950550350000025
为距离xi最近的k个样本的集合。
进一步地,所述集成亲和矩阵A为:
Figure GDA0002950550350000026
进一步地,所述对亲和矩阵集成系数进行更新,直至亲和矩阵逼近最优,输出决策树模型,包括:
a1)、令p=1,p,q=1,2,...,m;
a2)、针对每个q=p+1,p+2,...,m,循环依次执行如下指令:
Figure GDA0002950550350000031
其中,γ>0为平衡系数,
Figure GDA0002950550350000032
Lp为候选亲和矩阵Ap的图拉普拉斯矩阵,δ=[f(x1),f(x2),...,f(xn)]′,上标′表示矩阵转置,n表示所述样本集合中的样本总数;
a3)、令p←p+1,如果p<m,则跳转执行所述步骤a2),否则执行步骤a4);
a4)、令φ←φ+1,如果φ<Φ,则重新构造所述集成亲和矩阵,否则执行步骤a5),其中φ为当前优化迭代次数,Φ为设定的最大迭代次数;
a5)、输出所述决策树模型。
另一方面,采用一种具有可解释性的直推学习系统,包括样本处理模块、构造模块、伪标注模块、训练模块、更新优化模块和分类模块;
样本处理模块用于获取数据的样本集合,将样本集合划分为有标注样本集合和无标注样本集合;
构造模块用于基于数据同质性假设对样本集合进行处理,构造集成亲和矩阵和亲和矩阵集成系数;
伪标注模块用于利用集成亲和矩阵对无标注集合中的数据进行伪标注,得到伪标注样本集合;
训练模块用于利用有标注样本集合和伪标注样本集合,对决策树模型f进行训练;
更新优化模块用于对亲和矩阵集成系数进行更新,直至亲和矩阵逼近最优,输出决策树模型;
分类模块用于利用决策树模型对实时采集的数据进行标记分类。
进一步地,所述构造模块包括候选亲和矩阵集合构造单元、集成亲和矩阵构造单元和亲和矩阵集成系数构造单元;
候选亲和矩阵集合构造单元用于基于数据同质性假设对样本集合进行处理,构造候选亲和矩阵集合
Figure GDA0002950550350000041
m为候选亲和矩阵的数量;
集成亲和矩阵构造单元用于对候选亲和矩阵集合中的候选亲和矩阵进行线性加权,得到所述集成亲和矩阵A;
矩阵集成系数构造单元用于构造所述亲和矩阵集成系数{μk,k=1,2,...,m},且
Figure GDA0002950550350000042
进一步地,所述候选亲和矩阵Ak中的第(i,j)个元素ωi,j的计算公式为:
Figure GDA0002950550350000043
其中,i,j=1,2,...,n,t>0为高斯核宽度,
Figure GDA0002950550350000044
为距离xj最近的k个样本的集合,
Figure GDA0002950550350000045
为距离xi最近的k个样本的集合;
所述集成亲和矩阵A为:
Figure GDA0002950550350000046
进一步地,所述更新优化模块第一设置单元、循环执行单元、第二设置单元、第一判断单元、第三设置单元、第二判断单元和输出单元;
第一设置单元用于令p=1,p,q=1,2,...,m;
循环执行单元针对每个q=p+1,p+2,...,m,循环依次执行如下指令:
Figure GDA0002950550350000051
其中,γ>0为平衡系数,
Figure GDA0002950550350000052
Lp为候选亲和矩阵Ap的图拉普拉斯矩阵,δ=[f(x1),f(x2),...,f(xn)],上标′表示矩阵转置,n表示所述样本集合中的样本总数;
第二设置单元用于令令p←p+1;
第一判断单元用于判断是否满足p<m;
循环执行单元用于在第一判断单元输出结果为是时,循环执行所述指令;
第三设置单元用于在第一判断单元输出结果为否时,令φ←φ+1;
第二判断单元用于判断是否满足φ<Φ,其中φ为当前优化迭代次数,Φ为设定的最大迭代次数;
所述构造模块用于在第二判断单元输出结果为是时,重新构造所述集成亲和矩阵;
输出单元用于在第二判断单元输出结果为否时,输出所述决策树模型。
与现有技术相比,本发明存在以下技术效果:本发明设计的直推学习方法构建的直推学习分类模型为决策树模型,具有可解释性,克服了直推学习分类模型不具备可解释性的缺陷,适用于对风险极其敏感的场景。且本方案中通过不断优化逼近最优亲和矩阵,提高了对数据进行标签分类的准确性。
附图说明
下面结合附图,对本发明的具体实施方式进行详细描述:
图1是一种具有可解释性的直推学习方法的流程示意图;
图2是一种具有可解释性的直推学习系统的结构示意图。
具体实施方式
为了更进一步说明本发明的特征,请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用,并非用来对本发明的保护范围加以限制。
如图1所示,本实施例公开了一种具有可解释性的直推学习方法,包括如下步骤S1至S6:
S1、获取数据的样本集合,将样本集合划分为有标注样本集合和无标注样本集合;
S2、基于数据同质性假设对样本集合进行处理,构造集成亲和矩阵和亲和矩阵集成系数;
S3、利用集成亲和矩阵对无标注集合中的数据进行伪标注,得到伪标注样本集合;
S4、利用有标注样本集合和伪标注样本集合,对决策树模型f进行训练;
S5、对亲和矩阵集成系数进行更新,直至亲和矩阵逼近最优,输出决策树模型;
S6、利用决策树模型对实时采集的数据进行标记分类。
具体来说,上述步骤S1:获取数据的样本集合,具体包括如下步骤:
采集数据,该数据可为机器人地面分类中采集的振动信号,可为地下岩性识别过程中采集的测井曲线,也可以为卫星超光谱图像分类过程中采集的超光谱图像。
对数据进行特征提取,得到特征向量;
对数据进行特征提取,得到特征向量,将特征向量作为样本构建所述样本集合
Figure GDA0002950550350000071
样本
Figure GDA0002950550350000072
表示实数集,d为特征维度,i=1,2,...,n,n表示样本总数。
具体来说,从样本集合中选取l个样本进行标注,得到有标注样本集合
Figure GDA0002950550350000073
和无标注样本集合
Figure GDA0002950550350000074
Figure GDA0002950550350000075
标注ya∈Y={1,2,...,c},c为类别总数。
具体来说,上述步骤S2:基于数据同质性假设对样本集合进行处理,构造集成亲和矩阵和亲和矩阵集成系数,包括如下细分步骤S21至S3:
S21、基于数据同质性假设对样本集合进行处理,构造候选亲和矩阵集合
Figure GDA0002950550350000076
m为候选亲和矩阵的数量。
其中,所述候选亲和矩阵Ak中的第(i,j)个元素ωi,j的计算公式为:
Figure GDA0002950550350000077
其中,i,j=1,2,...,n,t>0为高斯核宽度,
Figure GDA0002950550350000078
为距离xj最近的k个样本的集合,
Figure GDA0002950550350000079
为距离xi最近的k个样本的集合,通过设定不同的k与t的值,确定候选亲和矩阵集合中的候选亲和矩阵Ak
S22、对候选亲和矩阵集合中的候选亲和矩阵进行线性加权,得到所述集成亲和矩阵A。
其中,所述集成亲和矩阵A为:
Figure GDA00029505503500000710
S23、构造所述亲和矩阵集成系数{μk,k=1,2,...,m},且
Figure GDA00029505503500000711
具体来说,上述步骤S3:利用集成亲和矩阵对无标注集合中的图像进行伪标注,得到伪标注样本集合,具体为:基于集成亲和矩阵进行半监督图标注传播,为上述无标注样本集合
Figure GDA00029505503500000712
进行伪标注,得到伪标注样本集合
Figure GDA0002950550350000081
其中,
Figure GDA0002950550350000082
为伪标注。
具体来说,上述步骤S5:对亲和矩阵集成系数进行更新,直至亲和矩阵逼近最优,输出决策树模型,具体包括如下细分步骤:
a1)、令p=1,p,q=1,2,...,m;
a2)、针对每个q=p+1,p+2,...,m,循环依次执行如下指令:
Figure GDA0002950550350000083
其中,γ>0为平衡系数,
Figure GDA0002950550350000084
Lp为候选亲和矩阵Ap的图拉普拉斯矩阵,δ=[f(x1),f(x2),...,f(xn)],上标′表示矩阵转置,n表示所述样本集合中的样本总数;其中,p,q,k=1,2,...,m,均为候选亲和矩阵的下标表示;
a3)、令p←p+1,如果p<m,则跳转执行所述步骤a2),否则执行步骤a4);
a4)、令φ←φ+1,如果φ<Φ,则重新构造所述集成亲和矩阵,否则执行步骤a5),其中φ为当前优化迭代次数,Φ为设定的最大迭代次数;
a5)、输出所述决策树模型。
如图2所示,本实施例公开了一种具有可解释性的直推学习系统,包括样本处理模块10、构造模块20、伪标注模块30、训练模块40、更新优化模块50和分类模块60;
样本处理模块10用于获取数据的样本集合
Figure GDA0002950550350000091
样本
Figure GDA0002950550350000092
表示实数集,d为特征维度,i=1,2,...,n,n表示样本总数,从样本集合中选取l个样本进行标注,得到有标注样本集合
Figure GDA0002950550350000093
和无标注样本集合
Figure GDA0002950550350000094
Figure GDA0002950550350000095
标注ya∈Y={1,2,...,c},c为类别总数。
构造模块20用于基于数据同质性假设对样本集合进行处理,构造集成亲和矩阵和亲和矩阵集成系数;
伪标注模块30用于利用集成亲和矩阵对无标注集合中的数据进行伪标注,得到伪标注样本集合;
训练模块40用于利用有标注样本集合和伪标注样本集合,对决策树模型f进行训练;
更新优化模块50用于对亲和矩阵集成系数进行更新,直至亲和矩阵逼近最优,输出决策树模型;
分类模块60用于利用决策树模型对实时采集的数据进行标记分类。
具体来说,所述构造模块20包括候选亲和矩阵集合构造单元、集成亲和矩阵构造单元和亲和矩阵集成系数构造单元;
候选亲和矩阵集合构造单元用于基于数据同质性假设对样本集合进行处理,构造候选亲和矩阵集合
Figure GDA0002950550350000096
m为候选亲和矩阵的数量。其中,候选亲和矩阵Ak中的第(i,j)个元素ωi,j的计算公式为:
Figure GDA0002950550350000097
其中,i,j=1,2,...,n,t>0为高斯核宽度,
Figure GDA0002950550350000098
为距离xj最近的k个样本的集合,
Figure GDA0002950550350000099
为距离xi最近的k个样本的集合。
集成亲和矩阵构造单元用于对候选亲和矩阵集合中的候选亲和矩阵进行线性加权,得到所述集成亲和矩阵A。其中,所述集成亲和矩阵A为:
Figure GDA0002950550350000101
矩阵集成系数构造单元用于构造所述亲和矩阵集成系数{μk,k=1,2,...,m},且
Figure GDA0002950550350000102
具体来说,所述更新优化模块50第一设置单元、循环执行单元、第二设置单元、第一判断单元、第三设置单元、第二判断单元和输出单元;
第一设置单元用于令p=1,p,q=1,2,...,m;
循环执行单元针对每个q=p+1,p+2,...,m,循环依次执行如下指令:
Figure GDA0002950550350000103
其中,γ>0为平衡系数,
Figure GDA0002950550350000104
Lp为候选亲和矩阵Ap的图拉普拉斯矩阵,δ=[f(x1),f(x2),...,f(xn)],上标′表示矩阵转置,n表示所述样本集合中的样本总数;
第二设置单元用于令令p←p+1;
第一判断单元用于判断是否满足p<m;
循环执行单元用于在第一判断单元输出结果为是时,循环执行所述指令;
第三设置单元用于在第一判断单元输出结果为否时,令φ←φ+1;
第二判断单元用于判断是否满足φ<Φ,其中φ为当前优化迭代次数,Φ为设定的最大迭代次数;
所述构造模块用于在第二判断单元输出结果为是时,重新构造所述集成亲和矩阵;
输出单元用于在第二判断单元输出结果为否时,输出所述决策树模型。
需要说明的是,本实施例提出的具有可解释性的直推学习方法可应用于对岩性预测,具体为收集一口井的测井曲线,每个深度上的不同测井值组成特征向量,进而构建样本集合,标注即为岩性;然后构建集成亲和矩阵,并在亲和矩阵逼近最优,输出决策树模型,对实时采集的测井曲线进行岩性预测。
同样地,也可应用于基于振动曲线的地面类型预测,具体为收集机器人在不同地面类型上行驶产生的振动曲线,将曲线以一定长度截断得到一系列振动帧,对每个振动帧进行傅里叶变化即可得到每个振动帧对应的特征向量(即样本),进而构建样本集合,标注即为地面类型。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种具有可解释性的直推学习方法,其特征在于,包括:
获取数据的样本集合,将样本集合划分为有标注样本集合和无标注样本集合,该样本集合中的样本数据为用于岩性分类的深井曲线的特征向量、用于地面分类的振动曲线的特征向量或用于卫星超光谱图像分类的超光谱图像的特征向量;
基于数据同质性假设对样本集合进行处理,构造集成亲和矩阵和亲和矩阵集成系数,包括:
基于数据同质性假设对样本集合进行处理,构造候选亲和矩阵集合
Figure FDA0002950550340000011
m为候选亲和矩阵的数量,所述候选亲和矩阵Ak中的第(i,j)个元素ωi,j的计算公式为:
Figure FDA0002950550340000012
其中,i,j=1,2,...,n,t>0为高斯核宽度,
Figure FDA0002950550340000013
为距离xj最近的k个样本的集合,
Figure FDA0002950550340000014
为距离xi最近的k个样本的集合,通过设定不同的k与t的值,确定候选亲和矩阵集合中的候选亲和矩阵Ak
对候选亲和矩阵集合中的候选亲和矩阵进行线性加权,得到所述集成亲和矩阵A,所述集成亲和矩阵A为:
Figure FDA0002950550340000015
构造所述亲和矩阵集成系数{μk,k=1,2,...,m},且
Figure FDA0002950550340000016
利用集成亲和矩阵对无标注样本集合中的数据进行伪标注,得到伪标注样本集合;
利用有标注样本集合和伪标注样本集合,对决策树模型f进行训练;
对亲和矩阵集成系数进行更新,直至亲和矩阵逼近最优,输出决策树模型,包括:
a1)、令p=1,p,q=1,2,...,m;
a2)、针对每个q=p+1,p+2,...,m,循环依次执行如下指令:
Figure FDA0002950550340000021
其中,γ>0为平衡系数,
Figure FDA0002950550340000022
Lp为候选亲和矩阵Ap的图拉普拉斯矩阵,δ=[f(x1),f(x2),..,f(xn)]′,上标′表示矩阵转置,n表示所述样本集合中的样本总数;
a3)、令p←p+1,如果p<m,则跳转执行所述步骤a2),否则执行步骤a4);
a4)、令φ←φ+1,如果φ<Φ,则重新构造所述集成亲和矩阵,否则执行步骤a5),其中φ为当前优化迭代次数,Φ为设定的最大迭代次数;
a5)、输出所述决策树模型;
利用决策树模型对实时采集的深井曲线、振动曲线或者超光谱图像分别进行岩性分类、地面类型分类或者超光谱图像分类。
2.如权利要求1所述的具有可解释性的直推学习方法,其特征在于,所述获取数据的样本集合,包括:
采集数据;
对数据进行特征提取,得到特征向量,将特征向量作为样本构建所述样本集合。
3.一种具有可解释性的直推学习系统,其特征在于,包括样本处理模块、构造模块、伪标注模块、训练模块、更新优化模块和分类模块;
样本处理模块用于获取数据的样本集合,将样本集合划分为有标注样本集合和无标注样本集合,该样本集合中的样本数据为用于岩性分类的深井曲线的特征向量、用于地面分类的振动曲线的特征向量或用于卫星超光谱图像分类的超光谱图像的特征向量;
构造模块用于基于数据同质性假设对样本集合进行处理,构造集成亲和矩阵和亲和矩阵集成系数;
伪标注模块用于利用集成亲和矩阵对无标注样本集合中的数据进行伪标注,得到伪标注样本集合;
训练模块用于利用有标注样本集合和伪标注样本集合,对决策树模型f进行训练;
更新优化模块用于对亲和矩阵集成系数进行更新,直至亲和矩阵逼近最优,输出决策树模型;
分类模块用于利用决策树模型对实时采集的深井曲线、振动曲线或者超光谱图像分别进行岩性分类、地面类型分类或者超光谱图像分类,其中:
所述构造模块包括候选亲和矩阵集合构造单元、集成亲和矩阵构造单元和亲和矩阵集成系数构造单元;
候选亲和矩阵集合构造单元用于基于数据同质性假设对样本集合进行处理,构造候选亲和矩阵集合
Figure FDA0002950550340000031
m为候选亲和矩阵的数量;
集成亲和矩阵构造单元用于对候选亲和矩阵集合中的候选亲和矩阵进行线性加权,得到所述集成亲和矩阵A;
矩阵集成系数构造单元用于构造所述亲和矩阵集成系数{μk,k=1,2,...,m},且
Figure FDA0002950550340000032
所述候选亲和矩阵Ak中的第(i,j)个元素ωi,j的计算公式为:
Figure FDA0002950550340000033
其中,i,j=1,2,..,n,t>0为高斯核宽度,
Figure FDA0002950550340000034
为距离xj最近的k个样本的集合,
Figure FDA0002950550340000035
为距离xi最近的k个样本的集合;
所述集成亲和矩阵A为:
Figure FDA0002950550340000041
其中,所述更新优化模块第一设置单元、循环执行单元、第二设置单元、第一判断单元、第三设置单元、第二判断单元和输出单元;
第一设置单元用于令p=1,p,q=1,2,...,m;
循环执行单元针对每个q=p+1,p+2,...,m,循环依次执行如下指令:
Figure FDA0002950550340000042
其中,γ>0为平衡系数,
Figure FDA0002950550340000043
Lp为候选亲和矩阵Ap的图拉普拉斯矩阵,δ=[f(x1),f(x2),...,f(xn)]′,上标′表示矩阵转置,n表示所述样本集合中的样本总数;
第二设置单元用于令令p←p+1;
第一判断单元用于判断是否满足p<m;
循环执行单元用于在第一判断单元输出结果为是时,循环执行所述指令;
第三设置单元用于在第一判断单元输出结果为否时,令φ←φ+1;
第二判断单元用于判断是否满足φ<Φ,其中φ为当前优化迭代次数,Φ为设定的最大迭代次数;
所述构造模块用于在第二判断单元输出结果为是时,重新构造所述集成亲和矩阵;
输出单元用于在第二判断单元输出结果为否时,输出所述决策树模型。
CN201910994868.0A 2019-10-18 2019-10-18 一种具有可解释性的直推学习方法及系统 Active CN110728327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910994868.0A CN110728327B (zh) 2019-10-18 2019-10-18 一种具有可解释性的直推学习方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910994868.0A CN110728327B (zh) 2019-10-18 2019-10-18 一种具有可解释性的直推学习方法及系统

Publications (2)

Publication Number Publication Date
CN110728327A CN110728327A (zh) 2020-01-24
CN110728327B true CN110728327B (zh) 2021-11-23

Family

ID=69221542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910994868.0A Active CN110728327B (zh) 2019-10-18 2019-10-18 一种具有可解释性的直推学习方法及系统

Country Status (1)

Country Link
CN (1) CN110728327B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537458B (zh) * 2021-06-21 2022-12-30 中国科学技术大学 一种有理式函数神经网络构建方法、系统及可读存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7272583B2 (en) * 2004-12-06 2007-09-18 Intel Corporation Using supervised classifiers with unsupervised data
US7647288B2 (en) * 2006-09-07 2010-01-12 International Business Machines Corporation System and method for optimally customizable and adaptive personalized information display for information associated with managing a chaotic event
CN102110173A (zh) * 2011-04-08 2011-06-29 华北电力大学(保定) 一种改进亲和矩阵的多路谱聚类方法
CN102687007A (zh) * 2009-09-18 2012-09-19 罗格斯州立大学 利用分层标准化切割的高处理量生物标志物分割
CN103530604A (zh) * 2013-09-27 2014-01-22 中国人民解放军空军工程大学 一种基于直推的鲁棒视觉跟踪方法
CN106022351A (zh) * 2016-04-27 2016-10-12 天津中科智能识别产业技术研究院有限公司 一种基于非负字典对学习的鲁棒多视角聚类方法
CN106228183A (zh) * 2016-07-18 2016-12-14 北京邮电大学 一种半监督学习分类方法与装置
CN107679138A (zh) * 2017-09-22 2018-02-09 陕西师范大学 基于局部尺度参数、熵和余弦相似性的谱特征选择方法
AU2018204480A1 (en) * 2017-06-27 2019-01-17 General Electric Company Max-margin temporal transduction for automatic prognostics, diagnosis and change point detection
CN109299162A (zh) * 2018-11-08 2019-02-01 南京航空航天大学 一种用于正类和无标记数据分类的主动学习方法
CN109447100A (zh) * 2018-08-30 2019-03-08 天津理工大学 一种基于b样条曲面相似性检测的三维点云识别方法
CN109478376A (zh) * 2016-04-26 2019-03-15 庞帝教育公司 基于亲和知识的计算学习系统
CN110334777A (zh) * 2019-07-15 2019-10-15 广西师范大学 一种加权多视角无监督属性选择方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11328169B2 (en) * 2017-09-26 2022-05-10 Nvidia Corporation Switchable propagation neural network
US10977737B2 (en) * 2018-01-10 2021-04-13 Liberty Mutual Insurance Company Training gradient boosted decision trees with progressive maximum depth for parsimony and interpretability

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7272583B2 (en) * 2004-12-06 2007-09-18 Intel Corporation Using supervised classifiers with unsupervised data
US7647288B2 (en) * 2006-09-07 2010-01-12 International Business Machines Corporation System and method for optimally customizable and adaptive personalized information display for information associated with managing a chaotic event
CN102687007A (zh) * 2009-09-18 2012-09-19 罗格斯州立大学 利用分层标准化切割的高处理量生物标志物分割
CN102110173A (zh) * 2011-04-08 2011-06-29 华北电力大学(保定) 一种改进亲和矩阵的多路谱聚类方法
CN103530604A (zh) * 2013-09-27 2014-01-22 中国人民解放军空军工程大学 一种基于直推的鲁棒视觉跟踪方法
CN109478376A (zh) * 2016-04-26 2019-03-15 庞帝教育公司 基于亲和知识的计算学习系统
CN106022351A (zh) * 2016-04-27 2016-10-12 天津中科智能识别产业技术研究院有限公司 一种基于非负字典对学习的鲁棒多视角聚类方法
CN106228183A (zh) * 2016-07-18 2016-12-14 北京邮电大学 一种半监督学习分类方法与装置
AU2018204480A1 (en) * 2017-06-27 2019-01-17 General Electric Company Max-margin temporal transduction for automatic prognostics, diagnosis and change point detection
CN107679138A (zh) * 2017-09-22 2018-02-09 陕西师范大学 基于局部尺度参数、熵和余弦相似性的谱特征选择方法
CN109447100A (zh) * 2018-08-30 2019-03-08 天津理工大学 一种基于b样条曲面相似性检测的三维点云识别方法
CN109299162A (zh) * 2018-11-08 2019-02-01 南京航空航天大学 一种用于正类和无标记数据分类的主动学习方法
CN110334777A (zh) * 2019-07-15 2019-10-15 广西师范大学 一种加权多视角无监督属性选择方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Slippage and immobilization detection for planetary exploration rovers via machine learning and proprioceptive sensing;Ramon Gonzalez等;《2017 Wiley Periodicals》;20170617;第1-17页 *
矿井突水水源快速判识智能算法研究;李琳;《中国博士学位论文全文数据库(工程科技Ⅰ辑)》;20190215(第02期);第B021-49页 *

Also Published As

Publication number Publication date
CN110728327A (zh) 2020-01-24

Similar Documents

Publication Publication Date Title
Cheng et al. Improving 3d object detection through progressive population based augmentation
Liu et al. Ssd: Single shot multibox detector
CN113688665B (zh) 一种基于半监督迭代学习的遥感影像目标检测方法及系统
CN110516095B (zh) 基于语义迁移的弱监督深度哈希社交图像检索方法和系统
CN111414942A (zh) 一种基于主动学习和卷积神经网络的遥感图像分类方法
CN110674323A (zh) 基于虚拟标签回归的无监督跨模态哈希检索方法及系统
Dawson et al. Impact of dataset size and convolutional neural network architecture on transfer learning for carbonate rock classification
CN111695413B (zh) 联合U-Net和Temporal Ensembling的信号初至拾取方法及装置
CN106934055B (zh) 一种基于不充分模态信息的半监督网页自动分类方法
CN110728327B (zh) 一种具有可解释性的直推学习方法及系统
CN113269254A (zh) 一种粒子群优化XGBoost算法的煤矸识别方法
CN116310718A (zh) 一种基于YOLOv5模型的害虫目标检测方法、系统及设备
Sharma et al. Automatic identification of bird species using audio/video processing
CN114511785A (zh) 基于瓶颈注意力模块的遥感图像云检测方法及系统
CN105069133B (zh) 一种基于未标记数据的数字图像分类方法
CN116863217A (zh) 一种野外露头岩石图像岩性识别方法
CN107943916B (zh) 一种基于在线分类的网页异常检测方法
CN116681961A (zh) 基于半监督方法和噪声处理的弱监督目标检测方法
CN112784927B (zh) 一种基于在线学习的半自动图像标注方法
CN112101263B (zh) 一种主动学习样本选取方法、系统及计算机可读存储介质
CN115424074A (zh) 一种应用于工业检测的分类方法、装置及设备
Chen et al. An Efficient Evaluation Method for Automobile Shells Design Based on Semi-supervised Machine Learning Strategy
CN114863209A (zh) 类别比例引导的无监督领域适应建模方法、系统、设备及介质
Norelyaqine et al. Deep learning for building extraction from high-resolution remote sensing images
CN113537458B (zh) 一种有理式函数神经网络构建方法、系统及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220713

Address after: 230026 Jinzhai Road, Baohe District, Hefei, Anhui Province, No. 96

Patentee after: University of Science and Technology of China

Patentee after: Kang Yu

Patentee after: Lv Wenjun

Address before: 230026 Jinzhai Road, Baohe District, Hefei, Anhui Province, No. 96

Patentee before: University of Science and Technology of China

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230110

Address after: Room 1001, Building 16, Wenqingyuan, Keda Garden, No. 130, Tongcheng South Road, Baohe District, Hefei City, Anhui Province, 230051

Patentee after: Kang Yu

Patentee after: Lv Wenjun

Address before: 230026 Jinzhai Road, Baohe District, Hefei, Anhui Province, No. 96

Patentee before: University of Science and Technology of China

Patentee before: Kang Yu

Patentee before: Lv Wenjun

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230202

Address after: Building 7, Yousi Tiancheng Industrial Park, 1800 Dabieshan Road, High-tech Zone, Hefei, Anhui Province, 230088

Patentee after: Hefei Zhongke Liheng Intelligent Technology Co.,Ltd.

Address before: Room 1001, Building 16, Wenqingyuan, Keda Garden, No. 130, Tongcheng South Road, Baohe District, Hefei City, Anhui Province, 230051

Patentee before: Kang Yu

Patentee before: Lv Wenjun

TR01 Transfer of patent right