CN112836802A - 一种半监督学习方法、岩性预测方法及存储介质 - Google Patents

一种半监督学习方法、岩性预测方法及存储介质 Download PDF

Info

Publication number
CN112836802A
CN112836802A CN202110150158.7A CN202110150158A CN112836802A CN 112836802 A CN112836802 A CN 112836802A CN 202110150158 A CN202110150158 A CN 202110150158A CN 112836802 A CN112836802 A CN 112836802A
Authority
CN
China
Prior art keywords
labeled
matrix
output
weight
hidden layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110150158.7A
Other languages
English (en)
Inventor
李泽瑞
康宇
汪萌
吕文君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Original Assignee
Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Artificial Intelligence of Hefei Comprehensive National Science Center filed Critical Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Priority to CN202110150158.7A priority Critical patent/CN112836802A/zh
Publication of CN112836802A publication Critical patent/CN112836802A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种半监督学习方法、岩性预测方法及存储介质,包括S1构建有标签数据集和无标签数据集;S2根据有标签数据集中的有标签样本数量,计算有标签样本的权重;S3设定模型参数值及最大迭代次数Titer,计算特征图拉普拉斯矩阵及模型隐藏层的输出;S4初始化模型输出层的权重为零,设定当前的迭代次数ξ=1;S5判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行S8,若是执行S6;S6利用有标签数据集中的样本数据、特征图拉普拉斯矩阵及隐藏层的输出,基于目标函数
Figure DDA0002932033120000011
最小化得到当前迭代次数下模型的输出层权重;S7判断是否满足
Figure DDA0002932033120000012
若是ξ自增1,并执行S5,否则执行S8;S8输出当前迭代次数下的模型;S9利用模型对实时采集的数据进行预测。

Description

一种半监督学习方法、岩性预测方法及存储介质
技术领域
本发明涉及计算机技术领域,特别涉及一种半监督学习方法、岩性预测方法及存储介质。
背景技术
机器学习方法试图利用任务的历史数据来改善任务的性能,为了得到好的学习性能,机器学习方法例如监督学习方法,通常要求有大量的有标记数据。如何利用大量未标记数据来辅助提高仅利用少量有标记数据得到的性能已成为机器学习方法的一个重要课题,而半监督学习方法是该方面的主流技术之一。半监督学习的思路是在拥有少量有标记数据的条件下,通过引入无标记数据来进行模型训练,从而解决仅使用有标记数据进行训练的有监督学习方法中因训练数据稀缺而导致的模型泛化能力差的问题,相比于无监督学习方法而言,半监督学习方法可改善模型准确率不理想的问题。通常来讲,无标记样本的数据规模很大,而且被引入的无标记样本数据通常与原有的有标记样本数据出自于相同的数据源而采样获得,因此无标记的样本数据可为模型训练提供丰富的具有重要意义的数据分布信息。在2000年以后,半监督学习作为一个全新的概念体系明确出现,此后涌现出了一系列具有代表性的半监督学习方法,例如图论半监督学习方法、自训练方法、流形半监督学习方法等。
随着在很多领域中人们逐渐意识到有标记数据稀缺的情况,半监督学习方法显示出其广泛的应用潜力,诸如地下岩性识别、医学图像分类等,其中地下岩性识别是地质学中的一个重要问题,更是储层预测的基础,准确的岩性识别可为油气勘探与开发提供可靠依据。测井数据具有连续、分辨率高的特点,利用测井资料进行岩性识别是测井解释的主要内容。传统的测井解释是由人工综合分析测井曲线特征,根据解释专家的专业知识和对工区地质情况的了解,得出解释结果,这种方法需要大量的人力物力,且对解释人员有较高的专业和经验要求。
近年来,机器学习的方法被应用于地下岩性识别中,可实现根据已有的测井解释资料对未解释的深度段或井位的自动解释,从而很大程度上提升解释人员的工作效率。这方面的研究中,绝大多数研究采用有监督学习方法,例如:文献《人工神经网络岩性识别在地质建模中的应用》中,作者用神经网络方法预测岩性,选择POR和GR作为输入项,将岩性分为砂泥两类;针对传统深度神经网络复杂的网络模型和学习性能严重依赖对超参数调节的问题,文献《基于改进多粒度级联森林的测井岩性识别方法研究与应用》引入余弦相似度对多粒度级联森林方法进行改进,在大庆油田实际测井数据上使用该方法,综合自然伽马(GR)、声波时差(AC)、密度(DEN)、微梯度电阻率(RMN)、深侧向电阻率(PHIND)和浅侧向电阻率(RLLS)六种测井参数,对页岩、粉砂岩和砂岩进行识别,取得了较好的识别效果;文献《基于LSTM循环神经网络的岩性识别方法》考虑到常规机器学习方法在岩性识别中无法充分利用沉积岩石在深度域序列上的潜在信息,提出利用长短期记忆神经网络(LSTM)提高岩性识别效果的方法,以苏里格气田苏东地区下古生界碳酸盐岩储层为例,选取自然伽马、光电吸收截面指数、密度、声波时差、补偿中子和电阻率6种测井参数,构建了基于LSTM的岩性预测模型,与朴素贝叶斯、KNN、决策树、SVM和HMM等传统方法相比,LSTM的岩性识别准确率提升幅度介于1.40%~12.25%。
然而,需要考虑到的是,由于岩屑或岩心资料获取的难度大、成本高,上述基于有监督学习的岩性识别方法需要大量的有标记数据参与训练才能保证模型良好的泛化性能,所以这些方法的可行性较低。最近,一些研究也开始探讨半监督学习方法在岩性识别中的应用。例如:文献《基于标签传播的岩性预测半监督学习算法研究》研究了岩性预测的半监督学习问题,提出了“聚类—人工标注—伪标注—分类”的岩性预测框架。首先,利用聚类算法选取待标注样本;然后,基于数据在特征空间和地理空间的相似性,利用图半监督学习方法实现人工标注样本到无标注样本的标注传播;最后,基于伪标注的置信度,采用加权支持向量机算法实现分类模型的设计与训练。文献《一种改进的基于密度的半监督聚类及其在测井岩性识别中的应用》中针对DBSCAN算法对聚类参数敏感、在处理非均匀密度数据集时效果不理想等问题进行研究,提出了改进方法V-DBSCAN算法。该算法的主要思想是先找出高密度的类簇,然后改变参数值继续聚类,发现较低密度的类簇。并加入半监督的学习方法,用已知点的标签信息或者约束信息实现已生成的类簇的合并,提高合并过程的速度和精度。作者将本文改进的方法运用在岩性识别上,得到了较高的准确率。文献Improvedwell log classification using semi-supervised algorithms采用标签传播算法得到无标记数据的伪标签,然后用自训练策略训练分类模型。
然而,由于地质环境的异质性导致了测井数据的复杂性,有标注数据中可能存在同一测井曲线组合值对应多种岩性标签的现象,使得基于测井的岩性识别难度大大增加。已有方法未考虑数据中存在的噪声,可能使得岩性识别方法的鲁棒性较差,特别是当存在较大噪声时,可能导致模型失效。
发明内容
本发明的目的在于克服上述背景技术中的不足,提高半监督学习方法的识别性能。
为实现以上目的,一方面,采用一种半监督学习方法,包括如下步骤:
S1、收集待处理的序列数据,并对待处理序列数据中部分数据样本请求其对应的标签,得到有标签数据集和无标签数据集;
S2、根据有标签数据集中的有标签样本数量,计算有标签样本的权重;
S3、设定神经网络模型参数的值以及最大迭代次数Titer,并根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出;
S4、初始化模型输出层的权重为零,并设定当前的迭代次数ξ=1;
S5、判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行步骤S8,若是执行步骤S6;
S6、利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000041
最小化得到当前迭代次数下模型的输出层权重;
S7、判断是否满足
Figure BDA0002932033100000042
ε为迭代停止阈值,若是则ξ自增1,并执行步骤S5,否则执行步骤S8;
S8、输出当前迭代次数下模型的输出层权重及对应的神经网络模型;
S9、利用当前迭代次数下的神经网络模型对实时采集的数据进行预测。
进一步地,所述根据有标签数据集中的有标签样本数量,计算有标签样本的权重,具体为:
Figure BDA0002932033100000043
其中,Ci表示第i个有标签样本的权重,
Figure BDA0002932033100000044
Figure BDA0002932033100000045
表示第i个有标签样本所属类别中包含的有标签样本数量,τ为控制加权程度的参数,
Figure BDA0002932033100000046
Figure BDA0002932033100000047
表示所述有标签样本集中的有标签样本数量。
进一步地,所述根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出,包括:
利用所述有标签数据集和无标签数据集中的样本数据,分别计算特征相似性矩阵A(1)和A(2)
计算第一特征图拉普拉斯矩阵L(1)=D(1)-A(1),其中D(1)为根据A(1)求得的一个对角矩阵;
计算第二特征图拉普拉斯矩阵L(2)=D(2)-A(2),其中D(2)为根据A(2)求得的一个对角矩阵;
随机生成所述神经网络模型的隐藏层神经元的权重和偏置,并根据隐藏层神经元的权重和偏置计算隐藏层的输出H。
进一步地,所述利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000051
最小化得到当前迭代次数下模型的输出层权重,包括:
计算所述有标签数据集中第i个样本数据的预测误差ei
根据预测误差ei计算N维对角矩阵Λ,第
Figure BDA0002932033100000055
个元素
Figure BDA0002932033100000052
其余元素等于0,中表示高斯核函数的中心,
Figure BDA0002932033100000056
表示所述有标签样本集中的有标签样本数量,N表示总样本数量;
利用N维对角矩阵A、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000053
最小化得到当前迭代次数下模型的输出层权重β(ξ)
其中,所述目标函数
Figure BDA0002932033100000054
为:
Figure BDA0002932033100000061
其中,||β||F表示β的Frobenius范数,βT表示β的转置,ρ、λ1、λ2分别为权衡系数,Q表示高斯核函数的数量,γq表示第q个高斯核函数的权重,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932033100000062
即表示宽度为σq的高斯核函数,Ci表示第i个有标签样本的权重,ei表示第i个样本数据的预测误差,Φ表示高斯核函数的中心,H表示隐藏层的输出,HT表示隐藏层的输出的转置,L(1)、L(2)分别为第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵。
另一方面,采用一种岩性预测方法,包括:
T1、收集不同深度点的测井样本,并对部分深度点的测井样本请求其对应的岩性标签,得到有标签数据集和无标签数据集;
T2、根据有标签数据集中的有标签样本数量,计算有标签样本的权重;
T3、设定岩性预测模型参数的值以及最大迭代次数Titer,并根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出;
T4、初始化模型输出层的权重为零,并设定当前的迭代次数ξ=1;
T5、判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行步骤T8,若是执行步骤T6;
T6、利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000071
最小化得到当前迭代次数下模型的输出层权重;
T7、判断是否满足
Figure BDA0002932033100000072
ε为迭代停止阈值,若是则ξ自增1,并执行步骤T5,否则执行步骤T8;
T8、输出当前迭代次数下模型的输出层权重及对应的岩性预测模型;
T9、利用岩性预测模型对实时采集的测井数据进行预测,识别出对应的岩性类别。
进一步地,所述收集不同深度点的测井样本,并对部分深度点的测井样本定义对应的岩性标签,得到有标签数据集和无标签数据集,包括:
收集工区的测井资料,设测井种类为NI,同一深度点的NI个测井数据组成一个测井样本
Figure BDA0002932033100000073
分析得到部分深度点对应的岩性种类,并将岩性种类作为岩性标签标记该深度点的测井样本,测井样本及其岩性标签组成有标签数据集
Figure BDA0002932033100000074
和无标签数据集
Figure BDA0002932033100000075
其中
Figure BDA0002932033100000079
表示有标签样本总数,u表示无标签样本总数,
Figure BDA00029320331000000710
表示测井样本
Figure BDA00029320331000000711
对应的岩性标签向量。
进一步地,所述根据有标签数据集中的有标签样本数量,计算有标签样本的权重,具体为:
Figure BDA0002932033100000076
其中,Ci表示第i个有标签样本的权重,
Figure BDA0002932033100000077
Figure BDA0002932033100000078
表示第i个有标签样本所属类别中包含的有标签样本数量,τ为控制加权程度的参数,
Figure BDA0002932033100000084
Figure BDA0002932033100000085
表示所述有标签样本集中的有标签样本数量。
进一步地,所述根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出,包括:
利用所述有标签数据集和无标签数据集中的样本数据,分别计算特征相似性矩阵A(1)和A(2)
计算第一特征图拉普拉斯矩阵L(1)=D(1)-A(1),其中D(1)为根据A(1)求得的一个对角矩阵;
计算第二特征图拉普拉斯矩阵L(2)=D(2)-A(2),其中D(2)为根据A(2)求得的一个对角矩阵;
随机生成所述神经网络模型的隐藏层神经元的权重和偏置,并根据隐藏层神经元的权重和偏置计算隐藏层的输出H。
进一步地,所述利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000081
最小化得到当前迭代次数下模型的输出层权重,包括:
计算所述有标签数据集中第i个样本数据的预测误差ei
根据预测误差ei计算N维对角矩阵Λ,第
Figure BDA0002932033100000086
个元素
Figure BDA0002932033100000082
其余元素等于0,Φ表示高斯核函数的中心,
Figure BDA0002932033100000087
表示所述有标签样本集中的有标签样本数量,N表示总样本数量;
利用N维对角矩阵A、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000083
最小化得到当前迭代次数下模型的输出层权重β(ξ)
其中,所述目标函数
Figure BDA0002932033100000091
为:
Figure BDA0002932033100000092
其中,||β||F表示β的Frobenius范数,βT表示β的转置,ρ、λ1、λ2分别为权衡系数,Q表示高斯核函数的数量,γq表示第q个高斯核函数的权重,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932033100000093
即表示宽度为σq的高斯核函数,Ci表示第i个有标签样本的权重,ei表示第i个样本数据的预测误差,Φ表示高斯核函数的中心,H表示隐藏层的输出,HT表示隐藏层的输出的转置,L(1)、L(2)分别为第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵。
第三方面,采用一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行可实现上述的岩性预测方法。
与现有技术相比,本发明存在以下技术效果:本发明考虑有标签样本和无标签样本数据分布的不均匀性,采用加权机制,缓解了数据不均衡现象引发的半监督学习方法识别性能下降的问题;考虑序列数据的样本连续性,引入两重流形假设,提升识别性能;另外,本发明采用相关熵准则,对于存在噪声的数据集同样可取得良好的预测性能。
附图说明
下面结合附图,对本发明的具体实施方式进行详细描述:
图1是数据集构建示意图;
图2是一种半监督学习方法的流程图;
图3是一种岩性预测方法的流程图。
具体实施方式
为了更进一步说明本发明的特征,请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用,并非用来对本发明的保护范围加以限制。
如图2所示,本实施例公开了一种半监督学习方法,包括如下步骤S1至S8:
S1、收集待处理的序列数据,并对待处理序列数据中部分数据样本请求对应的标签,得到有标签数据集和无标签数据集;
需要说明的是,所述待处理的序列数据可为测井数据或振动数据等,用于作为分类模型的输入数据。以图1作为说明,如果序列数据是测井数据,则序列类型可以为SP、GR、CNL、R25等;如果序列数据是振动数据,则序列类型可以为X/γ/Z轴的振动信号。
S2、根据有标签数据集中的有标签样本数量,计算有标签样本的权重;
S3、设定神经网络模型参数的值以及最大迭代次数Titer,并根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出;
S4、初始化模型输出层的权重为零,并设定当前的迭代次数ξ=1;
S5、判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行步骤S8,若是执行步骤S6;
S6、利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000101
最小化得到当前迭代次数下模型的输出层权重;
S7、判断是否满足
Figure BDA0002932033100000102
ε为迭代停止阈值,若是则ξ自增1,并执行步骤S5,否则执行步骤S8;
S8、输出当前迭代次数下模型的输出层权重及对应的神经网络模型;
S9、利用当前迭代次数下的神经网络模型对实时采集的数据进行预测。
需要说明的是,本实施例中在传统的半监督学习方法中引入加权机制,可缓解数据不均衡现象引发的识别性能下降;采用两重流形假设,挖掘序列数据的样本连续性以提升半监督学习性能;采用相关熵机制,以应对数据集存在噪声的情况。
作为进一步优选的技术方案,上述步骤S2中有标签样本的权重的计算公式具体为:
Figure BDA0002932033100000111
其中,Ci表示第i个有标签样本的权重,
Figure BDA0002932033100000112
Figure BDA0002932033100000113
表示第i个有标签样本所属类别中包含的有标签样本数量,τ为控制加权程度的参数,
Figure BDA0002932033100000115
Figure BDA0002932033100000116
表示所述有标签样本集中的有标签样本数量。
作为进一步优选的技术方案,上述步骤S3中神经网络模型参数包括参数τ>0、λ>0、0<η<1、p>0、α1>0、α2>0、k1≥1、k2≥3、Nh>1、Q>1、σq>0(q=1,2,…,Q)、
Figure BDA0002932033100000114
0<γq<1(q=1,2,…,Q)、ε>0、Titer>2。
作为进一步优选的技术方案,上述步骤S3中,根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出,具体包括S31至S34:
S31、利用所述有标签数据集和无标签数据集中的样本数据,分别计算第一和第二特征相似性矩阵A(1)和A(2)
其中,第一特征相似性矩阵A(1)的元素
Figure BDA0002932033100000121
为:
Figure BDA0002932033100000122
其中m,n=1,2,…,
Figure BDA00029320331000001213
α1>0表示计算第一特征相似性的高斯核宽度,
Figure BDA0002932033100000123
表示测井样本xn的k1个最近邻集合;
第二特征相似性矩阵A(2)的元素
Figure BDA0002932033100000124
为:
Figure BDA0002932033100000125
其中,α2>0表示计算第二特征相似性的高斯核宽度,
Figure BDA0002932033100000126
Figure BDA0002932033100000127
k2为大于等于3的奇数。
S32、计算第一特征图拉普拉斯矩阵L(1)=D(1)-A(1),其中D(1)为一个对角矩阵,其第m个对角元素值
Figure BDA0002932033100000128
S33、计算第二特征图拉普拉斯矩阵L(2)=D(2)-A(2),其中D(2)为一个对角矩阵,D(2)的第m个对角元素值
Figure BDA0002932033100000129
S34、随机生成所述神经网络模型的隐藏层神经元的权重和偏置,并根据隐藏层神经元的权重和偏置计算隐藏层的输出H。
需要说明的是,随机生成神经网络模型的隐藏层神经元的权重
Figure BDA00029320331000001210
和偏置bp,其中p=1,2,…,Nh,Nh表示隐藏神经元数量,则对于第
Figure BDA00029320331000001214
个测井样本,隐藏层的输出为hm=sigmoid(wTxm+b),其中
Figure BDA00029320331000001211
对于
Figure BDA00029320331000001215
个测井样本,隐藏层的输出为
Figure BDA00029320331000001212
作为进一步优选的技术方案,上述步骤S6:利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000131
最小化得到当前迭代次数下模型的输出层权重,具体包括如下细分步骤S61至S63:
S61、计算所述有标签数据集中第i个样本数据的预测误差ei
其中,第i个有标签样本的误差
Figure BDA0002932033100000132
S62、根据预测误差ei计算N维对角矩阵Λ,第
Figure BDA00029320331000001310
个元素
Figure BDA0002932033100000133
Φ表示高斯核函数的中心,
Figure BDA00029320331000001311
表示所述有标签样本集中的有标签样本数量,N表示总样本数量;
其中,计算
Figure BDA00029320331000001312
维对角矩阵Λ,其中第
Figure BDA00029320331000001313
个元素
Figure BDA0002932033100000134
其余元素等于0;其中Q表示此处使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932033100000135
即表示宽度为σq的高斯核函数,Φ表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932033100000136
S63、利用N维对角矩阵Λ、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000137
最小化得到当前迭代次数下模型的输出层权重β(ξ)
其中,所述目标函数
Figure BDA0002932033100000138
为:
Figure BDA0002932033100000139
其中,||β||F表示β的Frobenius范数,βT表示β的转置,ρ、λ1、λ2分别为权衡系数,λ1=λη,λ2=λ(1-η),Q表示高斯核函数的数量,γq表示第q个高斯核函数的权重,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932033100000141
即表示宽度为σq的高斯核函数,Ci表示第i个有标签样本的权重,ei表示第i个样本数据的预测误差,Φ表示高斯核函数的中心,H表示隐藏层的输出,HT表示隐藏层的输出的转置,L(1)、L(2)分别为第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵,η为取值在0-1之间的常数,决定两个特征相似性在目标函数中的贡献。
需要说明的是,令
Figure BDA0002932033100000142
则有:
Figure BDA0002932033100000143
则:
Figure BDA0002932033100000144
其中,类别权重矩阵C为
Figure BDA0002932033100000147
维对角矩阵,前
Figure BDA0002932033100000148
个对角元素分别为
Figure BDA00029320331000001410
后u个对角元素均为0;输出偏移矩阵
Figure BDA0002932033100000145
的第
Figure BDA0002932033100000149
Figure BDA0002932033100000146
后u行均为0。
作为进一步优选的技术方案,上述步骤S8中输出的当前迭代次数下的模型输出层权重β(ξ),并得到参数为w、b、β(ξ)的神经网络模型,以用于对数据进行预测。
如图3所示,本实施例公开了一种岩性预测方法,采用上述实施例中公开的半监督学习方法对岩性进行预测,具体步骤包括T1至T9:
T1、收集不同深度点的测井样本,并对部分深度点的测井样本请求其对应的岩性标签,得到有标签数据集和无标签数据集;
需要说明的是,岩性标签可根据其岩心或岩屑分析数据得到。
T2、根据有标签数据集中的有标签样本数量,计算有标签样本的权重;
T3、设定岩性预测模型参数的值以及最大迭代次数Titer,并根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出;
T4、初始化模型输出层的权重为零,并设定当前的迭代次数ξ=1;
T5、判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行步骤T8,若是执行步骤T6;
T6、利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000151
最小化得到当前迭代次数下模型的输出层权重;
T7、判断是否满足
Figure BDA0002932033100000152
ε为迭代停止阈值,若是则ξ自增1,并执行步骤T5,否则执行步骤T8;
T8、输出当前迭代次数下模型的输出层权重及对应的岩性预测模型;
T9、利用岩性预测模型对实时采集的测井数据进行预测,识别出对应的岩性类别。
作为进一步优选的技术方案,上述步骤T1:收集不同深度点的测井样本,并对部分深度点的测井样本定义对应的岩性标签,得到有标签数据集和无标签数据集,包括:
收集工区的测井资料,设测井种类为NI,同一深度点的NI个测井数据组成一个测井样本
Figure BDA0002932033100000153
同时由岩心或岩屑样本分析得到某些深度点的对应岩性种类,并将其作为岩性标签标记该深度点的测井样本,测井样本及其岩性标签组成有标签数据集
Figure BDA0002932033100000161
其中
Figure BDA0002932033100000168
表示有标签样本总数,
Figure BDA0002932033100000167
表示测井样本
Figure BDA0002932033100000169
对应的岩性标签向量,记岩性种类的总数为NO,则yi为NO维独热向量,第j(j=1,2,…,NO)个元素等于1则表示测井样本xi的岩性标签为第j种岩性;测井资料中没有对应岩性标签的测井样本组成无标签数据集
Figure BDA0002932033100000162
其中u表示无标签样本总数。
需要说明的是,所述测井种类指的是测井数据的类别,如一般包括自然电位、自然伽马、补偿声波、补偿中子;所述岩性类别包括砂岩、泥岩、石灰岩、页岩。
作为进一步优选的技术方案,上述步骤T2中有标签样本的权重的计算公式具体为:
Figure BDA0002932033100000163
其中,Ci表示第i个有标签样本的权重,
Figure BDA0002932033100000164
Figure BDA0002932033100000165
表示第i个有标签样本所属类别中包含的有标签样本数量,τ为控制加权程度的参数,
Figure BDA00029320331000001610
Figure BDA00029320331000001611
表示所述有标签样本集中的有标签样本数量。
作为进一步优选的技术方案,上述步骤T3中神经网络模型参数包括参数τ、λ、η、ρ、α1、α2、k1、k2、Nh、Q、σg(q=1,2,…,Q)、Φ、γq(q=1,2,…,Q)、ε。
具体地,一组可用参数如下:τ=2、λ=1、η=0.8、p=30、α1=1、α2=1、k1=5、k2=7、Nh=100、Q=2、σ1=1、σ2=1、
Figure BDA0002932033100000166
γ1=0.5、γ2=0.5、ε=0.001、Titer=200.
作为进一步优选的技术方案,上述步骤T3中,根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出,具体包括T31至T34:
T31、利用所述有标签数据集和无标签数据集中的样本数据,分别计算特征相似性矩阵A(1)和A(2)
其中,第一特征相似性矩阵A(1)的元素
Figure BDA0002932033100000171
为:
Figure BDA0002932033100000172
其中m,n=1,2,…,
Figure BDA00029320331000001711
α1>0表示计算第一特征相似性的高斯核宽度,
Figure BDA0002932033100000173
表示测井样本xn的k1个最近邻集合;
第二特征相似性矩阵A(2)的元素
Figure BDA0002932033100000174
为:
Figure BDA0002932033100000175
其中,α2>0表示计算第二特征相似性的高斯核宽度,
Figure BDA0002932033100000176
Figure BDA0002932033100000177
k2为大于等于3的奇数。
T32、计算第一特征图拉普拉斯矩阵L(1)=D(1)-A(1),其中D(1)为一个对角矩阵;
其中,D(1)为一个对角矩阵,其第m个对角元素值
Figure BDA0002932033100000178
T33、计算第二特征图拉普拉斯矩阵L(2)=D(2)-A(2),其中D(2)为一个对角矩阵,D(2)的第m个对角元素值
Figure BDA0002932033100000179
T34、随机生成所述神经网络模型的隐藏层神经元的权重和偏置,并根据隐藏层神经元的权重和偏置计算隐藏层的输出H。
需要说明的是,随机生成神经网络模型的隐藏层神经元的权重
Figure BDA00029320331000001710
和偏置bp,其中p=1,2,…,Nh,Nh表示隐藏神经元数量,Nh<(l+u),则对于第
Figure BDA00029320331000001812
个测井样本,隐藏层的输出为hm=sigmoid(wTxm+b),其中
Figure BDA0002932033100000181
Figure BDA0002932033100000182
对于
Figure BDA00029320331000001813
个测井样本,隐藏层的输出为
Figure BDA0002932033100000183
Figure BDA0002932033100000184
所述隐藏层权重和偏置随机生成的方法可以是从0-1均匀分布中采样。
作为进一步优选的技术方案,上述步骤T6:利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033100000185
最小化得到当前迭代次数下模型的输出层权重,具体包括如下细分步骤T61至T63:
T61、计算所述有标签数据集中第i个样本数据的预测误差ei
其中,第i个有标签样本的误差
Figure BDA0002932033100000186
T62、根据预测误差ei计算N维对角矩阵Λ,第
Figure BDA00029320331000001814
个元素
Figure BDA0002932033100000187
Φ表示高斯核函数的中心,
Figure BDA00029320331000001815
表示所述有标签样本集中的有标签样本数量,N表示总样本数量;
其中,计算
Figure BDA00029320331000001817
维对角矩阵Λ,其中第
Figure BDA00029320331000001816
个元素
Figure BDA0002932033100000188
其余元素等于0;其中Q表示此处使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932033100000189
即表示宽度为σq的高斯核函数,Φ表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA00029320331000001810
T63、利用N维对角矩阵A、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA00029320331000001811
最小化得到当前迭代次数下模型的输出层权重β(ξ)
其中,所述目标函数
Figure BDA0002932033100000191
为:
Figure BDA0002932033100000192
其中,||β||F表示β的Frobenius范数,βT表示β的转置,ρ、λ1、λ2分别为权衡系数,λ1=λη,λ2=λ(1-q),Q表示高斯核函数的数量,γq表示第q个高斯核函数的权重,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932033100000193
即表示宽度为σq的高斯核函数,Ci表示第i个有标签样本的权重,ei表示第i个样本数据的预测误差,Φ表示高斯核函数的中心,H表示隐藏层的输出,HT表示隐藏层的输出的转置,L(1)、L(2)分别为第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵,η为取值在0-1之间的常数,决定两个特征相似性在目标函数中的贡献。
需要说明的是,令
Figure BDA0002932033100000194
则有:
Figure BDA0002932033100000195
则:
Figure BDA0002932033100000196
其中,
Figure BDA0002932033100000197
为Nh维单位矩阵,类别权重矩阵C为
Figure BDA00029320331000001910
维对角矩阵,前
Figure BDA00029320331000001912
个对角元素分别为
Figure BDA00029320331000001911
后u个对角元素均为0;输出偏移矩阵
Figure BDA0002932033100000198
的第
Figure BDA00029320331000001913
Figure BDA0002932033100000199
后u行均为0。
作为进一步优选的技术方案,上述步骤T8中输出的当前迭代次数下的模型输出层权重β(ξ),并得到参数为w、b、β(ξ)的岩性预测模型,以用于预测出实时采集的测井数据所对应的岩性类别。
本实施例提供的一种岩性预测方法,具有如下有益效果:
考虑地下环境的复杂性以及岩石分布的不均匀性,引入加权机制,可缓解数据不均衡现象引发的识别性能下降;
考虑地下岩石分布的连续性,引入两重流形假设,提升识别性能;
采用相关熵准则,可缓解数据噪声对识别性能的影响。
另外,本实施例还公开了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行可实现如上所述的岩性预测方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种半监督学习方法,其特征在于,包括:
S1、收集待处理的序列数据,并对待处理序列数据中部分数据样本请求其对应的标签,得到有标签数据集和无标签数据集;
S2、根据有标签数据集中的有标签样本数量,计算有标签样本的权重;
S3、设定神经网络模型参数的值以及最大迭代次数Titer,并根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出;
S4、初始化模型输出层的权重为零,并设定当前的迭代次数ξ=1;
S5、判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行步骤S8,若是执行步骤S6;
S6、利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure FDA0002932033090000011
最小化得到当前迭代次数下模型的输出层权重;
S7、判断是否满足
Figure FDA0002932033090000012
ε为迭代停止阈值,若是则ξ自增1,并执行步骤S5,否则执行步骤S8;
S8、输出当前迭代次数下模型的输出层权重及对应的神经网络模型;
S9、利用当前迭代次数下的神经网络模型对实时采集的数据进行预测。
2.如权利要求1所述的半监督学习方法,其特征在于,所述根据有标签数据集中的有标签样本数量,计算有标签样本的权重,具体为:
Figure FDA0002932033090000013
其中,Ci表示第i个有标签样本的权重,
Figure FDA0002932033090000021
Figure FDA0002932033090000022
表示第i个有标签样本所属类别中包含的有标签样本数量,τ为控制加权程度的参数,i=1,2,…,l,l表示所述有标签样本集中的有标签样本数量。
3.如权利要求1所述的半监督学习方法,其特征在于,所述根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出,包括:
利用所述有标签数据集和无标签数据集中的样本数据,分别计算特征相似性矩阵A(1)和A(2)
计算第一特征图拉普拉斯矩阵L(1)=D(1)-A(1),其中D(1)为根据A(1)求得的一个对角矩阵;
计算第二特征图拉普拉斯矩阵L(2)=D(2)-A(2),其中D(2)为根据A(2)求得的一个对角矩阵;
随机生成所述神经网络模型的隐藏层神经元的权重和偏置,并根据隐藏层神经元的权重和偏置计算隐藏层的输出H。
4.如权利要求3所述的半监督学习方法,其特征在于,所述利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure FDA0002932033090000023
最小化得到当前迭代次数下模型的输出层权重,包括:
计算所述有标签数据集中第i个样本数据的预测误差ei
根据预测误差ei计算N维对角矩阵Λ,第i(i=1,2,…,l)个元素
Figure FDA0002932033090000024
Φ表示高斯核函数的中心,l表示所述有标签样本集中的有标签样本数量,N表示总样本数量;
利用N维对角矩阵A、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure FDA0002932033090000031
表小化得到当前迭代次数下模型的输出层权重β(ξ)
其中,所述目标函数
Figure FDA0002932033090000032
为:
Figure FDA0002932033090000033
其中,||β||F表示β的Frobenius范数,
Figure FDA0002932033090000035
表示β的转置,ρ、λ1、λ2分别为权衡系数,Q表示高斯核函数的数量,γq表示第q个高斯核函数的权重,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure FDA0002932033090000034
即表示宽度为σq的高斯核函数,Ci表示第i个有标签样本的权重,ei表示第i个样本数据的预测误差,Φ表示高斯核函数的中心,H表示隐藏层的输出,
Figure FDA0002932033090000036
表示隐藏层的输出的转置,L(1)、L(2)分别为第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵。
5.一种岩性预测方法,其特征在于,包括:
T1、收集不同深度点的测井样本,并对部分深度点的测井样本请求其对应的岩性标签,得到有标签数据集和无标签数据集;
T2、根据有标签数据集中的有标签样本数量,计算有标签样本的权重;
T3、设定岩性预测模型参数的值以及最大迭代次数Titer,并根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出;
T 4、初始化模型输出层的权重为零,并设定当前的迭代次数ξ=1;
T 5、判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行步骤T 8,若是执行步骤T 6;
T 6、利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure FDA0002932033090000041
最小化得到当前迭代次数下模型的输出层权重;
T 7、判断是否满足
Figure FDA0002932033090000042
ε为迭代停止阈值,若是则ξ自增1,并执行步骤T 5,否则执行步骤T 8;
T 8、输出当前迭代次数下模型的输出层权重及对应的岩性预测模型;
T 9、利用岩性预测模型对实时采集的测井数据进行预测,识别出对应的岩性类别。
6.如权利要求5所述的岩性预测方法,其特征在于,所述收集不同深度点的测井样本,并对部分深度点的测井样本请求对应的岩性标签,得到有标签数据集和无标签数据集,包括:
收集工区的测井资料,设测井种类为NI,同一深度点的NI个测井数据组成一个测井样本
Figure FDA0002932033090000043
分析得到部分深度点对应的岩性种类,并将岩性种类作为岩性标签标记该深度点的测井样本,测井样本及其岩性标签组成有标签数据集
Figure FDA0002932033090000044
和无标签数据集
Figure FDA0002932033090000045
其中l表示有标签样本总数,u表示无标签样本总数,yi(i=1,2,…,l)表示测井样本xi(i=1,2,…,l)对应的岩性标签向量。
7.如权利要求5所述的岩性预测方法,其特征在于,所述根据有标签数据集中的有标签样本数量,计算有标签样本的权重,具体为:
Figure FDA0002932033090000051
其中,Ci表示第i个有标签样本的权重,
Figure FDA0002932033090000052
Figure FDA0002932033090000053
表示第i个有标签样本所属类别中包含的有标签样本数量,τ为控制加权程度的参数,i=1,2,…,l,l表示所述有标签样本集中的有标签样本数量。
8.如权利要求5所述的岩性预测方法,其特征在于,所述根据有标签数据集和无标签数据集中的样本数据,计算第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及计算模型隐藏层的输出,包括:
利用所述有标签数据集和无标签数据集中的样本数据,分别计算特征相似性矩阵A(1)和A(2)
计算第一特征图拉普拉斯矩阵L(1)=D(1)-A(1),其中D(1)为根据A(1)求得的一个对角矩阵;
计算第二特征图拉普拉斯矩阵L(2)=D(2)-A(2),其中D(2)为根据A(2)求得的一个对角矩阵;
随机生成所述神经网络模型的隐藏层神经元的权重和偏置,并根据隐藏层神经元的权重和偏置计算隐藏层的输出H。
9.如权利要求8所述的岩性预测方法,其特征在于,所述利用有标签数据集中的样本数据、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure FDA0002932033090000054
最小化得到当前迭代次数下模型的输出层权重,包括:
计算所述有标签数据集中第i个样本数据的预测误差ei
根据预测误差ei计算N维对角矩阵Λ,第i(i=1,2,…,l)个元素
Figure FDA0002932033090000061
其余元素等于0,中表示高斯核函数的中心,l表示所述有标签样本集中的有标签样本数量,N表示总样本数量;
利用N维对角矩阵A、第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure FDA0002932033090000062
最小化得到当前迭代次数下模型的输出层权重β(ξ)
其中,所述目标函数
Figure FDA0002932033090000063
为:
Figure FDA0002932033090000064
其中,||β||F表示β的Frobenius范数,
Figure FDA0002932033090000066
表示β的转置,ρ、λ1、λ2分别为权衡系数,Q表示高斯核函数的数量,γq表示第q个高斯核函数的权重,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure FDA0002932033090000065
即表示宽度为σq的高斯核函数,Ci表示第i个有标签样本的权重,ei表示第i个样本数据的预测误差,Φ表示高斯核函数的中心,H表示隐藏层的输出,HT表示隐藏层的输出的转置,L(1)、L(2)分别为第一特征图拉普拉斯矩阵、第二特征图拉普拉斯矩阵。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行可实现如权利要求5-9中任意一项所述的岩性预测方法。
CN202110150158.7A 2021-02-03 2021-02-03 一种半监督学习方法、岩性预测方法及存储介质 Pending CN112836802A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110150158.7A CN112836802A (zh) 2021-02-03 2021-02-03 一种半监督学习方法、岩性预测方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110150158.7A CN112836802A (zh) 2021-02-03 2021-02-03 一种半监督学习方法、岩性预测方法及存储介质

Publications (1)

Publication Number Publication Date
CN112836802A true CN112836802A (zh) 2021-05-25

Family

ID=75931868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110150158.7A Pending CN112836802A (zh) 2021-02-03 2021-02-03 一种半监督学习方法、岩性预测方法及存储介质

Country Status (1)

Country Link
CN (1) CN112836802A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537458A (zh) * 2021-06-21 2021-10-22 中国科学技术大学 一种有理式函数神经网络构建方法、系统及可读存储介质
CN113780346A (zh) * 2021-08-06 2021-12-10 中国科学技术大学 一种先验约束分类器调整方法、系统及可读存储介质
CN113837394A (zh) * 2021-09-03 2021-12-24 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 多特征视图数据标签预测方法、系统与可读存储介质
CN114896479A (zh) * 2022-06-09 2022-08-12 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种在线学习方法、系统及计算机可读存储介质
CN117574258A (zh) * 2024-01-15 2024-02-20 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于文本噪声标签和协同训练策略的文本分类方法
WO2024087827A1 (zh) * 2022-10-26 2024-05-02 中国石油天然气股份有限公司 储层物性参数预测方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177267A (zh) * 2013-04-22 2013-06-26 山东师范大学 一种时频联合的支持向量机半监督学习方法
US20190122120A1 (en) * 2017-10-20 2019-04-25 Dalei Wu Self-training method and system for semi-supervised learning with generative adversarial networks
CN109766583A (zh) * 2018-12-14 2019-05-17 南京航空航天大学 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
CN110298392A (zh) * 2019-06-13 2019-10-01 北京工业大学 一种标签约束自权重多超图学习的半监督分类方法
CN110717390A (zh) * 2019-09-05 2020-01-21 杭州电子科技大学 基于图半监督宽度学习的脑电信号分类方法
CN111723666A (zh) * 2020-05-20 2020-09-29 同济大学 一种基于半监督学习的信号识别方法和装置
WO2020220439A1 (zh) * 2019-04-29 2020-11-05 东北大学 基于深度神经网络的高速公路交通流量状态识别方法
AU2020103335A4 (en) * 2020-11-09 2021-01-21 Southwest University Distributed semisupervised extreme learning machine algorithms for horizontally and vertically partitioned data

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177267A (zh) * 2013-04-22 2013-06-26 山东师范大学 一种时频联合的支持向量机半监督学习方法
US20190122120A1 (en) * 2017-10-20 2019-04-25 Dalei Wu Self-training method and system for semi-supervised learning with generative adversarial networks
CN109766583A (zh) * 2018-12-14 2019-05-17 南京航空航天大学 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
WO2020220439A1 (zh) * 2019-04-29 2020-11-05 东北大学 基于深度神经网络的高速公路交通流量状态识别方法
CN110298392A (zh) * 2019-06-13 2019-10-01 北京工业大学 一种标签约束自权重多超图学习的半监督分类方法
CN110717390A (zh) * 2019-09-05 2020-01-21 杭州电子科技大学 基于图半监督宽度学习的脑电信号分类方法
CN111723666A (zh) * 2020-05-20 2020-09-29 同济大学 一种基于半监督学习的信号识别方法和装置
AU2020103335A4 (en) * 2020-11-09 2021-01-21 Southwest University Distributed semisupervised extreme learning machine algorithms for horizontally and vertically partitioned data

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
JIANFENG YE: "Affinity Learning Via Self-Supervised Diffusion for Spectral Clustering", 《 IEEE ACCESS》 *
LI, ZR (LI, ZERUI): "Semi-supervised learning for lithology identification using Laplacian support vector machine", 《JOURNAL OF PETROLEUM SCIENCE AND ENGINEERING》 *
朱顺涛;卢先领;于丹石;: "一种基于流形正则化的半监督指纹定位算法", 测绘通报, no. 02 *
柴钊: "基于协同训练和主动学习的半监督图像分类研究", 《CNKI》 *
梅松青;: "基于自适应图的半监督学习方法", 计算机系统应用, no. 02 *
毕丽飞: "基于标签传播的岩性预测半监督学习算法研究", 《地球物理学进展》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537458A (zh) * 2021-06-21 2021-10-22 中国科学技术大学 一种有理式函数神经网络构建方法、系统及可读存储介质
CN113537458B (zh) * 2021-06-21 2022-12-30 中国科学技术大学 一种有理式函数神经网络构建方法、系统及可读存储介质
CN113780346A (zh) * 2021-08-06 2021-12-10 中国科学技术大学 一种先验约束分类器调整方法、系统及可读存储介质
CN113780346B (zh) * 2021-08-06 2023-06-16 中国科学技术大学 一种先验约束分类器调整方法、系统及可读存储介质
CN113837394A (zh) * 2021-09-03 2021-12-24 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 多特征视图数据标签预测方法、系统与可读存储介质
CN114896479A (zh) * 2022-06-09 2022-08-12 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种在线学习方法、系统及计算机可读存储介质
CN114896479B (zh) * 2022-06-09 2024-05-07 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种在线学习方法、系统及计算机可读存储介质
WO2024087827A1 (zh) * 2022-10-26 2024-05-02 中国石油天然气股份有限公司 储层物性参数预测方法及装置
CN117574258A (zh) * 2024-01-15 2024-02-20 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于文本噪声标签和协同训练策略的文本分类方法
CN117574258B (zh) * 2024-01-15 2024-04-26 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于文本噪声标签和协同训练策略的文本分类方法

Similar Documents

Publication Publication Date Title
CN112836802A (zh) 一种半监督学习方法、岩性预测方法及存储介质
Xie et al. Evaluation of machine learning methods for formation lithology identification: A comparison of tuning processes and model performances
Kardani et al. Predicting permeability of tight carbonates using a hybrid machine learning approach of modified equilibrium optimizer and extreme learning machine
CN112989708B (zh) 一种基于lstm神经网络的测井岩性识别方法及系统
Jiang et al. Lithology identification from well-log curves via neural networks with additional geologic constraint
Matinkia et al. Prediction of permeability from well logs using a new hybrid machine learning algorithm
Min et al. Research and application of logging lithology identification for igneous reservoirs based on deep learning
Ojha et al. Sediment classification using neural networks: an example from the site-U1344A of IODP Expedition 323 in the Bering Sea
CN114723095A (zh) 缺失测井曲线预测方法及装置
Farzi et al. Estimation of organic facies using ensemble methods in comparison with conventional intelligent approaches: A case study of the South Pars Gas Field, Persian Gulf, Iran
Yang et al. Oil logging reservoir recognition based on TCN and SA-BiLSTM deep learning method
CN114638255A (zh) 一种结合深度学习的致密砂岩裂缝测井综合识别方法
CN117236390A (zh) 一种基于交叉注意力扩散模型的储层预测方法
Wang et al. Missing well logs prediction using deep learning integrated neural network with the self-attention mechanism
CN113780346B (zh) 一种先验约束分类器调整方法、系统及可读存储介质
Maiti et al. A hybrid Monte Carlo method based artificial neural networks approach for rock boundaries identification: A case study from the KTB bore hole
Goliatt et al. Performance of evolutionary optimized machine learning for modeling total organic carbon in core samples of shale gas fields
Wang et al. Total organic carbon content prediction of source rocks with conventional well log data based on regression committee machine
Shi et al. Brittleness index prediction from conventional well logs in unconventional reservoirs using artificial intelligence
Li et al. Lithology classification based on set-valued identification method
Majdi et al. Identification of well logs with significant impact on prediction of oil and gas reservoirs permeability using statistical analysis of RSE values
CN115964667A (zh) 基于深度学习和重采样的河流-湖泊岩相测井识别方法
Yang et al. S-wave velocity prediction for complex reservoirs using a deep learning method
Bhattacharya Unsupervised time series clustering, class-based ensemble machine learning, and petrophysical modeling for predicting shear sonic wave slowness in heterogeneous rocks
Wang et al. Auto recognition of carbonate microfacies based on an improved back propagation neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination