CN116167288B - 一种ua2ft半监督迁移学习建模方法、介质及设备 - Google Patents

一种ua2ft半监督迁移学习建模方法、介质及设备 Download PDF

Info

Publication number
CN116167288B
CN116167288B CN202310421764.7A CN202310421764A CN116167288B CN 116167288 B CN116167288 B CN 116167288B CN 202310421764 A CN202310421764 A CN 202310421764A CN 116167288 B CN116167288 B CN 116167288B
Authority
CN
China
Prior art keywords
sample
matrix
target domain
domain
seismic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310421764.7A
Other languages
English (en)
Other versions
CN116167288A (zh
Inventor
吕文君
张文婷
康宇
李鲲
李泽瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202310421764.7A priority Critical patent/CN116167288B/zh
Publication of CN116167288A publication Critical patent/CN116167288A/zh
Application granted granted Critical
Publication of CN116167288B publication Critical patent/CN116167288B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Geometry (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明涉及地质建模迁移学习技术领域,公开了一种UA2FT半监督迁移学习建模方法、介质及设备,建模方法包括:获取源域和目标域数据;样本映射高维空间;单向对齐;精细调整;得到预测模型并得到预测结果;本发明有效解决了建模中的数据分布偏差问题,实现了从成熟区块的丰富数据集向新区块的知识迁移,有效提升了建模精度;充分利用了已有的数据标签和数据内蕴结构,减少了建模中对数据的依赖性;保持了特征的地球物理意义,建模过程具有一定的可解释性。

Description

一种UA2FT半监督迁移学习建模方法、介质及设备
技术领域
本发明涉及地质建模迁移学习技术领域,具体涉及一种UA2FT半监督迁移学习建模方法、介质及设备。
背景技术
地质建模是在将地质、测井、地球物理资料和各种解释结果或者概念模型进行综合分析的基础上,利用计算机图形技术,生成的三维定量模型。因此地质建模是一个涉及地质学、数据和信息分析、计算科学的交叉性的综合学科。以对测井解释进行地质建模为例,在固体地面上钻孔几乎是直接探索地下表面的唯一方法,因为我们可以观察钻孔岩屑和岩芯。未损坏的岩心为地层的形成提供了丰富的信息,但由于取心成本高、时间长,无法获得完整的、连续的沿井岩心序列。与岩心直接观测井眼地质相比,测井可连续、高分辨率地记录井眼物探参数(如声、电等),间接反映地层性质。因此,将稀缺而直接的岩心与间接而持续的地球物理测井相结合,建立完整而精细的井眼地质模型,是地质工作者的重要任务。
基于机器学习的测井解释已经得到了广泛的研究,但大多数研究都是在独立同分布(iid)假设下进行的,即训练数据集和测试数据集之间的概率分布不存在差异。一般来说,训练数据集可以由单口井组成,也可以由多口井的数据合并而成。因此,我们总是可以假设获得一个具有丰富甚至完整标签的训练数据集。但是,由于不同的井在钻井条件、测井设备等方面存在差异,因此有标记训练数据集与未标记(或几乎没有标记)测试数据集之间存在不可忽略的概率分布差异。因此,在实践中,基于机器学习的建模应该在非iid(独立同分布)问题下进行研究。
发明内容
为解决上述技术问题,本发明提供一种UA2FT半监督迁移学习建模方法、介质及设备。
为解决上述技术问题,本发明采用如下技术方案:
一种UA2FT半监督迁移学习建模方法,通过源域s的有标签样本和源域任务的预测模型
Figure SMS_1
,获取目标域t任务的预测模型/>
Figure SMS_2
;源域的有标签样本数量/>
Figure SMS_3
大于目标域的有标签样本数量/>
Figure SMS_4
;包括以下步骤:
步骤一、获取源域和目标域数据:源域数据
Figure SMS_16
中,/>
Figure SMS_7
分别表示源域第i个样本和对应的标签;目标域数据/>
Figure SMS_12
、/>
Figure SMS_8
中,/>
Figure SMS_11
表示目标域样本总数,/>
Figure SMS_15
分别表示目标域第i个样本和对应的标签;/>
Figure SMS_19
和/>
Figure SMS_13
统一记为样本/>
Figure SMS_17
,/>
Figure SMS_5
和/>
Figure SMS_9
统一记为标签/>
Figure SMS_14
;源域样本矩阵/>
Figure SMS_18
,目标域样本矩阵/>
Figure SMS_20
;源域标签矩阵/>
Figure SMS_21
;/>
Figure SMS_6
为样本/>
Figure SMS_10
的维数,c为预测目标类别总数;
步骤二、样本映射高维空间:采用样本映射函数
Figure SMS_30
对源域样本矩阵/>
Figure SMS_24
和目标域样本矩阵/>
Figure SMS_26
进行变换,分别得到映射样本矩阵/>
Figure SMS_33
和/>
Figure SMS_37
;其中/>
Figure SMS_34
为再生核希尔伯特空间,/>
Figure SMS_38
为特征空间,/>
Figure SMS_31
,/>
Figure SMS_35
的元素
Figure SMS_25
,/>
Figure SMS_27
,/>
Figure SMS_28
为映射样本维度,/>
Figure SMS_32
为从高斯分布
Figure SMS_36
采样的输入权重向量,/>
Figure SMS_39
为从均匀分布/>
Figure SMS_22
采样的输入偏置标量,/>
Figure SMS_29
为输入权重向量采样方差系数,/>
Figure SMS_23
表示实数域;
步骤三、单向对齐阶段:通过
Figure SMS_41
对映射样本矩阵/>
Figure SMS_44
和/>
Figure SMS_47
进行变换,得到调整后的源域样本矩阵/>
Figure SMS_40
和目标域样本矩阵/>
Figure SMS_43
;其中/>
Figure SMS_46
为输出权重矩阵;通过优化函数/>
Figure SMS_48
使调整后的源域样本矩阵接近原始的源域样本,即
Figure SMS_42
,并使调整后的目标域样本矩阵/>
Figure SMS_45
向源域概率分布对齐;
步骤四、精细调整阶段:通过优化函数
Figure SMS_49
对经过单向对齐阶段后的源域样本矩阵/>
Figure SMS_50
和目标域样本矩阵/>
Figure SMS_51
进行精细调整;
步骤五、得到预测模型并得到预测结果:经过单向对齐阶段和精细调整阶段训练后得到输出权重矩阵
Figure SMS_52
和/>
Figure SMS_53
,获得目标域任务的预测模型
Figure SMS_54
,/>
Figure SMS_55
为极限学习机随机映射;将通过预测模型/>
Figure SMS_56
预测目标域的无标签样本,得到预测结果,实现建模。
进一步地,样本x是由测井数据组成的测井样本或者是由地震属性数据组成的地震样本,步骤五中通过预测模型得到目标域多个无标签测井样本或地震样本的预测结果,实现井或者区块的地质建模。
进一步地,如果目标域任务为测井解释任务,则样本x是由测井数据组成的测井样本,标签y为测井标签,具体地:
测井样本x为一口井在同一深度上的多个测井值组成的向量,测井标签y为需要解释的地质信息,d为测井总数,源域数据的测井标签数量大于目标域数据中的测井标签数量;
步骤二中,映射样本维度
Figure SMS_57
取200至1000之间的整数,输入权重向量采样方差系数/>
Figure SMS_58
取0.01至4之间的实数;
步骤五中,通过预测模型得到目标域多个无标签测井样本的预测结果,得到井的完整地质模型。
进一步地,如果目标域任务为地震解释任务,则样本x是由地震属性数据组成的地震样本,标签y为地震标签,具体地:
地震样本x为一个区块在同一方位上的地震属性值组成的向量,地震标签y为需要解释的地质信息,d为地震属性总数,源域数据的地震标签数量大于目标域数据中的地震标签数量;
步骤二中,映射样本维度
Figure SMS_59
取500至2000之间的整数,输入权重向量采样方差系数/>
Figure SMS_60
取1至16之间的实数;
步骤五中,通过预测模型得到目标域多个无标签地震样本的预测结果,得到区块的完整地质模型。
进一步地,步骤三中,优化函数
Figure SMS_63
;其中
Figure SMS_64
用于度量跨域概率分布,/>
Figure SMS_66
为全体样本矩阵,
Figure SMS_61
为全体标签矩阵,/>
Figure SMS_65
,/>
Figure SMS_67
为目标域标签矩阵,其中无标签的目标域样本采用伪标签;/>
Figure SMS_68
用于避免变换过程中的信息丢失;/>
Figure SMS_62
用于度量单向对齐阶段的复杂性;具体地:
Figure SMS_69
,其中/>
Figure SMS_70
表示全体映射样本矩阵,
Figure SMS_71
表示转置,tr表示矩阵的迹,M为边缘MMD矩阵或者条件MMD矩阵;
Figure SMS_72
;/>
Figure SMS_73
进一步地,在步骤三的优化函数
Figure SMS_74
中加入平衡系数,则优化函数/>
Figure SMS_75
为:
Figure SMS_76
其中,
Figure SMS_77
、/>
Figure SMS_78
为人工定义的平衡系数,均大于0;如果目标域任务为测井解释任务,
Figure SMS_79
,/>
Figure SMS_80
;如果目标域任务为地震解释任务,/>
Figure SMS_81
,/>
Figure SMS_82
优化函数
Figure SMS_83
进一步写作:
Figure SMS_84
其中,中间变量
Figure SMS_85
,/>
Figure SMS_86
和/>
Figure SMS_87
表示全1和全0矩阵,/>
Figure SMS_88
和/>
Figure SMS_89
的下标表示维度;优化/>
Figure SMS_90
即得到A的解析解:
Figure SMS_91
,I为单位阵,下标表示该单位阵的维度。
进一步地,步骤四中,优化函数
Figure SMS_92
;/>
Figure SMS_93
为源域的总预测误差,/>
Figure SMS_94
为目标域中的总预测误差,/>
Figure SMS_95
用于评估目标域预测模型在特征空间中的平滑性,/>
Figure SMS_96
用于降低输出权重矩阵B的复杂度;
Figure SMS_99
,其中/>
Figure SMS_101
为/>
Figure SMS_105
经过极限学习机随机映射得到的高维映射矩阵,/>
Figure SMS_100
为映射后特征维度,/>
Figure SMS_102
;/>
Figure SMS_106
,其中/>
Figure SMS_109
为/>
Figure SMS_97
经过极限学习机随机映射/>
Figure SMS_103
得到的高维映射矩阵,/>
Figure SMS_107
为对角阵,
Figure SMS_110
为目标域标签矩阵;/>
Figure SMS_98
,其中/>
Figure SMS_104
表示转置,tr表示矩阵的迹,/>
Figure SMS_108
为目标域上的用于半监督的图拉普拉斯矩阵;/>
Figure SMS_111
进一步地,在步骤四的优化函数
Figure SMS_112
加入平衡系数,则优化函数/>
Figure SMS_113
为:
Figure SMS_114
其中,
Figure SMS_116
、/>
Figure SMS_118
、/>
Figure SMS_121
为人工定义的平衡系数,均大于0;如果目标域任务为测井解释任务,/>
Figure SMS_117
、/>
Figure SMS_120
、/>
Figure SMS_122
;如果目标域任务为地震解释任务,/>
Figure SMS_123
Figure SMS_115
、/>
Figure SMS_119
优化函数
Figure SMS_124
进一步写作:
Figure SMS_125
其中,中间变量
Figure SMS_126
,/>
Figure SMS_129
和/>
Figure SMS_132
表示全1和全0矩阵,/>
Figure SMS_128
和/>
Figure SMS_130
的下标表示维度;中间变量/>
Figure SMS_133
,/>
Figure SMS_134
为全体标签矩阵,
Figure SMS_127
为全体样本高维映射矩阵;优化/>
Figure SMS_131
即得到B的解析解:
Figure SMS_135
本发明还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述方法的步骤。
本发明还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述方法的步骤。
与现有技术相比,本发明的有益技术效果是:
1.本发明有效解决了地质建模中的数据分布偏差问题,实现了从成熟区块的丰富数据集向新区块的知识迁移,有效提升了建模精度;
2.充分利用了已有的数据标签和数据内蕴结构,减少了地质建模中对数据的依赖性;
3.保持了特征的地球物理意义,地质建模过程具有一定的可解释性。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合附图对本发明的一种优选实施方式作详细的说明。
源域、目标域、样本、标签、预测模型,属于迁移学习领域技术人员的技术用语。
本发明除了提出UA2FT半监督迁移学习建模方法,还结合具体应用实例对不同任务下的建模方法进行了区分化设置。例如本发明中的建模方法所用到的映射样本维度
Figure SMS_136
,输入权重向量采样方差系数/>
Figure SMS_137
,平衡系数/>
Figure SMS_138
、/>
Figure SMS_139
、/>
Figure SMS_140
、/>
Figure SMS_141
、/>
Figure SMS_142
等在不同的任务中取值范围不同。
如图1所示,本发明提出一种UA2FT半监督迁移学习建模方法,在单向对齐(Unilateral Alignment,UA)阶段,将源域和目标域的实例从原始空间非线性映射到再生核希尔伯特空间(RKHS),并通过可学习的输出权重矩阵依次线性映射,并在调整后的源域和目标域中对齐;具体来说,通过引入重构误差,将调整后的特征空间目标域推向原始特征空间域,即只有目标域的特征空间发生显著变化,目标域朝向源域对齐,因此命名为单向对齐。在精细调整(Fine Tune,FT)阶段,将调整后的域非线性映射到RKHS,使数据线性可分,并通过可学习的输出权重矩阵进行线性映射,输出对目标的预测。在训练目标域预测模型时,除了采用流形正则化来保持预测的平滑性外,还引入了源域丰富标签的知识。将目标域预测模型在源域的约束下进行更新,从而命名为精细调整。需要说明的是:UA和FT在循环中相互促进,由于UA增强了源域和目标域之间的关系,所以UA对FT有促进作用;另外由于FT提高了分布差异的测量精度,UA对FT有促进作用。
步骤S1、数据收集与处理:
收集数据并整理成样本,一个样本表达为
Figure SMS_143
,其中d是样本的维数,
Figure SMS_148
是特征空间,样本的标签表达为/>
Figure SMS_152
,其中/>
Figure SMS_146
为标签空间,对于分类任务或回归任务,/>
Figure SMS_149
分别属于有限元素集合或实数。一个样例定义为/>
Figure SMS_153
,域/>
Figure SMS_155
由一个特征空间
Figure SMS_145
,一个标签空间/>
Figure SMS_150
和联合概率分布/>
Figure SMS_154
组成,且/>
Figure SMS_156
。分类模型或者回归模型
Figure SMS_144
可以对样本进行预测,从概率的角度说,/>
Figure SMS_147
等价于/>
Figure SMS_151
如果采集到n个样本,则得到样本集合
Figure SMS_157
,样本集合写作矩阵形式为
Figure SMS_158
,样本集合/>
Figure SMS_159
对应的标签集合/>
Figure SMS_160
,其矩阵形式为
Figure SMS_161
,c为预测目标类别总数;源域和目标域为两个不同的域,源域具有较多的有标签样本,目标域样本的标签稀少。
采用符号s标识源域,t标识目标域;源域数据由
Figure SMS_163
构成,/>
Figure SMS_166
表示源域有标签样本总数,/>
Figure SMS_169
分别表示源域的样本和标签,目标域数据由/>
Figure SMS_165
和少量的/>
Figure SMS_167
构成,/>
Figure SMS_170
表示目标域样本总数,/>
Figure SMS_172
表示目标域的有标签样本数量,/>
Figure SMS_162
分别表示目标域的样本和标签;源域和目标域的预测模型分别用/>
Figure SMS_168
和/>
Figure SMS_171
表示;所有样本要进行归一化处理。源域数据的矩阵形式为/>
Figure SMS_173
,称为源域样本矩阵;目标域数据的矩阵形式为/>
Figure SMS_164
,称为目标域样本矩阵。
如果样本
Figure SMS_174
是由测井数据组成的测井样本,/>
Figure SMS_175
,测井数据包括SP、GR、AC、R25、COND等测井值,d为测井总数,同一深度上的测井值组成的向量即为测井样本/>
Figure SMS_176
。测井标签为需要解释的地质信息,如果解释岩性,则/>
Figure SMS_177
,c为岩性总数,y为独热编码,/>
Figure SMS_178
为实数域;如果解释物性,则/>
Figure SMS_179
。测井解释任务中,源域数据一般用多口已经完成测录井、测井数据处理、录井数据归位校正、人工解释的井数据合并而成,因此具有大量的有标签样本,目标域一般为刚完成测井且缺少大量录井数据和人工解释的井数据,因此目标域有大量无标签样本和极少数量的有标签样本,通过源域样本和目标域样本训练预测模型,得到目标域无标签样本的预测结果,即可得到该井的完整地质模型。
如果样本x是由地震属性数据组成的地震样本,
Figure SMS_180
,地震属性数据包括地震波的几何学、运动学、动力学或统计学特征,具体包括振幅、频率、相位、能量、波形、波阻抗、波速等,d为地震属性总数。同一方位上的地震属性值组成的向量即为地震样本x,地震标签为需要解释的地质信息,如果解释岩性,则/>
Figure SMS_181
,c为岩性总数,y为独热编码;如果解释物性,则/>
Figure SMS_182
。地震解释任务中,源域一般由成熟探区的地震属性数据合并而成,因此具有大量的有标签样本,目标域一般为新的探区或勘探程度较低的区块的地震属性数据组成,因此目标域有大量无标签样本和极少数量的有标签样本,通过源域和目标域数据训练预测模型,得到目标域无标签样本的预测结果,即可得到该区块的完整地质模型。
步骤S2、样本映射高维空间:
采用样本映射函数
Figure SMS_184
对样本进行变换,其中/>
Figure SMS_187
为再生核希尔伯特空间(RKHS),/>
Figure SMS_190
,其元素/>
Figure SMS_185
,/>
Figure SMS_188
和w下标i取值范围为1至/>
Figure SMS_191
,/>
Figure SMS_193
为映射样本维度,/>
Figure SMS_186
为从高斯分布/>
Figure SMS_189
采样的输入权重向量,/>
Figure SMS_192
为从均匀分布/>
Figure SMS_194
采样的输入偏置标量,/>
Figure SMS_183
为输入权重向量采样方差系数。
对于测井解释任务,预测模型复杂度相对较低,
Figure SMS_195
可取200至1000之间的整数,/>
Figure SMS_196
可取0.01至4之间的实数;对于地震解释任务,预测模型复杂度相对较高,/>
Figure SMS_197
可取500至2000之间的整数,/>
Figure SMS_198
可取1至16之间的实数。
步骤S3、单向对齐阶段(UA):
源域的样本矩阵
Figure SMS_200
和目标域的样本矩阵/>
Figure SMS_202
经过步骤S2后映射到高维空间,得到映射样本矩阵/>
Figure SMS_204
和/>
Figure SMS_199
,通过/>
Figure SMS_203
对映射样本矩阵再次进行变换,得到调整后的源域样本矩阵/>
Figure SMS_205
和目标域样本矩阵/>
Figure SMS_206
。在UA阶段,希望调整后的源域样本矩阵接近原始的源域样本矩阵,即/>
Figure SMS_201
,调整后的目标域样本具有显著变化,向源域概率分布对齐,则定义优化函数:
Figure SMS_207
其中,第一项
Figure SMS_217
度量跨域概率分布,/>
Figure SMS_210
Figure SMS_213
,/>
Figure SMS_219
,该项用以显式地消除源域和目标域之间的差异,其中无标签的目标域样本可以用伪标签,具体地/>
Figure SMS_222
,其中
Figure SMS_220
,/>
Figure SMS_223
表示转置,tr表示矩阵的迹,M为边缘或者条件MMD矩阵,MMD为最大均值差异(Maximum Mean Discrepancy)的缩写。第二项/>
Figure SMS_218
避免了变换过程中的信息丢失,没有/>
Figure SMS_221
将得到一个平凡解/>
Figure SMS_208
,其中/>
Figure SMS_214
是一个零矩阵,即UA后所有信息都被消去,与/>
Figure SMS_211
相比,/>
Figure SMS_215
只涉及两个域中的样本,没有标签的参与,所以该项在一定程度上保留了样本分布的内在结构,具体地/>
Figure SMS_212
,该项本质上为重构误差,能够让调整后的样本保持原始特征的物理意义,也进而保留了一定的可解释性。第三项/>
Figure SMS_216
,一般定义为/>
Figure SMS_209
,以度量UA模型的复杂性,该项可以防止经过训练的A过拟合。
进一步,加入平衡系数,优化函数
Figure SMS_224
可以写为:
Figure SMS_225
其中,
Figure SMS_226
、/>
Figure SMS_227
为人工定义的平衡系数,均大于0;对于测井解释任务,/>
Figure SMS_228
Figure SMS_229
;对于地震解释任务,/>
Figure SMS_230
,/>
Figure SMS_231
优化函数
Figure SMS_232
可以进一步写作:
Figure SMS_233
其中,
Figure SMS_234
,/>
Figure SMS_235
和/>
Figure SMS_236
表示全1和全0矩阵,下标表示其维度;优化/>
Figure SMS_237
即可得到A的解析解:
Figure SMS_238
步骤S4、精细调整阶段(FT):
经过UA阶段,源域得到了调整后的样本矩阵
Figure SMS_239
,目标域得到了调整后的样本矩阵
Figure SMS_240
,下面在此基础上进行精细调整,定义优化函数/>
Figure SMS_241
Figure SMS_242
其中,第一项
Figure SMS_253
定义了经验损失,即源域的总预测误差,该项试图充分利用源域中的丰富标签,并以某种方式保存源域信息,否则,目标域预测模型的结果可能非常糟糕,具体地/>
Figure SMS_245
,其中/>
Figure SMS_249
为/>
Figure SMS_257
经过极限学习机随机映射得到的高维映射矩阵,/>
Figure SMS_261
为映射后特征维度。第二项/>
Figure SMS_258
定义了经验损失,即目标域中的总预测误差,具体地/>
Figure SMS_260
,其中/>
Figure SMS_256
为/>
Figure SMS_259
经过极限学习机随机映射/>
Figure SMS_244
得到的高维映射矩阵,/>
Figure SMS_252
为对角阵,/>
Figure SMS_246
第j行样本在目标域没有标签,则/>
Figure SMS_247
第j个对角元素为0,否则为1。第三项/>
Figure SMS_250
用于评估目标域预测模型在特征空间中的平滑性,即特征空间中更接近的两个样本更有可能具有相同的标签,其中/>
Figure SMS_254
被列为一个条件,表明使用原始的目标域特征空间来构造图拉普拉斯矩阵,具体地
Figure SMS_243
,其中/>
Figure SMS_248
定义为目标域上的用于半监督的图拉普拉斯矩阵;第四项/>
Figure SMS_251
用于降低B的复杂度,具体地/>
Figure SMS_255
,防止B在训练中过拟合。
进一步,加入平衡系数,优化函数
Figure SMS_262
可以写为:
Figure SMS_263
其中,
Figure SMS_265
、/>
Figure SMS_268
、/>
Figure SMS_271
为人工定义的平衡系数,均大于0;在测井解释任务中,/>
Figure SMS_264
Figure SMS_267
、/>
Figure SMS_270
;在地震解释任务中,/>
Figure SMS_272
、/>
Figure SMS_266
、/>
Figure SMS_269
优化函数
Figure SMS_273
可以进一步写作:
Figure SMS_274
其中,
Figure SMS_275
,/>
Figure SMS_276
,/>
Figure SMS_277
Figure SMS_278
;优化/>
Figure SMS_279
即可得到B的解析解:
Figure SMS_280
步骤S5、得到预测模型并进行地质建模:
经过UA2FT训练后得到输出权重矩阵
Figure SMS_281
和/>
Figure SMS_282
,可得目标域的预测模型/>
Figure SMS_283
然后将预测模型
Figure SMS_284
用于预测目标域的无标签样本,即可得到其预测结果,当输入为测井数据组成的测井样本或由地震属性数据组成的地震样本,预测结果为地质信息,即实现了地质建模。
又一方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述方法的步骤。
再一方面,本发明还公开一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述方法的步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例中的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(如同轴电缆、光纤、数字用户线)或无线(如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(如软盘、硬盘、磁带)、光介质(如DVD)或者半导体介质(如固态硬盘)等。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立技术方案,说明书的这种叙述方式仅仅是为了清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (8)

1.一种UA2FT半监督迁移学习建模方法,通过源域s的有标签样本和源域任务的预测模型
Figure QLYQS_1
,获取目标域t任务的预测模型/>
Figure QLYQS_2
;源域的有标签样本数量/>
Figure QLYQS_3
大于目标域的有标签样本数量/>
Figure QLYQS_4
;包括以下步骤:
步骤一、获取源域和目标域数据:源域数据
Figure QLYQS_12
中,/>
Figure QLYQS_5
分别表示源域第i个样本和对应的标签;目标域数据/>
Figure QLYQS_13
、/>
Figure QLYQS_8
中,/>
Figure QLYQS_11
表示目标域样本总数,/>
Figure QLYQS_15
分别表示目标域第i个样本和对应的标签;/>
Figure QLYQS_19
和/>
Figure QLYQS_14
统一记为样本/>
Figure QLYQS_18
,/>
Figure QLYQS_7
和/>
Figure QLYQS_10
统一记为标签/>
Figure QLYQS_16
;源域样本矩阵/>
Figure QLYQS_20
,目标域样本矩阵/>
Figure QLYQS_17
;源域标签矩阵/>
Figure QLYQS_21
;/>
Figure QLYQS_6
为样本/>
Figure QLYQS_9
的维数,c为预测目标类别总数;
步骤二、样本映射高维空间:采用样本映射函数
Figure QLYQS_33
对源域样本矩阵/>
Figure QLYQS_24
和目标域样本矩阵/>
Figure QLYQS_26
进行变换,分别得到映射样本矩阵/>
Figure QLYQS_35
和/>
Figure QLYQS_38
;其中/>
Figure QLYQS_36
为再生核希尔伯特空间,/>
Figure QLYQS_39
为特征空间,/>
Figure QLYQS_29
,/>
Figure QLYQS_32
的元素
Figure QLYQS_22
,/>
Figure QLYQS_27
,/>
Figure QLYQS_28
为映射样本维度,/>
Figure QLYQS_31
为从高斯分布
Figure QLYQS_34
采样的输入权重向量,/>
Figure QLYQS_37
为从均匀分布/>
Figure QLYQS_23
采样的输入偏置标量,/>
Figure QLYQS_30
为输入权重向量采样方差系数,/>
Figure QLYQS_25
表示实数域;
步骤三、单向对齐阶段:通过
Figure QLYQS_41
对映射样本矩阵/>
Figure QLYQS_45
和/>
Figure QLYQS_47
进行变换,得到调整后的源域样本矩阵/>
Figure QLYQS_42
和目标域样本矩阵/>
Figure QLYQS_44
;其中/>
Figure QLYQS_46
为输出权重矩阵;通过优化函数/>
Figure QLYQS_48
使调整后的源域样本矩阵接近原始的源域样本,即
Figure QLYQS_40
,并使调整后的目标域样本矩阵/>
Figure QLYQS_43
向源域概率分布对齐;
步骤四、精细调整阶段:通过优化函数
Figure QLYQS_49
对经过单向对齐阶段后的源域样本矩阵
Figure QLYQS_50
和目标域样本矩阵/>
Figure QLYQS_51
进行精细调整;
步骤五、得到预测模型并得到预测结果:经过单向对齐阶段和精细调整阶段训练后得到输出权重矩阵
Figure QLYQS_52
和/>
Figure QLYQS_53
,获得目标域任务的预测模型/>
Figure QLYQS_54
Figure QLYQS_55
为极限学习机随机映射;将通过预测模型/>
Figure QLYQS_56
预测目标域的无标签样本,得到预测结果,实现建模;
步骤三中,优化函数
Figure QLYQS_58
;其中/>
Figure QLYQS_61
用于度量跨域概率分布,/>
Figure QLYQS_63
为全体样本矩阵,/>
Figure QLYQS_59
为全体标签矩阵,/>
Figure QLYQS_60
,/>
Figure QLYQS_62
为目标域标签矩阵,其中无标签的目标域样本采用伪标签,伪标签通过源域分类器预测目标域无标签样本获得;/>
Figure QLYQS_64
用于避免变换过程中的信息丢失;/>
Figure QLYQS_57
用于度量单向对齐阶段的复杂性;具体地:
Figure QLYQS_65
,其中/>
Figure QLYQS_66
表示全体映射样本矩阵,/>
Figure QLYQS_67
表示转置,tr表示矩阵的迹,M为边缘MMD矩阵或者条件MMD矩阵;/>
Figure QLYQS_68
Figure QLYQS_69
在步骤三的优化函数
Figure QLYQS_70
中加入平衡系数,则优化函数/>
Figure QLYQS_71
为:
Figure QLYQS_72
其中,
Figure QLYQS_73
、/>
Figure QLYQS_74
为人工定义的平衡系数,均大于0;如果目标域任务为测井解释任务,
Figure QLYQS_75
,/>
Figure QLYQS_76
;如果目标域任务为地震解释任务,/>
Figure QLYQS_77
,/>
Figure QLYQS_78
优化函数
Figure QLYQS_79
进一步写作:
Figure QLYQS_80
其中,中间变量
Figure QLYQS_81
,/>
Figure QLYQS_82
和/>
Figure QLYQS_83
表示全1和全0矩阵,/>
Figure QLYQS_84
和/>
Figure QLYQS_85
的下标表示维度;优化/>
Figure QLYQS_86
即得到A的解析解:
Figure QLYQS_87
,I为单位阵,I的下标表示单位阵I的维度。
2.根据权利要求1所述的UA2FT半监督迁移学习建模方法,其特征在于:样本x是由测井数据组成的测井样本或者是由地震属性数据组成的地震样本,步骤五中通过预测模型得到目标域多个无标签测井样本或地震样本的预测结果,实现井或者区块的地质建模。
3.根据权利要求1所述的UA2FT半监督迁移学习建模方法,其特征在于:如果目标域任务为测井解释任务,则样本x是由测井数据组成的测井样本,标签y为测井标签,具体地:
测井样本x为一口井在同一深度上的多个测井值组成的向量,测井标签y为需要解释的地质信息,d为测井总数,源域数据的测井标签数量大于目标域数据中的测井标签数量;
步骤二中,映射样本维度
Figure QLYQS_88
取200至1000之间的整数,输入权重向量采样方差系数/>
Figure QLYQS_89
取0.01至4之间的实数;
步骤五中,通过预测模型得到目标域多个无标签测井样本的预测结果,得到井的完整地质模型。
4.根据权利要求1所述的UA2FT半监督迁移学习建模方法,其特征在于:如果目标域任务为地震解释任务,则样本x是由地震属性数据组成的地震样本,标签y为地震标签,具体地:
地震样本x为一个区块在同一方位上的地震属性值组成的向量,地震标签y为需要解释的地质信息,d为地震属性总数,源域数据的地震标签数量大于目标域数据中的地震标签数量;
步骤二中,映射样本维度
Figure QLYQS_90
取500至2000之间的整数,输入权重向量采样方差系数/>
Figure QLYQS_91
取1至16之间的实数;
步骤五中,通过预测模型得到目标域多个无标签地震样本的预测结果,得到区块的完整地质模型。
5.根据权利要求1所述的UA2FT半监督迁移学习建模方法,其特征在于:步骤四中,优化函数
Figure QLYQS_92
;/>
Figure QLYQS_93
为源域的总预测误差,/>
Figure QLYQS_94
为目标域中的总预测误差,/>
Figure QLYQS_95
用于评估目标域预测模型在特征空间中的平滑性,/>
Figure QLYQS_96
用于降低输出权重矩阵B的复杂度;
Figure QLYQS_99
,其中/>
Figure QLYQS_102
为/>
Figure QLYQS_105
经过极限学习机随机映射得到的高维映射矩阵,/>
Figure QLYQS_100
为映射后特征维度,/>
Figure QLYQS_101
;/>
Figure QLYQS_104
,其中
Figure QLYQS_108
为/>
Figure QLYQS_98
经过极限学习机随机映射/>
Figure QLYQS_106
得到的高维映射矩阵,/>
Figure QLYQS_109
为对角阵,
Figure QLYQS_111
为目标域标签矩阵;/>
Figure QLYQS_97
,其中/>
Figure QLYQS_103
表示转置,tr表示矩阵的迹,/>
Figure QLYQS_107
为目标域上的用于半监督的图拉普拉斯矩阵;/>
Figure QLYQS_110
6.根据权利要求5所述的UA2FT半监督迁移学习建模方法,其特征在于:在步骤四的优化函数
Figure QLYQS_112
加入平衡系数,则优化函数/>
Figure QLYQS_113
为:
Figure QLYQS_114
其中,
Figure QLYQS_116
、/>
Figure QLYQS_119
、/>
Figure QLYQS_121
为人工定义的平衡系数,均大于0;如果目标域任务为测井解释任务,
Figure QLYQS_117
、/>
Figure QLYQS_120
、/>
Figure QLYQS_122
;如果目标域任务为地震解释任务,/>
Figure QLYQS_123
Figure QLYQS_115
、/>
Figure QLYQS_118
优化函数
Figure QLYQS_124
进一步写作:
Figure QLYQS_125
其中,中间变量
Figure QLYQS_128
,/>
Figure QLYQS_131
和/>
Figure QLYQS_132
表示全1和全0矩阵,/>
Figure QLYQS_127
和/>
Figure QLYQS_130
的下标表示维度;中间变量/>
Figure QLYQS_133
,/>
Figure QLYQS_134
为全体标签矩阵,
Figure QLYQS_126
为全体样本高维映射矩阵;优化/>
Figure QLYQS_129
即得到B的解析解:
Figure QLYQS_135
7.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。
CN202310421764.7A 2023-04-19 2023-04-19 一种ua2ft半监督迁移学习建模方法、介质及设备 Active CN116167288B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310421764.7A CN116167288B (zh) 2023-04-19 2023-04-19 一种ua2ft半监督迁移学习建模方法、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310421764.7A CN116167288B (zh) 2023-04-19 2023-04-19 一种ua2ft半监督迁移学习建模方法、介质及设备

Publications (2)

Publication Number Publication Date
CN116167288A CN116167288A (zh) 2023-05-26
CN116167288B true CN116167288B (zh) 2023-07-11

Family

ID=86418528

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310421764.7A Active CN116167288B (zh) 2023-04-19 2023-04-19 一种ua2ft半监督迁移学习建模方法、介质及设备

Country Status (1)

Country Link
CN (1) CN116167288B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116401597B (zh) * 2023-06-09 2023-08-22 中国科学技术大学先进技术研究院 地震解释模型构建方法、电子设备及可读存储介质
CN117173350B (zh) * 2023-08-09 2024-07-05 中国科学技术大学 基于主动领域适应学习的地质建模方法、系统及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659663A (zh) * 2019-03-22 2020-01-07 重庆大学 一种无监督的双向重建领域自适应方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110533193A (zh) * 2019-08-20 2019-12-03 武汉理工大学 半监督场景下特征和实例联合迁移学习方法
CN111829782B (zh) * 2020-07-16 2021-12-07 苏州大学 一种基于自适应流形嵌入动态分布对齐的故障诊断方法
CN111914708B (zh) * 2020-07-23 2023-09-12 杭州电子科技大学 迁移半监督宽度学习的脑电信号分类方法
CN113807420B (zh) * 2021-09-06 2024-03-19 湖南大学 一种考虑类别语义匹配的域自适应目标检测方法及系统
CN114863209B (zh) * 2022-04-21 2023-10-20 中国科学技术大学 类别比例引导的无监督领域适应建模方法、系统、设备及介质
CN115222019B (zh) * 2022-06-27 2023-07-28 西南石油大学 基于测井数据的深度Transformer迁移学习储层参数预测方法
CN115455828A (zh) * 2022-09-16 2022-12-09 中国科学技术大学 一种可解释的测井曲线补全方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659663A (zh) * 2019-03-22 2020-01-07 重庆大学 一种无监督的双向重建领域自适应方法

Also Published As

Publication number Publication date
CN116167288A (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
Mousavi et al. Deep-learning seismology
CN116167288B (zh) 一种ua2ft半监督迁移学习建模方法、介质及设备
CN112836802B (zh) 一种半监督学习方法、岩性预测方法及存储介质
Masroor et al. A multiple-input deep residual convolutional neural network for reservoir permeability prediction
Tian et al. Deep learning assisted well log inversion for fracture identification
Li et al. Pore type identification in carbonate rocks using convolutional neural network based on acoustic logging data
CN116047583A (zh) 基于深度卷积神经网络的自适应波阻抗反演方法及系统
US20210374465A1 (en) Methodology for learning a similarity measure between geophysical objects
Niri et al. Metaheuristic optimization approaches to predict shear-wave velocity from conventional well logs in sandstone and carbonate case studies
Gong et al. Investigation on automatic recognition of stratigraphic lithology based on well logging data using ensemble learning algorithm
CN114402233A (zh) 正演沉积模型的自动校准
CN115983094A (zh) 基于S-CNN-Bi-GRU网络测井曲线生成方法、处理终端及可读存储介质
Khan et al. Applicability of deep neural networks for lithofacies classification from conventional well logs: An integrated approach
Andersen et al. Machine learning based prediction of porosity and water saturation from Varg field reservoir well logs
Pourreza et al. Estimation of geomechanical units using petrophysical logs, core and supervised intelligent committee machine method to optimize exploration drilling operations
Lang et al. Cube2Vec: Self-Supervised Representation Learning for Sub-Surface Models
Sankaranarayanan et al. Automating the log interpretation workflow using machine learning
Kaul et al. Machine-learning-driven dispersion curve picking for surface-wave analysis, modelling, and inversion
Ballester et al. Characterising the parameter space of a highly nonlinear inverse problem
Kwon et al. Accurate and Convenient Missing Well Log Synthesis using Generative Model
Di et al. Unsupervised learning for automated seismic-well tie
Garcia et al. Predicting equatorial ionospheric convective instability using machine learning
Sarkar et al. A comparative analysis of supervised classification algorithms for lithofacies characterization
Simmons et al. The power of machine learning in petroleum geoscience: Biostratigraphy as an example
Raheem Prediction by reservoir porosity using micro-seismic attribute analysis by machine learning algorithms in an Iraqi Oil Field.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant