CN117173350A - 基于主动领域适应学习的地质建模方法、系统及介质 - Google Patents
基于主动领域适应学习的地质建模方法、系统及介质 Download PDFInfo
- Publication number
- CN117173350A CN117173350A CN202311011654.XA CN202311011654A CN117173350A CN 117173350 A CN117173350 A CN 117173350A CN 202311011654 A CN202311011654 A CN 202311011654A CN 117173350 A CN117173350 A CN 117173350A
- Authority
- CN
- China
- Prior art keywords
- geological
- matrix
- sample
- target domain
- domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 17
- 230000006978 adaptation Effects 0.000 claims abstract description 26
- 238000009826 distribution Methods 0.000 claims abstract description 14
- 238000005259 measurement Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 126
- 239000013598 vector Substances 0.000 claims description 26
- 238000005457 optimization Methods 0.000 claims description 21
- 238000013507 mapping Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 9
- 230000009191 jumping Effects 0.000 claims description 8
- 230000000704 physical effect Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000003860 storage Methods 0.000 claims description 2
- 238000012549 training Methods 0.000 abstract description 9
- 238000012360 testing method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005553 drilling Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及地质信息解释技术领域,公开了一种基于主动领域适应学习的地质建模方法、系统及介质,地质建模方法包括:系统初始化;无监督领域适应;标签请求;半监督领域适应;二次标签请求;输出目标域预测模型。相比于现有技术,本发明无需源域的数据,只需要提供源域模型;采用了先验分布对齐,能够快速缩小源域和目标域的分布差异;采用了集成流形正则化,能够保证分类结果的平滑性,增加了半监督的安全性,并进一步加快了模型的调整速率;利用模型差异度量,训练得到了多个子模型,进而利用其预测结果的方差描述了样本的关键性,实现样本的主动选取,并利用最终得到的目标域预测模型对无标签的地质样本进行地质信息解释。
Description
技术领域
本发明涉及地质信息解释技术领域,具体涉及一种基于主动领域适应学习的地质建模方法、系统及介质。
背景技术
地质建模是一门综合学科,涉及地质学、数据分析、信息分析和计算科学,它基于对地质、测井、地球物理资料以及各种解释结果或概念模型的综合分析,利用计算机图形技术生成三维定量模型。以测井解释为例,在地质建模中,钻孔几乎是直接探索地下表面的唯一方法,因为我们可以观察到钻孔岩屑和岩芯。未损坏的岩心为地层的形成提供了丰富的信息,但由于取心成本高昂且耗时,无法获得完整连续的岩心序列。与岩心直接观测井眼地质相比,测井可以连续、高分辨率地记录井眼物探参数(如声波、电阻率等),间接反映地层性质。因此,将稀缺但直接的岩心数据与间接但连续的地球物理测井数据相结合,建立完整而精细的井眼地质模型成为地质工作者的重要任务。
在地质建模中,基于机器学习的测井解释已经广泛研究。然而,大多数研究都基于独立同分布(iid)的假设,即训练数据集和测试数据集之间的概率分布不存在差异。一般情况下,训练数据集可以由单口井组成,也可以将多口井的数据合并而成。因此,我们通常可以假设获得一个具有丰富甚至完整标签的训练数据集。然而,不同井的钻井条件、测井设备等存在差异,导致有标记的训练数据集与少标记(或几乎没有标记)的测试数据集之间存在不可忽略的概率分布差异。因此,在实践中,基于机器学习的建模应该研究非iid问题。
为了解决这个问题,主动领域适应方法可以被引入。主动领域适应学习通过结合主动学习和领域适应技术,旨在充分利用源域(训练数据)的模型参数,以提高在目标域(测试数据)上的学习性能。在地质建模中,这意味着通过主动学习方法选择有意义的训练地质样本,同时采用领域适应技术来调整模型以适应目标域的特点。通过主动领域适应方法,可以更好地解决地质建模中源域与目标域数据分布不一致的问题,提高模型的泛化能力和适应性。
发明内容
为解决上述技术问题,本发明提供一种基于主动领域适应学习的地质建模方法、系统及介质。
为解决上述技术问题,本发明采用如下技术方案:
一种基于主动领域适应学习的地质建模方法,根据目标域无标签的地质样本对源域预测模型进行调整,得到目标域预测模型,并通过目标域预测模型得到地质模型;其特征在于,包括以下步骤:
步骤一、系统初始化:预测模型为f(x)=φ(x)Ω,源域预测模型为f0(x)=φ(x)Ω0,表示地质样本,/>表示实数域,d为地质样本的原始维度,地质样本x的标签记为/>为输出权重矩阵,Ω0为源域的输出权重矩阵;/>为高维映射函数,将地质样本映射到高维特征空间;τ为映射后地质样本的维度,c为地质信息的类别数量;目标域地质样本集为/>n为/>中地质样本的数量,xi表示/>中第i个地质样本;通过目标域的地质样本求解图拉普拉斯矩阵候选集合/>为目标域的第i个图拉普拉斯矩阵,m为图拉普拉斯矩阵候选集合中的元素数量;
步骤二、无监督领域适应:通过图拉普拉斯矩阵对无标签的目标域地质样本进行一次无监督领域适应,求解优化问题,得到调整后的输出权重矩阵Ω*;
步骤三、标签请求:根据所述输出权重矩阵Ω*计算目标域地质样本的伪标签在目标域地质样本集选取a个地质样本的请求标签,更新标签矩阵Y;
步骤四、半监督领域适应:令输出权重矩阵为最新得到的Ω*,使用标签矩阵Y对进行更新,求解/>优化问题,得到调整后的输出权重矩阵集合/>为输出权重矩阵集合中的第i个调整后的输出权重矩阵,r为输出权重矩阵集合/>中的元素数量;
步骤五、二次标签请求:根据所述权重矩阵集合从除步骤三选取过的地质样本外的目标域地质样本集中选取不确定性最高的a个地质样本请求标签,更新标签矩阵
步骤六、如果没达到标签请求最大数量,则将值赋予Ω*,并跳至步骤四;如果达到标签请求最大数量,则将/>值赋予/>跳至步骤七;
步骤七、输出目标域预测模型:输出目标域预测模型模型调整完毕;
步骤八、将无标签的地质样本x*输入到目标域预测模型,得到无标签地质样本的预测结果,即得到地质模型。
进一步地,步骤一中求解图拉普拉斯矩阵候选集合时,具体包括:
图拉普拉斯矩阵Li由相似矩阵计算得到,相似矩阵A的第i行第j列元素Ai,j为:
其中,表示xj的κ个最近邻的集合,通过人工设置不同κ值,得到m个不同的图拉普拉斯矩阵,组成图拉普拉斯矩阵候选集合/>
进一步地,步骤一中,所述优化问题如下:
其中,γ1,γ2,γ3分别为人工设定的用以平衡先验分布约束项、特征空间平滑约束项、模型调整约束项的平衡系数,高维映射函数集合 为用以计算协方差矩阵的中心矩阵,/>为全1向量,/>为人工设定目标域先验分布的均值,/>为协方差,F表示F范数,上标T表示转置,tr(·)用于度量不确定性;
所述优化问题的求解步骤包括:
令集合固定μ,求解/>并令/>等于0,求得Ω的解析解;
固定Ω,采用序列最小优化算法求解μ;
多次迭代得到最优的输出权重矩阵Ω*。
进一步地,步骤三具体包括:
根据所述输出权重矩阵Ω*计算目标域地质样本的伪标签Φ为高维映射函数;
从每类中分别选取预测概率最低的a个地质样本请求标签,得到标签矩阵Y对应到Φ,Y的行对应Φ相应行的标签,Φ的行向量表示某个映射后地质样本,如果映射后地质样本没有标签,则Y对应行向量置零。
进一步地,所述优化问题如下:
其中,λ1,λ2,λ3分别为用以平衡模型调整约束项,子模型差异度量项,特征空间、深度域平滑约束项的平衡系数,r为子模型数量;为地质样本加权对角阵;Ωi表示第i个输出权重矩阵;F表示F范数;tr(·)用于度量不确定性;
所述优化问题求解步骤包括:
令集合固定μ,求解/>并令/>等于0,求得Ω1的解析解;
固定Ω1并采用SMO算法求解μ;
固定Ω1和μ,采用交叉优化算法,在固定中除Ω1以外的输出权重矩阵的同时,分别求解/>并令/>等于0,依次求得/>的解析解;
多次迭代上述Ω1到μ再到的求解过程,得到调整后的输出权重矩阵集合
进一步地,所述二次标签请求包括:
将输出权重矩阵集合中/>作为目标域的输出权重矩阵,并将/>的值赋予计算/>得到目标域由第2至r子模型输出的预测矩阵;/>表示第i个子模型预测结果;
将的所有第j行向量取出来,合并得到目标域的第j个地质样本的子模型预测结果矩阵/>Fj的方差矩阵为/>采用tr(Ξj)度量第j个地质样本的不确定性;
从除步骤三选取过的地质样本外的目标域地质样本集中选取不确定性最高的a个地质样本请求标签,更新标签矩阵
进一步地,如果地质样本为测井数据样本,则测井数据样本x为由同一深度上的测井值SP、GR、AC、R25、COND组成的向量,d为测井总数;测井数据样本的标签为需要解释的地质信息,如果需要解释岩性,则c为岩性总数,y为独热编码,如果需要解释物性,则
进一步地,如果地质样本为地震属性数据样本,则地震属性数据样本x为由同一方位上的地震属性值组成的向量,d为地震属性总数,地震属性数据样的标签为需要解释的地质信息,如果需要解释岩性,则c为岩性总数,y为独热编码,如果需要解释物性,则
一种基于主动领域适应学习的地质建模系统,根据目标域无标签的地质样本对源域预测模型进行调整,得到目标域预测模型,并通过目标域预测模型得到地质模型;包括:
系统初始化模块:预测模型为f(x)=φ(x)Ω,源域预测模型为f0(x)=φ(x)Ω0,表示地质样本,/>表示实数域,d为地质样本的原始维度,/>表示地质样本x的标签,/>为输出权重矩阵,Ω0为源域的输出权重矩阵;/>为高维映射函数,将地质样本映射到高维特征空间;τ为映射后地质样本的维度,c为地质信息的类别数量;目标域地质样本集为/>n为/>中地质样本的数量,xi表示/>中第i个地质样本;通过目标域的地质样本求解图拉普拉斯矩阵候选集合/>为目标域的第i个图拉普拉斯矩阵,m为图拉普拉斯矩阵候选集合中的元素数量;
无监督领域适应模块:通过图拉普拉斯矩阵对无标签的目标域地质样本进行一次无监督领域适应,求解优化问题,得到调整后的输出权重矩阵Ω*;
标签请求模块:根据所述输出权重矩阵Ω*计算目标域地质样本的伪标签在目标域地质样本集选取a个地质样本的请求标签,更新标签矩阵Y;
半监督领域适应模块:令输出权重矩阵为最新得到的Ω*,使用标签矩阵Y对/>进行更新,求解/>优化问题,得到调整后的输出权重矩阵集合/>为输出权重矩阵集合中的第i个调整后的输出权重矩阵,r为输出权重矩阵集合/>中的元素数量;
二次标签请求模块:根据所述权重矩阵集合从除步骤三选取过的地质样本外的目标域地质样本集中选取不确定性最高的a个地质样本请求标签,更新标签矩阵
判断模块:如果没达到标签请求最大数量,则将值赋予Ω*,并跳至半监督领域适应模块;如果达到标签请求最大数量,则将/>值赋予/>跳至输出目标域预测模型模块;
输出目标域预测模型模块:输出目标域预测模型模型调整完毕;
预测模块:将无标签的地质样本x*输入到目标域预测模型,得到无标签地质样本的预测结果,即得到地质模型。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述方法的步骤。
本发明的系统与方法相对应,方法的细化方案、优化方案同样适用于系统。
与现有技术相比,本发明的有益技术效果是:
本发明无需源域的数据,只需要提供源域模型;采用了先验分布对齐,能够快速缩小源域和目标域的分布差异;采用了集成流形正则化,能够保证分类结果的平滑性,增加了半监督的安全性,并进一步加快了模型的调整速率;利用模型差异度量,训练得到了多个子模型,进而利用其预测结果的方差描述了地质样本的关键性,最终实现地质样本的主动选取;能够同时解决分类和回归问题。
附图说明
图1为本发明地质建模方法的流程示意图。
具体实施方式
下面结合附图对本发明的一种优选实施方式作详细的说明。
需要预先说明的是,为了简化符号系统,某些下标,例如i、j,可能被重复地利用,其含义也不尽相同,例如在中,i表示取整数值从1到n,而在/>i表示从取整数值从1到m;然而,下标是跟随其主体符号的,所以很容易根据上下文判断i、j的取值范围,因此不具备歧义。
地质样本记为其中d是地质样本的维数,/>是特征空间,地质样本的标签表达为/>其中/>为标签空间,对于分类任务或回归任务,y分别属于有限元素集合或实数,一个样例定义为(x,y)。
地质建模的本质是建立三维空间中地质信息的分布模型。
如果地质样本为测井数据样本,x由SP、GR、AC、R25、COND等测井值组成,d为测井总数,同一深度上的测井值组成的向量即为测井数据样本x;测井标签为需要解释的地质信息,如果解释岩性,则/>c为岩性总数,y为独热编码,/>为实数域,如果解释物性,则/>测井解释任务中,源域一般用多口已经完成测录井、测井数据处理、录井数据归位校正、人工解释的井数据合并而成,因此具有大量的有标签测井数据样本,目标域一般为刚完成测井且缺少大量录井数据和人工解释的井数据,因此目标域有大量无标签测井数据样本和极少数量的有标签测井数据样本,通过源域和目标域测井数据样本训练预测模型,得到目标域无标签测井数据样本的预测结果,即可得到该井的完整地质模型。
如果地质样本为地震属性数据样本,x由地震波的几何学、运动学、动力学或统计学特征等组成,包括振幅、频率、相位、能量、波形、波阻抗、波速等,d为地震属性总数,同一方位上的地震属性值组成的向量即为地震属性数据样本x,测井标签为需要解释的地质信息,如果解释岩性,则/>c为岩性总数,y为独热编码,如果解释物性,则/>地震解释任务中,源域一般由成熟探区的地震属性数据合并而成,因此具有大量的有标签地震属性数据样本,目标域一般为新的探区或勘探程度较低的区块的地震数据组成,因此目标域有大量无标签地震属性数据样本和极少数量的有标签地震属性数据样本,通过源域和目标域数据训练预测模型,得到目标域无标签地质样本的预测结果,即可得到该区块的完整地质模型。
如图1所示,本申请实施例提供一种基于主动领域适应学习的地质建模方法,包括:
步骤S1、系统初始化
首先定义本发明的变量和参数,表示地质样本,d为地质样本的原始维度,/>表示标签,对于分类任务c为类别数量,对于回归任务c等于1;/>为高维映射函数,将地质样本映射到高维特征空间,τ为映射后地质样本的维度;φ(x)可以是随机傅里叶特征;f(x)=φ(x)Ω为分类模型,/>为输出权重矩阵;Ω0为源域的输出权重矩阵;本发明的任务即为:如何基于具有n个地质样本目标域地质样本集/>对Ω0进行主动的调整以得到适合目标域的输出权重矩阵Ω1,调整期间允许请求标签。
求解图拉普拉斯矩阵候选集合m为集合元素数量,求解方式如下:为目标域的图拉普拉斯矩阵,由相似矩阵/>计算得到,其第i行第j列元素为:
其中,表示xj的κ个最近邻的集合,通过人工设置不同κ值,可以得到m个不同的图拉普拉斯矩阵。
下面举例说明数据集的实际含义:
以图像分类为例,数据集有n张图像,即可以通过SIFT等常用特征提取方法提取出图像的特征向量作为地质样本,设分类目标有c个,则地质样本xi对应标签yi∈{1,…,c},如果采用独热编码,yi可写为c维的向量yi,相应的标签向量y要写作标签矩阵的形式,即Y=[y1;…;yn]。
以测井解释为例,每个深度上的测井曲线值即组成一个特征向量,即构造出来一个地质样本,如果一口井有n个深度点,即得到n个地质样本,其对应的标签为地质信息,如地质信息为孔隙度,则任务是回归任务;如地质信息为岩性,则任务是分类任务。
步骤S2、无监督领域适应与标签请求
步骤S21、无监督领域适应
面对完全没有标签的目标域,首先需要做一次无监督领域适应,即求解以下优化问题:
其中,γ1,γ2,γ3用以平衡不同约束项,为用以计算协方差矩阵的中心矩阵,/>为全1向量;人工设定的平衡系数γ1,γ2,γ3均为正实数;人工设定目标域先验分布的均值协方差/>人工设定标签请求最大数量。
优化问题的求解分为两步,首先令/>固定μ,求解/>并令其等于0,可以求得Ω的解析解;然后固定Ω,采用序列最小优化算法(SequentialMinimal Optimization,SMO)求解μ,其基本思路如下:从μ中选择两个元素μi和μj进行更新,并将μ中其他元素视为已知常数;让变量/>为μi和μj当前值之和,此时变量即μj可以用μi表达,因此仅需更新μi;求解/>并令其等于0,可以得到μi的解析解;从μ抽取{(μi,μj);i=1,2,…,m;j=2,…,m;j>i},进行(m-1)!次更新,即可实现对μ的求解;多次迭代即可得到调整后输出权重矩阵Ω*。
步骤2-2、标签请求
计算得到目标域的伪标签对于分类任务,从每类中分别选取预测概率最低的a个地质样本请求标签;对于回归任务,/>从闭区间/>中均匀划分出a个子区间,保证每个子区间存在一个元素/>的前提下尽可能长度均匀,然后从每个子区间随机取一个元素/>并请求/>对应地质样本的标签;进而,得到标签矩阵Y对应到Φ,Φ的行向量表示某个映射后地质样本,如果该地质样本没有标签,则Y对应行向量置零。
S3、半监督领域适应与标签请求
S31、半监督领域适应
使用标签矩阵Y对进行更新,/>为最新得到的Ω*,然后求解以下优化问题:
其中,λ1,λ2,λ3用以平衡不同约束项,r为子模型数量;为地质样本加权对角阵,对于没有标签的地质样本,其对应的W的对角元素为0,否则为1;/>优化问题的求解分为三步,首先令/>固定μ,求解/>并令其等于0,可以求得Ω1的解析解;然后固定Ω1并采用SMO算法求解μ;最后固定Ω1和μ,采用交叉优化算法,在固定/>中其他输出权重矩阵的同时,分别求解/>并令其等于0,即可依次求得/>的解析解;多次迭代上述Ω1到μ再到/>的求解过程,即可得到调整后输出权重矩阵集合/>
人工设定的平衡系数λ1,λ2,λ3,均为正实数。
D32、标签请求
经过的优化,得到了/>其中/>作为目标域的输出权重矩阵,并将/>的值赋予/>计算/>得到目标域由第2至r子模型输出的预测矩阵;将/>的所有第j行向量取出来,合并得到目标域的第j个地质样本的子模型预测结果矩阵/>Fj的第p行对应第p+1个子模型的预测结果,其方差矩阵为/>采用tr(Ξj)度量第j个地质样本的不确定性;从剩下的无标签地质样本集合中选取不确定性最高的a个地质样本请求标签,更新标签矩阵/>如果没达到标签请求最大数量,则将/>值赋予Ω*,并跳至步骤S31,否则将/>值赋予/>跳至S4。
S4、输出目标域预测模型
输出目标域预测模型模型调整完毕。
S5、将无标签的地质样本x*输入到目标域预测模型,得到无标签地质样本的预测结果,即得到地质模型。
本发明的系统与方法相对应,方法的细化方案、优化方案同样适用于系统。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立技术方案,说明书的这种叙述方式仅仅是为了清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (10)
1.一种基于主动领域适应学习的地质建模方法,根据目标域无标签的地质样本对源域预测模型进行调整,得到目标域预测模型,并通过目标域预测模型得到地质模型;其特征在于,包括以下步骤:
步骤一、系统初始化:预测模型为f(x)=φ(x)Ω,源域预测模型为f0(x)=φ(x)Ω0,表示地质样本,/>表示实数域,d为地质样本的原始维度,地质样本x的标签记为为输出权重矩阵,Ω0为源域的输出权重矩阵;/>为高维映射函数,将地质样本映射到高维特征空间;τ为映射后地质样本的维度,c为地质信息的类别数量;目标域地质样本集为/>n为/>中地质样本的数量,xi表示/>中第i个地质样本;通过目标域的地质样本求解图拉普拉斯矩阵候选集合/> 为目标域的第i个图拉普拉斯矩阵,m为图拉普拉斯矩阵候选集合中的元素数量;
步骤二、无监督领域适应:通过图拉普拉斯矩阵对无标签的目标域地质样本进行一次无监督领域适应,求解优化问题,得到调整后的输出权重矩阵Ω*;
步骤三、标签请求:根据所述输出权重矩阵Ω*计算目标域地质样本的伪标签在目标域地质样本集选取a个地质样本的请求标签,更新标签矩阵Y;
步骤四、半监督领域适应:令输出权重矩阵为最新得到的Ω*,使用标签矩阵Y对/>进行更新,求解/>优化问题,得到调整后的输出权重矩阵集合/> 为输出权重矩阵集合中的第i个调整后的输出权重矩阵,r为输出权重矩阵集合/>中的元素数量;
步骤五、二次标签请求:根据所述权重矩阵集合从除步骤三选取过的地质样本外的目标域地质样本集中选取不确定性最高的a个地质样本请求标签,更新标签矩阵
步骤六、如果没达到标签请求最大数量,则将值赋予Ω*,并跳至步骤四;如果达到标签请求最大数量,则将/>值赋予/>跳至步骤七;
步骤七、输出目标域预测模型:输出目标域预测模型模型调整完毕;
步骤八、将无标签的地质样本x*输入到目标域预测模型,得到无标签地质样本的预测结果,即得到地质模型。
2.如权利要求1所述的基于主动领域适应学习的地质建模方法,其特征在于:步骤一中求解图拉普拉斯矩阵候选集合时,具体包括:
图拉普拉斯矩阵Li由相似矩阵计算得到,相似矩阵A的第i行第j列元素Ai,j为:
其中,表示xj的κ个最近邻的集合,通过人工设置不同κ值,得到m个不同的图拉普拉斯矩阵,组成图拉普拉斯矩阵候选集合/>
3.如权利要求1所述的基于主动领域适应学习的地质建模方法,其特征在于,步骤一中,所述优化问题如下:
其中,γ1,γ2,γ3分别为人工设定的用以平衡先验分布约束项、特征空间平滑约束项、模型调整约束项的平衡系数,高维映射函数集合 为用以计算协方差矩阵的中心矩阵,/>为全1向量,/>为人工设定目标域先验分布的均值,/>为协方差,F表示F范数,上标/>表示转置,tr(·)用于度量不确定性;
所述优化问题的求解步骤包括:
令集合固定μ,求解/>并令/>等于0,求得Ω的解析解;
固定Ω,采用序列最小优化算法求解μ;
多次迭代得到最优的输出权重矩阵Ω*。
4.如权利要求1所述的基于主动领域适应学习的地质建模方法,其特征在于:步骤三具体包括:
根据所述输出权重矩阵Ω*计算目标域地质样本的伪标签Φ为高维映射函数;
从每类中分别选取预测概率最低的a个地质样本请求标签,得到标签矩阵Y对应到Φ,Y的行对应Φ相应行的标签,Φ的行向量表示某个映射后地质样本,如果映射后地质样本没有标签,则Y对应行向量置零。
5.如权利要求1所述的基于主动领域适应学习的地质建模方法,其特征在于:所述优化问题如下:
其中,λ1,λ2,λ3分别为用以平衡模型调整约束项,子模型差异度量项,特征空间、深度域平滑约束项的平衡系数,r为子模型数量;为地质样本加权对角阵;Ωi表示第i个输出权重矩阵;F表示F范数;tr(·)用于度量不确定性;
所述优化问题求解步骤包括:
令集合固定μ,求解/>并令/>等于0,求得Ω1的解析解;
固定Ω1并采用SMO算法求解μ;
固定Ω1和μ,采用交叉优化算法,在固定中除Ω1以外的输出权重矩阵的同时,分别求解/>并令/>等于0,依次求得/>的解析解;
多次迭代上述Ω1到μ再到的求解过程,得到调整后的输出权重矩阵集合
6.如权利要求1所述的基于主动领域适应学习的地质建模方法,其特征在于:所述二次标签请求包括:
将输出权重矩阵集合中/>作为目标域的输出权重矩阵,并将/>的值赋予/>计算/>得到目标域由第2至r子模型输出的预测矩阵;/>表示第i个子模型预测结果;
将的所有第j行向量取出来,合并得到目标域的第j个地质样本的子模型预测结果矩阵/>Fj的方差矩阵为/>采用tr(Ξj)度量第j个地质样本的不确定性;
从除步骤三选取过的地质样本外的目标域地质样本集中选取不确定性最高的a个地质样本请求标签,更新标签矩阵
7.如权利要求1所述的基于主动领域适应学习的地质建模方法,其特征在于:如果地质样本为测井数据样本,则测井数据样本x为由同一深度上的测井值SP、GR、AC、R25、COND组成的向量,d为测井总数;测井数据样本的标签为需要解释的地质信息,如果需要解释岩性,则c为岩性总数,y为独热编码,如果需要解释物性,则/>
8.如权利要求1所述的基于主动领域适应学习的地质建模方法,其特征在于:如果地质样本为地震属性数据样本,则地震属性数据样本x为由同一方位上的地震属性值组成的向量,d为地震属性总数,地震属性数据样的标签为需要解释的地质信息,如果需要解释岩性,则c为岩性总数,y为独热编码,如果需要解释物性,则/>
9.一种基于主动领域适应学习的地质建模系统,根据目标域无标签的地质样本对源域预测模型进行调整,得到目标域预测模型,并通过目标域预测模型得到地质模型;其特征在于,包括:
系统初始化模块:预测模型为f(x)=φ(x)Ω,源域预测模型为f0(x)=φ(x)Ω0,表示地质样本,/>表示实数域,d为地质样本的原始维度,/>表示地质样本x的标签,/>为输出权重矩阵,Ω0为源域的输出权重矩阵;/>为高维映射函数,将地质样本映射到高维特征空间;τ为映射后地质样本的维度,c为地质信息的类别数量;目标域地质样本集为/>n为/>中地质样本的数量,xi表示/>中第i个地质样本;通过目标域的地质样本求解图拉普拉斯矩阵候选集合/> 为目标域的第i个图拉普拉斯矩阵,m为图拉普拉斯矩阵候选集合中的元素数量;
无监督领域适应模块:通过图拉普拉斯矩阵对无标签的目标域地质样本进行一次无监督领域适应,求解优化问题,得到调整后的输出权重矩阵Ω*;
标签请求模块:根据所述输出权重矩阵Ω*计算目标域地质样本的伪标签在目标域地质样本集选取a个地质样本的请求标签,更新标签矩阵Y;
半监督领域适应模块:令输出权重矩阵为最新得到的Ω*,使用标签矩阵Y对/>进行更新,求解/>优化问题,得到调整后的输出权重矩阵集合/> 为输出权重矩阵集合中的第i个调整后的输出权重矩阵,r为输出权重矩阵集合/>中的元素数量;
二次标签请求模块:根据所述权重矩阵集合从除步骤三选取过的地质样本外的目标域地质样本集中选取不确定性最高的a个地质样本请求标签,更新标签矩阵
判断模块:如果没达到标签请求最大数量,则将值赋予Ω*,并跳至半监督领域适应模块;如果达到标签请求最大数量,则将/>值赋予/>跳至输出目标域预测模型模块;
输出目标域预测模型模块:输出目标域预测模型模型调整完毕;
预测模块:将无标签的地质样本x*输入到目标域预测模型,得到无标签地质样本的预测结果,即得到地质模型。
10.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311011654.XA CN117173350B (zh) | 2023-08-09 | 基于主动领域适应学习的地质建模方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311011654.XA CN117173350B (zh) | 2023-08-09 | 基于主动领域适应学习的地质建模方法、系统及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117173350A true CN117173350A (zh) | 2023-12-05 |
CN117173350B CN117173350B (zh) | 2024-07-05 |
Family
ID=
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021003951A1 (zh) * | 2019-07-08 | 2021-01-14 | 南京信息工程大学 | 一种基于标签约束弹性网图模型的高光谱图像分类方法 |
CN112836802A (zh) * | 2021-02-03 | 2021-05-25 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种半监督学习方法、岩性预测方法及存储介质 |
WO2021159844A1 (zh) * | 2020-02-12 | 2021-08-19 | 河海大学 | 基于半监督域适应的雨、雪、冰雹分类监测方法 |
US20210390355A1 (en) * | 2020-06-13 | 2021-12-16 | Zhejiang University | Image classification method based on reliable weighted optimal transport (rwot) |
WO2022011754A1 (zh) * | 2020-07-16 | 2022-01-20 | 苏州大学 | 一种基于自适应流形嵌入动态分布对齐的故障诊断方法 |
CN114817856A (zh) * | 2022-04-15 | 2022-07-29 | 重庆科技学院 | 一种基于结构信息保持域适应网络的抽油机故障诊断方法 |
CN114863209A (zh) * | 2022-04-21 | 2022-08-05 | 中国科学技术大学 | 类别比例引导的无监督领域适应建模方法、系统、设备及介质 |
US11435499B1 (en) * | 2021-04-08 | 2022-09-06 | Sas Institute Inc. | Machine-learning techniques for automatically identifying tops of geological layers in subterranean formations |
CN115222019A (zh) * | 2022-06-27 | 2022-10-21 | 西南石油大学 | 基于测井数据的深度Transformer迁移学习储层参数预测方法 |
CN115455828A (zh) * | 2022-09-16 | 2022-12-09 | 中国科学技术大学 | 一种可解释的测井曲线补全方法 |
US20230141334A1 (en) * | 2021-11-08 | 2023-05-11 | Conocophillips Company | Systems and methods of modeling geological facies for well development |
CN116167288A (zh) * | 2023-04-19 | 2023-05-26 | 中国科学技术大学 | 一种ua2ft半监督迁移学习建模方法、介质及设备 |
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021003951A1 (zh) * | 2019-07-08 | 2021-01-14 | 南京信息工程大学 | 一种基于标签约束弹性网图模型的高光谱图像分类方法 |
WO2021159844A1 (zh) * | 2020-02-12 | 2021-08-19 | 河海大学 | 基于半监督域适应的雨、雪、冰雹分类监测方法 |
US20210390355A1 (en) * | 2020-06-13 | 2021-12-16 | Zhejiang University | Image classification method based on reliable weighted optimal transport (rwot) |
WO2022011754A1 (zh) * | 2020-07-16 | 2022-01-20 | 苏州大学 | 一种基于自适应流形嵌入动态分布对齐的故障诊断方法 |
CN112836802A (zh) * | 2021-02-03 | 2021-05-25 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 一种半监督学习方法、岩性预测方法及存储介质 |
US11435499B1 (en) * | 2021-04-08 | 2022-09-06 | Sas Institute Inc. | Machine-learning techniques for automatically identifying tops of geological layers in subterranean formations |
US20230141334A1 (en) * | 2021-11-08 | 2023-05-11 | Conocophillips Company | Systems and methods of modeling geological facies for well development |
CN114817856A (zh) * | 2022-04-15 | 2022-07-29 | 重庆科技学院 | 一种基于结构信息保持域适应网络的抽油机故障诊断方法 |
CN114863209A (zh) * | 2022-04-21 | 2022-08-05 | 中国科学技术大学 | 类别比例引导的无监督领域适应建模方法、系统、设备及介质 |
CN115222019A (zh) * | 2022-06-27 | 2022-10-21 | 西南石油大学 | 基于测井数据的深度Transformer迁移学习储层参数预测方法 |
CN115455828A (zh) * | 2022-09-16 | 2022-12-09 | 中国科学技术大学 | 一种可解释的测井曲线补全方法 |
CN116167288A (zh) * | 2023-04-19 | 2023-05-26 | 中国科学技术大学 | 一种ua2ft半监督迁移学习建模方法、介质及设备 |
Non-Patent Citations (2)
Title |
---|
吴琳琳;彭国华;延伟东;: "基于判别性样本选择的无监督领域自适应方法", 西北工业大学学报, no. 04, 15 August 2020 (2020-08-15) * |
姚明海;黄展聪;: "基于主动学习的半监督领域自适应方法研究", 高技术通讯, no. 08, 15 August 2020 (2020-08-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020123097A1 (en) | Training machine learning systems for seismic interpretation | |
Gao et al. | A new highly efficient differential evolution scheme and its application to waveform inversion | |
MXPA06012781A (es) | Inversion de forma de onda llena en pila previa en 3-d. | |
Golubev et al. | Simulation of seismic wave propagation in a multicomponent oil deposit model | |
CN113947198A (zh) | 一种基于非线性自回归神经网络模型的测井曲线重构方法 | |
CN111856596A (zh) | 层状介质电阻率各向异性海洋可控源电磁快速反演方法 | |
CN113780346B (zh) | 一种先验约束分类器调整方法、系统及可读存储介质 | |
CN116047583A (zh) | 基于深度卷积神经网络的自适应波阻抗反演方法及系统 | |
Jiang et al. | Full waveform inversion based on inversion network reparameterized velocity | |
CN116167288B (zh) | 一种ua2ft半监督迁移学习建模方法、介质及设备 | |
Bazulin et al. | Determination of the elastic parameters of a VTI medium from sonic logging data using deep learning | |
CN117173350B (zh) | 基于主动领域适应学习的地质建模方法、系统及介质 | |
CN110441815B (zh) | 基于差分进化及块坐标下降的模拟退火瑞雷波反演方法 | |
Jun Park et al. | Realistic synthetic data generation using neural style transfer: Application to automatic fault interpretation | |
Colombo et al. | Machine-learning inversion via adaptive learning and statistical sampling: Application to airborne micro-TEM for seismic sand corrections | |
CN117173350A (zh) | 基于主动领域适应学习的地质建模方法、系统及介质 | |
US20210374465A1 (en) | Methodology for learning a similarity measure between geophysical objects | |
US11208886B2 (en) | Direct hydrocarbon indicators analysis informed by machine learning processes | |
Luo et al. | Semisupervised seismic impedance inversion with data augmentation and uncertainty analysis | |
CN112836802B (zh) | 一种半监督学习方法、岩性预测方法及存储介质 | |
Xu et al. | Subsurface lithofacies identification with meta learning | |
Dunham et al. | Toward a semisupervised machine learning application to seismic facies classification | |
Gupta et al. | Improving Automatic Estimation of Rock Properties in the Presence of Geological Complexes Using Machine Learning | |
Yuan et al. | A convolutional neural network for prestack fracture detection | |
Torres et al. | A deep-learning inverse Hessian preconditioning for iterative least-squares migration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |