CN109255147A - 顾及样本数据分布特征的多点地质统计学随机模拟方法 - Google Patents

顾及样本数据分布特征的多点地质统计学随机模拟方法 Download PDF

Info

Publication number
CN109255147A
CN109255147A CN201810844515.8A CN201810844515A CN109255147A CN 109255147 A CN109255147 A CN 109255147A CN 201810844515 A CN201810844515 A CN 201810844515A CN 109255147 A CN109255147 A CN 109255147A
Authority
CN
China
Prior art keywords
node
path
simulated
data
stochastic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810844515.8A
Other languages
English (en)
Inventor
陈麒玉
刘刚
李新川
张夏林
张志庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN201810844515.8A priority Critical patent/CN109255147A/zh
Publication of CN109255147A publication Critical patent/CN109255147A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了顾及样本数据分布特征的多点地质统计学随机模拟方法,针对空间分布不均匀的地质调查和勘查数据,提出了对已知样本数据分布密度敏感的模拟路径优化策略和基于空间分区的数据事件构建方案;首先根据待模拟结点搜索邻域内已知结点的数目对模拟路径进行重新排序;然后在构建数据事件时,将模拟网格进行空间分区,均匀地从每个分区内获取距离待模拟结点最近的一定数目的已知结点构成数据事件;最后通过数据事件扫描训练图像,获得所述数据事件对应的多点统计信息,并按照其中心结点处属性的概率分布,最终得到待模拟节点的属性值。本发明的有益效果为:拓展了多点地质统计学随机模拟方法对分布不均的实际地质调查和勘察数据的适用性。

Description

顾及样本数据分布特征的多点地质统计学随机模拟方法
技术领域
本发明涉及地质统计模拟及建模领域,尤其涉及顾及样本数据分布特征的多点地质统计学随机模拟方法。
背景技术
多点地质统计学模拟方法来源于储层沉积相建模,它同时兼备了传统两点地质统计学和基于目标的模拟方法的优势。多点地质统计学方法已经成为复杂地学现象模拟领域的一个重要分支,其基本理论的发展以及各种算法的提出为各向异性的复杂地学现象的描述提供了技术保障,并且已经在储层模拟、水文地质建模、多孔介质重构等多个地学领域中取得了较好的应用。
多点地质统计学方法旨在通过直接从训练图像中提取空间模式而不是利用变差函数来描述空间异构几何特征。其中模拟路径和数据事件的选择是多点地质统计学随机模拟方法中的两个关键步骤。所谓模拟路径,就是指模拟过程中网格结点的访问顺序。一个数据事件代表着以当前待模拟结点为中心,一定搜索邻域内的空间模式。多点地质统计学方法就是通过数据事件与训练图像中模式的匹配来捕获由多个点确定的特定模式的高维统计信息的。
随机路径是序贯模拟过程中最常用的结点访问路径,即以随机顺序访问模拟网格中的所有未知位置。每个网格位置在统计学意义上具有同等的优先权,整个模拟网格将根据随机路径的顺序依次被模拟和填充。但是,对于分布极不均匀的已知样本,随机模拟路径很难保证能够获取有效的数据事件,尤其是在模拟刚开始阶段。使用不同的随机种子可以生成不同的随机路径,所获取的模拟结果也将是不同的,但从统计学意义上看,所有的模拟结果都保持了相似的统计特征。由此可见,已有的随机路径虽然对分布均匀的已知样本数据的模拟效果较好,但对于分布极不均匀的实际地质调查数据,其有效性受到了限制。
搜索邻域是地质统计学中的重要概念,但是区别于传统两点地质统计学方法,多点地质统计学模拟方法中的搜索邻域是用来确定以待模拟结点为中心的空间模式。大多数的多点地质统计学模拟方法都使用了固定的邻域确定方法,即数据样板。一个数据样板是由围绕着中心结点的若干个网格结点组成的特定图案。数据样板的大小会影响多点地质统计学算法对不同尺度的空间模式的重构能力。通过数据样板与已知图像匹配后获得的结点位置属性已知的图案被称为数据事件。与固定尺寸的数据样板相比,Mariethoz等(2010)在其提出的多点地质统计模拟方法Direct Sampling(简称DS)中使用了一种灵活可变的搜索邻域来确定数据事件。该方法通过给定邻域的搜索半径和最大结点数目来确定数据事件。在该策略中,一次模拟中数据事件的样式是多变的,而且随着模拟的继续,已知结点的密度逐渐增加,这样在最大结点数目的控制下数据事件的分布越来越集中,这保证了对不同尺度的空间模式的重构能力。但是,这些方法都没有考虑数据事件的空间分布情况,可能导致获取的数据事件中的结点集中分布在中心待模拟结点的某一个方向上,而不是均匀的分布在其周围。这将使得所获得的空间模式不是对待模拟点周围各个方向上分布模式的综合考量,因此其无法较好地应用于分布极不均匀的实际地质调查数据的模拟。
综上所述,对于均匀分布的条件数据,已有的随机模拟路径可以取得较好的模拟结果。但是,在实际的地质调查和地质勘查过程中,所获取的数据往往是分布不均匀的,如:野外数据采集往往沿着规划的线路进行数据采集,钻孔数据则都集中于钻井方向这一个维度。由于受到这些来自于实际地质调查数据空间分布特征的限制,传统的基于多点地质统计学的随机模拟方法无法较好地应用于此类数据的模拟与建模中。其中受数据分布特征影响最大的就是模拟路径的和数据事件的选择。因此,有必要提出一种顾及样本数据分布特征的多点地质统计学随机模拟方法,尤其是针对模拟路径和数据事件的选择这两个关键步骤进行改进和优化,使其能够适应于实际地质调查数据的模拟要求。
发明内容
为了解决上述问题,本发明提供了顾及样本数据分布特征的多点地质统计学随机模拟方法,主要包括以下步骤:
(1)加载已知样本数据,并根据已知样本数据的空间位置将已知样本数据分配到模拟网格中;
(2)确定一条随机模拟路径path_list,得到模拟路径path_list中所有结点对应的邻域R内已知结点的数目;
(3)判断path_list.size()>0是否成立;若是,则存在待模拟结点,转到步骤(4);若否,则转到步骤(12);path_list.size()获取模拟路径path_list中的所有剩余结点数目;
(4)根据已知结点的数目informed_points,按照从大到小的顺序对所述模拟路径path_list中的所有剩余结点进行重新排序,得到新的模拟路径;
(5)获取新的模拟路径中的第一个结点,作为当前待模拟结点x;
(6)以当前待模拟结点x为中心,将模拟网格进行空间分区,根据给定的邻域R,从每个分区中获取若干个已知结点,构成所述当前待模拟结点对应的数据事件Nx;
(7)扫描已知的整个训练图像TI,查找所有与数据事件Nx相匹配的模式的出现的频数;
(8)确定所有相匹配的模式的中心位置处的属性Z(x)对应的条件概率密度函数;
(9)从所述条件概率密度函数的概率分布中随机提取一个对应位置的属性值,将所述属性值赋给当前待模拟结点x;
(10)更新当前待模拟结点x的邻域R内所有还未被模拟的位置对应的结点中的已知结点的数目informed_points;
(11)从模拟路径path_list中移除当前模拟结点x,并转到步骤(3);
(12)保存结果,结束模拟。
进一步地,在步骤(2)中,所述模拟路径包含所有未知结点,根据给定的邻域R,得到在所述模拟路径path_list中所有结点对应的邻域R内已知结点的数目informed_points。
进一步地,在步骤(6)中,均匀地从每个分区获取距离待模拟结点最近的已知结点的个数为n=N/c,其中N为数据事件Nx可包含结点的最大个数,c为分区数。
进一步地,在步骤(10)中,如果所述新的模拟路径中某结点距离当前模拟结点x的距离小于邻域R的距离,则更新当前待模拟结点x的邻域R内所有还未被模拟的位置对应的结点中的已知结点的数目informed_points,即将对应的结点中已知结点的数目informed_points加1,即执行informed_points++。
本发明提供的技术方案带来的有益效果是:提高了模拟结果在属性比例再现、空间变异性刻画和空间结构连通性重建等方面的精确性,提升了已有多点地质统计学随机模拟算法的性能,也拓展了多点地质统计学随机模拟方法对分布不均的实际地质调查和勘察数据的适用性。
附图说明
下面将结合附图及实施例对本发明做进一步说明,附图中:
图1是本发明实施例中顾及样本数据分布特征的多点地质统计学随机模拟方法的流程图;
图2是本发明实施例中模拟路径的数据存储结构以及其更新过程示意图;
图3是本发明实施例中两种二维四分区方式及与不分区情况的对比图;
图4是本发明实施例中提供的一个二维实验案例的示意图;
图5是本发明实施例中二维实验案例中模拟结果的统计特性对比图;
图6是本发明实施例中提供的一个三维实验案例的示意图;
图7是本发明实施例中二维实验案例中模拟结果的统计特性对比图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
为了解决现有技术的不足,本发明的实施例提供了顾及样本数据分布特征的多点地质统计学随机模拟方法,针对空间分布不均匀的地质调查和勘查数据,提出了对已知样本数据分布密度敏感的模拟路径优化策略和基于空间分区的数据事件构建方案;首先根据待模拟结点邻域内已知结点的数量对模拟路径进行重新排序,保证每次模拟都是未知待模拟结点中包含周围已知结点密度最高的位置;在进行数据事件构建时,通过将搜索空间进行分区,均匀地从每个分区内获取距离待模拟结点最近的若干个已知结点构成此次模拟的数据事件,保证数据事件中结点更加均匀地分布在待模拟结点周围;然后通过数据事件扫描训练图像,获得当前数据事件对应的多点统计信息,并按照其中心结点处属性的概率分布,最终得到待模拟结点的属性值;最后根据新模拟结点的影响范围,更新邻域内所有未知结点的密度属性,根据该密度属性对模拟路径中的结点进行重新排序,获得新的模拟路径,进行下一个结点的模拟,直到模拟路径中所有结点被模拟。
请参考图1,图1是本发明实施例中顾及样本数据分布特征的多点地质统计学随机模拟方法的流程图,具体包括如下步骤:
(1)加载已知样本数据,并根据已知样本数据的空间位置将已知样本数据分配到模拟网格中;
(2)确定一条随机模拟路径path_list,得到模拟路径path_list中所有结点对应的邻域R内已知结点的数目;首先确定一条包含所有未知网格结点的随机路径path_list,对于path_list中的每一个结点,其数据结构如下:
然后根据给定的邻域R,获得随机路径path_list中所有结点对应的邻域R内已知结点的数目informed_points;
(3)判断path_list.size()>0是否成立;若是,则存在待模拟结点,转到步骤(4);若否,则转到步骤(12);path_list.size()获取模拟路径path_list中的所有剩余结点数目;
(4)根据已知结点的数目informed_points的值,按照从大到小的顺序对模拟路径path_list中的所有剩余结点进行重新排序,得到新的模拟路径;模拟路径path_list中的结点是随着模拟逐渐减少的;如图2所示,图2是本发明实施例中模拟路径的数据存储结构以及其更新过程示意图;
(5)获取新的模拟路径中的第一个结点,作为当前待模拟结点x;
(6)以当前待模拟结点x为中心,将模拟网格进行空间分区,然后根据给定的邻域R,均匀地从每个分区获取距离待模拟结点最近的若干个已知网格结点,构成当前模拟结点对应的数据事件Nx,保证其中结点更加均匀地分布在待模拟结点周围;在该实施例的二维实验案例中,采用四分的型分区方式,在三维实验案例中,采用了正交八分的分区方式;其中从每个分区获取的已知网格结点的最大个数n=N/c,其中N为给定的数据事件可包含结点的最大个数,c为分区数;如图3所示,图3是本发明实施例中两种二维四分区方式(型分区和型分区)及与不分区情况的对比图。
(7)扫描已知的整个训练图像TI,查找所有与数据事件Nx相匹配的模式,并统计匹配模式的出现的频数;
(8)确定所有匹配模式中心位置处的属性Z(x)对应的条件概率密度函数;
(9)从所述条件概率密度函数的概率分布中随机提取一个对应位置的属性值,并将所述属性值赋给当前待模拟结点x;
(10)更新当前待模拟结点x的邻域R内所有还未被模拟的位置对应的结点中的已知结点的数目informed_points;即如果所述新的模拟路径中某结点距离当前模拟结点x的距离小于邻域R,则更新当前待模拟结点x的邻域R内所有还未被模拟的位置对应的结点中的已知结点的数目informed_points,即将对应的结点中已知结点的数目informed_points加1,即执行informed_points++;
(11)从新的模拟路径中移除当前模拟结点x,并转到步骤(3);
(12)保存结果,结束本次模拟。
至此,整个模拟网格上的所有结点的属性值已经全部获得。
为了对比说明本发明提供的优化策略的性能,依次采取了三种优化策略的组合方式,如表1所示:
表1 实施案例中所用到的各种策略的组合方式
为了说明本发明所提供方法的优越性,根据顾及样本数据分布特征的多点地质统计学随机模拟方法的具体步骤分别实施了一个二维和一个三维的实施案例。如图4所示,为本发明实施例中提供的一个二维实验案例。图4(a)为该二维模拟所使用的训练图像(河道分布);图4(b)为该案例使用的200个已知样本数据的分布情况,从图中可以看出已知样本数据的空间分布极不均匀,而且集中在一些特定线路上,这也契合了地质调查过程中沿着特定线路进行数据采集的情况;图4(c)为三种不同策略组合方式下的实现结果。从实现结果中可以看出,原始的DS算法对河道连通性的再现不是很理想(Case 1),而使用了密度敏感的模拟路径的优化策略的结果对曲流河道连通度的再现有了很大的提升(Case 2),考虑空间分区的数据事件的优化方案进一步提升了算法对河道连通性的再现能力(Case 3)。
图5是本发明实施例中二维实验案例中模拟结果的统计特性对比图,为了深层次地揭示模拟结果在统计学特征上与训练图像(参考模型)的差异,该二维实施案例中各个策略组合分别输出15个不同的模拟结果,并和训练图像一起绘制其对应的变差函数曲线(如图5(a))和连通性函数曲线(如图5(b))。从变差函数曲线图可以看出,Case 3的曲线更加集中地分布在训练图像对应的曲线(黑色线条)周围。在连通性函数曲线图中,Case 2、Case 3对应的连通性曲线更加接近于训练图像对应的连通性曲线(黑色线条)。
如图6所示,为本发明实施例中提供的一个三维实验案例。图6(a)为该三维模拟所使用的三维训练图像;图6(b)为该案例使用16个已知钻孔的三维展布情况,可以看到钻孔数据的空间分布也是极其不均匀的;图6(c)为16个已知钻孔的平面分布情况;图6(d)为三种不同策略组合方式下的实现结果。从实现结果中可以看出,原始的DS算法对三维参考模型的模式再现不是很理想(Case 1),Case 2和Case 3的输出结果更加接近三维参考模型中各属性的分布模式。
图7是本发明实施例中二维实验案例中模拟结果的统计特性对比图,从图7中可以看出,与二维案例的统计特征相似,无论是变差函数曲线还是X、Y方向上的连通性函数曲线,使用了两种优化策略的Case 3的10个实现结果的统计特征都更加接近三维参考模型。
本发明的有益效果为:上述两个实施案例表明本发明提供的方法的模拟结果在属性比例再现、空间变异性刻画和空间结构连通性重建等方面都更加接近于训练图像的对应特征,即提高了模拟结果在属性比例再现、空间变异性刻画和空间结构连通性重建等方面的精确性,这也证实了本发明提供的优化策略提升了已有多点地质统计学随机模拟算法(如DS算法)的性能,尤其是对空间分布极不均匀的已知样本数据,使得多点地质统计学随机模拟方法能够适用于分布不均的实际地质调查和勘察数据的模拟与描述。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.顾及样本数据分布特征的多点地质统计学随机模拟方法,其特征在于:包括以下步骤:
(1)加载已知样本数据,并根据已知样本数据的空间位置将已知样本数据分配到模拟网格中;
(2)确定一条随机模拟路径path_list,得到模拟路径path_list中所有结点对应的邻域R内已知结点的数目;
(3)判断path_list.size()>0是否成立;若是,则存在待模拟结点,转到步骤(4);若否,则转到步骤(12);path_list.size()获取模拟路径path_list中的所有剩余结点数目;
(4)根据已知结点的数目informed_points,按照从大到小的顺序对所述模拟路径path_list中的所有剩余结点进行重新排序,得到新的模拟路径;
(5)获取新的模拟路径中的第一个结点,作为当前待模拟结点x;
(6)以当前待模拟结点x为中心,将模拟网格进行空间分区,根据给定的邻域R,从每个分区中获取若干个已知结点,构成所述当前待模拟结点对应的数据事件Nx;
(7)扫描已知的整个训练图像TI,查找所有与数据事件Nx相匹配的模式的出现的频数;
(8)确定所有相匹配的模式的中心位置处的属性Z(x)对应的条件概率密度函数;
(9)从所述条件概率密度函数的概率分布中随机提取一个对应位置的属性值,将所述属性值赋给当前待模拟结点x;
(10)更新当前待模拟结点x的邻域R内所有还未被模拟的位置对应的结点中的已知结点的数目informed_points;
(11)从模拟路径path_list中移除当前模拟结点x,并转到步骤(3);
(12)保存结果,结束模拟。
2.如权利要求1所述的顾及样本数据分布特征的多点地质统计学随机模拟方法,其特征在于:在步骤(2)中,所述模拟路径包含所有未知结点,根据给定的邻域R,得到在所述模拟路径path_list中所有结点对应的邻域R内已知结点的数目informed_points。
3.如权利要求1所述的顾及样本数据分布特征的多点地质统计学随机模拟方法,其特征在于:在步骤(6)中,均匀地从每个分区获取距离待模拟结点最近的已知结点的个数为n=N/c,其中N为数据事件Nx可包含结点的最大个数,c为分区数。
4.如权利要求1所述的顾及样本数据分布特征的多点地质统计学随机模拟方法,其特征在于:在步骤(10)中,如果所述新的模拟路径中某结点距离当前模拟结点x的距离小于邻域R的距离,则更新当前待模拟结点x的邻域R内所有还未被模拟的位置对应的结点中的已知结点的数目informed_points,即将对应的结点中已知结点的数目informed_points加1,即执行informed_points++。
CN201810844515.8A 2018-07-27 2018-07-27 顾及样本数据分布特征的多点地质统计学随机模拟方法 Pending CN109255147A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810844515.8A CN109255147A (zh) 2018-07-27 2018-07-27 顾及样本数据分布特征的多点地质统计学随机模拟方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810844515.8A CN109255147A (zh) 2018-07-27 2018-07-27 顾及样本数据分布特征的多点地质统计学随机模拟方法

Publications (1)

Publication Number Publication Date
CN109255147A true CN109255147A (zh) 2019-01-22

Family

ID=65049895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810844515.8A Pending CN109255147A (zh) 2018-07-27 2018-07-27 顾及样本数据分布特征的多点地质统计学随机模拟方法

Country Status (1)

Country Link
CN (1) CN109255147A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706966A (zh) * 2009-11-06 2010-05-12 上海第二工业大学 基于二维图像和多点统计方法的多孔介质三维重构方法
CN103886216A (zh) * 2014-04-04 2014-06-25 中国石油大学(北京) 一种基于地质矢量信息的多点地质统计方法
CN104504754A (zh) * 2014-12-29 2015-04-08 中国石油天然气股份有限公司 一种多点统计建模的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706966A (zh) * 2009-11-06 2010-05-12 上海第二工业大学 基于二维图像和多点统计方法的多孔介质三维重构方法
CN103886216A (zh) * 2014-04-04 2014-06-25 中国石油大学(北京) 一种基于地质矢量信息的多点地质统计方法
CN104504754A (zh) * 2014-12-29 2015-04-08 中国石油天然气股份有限公司 一种多点统计建模的方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GREGOIRE MARIETHOZ: "A general parallelization strategy for random path based geostatistical simulation methods", 《COMPUTERS&GEOSCIENCES》 *
喻思羽等: "基于样式降维聚类的多点地质统计建模算法", 《石油学报》 *
陈麒玉: "基于多点地质统计学的三维地质体随机建模方法研究", 《中国博士学位论文全文数据库基础科学辑》 *

Similar Documents

Publication Publication Date Title
CN103886216B (zh) 一种基于地质矢量信息的多点地质统计方法
EP2223167B1 (en) Multipoint geostatistics method using branch runlength compression and local grid transformation
Zhang A parallel algorithm for adaptive local refinement of tetrahedral meshes using bisection
WO2021147529A1 (zh) 基于更新概率比率恒定理论的多点地质统计叠前反演方法
CN108228972A (zh) 确定用于可重配置逻辑器件的至少一个电路的布置的方法和计算机程序
CN106651392A (zh) 一种智能商业选址方法、装置及系统
CN109409499A (zh) 一种基于深度学习和卡尔曼滤波修正的轨迹恢复方法
CN108931811B (zh) 基于多点地质统计的地震储层反演方法
CN109190653A (zh) 基于半监督密度聚类的恶意代码家族同源性分析技术
CN104504754B (zh) 一种油气储层多点统计建模的方法及装置
Wu et al. Fast FILTERSIM simulation with score-based distance
US20120150501A1 (en) Reservoir geobody calculation
CN108416841A (zh) 基于局部搜索策略的多点统计三维地质模型自动重构方法
CN103020267A (zh) 基于三角簇多标签传播的复杂网络社区结构挖掘方法
CN109615550A (zh) 一种基于相似性的局部社团检测方法
CN114692471B (zh) 一种岩溶地下水系统流网模拟方法
Gómez et al. Fast methods for eikonal equations: an experimental survey
CN105425286A (zh) 地震走时获取方法及基于其的井间地震走时层析成像方法
CN111538879A (zh) 一种基于半监督卷积神经网络的储层预测方法
CN103678899B (zh) 一种基于可变影响比的油气藏多点统计建模方法及设备
US20190392094A1 (en) Watershed marching-delineation algorithm
Zhang et al. Solving open quasigroup problems by propositional reasoning
Wang et al. A new method for measuring topological structure similarity between complex trajectories
CN109255147A (zh) 顾及样本数据分布特征的多点地质统计学随机模拟方法
US20190361147A1 (en) Designing a geological simulation grid

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190122