CN105426626B - 基于相似数据样式聚类的多点地质统计学建模方法 - Google Patents

基于相似数据样式聚类的多点地质统计学建模方法 Download PDF

Info

Publication number
CN105426626B
CN105426626B CN201510903204.0A CN201510903204A CN105426626B CN 105426626 B CN105426626 B CN 105426626B CN 201510903204 A CN201510903204 A CN 201510903204A CN 105426626 B CN105426626 B CN 105426626B
Authority
CN
China
Prior art keywords
data
styles
point
metadata
data styles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510903204.0A
Other languages
English (en)
Other versions
CN105426626A (zh
Inventor
喻思羽
李少华
段太忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangtze University
Original Assignee
Yangtze University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangtze University filed Critical Yangtze University
Priority to CN201510903204.0A priority Critical patent/CN105426626B/zh
Publication of CN105426626A publication Critical patent/CN105426626A/zh
Application granted granted Critical
Publication of CN105426626B publication Critical patent/CN105426626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于相似数据样式聚类的多点地质统计学建模方法,它对样式数据库的所有数据样式做了降维计算,把相同的降维数据样式所对应的数据样式归为同一类即相似数据样式聚类,并计算相似数据样式聚类的数据样式代表,在模拟过程中,将待估点u处的数据事件与数据样式代表进行相似性计算,再与最相似的数据样式代表对应的相似数据样式聚类中所有数据样式进行相似性计算,得到最相似数据样式。而SIMPAT算法在模拟过程中,需将待估点u处的数据事件与样式数据库中所有数据样式进行相似性计算。因此,相比SIMPAT算法,本发明大大提高了多点地质统计学建模算法的效率。

Description

基于相似数据样式聚类的多点地质统计学建模方法
技术领域
本发明涉及储层地质建模技术领域,具体是指一种基于相似数据样式聚类的多点地质统计学建模方法。
背景技术
多点地质统计学是相对于基于变差函数的两点地质统计学而言的。在两点统计里,储集层相关性通过空间两点协方差(变差函数)进行描述。在多点统计里,则是利用空间多个点组合模式进行描述。空间多点组合样式称为数据样板,如果在空间点赋予了值,则为一个特定的空间多点组合模式,称为数据事件。在建模时,对每一个未知点,估计在其处满足给定条件的数据事件出现的概率,随后抽样获得未知点处值或者数据事件,即完成单次模拟。一旦所有节点得到访问,即完成一次模拟实现。
基于多点地质统计学建模算法对油田高效开发具有重要支持作用。Arpat在2003年Stanford油藏预测中心会议上提出基于样式的多点地质统计学算法SIMPAT。SIMPAT是一种完全不同于传统建模的多点统计方法,它结合了计算机视觉及图像处理方面的理论,将地下储集层建模作为储集层图像的恢复过程。采用相似性方法对地下储集层进行图像恢复和再现。数据事件与数据样式之间的相似性由曼哈顿距离函数来表述:
其中,devT(u)表示待估点u处的数据事件,patT为训练图像内的数据样式,nT为数据事件的样板框架包含的点的个数,h是节点的向量。选择训练图像中最相似的数据样式替换待估点处数据事件。直至所有待估点都访问并模拟,完成一次随机模拟实现。
随着油田开发的不断深入,地质研究的精度越来越高,从而地质模型的尺度越来越小,例如很多开发中后期的老油田,地质建模的精度达到平面网格划分为10m×10m,纵向0.5m,甚至更小。目前普遍采用随机模拟技术建立地质模型,通常需要建立多个地质模型实现(如100个),甚至是三维模型。因此,地质建模的效率逐渐成为关注的热点问题。计算热点是程序代码需要耗费大量时间运行的部分,通常是计算性能瓶颈。SIMPAT算法的计算热点主要是数据事件与数量庞大的样式数据库中所有数据样式的相似性计算,因此,计算性能成为普及基于数据样式建模算法的瓶颈。
因此,亟需研究一种针对SIMPAT算法的加速计算改进方法,从而能高效地使用样式相似度匹配策略进行多点地质统计建模。
发明内容
本发明的目的在于提供一种基于相似数据样式聚类的多点地质统计学建模方法,相比SIMPAT算法,本发明大大提高了多点地质统计学建模算法的效率。
为实现上述目的,本发明采用以下技术方案:本发明基于相似数据样式聚类的多点地质统计学建模方法,包括以下步骤:
1)将数据样板扫描训练图像,得到由多个数据样式组成的样式数据库;
2)将样式数据库中的所有数据样式进行等间距取样,得到降维数据样式;将相同的降维数据样式对应的数据样式归位同一类,得到相似数据样式聚类;
3)计算相似数据样式聚类的数据样式代表;
4)构建模拟实现的随机路径;
5)遍历随机路径中的待估点u,将数据样板扫描模拟实现获得待估点u处的数据事件;
6)将待估点u处的数据事件与数据样式代表进行相似性计算,得到与待估点u处的数据事件最相似的数据样式代表,再计算待估点u处的数据事件与最相似的数据样式代表对应的相似数据样式聚类中所有数据样式进行相似性计算,得到最相似数据样式;
7)最相似数据样式替换待估点u处的数据事件;
8)重复步骤5)至步骤7)的操作,直至随机路径中所有待估点都访问完毕;
在步骤3)中,对相似数据样式聚类中所有数据样式进行点对点取平均值得到数据样式代表,数据样式代表的节点计算公式为:
其中,Grepat为数据样式代表的网格体,Gpat为相似数据样式聚类中任一个数据样式的网格体,N是相似数据样式聚类中数据样式的总数,i、j、k分别表示数据样式或数据样式代表的数据载体网格体的网格单元的X方向索引、Y方向索引、Z方向索引。
优选地,在步骤2)中,采用等间距取样法对样式数据库中任一数据样式的网格单元进行等间距取样,得到降维数据样式,等间距取样的公式为
GThumPat(i,j,k)=GPat(i×ri,j×rj,k×rk),
其中ri=IPat/IThumPat,rj=JPat/JThumPat,rk=KPat/KThumPat,GThumPat为降维数据样式的网格体,GPat为数据样式的网格体,IPat、JPat、KPat表示数据样式的数据载体网格体在X方向、Y方向和Z方向的维度,IThumPat、JThumPat、KThumPat表示降维数据样式的数据载体网格体在X方向、Y方向和Z方向的维度,i、j、k分别表示数据样式或降维数据样式的数据网格体的网格单元的X方向索引、Y方向索引、Z方向索引。
再进一步地,在步骤6)中,待估点u处的数据事件与数据样式代表之间、待估点u处的数据事件与数据样式之间的相似性通过曼哈顿距离函数来计算,曼哈顿距离函数为
其中,其中,devT(u+hα)表示待估点u处的数据事件,repatT(hα)、patT(hα)分别表示数据样式代表、数据样式。
本发明的有益效果在于:本发明对样式数据库的所有数据样式做了降维计算,把相同的降维数据样式所对应的数据样式归为同一类即相似数据样式聚类,并计算相似数据样式聚类的数据样式代表,在模拟过程中,将待估点u处的数据事件与数据样式代表进行相似性计算,再与最相似的数据样式代表对应的相似数据样式聚类中所有数据样式进行相似性计算,得到最相似数据样式。而SIMPAT算法在模拟过程中,需将待估点u处的数据事件与样式数据库中所有数据样式进行相似性计算。因此,相比SIMPAT算法,本发明大大提高了多点地质统计学建模算法的效率。
附图说明
图1为数据样板扫描训练图像建立样式数据库的原理图;
图2为数据样式进行等间距取样得到降维数据样式的原理图;
图3为相似数据样式聚类、降维数据样式和数据样式代表的关系图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步的详细描述,但该实施例不应该理解为对本发明的限制。
为了很好地理解本发明,下面给出相关术语解释:
1、网格单元C:沿着X方向、Y方向和Z方向上具有指定长(ISize)、宽(JSize)、高(KSize)的矩形立方单元,网格单元C存储具体数值代表其属性。
2、网格体G:由若干网格单元C构成的三维结构体,在X方向、Y方向和Z方向的维度是I×J×K,本质是三维矩阵。G(i,j,k)的含义是网格体中X方向的索引为i、Y方向索引为j、Z方向索引为k的网格单元。
3、训练图像TI:是指先验地质概念模型,其采用网格体GTI作为数据载体,是能够表述实际储层结构、几何形态及其分布模式的数字化模型。
4、模拟实现R:是指模拟的模型结果,其采用网格体GR作为数据载体,是能够表述实际储层结构、几何形态及其分布模式的数字化模型。
5、数据样板T:是指围绕中心单元对称的结构体,其采用网格体GT作为数据载体,是能够表述实际储层结构、结合形态及其分布模式的局部数字化模型,是基于样式的多点地质统计学建模方法的基本结构单元。
6、数据样式Pat:是指将数据样板T为框架扫描训练图像TI得到的局部空间数据组合体,其采用网格体GPat作为数据载体。
7、数据事件Dev:是指将数据样板T为框架扫描模拟实现R得到的局部空间数据组合体,其采用网格体GDev作为数据载体。
6、样式数据库PatDB:是指将数据样板T扫描训练图像TI获取的所有数据样式Pat的集合。
8、降维数据样式ThumPat:将样式数据库PatDB中的所有数据样式Pat进行等间距取样,得到降维数据样式。
9、相似数据样式聚类PatC:将样式数据库PatDB中的所有数据样式Pat进行等间距取样,得到降维数据样式,然后将相同的降维数据样式所对应的数据样式归位同一类,得到相似数据样式聚类。
10、数据样式代表RepPat:是采用点对点计算平均值方法对某一相似数据样式聚类PatC内所有数据样式Pat做计算处理,得到表示该相似数据样式聚类PatC主要特点的数据样式。
本发明提供一种基于相似数据样式聚类的多点地质统计学建模方法,包括以下步骤:
1)将数据样板扫描训练图像,得到由多个数据样式组成的样式数据库,图1所示;
2)将样式数据库中的所有数据样式进行等间距取样,得到降维数据样式,如图2所示;将相同的降维数据样式对应的数据样式归位同一类,得到相似数据样式聚类,如图3所示。其中,采用等间距取样法对样式数据库中任一数据样式的网格单元进行等间距取样,得到降维数据样式,等间距取样的公式为
GThumPat(i,j,k)=GPat(i×ri,j×rj,k×rk)
其中ri=IPat/IThumPat,rj=JPat/JThumPat,rk=KPat/KThumPat,GThumPat为降维数据样式的网格体,GPat为数据样式的网格体,IPat、JPat、KPat表示数据样式的数据载体网格体的X方向、Y方向和Z方向的维度,IThumPat、JThumPat、KThumPat表示降维数据样式的数据载体网格体的X方向、Y方向和Z方向的维度,i、j、k分别表示数据样式或降维数据样式的数据载体网格体的网格单元的X方向索引、Y方向索引、Z方向索引。
3)计算相似数据样式聚类的数据样式代表,如图3所示。其中,对相似数据样式聚类中所有数据样式进行点对点取平均值得到数据样式代表,数据样式代表的节点计算公式为:
其中,Grepat为数据样式代表的网格体,Gpat为相似数据样式聚类中任一个数据样式的网格体,N是相似数据样式聚类中数据样式的总数,i、j、k分别表示数据样式或数据样式代表的数据载体网格体的网格单元的X方向索引、Y方向索引、Z方向索引。
4)构建模拟实现的随机路径;
5)遍历随机路径中的待估点u,将数据样板扫描模拟实现获得待估点u处的数据事件;
6)将待估点u处的数据事件与数据样式代表进行相似性计算,得到与待估点u处的数据事件最相似的数据样式代表,再计算待估点u处的数据事件与最相似的数据样式代表对应的相似数据样式聚类中所有数据样式进行相似性计算,得到最相似数据样式。其中,待估点u处的数据事件与数据样式代表之间、待估点u处的数据事件与数据样式之间的相似性通过曼哈顿距离函数来计算,曼哈顿距离函数为
其中,devT(u+hα)表示待估点u处的数据事件,repatT(hα)、patT(hα)分别表示数据样式代表、数据样式。
7)最相似数据样式替换待估点u处的数据事件;
8)重复步骤5)至步骤7)的操作,直至随机路径中所有待估点都访问完毕。
下面分别采用SIMPAT算法和本发明算法对以两幅二值图像作为训练图像计算100个非条件模拟实现,比较两者算法的计算耗时来检验本发明算法在提高建模效率方面的改进效果。其一是二维Largetrain河流相数字模型,其维度为250×250,网格单元尺寸为1m×1m。另一个是三维fluvsim河流相数字模型,其维度为69×69×39,网格单元尺寸是1m×1m×1m。
参见表1,采用SIMPAT算法和本发明算法计算100个非条件模拟实现的计算耗时对比:(1)以二维Largetrain河流相数字模型作为训练图像,模拟实现的网格体维度为250×250,数据样板的维度为9×9,降维数据样式的维度为5×5,SIMPAT的计算耗时是5245秒,本发明算法的计算耗时是204秒,本发明算法的计算效率相比SIMPAT算法提高25倍;(2)以三维fluvsim河流相数字模型作为训练图像,模拟实现的网格体维度为69×69×39,数据样板的维度为11×11×5,降维数据样式的维度为5×5×3,SIMPAT的计算耗时是96588秒,本发明算法的计算耗时是1498秒,本发明算法的计算效率相比SIMPAT算法提高64倍。
表1SIMPAT算法和本发明算法计算100个模拟实现的计算耗时对比表
从表1可以看出,本发明大大提高了多点地质统计学建模算法的效率。
本说明书中未作详细描述的内容,属于本专业技术人员公知的现有技术。

Claims (3)

1.一种基于相似数据样式聚类的多点地质统计学建模方法,其特征在于:包括以下步骤:
1)将数据样板扫描训练图像,得到由多个数据样式组成的样式数据库;
2)将样式数据库中的所有数据样式进行等间距取样,得到降维数据样式;将相同的降维数据样式对应的数据样式归位同一类,得到相似数据样式聚类;
3)计算相似数据样式聚类的数据样式代表;
4)构建模拟实现的随机路径;
5)遍历随机路径中的待估点u,将数据样板扫描模拟实现获得待估点u处的数据事件;
6)将待估点u处的数据事件与数据样式代表进行相似性计算,得到与待估点u处的数据事件最相似的数据样式代表,再计算待估点u处的数据事件与最相似的数据样式代表对应的相似数据样式聚类中所有数据样式进行相似性计算,得到最相似数据样式;
7)最相似数据样式替换待估点u处的数据事件;
8)重复步骤5)至步骤7)的操作,直至随机路径中所有待估点都访问完毕;
在步骤3)中,对相似数据样式聚类中所有数据样式进行点对点取平均值得到数据样式代表,数据样式代表的节点计算公式为:
其中,Grepat(i,j,k)为数据样式代表的网格体,Gpat(i,j,k)为相似数据样式聚类中任一个数据样式,N是相似数据样式聚类中数据样式的总数,i、j、k分别表示数据样式或数据样式代表的数据载体网格体的网格单元的X方向索引、Y方向索引、Z方向索引。
2.根据权利要求1所述的基于相似数据样式聚类的多点地质统计学建模方法,其特征在于:在步骤2)中,采用等间距取样法对样式数据库中任一数据样式的网格单元进行等间距取样,得到降维数据样式,等间距取样的公式为
GThumPat(i,j,k)=GPat(i×ri,j×rj,k×rk),
其中ri=IPat/IThumPat,rj=JPat/JThumPat,rk=KPat/KThumPat,GThumPat为降维数据样式的网格体,GPat为数据样式的网格体,IPat、JPat、KPat表示数据样式的数据载体网格体的X方向、Y方向和Z方向的维度,IThumPat、JThumPat、KThumPat表示降维数据样式的数据载体网格体的X方向、Y方向和Z方向的维度,i、j、k分别表示数据样式或降维数据样式的数据载体网格体的网格单元的X方向索引、Y方向索引、Z方向索引。
3.根据权利要求1所述的基于相似数据样式聚类的多点地质统计学建模方法,其特征在于:在步骤6)中,待估点u处的数据事件与数据样式代表之间、待估点u处的数据事件与数据样式之间的相似性通过曼哈顿距离函数来计算,曼哈顿距离函数为
其中,devT(u+hα)表示待估点u处的数据事件,repatT(hα)、patT(hα)分别表示数据样式代表、数据样式。
CN201510903204.0A 2015-12-08 2015-12-08 基于相似数据样式聚类的多点地质统计学建模方法 Active CN105426626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510903204.0A CN105426626B (zh) 2015-12-08 2015-12-08 基于相似数据样式聚类的多点地质统计学建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510903204.0A CN105426626B (zh) 2015-12-08 2015-12-08 基于相似数据样式聚类的多点地质统计学建模方法

Publications (2)

Publication Number Publication Date
CN105426626A CN105426626A (zh) 2016-03-23
CN105426626B true CN105426626B (zh) 2018-09-25

Family

ID=55504835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510903204.0A Active CN105426626B (zh) 2015-12-08 2015-12-08 基于相似数据样式聚类的多点地质统计学建模方法

Country Status (1)

Country Link
CN (1) CN105426626B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108986217B (zh) * 2017-05-31 2021-07-27 中国石油化工股份有限公司 基于图型矢量距离的多点地质统计学建模方法
WO2023178553A1 (en) * 2022-03-23 2023-09-28 Saudi Arabian Oil Company Method for obtaining geological heterogeneity trends of a geological formation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706845A (zh) * 2009-11-03 2010-05-12 上海第二工业大学 一种基于软硬数据的信息预测方法
WO2010057505A8 (en) * 2008-11-20 2011-06-30 Université De Neuchâtel A deterministic version of the multiple point geostatistics simulation / reconstruction method with. the simulated / reconstructed values are directly taken from the training images without prior estimation of the conditional
CN104850682A (zh) * 2015-04-17 2015-08-19 长江大学 基于位置的多点地质统计学建模方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2223167B1 (en) * 2007-12-21 2011-11-09 Services Pétroliers Schlumberger Multipoint geostatistics method using branch runlength compression and local grid transformation
US9116258B2 (en) * 2012-04-03 2015-08-25 Schlumberger Technology Corporation Parallel multipoint geostatistics simulation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010057505A8 (en) * 2008-11-20 2011-06-30 Université De Neuchâtel A deterministic version of the multiple point geostatistics simulation / reconstruction method with. the simulated / reconstructed values are directly taken from the training images without prior estimation of the conditional
CN101706845A (zh) * 2009-11-03 2010-05-12 上海第二工业大学 一种基于软硬数据的信息预测方法
CN104850682A (zh) * 2015-04-17 2015-08-19 长江大学 基于位置的多点地质统计学建模方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Fast direct sampling for multiple-point stochastic simulation;Mohammad J. Abdollahifard_et al;《Arabian Journal of Geosciences》;20140531;第7卷(第5期);第1927-1939页 *
基于沉积过程建模算法Alluvsim的改进;李少华 等;《石油学报》;20130115;第140-144页 *
多点地质统计学研究进展与展望;尹艳树 等;《古地理学报》;20110401;第245-252页 *

Also Published As

Publication number Publication date
CN105426626A (zh) 2016-03-23

Similar Documents

Publication Publication Date Title
Nouanesengsy et al. Adr visualization: A generalized framework for ranking large-scale scientific data using analysis-driven refinement
CN111768502A (zh) 一种基于gpu加速技术的非结构网格二维洪水模拟系统
CN106709503B (zh) 一种基于密度的大型空间数据聚类算法k-dbscan
CN103886216B (zh) 一种基于地质矢量信息的多点地质统计方法
Ying et al. An intrinsic algorithm for parallel poisson disk sampling on arbitrary surfaces
CN103914865A (zh) 形成几何图案的面的组
CN108763827B (zh) 一种输电塔有限元模型建立方法及装置
Chen et al. Optimizing parallel performance of streamline visualization for large distributed flow datasets
KR20100052395A (ko) 3차원 변동 커패시턴스 계산을 위한 시스템 및 방법
CN107526895B (zh) 一种古民居群快速建模系统
Hurter et al. Functional decomposition for bundled simplification of trail sets
CN106600578B (zh) 基于遥感影像的特征函数空间滤值回归模型并行化方法
Lu et al. Clustering by Sorting Potential Values (CSPV): A novel potential-based clustering method
Jiang et al. Parallel contributing area calculation with granularity control on massive grid terrain datasets
Mueller‐Roemer et al. Ternary sparse matrix representation for volumetric mesh subdivision and processing on GPUs
CN104239446B (zh) 一种利用辅助变量数据进行采样点布局的方法
CN105426626B (zh) 基于相似数据样式聚类的多点地质统计学建模方法
CN101241520A (zh) 有限元建模中基于特征抑制的模型态生成方法
JPWO2008026261A1 (ja) 有限要素法と境界要素法による結合方程式の高速演算処理方法
CN109961129A (zh) 一种基于改进粒子群的海上静止目标搜寻方案生成方法
CN107506572B (zh) 获取目标点的高度的方法和装置
CN106227929A (zh) 基于各向异性的非平稳建模方法
CN106294540B (zh) 基于p-stable局部敏感哈希检索数据样式的多点地质统计建模方法
CN106846457B (zh) 一种ct切片数据可视化重构的八叉树并行构造方法
CN103942376A (zh) 一种应用于实时头发运动仿真的碰撞修正方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant