CN107330475A - 一种新型无模型贝叶斯分类预测模型软测量方法 - Google Patents
一种新型无模型贝叶斯分类预测模型软测量方法 Download PDFInfo
- Publication number
- CN107330475A CN107330475A CN201710589718.2A CN201710589718A CN107330475A CN 107330475 A CN107330475 A CN 107330475A CN 201710589718 A CN201710589718 A CN 201710589718A CN 107330475 A CN107330475 A CN 107330475A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- free
- classification
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000691 measurement method Methods 0.000 title claims abstract description 20
- 238000010586 diagram Methods 0.000 claims abstract description 29
- 238000005259 measurement Methods 0.000 claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 21
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 20
- 238000004817 gas chromatography Methods 0.000 claims abstract description 17
- 230000009467 reduction Effects 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 abstract description 12
- 238000004519 manufacturing process Methods 0.000 abstract description 4
- 230000015556 catabolic process Effects 0.000 abstract description 2
- 238000006731 degradation reaction Methods 0.000 abstract description 2
- 241000772415 Neovison vison Species 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000004215 Carbon black (E152) Substances 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 229930195733 hydrocarbon Natural products 0.000 description 3
- 150000002430 hydrocarbons Chemical class 0.000 description 3
- 239000011435 rock Substances 0.000 description 3
- 210000000481 breast Anatomy 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000000045 pyrolysis gas chromatography Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 241000364051 Pima Species 0.000 description 1
- HUTDUHSNJYTCAR-UHFFFAOYSA-N ancymidol Chemical compound C1=CC(OC)=CC=C1C(O)(C=1C=NC=NC=1)C1CC1 HUTDUHSNJYTCAR-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000003129 oil well Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 235000020095 red wine Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000004454 trace mineral analysis Methods 0.000 description 1
- 235000014101 wine Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Computer Hardware Design (AREA)
- Marketing (AREA)
- Geometry (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种新型无模型贝叶斯分类预测模型软测量方法,首先通过曲线拟合方法有效地实现对气相色谱图数据的降维和降噪,进而提取气相色谱图数据的特征值,从而缩短分类模型的训练时间而且能够获得更好的泛化能力。本发明使用新型无模型贝叶斯分类算法建立识别模型,这样可以有效避免由于训练样本不满足条件独立性而造成的模型泛化性能下降问题。本发明提供的新型无模型贝叶斯分类预测模型软测量方法通过气相色谱图的测量客观展现了不同条件下油气储层的水淹程度,指明了各油气储层的水淹程度与开采价值,有助于石油钻探公司进一步提高开采效率和降低成本。因此,本发明提供的技术方案具有有效性和适用性。
Description
技术领域
本发明涉及油田开采技术领域,尤其涉及一种新型无模型贝叶斯分类预测模型软测量方法。
背景技术
目前,我国大多数油田采用的是注水方式开采,长期的注水开采方式,使很多油田的含水量很高。录井技术是油气勘探开发活动中最基本的技术,是发现、评估油气藏最及时、最直接的手段。油藏地球化学录井技术是应用油藏地球化学的方法,通过特定的仪器检测岩石中与油气密切相关的烃信息,评价生油岩和储集岩,判断储注水开发区储层的水淹程度,寻找剩余油,为油田的勘探开发提供地质依据。通过热解气相色谱技术对固体样品进行检测,可以获得包含C13-C37 之间的蒸发烃气相色谱图,每幅色谱图由40000个时间序列数据组成,色谱图具有复杂、非线性、含噪声等特性。
国内外的工程师对油气层的识别也提出了多种解决方法,其中包括原始数据法、图版解释法、参数法、图谱比较法等综合评价方法。然而,从识别所花费的时间和效果方面来说都不是很理想。因此,人工对油气层进行检测主要是依赖录井解释工程师的实际经验,存在着很大的偶然性和误差。
发明内容
为解决上述问题,本发明提供一种新型无模型贝叶斯分类预测模型软测量方法,至少部分解决上述技术问题。
为此,本发明提供一种新型无模型贝叶斯分类预测模型软测量方法,包括:
获取油气层的气相色谱图数据;
根据曲线拟合法获取所述气相色谱图数据的特征值,以实现所述气相色谱图数据的降维和降噪;
对所述气相色谱图数据的特征值进行归一化处理,以形成测量样本;
根据预设的无模型贝叶斯分类器分类预测算法对所述测量样本对应的类别进行预测,以获得所述测量样本对应的类别;
根据所述测量样本对应的类别对所述油气层进行分析,以获得所述油气层的水淹程度和开采价值。
可选的,所述无模型贝叶斯分类器分类预测算法如下:
其中p(Y=cj)=φj,φj∈[0,1],1{*}是指示函数;
所述测量样本X=[X1...XN]T,所述测量样本对应的类别为 Y=[y1…yN]Tyk∈C={c1,c2,……,cq},每个测量样本Xk对应的类别为yk。
可选的,所述根据预设的无模型贝叶斯分类器分类预测算法对所述测量样本对应的类别进行预测的步骤之前包括:
根据贝叶斯算法形成朴素贝叶斯分类器;
根据最近邻算法形成概率估计器;
根据所述朴素贝叶斯分类器和所述概率估计器形成新型无模型贝叶斯分类器。
本发明具有下述有益效果:
本发明提供的新型无模型贝叶斯分类预测模型软测量方法之中,首先通过曲线拟合方法有效地实现对气相色谱图数据的降维和降噪,进而提取气相色谱图数据的特征值,从而缩短分类模型的训练时间而且能够获得更好的泛化能力。本发明使用新型无模型贝叶斯分类算法建立识别模型,这样可以有效避免由于训练样本不满足条件独立性而造成的模型泛化性能下降问题。本发明提供的新型无模型贝叶斯分类预测模型软测量方法通过气相色谱图的测量客观展现了不同条件下油气储层的水淹程度,指明了各油气储层的水淹程度与开采价值,有助于石油钻探公司进一步提高开采效率和降低成本。因此,本发明提供的新型无模型贝叶斯分类预测模型软测量方法具有有效性和适用性。
附图说明
图1为本发明实施例一提供的一种新型无模型贝叶斯分类预测模型软测量方法的流程图;
图2为实施例一中傅里叶函数拟合稠油强水淹层色谱图的示意图;
图3为实施例一中重质油强水淹层色谱图面积指标分区的示意图;
图4为实施例一中高斯函数拟合轻质油差油层色谱图的示意图;
图5为实施例一中朴素贝叶斯分类器、高斯概率分布贝叶斯分类器、决策树分类器与新型无模型贝叶斯分类器的分类结果比较示意图;
图6为实施例一中KNN算法、SVM算法、Adaboost算法与MFBC算法的分类结果比较示意图。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的新型无模型贝叶斯分类预测模型软测量方法进行详细描述。
实施例一
图1为本发明实施例一提供的一种新型无模型贝叶斯分类预测模型软测量方法的流程图。如图1所示,所述新型无模型贝叶斯分类预测模型软测量方法包括:
步骤1001、获取油气层的气相色谱图数据。
步骤1002、根据曲线拟合法获取所述气相色谱图数据的特征值,以实现所述气相色谱图数据的降维和降噪。
步骤1003、对所述气相色谱图数据的特征值进行归一化处理,以形成测量样本。
步骤1004、根据预设的无模型贝叶斯分类器分类预测算法对所述测量样本对应的类别进行预测,以获得所述测量样本对应的类别。
步骤1005、根据所述测量样本对应的类别对所述油气层进行分析,以获得所述油气层的水淹程度和开采价值。
本实施例中,根据贝叶斯算法形成朴素贝叶斯分类器,根据最近邻算法形成概率估计器,根据所述朴素贝叶斯分类器和所述概率估计器形成新型无模型贝叶斯分类器(MFBC)。本实施例提供的朴素贝叶斯分类器(NBC)是基于贝叶斯理论的一种分类器,已广泛应用于文本分类、图像分类、时间序列分类等多个领域。然而,NBC假设样本的各个属性之间都是相互独立的,因此属性之间的相互依赖信息没有被利用。当数据样本中存在着相互依赖的属性时,NBC就会呈现不足,分类正确率降低。最近邻(NN)规则是模式分类中最简单的算法之一,当分类没有重叠时,NN规则被证明可以渐进地趋向于最优。为了能够确定属性之间的关联关系,本实施例基于NN规则形成概率估计器,并将上述概率器应用在朴素贝叶斯分类器中,从而形成新型无模型贝叶斯分类器。
曲线拟合(CF)是指用连续曲线近似地比拟平面上一组离散点所表示的坐标之间的函数关系,是一种用解析表达式逼近离散数据的方法。复杂的气相色谱图,实际是通过采样、实验方法获得的离散数据,普遍存在严重的噪声数据,但是分类算法对这些噪声严重的数据比较敏感,所以在此之前需要对原始色谱图数据进行去噪处理,同时为了能够在一定程度提高算法的速度,也需要首先对原始数据进行降维处理。根据这些数据,如果能够找到一个连续的函数或者更加密集的离散方程,使得实验数据与方程的曲线能够在最大程度上近似吻合,就可以根据曲线方程对数据进行数学计算,对结果进行理论分析。因此,本实施例根据CF方法获取原始色谱图数据的特征,并且保留原始样本数据的重要信息,从而达到对原始数据进行去噪和降维的处理效果。
本实施例主要分析三种油品:稠油、重质油、轻质油。稠油和重质油的气相色谱图类似,所以采用同种样本方法。图2为实施例一中傅里叶函数拟合稠油强水淹层色谱图的示意图。如图2所示,以30s作为一个时间区间,选取样本区间的极小值,使用8阶傅立叶函数拟合,进行求面积,其中函数表达式如下:
funcFourier(x)=a0+a1*cos(x*w)+b1*sin(x*w)+a2*cos(2*x*w)+ b2*sin(2*x*w)+a3*cos(3*x*w)+b3*sin(3*x*w)+a4*cos(4*x*w)+b4*sin(4*x*w) +a5*cos(5*x*w)+b5*sin(5*x*w)+a6*cos(6*x*w)+b6*sin(6*x*w)+ a7*cos(7*x*w)+b7*sin(7*x*w)+a8*cos(8*x*w)+b8*sin(8*x*w) (1)
图3为实施例一中重质油强水淹层色谱图面积指标分区的示意图。如图3所示,面积是根据数据拟合出的函数图像所围成的面积,面积可以分为三个区域,1区是0-10分钟,2区是10-18分钟,3区是18分钟-结束。所以面积的指标有四个:总面积、1区面积、2区面积、3区面积。
图4为实施例一中高斯函数拟合轻质油差油层色谱图的示意图。如图4所示,以75s作为一个时间区间,选取样本区间的极大值,使用高斯函数拟合,进行求面积,其中函数表达式如下:
funcGaussian(x)=a1*exp(-((x-b1)/c1)^2) (2)
本实施例从拟合后的图像提取特征值,得到训练样本集。假设含有N个样本的训练集X=[X1…XN]T,由于每个特征的贡献是不同的,为了减少训练的难度,本实施例采用以下转换公式对训练前的数据集进行归一化处理:
如果xij=-1, i=1,2,..,N,j=1,2,...,J。
对于测量样本X=[X1…XN]T,所述测量样本对应的类别为 Y=[y1…yN]Tyk∈C={c1,c2,......,cq},本实施例需要预测每一个样本Xk对应的类别,本实施例通过公式(4)可以获得测量样本所属类别。
本实施例根据贝叶斯定理可以得到公式(5):
本实施例可以根据公式(4)和公式(5)为每一个样本Xk选择其最可能属于的类别,为了方便,本实施例将公式(5)简化为公式(6):
对于离散属性,本实施例假设所有属性都是条件独立的,因此本实施例可以通过公式(8)获得。对于连续属性,需要对样本假设一个先验概率分布。但是,在实际应用中,属性之间一般都不会满足条件独立性,因此本实施例采用公式(7)。
对于所述测量样本的标记Y~Multinomial(φ1,φ2,......,φq),即 p(Y=cj)=φj,φj∈[0,1],本实施例可以得到公式(9),其中1{*}是指示函数。
然后本实施例得到对数似然函数l(φ1,φ2,......,φq)
通过最大化对数似然函数l(φ1,φ2,......,φq),如公式(11)所示:
因为并且需要求解q-1个参数,本实施例可以分别对q-1个参数求偏导,如公式(12)所示,本实施例可以求解出参数,如公式(13)所示。
因此,本实施例可以得到
接着本实施例得
到最后根据公式(9)得到p(yk)。
利用公式(9)可以计算出的分类器预测值,同时也表示了油气储层的类别,将上述过程应用于不同规模及不同油井下的油品,能够得到各储层水淹程度。本实施例预测的类别可以指导并帮助制定储层开放方案。
为了验证改进的MFBC分类模型的有效性,首先有必要用标准数据集进行测试。本实施例选取了五个经典的数据集,详细介绍如表1所示:
表1标准数据集介绍
Table 1Specification of standard data sets
本实施例通过10折交叉验证来估计分类错误率,对于部分数据集存在缺失值的现象,为了能够获得更加准确的结果,本实施例采用直接删掉这些缺失值来处理。本实施例将MFBC算法与KNN算法、SVM算法以及Adaboost算法进行比较,得到不同分类模型预测结果,如表2所示:
表2不同分类模型的性能比较
Table 2Comparison of performance of different classificationmodels
从表2中可以看出,对于某些数据集MFBC算法要优于其他分类器,例如:UserKnowledge Modeling数据集、Breast Cancer Wisconsin数据集和 Mammographic Mass数据集,对于剩余的两个数据集,MFBC算法的准确率与其他分类器非常接近。
为了进一步地验证MFBC算法的性能,本实施例选择了朴素贝叶斯分类器 (NBC)、高斯概率分布贝叶斯分类器(GNB)和决策树分类器(C4.5)进行比较。此外,本实施例选择了Breast tissue数据集、Echocardiogram数据集、Glass、 Parkinsons数据集、Pima数据集、Red wine quality数据集和Wine数据集进行分析。
图5为实施例一中朴素贝叶斯分类器、高斯概率分布贝叶斯分类器、决策树分类器与新型无模型贝叶斯分类器的分类结果比较示意图。如图5所示,针对大部分数据集,MFBC的准确率和稳定性要优于NBC、GNB以及C4.5。例如,对于Echocardiogram数据集,MFBC的准确度要优于NBC大约145%;对于Breast tissue数据集,MFBC的准确度要优于C4.5大约10.9%;对于Glass数据集,MFBC 的准确度要优于GNB大约45.6%;对于Parkinsons数据集,MFBC的准确度要优于C4.5大约9.6%。从平均意义上来看,MFBC要优于NBC大约18%,优于GNB 大约21%,优于C4.5大约11.07%,优于COEC大约12.7%。因此,不管数据集属性之间是否独立,相比其他比较的分类器,MFBC算法都有着更好的或相近的准确度以及更稳定的性能。
本实施例已经验证了MFBC分类模型的有效性,因此,接着将其应用于油气储层气相色谱图数据分析中。本实施例选取我国某油田稠油G18井块、J16井块和轻质油m19井块的地化色谱图数据为分析对象,为了能够获得一个更好的 MFBC分类模型,同时防止训练网络模型出现过拟合或欠拟合现象,本实施例需要提取足够多的表征图谱特征的特征值。本实施例提取基础数据特征指标包括:峰数、最大值、最小值、平均值、中位数、众数、标准差、方差、偏斜度、峰度、峰值时间、拟合面积。实验部分特征数据如表3所示:
表3不同储层下色谱图的特征指标数据
Table 3Characteristic index data of chromatogram with differentreservoirs
其中,Peak1-Peak5表示标志峰;area1-area3表示拟合分区面积;area(1+2)/3 表示(area1+area2)/area3;area(1/2)表示(area1/area2)。
下面对地化色谱图水淹程度的实例进行具体分析:
本实施例用G18井块中的310个色谱图和m19井块中的334个色谱图提取数据作为训练样本集,使用10折交叉验证测试样本。分别比较KNN、SVM、 Adaboost和MFBC的泛化性能,最后得到预测准确率如表4所示:
表4不同井块下不同分类器的准确率比较
Table 4Comparison of the accuracy of different classifiers underdifferent well
如表4所示,MFBC的准确率和稳定性要优于KNN、SVM以及Adaboost。例如,对于G18井块,MFBC的准确度要优于KNN大约47.6%,优于SVM大约10.7%,优于Adaboost大约60.6%;对于m19井块,MFBC的准确度要优于KNN大约20.0%,优于SVM大约7.1%,优于Adaboost大约114%。
本实施例选择G18和m19的5个数据集,进行分类错误率评估。图6为实施例一中KNN算法、SVM算法、Adaboost算法与MFBC算法的分类结果比较示意图。如图6所示,KNN、SVM以及Adaboost的平均分类错误率分别比MFBC 高101%,33.3%,66.7%。至此,本实施例验证了MFBC分类模型在油气储层气相色谱图数据分析的有效性。
由于MFBC模型比较好的分类性能和稳定性,因此本实施例对J16中的部分储层进行测量。参见图6,可以看出与其他三种分类器比较,MFBC模型的分类预测结果要更接近真实试油结果。因此在实际生产中,录井技术人员可以依据该种软测量方法,用来预测油气储层的水淹程度,确定储层开采价值,用于指导开采方案的制定。通过实验可以看出,由于MFBC模型的优越的、稳定的泛化性能,使其可以用于录井油气层解释评价地化色谱图的软测量,获得一个可信的储层类别,从而可以更好地指导油气储层的探明和高效开发。
本实施例提供的新型无模型贝叶斯分类预测模型软测量方法之中,首先通过曲线拟合方法有效地实现对气相色谱图数据的降维和降噪,进而提取气相色谱图数据的特征值,从而缩短分类模型的训练时间而且能够获得更好的泛化能力。本实施例使用新型无模型贝叶斯分类算法建立识别模型,这样可以有效避免由于训练样本不满足条件独立性而造成的模型泛化性能下降问题。本实施例提供的新型无模型贝叶斯分类预测模型软测量方法通过气相色谱图的测量客观展现了不同条件下油气储层的水淹程度,指明了各油气储层的水淹程度与开采价值,有助于石油钻探公司进一步提高开采效率和降低成本。因此,本实施例提供的新型无模型贝叶斯分类预测模型软测量方法具有有效性和适用性。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (3)
1.一种新型无模型贝叶斯分类预测模型软测量方法,其特征在于,包括:
获取油气层的气相色谱图数据;
根据曲线拟合法获取所述气相色谱图数据的特征值,以实现所述气相色谱图数据的降维和降噪;
对所述气相色谱图数据的特征值进行归一化处理,以形成测量样本;
根据预设的无模型贝叶斯分类器分类预测算法对所述测量样本对应的类别进行预测,以获得所述测量样本对应的类别;
根据所述测量样本对应的类别对所述油气层进行分析,以获得所述油气层的水淹程度和开采价值。
2.根据权利要求1所述的新型无模型贝叶斯分类预测模型软测量方法,其特征在于,所述无模型贝叶斯分类器分类预测算法如下:
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mo>|</mo>
<msub>
<mi>X</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>X</mi>
<mi>k</mi>
</msub>
<mo>|</mo>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>*</mo>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>X</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>&Proportional;</mo>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>X</mi>
<mi>k</mi>
</msub>
<mo>|</mo>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>*</mo>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>q</mi>
</munderover>
<msubsup>
<mi>&phi;</mi>
<mi>j</mi>
<mrow>
<mn>1</mn>
<mo>{</mo>
<msub>
<mi>y</mi>
<mi>k</mi>
</msub>
<mo>=</mo>
<msub>
<mi>c</mi>
<mi>j</mi>
</msub>
<mo>}</mo>
</mrow>
</msubsup>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
其中p(Y=cj)=φj,φj∈[0,1],1{*}是指示函数;
所述测量样本X=[X1…XN]T,所述测量样本对应的类别为Y=[y1 … yN]Tyk∈C={c1,c2,......,cq},每个测量样本Xk对应的类别为yk。
3.根据权利要求1所述的新型无模型贝叶斯分类预测模型软测量方法,其特征在于,所述根据预设的无模型贝叶斯分类器分类预测算法对所述测量样本对应的类别进行预测的步骤之前包括:
根据贝叶斯算法形成朴素贝叶斯分类器;
根据最近邻算法形成概率估计器;
根据所述朴素贝叶斯分类器和所述概率估计器形成新型无模型贝叶斯分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710589718.2A CN107330475A (zh) | 2017-07-19 | 2017-07-19 | 一种新型无模型贝叶斯分类预测模型软测量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710589718.2A CN107330475A (zh) | 2017-07-19 | 2017-07-19 | 一种新型无模型贝叶斯分类预测模型软测量方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107330475A true CN107330475A (zh) | 2017-11-07 |
Family
ID=60226603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710589718.2A Pending CN107330475A (zh) | 2017-07-19 | 2017-07-19 | 一种新型无模型贝叶斯分类预测模型软测量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107330475A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111650894A (zh) * | 2020-04-02 | 2020-09-11 | 中国计量大学 | 一种基于隐变量的贝叶斯网络复杂工业过程软测量方法 |
CN113552243A (zh) * | 2020-04-24 | 2021-10-26 | 株式会社岛津制作所 | 分析支援装置、分析支援方法以及计算机可读取媒体 |
CN115754107A (zh) * | 2022-11-08 | 2023-03-07 | 福建省龙德新能源有限公司 | 用于六氟磷酸锂制备的自动化采样分析系统及其方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1563981A (zh) * | 2004-03-30 | 2005-01-12 | 大庆油田有限责任公司 | 多层混采原油分层产能贡献动态色谱监测方法 |
CN104110257A (zh) * | 2013-05-24 | 2014-10-22 | 中国石油化工股份有限公司 | 一种单层贡献率定量评价方法 |
KR20150124825A (ko) * | 2014-04-29 | 2015-11-06 | 한국과학기술원 | 화상분류 기반의 나이브 베이즈 분류기 |
CN105975508A (zh) * | 2016-04-28 | 2016-09-28 | 西安电子科技大学 | 个性化元搜索引擎检索结果合成排序方法 |
CN106401579A (zh) * | 2016-11-04 | 2017-02-15 | 上海神开石油科技有限公司 | 一种基于随钻多参数分析的油气水识别方法和系统 |
-
2017
- 2017-07-19 CN CN201710589718.2A patent/CN107330475A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1563981A (zh) * | 2004-03-30 | 2005-01-12 | 大庆油田有限责任公司 | 多层混采原油分层产能贡献动态色谱监测方法 |
CN104110257A (zh) * | 2013-05-24 | 2014-10-22 | 中国石油化工股份有限公司 | 一种单层贡献率定量评价方法 |
KR20150124825A (ko) * | 2014-04-29 | 2015-11-06 | 한국과학기술원 | 화상분류 기반의 나이브 베이즈 분류기 |
CN105975508A (zh) * | 2016-04-28 | 2016-09-28 | 西安电子科技大学 | 个性化元搜索引擎检索结果合成排序方法 |
CN106401579A (zh) * | 2016-11-04 | 2017-02-15 | 上海神开石油科技有限公司 | 一种基于随钻多参数分析的油气水识别方法和系统 |
Non-Patent Citations (1)
Title |
---|
胡建鹏等: "《基于贝叶斯判别的录井自动解释程序及其应用》", 《计算机应用与软件》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111650894A (zh) * | 2020-04-02 | 2020-09-11 | 中国计量大学 | 一种基于隐变量的贝叶斯网络复杂工业过程软测量方法 |
CN113552243A (zh) * | 2020-04-24 | 2021-10-26 | 株式会社岛津制作所 | 分析支援装置、分析支援方法以及计算机可读取媒体 |
CN115754107A (zh) * | 2022-11-08 | 2023-03-07 | 福建省龙德新能源有限公司 | 用于六氟磷酸锂制备的自动化采样分析系统及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mohamed et al. | History matching and uncertainty quantification: multiobjective particle swarm optimisation approach | |
JP7229233B2 (ja) | 機械学習ベースのモデルを用いる高い費用効率の熱力学的流体特性の予測の方法 | |
Salinas et al. | Comparative assessment of predictions in ungauged basins–Part 2: Flood and low flow studies | |
Singer et al. | A comparison of the weights-of-evidence method and probabilistic neural networks | |
CN107341497A (zh) | 结合选择性升采样的不均衡数据流加权集成分类预测方法 | |
CN103268431B (zh) | 一种基于学生t分布的癌症亚型生物标志物检测系统 | |
de Fondeville et al. | Functional peaks-over-threshold analysis | |
CN103942749A (zh) | 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法 | |
CN111398679B (zh) | 基于pmu测量相量的次同步振荡识别与告警方法 | |
CN107330475A (zh) | 一种新型无模型贝叶斯分类预测模型软测量方法 | |
Hami-Eddine et al. | A new technique for lithology and fluid content prediction from prestack data: An application to a carbonate reservoir | |
US8566322B1 (en) | Method and system for clustering transactions in a fraud detection system | |
CN112199862B (zh) | 纳米粒子运移的预测方法、其影响因子分析方法及系统 | |
James et al. | A new measure between sets of probability distributions with applications to erratic financial behavior | |
Crawford et al. | Using landslide-inventory mapping for a combined bagged-trees and logistic-regression approach to determining landslide susceptibility in eastern Kentucky, USA | |
Vallet et al. | A multi-dimensional statistical rainfall threshold for deep landslides based on groundwater recharge and support vector machines | |
CN105023024A (zh) | 一种基于正则化集合度量学习的遥感图像分类方法及系统 | |
Aulia et al. | A new history matching sensitivity analysis framework with random forests and Plackett-Burman design | |
Issa et al. | Non-parametric online market regime detection and regime clustering for multidimensional and path-dependent data structures | |
Horvath et al. | Non-parametric online market regime detection and regime clustering for multidimensional and path-dependent data structures | |
CN113792141A (zh) | 基于协方差度量因子的特征选择方法 | |
Zhong et al. | Positive and Inverse Degree of Grey Incidence Estimation Model of Soil Organic Matter Based on Hyper-spectral Data. | |
Li et al. | Reservoir ranking map sketching for selection of infill and replacement drilling locations using machine learning technique | |
Lai et al. | Correlation enhanced modularity-based belief propagation method for community detection in networks | |
Andrais | Probabilistic Oil and Gas Production Forecasting using Machine Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171107 |
|
RJ01 | Rejection of invention patent application after publication |