CN116451877B - 一种基于可计算语义网络的管网停开井产量预测方法 - Google Patents
一种基于可计算语义网络的管网停开井产量预测方法 Download PDFInfo
- Publication number
- CN116451877B CN116451877B CN202310712335.5A CN202310712335A CN116451877B CN 116451877 B CN116451877 B CN 116451877B CN 202310712335 A CN202310712335 A CN 202310712335A CN 116451877 B CN116451877 B CN 116451877B
- Authority
- CN
- China
- Prior art keywords
- network
- pipeline
- node
- data
- production
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000007246 mechanism Effects 0.000 claims abstract description 58
- 238000003860 storage Methods 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 28
- 239000003129 oil well Substances 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims abstract description 13
- 238000012512 characterization method Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000012360 testing method Methods 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 40
- 239000012530 fluid Substances 0.000 claims description 36
- 239000003921 oil Substances 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 16
- 239000007788 liquid Substances 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 14
- 239000010779 crude oil Substances 0.000 claims description 14
- 210000002569 neuron Anatomy 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000005086 pumping Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 4
- 230000000295 complement effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012821 model calculation Methods 0.000 claims description 3
- 238000011144 upstream manufacturing Methods 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 abstract description 8
- 238000013135 deep learning Methods 0.000 abstract description 7
- 238000013528 artificial neural network Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 239000007789 gas Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000012351 Integrated analysis Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Economics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
Abstract
本发明涉及油井产量预测技术领域,尤其涉及一种基于可计算语义网络的管网停开井产量预测方法,先采集样本数据集并进行预处理后划分为训练集和测试集;再建立储运机理知识并进行表征,然后构建深度网络框架并建立节点向量和边向量表示,再构建可计算语义网络模型,依次对可计算语义网络模型进行训练和评价;最后将集输管网生产数据输入可计算语义网络模型进行预测,得到预测结果,同时考虑生产数据和储运机理知识两大因素,提出“数据+机理”双驱动的网络模型,大幅度提高模型的预测准确度,将储运机理知识融入到深度学习神经网络相关算法中,提高网络模型迭代收敛效率,更快地输出最优预测结果。
Description
技术领域
本发明涉及油井产量预测技术领域,尤其涉及一种基于可计算语义网络的管网停开井产量预测方法。
背景技术
随着地下油气的不断开采,生产井的产能逐步下降,部分井已经进入高含水的后期阶段,油田正面临着注水井增多的问题,通常采用关停的方式解决高含水井的问题。另一方面,油田逐步加大油气藏勘探开发力度,大力推进新井建设或老井扩建,提高油气产能和生产力。
集输管网是输送石油、天然气及相关产品的管道网络,通常由主管道、支管道、调节阀、泵站、计量站等组成,是油气工业中重要的输送工具。由于集输管网的拓扑序列复杂,关停或新开油井会影响管网各处的压力和温度,进而对其余井的产量造成一定影响。在稳定的管网系统中,关停部分油井会降低管网回压,在各油井油压不变的前提下,产量会增加;反之,新开部分油井会增加管网回压,会减少其余油井的产量。因此,为了保持油田的高产稳产,研究集输管网停开井后的影响因素并预测各井产量,为油田指定合理的井口关停及生产方案是至关重要的。
近年来,随着人工智能的迅速发展,深度学习方法逐渐用于油井产量预测,例如CN110400006A公开了一种基于深度学习算法的油井产量预测方法,该基于深度学习算法的油井产量预测方法包括:步骤1,获取数据并进行质量检查;步骤2,进行数据处理及划分;步骤3,建立学习模型;步骤4,采用步骤3搭建的模型开展训练,并进行验证;步骤5,预测油井产量。但是现有深度学习方法仅依靠数据驱动,通过提取各生产参数和产量之间的关联关系进行建模,没有考虑储运机理知识和物理学公式的影响,这就造成在利用深度学习模型进行产量预测的过程中存在两个问题,一是采集到的实时生产数据不准确或者存在噪声,导致模型拟合程度差,预测准确率较低;二是不同油井的产量预测可能具有不同的解释方式,导致产量预测的应用存在较大的不确定性。
发明内容
本发明的目的在于克服现有技术存在的缺点,设计提供一种精度高、速度快的基于可计算语义网络的管网停开井产量预测方法。
为实现上述目的,本发明采用以下技术方案实现:
一种基于可计算语义网络的管网停开井产量预测方法,具体步骤如下:
S1、采集原油生产区停开井前后一段时间内的实时生产数据作为可计算语义网络模型的样本数据集,并对样本数据集进行预处理后划分为训练集和测试集;
S2、根据原油生产区的集输管网中所有管道的管道属性,分析同一管道上下游所有节点的回压、温度、流速、流量数据与管道属性的关联关系,得到适用于实际采油集输管网的储运机理知识,并对储运机理知识进行表征得到储运机理知识表征体系;
S3、结合原油生产区的集输管网拓扑图,将集输管网拓扑图中的单井、井组、中心平台作为节点,管道连接关系作为边,构建深度网络框架,并建立节点向量和边向量表示;
S4、根据步骤S3构建的深度网络框架,融合步骤S2储运机理知识的表征结果,通过设计网络参数计算机制,完善网络迭代更新方法,构建可计算语义网络模型;
S5、设置步骤S4得到的可计算语义网络模型的模型参数,并采用训练集对设置好参数的可计算语义网络模型进行训练,训练过程中,不断通过储运机理知识计算管网各处的压力、温度和产量,分析每次迭代时的变化趋势,直到模型训练结束,根据每一次迭代预测的总产量值和中心平台的压力值,得到模型自由参数的最优权重;
S6、基于步骤S5得到的最优权重,使用决定系数、平均绝对误差、平均绝对百分比误差、均方根误差和希尔不等系数作为评价指标对可计算语义网络模型进行评价;
S7、结合步骤S6中的评价结果,将集输管网生产数据输入可计算语义网络模型进行预测,得到停开井集输管网中各井口产量的预测结果。
作为本发明的进一步技术方案,步骤S1所述实时生产数据包括采集时间、井号、油压、回压、套压、温度、耗电量、三相电流、三相电压和日产液量,其中日产液量为原油生产区内所有单井当日的总产液量,通过读取安装在原油生产区内的油井井口的流量计得到;油压、回压、套压、温度、耗电量、三相电流、三相电压利用安装在原油生产现场的传感器获取。
作为本发明的进一步技术方案,步骤S1所述对样本数据集预处理包括重复数据清洗、缺失数据处理和噪声数据清洗,其中重复数据清洗是对数据集中相似重复记录的属性及产生原因进行分析,运用排列合并的清洗思想去重;缺失数据处理解决实时生产数据中由于传感器损坏或数据传输等原因导致数据缺失的问题,通过结合实际生产情况,对原油生产区停开井前后一段时间内的生产参数进行分析,进行删除或补全;噪声数据清洗是通过正态分布公式,将/>落在/>外的数据作为噪声数据并删除,其中/>是数据集的数据,/>是标准差,/>是平均值。
作为本发明的进一步技术方案,步骤S1所述训练集和训练集的数量比为7:3。
作为本发明的进一步技术方案,步骤S2所述管道属性包括管道长度、管道内径和内壁粗糙度;储运机理知识包括确定管径,流速、流量和管径之间的关系,雷诺数和摩擦系数的关系,管壁粗糙度的计算,管道压力降和管道属性的关系,对储运机理知识进行表征的结果为:
管径计算公式:,其中/>是管道直径,单位为mm;/>是流体体积流量,单位为m3/h;/>是流体平均流速,单位为m/s;/>是流体质量流量,单位为kg/h;/>是流体密度,单位为kg/m3;
雷诺数计算公式:,其中/>是雷诺数,无量纲;/>是流体平均流速,单位为m/s;/>是管道内直径,单位为mm;/>是流体粘度,单位为mPa·s;/>是流体质量流量,单位为kg/h;/>是流体体积流量,单位为m3/h;/>是流体密度,单位为kg/m3;摩擦系数计算公式:/>,其中/>是摩擦系数,无量纲,/>是雷诺数,无量纲;
管壁粗糙度计算公式:,其中/>是绝对粗糙度,/>,/>是管壁粗糙度;
管道压力降计算公式:,其中/>是一段管道的压力降,单位为kPa;/>、/>分别是管道始端和终端的高度,单位为m;/>、/>分别是管道始端和终端的流体速度,单位为m/s;/>是流体平均流速,单位为m/s;/>是流体密度,单位为kg/m3;/>是摩擦系数,无量纲;/>、/>分别是管道长度以及阀门管件的当量长度,单位为m;/>是管道内直径,单位为m。
作为本发明的进一步技术方案,步骤S3所述节点向量表示为,,/>是步骤S1样本数据集的数据,/>是通过储运机理知识表征体系计算出来的值;/>是自由参数,用于在网络计算过程中不断调整权值;边向量表示为/></>>,边的属性与管道属性一致,包括管线长度、管道内径、管壁粗糙度。
作为本发明的进一步技术方案,步骤S4中网络参数计算机制包括前向计算模式和反向传播模式,其中前向计算模式的具体计算过程为:相邻节点参数传递公式,其中/>是相邻节点所连接边所赋予的初始权重,默认为1;/>是边所赋予的初始偏置,默认为0;/>是节点的自由参数;节点的输入加权和计算公式为,其中/>是网络计算过程中输入到第j个节点的加权和,/>是连接到该节点的边的权重,/>是边的机理属性集合,/>是该节点的偏置,/>是节点的机理属性集合;节点的输出计算公式/>,其中/>是从第j个节点输出的数据,激活函数使用sigmoid函数;节点向上传递时参数加权计算公式/>,其中/>是第j个节点向相邻节点传递时的参数值,/>是连接该节点的边的权值,/>是前一个节点的输出值,/>是该节点的偏置,/>是节点的机理属性集合,前向计算模式公式,其中/>是流体密度,/>是归一化后的管径高度差,/>是气体密度,/>是权重,/>是网络总权重,/>是体积,/>是管道内径,/>是管道横截面面积,/>是加权后的网络参数,/>是当前压强;
反向传播模式计算过程为:相邻节点反向参数偏导公式,其中/>是第j个节点的反向参数,/>是模型正向计算时的产量预测值,/>是真实产量值,/>是第j个节点的生产参数,迭代一次结束后计算总误差/>,其中是真实生产数据库中的日产液量,/>是模型预测的日产液量,权重更新计算公式/>,其中/>是模型计算总误差,/>是第j个节点的权重,是该节点经过激活函数的输出值,/>是其他节点传递到该节点的加权和。
作为本发明的进一步技术方案,步骤S4所述网络迭代更新方法是在原有稳定输油管网系统中增加或者停止某井后,先根据其余各井口参数,通过油井井口产量计算公式,得到该井的实际产量,其中/>是油井产量,/>是流体密度,/>是抽油机冲次,/>是抽油机有效冲程,/>是泵径长度,/>是体积系数,再通过储运机理知识得到经过一段输油管道后到达下一节点处的温度和压力,重复该过程,直到计算出进入中心平台三相分离器之前的汇管压力和温度,若没有超过处理上限,则输出增、减井后的总产量;若超出,则执行网络的反向传输机制,通过储运机理公式反推各井口的回压数据,通过井口产量计算公式得到此时的产量数据,重复上述过程,直到没有超过中心平台三相分离器的处理上限。
作为本发明的进一步技术方案,步骤S5所述模型参数包括神经元数量、优化器、激活函数和迭代次数,其中神经元数量由节点种类决定,单井节点的神经元数量为10个,井组节点的神经元数量为50个,中心平台节点的神经元数量为70个,优化器采用Adam优化器,激活函数为Sigmoid激活函数,迭代次数为100次。
作为本发明的进一步技术方案,步骤S6所述决定系数、平均绝对误差、平均绝对百分比误差、均方根误差和希尔不等系数的计算公式如下:
决定系数,
平均绝对误差,
平均绝对百分比误差,
均方根误差,
希尔不等系数,
其中是实时生产数据库中的真实数据,/>是n个真实数据的平均值,/>是可计算语义网络模型预测的数据。
与现有技术相比,本发明具有以下有益效果如下:
(1)通过使用现场实时生产数据对停开井后输油管网内各单井的日产液量进行预测,为输油管网一体化分析及日产量预测提供一种准确可行的方法。
(2)首创一种融合机理知识的可计算语义网络,网络结构根据油田部署管网拓扑图动态变化,同时考虑生产数据和储运机理知识两大因素,提出“数据+机理”双驱动的网络模型,大幅度提高模型的预测准确度,有利于指导油田生产计划。
(3)设计了一种新型网络参数计算机制,包括前向计算模式和反向传播模式,均将储运机理知识融入到深度学习神经网络相关算法中,优化网络参数的计算方式,同时建立了一种新型网络迭代更新方法,结合油田集输管网系统实际运行规律,通过优化器不断减少损失函数,以中心平台三相分离器最高处理上限作为限制条件,反复计算管网各处数据,提高网络模型迭代收敛效率,更快地输出最优预测结果。
附图说明
图1为本发明所述基于可计算语义网络的管网停开井产量预测方法的流程框图;
图2为本发明实施例所述某油田的集输管网拓扑结构图;
图3为本发明构建的深度网络框架结构图;
图4为本发明实施例中步骤S5训练模型时的准确率曲线图;
图5为本发明实施例中某油田2023年1月至4月的产量预测值和真实值对比图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例:
如图1所示,本实施例提供了一种基于可计算语义网络的管网停开井产量预测方法,主要包括数据集收集和预处理、储运机理知识建立和表征、深度网络框架构建、可计算语义网络模型构建、可计算语义网络模型训练、可计算语义网络模型评价和产量预测六个步骤,具体为:
S1、数据集收集和预处理:
(S11)获取某油田整个集输管网在2020年1月1日至2022年12月31日共3年内每次停井或新开井前后各10天的实时动态生成数据,包括采集时间、井号、油压、回压、套压、温度、耗电量、三相电流、三相电压和日产液量,将其作为数据集;
(S12)由于采油现场环境恶劣,电磁干扰较多,获取到的现场数据不够完整甚至存在部分噪音,因此对数据集进行预处理,包括重复数据清洗、缺失数据处理和噪音数据清洗,其中重复数据清洗运用排列合并的思想去重;缺失数据处理是通过对缺失项的前后时间段内生产参数进行分析,合理删除该条数据或者补全该缺失项;噪音数据清洗是通过正态分布公式/>,将/>落在/>外的数据作为噪声数据并删除,其中/>是数据集的数据,/>是标准差,/>是平均值;
(S13)将预处理后的数据集按照7:3的比例划分为训练集和测试集,训练集用于训练可计算语义网络,测试集用于在模型训练结束后测试模型的准确度和可行性;
S2、储运机理知识建立和表征:
油田集输管网拓扑结构图如图2所示,图2中以“BW”开头的节点均为井组,拓扑结构图清晰展示了中心平台及各井组的分布情况,井组与井组、井组与中心平台连接的管道部分标明了管道长度和管道内径大小,该实施例的井组仅包含2-5口单井,井组内部结构简单,故不在拓扑结构图中展示,查询井组内包含的单井信息可参考单井台账表;根据油田的集输管网拓扑结构图,获取同一管线出口端和进口端两侧的压力降、温度降、平均流速、流量数据,与该管线内径、长度、粗糙度建立关联关系,得到储运机理知识,并采用建立数学公式的方法对储运机理知识进行表征得到储运机理知识表征体系,具体包括:
,
,
,
,
,
,
其中,是管道直径,单位为mm;/>是流体体积流量,单位为m3/h;/>是流体平均流速,单位为m/s;/>是流体质量流量,单位为kg/h;/>是流体密度,kg/m3;/>是雷诺数,无量纲;是流体粘度,单位为mPa·s;/>是摩擦系数,无量纲;/>是绝对粗糙度,单位为mm;/>是一段管道的压力降,单位为kPa;/>、/>分别是管道始端和终端的高度,单位为m;/>、/>分别是管道始端和终端的流体速度,单位为m/s;/>、/>分别是管道长度和阀门管件等的当量长度,单位为m;
S3、深度网络框架构建:
结合油田集输管网拓扑结构图和单井台账表,将单井、井组、中心平台作为网络的节点,它们之间的管线连接关系作为网络的边,搭建深度网络结构,并基于该网络结构,建立节点和边向量表示,节点向量表示为,/>,/>是步骤S1中样本数据集的数据,如油压、回压、温度、耗电量、电流、电压、日产液量等;/>是通过步骤S2中储运机理知识表征体系计算出来的值,如雷诺数、管壁粗糙度、压力降等;/>是自由参数,用于在网络计算过程中不断调整权值;边向量表示为/></>>,边的属性与管道属性一致,包括管线长度、管道内径、管壁粗糙度,构建的深度网络框架如图3所示,图中YJ表示油井,JZ表示井组平台,ZXPT表示采油中心平台,该结构是根据油田集输管网拓扑结构图搭建而成,只适用于本实施例,针对不同地区的集输管网拓扑,深度网络框架结构不唯一;
S4、可计算语义网络模型构建:
在深度网络结构基础上,融合机理知识表征结果和深度学习参数传递算法,设计前向计算模式、反向传播模式和迭代更新方法,构建可计算语义网络模型,其中前向计算模式相关公式包括:
,
,
,
,
,
其中,是相邻节点所连接边所赋予的初始权重,默认为1;/>是边所赋予的初始偏置,默认为0;/>和/>是节点的自由参数;/>是网络计算过程中输入到第j个节点的加权和,/>是连接到该节点的边的权重,/>是边的机理属性集合,/>是节点的机理属性集合;/>是从第j个节点输出的数据,/>是第j个节点向相邻节点传递时的参数值,/>是连接该节点的边的权值,/>是流体密度,/>是归一化后的管径高度差,/>是气体密度,/>是权重,/>是网络总权重,/>是体积,/>是管道直径,/>是管道横截面面积,/>是加权后的网络参数,/>是当前压强;
反向传播模式相关公式包括:
,
,
其中是第j个节点的反向参数,/>是模型正向计算时的产量预测值,/>是真实产量值,/>是第j个节点的生产参数,/>是模型计算总误差,/>是第j个节点的权重,/>是该节点经过激活函数的输出值,/>是其他节点传递到该节点的加权和;
网络迭代更新方法是一种根据储运机理模型进行迭代的算法,用于计算在增加或停止某井后,整个稳定输油管网系统中的产量变化和各井口回压数据,具体过程为:在原有稳定输油管网系统中增加或者停止某井后,先根据其余各井口参数,通过油井井口产量计算公式(其中/>是油井产量,/>是流体密度,/>是抽油机冲次,/>是抽油机有效冲程,是泵径长度,/>是体积系数)得到该井的实际产量,再通过储运机理知识得到经过一段输油管道后到达下一节点处的温度和压力,重复该过程,直到计算出进入中心平台三相分离器之前的汇管压力和温度,若没有超过处理上限,则输出增、减井后的总产量;若超出,则执行网络的反向传输机制,通过储运机理公式反推各井口的回压数据,通过井口产量计算公式得到此时的产量数据,重复上述过程,直到没有超过中心平台三相分离器的处理上限;
S5、可计算语义网络模型训练:
设置步骤S4得到的可计算语义网络模型的模型参数,模型参数中神经元数量由节点种类决定,单井节点的神经元数量为10个,井组节点的神经元数量为50个,中心平台节点的神经元数量为70个,优化器采用Adam优化器,激活函数Sigmoid激活函数,迭代次数为100次,采用训练集对设置好参数的可计算语义网络模型进行训练,训练过程中,不断通过储运机理知识计算管网各处的压力、温度和产量,分析每次迭代时的变化趋势,直到模型训练结束,根据每一次迭代预测的总产量值和中心平台的压力值,得到模型自由参数的最优权重;图4为进行迭代和校正过程中的准确率曲线,其中横轴表示迭代和校正的次数,纵轴表示准确率的大小,由图4可以看出,在迭代至40次左右时,准确率仍呈小幅度上升,直到95次左右时,准确率几乎没有变化,因此是合适的产量预测模型,能够获得更准确的预测结果;
S6、可计算语义网络模型评价:
可计算模型训练完成后,使用决定系数R2、平均绝对误差MAD、平均绝对百分比误差MAPE、均方根误差RMSE和希尔不等系数TIC作为评价指标进行模型评价,
,
,
,
,
,
其中,是实时生产数据库中的真实数据,/>是n个真实数据的平均值,/>是可计算语义网络模型预测的数据;
S6、产量预测:
使用2023年1月1日至4月30日共4个月内的管网生产数据进行预测,从而得到停开井后集输管网中各井口产量的预测结果,预测值和真实值的对比曲线如图5所示,其中横轴表示日期,纵轴表示日产液量数值,由图中可以看出,两者的误差都在5%以内,在油田生产区可接受的误差范围内,因此可以应用于生产环境中。
本实施例通过设计一种融合机理知识的可计算语义网络模型,对管网系统中各单井及管道各处的压力、温度、产量等实时数据进行学习,能够对停开井后的管网系统进行一体化分析,精准预测管网系统内所有单井的生产参数及日产液量,因此不同于以往从单独的某种方法和某种特征的角度来进行某口单井的产量预测,其中,可计算语义网络模型结构是根据管网系统拓扑结构图搭建而成,模型中的节点表示为管网系统中的单井及平台,边表示为单井及平台的输送管道,模型参数计算机制和迭代更新算法是基于深度学习中梯度下降算法、Adam优化算法的非线性求解过程,结合管网系统运行规律和生产现场实际情况,融合储运机理和生产数据进行混合建模。当管网系统内停开某口井后,利用学习生成的语义网络模型对调整后的管网系统进行模拟计算,最终输出各单井的产量值。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围内。
Claims (3)
1.一种基于可计算语义网络的管网停开井产量预测方法,其特征在于,包括如下步骤:
S1、采集原油生产区停开井前后一段时间内的实时生产数据作为可计算语义网络模型的样本数据集,并对样本数据集进行预处理后划分为训练集和测试集;其中对样本数据集的预处理过程包括重复数据清洗、缺失数据处理和噪声数据清洗,其中重复数据清洗是对数据集中相似重复记录的属性及产生原因进行分析,运用排列合并的清洗思想去重;缺失数据处理解决实时生产数据中由于传感器损坏或数据传输等原因导致数据缺失的问题,通过结合实际生产情况,对原油生产区停开井前后一段时间内的生产参数进行分析,进行删除或补全;噪声数据清洗是通过正态分布公式,将/>落在外的数据作为噪声数据并删除,其中/>是数据集的数据,/>是标准差,/>是平均值;
S2、根据原油生产区的集输管网中所有管道的管道属性,分析同一管道上下游所有节点的回压、温度、流速、流量数据与管道属性的关联关系,得到适用于实际采油集输管网的储运机理知识,并对储运机理知识进行表征得到储运机理知识表征体系;所述管道属性包括管道长度、管道内径和内壁粗糙度;储运机理知识包括确定管径,流速、流量和管径之间的关系,雷诺数和摩擦系数的关系,管壁粗糙度的计算,管道压力降和管道属性的关系,对储运机理知识进行表征的结果为:
管径计算公式:,其中/>是管道直径,单位为mm;/>是流体体积流量,单位为m3/h;/>是流体平均流速,单位为m/s;/>是流体质量流量,单位为kg/h;/>是流体密度,单位为kg/m3;
雷诺数计算公式:,其中/>是雷诺数,无量纲;/>是流体平均流速,单位为m/s;/>是管道内直径,单位为mm;/>是流体粘度,单位为mPa·s;/>是流体质量流量,单位为kg/h;/>是流体体积流量,单位为m3/h;/>是流体密度,单位为kg/m3;摩擦系数计算公式:/>,其中/>是摩擦系数,无量纲,/>是雷诺数,无量纲;
管壁粗糙度计算公式:,其中/>是绝对粗糙度,/>,/>是管壁粗糙度;
管道压力降计算公式:,其中/>是一段管道的压力降,单位为kPa;/>、/>分别是管道始端和终端的高度,单位为m;/>、/>分别是管道始端和终端的流体速度,单位为m/s;/>是流体平均流速,单位为m/s;/>是流体密度,单位为kg/m3;/>是摩擦系数,无量纲;/>、/>分别是管道长度以及阀门管件的当量长度,单位为m;/>是管道内直径,单位为m;
S3、结合原油生产区的集输管网拓扑图,将集输管网拓扑图中的单井、井组、中心平台作为节点,管道连接关系作为边,构建深度网络框架,并建立节点向量和边向量表示;其中节点向量表示为,/>,/>是步骤S1样本数据集的数据,/>是通过储运机理知识表征体系计算出来的值;/>是自由参数,用于在网络计算过程中不断调整权值;边向量表示为/></>>,边的属性与管道属性一致,包括管线长度、管道内径、管壁粗糙度;
S4、根据步骤S3构建的深度网络框架,融合步骤S2储运机理知识的表征结果,通过设计网络参数计算机制,完善网络迭代更新方法,构建可计算语义网络模型;
网络参数计算机制包括前向计算模式和反向传播模式,其中前向计算模式的具体计算过程为:相邻节点参数传递公式,其中/>是相邻节点所连接边所赋予的初始权重,默认为1;/>是边所赋予的初始偏置,默认为0;/>是节点的自由参数;节点的输入加权和计算公式为/>,其中/>是网络计算过程中输入到第j个节点的加权和,/>是连接到该节点的边的权重,/>是边的机理属性集合,/>是该节点的偏置,/>是节点的机理属性集合;节点的输出计算公式/>,其中/>是从第j个节点输出的数据,激活函数使用sigmoid函数;节点向上传递时参数加权计算公式,其中/>是第j个节点向相邻节点传递时的参数值,/>是连接该节点的边的权值,/>是前一个节点的输出值,/>是该节点的偏置,/>是节点的机理属性集合,前向计算模式公式/>,其中/>是流体密度,/>是归一化后的管径高度差,/>是气体密度,/>是权重,/>是网络总权重,/>是体积,/>是管道内径,/>是管道横截面面积,/>是加权后的网络参数,/>是当前压强;
反向传播模式计算过程为:相邻节点反向参数偏导公式
,
其中是第j个节点的反向参数,/>是模型正向计算时的产量预测值,/>是真实产量值,/>是第j个节点的生产参数,迭代一次结束后计算总误差,其中/>是真实生产数据库中的日产液量,/>是模型预测的日产液量,权重更新计算公式/>,其中/>是模型计算总误差,/>是第j个节点的权重,/>是该节点经过激活函数的输出值,/>是其他节点传递到该节点的加权和;
网络迭代更新方法是在原有稳定输油管网系统中增加或者停止某井后,先根据其余各井口参数,通过油井井口产量计算公式,得到增加或者停止井的实际产量,其中是油井产量,/>是流体密度,/>是抽油机冲次,/>是抽油机有效冲程,/>是泵径长度,/>是体积系数,再通过储运机理知识得到经过一段输油管道后到达下一节点处的温度和压力,重复该过程,直到计算出进入中心平台三相分离器之前的汇管压力和温度,若没有超过处理上限,则输出增、减井后的总产量;若超出,则执行网络的反向传输机制,通过储运机理公式反推各井口的回压数据,通过井口产量计算公式得到此时的产量数据,重复上述过程,直到没有超过中心平台三相分离器的处理上限;
S5、设置步骤S4得到的可计算语义网络模型的模型参数,并采用训练集对设置好参数的可计算语义网络模型进行训练,训练过程中,不断通过储运机理知识计算管网各处的压力、温度和产量,分析每次迭代时的变化趋势,直到模型训练结束,根据每一次迭代预测的总产量值和中心平台的压力值,得到模型自由参数的最优权重;其中模型参数包括神经元数量、优化器、激活函数和迭代次数,其中神经元数量由节点种类决定,单井节点的神经元数量为10个,井组节点的神经元数量为50个,中心平台节点的神经元数量为70个,优化器采用Adam优化器,激活函数为Sigmoid激活函数,迭代次数为100次;
S6、基于步骤S5得到的最优权重,使用决定系数、平均绝对误差、平均绝对百分比误差、均方根误差和希尔不等系数作为评价指标对可计算语义网络模型进行评价;所述决定系数、平均绝对误差、平均绝对百分比误差、均方根误差和希尔不等系数的计算公式如下:
决定系数,
平均绝对误差,
平均绝对百分比误差,
均方根误差,
希尔不等系数,
其中是实时生产数据库中的真实数据,/>是n个真实数据的平均值,/>是可计算语义网络模型预测的数据;
S7、结合步骤S6中的评价结果,将集输管网生产数据输入可计算语义网络模型进行预测,得到停开井集输管网中各井口产量的预测结果。
2.根据权利要求1所述基于可计算语义网络的管网停开井产量预测方法,其特征在于,步骤S1所述实时生产数据包括采集时间、井号、油压、回压、套压、温度、耗电量、三相电流、三相电压和日产液量,其中日产液量为原油生产区内所有单井当日的总产液量,通过读取安装在原油生产区内的油井井口的流量计得到;油压、回压、套压、温度、耗电量、三相电流、三相电压利用安装在原油生产现场的传感器获取。
3.根据权利要求2所述基于可计算语义网络的管网停开井产量预测方法,其特征在于,步骤S1所述训练集和训练集的数量比为7:3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310712335.5A CN116451877B (zh) | 2023-06-16 | 2023-06-16 | 一种基于可计算语义网络的管网停开井产量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310712335.5A CN116451877B (zh) | 2023-06-16 | 2023-06-16 | 一种基于可计算语义网络的管网停开井产量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116451877A CN116451877A (zh) | 2023-07-18 |
CN116451877B true CN116451877B (zh) | 2023-09-01 |
Family
ID=87124098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310712335.5A Active CN116451877B (zh) | 2023-06-16 | 2023-06-16 | 一种基于可计算语义网络的管网停开井产量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116451877B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1986981A (zh) * | 2005-12-21 | 2007-06-27 | 株式会社东芝 | 用于水分配及管道的信息分析系统 |
CN109523072A (zh) * | 2018-11-02 | 2019-03-26 | 中国石油化工股份有限公司 | 基于lstm的油田产油量预测方法 |
CN110400006A (zh) * | 2019-07-02 | 2019-11-01 | 中国石油化工股份有限公司 | 基于深度学习算法的油井产量预测方法 |
WO2020101128A1 (ko) * | 2018-11-15 | 2020-05-22 | 한국지질자원연구원 | 딥러닝을 이용한 셰일가스 생산량 예측방법 |
CN112580260A (zh) * | 2020-12-22 | 2021-03-30 | 广州杰赛科技股份有限公司 | 管网水流量的预测方法、装置以及计算机可读存储介质 |
CN113722997A (zh) * | 2021-09-01 | 2021-11-30 | 北京中地金石科技有限公司 | 一种基于静态油气田数据的新井动态产量预测方法 |
CN113792479A (zh) * | 2021-08-23 | 2021-12-14 | 北京科技大学 | 一种基于物理约束的煤层气藏压裂效果评价方法 |
CN113988410A (zh) * | 2021-10-27 | 2022-01-28 | 中国石油大学(华东) | 一种基于knn算法与多项式回归算法组合的跨区域致密油藏油井产能预测方法 |
CN114638401A (zh) * | 2022-02-21 | 2022-06-17 | 北京中科智上科技有限公司 | 一种基于历史及预测油藏知识的剩余油分布预测方法及装置 |
CN114723323A (zh) * | 2022-04-24 | 2022-07-08 | 北京理工大学 | 一种融合物理知识的数据驱动风险分析方法及装置 |
CN115099519A (zh) * | 2022-07-13 | 2022-09-23 | 西南石油大学 | 一种基于多机器学习模型融合的油井产量预测方法 |
CN115345378A (zh) * | 2022-08-29 | 2022-11-15 | 西南石油大学 | 一种基于机器学习的页岩气井产量评价方法 |
CN115526435A (zh) * | 2022-11-09 | 2022-12-27 | 上海交通大学 | 基于卡尔曼滤波的时空神经网络模型下的油井产量预测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018132786A1 (en) * | 2017-01-13 | 2018-07-19 | Ground Truth Consulting | System and method for predicting well production |
US20230184061A1 (en) * | 2021-12-13 | 2023-06-15 | Saudi Arabian Oil Company | Machine Learning with Physics-based Models to Predict Multilateral Well Performance |
-
2023
- 2023-06-16 CN CN202310712335.5A patent/CN116451877B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1986981A (zh) * | 2005-12-21 | 2007-06-27 | 株式会社东芝 | 用于水分配及管道的信息分析系统 |
CN109523072A (zh) * | 2018-11-02 | 2019-03-26 | 中国石油化工股份有限公司 | 基于lstm的油田产油量预测方法 |
WO2020101128A1 (ko) * | 2018-11-15 | 2020-05-22 | 한국지질자원연구원 | 딥러닝을 이용한 셰일가스 생산량 예측방법 |
CN110400006A (zh) * | 2019-07-02 | 2019-11-01 | 中国石油化工股份有限公司 | 基于深度学习算法的油井产量预测方法 |
CN112580260A (zh) * | 2020-12-22 | 2021-03-30 | 广州杰赛科技股份有限公司 | 管网水流量的预测方法、装置以及计算机可读存储介质 |
CN113792479A (zh) * | 2021-08-23 | 2021-12-14 | 北京科技大学 | 一种基于物理约束的煤层气藏压裂效果评价方法 |
CN113722997A (zh) * | 2021-09-01 | 2021-11-30 | 北京中地金石科技有限公司 | 一种基于静态油气田数据的新井动态产量预测方法 |
CN113988410A (zh) * | 2021-10-27 | 2022-01-28 | 中国石油大学(华东) | 一种基于knn算法与多项式回归算法组合的跨区域致密油藏油井产能预测方法 |
CN114638401A (zh) * | 2022-02-21 | 2022-06-17 | 北京中科智上科技有限公司 | 一种基于历史及预测油藏知识的剩余油分布预测方法及装置 |
CN114723323A (zh) * | 2022-04-24 | 2022-07-08 | 北京理工大学 | 一种融合物理知识的数据驱动风险分析方法及装置 |
CN115099519A (zh) * | 2022-07-13 | 2022-09-23 | 西南石油大学 | 一种基于多机器学习模型融合的油井产量预测方法 |
CN115345378A (zh) * | 2022-08-29 | 2022-11-15 | 西南石油大学 | 一种基于机器学习的页岩气井产量评价方法 |
CN115526435A (zh) * | 2022-11-09 | 2022-12-27 | 上海交通大学 | 基于卡尔曼滤波的时空神经网络模型下的油井产量预测方法 |
Non-Patent Citations (1)
Title |
---|
考虑动态克林伯格系数的煤储层渗透率预测模型;李立功;康天合;李彦斌;;地球物理学报(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116451877A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9031674B2 (en) | Lift-gas optimization with choke control | |
CN110952978B (zh) | 一种基于神经网络数据挖掘的钻井漏失裂缝宽度预测方法 | |
WO2014121147A1 (en) | Production analysis and/or forecasting methods, apparatus, and systems | |
EP1984860A2 (en) | Methods, systems, and computer-readable media for fast updating of oil and gas field production models with physical and proxy simulators | |
CN113988479A (zh) | 基于动静态信息特征融合神经网络的抽油井多井动液面深度预测方法 | |
CN112539054A (zh) | 地面管网与地下油藏复杂系统生产优化方法 | |
CN115860197A (zh) | 一种基于数据驱动的煤层气产量预测方法及系统 | |
CN116989277A (zh) | 一种基于Adaboost与BP神经网络的动态供水管网漏损风险评估方法 | |
CN114239419A (zh) | 一种基于深度学习的井筒积液预测方法 | |
CN110348176A (zh) | 一种页岩气地面集输管网滚动开发方案优化求解器及方法 | |
CN116451877B (zh) | 一种基于可计算语义网络的管网停开井产量预测方法 | |
Du et al. | A deep learning framework using graph convolutional networks for adaptive correction of interwell connectivity and gated recurrent unit for performance prediction | |
Huang et al. | Data-driven model for predicting production periods in the SAGD process | |
CN114429073A (zh) | 抽油机井耗电量影响因素敏感性的分析方法 | |
CN107545112A (zh) | 多源无标签数据机器学习的复杂装备性能评估与预测方法 | |
Preis et al. | Online hydraulic state prediction for water distribution systems | |
Vrabie et al. | Digital twin for downhole pressure gauges: model and field case study | |
CN113887026A (zh) | 一种基于集成学习的输油管道水力预测方法 | |
CN115510752A (zh) | 一种基于数据驱动的侧钻井井位优选方法及装置 | |
Okorocha et al. | Production optimization using gas lift incorporated with artificial neural network | |
CN114912291A (zh) | 服务于供水管网水力模型校核的新增监测点布置方法及装置 | |
CN114862007A (zh) | 一种面向碳酸盐岩气井的短周期产气量预测方法及系统 | |
CN113887049A (zh) | 一种基于机器学习的石油钻井的钻速预测方法及系统 | |
Nguyen et al. | Application of artificial neural network for predicting production flow rates of gaslift oil wells | |
Simanjuntak et al. | Applying artificial neural network and xgboost to improve data analytics in oil and gas industry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |