CN110264014A - 一种预测老井产油量的方法及装置 - Google Patents

一种预测老井产油量的方法及装置 Download PDF

Info

Publication number
CN110264014A
CN110264014A CN201910570597.6A CN201910570597A CN110264014A CN 110264014 A CN110264014 A CN 110264014A CN 201910570597 A CN201910570597 A CN 201910570597A CN 110264014 A CN110264014 A CN 110264014A
Authority
CN
China
Prior art keywords
oil well
entity
oil
well
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910570597.6A
Other languages
English (en)
Other versions
CN110264014B (zh
Inventor
南菊红
于翔
孟令培
廖拾平
任芳
张磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunlun Digital Technology Co ltd
China National Petroleum Corp
BGP Inc
Original Assignee
BGP Inc
CNPC Beijing Richfit Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGP Inc, CNPC Beijing Richfit Information Technology Co Ltd filed Critical BGP Inc
Priority to CN201910570597.6A priority Critical patent/CN110264014B/zh
Publication of CN110264014A publication Critical patent/CN110264014A/zh
Application granted granted Critical
Publication of CN110264014B publication Critical patent/CN110264014B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Mining & Mineral Resources (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种预测老井产油量的方法及装置,包括:获取目标油田中各油井的油井历史数据,从中提取与预先设置的油井实体库相匹配的油井实体;从油井实体对应的油井历史数据中,获取油井实体属性以及油井实体属性值;对油井实体以及油井实体属性进行聚类分析,得到聚类体以及聚类体对应的油井实体;基于油井历史采油量、聚类体、油井实体、油井实体属性、油井实体属性值以及预先设置的权重计算公式,构建知识图谱;获取目标油田中老井的油井数据,提取油井数据中包含的实体,确定实体在知识图谱中所属的聚类体;将实体、实体属性以及实体属性值输入知识图谱中所属的聚类体对应的油井实体,预测老井产油量。可以提升老井产油量的预测精确度。

Description

一种预测老井产油量的方法及装置
技术领域
本申请涉及石化技术领域,具体而言,涉及一种预测老井产油量的方法及装置。
背景技术
石油产量(产油量)预测在油田的开发规划中起着至关重要的作用。其中,对于一个油井,产油量的变化特点可分为上产、稳产和递减三个阶段,尤其对于处于递减阶段的老井,产油量受多种因素的影响,较难进行精确的预测,从而给油田的开发规划带来不小的影响。
目前,对于老井产油量的预测,一般基于当年产油量和自然递减率进行下一年的产油量预测,其中,自然递减率为当年产油量与上一年的产油量的比值。但该预测老井产油量的方法,自然递减率的计算较为简单,没有综合考虑影响老井产油量的其它多种因素的影响,使得预测的产油量精确度较低,而有效地预测老井产油量,对于油田的开发、规划调整、部署以及油井设施的配套设置具有重要的参考价值。
发明内容
有鉴于此,本申请的目的在于提供一种预测老井产油量的方法及装置,提升老井产油量的预测精确度。
第一方面,本申请实施例提供了一种预测老井产油量的方法,包括:
获取目标油田中各油井的油井历史数据,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体;
从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值;
对所述油井实体以及油井实体属性进行聚类分析,得到聚类体以及聚类体对应的油井实体;
基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重计算公式,构建知识图谱;
获取所述目标油田中老井的油井数据,提取所述油井数据中包含的实体,确定所述实体在所述知识图谱中所属的聚类体;
将所述实体、所述实体对应的实体属性以及实体属性值输入所述知识图谱中所属的聚类体对应的油井实体,预测老井产油量。
结合第一方面,本发明提供了第一方面的第一种可能的实施方式,其中,所述在所述获取目标油田中各油井的油井历史数据之后,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体之前,所述方法还包括:
对获取的油井历史数据进行检查,剔除或修复异常的油井历史数据。
结合第一方面的第一种可能的实施方式,本发明提供了第一方面的第二种可能的实施方式,其中,所述方法还包括:
对进行检查后得到的油井历史数据进行归一化处理。
结合第一方面,本发明提供了第一方面的第三种可能的实施方式,其中,所述基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重计算公式,构建知识图谱,包括:
针对每一油井实体属性,基于该油井实体属性对应的油井实体属性值,计算该油井实体属性的熵值;
针对每一油井实体,基于该油井实体包含的各油井实体属性对应的熵值,计算该油井实体属性对应该油井实体的信息增益值;
针对每一聚类体,基于该聚类体包含的各油井实体以及计算得到的油井实体属性对应该油井实体的信息增益值,计算该油井实体对应该聚类体的信息增益值;
基于油井历史采油量、老井产油量包含的各聚类体以及计算得到的油井实体对应聚类体的信息增益值,对各信息增益值进行归一化处理,得到该聚类体对应老井产油量的权重。
结合第一方面、第一方面的第一种至第三种中的任一可能的实施方式,本发明提供了第一方面的第四种可能的实施方式,其中,所述方法还包括:
对依据不同聚类分析得到的知识图谱进行质量评估,获取质量评估最高的知识图谱作为用于老井产油量预测的知识图谱。
结合第一方面、第一方面的第一种至第三种中的任一可能的实施方式,本发明提供了第一方面的第五种可能的实施方式,其中,所述方法还包括:
可视化展示知识图谱,接收用户依据可视化展示的知识图谱输入的老井的油井数据,可视化展示预测的所述老井产油量。
结合第一方面、第一方面的第一种至第三种中的任一可能的实施方式,本发明提供了第一方面的第六种可能的实施方式,其中,所述提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体,包括:
针对每一油井历史数据,对该油井历史数据进行分词处理,得到油井关键词;
查询预先设置的油井实体库,若所述油井实体库中包含有所述油井关键词,提取所述油井关键词。
结合第一方面、第一方面的第一种至第三种中的任一可能的实施方式,本发明提供了第一方面的第七种可能的实施方式,其中,所述从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值,包括:
查询预先构建的聚类实体库中是否包含所述油井实体;
若所述聚类实体库中未包含所述油井实体,将所述油井实体置于聚类实体库中,依据所述油井实体对应的油井历史数据,为置于所述聚类实体库中的所述油井实体设置油井实体属性,对设置的油井实体属性进行赋值,得到所述油井实体属性值。
结合第一方面的第七种可能的实施方式,本发明提供了第一方面的第八种可能的实施方式,其中,所述方法还包括:
若所述聚类实体库中包含所述油井实体,从所述油井实体对应的油井历史数据中,提取包含的油井实体属性以及该油井实体属性对应的油井实体属性值;
若所述聚类实体库中包含提取的油井实体属性和油井实体属性值,将所述聚类实体库中的该油井实体属性值对应的计数值加1;
若所述聚类实体库中包含提取的油井实体属性,但不包含油井实体属性值,为所述聚类实体库中的该油井实体属性添加所述油井实体属性值。
第二方面,本申请实施例提供了一种预测老井产油量的装置,包括:
实体提取模块,用于获取目标油田中各油井的油井历史数据,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体;
属性获取模块,用于从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值;
聚类模块,用于对所述油井实体以及油井实体属性进行聚类分析,得到聚类体以及聚类体对应的油井实体;
知识图谱构建模块,用于基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重计算公式,构建知识图谱;
聚类体确定模块,用于获取所述目标油田中老井的油井数据,提取所述油井数据中包含的实体,确定所述实体在所述知识图谱中所属的聚类体;
产油量预测模块,用于将所述实体、所述实体对应的实体属性以及实体属性值输入所述知识图谱中所属的聚类体对应的油井实体,预测老井产油量。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的方法的步骤。
本申请实施例提供的一种预测老井产油量的方法及装置,通过获取目标油田中各油井的油井历史数据,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体;从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值;对所述油井实体以及油井实体属性进行聚类分析,得到聚类体以及聚类体对应的油井实体;基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重计算公式,构建知识图谱;获取所述目标油田中老井的油井数据,提取所述油井数据中包含的实体,确定所述实体在所述知识图谱中所属的聚类体;将所述实体、所述实体对应的实体属性以及实体属性值输入所述知识图谱中所属的聚类体对应的油井实体,预测老井产油量。这样,结合影响老井产油量的多种因素构建知识图谱,基于知识图谱进行老井产油量预测,可以有效提升老井产油量的预测精确度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种预测老井产油量的方法流程示意图;
图2为本申请实施例提供的未设置权重的知识图谱示意图;
图3为本申请实施例提供的设置有权重的知识图谱示意图;
图4为本申请实施例提供的一种预测老井产油量的装置结构示意图;
图5为本申请实施例提供的一种计算机设备500的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种预测老井产油量的方法流程示意图。如图1所示,该方法包括:
步骤101,获取目标油田中各油井的油井历史数据,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体;
本申请实施例中,目标油田所在的区域内布设有一口或多口油井。作为一可选实施例,油井历史数据包括但不限于:注采矛盾数据、作业钻井数据、保钻关井数据、转注数据、关躺井数据、电网波动数据、补孔改层数据、换大泵数据、卡封数据、堵水数据、大修数据、压裂数据、采取措施的时间数据、工作量数据、单井措施实施效果数据、油井含水量数据,年含水上升率数据、产液量数据、油井历史采油量等。
本申请实施例中,作为一可选实施例,油井历史数据为结构化数据。可以根据实际需要,按照预设时间单位采集油井历史数据,例如,以一个月或半年或一年为单位,依次收集油井历史数据。
本申请实施例中,作为一可选实施例,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体,包括:
A11,针对每一油井历史数据,对该油井历史数据进行分词处理,得到油井关键词;
本申请实施例中,经过分词处理的油井历史数据,得到的油井关键词为一个或多个。作为一可选实施例,可以采用中文分词模型对油井历史数据进行分词处理,获取油井历史数据中包含的油井关键词。
A12,查询预先设置的油井实体库,若所述油井实体库中包含有所述油井关键词,提取所述油井关键词。
本申请实施例中,若油井实体库中未包含有该油井关键词,则对该油井关键词不作处理;若油井实体库中包含有该油井关键词,则将该油井关键词作为与预先设置的油井实体库相匹配的油井实体。
本申请实施例中,在石化领域,油井实体库可以通过相关技术人员采用人工分析方法或机器学习方法得到。例如,对于注采矛盾数据,对应油井实体库中的实体,可以包括注采矛盾;对于作业钻井数据,对应油井实体库中的实体,可以包括作业钻井;对于保钻关井数据,对应油井实体库中的实体,可以包括保钻关井等。
步骤102,从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值;
本申请实施例中,作为一可选实施例,从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值,包括:
A21,查询预先构建的聚类实体库中是否包含所述油井实体;
A22,若所述聚类实体库中未包含所述油井实体,将所述油井实体置于聚类实体库中,依据所述油井实体对应的油井历史数据,为置于所述聚类实体库中的所述油井实体设置油井实体属性,对设置的油井实体属性进行赋值,得到所述油井实体属性值。
本申请实施例中,针对目标油田,构建聚类实体库,用于存储与油井实体库相匹配的油井实体,以及,油井实体对应的油井实体属性和油井实体属性对应的油井实体属性值。例如,对于关躺井数据,对应的油井实体属性包括位置等,油井实体属性值为该位置对应的具体经纬度值。对于产液量数据,对应的油井实体属性包括日产油量、油井日注水量等,油井实体属性值为具体数值。
本申请实施例中,每一油井实体对应一个或多个油井实体属性,每一油井实体属性对应有一个或多个油井实体属性值。例如,对于多个油井历史数据对应的同一油井实体属性,每一油井历史数据对应一油井实体属性值,多个油井历史数据对应的油井实体属性值,可以相同,也可以不同,对于相同的油井实体属性值,可以采用计数的方式进行记录。因而,作为一可选实施例,该方法还包括:
若所述聚类实体库中包含所述油井实体,从所述油井实体对应的油井历史数据中,提取包含的油井实体属性以及该油井实体属性对应的油井实体属性值;
若所述聚类实体库中包含提取的油井实体属性和油井实体属性值,将所述聚类实体库中的该油井实体属性值对应的计数值加1;
若所述聚类实体库中包含提取的油井实体属性,但不包含油井实体属性值,为所述聚类实体库中的该油井实体属性添加所述油井实体属性值。
本申请实施例中,依据提取得到的油井实体,基于对应的油井历史数据,对于未存储在聚类实体库中的油井实体,将该油井实体置于聚类实体库,并为该油井实体设置油井实体属性,同时,还可以设置油井实体与油井实体之间的关系。
步骤103,对所述油井实体以及油井实体属性进行聚类分析,得到聚类体以及聚类体对应的油井实体;
本申请实施例中,作为一可选实施例,对所述油井实体以及油井实体属性进行聚类分析,包括:
根据聚类实体库中的油井实体以及该油井实体对应的实体属性,利用预先设置的聚类算法对油井实体进行聚类分析。其中,聚类算法包括但不限于:分割算法、分层次算法、基于密度的算法或基于网格的算法。
本申请实施例中,聚类得到的聚类体为影响老井产油量的分类实体,采用不同的聚类算法,得到的聚类体可能不同。作为一可选实施例,聚类体包括:初始产量、自然递减率、油井增产措施以及含水量,其中,初始产量为油井初始投产的年产量,自然递减率包括的油井实体包括:注采矛盾、作业钻井、保钻关井、转注、关躺井、电网波动;油井增产措施包括的油井实体包括:补孔改层、换大泵、卡封、堵孔、堵水、大修、压裂、采取措施的时间、工作量、单井措施实施效果;含水量包括的油井实体包括:油井含水量、年含水上升率、产液量。
本申请实施例中,作为一可选实施例,在所述获取目标油田中各油井的油井历史数据之后,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体之前,该方法还包括:
对获取的油井历史数据进行检查,剔除或修复异常的油井历史数据。
本申请实施例中,检查油井历史数据的一致性,剔除属性异常的油井历史数据,或,依据预先设置的一致性缺失填补规则填补油井历史数据中的缺失值,以避免异常的油井历史数据对老井产油量预测的影响。
本申请实施例中,作为一可选实施例,该方法还包括:
对进行检查后得到的油井历史数据进行归一化处理。
本申请实施例中,对各种类型的油井历史数据进行标准化,以消除不同参数由于物理量纲不同造成的数值差异,为数据共享、相关性分析提供基础依据。
步骤104,基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重计算公式,构建知识图谱;
本申请实施例中,知识图谱中,老井产油量为一级节点,聚类体为二级节点,聚类体对应的实体为三级节点,老井产油量、聚类体、聚类体对应的实体形成决策树结构。一级节点与二级节点通过边连接,二级节点与三级节点通过边连接,每一节点具有相应的权重(节点-边-权重)。其中,边表示节点与节点之间具有关系,将实体链接到知识图谱中相应的节点。知识图谱是由具有实体属性的实体通过关系(边)连接形成,以大港油田为例,实体为大港油田,实体属性包括:位置、历史产油量等,实体属性值,对于位置,对应的属性值为东经xx度xx分、北纬xx度xx分,对于历史产油量,对应的属性值为具体的产油量值。
本申请实施例中,基于不同的聚类算法得到的聚类体以及聚类体对应的油井实体,进行知识图谱的构建,可以得到不同的知识图谱。
所应说明的是,步骤101-步骤104只需执行一次,无需在每次进行老井产油量预测时都需要执行一次。
本申请实施例中,根据油井实体以及油井实体之间的关系,形成油井实体-关系-油井实体的知识图谱。
图2为本申请实施例提供的未设置权重的知识图谱示意图。如图2所示,老井产油量为一级节点,聚类体为二级节点,油井实体为三级节点,其中,老井产油量分别与初始产量、自然递减率、增产措施以及含水量相连接,其中,自然递减率分别与注采矛盾、作业占井影响、保钻关井影响、转注影响、关躺井影响、电网波动影响相连接;增产措施分别与补孔改层、换大泵、卡封、堵水、大修、压裂相连接,换大泵、堵水、大修、补孔改层、卡封以及压裂还与采取措施时间相连接。
本申请实施例中,老井产油量为各聚类体的特征值的加权和值,聚类体的特征值为该聚类体对应的各实体的特征值的加权和值。
本申请实施例中,可以利用人工智能深度学习方法,确定各特征值在知识图谱中的节点-边-权重,作为一可选实施例,基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重(节点-边-权重)计算公式,构建知识图谱,包括:
B11,针对每一油井实体属性,基于该油井实体属性对应的油井实体属性值,计算该油井实体属性的熵值;
本申请实施例中,作为一可选实施例,利用下式计算油井实体属性的熵值:
式中,
H(X)为油井实体属性X的熵值;
p(xi)为油井实体属性X取第i种油井实体属性值的概率;
n为油井实体属性X对应的油井实体属性值的取值种数。
本申请实施例中,对于油井实体属性X,假设n=3,其中,第一种油井实体属性值的个数为2,第二种油井实体属性值的个数为3,第三种油井实体属性值的个数为5,则该油井实体属性X取第一种实体属性值的概率为20%。
B12,针对每一油井实体,基于该油井实体包含的各油井实体属性对应的熵值,计算该油井实体属性对应该油井实体的信息增益值;
本申请实施例中,利用下式计算油井实体属性对应油井实体的信息增益值:
IG(X)=H(C)-H(C/X)
式中,
IG(X)为油井实体属性X对应油井实体C的信息增益值。
本申请实施例中,信息增益值用于在决策树中选择特征的指标,信息增益值越大,表明该特征的选择性越好,为待分类的集合的熵值和选定某个特征的条件熵值(例如,H(C/X))之差。
B13,针对每一聚类体,基于该聚类体包含的各油井实体以及计算得到的油井实体属性对应该油井实体的信息增益值,计算该油井实体对应该聚类体的信息增益值;
B14,基于油井历史采油量、老井产油量包含的各聚类体以及计算得到的油井实体对应聚类体的信息增益值,对各信息增益值进行归一化处理,得到该聚类体对应老井产油量的权重。
本申请实施例中,计算油井实体对应聚类体的信息增益值,以及,计算聚类体对应老井产油量的权重(节点-边-权重),与计算油井实体属性对应油井实体的信息增益值的计算公式相类似。
本申请实施例中,采用决策树算法,计算每一特征在训练数据集下的信息增益。作为一可选实施例,聚类体组成的特征为{初始产量,自然递减率,油井增产措施,含水量},通过决策树算法,得到四个特征对应的信息增益值,对信息增益值进行归一化处理,得到每个特征向量对应的节点-边-权重,即聚类体在知识图谱中的权重。
图3为本申请实施例提供的设置有权重的知识图谱示意图。如图3所示,以二级节点为例,初始产量在老井产油量的知识图谱中,权重(节点-边-权重)为0.08,自然递减率在老井产油量的知识图谱中,权重(节点-边-权重)为0.73,增产措施在老井产油量的知识图谱中,权重(节点-边-权重)为0.12,含水量在老井产油量的知识图谱中,权重(节点-边-权重)为0.07。
本申请实施例中,以油井历史数据作为训练集,按照上述方法进行训练,得到知识图谱。
本申请实施例中,作为一可选实施例,该方法还可以包括:
对依据不同聚类分析得到的知识图谱进行质量评估,获取质量评估最高的知识图谱作为用于老井产油量预测的知识图谱。
本申请实施例中,从油井历史数据中抽取一部分作为测试集,对依据各聚类算法构建的各知识图谱的可信度进行量化,例如,将测试集中除油井历史采油量之外的数据经过实体提取,获取实体属性以及实体属性值,输入至各知识图谱中,分别得到对应预测的老井产油量,与对应的油井历史采油量进行比较,以确定各知识图谱的置信度,保留置信度较高的一个或多个知识图谱,舍弃置信度较低的知识图谱,以确保用于老井产油量预测的知识图谱的质量。
步骤105,获取所述目标油田中老井的油井数据,提取所述油井数据中包含的实体,确定所述实体在所述知识图谱中所属的聚类体;
本申请实施例中,油井数据的收集时间单位与油井历史数据的收集时间单位相同,作为一可选实施例,收集一个时间单位内的目标油井的油井数据,例如,收集当年的目标油井的油井数据,以基于当年的该目标油井的油井数据进行该目标油井下一年产油量的预测。
步骤106,将所述实体、所述实体对应的实体属性以及实体属性值输入所述知识图谱中所属的聚类体对应的油井实体,预测老井产油量。
本申请实施例中,作为一可选实施例,该方法还包括:
可视化展示知识图谱,接收用户依据可视化展示的知识图谱输入的老井的油井数据,可视化展示预测的所述老井产油量。
本申请实施例中,通过采用知识图谱方法,全面梳理影响老井产油量的多种因素,例如:油井增产措施,以及采取油井增产措施的时间、工作量、单井措施实施效果等;以及油井含水量、年含水上升率、产液量等因素,梳理各影响因素之间的关系、属性,再利用人工智能深度学习方法,确定各特征值在知识图谱中的权重(节点-边-权重),从而构建全局的知识图谱,探知老井产油量递减规律,实现高精确度的老井产油量预测。这样,可以避免基于当年产油量和自然递减率进行下一年产油量预测导致的预测精度较低的技术问题,通过综合考虑影响老井产油量的多种因素的影响,使得预测的产油量精确度高,从而为油田的开发、规划调整、部署以及油井设施的配套设置提供重要的参考。
图4为本申请实施例提供的一种预测老井产油量的装置结构示意图。如图4所示,该装置包括:
实体提取模块401,用于获取目标油田中各油井的油井历史数据,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体;
本申请实施例中,作为一可选实施例,油井历史数据包括但不限于:注采矛盾数据、作业钻井数据、保钻关井数据、转注数据、关躺井数据、电网波动数据、补孔改层数据、换大泵数据、卡封数据、堵水数据、大修数据、压裂数据、采取措施的时间数据、工作量数据、单井措施实施效果数据、油井含水量数据,年含水上升率数据、产液量数据、油井历史采油量等。
本申请实施例中,作为一可选实施例,实体提取模块401,具体用于:
获取目标油田中各油井的油井历史数据,针对每一油井历史数据,对该油井历史数据进行分词处理,得到油井关键词;
查询预先设置的油井实体库,若所述油井实体库中包含有所述油井关键词,提取所述油井关键词。
本申请实施例中,作为另一可选实施例,实体提取模块401还用于:
对获取的油井历史数据进行检查,剔除或修复异常的油井历史数据。
本申请实施例中,作为另一可选实施例,实体提取模块还用于:
对进行检查后得到的油井历史数据进行归一化处理。
属性获取模块402,用于从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值;
本申请实施例中,每一油井实体对应一个或多个油井实体属性,每一油井实体属性对应有一个或多个油井实体属性值。
本申请实施例中,作为一可选实施例,属性获取模块402,具体用于:
查询预先构建的聚类实体库中是否包含所述油井实体;
若所述聚类实体库中未包含所述油井实体,将所述油井实体置于聚类实体库中,依据所述油井实体对应的油井历史数据,为置于所述聚类实体库中的所述油井实体设置油井实体属性,对设置的油井实体属性进行赋值,得到所述油井实体属性值。
本申请实施例中,作为另一可选实施例,属性获取模块402,具体还用于:
若所述聚类实体库中包含所述油井实体,从所述油井实体对应的油井历史数据中,提取包含的油井实体属性以及该油井实体属性对应的油井实体属性值;
若所述聚类实体库中包含提取的油井实体属性和油井实体属性值,将所述聚类实体库中的该油井实体属性值对应的计数值加1;
若所述聚类实体库中包含提取的油井实体属性,但不包含油井实体属性值,为所述聚类实体库中的该油井实体属性添加所述油井实体属性值。
聚类模块403,用于对所述油井实体以及油井实体属性进行聚类分析,得到聚类体以及聚类体对应的油井实体;
本申请实施例中,作为一可选实施例,根据聚类实体库中的油井实体以及该油井实体对应的实体属性,利用预先设置的聚类算法对油井实体进行聚类分析。其中,聚类算法包括但不限于:分割算法、分层次算法、基于密度的算法或基于网格的算法。
本申请实施例中,作为一可选实施例,聚类体包括:初始产量、自然递减率、油井增产措施以及含水量。
知识图谱构建模块404,用于基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重(节点-边-权重)计算公式,构建知识图谱;
本申请实施例中,作为一可选实施例,知识图谱构建模块404,具体用于:
针对每一油井实体属性,基于该油井实体属性对应的油井实体属性值,计算该油井实体属性的熵值;
针对每一油井实体,基于该油井实体包含的各油井实体属性对应的熵值,计算该油井实体属性对应该油井实体的信息增益值;
针对每一聚类体,基于该聚类体包含的各油井实体以及计算得到的油井实体属性对应该油井实体的信息增益值,计算该油井实体对应该聚类体的信息增益值;
基于油井历史采油量、老井产油量包含的各聚类体以及计算得到的油井实体对应聚类体的信息增益值,对各信息增益值进行归一化处理,得到该聚类体对应老井产油量的权重(节点-边-权重)。
聚类体确定模块405,用于获取所述目标油田中老井的油井数据,提取所述油井数据中包含的实体,确定所述实体在所述知识图谱中所属的聚类体;
产油量预测模块406,用于将所述实体、所述实体对应的实体属性以及实体属性值输入所述知识图谱中所属的聚类体对应的油井实体,预测老井产油量。
本申请实施例中,作为一可选实施例,该装置还包括:
评估模块(图中未示出),用于对依据不同聚类分析得到的知识图谱进行质量评估,获取质量评估最高的知识图谱作为用于老井产油量预测的知识图谱。
本申请实施例中,作为另一可选实施例,该装置还包括:
展示模块(图中未示出),用于可视化展示知识图谱,接收用户依据可视化展示的知识图谱输入的老井的油井数据,可视化展示预测的所述老井产油量。
如图5所示,本申请一实施例提供了一种计算机设备500,用于执行图1中的预测老井产油量的方法,该设备包括存储器501、处理器502及存储在该存储器501上并可在该处理器502上运行的计算机程序,其中,上述处理器502执行上述计算机程序时实现上述预测老井产油量的方法的步骤。
具体地,上述存储器501和处理器502能够为通用的存储器和处理器,这里不做具体限定,当处理器502运行存储器501存储的计算机程序时,能够执行上述预测老井产油量的方法。
对应于图1中的预测老井产油量的方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述预测老井产油量的方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述预测老井产油量的方法。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种预测老井产油量的方法,其特征在于,包括:
获取目标油田中各油井的油井历史数据,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体;
从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值;
对所述油井实体以及油井实体属性进行聚类分析,得到聚类体以及聚类体对应的油井实体;
基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重计算公式,构建知识图谱;
获取所述目标油田中老井的油井数据,提取所述油井数据中包含的实体,确定所述实体在所述知识图谱中所属的聚类体;
将所述实体、所述实体对应的实体属性以及实体属性值输入所述知识图谱中所属的聚类体对应的油井实体,预测老井产油量。
2.如权利要求1所述的方法,其特征在于,在所述获取目标油田中各油井的油井历史数据之后,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体之前,所述方法还包括:
对获取的油井历史数据进行检查,剔除或修复异常的油井历史数据。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
对进行检查后得到的油井历史数据进行归一化处理。
4.如权利要求1所述的方法,其特征在于,所述基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重计算公式,构建知识图谱,包括:
针对每一油井实体属性,基于该油井实体属性对应的油井实体属性值,计算该油井实体属性的熵值;
针对每一油井实体,基于该油井实体包含的各油井实体属性对应的熵值,计算该油井实体属性对应该油井实体的信息增益值;
针对每一聚类体,基于该聚类体包含的各油井实体以及计算得到的油井实体属性对应该油井实体的信息增益值,计算该油井实体对应该聚类体的信息增益值;
基于油井历史采油量、老井产油量包含的各聚类体以及计算得到的油井实体对应聚类体的信息增益值,对各信息增益值进行归一化处理,得到该聚类体对应老井产油量的权重。
5.如权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
对依据不同聚类分析得到的知识图谱进行质量评估,获取质量评估最高的知识图谱作为用于老井产油量预测的知识图谱。
6.如权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
可视化展示知识图谱,接收用户依据可视化展示的知识图谱输入的老井的油井数据,可视化展示预测的所述老井产油量。
7.如权利要求1至4任一项所述的方法,其特征在于,所述提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体,包括:
针对每一油井历史数据,对该油井历史数据进行分词处理,得到油井关键词;
查询预先设置的油井实体库,若所述油井实体库中包含有所述油井关键词,提取所述油井关键词。
8.如权利要求1至4任一项所述的方法,其特征在于,所述从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值,包括:
查询预先构建的聚类实体库中是否包含所述油井实体;
若所述聚类实体库中未包含所述油井实体,将所述油井实体置于聚类实体库中,依据所述油井实体对应的油井历史数据,为置于所述聚类实体库中的所述油井实体设置油井实体属性,对设置的油井实体属性进行赋值,得到所述油井实体属性值。
9.如权利要求8所述的方法,其特征在于,所述方法还包括:
若所述聚类实体库中包含所述油井实体,从所述油井实体对应的油井历史数据中,提取包含的油井实体属性以及该油井实体属性对应的油井实体属性值;
若所述聚类实体库中包含提取的油井实体属性和油井实体属性值,将所述聚类实体库中的该油井实体属性值对应的计数值加1;
若所述聚类实体库中包含提取的油井实体属性,但不包含油井实体属性值,为所述聚类实体库中的该油井实体属性添加所述油井实体属性值。
10.一种预测老井产油量的装置,其特征在于,包括:
实体提取模块,用于获取目标油田中各油井的油井历史数据,提取所述油井历史数据中包含的与预先设置的油井实体库相匹配的油井实体;
属性获取模块,用于从所述油井实体对应的油井历史数据中,获取所述油井实体的油井实体属性以及油井实体属性值;
聚类模块,用于对所述油井实体以及油井实体属性进行聚类分析,得到聚类体以及聚类体对应的油井实体;
知识图谱构建模块,用于基于油井历史采油量、所述聚类体、聚类体对应的油井实体、油井实体对应的油井实体属性、油井实体属性对应的油井实体属性值以及预先设置的权重计算公式,构建知识图谱;
聚类体确定模块,用于获取所述目标油田中老井的油井数据,提取所述油井数据中包含的实体,确定所述实体在所述知识图谱中所属的聚类体;
产油量预测模块,用于将所述实体、所述实体对应的实体属性以及实体属性值输入所述知识图谱中所属的聚类体对应的油井实体,预测老井产油量。
CN201910570597.6A 2019-06-27 2019-06-27 一种预测老井产油量的方法及装置 Active CN110264014B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910570597.6A CN110264014B (zh) 2019-06-27 2019-06-27 一种预测老井产油量的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910570597.6A CN110264014B (zh) 2019-06-27 2019-06-27 一种预测老井产油量的方法及装置

Publications (2)

Publication Number Publication Date
CN110264014A true CN110264014A (zh) 2019-09-20
CN110264014B CN110264014B (zh) 2020-04-03

Family

ID=67922652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910570597.6A Active CN110264014B (zh) 2019-06-27 2019-06-27 一种预测老井产油量的方法及装置

Country Status (1)

Country Link
CN (1) CN110264014B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475685A (zh) * 2019-12-27 2020-07-31 北京国双科技有限公司 油气勘探方法、装置、存储介质及电子设备
CN111472763A (zh) * 2019-12-30 2020-07-31 北京国双科技有限公司 地层厚度预测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160146973A1 (en) * 2014-11-25 2016-05-26 Cognitive Geology Limited Geological Prediction Technology
CN107977749A (zh) * 2017-12-06 2018-05-01 恒泰艾普(北京)云技术有限公司 一种油田开发指标的预测分析方法
CN108573078A (zh) * 2017-03-09 2018-09-25 中国石油化工股份有限公司 基于数据挖掘的压裂效果预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160146973A1 (en) * 2014-11-25 2016-05-26 Cognitive Geology Limited Geological Prediction Technology
CN108573078A (zh) * 2017-03-09 2018-09-25 中国石油化工股份有限公司 基于数据挖掘的压裂效果预测方法
CN107977749A (zh) * 2017-12-06 2018-05-01 恒泰艾普(北京)云技术有限公司 一种油田开发指标的预测分析方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475685A (zh) * 2019-12-27 2020-07-31 北京国双科技有限公司 油气勘探方法、装置、存储介质及电子设备
CN111472763A (zh) * 2019-12-30 2020-07-31 北京国双科技有限公司 地层厚度预测方法及装置

Also Published As

Publication number Publication date
CN110264014B (zh) 2020-04-03

Similar Documents

Publication Publication Date Title
CN110674841B (zh) 一种基于聚类算法的测井曲线识别方法
CN110390465A (zh) 业务数据的风控分析处理方法、装置和计算机设备
CN109597856A (zh) 一种数据处理方法、装置、电子设备及存储介质
AU2011283109A1 (en) Systems and methods for predicting well performance
CN109583468A (zh) 训练样本获取方法,样本预测方法及对应装置
CN108170765A (zh) 基于在校行为数据多维分析的贫困生资助推荐方法
CA2880497C (en) Methods and systems related to hydrocarbon recovery strategy development
Li et al. Cluster analysis of the relationship between carbon dioxide emissions and economic growth
CN104335074A (zh) 用于相分类的系统和方法
CN106121622A (zh) 一种基于示功图的有杆泵抽油井的多故障诊断方法
Abdalla et al. Identification of downhole conditions in sucker rod pumped wells using deep neural networks and genetic algorithms (includes associated discussion)
Shaheen et al. Mining sustainability indicators to classify hydrocarbon development
CN110264014A (zh) 一种预测老井产油量的方法及装置
Skoumas et al. On quantifying qualitative geospatial data: A probabilistic approach
CN109145431A (zh) 一种监控电力二次系统运行状态的建模方法及装置
CN117473305A (zh) 一种近邻信息增强的储层参数预测方法及系统
CN108563720A (zh) 基于ai的大数据推荐学习系统及推荐方法
CN104820956B (zh) 一种基于数据特征分析的低压配电系统拓扑自动识别方法
Cowpertwait A regionalization method based on a cluster probability model
Da Silva et al. A new approach to soil classification mapping based on the spatial distribution of soil properties
Kumagai Development of a way to visualize and observe linguistic similarities on a linguistic atlas
Manea et al. LOGISTIC REGRESSION IN MODELLING SOME SUSTAINABLE DEVELOPMENT PHENOMENA.
Feder Machine-learning approach determines spatial variation in shale decline curves
CN115994231B (zh) 稠油配汽优化的知识图谱优化方法
Liao et al. Predictive Analytics and Statistical Learning for Waterflooding Operations in Reservoir Simulations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100010 room 1501, Gehua building, No.1 Qinglong Hutong, Dongcheng District, Beijing

Patentee after: Kunlun Digital Technology Co.,Ltd.

Patentee after: BGP INC., CHINA NATIONAL PETROLEUM Corp.

Address before: 100010 room 1501, Gehua building, No.1 Qinglong Hutong, Dongcheng District, Beijing

Patentee before: RICHFIT INFORMATION TECHNOLOGY Co.,Ltd.

Patentee before: BGP INC., CHINA NATIONAL PETROLEUM Corp.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220329

Address after: 100010 room 1501, Gehua building, No.1 Qinglong Hutong, Dongcheng District, Beijing

Patentee after: Kunlun Digital Technology Co.,Ltd.

Patentee after: CHINA NATIONAL PETROLEUM Corp.

Address before: 100010 room 1501, Gehua building, No.1 Qinglong Hutong, Dongcheng District, Beijing

Patentee before: Kunlun Digital Technology Co.,Ltd.

Patentee before: BGP INC., CHINA NATIONAL PETROLEUM Corp.