CN107656903A - 数据体的平均指标的确定方法和装置 - Google Patents

数据体的平均指标的确定方法和装置 Download PDF

Info

Publication number
CN107656903A
CN107656903A CN201710728630.4A CN201710728630A CN107656903A CN 107656903 A CN107656903 A CN 107656903A CN 201710728630 A CN201710728630 A CN 201710728630A CN 107656903 A CN107656903 A CN 107656903A
Authority
CN
China
Prior art keywords
data
data body
frequency
target data
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710728630.4A
Other languages
English (en)
Other versions
CN107656903B (zh
Inventor
康志勇
闫家宁
刘勇
于连东
李焕宝
黄祥光
徐玲彬
高雨檬
李晓涛
倪志发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Natural Gas Co Ltd
Original Assignee
China Petroleum and Natural Gas Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Natural Gas Co Ltd filed Critical China Petroleum and Natural Gas Co Ltd
Priority to CN201710728630.4A priority Critical patent/CN107656903B/zh
Publication of CN107656903A publication Critical patent/CN107656903A/zh
Application granted granted Critical
Publication of CN107656903B publication Critical patent/CN107656903B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Complex Calculations (AREA)

Abstract

本申请实施方式提供了一种数据体的平均指标的确定方法和装置,其中,该方法包括:获取待确定的目标数据体;对目标数据体进行预处理,将预处理后的目标数据体中的数据按照预设顺序排列,得到有序数据体;根据有序数据体,确定目标数据体的加权中位数和多个平均指示参数;以加权中位数作为比较参数,从多个平均指示参数中确定出与加权中位数的差值满足第一预设条件的平均指示参数作为目标数据体的平均指标。由于该方案通过先对目标数据体进行排序处理,再根据处理后的有序数据体确定出加权中位数,利用加权中位数确定合适的平均指示参数作为平均指标,因而解决了现有方法中存在的所确定数据体的指标参数的表征性不合理、误差较大的技术问题。

Description

数据体的平均指标的确定方法和装置
技术领域
本申请涉及数据处理技术领域,特别涉及一种数据体的平均指标的确定方法和装置。
背景技术
在生产施工中,常常会获得大量数据。例如,对某区域的地层孔隙度进行分析研究时,会采集得到数据量非常庞大的孔隙度数据。在对所获得的大量数据进行具体处理时,往往又会先确定出该数据体的一个具有较好表征作用的指标,来反映该数据体整体的平均情况,以便对该数据体所包含的信息有一个较为基本的了解。进而,可以根据该指标对该数据进行进一步的具体处理、分析。
目前,大多是直接计算数据体的算术平均值或者几何平均值,利用算术平均值或几何平均值作为指标以表征数据体整体的平均情况。但是,可以表征数据体的平均情况的参数有很多,除上述列举的算术平均值、几何平均值外,还包括:调和平均值、中位数、众数等参数。上述不同的参数具有不同的特点,针对不同的数据体,采用上述不同的参数作为指标,来反映数据体的平均情况的效果也各不相同。具体的,例如,对于数据体A,利用算术平均值作为指标,表征效果相对较好。但对于数据体B,则利用调和平均值作为指标,表征效果相对较好。因此,具体施工时,如何根据不同的待确定目标数据体,选择出表征效果较好的参数作为上述指标,以较准确地反映出数据体整体的平均情况,是一个重要问题。现有确定上述指标的方法,处理过程相对比较简单,大多是根据研究者自己的经验进行判断选取,以选择合适的参数作为指标参数,导致人为因素带来的干扰较多,往往存在所确定数据体的指标参数的表征性不合理、误差较大的技术问题。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本申请实施方式提供了一种数据体的平均指标的确定方法和装置,以解决现有方法存在的所确定数据体的指标参数的表征性不合理、误差较大的技术问题。
本申请实施方式提供了一种数据体的平均指标的确定方法,包括:
获取待确定的目标数据体;
对所述目标数据体进行预处理,将预处理后的目标数据体中的数据按照预设顺序排列,得到有序数据体;
确定所述有序数据体的加权中位数和多个平均指示参数;
将所述多个平均指示参数中与所述加权中位数的差值满足第一预设条件的平均指示参数确定为所述目标数据体的平均指标。
在一个实施方式中,在确定出目标数据体的平均指标后,所述方法还包括:
根据所述目标数据体的平均指标,进行地质勘探。
在一个实施方式中,对所述目标数据体进行预处理,包括:
对所述目标数据体中的数据进行去重处理。
在一个实施方式中,所述方法还包括:
根据所述有序数据体中各个数据的频率,建立所述目标数据体的数据频率分布曲线,并根据所述目标数据体的数据频率分布曲线,对所述目标数据体的平均指标进行校验;
和/或,
根据所述有序数据体中各个数据的权重,建立所述目标数据体的数据权重分布曲线,并根据所述目标数据体的数据权重分布曲线,对所述目标数据体的平均指标进行校验。
在一个实施方式中,所述根据所述有序数据体中各个数据的频数、频率,确定所述目标数据体的加权中位数,包括:
根据所述有序数据体中各个数据的频数、频率,分别计算所述有序数据体中各个数据的左累积频率和右累积频率;
确定与50%的差值满足第二预设条件的左累积频率作为第一左频率,将所述第一左频率所对应的数据作为第一左侧数据;
确定与50%的差值满足所述第二预设条件的右累积频率作为第一右频率,将所述第一右频率所对应的数据作为第一右侧数据;
根据所述第一左频率、所述第一左侧数据、所述第一右频率、所述第一右侧数据,确定所述目标数据体的加权中位数。
在一个实施方式中,根据所述第一左频率、所述第一左侧数据、所述第一右频率、所述第一右侧数据,确定所述目标数据体的加权中位数,包括:
按照以下公式确定所述加权中位数:
XME=xLfL+xRfR
上式中,XME为加权中位数,xL为第一左侧数据,fL为第一左频率,xR为第一右侧数据,fR为第一右频率。
在一个实施方式中,所述根据所述有序数据体中各个数据的权数、权重,确定所述目标数据体的加权中位数,包括:
根据所述有序数据体中各个数据的权数、权重,分别计算所述有序数据体中各个数据的左累积权重和右累积权重;
确定与50%的差值满足第二预设条件的左累积权重作为第一左权重,将所述第一左权重所对应的数据作为第二左侧数据;
确定与50%的差值满足所述第二预设条件的右累积权重作为第一右权重,将所述第一右权重所对应的数据作为第二右侧数据;
根据所述第一左权重、所述第二左侧数据、所述第一右权重、所述第二右侧数据,确定所述目标数据体的加权中位数。
在一个实施方式中,将所述多个平均指示参数中与所述加权中位数的差值满足第一预设条件的平均指示参数确定为所述目标数据体的平均指标,包括:
分别确定所述多个平均指示参数中各个平均指示参数与所述加权中位数的差值;
根据所述差值,确定与所述加权中位数的差值的绝对值最小的平均指示参数作为所述目标数据体的平均指标。
在一个实施方式中,在确定出所述目标数据体的平均指标后,所述方法还包括:
确定所述目标数据体的平均指标是否满足预设的阈值范围,其中,所述预设的阈值范围为第一左侧数据至第一右侧数据,或,第二左侧数据至第二右侧数据;
在确定所述目标数据体的平均指标不满足所述预设的阈值范围的情况下,将所述加权中位数确定为所述目标数据体的平均指标。
在一个实施方式中,所述目标数据体包括:孔隙度数据、渗透率数据、饱和度数据、地层厚度数据、生产成本数据、石油产量数据。
在一个实施方式中,所述目标数据体中的数据个数大于等于10。
本申请实施方式还提供了一种数据体的平均指标的确定装置,包括:
获取模块,用于获取待确定的目标数据体;
预处理模块,用于对所述目标数据体进行预处理,将预处理后的目标数据体中的数据按照预设顺序排列,得到有序数据体;
第一确定模块,用于确定所述有序数据体的加权中位数和多个平均指示参数;
第二确定模块,用于将所述多个平均指示参数中与所述加权中位数的差值满足第一预设条件的平均指示参数确定为所述目标数据体的平均指标。
在本申请实施方式中,通过引入加权中位数作为比较参数,具体实施时先对目标数据体进行排序处理,再根据处理后的有序数据体确定出加权中位数,进而可以利用加权中位数确定出较为合适、准确的平均指示参数作为平均指标,从而解决了现有方法中存在的所确定数据体的指标参数的表征性不合理、误差较大的技术问题,达到准确地确定表征效果较好的数据体的平均指标的技术效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施方式提供的数据体的平均指标的确定方法的处理流程图;
图2是根据本申请实施方式提供的数据体的平均指标的确定的装置的组成结构图;
图3是在一个实施场景中应用本申请实施方式提供数据体的平均指标的确定方法/装置获得的渗透率数据体权重分布曲线图;
图4是在另一个实施场景中应用本申请实施方式提供数据体的平均指标的确定方法/装置获得的产品价格数据体频率分布曲线图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
考虑到现有方法大多是依据技术人员的经验,选择合适的参数作为指标参数来反映数据体整体的平均情况。由于上述方法具体实施时,人为因素引入的干扰较多,导致具体实施时往往会存在所确定数据体的指标参数的表征性不合理、误差较大的技术问题。针对产生上述技术问题的根本原因,本申请考虑可以引入一种新的参数作为比较参数,利用该参数来评价其他平均参数作为指标是否合适,表征效果是否较好,从而可以解决现有方法中存在的所确定数据体的指标参数的表征性不合理、误差较大的技术问题,达到准确地确定表征效果较好的数据体的平均指标的技术效果。
基于上述创新思路之一,本申请实施方式提供了一种数据体的平均指标的确定方法。具体请参阅图1所示的根据本申请实施方式提供的数据体的平均指标的确定方法的处理流程图。本申请实施方式提供的数据体的平均指标的确定方法,具体可以包括以下内容。
在本实施方式中,上述数据体的平均指标具体可以是一种表征效果相对较好的指示参数,通过该参数可以较准确地反映出待确定目标数据的整体的平均情况,即该数据体的典型水平。根据该参数可以大致获取该数据体的整体数值的平均水平、各个数值的分布情况等信息,以便后续可以根据该参数,对该目标数据体进行针对性的分析处理。例如,通过目标数据体的平均指标可以揭示一般典型的特征,消除偶然因素的影响,最大限度地反映出该数据体所表征的对应规律或客观特征。
S11:获取待确定的目标数据体。
在一个实施方式中,上述目标数据体具体可以包括:孔隙度数据、渗透率数据、饱和度数据、地层厚度数据、生产成本数据、石油产量数据等。当然,需要说明的是,上述所列举的数据只是为了更好地说明本申请实施方式,具体实施时,也可以应用本申请实施方式所提供的数据体的平均指标的确定方法对除上述所列举的数据以外的其他类型数据进行相应的分析、处理。
在一个实施方式中,需要说明的是,对于大数据量的数据体,例如,对数据个数大于等于10的目标数据体,应用本申请实施方式所确定的目标数据体的平均指标的表征效果相对较好、误差相对较小。
S12:对所述目标数据体进行预处理,将预处理后的目标数据体中的数据按照预设顺序排列,得到有序数据体。
在一个实施方式中,上述对所述目标数据体进行预处理,具体可以包括:对所述目标数据体的数据进行去重处理。具体的,可以将目标数据体中相同的多个数据合并为一个,同时可以记录关于该数据相同数据的个数,后续可以根据该个数确定该数据的频数。具体的,例如,目标数据体可以为以下一组数字:1、2、2、2、4、3、5、6、3、1、2。对该组数字进行预处理,具体可以是将多个相同的数字合为一个,即:将4个数据2,合为一个数据2,并记录数据2的个数为4;将2个数据1,合为一个数据1,并记录数据1的个数为2;将2个数据3,合为一个数据3,并记录数据3的个数为2;数据4、数据5、数据6都只有一个没有相同数据,不用进行去重处理,相应的,数据4的个数可以记录为1,数据5的个数可以记录为1,数据6的个数可以记录为1。经过上述预处理后,上述数据体变为:1、2、4、3、5、6。以便后续处理。
在一个实施方式中,在对上述目标数据体进行预处理后,为了便于后续确定加权中位数,具体实施时,可以按照预设的顺序将预处理后的目标数据体中的数据进行重新排列,以得到有序数据体。上述预设顺序具体可以是数值从大到小的顺序,也可以是数值从小到大的顺序。对此,本申请不作限定。在本实施方式中,为了便于后续的数据处理,优选地,是将预处理后的目标数据体中的数据按照从小到大的顺序进行排列。具体的,例如,预处理后的数据体为:1、2、4、3、5、6,按照数值从小到大的顺序重新排列后确定的有序数据体为:1、2、3、4、5、6。
S13:确定所述有序数据体的加权中位数和多个平均指示参数。
在一个实施方式中,具体实施时,可以根据目标数据体的特征,确定有序数据体中各个数据的频数、频率;根据有序数据体中各个数据的频数、频率,确定该有序数据体的加权中位数和多个平均指示参数。也可以根据目标数据体的特征,确定有序数据体中各个数据的权数、权重;根据有序数据体中各个数据的权数、权重,确定该有序数据体的加权中位数和多个平均指示参数。
在一个实施方式中,上述根据所述有序数据体,确定所述有序数据体中各个数据的频数、频率,具体可以包括:根据上述有序数据体中各个数据的个数,确定数据对应的频数,将数据的频数除以该数据体中所有数据的频数和得到的商值作为该数据的频率。具体地,例如上述预处理后的有序数据体为:1、2、3、4、5、6,记录的数据1的个数为2,数据2的个数为4,数据3的个数为2,数据4的个数为1,数据5的个数为1,数据6的个数为1。按照上述方式可以确定数据1的频数为2,数据2的频数为4,数据3的频数为2,数据4的频数为1,数据5的频数为1,数据6的频数为1,该数据体中所有数据的频数和为11。进而可以确定数据1的频率为2/11,数据2的频率为4/11,数据3的频率为2/11,数据4的频率为1/11,数据5的频率为1/11,数据6的频率为1/11。
在一个实施方式中,上述根据所述有序数据体,确定所述有序数据体中各个数据的权数、权重,具体可以包括:根据待确定数据体中数据所表征的物理意义以及具体的施工要求,确定权重指标,根据所述权重指标确定有序数据体中各个数据的权数,将有序数据体中数据的权数除以该数据体中所有数据的权数之和得到的商值作为该数据的权重。具体的,例如,待确定的目标数据体是孔隙度数据体,可以将该数据体中各个孔隙度数据所对应的储层厚度作为该数据的权数,将某个孔隙度数据的储层厚度除以该数据体中所有数据的储层厚度之和得到的商值作为该数据的权重。需要说明的是,如何确定上述有序数据体中的权数,具体可以根据实施情况、数据体体本身特征、具体的施工要求等因素灵活确定。优选地,可以将数据体中与研究主题相关,使平均方法具有明确物理意义的参数作为权数。
在一个实施方式中,上述多个平均指示参数具体可以包括:算术平均值、几何平均值、调和平均值、中位数、众数等。其中,上述算术平均值、几何平均值、调和平均值、中位数、众数等参数都可以通过某个角度,某种程度地反映数据体的平均情况。但是,需要说明的是,上述所列举的平均指示参数只是为了更好地说明本申请实施方式,具体实施时,也可以根据具体情况和施工要求,引入其他的参数作为上述平均指示参数。
在一个实施方式中,具体实施时,可以根据有序数据体的各个频数,按照以下公式,确定上述平均指示参数中的算术平均值:
上式中,为算术平均值,xi为有序数据体中编号为i的数据,Ni为编号为i的数据的频数,n为有序数据体中不同数据的总个数,i的取值为1至n。
在本实施方式中,具体实施时,由于确定关于权数的算术平均值与确定关于频数据的算术平均值过程相似,可以应用上述确定关于频数的算术平均值的公式,根据有序数据体的各个权数,确定对应的算术平均值。其中,公式中Ni可以为编号为i的数据的权数。
在一个实施方式中,具体实施时,可以根据有序数据体的各个频数,按照以下公式,确定上述平均指示参数中的几何平均值:
上式中,为几何平均值,xi为有序数据体中编号为i的数据,Ni为编号为i的数据的频数,n为有序数据体中不同数据的总个数,i的取值为1至n。
在一个实施方式中,具体实施时,为了防止计算时的数据溢出,可以对上述确定几何平均值的公式进行修改,按照以下公式,确定几何平均值:
上式中,为几何平均值,xi为有序数据体中编号为i的数据,Ni为编号为i的数据的频数,n为有序数据体中不同数据的总个数,i的取值为1至n。
在本实施方式中,具体实施时,由于确定关于权数的几何平均值与确定关于频数据的几何平均值过程相似,可以应用上述确定关于频数的几何平均值的公式,根据有序数据体的各个权数,确定对应的几何平均值。其中,公式中Ni可以为编号为i的数据的权数。
在一个实施方式中,具体实施时,可以根据有序数据体的各个频数,按照以下公式,确定上述平均指示参数中的调和平均值:
上式中,为调和平均值,xi为有序数据体中编号为i的数据,Ni为编号为i的数据的频数,n为有序数据体中不同数据的总个数,i的取值为1至n。
在本实施方式中,具体实施时,由于确定关于权数的调和平均值与确定关于频数的调和平均值过程相似,可以应用上述确定关于频数的调和平均值的公式,根据有序数据体的各个权数,确定对应的调和平均值。其中,公式中Ni可以为编号为i的数据的权数。
在一个实施方式中,具体实施时,可以按照以下公式确定有序数据体中的中位数:
Me=x(n+1)/2,(n-2INT(n/2)=1)
上式中,Me为中位数,INT(n/2)为取整函数,n为有序数据体中数据总数,x(n+1)/2有序数据体中编号为(n+1)/2的数据,x(n+1)/2为有序数据体中编号为n/2的数据,xn/2+1为有序数据体中编号为n/2+1的数据。
在一个实施方式中,具体实施时,可以根据有序数据体的各个频数或权数,按照以下方式,确定上述有序数据体的众数:将上述有序数据体中频数最大或者权数最大的数据确定为该有序数据体的众数。
在一个实施方式中,本申请实施方式所引入的加权中位数是一种即考虑的数值平均,又兼顾了分布因素,即空间位置平均的指示参数。因此,后续可以使用该加权中位数作为评价哪种平均指示参数适合作为该数据体的平均指标的比较参数。
在一个实施方式中,具体实施时,所述根据所述有序数据体中各个数据的频数、频率,确定所述目标数据体的加权中位数,具体可以包括以下内容。
S13-1-1:根据所述有序数据体中各个数据的频数、频率,分别计算所述有序数据体中各个数据的左累积频率和右累积频率。
在本实施方式中,需要说明的是,上述计算左累积频率具体可以是从有序数据体的最左端的数据开始,向右依次累加各个数据的频率;上述计算右累积权重具体可以是从有序数据体最右端的频率,向左依次累加各个数据的频率。具体的,以计算左累积频率为例,有序数据体为:1、2、3、4、5、6,对应的,各个数据的频率分别为:数据1的频率为2/11,数据2的频率为4/11,数据3的频率为2/11,数据4的频率为1/11,数据5的频率为1/11,数据6的频率为1/11。进而,可以通过上述方式从左往右依次计算各个数据的左累积频率:数据1的左累积频率为2/11,即0.182,数据2的左累积频率为2/11+4/11=6/11,即0.545,数据3的左累积频率为2/11+4/11+2/11=8/11,即0.727,数据4的左累积频率为2/11+4/11+2/11+1/11=9/11,即0.818,数据5的左累积频率为10/11,即0.909,数据6的左累积频率为11/11,即1。对于右累积频率,计算的方式与计算左累积频率的过程相似。对此,本申请不再赘述。
S13-1-2:确定与50%的差值满足第二预设条件的左累积频率作为第一左频率,将所述第一左频率所对应的数据作为第一左侧数据。
在本实施方式中,上述与50%的差值满足第二预设条件的左累积频率具体可以是与50%作差的差值的绝对值最小的左累积频率。
S13-1-3:确定与50%的差值满足所述第二预设条件的右累积频率作为第一右频率,将所述第一右频率所对应的数据作为第一右侧数据。
在本实施方式中,上述与50%的差值满足第二预设条件的右累积频率具体可以是与50%作差的差值的绝对值最小的右累积频率。
S13-1-4:根据所述第一左频率、所述第一左侧数据、所述第一右频率、所述第一右侧数据,确定所述目标数据体的加权中位数。
在一个实施方式中,具体实施时,可以根据所述有序数据体中各个数据的频数、频率,按照以下公式依次确定第一左频率、第一右频率,进而确定目标数据体的加权中位数:
XME=xLfL+xRfR
上式中,fL为第一左频率,L为第一左侧数据在有序数据体中的数据编号,i为有序数据体中的数据编号,其中,i的取值为1至n,n为有序数据体中的数据总数,fi为编号为i的数据的频率,fR为第一右频率,R为第一右侧数据在有序数据体中的数据编号,XME为加权中位数,xL为第一左侧数据,xR为第一右侧数据。
在一个实施方式中,具体实施时,所述根据所述有序数据体中各个数据的权数、权重,确定所述目标数据体的加权中位数,具体可以包括以下内容。
S13-2-1:根据所述有序数据体中各个数据的权数、权重,分别计算所述有序数据体中各个数据的左累积权重和右累积权重。
在本实施方式中,需要说明的是,上述计算左累计权重具体可以是从有序数据体的最左端的数据开始,向右依次累加各个数据的权重;上述计算右累积权重具体可以是从有序数据体最右端的数据,向左依次累加各个数据的权重。在本实施方式中,计算左累积权重和右累积权重与计算左累积频率和右累积频率的过程相似,具体可以参照计算左累积频率的过程。在此,本申请不再赘述。
S13-2-2:确定与50%的差值满足第二预设条件的左累积权重作为第一左权重,将所述第一左权重所对应的数据作为第二左侧数据。
在本实施方式中,上述与50%的差值满足第二预设条件的左累积权重具体可以是与50%作差的差值的绝对值最小的左累积权重。
S13-2-3:确定与50%的差值满足所述第二预设条件的右累积权重作为第一右权重,将所述第一右权重所对应的数据作为第二右侧数据。
在本实施方式中,上述与50%的差值满足第二预设条件的右累积权重具体可以是与50%作差的差值的绝对值最小的右累积权重。
S13-2-4:根据所述第一左权重、所述第二左侧数据、所述第一右权重、所述第二右侧数据,确定所述目标数据体的加权中位数。
在一个实施方式中,具体实施时,可以根据所述有序数据体中各个数据的权数、权重,按照以下公式依次确定第一左权重、第一右权重,进而确定目标数据体的加权中位数:
XME=x′LwL+x′RwR
上式中,wL为第一左权重,L为第二左侧数据在有序数据体中的数据编号,i为有序数据体中的数据编号,其中,i的取值为1至n,n为有序数据体中的数据总数,wi为编号为i的数据的频率,wR为第一右权重,R为第二右侧数据在有序数据体中的数据编号,XME为加权中位数,x′L为第二左侧数据,x′R为第二右侧数据。
S14:将所述多个平均指示参数中与所述加权中位数的差值满足第一预设条件的平均指示参数确定为所述目标数据体的平均指标。
在一个实施方式中,上述将所述多个平均指示参数中与所述加权中位数的差值满足第一预设条件的平均指示参数确定为所述目标数据体的平均指标,具体可以包括以下内容。
S14-1:分别确定所述多个平均指示参数中各个平均指示参数与所述加权中位数的差值。
S14-2:根据所述差值,确定与所述加权中位数的差值的绝对值最小的平均指示参数作为所述目标数据体的平均指标。
在本实施方式中,具体实施时,可以分别比较各个平均指示参数与加权中位数的差值,选择与加权中位数的差值的绝对值最小的一个平均指示参数作为该目标数据体的平均指标。该参数与加权中位数据的差值的绝对值最小,可以认为该参数与加权中位数最接近,因此,相对于其他平均指示参数,该参数的表征效果相对更好,更能较为准确地表征出目标数据体的整体的平均情况。
在本申请实施例中,相较于现有方法,通过引入加权中位数作为比较参数,实施时先对目标数据体进行排序处理,再根据处理后的有序数据体确定出加权中位数,利用加权中位数确定合适的平均指示参数作为平均指标。因而解决了现有方法中存在的所确定数据体的指标参数的表征性不合理、误差较大的技术问题,达到准确地确定表征效果较好的数据体的平均指标的技术效果。
在一个实施方式中,在确定出目标数据体的平均指标后,所述方法还可以包括:根据所述目标数据体的平均指标,进行地质勘探。具体的,例如,在目标数据体为某区域地层的渗透率数据体的情况下,确定某区域的地层的渗透率数据体的平均指标后,可以以该平均指标作为参考依据,进行具体的地质勘探。例如,对该区域地层的油藏进行预测,或者对该区域地层进行储层评价等。当然,需要说明的是,上述所列举的地质勘探只是为了更好地说明本申请实施方式,具体实施时,可以根据数据体所表征的物理意义和具体的施工要求,利用该目标数据体的平均指标进行其他类型的具体施工。例如,可以根据某公司员工工资数据体的平均指标,指导调整公司结构,完善员工福利等。还可以根据某产品的销售数据体的平均指标,规划针对该产品的推广。
在一个实施方式中,所述方法还可以包括:
根据所述有序数据体中各个数据的频率,建立所述目标数据体的数据频率分布曲线,并根据所述目标数据体的数据频率分布曲线,对所述目标数据体的平均指标进行校验;
和/或,
根据所述有序数据体中各个数据的权重,建立所述目标数据体的数据权重分布曲线,并根据所述目标数据体的数据权重分布曲线,对所述目标数据体的平均指标进行校验。
如此,可以对所确定的目标数据体的平均指标的准确性进行校验,以便进一步改善所确定的目标数据体的平均指标的准确度。具体的,如果所确定的目标数据体的平均指标与目标数据体的数据频率分布曲线或目标数据体的数据权重分布曲线所反映的信息一致,则可以判断该目标数据体的平均指标较为准确。如果所确定的目标数据体的平均指标与目标数据体的数据频率分布曲线或目标数据体的数据权重分布曲线所反映的信息不一致,偏差较大,则可以判断该目标数据体的平均指标准确度不够,需要重新确定该目标数据体的平均指标。
在一个,在确定出所述目标数据体的平均指标后,所述方法具体还可以包括以下内容。
S15:确定所述目标数据体的平均指标是否满足预设的阈值范围,其中,所述预设的阈值范围为第一左侧数据至第一右侧数据,或,第二左侧数据至第二右侧数据。
S16:在确定所述目标数据体的平均指标不满足所述预设的阈值范围的情况下,将所述加权中位数确定为所述目标数据体的平均指标。
在本实施方式中,加权中位数通常位于上述阈值范围内,当所确定的目标数据体的平均指标不满足预设的阈值范围,即不在第一左侧数据至第一右侧数据之间,或,第二左侧数据至第二右侧数据之间,可以判断与加权中位数最接近的平均指示参数的表征效果不能满足要求,其他的平均指示参数与加权中位数的差值相对更大,可以判断其他的平均指示参数的表征效果同样也不能满足要求。在这种情况下,判断多个平均指示参数都不适合作为目标数据体的平均指标,因此,可以将该加权中位数作为该目标数据体的平均指标,以表征目标数据体的整体平均情况。
在一个实施方式中,上述目标数据体具体可以包括:孔隙度数据、渗透率数据、饱和度数据、地层厚度数据、生产成本数据、石油产量数据等。当然,具体实施时,也可以根据具体情况和施工要求,将除上述列举的多种数据以外的其他数据作为目标数据体。
在一个实施方式中,应用本申请实施方式所提供的数据体的平均指标的确定方法,要求待确定目标数据体中的数据个数大于等于10。在这种情况下,应用本申请实施方式提供的数据体的平均指标的确定方法确定数据体的平均指标速度较快、效果较好。在目标数据体的数据个数较少的情况下,例如只有2~3个数据,加权中位数作用相对较差。在这种情况,由于本身需要处理的数据数量较少,可以计算目标数据体的几何平均值,通常可以将该目标数据体的几何平均值作为该数据体的平均指标。
从以上的描述中,可以看出,本申请实施方式提供的数据体的平均指标的确定方法,通过引入加权中位数作为比较参数,实施时先对目标数据体进行排序处理,再根据处理后的有序数据体确定出加权中位数,利用加权中位数确定合适的平均指示参数作为平均指标。因而解决了现有方法中存在的所确定数据体的指标参数的表征性不合理、误差较大的技术问题,达到准确地确定表征效果较好的数据体的平均指标的技术效果;又通过建立目标数据体的数据频率分布曲线或数据体的权重分布曲线,对所确定的数据体的平均指标进行校验,提高了所确定的平均指标的准确度。
基于同一发明构思,本发明实施方式中还提供了一种数据体的平均指标的确定装置,如下面的实施方式所述。由于装置解决问题的原理与数据体的平均指标的确定方法相似,因此数据体的平均指标的确定装置的实施可以参见数据体的平均指标的确定方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。请参阅图2,是本申请实施方式的数据体的平均指标的确定装置的一种组成结构图,该装置可以包括:获取模块201、预处理模块202、第一确定模块203、第二确定模块204,下面对该结构进行具体说明。
获取模块201,具体可以用于获取待确定的目标数据体。
预处理模块202,具体可以用于对所述目标数据体进行预处理,将预处理后的目标数据体中的数据按照预设顺序排列,得到有序数据体。
第一确定模块203,具体可以用于确定所述有序数据体的加权中位数和多个平均指示参数。
第二确定模块204,具体可以用于将所述多个平均指示参数中与所述加权中位数的差值满足第一预设条件的平均指示参数确定为所述目标数据体的平均指标。
在一个实施方式中,所述装置还可以包括施工模块,具体可以用于根据所述目标数据体的平均指标,进行地质勘探。
在一个实施方式中,所述预处理模块202还可以包括去重单元,具体可以用于对所述目标数据体中的数据进行去重处理。
在一个实施方式中,所述装置还可以包括校验模块,具体可以用于,在确定所述目标数据体的平均指标后,根据所述有序数据体中各个数据的频率,建立所述目标数据体的数据频率分布曲线,并根据所述目标数据体的数据频率分布曲线,对所述目标数据体的平均指标进行校验;和/或,根据所述有序数据体中各个数据的权重,建立所述目标数据体的数据权重分布曲线,并根据所述目标数据体的数据权重分布曲线,对所述目标数据体的平均指标进行校验。
在一个实施方式中,所述第一确定模块203具体实施时,可以根据所述有序数据体中各个数据的频数、频率,分别计算所述有序数据体中各个数据的左累积频率和右累积频率;再确定与50%的差值满足第二预设条件的左累积频率作为第一左频率,将所述第一左频率所对应的数据作为第一左侧数据;然后确定与50%的差值满足所述第二预设条件的右累积频率作为第一右频率,将所述第一右频率所对应的数据作为第一右侧数据;最后根据所述第一左频率、所述第一左侧数据、所述第一右频率、所述第一右侧数据,确定所述目标数据体的加权中位数。
在一个实施方式中,所述第一确定模块203具体可以按照以下公式确定所述加权中位数:
XME=xLfL+xRfR
上式中,XME为加权中位数,xL为第一左侧数据,fL为第一左频率,xR为第一右侧数据,fR为第一右频率。
在一个实施方式中,所述第一确定模块203具体实施时,也可以:根据所述有序数据体中各个数据的权数、权重,分别计算所述有序数据体中各个数据的左累积权重和右累积权重;再确定与50%的差值满足第二预设条件的左累积权重作为第一左权重,将所述第一左权重所对应的数据作为第二左侧数据;然后确定与50%的差值满足所述第二预设条件的右累积权重作为第一右权重,将所述第一右权重所对应的数据作为第二右侧数据;最后根据所述第一左权重、所述第二左侧数据、所述第一右权重、所述第二右侧数据,确定所述目标数据体的加权中位数。
在一个实施方式中,第二确定模块204具体可以包括以下结构:
第一确定单元,具体可以用于分别确定所述多个平均指示参数中各个平均指示参数与所述加权中位数的差值;
第二确定单元,具体可以用于根据所述差值,确定与所述加权中位数的差值的绝对值最小的平均指示参数作为所述目标数据体的平均指标。
在一个实施方式中,所述装置还可以包括检测模块,具体可以用于确定所述目标数据体的平均指标是否满足预设的阈值范围,其中,所述预设的阈值范围为第一左侧数据至第一右侧数据,或,第二左侧数据至第二右侧数据;在确定所述目标数据体的平均指标不满足所述预设的阈值范围的情况下,将所述加权中位数确定为所述目标数据体的平均指标。
在一个实施方式中,所述目标数据体包括以下至少之一:孔隙度数据、渗透率数据、饱和度数据、地层厚度数据、生产成本数据、石油产量数据等。
在一个实施方式中,所述目标数据体中的数据个数大于等于10。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,上述实施方式阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,在本说明书中,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
此外,在本说明书中,诸如第一和第二这样的形容词仅可以用于将一个元素或动作与另一元素或动作进行区分,而不必要求或暗示任何实际的这种关系或顺序。在环境允许的情况下,参照元素或部件或步骤(等)不应解释为局限于仅元素、部件、或步骤中的一个,而可以是元素、部件、或步骤中的一个或多个等。
从以上的描述中,可以看出,本申请实施方式提供的数据体的平均指标的确定装置,通过引入加权中位数作为比较参数,实施时先对目标数据体进行排序处理,再根据处理后的有序数据体确定出加权中位数,利用加权中位数确定合适的平均指示参数作为平均指标。因而解决了现有方法中存在的所确定数据体的指标参数的表征性不合理、误差较大的技术问题,达到准确地确定表征效果较好的数据体的平均指标的技术效果;又通过建立目标数据体的数据频率分布曲线或数据体的权重分布曲线,对所确定的数据体的平均指标进行校验,提高了所确定的平均指标的准确度。
在一个具体实施场景中,应用本申请提供的数据体的平均指标的确定方法/装置对某油藏储集岩分析渗透率数据体的平均指标进行具体的确定。具体可以参阅以下内容。
S1:获取某油藏储集岩分析渗透率数据体,其中,该数据体中包括有各个渗透率值和对应的储层厚度,具体可以参阅表1。
表1渗透率原始数据体
S2:整理原始数据体(即对数据体进行预处理),并建立有序数据体(即有序数据体)。具体的,将原始数据体中不同的数据从小到大依次排列,确定渗透率的权重指标为储层厚度,统计不同渗透率数据对应的厚度权数,得到一个没有相同渗透率分析数据的有序数据体,具体可以参阅表2。
表2渗透率有序数据体
S3:确定有序数据体的基本特征。即依次计算有序数据体中不同渗透率的权重、累积权重、左累积权重和右累积权重,绘制渗透率数据体权重分布曲线图。具体可以参阅表3,以及图3所示的在一个实施场景中应用本申请实施方式提供数据体的平均指标的确定方法/装置获得的渗透率数据体权重分布曲线图。
表3渗透率的权重及累计权重
S4:计算有序数据体的多种平均指示参数。
(1)计算算术平均值:
(2)计算几何平均值:
(3)计算调和平均值:
(4)计算中位数:
(5)计算众数:
结合频率分布曲线图,确定权重最大的数据为众数,即确定渗透率数据体众数为2048mD。
(6)计算加权中位数:
wR=1-wL=49.89%
xL=128mD
xR=256mD
ME=xLwL+xR(1-wL)=128×0.5011+256×(1-0.5011)=191.86mD
S5:以加权中位数作为比较参数,从上述多个平均指示参数中确定出与所述加权中位数的差值满足第一预设条件的平均指示参数作为所述目标数据体的平均指标
具体的,可以根据上述计算的多个平均指示参数,建立渗透率平均指示参数表,以便于后续的处理。具体可以参阅表4。
表4渗透率数据体平均指示参数表
根据表4,并结合图3,根据平衡中位数法则,可以确定与加权中位数的差值的绝对值最小的平均值指示参数作为该数据体的平均指标,又考虑到该渗透率数据体的平均指标应该介于128~256mD之间(即第二左侧数据和第二右侧数据之间)。因此,该渗透率数据体的平均指标最终确定为加权中位数191.86mD。
在另一个具体实施场景中,应用本申请提供的数据体的平均指标的确定方法/装置对某产品价格分布数据体的平均指标进行具体的确定。具体可以参阅以下内容。
S1:获取某产品价格分布数据体。具体可以参阅表5。
表5某产品价格原始数据体
S2:整理原始数据体(即对数据体进行预处理),并建立有序数据体(即有序数据体)。具体的,可以以产品件数作为频数(可以根据产品价格和支付金额计算确定),分别统计不同产品价格的频数,得到一个有序数据体。具体可以参阅表6。
表6产品价格有序数据体
S3:确定有序数据体的基本特征。依次计算有序数据体中不同产品价格的频率、累积频率、左累积频率和右累积频率,并绘制产品价格数据体频率分布曲线图。具体可以参阅表7和图4所示的在另一个实施场景中应用本申请实施方式提供数据体的平均指标的确定方法/装置获得的产品价格数据体频率分布曲线图。
表7产品价格的频率及累积频率
S4:计算有序数据体的多种平均指示参数。
(1)计算算术平均值(单位为:元/件):
(2)计算几何平均值(单位为:元/件):
(3)调和平均值(单位为:元/件):
(4)计算中位数(单位为:元/件):
Me=x(n+1)/2=x7=35,[13-2INT(13/2)=1]。
(5)计算众数(单位:元/件):
具体可以结合图4的产品价格数据体频率分布曲线,确定频率最大的数据为众数,即确定产品价格数据体的众数为10。
(6)计算加权中位数(单位:元/件):
xL=25,xR=30
ME=xLfL+xRfR=25×0.5347+30×0.4653=27.33。
S5:以加权中位数作为比较参数,从上述多个平均指示参数中确定出与所述加权中位数的差值满足第一预设条件的平均指示参数作为所述目标数据体的平均指标
具体的,可以根据上述计算的多个平均指示参数,建立产品价格数据平均指示参数表,以便于后续的处理。具体可以参阅表8。
表8产品价格数据平均指示参数表
根据表8,并结合图4,根据平衡中位数法则,可以确定与加权中位数的差值的绝对值最小的平均值指示参数作为该数据体的平均指标,又考虑到该渗透率数据体的平均指标应该介于25~30元/件之间(即第二左侧数据和第二右侧数据之间)。因此,该产品价格数据体的平均指标最终确定为算术平均值26.93元/件。
在本实施方式中,需要补充的是上述平衡中位数法则是基于本申请实施方式提供的数据体的平均指标的确定方法整理而形成的判断方法。具体的,平衡中位数法可以指加权中位数两侧紧邻的自然区间出现小于等于50%的最大累积频率(或最大累积权重)或大于等于50%的最小累积频率(或最小累积权重),把区间内有明确物理意义的加权平均值或最靠近加权中位数的平均指示参数作为目标数据体的平均指标,表征效果最好;在区间内无适合的平均指示参数时,可以利用加权中位数作为该数据体的平均指标。需要说明的是,应用上述平衡中位数法则确定正常有序数据体的平均指标,通常需满足以下两个条件:1)原始数据体有足够大的数据容量,能满足最基本的统计分析要求(通常要求数据体的数据量大于等于10);2)要选择到合理的参数作为权衡指标,确定对应的权数和权重。
通过上述的两个具体的场景示例,验证了本申请实施方式提供的数据体的平均指标的确定方法和装置确实可以解决现有方法中存在的所确定数据体的指标参数的表征性不合理、误差较大的技术问题,达到准确地确定表征效果较好的数据体的平均指标的技术效果。
尽管本申请内容中提到不同的具体实施方式,但是,本申请并不局限于必须是行业标准或实施例所描述的情况等,某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、处理、输出、判断方式等的实施例,仍然可以属于本申请的可选实施方案范围之内。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。
上述实施例阐明的装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的实施方式包括这些变形和变化而不脱离本申请。

Claims (12)

1.一种数据体的平均指标的确定方法,其特征在于,包括:
获取待确定的目标数据体;
对所述目标数据体进行预处理,将预处理后的目标数据体中的数据按照预设顺序排列,得到有序数据体;
确定所述有序数据体的加权中位数和多个平均指示参数;
将所述多个平均指示参数中与所述加权中位数的差值满足第一预设条件的平均指示参数确定为所述目标数据体的平均指标。
2.根据权利要求1所述的方法,其特征在于,在确定出目标数据体的平均指标后,所述方法还包括:
根据所述目标数据体的平均指标,进行地质勘探。
3.根据权利要求1所述的方法,其特征在于,对所述目标数据体进行预处理,包括:
对所述目标数据体中的数据进行去重处理。
4.根据权利要求1所述的方法,其特征在于,在确定所述目标数据体的平均指标后,所述方法还包括:
根据所述有序数据体中各个数据的频率,建立所述目标数据体的数据频率分布曲线,并根据所述目标数据体的数据频率分布曲线,对所述目标数据体的平均指标进行校验;
和/或,
根据所述有序数据体中各个数据的权重,建立所述目标数据体的数据权重分布曲线,并根据所述目标数据体的数据权重分布曲线,对所述目标数据体的平均指标进行校验。
5.根据权利要求1所述的方法,其特征在于,所述根据所述有序数据体中各个数据的频数、频率,确定所述目标数据体的加权中位数,包括:
根据所述有序数据体中各个数据的频数、频率,分别计算所述有序数据体中各个数据的左累积频率和右累积频率;
确定与50%的差值满足第二预设条件的左累积频率作为第一左频率,将所述第一左频率所对应的数据作为第一左侧数据;
确定与50%的差值满足所述第二预设条件的右累积频率作为第一右频率,将所述第一右频率所对应的数据作为第一右侧数据;
根据所述第一左频率、所述第一左侧数据、所述第一右频率、所述第一右侧数据,确定所述目标数据体的加权中位数。
6.根据权利要求5所述的方法,其特征在于,根据所述第一左频率、所述第一左侧数据、所述第一右频率、所述第一右侧数据,确定所述目标数据体的加权中位数,包括:
按照以下公式确定所述加权中位数:
XME=xLfL+xRfR
上式中,XME为加权中位数,xL为第一左侧数据,fL为第一左频率,xR为第一右侧数据,fR为第一右频率。
7.根据权利要求1所述的方法,其特征在于,所述根据所述有序数据体中各个数据的权数、权重,确定所述目标数据体的加权中位数,包括:
根据所述有序数据体中各个数据的权数、权重,分别计算所述有序数据体中各个数据的左累积权重和右累积权重;
确定与50%的差值满足第二预设条件的左累积权重作为第一左权重,将所述第一左权重所对应的数据作为第二左侧数据;
确定与50%的差值满足所述第二预设条件的右累积权重作为第一右权重,将所述第一右权重所对应的数据作为第二右侧数据;
根据所述第一左权重、所述第二左侧数据、所述第一右权重、所述第二右侧数据,确定所述目标数据体的加权中位数。
8.根据权利要求1所述的方法,其特征在于,将所述多个平均指示参数中与所述加权中位数的差值满足第一预设条件的平均指示参数确定为所述目标数据体的平均指标,包括:
分别确定所述多个平均指示参数中各个平均指示参数与所述加权中位数的差值;
根据所述差值,确定与所述加权中位数的差值的绝对值最小的平均指示参数作为所述目标数据体的平均指标。
9.根据权利要求8所述的方法,其特征在于,在确定出所述目标数据体的平均指标后,所述方法还包括:
确定所述目标数据体的平均指标是否满足预设的阈值范围,其中,所述预设的阈值范围为第一左侧数据至第一右侧数据,或,第二左侧数据至第二右侧数据;
在确定所述目标数据体的平均指标不满足所述预设的阈值范围的情况下,将所述加权中位数确定为所述目标数据体的平均指标。
10.根据权利要求1所述的方法,其特征在于,所述目标数据体包括以下至少之一:孔隙度数据、渗透率数据、饱和度数据、地层厚度数据、生产成本数据、石油产量数据。
11.根据权利要求1所述的方法,其特征在于,所述目标数据体中的数据个数大于等于10。
12.一种数据体的平均指标的确定装置,其特征在于,包括:
获取模块,用于获取待确定的目标数据体;
预处理模块,用于对所述目标数据体进行预处理,将预处理后的目标数据体中的数据按照预设顺序排列,得到有序数据体;
第一确定模块,用于确定所述有序数据体的加权中位数和多个平均指示参数;
第二确定模块,用于将所述多个平均指示参数中与所述加权中位数的差值满足第一预设条件的平均指示参数确定为所述目标数据体的平均指标。
CN201710728630.4A 2017-08-23 2017-08-23 地质勘探方法和装置 Active CN107656903B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710728630.4A CN107656903B (zh) 2017-08-23 2017-08-23 地质勘探方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710728630.4A CN107656903B (zh) 2017-08-23 2017-08-23 地质勘探方法和装置

Publications (2)

Publication Number Publication Date
CN107656903A true CN107656903A (zh) 2018-02-02
CN107656903B CN107656903B (zh) 2021-04-30

Family

ID=61128781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710728630.4A Active CN107656903B (zh) 2017-08-23 2017-08-23 地质勘探方法和装置

Country Status (1)

Country Link
CN (1) CN107656903B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109113732A (zh) * 2018-08-09 2019-01-01 中国石油天然气股份有限公司 储层非均质性的确定方法及装置
CN109346168A (zh) * 2018-08-31 2019-02-15 东软集团股份有限公司 一种确定数据相关性的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912655A (zh) * 2005-08-10 2007-02-14 大庆油田有限责任公司 一种沉积相控制预测砂岩油藏储层属性的方法
CN105678473A (zh) * 2016-02-22 2016-06-15 中国石油天然气股份有限公司 一种注水开发油藏油层水驱油效率的判识方法
US20160175634A1 (en) * 2014-10-14 2016-06-23 Regents Of The University Of Minnesota Compositions including matrix and biomaterial, uses thereof and methods of using the same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912655A (zh) * 2005-08-10 2007-02-14 大庆油田有限责任公司 一种沉积相控制预测砂岩油藏储层属性的方法
US20160175634A1 (en) * 2014-10-14 2016-06-23 Regents Of The University Of Minnesota Compositions including matrix and biomaterial, uses thereof and methods of using the same
CN105678473A (zh) * 2016-02-22 2016-06-15 中国石油天然气股份有限公司 一种注水开发油藏油层水驱油效率的判识方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
侯景儒,等: "加权中位数法的基本理论、方法及其应用", 《地质与勘探》 *
董晓波,等: "算术平均指标代表性的评价分析", 《淮海工学院学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109113732A (zh) * 2018-08-09 2019-01-01 中国石油天然气股份有限公司 储层非均质性的确定方法及装置
CN109346168A (zh) * 2018-08-31 2019-02-15 东软集团股份有限公司 一种确定数据相关性的方法及装置

Also Published As

Publication number Publication date
CN107656903B (zh) 2021-04-30

Similar Documents

Publication Publication Date Title
US10796257B2 (en) Method for providing business process analyses
CN107563633A (zh) 一种绩效指标考核评估方法、设备及存储介质
CN108171280A (zh) 一种分类器构建方法及预测分类的方法
CN109086546A (zh) 信号链路信号质量评估方法、装置、设备及可读存储介质
CN107784426A (zh) 一种员工的岗位分配方法、装置及设备
CN109947812A (zh) 连续缺失值填充方法、数据分析装置、终端及存储介质
CN106875110A (zh) 业务指标分层计算方法及装置、分布式计算方法及系统
CN109285082A (zh) 保险产品推荐方法、装置及计算机可读存储介质
CN104866408B (zh) 一种应用系统的容量预测方法和装置
CN109034505A (zh) 计量用表需求量在线预测方法及终端设备
CN109460908A (zh) 软件工程的造价评估方法
CN106646615A (zh) 一种面波频散曲线的数据处理方法及装置
CN107656903A (zh) 数据体的平均指标的确定方法和装置
CN110457396A (zh) 一种基于区块链科研数据处理方法、装置、设备和存储介质
CN110058310A (zh) 地震岩石的地震波速度频散及衰减预测方法及装置
CN110097170A (zh) 信息推送对象预测模型获取方法、终端及存储介质
CN103761618A (zh) 一种电网科技项目控制方法及系统
CN107122386A (zh) 数据的筛选方法及装置
CN110516472A (zh) 仿真方法和装置
CN106528774A (zh) 一种配网项目管理趋势预测方法和装置
CN110113373A (zh) 一种信息的过期处理方法及装置
CN108765147A (zh) 股票筛选方法、装置及计算机可读存储介质
CN110490554A (zh) 工作流管理方法、装置、计算机设备及存储介质
CN106126670A (zh) 运营数据排序处理方法及装置
CN109800265A (zh) 数据加载方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant