CN107766290A - 收敛的多元回归工程统计新方法 - Google Patents

收敛的多元回归工程统计新方法 Download PDF

Info

Publication number
CN107766290A
CN107766290A CN201610693324.7A CN201610693324A CN107766290A CN 107766290 A CN107766290 A CN 107766290A CN 201610693324 A CN201610693324 A CN 201610693324A CN 107766290 A CN107766290 A CN 107766290A
Authority
CN
China
Prior art keywords
variable
sample
group
independent variable
convergent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610693324.7A
Other languages
English (en)
Inventor
胡宝明
邴绍献
侯春华
赵小军
吴作舟
海会荣
王�华
冯义娜
马晶
张金铸
赵伟
孙成龙
李东玻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Exploration and Development Research Institute of Sinopec Henan Oilfield Branch Co
Exploration and Development Research Institute of Sinopec Shengli Oilfield Co
Original Assignee
China Petroleum and Chemical Corp
Exploration and Development Research Institute of Sinopec Henan Oilfield Branch Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Exploration and Development Research Institute of Sinopec Henan Oilfield Branch Co filed Critical China Petroleum and Chemical Corp
Priority to CN201610693324.7A priority Critical patent/CN107766290A/zh
Publication of CN107766290A publication Critical patent/CN107766290A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供一种收敛的多元回归工程统计新方法,包括:步骤1,从理论分析或者统计方法来确定自变量,这些自变量能够对因变量产生影响;步骤2,运用逐级筛选法筛选得到一组样品,这组样品的自变量相互独立,运用这组样品建立因变量与主要自变量关系式;步骤3,运用逐级筛选法筛选得到一组样品,这组样品的自变量x1、xn间相关,但x1、xn与其它自变量相互独立,运用这组样品建立因变量与其它自变量关系式;以及步骤4,通过迭代法来确定收敛系数。该收敛的多元回归工程统计新方法运用统计的手段来建立收敛函数,解决了运用非收敛方法拟合具有收敛特征的函数所带来的拟合精度偏低,模型意义与实际情况不符的问题。

Description

收敛的多元回归工程统计新方法
技术领域
本发明适用于多元回归数学统计方法领域,特别是涉及到建立具有收敛特征的工程模型的方法。
背景技术
多元回归分析是研究多个变量之间关系的回归分析方法,目前的多元回归统计方法是基于非收敛假设的基础上建立的,如果存在k(k≥2)个自变量X1,X2,…,Xk,假定因变量与自变量之间
存在着密切的线性关系,则为多元线性回归模型。即将因变量看作是各自变量作用的和(如图1非收敛函数示意图)。
但实际上工程函数多具有收敛的特征(如图1收敛函数示意图),因变量并非是各自变量作用的和,其中一个自变量对因变量的作用程度受到了其它自变量的影响。如果运用非收敛方法拟合具有收敛特征的函数拟合的精度会偏低,并且得到的函数的物理意义不符合实际情况。为此建立了一种收敛的多元回归工程统计新方法,可运用统计的手段来建立收敛函数。
发明内容
本发明的目的是提供一种运用统计的手段来建立收敛函数的收敛的多元回归工程统计新方法。
本发明的目的可通过如下技术措施来实现:收敛的多元回归工程统计新方法,该收敛的多元回归工程统计新方法包括:步骤1,从理论分析或者统计方法来确定自变量,这些自变量能够对因变量产生影响;步骤2,运用逐级筛选法筛选得到一组样品,这组样品的自变量相互独立,运用这组样品建立因变量与主要自变量关系式;步骤3,运用逐级筛选法筛选得到一组样品,这组样品的自变量x1、xn间相关,但x1、xn与其它自变量相互独立,运用这组样品建立因变量与其它自变量关系式;以及步骤4,通过迭代法来确定收敛系数。
本发明的目的还可通过如下技术措施来实现:
在步骤1中,收敛函数可近似分解为各影响因素函数的乘积再加一个收敛系数的形式:
式(1)中f1(x1)是原函数面上与x2,x3,…,xk无关的一条曲线τ1,即该曲线τ1与x1oY面平行,在x1oY面上的投影,gn(xn)是原函数面上的一条与x1,xn之外因素无关的曲线ln在xnoY面上的投影,x1=ωn(xn)是曲线ln在x1oxn面上的投影,α为收敛系数,用于控制函数的收敛程度。
在步骤2中,运用该组自变量相互独立的样品分别建立Y与x2,x3,…,xk的关系,选择出合理的曲线类型拟合得到f2(x2),f3(x3),…,fk(xk)的表达式。
在步骤3中,运用该组自变量x1、xn间相关,但x1、xn与其它自变量相互独立的样品建立Y与xn的关系,选择出合理的曲线类型拟合得到gn(xn)的表达式;运用该组自变量x1、xn间相关,但x1、xn与其它自变量相互独立的样品建立x1与xn的关系,选择出合理的曲线类型拟合得到x1=ωn(xn)的表达式;运用同样的方法得到g2(x2),g3(x3),…,gk(xk)及ω2(x2),ω3(x3),…,ωk(xk)的表达式。
在步骤4中,将由步骤2、3得到的各表达式代入式(1)并计算收敛系数α,收敛系数α是通过迭代法来确定的,通过多次迭代,不断调整α取值,使由式(1)计算得到的拟合值与样品实际值相关系数最大时,即求得了α值。
本发明中的收敛的多元回归工程统计新方法,可运用统计的手段来建立收敛函数,并将该方法应用于建立胜利油田吨液动力费模型,得到的模型拟合精度较高,结合其图版的,物理意义也可较为直观的解释。同时也避免了运用非收敛方法拟合具有收敛特征的函数所带来的拟合精度偏低,模型意义与实际情况不符的问题。
附图说明
图1为本发明的与非收敛方法的不同一非收敛函数与收敛函数示意图;
图2为本发明的一理论公式中各项的几何意义图;
图3为本发明的一具体实施例中的吨液动力费模型建立的流程图;
图4为本发明的一具体实施例中的样品点筛选图。
图5为本发明的一具体实施例中的选定样品点的平均单井日液与动液面关系图。
图6为本发明的一具体实施例中的平均单井日液与动液面关系图。
图7为本发明的一具体实施例中的吨液动力费与动液面关系图。
图8为本发明的一具体实施例中的平均单井日液与动液面关系图。
图9为本发明的一具体实施例中的建立的收敛模型图版。
具体实施方式
为使本发明的上述和其他目的、特征和优点能更明显易懂,下文特举出较佳实施例,并配合所附图式,作详细说明如下。
实际的工程模型多为收敛函数,收敛函数可近似分解为各影响因素函数的乘积再加一个收敛系数的形式:
式(1)中各函数的意义见图2,f1(x1)是原函数面上与x2,x3,…,xk无关的一条曲线τ1(即该曲线τ1与x1oY面平行)在x1oY面上的投影,gn(xn)是原函数面上的一条与x1,xn之外因素无关的曲线ln在xnoY面上的投影,x1=ωn(xn)是曲线ln在x1oxn面上的投影,α为收敛系数,用于控制函数的收敛程度。
特别地,当α→∞,式(1)变为
该方法需要样本点数量较大,需要的样品个数为8k-10k个。
如图3所示,图3为运用本发明拟合建立胜利油田水驱油田吨液动力费模型的流程图。
在步骤101中,确定自变量。从理论分析或者统计方法来确定自变量,这些自变量能够对因变量产生影响。考虑了因变量并非是各自变量作用的和,其中一个自变量对因变量的作用程度受到了其它自变量的影响,
在一实施例中,通过理论分析得到影响吨液动力费的主要因素为平均单井日液x1、平均动液面x2,所以为具有两个自变量的函数。
在步骤103中,建立因变量与主要自变量关系式。运用逐级筛选法筛选得到一组样品,这组样品的自变量相互独立。运用这组样品分别建立Y与x2,x3,…,xk的关系,选择出合理的曲线类型拟合得到f2(x2),f3(x3),…,fk(xk)的表达式。
在一实施例中,从现有样品中筛选得到一组样品,如图4所示,这组样品的平均单井日液x1、平均动液面x2相互独立,如图5所示。运用这组样品建立吨液动力费与平均单井日液的散点图,选择幂函数进行拟合,得到f1(x1)=155.47x1 -0.6426,如图6所示。
在步骤105中,建立因变量与其它自变量关系式。运用逐级筛选法筛选得到一组样品,这组样品的自变量x1、xn间相关,但x1、xn与其它自变量相互独立。运用这组样品建立Y与xn的关系,选择出合理的曲线类型拟合得到gn(xn)的表达式;运用这组样品建立x1与xn的关系,选择出合理的曲线类型拟合得到x1=ωn(xn)的表达式。运用同样的方法得到g2(x2),g3(x3),…,gk(xk)及ω2(x2),ω3(x3),…,ωk(xk)的表达式。
在一实施例中,因为目标函数具有两个自变量,所以样品不需要筛选,建立吨液动力费与平均动液面的散点图,选择指数函数进行拟合,得到如图7所示,建立平均单井日液与平均动液面的散点图,选择指数函数进行拟合,得到如图8所示。
在步骤107中,收敛系数的计算。将由步骤103、105得到的各表达式代入式(1)并计算收敛系数α,收敛系数α是通过迭代法来确定的,通过多次迭代,不断调整α取值,使由式(1)计算得到的拟合值与样品实际值相关系数最大时,即求得了α值。
在一实施例中,步骤103、105中的各表达式代入式(1)得到给定通过多次迭代,不断调整α取值,使由上式计算得到的拟合值与样品实际值相关系数最大,此时α=3.32,所以吨液动力费的模型为:图9为该函数的图版。

Claims (5)

1.收敛的多元回归工程统计新方法,其特征在于,该收敛的多元回归工程统计新方法包括:
步骤1,从理论分析或者统计方法来确定自变量,这些自变量能够对因变量产生影响;
步骤2,运用逐级筛选法筛选得到一组样品,这组样品的自变量相互独立,运用这组样品建立因变量与主要自变量关系式;
步骤3,运用逐级筛选法筛选得到一组样品,这组样品的自变量x1、xn间相关,但x1、xn与其它自变量相互独立,运用这组样品建立因变量与其它自变量关系式;以及
步骤4,通过迭代法来确定收敛系数。
2.根据权利要求1所述的收敛的多元回归工程统计新方法,其特征在于,在步骤1中,考虑了因变量并非是各自变量作用的和,其中一个自变量对因变量的作用程度受到了其它自变量的影响,将收敛函数近似分解为各影响因素函数的乘积再加一个收敛系数的形式:
式(1)中f1(x1)是原函数面上与x2,x3,…,xk无关的一条曲线τ1,即该曲线τ1与x1oY面平行,在x1oY面上的投影,gn(xn)是原函数面上的一条与x1,xn之外因素无关的曲线ln在xnoY面上的投影,x1=ωn(xn)是曲线ln在x1oxn面上的投影,α为收敛系数,用于控制函数的收敛程度。
3.根据权利要求2所述的收敛的多元回归工程统计新方法,其特征在于,在步骤2中,运用该组自变量相互独立的样品分别建立Y与x2,x3,…,xk的关系,选择出合理的曲线类型拟合得到f2(x2),f3(x3),…,fk(xk)的表达式。
4.根据权利要求3所述的收敛的多元回归工程统计新方法,其特征在于,在步骤3中,运用该组自变量x1、xn间相关,但x1、xn与其它自变量相互独立的样品建立Y与xn的关系,选择出合理的曲线类型拟合得到gn(xn)的表达式;运用该组自变量x1、xn间相关,但x1、xn与其它自变量相互独立的样品建立x1与xn的关系,选择出合理的曲线类型拟合得到x1=ωn(xn)的表达式;运用同样的方法得到g2(x2),g3(x3),…,gk(xk)及ω2(x2),ω3(x3),…,ωk(xk)的表达式。
5.根据权利要求4所述的收敛的多元回归工程统计新方法,其特征在于,在步骤4中,将由步骤2、3得到的各表达式代入式(1)并计算收敛系数α,收敛系数α是通过迭代法来确定的,通过多次迭代,不断调整α取值,使由式(1)计算得到的拟合值与样品实际值相关系数最大时,即求得了α值。
CN201610693324.7A 2016-08-18 2016-08-18 收敛的多元回归工程统计新方法 Pending CN107766290A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610693324.7A CN107766290A (zh) 2016-08-18 2016-08-18 收敛的多元回归工程统计新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610693324.7A CN107766290A (zh) 2016-08-18 2016-08-18 收敛的多元回归工程统计新方法

Publications (1)

Publication Number Publication Date
CN107766290A true CN107766290A (zh) 2018-03-06

Family

ID=61263269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610693324.7A Pending CN107766290A (zh) 2016-08-18 2016-08-18 收敛的多元回归工程统计新方法

Country Status (1)

Country Link
CN (1) CN107766290A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102020A (zh) * 2018-08-10 2018-12-28 新华三技术有限公司 一种图像对比方法及装置
CN112420135A (zh) * 2020-11-20 2021-02-26 北京化工大学 一种基于样方法和分位数回归的虚拟样本生成方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102020A (zh) * 2018-08-10 2018-12-28 新华三技术有限公司 一种图像对比方法及装置
CN112420135A (zh) * 2020-11-20 2021-02-26 北京化工大学 一种基于样方法和分位数回归的虚拟样本生成方法
CN112420135B (zh) * 2020-11-20 2024-09-13 北京化工大学 一种基于样方法和分位数回归的虚拟样本生成方法

Similar Documents

Publication Publication Date Title
CN104123451A (zh) 基于偏最小二乘回归的疏浚作业产量预测模型建立方法
CN105786860A (zh) 一种数据建模中的数据处理方法及装置
CN104021303B (zh) 一种基于实测载荷谱的弧齿锥齿轮修形齿面的修形方法
CN103106344B (zh) 一种建立电力系统聚类负荷模型的方法
CN110346623B (zh) 一种锁定窃电用户的系统、方法及设备
CN108171142A (zh) 一种确定复杂工业过程中关键变量因果关系的方法
CN108205432B (zh) 一种观测实验数据异常值的实时剔除方法
CN113486556B (zh) 一种改进的油气藏高效自动历史拟合方法
CN107766290A (zh) 收敛的多元回归工程统计新方法
CN109252855B (zh) 确定气井最终累积产量的方法及装置
CN115456418A (zh) 一种煤矿存储安全智能管理系统
CN101995845B (zh) 基于fpga的自调匀整控制系统及控制方法
CN110347889B (zh) 一种档位特征关系的建立、档位评价及档位推荐方法
TWI766167B (zh) 收款控制方法、裝置、伺服器及可讀儲存媒體
CN112115541A (zh) 一种装配式建筑设计方法、系统和云平台
CN104850711B (zh) 一种机电产品设计标准选择方法
CN103870614A (zh) 一种结构概率优化设计方法
CN115936232A (zh) 一种致密气藏合理井网密度与加密调整时机的预测方法及系统
CN110578317A (zh) 一种水文模型水库泄水量模拟方法
CN111009927A (zh) 一种风电配合压缩空气储能容量优化方法及系统
CN102005769B (zh) 基于受扰轨迹模式分析的电力系统动态稳定辅助决策方法
CN105721199A (zh) 一种基于核密度估计与模糊推理系统的实时云服务瓶颈检测方法
CN110781615A (zh) 一种cae仿真准确率的评价方法
CN102831279B (zh) 基于cad的金刚石制品电镀工艺参数的自动计算系统及方法
CN110516796A (zh) 一种面向嵌入式平台的分组卷积过程优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180306

WD01 Invention patent application deemed withdrawn after publication