CN106650774A - 一种数据分析中获取因变量与自变量回归关系的方法 - Google Patents

一种数据分析中获取因变量与自变量回归关系的方法 Download PDF

Info

Publication number
CN106650774A
CN106650774A CN201610889029.9A CN201610889029A CN106650774A CN 106650774 A CN106650774 A CN 106650774A CN 201610889029 A CN201610889029 A CN 201610889029A CN 106650774 A CN106650774 A CN 106650774A
Authority
CN
China
Prior art keywords
data
independent variable
regression
variable
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610889029.9A
Other languages
English (en)
Inventor
郑锐韬
李勇波
孙傲冰
季统凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Cloud Technology Co Ltd
Original Assignee
G Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Cloud Technology Co Ltd filed Critical G Cloud Technology Co Ltd
Priority to CN201610889029.9A priority Critical patent/CN106650774A/zh
Priority to PCT/CN2016/106004 priority patent/WO2018068360A1/zh
Publication of CN106650774A publication Critical patent/CN106650774A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23211Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据分析处理技术领域,尤其是一种数据分析中获取因变量与自变量回归关系的方法。本发明方法通过分析用户输入的因变量与多个自变量,对数据进行标准化处理,然后先对数据进行分类,从而分析出类似的数据特征,再从类似的数据特征中进行自变量的选取,通过调用相关的线性分析算法,得出因果关系,通过计算分析出来的结果与实际的结果进行对比,分析出某些自变量与因变量的最优关系,把最终的最优结果展示给用户用于最终的选择。解决现有方法无法进行数据区域的区别分析,比较难达到准确的分析效率;可用于因变量与自变量回归关系的获取。

Description

一种数据分析中获取因变量与自变量回归关系的方法
技术领域
本发明涉及数据分析处理技术领域,尤其是一种一种数据分析中获取因变量与自变量回归关系的方法。
背景技术
数据分析的过程,回归分析是经常使用的一种方法。传统的回归过程,需要用户按相关的某个模型的关系,选取自变量与因变量,通过手工的方法进行数据的输入并逐个分析最终的结果,再对得出的结果进行检查回归系数、自变量与实际因变量的准确率。对于无法很明确地查看出多个自变量与因变量的关系时,需由用户自行逐个过程进行操作。整个过程费时费力效率低,而且输入的数据量,对于全部数据来说因变量与自变量又有可能有不同的因果关系,直接使用传统的方法无法进行数据区域的区别分析,比较难达到准确的分析效率。
发明内容
本发明解决的技术问题在于提供一种数据分析中获取因变量与自变量回归关系的方法;可以高效地获取输入的因变量与自变量的最优对应关系,用于以后的数据预测。
本发明解决上述技术问题的技术方案是:
所述的方法包括以下几个步骤:
步骤1:对用户输入的因变量与自变量,进行数据标准化处理,并保存该结果备用;
步骤2:对数据进行回归分析,分析出类似的数据特征,从类似的数据特征中进行纵向的自变量选取,通过调用相关的线性分析算法,得出因果关系;
步骤3:对比计算分析出来的结果与实际的结果,获得自变量与因变量的最优关系,将最终的最优结果展示给用户用于最终的选择。
所述数据标准化具体步骤为:
步骤一、获取因变量及各自变量,分别求各自因变量、自变量的平均值,作为基准数据β;
步骤二、分别求各自因变量的标准差α,作为扩大系数,扩大系数通过标准差的方式求出,公式为:
公式中数值x1,x2,x3,......xN是各自变量的值,其中μ为各自变量的算术平均值;
步骤三、对因变量及各自变量,分别通过公式Z′=αZ+β求出标准化后的值,Z′为标准数据,β为基准数据,α是扩大系数。
所述数据回归分析具体步骤为:
步骤一、对输入的自变量数据按不同聚类数量,多次进行聚类分析,得出多个按不同聚类数量的分析结果;
步骤二、对某一特定聚类数量的分析结果,按不同的类别,从中选取自变量,分析选取的自变量与因变量的关系,得出回归系数;再通过回测的方法,计算出准确率,选取准确率最高的自变量与因变量的回归关系;对不同的数据类别采用相同的方法获取准确率最高的回归关系;
步骤三、对分类出来的不同的类别的回归关系进行分析,合并自变量一样、回归系数相差不大的类别,形成统一的回归关系;自变量不同或回归系数相差太大的,形成各数据区域独立的回归关系;
步骤四、重复步骤二、步骤三,对不同数据聚类数量的回归关系进行分析,得出各聚类数据下的最优回归关系和回归系数。
所述的聚类分析可采用K-Means聚类算法,计算聚类的距离可使用欧氏距离计算方法,计算公式如下:
欧氏距离dij表示两个n维向量a(x11,x12,...,x1n)与b(x21,x22,...,x2n)间的距离。
所述的回归关系可采用最小二乘法多项式曲线拟合,拟合的过程可通过自实现的方式进行,或是通过调用相关通用的拟合工具,直接获取拟合结果,拟合公式为:
假设给定数据点(xi,yi)(其中i=0,1,2,…,m),为所有次数不超过n(n≤m)的多项式构成的函数类,现求使得满足min公式的Pn(xi)称为最小二乘拟合多项式,通过代入相关的(xi,yi)值并假设min为最小0,可得出n条关于a0,a1,a2,…,an的多项式,求解出以上的a0,a1,a2,…,an的多元函数,得出a0,a1,a2,…,an的具体的值。
所述获取自变量与因变量的最优关系具体步骤为:
步骤一、对各不同的聚类数量分析出来的最优回归关系、回归系数,分析得出最优的准确率,或是最优的前几个的准确率;把分析结果展示给用户,为用户的最终选择提供数据依据;
步骤二、对用户选择的最优结果,提供自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数,用于最终的数据预测;
步骤三、用户通过提供的自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数;在输入新的预测数据时,先进行自变量的标准化,再与各聚类中心进行对比,选取距离最近的数据区域,应用该区域的自变量及回归系数,从而预测出标准化的预测值;再通过标准化公式反推预测的原始值。
本发明的有益效果是:
本发明方法是通过利用计算机可不断计算、并且可进行预测结果的回测的优势,通过对数据的标准化,提高数据的准确性,按聚类的方式使数据在横向上进行区域回归区分,再从自动选取自变量上进行纵向的计算,从而得出数据分析的最优回归结果,并形成数据分析预测的最终结果,用于最后的数据预测。在此方法中为用户快速直接分析出最优的因果关系,极大提高获取因变量与自变量回归关系的效率,形成一种高效获取多个自变量与因变量的关系的最优方法;从而提高数据回归分析过程中对因变量与多个自变量的主要成份的分析,简化了数据回归分析的过程,提高了因变量与自变量获取的效率。
附图说明
下面结合附图对本发明进一步说明:
附图1是本发明获取最优因变量与自变量关系流程图。
具体实施方式
本发明通过分析用户输入的因变量与多个自变量,对数据进行标准化处理,同时保存各因变量与自变量的数据标准化结果用于后续的数据预测;后先对数据从横向的角度进行分类,从而分析出类似的数据特征,再从类似的数据特征中进行纵向的自变量选取,通过调用相关的线性分析算法,得出因果关系,通过计算分析出来的结果与实际的结果进行对比,分析出某些自变量与因变量的最优关系,把最终的最优结果展示给用户用于最终的选择,使用此方法可为用户从多个自变量中高效获取与因变量的最优因果关系,可极大提高获取因变量与自变量回归关系的效率,作为优化数据分析过程获取主要因果成份关系的一种方法。
对输入的因变量及多个自变量,需进行各输入数据的数据标准化处理,就是将输入的所有变量包括因变量都先转化为标准数据,再进行线性回归分析,使标准化后的数据此时得到的回归系数更能反映对应自变量的重要程度;数据标准化可采用如下转换通式:Z′=αZ+β,式中,Z′为标准数据,β为基准数据,一般等于原始数据的平均值X_bar,α是扩大系数,一般等于原始数据的标准差S。
在因变量与自变量都进行了数据标准化后的基础上,按各自变量的数据进行多类别的聚类分析,聚类分析的目的,是为了发现不同数据在各个类别上的特征,从而可以从特征明显的数据上,获取明确的回归系数关系;如果进行分类后得出的回归系数关系相差不大,那可看作分析的结果数据是一致的,可作为统一的回归因果关系;对于进行分类后的回归系统相关比较大,则说明不同的类别数据在各区域上有不同的回归因果关系,在后续使用回归结果时可从计算出来的各聚类中心进行比对,选取与各聚类中心最近的回归因果关系进行数据的预测。
在对自变量进行某个类别的聚类分析后,按分析的结果,循环在种个分类类别上选取某几类自变量与因变量形成回归关系,得出回归系数,再把特定类别的自变量数据用于回归测试,计算出准确率,这样从多个自变量中,选取出最优的自变量与因变量的因果关系、回归系数;不同的类别使用这种方法,从而使所有类别的数据都形成一定的回归关系。
在使所有类别的数据都形成了最优回归关系后,分析各类别所选取的自变量及各自变量的回归系数,如果所选取的自变量是一样的,及各自变量的回归系统相关不大的,则可把回归系数进行合并,从而形成统一的回归关系,也说明数据符合统一的回归关系,回归过程选择出了最优的自变量与因变量的最优关系;如果各分类类别所选取的最优回归自变量与各自变量的回归系数是不一样的或相差很大,则说明输入的自变量与因变量的回归关系在各个区域是不同的,需使用不同的回归关系,则需保存各类别的数据中心点及各类别的回归自变量及系统,用于后续对各区域的回归关系的计算。
对输入的多个自变量的数据的聚类、选取自变量与因变量的回归分析,可通过程序的方式调用R语言或自实现程序进行实现,通过调用已实现的方法以提高进行自变量与因变量关系进行选择分析的效率。
对于输入的数据量比较多的情况,需对数据进行更多类别的分类,从而区分出各个区域数据的特征,更加详细地对各个区域的自变量与因变量的最优因果关系的回归分析,得出回归系数,而最重要的是在得出各区域的回归关系回归系数后,需对回归结果进行归纳总结,全部统一的回归关系,从而优化最终的回归关系的计算。
通过多次按不同的聚类数量进行横向、纵向的数据计算,最终得出各聚类数量下的最优回归关系及回归系数,对比各聚类数量的最优结果,最终给用户最优的聚类分类下的各区域的中心数据、回归自变量、回归系数,显示最优的因变量与自变量的关系。
在得出最优的聚类分类下的各区域的中心数据、回归自变量、回归系数,结合各自变量的标准化指标,输入新的预测数据,首先通过与各类别的中心数据进行对比选取距离最近的区域,套用距离最近的回归变量及回归系统,从而得出最终的预测结果。
按照流程而言,如图1所示,本发明的实现主要包括三部分,数据标准化、数据横向纵向回归分析、获取最优对应关系,三部分的具体步骤如下:
一、数据标准化:
步骤一、分别获取因变量及各自变量,分别求各自因变量、自变量的平均值X_bar,作为基准数据β;
步骤二、分别求各自因变量的标准差,作为扩大系数α,扩大系数通过标准差的方式求出,公式为:
公式说明:
公式中数值x1,x2,x3,......xN(皆为各自变量的值),其中μ为各自变量的平均值(算术平均值),标准差为α。
步骤三、对因变量及各自变量,分别通过公式Z′=αZ+β求出标准化后的值,Z′为标准数据,β为基准数据,α是扩大系数;
步骤四、保存因变量及各自变量的基准数据及扩大系数,用于后续进行新数据预测时的标准化计算;
通过以上方法把因变量及自变量进行重新计算,从而使最终得出的回归系数更能反映对应因变量与自变量的重要程度;
二、数据横向纵向回归分析
步骤一、按输入的自变量数据按不同聚类数量,多次进行聚类分析,得出多个按不同聚类数量的分析结果;聚类分析可采用K-Means聚类算法,计算聚类的距离可使用Euclidean Distance(欧氏距离)计算方法,公式:
公式说明:
欧氏距离表示两个n维向量a(x11,x12,...,x1n)与b(x21,x22,...,x2n)间的距离,例如二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离:
三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离:
步骤二、对某一特定聚类数量的分析结果,按不同的类别,从中选取自变量,分析选取的自变量与因变量的关系,得出回归系数,再通过回测的方法,计算出准确率,选取准确率最高的自变量与因变量的回归关系;对不同的数据类别采用相同的方法获取准确率最高的回归关系;回归关系可采用最小二乘法多项式曲线拟合,拟合的过程可通过自实现的方式进行,或是通过调用相关通用的拟合工具,直接获取拟合结果,拟合公式为:
公式说明:
假设给定数据点(xi,yi)(其中i=0,1,2,…,m),为所有次数不超过n(n≤m)的多项式构成的函数类,现求使得满足min公式的Pn(xi)称为最小二乘拟合多项式,通过代入相关的(xi,yi)值并假设min为最小0,可得出n条关于a0,a1,a2,…,an的多项式,求解出以上的a0,a1,a2,…,an的多元函数,得出a0,a1,a2,…,an的具体的值。
步骤三、对分类出来的不同的类别的回归关系进行分析,合并自变量一样、回归系统相差不大的类别,形成统一的回归关系;自变量不同或回归系数相差太大的,形成各数据区域独立的回归关系;
步骤四、重复步骤二、步骤三,从而对不同的数据聚类数量的回归关系的分析,得出各聚类数据下的最优回归关系,回归系数;
三、获取最优对应关系:
步骤一、对各不同的聚类数量分析出来的最优回归关系、回归系统,分析得出最优的准确率,或是最优的前几个的准确率,把分析结果展示给用户,为用户的最终选择提供数据依据;
步骤二、对用户选择的最优结果,需提供自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数,用于最终的数据预测;
步骤三、用户通过提供的自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数,在输入新的预测数据时,先进行自变量的标准化,再与各聚类中心进行对比,选取距离最近的数据区域,应用该区域的自变量及回归系统,从而预测出标准化的预测值,再通过标准化公式反推预测的原始值。

Claims (10)

1.一种数据分析中获取因变量与自变量回归关系的方法,其特征在于:所述的方法包括以下几个步骤:
步骤1:对用户输入的因变量与自变量,进行数据标准化处理,并保存该结果备用;
步骤2:对数据进行回归分析,分析出类似的数据特征,从类似的数据特征中进行纵向的自变量选取,通过调用相关的线性分析算法,得出因果关系;
步骤3:对比计算分析出来的结果与实际的结果,获得自变量与因变量的最优关系,将最终的最优结果展示给用户用于最终的选择。
2.根据权利要求1所述的方法,其特征在于:所述数据标准化具体步骤为:
步骤一、获取因变量及各自变量,分别求各自因变量、自变量的平均值,作为基准数据β;
步骤二、分别求各自因变量的标准差α,作为扩大系数,扩大系数通过标准差的方式求出,公式为:
α = 1 N Σ i = 1 N ( x i - μ ) 2
公式中数值x1,x2,x3,......xN是各自变量的值,其中μ为各自变量的算术平均值;
步骤三、对因变量及各自变量,分别通过公式Z′=α Z+β求出标准化后的值,Z′为标准数据,β为基准数据,α是扩大系数。
3.根据权利要求1所述的方法,其特征在于:所述数据回归分析具体步骤为:
步骤一、对输入的自变量数据按不同聚类数量,多次进行聚类分析,得出多个按不同聚类数量的分析结果;
步骤二、对某一特定聚类数量的分析结果,按不同的类别,从中选取自变量,分析选取的自变量与因变量的关系,得出回归系数;再通过回测的方法,计算出准确率,选取准确率最高的自变量与因变量的回归关系;对不同的数据类别采用相同的方法获取准确率最高的回归关系;
步骤三、对分类出来的不同的类别的回归关系进行分析,合并自变量一样、回归系数相差不大的类别,形成统一的回归关系;自变量不同或回归系数相差太大的,形成各数据区域独立的回归关系;
步骤四、重复步骤二、步骤三,对不同数据聚类数量的回归关系进行分析,得出各聚类数据下的最优回归关系和回归系数。
4.根据权利要求1所述的方法,其特征在于:所述数据回归分析具体步骤为:
步骤一、对输入的自变量数据按不同聚类数量,多次进行聚类分析,得出多个按不同聚类数量的分析结果;
步骤二、对某一特定聚类数量的分析结果,按不同的类别,从中选取自变量,分析选取的自变量与因变量的关系,得出回归系数;再通过回测的方法,计算出准确率,选取准确率最高的自变量与因变量的回归关系;对不同的数据类别采用相同的方法获取准确率最高的回归关系;
步骤三、对分类出来的不同的类别的回归关系进行分析,合并自变量一样、回归系数相差不大的类别,形成统一的回归关系;自变量不同或回归系数相差太大的,形成各数据区域独立的回归关系;
步骤四、重复步骤二、步骤三,对不同数据聚类数量的回归关系进行分析,得出各聚类数据下的最优回归关系和回归系数。
5.根据权利要求3所述的方法,其特征在于:所述的聚类分析可采用K-Means聚类算法,计算聚类的距离可使用欧氏距离计算方法,计算公式如下:
d i j = Σ k = 1 n ( x i k - x j k ) 2
欧氏距离dij表示两个n维向量a(x11,x12,...,x1n)与b(x21,x22,...,x2n)间的距离。
6.根据权利要求4所述的方法,其特征在于:所述的回归关系可采用最小二乘法多项式曲线拟合,拟合的过程可通过自实现的方式进行,或是通过调用相关通用的拟合工具,直接获取拟合结果,拟合公式为:
m i n = Σ i = 0 m | P n ( x i ) - y i | = Σ i = 0 m | Σ k = 0 n a k x i k - y i |
假设给定数据点(xi,yi)(其中i=0,1,2,…,m),为所有次数不超过n(n≤m)的多项式构成的函数类,现求使得满足min公式的Pn(xi)称为最小二乘拟合多项式,通过代入相关的(xi,yi)值并假设min为最小0,可得出n条关于a0,a1,a2,…,an的多项式,求解出以上的a0,a1,a2,…,an的多元函数,得出a0,a1,a2,…,an的具体的值。
7.根据权利要求1至4任一项所述的方法,其特征在于:所述获取自变量与因变量的最优关系具体步骤为:
步骤一、对各不同的聚类数量分析出来的最优回归关系、回归系数,分析得出最优的准确率,或是最优的前几个的准确率;把分析结果展示给用户,为用户的最终选择提供数据依据;
步骤二、对用户选择的最优结果,提供自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数,用于最终的数据预测;
步骤三、用户通过提供的自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数;在输入新的预测数据时,先进行自变量的标准化,再与各聚类中心进行对比,选取距离最近的数据区域,应用该区域的自变量及回归系数,从而预测出标准化的预测值;再通过标准化公式反推预测的原始值。
8.根据权利要求5所述的方法,其特征在于:所述获取自变量与因变量的最优关系具体步骤为:
步骤一、对各不同的聚类数量分析出来的最优回归关系、回归系数,分析得出最优的准确率,或是最优的前几个的准确率;把分析结果展示给用户,为用户的最终选择提供数据依据;
步骤二、对用户选择的最优结果,提供自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数,用于最终的数据预测;
步骤三、用户通过提供的自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数;在输入新的预测数据时,先进行自变量的标准化,再与各聚类中心进行对比,选取距离最近的数据区域,应用该区域的自变量及回归系数,从而预测出标准化的预测值;再通过标准化公式反推预测的原始值。
9.根据权利要求6所述的方法,其特征在于:所述获取自变量与因变量的最优关系具体步骤为:
步骤一、对各不同的聚类数量分析出来的最优回归关系、回归系数,分析得出最优的准确率,或是最优的前几个的准确率;把分析结果展示给用户,为用户的最终选择提供数据依据;
步骤二、对用户选择的最优结果,提供自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数,用于最终的数据预测;
步骤三、用户通过提供的自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数;在输入新的预测数据时,先进行自变量的标准化,再与各聚类中心进行对比,选取距离最近的数据区域,应用该区域的自变量及回归系数,从而预测出标准化的预测值;再通过标准化公式反推预测的原始值。
10.根据权利要求7所述的方法,其特征在于:所述获取自变量与因变量的最优关系具体步骤为:
步骤一、对各不同的聚类数量分析出来的最优回归关系、回归系数,分析得出最优的准确率,或是最优的前几个的准确率;把分析结果展示给用户,为用户的最终选择提供数据依据;
步骤二、对用户选择的最优结果,提供自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数,用于最终的数据预测;
步骤三、用户通过提供的自变量与因变量的标准化转换公式,各聚类的中心及分析的回归自变量、回归系数;在输入新的预测数据时,先进行自变量的标准化,再与各聚类中心进行对比,选取距离最近的数据区域,应用该区域的自变量及回归系数,从而预测出标准化的预测值;再通过标准化公式反推预测的原始值。
CN201610889029.9A 2016-10-11 2016-10-11 一种数据分析中获取因变量与自变量回归关系的方法 Pending CN106650774A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610889029.9A CN106650774A (zh) 2016-10-11 2016-10-11 一种数据分析中获取因变量与自变量回归关系的方法
PCT/CN2016/106004 WO2018068360A1 (zh) 2016-10-11 2016-11-16 一种数据分析中获取因变量与自变量回归关系的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610889029.9A CN106650774A (zh) 2016-10-11 2016-10-11 一种数据分析中获取因变量与自变量回归关系的方法

Publications (1)

Publication Number Publication Date
CN106650774A true CN106650774A (zh) 2017-05-10

Family

ID=58856396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610889029.9A Pending CN106650774A (zh) 2016-10-11 2016-10-11 一种数据分析中获取因变量与自变量回归关系的方法

Country Status (2)

Country Link
CN (1) CN106650774A (zh)
WO (1) WO2018068360A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107578105A (zh) * 2017-08-31 2018-01-12 江苏康缘药业股份有限公司 系统参数设计空间优化方法及装置
CN108573111A (zh) * 2018-04-27 2018-09-25 福州大学 一种外压容器设计中解析新算法参数的拟合方法
CN109242916A (zh) * 2018-10-12 2019-01-18 昆山博泽智能科技有限公司 一种基于回归算法自动标定图像的方法
CN110210000A (zh) * 2019-04-18 2019-09-06 贵州大学 基于多元非线性回归的工业过程能效识别与诊断方法
CN110595944A (zh) * 2019-08-21 2019-12-20 山东中烟工业有限责任公司 一种爆珠滤棒端部密度数据修正方法及系统
CN110991974A (zh) * 2019-12-20 2020-04-10 贵州黔岸科技有限公司 基于gps的运输成本智能核算系统及方法
CN111383768A (zh) * 2018-12-28 2020-07-07 医渡云(北京)技术有限公司 医疗数据回归分析方法、装置、电子设备及可读介质
CN111709152A (zh) * 2020-06-29 2020-09-25 西南交通大学 一种SiC场限环终端结构参数确定方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859245A (zh) * 2020-07-06 2020-10-30 东南数字经济发展研究院 一种社交电商用户群体阶层划分方法
CN112380273A (zh) * 2020-11-11 2021-02-19 北京达佳互联信息技术有限公司 数据预估方法及装置
CN112420135B (zh) * 2020-11-20 2024-09-13 北京化工大学 一种基于样方法和分位数回归的虚拟样本生成方法
CN115474205B (zh) * 2021-06-11 2024-10-15 中国移动通信集团云南有限公司 双路功率差冗余度获得方法、系统以及电子设备
CN113673864B (zh) * 2021-08-19 2024-08-13 中国石油化工股份有限公司 一种能源自动分输方法
CN114117292B (zh) * 2021-11-04 2024-04-16 中通服咨询设计研究院有限公司 一种互联网大数据分析提取方法
CN115270386B (zh) * 2022-04-22 2023-09-12 水利部交通运输部国家能源局南京水利科学研究院 一种滩槽演变主控因子权重的定量评价方法及系统
CN115795229B (zh) * 2023-02-07 2023-05-12 河海大学 一种适用于水相关生态系统服务反馈回路的量化研究方法
CN118070050B (zh) * 2024-02-27 2024-08-09 宝艺新材料股份有限公司 一种瓦楞纸板纸箱的检测数据处理方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123451A (zh) * 2014-07-16 2014-10-29 河海大学常州校区 基于偏最小二乘回归的疏浚作业产量预测模型建立方法
CN105260249B (zh) * 2015-09-19 2019-04-23 中国地质大学(武汉) 空间计算域计算强度特征提取方法
CN105825288B (zh) * 2015-12-07 2019-12-10 北京师范大学 一种消除复杂系统中回归数据共线性问题的优化分析方法
CN105844410A (zh) * 2016-03-22 2016-08-10 国网天津市电力公司 一种电力施工现场危险系数确定方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107578105A (zh) * 2017-08-31 2018-01-12 江苏康缘药业股份有限公司 系统参数设计空间优化方法及装置
CN108573111A (zh) * 2018-04-27 2018-09-25 福州大学 一种外压容器设计中解析新算法参数的拟合方法
CN109242916A (zh) * 2018-10-12 2019-01-18 昆山博泽智能科技有限公司 一种基于回归算法自动标定图像的方法
CN111383768A (zh) * 2018-12-28 2020-07-07 医渡云(北京)技术有限公司 医疗数据回归分析方法、装置、电子设备及可读介质
CN111383768B (zh) * 2018-12-28 2023-11-03 医渡云(北京)技术有限公司 医疗数据回归分析方法、装置、电子设备及计算机可读介质
CN110210000A (zh) * 2019-04-18 2019-09-06 贵州大学 基于多元非线性回归的工业过程能效识别与诊断方法
CN110595944A (zh) * 2019-08-21 2019-12-20 山东中烟工业有限责任公司 一种爆珠滤棒端部密度数据修正方法及系统
CN110991974A (zh) * 2019-12-20 2020-04-10 贵州黔岸科技有限公司 基于gps的运输成本智能核算系统及方法
CN111709152A (zh) * 2020-06-29 2020-09-25 西南交通大学 一种SiC场限环终端结构参数确定方法
CN111709152B (zh) * 2020-06-29 2022-11-15 西南交通大学 一种SiC场限环终端结构参数确定方法

Also Published As

Publication number Publication date
WO2018068360A1 (zh) 2018-04-19

Similar Documents

Publication Publication Date Title
CN106650774A (zh) 一种数据分析中获取因变量与自变量回归关系的方法
Pan et al. Oil well production prediction based on CNN-LSTM model with self-attention mechanism
Cho et al. A hybrid approach based on the combination of variable selection using decision trees and case-based reasoning using the Mahalanobis distance: For bankruptcy prediction
CN109636591A (zh) 一种基于机器学习的信用评分卡开发方法
Li et al. A financial early warning logit model and its efficiency verification approach
CN106777703A (zh) 一种公交乘客实时分析系统及其构建方法
Ryu et al. Firm bankruptcy prediction: experimental comparison of isotonic separation and other classification approaches
CN112990976B (zh) 基于开源数据挖掘的商业网点选址方法、系统、设备及介质
CN108595414A (zh) 基于源汇空间变量推理的土壤重金属企业污染源识别方法
CN107844865A (zh) 基于特征参数选取与lstm模型的股指预测方法
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN109739844A (zh) 基于衰减权重的数据分类方法
CN111626821A (zh) 基于集成特征选择实现客户分类的产品推荐方法及系统
CN109937421B (zh) 用于预测特定项目所属类别的二类别分类方法以及利用该方法的计算设备
Singh et al. Speaker specific feature based clustering and its applications in language independent forensic speaker recognition
Qian et al. Application of data mining technology and wireless network sensing technology in sports training index analysis
KR102438923B1 (ko) 시계열 분포 특징을 고려한 딥러닝 기반 비트코인 블록 데이터 예측 시스템
Bou-Hamad Bayesian credit ratings: A random forest alternative approach
CN110176309A (zh) 一种用于预测心血管疾病的医疗数据处理方法
CN112651838A (zh) 一种基于人工智能的金融交易推荐方法及系统
Saad Use bagging algorithm to improve prediction accuracy for evaluation of worker performances at a production company
KR102663632B1 (ko) 인공지능 기반의 미술품 거래의 트랜드 예측 장치 및 방법
TWI599896B (zh) 多輸出決策屬性選擇暨資料離散化分類方法
Akyol Clustering hotels and analyzing the importance of their features by machine learning techniques
CN114117210A (zh) 基于联邦学习的理财产品智能推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170510