CN116738197A - 基于大数据的经济体征指标分析方法、装置、设备及介质 - Google Patents
基于大数据的经济体征指标分析方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116738197A CN116738197A CN202310731138.8A CN202310731138A CN116738197A CN 116738197 A CN116738197 A CN 116738197A CN 202310731138 A CN202310731138 A CN 202310731138A CN 116738197 A CN116738197 A CN 116738197A
- Authority
- CN
- China
- Prior art keywords
- index data
- index
- standard
- stable
- economic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 54
- 238000004364 calculation method Methods 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000013112 stability test Methods 0.000 claims abstract description 16
- 238000012360 testing method Methods 0.000 claims abstract description 13
- 238000012216 screening Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 62
- 238000012545 processing Methods 0.000 claims description 26
- 239000013598 vector Substances 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000000875 corresponding effect Effects 0.000 description 78
- 238000004891 communication Methods 0.000 description 9
- 238000009826 distribution Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
Abstract
本发明涉及指标分析技术,揭露了一种基于大数据的经济体征指标分析方法、装置、设备及介质,所述方法包括:获取经济体征指标数据,对经济体征指标数据进行标准化处理,得到标准指标数据;对标准指标数据进行关联度计算,得到指标影响因子,根据标准指标数据及指标影响因子进行函数拟合,得到指标函数;根据指标函数建立回归模型,并根据回归模型对标准指标数据进行平稳性检验及相关性检验,得到相关指标数据集及相关值;根据相关值及标准指标数据值进行残差分析,根据残差分析的结果对指标数据进行筛选,得到目标指标数据。本发明可以在经济体征指标分析过程中筛选得到经济体征指标对应的具有相关性及稳定性的指标数据。
Description
技术领域
本发明涉及指标分析技术领域,尤其涉及一种基于大数据的经济体征指标分析方法、装置、设备及介质。
背景技术
随着国民经济核算体系的逐步完善、经济理论研究的不断深入、数学方法的广泛应用以及计算机技术和现代通信技术的快速发展,人们能够借助一些技术建立经济体征指标分析方法,来收集、存储和处理经济体征指标信息以对经济体征指标数据进行分析、研究,然而,随着社会生产力水平的提高,经济发展变化节奏的日益加快,当经济信息的数量呈现急剧增长的趋势,需要进行经济体征指标分析时会存在经济体征指标对应的指标数据的过大浮动,从而导致指标数据的不稳定的问题;当经济信息的种类逐步增加时,经济体征指标对应的指标数据的关联性会降低,从而导致指标数据之间不全具有相关性。因此,如何在经济体征指标分析过程中筛选得到经济体征指标对应的具有相关性及稳定性的指标数据成为一个亟待解决的问题。
发明内容
本发明提供一种基于大数据的经济体征指标分析方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决如何在经济体征指标分析过程中筛选得到经济体征指标对应的具有相关性及稳定性的指标数据的问题。
为实现上述目的,本发明提供的一种基于大数据的经济体征指标分析方法,包括:
获取经济体征指标数据,对所述经济体征指标数据进行标准化处理,得到标准指标数据;
对所述标准指标数据进行关联度计算,得到指标影响因子,根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数;
根据所述指标函数建立回归模型,并根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值;
根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值;
根据所述相关值及预设的标准指标数据值进行残差分析,根据残差分析的结果对所述相关值对应的相关指标数据集中的指标数据进行筛选,得到目标指标数据。
可选地,所述对所述经济体征指标数据进行标准化处理,得到标准指标数据,包括:
对所述经济体征指标数据进行分类处理,得到指标数据组;
根据所述指标数据组及所述指标数据组对应的经济体征指标数据进行计算,得到所述指标数据组对应的标准指标数据;
利用下述公式计算得到指标数据组对应的标准指标数据:
其中,表示第a个指标数据组中的第b个标准指标数据,/>表示第a个指标数据组中的第b个经济体征指标数据,/>表示第a个指标数据组中的第b个经济体征指标数据中的最小值,/>表示第a个指标数据组中的第b个经济体征指标数据中的最大值。
可选地,所述对所述标准指标数据进行关联度计算,得到指标影响因子,包括:
对所述标准指标数据进行无量纲化处理,得到指标数据序列;
计算所述指标数据序列中的元素与预设的参考元素的关联系数,并根据所述关联系数计算所述指标数据序列中的元素及所述参考元素的关联度;
利用下述公式计算所述指标数据序列中的元素与预设的参考元素的关联系数:
其中,ξ(c)表示第c个指标数据序列中的元素与参考元素的关联系数,X(c)表示第c个指标数据序列中的元素,F(c)表示第c个参考元素,ρ表示预设的分辨系数;
利用下述公式计算所述指标数据序列中的元素及所述参考元素的关联度:
其中,r表示所述关联度,ξ(c)表示第c个指标数据序列中的元素与参考元素的关联系数,k表示所述关联系数的总数;
根据所述关联度确定所述标准指标数据的指标影响因子。
可选地,所述根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数,包括:
所述指标函数表示为:
其中,pf表示第f个指标影响因子对应的标准指标数据,pf-1表示第f-1个指标影响因子对应的标准指标数据,P表示所述指标影响因子的总数,βf-1表示预设的第f-1个指标影响因子对应的第一计算参数,Z表示预设的误差项。
可选地,所述根据所述指标函数建立回归模型,包括:
对所述指标函数中的指标影响因子进行向量转换,得到影响因子向量;
根据所述影响因子向量及所述指标影响因子对所述指标函数中的误差项进行替换,得到更新后的误差项;
根据所述更新后的误差项及所述指标函数生成回归模型;
所述回归模型表示为:
其中,pf表示第f个指标影响因子对应的标准指标数据,pf-1表示第f-1个指标影响因子对应的标准指标数据,P表示所述指标影响因子的总数,βf-1表示预设的第f-1个指标影响因子对应的第一计算参数,f表示所述指标影响因子,uf-1表示第f-1个指标影响因子对应的影响因子向量,uf表示第f个指标影响因子对应的影响因子向量,αf-1表示预设的第f-1个指标影响因子对应的第二计算参数。
可选地,所述根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值,包括:
利用所述回归模型对所述标准指标数据进行回归计算,得到回归后的标准指标数据;
对所述回归后的标准指标数据进行一阶差分处理,得到差分指标数据;
判断多个所述差分指标数据的统计值与预设的目标值的差值是否在预设的差值范围内;
当所述差值在所述差值范围内时,将所述差分指标数据作为平稳指标数据,并将所述差分指标数据对应的统计值作为平稳值;
当所述差值不在所述差值范围内时,对所述差分指标数据进行修正,将修正后的所述差分指标数据作为平稳指标数据;
对所述平稳指标数据进行汇总,得到平稳指标数据集。
可选地,所述根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值,包括:
随机从所述平稳指标数据集中选取两个平稳指标数据及对应的平稳值;
基于所述平稳指标数据及对应的平稳值计算所述回归模型中的方差,判断所述方差是否为常数;
当所述方差不为常数时,判定所述平稳指标数据出现错误,返回随机从所述平稳指标数据集中选取两个平稳指标数据及对应的平稳值的步骤;
当所述方差为常数时,判断所述方差是否小于预设的标准方差;
当所述方差大于所述标准方差时,判定所述平稳指标数据不相关,返回随机从所述平稳指标数据集中选取两个平稳指标数据及对应的平稳值的步骤;
当所述方差小于或等于所述标准方差时,表示两个所述平稳指标数据相关,对所述平稳指标数据进行整合,得到相关指标数据集,并将所述平稳指标数据对应的平稳值作为相关值。
为了解决上述问题,本发明还提供一种基于大数据的经济体征指标分析装置,所述装置包括:
数据处理模块,用于获取经济体征指标数据,对所述经济体征指标数据进行标准化处理,得到标准指标数据;
函数拟合模块,用于对所述标准指标数据进行关联度计算,得到指标影响因子,根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数;
平稳性检验模块,用于根据所述指标函数建立回归模型,并根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值;
相关性检验模块,用于根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值;
数据分析模块,用于根据所述相关值及预设的标准指标数据值进行残差分析,根据残差分析的结果对所述相关值对应的相关指标数据集中的指标数据进行筛选,得到目标指标数据。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的基于大数据的经济体征指标分析方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于大数据的经济体征指标分析方法。
本发明实施例通过对经济体征指标数据进行标准化处理,使得到的标准指标数据更加精确;通过对标准指标数据进行关联度计算,能够更加准确得到指标影响因子;通过回归模型对标准指标数据进行平稳性检验,能够准确得到具有稳定性的指标数据,从而避免指标数据的浮动过大;通过回归模型对平稳指标数据集及平稳值进行相关性检验,保证得到的相关指标数据集中的指标数据之间均具有相关性;通过残差分析的结果对相关指标数据集中的指标数据进行筛选,保证目标指标数据为正常值、目标指标数据之间具有相关性并且目标指标数据具有平稳性。因此本发明提出的基于大数据的经济体征指标分析方法、装置、设备及介质,可以解决如何在经济体征指标分析过程中筛选得到经济体征指标对应的具有相关性及稳定性的指标数据的问题。
附图说明
图1为本发明一实施例提供的基于大数据的经济体征指标分析方法的流程示意图;
图2为本发明一实施例提供的对标准指标数据进行关联度计算,得到指标影响因子的流程示意图;
图3为本发明一实施例提供的根据指标函数建立回归模型的流程示意图;
图4为本发明一实施例提供的基于大数据的经济体征指标分析装置的功能模块图;
图5为本发明一实施例提供的实现所述基于大数据的经济体征指标分析方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于大数据的经济体征指标分析方法。所述基于大数据的经济体征指标分析方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于大数据的经济体征指标分析方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的基于大数据的经济体征指标分析方法的流程示意图。在本实施例中,所述基于大数据的经济体征指标分析方法包括:
S1、获取经济体征指标数据,对所述经济体征指标数据进行标准化处理,得到标准指标数据。
本发明实施例中,所述经济体征指标数据包括但不仅限于生产总值、工业增加值、固定资产投资、地方财政预算收入、财政预算支出、社会消费品零售价格、生产物价指数、消费物价指数及个人收入。
本发明实施例中,所述对所述经济体征指标数据进行标准化处理,得到标准指标数据,包括:
对所述经济体征指标数据进行分类处理,得到指标数据组;
根据所述指标数据组及所述指标数据组对应的经济体征指标数据进行计算,得到所述指标数据组对应的标准指标数据。
本发明实施例中,可以按照所述经济体征指标数据的类型不同,将所述经济体征指标数据进行分类处理,得到多个指标数据组。
本发明实施例中,利用下述公式计算得到指标数据组对应的标准指标数据:
其中,表示第a个指标数据组中的第b个标准指标数据,/>表示第a个指标数据组中的第b个经济体征指标数据,/>表示第a个指标数据组中的第b个经济体征指标数据中的最小值,/>表示第a个指标数据组中的第b个经济体征指标数据中的最大值。
本发明实施例中,对所述经济体征指标数据进行标准化处理,使得所述经济体制指标数据总体符合正态分布的要求,从而加快数据处理效率,保证得到的标准指标数据的准确性。
S2、对所述标准指标数据进行关联度计算,得到指标影响因子,根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数。
请参阅图2所示,本发明实施例中,所述对所述标准指标数据进行关联度计算,得到指标影响因子,包括:
S21、对所述标准指标数据进行无量纲化处理,得到指标数据序列;
S22、计算所述指标数据序列中的元素与预设的参考元素的关联系数,并根据所述关联系数计算所述指标数据序列中的元素及所述参考元素的关联度;
S23、根据所述关联度确定所述标准指标数据的指标影响因子。
本发明实施例中,所述无量纲化处理的方法包括但不仅限于均值化法、初值化法;所述参考序列中包含时间等其他与所述标准指标数据相关的影响因子。
本发明实施例中,所述指标数据序列表示为:
其中,X表示所述指标数据序列,p表示所述标准指标数据,n表示所述指标数据组的总数,m表示指标数据组所对应的所述标准指标数据的总数。
本发明实施例中,利用下述公式计算所述指标数据序列中的元素与预设的参考元素的关联系数:
其中,ξ(c)表示第c个指标数据序列中的元素与参考元素的关联系数,X(c)表示第c个指标数据序列中的元素,F(c)表示第c个参考元素,ρ表示预设的分辨系数。
本发明实施例中,利用下述公式计算所述指标数据序列中的元素及所述参考元素的关联度:
其中,r表示所述关联度,ξ(c)表示第c个指标数据序列中的元素与参考元素的关联系数,k表示所述关联系数的总数。
本发明实施例中,根据所述关联度确定所述标准指标数据的指标影响因子指的是当所述指标数据序列中的元素与所述参考元素的关联度大于80%时,将所述参考元素作为所述标准指标数据的指标影响因子。
本发明实施例中,所述根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数,包括:
所述指标函数表示为:
其中,pf表示第f个指标影响因子对应的标准指标数据,pf-1表示第f-1个指标影响因子对应的标准指标数据,P表示所述指标影响因子的总数,βf-1表示预设的第f-1个指标影响因子对应的第一计算参数,Z表示预设的误差项。
本发明实施例中,在对所述标准指标数据及所述指标影响因子进行函数拟合时,所述指标影响因子可能存在计算对应的误差,即作为所述指标影响因子对应的误差项,将所述误差项与所述标准指标数据及所述指标影响因子一同进行函数拟合,可以使得所述指标函数更加准确。
S3、根据所述指标函数建立回归模型,并根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值。
请参阅图3所示,本发明实施例中,所述根据所述指标函数建立回归模型,包括:
S31、对所述指标函数中的指标影响因子进行向量转换,得到影响因子向量;
S32、根据所述影响因子向量及所述指标影响因子对所述指标函数中的误差项进行替换,得到更新后的误差项;
S33、根据所述更新后的误差项及所述指标函数生成回归模型。
本发明实施例中,可以采用as.vector函数对所述指标影响因子进行向量转换,可以更好的进行数据比较,从而提高计算效率。
本发明实施例中,所述根据所述影响因子向量及所述指标影响因子对所述指标函数中的误差项进行替换,得到更新后的误差项,包括:
利用下述公式进行计算得到更新后的误差项:
其中,Tf表示第f个指标影响因子对应的更新后的误差项,uf-1表示第f-1个指标影响因子对应的影响因子向量,uf表示第f个指标影响因子对应的影响因子向量,αf-1表示预设的第f-1个指标影响因子对应的第二计算参数,P表示所述指标影响因子的总数。
本发明实施例中,所述回归模型表示为:
其中,pf表示第f个指标影响因子对应的标准指标数据,pf-1表示第f-1个指标影响因子对应的标准指标数据,P表示所述指标影响因子的总数,βf-1表示预设的第f-1个指标影响因子对应的第一计算参数,f表示所述指标影响因子,uf-1表示第f-1个指标影响因子对应的影响因子向量,uf表示第f个指标影响因子对应的影响因子向量,αf-1表示预设的第f-1个指标影响因子对应的第二计算参数。
本发明实施例中,所述根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值,包括:
利用所述回归模型对所述标准指标数据进行回归计算,得到回归后的标准指标数据;
对所述回归后的标准指标数据进行一阶差分处理,得到差分指标数据;
判断多个所述差分指标数据的统计值与预设的目标值的差值是否在预设的差值范围内;
当所述差值在所述差值范围内时,将所述差分指标数据作为平稳指标数据,并将所述差分指标数据对应的统计值作为平稳值;
当所述差值不在所述差值范围内时,对所述差分指标数据进行修正,将修正后的所述差分指标数据作为平稳指标数据;
对所述平稳指标数据进行汇总,得到平稳指标数据集。
本发明实施例中,可以利用ADF的方法进行所述标准指标数据的平稳性检验;采取对数方式对所述回归后的标准指标数据进行一阶差分处理;所述目标值指的是多个历史指标数据经过一阶差分处理后得到的目标差分指标数据的均值;所述差值范围可以是在5%的范围内,以1%、5%及10%不同的等级将所述差分指标数据的统计值与所述目标值的差值与所述差值范围进行比较,当所述差值在5%以内时,判定所述差分指标数据为平稳的,因此,将所述差分指标数据作为平稳指标数据;对所述差分指标数据进行修正指的是利用标准的差分指标数据对所述差分指标数据进行替换,将替换后的所述差分指标数据作为平稳指标数据;将所述平稳指标数据进行整合,得到平稳指标数据集,并将所述平稳指标数据对应的统计值作为平稳值。
S4、根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值。
本发明实施例中,所述根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值,包括:
随机从所述平稳指标数据集中选取两个平稳指标数据及对应的平稳值;
基于所述平稳指标数据及对应的平稳值计算所述回归模型中的方差,判断所述方差是否为常数;
当所述方差不为常数时,判定所述平稳指标数据出现错误,返回随机从所述平稳指标数据集中选取两个平稳指标数据及对应的平稳值的步骤;
当所述方差为常数时,判断所述方差是否小于预设的标准方差;
当所述方差大于所述标准方差时,判定所述平稳指标数据不相关,返回随机从所述平稳指标数据集中选取两个平稳指标数据及对应的平稳值的步骤;
当所述方差小于或等于所述标准方差时,表示两个所述平稳指标数据相关,对所述平稳指标数据进行整合,得到相关指标数据集,并将所述平稳指标数据对应的平稳值作为相关值。
本发明实施例中,可以利用最小二乘法计算所述回归模型中的方差,从而保证计算出的方差更加准确,当所述方差为常数时,即所述方差为1-n的正整数时,所述方差具有齐性;所述标准方差指的是通过历史大量数据计算得到的平均标准方差。
本发明实施例中,所述整合方式包括但不仅限于相加,当两个所述平稳指标数据不相关时,将两个所述平稳指标数据与其余所述平稳指标数据进行相关性检验,直至所有相关性检验结束,将未相关匹配成功的平稳指标数据进行删减,从而保证所述相关指标数据集的准确性。
S5、根据所述相关值及预设的标准指标数据值进行残差分析,根据残差分析的结果对所述相关值对应的相关指标数据集中的指标数据进行筛选,得到目标指标数据。
本发明实施例中,所述根据所述相关值及预设的标准指标数据值进行残差分析,包括:
计算所述相关值与所述标准指标数据值的差值,判断所述差值是否为正态分布;
当所述差值为正态分布时,判定所述相关值对应的相关指标数据集中的指标数据为正常值;
当所述差值不为正态分布时,判定所述相关值对应的相关指标数据集中的指标数据为异常值。
本发明实施例中,所述标准指标数据值指的是通过历史数据进行多次计算得到的指标均值;利用四则运算的方法计算所述相关值及所述标准指标数据值的差值,当所述差值σ满足正态分布N(0,σ2),其中,N表示所述正态分布,σ表示所述差值;当所述差值满足正态分布时,表示所述指标数据在正常范围内,为正常值;当所述差值不满足正态分布时,表示所述指标数据不在正常范围内,为异常值。
本发明实施例中,对所述相关值对应的相关指标数据集中的指标数据进行筛选指的是当所述相关值对应的相关指标数据集中的指标数据为正常值时,将所述指标数据进行保留,并将所述指标数据作为目标指标数据;当所述相关值对应的相关指标数据集中的指标数据为异常值时,对所述指标数据进行删减,从而保证指标数据的准确性。
本发明实施例通过对经济体征指标数据进行标准化处理,使得到的标准指标数据更加精确;通过对标准指标数据进行关联度计算,能够更加准确得到指标影响因子;通过回归模型对标准指标数据进行平稳性检验,能够准确得到具有稳定性的指标数据,从而避免指标数据的浮动过大;通过回归模型对平稳指标数据集及平稳值进行相关性检验,保证得到的相关指标数据集中的指标数据之间均具有相关性;通过残差分析的结果对相关指标数据集中的指标数据进行筛选,保证目标指标数据为正常值、目标指标数据之间具有相关性并且目标指标数据具有平稳性。因此本发明提出的基于大数据的经济体征指标分析方法,可以解决如何在经济体征指标分析过程中筛选得到经济体征指标对应的具有相关性及稳定性的指标数据的问题。
如图4所示,是本发明一实施例提供的基于大数据的经济体征指标分析装置的功能模块图。
本发明所述基于大数据的经济体征指标分析装置400可以安装于电子设备中。根据实现的功能,所述基于大数据的经济体征指标分析装置400可以包括数据处理模块401、函数拟合模块402、平稳性检验模块403、相关性检验模块404及数据分析模块405。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述数据处理模块401,用于获取经济体征指标数据,对所述经济体征指标数据进行标准化处理,得到标准指标数据;
所述函数拟合模块402,用于对所述标准指标数据进行关联度计算,得到指标影响因子,根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数;
所述平稳性检验模块403,用于根据所述指标函数建立回归模型,并根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值;
所述相关性检验模块404,用于根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值;
所述数据分析模块405,用于根据所述相关值及预设的标准指标数据值进行残差分析,根据残差分析的结果对所述相关值对应的相关指标数据集中的指标数据进行筛选,得到目标指标数据。
详细地,本发明实施例中所述基于大数据的经济体征指标分析装置400中所述的各模块在使用时采用与附图中所述的基于大数据的经济体征指标分析方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图5所示,是本发明一实施例提供的实现基于大数据的经济体征指标分析方法的电子设备的结构示意图。
所述电子设备500可以包括处理器501、存储器502、通信总线503以及通信接口504,还可以包括存储在所述存储器502中并可在所述处理器501上运行的计算机程序,如基于大数据的经济体征指标分析程序。
其中,所述处理器501在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing Unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器501是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器502内的程序或者模块(例如执行基于大数据的经济体征指标分析程序等),以及调用存储在所述存储器502内的数据,以执行电子设备的各种功能和处理数据。
所述存储器502至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器502在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器502在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器502还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器502不仅可以用于存储安装于电子设备的应用软件及各类数据,例如基于大数据的经济体征指标分析程序的代码等,还可以用于暂时的存储已经输出或者将要输出的数据。
所述通信总线503可以是外设部件互联标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器502以及至少一个处理器501等之间的连接通信。
所述通信接口504用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备500的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器501逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备500中的所述存储器502存储的基于大数据的经济体征指标分析程序是多个指令的组合,在所述处理器501中运行时,可以实现:
获取经济体征指标数据,对所述经济体征指标数据进行标准化处理,得到标准指标数据;
对所述标准指标数据进行关联度计算,得到指标影响因子,根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数;
根据所述指标函数建立回归模型,并根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值;
根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值;
根据所述相关值及预设的标准指标数据值进行残差分析,根据残差分析的结果对所述相关值对应的相关指标数据集中的指标数据进行筛选,得到目标指标数据。
具体地,所述处理器501对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备500集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取经济体征指标数据,对所述经济体征指标数据进行标准化处理,得到标准指标数据;
对所述标准指标数据进行关联度计算,得到指标影响因子,根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数;
根据所述指标函数建立回归模型,并根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值;
根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值;
根据所述相关值及预设的标准指标数据值进行残差分析,根据残差分析的结果对所述相关值对应的相关指标数据集中的指标数据进行筛选,得到目标指标数据。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于大数据的经济体征指标分析方法,其特征在于,所述方法包括:
获取经济体征指标数据,对所述经济体征指标数据进行标准化处理,得到标准指标数据;
对所述标准指标数据进行关联度计算,得到指标影响因子,根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数;
根据所述指标函数建立回归模型,并根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值;
根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值;
根据所述相关值及预设的标准指标数据值进行残差分析,根据残差分析的结果对所述相关值对应的相关指标数据集中的指标数据进行筛选,得到目标指标数据。
2.如权利要求1所述的基于大数据的经济体征指标分析方法,其特征在于,所述对所述经济体征指标数据进行标准化处理,得到标准指标数据,包括:
对所述经济体征指标数据进行分类处理,得到指标数据组;
根据所述指标数据组及所述指标数据组对应的经济体征指标数据进行计算,得到所述指标数据组对应的标准指标数据;
利用下述公式计算得到指标数据组对应的标准指标数据:
其中,表示第a个指标数据组中的第b个标准指标数据,/>表示第a个指标数据组中的第B个经济体征指标数据,/>表示第a个指标数据组中的第B个经济体征指标数据中的最小值,/>表示第a个指标数据组中的第B个经济体征指标数据中的最大值。
3.如权利要求1所述的基于大数据的经济体征指标分析方法,其特征在于,所述对所述标准指标数据进行关联度计算,得到指标影响因子,包括:
对所述标准指标数据进行无量纲化处理,得到指标数据序列;
计算所述指标数据序列中的元素与预设的参考元素的关联系数,并根据所述关联系数计算所述指标数据序列中的元素及所述参考元素的关联度;
利用下述公式计算所述指标数据序列中的元素与预设的参考元素的关联系数:
其中,ξ(c)表示第c个指标数据序列中的元素与参考元素的关联系数,X(c)表示第c个指标数据序列中的元素,F(c)表示第c个参考元素,ρ表示预设的分辨系数;
利用下述公式计算所述指标数据序列中的元素及所述参考元素的关联度:
其中,r表示所述关联度,ξ(c)表示第c个指标数据序列中的元素与参考元素的关联系数,k表示所述关联系数的总数;
根据所述关联度确定所述标准指标数据的指标影响因子。
4.如权利要求1所述的基于大数据的经济体征指标分析方法,其特征在于,所述根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数,包括:
所述指标函数表示为:
其中,pf表示第f个指标影响因子对应的标准指标数据,pf-1表示第f-1个指标影响因子对应的标准指标数据,P表示所述指标影响因子的总数,βf-1表示预设的第f-1个指标影响因子对应的第一计算参数,Z表示预设的误差项。
5.如权利要求1所述的基于大数据的经济体征指标分析方法,其特征在于,所述根据所述指标函数建立回归模型,包括:
对所述指标函数中的指标影响因子进行向量转换,得到影响因子向量;
根据所述影响因子向量及所述指标影响因子对所述指标函数中的误差项进行替换,得到更新后的误差项;
根据所述更新后的误差项及所述指标函数生成回归模型;
所述回归模型表示为:
其中,pf表示第f个指标影响因子对应的标准指标数据,pf-1表示第f-1个指标影响因子对应的标准指标数据,P表示所述指标影响因子的总数,βf-1表示预设的第f-1个指标影响因子对应的第一计算参数,f表示所述指标影响因子,uf-1表示第f-1个指标影响因子对应的影响因子向量,uf表示第f个指标影响因子对应的影响因子向量,αf-1表示预设的第f-1个指标影响因子对应的第二计算参数。
6.如权利要求1所述的基于大数据的经济体征指标分析方法,其特征在于,所述根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值,包括:
利用所述回归模型对所述标准指标数据进行回归计算,得到回归后的标准指标数据;
对所述回归后的标准指标数据进行一阶差分处理,得到差分指标数据;
判断多个所述差分指标数据的统计值与预设的目标值的差值是否在预设的差值范围内;
当所述差值在所述差值范围内时,将所述差分指标数据作为平稳指标数据,并将所述差分指标数据对应的统计值作为平稳值;
当所述差值不在所述差值范围内时,对所述差分指标数据进行修正,将修正后的所述差分指标数据作为平稳指标数据;
对所述平稳指标数据进行汇总,得到平稳指标数据集。
7.如权利要求1所述的基于大数据的经济体征指标分析方法,其特征在于,所述根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值,包括:
随机从所述平稳指标数据集中选取两个平稳指标数据及对应的平稳值;
基于所述平稳指标数据及对应的平稳值计算所述回归模型中的方差,判断所述方差是否为常数;
当所述方差不为常数时,判定所述平稳指标数据出现错误,返回随机从所述平稳指标数据集中选取两个平稳指标数据及对应的平稳值的步骤;
当所述方差为常数时,判断所述方差是否小于预设的标准方差;
当所述方差大于所述标准方差时,判定所述平稳指标数据不相关,返回随机从所述平稳指标数据集中选取两个平稳指标数据及对应的平稳值的步骤;
当所述方差小于或等于所述标准方差时,表示两个所述平稳指标数据相关,对所述平稳指标数据进行整合,得到相关指标数据集,并将所述平稳指标数据对应的平稳值作为相关值。
8.一种基于大数据的经济体征指标分析装置,其特征在于,所述装置包括:
数据处理模块,用于获取经济体征指标数据,对所述经济体征指标数据进行标准化处理,得到标准指标数据;
函数拟合模块,用于对所述标准指标数据进行关联度计算,得到指标影响因子,根据所述标准指标数据及所述指标影响因子进行函数拟合,得到指标函数;
平稳性检验模块,用于根据所述指标函数建立回归模型,并根据所述回归模型对所述标准指标数据进行平稳性检验,得到平稳指标数据集及对应的平稳值;
相关性检验模块,用于根据所述回归模型对所述平稳指标数据集及所述平稳值进行相关性检验,得到相关指标数据集及对应的相关值;
数据分析模块,用于根据所述相关值及预设的标准指标数据值进行残差分析,根据残差分析的结果对所述相关值对应的相关指标数据集中的指标数据进行筛选,得到目标指标数据。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的基于大数据的经济体征指标分析方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于大数据的经济体征指标分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310731138.8A CN116738197A (zh) | 2023-06-19 | 2023-06-19 | 基于大数据的经济体征指标分析方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310731138.8A CN116738197A (zh) | 2023-06-19 | 2023-06-19 | 基于大数据的经济体征指标分析方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116738197A true CN116738197A (zh) | 2023-09-12 |
Family
ID=87914735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310731138.8A Pending CN116738197A (zh) | 2023-06-19 | 2023-06-19 | 基于大数据的经济体征指标分析方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116738197A (zh) |
-
2023
- 2023-06-19 CN CN202310731138.8A patent/CN116738197A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220066744A1 (en) | Automatic Derivation Of Software Engineering Artifact Attributes From Product Or Service Development Concepts | |
CN112579621B (zh) | 数据展示方法、装置、电子设备及计算机存储介质 | |
CN111652278A (zh) | 用户行为检测方法、装置、电子设备及介质 | |
CN113327136A (zh) | 归因分析方法、装置、电子设备及存储介质 | |
CN113504935A (zh) | 软件开发质量评估方法、装置、电子设备及可读存储介质 | |
CN112463530A (zh) | 微服务系统的异常检测方法、装置、电子设备及存储介质 | |
CN114781832A (zh) | 课程推荐方法、装置、电子设备及存储介质 | |
CN114612194A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN113742069A (zh) | 基于人工智能的容量预测方法、装置及存储介质 | |
CN112541688B (zh) | 业务数据校验方法、装置、电子设备及计算机存储介质 | |
CN113516417A (zh) | 基于智能建模的业务评估方法、装置、电子设备及介质 | |
CN112948705A (zh) | 一种基于政策大数据的智能匹配方法、装置及介质 | |
CN111768096A (zh) | 基于算法模型的评级方法、装置、电子设备及存储介质 | |
CN116303677A (zh) | 基于数据分布均衡度的衡量方法、装置、设备及存储介质 | |
CN111460293B (zh) | 信息推送方法、装置及计算机可读存储介质 | |
CN116738197A (zh) | 基于大数据的经济体征指标分析方法、装置、设备及介质 | |
CN113435746B (zh) | 用户工作量的评分方法、装置、电子设备及存储介质 | |
CN111652281B (zh) | 信息数据的分类方法、装置及可读存储介质 | |
CN114331237A (zh) | 基于ahp-熵权法的污水处理质量评估方法及装置 | |
CN114742412A (zh) | 一种软件技术服务系统及方法 | |
CN114461630A (zh) | 智能归因分析方法、装置、设备及存储介质 | |
CN113313211A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN108109002B (zh) | 数据处理方法及装置 | |
CN115225489B (zh) | 队列业务流量阈值动态控制方法、电子设备及存储介质 | |
CN108269004B (zh) | 产品寿命分析方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |