CN111489011A - 基于机器学习算法的经济信息处理系统 - Google Patents
基于机器学习算法的经济信息处理系统 Download PDFInfo
- Publication number
- CN111489011A CN111489011A CN202010082776.8A CN202010082776A CN111489011A CN 111489011 A CN111489011 A CN 111489011A CN 202010082776 A CN202010082776 A CN 202010082776A CN 111489011 A CN111489011 A CN 111489011A
- Authority
- CN
- China
- Prior art keywords
- information
- fixed
- data
- acceleration
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 21
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 18
- 230000010365 information processing Effects 0.000 title claims abstract description 15
- 230000001133 acceleration Effects 0.000 claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 25
- 230000000007 visual effect Effects 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000002360 preparation method Methods 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 8
- 239000013589 supplement Substances 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims description 3
- 238000012098 association analyses Methods 0.000 claims description 2
- 230000002159 abnormal effect Effects 0.000 claims 1
- 238000004140 cleaning Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 29
- 238000004590 computer program Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000013480 data collection Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000009469 supplementation Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001364 causal effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种基于机器学习算法的经济信息处理系统,包括:数据采集中间件,用于获取预设时间段内的固定投资信息和固定资产增速历史信息;数据库,存储所述预设时间段内的固定投资信息和固定资产增速历史信息;模型训练集群,根据所述固定投资信息和所述固定资产增速历史信息训练模型;模型执行设备,根据所述固定投资信息和所述模型预测固定资产增速信息;结果输出设备,以可视化方式输出所述固定资产增速信息。
Description
技术领域
本申请属于智能设备领域,特别涉及一种基于机器学习算法的经济信息处理系统。
背景技术
本申请的发明人发现:传统的经济分析主要依靠结构化数据,这些数据最明显的缺陷就是具有很强的时滞性。例如,政府公布的季度 GDP往往会有一个月的滞后期,而反映全面经济社会状况的统计年鉴的滞后期会达到三个月左右,这对及时了解宏观经济形势、预测与预警都是非常不利的。
同时,经典计量模型以因果检验为核心。在复杂的宏观经济系统中,当许多宏观经济中的因果关系往往难以准确检验。
本申请的发明人发现:传统的经济分析方法存在手段缺乏、传统周期长、覆盖范围窄、失真率高、反映当前经济形势切合度低等问题。难以监测自治区经济、重点行业、重点领域运行情况,以及难以实现重点行业分布热力图绘制、重点行业结构分析,以及难以在投资、消费等领域进行冷热预警。
发明内容
本申请旨在提供一种基于机器学习算法的经济信息处理系统。
本申请的一个实施例提供了一种基于机器学习算法的经济信息处理系统,包括:数据采集中间件,用于获取预设时间段内的固定投资信息和固定资产增速历史信息;数据库,存储所述预设时间段内的固定投资信息和固定资产增速历史信息;模型训练集群,根据所述固定投资信息和所述固定资产增速历史信息训练模型;模型执行设备,根据所述固定投资信息和所述模型预测固定资产增速信息;结果输出设备,以可视化方式输出所述固定资产增速信息。
利用上述系统,可以通过大数据技术和方法,获取及时性的数据,结合人工智能机器学习算法对数据进行分析和预测,既能有效利用经济理论解释经济问题,又能通过大数据获取的数据信息突破传统统计数据存在的问题,有效提高宏观经济预测和分析的效果,为宏观经济预测和分析带来新的突破。
固定资产投资的互联网数据结合传统统计数据,联合建立的指标体系,可以更准确实时的对下一季度的增速进行预测。并且通过机器学习方法,使得模型有着更强的泛化性,抗干扰能力强,准确度高,稳定性强,而且可以通过互联网指标对一些传统数据无法描述的市场环境变化有着量化描述,使得整体预测更加具有实时性。
附图说明
图1示出了本申请的一个实施例基于机器学习算法的经济信息处理系统的组成示意图。
图2示出了图1所示系统的模型训练集群的组成示意图。
图3示出了图2所示模型训练集群的数据准备单元的组成示意图。
图4示出了图2所示模型训练集群中先导关系分析单元的组成示意图。
图5示出了,示例实施例中三个指标时间序列波形图示意图。
图6示出了图5所示时间序列波形图经平稳性处理后的波形示意图。
图7示出了本申请的一个实施例基于机器学习算法的经济信息处理方法的流程示意图。
图8示出根据一示例性实施例的一种电子设备的框图。
具体实施方式
以下是通过特定的具体实施例来说明本发明所公开有关“一种基于机器学习算法的经济信息处理系统”的实施方式,本领域技术人员可由本说明书所公开的内容了解本发明的优点与效果。本发明可通过其他不同的具体实施例加以施行或应用,本说明书中的各项细节也可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。另外,本发明的附图仅为简单示意说明,并非依实际尺寸的描绘,事先声明。以下的实施方式将进一步详细说明本发明的相关技术内容,但所公开的内容并非用以限制本发明的保护范围。
本申请旨在提供一种基于机器学习算法的经济信息处理系统。
本申请的一个实施例提供了一种基于机器学习算法的经济信息处理系统,包括:数据采集中间件,用于获取预设时间段内的固定投资信息和固定资产增速历史信息;数据库,存储所述预设时间段内的固定投资信息和固定资产增速历史信息;模型训练集群,根据所述固定投资信息和所述固定资产增速历史信息训练模型;模型执行设备,根据所述固定投资信息和所述模型预测固定资产增速信息;结果输出设备,以可视化方式输出所述固定资产增速信息。
利用上述系统,可以通过大数据技术和方法,获取及时性的数据,结合人工智能机器学习算法对数据进行分析和预测,既能有效利用经济理论解释经济问题,又能通过大数据获取的数据信息突破传统统计数据存在的问题,有效提高宏观经济预测和分析的效果,为宏观经济预测和分析带来新的突破。
固定资产投资的互联网数据结合传统统计数据,联合建立的指标体系,可以更准确实时的对下一季度的增速进行预测。并且通过机器学习方法,使得模型有着更强的泛化性,抗干扰能力强,准确度高,稳定性强,而且可以通过互联网指标对一些传统数据无法描述的市场环境变化有着量化描述,使得整体预测更加具有实时性。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,本申请的权利要求、说明书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。本申请的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的,而并不意在限定本申请。如在本申请说明书和权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
图1示出了本申请的一个实施例基于机器学习算法的经济信息处理系统的组成示意图。
如图1所示,系统1000可以包括:数据采集中间件11、数据库 12、模型训练集群13、模型执行设备14和结果输出设备15。
其中,数据采集中间件11可以用于获取预设时间段内的固定投资信息和固定资产增速历史信息。可选地,数据采集中间件11可以包括一台计算机,也可以包括两台或者两台以上计算机。可选地,数据采集中间件11也可以是与计算机连接的输设备。
可选地,数据采集中间件11可以通过与计算机相连接的输入设备,接收用户输入的固定投资信息和固定资产投资增速信息。可选地,数据采集中间件11也可以通过与数据采集中间件11通信连接的信息源获取固定投资信息和固定资产投资增速信息。
如表1所示,可选地,固定资产投资信息可以包括:固定资产投资项目完成金额、工业技术改造投资、重大项目投资完成金额、铁路投资、地方专项债、银行中长期贷款额、投资项目个数、公开招标项目金额和投资景气指数中的至少一类。固定资产投资信息也可以包括上述各类数据中每一类的至少一个子类。
表1
可选地,数据采集中间件11还可以根据获取的固定投资信息分类以及固定资产投资增速信息确定指标体系。其中指标体系可以包括至少一个指标,该指标可以包括:固定资产投资项目完成金额、工业技术改造投资、重大项目投资完成金额、铁路投资、地方专项债、银行中长期贷款额、投资项目个数、公开招标项目金额和投资景气指数中的至少一项和/或每一项的至少一个子项。
可选地,数据采集中间件11采集预设时间内上述数据中至少一类数据。比如可以采集近5年的固定投资统计数据,以及近五年的固定资产投资增速信息。采集的数据可以包括年度统计数据、月度统计数据,也可以包括每日统计数据。
数据库12可以用于存储所述预设时间段内的固定投资信息和固定资产增速历史信息。可选地,数据库12可以存储于一台计算机内,也可以存储于相互通信的两台或者两台以上计算机中,以及可以存储于可以与上述计算机数据交换的存储介质中。可选地,数据库12也可以包括至少一台计算机,也可以包括至少一个存储介质。
模型训练集群13可以用于根据固定投资信息和固定资产增速历史信息训练模型。可选地,模型训练集群13可以包括与数据库12通信连接的计算机或者计算机群。可选地,模型训练集群13可以获取数据库12中的数据,并对该数据数据预处理;模型训练集群13还可以根据数据预处理后的数据进行数据相关性分析;模型训练集群13也可以对数据进行时间序列因果分析;以及模型训练集群13可以根据上述过程训练模型。
模型执行设备14可以用于根据固定投资信息和前述模型预测固定资产增速信息。模型执行设备14可以以固定投资信息为参数执行前述模型,并预测未来预定时间段内的固定资产增速信息。可选地,模型执行设备14可以包括与模型训练集群13通信连接的计算机或者计算机群。
结果输出设备15可以用于以可视化方式输出固定资产增速信息。结果输出设备15可以包括与数据库12和模型执行设备14均通信连接的计算机、显示终端或者其他输出设备。输出设备15接收来自模型执行设备14的固定资产增速信息。
图2示出了图1所示系统的模型训练集群的组成示意图。
如图2所示,模型训练集群13可以包括数据准备单元131和先导关系分析单元132。可选地,模型训练集群13也可以包括数据准备单元131和先导关系分析单元132中的一项。其中数据准备单元131可以用于对数据进行预处理操作。先导关系分析单元132可以用于分析所述固定投资信息中的至少一个成分与所述历史固定资产增速信息之间的先导关系。可选地,先导关系分析单元132可以用于确定固定投资信息中的至少一个成分与历史固定资产增速信息之间的偏移量。可选地,模型训练集群13可以根据该偏移量创建模型。
图3示出了图2所示模型训练集群的数据准备单元的组成示意图。
如图3所示,数据准备单元131可以包括:数据补充单元1311、数据清洗单元1312、数据规范单元1313、关联关系分析单元1314和降维处理单元1315中的至少一项。
其中数据补充单元1311可以用于填补所述固定投资信息中的缺失数据。当缺失数据比较少时,数据补充单元1311可以对缺失数据进行补充。数据补充单元1311可以采用平均值补充、随机数补充的方式进行数据补充。
数据清洗单元1312可以用于删除所述固定投资信息中的无效数据和/或异常数据。当数据中的某一个指标数据缺失较为严重时,为了不影响该数据对模型有效性的影响。数据清洗单元1312可以对该指标进行删除操作。
数据规范单元1313可以用于规范化所述固定投资信息中的数据。数据规范单元1313可以用于对预设指标数据进行量纲统一处理和数据归一化处理。
如示例实施例所示,数据补充单元1311、数据清洗单元1312和数据规范单元1313可以如图3所示的顺序串联连接。上述三个单元也可以交换次序连接。
关联关系分析单元1314,分析所述固定投资信息中的各个成分和所述历史固定资产增速信息的相关性。可选地,关联关系分析单元1314 可以执行以下过程:分析固定投资信息中的各个成分之间的相关性;分析固定投资信息中的各个成分与历史固定资产增速信息的相关性;根据固定投资信息中的各个成分与历史固定资产增速信息的相关性和固定投资信息中的各个成分之间的相关性建立关系矩阵。
可选地,关联关系分析单元1314可以根据在指标系统中任意提取一对指标。并绘制该一对指标的相关关系点图。并根据二者的相互关系点图得到二者的关联系数。确定每一对指标之间的关联系数,并在同一张二维表中列出上述关联系数。即得到关系矩阵。如表2所示为本申请的一个示例实施例的关系矩阵。表2所示的关系矩阵结构简单,仅为说明方便。在实际应用中的指标矩阵的指标可以更多。
表2
降维处理单元1315,剔除所述固定投资信息中与所述历史固定资产增速信息相关性较弱的成分。可选地,降维处理单元1315可以在指标系统中删除关系矩阵中权值小于第二阈值的指标,从而可以实现降维的目的。
如表2所示的关系矩阵中,“重大项目投资完成金额”与其他指标之间的关联系数较小。如果第二阈值为0.15,则可以在数据中剔除指标“重大项目投资完成金额”。可选地,也可以对表2所示的关系矩阵进行矩阵变换,并求得该关系矩阵的特征向量,以及由特征向量中每个特征值对应的指标表达式对应的新的指标系统。在新的指标系统中剔除特征值小于第二阈值的新指标,从而可以实现指标系统的解耦和降维。
可以反复多次利用关联关系分析单元1314确定关系矩阵,并利用降维处理单元1315进行降维处理,从而可以最大限度的简化指标之间的关联关系。
图4示出了图2所示模型训练集群中先导关系分析单元的组成示意图。
如图4所示先导关系分析单元132可以包括:平稳性检验单元 1321、平稳性处理单元1322。
其中,平稳性检验单元1321可以用于检验分析固定投资信息中的至少一个成分与历史固定资产增速信息之间关系的平稳性。平稳性检验单元1321可以采用格兰杰检验或者是指标之间线性回归拟合度检验数据的平稳性。
如果前述平稳性低于第一阈值,则可以利用平稳性处理单元1322 对所述固定投资信息中的至少一个成分与所述历史固定资产增速信息进行平稳性处理。
图5示出了,示例实施例中三个指标时间序列波形图示意图。图6 示出了图5所示时间序列波形图经平稳性处理后的波形示意图。
可以利用平稳性检验单元1321对图5所示的波形图进行平稳性分析。如果分析结果为该图的平稳性超过第一阈值。则可以利用平稳性处理单元1322对数据进行log变换,得到图6所示的平稳处理后的波形图。可选地,也可以采用其他方式对数据进行平稳性处理。
先导关系分析单元132可以利用图6所示的平稳处理后的波形图进行带偏移量线性回归计算。根据多个不同偏移量下的线性拟合度确定指标之间的偏移量。
图7示出了本申请的一个实施例基于机器学习算法的经济信息处理方法的流程示意图。
如图7所示,方法2000可以包括S210、S220、S230和S240。其中,在S210中,可以获取预设时间段内的固定投资信息和固定资产增速历史信息。可选地,采集的数据可以包括年度统计数据、月度统计数据,也可以包括每日统计数据。采集的数据可以存储于数据库中。
在S220中,可以根据固定投资信息和固定资产增速历史信息训练模型。可选地,S220还可以包括预处理和先导关系分析。其中,预处理可以包括数据补充、数据剔除、数据规范化和数据的线性拟合以及降维处理。先导关系分析可以对数据进行先导关系处理,得到数据之间的偏移量,即超前量或者滞后量。
在S230中,可以根据固定投资信息和模型预测固定资产增速信息。
在S240中,可以通过可视化方式输出所述固定资产增速信息。
图8示出根据一示例性实施例的一种电子设备的框图。
下面参照图8来描述根据本申请的这种实施方式的电子设备 200。图8显示的电子设备200仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书描述的根据本申请各种示例性实施方式的方法。例如,所述处理单元210 可以执行如图7所示的方法。
所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(ROM)2203。
所述存储单元220还可以包括具有一组(至少一个)程序模块 2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口250 进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备 200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
本领域技术人员可以理解,本申请的技术方案可实施为系统、方法或计算机程序产品。因此,本申请可表现为完全硬件的实施例、完全软件的实施例(包括固件、常驻软件、微码等)或将软件和硬件相结合的实施例的形式,它们一般可被称为“电路”、“模块”或“系统”。此外,本申请可表现为计算机程序产品的形式,所述计算机程序产品嵌入到任何有形的表达介质中,所述有形的表达介质具有嵌入到所述介质中的计算机可用程序代码。
参照根据本申请实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图来描述本申请。可以理解的是,可由计算机程序指令执行流程图和/或框图中的每个框、以及流程图和/或框图中的多个框的组合。这些计算机程序指令可提供给通用目的计算机、专用目的计算机或其它可编程数据处理装置的处理器,以使通过计算机或其它可编程数据处理装置的处理器执行的指令创建用于实现流程图和/或框图的一个框或多个框中指明的功能/动作的装置。
这些计算机程序指令还可存储于能够指导计算机或其它可编程数据处理装置以特定的方式实现功能的计算机可读介质中,以使存储于计算机可读介质中的指令产生包括实现流程图和/或框图中的一个框或多个框中指明的功能/动作的指令装置。
利用上述系统,可以通过大数据技术和方法,获取及时性的数据,结合人工智能机器学习算法对数据进行分析和预测,既能有效利用经济理论解释经济问题,又能通过大数据获取的数据信息突破传统统计数据存在的问题,有效提高宏观经济预测和分析的效果,为宏观经济预测和分析带来新的突破。
固定资产投资的互联网数据结合传统统计数据,联合建立的指标体系,可以更准确实时的对下一季度的增速进行预测。并且通过机器学习方法,使得模型有着更强的泛化性,抗干扰能力强,准确度高,稳定性强,而且可以通过互联网指标对一些传统数据无法描述的市场环境变化有着量化描述,使得整体预测更加具有实时性。
计算机程序指令还可加载到计算机或其它可编程数据处理装置上,以引起在计算机上或其它可编程装置上执行一连串的操作步骤,以产生计算机实现的过程,从而使在计算机或其它可编程装置上执行的指令提供用于实现流程图和/或框图中的一个框或多个框中指明的功能/动作的过程。
附图中的流程图和框图示出根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系结构、功能和操作。在这点上,流程图或框图中的每个框可表示一个模块、区段或代码的一部分,其包括一个或多个用于实现特定逻辑功能的可执行指令。还应注意,在一些可替代性实施中,框中标注的功能可以不按照附图中标注的顺序发生。例如,根据所涉及的功能性,连续示出的两个框实际上可大致同时地执行,或者这些框有时以相反的顺序执行。还可注意到,可由执行特定功能或动作的专用目的的基于硬件的系统、或专用目的硬件与计算机指令的组合来实现框图和/或流程图示图中的每个框、以及框图和/或流程图示图中的多个框的组合。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明仅用于帮助理解本申请的方法及其核心思想。同时,本领域技术人员依据本申请的思想,基于本申请的具体实施方式及应用范围上做出的改变或变形之处,都属于本申请保护的范围。综上所述,本说明书内容不应理解为对本申请的限制。
Claims (12)
1.一种基于机器学习算法的经济信息处理系统,包括:
数据采集中间件,用于获取预设时间段内的固定投资信息和固定资产增速历史信息;
数据库,存储所述预设时间段内的固定投资信息和固定资产增速历史信息;
模型训练集群,根据所述固定投资信息和所述固定资产增速历史信息训练模型;
模型执行设备,根据所述固定投资信息和所述模型预测固定资产增速信息;
结果输出设备,以可视化方式输出所述固定资产增速信息。
2.根据权利要求1所述的系统,其中所述模型训练集群,包括:
数据准备单元,对所述固定投资信息进行预处理。
3.根据权利要求2所述的系统,其中所述数据准备单元,包括:
数据补充单元,填补所述固定投资信息中的缺失数据;
数据清洗单元,删除所述固定投资信息中的无效数据和/或异常数据;
数据规范单元,规范化所述固定投资信息中的数据。
4.根据权利要求2所述的系统,其中所述数据准备单元,包括:
关联关系分析单元,分析所述固定投资信息中的各个成分和所述历史固定资产增速信息的相关性;
降维处理单元,剔除所述固定投资信息中与所述历史固定资产增速信息相关性较弱的成分。
5.根据权利要求4所述的系统,其中关联关系分析单元用于:
分析所述固定投资信息中的各个成分之间的相关性,
分析所述固定投资信息中的各个成分与所述历史固定资产增速信息的相关性,
根据所述固定投资信息中的各个成分与所述历史固定资产增速信息的相关性和所述固定投资信息中的各个成分之间的相关性建立关系矩阵。
6.根据权利要求1所述的系统,其中所述模型训练集群包括:
先导关系分析单元,分析所述固定投资信息中的至少一个成分与所述历史固定资产增速信息之间的先导关系。
7.根据权利要求6所述的系统,其中,所述先导关系分析单元包括:
平稳性检验单元,检验所述分析所述固定投资信息中的至少一个成分与所述历史固定资产增速信息之间关系的平稳性;
平稳性处理单元,如果所述平稳性低于第一阈值,则对所述固定投资信息中的至少一个成分与所述历史固定资产增速信息进行平稳性处理。
8.根据权利要求6所述的系统,其中,所述先导关系分析单元用于确定所述固定投资信息中的至少一个成分与所述历史固定资产增速信息之间的偏移量。
9.根据权利要求8所述的系统,其中,所述模型训练集群根据所述偏移量创建模型。
10.一种基于机器学习算法的经济信息处理方法,包括:
获取预设时间段内的固定投资信息和固定资产增速历史信息;
根据所述固定投资信息和所述固定资产增速历史信息训练模型;
根据所述固定投资信息和所述模型预测固定资产增速信息;
以可视化方式输出所述固定资产增速信息。
11.一种电子设备,包括处理器和存储器,以及存储于所述存储器的所述处理器可执行的程序,当所述程序被执行时,所述处理器执行权利要求10所述的方法。
12.一种存储介质,存储处理器可执行的程序,当所述程序被执行时,所述处理器执行权利要求10所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010082776.8A CN111489011A (zh) | 2020-02-07 | 2020-02-07 | 基于机器学习算法的经济信息处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010082776.8A CN111489011A (zh) | 2020-02-07 | 2020-02-07 | 基于机器学习算法的经济信息处理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111489011A true CN111489011A (zh) | 2020-08-04 |
Family
ID=71811592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010082776.8A Pending CN111489011A (zh) | 2020-02-07 | 2020-02-07 | 基于机器学习算法的经济信息处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111489011A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113521484A (zh) * | 2021-08-20 | 2021-10-22 | 华东师范大学 | 神经反馈训练系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527124A (zh) * | 2017-10-13 | 2017-12-29 | 众安信息技术服务有限公司 | 生成行业基本面组合预测模型的方法和装置 |
CN109919684A (zh) * | 2019-03-18 | 2019-06-21 | 上海盛付通电子支付服务有限公司 | 用于生成信息预测模型的方法、电子设备和计算机可读存储介质 |
CN110335155A (zh) * | 2019-05-29 | 2019-10-15 | 平安科技(深圳)有限公司 | 固定资产投资金额智能预测方法、装置及存储介质 |
-
2020
- 2020-02-07 CN CN202010082776.8A patent/CN111489011A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527124A (zh) * | 2017-10-13 | 2017-12-29 | 众安信息技术服务有限公司 | 生成行业基本面组合预测模型的方法和装置 |
CN109919684A (zh) * | 2019-03-18 | 2019-06-21 | 上海盛付通电子支付服务有限公司 | 用于生成信息预测模型的方法、电子设备和计算机可读存储介质 |
CN110335155A (zh) * | 2019-05-29 | 2019-10-15 | 平安科技(深圳)有限公司 | 固定资产投资金额智能预测方法、装置及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113521484A (zh) * | 2021-08-20 | 2021-10-22 | 华东师范大学 | 神经反馈训练系统 |
CN113521484B (zh) * | 2021-08-20 | 2023-03-28 | 华东师范大学 | 神经反馈训练系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Anagnostidis et al. | Has the 2008 financial crisis affected stock market efficiency? The case of Eurozone | |
CN106874658A (zh) | 一种基于主成分分析算法的医保欺诈识别方法 | |
Fielitz | Stationarity of random data: some implications for the distribution of stock price changes | |
CN111796233B (zh) | 双母线接线形式下多台电压互感器继发性误差的评估方法 | |
CN113126019A (zh) | 一种智能电表误差远程估计方法、系统、终端和存储介质 | |
CN109308225B (zh) | 一种虚拟机异常检测方法、装置、设备及存储介质 | |
CN112215398A (zh) | 电力用户负荷预测模型建立方法、装置、设备及存储介质 | |
CN111489011A (zh) | 基于机器学习算法的经济信息处理系统 | |
Hilal et al. | Portfolio risk assessment using multivariate extreme value methods | |
Lee et al. | Residual based cusum test for parameter change in AR-GARCH models | |
Boubaker et al. | Modellng Return and Volatility of Oil Price using Dual Long Memory Models | |
CN114090377A (zh) | 一种数据监控方法及装置 | |
CN115859201B (zh) | 一种化工过程故障诊断方法及系统 | |
Wei et al. | Fast quantitative analysis of stock trading points in dual period of DMAC | |
CN117436036A (zh) | 宏观经济指数的预测方法及装置 | |
Wei | Mathematical Model of Financial Market Risk Prediction Based on Data Mining | |
Adel et al. | Crash occurrence probability and stock market efficiency the indie stock exchange case via Shannon entropy | |
TSAKONAS et al. | NON-LINEAR ANALYSIS ON EXXON MOBIL SHARE PRICES. | |
Raïssi | On the correlation analysis of illiquid stocks | |
CN118424607A (zh) | 泄漏检测方法、装置、计算机可读存储介质及终端设备 | |
Guo | Housing Price Forecasting based on Stochastic Time Series Model. | |
Yinghua et al. | Optimization of non-linear industrial based on WT-KECA for process fault detection | |
Wu | Fault Diagnosis of Reducing Valve Based on Bispectra Slices | |
Lei | The Empirical Research between China's Scientific and Technological Investment and Economic Growth | |
Essaied | Export-led growth in Tunisia: A wavelet filtering based analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200804 |