CN111046339B - 一种仿真基期数据的处理方法及装置 - Google Patents
一种仿真基期数据的处理方法及装置 Download PDFInfo
- Publication number
- CN111046339B CN111046339B CN201911229911.0A CN201911229911A CN111046339B CN 111046339 B CN111046339 B CN 111046339B CN 201911229911 A CN201911229911 A CN 201911229911A CN 111046339 B CN111046339 B CN 111046339B
- Authority
- CN
- China
- Prior art keywords
- data
- industry
- simulation
- principle
- industry classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004088 simulation Methods 0.000 title claims abstract description 212
- 238000012545 processing Methods 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000006243 chemical reaction Methods 0.000 claims abstract description 52
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 35
- 230000001502 supplementing effect Effects 0.000 claims abstract description 8
- 238000010606 normalization Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000003672 processing method Methods 0.000 abstract description 4
- 238000012217 deletion Methods 0.000 abstract 1
- 230000037430 deletion Effects 0.000 abstract 1
- 239000000047 product Substances 0.000 description 62
- 238000004519 manufacturing process Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 6
- 235000008429 bread Nutrition 0.000 description 4
- 241000209094 Oryza Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012958 reprocessing Methods 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Bioinformatics & Computational Biology (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Algebra (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种仿真基期数据的处理方法及装置,方法包括:获取国民经济统计数据;国民经济统计数据按国民经济行业分类划分为若干子数据项;根据预设的数据处理原则,对国民经济统计数据进行处理,获得仿真基期数据,并将仿真基期数据输入经济仿真系统中进行仿真;其中,根据预设的处理原则对国民经济统计数据进行处理包括:根据行业转换原则将国民经济行业分类转换为仿真系统行业分类,继而将国民经济统计数据重新进行分类,分入经济仿真系统行业分类的对应类别中;根据总量分解原则对经济仿真系统行业分类中每一行业中企业缺失的数据项进行补充。通过实施本发明实施例,能够能解决现有仿真基期数据,系统性差以及数据缺失问题。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种仿真基期数据的处理方法及装置。
背景技术
经济仿真系统,是基于经济大数据的一种复杂系统,具备处理海量经济数据的同时,对仿真基期数据结构的也有特殊的要求;
而现有的仿真基期数据的采集,需要从不同的数据平台和工具中获取,由于不同平台和工具的数据规范标准不同,导致各采集的仿真基期数据之间的碎片化和断链化,数据系统性差,直接运用这些数据会导致经济仿真系统无法运行或者输出的仿真结果失真,此外采集的仿真基期数据需要涉及各行业中一些具体企业的微观数据如单个企业的固定资产,但由于这些数据往往具有隐私性,一般不会随意公开,因此会导致采集的仿真基期数据,存在数据缺失的情况,这些为了保证整个仿真系统的正常运行和仿真结果的仿真逼真度,通常会随意填入一些数据值进行仿真,这样降低了经济仿真系统的仿真逼真度。
发明内容
本发明实施例提供一种仿真基期数据的处理方法及装置,能降低经济仿真系统运行的出错率,提高仿真逼真度。
本发明一实施例提供了一种仿真基期数据的处理方法,包括获取国民经济统计数据;其中,所述国民经济统计数据按国民经济行业分类划分为若干子数据项;
根据预设的数据处理原则,对所述国民经济统计数据进行处理,获得所述仿真基期数据,并将所述仿真基期数据输入经济仿真系统中进行仿真;其中,所述根据预设的处理原对所述国民经济统计数据进行处理包括:
根据行业转换原则将所述国民经济行业分类转换为仿真系统行业分类,继而将所述国民经济统计数据重新进行分类,分入所述经济仿真系统行业分类的对应类别中;
根据总量分解原则对所述经济仿真系统行业分类中,每一行业中企业缺失的数据项进行补充。
进一步的,所述根据行业转换原则将所述国民经济行业分类转换为仿真系统行业分类包括:
将所述国民经济行业分类中的每一类别与所述仿真系统行业分类中的每一类别,一一对应,进行一对一转换;
或将所述国民经济行业分类中的每一类别拆分为多个子类别,将每一所述子类别与所述仿真系统行业分类中的每一类别对应,进行一对多转换;
或将所述国民经济行业分类中的若干类别组合为一个总类别,继而将每一所述总类别与所述仿真系统行业分类中的每一类别对应,进行多对一转换。
或将所述国民经济行业分类中的每一类别拆分为多个子类别,并将所述所有子类别进行组合,获得若干组合类别,继而将每一所述组合类别与所述仿真系统行业分类中的每一类别对应,进行组合转换。
进一步的,将所述国民经济行业分类中的每一类别与所述仿真系统行业分类中的每一类别,一一对应,进行一对一转换;
或将所述国民经济行业分类中的每一类别拆分为多个子类别,将每一所述子类别与所述仿真系统行业分类中的每一类别对应,进行一对多转换;
或将所述国民经济行业分类中的若干类别组合为一个总类别,继而将每一所述总类别与所述仿真系统行业分类中的每一类别对应,进行多对一转换。
或将所述国民经济行业分类中的每一类别拆分为多个子类别,并将所述所有子类别进行组合,获得若干组合类别,继而将每一所述组合类别与所述仿真系统行业分类中的每一类别对应,进行组合转换。
进一步的,所述根据预设的处理原对所述国民经济统计数据进行处理,还包括:根据归一化原则对经过总量分解原则处理后的国民经济统计数据进行校验。
进一步的,所述根据预设的处理原对所述国民经济统计数据进行处理,还包括:通过产品价值总量原则对经过总量分解原则处理后的国民经济统计数据进行校验;其中,所述产品价值总量原则为,产品的总价值必然等于产品的数量与单个产品的价格的乘积。
进一步的,在生成所述仿真基期数据之后,还包括:
设定用于仿真校验的特征指标,并以所述仿真基期数据作为输入进行仿真,获得仿真结果;
提取所述仿真结果中与所述特征指标对应的数据项,获得待校验数据项;
将所述待校验数据项与现实数据进行比对,判断是否在预设的误差范围内;
若否,将所述国民经济统计数据根据所述预设的数据处理原则,采用重新进行处理。
在上述方法项实施例的基础上,对应提供了装置项实施例:
本发明实施例提供了一种仿真基期数据的处理装置,包括数据获取模块和数据处理模块;
所述数据获取模块,用于获取国民经济统计数据;其中,所述国民经济统计数据按国民经济行业分类划分为若干子数据项;
所述数据处理模块,用于根据预设的数据处理原则,对所述国民经济统计数据进行处理,获得所述仿真基期数据,并将所述仿真基期数据输入经济仿真系统中进行仿真;其中,所述数据处理模块包括行业转换单元和总量分解单元;
所述行业转换单元,用于根据行业转换原则将所述国民经济行业分类转换为仿真系统行业分类,继而将所述国民经济统计数据重新进行分类,分入所述经济仿真系统行业分类的对应类别中;
所述总量分解单元,用于根据总量分解原则对所述经济仿真系统行业分类中,每一行业中企业缺失的数据项进行补充。
进一步的,所述数据处理模块,还包括归一化单元;所述归一化单元,用于根据归一化原则对经过总量分解原则处理后的国民经济统计数据进行校验。
进一步的,所述数据处理模块,还包括产品价值总量处理单元;其中,产品价值总量处理单元,用于通过产品价值总量原则对经过总量分解原则处理后的国民经济统计数据进行校验;其中,所述产品价值总量原则为,产品的总价值必然等于产品的数量与单个产品的价格的乘积。
进一步的,还包括特征校验模块;所述特征校验模块,用于设定用于仿真校验的特征指标,并以所述仿真基期数据作为输入进行仿真,获得仿真结果;
提取所述仿真结果中与所述特征指标对应的数据项,获得待校验数据项;
将所述待校验数据项与现实数据进行比对,判断是否在预设的误差范围内;
并在超出所述预设的误差范围内时,将所述国民经济统计数据根据所述预设的数据处理原则,重新进行处理。
通过实施本发明实施例具有如下有益效果:
本发明实施例提供了一种仿真基期数据的处理方法及装置,所述方法首先获取国民经济统计数据,以国民经济统计数据为基础数据,然后通过行业转换原则,国民经济统计数据原有分类的数据结构进行调整,将国民经济统计数据中各数据项按仿真系统中的行业分类,分入仿真系统的各个行业类别中,使得各数据项根据类别形成对应关系,符合经济仿真系统的数据结构要求,降低仿真系统的出错率;紧接着根据总量分解原则将经济仿真系统行业分类中,每个行业中各企业所缺失的数据进行补充,解决原仿真基期数据的数据缺失问题,从而提高仿真系统的逼真度。
附图说明
图1是本发明一实施例提供的一种仿真基期数据的处理方法的流程示意图。
图2是本发明一实施例提供的一种仿真基期数据的处理方法中行业转换原则的原理示意图。
图3是本发明一实施例提供的一种仿真基期数据的处理方法的一结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明一实施例提供的一种仿真基期数据的处理方法,包括以下步骤:
步骤S101:获取国民经济统计数据;其中,所述国民经济统计数据按国民经济行业分类划分为若干子数据项。
步骤S102:根据预设的数据处理原则,对所述国民经济统计数据进行处理,获得所述仿真基期数据,并将所述仿真基期数据输入经济仿真系统中进行仿真;其中,所述根据预设的处理原对所述国民经济统计数据进行处理包括:根据行业转换原则将所述国民经济行业分类转换为仿真系统行业分类,继而将所述国民经济统计数据重新进行分类,分入所述经济仿真系统行业分类的对应类别中;根据总量分解原则对所述经济仿真系统行业分类中,每一行业中企业缺失的数据项进行补充。
对于步骤S101、上述国民经济统计数据指的是国家统计局公布的统计数据,按各统计数据所反映的内容或数值表现形式可以分为总量指标数据、相对指标数据和平均指标数据三种。
总量指标数据是反映现象总体规模的统计指标,通常以绝对数的形式来表现,因此又称为绝对数,具体包括但不限于以下几种:例如国内生产总值(GDP)、财政收入、财政支出、全社会产品产量、全社会固定资产等。
相对指标数据又称相对数,是两个绝对数之比,具体包括但不限于以下几种,如经济增长率、失业率、通胀率、物价指数、全社会固定资产增长率、利润率等。相对数的表现形式通常为比例和比率两种。
平均指标数据又称平均数或均值,它反映的是现象在某一空间或时间上的平均数量状况,具体包括,但不限于以下几种,如人均国内生产总值、人均利润、平均固定资产等。
此外,各种指标数据按其数值计量单位的属性,可分为实物指标数据和价值指标数据。实物指标数据的计量单位是根据事物本身的物理性质和外部特征规定的。其中有些用自然单位表示,如面包,按个;有些用度量衡单位表示,如大米按斤等。价值指标数据的计量单位是货币,如工业总产值、社会商品零售总额等。价值指标可对各种不同产品的产量进行加总计算。
而上述各指标数据会根据现有的国民经济分类,划分为各个子数据项分入不同的行业中,即每个行业为统计基础,统计每个行业的总量指标数据、相对指标数据、平均指标数据等;具体的例如上述总量指标数据就还包括:各行业的生产总值、各行业的产品产量、各行业的固定资产等。
上述相对指标数据,就还包括:各行业的经济增长率、各行业的失业率、各行业的通胀率、各行业的物价指数、各行业的固定资产增长率、各行业的利润率等;
上述平均指标数据,就还包括行业平均生产总值、行业平均利润、行业平均固定资产等。
此外上述各指标数据还包括企业层次的统计数据,及上述总量指标数据,还包括各企业的生产总值、各企业产品产量、各企业的固定资产等,以获取中国国家统计局发布的国民经济统计数据为例,其内部包含了规模以上企业的固定资产数据等,需要说明的是由于各企业的上述微观数据,具有隐私性,在国民经济统计数据中,可能有部分企业的重量指标数据存在缺失的问题,此外若企业规模过小也可能不会在上述国民经济统计数据中,以中国国家统计局发布的国民经济统计数据为例其至包括了规模以上企业的数据但是没有包括规模以下的企业的数据,从而造成了数据缺失问题。
需要说明的是上述国民经济经济行业分类优选的是以中国2017年第四次修订的《国民经济行业分类》国家标准,对上述各指标数据进行行业分类的,当然若获取的国民经济统计数据,不为中国国家统计局发布的数据,例如为美国的国家统计局发布的数据,那么可以理解的是上述国民经济统计数据必然是按照美国的国民经济行业分类进行划分的。
对于步骤S102、由于仿真系统具有系统本身的行业分类标准,首先需要将原国民经济分类下的各个数据,对应的转换到仿真系统本生的行业分类标准下;
因此首先需要将国民经济分类标准与仿真系统本身的行业分类标准即上述仿真系统行业分离,进行对应的转换:
如图2所示,在一个优选的实施例中,所述根据行业转换原则将所述国民经济行业分类转换为仿真系统行业分类包括:
将所述国民经济行业分类中的每一类别与所述仿真系统行业分类中的每一类别,一一对应,进行一对一转换;
或将所述国民经济行业分类中的每一类别拆分为多个子类别,将每一所述子类别与所述仿真系统行业分类中的每一类别对应,进行一对多转换;
或将所述国民经济行业分类中的若干类别组合为一个总类别,继而将每一所述总类别与所述仿真系统行业分类中的每一类别对应,进行多对一转换。
或将所述国民经济行业分类中的每一类别拆分为多个子类别,并将所述所有子类别进行组合,获得若干组合类别,继而将每一所述组合类别与所述仿真系统行业分类中的每一类别对应,进行组合转换。
即上述转换的对应关系包括4中情况:
1、是国民经济行业分类中一个行业与仿真系统行业分类中一个行业一一对应,即Aα=Bβ,α=1,…,n,β=1,…,m,Aα表示n个国民经济行业中的第α个行业,表示n个仿真系统行业中的第β个行业;
2、是国民经济行业中一个行业对应仿真系统行业中的多个行业,则将国民经济行业中的该行业进行拆分,分配到仿真系统行业多个行业中去,即k表示将一个国民经济行业Aα的数据拆分到k个仿真系统行业中。
3、是国民经济行业中的多个行业或多个行业中的拆分部分对应仿真系统行业中的一个行业,则将国民经济行业中的多个行业或多个行业中的拆分部分合并起来,成为仿真系统行业中某个行业的数据,即表示将l个国民经济行业数据合并到一个仿真系统行业Bβ中。
4、是国民经济行业中的每一个行业拆分为若干子行业,然后将所有子行业重新组合,构成仿真系统中的各个行业。
经过上述步骤,形成国民经济行业分类与仿真系统行业分类之间的对应关系,然后将原有国民经济行业分类下的各个数据项,分入仿真系统行业分类中,这样使得仿真基期数据与经济仿真系统的数据结构要求对应,从而降低经济仿真系统的出错率。
在上述行业转换后,就可以得到在仿真系统行业分类下的各个行业的指标数据,如各行业的生产总值、各行业的产品产量等。
此时,还可以对上述行业转化做一次校验,具体的例如,从国民经济统计数据中采集到行业固定资产的数据,既有以具体金额表示的各行业固定资产,也有全社会固定资产总值,各行业固定资产之和为全社会固定资产总值。具体来说,行业转换前,如已知全社会固定资产总值为F,国民经济各行业固定资产为fA,A=1,…,n,f1+…+fn=F,在进行行业转换后,仿真系统中各行业固定资产为fB,B=1,…,m,f1+…+fm=F,全社会固定资产总值不变。若在校验过程中,发现进行行业转化后,全社会固定资产总值发生了变化,则说明在行业转换的过程中出现了错误。此外在将国民经济统计数据按仿真系统行业进行重新划分之后,对于每个行业中具体的各个企业的数据,有些可以从国民经济统计数据直接获取,而有一些缺失的数据项就需要通过总量分解原则,对缺失的数据项进行补充。
总量分解原则是指在宏观数据指标(行业级及行业级以上的指标数据),如全社会固定资产数据,各行业固定资产数据可获取,但部分微观的数据指标(行业级以下的指标数据),例如某一具体企业的固定资产数据不可获取的情况下,根据统计规律,将将宏观的数据指标按一定比例分配各微观的数据指标中去,需要说明的是,此处所提及的宏观数据指标指的是,行业层次以及行业层次以上(全国范围)的指标数据,此处所提及的微观数据指标指的是,行业层次以下的,例如一个企业的指标数据,包括但不限于企业的生产总值、企业产品产量各企业的固定资产等,以下以具体实例对总量分解原则进行说明:
在个别仿真对象输入值没有具体微观数据指标,但存在该仿真对象相应宏观数据指标的情况下,如能够获取某个行业的固定资产,但无法获取某个企业的固定资产,那么此时根据统计规律将某个行业的固定资产,分配到该企业中,这样可以保证经济仿真模型中该行业所有企业的同一数据项的数值总额与其行业统计数据一致。例如,在经过行业分类转换后,可以获得仿真系统行业分类中,某一行业例如是A行业的固定资产为C,由于数据的缺失,可能存在以下几种情况:
一、A行业中的第i个企业固定资产占行业固定资产的比例如占比为ri,但没有第i个企业固定资产具体数值下,则该企业的固定资产为ci=C×ri;
二、是各企业固定资产的占行业固定资产的比例缺失,但不同类型企业的数量和不同类型企业固定资产的占比。
具体来说,例如,在中国国家统计局发布的国民经济统计数据中,可以采集到大中型企业主要指标(规模以上),包括企业单位数(个),固定资产总计等,也可以采集到全国所有企业的总数量和资产总计等,但是没有小型企业(规模以下)的相关数据,但是通过之前的总量分解原则,小型企业的数据在经过处理之后也可以获得,即
已知该行业有Q个企业,行业固定资产总计为C,其中大型(l)企业数量为ql,其固定资产总计为Cl,中型企业(m)数量为qm,其固定资产总计为Cm,则小型企业(s)数量qs=Q-ql-qm,其固定资产总计为Cs=C-Cl-Cm
进一步则可计算出大中小型企业的每个企业的固定资产数据,在此简化地以算数平均法计算上述三种类型企业的每个企业的固定资产c:
cl=Cl÷ql,cm=Cm÷qm,cs=Cs÷qs
当然上述只是列举了企业的固定资产这一类别,还可以包括但不限于:企业的生产量,企业的产量等微观指标数据。
通过上述原则可以实现经济仿真系统行业分类中每一行业中企业缺失的数据项进行补充。
在一个优选的实施例中,上述企业缺失的数据项,主要是指规模以下的企业所缺失的数据项。
在一个优选的实施例中,所述根据预设的处理原对所述国民经济统计数据进行处理,还包括:根据归一化原则对经过总量分解原则处理后的国民经济统计数据进行校验。
归一化是一种简化计算的方式,即将有量纲的表达式,经过转换,化为无量纲的表达式,成为标量。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。在统计学中,归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。
例如,从上述行业转换过程中,可以获得转换后仿真系统各行业的固定资产比例为
B1:B2:…:Bm=r1:r2:…:rm
在数据处理后则可以用归一化原则进行检验,
r1+r2+…+rm=1
若上述各项比例之和不为1,则可判断该固定资产分配数据可能出错。
又如:行业产值的输入数据,既有以具体金额表示的各行业产值,也有所有行业的行业总产值,则可获得各行业产值占行业总产值的比例,比例之和为1。如已知年行业总产值为F,各行业产值为fα,α=1,…,fn,则各行业产值占比rα=fα÷F,必须满足f1+…+fn=1,否则可判断该行业产值的分配数据可能出错。
在一个优选的实施例中,若根据归一化原则对经过总量分解原则处理后的国民经济统计数据进行校验时,出现校验失败的情况则需要重新进行总量分解处理。
在一个优选的实施例中,所述根据预设的处理原对所述国民经济统计数据进行处理,还包括:通过产品价值总量原则对经过总量分解原则处理后的国民经济统计数据进行校验;其中,所述产品价值总量原则为,产品的总价值必然等于产品的数量与单个产品的价格的乘积。
产品的总价值必然是等于产品的数量与单个产品的价格的乘积的,因此在本实施例中,通过产品价值总量原则对经过总量分解原则处理后的国民经济统计数据进行校验;
具体可为:计算仿真系统行业分类下各行业中产品产量与对应的产品数量的乘积,并将该乘积与各行业的生产总值进行比对,如果不符合,则说明数据出现错误,需要重新调整;
在获取产品数据时,由于产品分类和价值计算不统一的问题,例如,大米按斤计算价格,单价乘以斤数可以求出总价值,面包按个数计算价格,单价乘以个数可以求出总价值。大米和面包都属于食品,因此最容易获取到的数据就是总价值。但是在经济仿真系统中,必须输入数量或价格,因此,需要从某类产品的总价值反推出数量和价格。
在产品总价值V=p×q不变的情况下,我们假设产品价格p或产品数量q,按照价格*数量=价值的计算公式可以得到对应产品数量q=V÷p或产品价格p=V÷q。
通过产品价值总量原则进行数据处理获得某类产品的数量或价格之后,输入经济仿真系统运行实验,输出结果是符合经济规律的,因此可保证数据的合理性,也免去了现场调查采集数据的成本,提高效率,解决数据收集成本高的问题。
通过上述数据处理原则进行处理后,最终可获得适用于经济仿真系统的仿真基期数据,然后将获取的仿真数据输入经济仿真系统进行仿真,从而降低仿真系统的出错率,提高仿真系统的逼真度。需要说明的是此处所定义的仿真基期数据,包括行业级及行业级以下的数据,而仿真基期数据在经济仿真系统中可按现有的技术进行经济仿真。
在一个优选的实施例中,还包括:
设定用于仿真校验的特征指标,并提取以所述仿真基期数据作为输入后的仿真结果;
提取所述仿真结果中与所述特征指标对应的数据项,获得待校验数据项;
将所述待校验数据项与现实数据进行比对,判断是否在预设的误差范围内;
若否,将所述国民经济统计数据根据所述预设的数据处理原则,重新进行处理。
这一实施例是一个特征校验的过程,在进行特征校验之前,先进行于仿真校验的特征指标的选择。为实现经济仿真系统与现实国民经济系统逼近,因此其特征指标为最有代表性的宏观经济指标,如国民生产总值(GDP)、失业率、通胀率等。这些指标将作为校验的标准或基准。
然后将经过上述数据预设的处理原则后生成符合经济仿真系统输入数据结构的仿真基期数据,输入到仿真系统系统中,对仿真后的道的国民生产总值、失业率、通胀率等,与国家统计局发布的国民生产总值、失业率、通胀率的实际数据进行比对,如果在误差范围内,则校验通过,将生成的基期数据进行保存,若校验不同过,则按预设的数据处理原则进行数据处理。
具体的,特征校验是这样的一个过程,采用权威统计部门(包括但不限于国家统计局、世界银行、世界贸易组织等)发布的统计指标数据,经过上述数据处理原则后生成符合经济仿真系统输入数据结构的数据,为经济仿真系统中的各种类型的仿真对象赋值,运行后获得宏观经济指标数据,主要考察国民生产总值(GDP)、失业率和通胀率为特征指标的仿真输出数据,以权威统计部门发布的的宏观经济统计指标数据为基准进行对比并确定误差值最终使得模型的宏观总量指标国民生产总值(GDP)、失业率和通胀率的仿真数据控制在预期的允差范围之内。
上述各种类型的仿真对象(agent)为:经济仿真系统可以模拟一个国家的政府,管理着一个有42个行业,六种市场的商品经济系统。在模型中,不同行业和政府中的agents,包括不同年龄、技术水平的居民、不同行业和规模的企业、批发和零售商店、银行、中央银行、多种职能的政府部门。每个行业生产一种商品。行业的生产者是成千上万的企业、股东和受雇佣者。不同行业的生产者拥有自己生产的产品的所有权。为了满足自己对对多种不同效用属性的产品的需求。他们按照价值相等的原则在市场上进行商品交换,互通有无。模型可以模拟这些agents几十年中的每一天中的原材料、设备、劳动力、产量、效用等级、资金、价格、成本、利润、GDP、失业率、通胀率等的变化情况。
上述误差值:即以准确已知的统计数据为标准值得出仿真结果数值与之存在的误差,误差率=(仿真结果数值-标准值)/标准值*100%,取绝对值。
上述允差范围:就当前的经济仿真系统而言,无法百分之百地还原现实经济社会,只能尽可能地逼近现实经济社会。同时,不同特征指标的基准数值不同,且允差范围也不同。因此,经济仿真系统输出数值无法百分之百与特征指标的基准一致,但是可以做到尽可能逼近特征指标基准,与特征指标基准的误差越小,经济仿真系统的仿真逼真度就越高。
例如,某一次仿真特征校验要求是连续仿真2年输出的GDP误差率为在5%以内,失业率的误差率在10%以内。若特征指标仿真结果的误差率超过要求的范围,重新将国民经济统计数据按预设的处理原则,进行重新处理,然后输入数据,重新运行经济仿真系统,得到仿真结果后再次进行对比,如此反复,直到所有特征指标仿真结果的误差率都符合要求。
如图3所示在上述方法项实施例的基础上对应提供了装置项实施例;
本发明一实施例提供了一种种仿真基期数据的处理装置,包括数据获取模块和数据处理模块;
所述数据获取模块,用于获取国民经济统计数据;其中,所述国民经济统计数据按国民经济行业分类划分为若干子数据项;
所述数据处理模块,用于根据预设的数据处理原则,对所述国民经济统计数据进行处理,获得所述仿真基期数据,并将所述仿真基期数据输入经济仿真系统中进行仿真;其中,所述数据处理模块包括行业转换单元和总量分解单元;
所述行业转换单元,用于根据行业转换原则将所述国民经济行业分类转换为仿真系统行业分类,继而将所述国民经济统计数据重新进行分类,分入所述经济仿真系统行业分类的对应类别中;
所述总量分解单元,用于根据总量分解原则对所述经济仿真系统行业分类中,每一行业中企业缺失的数据项进行补充。
进一步的,所述数据处理模块,还包括归一化单元;所述归一化单元,用于根据归一化原则对经过总量分解原则处理后的国民经济统计数据进行校验。
进一步的,其特征在于,所述数据处理模块,还包括产品价值总量处理单元;其中,产品价值总量处理单元,用于通过产品价值总量原则对经过总量分解原则处理后的国民经济统计数据进行校验;其中,所述产品价值总量原则为,产品的总价值必然等于产品的数量与单个产品的价格的乘积。
进一步的,所述特征校验模块,用于设定用于仿真校验的特征指标,并将所述仿真基期数据输入所述经济仿真系统中进行仿真获得仿真结果;
提取所述仿真结果中与所述特征指标对应的数据项,获得待校验数据项;
将所述待校验数据项与现实数据进行比对,判断是否在预设的误差范围内;
并在超出所述预设的误差范围内时,将所述国民经济统计数据根据所述预设的数据处理原则,重新进行处理。
需说明的是,上述装置项是与上述方法项相对应的,其可以实现本发明上述任意一项方法项实施例所述的仿真基期数据的处理方法;
另以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元/模块可以是或者也可以不是物理上分开的,作为单元/模块显示的部件可以是或者也可以不是物理单元/模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。所述示意图仅仅是仿真基期数据的处理装置的示例,并不构成对仿真基期数据的处理装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
通过实施本发明的实施例能够根据国民统计数据生成仿真基期数据,解决现有仿真基期数据系统性差和数据缺失的问题,从而进一步的降低了经济仿真系统的出错率以及提高仿真逼真度。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (6)
1.一种仿真基期数据的处理方法,其特征在于,包括:
获取国民经济统计数据;其中,所述国民经济统计数据按国民经济行业分类划分为若干子数据项;
根据预设的数据处理原则,对所述国民经济统计数据进行处理,获得所述仿真基期数据,并将所述仿真基期数据输入经济仿真系统中进行仿真;其中,所述根据预设的数据处理原则对所述国民经济统计数据进行处理包括:
根据行业转换原则将所述国民经济行业分类转换为经济仿真系统行业分类,继而将所述国民经济统计数据重新进行分类,分入所述经济仿真系统行业分类的对应类别中;
根据总量分解原则对所述经济仿真系统行业分类中每一行业中企业缺失的数据项进行补充;
所述根据行业转换原则将所述国民经济行业分类转换为仿真系统行业分类包括:
将所述国民经济行业分类中的每一类别与所述仿真系统行业分类中的每一类别,一一对应,进行一对一转换;
或将所述国民经济行业分类中的每一类别拆分为多个子类别,将每一所述子类别与所述仿真系统行业分类中的每一类别对应,进行一对多转换;
或将所述国民经济行业分类中的若干类别组合为一个总类别,继而将每一所述总类别与所述仿真系统行业分类中的每一类别对应,进行多对一转换;
或将所述国民经济行业分类中的每一类别拆分为多个子类别,并将所有子类别进行组合,获得若干组合类别,继而将每一所述组合类别与所述仿真系统行业分类中的每一类别对应,进行组合转换;
所述总量分解原则是指根据统计规律,将宏观的数据指标按一定比例分配到各微观的数据指标中,包括:将行业层次以及行业层次以上的指标数据按一定比例分配至各企业的指标数据中;
设定用于仿真校验的特征指标,并以所述仿真基期数据作为输入进行仿真,获得仿真结果;
提取所述仿真结果中与所述特征指标对应的数据项,获得待校验数据项;
将所述待校验数据项与现实数据进行比对,判断是否在预设的误差范围内;
若否,将所述国民经济统计数据根据所述预设的数据处理原则,重新进行处理。
2.如权利要求1所述的仿真基期数据的处理方法,其特征在于,所述根据预设的数据处理原则对所述国民经济统计数据进行处理,还包括:根据归一化原则对经过总量分解原则处理后的国民经济统计数据进行校验。
3.如权利要求1所述的仿真基期数据的处理方法,其特征在于,所述根据预设的数据处理原则对所述国民经济统计数据进行处理,还包括:通过产品价值总量原则对经过总量分解原则处理后的国民经济统计数据进行校验;其中,所述产品价值总量原则为,产品的总价值等于产品的数量与单个产品的价格的乘积。
4.一种仿真基期数据的处理装置,其特征在于,包括数据获取模块、数据处理模块、以及特征校验模块;
所述数据获取模块,用于获取国民经济统计数据;其中,所述国民经济统计数据按国民经济行业分类划分为若干子数据项;
所述数据处理模块,用于根据预设的数据处理原则,对所述国民经济统计数据进行处理,获得所述仿真基期数据并将所述仿真基期数据输入经济仿真系统中进行仿真;其中,所述数据处理模块包括行业转换单元和总量分解单元;
所述行业转换单元,用于根据行业转换原则将所述国民经济行业分类转换为仿真系统行业分类,继而将所述国民经济统计数据重新进行分类,分入所述经济仿真系统行业分类的对应类别中;
所述总量分解单元,用于根据总量分解原则对所述经济仿真系统行业分类中,每一行业中企业缺失的数据项进行补充;
所述特征校验模块,用于设定用于仿真校验的特征指标,并以所述仿真基期数据作为输入进行仿真,获得仿真结果;
提取所述仿真结果中与所述特征指标对应的数据项,获得待校验数据项;
将所述待校验数据项与现实数据进行比对,判断是否在预设的误差范围内;
并在超出所述预设的误差范围内时,将所述国民经济统计数据根据所述预设的数据处理原则,重新进行处理;
其中,所述行业转换单元,根据行业转换原则将所述国民经济行业分类转换为仿真系统行业分类包括:
将所述国民经济行业分类中的每一类别与所述仿真系统行业分类中的每一类别,一一对应,进行一对一转换;
或将所述国民经济行业分类中的每一类别拆分为多个子类别,将每一所述子类别与所述仿真系统行业分类中的每一类别对应,进行一对多转换;
或将所述国民经济行业分类中的若干类别组合为一个总类别,继而将每一所述总类别与所述仿真系统行业分类中的每一类别对应,进行多对一转换;
或将所述国民经济行业分类中的每一类别拆分为多个子类别,并将所有子类别进行组合,获得若干组合类别,继而将每一所述组合类别与所述仿真系统行业分类中的每一类别对应,进行组合转换;
所述总量分解原则是指根据统计规律,将宏观的数据指标按一定比例分配到各微观的数据指标中,包括:将行业层次以及行业层次以上的指标数据按一定比例分配至各企业的指标数据中。
5.如权利要求4所述的仿真基期数据的处理装置,其特征在于,所述数据处理模块,还包括归一化单元;所述归一化单元,用于根据归一化原则对经过总量分解原则处理后的国民经济统计数据进行校验。
6.如权利要求4所述的仿真基期数据的处理装置,其特征在于,所述数据处理模块,还包括产品价值总量处理单元;其中,产品价值总量处理单元,用于通过产品价值总量原则对经过总量分解原则处理后的国民经济统计数据进行校验;其中,所述产品价值总量原则为,产品的总价值等于产品的数量与单个产品的价格的乘积。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911229911.0A CN111046339B (zh) | 2019-12-04 | 2019-12-04 | 一种仿真基期数据的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911229911.0A CN111046339B (zh) | 2019-12-04 | 2019-12-04 | 一种仿真基期数据的处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111046339A CN111046339A (zh) | 2020-04-21 |
CN111046339B true CN111046339B (zh) | 2024-03-08 |
Family
ID=70234658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911229911.0A Active CN111046339B (zh) | 2019-12-04 | 2019-12-04 | 一种仿真基期数据的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111046339B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990651A (zh) * | 2021-01-15 | 2021-06-18 | 嘉兴学院 | 一种流域环境资源投入产出模型的构建方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110363483A (zh) * | 2019-07-22 | 2019-10-22 | 西南交通大学 | 一种基于共享平台货运出行数据的扩样校核方法 |
-
2019
- 2019-12-04 CN CN201911229911.0A patent/CN111046339B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110363483A (zh) * | 2019-07-22 | 2019-10-22 | 西南交通大学 | 一种基于共享平台货运出行数据的扩样校核方法 |
Non-Patent Citations (1)
Title |
---|
张梦婷 ; 俞峰 ; 钟昌标 ; 林发勤 ; .高铁网络、市场准入与企业生产率.中国工业经济.2018,(第05期),第137-156页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111046339A (zh) | 2020-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dhyne et al. | Multi product firms, import competition, and the evolution of firm-product technical efficiencies | |
CN105005289B (zh) | 一种工业物联网平台 | |
Baltazar et al. | Air transport performance and efficiency: MCDA vs. DEA approaches | |
CN106570778A (zh) | 一种基于大数据的数据集成与线损分析计算的方法 | |
Tsai et al. | A new fuzzy DEA model for solving the MCDM problems in supplier selection | |
CN102376040A (zh) | 一种企业采购份额分配决策支持系统 | |
JP2017504126A5 (zh) | ||
CN112860769B (zh) | 一种能源规划数据管理系统 | |
Wieland et al. | Supply versus use designs of environmental extensions in input–output analysis: Conceptual and empirical implications for the case of energy | |
CN108846645A (zh) | 一种企业扁平化管理方法及系统 | |
CN111754317A (zh) | 一种金融投资数据测评方法及系统 | |
CN111046339B (zh) | 一种仿真基期数据的处理方法及装置 | |
CN111695979A (zh) | 一种原材料与成品的关系分析方法、装置及设备 | |
CN114742432A (zh) | 市场采购贸易风控管理方法及其管理系统 | |
WO2022105127A1 (zh) | 基于 Hadoop 的数据处理方法、装置、设备及存储介质 | |
CN113450004A (zh) | 电力信用报告生成方法、装置、电子设备及可读存储介质 | |
CN112256681A (zh) | 一种空管数字化指标应用系统及方法 | |
CN112785057A (zh) | 基于指数平滑的件量预测方法、装置、设备及存储介质 | |
Haepp et al. | Is Taiwan’s workforce underpaid? Evidence from marginal product of labor estimates at the company level | |
CN113744024B (zh) | 一种商家匹配方法、装置、计算机设备及存储介质 | |
CN115564278A (zh) | 一种绩效数据管理系统、方法及计算设备 | |
CN114781855A (zh) | 基于dea模型的物流传输效率分析方法、装置、设备及介质 | |
Rifqi et al. | Lean Six Sigma in agribusiness: A Case Study in a Cookie Production Plant | |
JP2022033470A (ja) | 設計支援装置および設計支援方法 | |
Prakash et al. | The Potential of Re-exports: A Probability for Fiji’s Trade Growth |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |