CN111221806A - 一种物质循环过程模拟数据库的构建方法 - Google Patents
一种物质循环过程模拟数据库的构建方法 Download PDFInfo
- Publication number
- CN111221806A CN111221806A CN202010066608.XA CN202010066608A CN111221806A CN 111221806 A CN111221806 A CN 111221806A CN 202010066608 A CN202010066608 A CN 202010066608A CN 111221806 A CN111221806 A CN 111221806A
- Authority
- CN
- China
- Prior art keywords
- data
- database
- model
- activity level
- simulation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 230000008569 process Effects 0.000 title claims abstract description 55
- 238000004088 simulation Methods 0.000 title claims abstract description 41
- 239000000463 material Substances 0.000 title claims abstract description 34
- 238000010276 construction Methods 0.000 title claims abstract description 12
- 230000000694 effects Effects 0.000 claims abstract description 42
- 238000013523 data management Methods 0.000 claims abstract description 9
- 238000012821 model calculation Methods 0.000 claims abstract description 9
- 230000002159 abnormal effect Effects 0.000 claims abstract description 7
- 238000013500 data storage Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 31
- 230000014509 gene expression Effects 0.000 claims description 13
- 230000000875 corresponding effect Effects 0.000 claims description 9
- 238000011160 research Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 4
- 230000009897 systematic effect Effects 0.000 claims description 4
- 238000012800 visualization Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000007794 visualization technique Methods 0.000 claims description 3
- 238000000528 statistical test Methods 0.000 claims description 2
- 239000000126 substance Substances 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 abstract description 9
- 238000004458 analytical method Methods 0.000 abstract description 6
- 238000011156 evaluation Methods 0.000 abstract description 5
- 238000003860 storage Methods 0.000 abstract description 5
- 238000013079 data visualisation Methods 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 abstract description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 23
- 229910052698 phosphorus Inorganic materials 0.000 description 23
- 239000011574 phosphorus Substances 0.000 description 23
- 238000004519 manufacturing process Methods 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 7
- 239000003337 fertilizer Substances 0.000 description 6
- 238000011835 investigation Methods 0.000 description 5
- 229910052729 chemical element Inorganic materials 0.000 description 4
- 239000002894 chemical waste Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000003975 animal breeding Methods 0.000 description 3
- 238000012824 chemical production Methods 0.000 description 3
- 230000004907 flux Effects 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 235000013372 meat Nutrition 0.000 description 3
- 239000002367 phosphate rock Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000003912 environmental pollution Methods 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 235000008708 Morus alba Nutrition 0.000 description 1
- 240000000249 Morus alba Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012272 crop production Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- OJMIONKXNSYLSR-UHFFFAOYSA-N phosphorous acid Chemical compound OP(O)O OJMIONKXNSYLSR-UHFFFAOYSA-N 0.000 description 1
- 238000004175 phosphorus cycle Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/214—Database migration support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/01—Automatic library building
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Abstract
本发明提出了一种物质循环过程模拟数据库构建方法,主要包括数据采集、数据治理、数据入库、模型构建、模型计算、数据可视化六个步骤。通过综合多种数据采集手段,保证了活动水平数据和系数的质量;通过异常值检测和缺失值多重插补的方法对数据进行治理,保证了入库数据的有效性;通过标准范式构建结构化活动水平数据库、系数数据库、模型数据库、结果数据库,保证了物质循环过程模拟数据库的拓展性和一致性;通过桑基图、GIS图和统计图表等数据可视化方法对数据进行直观展示,保证了研究者对于模拟结果的深度洞察。本发明适用于大规模长时序高分辨率的物质循环过程模拟,为高效地开展物质循环过程模拟、分析、评估提供技术支持。
Description
技术领域
本发明属于环境模拟与数据分析技术领域,具体涉及一种物质循环过程模拟数据库的构建方法。
背景技术
物质循环是指人类-自然复合生态系统内的各种化学元素及其化合物在系统内部各组成要素之间及其在地球表层生物圈、水圈、大气圈、岩石圈、土壤圈等各圈层之间,沿着特定的途径从环境到人类社会,再经由矿物开采、生产加工、人类消费、污染处置等人类社会物质代谢环节从人类社会回到环境不断地进行反复循环变化的过程。物质循环过程模拟是生物地球化学循环、物质代谢分析、产业生态学、清洁生产与循环经济、环境规划与管理、生命周期评估等多个学科研究的重要基础。随着人类社会经济活动的飞速发展,物质循环过程也不断加剧,物质循环的路径也日益复杂。传统的物质循环过程定量分析方法计算规模及计算效率已经远远不能满足于当前高效的人类生产生活方式的定量模拟及精细化的资源利用效率提升及环境污染精准管控的需求,其中一个及其重要的技术瓶颈在于如何构建和管理大规模长时序高分辨率的物质循环过程模拟数据并建立数据库。为此,建立一种管理大规模长时序高分辨率的物质循环过程模拟数据库,用以高效地管理物质循环过程模拟、分析、评估,为相关学科的研究提供数据基础,为支撑我国资源的高效利用及环境污染精准治理提供科学依据。
发明内容
本发明的目的在于针对现有物质循环过程模拟中缺乏系统和高效数据库进行数据管理与模型计算的问题,提供一种物质循环过程模拟数据库的构建方法。该方法构建的数据库符合结构化数据库构建的标准,具有较高的数据扩展性,适宜于大规模数据库的构建,能够很好地支撑大规模长时序高分辨率的物质循环过程模拟。
本发明的方案是通过这样实现的:
一种物质循环过程模拟数据库的构建方法,包括以下步骤:
步骤一数据采集:采集物质循环过程模拟模型所需要的活动水平数据和系数并将数据存储到计算机中;
步骤二数据治理:将储存的数据进行系统的数据治理,剔除或者替换数据中的异常值,填补数据中的缺失值,并将数据进行标准化处理;
步骤三数据入库:根据结构化数据库构建的标准范式,分别对上述活动水平数据和系数进行整理,存储到结构化数据库中并构建相应的活动水平数据库和系数数据库;
步骤四模型构建:建立标准化的模型数据库,将模型的表达式按照计算顺序进行整理得到模型图库和模型表达式库,模型计算公式可以引用活动水平数据库和系数数据库中的变量及前序的表达式计算的结果;
步骤五模型计算:调用活动水平数据库和系数数据库中的相关变量以及模型数据库中的标准化模型,进行核算,将核算的结果存入结果数据库;
步骤六数据可视化:根据活动水平数据库、系数数据库、模型数据库和结果数据库中存储的标准化数据,采用可视化的方法进行分析,用以支撑科学研究和指导现实决策。
作为本发明的进一步说明,所述步骤一中数据存储采用人工输入、文字识别和自动采集方式中的一种或两种。
作为本发明的进一步说明,所述文字识别是指通过OCR技术对手写的标准化表格中的数据进行识别从而采集数据的方式。
作为本发明的进一步说明,所述活动水平数据和系数通过统计年鉴、长期观测、遥感解译、问卷调查、文献调研、现场监测、专家咨询的方式获取。
作为本发明的进一步说明,所述异常值通过统计检验或者统计作图进行识别;所述缺失值通过数据的多重插补进行填补;所述数据进行标准化处理指同一类数据按照同样的方式处理,并且数据的量纲保持统一。统计作图可以采用如箱线图等方式进行识别,缺失数据需要通过数据的多重插补进行填补,以降低单一值插补造成的数据方差值的低估。
作为本发明的进一步说明,所述步骤三中,活动水平数据和系数至少需要指明变量名(NAME)、变量含义(NOTE)、变量单位(UNIT)和变量的取值(DATA),推荐记录数据的来源(SOURCE);当存在不同时间段的数据需要包括记录变量作用的时间(TIME),当存在不同空间上的数据还需要包括记录变量作用的位置(SITE)。
作为本发明的进一步说明,所述步骤三中,活动水平数据和系数的变量名最好使用英文命名法,包括字母、数字和下划线(_),需要字母打头。
作为本发明的进一步说明,所述模型数据库至少包括3个方面的信息:来源(FROM)、去向(TO)和算法(FUN);当需要引用前面表达式计算结果,还包括一个变量名字段(NAME),并将计算的结果存入对应的变量。3个方面的信息具体为:从哪个过程来(FROM),到哪个过程去(TO)以及如何计算(FUN);为了防止在存储过程中计算顺序打乱,最好给每个计算公式一个序号(ID)。
作为本发明的进一步说明,所述步骤五中,还包括一个计算模块,所述计算模块调用活动水平数据库、系数数据库和模型数据库,计算的结果至少包括流的来源(FROM)、流的去向(TO)和流量大小(FLOW)3个字段。
作为本发明的进一步说明,所述可视化的方法包括桑基图、GIS图和统计图表中的一种或多种。可以根据具体分析问题而定。
本发明具备以下良好效果:
本发明提供的物质循环过程模拟数据库的构建方法,综合多种数据采集手段保证了数据采集的质量,采用异常值检测和缺失值多重插补的方法保证了入库数据的有效性,依据结构化数据构建的标准范式构建数据库保证了构建的活动水平数据库、系数数据库、模型数据库、结果数据库具有很好的拓展性和一致性,利用桑基图、GIS图和统计图表等数据可视化保证了模拟结果的直观性。本发明的方法适用于大规模长时序高分辨率的物质循环过程模拟,能够高效地管理物质循环过程模拟、分析和评估等科研工作。
附图说明
图1 为本发明的物质循环过程模拟数据库的构建方法流程图。
图2 为以磷在人类社会循环过程模拟数据库构建原理图。
图3 为图2中磷在人类社会循环过程模拟结果的桑基图。
具体实施方式
以下结合实施例描述本发明一种物质循环过程模拟数据库的构建方法,这些描述并不是对本发明内容作进一步的限定。
实施例1:
一种物质循环过程模拟数据库的构建方法,包括以下步骤:
步骤一数据采集:通过统计年鉴、长期观测、遥感解译、问卷调查、文献调研、现场监测、专家咨询的方式获取采集物质循环过程模拟模型所需要的活动水平数据和系数并将数据通过人工输入、文字识别和和自动采集相结合的方式存储到计算机中;
步骤二数据治理:将储存的数据进行系统的数据治理,剔除或者替换数据中的异常值,填补数据中的缺失值,并将数据进行标准化处理;
步骤三数据入库:根据结构化数据库构建的标准范式,分别对上述活动水平数据和系数进行整理,存储到结构化数据库中并构建相应的活动水平数据库和系数数据库;
步骤四模型构建:建立标准化的模型数据库,将模型的表达式按照计算顺序进行整理得到模型图库和模型表达式库,模型计算公式可以引用活动水平数据库和系数数据库中的变量及前序的表达式计算的结果;
步骤五模型计算:调用活动水平数据库和系数数据库中的相关变量以及模型数据库中的标准化模型,进行核算,将核算的结果存入结果数据库;
步骤六数据可视化:根据活动水平数据库、系数数据库、模型数据库和结果数据库中存储的标准化数据,采用桑基图、GIS图和统计图表的可视化的方法进行分析,用以支撑科学研究和指导现实决策;
所述异常值通过统计检验或者统计作图进行识别;所述缺失值通过数据的多重插补进行填补;所述数据进行标准化处理指同一类数据按照同样的方式处理,并且数据的量纲保持统一。统计作图可以采用如箱线图等方式进行识别,缺失数据需要通过数据的多重插补进行填补,以降低单一值插补造成的数据方差值的低估;
所述步骤三中,活动水平数据和系数至少需要指明变量名(NAME)、变量含义(NOTE)、变量单位(UNIT)和变量的取值(DATA),推荐记录数据的来源(SOURCE);当存在不同时间段的数据需要包括记录变量作用的时间(TIME),当存在不同空间上的数据还需要包括记录变量作用的位置(SITE);
所述模型数据库至少包括3个方面的信息:来源(FROM)、去向(TO)和算法(FUN);当需要引用前面表达式计算结果,还包括一个变量名字段(NAME),并将计算的结果存入对应的变量。3个方面的信息具体为:从哪个过程来(FROM),到哪个过程去(TO)以及如何计算(FUN);为了防止在存储过程中计算顺序打乱,最好给每个计算公式一个序号(ID);
所述步骤五中,还包括一个计算模块,所述计算模块调用活动水平数据库、系数数据库和模型数据库,计算的结果至少包括流的来源(FROM)、流的去向(TO)和流量大小(FLOW)3个字段。
实施例2:
如图2和图3所示,将本发明的物质循环过程模拟数据库的构建方法应用到磷在人类社会循环过程的迁移转化活动,主要将人类活动分成了六类:磷矿开采、磷化工生产、农业种植、动物养殖、人类消费、废物产生,分别将这六个过程记为R(P rock production)、Ch(Pchemical production)、Cr(Crop production)、A(Animal production)、H(Humanconsumption)和W(Waste generation)。这六个过程之间磷的流通量的定量刻画取决于人类活动水平量以及单位活动水平下磷的流动的量(即通常说的系数),磷流的计算公式为:活动水平×系数。定义F为磷流,F(X,Y)表示从过程X到过程Y的磷的流量,针对以上六个过程,建立如下的磷流核算模型,其定量关系表达式如下:
F(R,Ch)=原矿产量×原矿元素含量×矿石产率;
F(R,W)=原矿产量×原矿元素含量-F(R,Ch);
F(Ch,Cr)=化肥产量×化肥元素含量;
F(Ch,H)=日化产量×日化元素含量;
F(Ch,W)=(F(R,Ch)-F(Ch,Cr)-F(Ch,H))/(1-化工废物回用率);
F(W,Ch)=F(Ch,W)×化工废物回用率;
F(Cr,A)=作物产量×作物元素含量×饲料占比;
F(Cr,H)=作物产量×作物元素含量×食品占比;
F(Cr,W)=F(Ch,Cr)-F(Cr,A)-F(Cr,H);
F(A,H)=动物产量×动物元素含量×肉产率;
F(A,W)=F(Cr,A)-F(A,H);
F(H,W)=F(Ch,H)+F(Cr,H)+F(A,H)。
在确认了磷流核算模型之后,按照如下步骤进行数据库构建:
步骤一数据采集:根据模型对于数据的需求进行数据采集,数据采集主要针对活动水平数据和系数两类,然后存储到计算机中;其中活动水平数据主要来源于统计资料或者长期的观测,系数则主要来源于问卷调查、文献调研、现场监测、专家咨询;
步骤二数据治理:将储存的数据进行系统的数据治理,剔除或者替换数据中的异常值,填补数据中的缺失值,并将数据进行标准化处理,数据进行标准化处理主要指同一类数据按照同样的方式处理,并且数据的量纲保持统一;
步骤三数据入库:将整理好的数据按照结构化数据库的标准范式进行整理,并且存储到数据库中;在本实例中,存储的数据主要包括活动水平数据和系数,存储的数据格式分别如表1和表2所示;这里主要包括五个字段:NAME(变量名)、NOTE(变量含义)、UNIT(变量单位)、TIME(变量作用的时间)、DATA(变量的取值);这些都是关键字段,可以根据需求补充其他字段,比如数据来源之类;
表1 活动水平数据
NAME | NOTE | UNIT | TIME | DATA |
DRP | 原矿产量 | kt | 2000 | 20 |
DFP | 化肥产量 | kt | 2000 | 15 |
DCP | 日化产量 | kt | 2000 | 5 |
DMP | 作物产量 | kt | 2000 | 1000 |
DAP | 动物产量 | kt | 2000 | 800 |
DRP | 原矿产量 | kt | 2005 | 40 |
DFP | 化肥产量 | kt | 2005 | 30 |
DCP | 日化产量 | kt | 2005 | 10 |
DMP | 作物产量 | kt | 2005 | 2000 |
DAP | 动物产量 | kt | 2005 | 1600 |
表2 系数
NAME | NOTE | UNIT | TIME | DATA |
PRP | 原矿元素含量 | 1 | 2000 | 0.5 |
PRR | 矿石产率 | 1 | 2000 | 0.8 |
PFP | 化肥元素含量 | 1 | 2000 | 0.4 |
PCP | 日化元素含量 | 1 | 2000 | 0.3 |
PCR | 化工废物回用率 | 1 | 2000 | 0.5 |
PMP | 作物元素含量 | 1 | 2000 | 0.005 |
PHR | 饲料占比 | 1 | 2000 | 0.4 |
PNR | 食品占比 | 1 | 2000 | 0.45 |
PAP | 动物元素含量 | 1 | 2000 | 0.002 |
PAR | 肉产率 | 1 | 2000 | 0.75 |
PRP | 原矿元素含量 | 1 | 2005 | 0.5 |
PRR | 矿石产率 | 1 | 2005 | 0.85 |
PFP | 化肥元素含量 | 1 | 2005 | 0.4 |
PCP | 日化元素含量 | 1 | 2005 | 0.3 |
PCR | 化工废物回用率 | 1 | 2005 | 0.6 |
PMP | 作物元素含量 | 1 | 2005 | 0.005 |
PHR | 饲料占比 | 1 | 2005 | 0.35 |
PNR | 食品占比 | 1 | 2005 | 0.5 |
PAP | 动物元素含量 | 1 | 2005 | 0.002 |
PAR | 肉产率 | 1 | 2005 | 0.8 |
步骤四模型构建:构建标准化模型数据库,模型是一系列公式按照一定顺序陈列而形成的一个列表,对于磷流核算模型而言,需要包含至少3个方面的信息,从哪个过程来(FROM),到哪个过程去(TO)和如何计算(FUN);为了便于后续计算过程引用前面计算的结果,需要把每一个FUN计算的结果存到一个变量中,变量名存在NAME列;此外,为了防止模型在存储过程中出现顺序错乱的问题,设置了一个字段用来控制顺序(ID);在本实例中,还对每条流属于哪个过程进行了标识(NOTE);通过表3给出的标准化模型,将模型的信息以结构化的数据库进行存储;
表3 标准化模型
ID | NAME | FROM | TO | FUN | NOTE |
1 | PF_01 | R | Ch | DRP*PRP*PRR | 磷矿开采 |
2 | PF_02 | R | W | DRP*PRP-PF_01 | 磷矿开采 |
3 | PF_03 | Ch | Cr | DFP*PFP | 磷化工生产 |
4 | PF_04 | Ch | H | DCP*PCP | 磷化工生产 |
5 | PF_05 | W | Ch | PF_06*PCR | 废物产生 |
6 | PF_06 | Ch | W | (PF_01-PF_03-PF_04)/(1-PCR) | 磷化工生产 |
7 | PF_07 | Cr | A | DMP*PMP*PHR | 农业种植 |
8 | PF_08 | Cr | H | DMP*PMP*PNR | 农业种植 |
9 | PF_09 | Cr | W | PF_03-PF_07-PF_08 | 农业种植 |
10 | PF_10 | A | H | DAP*PAP*PAR | 动物养殖 |
11 | PF_11 | A | W | PF_07-PF_10 | 动物养殖 |
12 | PF_12 | H | W | PF_04+PF_08+PF_10 | 人类消费 |
步骤五模型计算:调用数据库中的活动水平数据和系数以及模型数据库中的标准化模型进行磷流核算,核算结果如表4所示;表4是一个长表,主要包括TIME(模拟时间)、FROM(磷流的来源)、TO(磷流的去向)和FLOW(磷流流量大小)4个字段;这4个字段能够全面地反映出磷在各个系统之间的传递过程与量;
表4 核算结果
TIME | FROM | TO | FLOW |
2000 | R | Ch | 8 |
2000 | W | Ch | 0.5 |
2000 | Ch | Cr | 6 |
2000 | Cr | A | 2 |
2000 | Ch | H | 1.5 |
2000 | Cr | H | 2.25 |
2000 | A | H | 1.2 |
2000 | R | W | 2 |
2000 | Ch | W | 1 |
2000 | Cr | W | 1.75 |
2000 | A | W | 0.8 |
2000 | H | W | 4.95 |
2005 | R | Ch | 17 |
2005 | W | Ch | 3 |
2005 | Ch | Cr | 12 |
2005 | Cr | A | 3.5 |
2005 | Ch | H | 3 |
2005 | Cr | H | 5 |
2005 | A | H | 2.56 |
2005 | R | W | 3 |
2005 | Ch | W | 5 |
2005 | Cr | W | 3.5 |
2005 | A | W | 0.94 |
2005 | H | W | 10.56 |
步骤六数据可视化:根据基础数据库、模型数据库和结果数据库中存储的标准化数据,采用可视化的方法对结果进行分析,用以支撑科学研究和指导现实决策;图3给出了由本实例计算出的一个桑基图,从图中可以看出磷是从哪里来,最后到哪里去了,每一种去向中不同的源的贡献量,以及不同年份磷流总量及各个系统的变换等,从而对能够高效地管理磷循环过程模拟、分析和评估等科研工作。
最后,本实施例的模型是一个简化版的模型,其中每一个过程都可以细化,每条磷流的计算方法也可以精细化。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (8)
1.一种物质循环过程模拟数据库的构建方法,其特征在于,包括以下步骤:
步骤一数据采集:采集物质循环过程模拟模型所需要的活动水平数据和系数并将数据存储到计算机中;
步骤二数据治理:将储存的数据进行系统的数据治理,剔除或者替换数据中的异常值,填补数据中的缺失值,并将数据进行标准化处理;
步骤三数据入库:根据结构化数据库构建的标准范式,分别对上述活动水平数据和系数进行整理,存储到结构化数据库中并构建相应的活动水平数据库和系数数据库;
步骤四模型构建:建立标准化的模型数据库,将模型的表达式按照计算顺序进行整理得到模型图库和模型表达式库,模型计算公式可以引用活动水平数据库和系数数据库中的变量及前序的表达式计算的结果;
步骤五模型计算:调用活动水平数据库和系数数据库中的相关变量以及模型数据库中的标准化模型,进行核算,将核算的结果存入结果数据库;
步骤六数据可视化:根据活动水平数据库、系数数据库、模型数据库和结果数据库中存储的标准化数据,采用可视化的方法进行分析,用以支撑科学研究和指导现实决策。
2.根据权利要求1所述的物质循环过程模拟数据库的构建方法,其特征在于,所述步骤一中数据存储采用人工输入、文字识别和自动采集方式中的一种或两种以上。
3.根据权利要求1所述的物质循环过程模拟数据库的构建方法,其特征在于,所述活动水平数据和系数通过统计年鉴、长期观测、遥感解译、问卷调查、文献调研、现场监测、专家咨询的方式获取。
4.根据权利要求1所述的物质循环过程模拟数据库的构建方法,其特征在于,所述异常值通过统计检验或者统计作图进行识别;所述缺失值通过数据的多重插补进行填补;所述数据进行标准化处理指同一类数据按照同样的方式处理,并且数据的量纲保持统一。
5.根据权利要求1所述的物质循环过程模拟数据库的构建方法,其特征在于,所述步骤三中,活动水平数据和系数至少需要指明变量名(NAME)、变量含义(NOTE)、变量单位(UNIT)和变量的取值(DATA),推荐记录数据的来源(SOURCE);当存在不同时间段的数据需要包括记录变量作用的时间(TIME),当存在不同空间上的数据还需要包括记录变量作用的位置(SITE)。
6.根据权利要求1所述的物质循环过程模拟数据库的构建方法,其特征在于,所述模型数据库至少包括3个方面的信息:来源(FROM)、去向(TO)和算法(FUN);当需要引用前面表达式计算结果,还包括一个变量名字段(NAME),并将计算的结果存入对应的变量。
7.根据权利要求1所述的物质循环过程模拟数据库的构建方法,其特征在于,所述步骤五中,还包括一个计算模块,所述计算模块调用活动水平数据库、系数数据库和模型数据库,计算的结果至少包括流的来源(FROM)、流的去向(TO)和流量大小(FLOW)3个字段。
8.根据权利要求1所述的物质循环过程模拟数据库的构建方法,其特征在于,所述可视化的方法包括桑基图、GIS图和统计图表中的一种或多种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010066608.XA CN111221806B (zh) | 2020-01-20 | 2020-01-20 | 一种物质循环过程模拟数据库的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010066608.XA CN111221806B (zh) | 2020-01-20 | 2020-01-20 | 一种物质循环过程模拟数据库的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111221806A true CN111221806A (zh) | 2020-06-02 |
CN111221806B CN111221806B (zh) | 2024-04-16 |
Family
ID=70811591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010066608.XA Active CN111221806B (zh) | 2020-01-20 | 2020-01-20 | 一种物质循环过程模拟数据库的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111221806B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114090714A (zh) * | 2021-11-22 | 2022-02-25 | 中国矿业大学(北京) | 基于地理格网模型矿区生态演变大数据多尺度查询方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1281605A (zh) * | 1997-12-11 | 2001-01-24 | 摩托罗拉公司 | 在无线通信系统中预测信号特性的方法和设备 |
JP2005196752A (ja) * | 2003-12-10 | 2005-07-21 | Hiroshi Sato | 社会、経済、市場における現象の可視化手段、モデル化手段、シミュレーション手段、及び分析手段。並びに社会を自律的に理解する機械或いは計算機の実現手段 |
CN101976380A (zh) * | 2010-09-14 | 2011-02-16 | 华北电力大学 | 一种水环境实时调控与数字化管理方法 |
WO2018214190A1 (zh) * | 2017-06-19 | 2018-11-29 | 中国科学院南京地理与湖泊研究所 | 一种面向湖泊蓝藻灾害的立体监控及数据挖掘系统和方法 |
CN109241669A (zh) * | 2018-10-08 | 2019-01-18 | 成都四方伟业软件股份有限公司 | 一种自动建模方法、装置及其存储介质 |
CN110597932A (zh) * | 2019-07-05 | 2019-12-20 | 袁静 | 一种基于遥感影像的环境综合评估预测方法 |
-
2020
- 2020-01-20 CN CN202010066608.XA patent/CN111221806B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1281605A (zh) * | 1997-12-11 | 2001-01-24 | 摩托罗拉公司 | 在无线通信系统中预测信号特性的方法和设备 |
JP2005196752A (ja) * | 2003-12-10 | 2005-07-21 | Hiroshi Sato | 社会、経済、市場における現象の可視化手段、モデル化手段、シミュレーション手段、及び分析手段。並びに社会を自律的に理解する機械或いは計算機の実現手段 |
CN101976380A (zh) * | 2010-09-14 | 2011-02-16 | 华北电力大学 | 一种水环境实时调控与数字化管理方法 |
WO2018214190A1 (zh) * | 2017-06-19 | 2018-11-29 | 中国科学院南京地理与湖泊研究所 | 一种面向湖泊蓝藻灾害的立体监控及数据挖掘系统和方法 |
CN109241669A (zh) * | 2018-10-08 | 2019-01-18 | 成都四方伟业软件股份有限公司 | 一种自动建模方法、装置及其存储介质 |
CN110597932A (zh) * | 2019-07-05 | 2019-12-20 | 袁静 | 一种基于遥感影像的环境综合评估预测方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114090714A (zh) * | 2021-11-22 | 2022-02-25 | 中国矿业大学(北京) | 基于地理格网模型矿区生态演变大数据多尺度查询方法 |
CN114090714B (zh) * | 2021-11-22 | 2022-04-29 | 中国矿业大学(北京) | 基于地理格网模型矿区生态演变大数据多尺度查询方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111221806B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nedd et al. | A synthesis of land use/land cover studies: Definitions, classification systems, meta-studies, challenges and knowledge gaps on a global landscape | |
Brandt et al. | Soil heterogeneity generated by plant–soil feedbacks has implications for species recruitment and coexistence | |
Perryman et al. | The electronic Rothamsted Archive (e-RA), an online resource for data from the Rothamsted long-term experiments | |
Kashkoush et al. | Product family formation by matching Bill-of-Materials trees | |
Gil et al. | Mind your metadata: Exploiting semantics for configuration, adaptation, and provenance in scientific workflows | |
CN117171223B (zh) | 一种微生物修复过程中的微生物培养方案推荐方法及系统 | |
Ho et al. | Machine learning applications in river research: Trends, opportunities and challenges | |
Zhang et al. | Identifying key pathways in manure and sewage management of dairy farming based on a quantitative typology: A case study in China | |
CN111221806B (zh) | 一种物质循环过程模拟数据库的构建方法 | |
Hosseinzadeh-Bandbafha et al. | Life-Cycle Assessment (LCA) analysis of algal fuels | |
Sajid et al. | The nexus between environmental impact and agricultural sector linkages: a case study of Pakistan | |
CN103514294B (zh) | 数据监测方法及系统 | |
Ding et al. | Coupling agent-based modeling with territorial LCA to support agricultural land-use planning | |
Chamanara et al. | A conceptual model for data management in the field of ecology | |
Kimble et al. | medna-metadata: an open-source data management system for tracking environmental DNA samples and metadata | |
CN116842092A (zh) | 数据建库及归集管理的方法及系统 | |
Taylor et al. | Code modernization and modularization of APEX and SWAT watershed simulation models | |
Koós et al. | Influence of the Shortening of the Winter Fertilization Prohibition Period in Hungary Assessed by Spatial Crop Simulation Analysis | |
US20230121145A1 (en) | Method of introducing ecosystem and method of managing value information about land | |
Rodino et al. | Developing an Evaluation Framework for Circular Agriculture: A Pathway to Sustainable Farming | |
Hashimoto et al. | Divergent data-driven estimates of global soil respiration | |
Karabulut et al. | Sainfoin (Onobrychis spp.) crop ontology: supporting germplasm characterization and international research collaborations | |
Bhar et al. | Agriculture Model Comparison Framework and MyGeoHub Hosting: Case of Soil Nitrogen | |
Filter et al. | A community resource for integrated predictive microbial modelling (PMM-Lab) | |
Bach et al. | ARAapp: filling gaps in the ecological knowledge of spiders using an automated and dynamic approach to analyze systematically collected community data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |