CN115544123A - 一种农业信息资源数据识别分析挖掘方法 - Google Patents

一种农业信息资源数据识别分析挖掘方法 Download PDF

Info

Publication number
CN115544123A
CN115544123A CN202211357586.8A CN202211357586A CN115544123A CN 115544123 A CN115544123 A CN 115544123A CN 202211357586 A CN202211357586 A CN 202211357586A CN 115544123 A CN115544123 A CN 115544123A
Authority
CN
China
Prior art keywords
information
agricultural
information resource
departments
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211357586.8A
Other languages
English (en)
Inventor
任万明
石秋发
王统敏
侯学会
丁超
李慧娟
蔡柯鸣
李川
王莹
王春伟
孟庆峰
赵振宇
曹建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Ecloud Information Technology Co ltd
Original Assignee
Shandong Ecloud Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Ecloud Information Technology Co ltd filed Critical Shandong Ecloud Information Technology Co ltd
Priority to CN202211357586.8A priority Critical patent/CN115544123A/zh
Publication of CN115544123A publication Critical patent/CN115544123A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种农业信息资源数据识别分析挖掘方法,涉及农业信息资源技术领域,其技术方案要点包括如下步骤:步骤一:准备阶段:对农业信息资源数据进行收集整理。步骤二:信息资源调查:对农业信息序号、信息资源名称、信息资源说明、提供科室、共享范围、管理方式、关联系统、更新频率、主题分类、部门分类、服务分类。通过在农业信息资源数据进行收集时,通过对建立信息资源进行调查,确定信息数据是否全面,并通过信息资源调查表和信息项调查表,对资源数据进行记录,之后便于进行分析挖掘,并且对记录的数据进行共享,建立共享采集系统,增大农业信息数据资源,使获得的数据更加全面,提高数据分析过程中的准确性。

Description

一种农业信息资源数据识别分析挖掘方法
技术领域
本发明涉及农业信息资源技术领域,更具体地说,它涉及一种农业信息资源数据识别分析挖掘方法。
背景技术
农业信息资源目录编制对信息资源共享和提升农业厅电子政务水平具有十分重要的意义。信息资源目录是通过信息资源描述项记录信息资源结构和信息资源属性的数据体系。目录编制的过程是梳理业务,明确职责,整理和挖掘数据资源、规范数据表示,摸清信息资源的过程。
在进行农业信息资源的数据收集中,由于收集的途径较为单一,导致数据不够全面性,影响在数据分析过程中的准确性。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种农业信息资源数据识别分析挖掘方法。
为实现上述目的,本发明提供了如下技术方案:
一种农业信息资源数据识别分析挖掘方法,包括如下步骤:步骤一:准备阶段:对农业信息资源数据进行收集整理。步骤二:信息资源调查:对农业信息序号、信息资源名称、信息资源说明、提供科室、共享范围、管理方式、关联系统、更新频率、主题分类、部门分类、服务分类、资源形态分类、密级、需其他单位提供的信息资源、备注进行整理调查。步骤三:信息资源调查表和信息项调查表的获得阶段:通过农业厅各行政处室及直属事业单位,对信息序号、信息资源名称、信息资源说明、提供科室、共享范围、管理方式、关联系统、更新频率、主题分类、部门分类、服务分类、资源形态分类、密级、需其他单位提供的信息资源、备注进行调查,且制成信息资源调查表;同时对信息序号、所属的信息资源名称、信息项名称、信息项定义、数据类型、数据格式、值域、备注进行调查,且制成信息项调查表。步骤四:信息资源目录生成:将步骤三中的调查表信息进行汇总,并分为业务信息目录的生成、处室政务信息资源目录的生成、数据元目录的生成、代码集的生成。步骤五:农业信息资源目录、农业信息资源共享目录和农业信息资源主题目录的获得阶段:将步骤四中建立各业务处室信息资源目录基础上,建立农业厅信息资源目录、信息资源共享目录和农业信息资源主题目录,并纳入到农业厅政务信息资源目录管理。步骤六:数据共享交换采集系统建设:将步骤五中政务信息资源目录进行共享,并建立数据采集管理系统。
优选地,所述步骤三中农业厅各行政处室包括人事处、政策法规处、农村经济经营管理处、市场与经济信息处、农产品质量安全监管处、发展规划处、对外合作处、科技处、种植业管理处、产业化办公室、生态农业处等。涉及的主要直属事业单位包括:农业技术推广总站、果茶技术推广总站、土壤肥料总站,植物保护总站、农业环境保护和农村能源总站、农村经济经营管理总站、种子管理总站、农药检定所、绿色食品发展中心等。
优选地,所述步骤三中信息资源调查表的方法包括如下步骤:
(1)部门业务梳理
从农业厅各部门的业务应用出发,梳理业务办理的方式、依据等,编制部门业务信息目录。通过梳理相关的业务环节,分析业务相关信息,编制面向业务的部门信息资源目录。这种方法适合于梳理不需要部门间协同,部门内独立处理的业务。
(2)跨部门业务梳理
以某项主题应用为中心,从跨部门的全农业厅角度来思考问题,对整个业务流程进行梳理,整理可能分布在多个部门的信息资源。这种方法适合于梳理需要多个部门协同处理的业务。
(3)检查梳理工作
先收集所有的单据、表格和报表等原始信息资源,根据这些信息资源再倒推它们各自所属的业务事项,再对业务事项进行整理,最后根据业务事项梳理信息资源。这种方式适合于作为一种检查方法,用来检查梳理工作是否有遗漏,和其它方法配合使用。
(4)自上而下/自下而上
自上而下指先从整体进行调查和整理,在理清上层业务的基础上,再逐渐细化、分解和深入,这种方法适合于层次性较强、功能划分比较明确的业务。自下而上指先从具体的、细小的业务事项出发,调查和整理清楚后,再向上归纳,理清更上层次的业务,这种方法适合于业务相对分散、层次性不强、功能划分不太清晰的业务。在具体工作中,可以综合使用这两种方法,先自上而下了解整个农业厅,再自下而上调查和整理业务事项。
优选地,所述步骤六中数据采集管理系统包括信息来源方业务系统的类型、信息来源方数据库的类型、信息的数据格式。
与现有技术相比,本发明具备以下有益效果:
通过在农业信息资源数据进行收集时,通过对建立信息资源进行调查,确定信息数据是否全面,并通过信息资源调查表和信息项调查表,对资源数据进行记录,之后便于进行分析挖掘,并且对记录的数据进行共享,建立共享采集系统,增大农业信息数据资源,使获得的数据更加全面,提高数据分析过程中的准确性。
附图说明
图1为本发明一种农业信息资源数据识别分析挖掘方法的流程示意图;
图2为本发明一种农业信息资源数据识别分析挖掘方法中数据采集方式表;
图3为本发明一种农业信息资源数据识别分析挖掘方法中数据共享管理系统架构图。
具体实施方式
参照图1至图3对本发明一种农业信息资源数据识别分析挖掘方法实施例做进一步说明。
一种农业信息资源数据识别分析挖掘方法,包括如下步骤:步骤一:准备阶段:对农业信息资源数据进行收集整理。步骤二:信息资源调查:对农业信息序号、信息资源名称、信息资源说明、提供科室、共享范围、管理方式、关联系统、更新频率、主题分类、部门分类、服务分类、资源形态分类、密级、需其他单位提供的信息资源、备注进行整理调查。步骤三:信息资源调查表和信息项调查表的获得阶段:通过农业厅各行政处室及直属事业单位,对信息序号、信息资源名称、信息资源说明、提供科室、共享范围、管理方式、关联系统、更新频率、主题分类、部门分类、服务分类、资源形态分类、密级、需其他单位提供的信息资源、备注进行调查,且制成信息资源调查表。同时对信息序号、所属的信息资源名称、信息项名称、信息项定义、数据类型、数据格式、值域、备注进行调查,且制成信息项调查表。步骤四:信息资源目录生成:将步骤三中的调查表信息进行汇总,并分为业务信息目录的生成、处室政务信息资源目录的生成、数据元目录的生成、代码集的生成。步骤五:农业信息资源目录、农业信息资源共享目录和农业信息资源主题目录的获得阶段:将步骤四中建立各业务处室信息资源目录基础上,建立农业厅信息资源目录、信息资源共享目录和农业信息资源主题目录,并纳入到农业厅政务信息资源目录管理。步骤六:数据共享交换采集系统建设:将步骤五中政务信息资源目录进行共享,并建立数据采集管理系统。
所述步骤三中农业厅各行政处室包括人事处、政策法规处、农村经济经营管理处、市场与经济信息处、农产品质量安全监管处、发展规划处、对外合作处、科技处、种植业管理处、产业化办公室、生态农业处等。涉及的主要直属事业单位包括:农业技术推广总站、果茶技术推广总站、土壤肥料总站,植物保护总站、农业环境保护和农村能源总站、农村经济经营管理总站、种子管理总站、农药检定所、绿色食品发展中心等。
所述步骤三中信息资源调查表的方法包括如下步骤:
(1)部门业务梳理
从农业厅各部门的业务应用出发,梳理业务办理的方式、依据等,编制部门业务信息目录。通过梳理相关的业务环节,分析业务相关信息,编制面向业务的部门信息资源目录。这种方法适合于梳理不需要部门间协同,部门内独立处理的业务。
(2)跨部门业务梳理
以某项主题应用为中心,从跨部门的全农业厅角度来思考问题,对整个业务流程进行梳理,整理可能分布在多个部门的信息资源。这种方法适合于梳理需要多个部门协同处理的业务。
(3)检查梳理工作
先收集所有的单据、表格和报表等原始信息资源,根据这些信息资源再倒推它们各自所属的业务事项,再对业务事项进行整理,最后根据业务事项梳理信息资源。这种方式适合于作为一种检查方法,用来检查梳理工作是否有遗漏,和其它方法配合使用。
(4)自上而下/自下而上
自上而下指先从整体进行调查和整理,在理清上层业务的基础上,再逐渐细化、分解和深入,这种方法适合于层次性较强、功能划分比较明确的业务。自下而上指先从具体的、细小的业务事项出发,调查和整理清楚后,再向上归纳,理清更上层次的业务,这种方法适合于业务相对分散、层次性不强、功能划分不太清晰的业务。在具体工作中,可以综合使用这两种方法,先自上而下了解整个农业厅,再自下而上调查和整理业务事项。
所述步骤六中数据采集管理系统包括信息来源方业务系统的类型、信息来源方数据库的类型、信息的数据格式。
1.采用接口采集
对于不允许直连数据库的业务系统或者不允许改变原有应用系统的,可采用针对业务系统功能开发采集接口,直接从业务系统功能采集数据。如农机安全、农产品质量安全监管、农机购置补贴、畜牧兽医综合监管、推广目录申报、农机科技、农机化新技术新机具推广、农技推广、农机化统计等应用系统,这部分系统建设在省农机局和省畜牧兽医局,无法直连数据库,可采集接口采集方式采集需要的数据。
2.开放数据库接口的信息系统
对于直接开放数据库接口的信息系统,系统根据该系统提供的信息标准接口规范,直接从数据库中抽取所需要的数据。如农牧渔业丰收奖、12316短彩信、舆情分析、全省农民创业培训视频、物联网、农村土地承包经营、农村经济、农村集体“三资”、现代化智慧农业、农民负担监管、农业地理信息、农业产业体系等系统,都为省农业厅自建系统,可采用ETL方式直接抽取数据库中数据。
3.提供数据文件的数据源单位
对于提供txt(非格式化)、excel等不按照信息标准接口规范生成数据的,系统将所提供的数据文件进行数据的质量检查、整理和格式标准化,并按照统一标准进行数据载入。
4.需要人工录入的数据源单位
对于没有数据库且不能格式化生成数据文件的部门,系统为部门提供人工录入界面,由部门进行数据的手工录入或批量导入。当所有数据都以标准格式加载入数据源数据库,则能一定程度上保证数据库质量并为开发统一、标准的数据清洗、比对功能打下基础。
系统提供的采集方式主要有以下几种:
1.接口交换方式
业务系统提供数据接口,资源共享平台将数据接口配置到平台中,其他需求部门可以通过平台直接获取到本部门的数据,可以进行数据的批量下载、比对、查询等功能。农机安全、农产品质量安全监管、农机购置补贴、畜牧兽医综合监管、推广目录申报、农机科技、农机化新技术新机具推广、农技推广、农机化统计等系统采用该方式。
2.数据库交换方式
系统使用ETL自动抽取方式进行数据库交换,安装ETL数据抽取工具接入部门业务数据库,按照数据格式需求、时间要求,对部门数据进行抽取,并对数据进行清洗,存入到农业厅信息资源数据库,提供给其他部门。农牧渔业丰收奖、12316短彩信、舆情分析、全省农民创业培训视频、物联网、农村土地承包经营、农村经济、农村集体“三资”、现代化智慧农业、农民负担监管、农业地理信息、农业产业体系等系统可采用此方式。
3.文件导入方式
在服务器中部署数据上传工具,部门工作人员将按照上传格式进行数据上传,数据存入数据库,提供数据交换。导入文件格式支持xlsx、xls、xml、csv、mdb等带格式的文本文件,以及WPS、WORD等多种主流格式。
4.人工录入方式
部门如果没有信息化系统和格式化数据文件,可以在数据录入系统,将数据填写后提交到数据库进行数据的交换共享。
本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种农业信息资源数据识别分析挖掘方法,其特征在于,包括如下步骤:
步骤一:准备阶段:对农业信息资源数据进行收集整理;
步骤二:信息资源调查:对农业信息序号、信息资源名称、信息资源说明、提供科室、共享范围、管理方式、关联系统、更新频率、主题分类、部门分类、服务分类、资源形态分类、密级、需其他单位提供的信息资源、备注进行整理调查;
步骤三:信息资源调查表和信息项调查表的获得阶段:通过农业厅各行政处室及直属事业单位,对信息序号、信息资源名称、信息资源说明、提供科室、共享范围、管理方式、关联系统、更新频率、主题分类、部门分类、服务分类、资源形态分类、密级、需其他单位提供的信息资源、备注进行调查,且制成信息资源调查表;
同时对信息序号、所属的信息资源名称、信息项名称、信息项定义、数据类型、数据格式、值域、备注进行调查,且制成信息项调查表;
步骤四:信息资源目录生成:将步骤三中的调查表信息进行汇总,并分为业务信息目录的生成、处室政务信息资源目录的生成、数据元目录的生成、代码集的生成;
步骤五:农业信息资源目录、农业信息资源共享目录和农业信息资源主题目录的获得阶段:将步骤四中建立各业务处室信息资源目录基础上,建立农业厅信息资源目录、信息资源共享目录和农业信息资源主题目录,并纳入到农业厅政务信息资源目录管理;
步骤六:数据共享交换采集系统建设:将步骤五中政务信息资源目录进行共享,并建立数据采集管理系统。
2.根据权利要求1所述的一种农业信息资源数据识别分析挖掘方法,其特征在于,所述步骤三中农业厅各行政处室包括人事处、政策法规处、农村经济经营管理处、市场与经济信息处、农产品质量安全监管处、发展规划处、对外合作处、科技处、种植业管理处、产业化办公室、生态农业处等,涉及的主要直属事业单位包括:农业技术推广总站、果茶技术推广总站、土壤肥料总站,植物保护总站、农业环境保护和农村能源总站、农村经济经营管理总站、种子管理总站、农药检定所、绿色食品发展中心等。
3.根据权利要求1所述的一种农业信息资源数据识别分析挖掘方法,其特征在于,所述步骤三中信息资源调查表的方法包括如下步骤:
(1)部门业务梳理
从农业厅各部门的业务应用出发,梳理业务办理的方式、依据等,编制部门业务信息目录,通过梳理相关的业务环节,分析业务相关信息,编制面向业务的部门信息资源目录,这种方法适合于梳理不需要部门间协同,部门内独立处理的业务;
(2)跨部门业务梳理
以某项主题应用为中心,从跨部门的全农业厅角度来思考问题,对整个业务流程进行梳理,整理可能分布在多个部门的信息资源,这种方法适合于梳理需要多个部门协同处理的业务;
(3)检查梳理工作
先收集所有的单据、表格和报表等原始信息资源,根据这些信息资源再倒推它们各自所属的业务事项,再对业务事项进行整理,最后根据业务事项梳理信息资源,这种方式适合于作为一种检查方法,用来检查梳理工作是否有遗漏,和其它方法配合使用;
(4)自上而下/自下而上
自上而下指先从整体进行调查和整理,在理清上层业务的基础上,再逐渐细化、分解和深入,这种方法适合于层次性较强、功能划分比较明确的业务,自下而上指先从具体的、细小的业务事项出发,调查和整理清楚后,再向上归纳,理清更上层次的业务,这种方法适合于业务相对分散、层次性不强、功能划分不太清晰的业务,在具体工作中,可以综合使用这两种方法,先自上而下了解整个农业厅,再自下而上调查和整理业务事项。
4.根据权利要求1所述的一种农业信息资源数据识别分析挖掘方法,其特征在于,所述步骤六中数据采集管理系统包括信息来源方业务系统的类型、信息来源方数据库的类型、信息的数据格式。
CN202211357586.8A 2022-11-01 2022-11-01 一种农业信息资源数据识别分析挖掘方法 Pending CN115544123A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211357586.8A CN115544123A (zh) 2022-11-01 2022-11-01 一种农业信息资源数据识别分析挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211357586.8A CN115544123A (zh) 2022-11-01 2022-11-01 一种农业信息资源数据识别分析挖掘方法

Publications (1)

Publication Number Publication Date
CN115544123A true CN115544123A (zh) 2022-12-30

Family

ID=84720464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211357586.8A Pending CN115544123A (zh) 2022-11-01 2022-11-01 一种农业信息资源数据识别分析挖掘方法

Country Status (1)

Country Link
CN (1) CN115544123A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106855962A (zh) * 2015-12-09 2017-06-16 星际空间(天津)科技发展有限公司 一种构建政务大数据平台的方法
CN110781236A (zh) * 2019-10-29 2020-02-11 山西云时代技术有限公司 一种构建政务大数据治理体系的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106855962A (zh) * 2015-12-09 2017-06-16 星际空间(天津)科技发展有限公司 一种构建政务大数据平台的方法
CN110781236A (zh) * 2019-10-29 2020-02-11 山西云时代技术有限公司 一种构建政务大数据治理体系的方法

Similar Documents

Publication Publication Date Title
Hori et al. Application of cloud computing to agriculture and prospects in other fields
US7512627B2 (en) Business intelligence data repository and data management system and method
Verdecchia et al. Architectural technical debt identification: The research landscape
CN107256247A (zh) 大数据数据治理方法和装置
CN103631922A (zh) 基于Hadoop集群的大规模Web信息提取方法及系统
CN101739454B (zh) 数据处理系统
CN111626694A (zh) 一种知识产权大数据信息服务平台
CN107945092A (zh) 用于审计领域的大数据综合管理方法及系统
CN112328577A (zh) 一种基于县域的农业大数据管理系统及方法
De Meyer et al. A reference data model to support biomass supply chain modelling and optimisation
Ereshko et al. Digital platforms clustering model
CN109101534A (zh) 一种基于文本规则的自动文档分发方法和装置
Agbona et al. Data management in multi-disciplinary African RTB crop breeding programs
Küzmič et al. European Weed Vegetation Database-a gap-focused vegetation-plot database.
CN113506098A (zh) 基于多源数据的电厂元数据管理系统及方法
Batini et al. Analysis of an inventory of information systems in the public administration
CN115544123A (zh) 一种农业信息资源数据识别分析挖掘方法
CN109063134A (zh) 一种微信公众号大数据分析的方法及系统
CN108763273A (zh) 一种高寒草地数据处理方法及管理系统
CN113485987A (zh) 企业信息标签生成方法及装置
Fjeldså How broad‐scale studies of patterns and processes can serve to guide conservation planning in Africa
Fitzgerald et al. DiSSCo Prepare Deliverable D1. 1-Report on life sciences use cases and user stories
Yang et al. A variety test platform for the standardization and data quality improvement of crop variety tests
CN111382149A (zh) 财务数据分析系统及方法
Kallas et al. A documentation model for comparative research based on harmonization strategies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20221230