CN115115126A - 基于知识图谱的农作物灾害损失及产量预测系统及方法 - Google Patents

基于知识图谱的农作物灾害损失及产量预测系统及方法 Download PDF

Info

Publication number
CN115115126A
CN115115126A CN202210824372.0A CN202210824372A CN115115126A CN 115115126 A CN115115126 A CN 115115126A CN 202210824372 A CN202210824372 A CN 202210824372A CN 115115126 A CN115115126 A CN 115115126A
Authority
CN
China
Prior art keywords
disaster
data
yield
crop
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210824372.0A
Other languages
English (en)
Inventor
李银胜
柴洪峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN202210824372.0A priority Critical patent/CN115115126A/zh
Publication of CN115115126A publication Critical patent/CN115115126A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mining & Mineral Resources (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Animal Husbandry (AREA)
  • Software Systems (AREA)
  • Agronomy & Crop Science (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于知识图谱的农作物灾害损失及产量预测系统及方法,该系统包括数据采集模块、知识表达模块、关联分析模块、致灾因素分析模块、灾害损失及产量预测模块、人机交互模块。用户通过人机交互模块输入各组成模块的运行参数后,数据采集模块从多个数据源采集数据并进行集成;知识表达模块基于采集、集成的数据构建并存储农作物产量的全要素知识图谱;关联分析模块基于该知识图谱构建农作物产量及灾害影响的多度关系动态网络;致灾因素分析模块基于该关系网络自动识别出致灾因素,灾害损失及产量预测模块基于该关系网络和识别出的致灾因素预测农作物灾害损失及实际产量;最后人机交互模块输出预测结果。

Description

基于知识图谱的农作物灾害损失及产量预测系统及方法
技术领域
本发明属于农作物产量预测技术领域,具体涉及一种基于知识图谱的农作物灾害损失及产量预测系统及方法。
背景技术
通过检索百度学术、IEEE Explorer以及公开技术资料,农作物灾害预测与产量预测的研究及应用现状归纳如下:(1)在天气指数保险领域,产量预测所涵盖的农作物和地区,以水稻、玉米等农作物为主,在中国涉及地区有黑龙江、安徽、广东、湖南、江苏等省份;(2)面向气象灾害损失的产量预测方法,通常分为经验定价法,分布拟合法,以及动态建模法。经验定价法相对简单,其缺点在于仅仅使用历史数据,无法考虑所有的极端天气情况,也没有考虑气候条件随时间的趋势性变动。由于近年来全球气候变暖的大背景,以及各地高温、暴雨、洪水、热浪等极端天气增多,历史的经验数据已经无法很好的代表未来的天气情况,所以需要使用动态建模法,通过对原始气温数据进行动态建模预测未来的天气变化,并以此为依据用于产品定价。(3)产量预测技术最新进展包括,引入机器学习进行产量预测,遥感和物联网数据的应用,对一些天气指标进行优化,或者考虑全球气候变化因素,除了需要考虑过去的天气历史数据之外,还考虑到天气变化的整体趋势,还有一些天气指数保险精算,引入了反映农民抵抗气象灾害能力的“风险预防因子”,建立了水稻相对气象损失率与相关因子的回归模型,以实现更好的拟合效果;还有利用历史气象资料和水稻生育期资料,对水稻高温热害的发生规律分区域、分等级、分生育期地进行精细化、定量化分析和评估。(4)针对自然灾害的产量预测模型,在机器学习方面进展较大,有一篇基于神经网络的产量预测文献“A GNN-RNN Approach for Harnessing Geospatial and TemporalInformation:Application to Crop Yield Prediction,发表于AAAI 2022学术会议,提出一种基于GNN-RNN的模型对粮食产量进行预测,将气候特征细化,分为随时间变化的特征和固定的特征,利用更长时间和更大空间的数据集。
综合所检索的文献可以判断,现有农作物灾害损失与产量预测的技术,采用确定的、有限的农作物生产及自然灾害参数、在历史数据基础上进行拟合计算。然而,由于农作物生产影响因素众多,气候动态变化,自然灾害及农作物数据的质量无法保证,致灾因素甄别方面存在不确定、不精确或不真实情况,因此在原理上难以保障灾害损失及产量预测的准确性;在技术上也不支持面向不同区域、不同作物构造参数可定制的产量预测模型,不支持数据驱动的智能化产量预测;在应用上无法满足面向不同区域、不同作物、不同用户,成规模、高效率开发天气指数保险产品及数字农业应用,不支持天气指数保险网络化营销所需的柔性定制。针对上述问题,本发明提出一种采用农业生产实际数据、通过知识图谱识别致灾因素,从而能够实现精准预测的预测系统及方法。
特别的,上述的AAAI 2022学术会议论文,虽然采用了主流深度学习的产量预测模型,但是其解决的问题是现有产量预测方法中面向区域较小,时间短,假设多、计算复杂,没有考虑不同地区的气候和土壤条件差异的问题。具体地,其应用场景和目标,并不针对自然灾害情况下的产量预测,面向的是大面积统计预测而非分地区分品类的农作物产量预测,仍然采用确定的地理参数而非区域特征参数,只采用气候参数而没有从致灾因素出发,参数是确定的而非如本发明一样通过知识图谱识别致灾因素,采用的是开放实验数据集,而非本发明采用的农业生产实际数据。
发明内容
本发明是为解决上述问题而进行的,目的在于为天气指数保险以及数字农业应用提供一种预测精准、要素综合、参数可定制的农作物灾害损失及产量预测系统及方法。
发明人认为,知识图谱是解决上述问题的关键技术,配合深度学习进行关联分析,可以形成新一代产量预测模型。然而,虽然机器学习和指标优化已经有相关应用,但是尚未在文献中发现知识图谱及关联分析在农作物产量预测中的应用。知识图谱是被广泛接受的数据表达技术,具有结构化、语义化以及可扩充等特征,是大数据处理和关联分析的基础,支持模型驱动的数据自动处理,可持续引进新的影响因素,且在计算结果和影响因素之间存在良好的可解释性。因此,通过知识图谱来表达农业生产要素及其关系,可以将农业产量影响因素进行结构化语义表达,确定影响农业产量的因素及其贡献度,增加预测的准确性和合理性,涵盖的影响因素和关系线索越多,挖掘性能就越强,对致灾因素的识别、费率的基差就越小。因此,构造全要素、多维关系的知识图谱来解决上述问题。
基于上述分析,本发明提出了一种农作物灾害损失及产量预测系统及方法,与现有技术中的产量预测方法相比,本发明的应用场景是农业天气指数保险,以及涉及产量预测的数字农业应用;基本原理是通过农作物产量全要素知识图谱,纳入所有必要的影响因素,实现农作物生产涉及的自然灾害影响因素综合性和结构化,在此基础上通过深度学习及关联分析准确识别真实的致灾因素,进而构造产量预测模型及算法模型。
具体地,本发明采用了如下技术方案:
本发明提供了一种基于知识图谱的农作物灾害损失及产量预测系统,其特征在于,包括:数据采集模块,从多个数据源采集多种数据并进行集成,得到集成的农作物数据;知识表达模块,基于所述集成的农作物数据构建及存储农作物产量的全要素知识图谱;关联分析模块,基于所述农作物产量全要素知识图谱构建农作物产量及灾害影响的多度关系动态网络;致灾因素分析模块,基于所述多度关系动态网络,通过深度学习识别出致灾因素;灾害损失及产量预测模块,基于所述多度关系动态网络以及所述致灾因素进行农作物灾害损失及产量预测,得到预测结果;以及人机交互模块,为用户提供用户界面,该用户界面至少用于输入参数以及输出所述预测结果。
本发明提供的基于知识图谱的农作物灾害损失及产量预测系统,还可以具有这样的技术特征,其中,所述全要素知识图谱按以下方式构建:定义影响农作物生产的自然灾害因素,定义影响农作物生产的种养殖环境因素,定义农作物生产流通因素,定义农户金融信贷因素,定义农户抗灾因素,基于特征学习和扎根理论识别和定义各因素涉及的概念和关系,通过知识图谱开发环境构建所述全要素知识图谱。
本发明提供的基于知识图谱的农作物灾害损失及产量预测系统,还可以具有这样的技术特征,其中,所述多度关系动态网络按以下方式构建:定义典型致灾模式,分析灾害损失案例,在所述全要素知识图谱的基础上基于特征学习对面向指定致灾模式的关系进行聚类,识别并验证涉及的多度关系,构建基于所述多度关系的所述多度关系动态网络。
本发明提供的基于知识图谱的农作物灾害损失及产量预测系统,还可以具有这样的技术特征,其中,所述灾害损失及产量预测模块包括:神经网络预测子模块,将所述多度关系动态网络输入图神经网络模型,对农作物灾害损失及产量进行预测,得到第一预测结果;模数结合预测子模块,基于所述致灾因素,采用模数结合方法对农作物灾害损失及产量进行预测,得到第二预测结果;以及综合预测子模块,对所述第一预测结果和所述第二预测结果进行综合评价及结果修正,得到综合预测结果。
本发明提供的基于知识图谱的农作物灾害损失及产量预测系统,还可以具有这样的技术特征,其中,所述综合预测子模块基于所采集数据的质量,以及预测结果与所述多度关系动态网络的联动一致性程度,分析所述第一预测结果和所述第二预测结果的一致性程度,并根据该一致性程度对所述第一预测结果进行修正,所述综合预测结果包括所述第一预测结果、所述第二预测结果、修正后的预测结果以及修正依据。
本发明提供的基于知识图谱的农作物灾害损失及产量预测系统,还可以具有这样的技术特征,其中,所述数据采集模块采集的数据类型包括:气象数据、自然灾害数据、种养殖环境数据、农作物生产流通数据、农户金融信贷数据以及农户抗灾数据,数据性质包括:历史数据、实时数据以及预测数据,数据来源包括:气象服务、金融服务、农业物联网、网络公开数据以及文献与资料,数据格式包括:结构化数据、半结构化数据以及非结构化数据。
本发明提供的基于知识图谱的农作物灾害损失及产量预测系统,还可以具有这样的技术特征,其中,所述致灾因素分析模块的致灾因素识别方法包括关联分析、交叉认证、聚类算法以及分类算法。
本发明提供的基于知识图谱的农作物灾害损失及产量预测系统,还可以具有这样的技术特征,其中,用户通过所述人机交互模块进行的交互内容包括:面向所述数据采集模块的数据源定义、接口配置、采集状态显示;面向所述知识表达模块的知识图谱用户定义、知识图谱可视化展示及用户互动;面向所述致灾因素分析模块的致灾因素可视化展示及用户互动;面向所述灾害损失及产量预测模块的农作物、地区、预测目标、预测时期、预测方法的用户定义,以及所述预测结果与所述农作物灾害影响多度关系动态网络的联动关系可视化。
本发明提供了一种采用上述基于知识图谱的农作物灾害损失及产量预测系统对农作物产量进行预测的预测方法,其特征在于,包括以下步骤:步骤S1,用户通过人机交互模块输入参数;步骤S2,数据采集模块从多个数据源采集数据并进行集成,得到集成的农作物数据;步骤S3,知识表达模块基于所述农作物数据构建并存储农作物产量的全要素知识图谱;步骤S4,关联分析模块基于所述全要素知识图谱构建农作物产量的多度关系动态网络;步骤S5,致灾因素分析模块基于所述多度关系动态网络自动识别致灾因素;步骤S6,灾害损失及产量预测模块基于识别出的所述致灾因素预测灾害损失及产量;步骤S7,所述人机交互模块输出预测的所述农作物灾害损失及产量。
发明作用与效果
根据本发明的基于知识图谱的农作物灾害损失及产量预测系统及方法,该系统包括数据采集模块、知识表达模块、关联分析模块、致灾因素分析模块、灾害损失及产量预测模块、人机交互模块。用户通过人机交互模块输入各组成模块的运行参数后,数据采集模块从多个数据源采集数据并进行集成;知识表达模块基于采集、集成的数据构建并存储农作物产量的全要素知识图谱;关联分析模块基于该知识图谱构建农作物产量及灾害影响的多度关系动态网络;致灾因素分析模块基于该关系网络自动识别出致灾因素,灾害损失及产量预测模块基于该关系网络和识别出的致灾因素预测农作物灾害损失及实际产量;最后人机交互模块输出预测结果。
如上所述,本发明通过农作物产量全要素知识图谱,纳入了所有必要的影响因素,实现了农作物生产涉及的自然灾害影响因素综合性和结构化,在此基础上通过深度学习、关联分析准确识别真实的致灾因素,因此能够得到准确的预测结果。采用该系统,技术上可以解决现有农作物产量预测采用确定参数进行拟合计算所导致的可解释性不强、可扩展性弱、缺少穿透性,效果上可以解决致灾因素不确定、不精确或不真实而导致的产量预测不准确,应用上支持天气指数保险及数字农业创新产品及应用的高效开发与自动处理,实现模型驱动的网络化保险产品定制。
附图说明
图1是本发明实施例中基于知识图谱的农作物灾害损失及产量预测系统的结构框图;
图2是本发明实施例中基于知识图谱的农作物灾害损失及产量预测系统的工作原理图;
图3是本发明实施例中数据采集模块的工作原理图;
图4是本发明实施例中知识表达模块的工作原理图;
图5是本发明实施例中关联分析模块的工作原理图;
图6是本发明实施例中致灾因素分析模块的工作原理图;
图7是本发明实施例中灾害损失及产量预测模块的工作原理图;
图8是本发明实施例中基于知识图谱的农作物灾害损失及产量预测方法的流程图;
图9是本发明实施例中基于知识图谱的农业天气指数保险精算技术框架图。
附图标记:基于知识图谱的农作物灾害损失及产量预测系统10;数据采集模块11;知识表达模块12;关联分析模块13;致灾因素分析模块14;灾害损失及产量预测模块15;人机交互模块16;控制模块17。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本发明的基于知识图谱的农作物灾害损失及产量预测系统及方法作具体阐述。
<实施例>
本实施例提供一种基于知识图谱的农作物灾害损失及产量预测系统及方法,其中,农作物指农林牧渔作物,灾害损失指农作物由于自然灾害导致的产量损失,产量指考虑自然灾害影响的实际产量。知识图谱指表达农作物产量及自然灾害相关概念及关系的知识载体,预测方法指该预测系统采用的数据处理流程及技术方案。
本实施例中,该系统及方法的主要应用领域是为天气指数保险精算提供灾害损失依据,或者为涉及气象灾害、农业生产以及信贷服务的数字农业应用,为这些应用提供一种基础性的决策支持服务。
天气指数保险是数字农业保险产品的典型代表,其保险精算依据的是自然灾害带来的产量损失,核心是将气象数据与农业生产的损益进行指数化关联,为气象灾害带来的农业生产损失提供高效的保障和赔偿。与灾害性天气保险以直接损失为可保利益不同,天气指数保险的可保利益是异常天气给个人或机构带来的必然开支,因此属于费用补偿性保险。传统农业保险产品的理赔依据是测定被保险农田的产量或收入,而气象指数作物保险产品的赔付依据是与农场产量或收入高度相关,但又独立于标的的一个或几个指数化的天气变量,如天气事件、温度、降水等。
天气指数保险的应用趋势及关键问题包括,首先,考虑到不同作物的生长特点不同,不同区域的气候、气象灾害频度和影响也不同,所以需要按区域和作物进行灾害损失及产量预测,在此基础上开发针对性的保险产品。其次,因为天气本身具有可测量性、客观性、公开性、不可人为操纵等特点,相对于传统保险产品,能够避免逆选择和道德风险,适合自动处理,因此天气指数保险适合网络化可定制营销,但是缺少支持参数化定制的精算模型。第三,保险精算涉及的农业生产影响因素众多,气候动态变化,自然灾害及农作物数据的质量无法保证,致灾因素甄别方面存在不确定、不精确或不真实情况,导致产量预测不准确,保险出现基差,引起不公平赔付,影响了农户对投保的积极性。
此外,现有农作物灾害损失与产量预测的技术,采用确定的、有限的农作物生产及自然灾害参数、在历史数据基础上进行拟合计算,因此在原理上难以保障灾害损失及产量预测的准确性,在技术上也不支持面向不同区域、不同作物构造参数可定制的产量预测模型,不支持数据驱动的智能化产量预测,不能满足天气指数保险规模化所需的高效开发,也不支持网络化营销要求的保险产品及费率的可定制需要。
本实施例的应用目标是为天气指数保险精算提供气候影响下的农作物产量预测,涉及地区是长三角农户,涉及农作物是水稻、鱼虾蟹以及茶叶等长三角特色农产品,目的是结合农业物联网、气象服务、人工智能技术进展,解决目前农作物产量预测在技术原理方面的局限,为农业天气指数保险提供一种预测精准、要素综合、参数可定制的农作物产量预测系统与预测方法。
图1、图2分别是本实施例中基于知识图谱的农作物灾害损失及产量预测系统的结构框图和工作原理图。
如图1-2所示,基于知识图谱的农作物灾害损失及产量预测系统10(以下简称预测系统10)包括数据采集模块11、知识表达模块12、关联分析模块13、致灾因素分析模块14、灾害损失及产量预测模块15、人机交互模块16以及用于对上述各组成模块的工作进行控制的控制模块17。
图3是本实施例中数据采集模块的工作原理图。
如图2-3所示,数据采集模块11用于实现多种来源的数据采集与集成,以保证农作物生产及气象数据的完整性、客观性与准确性,从而能够支持精准的灾害因素及产量预测分析。本实施例中,采集的数据类型包括气象数据、自然灾害数据、种养殖环境数据、农作物生产流通数据、农户金融信贷数据以及农户抗灾数据;数据性质包括历史数据、实时数据以及预测数据,数据来源包括气象服务、金融服务、农业物联网、网络公开数据以及可获取的文献与资料;数据格式包括结构化数据、半结构化数据以及非结构化数据。数据采集的方式包括气象服务数据接口调用、金融服务数据接口调用、物联网数据接口调用、网络公开数据自动抓取以及可获取文献与资料录入。
数据采集模块11具有数据调用子模块、数据预处理子模块、数据存储子模块以及数据接口子模块。数据调用子模块用于调用上述接口、获取对应的数据;数据预处理子模块用于对获取到的数据进行预处理,使其形成结构化的农作物数据;数据存储子模块用于对结构化的农作物数据进行存储;数据接口子模块用于为其他模块提供获取农作物数据的接口。
图4是本实施例中知识表达模块的工作原理图。
如图4所示,知识表达模块12基于数据采集模块11采集与集成的农作物数据,构建并存储农作物产量的全要素知识图谱。
知识表达模块12包括数据采集数据接口调用子模块、知识图谱生成子模块以及知识图谱数据接口模块。通过全要素知识图谱对综合性产量影响因素进行结构化、语义化知识表达,将影响农作物产量涉及的所有因素纳入预测考虑,科学表达这些因素涉及的概念及其复杂关系,实现数据紧密关联、模型系统表达与自动动态更新,从而解决现有产量预测只考虑有限影响因素、只处理有限历史数据、可扩展性弱以及可解释性不强问题。
采集数据接口调用子模块用于调用数据采集模块11的接口,获取农作物数据;知识图谱生成子模块基于农作物数据生成全要素知识图谱;知识图谱数据接口模块用于为其他模块提供获取全要素知识图谱的接口。
全要素知识图谱的构建方法包括:定义影响农作物生产的自然灾害因素、定义影响农作物生产的种养殖环境因素、定义农作物生产流通因素、定义农户金融信贷因素、定义农户抗灾因素,基于特征学习和扎根理论识别和定义各因素涉及的概念和关系,搭建知识图谱开发环境,并通过该知识图谱开发环境构建农作物产量全要素知识图谱。本实施例中,选择现有技术中的Python/Flask与Neo4j/CQL搭建知识图谱开发环境,在替代方案中,也可以采用现有技术中的其他框架、工具搭建知识图谱开发环境。
图5是本实施例中关联分析模块的工作原理图。
如图5所示,关联分析模块13基于全要素知识图谱构建农作物灾害影响多度关系动态网络,增强灾害损失及产量预测的穿透性,提升精准性。
关联分析模块13包括知识图谱数据接口调用子模块、多度关系网络生成子模块、多度关系网络数据接口子模块。
知识图谱数据接口调用子模块用于调用知识表达模块12的接口,获取全要素知识图谱;多度关系网络生成子模块基于全要素知识图谱生成农作物灾害影响多度关系动态网络;多度关系网络数据接口子模块用于为其他模块提供获取农作物灾害影响多度关系动态网络的接口。
农作物灾害影响多度关系动态网络的生成,是在全要素知识图谱的基础上,围绕典型的致灾模式,进行致灾模式定义,并通过聚类学习构建,其中涉及的多度关系,不仅考虑概念之间的直接关系,还定义概念之间的非直接关系,从而丰富关系类型,在此基础上实现自然灾害、农业生产以及其他要素之间更全面、更准确的关联,减少模糊关联。
农作物灾害影响多度关系动态网络的构建方法包括:
定义典型致灾模式,分析灾害损失案例,在知识图谱基础上基于特征学习对面向指定致灾模式的关系进行聚类,识别并验证涉及的多度关系,构建基于多度关系的动态网络。
图6是本实施例中致灾因素分析模块的工作原理图。
如图6所示,致灾因素分析模块14在多度关系动态网络的基础上通过深度学习自动识别致灾因素,解决致灾因素甄别方面存在的不确定、不精确或不真实问题。
致灾因素分析模块14包括知识图谱接口调用子模块、多度关系数据接口调用子模块、致灾因素分析子模块、致灾因素数据接口子模块。
知识图谱接口调用子模块用于调用知识表达模块12的接口,获取全要素知识图谱;多度关系数据接口调用子模块用于调用关联分析模块13的接口,获取多度关系动态网络;致灾因素分析子模块基于全要素知识图谱和多度关系动态网络、通过深度学习自动识别致灾因素,识别方法包括关联分析、交叉认证、聚类算法和分类算法;致灾因素数据接口子模块为其他模块提供获取识别出的致灾因素的接口。
图7是本实施例中灾害损失及产量预测模块的工作原理图。
如图7所示,灾害损失及产量预测模块15结合了两种不同技术模式的预测方法,第一种是基于图神经网络的预测方法,在多度关系动态网络基础上通过深度学习计算灾害损失与实际产量;第二种是模数结合的预测方法,基于识别出的致灾因素,结合传统拟合算法,构建模数结合计算模型,进行灾害损失及实际产量预测,其目的是提升预测精准度、智能化的同时,解决与现有产量预测方法的继承性与集成性,减少由于预测方法原始创新导致的不确定性。
灾害损失及产量预测模块15包括神经网络预测子模块、模数结合预测子模块、综合预测子模块。
神经网络预测子模块的作用如上述,其调用关联分析模块13的接口获取多度关系动态网络,然后将多度关系动态网络输入图神经网络进行灾害损失及产量预测,得到预测结果(即预测的灾害损失数据、预测的实际产量数据),并为其他模块提供获取灾害损失数据的接口、获取实际产量数据的接口。本实施例中,使用现有深度学习技术中的Metapath/GCN/双向LSTM与Attention模型来构造图神经网络和学习算法,在替代方案中,也可以采用现有技术中的其他图神经网络和学习算法。
模数结合预测子模块的作用如上述,其调用致灾因素分析模块14的接口获取致灾因素,然后基于模数结合方法进行灾害损失预测、实际产量预测,并为其他模块提供获取灾害损失数据的接口、获取实际产量数据的接口。
综合预测子模块分别调用神经网络预测子模块的预测结果和模数结合预测子模块的预测结果,并对两者的预测结果进行综合评价及结果修正,得到综合预测结果,并为其他模块提供获取该综合预测结果的接口。
综合预测子模块在两种预测结果的基础上,结合所采集数据质量,以及预测结果与多度关系动态网络的联动一致性程度,分析两种预测结果的一致性程度,根据一致性程度对预测结果进行修正。最终得到的综合预测结果包括上述两种预测结果、修正后的预测结果以及修正依据。
人机交互模块16为用户提供用户界面,通过用户界面支持预测系统10各组成模块的用户定义、数据处理过程及结果的动态、可视化展示。通过全要素知识图谱或多度关系动态网络,使预测结果与致灾因素关联,实现预测过程的可视化闭环展示,可以增强用户对预测结果的合理性及可解释性感知。人机交互模块16与上述各模块的接口均有接口交互。
用户通过人机交互模块16可进行的交互内容包括:
面向数据采集模块11的数据源定义、接口配置、采集状态显示;
面向知识表达模块12的知识图谱用户定义、知识图谱可视化展示及用户互动;
面向关联分析模块13的多度关系用户定义、多度关系动态网络可视化展示及用户互动;
面向致灾因素分析模块14的致灾因素可视化展示及用户互动;
面向灾害损失及产量预测模块15的农作物、地区、预测目标、预测时期、预测方法等用户定义,以及灾害损失及产量预测结果与多度关系动态网络的联动关系可视化。
图8是本实施例中基于知识图谱的农作物灾害损失及产量预测方法的流程图。
如图8所示,采用上述预测系统10对农作物的实际产量进行预测的预测方法具体包括以下步骤:
步骤S1,用户通过人机交互模块16输入各组成模块的参数;
步骤S2,数据采集模块11从数据源采集数据并进行集成,得到集成的农作物数据;
步骤S3,知识表达模块12基于农作物数据构建并存储农作物产量全要素知识图谱;
步骤S4,关联分析模块13基于农作物产量全要素知识图谱构建农作物产量及灾害影响的多度关系动态网络;
步骤S5,致灾因素分析模块14基于农作物产量多度关系动态网络自动识别致灾因素;
步骤S6,灾害损失及产量预测模块15基于识别出的致灾因素计算预测农作物的灾害损失及产量;
步骤S7,人机交互模块16输出预测结果,即输出预测的农作物灾害损失的数据及实际产量的数据。
图9是本实施例中基于知识图谱的农业天气指数保险精算技术框架图,该图示出了上述的预测系统10及预测方法在农业天气指数保险精算方面的应用。
如图9所示,本实施例以水稻、鱼虾蟹以及茶叶等长三角特色农产品为案例,分析天气、农户以及金融因素在其生长过程中的影响,围绕天气指数保险产品品类化、影响因素综合化与营销渠道网络化趋势,提供了基于物联网、区块链、知识图谱、关联分析、模数计算的保险精算技术框架,采用上述预测系统10的方案,解决保险精算关键技术问题,实现保险精算的综合性、可解释与参数化。
其中,气象数据是确定气象指数和农作物产量关联关系和保险赔付标准的依据,其完整性、客观性与准确性,直接影响产量预测、费率与理赔标准的合理性与客观性。
面向数据采集、清洗、存储、分析及挖掘的技术框架已经非常成熟并被广泛应用,本实施例面向长三角农业生产的特征和保险精算需求,结合农业综合天气指数保险区块链,形成针对性的农业生产气象数据技术框架,在数据范围、数据来源与内容、处理技术方面具有以下特点:
第一,数据的完整性。农业生产气象数据由历史数据和预报数据组成,既包括现有气候指数所包含的气温、降水、风速,也纳入其他影响农业生产、作物质量、灾害损失的历史数据,如生产主体、生产资料、普惠金融等条件,提升产量预测的综合性、客观性与准确性,为保险费率、致灾因子、理赔标准的优化提供更加全面的综合依据。
第二,数据的客观性与准确性。农业生产气象数据依托农业综合天气指数保险区块链获取,来源于参与者数据共享,内容包括区域气象数据,农户及农作物溯源,普惠金融业务数据,以及基于爬虫的风险关联数据。区块链去中心化、数据自主、不可篡改等特征,区块链联盟的会员准入条件,以及链上独立执行的数据存取合约,可以有效保证数据的可信度。
第三,数据共享的安全性。农业生产气象数据来源于不同主体、不同领域,性质、作用、结构、安全等级不同,数据共享涉及的采集、集成与处理必须解决安全和隐私问题。因此,本案例将聚焦大数据用途,结合农业生产知识图谱要求,针对农业生产历史数据存在不确定、不精确和不真实等情况,缺失、稀疏、冗余问题普遍,研究区块链数据自治环境下的数据采集、隐私脱敏、交叉融合数据处理技术,为农业产量预测与保险精算提供高质量数据支持。
影响农业生产的天气因素的综合性和结构化,是准确识别致灾因素、预测农业产量预测的关键问题。天气和农业生产影响因素众多,数据采集及甄别困难,只考虑有限因素容易出现致灾因素不确定、不精确或不真实情况,产量预测的准确性难以保障。此外,从保险费率厘定方面,影响农业产量的因素还包括生产主体、生产条件以及保险、信贷组合因素。
为此,本实施例在现有农业天气指数保险精算模型基础上,结合知识图谱构建技术,在传统天气指数保险所考虑的作物、生产与气象灾害等因素之外,纳入生产主体、生产条件以及金融组合因素,分析所有影响因素涉及的概念与关系,构建以气候特征和农业产量为中心的农业生产全要素知识图谱。
知识图谱是被广泛接受的数据表达技术,具有结构化、语义化以及可扩充等特征,是大数据处理和关联分析的基础,支持模型驱动的数据自动处理,可持续引进新的影响因素,且在计算结果和影响因素之间存在良好的可解释性。因此,通过知识图谱来表达农业生产要素及其关系,可以将农业产量与业务风险涉及的影响因素进行结构化语义表达,确定影响农业产量的因素及其贡献度,增加预测的准确性和合理性,涵盖的影响因素和关系线索越多,挖掘性能就越强,对致灾因素的识别、费率的基差就越小。因此,构造全要素、多维关系的知识图谱,是本案例的关键技术和难点。
鉴于知识图谱的构建具有通用的技术框架,本案例参考金融领域知识图谱的成功实践和问题,结合长三角地区农业生产场景,面向产量预测及费率厘定,以气象参数和农业产量关系为主线,从农业生产主体、条件、过程、手段、金融等角度,分析关联概念及关系,构造农作物产量全要素知识图谱。该图谱在表达内容、关联结构、实现技术方面具有以下特点:
首先,农业生产知识图谱内容涵盖影响天气指数保险精算模型的全部要素。农业产量与天气的关联关系是实现天气指数保险精算模型的基础和依据,影响农业产量的因素除了传统天气指数保险所考虑的作物、生产与气象灾害等因素,还包括生产主体、生产条件以及普惠金融组合情况,因此,应在现有天气指数保险精算模型基础上,深入分析并纳入农业生产涉及的种植/养殖主体、生产条件、普惠金融组合等关联要素,研究开发以气候特征和农业产量关系为中心的农业生产关联关系,形成全要素知识图谱。
其次,农业生产知识图谱结构基于多维交叉关系构建,涵盖农业生产主体、条件、过程、手段、金融等多个角度,关联分析拥有更强的准确性与可解释性。
第三,农业生产知识图谱概念及关系以气象参数和农业产量关系为主线,基于特征学习和扎根理论进行识别和定义,表达更科学、支持数据自动处理。
模型驱动的农作物产量预测,是实现保险品类快速开发、参数可定制的关键技术和难点。传统保险精算涉及的经验定价法、分布拟合法以及动态建模法,采用确定的参数和定量计算,考虑气候变化,农业生产不同年份影响因素及程度并不确定,所以难以构造参数可定制的保险产品。
本实施例结合上述预测系统10及预测方法,在气象数据基础上构造基于农作物产量全要素知识图谱的灾害损失、产量预测与保险精算方法,形成实现模型驱动的天气指数保险精算模型。
如图8所示,在该技术框架中,同时采用两种技术路线,互为补充和参考,在实现保险精算创新的同时保障模型的正确性与可用性。两种技术路线均基于农作物产量全要素知识图谱,构建面向产量预测的多度关系网络模型。区别在于,第一种通过多度关系网络模型的深度学习,明确致灾因子及其贡献,在此基础上,结合传统精算方法构造产量预测及费率厘定算法模型;第二种则通过多度关系网络模型的深度学习,直接进行产量预测及费率厘定。
本实施例中,未详细说明的部分为本领域的公知技术。
实施例作用与效果
根据本实施例提供的基于知识图谱的农作物灾害损失及产量预测系统及方法,系统包括数据采集模块、知识表达模块、关联分析模块、致灾因素分析模块、灾害损失及产量预测模块、人机交互模块。用户通过人机交互模块输入各组成模块的运行参数后,数据采集模块从多个数据源采集数据并进行集成;知识表达模块基于采集、集成的数据构建并存储农作物产量的全要素知识图谱;关联分析模块基于该知识图谱构建农作物产量及灾害影响的多度关系动态网络;致灾因素分析模块基于该关系网络自动识别出致灾因素,灾害损失及产量预测模块基于该关系网络和识别出的致灾因素预测农作物灾害损失及实际产量;最后人机交互模块输出预测结果。
如上所述,本发明通过农作物产量全要素知识图谱,纳入了所有必要的影响因素,实现了农作物生产涉及的自然灾害影响因素综合性和结构化,在此基础上通过深度学习、关联分析准确识别真实的致灾因素,因此能够得到准确的预测结果。采用该系统,技术上可以解决现有农作物产量预测采用确定参数进行拟合计算所导致的可解释性不强、可扩展性弱、缺少穿透性,效果上可以解决致灾因素不确定、不精确或不真实而导致的产量预测不准确,应用上支持天气指数保险及数字农业创新产品及应用的高效开发与自动处理,实现模型驱动的网络化保险产品定制。
实施例中,该系统与方法应用于农业天气指数保险精算场景,构建了基于知识图谱的农业天气指数保险精算技术框架,依托农业生产气象数据与全要素知识图谱进行关联分析,具有良好的完整性、客观性与可解释性,支持模型驱动的自动处理,可以实现保险品类快速开发、达到规模化效应,支持网络化参数定制营销。相比而言,传统方法采用的气象致灾因素分析,是把气象数据作为影响因素,与产量、地力和质量等目标指标建立对应关系,形成多因素损失模型,缺少更深层次的关联分析,也不利于致灾因子挖掘、优化过程中的因素扩展。
上述实施例仅用于举例说明本发明的具体实施方式,而本发明不限于上述实施例的描述范围。

Claims (9)

1.一种基于知识图谱的农作物灾害损失及产量预测系统,其特征在于,包括:
数据采集模块,从多个数据源采集多种数据并进行集成,得到集成的农作物数据;
知识表达模块,基于所述集成的农作物数据构建及存储农作物产量的全要素知识图谱;
关联分析模块,基于所述农作物产量全要素知识图谱构建农作物产量及灾害影响的多度关系动态网络;
致灾因素分析模块,基于所述多度关系动态网络,通过深度学习识别出致灾因素;
灾害损失及产量预测模块,基于所述多度关系动态网络以及所述致灾因素进行农作物灾害损失及产量预测,得到预测结果;以及
人机交互模块,为用户提供用户界面,该用户界面至少用于输入参数以及输出所述预测结果。
2.根据权利要求1所述的基于知识图谱的农作物灾害损失及产量预测系统,其特征在于:
其中,所述全要素知识图谱按以下方式构建:
定义影响农作物生产的自然灾害因素,定义影响农作物生产的种养殖环境因素,定义农作物生产流通因素,定义农户金融信贷因素,定义农户抗灾因素,基于特征学习和扎根理论识别和定义各因素涉及的概念和关系,通过知识图谱开发环境构建所述全要素知识图谱。
3.根据权利要求1所述的基于知识图谱的农作物灾害损失及产量预测系统,其特征在于:
其中,所述多度关系动态网络按以下方式构建:
定义典型致灾模式,分析灾害损失案例,在所述全要素知识图谱的基础上基于特征学习对面向指定致灾模式的关系进行聚类,识别并验证涉及的多度关系,构建基于所述多度关系的所述多度关系动态网络。
4.根据权利要求1所述的基于知识图谱的农作物灾害损失及产量预测系统,其特征在于:
其中,所述灾害损失及产量预测模块包括:
神经网络预测子模块,将所述多度关系动态网络输入图神经网络模型,对农作物灾害损失及产量进行预测,得到第一预测结果;
模数结合预测子模块,基于所述致灾因素,采用模数结合方法对农作物灾害损失及产量进行预测,得到第二预测结果;以及
综合预测子模块,对所述第一预测结果和所述第二预测结果进行综合评价及结果修正,得到综合预测结果。
5.根据权利要求4所述的基于知识图谱的农作物灾害损失及产量预测系统,其特征在于:
其中,所述综合预测子模块基于所采集数据的质量,以及预测结果与所述多度关系动态网络的联动一致性程度,分析所述第一预测结果和所述第二预测结果的一致性程度,并根据该一致性程度对所述第一预测结果进行修正,
所述综合预测结果包括所述第一预测结果、所述第二预测结果、修正后的预测结果以及修正依据。
6.根据权利要求1所述的基于知识图谱的农作物灾害损失及产量预测系统,其特征在于:
其中,所述数据采集模块采集的数据类型包括:气象数据、自然灾害数据、种养殖环境数据、农作物生产流通数据、农户金融信贷数据以及农户抗灾数据,
数据性质包括:历史数据、实时数据以及预测数据,
数据来源包括:气象服务、金融服务、农业物联网、网络公开数据以及文献与资料,
数据格式包括:结构化数据、半结构化数据以及非结构化数据。
7.根据权利要求1所述的基于知识图谱的农作物灾害损失及产量预测系统,其特征在于:
其中,所述致灾因素分析模块的致灾因素识别方法包括关联分析、交叉认证、聚类算法以及分类算法。
8.根据权利要求1所述的基于知识图谱的农作物灾害损失及产量预测系统,其特征在于:
其中,用户通过所述人机交互模块进行的交互内容包括:
面向所述数据采集模块的数据源定义、接口配置、采集状态显示;
面向所述知识表达模块的知识图谱用户定义、知识图谱可视化展示及用户互动;
面向所述致灾因素分析模块的致灾因素可视化展示及用户互动;
面向所述灾害损失及产量预测模块的农作物、地区、预测目标、预测时期、预测方法的用户定义,以及所述预测结果与所述农作物灾害影响多度关系动态网络的联动关系可视化。
9.一种采用如权利要求1-8中任意一项所述的基于知识图谱的农作物灾害损失及产量预测系统对农作物灾害损失及产量进行预测的预测方法,其特征在于,包括以下步骤:
步骤S1,用户通过人机交互模块输入各组成模块的参数;
步骤S2,数据采集模块从多个数据源采集数据并进行集成,得到集成的农作物数据;
步骤S3,知识表达模块基于所述农作物数据构建并存储农作物产量的全要素知识图谱;
步骤S4,关联分析模块基于所述全要素知识图谱构建农作物产量及灾害影响的多度关系动态网络;
步骤S5,致灾因素分析模块基于所述多度关系动态网络识别出致灾因素;
步骤S6,灾害损失及产量预测模块基于所述多度关系动态网络以及所述致灾因素预测农作物灾害损失及产量;
步骤S7,所述人机交互模块输出预测的所述农作物灾害损失及产量。
CN202210824372.0A 2022-07-14 2022-07-14 基于知识图谱的农作物灾害损失及产量预测系统及方法 Pending CN115115126A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210824372.0A CN115115126A (zh) 2022-07-14 2022-07-14 基于知识图谱的农作物灾害损失及产量预测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210824372.0A CN115115126A (zh) 2022-07-14 2022-07-14 基于知识图谱的农作物灾害损失及产量预测系统及方法

Publications (1)

Publication Number Publication Date
CN115115126A true CN115115126A (zh) 2022-09-27

Family

ID=83333233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210824372.0A Pending CN115115126A (zh) 2022-07-14 2022-07-14 基于知识图谱的农作物灾害损失及产量预测系统及方法

Country Status (1)

Country Link
CN (1) CN115115126A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115829162A (zh) * 2023-01-29 2023-03-21 北京市农林科学院信息技术研究中心 作物产量预测方法、装置、电子设备及介质
CN115936262A (zh) * 2023-02-20 2023-04-07 深圳普菲特信息科技股份有限公司 基于大数据的环境干扰的产量预测方法、系统和介质
CN116307405A (zh) * 2023-05-25 2023-06-23 日照鲁光电子科技有限公司 一种基于生产数据的二极管性能预测方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115829162A (zh) * 2023-01-29 2023-03-21 北京市农林科学院信息技术研究中心 作物产量预测方法、装置、电子设备及介质
CN115936262A (zh) * 2023-02-20 2023-04-07 深圳普菲特信息科技股份有限公司 基于大数据的环境干扰的产量预测方法、系统和介质
CN116307405A (zh) * 2023-05-25 2023-06-23 日照鲁光电子科技有限公司 一种基于生产数据的二极管性能预测方法及系统
CN116307405B (zh) * 2023-05-25 2023-08-04 日照鲁光电子科技有限公司 一种基于生产数据的二极管性能预测方法及系统

Similar Documents

Publication Publication Date Title
Antle et al. Next generation agricultural system data, models and knowledge products: Introduction
Phasinam et al. Application of IoT and cloud computing in automation of agriculture irrigation
CN115115126A (zh) 基于知识图谱的农作物灾害损失及产量预测系统及方法
Reddy et al. Survey on weather prediction using big data analystics
CN105260791A (zh) 基于农业物联网和大数据分析的种植计划优化系统和方法
Gupta et al. WB-CPI: Weather based crop prediction in India using big data analytics
CN117036088A (zh) 一种ai识别绿化植物生长态势的数据采集分析方法
Liu Smart sensors, sensing mechanisms and platforms of sustainable smart agriculture realized through the big data analysis
Lad et al. Factors affecting agriculture and estimation of crop yield using supervised learning algorithms
Srikanth et al. Small Holders Farming Predictive Analysis Using Peer-To-Peer Approach
Murakami et al. Prediction of municipality-level winter wheat yield based on meteorological data using machine learning in Hokkaido, Japan
Nayagam et al. Control of pests and diseases in plants using iot technology
Jie RETRACTED ARTICLE: Precision and intelligent agricultural decision support system based on big data analysis
Kumar et al. Internet of things sensors and support vector machine integrated intelligent irrigation system for agriculture industry
Wanyama et al. A Systematic Review of Fourth Industrial Revolution Technologies in Smart Irrigation: Constraints, Opportunities, and Future Prospects for sub-Saharan Africa
Helfer et al. Ubiquitous computing in precision agriculture: A systematic review
Zhang et al. A hierarchical growth method for extracting 3D phenotypic trait of apple tree branch in edge computing
Sumangala et al. Impact of Adopting Machine Learning Methods on Indian Agriculture Industry-A Case Study
CN111640039A (zh) 一种设施蔬菜病害防治推荐系统及方法
Kim et al. An agricultural digital twin for mandarins demonstrates the potential for individualized agriculture
Mahalakshmi et al. Agricultural Crop and Fertilizer Recommendations based on Various Parameters
Kaur et al. Analysis of wheat production techniques
Jdi et al. Precipitation forecasting using machine learning in the region of Beni Mellal-Khenifra
Sharma et al. IoT-Based ML Model to Sense Selection of Seed Crops in Changing Climatic Conditions of Punjab
Kamatchi et al. Enhancing Maize Cultivation with Intelligent Decision Support: IoT, Deep Learning, and Blockchain Integration for Land Data Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination