CN115423148A - 一种基于克里金法和决策树的农机作业性能预测方法与装置 - Google Patents

一种基于克里金法和决策树的农机作业性能预测方法与装置 Download PDF

Info

Publication number
CN115423148A
CN115423148A CN202210907597.2A CN202210907597A CN115423148A CN 115423148 A CN115423148 A CN 115423148A CN 202210907597 A CN202210907597 A CN 202210907597A CN 115423148 A CN115423148 A CN 115423148A
Authority
CN
China
Prior art keywords
data
decision tree
agricultural machinery
kriging
operation performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210907597.2A
Other languages
English (en)
Other versions
CN115423148B (zh
Inventor
石茂林
徐立章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN202210907597.2A priority Critical patent/CN115423148B/zh
Publication of CN115423148A publication Critical patent/CN115423148A/zh
Application granted granted Critical
Publication of CN115423148B publication Critical patent/CN115423148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于克里金法和决策树的农机作业性能预测方法与装置,该方法包括以下步骤:构建基于克里金法的决策树,将样本空间按照数据输入与输出关联关系划分,获得每个节点对应的克里金农机作业性能预测模型;对于待预测的新样本,基于获取的划分规则,将其归类到对应节点,根据节点所属的克里金农机作业性能预测模型获取预测值;生成若干棵基于克里金法的决策树,将所有决策树预测值的平均值作为最终预测结果。本发明通过构建基于克里金法的决策树,实现样本空间按照数据输入与输出关联关系的划分,提升作业性能预测模型精度,通过基于克里金法的决策树的集成,提升作业性能预测模型的泛化能力。

Description

一种基于克里金法和决策树的农机作业性能预测方法与装置
技术领域
本发明涉及大数据技术在农机作业性能预测中的应用,特别涉及一种基于克里金法和决 策树的农机作业性能预测方法与装置,属于农业工程、大数据与人工智能的交叉领域。
背景技术
随着检测技术和物联网技术高速发展,以联合收获机为代表的农业机械(简称“农机”) 的运行监测日趋完善。为了获取和分析农机在作业过程中的性能表现,众多农机制造厂商和 农场开始搭建农机车载监测、远程监控、智慧农场等多种平台,获取和积累农机现场作业数 据,以期通过挖掘和分析这些数据,预测和指导农机的现场作业,提升作业性能,节约作业 成本。
目前,数据驱动的预测技术在工业系统设计、分析、运行与维护等已经取得了成功应用。 针对不同工业系统数据的特点,科研和工程人员开发了对应的算法和装置,使得工业系统的 智能化水平得到不断提升。然而,数据驱动的预测技术在农机领域应用较少,适应农机现场 作业数据特点的算法和装置更有待进一步研发。
与工业、商业、医疗等其他行业数据相比,农机现场作业数据具有其特殊性,包括如下 方面:
1.农机作业对象为水稻、小麦、油菜等作物,生物属性受天气、时间、土壤、田间管理 等多方面因素影响,导致农机作业对象和作业工况复杂多变,相应的现场作业数据特征十分 复杂;
2.受农业生产规律限制,农机作业具有季节性、集中性,难以按照理想实验设计方案进 行全空间采样,导致农机现场作业数据分布不均,难以覆盖所有可能工况。
因此,工业、商业、医疗等其他行业大数据算法与装置难以适用农机现场作业数据,无 法发挥理想效能。
发明内容
针对上述技术问题,本发明的一个方式的目的之一是提供一种基于克里金法和决策树的 农机作业性能预测方法,提高了克里金法在构建基于农机现场作业数据的作业性能预测模型过程 中的预测精度。本发明的一个方式的目的之一提供一种实现所述基于克里金法和决策树的农机 作业性能预测方法的装置。
注意,这些目的的记载并不妨碍其他目的的存在。本发明的一个方式并不需要实现所有 上述目的。可以从说明书、附图、权利要求书的记载中抽取上述目的以外的目的。
克里金法假设所有数据输入与输出具有相近的关联关系,但农机的作业对象和作业工况 与天气、时间、土壤等多种因素相关,导致农机现场作业数据中的作业参数与作业性能关联 关系极其复杂,难以通过单一的克里金模型进行表示。因此,克里金法对农机现场作业数据 的建模精度有待提高。本发明将样本空间按输入与输出的关联关系划分,再分别建模是实现 数据输入与输出复杂关联关系精准建模的有效途径。决策树是实现这一目标的工具之一,其 通过基于树状结构的递归划分实现样本空间按照特定数据特征的划分。然而,决策树是面向 有标签的分类问题而提出的,即其按照数据分类标签获取分类规则,而按照数据输入与输出 关联关系划分样本空间的决策树还有待研发。克里金法对于非均匀分布的训练数据容易表现 出泛化能力不强的不足。因此,基于克里金法的农机作业性能预测模型的泛化能力也有待提 高。
本申请提供了一种基于克里金法和决策树的农机作业性能预测方法与装置,提高了克里金法在 构建基于农机现场作业数据的作业性能预测模型过程中的预测精度和泛化能力。
本发明通过构建基于克里金法的决策树,实现样本空间按照数据输入与输出关联关系的划分, 提升作业性能预测模型精度;通过基于克里金法的决策树的集成,提升作业性能预测模型的泛化能 力。本发明通过包括但不限于农机车载监测、远程监控、智慧农场等平台获取农机现场作业数据, 对农机现场作业数据进行预处理,去除数据内部的野值、缺失值、异常值,形成特征数据集,特征 数据集包括农机作业参数与作业性能的数据。
本发明是通过以下技术手段实现上述技术目的的。
一种基于克里金法和决策树的农机作业性能预测方法,包括如下步骤:
步骤S1、构建基于克里金法的决策树,按照数据输入与输出关联关系划分样本空间,获 得每个节点对应的克里金农机作业性能预测模型;
步骤S2、对于农机作业性能的待预测样本数据,根据步骤S1构建的基于克里金法的决 策树获得的划分准则,将待预测样本数据归类至相应的节点,通过节点所属的克里金农机作 业性能预测模型获取预测值;
步骤S3、利用集成学习提升克里金农机作业性能预测模型的泛化能力,针对总体训练数 据集,生成m棵基于克里金法的决策树,对于每棵决策树,有放回地选取总体训练数据集中 的α个样本作为训练集,根据所有决策树预测值的平均值作为最终预测结果。
上述方案中,所述步骤S1中,构建基于克里金法的决策树,按照数据输入与输出关联关 系划分样本空间,包括如下步骤:
步骤S1)、将所有特征集放入决策树的根节点;
步骤S2)、在当前节点求解最优划分特征;
步骤S3)、如果当前节点满足停止条件,将当前节点视为叶节点,划分结束;
步骤S4)、如果当前节点不满足停止条件,根据最优划分特征将当前节点的样本空间划分 为左、右两个子样本空间;
步骤S5)、针对每一个子样本空间,重复步骤S2)、步骤S3)、步骤S4)。
进一步的,所述步骤S2)中,所述最优划分特征获取包括以下步骤:
步骤S21)对于每一个数据输入参数,根据输入参数的上下界,均匀生成若干数值;
步骤S22)对当前输入参数的每一个数值,计算节点划分指标Sc,记录当前输入参数最优 划分指标数值和对应输入参数数值;
步骤S23)比较所有输入参数的最优划分指标数值,将最优解视为节点的最优划分指标,将对 应的划分输入参数和数值作为节点最优划分特征。
上述方案中,所述步骤S3)中,停止条件如下:当前节点划分指标Sc>0,或任一个划分子集的样本容量小于5d,d是输入参数的个数。
进一步的,所述节点划分指标Sc通过如下公式建立:
Figure BDA0003773023750000031
yi,left是节点测试样本子集Samplestesting_left中第i个数据的真实输出值;
yi,right是节点测试样本子集Samplestesting_right中第i个数据的真实输出值;
yi,test是节点测试样本集Samplestesting中第i个数据的真实输出值;
Figure BDA0003773023750000032
是节点测试样本子集Samplestesting_left中第i个数据的预测输出值;
Figure BDA0003773023750000033
是节点测试样本子集Samplestesting_right中第i个数据的预测输出值;
Figure BDA0003773023750000034
是节点测试样本子集Samplestesting中第i个数据的预测输出值;
nleft是节点测试样本子集Samplestesting_left的样本数量;
nright是节点测试样本子集Samplestesting_right的样本数量;
ntest是节点测试样本集Samplestesting的样本数量。
上述方案中,所述步骤S3中,通过多棵基于克里金法的决策树的集成提升克里金农机作业 性能预测模型的泛化能力,包括以下步骤:
步骤S31)有放回地从总体数据集中选取α个样本作为训练数据集,共进行m次,获得m个 训练数据集;
步骤S32)利用获得的m个训练数据集,生成m棵基于克里金法的决策树;
步骤S33)对于待预测样本x*,通过每棵决策树获取其对应的预测值,通过如下公式计算其最 终预测值:
Figure BDA0003773023750000041
Figure BDA0003773023750000042
是样本x*的最终预测值,
Figure BDA0003773023750000043
是第i棵基于克里金法的决策树给出的样本x*的预测值;
m是决策树的棵数。
上述方案中,所述步骤S3中,所述m为25,α为0.95n,n是所有训练数据的样本数量。
一种实现所述基于克里金法和决策树的农机作业性能预测方法的装置,其特征在于,包 括数据采集模块、数据处理模块、数据建模模块、数据预测模块和存储模块;
所述数据采集模块用于获取农机现场作业数据;
所述数据处理模块用于预处理农机现场作业数据,生成特征数据集;
所述数据建模模块用于根据基于克里金法和决策树的农机作业性能预测方法建立的克里 金农机作业性能预测模型;
所述数据预测模块用于根据建立的农机作业性能预测模型,对新样本进行预测;
所述存储模块用于存储原始农机现场作业数据、农机现场作业数据特征集、作业性能预 测模型、以及新样本的预测结果。
上述方案中,所述数据采集模块用于连接农机车载监测系统、远程监控系统、智慧农场 平台的数据接口,获取农机现场作业数据。
上述方案中,所述数据建模模块用于构建基于克里金法的决策树,按照数据输入与输出 关联关系划分样本空间,获得每个节点对应的克里金农机作业性能预测模型。
上述方案中,所述数据预测模块用于对于农机作业性能的待预测样本数据,根据构建的 基于克里金法的决策树获得的划分准则,将待预测样本数据归类至相应的节点,通过节点所 属的克里金农机作业性能预测模型获取预测值,利用集成学习提升克里金农机作业性能预测 模型的泛化能力,针对总体训练数据集,生成m棵基于克里金法的决策树,对于每棵决策树, 有放回地选取总体训练数据集中的α个样本作为训练集,根据所有决策树预测值的平均值作为 最终预测结果。
与现有技术相比,本发明的有益效果是:
根据本发明的一个方式,本发明通过构建基于克里金法的决策树,实现样本空间按照数据输 入与输出关联关系的划分,提升作业性能预测模型精度,通过基于克里金法的决策树的集成, 提升作业性能预测模型的泛化能力。
注意,这些效果的记载不妨碍其他效果的存在。本发明的一个方式并不一定必须具有所有上 述效果。可以从说明书、附图、权利要求书等的记载显而易见地看出并抽出上述以外的效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意 性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明一实施方式的一种基于克里金法和决策树的农机作业性能预测方法的框架 图;
图2为本发明一实施方式的一种基于克里金法和决策树的农机作业性能预测方法中的基 于克里金法的决策树的算法流程图;
图3为本发明一实施方式的一种基于克里金法和决策树的农机作业性能预测装置的示意 图;
图4为本发明实施例一中5折交叉验证实验的说明图;
图5为本发明实施例一提供的一种基于克里金法和决策树的农机作业性能预测方法获取的 样本空间划分规则图;
图6为本发明实施例一提供的传统克里金法与本发明提供的一种基于克里金法和决策树的农机 作业性能预测方法的实验结果图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或 类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的 实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语 应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械 连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件 内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中 的具体含义。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将通过本发明实施例对技术方 案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施 例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获取的所有 其他实施例,都属于本发明保护的范围。
本发明涉及一种基于克里金法和决策树的农机作业性能预测方法与装置,旨在构建基于克里金 法的决策树,实现样本空间按照数据输入与输出关联关系的划分,使每个子样本空间数据输入与输 出关联关系相近或一致,提升作业性能模型精度,并通过多棵基于克里金法的决策树的集成,提升 作业性能预测模型的泛化能力。属于农业工程、大数据与人工智能的交叉领域。
一种基于克里金法和决策树的农机作业性能预测方法,包括如下步骤:
步骤S1、构建基于克里金法的决策树,按照数据输入与输出关联关系划分样本空间,获 得每个节点对应的克里金农机作业性能预测模型;
步骤S2、对于农机作业性能的待预测样本数据,根据步骤S1构建的基于克里金法的决 策树获得的划分准则,将待预测样本数据归类至相应的节点,通过节点所属的克里金农机作 业性能预测模型获取预测值;
步骤S3、利用集成学习提升克里金农机作业性能预测模型的泛化能力,针对总体训练数 据集,生成m棵基于克里金法的决策树,对于每棵决策树,有放回地选取总体训练数据集中 的α个样本作为训练集,根据所有决策树预测值的平均值作为最终预测结果。
如图1所示为本发明基于克里金法的决策树的基本框架,所述步骤S1中,构建基于克里金法 的决策树,按照数据输入与输出关联关系划分样本空间,包括如下步骤:
步骤S1)、将所有特征集放入决策树的根节点;
步骤S2)、在当前节点求解最优划分特征;
步骤S3)、如果当前节点满足停止条件,将当前节点视为叶节点,划分结束;
步骤S4)、如果当前节点不满足停止条件,根据最优划分特征将当前节点的样本空间划分为左、 右两个子样本空间;
步骤S5)、针对每一个子样本空间,重复步骤S2)、步骤S3)、步骤S4)。
所述步骤S2)中,基于克里金法的决策树每个节点的最优划分特征通过启发式算法、模 拟退火算法或以下步骤获得:
步骤S21)对于每一个数据输入参数,根据输入参数的上下界,均匀生成若干数值;
步骤S22)对当前输入参数的每一个数值,计算节点划分指标Sc,记录当前输入参数最优划分 指标数值和对应输入参数数值;
步骤S23)比较所有输入参数的最优划分指标数值,将最优解视为节点的最优划分指标,将对 应的划分输入参数和数值作为节点最优划分特征。
所述步骤S3)中,基于克里金法的决策树每个节点停止条件如下:当前节点划分指标 Sc>0,或任一个划分子集的样本容量小于5d,d是输入参数的个数。
所述步骤S1中,采用克里金法刻画数据输入与输出关联关系,决策树的节点划分指标Sc的计算,包括如下步骤。
步骤(1)将节点所有样本数据划分为k份,随机选取其中1份样本作为节点测试样本集 Samplestesting,其他样本作为节点训练样本集Samplestraining
步骤(2)采用克里金法基于节点训练样本集Samplestraining建立预测模型,根据预测模型 得到节点测试样本集Samplestesting的预测值;
步骤(3)根据当前划分输入参数和划分点,将节点训练样本集Samplestraining划分为节点 训练样本子集Samplestraining_left与Samplestraining_right,节点测试样本集Samplestesting划分 为节点测试样本子集Samplestesting_left与Samplestesting_right
步骤(4)采用克里金法基于节点训练样本子集Samplestraining_left建立对应的预测模型, 并得到节点测试样本子集Samplestesting_left的预测输出值;
步骤(5)采用克里金法基于节点训练样本子集Samplestraining_right建立对应的预测模型, 并得到节点测试样本子集Samplestesting_right的预测输出值;
步骤(6)根据下式计算节点划分指标:
Figure BDA0003773023750000071
yi,left是节点测试样本子集Samplestesting_left中第i个数据的真实输出值;
yi,right是节点测试样本子集Samplestesting_right中第i个数据的真实输出值;
yi,test是节点测试样本集Samplestesting中第i个数据的真实输出值;
Figure BDA0003773023750000072
是节点测试样本子集Samplestesting_left中第i个数据的预测输出值;
Figure BDA0003773023750000073
是节点测试样本子集Samplestesting_right中第i个数据的预测输出值;
Figure BDA0003773023750000074
是节点测试样本集Samplestesting中第i个数据的预测输出值;
nleft是节点测试样本子集Samplestesting_left的样本数量;
nright是节点测试样本子集Samplestesting_right的样本数量;
ntest是节点测试样本集Samplestesting的样本数量。
节点划分过程中数据输入与输出关联关系的刻画采用克里金法刻画数据输入与输出的关联关 系,假设输入参数x和输出预测结果y满足如下关系:
Figure BDA0003773023750000081
fj(x)为第j个基函数;
βj为第j个基函数的系数;
p是基函数的个数;
Z(x)为高斯过程,满足如下条件:
E(Z(x))=0
E(Z(xi)Z(xj))=σ2R(θ,xi,xj)
σ2为样本方差;
R(θ,xi,xj)为相关矩阵;
θ为相关矩阵的参数向量;
xi是第i个数据输入组成的向量;
xj是第j个数据输入组成的向量;
构建基函数矩阵F:
F=(f(x1),f(x2),…,f(xn))T
n是训练数据的样本数;
f(xi)(i=1,2,…,n)表示第i个数据通过基函数得到的数值,如下所示;
f(xi)=(f1(xi),f2(xi),..,fp(xi))
基函数矩阵F可改写为:
Figure BDA0003773023750000082
输入向量表示如下:
Y=Fβ+Z
β是基函数系数组成的向量;
Z是训练数据=的高斯过程组成的向量,
Z=(Z(x1),Z(x2),…,Z(xn))T
待预测样本xnew的输出估计值为:
Figure BDA0003773023750000091
Y是训练数据输出组成的向量;
c(x)T是的系数向量;
样本xnew的预测误差如下:
Figure BDA0003773023750000092
y(xnew)是样本xnew的真实输出值;
由线性无偏条件,得:
Figure BDA0003773023750000093
FTc(x)-f(x)=0
计算回归均方差
Figure BDA0003773023750000094
Figure BDA0003773023750000095
σ2=D(Z)=E(Z2)-(E(Z))2=E(Z2)
Figure BDA0003773023750000096
是样本xnew与训练数据输入通过相关矩阵得到的对应向量;
建立如下优化问题求解模型最优参数:
Figure BDA0003773023750000097
s.t.FTc(x)-f(x)=0
构建朗格朗日函数:
Figure BDA0003773023750000098
λ是拉格朗日乘子;
求偏导,得:
Figure BDA0003773023750000099
Figure BDA00037730237500000910
Figure BDA00037730237500000911
x的估计值通过下式获得:
Figure BDA00037730237500000912
Figure BDA00037730237500000913
得β的最优估计:
Figure BDA0003773023750000101
样本xnew的输出值如下所示:
Figure BDA0003773023750000102
新样本数据的预测包括以下步骤:
步骤(1)对于待预测的样本数据x*,根据基于克里金法的决策树获得划分准则,将其归类至 某一节点;
步骤(2)根据节点所属的克里金模型获取预测值。
基于克里金法的决策树的集成:
所述步骤S3中,通过多棵基于克里金法的决策树的集成提升克里金农机作业性能预测模型 的泛化能力,包括以下步骤:
步骤(1)有放回地从总体数据集中选取α个样本作为训练数据集,共进行m次,获得m个训练 数据集;
步骤(2)利用获得的m个训练数据集,生成m棵基于克里金法的决策树;
步骤(3)对于待预测样本x*,通过每棵决策树获取其对应的预测值,通过如下公式计算其最 终预测值。
Figure BDA0003773023750000103
Figure BDA0003773023750000104
是样本x*的最终预测值;
Figure BDA0003773023750000105
是第i棵基于克里金法的决策树给出的样本x*的预测值;
m是决策树的棵数。
所述m和α根据需求选取,优选的,所述m为25,α为0.95n,n是所有训练数据的样本数量。
图2为本发明所述基于克里金法和决策树的农机作业性能预测方法中的基于克里金法的决策树 的算法流程示例图:
x1和x2是输入参数,
样本空间中的黑色圆圈表示样本点;
a是第一次样本空间划分点,即大于x1>a为左样本空间,x1≤a为右样本空间;
b是第二次样本空间划分点,即大于x2<b为左样本空间,x2≥b为右样本空间;
假设经过划分,共得到4个子样本空间,以及对应的4个克里金预测模型;
对于新样本,根据得到的划分规则,判定其归属的子样本空间,根据对应的克里金预测模型获 得预测结果(y)。
一种实现所述基于克里金法和决策树的农机作业性能预测方法的装置,包括数据采集模 块、数据处理模块、数据建模模块、数据预测模块和存储模块,如图3所示。
所述数据采集模块用于对接包括但不限于农机车载监测、远程监控、智慧农场等平台的数据 接口,获取农机现场作业数据;
所述数据处理模块用于预处理农机现场作业数据,生成特征数据集;优选的,集成包括 但不限于聚类、滤波、空值识别等算法,识别和处理农机现场作业初始数据中的野值、噪声、空值 等,形成特征数据集;
所述数据建模模块用于根据基于克里金法和决策树的农机作业性能预测方法建立的克里 金农机作业性能预测模型;
所述数据预测模块用于根据建立的农机作业性能预测模型,对新样本进行预测;
所述存储模块用于存储原始农机现场作业数据、农机现场作业数据特征集、作业性能预 测模型、以及新样本的预测结果。
优选的,所述数据建模模块用于构建基于克里金法的决策树,按照数据输入与输出关联 关系划分样本空间,获得每个节点对应的克里金农机作业性能预测模型;所述数据预测模块 用于对于农机作业性能的待预测样本数据,根据构建的基于克里金法的决策树获得的划分准 则,将待预测样本数据归类至相应的节点,通过节点所属的克里金农机作业性能预测模型获 取预测值,利用集成学习提升克里金农机作业性能预测模型的泛化能力,针对总体训练数据 集,生成m棵基于克里金法的决策树,对于每棵决策树,有放回地选取总体训练数据集中的α个 样本作为训练集,根据所有决策树预测值的平均值作为最终预测结果。
农机作业对象和工况复杂多变,导数作业参数与作业性能之间的关联关系十分复杂,传统 克里金法在数据建模过程中,假定所有数据输入与输出具有相近的关联关系,难以实现农机现 场作业数据中作业参数与作业性能复杂关联关系的精准建模;受制于农业生产规律,农机现场 作业数据难以进行全空间理想采样,基于传统克里金法在处理不均匀分布数据的建模问题时, 存在泛化能力不强的不足;传统决策树根据数据的分类标签获取分类规则,无法按照输入与输 出关联关系划分数据样本空间,获取相应的划分规则。本发明面向农机现场作业数据,将克里 金法与决策树相结合,采用克里金法刻画数据输入与输出的关联关系,基于决策树框架划分样 本空间,实现样本空间按照输入与输出关联关系的划分,从而使每个样本空间的关联关系相近 或一致,达到提升作业性能预测模型精度的目的;通过若干棵基于克里金法的决策树的集成, 达到提升作业性能预测模型泛化能力的目的。本发明方法和装置能准确地根据农机装备的作 业现场数据建立农机装备的作业性能预测模型,为农机作业、运行与维护提供指导与参 考。
具体实施例1:
本实施例提供一种基于克里金法和决策树的农机作业性能预测方法,应用对象是联合收获机。 联合收获机是用于水稻、小麦、油菜等主粮作物收获的关键农机装备,由发动机、悬架等组成的行 走部件,以及割台、输送槽、脱粒、清选等组成的工作部件所组成,对其作业过程的性能表现进行 预测是提升粮食收获效率、降低粮食损耗的基础。联合收获机的作业性能主要由脱粒、清选系统所 决定。
本实施例利用本发明提供的一种基于克里金法和决策树的农机作业性能预测方法,基于脱粒、 清选系统的工作参数对联合收获机作业性能-损失籽粒数进行预测。
联合收获机作业对象为水稻,输入参数包括风机转速、分风板角度、脱粒滚筒间隙,输出为籽 粒损失数,初始数据集样本容量为100。
采用k均值聚类方法识别数据集内部的野值,将包含野值和空值的数据从初始数据集中剔除, 保留剩余80个数据样本作为特征数据集。
采用5折交叉验证法对特征数据集进行实验。
如附图4所示,在实验过程中,将特征数据集分割成5个样本子集。在每次实验中,将一个单 独的样本子集保留作为损失数预测模型的验证集,其他4个样本子集作为训练集,构建籽粒损失数 预测模型。
在每次实验中,通过验证集检验所建立的籽粒损失数预测模型精度,采用决定系数R方(R2) 进行评价,定义如下:
Figure BDA0003773023750000121
yi是验证集中第i个样本的真实输出值;
Figure BDA0003773023750000122
是验证集中第i个样本的预测输出值;
n是验证集的样本容量;
Figure BDA0003773023750000123
是真实输出值的平均值。
R2越接近1,表明模型预测精度越高。
分别采用传统克里金法和本发明提供的一种基于克里金法和决策树的农机作业性能预测方法建 立的克里金农机作业性能预测模型为籽粒损失数预测模型。
交叉验证实验重复5次,如附图4所示。
通过第1次实验,详细说明数据建模与预测过程。
在实验Test-1中,共生成10棵基于克里金法的决策树,其中每棵决策树使用的样本为60个, 有放回地从总体数据集中选取。
结合生成的第1棵决策树说明本申请提供的一种基于克里金法和决策树的农机作业性能预测方 法中的基于克里金法的决策树的构建与预测过程。
第1棵决策树得到的树状结构划分规则如附图5所示,即根据风机转速数值是否大于1432.5 划分样本空间,得到每个子样本空间的籽粒损失数预测模型。
对于第1次实验验证集中的第1个样本数据,基于样本风机转速数值是否大于1432.5,将 其放入对应的籽粒损失数预测模型获得预测结果。
通过生成的10棵基于克里金法的决策树,如表1所示,为实施例1提供的10棵基于克里 金法的决策树的预测结果与平均结果。
表1籽粒损失数预测结果
决策树1 决策树2 决策树3 决策树4 决策树5 决策树6 决策树7 决策树8 决策树9 决策树10 平均值
40.258 40.623 37.507 40.653 39.529 37.390 38.113 39.187 40.830 40.859 39.495
对10棵基于克里金法的决策数据的预测结果取平均,即得到验证集中第1个样本数据的最 终预测结果。
通过5折交叉验证实验,比较本发明提供的一种基于克里金法和决策树的农机作业性能预测方 法与传统克里金法,实验结果如附图6所示。
从附图6可以看出,本发明提供的一种基于克里金法和决策树的农机作业性能预测方法的预测 精度R2:0.953,要远好于传统克里金法R2:0.742,R2提升0.211,表明本发明提供的一种基于克里 金法和决策树的农机作业性能预测方法能够准确刻画农机现场作业数据中作业参数与作业性能的关 联关系,提升农机作业性能预测模型的预测精度。
具体实施例2:
本实施例2提供一种实现所述基于克里金法和决策树的农机作业性能预测方法的装置,所 述装置可集成于但不限于联合收获机车载监测、远程监控、智慧农场等平台。
装置中的数据采集模块连接联合收获机车载监测平台的数据接口,获取联合收获机的现场 作业数据。
装置中的数据处理模块集成聚类、滤波、空值识别算法,识别和处理初始数据集中的野值、 噪声、空值等,形成特征数据集。
装置中的数据建模模块集成本发明提供的一种基于克里金法和决策树的农机作业性能预测 方法,用于基于特征数据集建立作业性能预测模型。
装置中的数据预测模块基于数据建模模块建立的作业性能预测模型,对新样本进行预测。
装置中的存储模块用于存储联合收获机现场作业初始数据集、特征数据集、作业性能预测 模型以及新样本预测结果。
在本实施例中,配置有本发明提供的一种基于克里金法和决策树的农机作业性能预测装置 的联合收获机用于收获水稻。
通过数据采集模块,由联合收获机车载监测平台获取联合收获机现场作业数据,导入数据处理 模块。
在数据处理模块中,利用k均值聚类、高斯滤波处理采集数据,形成特征数据集,导入数据建 模模块。
在数据建模模块中,利用本发明提供的所述基于克里金法和决策树的农机作业性能预测方法, 建立的克里金农机作业性能预测模型为清选损失数预测模型。
在数据预测模块中,基于联合收获机下次作业的输入参数,通过数据建模模块中的清选损失数 预测模型获取对应的预测值。
将初始现场作业数据集、特征数据集、清选损失数预测模型、清选损失数预测结果输入到存储 模块进行保存。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细 节,也不限制该发明的具体实施方式。本说明书选取并具体描述实施例,是为了更好地解释本发明 的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要 求书及其全部范围和等效物的限制。

Claims (10)

1.一种基于克里金法和决策树的农机作业性能预测方法,其特征在于,包括如下步骤:
步骤S1、构建基于克里金法的决策树,按照数据输入与输出关联关系划分样本空间,获得每个节点对应的克里金农机作业性能预测模型;
步骤S2、对于农机作业性能的待预测样本数据,根据步骤S1构建的基于克里金法的决策树获得的划分准则,将待预测样本数据归类至相应的节点,通过节点所属的克里金农机作业性能预测模型获取预测值;
步骤S3、利用集成学习提升克里金农机作业性能预测模型的泛化能力,针对总体训练数据集,生成m棵基于克里金法的决策树,对于每棵决策树,有放回地选取总体训练数据集中的α个样本作为训练集,根据所有决策树预测值的平均值作为最终预测结果。
2.根据权利要求1所述的基于克里金法和决策树的农机作业性能预测方法,其特征在于,所述步骤S1中,构建基于克里金法的决策树,按照数据输入与输出关联关系划分样本空间,包括如下步骤:
步骤S1)、将所有特征集放入决策树的根节点;
步骤S2)、在当前节点求解最优划分特征;
步骤S3)、如果当前节点满足停止条件,将当前节点视为叶节点,划分结束;
步骤S4)、如果当前节点不满足停止条件,根据最优划分特征将当前节点的样本空间划分为左、右两个子样本空间;
步骤S5)、针对每一个子样本空间,重复步骤S2)、步骤S3)、步骤S4)。
3.根据权利要求2所述的基于克里金法和决策树的农机作业性能预测方法,其特征在于,
所述步骤S2)中,所述最优划分特征获取包括以下步骤:
步骤S21)对于每一个数据输入参数,根据输入参数的上下界,均匀生成若干数值;
步骤S22)对当前输入参数的每一个数值,计算节点划分指标Sc,记录当前输入参数最优划分指标数值和对应输入参数数值;
步骤S23)比较所有输入参数的最优划分指标数值,将最优解视为节点的最优划分指标,将对应的划分输入参数和数值作为节点最优划分特征。
4.根据权利要求2所述的基于克里金法和决策树的农机作业性能预测方法,其特征在于,所述步骤S3)中,停止条件如下:当前节点划分指标Sc>0,或任一个划分子集的样本容量小于5d,d是输入参数的个数。
5.根据权利要求4所述的基于克里金法和决策树的农机作业性能预测方法,其特征在于,所述节点划分指标Sc通过如下公式建立:
Figure FDA0003773023740000021
yi,left是节点测试样本子集Samplestesting_left中第i个数据的真实输出值;
yi,right是节点测试样本子集Samplestesting_right中第i个数据的真实输出值;
yi,test是节点测试样本集Samplestesting中第i个数据的真实输出值;
Figure FDA0003773023740000022
是节点测试样本子集Samplestesting_left中第i个数据的预测输出值;
Figure FDA0003773023740000023
是节点测试样本子集Samplestesting_right中第i个数据的预测输出值;
Figure FDA0003773023740000024
是节点测试样本子集Samplestesting中第i个数据的预测输出值;
nleft是节点测试样本子集Samplestesting_left的样本数量;
nright是节点测试样本子集Samplestesting_right的样本数量;
ntest是节点测试样本集Samplestesting的样本数量。
6.根据权利要求1所述的基于克里金法和决策树的农机作业性能预测方法,其特征在于,所述步骤S3中,通过多棵基于克里金法的决策树的集成提升克里金农机作业性能预测模型的泛化能力,包括以下步骤:
步骤S31)有放回地从总体数据集中选取α个样本作为训练数据集,共进行m次,获得m个训练数据集;
步骤S32)利用获得的m个训练数据集,生成m棵基于克里金法的决策树;
步骤S33)对于待预测样本x*,通过每棵决策树获取其对应的预测值,通过如下公式计算其最终预测值:
Figure FDA0003773023740000025
Figure FDA0003773023740000026
是样本x*的最终预测值,
Figure FDA0003773023740000027
是第i棵基于克里金法的决策树给出的样本x*的预测值;
m是决策树的棵数。
7.根据权利要求1所述的基于克里金法和决策树的农机作业性能预测方法,其特征在于,所述步骤S3中,所述m为25,α为0.95n,n是所有训练数据的样本数量。
8.一种实现权利要求1-7任意一项所述基于克里金法和决策树的农机作业性能预测方法的装置,其特征在于,包括数据采集模块、数据处理模块、数据建模模块、数据预测模块和存储模块;
所述数据采集模块用于获取农机现场作业数据;
所述数据处理模块用于预处理农机现场作业数据,生成特征数据集;
所述数据建模模块用于根据基于克里金法和决策树的农机作业性能预测方法建立的克里金农机作业性能预测模型;
所述数据预测模块用于根据建立的农机作业性能预测模型,对新样本进行预测;
所述存储模块用于存储原始农机现场作业数据、农机现场作业数据特征集、作业性能预测模型、以及新样本的预测结果。
9.根据权利要求8所述的基于克里金法和决策树的农机作业性能预测方法的装置,其特征在于,所述数据采集模块用于连接农机车载监测系统、远程监控系统、智慧农场平台的数据接口,获取农机现场作业数据。
10.根据权利要求8所述的基于克里金法和决策树的农机作业性能预测方法的装置,其特征在于,所述数据建模模块用于构建基于克里金法的决策树,按照数据输入与输出关联关系划分样本空间,获得每个节点对应的克里金农机作业性能预测模型;
所述数据预测模块用于对于农机作业性能的待预测样本数据,根据构建的基于克里金法的决策树获得的划分准则,将待预测样本数据归类至相应的节点,通过节点所属的克里金农机作业性能预测模型获取预测值,利用集成学习提升克里金农机作业性能预测模型的泛化能力,针对总体训练数据集,生成m棵基于克里金法的决策树,对于每棵决策树,有放回地选取总体训练数据集中的α个样本作为训练集,根据所有决策树预测值的平均值作为最终预测结果。
CN202210907597.2A 2022-07-29 2022-07-29 一种基于克里金法和决策树的农机作业性能预测方法与装置 Active CN115423148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210907597.2A CN115423148B (zh) 2022-07-29 2022-07-29 一种基于克里金法和决策树的农机作业性能预测方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210907597.2A CN115423148B (zh) 2022-07-29 2022-07-29 一种基于克里金法和决策树的农机作业性能预测方法与装置

Publications (2)

Publication Number Publication Date
CN115423148A true CN115423148A (zh) 2022-12-02
CN115423148B CN115423148B (zh) 2023-10-31

Family

ID=84197018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210907597.2A Active CN115423148B (zh) 2022-07-29 2022-07-29 一种基于克里金法和决策树的农机作业性能预测方法与装置

Country Status (1)

Country Link
CN (1) CN115423148B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118095789A (zh) * 2024-04-23 2024-05-28 泰安市园林绿化管理服务中心 基于云计算的园林数据智能管理方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053071A (zh) * 2017-12-21 2018-05-18 宇星科技发展(深圳)有限公司 区域空气污染物浓度预测方法、终端及可读存储介质
US20190147350A1 (en) * 2016-04-27 2019-05-16 The Fourth Paradigm (Beijing) Tech Co Ltd Method and device for presenting prediction model, and method and device for adjusting prediction model
CN110222708A (zh) * 2019-04-29 2019-09-10 中国科学院计算技术研究所 一种基于集成决策树的跌倒检测方法和系统
CN110705115A (zh) * 2019-10-10 2020-01-17 北京北科融智云计算科技有限公司 一种基于深度置信网络的气象预报方法和系统
CN110796485A (zh) * 2019-10-11 2020-02-14 上海上湖信息技术有限公司 一种提高预测模型的预测精度的方法及装置
US20200201282A1 (en) * 2017-06-26 2020-06-25 Jiangnan University Energy consumption prediction system and method based on the decision tree for CNC lathe turning
WO2021022970A1 (zh) * 2019-08-05 2021-02-11 青岛理工大学 一种基于多层随机森林的零部件识别方法及系统
CN112699947A (zh) * 2020-12-30 2021-04-23 深圳前海微众银行股份有限公司 基于决策树的预测方法、装置、设备、介质及程序产品
WO2021127186A1 (en) * 2019-12-18 2021-06-24 Schlumberger Technology Corporation Methods and systems for subsurface modeling employing ensemble machine learning prediction trained with data derived from at least one external model
CN113096388A (zh) * 2021-03-22 2021-07-09 北京工业大学 一种基于梯度提升决策树的短时交通流量预测方法
US20220198340A1 (en) * 2020-12-22 2022-06-23 Sas Institute Inc. Automated machine learning test system

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190147350A1 (en) * 2016-04-27 2019-05-16 The Fourth Paradigm (Beijing) Tech Co Ltd Method and device for presenting prediction model, and method and device for adjusting prediction model
US20200201282A1 (en) * 2017-06-26 2020-06-25 Jiangnan University Energy consumption prediction system and method based on the decision tree for CNC lathe turning
CN108053071A (zh) * 2017-12-21 2018-05-18 宇星科技发展(深圳)有限公司 区域空气污染物浓度预测方法、终端及可读存储介质
CN110222708A (zh) * 2019-04-29 2019-09-10 中国科学院计算技术研究所 一种基于集成决策树的跌倒检测方法和系统
WO2021022970A1 (zh) * 2019-08-05 2021-02-11 青岛理工大学 一种基于多层随机森林的零部件识别方法及系统
CN110705115A (zh) * 2019-10-10 2020-01-17 北京北科融智云计算科技有限公司 一种基于深度置信网络的气象预报方法和系统
CN110796485A (zh) * 2019-10-11 2020-02-14 上海上湖信息技术有限公司 一种提高预测模型的预测精度的方法及装置
WO2021127186A1 (en) * 2019-12-18 2021-06-24 Schlumberger Technology Corporation Methods and systems for subsurface modeling employing ensemble machine learning prediction trained with data derived from at least one external model
US20220198340A1 (en) * 2020-12-22 2022-06-23 Sas Institute Inc. Automated machine learning test system
CN112699947A (zh) * 2020-12-30 2021-04-23 深圳前海微众银行股份有限公司 基于决策树的预测方法、装置、设备、介质及程序产品
CN113096388A (zh) * 2021-03-22 2021-07-09 北京工业大学 一种基于梯度提升决策树的短时交通流量预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吴晓欢;付金强;周训海;彭刚;陈敏;阮景;: "基于工业数据的生产过程故障预测方法研究", 智慧工厂, no. 11 *
毕云帆;张健;胥晓晖;孙文慧;张智晟;: "基于梯度提升决策树的电力短期负荷预测模型", 青岛大学学报(工程技术版), no. 03 *
赵佳楠;徐建华;卢德彬;杨东阳;毛婉柳;: "基于RF-LUR模型的PM_(2.5)空间分布模拟――以长江三角洲地区为例", 地理与地理信息科学, no. 01 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118095789A (zh) * 2024-04-23 2024-05-28 泰安市园林绿化管理服务中心 基于云计算的园林数据智能管理方法及系统

Also Published As

Publication number Publication date
CN115423148B (zh) 2023-10-31

Similar Documents

Publication Publication Date Title
Lv et al. Multivariate wind speed forecasting based on multi-objective feature selection approach and hybrid deep learning model
CN110680326B (zh) 基于深度卷积神经网络的尘肺病鉴别及分级判定方法
Suma et al. CNN based leaf disease identification and remedy recommendation system
CN110349666B (zh) 一种基于iabc-rf的icu心力衰竭患者死亡率的预测方法
CN115602337A (zh) 一种基于机器学习的刺激隐核虫疾病预警方法及系统
CN115423148B (zh) 一种基于克里金法和决策树的农机作业性能预测方法与装置
CN113221282A (zh) 基于贝叶斯残差卷积网络的航空发动机寿命预测方法
Hariri et al. Tipburn disorder detection in strawberry leaves using convolutional neural networks and particle swarm optimization
Kumar et al. Apple Sweetness Measurement and Fruit Disease Prediction Using Image Processing Techniques Based on Human‐Computer Interaction for Industry 4.0
CN114764682B (zh) 一种基于多机器学习算法融合的大米安全风险评估方法
Rai et al. Classification of diseased cotton leaves and plants using improved deep convolutional neural network
Rajakumar et al. Health monitoring and fault prediction using a lightweight deep convolutional neural network optimized by Levy flight optimization algorithm
da Silva et al. Tracking the connection between Brazilian agricultural diversity and native vegetation change by a machine learning approach
Karthiga et al. A Deep Learning Approach to classify the Honeybee Species and health identification
CN112149870B (zh) 一种基于ISODATA聚类与Elman神经网络的猪舍氨气浓度组合预测方法
Kumawat et al. Time-Variant Satellite Vegetation Classification Enabled by Hybrid Metaheuristic-Based Adaptive Time-Weighted Dynamic Time Warping
Mubarokah et al. Detection of Begomovirus Disease for Identification of Disease Severity Level in Tomato Leaves Using Convolutional Neural Network (CNN)
CN110109005B (zh) 一种基于序贯测试的模拟电路故障测试方法
CN102779241A (zh) 基于人工蜂群繁殖机制的ppi网络聚类方法
CN113127464A (zh) 农业大数据环境特征处理方法、装置及电子设备
CN115423005B (zh) 一种联合收获机大数据重构方法与装置
CN116612386A (zh) 基于分级检测双任务模型的辣椒病虫害识别方法及系统
CN114611804A (zh) 基于tso-grnn组合模型的玉米产量预测方法
CN116205508A (zh) 一种分布式光伏发电异常诊断方法和系统
Oprea et al. Evaluating Critical Disease Occurrence in Grapevine Leaves using CNN: Use-Case in Eastern Europe

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant