CN109426909B - 基于随机森林的耕地产能指数获取方法及装置 - Google Patents

基于随机森林的耕地产能指数获取方法及装置 Download PDF

Info

Publication number
CN109426909B
CN109426909B CN201710763273.5A CN201710763273A CN109426909B CN 109426909 B CN109426909 B CN 109426909B CN 201710763273 A CN201710763273 A CN 201710763273A CN 109426909 B CN109426909 B CN 109426909B
Authority
CN
China
Prior art keywords
farmland
index
productivity
capacity
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710763273.5A
Other languages
English (en)
Other versions
CN109426909A (zh
Inventor
杨永侠
李岳
张丽红
张函
郭亚萍
朱德海
杨建宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Priority to CN201710763273.5A priority Critical patent/CN109426909B/zh
Publication of CN109426909A publication Critical patent/CN109426909A/zh
Application granted granted Critical
Publication of CN109426909B publication Critical patent/CN109426909B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Agronomy & Crop Science (AREA)
  • Mining & Mineral Resources (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Quality & Reliability (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Processing (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供一种基于随机森林的耕地产能指数获取方法及装置。该方法包括:基于耕地产能赋分规则表和目标区域的耕地产能二级指标数据,获取所述目标区域的耕地产能二级指标评分;将所述耕地产能二级指标评分归一化后,输入基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得的耕地产能指数获取模型,获取所述目标区域的耕地产能指数。本发明直接获取目标区域的耕地产能指数,而无需再通过考察设置目标区域内二级指标和一级指标的权重,节省了工作量提高了工作效率。

Description

基于随机森林的耕地产能指数获取方法及装置
技术领域
本发明涉及耕地评价技术领域,更具体地,涉及一种基于随机森林的耕地产能指数获取方法及装置。
背景技术
耕地产能是指在一定地域、一定时期和一定的经济、社会、技术条件下所形成的耕地综合生产能力。耕地产能的评价对于国家从宏观上掌握我国耕地的生产力水平、健康程度、耕作效率以及可持续状况有重要意义。
目前,最常用的耕地产能评价方法是通过在地理信息系统平台上,对目标区域内影响耕地产能的各二级指标进行评分并赋予权重;根据一级指标包括的二级指标的评分和权重,获取各一级指标的评分并对各一级指标赋予权重;根据各一级指标的评分和权重,获得目标区域的耕地产能指数。
上述方法中各指标的权重均是通过对目标区域耕地的考察人为设定的,而权重的设定易受人为主观因素的影响,会导致耕地产能指数无法客观地反映耕地产能的实际情况。此外,具有相同指标类耕地但指标评分差异过大的耕地需采用不同的权重计算耕地产能指数,增加了耕地考察工作量,降低了工作效率。
发明内容
本发明提供一种基于随机森林的耕地产能指数获取方法及装置,以克服现有技术中,人为设定权重易受主观因素的影响,导致耕地产能指数无法客观地反映耕地产能以及具有相同指标类耕地但指标评分差异过大的耕地需采用不同的权重计算耕地产能指数,导致耕地考察工作量增加,工作效率降低的情况。
根据本发明的第一方面,提供一种基于随机森林的耕地产能指数获取方法,该方法包括:步骤1,基于耕地产能赋分规则表和目标区域的耕地产能二级指标数据,获取所述目标区域的耕地产能二级指标评分;步骤2,将所述耕地产能二级指标评分归一化后,基于耕地产能指数获取模型,获取所述目标区域的耕地产能指数;其中,所述耕地产能指数获取模型为基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得。
结合本发明第一方面的第一种可能实现方式,在第二种可能实现方式中,所述步骤1之前还包括:获取所述样本区域内所有耕地图斑的耕地产能二级指标评分和耕地产能指数;基于所述样本区域内所有耕地图斑,获取第一预设数目个图斑集;基于所述第一预设数目个图斑集中图斑的归一化耕地产能二级指标评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型。
结合本发明第一方面的第二种可能实现方式,在第三种可能实现方式中,所述基于所述样本区域内所有耕地图斑,获取第一预设数目个图斑集具体包括:利用自助抽样法,重复所述第一预设数目次从所述样本区域内所有耕地图斑中有放回地抽取一定数目的图斑,获取所述第一预设数目各图斑集。
结合本发明第一方面的第二种可能实现方式,在第四种可能实现方式中,所述基于所述第一预设数目个图斑集中图斑的归一化耕地产能二级指标评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型具体包括:获取各所述二级指标的变量重要性数值;基于所述第一预设数目个图斑集中图斑的变量重要性数值较大的第二预设数目个耕地产能二级指标的归一化评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型;所述第二预设数目小于等于所述第一预设数目。
结合本发明第一方面的第二种可能实现方式,在第五种可能实现方式中,所述获取各所述二级指标的变量重要性数值具体包括:对于每一个二级指标,获取每一所述图斑集对应回归树的袋外误差与该回归树对应袋外数据中该二级指标的随机修改值之差;基于所述一预设数目个所述差的平均值,获取该二级指标的变量重要性数值。
结合本发明第一方面的第五种可能实现方式,在第六种可能实现方式中,任一所述二级指标Xj的变量重要性数值V(Xj)获取方式为:
Figure BDA0001393610390000031
其中,et为随机森林中第t个回归树的袋外误差,
Figure BDA0001393610390000032
为随机改变袋外数据第j个指标Xj的值后第t个回归树产生的新的袋外误差,N为回归树的个数。
结合本发明第一方面的第二种可能实现方式,在第七种可能实现方式中,所述归一化具体包括:基于所述耕地产能赋分规则表中各二级指标的最高预设分值和最低预设分值,对各所述二级指标评分进行归一化。
结合本发明第一方面的第七种可能实现方式,在第八种可能实现方式中,所述归一化公式如下:
Figure BDA0001393610390000033
其中,K为归一化后的二级指标评分,xi为一项二级指标评分,xmax为所述耕地产能赋分规则表中该项二级指标的最高预设分值,xmin为所述耕地产能赋分规则表中该项二级指标的最低预设分值。
根据本发明的第二方面,提供一种基于随机森林的耕地产能指数获取装置。该装置包括:评分获取模块和耕地产能指数获取模块;所述评分获取模块,用于基于耕地产能赋分规则表和目标区域的耕地产能二级指标数据,获取所述目标区域的耕地产能二级指标评分;所述耕地产能指数获取模块,用于将所述耕地产能二级指标评分归一化后,基于耕地产能指数获取模型,获取所述目标区域的耕地产能指数;其中所述耕地产能指数获取模型为基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得。
本发明提出的基于随机森林的耕地产能指数获取方法及装置,通过基于目标区域归一化的耕地产能二级指标评分,基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得的耕地产能指数获取模型,直接获取目标区域的耕地产能指数,而无需再通过考察设置目标区域内二级指标和一级指标的权重,节省了工作量提高了工作效率。此外,目标区域内的耕地产能指数的获取不再依赖于目标区域内二级指标和一级指标的权重,降低了主观因素对耕地产能指数准确性的影响。
附图说明
图1为根据本发明实施例的基于随机森林的耕地产能指数获取方法流程图;
图2为根据本发明实施例的基于随机森林的耕地产能指数获取装置流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,根据本发明的第一方面,提供一种基于随机森林的耕地产能指数获取方法,该方法包括:步骤1,基于耕地产能赋分规则表和目标区域的耕地产能二级指标数据,获取所述目标区域的耕地产能二级指标评分;步骤2,将所述耕地产能二级指标评分归一化后,基于耕地产能指数获取模型,获取所述目标区域的耕地产能指数;其中,所述耕地产能指数获取模型为基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得。
全国耕地分为12个一级区,这12个一级区又共分为42个二级区。属于同一个二级区的县域共用一份耕地产能赋分规则表,具有相同的耕地产能二级指标和指标赋分规则。在本实施例中,目标区域和样本区域可以为任意同一二级区中的两个县域或者为具有相同的耕地产能指标和指标赋分规则的区域。耕地产能赋分规则表为业内在进行耕地产能评价时进行耕地产能二级指标评分的通用表。表1示出了一级区为黄土高原区,二级区为宁南陇中青东黄土高原区的耕地产能赋分规则表的部分内容。对于耕地产能赋分规则表中任一二级指标的数据,例如:有效土层厚度,数据为70cm,可获得有效土层厚度这一二级指标的评分,评分为70分。
在本实施例中,耕地产能指数获取模型是由与目标区域具有相同耕地产能二级指标的样本区域的归一化耕地产能二级指标评分和耕地产能指数训练而得,很好的拟合了归一化耕地产能二级指标评分与耕地产能指数的对应关系,因而可推广用于与样本区域具有相同耕地产能二级指标的其他区域。
本发明提出的基于随机森林的耕地产能指数获取方法,通过基于目标区域归一化的耕地产能二级指标评分,基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得的耕地产能指数获
表1
Figure BDA0001393610390000061
取模型,直接获取目标区域的耕地产能指数,而无需再通过考察设置目标区域内二级指标和一级指标的权重,节省了工作量提高了工作效率。此外,目标区域内的耕地产能指数的获取不再依赖于目标区域内二级指标和一级指标的权重,降低了主观因素对耕地产能指数准确性的影响。
作为一种可选实施例,所述步骤1之前还包括:获取所述样本区域内所有耕地图斑的耕地产能二级指标评分和耕地产能指数;基于所述样本区域内所有耕地图斑,获取第一预设数目个图斑集;基于所述第一预设数目个图斑集中图斑的归一化耕地产能二级指标评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型。
在本实施例中,训练耕地产能指数获取模型所采用的样本数据包括输入数据和输出数据的真实值。其中,输入数据为按照上述二级指标评分获取方法得到的样本区域的耕地产能二级指标评分进行归一化后的数据,在此不再复述;输出数据的真实值为根据现有技术中耕地产能指数计算方法得到的样本区域的耕地产能指数。即基于现有权重获取方法,获取耕地产能各二级指标的权重和各一级指标的权重。基于各一级指标包含的二级指标,利用图斑的耕地产能二级指标评分和对应权重,获取各一级指标的评分。根据各一级指标的评分和权重,获得图斑的耕地产能指数。为了获取精度较高的耕地产能指数获取模型,采用多组样本数据进行训练,即基于样本区域内所有耕地图斑,获取第一预设数目个图斑集,获取方法不做具体限定。每一个图斑图中包含至少一个图斑,每个图斑具有对应的耕地产能二级指标评分和耕地产能指数。第一预设数目可根据经验选取,在此不做限定。当利用随机森林算法得到的耕地产能指数和基于现有技术中耕地产能指数计算方法得到耕地产能指数的误差过大,可逐渐增加用于训练模型的图斑集的数目,直至误差满足要求。此时的随机森林算法便为耕地产能指数获取模型。所述误差可根据实际情况设定,在此不做限定。
作为一种可选实施例,所述基于所述样本区域内所有耕地图斑,获取第一预设数目个图斑集具体包括:利用自助抽样法,重复所述第一预设数目次从所述样本区域内所有耕地图斑中有放回地抽取一定数目的图斑,获取所述第一预设数目各图斑集。
在本实施例中,若所述样本区域内所有耕地图斑数目为N,则从N个图斑中抽取一个图斑作为第一个图斑集的元素;将该抽中的图斑放回,再次从N个图斑中抽取一个图斑作为第一个图斑集的元素,直至第一个图斑集中有所述一定数目个图斑。同样地方法,获取第二个图斑集、第三个图斑集、……、第一预设数目个图斑集。
作为一种可选实施例,所述基于所述第一预设数目个图斑集中图斑的归一化耕地产能二级指标评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型具体包括:获取各所述二级指标的变量重要性数值;基于所述第一预设数目个图斑集中图斑的变量重要性数值较大的第二预设数目个耕地产能二级指标的归一化评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型;所述第二预设数目小于等于所述第一预设数目。
在本实施例中,为减少模型训练过程中的数据运算量,从所有二级指标中选择变量重要性数值较大的若干二级指标用于进行模型训练。其中,一项二级指标的变量重要性数值为各图斑集对应的回归树的袋外误差与随机改变该回归树的袋外数据中该二级指标评分产生的新的袋外误差之差的总和的平均值。二级指标的变量重要性数值越大,表明该二级指标对于获取准确的耕地产能指数所起的决定性作用越大。在训练模型时,根据变量重要性数值选择的二级指标的数目可根据实际情况自行设定,本实施例对此不作限定。当根据选定的若干个变量重要性数值较大的二级指标训练得到的模型的准确率小于期望准确率时,可根据变量重要性数值适当增加二级指标的数目。其中,期望准确率和增加的二级指标的数目可根据实际情况确定,本实施例对此不作限定。
作为一种可选实施例,所述获取各所述二级指标的变量重要性数值具体包括:对于每一个二级指标,获取每一所述图斑集对应回归树的袋外误差与该回归树对应袋外数据中该二级指标的随机修改值之差;基于所述一预设数目个所述差的平均值,获取该二级指标的变量重要性数值。
作为一种可选实施例,任一所述二级指标Xj的变量重要性数值V(Xj)获取方式为:
Figure BDA0001393610390000091
其中,et为随机森林中第t个回归树的袋外误差,
Figure BDA0001393610390000092
为随机改变袋外数据第j个指标Xj的值后第t个回归树产生的新的袋外误差,N为回归树的个数。
在本实施例中,具体根据上式计算各二级指标的变量重要性数值。
作为一种可选实施例,所述归一化具体包括:基于所述耕地产能赋分规则表中各二级指标的最高预设分值和最低预设分值,对各所述二级指标评分进行归一化。
在本实施例中,以二级指标为有效土层厚度时为例,由表1可知,最高预设分值为100,最低预设分值为30。
作为一种可选实施例,所述归一化公式如下:
Figure BDA0001393610390000093
其中,K为归一化后的二级指标评分,xi为一项二级指标评分,xmax为所述耕地产能赋分规则表中该项二级指标的最高预设分值,xmin为所述耕地产能赋分规则表中该项二级指标的最低预设分值。
在本实施例中,以二级指标为有效土层厚度时为例,当有效土层厚度为70cm时,评分为70分,按上式进行归一化:K=(70-30)/(100-30)=4/7。
如图2所示,根据本发明的第二方面,提供一种基于随机森林的耕地产能指数获取装置。该装置包括:评分获取模块和耕地产能指数获取模块;所述评分获取模块,用于基于耕地产能赋分规则表和目标区域的耕地产能二级指标数据,获取所述目标区域的耕地产能二级指标评分;所述耕地产能指数获取模块,用于将所述耕地产能二级指标评分归一化后,输入耕地产能指数获取模型,获取所述目标区域的耕地产能指数;所述耕地产能指数获取模型为基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得。
本发明提出的基于随机森林的耕地产能指数获取装置,通过评分获取模块和耕地产能指数获取模块,基于目标区域归一化的耕地产能二级指标评分,基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得的耕地产能指数获取模型,直接获取目标区域的耕地产能指数,而无需再通过考察设置目标区域内二级指标和一级指标的权重,节省了工作量提高了工作效率。此外,目标区域内的耕地产能指数的获取不再依赖于目标区域内二级指标和一级指标的权重,降低了主观因素对耕地产能指数准确性的影响。
作为一种可选实施例,所述装置还包括:第一获取单元,用于获取所述样本区域内所有耕地图斑的耕地产能二级指标评分和耕地产能指数;第二获取单元,用于基于所述样本区域内所有耕地图斑,获取第一预设数目个图斑集;训练单元,用于基于所述第一预设数目个图斑集中图斑的归一化耕地产能二级指标评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型。
作为一种可选实施例,所述第二获取单元,具体用于利用自助抽样法,重复所述第一预设数目次从所述样本区域内所有耕地图斑中有放回地抽取一定数目的图斑,获取所述第一预设数目各图斑集。
作为一种可选实施例,所述训练单元,具体用于获取各所述二级指标的变量重要性数值;基于所述第一预设数目个图斑集中图斑的变量重要性数值较大的第二预设数目个耕地产能二级指标的归一化评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型;所述第二预设数目小于等于所述第一预设数目。
作为一种可选实施例,所述训练单元还具体用于对于每一个二级指标,获取每一所述图斑集对应回归树的袋外误差与该回归树对应袋外数据中该二级指标的随机修改值之差;基于所述一预设数目个所述差的平均值,获取该二级指标的变量重要性数值。
作为一种可选实施例,所述耕地产能指数获取模块还具体用于基于所述耕地产能赋分规则表中各二级指标的最高预设分值和最低预设分值,对各所述二级指标评分进行归一化。
最后,本发明的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于随机森林的耕地产能指数获取方法,其特征在于,包括:
步骤1,基于耕地产能赋分规则表和目标区域的耕地产能二级指标数据,获取所述目标区域的耕地产能二级指标评分;
步骤2,将所述耕地产能二级指标评分归一化后,基于耕地产能指数获取模型,获取所述目标区域的耕地产能指数;
其中,所述耕地产能指数获取模型为基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得;
所述步骤1之前还包括:
获取所述样本区域内所有耕地图斑的耕地产能二级指标评分和耕地产能指数;
基于所述样本区域内所有耕地图斑,获取第一预设数目个图斑集;
基于所述第一预设数目个图斑集中图斑的归一化耕地产能二级指标评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型;
所述基于所述样本区域内所有耕地图斑,获取第一预设数目个图斑集具体包括:
利用自助抽样法,重复所述第一预设数目次从所述样本区域内所有耕地图斑中有放回地抽取一定数目的图斑,获取所述第一预设数目各图斑集;
所述基于所述第一预设数目个图斑集中图斑的归一化耕地产能二级指标评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型具体包括:
获取各所述二级指标的变量重要性数值;
基于所述第一预设数目个图斑集中图斑的变量重要性数值较大的第二预设数目个耕地产能二级指标的归一化评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型;所述第二预设数目小于等于所述第一预设数目。
2.根据权利要求1所述的方法,其特征在于,所述获取各所述二级指标的变量重要性数值具体包括:
对于每一个二级指标,获取每一所述图斑集对应回归树的袋外误差与该回归树对应袋外数据中该二级指标的随机修改值之差;
基于所述一预设数目个所述差的平均值,获取该二级指标的变量重要性数值。
3.根据权利要求2所述的方法,其特征在于,任一所述二级指标Xj的变量重要性数值V(Xj)获取方式为:
Figure FDA0002848870320000021
其中,et为随机森林中第t个回归树的袋外误差,
Figure FDA0002848870320000022
为随机改变袋外数据第j个指标Xj的值后第t个回归树产生的新的袋外误差,N为回归树的个数。
4.根据权利要求1所述的方法,其特征在于,所述归一化具体包括:
基于所述耕地产能赋分规则表中各二级指标的最高预设分值和最低预设分值,对各所述二级指标评分进行归一化。
5.根据权利要求4所述的方法,其特征在于,所述归一化公式如下:
Figure FDA0002848870320000031
其中,K为归一化后的二级指标评分,xi为一项二级指标评分,xmax为所述耕地产能赋分规则表中该项二级指标的最高预设分值,xmin为所述耕地产能赋分规则表中该项二级指标的最低预设分值。
6.一种基于随机森林的耕地产能指数获取装置,其特征在于,包括:评分获取模块和耕地产能指数获取模块;
所述评分获取模块,用于基于耕地产能赋分规则表和目标区域的耕地产能二级指标数据,获取所述目标区域的耕地产能二级指标评分;
所述耕地产能指数获取模块,用于将所述耕地产能二级指标评分归一化后,基于耕地产能指数获取模型,获取所述目标区域的耕地产能指数;其中,所述耕地产能指数获取模型为基于随机森林算法,由与所述目标区域采用相同赋分规则的样本区域的归一化耕地产能二级指标评分和耕地产能指数分别作为输入和输出训练而得;
第一获取单元,用于获取所述样本区域内所有耕地图斑的耕地产能二级指标评分和耕地产能指数;第二获取单元,用于基于所述样本区域内所有耕地图斑,获取第一预设数目个图斑集;训练单元,用于基于所述第一预设数目个图斑集中图斑的归一化耕地产能二级指标评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型;
所述基于所述样本区域内所有耕地图斑,获取第一预设数目个图斑集具体包括:
利用自助抽样法,重复所述第一预设数目次从所述样本区域内所有耕地图斑中有放回地抽取一定数目的图斑,获取所述第一预设数目各图斑集;
所述基于所述第一预设数目个图斑集中图斑的归一化耕地产能二级指标评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型具体包括:
获取各所述二级指标的变量重要性数值;
基于所述第一预设数目个图斑集中图斑的变量重要性数值较大的第二预设数目个耕地产能二级指标的归一化评分和耕地产能指数,对随机森林进行训练,得到耕地产能指数获取模型;所述第二预设数目小于等于所述第一预设数目。
CN201710763273.5A 2017-08-30 2017-08-30 基于随机森林的耕地产能指数获取方法及装置 Expired - Fee Related CN109426909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710763273.5A CN109426909B (zh) 2017-08-30 2017-08-30 基于随机森林的耕地产能指数获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710763273.5A CN109426909B (zh) 2017-08-30 2017-08-30 基于随机森林的耕地产能指数获取方法及装置

Publications (2)

Publication Number Publication Date
CN109426909A CN109426909A (zh) 2019-03-05
CN109426909B true CN109426909B (zh) 2021-04-13

Family

ID=65502037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710763273.5A Expired - Fee Related CN109426909B (zh) 2017-08-30 2017-08-30 基于随机森林的耕地产能指数获取方法及装置

Country Status (1)

Country Link
CN (1) CN109426909B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101546421A (zh) * 2009-04-01 2009-09-30 河北农业大学 一种基于gis的省域可比耕地质量评价方法
CN105868923A (zh) * 2016-04-21 2016-08-17 重庆市勘测院 基于多要素耦合模型的资源环境承载力评价方法
CN106952170A (zh) * 2017-02-20 2017-07-14 中国农业大学 一种基于随机森林的县域耕地自然质量评价方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170270446A1 (en) * 2015-05-01 2017-09-21 360 Yield Center, Llc Agronomic systems, methods and apparatuses for determining yield limits
US9721181B2 (en) * 2015-12-07 2017-08-01 The Climate Corporation Cloud detection on remote sensing imagery

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101546421A (zh) * 2009-04-01 2009-09-30 河北农业大学 一种基于gis的省域可比耕地质量评价方法
CN105868923A (zh) * 2016-04-21 2016-08-17 重庆市勘测院 基于多要素耦合模型的资源环境承载力评价方法
CN106952170A (zh) * 2017-02-20 2017-07-14 中国农业大学 一种基于随机森林的县域耕地自然质量评价方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于支持向量机的标准农田地力等级评价-以浙江省温州市鹿城区为例;赖红松 等;《土壤学报》;20120930;第49卷(第5期);摘要、第2.5、3节 *

Also Published As

Publication number Publication date
CN109426909A (zh) 2019-03-05

Similar Documents

Publication Publication Date Title
CN110210434A (zh) 病虫害识别方法及装置
CN106952170A (zh) 一种基于随机森林的县域耕地自然质量评价方法
CN111783516A (zh) 一种基于深度学习的耕地质量自然等级评价方法
CN104182629A (zh) 一种基于主成分分析的烟支物理指标综合稳定性表征方法
CN106530104A (zh) 种植区生产适宜性的评价方法及装置
CN114820532A (zh) 一种蝗区分析方法及装置
CN109426909B (zh) 基于随机森林的耕地产能指数获取方法及装置
CN108985641A (zh) 一种项目分级管理评价方法
CN104572900B (zh) 一种作物育种评价的性状特征选择方法
CN111191386A (zh) 一种多尺度相容的林木年生长模型组建模方法
CN105403666B (zh) 甘蔗脱叶性的评价指标筛选及评价方法
Araújo et al. Appropriate search techniques to estimate Weibull function parameters in a Pinus spp. plantation
JP6815229B2 (ja) 答案採点システム及び答案採点方法
CN109377017A (zh) 一种信息系统实用化及数据健康度评价方法
CN115909063A (zh) 一种中分辨率水稻提取方法及系统
Madi et al. Univariate models to represent the diametric distribution of thinned stand of Tectona grandis Linn. F
CN110033187B (zh) 一种基于环境数据的指标数据获取方法
Teixeira et al. Principal component analysis on morphological traits teixeira, in juvenile stage arabica coffee
Tennent Individual-tree growth model for Pinus radiata
CN109086359A (zh) 一种基于大数据的防浪林树种评估方法
Van Laar Bark thickness and bark volume of Pinus patula in South Africa
CN110363442B (zh) 获取省域耕地自然等指数的方法及装置
CN117746306B (zh) 一种基于图像处理的林木病虫害识别方法和系统
CN109447502A (zh) 一种多准则综合评价方法及装置
CN109360116B (zh) 获取县域作物生产潜力指数的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210413

Termination date: 20210830

CF01 Termination of patent right due to non-payment of annual fee