CN113673866A - 农作物决策方法、模型训练方法以及相关设备 - Google Patents
农作物决策方法、模型训练方法以及相关设备 Download PDFInfo
- Publication number
- CN113673866A CN113673866A CN202110961661.0A CN202110961661A CN113673866A CN 113673866 A CN113673866 A CN 113673866A CN 202110961661 A CN202110961661 A CN 202110961661A CN 113673866 A CN113673866 A CN 113673866A
- Authority
- CN
- China
- Prior art keywords
- crop
- candidate
- decision
- feature
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 104
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000012360 testing method Methods 0.000 claims abstract description 47
- 238000000605 extraction Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 230000008030 elimination Effects 0.000 claims description 6
- 238000003379 elimination reaction Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 description 10
- 241000219109 Citrullus Species 0.000 description 9
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000007667 floating Methods 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 241001491882 Ecliptopera silaceata Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001428166 Eucheuma Species 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 244000157072 Hylocereus undatus Species 0.000 description 1
- 235000018481 Hylocereus undatus Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- -1 etc.) Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000002688 soil aggregate Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
- Development Economics (AREA)
- Agronomy & Crop Science (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种农作物决策方法、模型训练方法以及相关设备,农作物决策模型训练方法,包括:提取农作物的历史种植数据的候选特征集合,所述候选特征集合包括多个候选特征;利用特征选择模型,自所述候选特征集合中选择多个特征;生成训练样本以及测试样本,所述训练样本以及测试样本包括农作物的品种以及所述农作物的品种的多个所选择特征;根据所述训练样本训练农作物决策模型,并根据所述测试样本测试所训练的农作物决策模型。本发明实现农作物种植品种的最优决策,从而提高农作物种植品质和种植产量。
Description
技术领域
本发明涉及计算机应用领域,尤其涉及一种农作物决策方法、模型训练方法以及相关设备。
背景技术
目前,农作物的种植通常凭借种植者的经验,根据种植地的地理位置、天气来确定在种植地的地理位置种植何种农作物。然而,这样的方式,可能存在经验误差,使得实际种植了不适宜种植在当前种植地的农作物品种,导致种植失败。此外,凭借经验的种植,很有可能使得种植的农作物并非是最适合种植在当前种植地的农作物,从而无法获得品质、产量良好的农作物收成。
由此,如何实现种植何种农作物的最优决策,从而提高农作物种植品质和种植产量,是本领域亟待解决的技术问题。
发明内容
本发明为了克服上述相关技术存在的缺陷,提供一种农作物决策方法、模型训练方法以及相关设备,以实现农作物种植品种的最优决策,从而提高农作物种植品质和种植产量。
根据本发明的一个方面,提供一种农作物决策模型训练方法,包括:
提取农作物的历史种植数据的候选特征集合,所述候选特征集合包括多个候选特征;
利用特征选择模型,自所述候选特征集合中选择多个特征;
生成训练样本以及测试样本,所述训练样本以及测试样本包括农作物的品种以及所述农作物的品种的多个所选择特征;
根据所述训练样本训练农作物决策模型,并根据所述测试样本测试所训练的农作物决策模型。
在本发明的一些实施例中,所述提取农作物的历史种植数据的候选特征集合包括:
对所述农作物的历史种植数据进行预处理,所述预处理包括如下预处理步骤中的一项或多项:
去除不完整的农作物的历史种植数据;
去除冗余的农作物的历史种植数据;
将农作物的历史种植数据的数据格式转换为标准数据格式,所述标准数据格式包括预先设置的数据位长度、数据名称、计量单位中的一项或多项。
在本发明的一些实施例中,所述利用特征选择模型,自所述候选特征集合中选择多个特征包括:
利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序;
根据所述候选特征集合中的候选特征的排序顺序选取排序在前的多个候选特征作为所选择特征。
在本发明的一些实施例中,所述利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序,包括:
迭代执行特征剔除步骤,直至所述候选特征集合为空,
其中,所述特征剔除步骤包括:
利用特征排序模型对所述候选特征集合中的多个候选特征进行排序;
按所述排序顺序自所述候选特征集合中剔除一候选特征;
其中,当所述候选特征集合为空时,按所述候选特征的剔除顺序输出所述候选特征集合中的候选特征的排序顺序。
在本发明的一些实施例中,所述利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序,包括:
利用多个具有权重的特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
在本发明的一些实施例中,所述利用多个具有权重的特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序包括:
利用多个特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的多个准排序顺序;
对每一所述候选特征,计算该候选特征基于各特征选择模型获得的准排序顺序的序号的加权和,作为该候选特征的排序系数;
根据所述排序系数,对各所述候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
在本发明的一些实施例中,所述利用多个具有权重的特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序包括:
利用多个特征选择模型,计算所述候选特征集合中各所述候选特征的准排序系数;
对每一所述候选特征,计算该候选特征基于各特征选择模型获得的准排序系数的加权和,作为该候选特征的排序系数;
根据所述排序系数,对各所述候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
在本发明的一些实施例中,所述农作物决策模型根据如下步骤决策输出所述农作物的品种:
计算输入的多个所选择特征形成的特征集合与特征空间中的多个特征集合的特征距离;
确定与输入的特征集合的特征距离最近的特征空间中的K个特征集合对应的农作物的品种作为候选品种,K为大于1的整数;
确定K个特征集合中,各所述候选品种对应的特征集合的数量;
将对应的特征集合的数量最多的候选品种作为决策输出的所述农作物的品种。
在本发明的一些实施例中,所述农作物决策模型包括多个农作物子决策模型。
在本发明的一些实施例中,所述农作物决策模型根据如下步骤决策输出所述农作物的品种:
根据输入的多个所选择特征形成的特征集合,获得各所述农作物子决策模型输出的所述农作物的准品种;
将输出数量最多的农作物的准品种,作为所述农作物决策模型决策输出的所述农作物的品种。
在本发明的一些实施例中,所述将数量最多的农作物的准品种,作为所述农作物决策模型决策输出的所述农作物的品种包括:
根据输入的多个所选择特征形成的特征集合,获得各所述农作物子决策模型输出的所述农作物的各准品种的概率;
对所述农作物的每一准品种,计算该准品种利用各农作物子决策模型输出的概率的加权和,作为该准品种的决策概率;
将决策概率最高的该准品种,作为所述农作物决策模型决策输出的所述农作物的品种。
在本发明的一些实施例中,所述训练样本以及测试样本还包括各农作物的品种的产量。
根据本发明的又一方面,还提供一种农作物决策方法,包括:
提取设定土地区域的种植数据的多个特征;
将所提取的多个特征输入农作物决策模型,所述农作物决策模型经由如上所述的农作物决策模型训练方法训练;
获取所述农作物决策模型决策输出的农作物的品种。
在本发明的一些实施例中,所述训练样本以及测试样本还包括各农作物的品种的产量,所述获取所述农作物决策模型决策输出的农作物的品种还包括:
获取所述农作物决策模型决策输出的农作物的品种的预测产量。
根据本发明的又一方面,还提供一种农作物决策模型训练装置,包括:
第一提取模块,配置成提取农作物的历史种植数据的候选特征集合,所述候选特征集合包括多个候选特征;
选择模块,配置成利用特征选择模型,自所述候选特征集合中选择多个特征;
生成模块,配置成生成训练样本以及测试样本,所述训练样本以及测试样本包括农作物的品种以及所述农作物的品种的多个所选择特征;
训练模块,配置成根据所述训练样本训练农作物决策模型,并根据所述测试样本测试所训练的农作物决策模型。
根据本发明的又一方面,还提供一种农作物决策装置,包括:
第二提取模块,配置成提取设定土地区域的种植数据的多个特征;
输入提取模块,配置成将所提取的多个特征输入农作物决策模型,所述农作物决策模型经由如上所述的农作物决策模型训练方法训练;
获取模块,配置成获取所述农作物决策模型决策输出的农作物的品种。
根据本发明的又一方面,还提供一种电子设备,所述电子设备包括:处理器;存储介质,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行如上所述的步骤。
根据本发明的又一方面,还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上所述的步骤。
相比现有技术,本发明的优势在于:
一方面,通过历史种植数据生成的训练样本和测试样本对农作物决策模型进行训练,从而能够对需要种植的农作物的决策提供智能的决策模型;另一方面,通过对用于生成训练样本和测试样本的农作物的历史种植数据的候选特征集合的特征选择,从而有效降低模型所需处理的数量,提高模型训练和模型决策效率;再一方面,可以通过所训练的智能决策模型实现农作物种植品种的最优决策,从而提高农作物种植品质和种植产量。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显。
图1示出了根据本发明实施例的农作物决策模型训练方法的流程图。
图2示出了根据本发明实施例的利用特征选择模型,自所述候选特征集合中选择多个特征的流程图。
图3示出了根据本发明一实施例的利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序的流程图。
图4示出了根据本发明另一实施例的利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序的流程图。
图5示出了根据本发明再一实施例的利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序的流程图。
图6示出了根据本发明一实施例的农作物决策模型决策输出的流程图。
图7示出了根据本发明又一实施例的农作物决策模型决策输出的流程图。
图8示出了根据本发明再一实施例的农作物决策模型决策输出的流程图。
图9示出了根据本发明实施例的农作物决策方法的流程图。
图10示出了根据本发明实施例的农作物决策模型训练装置的模块图。
图11示出了根据本发明实施例的农作物决策装置的模块图。
图12示意性示出本发明示例性实施例中一种计算机可读存储介质示意图。
图13示意性示出本发明示例性实施例中一种电子设备示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。
图1示出了根据本发明实施例的农作物决策模型训练方法的流程图。农作物决策模型训练方法包括如下步骤:
步骤S110:提取农作物的历史种植数据的候选特征集合,所述候选特征集合包括多个候选特征。
具体而言,历史种植数据例如可以包括农作物名称、品种、土地环境数据、自然(种植)环境数据等。土地环境数据例如可以包括Ph(酸碱)值、矿物质含量、有机质含量(氮、锌、磷、钾等)、空气含量、水含量、土壤团粒等。自然(种植)环境数据例如可以降雨量、气候温度、光照时长、季风等。
具体而言,步骤S110可以包括对所述农作物的历史种植数据进行预处理的步骤。
例如,在预处理的步骤中可以去除不完整的农作物的历史种植数据。不完整的农作物的历史种植数据包括单项不完整的历史种植数据和/或一条不完整的历史种植数据。单项历史种植数据为土地环境数据/自然环境数据/农作物名称/品种中任一个单项数据。一条历史种植数据为包含土地环境数据、自然环境数据、农作物名称以及品种的历史种植数据。不完整可以包括数据为空、数据缺漏从而无法指示到具体的数据含义等。
例如,在预处理的步骤中可以去除冗余的农作物的历史种植数据。具体而言,冗余的农作物的历史种植数据可以为重复的历史种植数据。例如,对于同一农作物名称以及品种的农作物的同一条自然环境数据中,包含了两个相同的温度数据,由此,可以去除重复的温度数据。
例如,在预处理的步骤中可以将农作物的历史种植数据的数据格式转换为标准数据格式,所述标准数据格式包括预先设置的数据位长度、数据名称、计量单位中的一项或多项。其中,通过将农作物的历史种植数据的数据格式转换为标准数据格式,以便于对历史种植数据执行特征提取和后续的模型训练。
进一步地,在进行预处理中,可以使用过滤器(filter)、封装(wrapper)或嵌入(embedded)的方式来实现,本发明并非以此为限制。
在一些实施例中,步骤S110的特征提取可以通过如下方式实现:根据所要提取的特征的名称、数据格式,自农作物的历史种植数据中提取对应的候选特征,并将提取的多个候选特征加入候选特征集合。
步骤S120:利用特征选择模型,自所述候选特征集合中选择多个特征。
具体而言,步骤S120通过特征选择模型选取对农作物决策影响更大,与农作物更相关的的多个特征,以在保证模型准确度的同时,减少所需处理的特征数量,提高模型训练和决策效率。步骤S120的具体实现将在下文中分别结合图2至图5进行描述,在此不予赘述。
步骤S130:生成训练样本以及测试样本,所述训练样本以及测试样本包括农作物的品种以及所述农作物的品种的多个所选择特征。
具体而言,训练样本以及测试样本根据历史种植数据的多个所选择特征生成。每一个样本包括农作物的品种以及所述农作物的品种的历史种植数据的多个所选择特征。农作物品种可以按需设置品种范围。例如,可以设置农作物品种为大类品种(例如,西瓜、芒果、火龙果、草莓等大类品种);也可以设置农作物品种为小类品种(例如,麒麟西瓜、8424西瓜、花皮无籽西瓜、特小凤西瓜等)。本发明并非以此为限制,具体的品种可以按需设置。
具体而言,步骤S130可以首选根据农作物的品种以及所述农作物的品种的多个所选择特征生成多个样本,然后按预设比例随机划分训练样本和测试样本。预设比例例如可以为训练样本占样本中的80%,测试样本占样本中的20%。本发明并非以此为限制,具体的比例可以按需设置。
步骤S140:根据所述训练样本训练农作物决策模型,并根据所述测试样本测试所训练的农作物决策模型。
步骤S140的具体实现将在下文中分别结合图6至图8进行描述,在此不予赘述。
在一些实施例中,所述训练样本以及测试样本还包括各农作物的品种的产量。由此,还可以训练农作物决策模型预测各农作物的品种的产量。
由此,通过上述步骤,可以使用经过训练样本训练好的分类器,对测试样本进行处理,并得到对于一个特定的种植环境下最适合种植的农作物(品类、品种)。
在本发明提供的农作物决策模型训练方法中,一方面,通过历史种植数据生成的训练样本和测试样本对农作物决策模型进行训练,从而能够对需要种植的农作物的决策提供智能的决策模型;另一方面,通过对用于生成训练样本和测试样本的农作物的历史种植数据的候选特征集合的特征选择,从而有效降低模型所需处理的数量,提高模型训练和模型决策效率;再一方面,可以通过所训练的智能决策模型实现农作物种植品种的最优决策,从而提高农作物种植品质和种植产量。
下面参见图2,图2示出了根据本发明实施例的利用特征选择模型,自所述候选特征集合中选择多个特征的流程图。图2共示出如下步骤:
步骤S121:利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
具体而言,特征选择模型例如可以通过相关性计算,从而对候选特征集合中的多个候选特征进行排序。
步骤S122:根据所述候选特征集合中的候选特征的排序顺序选取排序在前的多个候选特征作为所选择特征。
具体而言,步骤S122可以按排序顺序选取排序在前的设定数量的候选特征作为所选择特征。步骤S122也可以按排序顺序选取特征总数量的前N%的候选特征作为所选择特征。本发明可以实现多种不同的特征选取方式。
具体而言,上述步骤S121可以通过如图3、图4、图5任一项方式来实现。
参见图3,图3示出了根据本发明一实施例的利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序的流程图。图3共示出如下步骤:
步骤S1211:利用特征排序模型对所述候选特征集合中的多个候选特征进行排序。
步骤S1212:按所述排序顺序自所述候选特征集合中剔除一候选特征。
步骤S1213:判断所述候选特征集合是否为空。
若步骤S1213判断为否,则再次执行步骤S1211。
若步骤S1213判断为是,则执行步骤S1214:按所述候选特征的剔除顺序输出所述候选特征集合中的候选特征的排序顺序。
具体而言,特征选择模型例如可以为RFE(Recursive feature elimination,递归式特征消除),RFE通过反复构建模型,然后选择出最好(排序第1)的特征,将选择出的特征摘出,然后在剩余的特征中进行重复这一过程,直至遍历了所有的特征。RFE使用一个模型来进行多轮训练,每轮训练后,对特征进行排序,然后移除若干个权值系数的特征,再基于剩下的特征集进行下一轮训练,一直到所有数据都被移除;如果每次移除1个特征,那么移除的顺序就是这些特征的排序。
RFE的伪代码如下:
Inputs:
Training dataset T;
Set ofp features Fe={f1,f2…fn}
Ranking method Me(T,Fe)
Outputs:
Final ranking R
Steps:
1,Repeat for i in{i:n}
2,Rank set Fe using Me(T,Fe)
3,f=last ranked feature in Fe
4,R(n-i+1)=f
5,Fe=Fe-f
具体而言,特征排序模型例如可以是根据候选特征之间的相关性进行排序的模型。具体而言,步骤S1212相当于自多个候选特征中,将最相关(最优)的候选特征进行剔除,由此,以便于对除去最相关/最优的候选特征后的其它特征再次进行相关性计算和排序,从而实现迭代的候选特征的剔除。在该实施例中,通过迭代的排序和候选特征的剔除,避免最相关的候选特征对其它候选特征的排序影响,以便于能够获得更为准确的按相关性排序的候选特征。
进一步地,图3相当于提供了仅使用一个特征选择模型对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序的实施例,本发明并非以此为限制。在一些变化例中,本发明还可以利用多个具有权重的特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
参见图4,图4示出了根据本发明另一实施例的利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序的流程图。图4共示出如下步骤:
步骤S1215:利用多个特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的多个准排序顺序。
具体而言,特征选择模型例如可以为RFE(Recursive feature elimination,递归式特征消除)、Boruta(全相关特征选择算法)、SFFS(Sequential Floating ForwardSelection,序列浮动前向选择)、SFBS(Sequential Floating Forward Selection,序列浮动后向选择)等。
步骤S1216:对每一所述候选特征,计算该候选特征基于各特征选择模型获得的准排序顺序的序号的加权和,作为该候选特征的排序系数。
步骤S1217:根据所述排序系数,对各所述候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
具体而言,下面将示意性地对上述步骤S1215至步骤S1217进行举例说明:
首先,利用特征选择模型A、特征选择模型B以及特征选择模型C,分别对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的准排序顺序A、准排序顺序B、准排序顺序C。准排序顺序A中,候选特征的排序为a,b,c,d,e;准排序顺序B中,候选特征的排序为a,b,d,c,e;准排序顺序C中,候选特征的排序为a,d,b,c,e。特征选择模型A、特征选择模型B以及特征选择模型C的权重例如为0.2、0.3以及0.5。由此,候选特征a的排序系数为1*0.2+1*0.3+1*0.5=1;候选特征b的排序系数为2*0.2+2*0.3+3*0.5=2.5;候选特征c的排序系数为3*0.2+4*0.3+4*0.5=3.8;候选特征d的排序系数为4*0.2+3*0.3+2*0.5=2.7;候选特征e的排序系数为5*0.2+5*0.3+5*0.5=5。由此,由于本实施例中,排序系数为排序序号的排序系数,因此,需要将各候选特征按排序系数由小至大进行排序,获得所述候选特征集合中的候选特征的排序顺序为a,b,d,c,e。以上示例仅仅是示意性的,本发明并非以此为限制。
参见图5,图5示出了根据本发明再一实施例的利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序的流程图。图5共示出如下步骤:
步骤S1218:利用多个特征选择模型,计算所述候选特征集合中各所述候选特征的准排序系数。
具体而言,特征选择模型例如可以为RFE(Recursive feature elimination,递归式特征消除)、Boruta(全相关特征选择算法)、SFFS(Sequential Floating ForwardSelection,序列浮动前向选择)、SFBS(Sequential Floating Forward Selection,序列浮动后向选择)等。
步骤S1219:对每一所述候选特征,计算该候选特征基于各特征选择模型获得的准排序系数的加权和,作为该候选特征的排序系数。
步骤S12110:根据所述排序系数,对各所述候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
具体而言,下面将示意性地对上述步骤S1218至步骤S12110进行举例说明:
首先,利用特征选择模型A、特征选择模型B以及特征选择模型C,分别计算所述候选特征集合中的多个候选特征的准排序系数。特征选择模型A:候选特征的准排序系数为a(10),b(7),c(5),d(2),e(1);特征选择模型B:候选特征的准排序系数为a(9),b(4),c(3),d(5),e(1);候选特征的准排序系数为a(10),b(7),c(2),d(6),e(2)。特征选择模型A、特征选择模型B以及特征选择模型C的权重例如为0.2、0.3以及0.5。由此,候选特征a的排序系数为10*0.2+9*0.3+10*0.5=9.7;候选特征b的排序系数为7*0.2+4*0.3+7*0.5=6.1;候选特征c的排序系数为5*0.2+3*0.3+2*0.5=2.9;候选特征d的排序系数为2*0.2+5*0.3+6*0.5=4.9;候选特征e的排序系数为1*0.2+1*0.3+2*0.5=1.5。由此,由于本实施例中,排序系数实际上表示候选特征的相关性,因此,需要将各候选特征按排序系数由大至小进行排序,获得所述候选特征集合中的候选特征的排序顺序为a,b,d,c,e。以上示例仅仅是示意性的,本发明并非以此为限制。
下面参见图6,图6示出了根据本发明一实施例的农作物决策模型决策输出的流程图。
步骤S101:计算输入的多个所选择特征形成的特征集合与特征空间中的多个特征集合的特征距离。
具体而言,特征空间的多个特征集合为所述农作物决策模型训练后获得的。特征空间的多个特征集合对应的农作物的品种皆是经训练后,获得的准确的农作物的品种。
具体而言,特征集合与特征集合之间的特征距离可以采用欧氏距离、曼哈顿距离、切比雪夫距离、余弦距离等特征距离计算方法来计算,本发明并非以此为限制。
步骤S102:确定与输入的特征集合的特征距离最近的特征空间中的K个特征集合对应的农作物的品种作为候选品种,K为大于1的整数。
步骤S103:确定K个特征集合中,各所述候选品种对应的特征集合的数量。
步骤S104:将对应的特征集合的数量最多的候选品种作为决策输出的所述农作物的品种。
具体而言,可以采用KNN(K-NearestNeighbor,K最近邻近)算法作为农作物决策模型的分类器。kNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
KNN的伪代码如下
具体而言,下面将示意性地对上述步骤S101至步骤S104进行举例说明:
根据步骤S101计算的特征距离,可以获得与输入的特征集合的特征距离最近的特征空间中的10个特征集合。其中,该10个特征集合对应的农作物的品种包括麒麟西瓜(2个特征集合)、8424西瓜(2个特征集合)、花皮无籽西瓜(6个特征集合)作为候选品种。将10个特征集合中,对应特征集合数量最多的候选品种花皮无籽西瓜作为决策输出的所述农作物的品种。
由此,通过上述方式,可以只依据最邻近的多个特征集合的农作物的品种来决定输入的特征集合所适合的农作物的品种。
进一步地,图6相当于仅使用一种农作物决策模型来进行农作物决策,本发明并非以此为限制。在一些变化例中,所述农作物决策模型可以包括多个农作物子决策模型。具体而言,农作物子决策模型可以为NBC(Naive Bayesian Classifier,朴素贝叶斯分类)算法、LR(Logistic Regress,逻辑回归)算法、ID3(Iterative Dichotomiser 3迭代二叉树3代)决策树算法、C4.5决策树算法、C5.0决策树算法、SVM(Support VectorMachine,支持向量机)算法、KNN(K-Nearest Neighbor,K最近邻近)算法、ANN(Artificial Neural Network,人工神经网络)算法等,本发明并非以此为限制。
参见图7,图7示出了根据本发明又一实施例的农作物决策模型决策输出的流程图。图7共示出如下步骤:
步骤S105:根据输入的多个所选择特征形成的特征集合,获得各所述农作物子决策模型输出的所述农作物的准品种。
步骤S106:将输出数量最多的农作物的准品种,作为所述农作物决策模型决策输出的所述农作物的品种。
具体而言,下面将示意性地对上述步骤S105至步骤S106进行举例说明:
根据输入的多个所选择特征形成的特征集合,获得所述农作物子决策模型A输出的所述农作物的准品种f、所述农作物子决策模型B输出的所述农作物的准品种f、所述农作物子决策模型C输出的所述农作物的准品种g。由此,由于,输出的所述农作物的准品种f的农作物子决策模型的数量更多,因此,可以将准品种f作为所述农作物决策模型决策输出的所述农作物的品种。
参见图8,图8示出了根据本发明再一实施例的农作物决策模型决策输出的流程图。图8共示出如下步骤:
步骤S107:根据输入的多个所选择特征形成的特征集合,获得各所述农作物子决策模型输出的所述农作物的各准品种的概率;
步骤S108:对所述农作物的每一准品种,计算该准品种利用各农作物子决策模型输出的概率的加权和,作为该准品种的决策概率;
步骤S109:将决策概率最高的该准品种,作为所述农作物决策模型决策输出的所述农作物的品种。
具体而言,下面将示意性地对上述步骤S107至步骤S109进行举例说明:
根据输入的多个所选择特征形成的特征集合,获得所述农作物子决策模型A输出的所述农作物的准品种f的概率为0.8、准品种g的概率为0.4、准品种h的概率为0.4;所述农作物子决策模型B输出的所述农作物的准品种f的概率为0.6、准品种g的概率为0.7、准品种h的概率为0.2;所述农作物子决策模型C输出的所述农作物的准品种f的概率为0.9、准品种g的概率为0.4、准品种h的概率为0.1。农作物子决策模型A、农作物子决策模型B以及农作物子决策模型C的权重例如为0.4、0.4以及0.2。对各准品种的概率进行加权求和,准品种f的概率为0.4*0.8+0.4*0.6+0.2*0.9=0.74;准品种g的概率为0.4*0.4+0.4*0.7+0.2*0.4=0.52;准品种h的概率为0.4*0.4+0.4*0.2+0.2*0.1=0.26。由此,可以将概率最高的准品种f作为所述农作物决策模型决策输出的所述农作物的品种。
以上仅仅是示意性的描述了本发明的一些实施例,本发明并非以此为限制。
本发明还提供一种农作物决策方法。下面参见图9,图9示出了根据本发明实施例的农作物决策方法的流程图。图9共示出如下步骤:
步骤S210:提取设定土地区域的种植数据的多个特征。
具体而言,步骤S210提取的多个特征为前述步骤中所选择的多个特征。
步骤S220:将所提取的多个特征输入农作物决策模型,所述农作物决策模型经由如上所述的农作物决策模型训练方法训练。
步骤S230:获取所述农作物决策模型决策输出的农作物的品种。
具体而言,当训练农作物决策模型时,使训练样本以及测试样本还包括各农作物的品种的产量,从而在步骤S230还可以获取所述农作物决策模型决策输出的农作物的品种的预测产量。
在本发明提供的农作物决策方法中,一方面,通过历史种植数据生成的训练样本和测试样本对农作物决策模型进行训练,从而能够对需要种植的农作物的决策提供智能的决策模型;另一方面,通过对用于生成训练样本和测试样本的农作物的历史种植数据的候选特征集合的特征选择,从而有效降低模型所需处理的数量,提高模型训练和模型决策效率;再一方面,可以通过所训练的智能决策模型实现农作物种植品种的最优决策,从而提高农作物种植品质和种植产量。
以上仅仅是本发明的农作物决策模型训练方法以及农作物决策方法的多个具体实现方式,各实现方式可以独立或组合来实现,本发明并非以此为限制。进一步地,本发明的流程图仅仅是示意性地,各步骤之间的执行顺序并非以此为限制,步骤的拆分、合并、顺序交换、其它同步或异步执行的方式皆在本发明的保护范围之内。
下面参见图10,图10示出了根据本发明实施例的农作物决策模型训练装置的模块图。农作物决策模型训练装置300包括第一提取模块310、选择模块320、生成模块330以及训练模块340。
第一提取模块310,配置成提取农作物的历史种植数据的候选特征集合,所述候选特征集合包括多个候选特征;
选择模块320配置成利用特征选择模型,自所述候选特征集合中选择多个特征;
生成模块330配置成生成训练样本以及测试样本,所述训练样本以及测试样本包括农作物的品种以及所述农作物的品种的多个所选择特征;
训练模块340配置成根据所述训练样本训练农作物决策模型,并根据所述测试样本测试所训练的农作物决策模型。
图10仅仅是示意性的示出本发明提供的农作物决策模型训练装置300,在不违背本发明构思的前提下,模块的拆分、合并、增加都在本发明的保护范围之内。本发明提供的农作物决策模型训练装置300可以由软件、硬件、固件、插件及他们之间的任意组合来实现,本发明并非以此为限。
下面参见图11,图11示出了根据本发明实施例的农作物决策装置的模块图。农作物决策装置400包括第二提取模块410、输入提取模块420以及获取模块430。
第二提取模块410配置成提取设定土地区域的种植数据的多个特征;
输入提取模块420配置成将所提取的多个特征输入农作物决策模型,所述农作物决策模型经由如上所述的农作物决策模型训练方法训练;
获取模块430配置成获取所述农作物决策模型决策输出的农作物的品种。
图11仅仅是示意性的示出本发明提供的农作物决策装置400,在不违背本发明构思的前提下,模块的拆分、合并、增加都在本发明的保护范围之内。本发明提供的农作物决策装置400可以由软件、硬件、固件、插件及他们之间的任意组合来实现,本发明并非以此为限。
在本发明的示例性实施方式的农作物决策模型训练装置以及农作物决策装置中,一方面,通过历史种植数据生成的训练样本和测试样本对农作物决策模型进行训练,从而能够对需要种植的农作物的决策提供智能的决策模型;另一方面,通过对用于生成训练样本和测试样本的农作物的历史种植数据的候选特征集合的特征选择,从而有效降低模型所需处理的数量,提高模型训练和模型决策效率;再一方面,可以通过所训练的智能决策模型实现农作物种植品种的最优决策,从而提高农作物种植品质和种植产量。
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被例如处理器执行时可以实现上述任意一个实施例中所述农作物决策模型训练方法和/或农作物决策方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述所述农作物决策模型训练方法和/或农作物决策方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图12所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品700,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在租户计算设备上执行、部分地在租户设备上执行、作为一个独立的软件包执行、部分在租户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到租户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本发明的示例性实施例中,还提供一种电子设备,该电子设备可以包括处理器,以及用于存储所述处理器的可执行指令的存储器。其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述农作物决策模型训练方法和/或农作物决策方法的步骤。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图13来描述根据本发明的这种实施方式的电子设备500。图13显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图13所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:至少一个处理单元510、至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530、显示单元540等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述所述农作物决策模型训练方法和/或农作物决策方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图1所示的步骤。
所述存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。
所述存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备500也可以与一个或多个外部设备600(例如键盘、指向设备、蓝牙设备等)通讯,还可与一个或者多个使得租户能与该电子设备500交互的设备通讯,和/或与使得该电子设备500能与一个或多个其它计算设备进行通讯的任何设备(例如路由器、调制解调器等等)通讯。这种通讯可以通过输入/输出(I/O)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通讯。网络适配器560可以通过总线530与电子设备500的其它模块通讯。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明实施方式的上述所述农作物决策模型训练方法和/或农作物决策方法。
相比现有技术,本发明的优势在于:
一方面,通过历史种植数据生成的训练样本和测试样本对农作物决策模型进行训练,从而能够对需要种植的农作物的决策提供智能的决策模型;另一方面,通过对用于生成训练样本和测试样本的农作物的历史种植数据的候选特征集合的特征选择,从而有效降低模型所需处理的数量,提高模型训练和模型决策效率;再一方面,可以通过所训练的智能决策模型实现农作物种植品种的最优决策,从而提高农作物种植品质和种植产量。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。
Claims (18)
1.一种农作物决策模型训练方法,其特征在于,包括:
提取农作物的历史种植数据的候选特征集合,所述候选特征集合包括多个候选特征;
利用特征选择模型,自所述候选特征集合中选择多个特征;
生成训练样本以及测试样本,所述训练样本以及测试样本包括农作物的品种以及所述农作物的品种的多个所选择特征;
根据所述训练样本训练农作物决策模型,并根据所述测试样本测试所训练的农作物决策模型。
2.如权利要求1所述的农作物决策模型训练方法,其特征在于,所述提取农作物的历史种植数据的候选特征集合包括:
对所述农作物的历史种植数据进行预处理,所述预处理包括如下预处理步骤中的一项或多项:
去除不完整的农作物的历史种植数据;
去除冗余的农作物的历史种植数据;
将农作物的历史种植数据的数据格式转换为标准数据格式,所述标准数据格式包括预先设置的数据位长度、数据名称、计量单位中的一项或多项。
3.如权利要求1所述的农作物决策模型训练方法,其特征在于,所述利用特征选择模型,自所述候选特征集合中选择多个特征包括:
利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序;
根据所述候选特征集合中的候选特征的排序顺序选取排序在前的多个候选特征作为所选择特征。
4.如权利要求3所述的农作物决策模型训练方法,其特征在于,所述利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序,包括:
迭代执行特征剔除步骤,直至所述候选特征集合为空,
其中,所述特征剔除步骤包括:
利用特征排序模型对所述候选特征集合中的多个候选特征进行排序;
按所述排序顺序自所述候选特征集合中剔除一候选特征;
其中,当所述候选特征集合为空时,按所述候选特征的剔除顺序输出所述候选特征集合中的候选特征的排序顺序。
5.如权利要求3所述的农作物决策模型训练方法,其特征在于,所述利用特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序,包括:
利用多个具有权重的特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
6.如权利要求5所述的农作物决策模型训练方法,其特征在于,所述利用多个具有权重的特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序包括:
利用多个特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的多个准排序顺序;
对每一所述候选特征,计算该候选特征基于各特征选择模型获得的准排序顺序的序号的加权和,作为该候选特征的排序系数;
根据所述排序系数,对各所述候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
7.如权利要求5所述的农作物决策模型训练方法,其特征在于,所述利用多个具有权重的特征选择模型,对所述候选特征集合中的多个候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序包括:
利用多个特征选择模型,计算所述候选特征集合中各所述候选特征的准排序系数;
对每一所述候选特征,计算该候选特征基于各特征选择模型获得的准排序系数的加权和,作为该候选特征的排序系数;
根据所述排序系数,对各所述候选特征进行排序,获得所述候选特征集合中的候选特征的排序顺序。
8.如权利要求1所述的农作物决策模型训练方法,其特征在于,所述农作物决策模型根据如下步骤决策输出所述农作物的品种:
计算输入的多个所选择特征形成的特征集合与特征空间中的多个特征集合的特征距离;
确定与输入的特征集合的特征距离最近的特征空间中的K个特征集合对应的农作物的品种作为候选品种,K为大于1的整数;
确定K个特征集合中,各所述候选品种对应的特征集合的数量;
将对应的特征集合的数量最多的候选品种作为决策输出的所述农作物的品种。
9.如权利要求1所述的农作物决策模型训练方法,其特征在于,所述农作物决策模型包括多个农作物子决策模型。
10.如权利要求9所述的农作物决策模型训练方法,其特征在于,所述农作物决策模型根据如下步骤决策输出所述农作物的品种:
根据输入的多个所选择特征形成的特征集合,获得各所述农作物子决策模型输出的所述农作物的准品种;
将输出数量最多的农作物的准品种,作为所述农作物决策模型决策输出的所述农作物的品种。
11.如权利要求9所述的农作物决策模型训练方法,其特征在于,所述农作物决策模型根据如下步骤决策输出所述农作物的品种:
根据输入的多个所选择特征形成的特征集合,获得各所述农作物子决策模型输出的所述农作物的各准品种的概率;
对所述农作物的每一准品种,计算该准品种利用各农作物子决策模型输出的概率的加权和,作为该准品种的决策概率;
将决策概率最高的该准品种,作为所述农作物决策模型决策输出的所述农作物的品种。
12.如权利要求1至11任一项所述的农作物决策模型训练方法,其特征在于,所述训练样本以及测试样本还包括各农作物的品种的产量。
13.一种农作物决策方法,其特征在于,包括:
提取设定土地区域的种植数据的多个特征;
将所提取的多个特征输入农作物决策模型,所述农作物决策模型经由如权利要求1至12任一项所述的农作物决策模型训练方法训练;
获取所述农作物决策模型决策输出的农作物的品种。
14.如权利要求13所述的农作物决策方法,其特征在于,所述训练样本以及测试样本还包括各农作物的品种的产量,所述获取所述农作物决策模型决策输出的农作物的品种还包括:
获取所述农作物决策模型决策输出的农作物的品种的预测产量。
15.一种农作物决策模型训练装置,其特征在于,包括:
第一提取模块,配置成提取农作物的历史种植数据的候选特征集合,所述候选特征集合包括多个候选特征;
选择模块,配置成利用特征选择模型,自所述候选特征集合中选择多个特征;
生成模块,配置成生成训练样本以及测试样本,所述训练样本以及测试样本包括农作物的品种以及所述农作物的品种的多个所选择特征;
训练模块,配置成根据所述训练样本训练农作物决策模型,并根据所述测试样本测试所训练的农作物决策模型。
16.一种农作物决策装置,其特征在于,包括:
第二提取模块,配置成提取设定土地区域的种植数据的多个特征;
输入提取模块,配置成将所提取的多个特征输入农作物决策模型,所述农作物决策模型经由如权利要求1至12任一项所述的农作物决策模型训练方法训练;
获取模块,配置成获取所述农作物决策模型决策输出的农作物的品种。
17.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,其上存储有计算机程序,所述计算机程序被所述处理器运行时执行:
如权利要求1至12任一项所述的农作物决策模型训练方法;和/或
如权利要求13或14所述的农作物决策方法。
18.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行:
如权利要求1至12任一项所述的农作物决策模型训练方法;和/或
如权利要求13或14所述的农作物决策方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110961661.0A CN113673866A (zh) | 2021-08-20 | 2021-08-20 | 农作物决策方法、模型训练方法以及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110961661.0A CN113673866A (zh) | 2021-08-20 | 2021-08-20 | 农作物决策方法、模型训练方法以及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113673866A true CN113673866A (zh) | 2021-11-19 |
Family
ID=78544610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110961661.0A Pending CN113673866A (zh) | 2021-08-20 | 2021-08-20 | 农作物决策方法、模型训练方法以及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113673866A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116090603A (zh) * | 2022-12-02 | 2023-05-09 | 浙江天演维真网络科技股份有限公司 | 一种多时期农作物种植预测方法、装置、设备和介质 |
CN116930459A (zh) * | 2023-07-25 | 2023-10-24 | 江苏龙环环境科技有限公司 | 一种土壤原位探测装置及其探测方法 |
Citations (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080233576A1 (en) * | 1998-05-01 | 2008-09-25 | Jason Weston | Method for feature selection in a support vector machine using feature ranking |
US20110131077A1 (en) * | 2009-12-01 | 2011-06-02 | Microsoft Corporation | Context-Aware Recommendation Module Using Multiple Models |
CN104077306A (zh) * | 2013-03-28 | 2014-10-01 | 阿里巴巴集团控股有限公司 | 一种搜索引擎的结果排序方法及系统 |
US20160055426A1 (en) * | 2014-08-25 | 2016-02-25 | Sunstone Analytics | Customizable machine learning models |
CN105892287A (zh) * | 2016-05-09 | 2016-08-24 | 河海大学常州校区 | 基于模糊判决的农作物灌溉策略及决策系统 |
WO2016175990A1 (en) * | 2015-04-30 | 2016-11-03 | Biodesix, Inc. | Bagged filtering method for selection and deselection of features for classification |
CN109034658A (zh) * | 2018-08-22 | 2018-12-18 | 重庆邮电大学 | 一种基于大数据金融的违约用户风险预测方法 |
CN109214587A (zh) * | 2018-09-27 | 2019-01-15 | 重庆智万家科技有限公司 | 一种基于三支决策的商品需求预测与物流分仓规划方法 |
WO2019047790A1 (zh) * | 2017-09-08 | 2019-03-14 | 第四范式(北京)技术有限公司 | 生成机器学习样本的组合特征的方法及系统 |
WO2019056499A1 (zh) * | 2017-09-20 | 2019-03-28 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
CN110210913A (zh) * | 2019-06-14 | 2019-09-06 | 重庆邮电大学 | 一种基于大数据的商家回头客预测方法 |
WO2019184119A1 (zh) * | 2018-03-26 | 2019-10-03 | 平安科技(深圳)有限公司 | 风险模型训练方法、风险识别方法、装置、设备及介质 |
CN110442722A (zh) * | 2019-08-13 | 2019-11-12 | 北京金山数字娱乐科技有限公司 | 分类模型训练的方法及装置、数据分类的方法及装置 |
CN110517693A (zh) * | 2019-08-01 | 2019-11-29 | 出门问问(苏州)信息科技有限公司 | 语音识别方法、装置、电子设备和计算机可读存储介质 |
CN110555717A (zh) * | 2019-07-29 | 2019-12-10 | 华南理工大学 | 基于用户行为特征挖掘用户潜在购买商品和品类的方法 |
CN110991476A (zh) * | 2019-10-18 | 2020-04-10 | 北京奇艺世纪科技有限公司 | 决策分类器的训练、音视频的推荐方法、装置及存储介质 |
US20200125545A1 (en) * | 2018-10-18 | 2020-04-23 | Oracle International Corporation | Automated configuration parameter tuning for database performance |
US20200273172A1 (en) * | 2019-02-27 | 2020-08-27 | International Business Machines Corporation | Crop grading via deep learning |
US20200342226A1 (en) * | 2019-04-23 | 2020-10-29 | Farmers Edge Inc. | Yield forecasting using crop specific features and growth stages |
CN112101839A (zh) * | 2020-07-10 | 2020-12-18 | 上海寻梦信息技术有限公司 | 建立快递送达时间预测模型的方法、预测方法及相关设备 |
CN112232892A (zh) * | 2020-12-14 | 2021-01-15 | 南京华苏科技有限公司 | 基于移动运营商的满意度的易访用户的挖掘方法 |
CN112613997A (zh) * | 2020-12-17 | 2021-04-06 | 平安消费金融有限公司 | 货币基金的组合投资预测方法和预测装置 |
CN112836623A (zh) * | 2021-01-29 | 2021-05-25 | 北京农业智能装备技术研究中心 | 设施番茄农事决策辅助方法及装置 |
US20210217525A1 (en) * | 2019-12-17 | 2021-07-15 | Universiteit Maastricht | Method of training a machine learning data processing model, method of determining a hypoxia status of a neoplasm in a human or animal body, and system therefore |
WO2021146996A1 (zh) * | 2020-01-22 | 2021-07-29 | 京东方科技集团股份有限公司 | 设备指标优良性等级预测模型训练方法、监控系统和方法 |
CN113256066A (zh) * | 2021-04-23 | 2021-08-13 | 新疆大学 | 基于PCA-XGBoost-IRF的作业车间实时调度方法 |
-
2021
- 2021-08-20 CN CN202110961661.0A patent/CN113673866A/zh active Pending
Patent Citations (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080233576A1 (en) * | 1998-05-01 | 2008-09-25 | Jason Weston | Method for feature selection in a support vector machine using feature ranking |
US20110131077A1 (en) * | 2009-12-01 | 2011-06-02 | Microsoft Corporation | Context-Aware Recommendation Module Using Multiple Models |
CN104077306A (zh) * | 2013-03-28 | 2014-10-01 | 阿里巴巴集团控股有限公司 | 一种搜索引擎的结果排序方法及系统 |
US20160055426A1 (en) * | 2014-08-25 | 2016-02-25 | Sunstone Analytics | Customizable machine learning models |
WO2016175990A1 (en) * | 2015-04-30 | 2016-11-03 | Biodesix, Inc. | Bagged filtering method for selection and deselection of features for classification |
CN105892287A (zh) * | 2016-05-09 | 2016-08-24 | 河海大学常州校区 | 基于模糊判决的农作物灌溉策略及决策系统 |
WO2019047790A1 (zh) * | 2017-09-08 | 2019-03-14 | 第四范式(北京)技术有限公司 | 生成机器学习样本的组合特征的方法及系统 |
WO2019056499A1 (zh) * | 2017-09-20 | 2019-03-28 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
WO2019184119A1 (zh) * | 2018-03-26 | 2019-10-03 | 平安科技(深圳)有限公司 | 风险模型训练方法、风险识别方法、装置、设备及介质 |
CN109034658A (zh) * | 2018-08-22 | 2018-12-18 | 重庆邮电大学 | 一种基于大数据金融的违约用户风险预测方法 |
CN109214587A (zh) * | 2018-09-27 | 2019-01-15 | 重庆智万家科技有限公司 | 一种基于三支决策的商品需求预测与物流分仓规划方法 |
US20200125545A1 (en) * | 2018-10-18 | 2020-04-23 | Oracle International Corporation | Automated configuration parameter tuning for database performance |
US20200273172A1 (en) * | 2019-02-27 | 2020-08-27 | International Business Machines Corporation | Crop grading via deep learning |
US20200342226A1 (en) * | 2019-04-23 | 2020-10-29 | Farmers Edge Inc. | Yield forecasting using crop specific features and growth stages |
CN110210913A (zh) * | 2019-06-14 | 2019-09-06 | 重庆邮电大学 | 一种基于大数据的商家回头客预测方法 |
CN110555717A (zh) * | 2019-07-29 | 2019-12-10 | 华南理工大学 | 基于用户行为特征挖掘用户潜在购买商品和品类的方法 |
CN110517693A (zh) * | 2019-08-01 | 2019-11-29 | 出门问问(苏州)信息科技有限公司 | 语音识别方法、装置、电子设备和计算机可读存储介质 |
CN110442722A (zh) * | 2019-08-13 | 2019-11-12 | 北京金山数字娱乐科技有限公司 | 分类模型训练的方法及装置、数据分类的方法及装置 |
CN110991476A (zh) * | 2019-10-18 | 2020-04-10 | 北京奇艺世纪科技有限公司 | 决策分类器的训练、音视频的推荐方法、装置及存储介质 |
US20210217525A1 (en) * | 2019-12-17 | 2021-07-15 | Universiteit Maastricht | Method of training a machine learning data processing model, method of determining a hypoxia status of a neoplasm in a human or animal body, and system therefore |
WO2021146996A1 (zh) * | 2020-01-22 | 2021-07-29 | 京东方科技集团股份有限公司 | 设备指标优良性等级预测模型训练方法、监控系统和方法 |
CN112101839A (zh) * | 2020-07-10 | 2020-12-18 | 上海寻梦信息技术有限公司 | 建立快递送达时间预测模型的方法、预测方法及相关设备 |
CN112232892A (zh) * | 2020-12-14 | 2021-01-15 | 南京华苏科技有限公司 | 基于移动运营商的满意度的易访用户的挖掘方法 |
CN112613997A (zh) * | 2020-12-17 | 2021-04-06 | 平安消费金融有限公司 | 货币基金的组合投资预测方法和预测装置 |
CN112836623A (zh) * | 2021-01-29 | 2021-05-25 | 北京农业智能装备技术研究中心 | 设施番茄农事决策辅助方法及装置 |
CN113256066A (zh) * | 2021-04-23 | 2021-08-13 | 新疆大学 | 基于PCA-XGBoost-IRF的作业车间实时调度方法 |
Non-Patent Citations (1)
Title |
---|
马蕾, 杨善志, 冯俊文: "决策树研究新探", 南京理工大学学报(自然科学版), no. 05 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116090603A (zh) * | 2022-12-02 | 2023-05-09 | 浙江天演维真网络科技股份有限公司 | 一种多时期农作物种植预测方法、装置、设备和介质 |
CN116930459A (zh) * | 2023-07-25 | 2023-10-24 | 江苏龙环环境科技有限公司 | 一种土壤原位探测装置及其探测方法 |
CN116930459B (zh) * | 2023-07-25 | 2024-03-12 | 江苏龙环环境科技有限公司 | 一种土壤原位探测装置及其探测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Doherty et al. | Matching seed to site by climate similarity: techniques to prioritize plant materials development and use in restoration | |
CN113673866A (zh) | 农作物决策方法、模型训练方法以及相关设备 | |
CN111027629A (zh) | 基于改进随机森林的配电网故障停电率预测方法及系统 | |
Austin | Inconsistencies between theory and methodology: a recurrent problem in ordination studies | |
CN116680548B (zh) | 一种针对多源观测数据的时间序列干旱因果分析方法 | |
Hysen et al. | Background sampling for multi-scale ensemble habitat selection modeling: Does the number of points matter? | |
CN114219562A (zh) | 模型的训练方法、企业信用评估方法和装置、设备、介质 | |
EP3171321A1 (en) | Commercial message planning assistance system and sales prediction assistance system | |
CN117688404B (zh) | 智能施肥配方决策方法、装置、设备、介质及程序产品 | |
Bell | Application of classification trees to the habitat preference of upland birds | |
Jubair et al. | Crop genomic selection with deep learning and environmental data: A survey | |
CN113127464B (zh) | 农业大数据环境特征处理方法、装置及电子设备 | |
CN112613391B (zh) | 一种基于反向学习二进制水稻育种算法的高光谱图像波段选择方法 | |
Sánchez et al. | Obtaining transparent models of chaotic systems with multi-objective simulated annealing algorithms | |
Shahbazi | Using decision tree classification algorithm to design and construct the credit rating model for banking customers | |
Ruotsalainen et al. | The effects of sample plot selection strategy and the number of sample plots on inoptimality losses in forest management planning based on airborne laser scanning data | |
KR101088082B1 (ko) | 주성분 분석에 의한 유사 일기도 검색 시스템 및 그 방법 | |
Kavzoglu et al. | The use of feature selection techniques in the context of artificial neural networks | |
CN115660795A (zh) | 数据处理方法、装置、设备、存储介质及程序产品 | |
CN111950615B (zh) | 一种基于树种优化算法的网络故障特征选择方法 | |
CN113919600A (zh) | 一种居民负荷超短期预测方法 | |
KR101272246B1 (ko) | 주성분 분석에 의한 유사 일기도 검색 시스템 및 그 방법 | |
CN117893216B (zh) | 基于大数据的用户行为分析方法及系统 | |
TWI759785B (zh) | 整合定性資料及定量資料進行稽核準則推薦的系統及方法 | |
Tallón-Ballesteros et al. | Hybrid scatter and ant search feature subset selection: applications in classification problems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |