CN112930544A - 利用遗传学和特征工程来提高按田地的种子产品选择和推荐的放置可预测性 - Google Patents

利用遗传学和特征工程来提高按田地的种子产品选择和推荐的放置可预测性 Download PDF

Info

Publication number
CN112930544A
CN112930544A CN201980070460.2A CN201980070460A CN112930544A CN 112930544 A CN112930544 A CN 112930544A CN 201980070460 A CN201980070460 A CN 201980070460A CN 112930544 A CN112930544 A CN 112930544A
Authority
CN
China
Prior art keywords
data
yield
seeds
seed
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980070460.2A
Other languages
English (en)
Inventor
江冬明
H·塞加内
J·C·莫雷三世
J·K·布尔
温丽伟
T·赖希
T·S·艾尔曼
杨晓
王雪非
B·卢茨
王国梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Climate LLC
Original Assignee
Climate Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Climate Corp filed Critical Climate Corp
Publication of CN112930544A publication Critical patent/CN112930544A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01CPLANTING; SOWING; FERTILISING
    • A01C21/00Methods of fertilising, sowing or planting
    • A01C21/005Following a specific plan, e.g. pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Physiology (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种示例计算机实现的方法,包括:接收农业数据记录,该农业数据记录包括用于在第一环境集合中生长的第一种子集合的第一产量属性集合;以及接收与第二种子集合有关的遗传特征数据。该方法进一步包括:通过应用使用遗传特征数据和农业数据记录来模型,以生成针对与第二环境集合相关联的第二种子集合的第二产量属性集合。另外,该方法包括:通过应用第二产量属性集合来确定针对与一个或多个目标环境相关联的第三种子集合的预测的产量表现;以及针对用于第三种子集合的预测的产量表现来生成用于一个或多个目标环境的种子推荐。在本示例中,方法还包括引起在通信地耦合到服务器计算机系统的显示设备上显示种子推荐。

Description

利用遗传学和特征工程来提高按田地的种子产品选择和推荐 的放置可预测性
版权声明
本专利文献的公开内容的一部分包含受版权保护的材料。版权所有者不反对任何人以专利和商标局专利文献或记录中的形式复制专利文献或专利公开的内容,但保留所有版权或权利。
Figure BDA0003036197490000011
2015——2019气候公司。
技术领域
本公开的一个技术领域是用于农业的计算机实现的决策支持系统,特别是在种子选择和种植策略方面的计算机实现的决策支持系统。另一个技术领域是计算机系统,该计算机系统被编程为使用种子的遗传特性和田地的农业特征来生成针对一个或多个田地的预测和比较产量数据。另一个技术领域是计算机系统,该计算机系统被编程为推荐在一个或多个独特的目标田地中选择和放置种子,以帮助改善产量和一致性。
背景技术
本部分中描述的方法是可以采用的方法,但不一定是先前已经设想或可以采用的方法。因此,除非另有说明,否则不应仅由于将本节中所述的任何方法包括在本节中而认为这些方法中的任何方法有资格作为现有技术。
成功的收获取决于许多因素,包括种子选择、土壤施肥、灌溉、害虫控制和管理实践,每个因素都对植物(例如,玉米或大豆植物)的生长率做出贡献。最重要的农业管理因素中的一个农业管理因素是选择在目标田地上种植的种子。种子品种或杂交种的范围从适合短生育期的种子到更长的生育期的种子、适合高温的种子或适合低温的种子、适合干燥的气候的种子或适合潮湿的气候的种子以及适合特定土壤成分的不同种子。实现特定种子杂交种或品种的最佳表现取决于田地条件是否与特定种子的最佳生长条件相吻合。例如,可以将特定的玉米杂交种定为可以为种植者生产特定量的产量,但是,如果田地条件与用于评估特定玉米杂交种的最佳条件不匹配,则玉米杂交种将不可能持续满足种植者对产量的期望。
一旦选择了种子集合进行种植,则种植者就必须确定种植策略。种植策略包括确定选定种子中的每种种子的量和位置。确定量和位置的策略可以决定收获的产量是否符合预期。例如,如果条件有利的话,种植具有相似强度和脆弱性的种子可以带来高产。但是,如果条件波动(诸如,降雨少于预期或气温高于正常温度),则类似种子的总产量可以被降低。为了克服不可预见的环境波动,可以需要采取多样化的种植策略。
本文描述的技术有助于减轻这些问题中的一些问题,并且帮助种植者确定在哪个田地种植哪种种子。
附图说明
图1图示了被配置为执行本文所述的功能的示例计算机系统,该示例计算机系统在田地环境中与该系统可以与之交互的其它装置一起示出。
图2图示了当示例移动应用被加载以执行时在主存储器中的指令集合的示例逻辑组织的两个视图。
图3图示了编程的过程,通过该过程,农业智能计算机系统使用由一个或多个数据源提供的农艺数据来生成一个或多个预先配置的农艺模型。
图4是图示了可以在其上实现本公开的实施例的计算机系统的框图。
图5描绘了用于数据条目的时间线视图的示例实施例。
图6描绘了用于数据条目的电子表格视图的示例实施例。
图7描绘了用于基于种子的农业数据记录和与目标田地相关联的地理位置数据,来生成针对目标田地上的最佳产量表现而标识的种子的目标成功产量组的示例流程图。
图8描绘了基于生育期持续时间而具有不同的分配的相对成熟度的在一个州内的不同区域的示例。
图9描绘了用于描述在分类的相对成熟度内的种子的标准化产量值的范围的图。
图10描绘了用于基于种子的农业数据记录和与目标田地相关联的地理位置数据来生成针对目标田地的最佳产量表现和管理风险而标识的目标种子集合的示例流程图。
图11描绘了用于一种或多种种子的产量值对风险值的示例图。
图12图示了用于利用遗传学来填补历史农业数据中的数据空白的示例流程图。
图13图示了接收到的农业数据记录和进一步处理以填补数据空白的示例。
图14图示了接收到的农业数据记录和进一步处理以填补数据空白的另一个示例。
图15图示了包括基因组标记数据的遗传特征数据的示例。
图16图示了示例的基于谱系的亲属矩阵,其基于种子谱系标识种子之间的成对关系。
图17图示了将种子组织成遗传簇关系的示例。
图18图示了基于基因标记的示例亲属矩阵,其基于SNP标记标识种子之间的成对关系。
图19图示了捕获产品的近交亲本系的示例的近交编码。
图20图示了利用特征工程对特征数据进行分类并且为图12的推荐模型准备农业数据记录的示例流程图。
具体实施方式
在以下描述中,出于解释的目的,阐述了许多具体细节以便提供对本公开的透彻理解。然而,将显而易见的是,可以在没有这些具体细节的情况下实践实施例。在其它实例中,以框图形式图示了公知的结构和设备,以避免不必要地使本公开变得晦涩。根据以下概述,在各部分中公开了实施例:
1.总体概述
2.示例农业智能计算机系统
2.1 结构概述
2.2 应用程序概述
2.3 录入计算机系统的数据
2.4 过程概述—农艺模型训练
2.5 种子分类子系统
2.6 种子推荐子系统
2.7 实现方式示例—硬件概述
3.功能概述—生成并且显示种子的目标成功产量组
3.1 数据输入
3.2 农业数据处理
3.3 现有的目标成功产量组
4.功能概述—生成并且显示用于种植的目标种子
4.1 数据输入
4.2 种子选择
4.3 生成用于种子的风险值
4.4 生成目标种子的数据集
4.5 种子简档分析
4.6 目标种子的现有的集合
5.功能概述—按田地生成和显示产量改进推荐
5.1 数据输入
5.2 数据归因
5.3 确定预期的产量表现
5.4 种子优化和推荐生成
5.5 验证和调整模型
6.功能概述—包括特征工程以增强用于推荐建模的数据的实施例
6.1 原始特征和特征分类
6.2 准备数据
1.总体概述
本文公开了一种计算机系统和计算机实现的方法,该计算机系统和计算机实现的方法用于生成杂交种或种子品种的目标成功产量组的集合,该集合在一个或多个目标田地上具有高概率的成功产量。在实施例中,可以使用服务器计算机系统来生成种子的目标成功产量组,该服务器计算机系统被配置为通过数字数据通信网络接收一个或多个农业数据记录,该农业数据记录表示描述一种或多种种子的种子和产量属性的农作物种子数据,以及种植一种或多种种子的一个或多个农业田地的第一田地地理位置数据。然后,服务器计算机系统接收要种植种子的一个或多个目标田地的第二地理位置数据。
服务器计算机系统包括种子标准化指令,该种子标准化指令被配置为生成种子属性的数据集,该种子属性的数据集描述来自一个或多个农业数据记录的每种种子的代表性产量值和环境分类。然后,在服务器计算机系统上的成功世代概率的指令被配置为生成成功概率分数的数据集,该成功概率的数据集描述在一个或多个目标田地上的成功的产量的概率。成功的产量可以被定义为用于环境分类的特定种子的估计产量值,该种子的估计产量值比相同的环境分类的平均产量超出特定产量数目。每种种子的成功概率值基于种子属性的数据集,以及一个或多个目标田地的第二地理位置数据。
服务器计算机系统包括产量分类指令,该产量分类指令被配置为生成由一种或多种种子的子集以及与一种或多种种子的子集中的每个子集相关联的成功概率值组成的目标成功产量组,目标成功产量组的生成基于每种种子的成功概率分数的数据集和配置的成功的产量阈值,如果种子的成功概率值超过成功的产量阈值,则将种子添加到目标成功产量组。
服务器计算机系统被配置为引起在被通信地耦合到服务器计算机系统的显示设备上显示目标成功产量组以及与目标成功产量组中的每种种子相关联的产量值。
在实施例中,目标成功产量组(或种子与田地的另一个集合)可以被用于生成被选择用于种植在一个或多个目标田地上的目标种子集合。服务器计算机系统被配置为接收候选种子的目标成功产量组,该候选种子可以是用于种植在一个或多个目标田地上的候选物。目标成功产量组中包括一种或多种种子、描述成功产量概率的与一种或多种种子中的每种种子相关联的成功概率值、以及与一种或多种种子中的每种种子相关联的历史农业数据。然后,服务器计算机接收与一个或多个目标田地有关的属性信息。
在服务器计算机系统内的种子过滤指令被配置为选择具有成功概率值大于目标概率过滤阈值的杂交种或种子品种的子集。该服务器计算机系统包括种子标准化指令,该种子标准化指令被配置为基于历史农业数据生成针对一种或多种种子的子集中的种子的代表性的产量值。
服务器计算机系统包括风险生成指令,该风险生成指令被配置为生成针对一种或多种种子的子集的风险值的数据集。风险值的数据集基于历史农业数据描述与每种种子相关联的风险。该服务器计算机系统包括优化分类指令,该优化分类指令被配置为基于风险值、针对一种或多种种子的子集的代表性产量值以及针对一个或多个目标田地的一个或多个属性的数据集,生成用于种植在一个或多个目标田地上的目标种子的数据集。目标种子的数据集包括目标种子,该目标种子的代表性产量值满足来自跨一个或多个目标田地的风险值的数据集的风险值范围的特定目标阈值。
服务器计算机系统被配置为在被通信地耦合到服务器计算机系统的显示设备上显示目标种子的数据集,该目标种子的数据集包括来自与目标种子和一个或多个目标田地的数据集中的每种目标种子相关联的风险值的数据集的代表性产量值和风险值。
在另一个实施例中,计算机实现的方法包括:通过在服务器计算机系统处的数字数据通信网络接收农业数据记录,该农业数据记录包括在第一环境集合中生长的第一种子集合的第一产量属性集合;并且通过数字数据通信网络进一步接收与第二种子集合有关的遗传特征数据,其中第二种子集合包括第一种子集合。该方法还包括使用服务器计算机系统,通过将遗传特征数据应用到农业数据记录来生成针对与第二环境集合相关联的第二种子集合的第二产量属性集合。在该示例中,第二产量属性集合填补了来自第一产量属性集合的数据空白。然后,服务器计算机系统可以被用于确定一种或多种种子(诸如第三种子集合)在一个或多个目标田地上的预测的产量表现,该第三种子集合可以与第一种子集合和/或第二种子集合相同或不同。预测的产量表现可以基于以下一项或多项:绝对或相对产量值、产量等级、成功分数的概率和/或其它因素。在一个示例中,服务器计算机通过应用估算的产量属性来确定与第二环境集合相关联的第二种子集合的预测的产量表现,并且基于针对第二种子集合的预测的产量表现来生成产量改善推荐。该方法还可以包括在被通信地耦合到服务器计算机系统的显示设备上显示产量改善推荐。
在另一个实施例中,计算机实现的方法包括:通过在服务器计算机系统处的数字数据通信网络接收农业数据记录,该农业数据记录包括用于在环境集合中生长的种子集合的产量属性的集合,其中产量属性的集合包括通过施加种子之间的遗传关系数据生成的产量属性。该方法进一步包括通过数字数据通信网络接收针对要种植种子的一个或多个目标田地的特征数据。然后,可以使用服务器计算机系统基于产量属性和特征数据的集合为一个或多个目标田地生成种子推荐。并且,该方法还可以包括在被耦合到服务器计算机系统的显示设备上显示种子推荐。
2.示例农业智能计算机系统
2.1结构概述
图1图示了示例计算机系统,该示例计算机系统被配置为执行本文描述的功能,该示例计算机系统在田地环境中与该系统可以与之交互的其它装置一起示出。在一个实施例中,用户102拥有、操作或具有在田地位置中的田地管理器计算设备104或与田地位置(诸如,用于农业活动的田地或用于一个或多个农业田地的管理位置)相关联的田地管理器计算设备104。田地管理器计算机设备104被编程或被配置为经由一个或多个网络109向农业智能计算机系统130提供田地数据106。
田地数据106的示例包括:(a)标识数据(例如,面积、田地名称、田地标识符、地理标识符、边界标识符、农作物标识符、以及可以被用于标识农场的任何其它合适的数据,诸如公共用地单位(CLU)、地段和街区编号、地块编号、地理坐标和边界、农场序列号(FSN)、农场编号、地段编号、田地编号、区域、乡镇和/或范围);(b)收获数据(例如,农作物类型、农作物品种、农作物轮换、是否以有机方式种植农作物、收获日期、实际生产历史(APH)、预期产量、产量、农作物价格、农作物收入、谷物水分、耕作实践、以及先前的生育期信息);(c)土壤数据(例如,类型、组成、pH、有机质(OM)、阳离子交换容量(CEC));(d)种植数据(例如,种植日期、种子类型、种植的种子的相对成熟度(RM)、种子种群);(e)肥料数据(例如,养分类型(氮、磷、钾)、施用类型、施用日期、用量、来源、方法);(f)化学施用数据(例如,拟用作植物调节剂的农药、除草剂、杀真菌剂、其它物质或物质混合物,脱叶剂或干燥剂、施用日期、用量、来源、方法);(g)灌溉数据(例如,施用日期、用量、来源、方法);(h)天气数据(例如,降水、降雨率、预测降雨、水径流区域、温度、风、预测、压力、能见度、云、热指数、露点、湿度、雪深、空气质量、日出、日落);(i)图像数据(例如,来自农业装置传感器、相机、计算机、智能电话、平板计算机、无人驾驶飞行器、飞机或卫星的图像和光谱信息);(j)勘探观测(照片、视频、自由形式注释、录音、语音转录、天气条件(温度、降水(当前或一段时间内)、土壤湿度、农作物生长阶段、风速、相对湿度、露点、黑土层));以及(k)土壤、种子、农作物物候、病虫与疾病报告以及预测来源和数据库。
数据服务器计算机108被通信地耦合到农业智能计算机系统130,并且被编程为或被配置为经由(一个或多个)网络109将外部数据110发送到农业智能计算机系统130。外部数据服务器计算机108可以由与农业智能计算机系统130相同的法人或实体拥有或操作,或者由不同的人或实体(诸如,政府机构、非政府机构(NGO))和/或私人数据服务提供商拥有或操作。外部数据的示例包括天气数据、图像数据、土壤数据或与农作物产量有关的统计数据等。外部数据110可以包括与田地数据106相同类型的信息。在一些实施例中,外部数据110由拥有和/或操作农业智能计算机系统130的相同实体拥有的外部数据服务器108提供。例如,农业智能计算机系统130可以包括专门专注于可以从第三方来源获取的数据类型(诸如,天气数据)的数据服务器。在一些实施例中,外部数据服务器108实际上可以被并入系统130内。
农业装置111可以具有固定在其上的一个或多个远程传感器112,这些传感器经由农业装置111被直接地或间接地通信地耦合到农业智能计算机系统130,并且这些传感器被编程或被配置为将传感器数据发送给农业智能计算机系统130。农业装置111的示例包括拖拉机、联合收割机、收割机、播种机、卡车、施肥设备、包括无人驾驶飞行器的飞行器、以及任何其它物理机械或硬件,通常为移动机械、并且可以被用在与农业有关的任务中。在一些实施例中,装置111的单个单元可以包括:多个传感器112,被本地耦合在装置上的网络中;控制器局域网CAN,是可以被安装在联合收割机、收割机、喷雾器和中耕机中的这种网络的示例。应用控制器114经由(一个或多个)网络109被通信地耦合到农业智能计算机系统130,并且被编程或被配置为从农业智能计算机系统接收用于控制农业车辆的操作参数或实现的一个或多个脚本。例如,控制器局域网(CAN)总线接口可以被用于使能从农业智能计算机系统130到农业装置111的通信,诸如如何使用从加利福尼亚的旧金山的气候公司(TheClimate Corporation)获取的气候视场驱动器。传感器数据可以包括与田地数据106相同类型的信息。在一些实施例中,远程传感器112可以不被固定到农业装置111,而是可以被远程地放置在田地中并且可以与网络109通信。
装置111可以包括用驾驶室应用程序编程的驾驶室计算机115,该驾驶室应用程序可以包括用于在本文的其它部分中进一步描述的设备104的移动应用程序的版本或变体。在实施例中,驾驶室计算机115包括紧凑型计算机,通常是平板计算机或智能电话,其具有安装在装置111的驾驶室中的图形屏幕显示,诸如彩色显示器。驾驶室计算机115可以实现本文中针对移动计算机设备104进一步描述的一些操作和功能或全部操作和功能。
(一个或多个)网络109广泛地表示使用有线或无线链路(包括地面或卫星链路)的包括局域网、广域网、互联网或因特网的一个或多个数据通信网络的任意组合。可以通过提供在图1的各个元件之间的数据交换的任何介质或机制来实现(一个或多个)网络。图1的各个元件还可以具有直接(有线或无线)通信链路。传感器112、控制器114、外部数据服务器计算机108和系统的其它元件均包括与(一个或多个)网络109兼容的接口,并且被编程或被配置为使用用于跨网络(诸如,TCP/IP、蓝牙、CAN协议和更高层的协议(诸如,HTTP、TLS等))通信的标准化协议。
农业智能计算机系统130被编程为或被配置为从田地管理器计算设备104接收田地数据106,从外部数据服务器计算机108接收外部数据110,以及从远程传感器112接收传感器数据。以本公开的其它部分中进一步描述的方式,农业智能计算机系统130可以进一步被配置为托管、使用或执行一个或多个计算机程序、其它软件元件、数字编程逻辑(诸如,FPGA或ASIC)或其任意组合,来执行数据值的转换和存储、在一个或多个田地上的一个或多个农作物的数字模型的构造、推荐和通知的生成以及脚本的生成和向应用控制器114的发送。
在实施例中,农业智能计算机系统130被编程为或包括通信层132、呈现层134、数据管理层140、硬件/虚拟化层150以及模型和田地数据存储库160。在本文中,“层”是指电子数字接口电路、微控制器、固件(诸如,驱动程序)和/或计算机程序或其它软件元素的任意组合。
通信层132可以被编程或被配置为执行输入/输出接口功能,包括分别地向田地管理器计算设备104、外部数据服务器计算机108和远程传感器112发送针对田地数据、外部数据和传感器数据的请求。通信层132可以被编程或被配置为将接收到的数据发送到模型和田地数据存储库160以存储为田地数据106。
呈现层134可以被编程或被配置为生成要在田地管理器计算设备104、驾驶室计算机115或通过网络109耦合到系统130的其它计算机上显示的图形用户界面(GUI)。GUI可以包括用于输入要被发送到农业智能计算机系统130的数据、生成针对模型和/或推荐的请求、和/或显示推荐、通知、模型和其它田地数据的控件。
数据管理层140可以被编程或被配置为管理涉及存储库160和系统的其它功能元件的读取操作和写入操作,包括在系统与存储库的功能元件之间通信的查询和结果集合。数据管理层140的示例包括JDBC、SQL服务器接口码和/或HADOOP接口码等。存储库160可以包括数据库。如本文使用的,术语“数据库”可以指数据主体、关系数据库管理系统(RDBMS)或两者。如本文使用的,数据库可以包括数据的任何集合,包括:分层数据库、关系数据库、平面文件数据库、对象关系数据库、面向对象的数据库、分布式数据库以及被存储在计算机系统中的记录或数据的任何其它结构化集合。RDBMS的示例包括但不限于
Figure BDA0003036197490000111
MYSQL、
Figure BDA0003036197490000112
Figure BDA0003036197490000113
SERVER、
Figure BDA0003036197490000114
以及POSTGRESQL数据库。然而,可以使用使能本文描述的系统和方法的任何数据库。
当没有通过一个或多个农业机械或与农业智能计算机系统交互的农业机械设备直接向农业智能计算机系统提供田地数据106时,可能会经由(由农业智能计算机系统服务的)用户设备上的一个或多个用户界面提示用户输入这种信息。在示例实施例中,用户可以通过访问(由农业智能计算机系统130服务的)用户设备上的地图并且选择已经在地图上以图形方式示出的特定CLU来指定标识数据。在备选的实施例中,用户102可以通过访问(由农业智能计算机系统130服务的)用户设备上的地图并且在该地图上绘制田地的边界来指定标识数据。这种CLU选择或地图绘制表示地理标识符。在备选的实施例中,用户可以通过经由用户设备访问来自美国农业部农业服务局或其它来源的(以形状文件或类似的格式提供的)田地标识数据来制定标识数据,并且将这种田地标识数据提供给农业智能计算机系统。
在示例实施例中,农业智能计算机系统130被编程为生成并且显示包括用于数据输入的数据管理器的图形用户界面。在已经使用上述方法标识一个或多个田地之后,数据管理器可以提供一个或多个图形用户界面小窗口,当选择该图形用户界面小窗口时,可以标识田地、土壤、农作物、耕作或养分实践的变化。数据管理器可以包括时间线视图、电子表格视图和/或一个或多个可编辑程序。
图5描绘了用于数据条目的时间线视图的示例实施例。使用图5中描绘的显示器,用户计算机可以输入特定田地的选择和特定日期以用于事件的添加。在时间线的顶部处描绘的事件可以包括氮、种植、实践和土壤。为了添加氮施用事件,用户计算机可以提供输入以选择氮标签。然后,用户计算机可以选择针对特定田地的时间线上的位置,以便指示氮在所选择的田地上的施用。响应于接收到的对特定田地的时间线上的位置的选择,数据管理器可以显示数据条目覆盖图,从而允许用户计算机输入与氮施用、种植流程、土壤施用、耕作流程、灌溉实践有关的数据或与特定田地有关的其它信息。例如,如果用户计算机选择时间线的一部分并且指示施氮量的施用,则数据条目覆盖图可以包括用于输入氮施用量、施用日期、使用的肥料类型以及与施氮量的施用有关的任何其它信息的田地。
在实施例中,数据管理器提供用于创建一个或多个程序的接口。在本文中,“程序”是指与以下项有关的数据的集合:氮施用、种植流程、土壤施用、耕作流程、灌溉实践或与一个或多个田地有关的其它信息,并且程序可以被存储在数字数据存储中,以便在其它操作中作为集合重复使用。在已经创建程序之后,可以在概念上将其施加到一个或多个田地,并且可以将该程序的引用与标识这些田地的数据关联地存储在数字存储中。因此,代替手动输入与针对多个不同田地的相同氮施用有关的相同数据,用户计算机可以创建指示施氮量的特定施用的程序,然后将该程序施加到多个不同的田地。例如,在图5的时间线视图中,顶部两个时间线选择了“春季施用”程序,该程序包括在四月初施用150lbs.N/ac。数据管理器可以提供用于编辑程序的界面。在实施例中,当编辑特定程序时,已经选择了特定程序的每个田地都被编辑。例如,在图5中,如果“春季施用”程序被编辑以将施氮量的施用减小到130lbs.N/ac,则可以基于编辑的程序通过减少施氮量的施用来更新顶部两个田地。
在实施例中,响应于接收到对具有选择的程序的田地的编辑,数据管理器去除该田地与选择的程序的对应关系。例如,如果在图5的顶部田地增加了氮施用,则该界面可以更新以指示“春季施用”程序不再被施加到顶部田地。尽管可以保留四月初的氮施用,但是“春季施用”程序的更新不会改变施氮量的四月施用。
图6描绘了用于数据条目的电子表格视图的示例实施例。使用图6中描绘的显示,用户可以创建以及编辑用于一个或多个田地的信息。数据管理器可以包括电子表格,该电子表格用于输入与图6中描绘的氮、种植、实践和土壤有关的信息。为了编辑特定的条目,用户计算机可以在电子表格中选择特定的条目并且更新值。例如,图6描绘了针对第二田地的目标产量值的正在进行的更新。附加地,用户计算机可以选择一个或多个田地,以便施加一个或多个程序。响应于接收到用于特定田地的程序的选择,数据管理器可以基于选择的程序来自动地完成针对特定田地的输入。与时间线视图一样,数据管理器可以响应于接收到的对该程序的更新,来更新与特定程序相关联的每个田地的输入。附加地,数据管理器可以响应于接收到对该田地的输入中的一个输入的编辑,而移除所选择的程序与该田地的对应关系。
在实施例中,模型和田地数据被存储在模型和田地数据存储库160中。模型数据包括针对一个或多个田地创建的数据模型。例如,农作物模型可以包括在一个或多个田地上的农作物的发育的数字构建模型。在本文中,“模型”是指经电子数字存储的彼此相关联的可执行的指令和数据值的集合,这些可执行的指令和数据值的集合能够接收以及响应程序化的调用或其它数字调用、调用或解析请求,以产生一个或多个存储的输出值或计算的输出值,这些输出值可以用作计算机实现的推荐、输出数据显示或机器控制等的基础。本领域技术人员发现应用数学式来表达模型是方便的,但是这种表达形式并不将本文所公开的模型局限于抽象概念;相反,本文中的每个模型都以存储的可执行指令和数据的形式在计算机中具有实际应用,该可执行指令和数据使用计算机来实现该模型。该模型可以包括一个或多个田地上的过去事件的模型,一个或多个田地的当前状态的模型和/或一个或多个田地上的预测的事件的模型。模型和田地数据可以被存储在存储器中的数据结构中、在数据库表中的行中、在平面文件或电子表格中或其它形式的存储数字数据中。
在实施例中,种子分类子系统170包含专门配置的逻辑,包括但不限于种子标准化指令172、成功概率或预测的产量表现生成指令174以及并且产量分类指令176,产量分类指令176包括主存储器(诸如,RAM)的一个或多个页面的集合,在农业智能计算机系统130中已经加载了可执行指令,并且当执行该可执行指令时导致农业智能计算系统执行本文参考那些模块描述的功能或操作。在实施例中,种子推荐子系统180包含专门配置的逻辑,包括但不限于种子过滤指令182、风险生成指令184以及优化分类指令186,优化分类指令186包括主存储器(诸如,RAM)的一个或多个页面的集合,在农业智能计算机系统130中已经加载了可执行指令,并且当执行该可执行指令时导致农业智能计算系统执行本文参考那些模块描述的功能或操作。例如,种子标准化指令172可以包括包含指令的RAM中的页面的集合,当执行该指令时导致执行本文描述的目标标识功能。该指令可以在CPU的指令集合中的机器可执行代码中,并且可以基于单独或与JAVASCRIPT中的脚本、其它脚本语言和其它编程源文本结合使用JAVA、C、C++、OBJECTIVE-C或任何其它人类可读编程语言或环境编写的源代码进行编译。术语“页面”旨在广义地指主存储器内的任何区域,并且系统中使用的特定术语可以根据存储器架构或处理器架构而变化。在另一个实施例中,种子标准化指令172、成功概率或预测的产量表现生成指令174、产量分类指令176、种子过滤指令182、风险生成指令184和优化的分类指令186中的每个指令还可以表示一个或多个文件或者在农业智能计算机系统130或单独的存储库系统中被数字地存储在大容量存储设备(诸如,非易失性RAM或磁盘存储)中的源代码项目,当编译或解释这些项目时导致生成可执行指令,当执行这些可执行指令时导致农业智能计算系统执行本文参考那些模块描述的功能或操作。换句话说,附图可以表示程序员或软件开发人员组织和安排源代码以供以后由农业智能计算机系统130执行以便将其编译为可执行文件或解释为字节代码或等效代码的方式。
例如结合图4图示和描述的,硬件/虚拟化层150包括一个或多个中央处理单元(CPU)、存储器控制器以及计算机系统的其它设备、部件或元件,诸如易失性存储器或非易失性存储器,非易失性存储(诸如,磁盘)以及I/O设备或接口。层150还可以包括被配置为支持虚拟化、容器化或其它技术的编程指令。
出于图示清楚的示例的目的,图1图示了某些功能元件的有限数目的实例。然而,在其它实施例中,可以有任何数目的这种元件。例如,实施例可以使用与不同用户相关联的数千或数百万个不同的移动计算设备104。此外,可以使用两个或多个处理器、核心、簇或物理机或虚拟机的实例来实现系统130和/或外部数据服务器计算机108,它们可以被配置在离散的位置或与数据中心、共享计算设施或云计算设施中的其它元件共同放置。
2.2应用程序概述
在实施例中,使用被加载到一个或多个通用计算机中并且由一个或多个通用计算机执行的一个或多个计算机程序或其它软件元件来实现本文描述的功能,将使得该通用计算机被配置为特别适合执行本文描述的功能的特定机器或计算机。此外,本文进一步描述的流程图中的每个流程图可以单独地或与本文中的过程和功能的描述结合地用作算法、计划或方向,这些算法、计划或方向可以被用于对计算机或逻辑进行编程以实现所描述的功能。换句话说,本文中的所有叙述性的文字以及所有附图一起旨在结合技术人员的技能和知识,并且使其具有适用于此类发明和公开的技能水平,提供足以允许技术人员对计算机进行编程以执行本文描述的功能的算法、计划或方向的公开。
在实施例中,用户102使用配置有操作系统和一个或多个应用程序或应用的田地管理器计算设备104与农业智能计算机系统130进行交互;田地管理器计算设备104还可以在程序控制或逻辑控制下独立并且自动地与农业智能计算机系统进行互操作,并且并不总是需要直接的用户交互。田地管理器计算设备104广泛地表示智能电话、PDA、平板计算设备、膝上型计算机、台式计算机、工作站或者能够发送和接收信息并且执行本文描述的功能的任何其它计算设备中的一个或多个设备。田地管理器计算设备104可以使用存储在田地管理器计算设备104上的移动应用程序经由网络进行通信,并且在一些实施例中,可以使用电缆113或连接器将该设备耦合到传感器112和/或控制器114。特定用户102可以一次拥有、操作或具有并且使用与系统130相关联的多个田地管理器计算设备104。
移动应用程序可以经由网络向一个或多个移动计算设备提供客户端功能。在示例实施例中,田地管理器计算设备104可以经由网页浏览器或本地客户端应用程序或应用访问移动应用程序。田地管理器计算设备104可以使用基于网页的协议或格式(诸如,HTTP、XML和/或JSON)或专用于应用的协议向一个或多个前端服务器发送数据,并且从一个或多个前端服务器接收数据。在示例实施例中,数据可以采取到移动计算设备中的请求和用户信息输入(诸如,田地数据)的形式。在一些实施例中,移动应用程序与田地管理器计算设备104上的位置跟踪硬件以及软件进行交互,该位置跟踪硬件以及软件使用标准跟踪技术(诸如,无线电信号的多边定位、全球定位系统(GPS)、WiFi定位系统或移动定位的其它方法)来确定田地管理器计算设备104的位置。在一些情况下,通过查询设备的操作系统或通过请求设备上的应用以从操作系统获取数据,可以获取与设备104、用户102和/或(一个或多个)用户账户相关联的位置数据或其它数据。
在实施例中,田地管理器计算设备104将田地数据106发送到农业智能计算机系统130,该农业智能计算机系统130包含或包括但不限于表示以下信息中的一个或多个信息的数据值:一个或多个田地的地理位置;用于一个或多个田地的耕作信息;种植在一个或多个田地中的农作物;以及从一个或多个田地提取的土壤数据。田地管理器计算设备104可以响应于来自用户102指定的用于一个或多个田地的数据值的用户输入来发送田地数据106。附加地,当数据值中的一个或多个数据值变得可用于田地管理器计算设备104时,田地管理器计算设备104可以自动地发送田地数据106。例如,田地管理器计算设备104可以被通信地耦合到远程传感器102和/或应用程序控制器114,远程传感器102和/或应用程序控制器114包括灌溉传感器和/或灌溉控制器。响应于接收到指示应用程序控制器114将水释放到一个或多个田地上的数据,田地管理器计算设备104可以将田地数据106发送到农业智能计算机系统130,该数据指示水被释放在一个或多个田地上。可以使用电子数字数据来输入和通信在本公开中标识的田地数据106,该电子数字数据通过HTTP或另一种合适的通信或消息收发协议使用参数化的URL在计算设备之间进行通信。
移动应用程序的商业示例是气候视场(CLIMATE FIELDVIEW),可以从加利福尼亚州旧金山的气候公司商购获得。气候视场应用程序或其它应用程序可以进行修改、扩展或调整,以包括尚未在本公开的申请日之前公开的特征、功能和程序。在一个实施例中,移动应用程序包括一个集成的软件平台,该软件平台允许种植者为他们的操作做出基于事实的决定,这是因为它结合了有关种植者田地的历史数据与种植者希望比较的任何其它数据。组合和比较可以实时进行并且基于科学模型,该科学模型提供了可能的情景,使种植者可以做出更好更明智的决定。
图2图示了当示例移动应用程序被加载以执行时在主存储器中的指令的集合的示例逻辑组织的两个视图。在图2中,每个命名的元件表示RAM或其它主存储器的一个或多个页面的区域、或者磁盘存储或其它非易失性存储的一个或多个块的区域以及那些区域内的编程指令。在一个实施例中,在视图(a)中,移动计算机应用程序200包括账户田地数据摄取共享指令202、概述和警报指令204、数字地图手册指令206、种子和种植指令208、施氮指令210、天气指令212、田地健康指令214和表现指令216。
在一个实施例中,移动计算机应用程序200包括账户、田地、数据摄取、共享指令202,该指令被编程为经由手动上传或API从第三方系统接收、翻译和摄取田地数据。数据类型可以包括田地边界、产量地图、种植地图、土壤测试结果、应用地图和/或管理地带等。数据格式可以包括形状文件、第三方的本机数据格式和/或农场管理信息系统(FMIS)导出等。接收数据可以经由以下方式来发生:手动上传、具有附件的电子邮件、将数据推送到移动应用程序的外部API或调用外部系统的API来将数据拉入移动应用程序的指令。在一个实施例中,移动计算机应用程序200包括数据收件箱。响应于接收到的对数据收件箱的选择,移动计算机应用程序200可以显示用于手动上传数据文件并且将上传的文件导入数据管理器的图形用户界面。
在一个实施例中,数字地图手册指令206包括存储在设备存储器中的田地地图数据层,并且改田地地图数据层利用数据可视化工具和地理田地注释进行编程。这为种植者提供了方便的信息,可供参考、记录和对田地表现的直观见解。在一个实施例中,概述和警报指令204被编程为提供对种植者重要的内容的全操作视图,并且提供及时的推荐以采取行动或集中于特定问题。这可以使种植者将时间集中在需要注意的地方,以节省时间以及在整个季节保持产量。在一个实施例中,对种子和种植指令208进行编程以基于科学模型和经验数据提供用于种子选择、种子放置和脚本创建的工具,包括可变速率(VR)脚本创建。这使种植者可以通过优化种子购买、放置和种群,最大限度地提高产量或投资回报率。
在一个实施例中,脚本生成指令205被编程为提供用于生成包括可变速率(VR)生产力脚本的脚本的界面。该界面使种植者能够为田地实现创建脚本,诸如养分施用、种植和灌溉。例如,种植脚本界面可以包括用于标识用于种植的种子类型的工具。在接收到种子类型的选择之后,移动计算机应用程序200可以显示一个或多个细分为管理地带的田地,诸如作为数字地图手册指令206的一部分创建的田地地图数据层。在一个实施例中,管理地带包括土壤地带以及标识每个土壤地带以及土壤名称、质地、每个地带的排水或其它田地数据的面板。移动计算机应用程序200还可以在一个或多个田地的地图之上显示用于编辑或创建的工具,诸如用于绘制管理地带(诸如,土壤地带)的图形工具。种植流程可以被施加到所有管理地带,或者不同的种植流程可以被施加到管理地带的不同子集。当创建脚本时,移动计算机应用程序200可以使脚本可用于以应用程序控制器可读的格式下载,诸如存档格式或压缩格式。附加地和/或备选地,脚本可以从移动计算机应用程序200直接地发送到驾驶室计算机115和/或上传到一个或多个数据服务器并且存储以供进一步使用。
在一个实施例中,对施氮指令210进行编程以提供工具,以通过可视化农作物中施氮量的可用性来通知施氮量的决策。通过优化季节期间的氮施用,这使种植者能够最大化产量或投资回报。示例编程功能包括:以高空间分辨率(取决于传感器的接近度和分辨率,可以达到毫米或以下)显示图像(诸如,SSURGO图像),以使能肥料施用地带的绘制和/或从子田地土壤数据(诸如,从传感器获取的数据)生成的图像;上传现有的种植者定义的地带;提供植物养分可用率的图表和/或地图,以使能调节跨(一个或多个)地带的氮施用;输出脚本以驱动机械;用于大数据条目和调整的工具;和/或用于数据可视化的地图等。在本文中,“大数据条目”可以意味着一次输入数据,然后将相同的数据施加到系统中已经定义的多个田地和/或地带;示例数据可以包括对于相同的种植者的许多田地和/或地带相同的氮施用数据,但是这种大数据条目适用于将任何类型的田地数据输入到移动计算机应用程序200中。例如,施氮指令210可以被编程为接受氮施用和实践程序的定义并且接受指定跨多个田地施用的那些程序的用户输入。在本文中,“氮施用程序”是指与以下内容相关联的已存储的数据的命名的集合:名称、颜色码或其它标识符、一个或多个应用程序日期、日期和用量中的每一项的材料或产品类型、施用或掺入的方法(诸如,注入或种植)、和/或作为应用的主题的日期、农作物或杂交种/品种中的每一项的施用量或施用率等。在本文中,“氮实践程序”是指与以下内容相关联的已存储的数据的命名的集合:实践名称;先前的农作物;耕作系统;主要耕作日期;使用过的一个或多个先前的耕作系统;使用过的一个或多个应用程序类型(诸如肥料)的指示符。施氮指令210也可以被编程为生成并且导致显示施氮图,该施氮图指示出植物对指定施氮量的使用的预测以及是否预测了剩余或不足;在一些实施例中,不同的颜色指示符可以表示剩余量或不足量。在一个实施例中,施氮图包括:计算机显示设备中的图形显示,该计算机显示设备包括多行,每行与一个田地相关联并且标识一个田地;数据,指定哪种农作物被种植在田地中,田地大小、田地位置以及田地周长的图形表示;在每一行中,具有图形指示符的每个月的时间表,指定与月份名称相关的每个氮施用和用量;以及数字和/或彩色的剩余或不足指示符,其中颜色指示幅度。
在一个实施例中,施氮图可以包括一个或多个用户输入特征(诸如刻度盘或滑动条),以动态地改变施氮种植和实践程序,使得用户可以优化他的施氮图。然后,用户可以使用他的优化的施氮图以及相关的施氮种植和实践程序来实现一个或多个脚本,包括可变速率(VR)生产力脚本。施氮指令210也可以被编程为生成以及显示施氮图,该施氮图指示出对指定种植施氮量的使用的预测以及是否预测了剩余或不足;在一些实施例中,不同的颜色指示符可以表示剩余量或不足量。施氮图可以显示对指定种植施氮量的使用的预测以及是否预测了过去和未来的不同时间(诸如,每天、每周、每月或每年)是否剩余或不足,其中颜色指示幅度。在一个实施例中,施氮图可以包括一个或多个用户输入特征,诸如刻度盘或滑动条,以动态地改变施氮种植和实践程序,以便用户可以优化他的施氮图,诸如以获取优选的剩余量到优选的不足量。然后,用户可以使用他的优化的施氮图以及相关的施氮种植和实践程序来实现一个或多个脚本,包括可变速率(VR)生产力脚本。在其它实施例中,与施氮指令210类似的指令可以被用于其它养分(诸如,磷和钾)的施用、农药的施用以及灌溉程序。
在一个实施例中,天气指令212被编程为提供田地特定的近期天气数据和预报天气信息。这使种植者可以节省时间,并且在日常操作决策方面具有高效的集成显示。
在一个实施例中,田地健康指令214被编程为提供及时的远程感测图像,突出显示应时的农作物变化和潜在的问题。示例编程功能包括:云检查,以标识可能的云或云阴影;基于田地图像确定氮指数;勘探层的图形可视化,例如包括与田地健康有关的层,以及查看和/或共享勘探笔记;和/或从多个来源下载卫星图像,并且为种植者确定图像的优先级等。
在一个实施例中,表现指令216被编程以使用在农场的数据来提供报告、分析和洞察工具,用于评估、洞察和决策。这使种植者可以能够基于事实的结论(为何投资回报率处于先前水平)以及对产量限制因素的洞察,来寻求下一年的改善结果。表现指令216可以被编程为经由(一个或多个)网络109与在农业智能计算机系统130和/或外部数据服务器计算机108处执行的后端分析程序通信,并且表现指令216被配置为分析度量,诸如产量、产量差异、杂交种/品种、种群、SSURGO地带、土壤测试属性或海拔等。程序化报告和分析可以包括:产量变异性分析,处理效果估计,基于从许多种植者处收集的匿名数据或用于种子和种植的数据等对照其他种植者对产量和其它指标进行基准测试。
当保留相同的一般用户界面外观时,具有以这种方式配置的指令的应用可以针对不同的计算设备平台来实现。例如,移动应用程序可以被编程用于在平板计算机、智能电话或在客户端计算机处使用浏览器访问的服务器计算机上执行。此外,为平板计算机或智能电话配置的移动应用程序可以提供适合于驾驶室计算机115的显示和处理能力的完整应用体验或驾驶室应用体验。例如,现在参照图2的视图(b),在一个实施例中,驾驶室计算机应用程序220可以包括:地图驾驶室指令222、远程查看指令224、数据收集和传输指令226、机器警报指令228、脚本传输指令230和勘探驾驶室指令232。用于视图(b)的指令的代码库可以与视图(a)的代码库相同,并且可以对实现代码的可执行文件进行编程,以检测它们在其上执行的平台的类型,并且通过图形用户界面仅公开那些适用于驾驶室平台或完整平台的功能的产品。这种方法使系统能够识别出适用于驾驶室内环境和驾驶室的不同技术环境的截然不同的用户体验。可以对地图驾驶室指令222进行编程,以提供可用于指导机器操作的田地、农场或区域的地图视图。远程查看指令224可以被编程为实时地或接近实时地经由无线网络、有线连接器或适配器等接通、管理以及向连接到系统130的其它计算设备提供机器活动视图。数据收集和传输指令226可以被编程为经由无线网络、有线连接器或适配器等接通、管理以及向系统130传输在传感器和控制器处收集的数据。机器警报指令228可以被编程为检测与驾驶室相关联的机器或工具的操作问题并且生成操作者警报。脚本传输指令230可以被配置为以指令脚本的形式传输,该指令脚本被配置为指导机器操作或数据的收集。勘探驾驶室指令232可以被编程为基于田地管理器计算设备104、农业装置111或传感器112在田地中的位置来显示从系统130接收的基于位置的警报和信息,并且基于在田地中的农业装置111或传感器112的位置,摄取、管理以及向系统130提供基于位置的勘探观测。
2.3摄取到计算机系统的数据
在实施例中,外部数据服务器计算机108存储外部数据110,该外部数据110包括表示一个或多个田地的土壤成分的土壤数据以及表示一个或多个田地的温度和降水的天气数据。天气数据可以包括过去和当前的天气数据以及对未来天气数据的预测。在实施例中,外部数据服务器计算机108包括由不同实体托管的多个服务器。例如,第一服务器可以包含土壤成分数据,而第二服务器可以包括天气数据。附加地,土壤成分数据可以被存储在多个服务器中。例如,一个服务器可以存储表示土壤中的沙子、淤泥和黏土的百分比的数据,而第二服务器可以存储表示土壤中的有机物质(OM)的百分比的数据。
在实施例中,远程传感器112包括被编程或被配置为产生一个或多个观测的一个或多个传感器。远程传感器112可以是空中传感器,诸如卫星、车辆传感器、种植设备传感器、耕作传感器、肥料或杀虫剂施用传感器、收割机传感器以及能够从一个或多个田地接收数据的任何其它器具。在实施例中,应用程序控制器114被编程或被配置为从农业智能计算机系统130接收指令。应用程序控制器114还可以被编程或被配置为控制农业车辆或器具的操作参数。例如,应用程序控制器可以被编程或被配置为控制车辆(诸如,拖拉机)、种植设备、耕作设备、肥料或杀虫剂设备、收割机设备或其它农田器具(诸如,水阀)的操作参数。其它实施例可以使用传感器和控制器的任何组合,以下实施例仅仅是选择的示例。
系统130可以在用户102的控制下,从已经向共享数据库系统共享了数据的大量种植者大规模地获取或摄取数据。当请求或触发一个或多个用户控制的计算机操作以获取由系统130使用的数据时,这种形式的获取数据可以被称为“手动数据摄取”。例如,可以操作从加利福尼亚州旧金山的气候公司购买的气候视场应用程序,以将数据导出到系统130,用于存储在存储库160中。
例如,种子监测器系统既可以控制播种机装置部件又可以获取种植数据,种植数据包括经由信号线束从种子传感器发出的信号,该信号线束包括CAN主干网和用于注册和/或诊断的点对点连接。种子监测器系统可以被编程或被配置为经由驾驶室计算机115或系统130内的其它设备向用户显示种子间距、种群和其它信息。在美国专利No.8738243和美国专利公开20150094916中公开了示例,并且本公开假定那些其它专利公开的知识。
同样,产量监测器系统可以包含用于收割机装置的产量传感器,该产量传感器将产量测量数据发送到驾驶室计算机115或系统130内的其它设备。产量监测器系统可以利用一个或多个远程传感器112在联合收割机或其它收割机中获取谷物水分测量值,并且将这些测量值经由驾驶室计算机115或系统130内的其它设备发送给用户。
在实施例中,可以与本文其它各处描述的任何类型的移动的车辆或装置一起使用的传感器112的示例包括运动学传感器和位置传感器。运动学传感器可以包括任何速度传感器,诸如雷达或车轮速度传感器、加速度计或陀螺仪。位置传感器可以包括:GPS接收器或收发器;或基于WiFi的位置或地图应用,这些应用被编程为基于附近的WiFi热点确定位置等。
在实施例中,可以与拖拉机或其它移动车辆一起使用的传感器112的示例包括:发动机速度传感器、燃料消耗传感器、与GPS或雷达信号交互的面积计数器或距离计数器、PTO(动力输出装置)速度传感器、被配置为检测液压参数(诸如,压力或流量和/或液压泵速度)的拖拉机液压传感器、车轮速度传感器或车轮滑移传感器。在实施例中,可以与拖拉机一起使用的控制器114的示例包括:液压方向控制器、压力控制器和/或流量控制器;液压泵速度控制器;速度控制器或调速器;悬挂位置控制器;或提供自动转向的车轮位置控制器。
在实施例中,可以与种子种植设备(诸如,播种机、钻机或空气播种机)一起使用的传感器112的示例包括:种子传感器,该种子传感器可以是光学传感器、电磁传感器或碰撞传感器;下压力传感器,诸如称重销、称重单元、压力传感器;土壤属性传感器,诸如反射率传感器、湿度传感器、电导率传感器、光学残留传感器或温度传感器;部件操作标准传感器,诸如种植深度传感器、下压力缸压力传感器、种子盘速度传感器、种子驱动电机编码器、种子输送系统速度传感器或真空度传感器;或农药应用传感器,诸如光学传感器或其它电磁传感器;或碰撞传感器。在实施例中,可以与这种种子种植设备一起使用的控制器114的示例包括:工具栏折叠控制器,诸如用于与液压缸相关联的阀门的控制器;下压力控制器,诸如用于与气压缸、安全气囊或液压缸相关联的阀门的控制器,并且被编程用于将下压力施加到单个行单元或整个播种机框架;种植深度控制器,诸如线性致动器;计量控制器,诸如电动种子计量器驱动电机、液压种子计量驱动电机或条带控制离合器;杂交种/品种选择控制器,诸如种子计量驱动电机或被编程用于选择性地允许或阻止种子或空气种子混合物将种子输送到种子计量器或中央散装料斗的其它致动器;计量控制器,诸如电动种子计量驱动电机、或液压种子计量驱动电机;种子输送系统控制器,诸如用于带式种子输送电机的控制器;或农药施用率控制器,诸如计量驱动控制器、孔口尺寸或位置控制器。
在实施例中,可以与耕作设备一起使用的传感器112的示例包括:用于工具(诸如,吸嘴杆或圆盘)的位置传感器;被配置为检测深度、配合角度或横向间距的这种工具的工具位置传感器;下压力传感器;或牵引力传感器。在实施例中,可以与耕作设备一起使用的控制器114的示例包括下压力控制器或工具位置控制器,诸如被配置为控制工具深度、配合角度或横向间距的控制器。
在实施例中,可以与用于施用肥料、杀虫剂、杀真菌剂等(诸如,播种机上的起步肥料系统、下土壤肥料施用器或肥料喷雾器)的装置有关的传感器112的示例包括:流体系统标准传感器,诸如流体传感器或压力传感器;指示哪个喷头阀门或流体管线阀门打开的传感器;与储罐相关联的传感器,诸如填充位传感器;分段或系统范围的供应线传感器,或行专用的供应线传感器;或运动学传感器(诸如,布置在喷雾器吊杆上的加速度计)。在实施例中,可以与这种装置一起使用的控制器114的示例包括:泵速度控制器;被编程为控制压力、流量、方向、PWM等的阀门控制器;或位置致动器,诸如吊杆高度、下土壤深度或吊杆位置。
在实施例中,可以与收割机一起使用的传感器112的示例包括:产量监测器,诸如冲击板应变仪或位置传感器,电容式流量传感器,负载传感器,重量传感器,或与升降机或螺旋钻相关联的扭矩传感器,或光学或其它电磁谷物高度传感器;谷物水分传感器,诸如电容传感器;谷物损失传感器,包括碰撞、光学或电容传感器;割台操作标准传感器,诸如割台高度、割台类型、盖板间隙、进给速度和卷筒速度传感器;分离器操作标准传感器,诸如凹形间隙、转子速度、靴形间隙或罩壳间隙传感器;用于位置、操作或速度的螺旋钻传感器;或发动机速度传感器。在实施例中,可以与收割机一起使用的控制器114的示例包括:用于元件(诸如,割台高度、割台类型、盖板间隙、进给速度或卷筒速度)的割台操作标准控制器;用于特征(诸如,凹形间隙、转子速度、靴形间隙或罩壳间隙)的分离器操作标准控制器;或用于螺旋钻位置、操作或速度的控制器。
在实施例中,可以与谷物推车一起使用的传感器112的示例包括:重量传感器、或用于螺旋钻位置、操作或速度的传感器。在实施例中,可以与谷物推车一起使用的控制器114的示例包括:用于螺旋钻位置、操作或速度的控制器。
在实施例中,传感器112和控制器114的示例可以被安装在无人驾驶飞行器(UAV)装置或“无人机”中。这种传感器可以包括:具有检测器的相机,这种检测器对包括可见光、红外、紫外线、近红外(NIR)等在内的电磁频谱的任何范围都有效;加速度计;高度计;温度传感器;湿度传感器;皮托管传感器或其它空速或风速传感器;电池寿命传感器;或雷达发射器和反射式雷达能量检测装置;其它电磁辐射发射器和反射电磁辐射检测装置。这种控制器可以包括:引导或电机控制装置,控制表面控制器,相机控制器,或被编程为接通、操作、从其获取数据、管理和配置前述传感器中的任何传感器的控制器。在美国专利申请No.14/831165中公开了示例,并且本公开假定其它专利公开的知识。
在实施例中,传感器112和控制器114可以被固定到土壤采样和测量装置,该装置被配置或被编程为对土壤进行采样以及执行土壤化学测试、土壤湿度测试以及与土壤有关的其它测试。例如,可以使用在美国专利No.8767194和美国专利No.8712148中公开的装置,并且本公开假定那些专利公开的知识。
在实施例中,传感器112和控制器114可以包括用于监测田地的天气状况的天气设备。例如,可以使用于2015年4月29日提交的美国临时申请No.62/154,207、于2015年6月12日提交的美国临时申请No.62/175,160、于2015年7月28日提交的美国临时申请62/198,060以及与2015年9月18日提交的美国临时申请No.62/220852中公开的装置,并且本公开假定那些专利公开的知识。
2.4过程概述——农艺模型训练
在实施例中,农业智能计算机系统130被编程或被配置为创建农艺模型。在本文中,农艺模型是农业智能计算机系统130的存储器中的数据结构,该数据结构包括田地数据106,诸如用于一个或多个田地的标识数据和收获数据。农艺模型还可以包括计算的农艺属性,该农艺属性描述了可以影响田地上的一种或多种农作物的生长的条件或一种或多种农作物的属性或以上两者。附加地,农学模型可以包括基于农艺因素的推荐,诸如农作物推荐、灌溉推荐、种植推荐、肥料推荐、杀真菌剂推荐、农药推荐、收获推荐和其它农作物管理推荐。农艺因素还可以被用于估计一个或多个农作物相关的结果,诸如农艺产量。农作物的农艺产量是对所生产的农作物的数量的估计,或者在一些示例中是从所生产的农作物获取的收入或利润。
在实施例中,农业智能计算机系统130可以使用预配置的农艺模型来计算与当前接收到的一个或多个田地的位置和农作物信息有关的农艺属性。预先配置的农艺模型基于先前处理的田地数据,包括但不限于标识数据、收获数据、肥料数据和天气数据。预先配置的农艺模型可以已经经过交叉验证,以确保模型的准确性。交叉验证可以包括与地面真实性的比较,该地面真实性将预测的结果与田地上的实际结果进行比较,诸如将降雨量估计与使用雨量计或提供相同位置或附近位置处的天气数据的传感器进行比较,或将氮含量估算与土壤采样测量进行比较。
图3图示了编程的过程,通过该过程,农业智能计算机系统使用由一个或多个数据源提供的田地数据来生成一个或多个预先配置的农艺模型。图3可以用作用于对农业智能计算机系统130的功能元件进行编程以执行现在描述的操作的算法或指令。
在框305处,农业智能计算机系统130被配置或被编程为对从一个或多个数据源接收的田地数据实施农艺数据预处理。可以对从一个或多个数据源接收的田地数据进行预处理,以消除噪声、失真效应以及包括可能对接收到的田地数据值产生不利影响的异常值的农艺数据内的混杂因素。农艺数据预处理的实施例包括但不限于:去除通常与异常数据值相关联的数据值,已知不必要地歪斜其它数据值的特定测量数据点,被用于去除或减小噪声带来的加法效应或乘法效应的数据平滑、聚合或采样技术,以及用于明确区分阳性数据输入和阴性数据输入的其它滤波或数据推导技术。
在框310处,农业智能计算机系统130被配置或被编程为使用预处理的田地数据执行数据子集选择,以便标识对于初始农艺模型生成有用的数据集。可以实现数据子集选择技术的农业智能计算机系统130包括但不限于:遗传算法方法、所有子集模型的方法、顺序搜索方法、逐步回归方法、粒子群优化方法、以及蚁群优化方法。例如,遗传算法选择技术基于自然选择和遗传学的进化原理,使用自适应启发式搜索算法来确定和评估在预处理农艺数据内的数据集。
在框315处,农业智能计算机系统130被配置或被编程为实现田地数据集评估。在实施例中,通过创建农艺模型并且使用所创建的农艺模型的特定质量阈值来评估特定田地数据集。可以使用一种或多种比较技术来比较和/或验证农艺模型,诸如但不限于,均方根误差和留一法交叉验证(RMSECV)、平均绝对误差和平均百分比误差。例如,RMSECV可以通过比较由农艺模型创建的预测的农艺属性值与收集和分析的历史农艺属性值来交叉验证农艺模型。在实施例中,农艺数据集评估逻辑被用作反馈回路,其中在未来数据子集选择步骤期间使用不满足配置的质量阈值的农艺数据集(框310)。
在框320处,农业智能计算机系统130被配置或被编程为基于交叉验证的农艺数据集来实现农艺模型创建。在实施例中,农艺模型创建可以实施多元回归技术以创建预配置的农艺数据模型。
在框325处,农业智能计算机系统130被配置或被编程为存储预配置的农艺数据模型以用于未来田地数据评估。
2.5种子分类子系统
在实施例中,除其它部件外,农业智能计算机系统130包括种子分类子系统170。种子分类子系统170被配置为生成种子的目标成功产量组,该目标成功产量组专门针对目标田地的最佳属性而标识。如本文使用的,术语“最佳”和相关术语(例如,“优化的”、“优化”等)是广义术语,指的是关于任何结果、系统、数据等的“最佳或最有效”(“通用优化”)以及“更好或更有效”(“相对优化”)的改善。目标成功产量组包括:一种或多种种子的子集、用于每种种子的估计的产量预测、以及成功超过类似分类种子的平均估计产量预测的概率。
在实施例中,基于由农业智能计算机系统130接收的输入来标识将在目标田地上最佳地执行的种子,该输入包括但不限于,用于多个不同种子的农业数据记录以及与收集农业数据记录的田地有关的地理位置数据。例如,如果接收到一百个种子的农业数据记录,则农业数据记录将包括一百个种子的生长和产量数据以及有关种植一百个种子的田地的地理位置数据。在实施例中,农业智能计算机系统130还接收用于第二田地集合的地理位置和农业数据。第二田地集合是种植者意在种植选择的种子的目标田地。有关目标田地的信息与将特定种子匹配到目标田地的环境特别相关。
种子标准化指令172提供指令以生成种子属性的数据集,该数据集描述了具有代表性的产量值和环境分类,其与由农业智能计算机系统130接收到的种子中的每种种子的优选的环境条件有关。成功世代的概率指令174提供指令以生成与种子中的每种种子相关联的成功概率分数的数据集。成功概率分数描述了在目标田地上的成功的产量的概率。产量分类指令176提供指令以基于与种子中的每种种子相关联的成功概率分数来生成已经被标识为在目标田地上具有最佳属性的种子的目标成功产量组。
在实施例中,农业智能计算机系统130被配置为经由呈现层134呈现选择的种子的目标成功产量组及其标准化的产量值和成功概率分数。
种子分类子系统170和相关指令在本文其它地方被附加地描述。
2.6种子推荐子系统
在实施例中,除了其它部件,农业智能计算机系统130包括种子推荐子系统180。种子推荐子系统180被配置为生成目标种子集合,该目标种子集合针对最佳表现被专门选择以最小化或降低在目标田地上的在风险。目标种子集合包括一种或多种种子的子集,这些子集的估计产量预测高于特定产量阈值,并且相关联的风险值低于特定风险目标。
在实施例中,基于已经被标识为具有在目标田地上产生成功产量的特定概率的种子输入集合来标识将在目标田地上最佳地执行的目标种子集合。农业智能计算机系统130可以被配置为接收种子集合,作为由种子分类子系统170生成的目标成功产量组的一部分。目标成功产量组还可以包括指定每种种子的成功的概率的农业数据以及其它农业数据(诸如,产量值、相对成熟度和先前观测的收获物中的环境观测)。在实施例中,农业智能计算机系统130还接收用于目标田地的集合的地理位置和农业数据。“目标田地”是种植者正在考虑或打算种植目标种子的田地。
种子过滤指令182提供指令以过滤和标识具有超过指定成功产量阈值的成功概率值的种子的子集。风险生成指令184提供指令以生成与种子中的每种种子相关联的风险值的数据集。风险值描述与相对于每种种子的估计的产量值的每种种子相关联的风险量。优化分类指令186提供指令以从风险值的数据集生成目标种子的数据集,该目标种子的平均产量值高于用于一系列风险值的目标阈值。
在实施例中,农业智能计算机系统130被配置为经由呈现层134呈现目标种子集合,并且包括它们的平均产量值。
种子推荐子系统180和相关指令在本文其它地方被附加地描述。
2.7实现方式示例—硬件概述
根据一个实施例,本文描述的技术由一个或多个专用计算设备实现。专用计算设备可以被硬连线以执行该技术,或者可以包括数字电子设备,诸如被永久地编程以执行该技术的一个或多个专用集成电路(ASIC)或现场可编程门阵列(FPGA),或者可以包括被编程为根据硬件、存储器、其它存储或组合中的程序指令来执行该技术的一个或多个通用硬件处理器。这种专用计算设备还可以将定制的硬连线逻辑、ASIC或FPGA与定制的编程相结合以实现该技术。专用计算设备可以是台式计算机系统、便携式计算机系统、手持式设备、网络设备或结合了硬连线和/或程序逻辑以实现该技术的任何其它设备。
例如,图4是图示了可以在其上实现本公开的实施例的计算机系统400的框图。计算机系统400包括总线402或用于通信信息的其它通信机制,以及与总线402耦合以用于处理信息的硬件处理器404。例如,硬件处理器404可以是通用微处理器。
计算机系统400还包括主存储器406(诸如随机存取存储器(RAM)或其它动态存储设备),该主存储器406被耦合到总线402以用于存储要由处理器404执行的信息和指令。主存储器406还可以被用于在执行要由处理器404执行的指令期间存储临时变量或其它中间信息。当将这些指令存储在处理器404可访问的非暂时性存储介质中时,它们将计算机系统400渲染成专用于执行指令中指定的操作的专用机器。
计算机系统400进一步包括只读存储器(ROM)408或其它静态存储设备,只读存储器(ROM)408或其它静态存储设备被耦合到总线402以用于存储静态信息和用于处理器404的指令。存储设备410(诸如,磁盘、光盘或固态驱动器)被提供并且被耦合到总线402以用于存储信息和指令。
计算机系统400可以经由总线402被耦合到显示器412(诸如,阴极射线管(CRT)),用于向计算机用户显示信息。包括字母数字键和其它键的输入设备414被耦合到总线402,用于将信息和命令通信到处理器404。另一种类型的用户输入设备是光标控件416(诸如鼠标、轨迹球或光标方向键),用于将方向信息和命令选择通信到处理器404并且用于控制显示器412上的光标移动。该输入设备通常在两个轴(第一轴(例如,x轴)和第二轴(例如,y轴))上具有两个自由度,其允许设备指定平面中的位置。
计算机系统400可以使用定制的硬连线逻辑、一个或多个ASIC或FPGA、固件和/或程序逻辑来实现本文描述的技术,这些逻辑与计算机系统结合使计算机系统400成为专用机器或对其进行编程。根据一个实施例,本文的技术由计算机系统400响应于处理器404执行包含在主存储器406中的一个或多个指令的一个或多个序列来执行。可以从另一个存储介质(诸如,存储设备410)将这种指令读入主存储器406。包含在主存储器406中的指令的序列的执行导致处理器404执行本文描述的处理步骤。在备选的实施例中,可以使用硬连线电路代替软件指令或者与软件指令结合使用。
如本文使用的,术语“存储介质”是指存储使机器以特定方式操作的数据和/或指令的任何非暂时性介质。这种存储介质可以包括非易失性介质和/或易失性介质。例如,非易失性介质包括:光盘、磁盘或固态驱动器(诸如,存储设备410)。易失性介质包括动态存储器,诸如主存储器406。例如,存储介质的常见形式包括:软盘、软磁盘、硬盘、固态驱动器、磁带或任何其它磁性数据存储介质、CD-ROM、任何其它光学数据存储介质、带孔图案的任何物理介质、RAM、PROM和EPROM、FLASH-EPROM、NVRAM、任何其它存储器芯片或盒式磁带。
存储介质不同于传输介质,但可以与传输介质结合使用。传输介质参与存储介质之间的信息传输。例如,传输介质包括同轴电缆、铜线和光纤、包括构成总线402的导线。传输介质还可以采用声波或光波的形式,诸如在无线电波和红外数据通信期间生成的声波或光波。
在将一个或多个指令的一个或多个序列承载到处理器404以供执行时,可以涉及各种形式的介质。例如,指令最初可以被承载在远程计算机的磁盘或固态驱动器上。远程计算机可以将指令加载到其动态存储器中,并且使用调制解调器通过电话线发送指令。计算机系统400本地的调制解调器可以在电话线上接收数据,并且使用红外发射器将数据转换为红外信号。红外检测器可以接收红外信号中承载的数据,并且适当的电路装置可以将数据放置在总线402上。总线402将数据承载到主存储器406,处理器404从该主存储器检索指令并且执行指令。由主存储器406接收的指令可以可选地在由处理器404执行之前或之后被存储在存储设备410上。
计算机系统400还包括耦合到总线402的通信接口418。通信接口418提供耦合到网络链路420的双向数据通信,该网络链路420被连接到本地网络422。例如,通信接口418可以是集成服务数字网络(ISDN)卡、电缆调制解调器、卫星调制解调器或者提供与对应类型的电话线的数据通信连接的调制解调器。作为另一个示例,通信接口418可以是局域网(LAN)卡,以提供到兼容LAN的数据通信连接。还可以实现无线链接。在任何这种实现中,通信接口418发送和接收承载表示各种类型的信息的数字数据流的电信号、电磁信号或光信号。
网络链路420通常通过一个或多个网络向其它数据设备提供数据通信。例如,网络链路420可以通过本地网络422提供到主机计算机424的连接,或者提供到有互联网服务提供商(ISP)426操作的数据设备的连接。ISP 426又通过全球分组数据通信网络(现在通常被称为“因特网”428)提供数据通信服务。本地网络422和因特网428二者都使用承载数字数据流的电信号、电磁信号或光信号。通过各种网络的信号以及在网络链路420上并且通过通信接口418的信号是传输介质的示例形式,该信号承载到计算机系统400和来自计算机系统400的数字数据。
计算机系统400可以通过(一个或多个)网络、网络链路420和通信接口418发送信息以及接收数据(包括程序代码)。在因特网示例中,服务器430可以通过因特网428、ISP426、本地网络422和通信接口418发送用于应用程序的请求码。
接收到的代码可以在其被接收到时由处理器404执行,和/或存储在存储设备410或其它非易失性存储中,用于以后执行。
3.功能概述—生成并且显示种子的目标成功产量组
图7描绘了基于种子的农业数据记录和与目标田地相关联的地理位置数据来生成针对目标田地上的最佳产量表现而标识的种子的目标成功产量组的详细示例。
3.1数据输入
在步骤705处,农业智能计算机系统130从一个或多个田地接收针对多个不同种子的农业数据记录。在实施例中,农业数据记录可以包括针对一种或多种种子的农作物种子数据。农作物种子数据可以包括与在一个或多个田地上种植、生长和收获的特定种子有关的历史农业数据。农作物种子数据的示例可以包括但不限于:历史产量值、收获时间信息和种子的相对成熟度、以及有关植物生命周期的任何其它观测数据。例如,农业数据记录可以包括针对两百(或更多)不同类型的可用玉米杂交种的种子数据。与玉米杂交种中的每种玉米杂交种相关联的农作物种子数据将包括:与观测的收获相关联的历史产量值、相对于种植的收获时间信息、以及针对在观测的田地中的每个观测的田地上的玉米杂交种中的每种玉米杂交种的观测的相对成熟度。例如,玉米杂交种001可以具有包括过去十年(或更长时间)内从二十个(或更多个)不同田地收集的历史产量数据的农业数据记录。
在实施例中,农业数据记录可以包括与在其中观测农作物种子数据的田地有关的田地特定数据。例如,田地特定数据可以包括但不限于:地理位置信息、基于田地地理位置的观测到的相对成熟度、历史天气指数数据、观测到的土壤属性、观测到的土壤水分和水位、以及可能特定于收集历史农作物种子数据的田地的任何其它环境观测。田地特定数据可以被用于进一步量化和分类农作物种子数据,因为它与种子中的每种种子有关。例如,基于种子的相对成熟度和生育期的长度,不同地理位置的不同田地可能更适合于不同的种子。特定区域和子区域内的田地可能具有特定的生育期相对成熟度,该相对成熟度基于与特定地理位置相关联的气候和生育期期间可用的生长度天数(GDD)。
图8描绘了基于生育期持续时间而具有不同的分配的相对成熟度的在州内的不同区域的示例。州805是伊利诺州,并且被分为多个不同的区域和子区域。子区域的示例可以包括基于县边界、市边界、或镇边界的区域。区域810、815、820、825和830中的每个区域表示具有不同生育期持续时间的地理位置特定区域。例如,区域810表示基于其地理位置并且由于气候凉爽而相关的气候具有较短的生育期的田地的区域。结果,区域810可以被分类为适合于具有100天的相对成熟度的种子的田地(在图8中示出为阴影和相应的GDD的图例)。区域815位于区域100的南部,因此可以具有较温暖的整体气候。区域815中的田地可以被分类为适合于具有105天的相对成熟度的种子的田地。类似地,区域820、825和830位于比区域810和815更靠南的位置,因此分别以110天、115天和120天的相对成熟度分类进行了分类。可以将不同区域的相对成熟度分类与种子的历史产量数据一起使用,以基于额定相对成熟度评估种子在田地上的表现如何。
在实施例中,农业数据记录内的特定田地数据还可以包括农作物轮作数据。针对田地的土壤养份管理可以取决于诸如建立不同的农作物轮作和管理土壤耕作量的因素。例如,一些历史观测表明,在田地上的不同作物之间轮作的“轮作效应”可以比每年种植同一种作物的作物产量提高5%至15%。结果,农业数据记录内的农作物轮作数据可以被用于帮助确定更准确的产量估算。
在实施例中,特定田地数据可以包括在农作物季节期间使用的耕作数据和管理实践。耕作数据和管理实践是指在特定田地上执行耕作的方式和时间表。土壤质量和土壤中有效养分的量根据表层土壤的量而变化。土壤侵蚀是指表层土壤的去除,表层土壤是有机质和养分价值最丰富的土壤层。造成土壤侵蚀的一种做法是耕作。耕作会破坏土壤团聚体并且增加土壤通气量,这可以加速有机物的分解。因此,跟踪耕作管理实践可以有助于理解对土壤侵蚀的影响程度,这可以影响种植的农作物的总产量。
在实施例中,农业数据记录包括历史农作物种子数据和来自用于由制造商确定种子属性的试验田的集合的田地特定数据。例如,孟山都公司(Monsanto Corporation)生产数种商业杂交种种子(例如,玉米杂交种)和种子品种(例如,大豆品种),并且在多个试验田上测试它们的作物生长。孟山都公司的试验田可以用作试验田的集合的示例,其中农业数据记录由农业智能计算机系统130收集和接收。在另一个实施例中,农业数据记录可以包括历史农作物种子数据和来自由个体种植者拥有和经营的田地特定数据。收集农业数据记录的这些田地的集合也可以是指定为种植新选择的农作物的目标田地的相同田地。在其它实施例中,当确定种子的目标成功产量组时,由种植者拥有和经营的田地的集合可以提供由其他种植者使用的农业数据记录。
再次参考图7,在步骤710处,农业智能计算机系统130接收用于一个或多个目标田地的地理位置信息。目标田地表示种植者正在考虑种植或计划种植从目标成功产量组选择的种子集合的田地。在实施例中,可以将一个或多个目标田地的地理位置信息与特定田地的农业数据记录结合使用,以基于相对成熟度和气候确定哪种种子最适合目标田地。
3.2农业数据处理
在步骤715处,种子标准化指令172提供指令以生成种子属性的数据集,该数据集描述了作为农业数据记录的一部分而接收的针对每种种子的代表性产量值和环境分类。在实施例中,与种子相关联的农业数据记录被用于计算用于种子中的每种种子的代表性产量值和环境分类。如果基于历史产量值和从过去的收获观测的其它农业数据种植在田地中,则代表性产量值是特定种子的预期产量值。
在实施例中,可以通过对来自跨不同观测的生长年的不同田地的多个不同的产量观测进行标准化来计算标准化的产量值。例如,可以使用首先种植特定种子的田地来计算特定种子的第一年平均生长周期产量。特定种子的第一年平均生长周期产量可以包括合并不同年份不同田地观测到的产量值。例如,特定的种子可能已经被种植在孟山都商业产品周期(PS3、PS4、MD1和MD2)的产品阶段期间(2011年至2017年)进行过测试的田地上。然而,特定种子的第一周期可能已经被种植在不同年份的田地中的每个田地上。下表示出了一个这样的示例:
2011 2012 2013 2014 2015 2016 2017
周期1 PS3 PS4 MD1 MD2
周期2 PS3 PS4 MD1 MD2
周期3 PS3 PS4 MD1 MD2
周期4 PS3 PS4 MD1 MD2
表中的列表示收获年,并且表中的行表示孟山都商业产品开发周期,其中周期1表示被种植在各种田地上的种子的4年,并且周期2表示用于被种植在相同田地环境上的另一个种子集合的4年的第二周期,依此类推。
在实施例中,可以基于在多个田地处种植的种子的相似周期来计算标准化的产量值。例如,可以将周期1的标准化的产量值计算为在田地PS3(2011)、PS4(2012)、MD1(2013)和MD2(2014)上观测到的产量值的平均值。通过这样做,可以基于在特定田地上已经发生了多少个生长周期的共同特征来对产量值进行平均。在其它实施例中,可以基于来自农业数据记录(诸如,同一年或同一区域/田地)的其它农业属性计算标准化的产量值。
在实施例中,可以使用与种子的农业数据记录相关联的相对成熟度田地属性来计算种子中的每种种子的环境分类。例如,特定种子可以已经被种植在区域820内的多个田地上。区域820内的田地中的每个田地被分类为具有与110天的相对成熟度一致的观测的生育期。因此,基于与特定种子相关联的田地,可以为特定种子的环境分类分配相对成熟度,该相对成熟度等于区域820的相对成熟度,即110天。在其它实施例中,如果与特定种子的历史观测相关联的田地包含被分类在多个区域内的田地,则可以将环境分类计算为不同的分配的相对成熟度值的平均值。
在实施例中,种子属性的数据集包含针对每种种子的标准化产量值以及描述与标准化产量值相关联的相对成熟度值的环境分类。在其它实施例中,种子属性的数据集还可以包括与种子生长周期和田地属性相关联的属性,诸如轮作、耕作、天气观测、土壤组成和任何其它农业观测。
再次参考图7,在步骤720处,成功概率生成指令174提供指令来生成用于种子中的每种种子的成功概率分数的数据集,该成功概率分数的数据集将成功的产量的概率描述为相对于具有相同相对成熟度的其它种子的平均产量而言获取成功产量的概率值。在实施例中,种子的成功概率分数基于相对于与目标田地相关联的地理位置的种子属性的数据集。例如,与目标田地的地理位置相关联的相对成熟度值被部分地用于确定要评估的种子集合,以便为特定种子计算成功概率分数。例如,玉米杂交种002可以是具有按7.5蒲式耳每英亩计算的标准化产量和100GDD的指定的相对成熟度的种子。然后,将玉米杂交种002与具有相似的相对成熟度的其它种子进行比较,以便基于玉米杂交种002和其它种子的标准化产量值确定玉米杂交种002是否是种植的良好候选者。
实现机器学习技术以确定与目标田地相关联的地理位置处的种子的成功的概率分数。在实施例中,标准化的产量值和分配的相对成熟度值被用作机器学习模型的预测变量。在其它实施例中,附加的属性(诸如,农作物轮作、耕作、天气观测、土壤成分)也可以被用作机器学习模型的附加的预测变量。机器学习模型的目标变量是从0到1的概率值,其中0等于成功产量的概率为0%,并且1等于成功产量的概率为100%,在其它实施例中,目标变量可以是概率值,该概率值可以从0到10、1到10或任何其它测量标度缩放。成功的产量被描述为特定种子的产量比类似地分类的种子的平均产量高出一定值的可能性。例如,成功的产量可以被定义为高于具有相同分配的相对成熟度值的种子的平均产量5蒲式耳/英亩的产量。
图9描绘了采样图,该采样图描述了在分类的相对成熟度内的种子的标准化产量值的范围。平均值905表示具有相同相对成熟度(诸如,100GDD)的种子的计算的平均产量值。在实施例中,可以通过实现最小有效差计算来确定哪些种子具有显著高于平均值905的标准化产量。最小有效差是统计概率的特定级别处的值。如果两个均值之间的差超过了该值,则两个均值被认为是不同的。例如,如果种子的产量值与计算的平均产量之间的差超过最小有效差值,则种子的产量被视为是不同的。在其它实施例中,可以使用任何其它统计算法来确定产量值与平均值905之间的确定的显著差异。
范围910表示被认为在最小有效差值之内,并且因此没有明显区别的产量值的范围。阈值915表示范围910的上限。然后,高于阈值915的标准化产量值被认为明显不同于平均值905。在实施例中,范围910和阈值915可以被配置为表示阈值,该阈值用于确定哪个种子产量被认为明显高于平均值905并且因此是成功的产量值。例如,阈值915可以被配置为等于高于平均值905了5蒲式耳/英亩的值。在实施例中,阈值915可以被配置为取决于平均值905、范围910和具有相同相对成熟度的特定种子的产量值的总范围的产量值。
范围920表示被认为是成功产量的种子的产量值的范围。种子925表示具有高于阈值915的标准化产量值的范围920内的特定杂交种种子或种子品种。在实施例中,机器学习模型可以被配置为当计算成功分数的概率在0至1之间时使用范围910和阈值915。不同的机器学习模型可以包括但不限于:逻辑回归、随机森林、向量机建模和梯度提升建模。
在实施例中,逻辑回归可以被实现为机器学习技术,以确定用于目标田地的每种种子的成功分数的概率。对于逻辑回归,种子中的每种种子的输入值是标准化的产量值和环境分类,该输入值被指定为相对成熟度。逻辑回归的功能形式为:
Figure BDA0003036197490000401
其中
P(y=1|x1yldi ,x2RMj )
是具有标准化产量值并且在具有给定的相对成熟度的目标田地j中的产品i的成功的概率(y=1);常数a、b和c是通过历史数据估算的回归系数。对于每种种子,逻辑回归的输出是在0至1之间的概率分数的集合,该概率分数的集合基于分配给与目标田地相关联的地理位置的相对成熟度来指定在目标田地处的成功。
在另一个实施例中,随机森林算法可以被实现为机器学习技术,以确定用于目标田地的种子中的每种种子的成功分数的概率。随机森林算法是一种集成的机器学习方法,该方法通过在训练周期期间构造多个决策树来进行操作,然后输出作为各个树的均值回归的类。每种种子的输入值是标准化产量值和作为相对成熟度的环境分类。输出是用于每种种子在0至1之间的概率分数的集合。
在另一个实施例中,支持向量机器(SVM)建模可以被实现为机器学习技术,以确定用于目标田地的种子中的每种种子的成功分数的概率。支持向量机器建模是一种监督学习模型,被用于分类输入是否使用分类和回归分析。用于支持向量机器建模的输入值是用于每种种子的标准化产量值和环境分类相对成熟度值。输出是针对每种种子在0至1之间的概率分数的集合。在又一个实施例中,梯度提升(GBM)建模可以被实现为机器学习技术,其中输入值是用于每种种子的标准化产量值和环境分类相对成熟度值。梯度提升是用于回归和分类问题的技术,该技术以一组弱预测模型(诸如,决策树)的形式产生预测模型。
参考图7,在步骤725处,产量分类指令176生成目标成功产量组,该目标成功产量组由已经被标识为具有高概率的种子的子集组成,以产生显著高于用于目标田地的相同相对成熟度分类内的其它种子的平均产量的产量。在实施例中,目标成功产量组包含具有高于特定成功概率阈值的成功的概率值的种子。成功概率阈值可以是与显著地高于其它种子的平均产量的产量相关联的配置的概率值。例如,如果在步骤720处,用于成功产量的产量阈值等于高于平均值5蒲式耳/英亩,则成功概率阈值可以与等于产量阈值的成功的概率值的成功的概率值相关联。例如,如果产量阈值等于高于平均产量5蒲式耳/英亩并且成功的概率值为0.80,则成功概率阈值可以被指定为0.80。在该示例中,目标成功产量组将包含成功的概率值等于或大于0.80的种子。
在其它实施例中,分别地取决于种植者是否期望较小或较大的目标成功产量组,成功概率阈值可以被配置为更高或更低。
3.3当前目标成功产量组
在实施例中,目标成功产量组包含具有指定的相对成熟度值的种子,该相对成熟度值等于与目标田地相关联的相对成熟度。在步骤730处,农业智能计算机系统130的呈现层134被配置为在田地管理器计算设备104上的显示设备上显示或导致显示目标成功产量组以及用于目标成功产量组内的每种种子的标准化产量值。在另一个实施例中,呈现层134可以将目标成功产量组的显示通信到可以被通信地耦合到农业智能计算机系统130的任何其它显示设备,诸如远程计算机设备、驾驶室内显示设备、或任何其它已连接的移动设备。在又一个实施例中,呈现层134可以将目标成功产量组通信到具有农业智能计算机系统130的其它系统和子系统,用于进一步处理和表示。
在实施例中,呈现层134可以显示可以与种植者有关的附加的种子属性数据和其它农业数据。呈现层134还可以基于成功的概率值将目标成功产量组中的种子进行分类。例如,可以以成功的概率值的降序对种子的显示进行分类,使得种植者能够首先查看其目标田地最成功的种子。
在一些实施例中,种植者在接收到显示的信息之后,可以对该信息采取行动并且种植推荐的种子。在一些实施例中,种植者可以作为确定目标成功产量组的组织的一部分来工作和/或可以被分开工作。例如,种植者可以是确定目标成功产量组的组织的客户,并且可以基于目标成功产量组来种植种子。
4.功能概述—生成和显示用于种植的目标种子
图10描绘了基于种子的农业数据记录和与目标田地相关联的地理位置数据来生成针对目标田地上的最佳产量表现和受管理风险而标识的目标种子集合的详细示例。
4.1数据输入
在步骤1005处,农业智能计算机系统130接收候选种子的数据集,该数据集包括:适合于在目标田地上种植的一种或多种种子,与每种种子相关联的成功的概率值,以及与每种种子相关联的历史农业数据。在实施例中,候选种子的数据集可以包括由种子分类子系统170标识作为具有高概率在目标田地上产生成功的产量值以及与该候选种子集合中的每种种子相关联的历史农业数据的一种或多种种子集合。在图7中的步骤725处生成的目标成功产量组可以表示候选种子的数据集。
在实施例中,历史农业数据可以包括与一个或多个田地上的特定种子的种植、生长和收获有关的农业数据。农业数据的示例可以包括但不限于:历史产量值,收获时间信息和种子的相对成熟度,以及有关植物生命周期的任何其它观测数据。例如,如果候选种子的数据集是来自种子分类子系统170的目标成功产量组,则农业数据可以包括分配给每种种子的平均产量值和相对成熟度。
在步骤1010处,农业智能计算机系统130接收关于目标田地的数据,种植者计划在这些田地中种植目标杂交种种子和/或种子品种的集合。在实施例中,关于目标田地的数据是属性信息,该属性信息包括但不限于:针对目标田地的地理位置信息和针对目标田地中的每个目标田地的尺寸和大小信息。在实施例中,可以将目标田地的地理位置信息与历史农业数据结合使用,以基于相对成熟度和目标田地的气候来确定目标种子的最佳集合以及要在目标田地中的每个目标田地上种植的目标种子中的每种目标种子的量。
4.2种子选择
在步骤1015处,种子过滤指令182提供指令以从具有成功的概率值大于或等于目标概率过滤阈值的种子的候选集合中选择一种或多种种子的子集。在实施例中,目标概率过滤阈值是与种子的候选集合中的种子中的每种种子相关联的成功的概率值的配置的阈值。目标概率过滤阈值可以被用于仅基于选择具有一定成功的概率的种子来进一步缩小种子的选择池。在实施例中,如果种子的候选集合表示在步骤725处生成的目标成功产量组,则种子集合可能已经被过滤为仅包括具有高成功的概率值的种子。在一个示例中,目标概率过滤阈值可以具有与被用于生成目标成功产量组的成功的产量阈值相同的阈值。如果是这种情况,则一种或多种种子的子集可以包括种子的整个集合。在另一个示例中,种植者可以期望更窄的种子的列表,这可以通过为目标概率过滤阈值配置更高的成功的概率值来过滤掉具有低于期望的成功的概率值的种子来实现。
在步骤1020处,种子标准化指令172提供指令以基于来自种子中的每种种子的历史农业数据的产量值来生成一种或多种种子的子集中的每种种子的代表性产量值。在实施例中,如果基于历史产量值和从过去的收获中观测的其它农业数据将特定种子种植在田地中,则代表性产量值是用于特定种子的预期产量值。在实施例中,代表性产量值是来自多个田地上的多个不同观测的生育期的产量的计算的平均值。例如,代表性产量值可以被计算为不同的观测的生长周期年的平均值,其中用于特定种子的平均第一年生长周期产量可以合并从不同年份不同田地观测的产量值的组合。在计算用于不同生长周期年的平均生长周期产量之后,平均值中的每个平均值可以被合并以生成用于每种特定种子的代表性平均产量。在另一个实施例中,代表性产量值可以是在步骤715处计算的标准化产量值。
4.3生成用于种子的风险值
在步骤1025处,风险生成指令184提供指令以基于与种子中的每种种子相关联的历史农业数据生成用于一种或多种种子的子集中的每种杂交种种子或种子品种的风险值的数据集。风险值基于代表性产量值,根据产量变异性描述了针对每种种子的风险量。例如,如果玉米杂交种002的代表性产量为15蒲式耳/英亩,但是玉米杂交种002的变异性很高,使得产量可以从5蒲式耳/英亩至25蒲式耳/英亩不等,而且玉米杂交种002的代表性产量可能不能很好地表示实际产量,因为产量可能在5蒲式耳/英亩至25蒲式耳/英亩之间变化。高风险值与产量回报的高变异性相关联,而低风险值与产量回报和与代表性产量更紧密一致的产量结果的低变异性相关联。
在实施例中,用于种子的风险值基于特定种子在两年或两年以上的年度产量回报之间的变异性。例如,计算用于杂交种002的风险值包括从历史农业数据的多年产量输出中计算产量值的变异性。用于玉米杂交种002的从2015年到2016年的产量输出中的方差可以被用于确定与用于玉米杂交种002的代表性产量值相关联的风险值。确定产量输出的方差不限于使用先前两年的产量输出,还可以利用多年的产量输出数据来计算方差。在实施例中,可以用蒲式耳/英亩的标准偏差来表示所计算的风险值,其中标准偏差被计算为所计算的风险方差的平方根。
在实施例中,用于种子的风险值可以基于针对特定年份的田间观测的产量输出的变异性。例如,计算与田地变异性相关联的风险值可以包括确定来自针对特定年份的特定种子观测的每个场地的产量的变异性。如果对于特定种子,跨多个田地的观测的产量输出为5蒲式耳/英亩至50蒲式耳/英亩,则特定种子可以具有高田地变异性。结果,可以基于田地变异性为特定种子分配高风险因素,因为任何给定的田地的预期输出可能在5蒲式耳/英亩至50蒲式耳/英亩之间变化,而不是接近于代表性产量值。
在另一个实施例中,用于种子的风险值可以基于年间产量回报之间的变异性和田间观测之间的变异性。年间风险值与田间风险值两者可以被结合以表示风险值,该风险值合并了跨多个观测的田地和多个观测的季节的产量输出的变异性。在其它实施例中,风险值可以合并与历史农作物生长和产量相关联的其它观测的农作物种子数据。
4.4生成目标种子的数据集
在步骤1030处,优化分类指令186提供指令,以基于风险值、用于种子的代表性产量值和用于目标田地一个或多个属性的数据集来生成用于种植在目标田地上的目标种子的数据集。在实施例中,基于目标种子的代表性产量值和来自风险值的数据集的相关的风险值选择目标种子的数据集中的目标种子。
确定要包括在目标种子的数据集中的种子的组合涉及确定用于特定种子的代表性产量和与特定种子相关联的风险值之间的关系。如果高产量种子也具有高风险水平,则选择具有高代表性产量的种子可能无法获得种子的最佳集合。相反,选择具有低风险值的种子可能不会获得足够高的产量回报。
在实施例中,可以基于它们的相应的代表性产量值相对于它们的相关联的风险值来绘制来自一种或多种种子的子集的种子的曲线图。图11描绘了用于一种或多种种子的子集的产量相对于风险的示例曲线图1105。y轴1110表示用于种子的代表性产量(作为预期产量),并且x轴1115表示用于种子的风险值(以标准偏差表示)。通过将风险值表示为标准偏差,风险值的单位可以与表示产量的单位相同,即蒲式耳/英亩。由组1125和组1130表示的曲线图1105上的点表示来自一种或多种种子的子集的种子中的每种种子。例如,曲线图1105示出了种子1135的代表性产量值为200蒲式耳/英亩,并且风险值的标准偏差为191蒲式耳/英亩。在其它实施例中,可以使用不同的单位来生成曲线图1105,诸如以美元计量的每英亩利润或任何其它导出的计量单位。
在实施例中,确定哪些种子属于目标种子的数据集涉及确定针对指定的风险量的预期的产量回报。为了生成可能对各种环境和其它因素具有适应力的目标种子集合,优选的是生成种子的多样化集合,这些种子包含具有较低的风险值和较高的风险值以及中高产量输出的种子。参考图10,步骤1032表示针对风险值的范围生成代表性的产量值的目标阈值。在实施例中,优化分类指令186提供指令以计算最佳边界曲线,该最佳边界曲线表示在风险值的范围内具有可管理的风险容忍量的最佳产量输出的阈值。边界曲线是拟合曲线,该拟合曲线表示考虑到最佳效率的相对于图形输入值的最佳输出。例如,曲线图1105包含基于代表性产量相对于风险值的种子,其中可以推断出具有较高产量的特定种子也可能具有较高的风险。相反,具有较低风险值的种子可能具有较低的代表性产量值。边界曲线1120表示基于风险值的范围跟踪最佳产量的最佳曲线。
在步骤1034处,优化分类指令186提供指令以通过选择具有满足由边界曲线1120定义的阈值的代表性产量和风险值的种子来选择组成目标种子集合的种子。落在边界曲线1120上或边界曲线1120附近的种子以期望的风险水平提供最佳的产量水平。目标种子1140表示用于目标种子的数据集的种子的最佳集合。落在边界曲线1120下方的种子对于风险水平具有次优产量输出,或者对于所产生的产量输出的水平具有高于期望的风险。例如,种子1135在边界曲线1120下方,并且可以被解释为具有低于其风险量的最佳产量,如通过将种子1135垂直地放置在边界曲线1120的下方所示。而且,种子1135可以被解释为具有高于其产量输出的期望风险,如对于代表性产量而言,通过将种子1135水平地放置在边界曲线1120的右侧所示。不在边界曲线1120上或边界曲线1120附近的种子1135对于其相关联的风险值具有次优的代表性产量,因此不被包括在目标种子集合中。附加地,种子1135表示具有高于期望的风险值的种子,因此不被包括在目标种子集合中。
在实施例中,优化分类指令186提供指令以生成针对目标种子集合中的每种目标种子的分配指令。分配指令描述了针对目标种子集合中的每种目标种子的种子分配量,该目标种子集合基于目标田地的数量和位置为种植者提供最佳分配策略。例如,针对包括种子(CN-001、CN-002、SOY-005、CN-023)的目标种子集合的分配指令可以包括CN-001的75%、CN-002的10%、SOY-005的13%以及CN-023的2%的分配。分配指令的实施例可以包括但不限于:种子袋的数目、要跨目标田地种植的种子总数的百分比或针对要种植的每种目标种子的分配英亩数。在实施例中,可以使用第三方优化求解器产品(诸如,IBM的CPLEX优化器)来计算确定分配量。CPLEX优化器是用于线性编程、混合整数编程和二次编程的数学编程求解器。优化求解器(诸如,CPLEX优化器)被配置为评估与目标种子相关联的代表性产量值和风险值,并且确定用于为目标种子集合中的目标种子中的每种目标种子分配种子数量的分配指令的集合。在实施例中,优化求解器可以使用目标种子的代表性产量值的总和以及目标种子的风险值的计算的总和来计算配置的总风险阈值,该风险阈值可以被用于确定用于目标种子集合的允许的风险和产量输出的上限。
在另一个实施例中,优化求解器还可以输入描述目标田地中的每个目标田地的大小、形状和地理位置的目标田地数据,以便确定包括针对目标种子的分配中的每个分配的放置指令的分配指令。例如,如果特定目标田地以特定方式成形或定尺寸,则优化求解器可以确定在该特定田地上分配一种目标种子是优选的,这与在该特定田地上种植多种目标种子相反。优化求解器不限于CPLEX优化器,其它实施例可以实现其它优化求解器或其它优化算法来确定用于目标种子集合的分配指令的集合。
4.5种子简档分析
步骤1030描述了使用边界曲线基于目标田地确定并且生成目标种子集合,以确定用于期望的风险水平的最佳产量输出。在实施例中,优化分类指令186提供指令以配置边界曲线,以确定相对于相同区域或子区域内的其他种植者的种植者的种子简档的总体最佳表现。例如,可以针对特定区域内的每个种植者计算代表性产量输出和总体风险值。例如,使用针对多个种植者的历史农业数据,可以对由每个种植者种植的种子的代表性产量值和相关联的风险值进行汇总,以生成与每个种植者相关联的合计产量输出值和合计风险值。然后,可以将针对每个种植者合计值绘制在种子简档曲线图上,类似于曲线图1105,其中曲线图上的各个点可以表示种植者的合计种子产量输出和合计风险。在实施例中,可以生成边界曲线以确定针对特定区域中的种植者的最优合计产量输出和合计风险。在边界曲线上或边界曲线附近的种植者可以表示其种子简档产生具有风险可控量的最佳产量的种植者。在边界曲线下方的种植者表示未基于其风险最大化其输出的种植者。
在实施例中,如果针对种植者的种子简档的合计产量输出和合计风险未达到针对由种子简档曲线图上的边界曲线描述的种子简档的最佳阈值,则优化分类指令186提供指令以生成针对特定种植者的警报消息。呈现层134可以被配置为向种植者呈现警报消息并且将警报消息发送到田地管理器计算设备104。然后,种植者可以选择可以为未来种植季节提供最佳产量输出的目标种子集合的请求。
4.6目标种子的当前集合
在实施例中,目标种子的数据集可以包含来自风险值的数据集的代表性产量值和风险值,其与针对目标田地的目标种子的数据集中的每种目标种子相关联。参考图10,在步骤1035处,农业智能计算机系统130的呈现层134被配置为在田地管理器计算设备104的显示设备上通信包括用于每种目标种子的代表性产量值和相关联的风险值的目标种子的数据集的显示。在另一个实施例中,呈现层134可以将目标种子的数据集的显示通信到可以被通信地耦合到农业智能计算机系统130的任何其它显示设备(诸如,远程计算机设备、驾驶室内的显示设备或任何其它已连接的移动设备)。在又一个实施例中,呈现层134可以将目标种子的数据集通信到具有农业智能计算机系统130的其它系统和子系统,用于进一步处理和表示。
在实施例中,呈现层134可以显示用于每种目标种子的分配指令,包括种子分配和放置信息。呈现层134还可以基于分配量对目标种子进行排序,或者可以基于在目标田地上的放置策略来呈现目标种子。例如,目标种子和分配指令的显示可以被叠加在目标田地的地图上,使得种植者可以可视化即将到来的季节的种植策略。
在一些实施例中,种植者可以接收与分配指令有关的信息以及基于分配指令来种植种子。种植者可以作为确定分配指令的组织的一部分来工作和/或可以被分开工作。例如,种植者可以是确定分配指令的组织的客户,也可以基于分配指令来种植种子。
5.功能概述—按田地生成和显示产量改进推荐
如上所述,本文公开的实施例可以被用于基于由农业智能计算机系统130接收的输入来标识将在目标田地上最佳地执行的种子产品。这种输入可以包括:用于不同种子的农业数据和历史产量数据,以及与观测种子数据的种植者的田地相关联的环境数据。除了种植者数据之外,农业智能计算机系统130还可以利用在与种子相关联的不同育种和发育阶段期间观测的种子和环境数据。这些数据是有价值的,并且随着分析收获、环境条件变化、添加独特的田地位置以及进一步开发和测试新种子和现有种子,这些数据会随着时间的推移而不断增长。即使这样,也不能在每个田地位置或在每种环境条件的潜在组合下对种子进行测试。
在实施例中,通过使用遗传数据来生成尚未在特定环境条件下测试的种子的农业数据,来丰富在所公开的机器学习模型中使用的数据。例如,公开的技术通过获取和使用种质(基础遗传学+性状)和/或谱系信息、遗传簇模式和/或基因组标记关系来使用遗传学数据,以估算不同环境中的产量数据。使用计算机实现的指令来对所有这种数据进行数字存储、检索和转换。
图12图示了包括利用遗传学来填补历史农业数据中的数据空白的示例流程图。由此得到的农业数据将以预测的估算数据得到增强,这些数据可以为在具有特定环境条件的实际田地中改善种子布置计算策略奠定基础。根据一个示例,图1的农业智能计算机系统130被编程或被配置为执行图12的流程图1200的功能。例如,种子分类子系统170和/或种子推荐子系统180可以包括如本文进一步描述的遗传建模指令。
5.1数据输入
在框1202处,例如,农业智能计算机系统130接收或以其它方式访问农业数据记录。在一个示例中,计算机系统130通过数字数据通信网络109接收农业数据记录。例如,农业数据记录包括:农作物种子数据和种子的产量属性以及种子被种植和/或被测试的环境数据。
图13图示了接收的农业数据记录以及进一步处理以估算数据值的示例。在图13中,接收的农业数据记录包括种子产品G1、G2、G3、G4、G5、G6以及以蒲式耳/英亩(bu/ac)的形式提供的(例如,与不同的田地或环境E1、E2、E3、E4相关联的)产量数据。产量数据可以与特定年份或收获相关联,并且可以接收针对其它年份/收获的附加的数据记录,和/或产量数据可以是多年数据的平均产量或其它表示形式。作为示例,种子产品G1被种植在田地E1中并且与222bu/ac的实际产量相关联。但是,接收的农业数据记录缺少应与给定田地中的给定种子产品相关联的选择的产量数据。例如,在图13中,没有产量数据与田地E1中的种子产品G3相关联。这种数据空白可能是由于未在给定田地中种植给定种子或其它原因导致的。实际上,不可能在独特的环境条件的每个组合中对每种种子进行实际的田地测试或实验室测试。
图14图示了接收的农业数据记录和进一步处理以填补数据空白的另一个示例。在图14中,提供了针对不同产品阶段的数据记录。例如,数据记录1402与早期产品开发或育种阶段相关联,数据记录1404与随后的产品开发或商业测试阶段相关联,并且数据记录1406与田地使用阶段相关联。每个数据记录的第一列标识了育种阶段H1、H2、H3、H4处的不同种子(例如,玉米杂交种),以及商业测试和田地使用阶段P1、P2、P3、P4处的种子产品。为了讨论的目的,种子H1、H2、H3、H4从育种阶段开始生长,并且在其它阶段中被分别地重命名或被后续标识为对应的种子产品P1、P2、P3、P4。
数据记录1402中的顶部行标识不同的测试周期PS3、PS4,该测试周期可以由给定的时间段(诸如,一年)定义,并且与独特的环境条件相关联。数据记录1404中的顶部行标识不同的附加测试周期MD1、MD2,该测试周期可以类似地由给定的时间段(诸如,一年)定义,并且可能与其它独特的环境条件相关联。数据记录1406中的顶部行标识与不同的田地或环境Fld1-FldX相关联的周期,在该环境中种植和收获种子产品以提供产量数据。
类似于图13中接收的农业数据记录,在图14中的数据记录也具有数据空白,其中在给定的田地或测试环境中没有产量数据与给定的种子产品相关联。然而,即使存在数据空白,由图13和图14表示的农业数据记录也为成千上万个田地位置和测试条件以及在多个产品阶段中的一千种或更多种子提供了丰富的信息、测试周期以及多年的种植和收获周期。本实施例使用遗传学关系来在这种丰富的信息上进一步增强和建设。接收的农业数据记录可以与广泛的特征数据相关联,该特征数据与种子、环境和/或测试条件以及产量属性有关。这种特征数据的一般类别与天气、土壤条件、环境分类、田地管理实践、害虫风险、遗传特征以及捕获基因和环境特征之间的非累加相互作用的整体基因组逐环境特征(GxE特征)有关。这种特征数据的其它类别包括基因组逐管理特征(GxM)和基因组逐环境逐管理特征(GxExM),它们分别地捕获了遗传和管理特征之间的非叠加性相互作用以及遗传、环境和管理特征之间的相互作用。本文提供了这种类别内的各种特定特征。
参考回图12,在框1204处,计算机系统130接收或以其它方式访问与种子有关的遗传特征数据。遗传数据可以包括种子之间的遗传关系。尽管在一个示例中,计算机系统130使用接收的原始遗传特征数据来发展种子之间的这种遗传关系。在一个示例中,在框1202处接收或访问的农业数据记录与第一种子集合相关联,在框1204处接收或访问的遗传特征数据与第二种子集合相关联,并且第二种子集合包括第一种子集合。在一些实施例中,可以从德国勒沃库森的拜耳公司的农作物科学部门商业地获取遗传特征数据和/或遗传关系。
图15图示了包括基因组标记数据的遗传特征数据的示例。基因组标记数据通常是可以被用于标识独特基因特征的基因或DNA序列。在一个示例中,如图15中的基因1-10表示的,基因组标记数据可以结合在种子中发现的全基因组单核苷酸多态性(SNP)标记。
图16图示了基于谱系的示例亲属矩阵,该矩阵基于种子谱系标识在种子之间的成对关系。该关系由介于0.0至1.0之间的值捕获,其中值0.0表示两个种子根据谱系完全不同且不相关,而值1.0表示两个种子具有相同的谱系。计算机系统130可以在框1204处接收该基于谱系的亲属矩阵,或者可以通过跟踪与原始亲本起源基因型(谱系)有关的雌性和雄性近交标记数据,来使用基因组标记数据来生成矩阵,以开发矩阵。
图17图示了将种子组织成遗传簇关系的示例。通常,基因簇是在种子的DNA内发现的一组基因,它们以相似的多肽或蛋白质而被编码,该多肽或蛋白质共同分享普遍的功能。在图17中,下部分支或单个末端表示不同的种子,这些种子根据共享的基因组标记数据或基因在基因树中进行组织。图17图示了通过不同的遗传簇1702、1704、1706、1708、1710进一步标识种子的示例。计算机系统130可以在框1204处接收该遗传簇数据,或者可以使用基因组标记数据将种子组织为任何数目的合适的遗传簇关系。
图18图示了基于基因标记的示例亲属矩阵,该矩阵基于SNP标记标识种子之间的成对关系。该关系由介于0.0至1.0之间的值捕获,其中值0.0表示两个种子完全不同且根据SNP标记不相关,并且值1.0表示两个种子相同。计算机系统130可以在框1204处接收该基于标记的亲属矩阵,或者可以使用基因组标记数据来使用适当的计算方法(诸如,平方欧几里得距离计算)来生成矩阵。如由图16和图18示意性所示,与基于谱系的矩阵相比,基于标记的亲属矩阵提供了种子对之间的更详细的关系数据。
图19示出了近交编码矩阵的示例,该矩阵可以被用于通过捕获产品的近交亲本系来区别地标识种子产品。更特别地,图19包括“雌性”列,该雌性列将三个示例雌性种子产品标识为FL1、FL2和FL3。针对雌性亲本系的“一键式示例”矩阵提供了嵌入方法来编码给定的产品的亲本特征。更特别地,雌性产品FL1被编码为100,FL2被编码为010,FL3被编码为001,如果有附加的雌性产品则依此类推。图19还提供了“雄性”列,该雄性列将三个示例雄性种子产品标识为ML1、ML2和ML3。针对雄性亲本系的对应的“一键式示例”矩阵提供了嵌入式方法,以对给定的产品的亲本特征进行编码。更特别地,雄性产品ML1被编码为100,ML2被编码为010,ML3被编码为001,如果有附加的雄性产品则依此类推。
在近交编码的该示例中,一键式矩阵被用于将给定的产品线转换为捕获近交亲本系信息的代码或ID。通常,杂交种种子产品的特征在于雌性亲本系和雄性亲本系。对于给定的杂交种种子,一键式矩阵被用于为杂交种的每个雌性系和雄性系提供代码。例如,从FL1和ML1开发的第一杂交种将被编码为100+100,从FL2和ML2开发的第二杂交种将被编码为001+010,并且从FL2和ML3开发的第三杂交种将被编码为010+001。结果,可以通过集合近交亲本系数据的方式对杂交种进行唯一编码,这对于区分不同的种子产品以及更精确地将GxE和产量特性与不同的产品相关联很有用。
5.2数据归因
在框1206处,计算机系统130生成用于与特定田地或环境相关联的种子的预测的产量属性。更特别地,计算机系统130利用接收的农业数据记录和遗传特征数据(包括种子之间的遗传关系)来提供估算的产量数据,以填补例如在图13和图14中表示的数据空白。在一个示例中,计算机系统使用统计混合效应模型利用以下数学表示形式组合各种项:产量(bu/ac)=f(G+E+GxE+误差)。G项表示杂交种/品种的列表的遗传特征数据,并且可以包括相对成熟度、生物技术性状、基因组标记数据、基于谱系的亲属矩阵、遗传簇关系和基于基因标记的亲属矩阵。E项表示用于田地的集合的环境和管理特征,并且可以包括降水、干旱风险、热应力、土壤成分、土壤质地、土壤排水、环境地带、疾病风险、农作物轮作、耕作实践等。GxE项是用于捕获遗传特征与环境/管理特征之间的非叠加性相互作用的数学术语。GxE捕获由于种子在不同环境条件下表现不同而引起的变异性,这也可以考虑管理特征。误差项有助于考虑G、E和GxE项未捕获的产量变化。
总体而言,遗传关系数据(诸如,基因组标记数据、基于谱系的亲属矩阵、遗传簇关系和/或基于基因标记的亲属矩阵)有助于通过标识在特定环境条件下测试的种子与未在特定环境条件下测试的种子之间的基因相似度来改善数据估算过程。适当的机器学习模型(诸如,统计混合效应模型或最佳线性无偏预测(BLUP)模型)和本文讨论的遗传特征和关系,以及其它可能的遗传特征和关系、原始环境特征或者过滤的和工程化的环境特征以及GxE相互作用都使用这种程度的遗传相似性,以提供更可靠的产量预测来填补数据空白。图13和图14中的每个图使用遗传特征以及具有估算的产量值以填充数据空白的所得的数据记录,分别地提供了接收的数据记录的示例(处理块1310、1410)。
在一个示例中,可以使用根据以下等式的混合的基因组BLUP来计算估算的产量数据:产量=Xβ+Zu+误差。Xβ项表示固定的环境效应的向量,Zu表示杂交种基因组因子和环境因素之间的关系或相关性的向量,并且误差项是考虑到其它产量变化的随机残余效应的向量。在该示例中,u项遵循具有由方差-协方差矩阵K(例如,杂交种之间的亲属矩阵)和标识矩阵I所捕获的相关性的随机分布,并可以根据以下等式被确定:
Figure BDA0003036197490000541
5.3确定预期的产量表现
在框1208处,计算机系统130确定用于一种或多种种子的预测产量表现。在一个示例中,在框1208处,计算机系统130基于在框1206处生成的估算的数据集、其它遗传数据以及用于一个或多个目标田地或环境的田地属性,生成用于一种或多种种子的成功分数的概率。备选地或组合地,计算机系统130在框1208处使用估算的数据集、其它遗传数据和田地属性来确定预测的产量表现,以生成绝对产量值或相对产量值、产量排名和/或其它产量表现度量。
在一个示例中,在框1208处或其它地方的流程图1200包括接收或以其它方式访问用于计划要种植种子的一个或多个目标田地的特征数据。实现机器学习模型来确定用于(一个或多个)目标田地处的种子的预测的产量表现。在实施例中,机器学习模型使用估算的产量数据、遗传关系数据、基因组标记数据(例如,与图15相关的数据)、遗传簇数据(例如,与图16和图17相关的数据)、近交编码(例如,与图19相关的编码)和/或遗传亲属矩阵(例如,与图16和图18相关的矩阵)、GxE特征以及环境和管理田地属性作为预测变量。例如,机器学习模型的目标变量可以是范围从0到1的概率值,其中0等于成功的产量的概率为0%,并且1等于成功的产量的概率为100%。在示例中,成功的产量被描述为特定种子的产量比类似地分类的种子的平均产量高出一定值的可能性。例如,成功的产量可以被定义为高于具有相同分配的相对成熟度值的种子的平均产量5蒲式耳/英亩的产量。例如,本文相对于图7和图9描述了附加的细节和技术。
本公开包括利用基因组预测和遗传学相关特征来改善田地布置模型的附加的技术。附加的遗传特征数据(G)以及遗传特征与环境特征之间的相互作用(GxE)可以被用作训练模型中的数据层,例如包括:杂交种和近交遗传杂交种群;与关键生物技术性状和关键定量性状基因座(QTL)、全基因组遗传学标记和/或长型单倍型相关联的基因标记;近交BLUP-GCA(一般结合能力)产量和与产量相关的表型;杂交种和近交疾病特征(GLS、NLB、SR、ASR、GW)和其它基因组预测特征以及衍生的与遗传有关的特征。
根据实施例,田地布置模型可以使用包括近交产品系和杂交种簇的遗传杂交种群的数据层。更特别地,簇模型被配置为处理基因标记数据以及近交和杂交种信息以从中生成或估计近交产品系和杂交种簇的遗传杂交种群。通常,杂交种群是来自相同种群或不同种群的一组相关的种质或不相关的种质,当与其它遗传上不同的种质群体的种质杂交时,它们表现出相似的结合能力和杂交种反应。参考的近交和杂交种信息被用于验证和导出杂交种群或杂交种簇。
田地布置模型还可以使用基因标记数据,该基因标记数据包括生物技术性状的基因标记数据、关键QTL的基因标记数据、全基因组基因标记数据和/或长型单倍型数据。在该示例中,田地布置模型可以使用通常是原始数据的这种基因标记数据,作为其它遗传亲属矩阵数据的备选或补充,该基因标记数据提供了从上述原始基因标记数据导出的相关性。
此外,田地布置模型可以使用混合的预测模型,该混合的预测模型被配置为处理原始研究和市场开发疾病以及杂交种和近交产品的其它表型的数据和基因标记数据,以从中开发近交BLUP-GCA产量和与产量相关的表型、杂交种和近交疾病特性、以及其它基因组预测或衍生的特征。
5.4种子优化和推荐生成
在框1210处,计算机系统130可以使用一个或多个目标田地的独特特征或属性以及成功概率分数的数据集,来生成针对种植者田地的田地特定种子推荐。计算机系统130可以在框1210处接收目标田地的独特特征或属性,或者可以在其它时间处接收这些特征。该推荐可以包括诸如以密度为单位的播种率的信息。以密度为单位的播种率可以被用于推荐选择特定种子,以便获取期望的目标产量范围。在实施例中,以密度为单位的播种率还可以被用于调节种子种群或种子密度。图12的过程的总体结果是,估算的数据提供了可以与目标田地的独特特征匹配的有用的产量信息,从而针对那些独特特征定制每个推荐。与先前的模型相比这提高平均产量,而先前的模型可以按更大的范围(诸如,区域或邮政编码)推广推荐。
在生成推荐时,计算机系统130还可以执行特征选择以减少来自许多田地特征的冗余。通常,特征选择有助于避免潜在的尺寸问题,去除冗余特征,消除非预测特征或特征的组合,并且通过减少过度拟合来增强泛化能力,从而简化模型并且减少缺失的特征数据的影响。计算机系统130可以使用适当的策略来执行特征选择,诸如基于自动化的似然比测试的向后选择。
此外,类似于本文讨论的其它示例,计算机系统130可以引起针对每个田地的推荐的显示。
5.5验证和调整模型
在框1212处,计算机系统130可以验证和调节机器学习模型。在一个示例中,验证过程包括:接收用于特定田地中种植的杂交种/品种的实际产量数据,并且将该产量数据与估算的产量数据进行比较。验证过程还可以接收用于在相同田地、附近田地或以其它方式共享属性的类似的组合的田地上生长的不同种子的产量数据,并且将用于不同种子的产量数据相互比较。这种在田地级别处的验证提供的数据可以被用于帮助改善推荐,并且提供优于可能在低于级别处执行验证的先前模型的结果。然后,计算机系统130可以通过修改对应的模型(诸如,通过修改GxE、GxM和/或GxExM关系和/或调节上述误差项)来解决实际产量数据与估算的产量数据之间的差异。然后,可以使用调节后的模型来生成估算的产量数据和计算推荐的未来迭代。
在框1212处,计算机系统130还可以将实际产量数据与其它数据输入以及机器学习技术一起使用,以帮助标识可以预示积极种子布置结果的特定环境和管理属性。通常,计算机系统130可以应用机器学习技术来标识单个属性与属性和产量输出的组合之间的相关性。在一个示例中,例如,通过简化来自不同用户的计算和/或数据输入,将预测属性用于生成估算的产量数据和计划推荐的未来迭代中。预测属性还可以在不同的育种和产品开发阶段被使用,以帮助增强农业数据并且推动研究和测试。
6.功能概述—包括功能工程以增强用于推荐建模的数据的实施例
图20图示了使用特征工程对特征数据进行分类并且准备用于图12的推荐模型的农业数据记录的示例过程。本文公开的过程可以被扩展和定制用于特定产品(诸如,玉米)。通常,就不同产品的产量而言,不同的环境特征可以被视为主要驱动因素。在一个实施例中,玉米生长主要由热量单位或生长度单位驱动。图20的过程2000可以被用于设计特定产品的特征,以利用关于关键特征的知识或以其它方式开发和增强数据以在推荐建模中提供质量结果。例如,在框1210处可以使用工程特征来生成用于目标田地或环境的田地特定种子推荐。
6.1原始特征和特征分类
在框2002处,例如,农业智能计算机系统130标识作为产量的重要驱动因素的原始特征,并且进一步执行特征分类以将连续特征转换为分类特征。原始特征可以从包括地形学和水文学、天气、管理实践以及土壤特性的一般类别中被导出。例如,地形学和水文学导出的特征包括:海拔、坡度、轮廓曲线(凹凸特性)、坡向(坡度所面向的轮盘方向)、距水源的距离、土壤EC500等。天气导出的特征可以与日长、温度、蒸散量、降雨、太阳特性、干旱指数等有关。管理导出的特征可以包括种植时机、收获时机、每英亩种植的种子、种子产品细分、种子MAC地带、种子位置成熟度组地带等。例如,土壤导出的特征可以量化或表征有机物质、质地类别、沙子/粘土百分比、渗透性和堆积密度、CEC(阳离子交换容量)、PAW(植物可用水分)和土壤生产力指数。
在框2002处,农业智能计算机系统130标识驱动用于特定产品的产量的一个或多个特征。根据实施例,系统130通过将至少所标识的关键特征表征为较少数目的不同特征类别,将以其它方式连续的特征转换为类别特征。然后,与使用原始连续的特征相比,系统130可以在图12的推荐建模中使用这种关键特征分类以增强结果。
以玉米为例,关键特征包括土壤和地形特征。基于不同环境(例如,印第安纳州、伊利诺伊州、爱荷华州、明尼苏达州、密苏里州和威斯康星州)的田地数据和科学研究,可以根据表1的示例对土壤和地形特征进行分类:
Figure BDA0003036197490000581
Figure BDA0003036197490000591
Figure BDA0003036197490000601
表1—示例特征分类
6.2准备数据
在框2004处,例如,农业智能计算机系统130通过数字数据通信网络109接收农业数据记录。例如,农业数据记录包括农作物种子数据和种子的产量属性以及种子被种植和/或测试的环境数据。在框2006处,系统130进一步为机器学习模型(例如,图12的推荐模型)准备接收的农业数据记录。根据实施例,系统130使用框2002的关键特征分类来表征接收的环境特征,以准备在机器学习模型中使用。说明性地,作为框2004的结果,系统130将来自多个田地的种子的产量属性与对应于特定田地条件的关键特征分类相关联。
在框2006处,系统130还可以执行过滤以提取用于推荐建模中的更多重要的数据。在玉米的情况下,与只有一个产品或相对少量产品的田地相比,在相同田地中测试或种植了多种产品的田地可以发现大量的产量数据。例如,在框2006处,系统130可以仅针对具有六个或多个同时测试的产品的田地提取农业数据记录,并且使用关键特征分类仅对该提取的数据进行推荐建模。
根据实施例,系统130使用处理的农业数据记录来生成在种子的遗传特征、田地特征和产量之间的GxE关系,例如,该产量使用一些形式的BLUP模型(例如,环境最佳线性无偏预测(eBLUP)模型)、T-stat和/或使用高斯过程的核平滑处理。例如,系统130还可以使用处理的农业数据来根据图12的框1206来填补数据空白。如上所述,GxE关系和/或估算数据可以被用于为一个或多个特定目标田地生成针对一种或多种种子的预测产量表现,从而生成田地水平的产量改善推荐。

Claims (20)

1.一种计算机实现的方法,包括:
通过在服务器计算机系统处的数字数据通信网络,接收农业数据记录,所述农业数据记录包括针对在第一环境集合中生长的第一种子集合的第一产量属性集合;
通过所述数字数据通信网络,接收与第二种子集合有关的遗传特征数据,其中所述第二种子集合包括所述第一种子集合;
使用所述服务器计算机系统,通过应用使用所述遗传特征数据以及所述农业数据记录的模型,来生成针对与第二环境集合相关联的所述第二种子集合的第二产量属性集合,其中所述第二产量属性集合填补来自所述第一产量属性集合的一个或多个数据空白;
使用所述服务器计算机系统,通过应用所述第二产量属性集合,确定针对与一个或多个目标环境相关联的第三种子集合的预测的产量表现;
使用所述服务器计算机系统,基于针对所述第三种子集合的所述预测的产量表现,生成针对所述一个或多个目标环境的种子推荐;以及
引起在通信地被耦合到所述服务器计算机系统的显示设备上显示所述种子推荐。
2.根据权利要求1所述的计算机实现的方法,其中所述遗传特征数据包括基因组标记数据,以及其中生成所述第二产量属性集合包括应用使用所述基因组标记数据的所述模型。
3.根据权利要求1所述的计算机实现的方法,其中所述遗传特征数据包括基于谱系的亲属矩阵,并且其中生成所述第二产量属性集合包括应用使用所述基于谱系的亲属矩阵的所述模型。
4.根据权利要求1所述的计算机实现的方法,其中所述遗传特征数据包括基因簇关系数据,并且其中生成所述第二产量属性集合包括应用使用所述基因簇关系数据的所述模型。
5.根据权利要求1所述的计算机实现的方法,其中所述遗传特征数据包括基于基因标记的亲属矩阵,并且其中生成所述第二产量属性集合包括应用使用所述基于基因标记的亲属矩阵的所述模型。
6.根据权利要求1所述的计算机实现的方法,其中生成针对所述第三种子集合的所述预测的产量表现包括应用近交编码,以将基因组逐环境特征与不同的种子相关联。
7.根据权利要求1所述的计算机实现的方法,生成针对所述一个或多个目标环境的种子推荐进一步基于以下一个或多个因素:杂交种或近交遗传杂交种群、与生物技术性状或数量性状基因座相关联的基因标记、全基因组基因标记、长型单倍型、近交BLUP-GCA(最佳线性无偏预测—一般结合能力)产量、与产量相关的表型或杂交种或近交疾病特性。
8.根据权利要求1所述的计算机实现的方法,其中生成针对所述第三种子集合的所述预测的产量表现包括:应用特征工程来开发基因组逐环境特征,以及在机器学习模型中使用所述基因组逐环境特征来生成所述预测的产量表现。
9.根据权利要求8所述的计算机实现的方法,其中特征工程进一步包括:
将连续的环境特征转换为一个或多个不同的特征类;
使用所述一个或多个不同的特征类来表征与所述农业数据记录相关联的环境特征;
在所述机器学习模型中使用表征的所述环境特征,来生成所述预测的产量表现。
10.根据权利要求9所述的计算机实现的方法,其中特征工程进一步包括:仅针对具有在给定环境中生长的多种种子的一个或多个农业数据记录,使用所述一个或多个不同的特征类来表征与所述农业数据记录相关联的环境特征。
11.一种或多种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储有指令,所述指令在由一个或多个处理器执行时,引起执行操作,所述操作包括:
接收农业数据记录,所述农业数据记录包括针对在第一环境集合中生长的第一种子集合的第一产量属性集合;
接收与第二种子集合有关的遗传特征数据,其中所述第二种子集合包括所述第一种子集合;
通过应用使用所述遗传特征数据以及所述农业数据记录的模型,来生成针对与第二环境集合相关联的所述第二种子集合的第二产量属性集合,其中所述第二产量属性集合填补来自所述第一产量属性集合的一个或多个数据空白;
通过应用所述第二产量属性集合,确定针对与一个或多个目标环境相关联的第三种子集合的预测的产量表现;
基于针对所述第三种子集合的所述预测的产量表现,生成针对所述一个或多个目标环境的种子推荐;以及
引起显示所述种子推荐。
12.根据权利要求11所述的一种或多种非暂态计算机可读存储介质,其中所述遗传特征数据包括基因组标记数据,并且其中生成所述第二产量属性集合的所述操作包括应用使用所述基因组标记数据的所述模型。
13.根据权利要求11所述的一种或多种非暂态计算机可读存储介质,其中所述遗传特征数据包括基于谱系的亲属矩阵,并且其中生成所述第二产量属性集合的所述操作包括应用使用所述基于谱系的亲属矩阵的所述模型。
14.根据权利要求11所述的一种或多种非暂态计算机可读存储介质,其中所述遗传特征数据包括基因簇关系数据,并且其中生成所述第二产量属性集合的所述操作包括应用使用所述基因簇关系数据的所述模型。
15.根据权利要求11所述的一种或多种非暂态计算机可读存储介质,其中所述遗传特征数据包括基于基因标记的亲属矩阵,并且其中生成所述第二产量属性集合的所述操作包括应用使用所述基于基因标记的亲属矩阵的所述模型。
16.根据权利要求11所述的一种或多种非暂态计算机可读存储介质,其中生成针对所述第三种子集合的所述预测的产量表现的所述操作包括应用近交编码以将基因组逐环境特征与不同的种子相关联的操作。
17.根据权利要求11所述的一种或多种非暂态计算机可读存储介质,其中生成针对所述一个或多个目标环境的种子推荐的所述操作进一步基于以下一个或多个因素:杂交种或近交遗传杂交种群、与生物技术性状或数量性状基因座相关联的基因标记、全基因组基因标记、长型单倍型、近交BLUP-GCA(最佳线性无偏预测—一般结合能力)产量、与产量相关的表型或杂交种或近交疾病特性。
18.根据权利要求11所述的一种或多种非暂态计算机可读存储介质,其中生成针对所述第三种子集合的所述预测的产量表现的所述操作包括以下操作:
应用特征工程来开发基因组逐环境特征;以及
在机器学习模型中使用所述基因组逐环境特征来生成所述预测的产量表现。
19.根据权利要求18所述的一种或多种非暂态计算机可读存储介质,其中应用特征工程的所述操作进一步包括以下操作:
将连续的环境特征转换为一个或多个不同的特征类;
使用所述一个或多个不同的特征类来表征与所述农业数据记录相关联的环境特征;
在所述机器学习模型中使用表征的所述环境特征,来生成所述预测的产量表现。
20.根据权利要求11所述的一种或多种非暂态计算机可读存储介质,其中应用特征工程的所述操作进一步包括以下操作:仅针对具有在给定环境中生长的多种种子的一个或多个农业数据记录,使用所述一个或多个不同的特征类来表征与所述农业数据记录相关联的环境特征。
CN201980070460.2A 2018-10-24 2019-10-24 利用遗传学和特征工程来提高按田地的种子产品选择和推荐的放置可预测性 Pending CN112930544A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862750153P 2018-10-24 2018-10-24
US201862750156P 2018-10-24 2018-10-24
US62/750,156 2018-10-24
US62/750,153 2018-10-24
US201962832148P 2019-04-10 2019-04-10
US62/832,148 2019-04-10
PCT/US2019/057812 WO2020086814A1 (en) 2018-10-24 2019-10-24 Leveraging genetics and feature engineering to boost placement predictability for seed product selection and recommendation by field

Publications (1)

Publication Number Publication Date
CN112930544A true CN112930544A (zh) 2021-06-08

Family

ID=70326325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980070460.2A Pending CN112930544A (zh) 2018-10-24 2019-10-24 利用遗传学和特征工程来提高按田地的种子产品选择和推荐的放置可预测性

Country Status (7)

Country Link
US (2) US11593674B2 (zh)
EP (1) EP3871160A4 (zh)
CN (1) CN112930544A (zh)
BR (1) BR112021007032A2 (zh)
CA (1) CA3116341A1 (zh)
MX (1) MX2021004578A (zh)
WO (1) WO2020086814A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114912040A (zh) * 2022-04-19 2022-08-16 中国农业科学院作物科学研究所 育种处理方法、装置及计算机可读存储介质

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11266125B1 (en) * 2018-08-06 2022-03-08 American Institute of Nutrition and Management Inc. System and method for animal growth regulation for improved profitability and mitigated risk
US11861737B1 (en) * 2018-08-31 2024-01-02 Climate Llc Hybrid seed supply management based on prescription of hybrid seed placement
US11568467B2 (en) 2019-04-10 2023-01-31 Climate Llc Leveraging feature engineering to boost placement predictability for seed product selection and recommendation by field
US20210398012A1 (en) * 2020-06-17 2021-12-23 International Business Machines Corporation Method and system for performing data pre-processing operations during data preparation of a machine learning lifecycle
US20220383428A1 (en) * 2021-06-01 2022-12-01 Climate Llc Systems and methods for use in planting seeds in growing spaces
WO2022265914A1 (en) * 2021-06-16 2022-12-22 Advanced Agrilytics Holdings, Llc Methods and systems for generating and visualizing optimal hybrid and variety placement
WO2023056099A1 (en) * 2021-10-01 2023-04-06 Iron Ox, Inc. Distributing plants within an automated agricultural facility
WO2023129653A2 (en) * 2021-12-31 2023-07-06 Benson Hill, Inc. Systems and methods for accelerate speed to market for improved plant-based products
WO2023235120A1 (en) * 2022-06-03 2023-12-07 Microsoft Technology Licensing, Llc Deep learning system and method for predicting crop characteristics

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060282228A1 (en) * 2005-06-10 2006-12-14 Pioneer Hi-Bred International, Inc. Method and system for use of environmental classification in precision farming
CN101464881A (zh) * 2007-12-21 2009-06-24 音乐会技术公司 基于用位置信息标记的播放历史信息、在分布式环境中生成媒体推荐的方法和系统
US20170196171A1 (en) * 2016-01-07 2017-07-13 The Climate Corporation Generating digital models of crop yield based on crop planting dates and relative maturity values
CN107077650A (zh) * 2014-09-12 2017-08-18 克莱米特公司 用于管理农业活动的方法和系统
CN107133253A (zh) * 2015-12-31 2017-09-05 达索系统公司 基于预测模型的推荐
CN107229999A (zh) * 2017-05-31 2017-10-03 深圳前海弘稼科技有限公司 作物产量的预测方法、系统、计算机设备及可读存储介质

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6505146B1 (en) 1999-09-24 2003-01-07 Monsanto Company Method and system for spatial evaluation of field and crop performance
US7047133B1 (en) * 2003-01-31 2006-05-16 Deere & Company Method and system of evaluating performance of a crop
US7702597B2 (en) 2004-04-20 2010-04-20 George Mason Intellectual Properties, Inc. Crop yield prediction using piecewise linear regression with a break point and weather and agricultural parameters
US20090099776A1 (en) 2007-10-16 2009-04-16 Kapadi Mangesh D System and method for sugarcane yield estimation
US9428425B2 (en) 2012-09-20 2016-08-30 Core Intellectual Properties Holdings, Llc Methods and compositions for treating soil and plants
US9767521B2 (en) 2013-08-30 2017-09-19 The Climate Corporation Agricultural spatial data processing systems and methods
US10371561B2 (en) 2013-11-01 2019-08-06 Iowa State University Research Foundation, Inc. Yield measurement and base cutter height control systems for a harvester
US10107770B2 (en) 2014-06-18 2018-10-23 Texas Tech University System Portable apparatus for soil chemical characterization
US10564316B2 (en) * 2014-09-12 2020-02-18 The Climate Corporation Forecasting national crop yield during the growing season
US9792557B2 (en) 2015-01-14 2017-10-17 Accenture Global Services Limited Precision agriculture system
EP3326093B1 (en) 2015-07-23 2024-01-24 Limagrain Europe Improved computer implemented method for predicting true agronomical value of a plant
WO2017069607A1 (en) * 2015-10-23 2017-04-27 Sime Darby Plantation Sdn. Bhd. Methods for predicting palm oil yield of a test oil palm plant
US10586158B2 (en) * 2015-10-28 2020-03-10 The Climate Corporation Computer-implemented calculation of corn harvest recommendations
US10628895B2 (en) 2015-12-14 2020-04-21 The Climate Corporation Generating digital models of relative yield of a crop based on nitrate values in the soil
WO2017214445A1 (en) * 2016-06-08 2017-12-14 Monsanto Technology Llc Methods for identifying crosses for use in plant breeding
US9881214B1 (en) 2016-07-13 2018-01-30 The Climate Corporation Generating pixel maps from non-image data and difference metrics for pixel maps
US20180020622A1 (en) 2016-07-25 2018-01-25 CiBo Technologies Inc. Agronomic Database and Data Model
WO2018049288A1 (en) 2016-09-09 2018-03-15 Cibo Technologies, Inc. Systems for learning farmable zones, and related methods and apparatus
US10028451B2 (en) * 2016-11-16 2018-07-24 The Climate Corporation Identifying management zones in agricultural fields and generating planting plans for the zones
UA126070C2 (uk) 2016-12-19 2022-08-10 Зе Клаймет Корпорейшн Системи, способи та пристрої для контролю ґрунту та насіння
AU2018207204B2 (en) 2017-01-12 2023-11-30 Pivot Bio, Inc. Methods and compositions for improving plant traits
US10699185B2 (en) 2017-01-26 2020-06-30 The Climate Corporation Crop yield estimation using agronomic neural network
BR112019023237A2 (pt) 2017-05-09 2020-06-02 Taxon Biosciences Inc. Micróbios de promoção de crescimento de planta, composições, e usos
US11562444B2 (en) * 2017-11-09 2023-01-24 Climate Llc Hybrid seed selection and seed portfolio optimization by field
US11568340B2 (en) * 2017-11-09 2023-01-31 Climate Llc Hybrid seed selection and seed portfolio optimization by field
US11406053B1 (en) * 2018-05-21 2022-08-09 Climate Llc Using casual learning algorithms to assist in agricultural management decisions
JP7088541B2 (ja) 2018-05-24 2022-06-21 ラピスセミコンダクタ株式会社 測定装置及び測定方法
AU2019315506A1 (en) 2018-08-02 2021-03-11 Climate Llc Automatic prediction of yields and recommendation of seeding rates based on weather data
US11475359B2 (en) * 2018-09-21 2022-10-18 Climate Llc Method and system for executing machine learning algorithms on a computer configured on an agricultural machine
CN112955000B (zh) * 2018-10-24 2022-07-19 克莱米特有限责任公司 使用基于机器学习的种子收获水分预测来改进计算机辅助农场操作
US20200154629A1 (en) 2018-11-15 2020-05-21 Ag Leader Technology On the go organic matter sensor and associated systems and methods
US11568467B2 (en) 2019-04-10 2023-01-31 Climate Llc Leveraging feature engineering to boost placement predictability for seed product selection and recommendation by field
US11125675B2 (en) 2019-10-18 2021-09-21 Roger Lawrence Deran Fluid suspended particle classifier
US11610272B1 (en) * 2020-01-29 2023-03-21 Arva Intelligence Corp. Predicting crop yield with a crop prediction engine

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060282228A1 (en) * 2005-06-10 2006-12-14 Pioneer Hi-Bred International, Inc. Method and system for use of environmental classification in precision farming
CN101464881A (zh) * 2007-12-21 2009-06-24 音乐会技术公司 基于用位置信息标记的播放历史信息、在分布式环境中生成媒体推荐的方法和系统
CN107077650A (zh) * 2014-09-12 2017-08-18 克莱米特公司 用于管理农业活动的方法和系统
CN107133253A (zh) * 2015-12-31 2017-09-05 达索系统公司 基于预测模型的推荐
US20170196171A1 (en) * 2016-01-07 2017-07-13 The Climate Corporation Generating digital models of crop yield based on crop planting dates and relative maturity values
CN107229999A (zh) * 2017-05-31 2017-10-03 深圳前海弘稼科技有限公司 作物产量的预测方法、系统、计算机设备及可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114912040A (zh) * 2022-04-19 2022-08-16 中国农业科学院作物科学研究所 育种处理方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
EP3871160A1 (en) 2021-09-01
US11593674B2 (en) 2023-02-28
US20200134486A1 (en) 2020-04-30
US20230351226A1 (en) 2023-11-02
BR112021007032A2 (pt) 2021-07-20
EP3871160A4 (en) 2022-07-27
CA3116341A1 (en) 2020-04-30
WO2020086814A1 (en) 2020-04-30
MX2021004578A (es) 2021-09-08

Similar Documents

Publication Publication Date Title
CN111565558B (zh) 根据田地的杂交种子选择和种子投资组合优化
CN111565557B (zh) 根据田地的杂交种子选择和种子投资组合优化
US20230351226A1 (en) Leveraging genetics and feature engineering to boost placement predictability for seed product selection and recommendation by field
CN113168598B (zh) 由田间的风险调整的杂交种子选择和作物产量优化
US11568467B2 (en) Leveraging feature engineering to boost placement predictability for seed product selection and recommendation by field
CN113168577A (zh) 用于执行机器学习算法的方法和系统
US20200005166A1 (en) Automatically assigning hybrids or seeds to fields for planting
CN112585633A (zh) 最佳放置及组合机会目标
US11864488B1 (en) Computer-implemented recommendation of side-by-side planting in agricultural fields

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: California, USA

Applicant after: Clemet Co.,Ltd.

Address before: California, USA

Applicant before: THE CLIMATE Corp.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: Missouri, USA

Applicant after: Clemet Co.,Ltd.

Address before: California, USA

Applicant before: Clemet Co.,Ltd.

CB02 Change of applicant information