CN115618021A - 农作物品种适宜种植区域推荐方法及装置 - Google Patents

农作物品种适宜种植区域推荐方法及装置 Download PDF

Info

Publication number
CN115618021A
CN115618021A CN202211630076.3A CN202211630076A CN115618021A CN 115618021 A CN115618021 A CN 115618021A CN 202211630076 A CN202211630076 A CN 202211630076A CN 115618021 A CN115618021 A CN 115618021A
Authority
CN
China
Prior art keywords
variety
planting
area
unit area
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211630076.3A
Other languages
English (en)
Other versions
CN115618021B (zh
Inventor
潘守慧
王开义
韩焱云
刘忠强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Center of Information Technology of Beijing Academy of Agriculture and Forestry Sciences
Original Assignee
Research Center of Information Technology of Beijing Academy of Agriculture and Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Center of Information Technology of Beijing Academy of Agriculture and Forestry Sciences filed Critical Research Center of Information Technology of Beijing Academy of Agriculture and Forestry Sciences
Priority to CN202211630076.3A priority Critical patent/CN115618021B/zh
Publication of CN115618021A publication Critical patent/CN115618021A/zh
Application granted granted Critical
Publication of CN115618021B publication Critical patent/CN115618021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Human Resources & Organizations (AREA)
  • Animal Husbandry (AREA)
  • Computational Linguistics (AREA)
  • Mining & Mineral Resources (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Agronomy & Crop Science (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种农作物品种适宜种植区域推荐方法及装置,属于农业智能信息处理领域,该方法包括:根据地理环境数据、品种试验数据和种植方式数据,构建待分析区域的地理环境知识图谱;根据知识图谱结合品种试验数据构建推荐模型并进行训练;将每个待分析品种及对应的已种植单元区域的适宜性类别,输入推荐模型中,输出每个品种在未种植单元区域的适宜性类别;根据所有单元区域的适宜性类别确定每个待分析品种的推荐种植单元区域集合。该方法的推荐模型中每个品种对单元区域的适宜性会从该品种已确定的适宜单元区域不断扩大,沿着知识图谱中各实体之间的链接不断地迭代扩展品种的适宜种植单元区域,实现品种推广过程中小尺度地理区域的精准推荐。

Description

农作物品种适宜种植区域推荐方法及装置
技术领域
本发明涉及农业智能信息处理领域,尤其涉及一种农作物品种适宜种植区域推荐方法及装置。
背景技术
种业是战略性、基础性核心产业,种子是农业的“芯片”,直接关系到粮食产量。随着农作物育种主体数量的不断增加和育种能力的不断提升,每年通过审定或登记的农作物品种数量急速增加。
然而,农作物品种数量的快速增加,也给农作物品种的推广应用带来了一系列的问题。首先,随着市场上农作物新品种数量的剧增,农户面临适宜品种选择难,农业部门面临品种推广难等问题;其次,目前许多品种对适宜种植区域的标注过于笼统宽泛甚至含混不清,导致品种审定时标注的适宜种植区域与实际适宜种植区域不能完全匹配;此外,由于受地形和气候异质性的影响,即便是在同一生态区内,不同区域内的环境状况往往也会有较大差异,导致已审定通过的品种并非完全适合在其参试生态区内的任一区域种植。
在实际工作中,由于受人员、经费、管理机制等因素限制,品种区域试验的试验点数量也不可能在短期内大幅增加,这给品种适宜种植区域的小尺度精准评价带了较大挑战。因此,迫切需要一种农作物品种适宜种植区域推荐方法,以满足当前农作物品种适宜种植区域精准推广的现实需求。
发明内容
针对现有技术存在的问题,本发明提供一种农作物品种适宜种植区域推荐方法及装置。
本发明提供一种农作物品种适宜种植区域推荐方法,包括:获取待分析区域中每个单元区域的地理环境数据、品种试验数据和种植方式数据;其中,所述待分析区域包括多个单元区域;根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱;根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练;将每个待分析品种在已种植单元区域的种植记录数据及对应的适宜性类别,输入所述品种适宜种植区域推荐模型中,输出每个待分析品种在每个未种植单元区域的适宜性类别;根据所有单元区域的适宜性类别,确定每个待分析品种的推荐种植单元区域集合;其中,所述品种适宜种植区域推荐模型,根据所述地理环境知识图谱中各单元区域之间的关系,以及每个品种在已种植单元区域的适宜性类别作为训练数据,进行不断迭代训练后得到。
根据本发明提供的一种农作物品种适宜种植区域推荐方法,所述根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱,包括:通过聚类分析和关联性分析,提取影响农作物品种产量或品质的关键地理环境因子;基于所述关键地理环境因子,对所述地理环境数据进行知识抽取;抽取出的知识验证通过后采用三元组进行表示,并建立对应的复合索引;利用所述种植方式数据,对根据地理环境数据抽取出的三元组进行扩充,得到扩充后的三元组,根据扩充后的三元组构建待分析区域的地理环境知识图谱。
根据本发明提供的一种农作物品种适宜种植区域推荐方法,所述根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练,包括:根据每个单元区域的品种试验数据以及对应的预设指标阈值,确定每个试验品种在已种植单元区域的适宜性类别,将每个单元区域的品种试验数据和对应的适宜性类别,作为种植记录数据,用于所述品种适宜种植区域推荐模型的训练;根据所述知识图谱,以及每个品种的所述种植记录数据,生成每个品种的各阶单元区域扩展集合;利用嵌入表示法将每个单元区域表示为候选单元区域向量,根据所述知识图谱中各实体之间的关系,确定每个品种在初始种植单元区域扩展后得到的品种嵌入向量;计算所述品种嵌入向量与所述候选单元区域向量之间的适宜概率,并根据预设指标阈值,确定品种在单元区域的适宜性类别,根据品种在单元区域的适宜性类别,对所述品种适宜种植区域推荐模型进行训练。
根据本发明提供的一种农作物品种适宜种植区域推荐方法,所述根据所述知识图 谱中各实体之间的关系,以及每个品种的各阶地域单元区域扩展集合,确定每个品种在初 始种植单元区域扩展后得到的品种嵌入向量,包括:根据候选单元区域
Figure 839630DEST_PATH_IMAGE001
的嵌入向量
Figure 979625DEST_PATH_IMAGE002
,以及 品种
Figure 684276DEST_PATH_IMAGE003
的一阶单元区域扩展集
Figure 226115DEST_PATH_IMAGE004
上的每个三元组
Figure 475962DEST_PATH_IMAGE005
,计算候选单元区域
Figure 103253DEST_PATH_IMAGE006
与实体
Figure 346015DEST_PATH_IMAGE007
在关系
Figure 742361DEST_PATH_IMAGE008
下的相似性概率
Figure 661645DEST_PATH_IMAGE009
Figure 776231DEST_PATH_IMAGE010
其中,
Figure 557106DEST_PATH_IMAGE011
Figure 73538DEST_PATH_IMAGE012
分别为一阶单元区域扩展集
Figure 665187DEST_PATH_IMAGE013
上第
Figure 267070DEST_PATH_IMAGE014
个三元组中的关系
Figure 851635DEST_PATH_IMAGE015
和头部实体
Figure 222573DEST_PATH_IMAGE016
的嵌入表示;
Figure 483659DEST_PATH_IMAGE017
表示嵌入表示向量或矩阵的维度;
Figure 307259DEST_PATH_IMAGE018
Figure 695515DEST_PATH_IMAGE019
分别表示扩展集
Figure 920960DEST_PATH_IMAGE020
上每个三元组中关系
Figure 854412DEST_PATH_IMAGE021
和头部实体
Figure 165307DEST_PATH_IMAGE022
对应的嵌入表示;
计算品种
Figure 91675DEST_PATH_IMAGE023
在一阶单元区域扩展集上的潜在适宜单元区域的向量
Figure 171627DEST_PATH_IMAGE024
,计算方法为:
Figure 790827DEST_PATH_IMAGE025
其中,
Figure 838286DEST_PATH_IMAGE026
为实体
Figure 568345DEST_PATH_IMAGE027
的嵌入向量;
Figure 502803DEST_PATH_IMAGE028
的值赋值给向量
Figure 292904DEST_PATH_IMAGE029
,重新计算
Figure 329124DEST_PATH_IMAGE030
与实体
Figure 597295DEST_PATH_IMAGE031
在关系
Figure 651838DEST_PATH_IMAGE032
下的相似性概率
Figure 612841DEST_PATH_IMAGE033
,进而得 到品种
Figure 369313DEST_PATH_IMAGE034
在二阶单元区域扩展集上的潜在适宜单元区域的向量
Figure 441175DEST_PATH_IMAGE035
;重复上述步骤,得到品 种
Figure 350225DEST_PATH_IMAGE036
Figure 482129DEST_PATH_IMAGE037
阶单元区域扩展集上的潜在适宜单元区域的向量
Figure 227362DEST_PATH_IMAGE038
Figure 102914DEST_PATH_IMAGE039
;根据品种
Figure 132050DEST_PATH_IMAGE040
在 各阶单元区域扩展集上的向量
Figure 169276DEST_PATH_IMAGE041
,确定品种
Figure 165920DEST_PATH_IMAGE042
在单元区域
Figure 579584DEST_PATH_IMAGE043
的扩展后的品种嵌入 向量
Figure 463226DEST_PATH_IMAGE044
根据本发明提供的一种农作物品种适宜种植区域推荐方法,所述对所述品种适宜种植区域推荐模型进行训练,包括根据如下损失函数对所述品种适宜种植区域推荐模型进行训练:
Figure 936933DEST_PATH_IMAGE045
其中,
Figure 656758DEST_PATH_IMAGE046
Figure 608534DEST_PATH_IMAGE047
分别为所有种植记录和实体的嵌入矩阵,
Figure 612262DEST_PATH_IMAGE048
为关系
Figure 991290DEST_PATH_IMAGE049
的嵌入矩阵,
Figure 696947DEST_PATH_IMAGE050
为知识图谱中关系
Figure 452414DEST_PATH_IMAGE051
的指示张量
Figure 310648DEST_PATH_IMAGE052
的切片,
Figure 126157DEST_PATH_IMAGE053
表示L2范数;
Figure 820575DEST_PATH_IMAGE054
为品 种-单元区域交互矩阵,若品种
Figure 114153DEST_PATH_IMAGE055
在单元区域
Figure 826894DEST_PATH_IMAGE056
的适宜性类别为适宜,则
Figure 813305DEST_PATH_IMAGE057
,否则
Figure 493554DEST_PATH_IMAGE058
Figure 590823DEST_PATH_IMAGE059
Figure 158070DEST_PATH_IMAGE060
为预设常数;
Figure 315382DEST_PATH_IMAGE061
表示知识图谱
Figure 984392DEST_PATH_IMAGE062
中的关系集合;
Figure 619773DEST_PATH_IMAGE063
为sigmoid激活函数。
根据本发明提供的一种农作物品种适宜种植区域推荐方法,所述对所述品种适宜 种植区域推荐模型进行训练,包括:采用随机梯度下降算法进行损失函数的迭代求解;在每 次迭代计算中,随机根据所述交互矩阵
Figure 307106DEST_PATH_IMAGE064
和知识图谱
Figure 635319DEST_PATH_IMAGE065
中抽取正负样本,并计算
Figure 759002DEST_PATH_IMAGE066
Figure 463653DEST_PATH_IMAGE067
Figure 5492DEST_PATH_IMAGE068
的梯度,进而更新
Figure 770186DEST_PATH_IMAGE069
Figure 882630DEST_PATH_IMAGE070
Figure 859813DEST_PATH_IMAGE071
的值。
根据本发明提供的一种农作物品种适宜种植区域推荐方法,所述确定每个待分析品种的推荐种植单元区域集合之后,还包括:根据所述每个品种的推荐种植单元区域集合,经二次筛选后,得到每个品种最终的适宜种植区域;其中,所述二次筛选的特征包括:品种抗性、品种的历史平均亩产和单元区域内的品种数。
本发明还提供一种农作物品种适宜种植区域推荐装置,包括:数据采集模块,用于获取待分析区域中每个单元区域的地理环境数据、品种试验数据和种植方式数据;其中,所述待分析区域包括多个单元区域;知识图谱构建模块,用于根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱;模型处理模块,用于根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练;结果输出模块,用于将每个待分析品种在已种植单元区域的种植记录数据及对应的适宜性类别,输入所述品种适宜种植区域推荐模型中,输出每个待分析品种在每个未种植单元区域的适宜性类别;根据所有单元区域的适宜性类别,确定每个待分析品种的推荐种植单元区域集合;其中,所述品种适宜种植区域推荐模型,根据所述地理环境知识图谱中各单元区域之间的关系,以及每个品种在已种植单元区域的适宜性类别作为训练数据,进行不断迭代训练后得到。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述农作物品种适宜种植区域推荐方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述农作物品种适宜种植区域推荐方法。
本发明提供的农作物品种适宜种植区域推荐方法及装置,在推荐模型中,基于知识图谱中各单元区域实体之间的链接关系,每个品种对单元区域的适宜性会从该品种已确定的适宜单元区域而不断扩大,即沿着知识图谱中各实体之间的链接,不断地迭代扩展品种的适宜种植单元区域,从而实现农作物品种推广过程中小尺度地理区域的精准推荐。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的农作物品种适宜种植区域推荐方法的流程示意图;
图2是本发明提供的农作物品种适宜种植区域推荐装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1至图3描述本发明的农作物品种适宜种植区域推荐方法及装置。图1是本发明提供的农作物品种适宜种植区域推荐方法的流程示意图,如图1所示,本发明提供农作物品种适宜种植区域推荐方法,包括:
101、获取待分析区域中每个单元区域的地理环境数据、品种试验数据和种植方式数据。其中,所述待分析区域包括多个单元区域。
举例而言,地理环境数据可包括:基础地理信息数据、气象数据、土壤数据。其中,基础地理信息数据包括县级行政区划数据、地貌数据(等高线、数字高程模型DEM);气象数据包括国家气象站点的气象数据,以及国家与省级区试站点的气象数据;土壤数据包括土壤肥料数据、土壤生物数据。
可选地,基础地理信息数据可从国家地理信息公共服务平台(天地图)获取;气象数据可从气象数据网获取,以及从每个区试站点的历年观测数据中收集;土壤数据可从国家土壤信息服务平台、中国土壤科学数据库、国家农业科学数据中心、国家测土配方施肥数据管理平台等数据源获取。品种试验数据可从国家农作物品种试验信息与运行管理平台中获取,种植方式数据可从农业农村部及各级农业部门网站、农业资讯类网站获取,以及通过问卷调查、文献研究、专家咨询等方式获得。
品种试验数据是指待分析品种在待分析区域内的试验点种植后得到的表型性状数据。在发明中,品种试验数据可以为待分析品种在开展国家级或省级品种审定试验时所采集的表型性状数据;其品种审定试验又包括品种区域试验和品种生产试验。
表1是黄淮海夏播玉米区中部分品种试验数据的示意;其中,品种名称为“C001”和“C002”,试验地点为“河南省安阳市滑县”和“山东省临沂市平邑县”,部分表型性状为“亩产”、“播种期”、“生育期”、“株高”、“大斑病”。
表1
Figure 521738DEST_PATH_IMAGE072
其中,种植方式数据包括收获方式、播种方式、栽培方式。可选地,可将农户种植偏好包括进来。
本实施例中,待分析区域包括多个单元区域。在进行品种的适宜种植区域推荐时,是以单元区域为尺度进行推荐的。所述单元区域是对待分析区域进行地理空间划分的最小单元,可以是县级行政区或地市级行政区。
可选地,获取地理环境数据后,还包括基于单元区域对所获取的地理环境数据、品种试验数据和种植方式数据进行预处理,所述预处理包括:数据清洗、语义融合、异常值处理、缺失值处理、数据标准化、数据归一化、特征选择、数据离散化中的任意一种或多种;其中,所述语义融合包括综合运用实体抽取、实体对齐、实体链接、冲突解决和关系推演技术,对不同来源或不同格式的地理环境数据进行语义关联,消除不同来源数据之间的异构性
102、根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱。
可将每个单元区域的地理环境数据和种植方式数据进行关联,抽取成三元组的数据形式,最后构建待分析区域的地理环境知识图谱。每个单元区域可以是一个实体,一个实体包括若干属性。关于品种试验数据,若某品种A在某区域L种植时,易出现某种病害,可将该品种A的病害作为一个环境属性纳入进来。
103、根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练。
其中,所述品种适宜种植区域推荐模型,根据所述地理环境知识图谱中各单元区域之间的关系,以及每个品种在已种植单元区域的适宜性类别作为训练数据,进行不断迭代训练后得到。
其中,所述适宜性类别可以按需求划分,如可划分为2类:适宜和不适宜,分别用数字1和0表示。具体地,可将产量类、抗性类、品质类性状指标作为适宜性类别划分的依据,根据预设的指标阈值和品种试验数据,确定每个品种在已试验种植单元区域的适宜性类别。例如:可将“比对照增产百分比(%)”和“抗病性”作为适宜性类别划分的依据,划分规则为:比对照品种增产≥3%且中抗及以上的,则标注为适宜;否则为不适宜。例如:品种A和品种B均在“单元区域#1”中开展过品种试验,其中品种A比对照品种增产5%且抗性为高抗,品种B比对照品种减产2%且抗性为高感,则品种A在单元区域#1的适宜性类别为“适宜”,品种B在单元区域#1的适宜性类别为“不适宜”。
104、将每个待分析品种在已种植单元区域的种植记录数据及对应的适宜性类别,输入所述品种适宜种植区域推荐模型中,输出每个待分析品种在每个未种植单元区域的适宜性类别;根据每个待分析品种在每个单元区域的适宜性类别,确定每个待分析品种的推荐种植单元区域集合。
其中,种植记录数据与上述101中的品种试验数据对应,即采用同类型的数据。可选地,在104之后,还包括根据用户查询请求,向用户输出最终推荐结果。其中,用户查询请求的输入方式包括:图形界面输入、语音输入、触摸屏点击、程序接口调用。推荐结果包括:指定品种的适宜种植单元区域、指定单元区域的适宜种植品种,结果呈现方式包括基于电子地图的可视化展示、文字展示、语音播报、JSON或XML格式的封装数据。
例如:用户可使用智能设备进行语音提问:“玉米品种‘郑单958’的适宜种植区域有哪些”系统收到语音查询请求后,返回系统已计算出的“郑单958”的推荐种植区域数据,并进行语音播报,或在屏幕上利用电子地图可视化展示该品种的适宜种植区域。
本发明的农作物品种适宜种植区域推荐方法,在推荐模型中,基于知识图谱中各单元区域实体之间的链接关系,每个品种对单元区域的适宜性会从该品种已确定的适宜单元区域而不断扩大,即沿着知识图谱中各实体之间的链接,不断地迭代扩展品种的适宜种植单元区域,从而实现农作物品种推广过程中小尺度地理区域的精准推荐。
在一个实施例中,所述根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱,包括:通过聚类分析和关联性分析,提取影响农作物品种产量或品质的关键地理环境因子;基于所述关键地理环境因子,对所述地理环境数据进行知识抽取;抽取出的知识验证通过后采用三元组进行表示,并建立对应的复合索引;利用所述种植方式数据,对根据地理环境数据抽取出的三元组进行扩充,得到扩充后的三元组,根据扩充后的三元组构建关于每个单元区域的地理环境知识图谱。
其中,所述知识抽取包括实体抽取、属性抽取、关系抽取、事件抽取和实体链接。
可选地,在本发明实施例中,通过聚类分析和关联性分析,选取的关键地理环境因子集合包括:有效积温、日照时长、平均气温、最低气温、最高气温、地表温度、最大风力、平均降水量、平均湿度、光热比、土壤类型、土壤质地。
可选地,当某个单元区域内的某些地理环境因子指标值缺失时,可采用空间插值方法进行补全,所述空间插值方法包括:克里金插值法、反距离加权插值法、自然邻点插值法、最近邻点插值法中任意一种或多种。
通常,三元组具体的表示形式为:(实体,关系,实体)、(实体,属性,属性值)、(实体,关系,事件)、(事件,关系,事件)。例如:“单元区域#1”的“有效积温”为“2500℃”,可用三元组表示为:(单元区域#1,有效积温,2500℃);其中,“单元区域#1”为实体,有效积温为属性(关键地理环境因子),2500℃为属性值。
然后利用种植方式数据,对基于地理环境数据抽取出的三元组进行扩充,得到扩充后的三元组。
可将待分析区域的收获方式、播种方式、栽培方式、农户种植偏好等因素考虑进来,将其用三元组形式进行表示。例如:“单元区域#1”的“播种方式”为“机播”,“单元区域#2”的“收获方式”为“机收”,则上述两条知识可用三元组分别表示为:(单元区域#1,播种方式,机播),(单元区域#1,收获方式,机收)。
然后,利用所述扩充后的三元组,构建待分析区域的地理环境知识图谱。
在一个实施例中,所述根据所述知识图谱,结合所述品种试验数据,构建基于嵌入 模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型 进行训练,包括:根据每个单元区域的品种试验数据以及对应的预设指标阈值,确定每个试 验品种在已种植单元区域的适宜性类别;将每个单元区域的品种试验数据和对应的适宜性 类别,作为种植记录数据,用于所述品种适宜种植区域推荐模型的训练;根据所述知识图 谱,以及每个品种的所述种植记录数据,生成每个品种的各阶单元区域扩展集合;利用嵌入 表示法将每个单元区域表示为候选单元区域向量,根据所述知识图谱中各实体之间的关 系,确定每个品种在初始种植单元区域扩展后得到的品种嵌入向量;计算所述品种嵌入向 量与所述候选单元区域向量之间的适宜概率
Figure 191754DEST_PATH_IMAGE073
,并根据预设指标阈值,确定品种在单元区 域的适宜性类别,根据品种在单元区域的适宜性类别,对所述品种适宜种植区域推荐模型 进行训练。
品种
Figure 579046DEST_PATH_IMAGE036
Figure 359920DEST_PATH_IMAGE074
阶单元区域扩展集
Figure 876352DEST_PATH_IMAGE075
是指以
Figure 717269DEST_PATH_IMAGE076
为头实体的三元组而组成的集合,记 为
Figure 69884DEST_PATH_IMAGE077
Figure 654449DEST_PATH_IMAGE078
为预设的正整数。
其中,给定知识图谱
Figure 25388DEST_PATH_IMAGE079
和交互矩阵
Figure 37206DEST_PATH_IMAGE080
,品种
Figure 110073DEST_PATH_IMAGE081
Figure 498329DEST_PATH_IMAGE082
阶关联单元区域实体表示为
Figure 723774DEST_PATH_IMAGE083
, 记为
Figure 906494DEST_PATH_IMAGE084
Figure 233701DEST_PATH_IMAGE085
是品种
Figure 160069DEST_PATH_IMAGE086
的种植记录集合,表示品种
Figure 240020DEST_PATH_IMAGE087
在知识图谱上进行适 宜性单元区域扩展的初始种植单元区域;
Figure 593641DEST_PATH_IMAGE088
为三元组,
Figure 391833DEST_PATH_IMAGE089
Figure 105580DEST_PATH_IMAGE090
Figure 305617DEST_PATH_IMAGE091
分别表示三 元组中的头实体、关系和尾实体,其中
Figure 95719DEST_PATH_IMAGE092
Figure 115627DEST_PATH_IMAGE093
分别表示知识图谱
Figure 400109DEST_PATH_IMAGE094
中的实体集合和关系集 合;
Figure 454653DEST_PATH_IMAGE095
为系统指定的正整数。
单元区域交互矩阵
Figure 150076DEST_PATH_IMAGE096
:若品种
Figure 922860DEST_PATH_IMAGE097
在单元区域
Figure 978410DEST_PATH_IMAGE098
的适宜性类别为 适宜则
Figure 887460DEST_PATH_IMAGE099
;否则
Figure 19364DEST_PATH_IMAGE100
。其中,
Figure 13865DEST_PATH_IMAGE101
表示待分析品种的集合,
Figure 640149DEST_PATH_IMAGE102
表示待推 荐单元区域的集合,
Figure 669285DEST_PATH_IMAGE103
为待分析区域的地理环境知识图谱。
根据所述知识图谱
Figure 706511DEST_PATH_IMAGE104
,以每个品种的种植记录作为品种适宜性扩展的初始种子单 元区域,进而生成每个品种的潜在适宜的各阶单元区域扩展集合
Figure 453888DEST_PATH_IMAGE105
利用嵌入表示法将每个单元区域表示为一个向量
Figure 116819DEST_PATH_IMAGE106
(其中,
Figure 461DEST_PATH_IMAGE107
为向量
Figure 208589DEST_PATH_IMAGE108
的维 数),根据知识图谱
Figure 177682DEST_PATH_IMAGE109
中各实体之间的关系,得到每个品种在其初始种子单元区域扩展后得 到的嵌入向量
Figure 145769DEST_PATH_IMAGE110
具体地,在对品种或单元区域进行嵌入表示时,可综合运用独热编码,以及待表示对象的属性、词袋模型、上下文信息等进行向量表示。例如:在进行单元区域的嵌入表示时,可考虑将独热编码、有效积温、日照时长、最高气温、平均湿度、土壤类型、收获方式、栽培方式等要素集成,将其转化为一个数值向量。
最后,计算品种
Figure 883918DEST_PATH_IMAGE111
的嵌入向量
Figure 528526DEST_PATH_IMAGE112
候选单元区域
Figure 984915DEST_PATH_IMAGE113
的向量
Figure 989649DEST_PATH_IMAGE114
之间的适宜概率
Figure 847883DEST_PATH_IMAGE115
,并根 据预设的阈值,确定该品种在该单元区域的适宜性类别;其中,
Figure 663393DEST_PATH_IMAGE116
的计算公式为:
Figure 341499DEST_PATH_IMAGE117
其中,
Figure 651388DEST_PATH_IMAGE118
为sigmoid激活函数,
Figure 98550DEST_PATH_IMAGE119
为向量
Figure 84961DEST_PATH_IMAGE120
的转置。
优选地,可将激活函数的阈值设为0.5,若
Figure 515942DEST_PATH_IMAGE121
的值大于0.5,则认为品种
Figure 613211DEST_PATH_IMAGE122
在单元区 域
Figure 429726DEST_PATH_IMAGE123
内适宜种植;否则,则认为品种
Figure 587038DEST_PATH_IMAGE124
不适宜在单元区域
Figure 239736DEST_PATH_IMAGE125
内种植。
在一个实施例中,所述根据所述知识图谱中各实体之间的关系,以及每个品种的 各阶地域单元区域扩展集合,确定每个品种在初始种植单元区域扩展后得到的品种嵌入向 量,包括:根据候选单元区域
Figure 140696DEST_PATH_IMAGE126
的嵌入向量
Figure 578762DEST_PATH_IMAGE127
,以及品种
Figure 641396DEST_PATH_IMAGE128
的一阶单元区域扩展集
Figure 46969DEST_PATH_IMAGE129
上的每 个三元组
Figure 486041DEST_PATH_IMAGE130
,计算候选单元区域
Figure 11569DEST_PATH_IMAGE131
与实体
Figure 510684DEST_PATH_IMAGE132
在关系
Figure 137974DEST_PATH_IMAGE133
下的相似性概率
Figure 380737DEST_PATH_IMAGE134
Figure 793395DEST_PATH_IMAGE135
其中,
Figure 463410DEST_PATH_IMAGE136
Figure 312418DEST_PATH_IMAGE137
分别为一阶单元区域扩展集
Figure 358871DEST_PATH_IMAGE138
上第
Figure 124571DEST_PATH_IMAGE139
个三元组中的关系
Figure 965488DEST_PATH_IMAGE140
和头部实体
Figure 301791DEST_PATH_IMAGE141
的嵌入表示;
Figure 886356DEST_PATH_IMAGE142
表示嵌入表示(向量或矩阵)的维度;
Figure 991715DEST_PATH_IMAGE143
Figure 754266DEST_PATH_IMAGE144
分别表示扩展 集
Figure 109024DEST_PATH_IMAGE145
上每个三元组中关系
Figure 231701DEST_PATH_IMAGE146
和头部实体
Figure 971993DEST_PATH_IMAGE147
对应的嵌入表示;
计算品种
Figure 889133DEST_PATH_IMAGE148
在一阶单元区域扩展集上的潜在适宜单元区域的向量
Figure 200029DEST_PATH_IMAGE149
,计算方法 为:
Figure 126396DEST_PATH_IMAGE025
其中,
Figure 471927DEST_PATH_IMAGE150
为实体
Figure 841860DEST_PATH_IMAGE151
的嵌入向量;
Figure 640051DEST_PATH_IMAGE152
的值赋值给向量
Figure 104531DEST_PATH_IMAGE153
,重新计算
Figure 304568DEST_PATH_IMAGE154
与实体
Figure 78358DEST_PATH_IMAGE155
在关系
Figure 363846DEST_PATH_IMAGE156
下的相似性概率
Figure 897595DEST_PATH_IMAGE157
,进而得 到品种
Figure 952139DEST_PATH_IMAGE148
在二阶单元区域扩展集上的潜在适宜单元区域的向量
Figure 398295DEST_PATH_IMAGE035
;重复上述步骤,得到品 种
Figure 171079DEST_PATH_IMAGE158
Figure 242940DEST_PATH_IMAGE159
阶单元区域扩展集上的潜在适宜单元区域的向量
Figure 151990DEST_PATH_IMAGE160
Figure 533162DEST_PATH_IMAGE161
;根据品种
Figure 527663DEST_PATH_IMAGE162
在各阶单元区域扩展集上的向量
Figure 137635DEST_PATH_IMAGE163
,确定品种
Figure 166771DEST_PATH_IMAGE164
在单元区域
Figure 954730DEST_PATH_IMAGE165
的扩展后的品 种嵌入向量
Figure 436527DEST_PATH_IMAGE166
在一个实施例中,所述对所述品种适宜种植区域推荐模型进行训练,包括根据如下损失函数对所述品种适宜种植区域推荐模型进行训练:
Figure 850191DEST_PATH_IMAGE167
其中,
Figure 733833DEST_PATH_IMAGE168
Figure 456807DEST_PATH_IMAGE169
分别为所有种植记录和实体的嵌入矩阵,
Figure 425900DEST_PATH_IMAGE170
为关系
Figure 643255DEST_PATH_IMAGE171
的嵌入矩阵,
Figure 381404DEST_PATH_IMAGE172
为知识图谱中关系
Figure 760433DEST_PATH_IMAGE173
的指示张量
Figure 967554DEST_PATH_IMAGE174
的切片,
Figure 723021DEST_PATH_IMAGE175
表示L2范数;
Figure 581255DEST_PATH_IMAGE176
为品种- 单元区域交互矩阵,若品种
Figure 131185DEST_PATH_IMAGE086
在单元区域
Figure 324138DEST_PATH_IMAGE177
的适宜性类别为适宜,则
Figure 883295DEST_PATH_IMAGE178
,否则
Figure 596036DEST_PATH_IMAGE179
Figure 582447DEST_PATH_IMAGE180
Figure 498581DEST_PATH_IMAGE181
为预设常数;
Figure 595850DEST_PATH_IMAGE182
表示知识图谱
Figure 428677DEST_PATH_IMAGE183
中的关系集合;
Figure 585989DEST_PATH_IMAGE184
为sigmoid激活函数。
Figure 487955DEST_PATH_IMAGE185
Figure 388915DEST_PATH_IMAGE186
分别 为预设常数,优选地,其值可设为
Figure 76248DEST_PATH_IMAGE187
Figure 138882DEST_PATH_IMAGE188
在给定知识图谱
Figure 29609DEST_PATH_IMAGE189
和品种-单元区域交互矩阵
Figure 468680DEST_PATH_IMAGE190
的情况下,可通过最大化模型参 数
Figure 10520DEST_PATH_IMAGE191
的后验概率进行模型的迭代训练,目标函数为:
Figure 509635DEST_PATH_IMAGE192
根据贝叶斯定理,上述公式可转化为:
Figure 386193DEST_PATH_IMAGE193
其中,参数
Figure 628955DEST_PATH_IMAGE194
服从正态分布,即
Figure 25301DEST_PATH_IMAGE195
Figure 695317DEST_PATH_IMAGE196
为知识图谱中每个事实的概 率乘积,即:
Figure 560636DEST_PATH_IMAGE197
Figure 607090DEST_PATH_IMAGE198
为在给定参数
Figure 857942DEST_PATH_IMAGE199
和知识图谱
Figure 433280DEST_PATH_IMAGE200
下的极大似然函数,可将其定义为伯努利 分布的乘积:
Figure 35163DEST_PATH_IMAGE201
其中,
Figure 892433DEST_PATH_IMAGE202
为指示函数,当三元组
Figure 263371DEST_PATH_IMAGE203
存在时,
Figure 275190DEST_PATH_IMAGE204
的值为1;否则,该函数的值 为0;
Figure 364368DEST_PATH_IMAGE205
Figure 237778DEST_PATH_IMAGE206
分别为模型的超参;
Figure 463223DEST_PATH_IMAGE207
为sigmoid激活函数。
Figure 911522DEST_PATH_IMAGE208
取负对数,从而可得模型的上述损失函数,
Figure 222417DEST_PATH_IMAGE209
在一个实施例中,所述对所述品种适宜种植区域推荐模型进行训练,包括:采用随 机梯度下降算法进行损失函数的迭代求解;在每次迭代计算中,随机根据所述交互矩阵
Figure 398052DEST_PATH_IMAGE210
和知识图谱
Figure 743583DEST_PATH_IMAGE109
中抽取正负样本,并计算
Figure 831625DEST_PATH_IMAGE211
Figure 895396DEST_PATH_IMAGE212
Figure 110608DEST_PATH_IMAGE213
的梯度,进而更新
Figure 310645DEST_PATH_IMAGE214
Figure 835167DEST_PATH_IMAGE215
Figure 120655DEST_PATH_IMAGE216
的值。
优选地,可采用随机梯度下降算法进行损失函数的迭代求解。在每次迭代计算中, 可随机小批量根据所述交互矩阵
Figure 638093DEST_PATH_IMAGE217
和知识图谱
Figure 692636DEST_PATH_IMAGE218
中抽取正负样本,并计算
Figure 653639DEST_PATH_IMAGE219
Figure 426423DEST_PATH_IMAGE220
Figure 967126DEST_PATH_IMAGE221
的梯度,进而更新
Figure 892488DEST_PATH_IMAGE222
Figure 24392DEST_PATH_IMAGE223
Figure 18893DEST_PATH_IMAGE224
的值。为便于求解算法的编程实现,可在现有机 器学习开发框架(如TensorFlow、PyTorch、PaddlePaddle等)的基础上进行模型的程序编码 实现。
在一个实施例中,所述确定每个待分析品种的推荐种植单元区域集合之后,还包括:根据所述每个品种的推荐种植单元区域集合,经二次筛选后,得到每个品种最终的适宜种植区域;其中,所述二次筛选的特征包括:品种抗性、品种的历史平均亩产和单元区域内的品种数。
其中,二次筛选是基于一系列预定义规则,对每个品种初步的推荐种植单元区域集合进行再次筛选,从而得到最终的适宜种植区域组合。具体地,可根据品种、单元区域以及二者之间的协同关系,确定二次筛选特征,相关筛选特征包括:品种抗性、品种的历史平均亩产、单元区域内的品种数。例如:可先根据品种抗性或历史亩产,剔除每个单元区域内的部分品种;然后,以品种维度再次汇总出每个品种的适宜种植单元区域集合,将其作为该品种的适宜种植区域进行推荐。具体地,二次筛选规则如下:(a)在某一指定单元区域内,按品种的综合抗性由大到小进行排序,选取大于指定阈值的品种;(b)在某一指定单元区域内,按品种的历史平均亩产由大到小进行排序,选取大于指定阈值的品种;(c)对规则a和b中的品种求交集,可得到该指定单元区域的推荐品种,同理可得到所有单元区域的推荐品种;(d)以品种维度,汇总得到每个品种的适宜种植区域,并将其进行推荐。
下面对本发明提供的农作物品种适宜种植区域推荐装置进行描述,下文描述的农作物品种适宜种植区域推荐装置与上文描述的农作物品种适宜种植区域推荐方法可相互对应参照。
图2是本发明提供的农作物品种适宜种植区域推荐装置的结构示意图,如图2所示,该农作物品种适宜种植区域推荐装置包括:数据采集模块201、知识图谱构建模块202、模型处理模块203和结果输出模块204。其中,数据采集模块201用于获取待分析区域中每个单元区域的地理环境数据、品种试验数据和种植方式数据;其中,所述待分析区域包括多个单元区域;知识图谱构建模块202用于根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱;模型处理模块,203用于根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练;结果输出模块204用于将每个待分析品种在已种植单元区域的种植记录数据及对应的适宜性类别,输入所述品种适宜种植区域推荐模型中,输出每个待分析品种在每个未种植单元区域的适宜性类别;根据所有单元区域的适宜性类别,确定每个待分析品种的推荐种植单元区域集合;其中,所述品种适宜种植区域推荐模型,根据所述地理环境知识图谱中各单元区域之间的关系,以及每个品种在已种植单元区域的适宜性类别作为训练数据,进行不断迭代训练后得到。
本发明实施例提供的装置实施例是为了实现上述各方法实施例的,具体流程和详细内容请参照上述方法实施例,此处不再赘述。
本发明实施例所提供的农作物品种适宜种植区域推荐装置,其实现原理及产生的技术效果和前述农作物品种适宜种植区域推荐方法实施例相同,为简要描述,农作物品种适宜种植区域推荐装置实施例部分未提及之处,可参考前述农作物品种适宜种植区域推荐方法实施例中相应内容。
图3是本发明提供的电子设备的结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行农作物品种适宜种植区域推荐方法,该方法包括:获取待分析区域中每个单元区域的地理环境数据、品种试验数据和种植方式数据;其中,所述待分析区域包括多个单元区域;根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱;根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练;将每个待分析品种在已种植单元区域的种植记录数据及对应的适宜性类别,输入所述品种适宜种植区域推荐模型中,输出每个待分析品种在每个未种植单元区域的适宜性类别;根据所有单元区域的适宜性类别,确定每个待分析品种的推荐种植单元区域集合;其中,所述品种适宜种植区域推荐模型,根据所述地理环境知识图谱中各单元区域之间的关系,以及每个品种在已种植单元区域的适宜性类别作为训练数据,进行不断迭代训练后得到。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的农作物品种适宜种植区域推荐方法,该方法包括:获取待分析区域中每个单元区域的地理环境数据、品种试验数据和种植方式数据;其中,所述待分析区域包括多个单元区域;根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱;根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练;将每个待分析品种在已种植单元区域的种植记录数据及其对应的适宜性类别,输入所述品种适宜种植区域推荐模型中,输出每个待分析品种在每个未种植单元区域的适宜性类别;根据所有单元区域的适宜性类别,确定每个待分析品种的推荐种植单元区域集合;其中,所述品种适宜种植区域推荐模型,根据所述地理环境知识图谱中各单元区域之间的关系,以及每个品种在已种植单元区域的适宜性类别作为训练数据,进行不断迭代训练后得到。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种农作物品种适宜种植区域推荐方法,其特征在于,包括:
获取待分析区域中每个单元区域的地理环境数据、品种试验数据和种植方式数据;其中,所述待分析区域包括多个单元区域;
根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱;
根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练;
将每个待分析品种在已种植单元区域的种植记录数据及对应的适宜性类别,输入所述品种适宜种植区域推荐模型中,输出每个待分析品种在每个未种植单元区域的适宜性类别;根据所有单元区域的适宜性类别,确定每个待分析品种的推荐种植单元区域集合;
其中,所述推荐模型,根据所述地理环境知识图谱中各单元区域之间的关系,以及每个品种在已种植单元区域的适宜性类别作为训练数据,进行不断迭代训练后得到。
2.根据权利要求1所述的农作物品种适宜种植区域推荐方法,其特征在于,所述根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱,包括:
通过聚类分析和关联性分析,提取影响农作物品种产量或品质的关键地理环境因子;
基于所述关键地理环境因子,对所述地理环境数据进行知识抽取;
抽取出的知识验证通过后采用三元组进行表示,并建立对应的复合索引;
利用所述种植方式数据,对根据地理环境数据抽取出的三元组进行扩充,得到扩充后的三元组,根据扩充后的三元组构建待分析区域的地理环境知识图谱。
3.根据权利要求1或2所述的农作物品种适宜种植区域推荐方法,其特征在于,所述根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练,包括:
根据每个单元区域的品种试验数据以及对应的预设指标阈值,确定每个试验品种在已种植单元区域的适宜性类别,将每个单元区域的品种试验数据和对应的适宜性类别,作为种植记录数据,用于所述推荐模型的训练;
根据所述知识图谱,以及每个品种的所述种植记录数据,生成每个品种的各阶单元区域扩展集合;
利用嵌入表示法将每个单元区域表示为候选单元区域向量,并根据所述知识图谱中各实体之间的关系,以及每个品种的各阶地域单元区域扩展集合,确定每个品种在初始种植单元区域扩展后得到的品种嵌入向量;
计算所述品种嵌入向量与所述候选单元区域向量之间的适宜概率,并根据预设指标阈值,确定品种在单元区域的适宜性类别,根据品种在单元区域的适宜性类别,对所述品种适宜种植区域推荐模型进行训练。
4.根据权利要求3所述的农作物品种适宜种植区域推荐方法,其特征在于,所述根据所述知识图谱中各实体之间的关系,以及每个品种的各阶地域单元区域扩展集合,确定每个品种在初始种植单元区域扩展后得到的品种嵌入向量,包括:
根据候选单元区域
Figure 994771DEST_PATH_IMAGE001
的嵌入向量
Figure 289486DEST_PATH_IMAGE002
,以及品种
Figure 326712DEST_PATH_IMAGE003
的一阶单元区域扩展集
Figure 57777DEST_PATH_IMAGE004
上的每个三元 组
Figure 471441DEST_PATH_IMAGE005
,计算候选单元区域
Figure 355083DEST_PATH_IMAGE001
与实体
Figure 828790DEST_PATH_IMAGE006
在关系
Figure 548615DEST_PATH_IMAGE007
下的相似性概率
Figure 500391DEST_PATH_IMAGE008
Figure 504119DEST_PATH_IMAGE009
其中,
Figure 148727DEST_PATH_IMAGE010
Figure 854384DEST_PATH_IMAGE011
分别为一阶单元区域扩展集
Figure 609850DEST_PATH_IMAGE012
上第
Figure 202505DEST_PATH_IMAGE013
个三元组中的关系
Figure 18015DEST_PATH_IMAGE014
和 头部实体
Figure 712432DEST_PATH_IMAGE015
的嵌入表示;
Figure 537169DEST_PATH_IMAGE016
表示嵌入表示向量或矩阵的维度;
Figure 984331DEST_PATH_IMAGE017
Figure 220009DEST_PATH_IMAGE018
分别表示扩展集
Figure 650990DEST_PATH_IMAGE019
上 每个三元组中关系
Figure 748259DEST_PATH_IMAGE020
和头部实体
Figure 581086DEST_PATH_IMAGE021
对应的嵌入表示;
计算品种
Figure 223551DEST_PATH_IMAGE022
在一阶单元区域扩展集上的潜在适宜单元区域的向量
Figure 876249DEST_PATH_IMAGE023
,计算方法为:
Figure 777209DEST_PATH_IMAGE024
其中,
Figure 198963DEST_PATH_IMAGE025
为实体
Figure 527176DEST_PATH_IMAGE026
的嵌入向量;
Figure 916438DEST_PATH_IMAGE027
的值赋值给向量
Figure 621089DEST_PATH_IMAGE028
,重新计算
Figure 162929DEST_PATH_IMAGE029
与实体
Figure 662043DEST_PATH_IMAGE030
在关系
Figure 40066DEST_PATH_IMAGE031
下的相似性概率
Figure 282829DEST_PATH_IMAGE032
,进而得到品 种
Figure 679175DEST_PATH_IMAGE033
在二阶单元区域扩展集上的潜在适宜单元区域的向量
Figure 349191DEST_PATH_IMAGE034
重复上述步骤,得到品种
Figure 713045DEST_PATH_IMAGE035
Figure 493919DEST_PATH_IMAGE036
阶单元区域扩展集上的潜在适宜单元区域的向量
Figure 10351DEST_PATH_IMAGE037
Figure 851268DEST_PATH_IMAGE038
根据品种
Figure 203883DEST_PATH_IMAGE022
在各阶单元区域扩展集上的向量
Figure 788448DEST_PATH_IMAGE039
,确定品种
Figure 893807DEST_PATH_IMAGE040
在单元区域
Figure 905626DEST_PATH_IMAGE041
的扩 展后的品种嵌入向量
Figure 978493DEST_PATH_IMAGE042
5.根据权利要求4所述的农作物品种适宜种植区域推荐方法,其特征在于,所述对所述品种适宜种植区域推荐模型进行训练,包括根据如下损失函数对所述品种适宜种植区域推荐模型进行训练:
Figure 366749DEST_PATH_IMAGE043
其中,
Figure 592194DEST_PATH_IMAGE044
Figure 774913DEST_PATH_IMAGE045
分别为所有种植记录和实体的嵌入矩阵,
Figure 102121DEST_PATH_IMAGE046
为关系
Figure 28488DEST_PATH_IMAGE047
的嵌入矩阵,
Figure 108440DEST_PATH_IMAGE048
为知 识图谱中关系
Figure 727640DEST_PATH_IMAGE049
的指示张量
Figure 775099DEST_PATH_IMAGE050
的切片,
Figure 505158DEST_PATH_IMAGE051
表示L2范数;
Figure 439616DEST_PATH_IMAGE052
为品种-单元 区域交互矩阵,若品种
Figure 229717DEST_PATH_IMAGE053
在单元区域
Figure 265938DEST_PATH_IMAGE054
的适宜性类别为适宜,则
Figure 534108DEST_PATH_IMAGE055
,否则
Figure 588652DEST_PATH_IMAGE056
Figure 549654DEST_PATH_IMAGE057
Figure 791280DEST_PATH_IMAGE058
为预 设常数;
Figure 377988DEST_PATH_IMAGE059
表示知识图谱
Figure 552617DEST_PATH_IMAGE060
中的关系集合;
Figure 418942DEST_PATH_IMAGE061
为sigmoid激活函数。
6.根据权利要求5所述的农作物品种适宜种植区域推荐方法,其特征在于,所述对所述品种适宜种植区域推荐模型进行训练,包括:
采用随机梯度下降算法进行损失函数的迭代求解;
在每次迭代计算中,随机根据所述交互矩阵
Figure 429755DEST_PATH_IMAGE062
和知识图谱
Figure 39727DEST_PATH_IMAGE063
中抽取正负样本,并计算
Figure 68863DEST_PATH_IMAGE064
Figure 106089DEST_PATH_IMAGE065
Figure 102733DEST_PATH_IMAGE066
的梯度,进而更新
Figure 516397DEST_PATH_IMAGE067
Figure 134460DEST_PATH_IMAGE068
Figure 873746DEST_PATH_IMAGE069
的值。
7.根据权利要求1所述的农作物品种适宜种植区域推荐方法,其特征在于,所述确定每个待分析品种的推荐种植单元区域集合之后,还包括:
根据所述每个品种的推荐种植单元区域集合,经二次筛选后,得到每个品种最终的适宜种植区域;
其中,所述二次筛选的特征包括:品种抗性、品种的历史平均亩产和单元区域内的品种数。
8.一种农作物品种适宜种植区域推荐装置,其特征在于,包括:
数据采集模块,用于获取待分析区域中每个单元区域的地理环境数据、品种试验数据和种植方式数据;其中,所述待分析区域包括多个单元区域;
知识图谱构建模块,用于根据所述地理环境数据、所述品种试验数据和所述种植方式数据,构建待分析区域的地理环境知识图谱;
模型处理模块,用于根据所述知识图谱,结合所述品种试验数据,构建基于嵌入模型与知识图谱推理的品种适宜种植区域推荐模型,并对所述品种适宜种植区域推荐模型进行训练;
结果输出模块,用于将每个待分析品种在已种植单元区域的种植记录数据及对应的适宜性类别,输入所述品种适宜种植区域推荐模型中,输出每个待分析品种在每个未种植单元区域的适宜性类别;根据所有单元区域的适宜性类别,确定每个待分析品种的推荐种植单元区域集合;
其中,所述品种适宜种植区域推荐模型,根据所述地理环境知识图谱中各单元区域之间的关系,以及每个品种在已种植单元区域的适宜性类别作为训练数据,进行不断迭代训练后得到。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述农作物品种适宜种植区域推荐方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述农作物品种适宜种植区域推荐方法。
CN202211630076.3A 2022-12-19 2022-12-19 农作物品种适宜种植区域推荐方法及装置 Active CN115618021B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211630076.3A CN115618021B (zh) 2022-12-19 2022-12-19 农作物品种适宜种植区域推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211630076.3A CN115618021B (zh) 2022-12-19 2022-12-19 农作物品种适宜种植区域推荐方法及装置

Publications (2)

Publication Number Publication Date
CN115618021A true CN115618021A (zh) 2023-01-17
CN115618021B CN115618021B (zh) 2023-04-28

Family

ID=84879893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211630076.3A Active CN115618021B (zh) 2022-12-19 2022-12-19 农作物品种适宜种植区域推荐方法及装置

Country Status (1)

Country Link
CN (1) CN115618021B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860581A (zh) * 2023-02-28 2023-03-28 北京市农林科学院信息技术研究中心 农作物品种适宜性评价方法、装置、设备及存储介质
CN116109915A (zh) * 2023-04-17 2023-05-12 济宁能源发展集团有限公司 一种集装箱箱门状态智能识别方法
CN117371529A (zh) * 2023-12-07 2024-01-09 北京市农林科学院信息技术研究中心 作物表型数据知识图谱生成方法、装置、电子设备及介质
CN117557399A (zh) * 2024-01-11 2024-02-13 四川省农村经济综合信息中心 一种丹参生长适宜分布区域分析系统及其分析方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899786A (zh) * 2015-05-13 2015-09-09 中国农业大学 玉米品种种植适宜性精细区划方法与系统
US20200242444A1 (en) * 2019-01-30 2020-07-30 Baidu Usa Llc Knowledge-graph-embedding-based question answering
US20200302556A1 (en) * 2019-03-21 2020-09-24 International Business Machines Corporation Crop recommendation
CN112149004A (zh) * 2020-10-30 2020-12-29 中国科学院计算技术研究所 一种基于协同知识图谱的个性化推荐方法
CN114332667A (zh) * 2022-03-17 2022-04-12 北京市农林科学院信息技术研究中心 玉米株型识别方法、装置、电子设备及存储介质
CN114461903A (zh) * 2021-12-29 2022-05-10 北京市农林科学院信息技术研究中心 作物品种适宜推广区域确定方法及装置
CN114595344A (zh) * 2022-05-09 2022-06-07 北京市农林科学院信息技术研究中心 面向农作物品种管理的知识图谱构建方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899786A (zh) * 2015-05-13 2015-09-09 中国农业大学 玉米品种种植适宜性精细区划方法与系统
US20200242444A1 (en) * 2019-01-30 2020-07-30 Baidu Usa Llc Knowledge-graph-embedding-based question answering
US20200302556A1 (en) * 2019-03-21 2020-09-24 International Business Machines Corporation Crop recommendation
CN112149004A (zh) * 2020-10-30 2020-12-29 中国科学院计算技术研究所 一种基于协同知识图谱的个性化推荐方法
CN114461903A (zh) * 2021-12-29 2022-05-10 北京市农林科学院信息技术研究中心 作物品种适宜推广区域确定方法及装置
CN114332667A (zh) * 2022-03-17 2022-04-12 北京市农林科学院信息技术研究中心 玉米株型识别方法、装置、电子设备及存储介质
CN114595344A (zh) * 2022-05-09 2022-06-07 北京市农林科学院信息技术研究中心 面向农作物品种管理的知识图谱构建方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
于春花 等: "农作物品种试验数据管理平台设计与实现" *
孙雨生;祝博;朱礼军;: "国内基于知识图谱的信息推荐研究进展" *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860581A (zh) * 2023-02-28 2023-03-28 北京市农林科学院信息技术研究中心 农作物品种适宜性评价方法、装置、设备及存储介质
CN116109915A (zh) * 2023-04-17 2023-05-12 济宁能源发展集团有限公司 一种集装箱箱门状态智能识别方法
CN116109915B (zh) * 2023-04-17 2023-07-18 济宁能源发展集团有限公司 一种集装箱箱门状态智能识别方法
CN117371529A (zh) * 2023-12-07 2024-01-09 北京市农林科学院信息技术研究中心 作物表型数据知识图谱生成方法、装置、电子设备及介质
CN117371529B (zh) * 2023-12-07 2024-04-05 北京市农林科学院信息技术研究中心 作物表型数据知识图谱生成方法、装置、电子设备及介质
CN117557399A (zh) * 2024-01-11 2024-02-13 四川省农村经济综合信息中心 一种丹参生长适宜分布区域分析系统及其分析方法
CN117557399B (zh) * 2024-01-11 2024-03-12 四川省农村经济综合信息中心 一种丹参生长适宜分布区域分析系统及其分析方法

Also Published As

Publication number Publication date
CN115618021B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN115618021B (zh) 农作物品种适宜种植区域推荐方法及装置
Gutiérrez et al. A review of visualisations in agricultural decision support systems: An HCI perspective
Nyambo et al. A review of characterization approaches for smallholder farmers: Towards predictive farm typologies
CN109328016A (zh) 用于识别用于植物育种的杂交物种的方法
Arumugam A predictive modeling approach for improving paddy crop productivity using data mining techniques
Willemen et al. Spatial patterns of diversity and genetic erosion of traditional cassava (Manihot esculenta Crantz) in the Peruvian Amazon: An evaluation of socio-economic and environmental indicators
Mulla et al. Crop-yield and price forecasting using machine learning
CN113139717B (zh) 作物苗情分级遥感监测方法及装置
Nikoloski et al. Farm reorientation assessment model based on multi-criteria decision making
Hudait et al. Site suitability assessment for traditional betel vine cultivation and crop acreage expansion in Tamluk Subdivision of Eastern India using AHP-based multi-criteria decision making approach
Albayrak et al. Development of intelligent decision support system using fuzzy cognitive maps for migratory beekeepers
Fenz et al. AI-and data-driven pre-crop values and crop rotation matrices
Motia et al. Ensemble classifier to support decisions on Soil Classification
An et al. Optimized supply chain management of rice in south korea: Location–allocation model of rice production
Ahmad Latif et al. Predicting heritability of oil palm breeding using phenotypic traits and machine learning
Verma et al. [Retracted] Plantosphere: Next Generation Adaptive and Smart Agriculture System
US20230121145A1 (en) Method of introducing ecosystem and method of managing value information about land
Diepeveen et al. Identifying key crop performance traits using data mining
Perković et al. Shallot species and subtypes discrimination based on morphology descriptors
CN117745148B (zh) 基于多源数据的稻茬烤烟种植质量评价方法及系统
CN110263922A (zh) 一种用于评价草地退化程度的训练数据处理方法
Mondo et al. Farming practices, varietal preferences, and land suitability analyses for yam production in Eastern DR Congo: implications for breeding initiatives and food sovereignty
Nath et al. Design of intelligent system in agriculture using data mining
Abiola et al. Toward tailored interventions in plantain (Musa paradisiaca L.) industry: Insights from heterogeneity and constraints to plantain-based cropping systems in South-Benin
Dissanayake et al. Crop Yield Forecasting using Machine Learning Techniques-A Systematic Literature Review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant