CN116935230B - 作物病虫害识别方法、装置、设备及介质 - Google Patents

作物病虫害识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN116935230B
CN116935230B CN202311175744.2A CN202311175744A CN116935230B CN 116935230 B CN116935230 B CN 116935230B CN 202311175744 A CN202311175744 A CN 202311175744A CN 116935230 B CN116935230 B CN 116935230B
Authority
CN
China
Prior art keywords
image
training
crop
feature extraction
key frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311175744.2A
Other languages
English (en)
Other versions
CN116935230A (zh
Inventor
陈飞勇
李政道
宋扬
刘汝鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Jianzhu University
Original Assignee
Shandong Jianzhu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Jianzhu University filed Critical Shandong Jianzhu University
Priority to CN202311175744.2A priority Critical patent/CN116935230B/zh
Publication of CN116935230A publication Critical patent/CN116935230A/zh
Application granted granted Critical
Publication of CN116935230B publication Critical patent/CN116935230B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/188Vegetation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供作物病虫害识别方法、装置、设备及介质,涉及人工智能技术领域,方法包括:获取待识别作物的图像序列,图像序列中包括多张按时间顺序排列的待识别作物的图像;对图像序列进行关键帧提取,得到关键帧,基于关键帧和已训练的图像特征提取模型,确定参考图像;将关键帧和参考图像分别输入至目标检测模型中,获取目标检测模型输出的关键帧和参考图像中的目标检测结果,目标检测结果反映关键帧和参考图像中作物的叶片、茎以及果实;基于图像序列、关键帧、参考图像、目标检测结果和已训练的图像处理模型,获取待识别作物的病虫害识别结果,其中,病虫害识别结果包括待识别作物的生长阶段以及病虫害类型。本发明可以提高病虫害识别效率。

Description

作物病虫害识别方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及作物病虫害识别方法、装置、设备及介质。
背景技术
病虫害会对作物的产量造成重大影响,农业病虫害防治需要及时准确地识别病虫害类型,从而快速定位到科学的处理方案。而目前作物病虫害的识别依赖于有专业经验的人士根据实地观察到的作物情况进行判断,效率低。
发明内容
本发明提供作物病虫害识别方法、装置、设备及介质,用以解决现有技术需要人工识别病虫害,效率低的缺陷,实现高效率识别病虫害的效果。
本发明提供一种作物病虫害识别方法,包括:
获取待识别作物的图像序列,其中,所述图像序列中包括多张按时间顺序排列的所述待识别作物的图像;
对所述图像序列进行关键帧提取,得到关键帧,基于所述关键帧和已训练的图像特征提取模型,确定参考图像;
将所述关键帧和所述参考图像分别输入至目标检测模型中,获取所述目标检测模型输出的所述关键帧和所述参考图像中的目标检测结果,所述目标检测结果反映所述关键帧和所述参考图像中作物的叶片、茎以及果实;
基于所述图像序列、所述关键帧、所述参考图像、所述目标检测结果和已训练的图像处理模型,获取所述待识别作物的病虫害识别结果,其中,所述病虫害识别结果包括所述待识别作物的生长阶段以及病虫害类型;
其中,所述图像特征提取模型是基于多组第一样本训练对和多组第二样本训练对训练得到的,所述第一样本训练对中包括第一训练图像和第二训练图像,所述第一训练图像为存在病虫害的作物的图像,所述第二训练图像为不存在病虫害的作物的图像,所述第二样本训练对中包括第三训练图像和第四训练图像,所述第三训练图像和所述第四训练图像均为存在病虫害的作物的图像,所述第三训练图像和所述第四训练图像对应的病虫害不同。
根据本发明提供的一种作物病虫害识别方法,所述图像处理模型包括第一特征提取模块、第二特征提取模块、融合模块、生长阶段预测模块和病虫害类型预测模块;所述基于所述图像序列、所述关键帧、所述参考图像、所述目标检测结果和已训练的图像处理模型,获取所述待识别作物的病虫害识别结果,包括:
将所述图像序列输入至所述第一特征提取模块中,获取所述第一特征提取模块输出的作物变化特征,将所述作物变化特征输入至所述生长阶段预测模块,获取所述生长阶段预测模块输出的所述待识别作物的生长阶段;
生成第一对比图像对、第二对比图像对和第三对比图像对,所述第一对比图像对中包括所述关键帧的叶片区域图像和所述参考图像中的叶片区域图像,所述第二对比图像对中包括所述关键帧的茎区域图像和所述参考图像中的茎区域图像,所述第三对比图像对中包括所述关键帧的果实区域图像和所述参考图像中的果实区域图像;
将所述第一对比图像对、所述第二对比图像对和所述第三对比图像对输入至所述第二特征提取模块中,获取所述第二特征提取模块输出的病虫害状态特征;
将所述作物变化特征和所述病虫害状态特征输入至所述融合模块中,获取所述融合模块输出的融合特征;
将所述融合特征输入至所述病虫害类型预测模块,获取所述病虫害类型预测模块输出的所述病虫害类型。
根据本发明提供的一种作物病虫害识别方法,所述基于所述关键帧和已训练的图像特征提取模型,确定参考图像,包括:
基于所述待识别作物的生长阶段,在预设的参考图像库中确定候选图像集,所述候选图像集中的图像对应的生长阶段与所述待识别作物的生长阶段一致;
将所述关键帧输入至所述图像特征提取模型中,获取所述图像特征提取模型输出的关键帧特征;
将所述关键帧特征与所述候选图像集中的各个图像对应的图像特征进行匹配,基于匹配结果确定所述参考图像;
其中,所述候选图像集中的各个图像对应的所述图像特征是将所述候选图像集中的图像输入至所述图像特征提取模型中得到的。
根据本发明提供的一种作物病虫害识别方法,所述图像特征提取模型的训练过程包括:
将所述第一样本训练对中的图像分别输入至所述图像特征提取模型,获取所述图像特征提取模型输出的第一训练图像特征和第二训练图像特征;
将所述第二样本训练对中的图像分别输入至所述图像特征提取模型,获取所述图像特征提取模型输出的第三训练图像特征和第四训练图像特征;
基于所述第一训练图像特征和所述第二训练图像特征得到第一损失,所述第一损失与样本相似度正相关,所述样本相似度为第一相似度和第二相似度之间的相似度,所述第一相似度为所述第一训练图像和所述第二训练图像之间的相似度,所述第二相似度为所述第一训练图像特征和所述第二训练图像特征之间的相似度;
基于所述第三训练图像特征和所述第四训练图像特征得到第二损失,所述第三训练图像特征和所述第四训练图像特征之间的相似度与所述第二损失负相关;
基于所述第一损失和所述第二损失更新所述图像特征提取模型。
根据本发明提供的一种作物病虫害识别方法,所述图像处理模型的训练过程包括:
基于多组第一数据训练所述第一特征提取模块和生长阶段预测模块,其中,每组所述第一数据包括第一样本图像序列和所述第一样本图像序列对应的生长阶段标签,所述第一样本图像序列为对有病虫害的作物或无病虫害的作物进行图像采集得到;
将训练后的所述第一特征提取模块和所述生长阶段预测模块加入至所述图像处理模型;
基于多组第二数据训练所述图像处理模型,其中,每组所述第二数据包括第二样本图像序列、样本目标检测结果和所述第二样本图像序列对应的病虫害类型标签。
根据本发明提供的一种作物病虫害识别方法,所述获取所述待识别作物的病虫害识别结果之后,所述方法包括:
根据所述病虫害识别结果生成问题文本;
将所述问题文本输入至已训练的大语言模型中,获取所述大语言模型输出的病虫害防治措施;所述大语言模型的训练过程包括:
基于第一数据集对所述大语言模型进行预训练,所述第一数据集中包括多个训练语料,所述训练语料涉及病虫害防治知识;
基于第二数据集训练奖励模型,所述第二数据集中包括第一样本问题以及所述第一样本问题对应的答案标签;
基于第三数据集和已训练的所述奖励模型对已进行预训练的大语言模型进行再次训练,得到所述已训练的大语言模型,所述第三数据集包括第二样本问题。
根据本发明提供的一种作物病虫害识别方法,所述基于第一数据集对所述大语言模型进行预训练,包括:
将所述训练语料中的前N个句子输入至所述大语言模型中,获取所述大语言模型输出的预测句子,基于所述预测句子和所述训练语料中的第N+1个句子,更新所述大语言模型;和/或,
随机遮罩所述训练语料中的目标词,将遮罩后的所述训练语料输入至所述大语言模型中,获取所述大语言模型输出的预测词,基于所述预测词和所述目标词,更新所述大语言模型。
本发明还提供一种作物病虫害识别装置,包括:
图像获取模块,用于获取待识别作物的图像序列,其中,所述图像序列中包括多张按时间顺序排列的所述待识别作物的图像;
关键帧提取模块,用于对所述图像序列进行关键帧提取,得到关键帧,基于所述关键帧和已训练的图像特征提取模型,确定参考图像;
目标检测模块,用于将所述关键帧和所述参考图像分别输入至目标检测模型中,获取所述目标检测模型输出的所述关键帧和所述参考图像中的目标检测结果,所述目标检测结果反映所述关键帧和所述参考图像中作物的叶片、茎以及果实;
识别模块,用于基于所述图像序列、所述关键帧、所述参考图像、所述目标检测结果和已训练的图像处理模型,获取所述待识别作物的病虫害识别结果,其中,所述病虫害识别结果包括所述待识别作物的生长阶段以及病虫害类型;
其中,所述图像特征提取模型是基于多组第一样本训练对和多组第二样本训练对训练得到的,所述第一样本训练对中包括第一训练图像和第二训练图像,所述第一训练图像为存在病虫害的作物的图像,所述第二训练图像为不存在病虫害的作物的图像,所述第二样本训练对中包括第三训练图像和第四训练图像,所述第三训练图像和所述第四训练图像均为存在病虫害的作物的图像,所述第三训练图像和所述第四训练图像对应的病虫害不同。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述作物病虫害识别方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述作物病虫害识别方法。
本发明提供的作物病虫害识别方法、装置、设备及介质,获取待识别作物的图像序列,对图像序列进行关键帧提取,得到关键帧,基于所述关键帧和已训练的图像特征提取模型,确定参考图像,对关键帧和参考图像进行目标检测,得到包括关键帧和参考图像中作物的叶片、茎以及果实的目标检测结果,基于图像序列、关键帧、参考图像、目标检测结果和已训练的图像处理模型,通过图像处理模型提取目标检测结果以及图像序列中关于病虫害的特征,输出病虫害识别结果,实现了作物病虫害的自动智能识别,不需要人工,提升作物病虫害识别效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的作物病虫害识别方法的流程示意图;
图2是本发明提供的作物病虫害识别装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1描述本发明提供的作物病虫害识别方法,如图1所示,该方法包括步骤:
S100、获取待识别作物的图像序列,其中,图像序列中包括多张按时间排序的待识别作物的图像。
对待识别作物进行连续成像,得到待识别作物的图像序列,具体地,图像序列中包括的多张图像之间的成像间隔可以为一天、三天等。图像序列中待识别作物的图像的成像角度一致。
S200、对图像序列进行关键帧提取,得到关键帧,基于关键帧和已训练的图像特征提取模型,确定参考图像。
对图像序列进行关键帧提取可以通过现有的关键帧提取模型实现,由于作物病虫害导致作物的叶片、茎等性状发生改变的进度可能会比较慢,本发明提供的方法中,对图像序列进行关键帧提取,得到能够反映病虫害的关键识别特征的关键帧,便于后续提取关键帧的特征,有利于提升处理效率。
S300、将关键帧和参考图像分别输入至目标检测模型中,获取目标检测模型输出的关键帧和参考图像中的目标检测结果,目标检测结果反映关键帧和参考图像中作物的叶片、茎以及果实。
病虫害可以从作物的叶、茎以及果实上表现,本发明提供的方法中,在检测到关键帧,并确定参考图像后,先采用目标检测模型检测关键帧和参考图像中的叶片、茎以及果实等目标,本发明中采用的目标检测模型可以采用现有技术中已有的采用通用数据库训练得到的用于检测目标的模型,采用作物图像库进行调整后得到。
S400、基于图像序列、关键帧、参考图像、目标检测结果和已训练的图像处理模型,获取待识别作物的病虫害识别结果,其中,病虫害识别结果包括待识别作物的生长阶段以及病虫害类型。
图像处理模型包括第一特征提取模块、第二特征提取模块、融合模块、生长阶段预测模块和病虫害类型预测模块,基于图像序列、关键帧、参考图像、目标检测结果和已训练的图像处理模型,获取待识别作物的病虫害识别结果,包括:
将图像序列输入至第一特征提取模块中,获取第一特征提取模块输出的作物变化特征,将作物变化特征输入至生长阶段预测模块,获取生长阶段预测模块输出的待识别作物的生长阶段;
生成第一对比图像对、第二对比图像对和第三对比图像对,第一对比图像对中包括关键帧的叶片区域图像和参考图像中的叶片区域图像,第二对比图像对中包括关键帧的茎区域图像和参考图像中的茎区域图像,第三对比图像对中包括关键帧的果实区域图像和参考图像中的果实区域图像;
将第一对比图像对、第二对比图像对和第三对比图像对输入至第二特征提取模块中,获取第二特征提取模块输出的病虫害状态特征;
将作物变化特征和病虫害状态特征输入至融合模块中,获取融合模块输出的融合特征;
将融合特征输入至病虫害类型预测模块,获取病虫害类型预测模块输出的病虫害类型。
具体地,参考图像库中的参考图像为作物不存在病虫害时各个生长阶段的图像。基于关键帧和已训练的图像特征提取模型,确定参考图像,包括:
基于待识别作物的生长阶段,在预设的参考图像库中确定候选图像集,候选图像集中的图像对应的作物生长阶段与待识别作物的生长阶段一致;
将关键帧输入至图像特征提取模型中,获取图像特征提取模块输出的关键帧特征;
将关键帧特征与候选图像集中的各个图像对应的图像特征进行匹配,基于匹配结果确定参考图像;
候选图像集中的各个图像对应的图像特征是将候选图像集中的图像输入至图像特征提取模型中得到。
本发明提供的方法中,采用独立的图像特征提取模型确定待识别作物在图像序列对应的生长阶段时的参考图像,也就是说,参考图像反映待识别作物在图像序列对应的生长阶段时,如果没有病虫害,生长状态应该是什么样的。
图像特征提取模型是基于多组第一样本训练对和多组第二样本训练对训练得到的,第一样本训练对中包括第一训练图像和第二训练图像,第一训练图像为存在病虫害的作物的图像,第二训练图像为不存在病虫害的作物的图像,第二样本训练对中包括第三训练图像和第四训练图像,第三训练图像和第四训练图像均为存在病虫害的作物的图像,第三训练图像和第四训练图像对应的病虫害不同。
具体地,图像特征提取模型的训练过程包括:
将第一样本训练对中的图像分别输入至图像特征提取模型,第一样本训练对中包括第一训练图像和第二训练图像,第一训练图像为存在病虫害的作物的图像,第二训练图像为不存在病虫害的作物的图像;
获取图像特征提取模型输出的第一训练图像特征和第二训练图像特征;
将第二样本训练对中的图像分别输入至图像特征提取模型,第二样本训练对中包括第三训练图像和第四训练图像,第三训练图像和第四训练图像均为存在病虫害的作物的图像,第三训练图像和第四训练图像对应的病虫害不同;
获取图像特征提取模型输出的第三训练图像特征和第四训练图像特征;
基于第一训练图像特征和第二训练图像特征得到第一损失,第一损失与样本相似度正相关,样本相似度为第一相似度和第二相似度之间的相似度,第一相似度为第一训练图像和第二训练图像之间的相似度,第二相似度为第一训练图像特征和第二训练图像特征之间的相似度;
基于第三训练图像特征和第四训练图像特征得到第二损失,第三训练图像特征和第四训练图像特征越相似,第二损失越大;
基于第一损失和第二损失更新图像特征提取模型。
具体地,图像特征提取模型要能够实现对于存在病虫害和不存在病虫害的同一作物,能够输出类似的特征,这样可以实现能够基于待识别作物对应的关键帧从图像数据库中提取出准确的参考图像的效果。当第一训练图像和第二训练图像对应的是同一作物时,第一相似度为1,当第一训练图像和第二训练图像对应的不是同一作物时,第一相似度为0。但是农作物的图像数据集有限,为了更高效地利用农作物图像数据,本发明提供的方法中,除了第一损失,还设置第二损失,使得图像特征提取模型输出的特征仍然可以反映具体的病虫害,使得图像特征提取模型输出的图像特征具有区别性,将没有作物种类标签的数据也可以用于训练图像特征提取模型,提升图像特征提取模型的训练数据量,提升训练效果,使得图像特征提取模型输出的特征更加准确。
进一步地,为了提升图像处理模型输出的结果的准确性,本发明提供的方法中,图像处理模型的训练过程包括:
基于多组第一数据训练第一特征提取模块和生长阶段预测模块,每组第一数据包括第一样本图像序列和第一样本图像序列对应的生长阶段标签,第一样本图像序列为对有病虫害的作物或无病虫害的作物进行图像采集得到;
将训练后的第一特征提取模块和生长阶段预测模块加入至图像处理模型;
基于多组第二数据训练图像处理模块,其中,每组第二数据包括第二样本图像序列、第二样本目标检测结果和第二样本图像序列对应的病虫害类型标签。
本发明提供的方法中,先对用于预测作物生长阶段的第一特征提取模块和生长阶段预测模块进行单独训练后再加入至图像处理模型进行训练。
具体地,基于多组第一数据训练第一特征提取模块和生长阶段预测模块,包括:
对第一样本图像序列输入至第一特征提取模块中,获取第一特征提取模块输出的样本作物变化特征;
将样本作物变化特征输入至生长阶段预测模块,获取生长阶段预测模块输出的样本生长阶段;
基于样本生长阶段与第一样本图像序列对应的生长阶段标签,得到第一训练损失,基于第一训练损失更新第一特征提取模块和生长阶段预测模块。
在一种可能的实现方式中,为了提升第一特征提取模块的特征提取能力以及生长阶段预测模块的预测能力,采用多种的第一样本图像序列进行训练,具体地说,第一样本图像序列可以为对有病害的作物进行成像得到的图像序列,也可以是对正常生长的作物进行成像得到的图像序列,也就是说,在用于训练第一特征提取模块和生长阶段预测模块的多组第一数据中,包括两种第一样本图像序列。采用两种第一样本图像序列进行训练,可以使得第一特征提取模块和生长阶段预测模块具备在存在其他信息干扰(病虫害对植株的性状产生了影响)时仍能够准确地提取出与作物生长阶段相关的特征的能力。
在基于多组第二数据训练图像处理模型时,维持图像处理模型中的第一特征提取模块和生长阶段预测模块的参数不变,只更新其他模块的参数。
在获取图像处理模型输出的待识别作物的病虫害识别结果之后,本发明提供的方法还提供针对待识别作物的病虫害识别结果的病虫害防治措施。具体地,在获取待识别作物的病虫害识别结果之后,本发明提供的方法还包括:
根据病虫害识别结果生成问题文本;
将问题文本输入至已训练的大语言模型中,获取大语言模型输出的病虫害防治措施。
问题文本是将待识别作物的生长阶段以及病虫害类型转化为自然语言后得到的文本,本发明采用大语言模型来实现对问题文本的回答。大语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等。由于大语言模型在专业领域的知识缺乏,本发明提供的方法中,先对大语言模型进行微调,使得大语言模型能够学习到病虫害防治的知识,从而实现病虫害防治问答。
具体地,大语言模型的训练过程包括:
基于第一数据集对大语言模型进行预训练,第一数据集中包括多个训练语料,训练语料涉及病虫害防治知识;
基于第二数据集训练奖励模型,第二数据集中包括第一样本问题以及第一样本文本对应的答案标签;
基于第三数据集和已训练的奖励模型对已进行预训练的大语言模型进行再次训练,得到已训练的大语言模型,第三数据集包括第二样本问题。
训练语料是病虫害防治领域的高质量文本数据,可以通过爬虫技术采集,训练语料可以包括标准、指南、操作手册、学术论文等。
基于第一数据集对大语言模型进行预训练,包括:
将训练语料中的前N个句子输入至大语言模型中,获取大语言模型输出的预测句子,基于预测句子和训练语料中的第N+1个句子,更新大语言模型;和/或,
随机遮罩训练语料中的目标词,将遮罩后的训练语料输入至大语言模型中,获取大语言模型输出的预测词,基于预测词和目标词,更新大语言模型。
首先将原始的训练语料输入大语言模型进行预训练,即无标注地让模型进行随机遮罩词语预测和句子预测,前者是让模型随机在一句话里将一个词语遮蔽,然后用模型预测该词语,并和真实词对比,后者是直接让模型预测下一句话并和真实的语句对比,从而将模型在病虫害防治领域迁移。
之后,针对农业病虫害防治,设计一系列问答场景(问题文本和回答文本),问答场景由人工设计,通过梳理主要的虫害类型,针对不同类型提问并回答,形成多条问答数据(包括第一样本问题和第一样本问题对应的答案标签),将第一样本问题和第一样本问题对应的答案标签填入预设的训练模板,输入至大语言模型中,对大语言模型进行进一步调整,使得大语言模型能够具备病虫害防治领域的问答功能。
针对问答数据中的每个问题(即第一样本问题),由大语言模型生成多个答案,将多个答案分别输入至奖励模型中,获取奖励模型对大语言模型生成的多个答案的等级排序结果,同时由人工专家对生成的多个答案基于偏好排序,基于人工排序结果和奖励模型输出的等级排序结果训练奖励模型,使得奖励模型能够对人工智能生成的答案进行打分。
最后,设计新的问题集,即第三数据集,将第三数据集中的问题输入至大语言模型中,获取大语言模型输出的答案,通过奖励模型对大语言模型输出的答案打分,获得的分数通过PPO算法迭代优化大语言模型参数。最终使得大语言模型能够实现在病虫害防治领域的准确问答功能。
下面对本发明提供的作物病虫害识别装置进行描述,下文描述的作物病虫害识别装置与上文描述的作物病虫害识别方法可相互对应参照。如图2所示,该装置包括:
图像获取模块210,用于获取待识别作物的图像序列,其中,图像序列中包括多张按时间顺序排列的待识别作物的图像;
关键帧提取模块220,用于对图像序列进行关键帧提取,得到关键帧,基于关键帧和已训练的图像特征提取模型,确定参考图像;
目标检测模块230,用于将关键帧和参考图像分别输入至目标检测模型中,获取目标检测模型输出的关键帧和参考图像中的目标检测结果,目标检测结果反映关键帧和参考图像中作物的叶片、茎以及果实;
识别模块240,用于基于图像序列、关键帧、参考图像、目标检测结果和已训练的图像处理模型,获取待识别作物的病虫害识别结果,其中,病虫害识别结果包括待识别作物的生长阶段以及病虫害类型;
其中,图像特征提取模型是基于多组第一样本训练对和多组第二样本训练对训练得到的,第一样本训练对中包括第一训练图像和第二训练图像,第一训练图像为存在病虫害的作物的图像,第二训练图像为不存在病虫害的作物的图像,第二样本训练对中包括第三训练图像和第四训练图像,第三训练图像和第四训练图像均为存在病虫害的作物的图像,第三训练图像和第四训练图像对应的病虫害不同。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行作物病虫害识别方法,该方法包括:获取待识别作物的图像序列,其中,图像序列中包括多张按时间顺序排列的待识别作物的图像;对图像序列进行关键帧提取,得到关键帧,基于关键帧和已训练的图像特征提取模型,确定参考图像;将关键帧和参考图像分别输入至目标检测模型中,获取目标检测模型输出的关键帧和参考图像中的目标检测结果,目标检测结果反映关键帧和参考图像中作物的叶片、茎以及果实;基于图像序列、关键帧、参考图像、目标检测结果和已训练的图像处理模型,获取待识别作物的病虫害识别结果,其中,病虫害识别结果包括待识别作物的生长阶段以及病虫害类型;其中,图像特征提取模型是基于多组第一样本训练对和多组第二样本训练对训练得到的,第一样本训练对中包括第一训练图像和第二训练图像,第一训练图像为存在病虫害的作物的图像,第二训练图像为不存在病虫害的作物的图像,第二样本训练对中包括第三训练图像和第四训练图像,第三训练图像和第四训练图像均为存在病虫害的作物的图像,第三训练图像和第四训练图像对应的病虫害不同。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的作物病虫害识别方法,该方法包括:获取待识别作物的图像序列,其中,图像序列中包括多张按时间顺序排列的待识别作物的图像;对图像序列进行关键帧提取,得到关键帧,基于关键帧和已训练的图像特征提取模型,确定参考图像;将关键帧和参考图像分别输入至目标检测模型中,获取目标检测模型输出的关键帧和参考图像中的目标检测结果,目标检测结果反映关键帧和参考图像中作物的叶片、茎以及果实;基于图像序列、关键帧、参考图像、目标检测结果和已训练的图像处理模型,获取待识别作物的病虫害识别结果,其中,病虫害识别结果包括待识别作物的生长阶段以及病虫害类型;其中,图像特征提取模型是基于多组第一样本训练对和多组第二样本训练对训练得到的,第一样本训练对中包括第一训练图像和第二训练图像,第一训练图像为存在病虫害的作物的图像,第二训练图像为不存在病虫害的作物的图像,第二样本训练对中包括第三训练图像和第四训练图像,第三训练图像和第四训练图像均为存在病虫害的作物的图像,第三训练图像和第四训练图像对应的病虫害不同。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种作物病虫害识别方法,其特征在于,包括:
获取待识别作物的图像序列,其中,所述图像序列中包括多张按时间顺序排列的所述待识别作物的图像;
对所述图像序列进行关键帧提取,得到关键帧,基于所述关键帧和已训练的图像特征提取模型,确定参考图像;
将所述关键帧和所述参考图像分别输入至目标检测模型中,获取所述目标检测模型输出的所述关键帧和所述参考图像中的目标检测结果,所述目标检测结果反映所述关键帧和所述参考图像中作物的叶片、茎以及果实;
基于所述图像序列、所述关键帧、所述参考图像、所述目标检测结果和已训练的图像处理模型,获取所述待识别作物的病虫害识别结果,其中,所述病虫害识别结果包括所述待识别作物的生长阶段以及病虫害类型;
其中,所述图像特征提取模型是基于多组第一样本训练对和多组第二样本训练对训练得到的,所述第一样本训练对中包括第一训练图像和第二训练图像,所述第一训练图像为存在病虫害的作物的图像,所述第二训练图像为不存在病虫害的作物的图像,所述第二样本训练对中包括第三训练图像和第四训练图像,所述第三训练图像和所述第四训练图像均为存在病虫害的作物的图像,所述第三训练图像和所述第四训练图像对应的病虫害不同;
所述图像处理模型包括第一特征提取模块、第二特征提取模块、融合模块、生长阶段预测模块和病虫害类型预测模块;所述基于所述图像序列、所述关键帧、所述参考图像、所述目标检测结果和已训练的图像处理模型,获取所述待识别作物的病虫害识别结果,包括:
将所述图像序列输入至所述第一特征提取模块中,获取所述第一特征提取模块输出的作物变化特征,将所述作物变化特征输入至所述生长阶段预测模块,获取所述生长阶段预测模块输出的所述待识别作物的生长阶段;
生成第一对比图像对、第二对比图像对和第三对比图像对,所述第一对比图像对中包括所述关键帧的叶片区域图像和所述参考图像中的叶片区域图像,所述第二对比图像对中包括所述关键帧的茎区域图像和所述参考图像中的茎区域图像,所述第三对比图像对中包括所述关键帧的果实区域图像和所述参考图像中的果实区域图像;
将所述第一对比图像对、所述第二对比图像对和所述第三对比图像对输入至所述第二特征提取模块中,获取所述第二特征提取模块输出的病虫害状态特征;
将所述作物变化特征和所述病虫害状态特征输入至所述融合模块中,获取所述融合模块输出的融合特征;
将所述融合特征输入至所述病虫害类型预测模块,获取所述病虫害类型预测模块输出的所述病虫害类型。
2.根据权利要求1所述的作物病虫害识别方法,其特征在于,所述基于所述关键帧和已训练的图像特征提取模型,确定参考图像,包括:
基于所述待识别作物的生长阶段,在预设的参考图像库中确定候选图像集,所述候选图像集中的图像对应的生长阶段与所述待识别作物的生长阶段一致;
将所述关键帧输入至所述图像特征提取模型中,获取所述图像特征提取模型输出的关键帧特征;
将所述关键帧特征与所述候选图像集中的各个图像对应的图像特征进行匹配,基于匹配结果确定所述参考图像;
其中,所述候选图像集中的各个图像对应的所述图像特征是将所述候选图像集中的图像输入至所述图像特征提取模型中得到的。
3.根据权利要求2所述的作物病虫害识别方法,其特征在于,所述图像特征提取模型的训练过程包括:
将所述第一样本训练对中的图像分别输入至所述图像特征提取模型,获取所述图像特征提取模型输出的第一训练图像特征和第二训练图像特征;
将所述第二样本训练对中的图像分别输入至所述图像特征提取模型,获取所述图像特征提取模型输出的第三训练图像特征和第四训练图像特征;
基于所述第一训练图像特征和所述第二训练图像特征得到第一损失,所述第一损失与样本相似度正相关,所述样本相似度为第一相似度和第二相似度之间的相似度,所述第一相似度为所述第一训练图像和所述第二训练图像之间的相似度,所述第二相似度为所述第一训练图像特征和所述第二训练图像特征之间的相似度;
基于所述第三训练图像特征和所述第四训练图像特征得到第二损失,所述第三训练图像特征和所述第四训练图像特征之间的相似度与所述第二损失负相关;
基于所述第一损失和所述第二损失更新所述图像特征提取模型。
4.根据权利要求1所述的作物病虫害识别方法,其特征在于,所述图像处理模型的训练过程包括:
基于多组第一数据训练所述第一特征提取模块和所述生长阶段预测模块,其中,每组所述第一数据包括第一样本图像序列和所述第一样本图像序列对应的生长阶段标签,所述第一样本图像序列为对有病虫害的作物或无病虫害的作物进行图像采集得到;
将训练后的所述第一特征提取模块和所述生长阶段预测模块加入至所述图像处理模型;
基于多组第二数据训练所述图像处理模型,其中,每组所述第二数据包括第二样本图像序列、样本目标检测结果和所述第二样本图像序列对应的病虫害类型标签。
5.根据权利要求1所述的作物病虫害识别方法,其特征在于,所述获取所述待识别作物的病虫害识别结果之后,所述方法包括:
根据所述病虫害识别结果生成问题文本;
将所述问题文本输入至已训练的大语言模型中,获取所述大语言模型输出的病虫害防治措施;
所述大语言模型的训练过程包括:
基于第一数据集对所述大语言模型进行预训练,所述第一数据集中包括多个训练语料,所述训练语料涉及病虫害防治知识;
基于第二数据集训练奖励模型,所述第二数据集中包括第一样本问题以及所述第一样本问题对应的答案标签;
基于第三数据集和已训练的所述奖励模型对已进行预训练的大语言模型进行再次训练,得到所述已训练的大语言模型,所述第三数据集包括第二样本问题。
6.根据权利要求5所述的作物病虫害识别方法,其特征在于,所述基于第一数据集对所述大语言模型进行预训练,包括:
将所述训练语料中的前N个句子输入至所述大语言模型中,获取所述大语言模型输出的预测句子,基于所述预测句子和所述训练语料中的第N+1个句子,更新所述大语言模型;和/或,
随机遮罩所述训练语料中的目标词,将遮罩后的所述训练语料输入至所述大语言模型中,获取所述大语言模型输出的预测词,基于所述预测词和所述目标词,更新所述大语言模型。
7.一种作物病虫害识别装置,其特征在于,包括:
图像获取模块,用于获取待识别作物的图像序列,其中,所述图像序列中包括多张按时间顺序排列的所述待识别作物的图像;
关键帧提取模块,用于对所述图像序列进行关键帧提取,得到关键帧,基于所述关键帧和已训练的图像特征提取模型,确定参考图像;
目标检测模块,用于将所述关键帧和所述参考图像分别输入至目标检测模型中,获取所述目标检测模型输出的所述关键帧和所述参考图像中的目标检测结果,所述目标检测结果反映所述关键帧和所述参考图像中作物的叶片、茎以及果实;
识别模块,用于基于所述图像序列、所述关键帧、所述参考图像、所述目标检测结果和已训练的图像处理模型,获取所述待识别作物的病虫害识别结果,其中,所述病虫害识别结果包括所述待识别作物的生长阶段以及病虫害类型;
其中,所述图像特征提取模型是基于多组第一样本训练对和多组第二样本训练对训练得到的,所述第一样本训练对中包括第一训练图像和第二训练图像,所述第一训练图像为存在病虫害的作物的图像,所述第二训练图像为不存在病虫害的作物的图像,所述第二样本训练对中包括第三训练图像和第四训练图像,所述第三训练图像和所述第四训练图像均为存在病虫害的作物的图像,所述第三训练图像和所述第四训练图像对应的病虫害不同;
所述图像处理模型包括第一特征提取模块、第二特征提取模块、融合模块、生长阶段预测模块和病虫害类型预测模块;所述基于所述图像序列、所述关键帧、所述参考图像、所述目标检测结果和已训练的图像处理模型,获取所述待识别作物的病虫害识别结果,包括:
将所述图像序列输入至所述第一特征提取模块中,获取所述第一特征提取模块输出的作物变化特征,将所述作物变化特征输入至所述生长阶段预测模块,获取所述生长阶段预测模块输出的所述待识别作物的生长阶段;
生成第一对比图像对、第二对比图像对和第三对比图像对,所述第一对比图像对中包括所述关键帧的叶片区域图像和所述参考图像中的叶片区域图像,所述第二对比图像对中包括所述关键帧的茎区域图像和所述参考图像中的茎区域图像,所述第三对比图像对中包括所述关键帧的果实区域图像和所述参考图像中的果实区域图像;
将所述第一对比图像对、所述第二对比图像对和所述第三对比图像对输入至所述第二特征提取模块中,获取所述第二特征提取模块输出的病虫害状态特征;
将所述作物变化特征和所述病虫害状态特征输入至所述融合模块中,获取所述融合模块输出的融合特征;
将所述融合特征输入至所述病虫害类型预测模块,获取所述病虫害类型预测模块输出的所述病虫害类型。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述作物病虫害识别方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述作物病虫害识别方法。
CN202311175744.2A 2023-09-13 2023-09-13 作物病虫害识别方法、装置、设备及介质 Active CN116935230B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311175744.2A CN116935230B (zh) 2023-09-13 2023-09-13 作物病虫害识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311175744.2A CN116935230B (zh) 2023-09-13 2023-09-13 作物病虫害识别方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN116935230A CN116935230A (zh) 2023-10-24
CN116935230B true CN116935230B (zh) 2023-12-15

Family

ID=88382829

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311175744.2A Active CN116935230B (zh) 2023-09-13 2023-09-13 作物病虫害识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN116935230B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914914A (zh) * 2020-07-21 2020-11-10 上海理想信息产业(集团)有限公司 一种病虫害的识别方法、装置、设备和存储介质
WO2021022521A1 (zh) * 2019-08-07 2021-02-11 华为技术有限公司 数据处理的方法、训练神经网络模型的方法及设备
CN112989969A (zh) * 2021-02-26 2021-06-18 清远市智慧农业农村研究院 一种作物病虫害识别方法及装置
CN113538390A (zh) * 2021-07-23 2021-10-22 仲恺农业工程学院 一种柚子病虫害的快速识别方法
WO2021217935A1 (zh) * 2020-04-29 2021-11-04 深圳壹账通智能科技有限公司 问题生成模型的训练方法、问题生成方法及其相关设备
CN114511801A (zh) * 2021-12-31 2022-05-17 广东技术师范大学 一种虫害识别模型训练方法、虫害监测方法和电子设备
CN114596468A (zh) * 2022-03-14 2022-06-07 瀚云科技有限公司 病虫害识别及模型训练方法、装置、电子设备及存储介质
CN116485796A (zh) * 2023-06-19 2023-07-25 闽都创新实验室 害虫检测方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160224703A1 (en) * 2015-01-30 2016-08-04 AgriSight, Inc. Growth stage determination system and method
US20200117897A1 (en) * 2018-10-15 2020-04-16 Walt Froloff Adaptive Artificial Intelligence Training Data Acquisition and Plant Monitoring System
US10957036B2 (en) * 2019-05-17 2021-03-23 Ceres Imaging, Inc. Methods and systems for crop pest management utilizing geospatial images and microclimate data
US20220358265A1 (en) * 2021-05-04 2022-11-10 X Development Llc Realistic plant growth modeling
US20230169416A1 (en) * 2021-12-01 2023-06-01 X Development Llc Pest distribution modeling with hybrid mechanistic and machine learning models

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021022521A1 (zh) * 2019-08-07 2021-02-11 华为技术有限公司 数据处理的方法、训练神经网络模型的方法及设备
WO2021217935A1 (zh) * 2020-04-29 2021-11-04 深圳壹账通智能科技有限公司 问题生成模型的训练方法、问题生成方法及其相关设备
CN111914914A (zh) * 2020-07-21 2020-11-10 上海理想信息产业(集团)有限公司 一种病虫害的识别方法、装置、设备和存储介质
CN112989969A (zh) * 2021-02-26 2021-06-18 清远市智慧农业农村研究院 一种作物病虫害识别方法及装置
CN113538390A (zh) * 2021-07-23 2021-10-22 仲恺农业工程学院 一种柚子病虫害的快速识别方法
CN114511801A (zh) * 2021-12-31 2022-05-17 广东技术师范大学 一种虫害识别模型训练方法、虫害监测方法和电子设备
CN114596468A (zh) * 2022-03-14 2022-06-07 瀚云科技有限公司 病虫害识别及模型训练方法、装置、电子设备及存储介质
CN116485796A (zh) * 2023-06-19 2023-07-25 闽都创新实验室 害虫检测方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孔建磊 ; 金学波 ; 陶治 ; 王小艺 ; 林森 ; .基于多流高斯概率融合网络的病虫害细粒度识别.农业工程学报.2020,(13),全文. *
杨森 ; 冯全 ; 张建华 ; 孙伟 ; 王关平 ; .基于深度学习与复合字典的马铃薯病害识别方法.农业机械学报.(07),全文. *

Also Published As

Publication number Publication date
CN116935230A (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
Adedoja et al. Deep learning based on nasnet for plant disease recognition using leave images
CN106202030B (zh) 一种基于异构标注数据的快速序列标注方法及装置
CN117009490A (zh) 基于知识库反馈的生成式大语言模型的训练方法和装置
Alimboyong et al. Classification of plant seedling images using deep learning
Montalbo et al. An Optimized Classification Model for Coffea Liberica Disease using Deep Convolutional Neural Networks
CN108121702A (zh) 数学主观题评阅方法及系统
CN111324692B (zh) 基于人工智能的主观题自动评分方法和装置
Hassan et al. Plant seedlings classification using transfer learning
CN114036281A (zh) 基于知识图谱的柑橘管控问答模块构建方法及问答系统
CN107688583A (zh) 创建用于自然语言处理装置的训练数据的方法和设备
CN109033073B (zh) 基于词汇依存三元组的文本蕴含识别方法及装置
CN115511069A (zh) 神经网络的训练方法、数据处理方法、设备及存储介质
CN109947923A (zh) 一种基于词向量的初等数学题型自动提取方法及系统
CN113516097B (zh) 一种基于改进EfficentNet-V2的植物叶片疾病识别方法
CN117076688A (zh) 基于领域知识图谱的知识问答方法及其装置、电子设备
CN112579752A (zh) 实体关系的抽取方法及装置、存储介质、电子设备
CN115223021A (zh) 一种基于视觉问答的果树全生长期农事作业决策方法
CN111553140A (zh) 数据处理方法、数据处理设备及计算机存储介质
EP3576024A1 (en) Accessible machine learning
CN113673246A (zh) 语义融合和知识蒸馏的农业实体识别方法和装置
CN114021546A (zh) 迁移语境网络的大桃生产知识开放问答方法及装置
CN116935230B (zh) 作物病虫害识别方法、装置、设备及介质
CN108763411B (zh) 一种结合短文本聚类和推荐机制的主观题批阅系统及方法
CN110472231A (zh) 一种识别法律文书案由的方法和装置
CN115795018A (zh) 一种面向电网领域的多策略智能搜索问答方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant