CN109308936B - 一种粮食作物产地的识别方法、识别装置及终端识别设备 - Google Patents

一种粮食作物产地的识别方法、识别装置及终端识别设备 Download PDF

Info

Publication number
CN109308936B
CN109308936B CN201810970400.3A CN201810970400A CN109308936B CN 109308936 B CN109308936 B CN 109308936B CN 201810970400 A CN201810970400 A CN 201810970400A CN 109308936 B CN109308936 B CN 109308936B
Authority
CN
China
Prior art keywords
matrix
grain
data
target
grain crop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810970400.3A
Other languages
English (en)
Other versions
CN109308936A (zh
Inventor
王晨羽
孙伯明
孙维昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heilongjiang Boundless Rice Agricultural Technology Co ltd
Original Assignee
Heilongjiang Boundless Rice Agricultural Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heilongjiang Boundless Rice Agricultural Technology Co ltd filed Critical Heilongjiang Boundless Rice Agricultural Technology Co ltd
Priority to CN201810970400.3A priority Critical patent/CN109308936B/zh
Publication of CN109308936A publication Critical patent/CN109308936A/zh
Application granted granted Critical
Publication of CN109308936B publication Critical patent/CN109308936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种粮食作物产地的识别方法、识别装置及终端识别设备;其中,一种粮食作物产地的识别方法,包括:提取粮食作物样本的特征数据以及所述粮食作物样本的三原色空间的归一化标量;对已给定作物种子品种的基因座数据进行分类;根据所述分类结果以及所述特征数据和所述归一化标量构建测试数据矩阵;利用土壤数据对所述测试数据矩阵进行扩展,形成目标矩阵;利用所述目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;使所述目标损失函数收敛,得到所述目标矩阵的预测值对应所述粮食作物产地;其中,所述特征数据为所述粮食作物样本的长度、宽度、胚芽长度中的一种或几种。可以解决粮食作物产地的识别的问题。

Description

一种粮食作物产地的识别方法、识别装置及终端识别设备
技术领域
本发明涉及农业领域,具体说是一种粮食作物产地的识别方法、识别装置及终端识别设备。
背景技术
目前没有粮食作物产地的识别方法,消费者购买的粮食往往是通过粮食的标签来判断产地,并不知道粮食作物的实际产地,实际产地的经营者一般也没有办法给出粮食作物产地的识别方法。
发明内容
有鉴于此,本发明提供一种粮食作物产地的识别方法、识别装置及终端识别设备,消费者购买的粮食往往是通过粮食的标签来判断产地,并不知道粮食作物的实际产地,实际产地的经营者一般也没有办法给出粮食作物产地的识别方法。
第一方面,本发明提供一种粮食作物产地的识别方法,包括:
提取粮食作物样本的特征数据以及所述粮食作物样本的三原色空间的归一化标量;
对已给定作物种子品种的基因座数据进行分类;
根据所述分类结果以及所述特征数据和所述归一化标量构建测试数据矩阵;
利用土壤数据对所述测试数据矩阵进行扩展,形成目标矩阵;
利用所述目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;
使所述目标损失函数收敛,得到所述目标矩阵的预测值对应所述粮食作物产地;
其中,所述特征数据为所述粮食作物样本的长度、宽度、胚芽长度中的一种或几种。
优选地,输入或者读取粮食作物样本图片;
计算所述粮食作物样本图片的像素点,识别所述像素点的边界点集;
利用所述边界点集计算所述粮食作物样本的特征数据。
优选地,获取或者读取所述已给定作物种子品种的基因座数据;
对所述已给定作物种子品种的基因座数据进行分类之前,利用捷径路线的残差映射公式找到主效QTL和引物区间对欧式空间的不变性。
优选地,找到所述主效QTL和所述引物区间对欧式空间的不变性后,利用所述测试数据矩阵判断是否与本次种植采取的种子基因引物RM区间一致;
若落入所述种子基因引物RM区间,则为该年种植的种子;
否则,则不是该年种植的种子;
然后,对所述该年种植的种子和所述不是该年种植的种子进行分类。
优选地,对所述土壤数据进行做线性回归,具体的方法为:
利用所述粮食作物样本土壤数据对所述测试数据矩阵进行扩展,形成估计目标矩阵;
利用线性回归得到所述估计目标矩阵的真实目标矩阵;
其中,所述土壤数据已知,包括:容重、有机质、全氮、全磷、全钾、碱解氮、速磷和速钾中的一种或几种;所述真实目标矩阵即为所述目标矩阵。
优选地,求取所述目标损失函数收敛的最小值,得到所述目标矩阵的预测值对应所述粮食作物产地;
优选地,求取所述目标损失函数收敛的最小值的方法为:
对所述目标损失函数的学习参数求导;
做梯度下降,梯度下降为0时学习完成,将此时的学习参数带回到所述目标损失函数,得到所述目标矩阵的预测值对应所述粮食作物产地。
第二方面,本发明提供一种粮食作物产地的识别装置,包括:
存储器和处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序为如上述一种粮食作物产地的识别方法,所述处理器执行所述程序时实现以下步骤:
提取粮食作物样本的特征数据以及所述粮食作物样本的三原色空间的归一化标量;
对已给定作物种子品种的基因座数据进行分类;
根据所述分类结果以及所述特征数据和所述归一化标量构建测试数据矩阵;
利用土壤数据对所述测试数据矩阵进行扩展,形成目标矩阵;
利用所述目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;
使所述目标损失函数收敛,得到所述目标矩阵的预测值对应所述粮食作物产地;
其中,所述特征数据为所述粮食作物样本的长度、宽度、胚芽长度中的一种或几种。
第三方面,本发明提供另一种粮食作物产地的识别装置,其特征在于,包括:
如上述一种粮食作物产地的识别方法;以及
提取单元;
所述提取单元与矩阵构建单元连接,所述矩阵构建单元与分类单元连接,所述分类单元与目标损失函数构建单元连接,所述目标损失函数构建单元连接,所述目标损失函数构建单元与计算单元连接;
所述提取单元,提取粮食作物样本的特征数据以及所述粮食作物样本的三原色空间的归一化标量;
所述分类单元,对已给定作物种子品种的基因座数据进行分类;
所述矩阵构建单元,根据所述分类结果以及所述特征数据和所述归一化标量构建测试数据矩阵,以及利用土壤数据对所述测试数据矩阵进行扩展,形成目标矩阵;
所述目标损失函数构建单元,利用所述目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;
所述计算单元,使所述目标损失函数收敛,得到所述目标矩阵的预测值对应所述粮食作物产地;
其中,所述特征数据为所述粮食作物样本的长度、宽度、胚芽长度中的一种或几种。
第四方面,本发明提供一种粮食作物产地的终端识别设备,包括:
如上述一种粮食作物产地的识别方法;或者,如上述一种粮食作物产地的识别装置;以及
显示单元;
所述显示单元,用于显示所述粮食作物产地。
本发明至少具有如下有益效果:
本发明提供一种粮食作物产地的识别方法、识别装置及终端识别设备,消费者购买的粮食往往是通过粮食的标签来判断产地,并不知道粮食作物的实际产地,实际产地的经营者一般也没有办法给出粮食作物产地的识别方法。
附图说明
通过以下参考附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点更为清楚,在附图中:
图1是本发明实施例的一种粮食作物产地的识别方法的流程示意图;
图2是本发明实施例的所采用的训练样本和测试样本比例直方图示意图;
图3是本发明实施例的模型训练集训练次数和训练精度直方图示意图;
图4是本发明实施例的测试集分别的训练次数和训练精度直方图示意图;
图5是本发明实施例的为损失函数下降趋势图;
图6是本发明实施例的卷积层输出的特征图分类预测样例;
图7是本发明实施例的最终真实大米分类情况。
具体实施方式
以下基于实施例对本发明进行描述,但是值得说明的是,本发明并不限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。然而,对于没有详尽描述的部分,本领域技术人员也可以完全理解本发明。
此外,本领域普通技术人员应当理解,所提供的附图只是为了说明本发明的目的、特征和优点,附图并不是实际按照比例绘制的。
同时,除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包含但不限于”的含义。
本发明技术所属领域为深度神经网络图像分类,具体内容为一种基于生物遗传学QTL定位、土壤数据和对称性改造残差网络相结合的图像分类粮食作物产地的方法。
自深度卷积神经网络模型应用于图像识别领域以来,AI在图像分类方面取得了巨大成功,但仍有两大方面的困难,即“不完全信息”与“图像噪声处理”这两个难题。在小物体分类中,尤其以图像噪声干扰最为严重。残差网络,是一种基于深度卷积神经网络的深度学习模型,优点是加入了捷径路径进行输入数据和输出数据的比照。但依旧难以解决图像质量差导致的噪声问题。在粮食作物单粒产地识别上,直接应用残差网络,准确率相对较低。提高准确率的通常做法是在数据预处理环节加入先验知识。并且在网络参数的优化及损失函数的改动方案上进行调整。
QTL“数量性状基因座”技术,它指的是控制数量性状的基因在基因组中的位置。对QTL的定位必须使用遗传标记,人们通过寻找遗传标记和感兴趣的数量性状之间的联系,将一个或多个QTL定位到位于同一染色体的遗传标记旁边。QTL定位主要是为了得到不同种子类型的稻米的长度、宽度、胚芽大小、糊粉层颜色、胚芽颜色这些基本性状的先验知识。
关于水稻性状和千粒重的QTL定位已经在文献《水稻粒型性状及千粒重的QTLs定位研究》(高璇,2015/5/28)中说明,稻米的长度、宽度和胚芽大小等性状是直接由被针对不同种子类型所定位的某些基因决定的。
土壤数据,也是间接决定种子性状的条件之一,根据文献《黑龙江不同类型土壤对水稻生长发育及产量的影响》王秋菊1,2张玉龙1*,赵宏亮2,王晓岑2,孟英2,徐东斌(1.沈阳农业大学土地与环境学院,辽宁沈阳110866;2.黑龙江省农科院耕作栽培研究所,黑龙江哈尔滨150086;黑龙江省农科院牡丹江分院157000),获得有关土壤的容重、有机质、全氮、全磷、全钾、碱解氮、速磷、速钾的数据。
在粮食作物产地识别问题上,我们利用残差网络进行对“基因座”及相应的引物RM序列的学习,将学习结果作为新数据特征保存。再依次对土壤数据进行线性回归学习。最终将整体再进行逻辑回归学习。
图1是本发明实施例的一种粮食作物产地的识别方法的流程示意图。如图1所示,一种粮食作物产地的识别方法,包括:步骤101提取粮食作物样本的特征数据以及粮食作物样本的三原色空间的归一化标量;步骤102对已给定作物种子品种的基因座数据进行分类;步骤103根据分类结果以及特征数据和归一化标量构建测试数据矩阵;步骤104利用土壤数据对测试数据矩阵进行扩展,形成目标矩阵;步骤105利用目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;步骤106使目标损失函数收敛,得到目标矩阵的预测值对应粮食作物产地;其中,特征数据为粮食作物样本的长度、宽度、胚芽长度中的一种或几种。
具体地说,输入或者读取粮食作物样本图片;计算粮食作物样本图片的像素点,识别像素点的边界点集;利用边界点集计算粮食作物样本的特征数据。
步骤101提取粮食作物样本的特征数据以及粮食作物样本的三原色空间的归一化标量为可称为训练集数据,输入或者读取粮食作物样本图片,提取作物样本图片长度L、宽度W、胚芽长度pL、R、G、B六个维度的特征。其中R、G、B为三原色空间的归一化标量。
计算粮食作物样本图片的像素点,识别所述像素点的边界点集。一般地,对于一张k×l个像素点的图片,识别所述像素点的边界点集,具体地说,使用双层卷积神经网络识别物体边界的点集为{xi,yi},点集中满足y=yi的第m个xi和第n个xi记为xim,xin,则提取粮食作物样本长度公式为:
Figure GDA0002539327440000051
同理,提取粮食作物样本宽度的公式为:
Figure GDA0002539327440000052
本发明中涉及物体(即,粮食作物样本)长度(如,胚芽长度)的提取方法均与此相同。
颜色归一化公式:所要识别的图像(即,粮食作物样本图片)I为m×n×3的三维矩阵,I的k×l×3(k<m,l<n)子阵D对于r、g、b三色各有k×l个像素,D中第i个像素的三色值分别为ri、gi、bi,提取分别归一化为:
Figure GDA0002539327440000053
因此,得到7维特征数据:Xa=(1,L,W,pL,R,G,B)。
步骤102对已给定作物种子品种的基因座数据进行分类。获取或者读取已给定作物种子品种的基因座数据;对已给定作物种子品种的基因座数据进行分类之前,利用捷径路线的残差映射公式找到主效QTL和引物区间对欧式空间的不变性。
进一步地,找到主效QTL和引物区间对欧式空间的不变性后,利用测试数据矩阵判断是否与本次种植采取的种子基因引物RM区间一致;若落入种子基因引物RM区间,则为该年种植的种子;否则,则不是该年种植的种子;然后,对该年种植的种子和不是该年种植的种子进行分类。
具体地说,根据已给定作物种子品种的数量性状基因座数据QTLs,将残差网络模型第i个卷积层参数矩阵对称化,让粮食作物样本图片经过欧式空间中的正交变换群变换后,利用残差网络模型对粮食作物样本图片进行基因分类。残差网络模型所采用优化的残差网络模型为ResNet-50,将基因分类的结果作为第8个特征维度合并入数据特征中。
第i层输入X的正交变换群公式为:X=(1+ωiα)X'。
其中X'为经过i个卷积层后的原始输入(即,粮食作物样本图片),α=0.001为保证小范围变换而设定的参数,ωi∈Rn×n是权重矩阵经过对称化的生成元:
其中wi∈Rn×n为第i层神经元的权重矩阵,默认原始输入第一卷积层的第一个卷积核为3×3全1矩阵。
残差网络公式为:Y=F(X,{ωi,wi})+X。
Y为输出向量,F(X,{wi})为待学习的残差映射。我们采用以双卷积层为单位,给出捷径路线的残差映射公式为:
F(X,{ωi+2,wi+2})=ωi+2σ(wi+2+X);
其中,σ()为ReLU函数。
之所以用对称性改造残差网络(即,捷径路线的残差映射公式),是从群论在物理中的应用迁移学习而来,希望找到主效QTL和引物区间对欧式空间的不变性,而找到这一规律,就会大大增加学习精度。
在倒数第二层(即,输出层),用SVM分类先进行主效QTL判断,这里SVM算法不多详述。主要以粒长、粒宽两项指标为主,判断出主效QTL。再用测试数据矩阵Xa=(1,L,W,pL,R,G,B,Q)判断是否与本次种植采取的种子基因引物RM区间(即,引物区间)一致。一致就是落入次种植采取的种子基因引物RM区间内,为该年种植的种子,不一致就是落入次种植采取的种子基因引物RM区间外,不是该年种植的种子。最后一层再分类时采用逻辑回归,分类出是否为该年种植的种子。将分类结果(Q=0或Q=1)作为第8维数据特征保存,即:测试数据矩阵Xa=(1,L,W,pL,R,G,B,Q)。其中,对已给定作物种子品种的基因座数据进行分类的分类方法可以利用现有的分类方法,如:聚类分类或者其他特征分类方法。
其中,Q=0不是该年种植的种子,Q=1为该年种植的种子。
若本专业技术人员对以上知识或步骤有疑问,请参考文献《作物QTL定位研究进展(周元昌陈启锋吴为人李维明)》。
第八个特征X8与残差网络第i层第j个特征图的第k个卷积核第l个参数wijkl的关系为:
Figure GDA0002539327440000071
步骤103根据分类结果以及特征数据和归一化标量构建测试数据矩阵。步骤104利用土壤数据对测试数据矩阵进行扩展,形成目标矩阵。对土壤数据进行做线性回归,具体的方法为:利用粮食作物样本土壤数据对测试数据矩阵进行扩展,形成估计目标矩阵;利用线性回归得到估计目标矩阵的真实目标矩阵;其中,土壤数据已知,包括:容重、有机质、全氮、全磷、全钾、碱解氮、速磷和速钾中的一种或几种;真实目标矩阵即为目标矩阵。
具体地说,将土壤的容重K1、有机质K2、全氮K3、全磷K4、全钾K5、碱解氮K6、速磷K7、速钾K8标签,并分别对上述7维数据做线性回归。
依旧用对称性的方法给出正则项,目标函数为:
Figure GDA0002539327440000072
其中,真实值y=(K1,K2,K3,K4,K5,K6,K7,K8)(即,已知的土壤数据),估计值
Figure GDA0002539327440000073
(即,粮食作物样本土壤数据),故
Figure GDA0002539327440000074
n组土壤数据的波动平均值
Figure GDA0002539327440000075
在目标函数中,λ为调节参数,
Figure GDA0002539327440000076
Figure GDA0002539327440000077
的期望值。
将以上通过学习得到的参数获得的8个预测值做合并入上面7维特征中,形成16维的数据集。这样每一次得到粮食作物样本图片,就会获得6维数据,经过两次学习,就会扩展为16维数据(即,目标矩阵)。即:
Xa=(1,L,W,pL,R,G,B,Q,K1,K2,K3,K4,K5,K6,K7,K8)。
步骤105利用目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;步骤106使目标损失函数收敛,得到目标矩阵的预测值对应粮食作物产地。求取目标损失函数收敛的最小值,得到目标矩阵的预测值对应粮食作物产地;求取目标损失函数收敛的最小值的方法为:对目标损失函数的学习参数求导;做梯度下降,梯度下降为0时学习完成,将此时的学习参数带回到目标损失函数,得到目标矩阵的预测值对应粮食作物产地。
具体地说,目标损失函数为:
Figure GDA0002539327440000081
导数模块为:
Figure GDA0002539327440000082
参数θ8先天规定大于其他参数,初始化值为10,其余初始化为1。
利用上面目标损失函数,做logistic回归得到结果。
做梯度下降:
Figure GDA0002539327440000083
为0,θ学习完成,得到学习参数θ,带回到目标损失函数,目标损失函数收敛到一个最小值,真实值Ytrue最接近预测值
Figure GDA0002539327440000084
其中,步长η可定为0.005。实值Ytrue是已知的粮食作物产地。
正则项
Figure GDA0002539327440000085
防止目标损失函数过拟合,tr()为求秩。γ为拟合度参数,γ的大小影响正则项在目标损失函数权重比例。
更为具体地说,在输入数据方面,输入图片(粮食作物样本图片)的尺度可为128*128,在图片(粮食作物样本图片)预处理阶段,我们采取剪裁出中间部分。采用多视角模型,对输入图像进行左上、右上、左下、右下、中间位置将粮食作物样本图片裁剪下来,并通过镜面反射得到的10张128*128图像,进而通过深度网络提取这10张图像Pi(i=1,2...,10)平均特征用于分类。
数据采集上,我们以五常胚芽米为例,我们先期采集1167粒样本,共有11670张输入图像(粮食作物样本图片)。分为五常产地和非五常产地两类。其中502条非五常产地胚芽米样本(其中包括不带胚芽的精白米100粒,非同一设备生产胚芽米234粒,不确定为同一设备生产的胚芽米共168粒,这样区分的目的在于分类细化,更加细致地寻找分类依据,不同设备加工的大米在r,g,b三色的均值上差别很大),665条五常产地胚芽米样本。图2表示,训练集和测试集的划分。
使用iphone8相机拍照的方式人工采集胚芽米图像,并确保一张图片中有且仅有一例米样,然后按照发明内容第一步进行特征提取,得到米粒长度、米粒宽度、胚芽长度,再用cv2(cv2为python语言下的opencv图像处理模块的模块名称)进行b,g,r三通道拆分。
按照步骤101提取粮食作物样本的特征数据以及粮食作物样本的三原色空间的归一化标量,进行初期特征提取。
然后步骤102对已给定作物种子品种的基因座数据进行分类,首先进行残差网络学习。参数设置采用随机批量梯度下降,批处理容量mini-batch为64;学习率base_lr从0.01开始,当错误率迭代变化低于阈值时,base_lr将乘以1/2不断下降;模型训练迭代次数max_iter为10000;惯性动量momentum=0.65;权值衰减weight_decay=0.0001。
提取所采用种子的主效QTL如下,粒长QTL:qGL-2-1,粒宽QTL:qGW-2-1,加效QTL为:qGW-2-2。胚芽长度主效QTL为空,颜色主效QTL为空。本次采取种子的主效QTL分布在RM346及RM525之间。
步骤103根据分类结果以及特征数据和归一化标量构建测试数据矩阵,将学习完的分类输出,合并到特征数据中。
步骤104利用土壤数据对测试数据矩阵进行扩展,形成目标矩阵,即:提取土壤特征(K1,K2,K3,K4,K5,K6,K7,K8)。
步骤105利用目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;步骤106使目标损失函数收敛,得到目标矩阵的预测值对应粮食作物产地。提取土壤特征(K1,K2,K3,K4,K5,K6,K7,K8)得到八个线性回归目标函数:
Figure GDA0002539327440000091
其中,λ=0.5,μ=E(X)。
得到导数为:
Figure GDA0002539327440000092
做梯度下降有:
Figure GDA0002539327440000093
本发明提供一种粮食作物产地的识别装置,包括:存储器和处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序为如上述一种粮食作物产地的识别方法,处理器执行程序时实现以下步骤。
步骤101提取粮食作物样本的特征数据以及粮食作物样本的三原色空间的归一化标量。步骤102对已给定作物种子品种的基因座数据进行分类。步骤103根据分类结果以及特征数据和归一化标量构建测试数据矩阵。步骤104利用土壤数据对测试数据矩阵进行扩展,形成目标矩阵。步骤105利用目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数。步骤106使目标损失函数收敛,得到目标矩阵的预测值对应粮食作物产地。其中,特征数据为粮食作物样本的长度、宽度、胚芽长度中的一种或几种。
本发明提供另一种粮食作物产地的识别装置,包括:如上述一种粮食作物产地的识别方法;以及提取单元;提取单元与矩阵构建单元连接,矩阵构建单元与分类单元连接,分类单元与目标损失函数构建单元连接,目标损失函数构建单元连接,目标损失函数构建单元与计算单元连接;提取单元,提取粮食作物样本的特征数据以及粮食作物样本的三原色空间的归一化标量;分类单元,对已给定作物种子品种的基因座数据进行分类;矩阵构建单元,根据分类结果以及特征数据和归一化标量构建测试数据矩阵,以及利用土壤数据对测试数据矩阵进行扩展,形成目标矩阵;目标损失函数构建单元,利用目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;计算单元,使目标损失函数收敛,得到目标矩阵的预测值对应粮食作物产地;其中,特征数据为粮食作物样本的长度、宽度、胚芽长度中的一种或几种。
本发明提供一种粮食作物产地的终端识别设备,其特征在于,包括:如上述一种粮食作物产地的识别方法;或者,如上一种粮食作物产地的识别装置和另一种粮食作物产地的识别装置;以及显示单元;显示单元,用于显示粮食作物产地。显示单元可以为显示屏或者PC或者其他终端显示设备。
图2是本发明实施例的所采用的训练样本和测试样本比例直方图示意图。共502条非五常产地胚芽米样本,665条五常产地胚芽米样本;训练集:334条非五常产地胚芽米样本,223条条五常产地胚芽米样本;测试集:168条非五常产地胚芽米样本,442条五常产地胚芽米样本。
图3是本发明实施例的模型训练集训练次数和训练精度直方图示意图。图4是本发明实施例的测试集分别的训练次数和训练精度直方图示意图。其中,训练集第1、第3、第5小时准确度分别为:74%、83%和86%;测试集第1、第3、第5小时准确度分别为:67%、72%和76%。
图5是本发明实施例的为损失函数下降趋势图。我们可以看出,该模型损失函数接近于平稳下降。损失函数曲线最高点为3.43,训练完成时收敛到0.71。
图6是本发明实施例的卷积层输出的特征图分类预测样例。包含预测两种类型的概率分布情况,台头部分为预测结果和真实结果,五常产地的大米和其他产地结果。图6的第一和第四个分类错误。
图7是本发明实施例的最终真实大米分类情况。可以看到同样样本下,上图出错的两个样本已经分类正确。
综上所述,为解决粮食作物产地没有分类,或者粮食作物产地分类问题准确率低,本发明基于以上的观点,对残差网络参数更新机制进行调整(即,捷径路线的残差映射公式),并对逻辑回归目标损失函数进行微调,加入QTL及土壤数据先验知识,形成一种数据增维的方法。提供了一种基于生物遗传学QTL定位和对称性方法优化相结合的图像识别大米产地的方法、识别装置和终端识别设备。
显然,本领域的技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路单元,或者将它们中的多个单元或步骤制作成单个集成电路单元来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述实施例仅为表达本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形、同等替换、改进等,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种粮食作物产地的识别方法,其特征在于,包括:
提取粮食作物样本的特征数据以及所述粮食作物样本的三原色空间的归一化标量;
对已给定作物种子品种的基因座数据进行分类;
根据所述分类结果以及所述特征数据和所述归一化标量构建测试数据矩阵;
利用土壤数据对所述测试数据矩阵进行扩展,形成目标矩阵;
利用所述目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;
使所述目标损失函数收敛,得到所述目标矩阵的预测值对应的所述粮食作物产地;
其中,所述特征数据为所述粮食作物样本的长度、宽度、胚芽长度中的一种或几种;
其中,所述对已给定作物种子品种的基因座数据进行分类的方法,包括:
对所述已给定作物种子品种的基因座数据进行分类之前,利用捷径路线的残差映射公式找到主效QTL和引物区间对欧式空间的不变性;
所述残差映射公式为:F(X,{ωi+2,wi+2})=ωi+2σ(wi+2+X);
其中,σ()为ReLU函数,wi+2为第i+2层神经元的权重矩阵,ωi+2为第i+2层神经元的权重矩阵经过对称化的生成元,X为第i层神经元的输入;
找到所述主效QTL和所述引物区间对欧式空间的不变性后,利用所述测试数据矩阵判断是否与本次种植采取的种子基因引物区间一致;
若落入所述种子基因引物区间,则为本次种植当年种植的种子;
否则,则不是本次种植当年种植的种子;
然后,对所述本次种植当年种植的种子和所述不是本次种植当年种植的种子进行分类。
2.根据权利要求1所述一种粮食作物产地的识别方法,其特征在于:
输入或者读取粮食作物样本图片;
计算所述粮食作物样本图片的像素点,识别所述像素点的边界点集;
利用所述边界点集计算所述粮食作物样本的特征数据。
3.根据权利要求1或2所述一种粮食作物产地的识别方法,其特征在于:
所述利用土壤数据对所述测试数据矩阵进行扩展,形成目标矩阵的具体方法,包括:
利用所述粮食作物样本土壤数据对所述所述测试数据矩阵进行扩展,形成估计目标矩阵;
利用线性回归得到所述估计目标矩阵的真实目标矩阵;
其中,所述土壤数据已知,包括:容重、有机质、全氮、全磷、全钾、碱解氮、速磷和速钾中的一种或几种;所述真实目标矩阵即为所述目标矩阵。
4.根据权利要求1或2所述一种粮食作物产地的识别方法,其特征在于:
求取所述目标损失函数收敛的最小值,得到所述目标矩阵的预测值对应的所述粮食作物产地。
5.根据权利要求4所述一种粮食作物产地的识别方法,其特征在于:
求取所述目标损失函数收敛的最小值的方法为:
对所述目标损失函数的学习参数求导;
做梯度下降,梯度下降为0时学习完成,将此时的学习参数带回到所述目标损失函数,得到所述目标矩阵的预测值对应的所述粮食作物产地。
6.一种粮食作物产地的识别装置,其特征在于,包括:
存储器和处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序执行权利要求1~5任一项所述一种粮食作物产地的识别方法,所述处理器执行所述程序时实现以下步骤:
提取粮食作物样本的特征数据以及所述粮食作物样本的三原色空间的归一化标量;
对已给定作物种子品种的基因座数据进行分类;
根据所述分类结果以及所述特征数据和所述归一化标量构建测试数据矩阵;利用土壤数据对所述测试数据矩阵进行扩展,形成目标矩阵;
利用所述目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;
使所述目标损失函数收敛,得到所述目标矩阵的预测值对应的所述粮食作物产地;
其中,所述特征数据为所述粮食作物样本的长度、宽度、胚芽长度中的一种或几种;
其中,所述对已给定作物种子品种的基因座数据进行分类的方法,包括:
对所述已给定作物种子品种的基因座数据进行分类之前,利用捷径路线的残差映射公式找到主效QTL和引物区间对欧式空间的不变性;
所述残差映射公式为:F(X,{ωi+2,wi+2})=ωi+2σ(wi+2+X);
其中,σ()为ReLU函数,wi+2为第i+2层神经元的权重矩阵,ωi+2为第i+2层神经元的权重矩阵经过对称化的生成元,X为第i层神经元的输入;
找到所述主效QTL和所述引物区间对欧式空间的不变性后,利用所述测试数据矩阵判断是否与本次种植采取的种子基因引物区间一致;
若落入所述种子基因引物区间,则为本次种植当年种植的种子;
否则,则不是本次种植当年种植的种子;
然后,对所述本次种植当年种植的种子和所述不是本次种植当年种植的种子进行分类。
7.一种粮食作物产地的识别装置,其特征在于,包括:
提取单元;
所述提取单元与矩阵构建单元连接,所述矩阵构建单元与分类单元连接,所述矩阵构建单元与目标损失函数构建单元连接,所述目标损失函数构建单元与计算单元连接;
所述提取单元,提取粮食作物样本的特征数据以及所述粮食作物样本的三原色空间的归一化标量;
所述分类单元,对已给定作物种子品种的基因座数据进行分类;
所述矩阵构建单元,根据所述分类结果以及所述特征数据和所述归一化标量构建测试数据矩阵,以及利用土壤数据对所述测试数据矩阵进行扩展,形成目标矩阵;
所述目标损失函数构建单元,利用所述目标矩阵的预测值以及已知的粮食作物产地构建目标损失函数;
所述计算单元,使所述目标损失函数收敛,得到所述目标矩阵的预测值对应的所述粮食作物产地;
其中,所述特征数据为所述粮食作物样本的长度、宽度、胚芽长度中的一种或几种;
其中,利用所述分类单元对所述已给定作物种子品种的基因座数据进行分类之前,利用捷径路线的残差映射公式找到主效QTL和引物区间对欧式空间的不变性;
所述残差映射公式为:F(X,{ωi+2,wi+2})=ωi+2σ(wi+2+X);
其中,σ()为ReLU函数,wi+2为第i+2层神经元的权重矩阵,ωi+2为第i+2层神经元的权重矩阵经过对称化的生成元,X为第i层神经元的输入;
找到所述主效QTL和所述引物区间对欧式空间的不变性后,利用所述测试数据矩阵判断是否与本次种植采取的种子基因引物区间一致;
若落入所述种子基因引物区间,则为本次种植当年种植的种子;
否则,则不是本次种植当年种植的种子;
然后,对所述本次种植当年种植的种子和所述不是本次种植当年种植的种子进行分类。
8.一种粮食作物产地的终端识别设备,其特征在于,包括:
用于执行如权利要求1~5任一项所述一种粮食作物产地的识别方法的装置,或者如权利要求6或7所述一种粮食作物产地的识别装置;以及
显示单元;
所述显示单元,用于显示所述粮食作物产地。
CN201810970400.3A 2018-08-24 2018-08-24 一种粮食作物产地的识别方法、识别装置及终端识别设备 Active CN109308936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810970400.3A CN109308936B (zh) 2018-08-24 2018-08-24 一种粮食作物产地的识别方法、识别装置及终端识别设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810970400.3A CN109308936B (zh) 2018-08-24 2018-08-24 一种粮食作物产地的识别方法、识别装置及终端识别设备

Publications (2)

Publication Number Publication Date
CN109308936A CN109308936A (zh) 2019-02-05
CN109308936B true CN109308936B (zh) 2020-09-01

Family

ID=65224064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810970400.3A Active CN109308936B (zh) 2018-08-24 2018-08-24 一种粮食作物产地的识别方法、识别装置及终端识别设备

Country Status (1)

Country Link
CN (1) CN109308936B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882500B (zh) * 2022-07-11 2022-09-16 深圳市赛泰诺生物技术有限公司 一种多功能转基因粮油智能检测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101701916A (zh) * 2009-12-01 2010-05-05 中国农业大学 一种玉米品种快速鉴定、鉴别方法
CN102473247A (zh) * 2009-06-30 2012-05-23 陶氏益农公司 用于在包含分子遗传标志物的植物和动物数据集中挖掘关联规则,继而利用由这些关联规则创建的特征进行分类或预测的机器学习方法的应用
CN103020970A (zh) * 2012-12-25 2013-04-03 北京农业信息技术研究中心 玉米果穗图像籽粒分割方法
CN104915682A (zh) * 2015-06-08 2015-09-16 浪潮集团有限公司 一种豆科种子识别系统及方法
CN105139023A (zh) * 2015-07-24 2015-12-09 福州大学 一种基于多尺度特征融合和极限学习机的种子识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1514213A2 (en) * 2002-05-20 2005-03-16 Rosetta Inpharmactis LLC. Computer systems and methods for subdividing a complex disease into component diseases

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102473247A (zh) * 2009-06-30 2012-05-23 陶氏益农公司 用于在包含分子遗传标志物的植物和动物数据集中挖掘关联规则,继而利用由这些关联规则创建的特征进行分类或预测的机器学习方法的应用
CN101701916A (zh) * 2009-12-01 2010-05-05 中国农业大学 一种玉米品种快速鉴定、鉴别方法
CN103020970A (zh) * 2012-12-25 2013-04-03 北京农业信息技术研究中心 玉米果穗图像籽粒分割方法
CN104915682A (zh) * 2015-06-08 2015-09-16 浪潮集团有限公司 一种豆科种子识别系统及方法
CN105139023A (zh) * 2015-07-24 2015-12-09 福州大学 一种基于多尺度特征融合和极限学习机的种子识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
不同产地花椒多指标综合排序及环境因子影响分析;李智杰,孙德祥,邓振义,段宏斌,廉坡;《西北林学院学报》;20061231;第21卷(第5期);正文第1.2节,表2 *
基于核型与RAPD标记的大麻地方品种遗传多样性分析;张利国,关凤芝,吴广文,房郁妍,宋宪友,徐丽珍,康庆华;《中国麻业科学》;20091231;第31卷(第3期);摘要、正文第1-2节 *
基于稀疏表示的小麦品种识别方法研究;冯丽娟;《中国优秀硕士学位论文全文数据库信息科技辑》;20160815(第8期);正文第2.3、2.4.2、2.5、3.4节 *
近红外光谱分析技术在花生原产地溯源中的应用;张龙,潘家荣,朱诚;《食品科学》;20131231;第34卷(第6期);摘要、正文第3节 *

Also Published As

Publication number Publication date
CN109308936A (zh) 2019-02-05

Similar Documents

Publication Publication Date Title
DeChant et al. Automated identification of northern leaf blight-infected maize plants from field imagery using deep learning
Lu et al. Generative adversarial networks (GANs) for image augmentation in agriculture: A systematic review
Altuntaş et al. Identification of haploid and diploid maize seeds using convolutional neural networks and a transfer learning approach
CN110148120B (zh) 一种基于cnn与迁移学习的病害智能识别方法及系统
CN109685115B (zh) 一种双线性特征融合的细粒度概念模型及学习方法
Zhou et al. Wheat ears counting in field conditions based on multi-feature optimization and TWSVM
CN111553240B (zh) 一种玉米病害病情分级方法、系统和计算机设备
CN110222215B (zh) 一种基于f-ssd-iv3的作物害虫检测方法
US20230139567A1 (en) Multi-modal methods and systems
CN106228185A (zh) 一种基于神经网络的通用图像分类识别系统及方法
WO2023217290A1 (zh) 基于图神经网络的基因表型预测
Jubery et al. Using machine learning to develop a fully automated soybean nodule acquisition pipeline (snap)
Ninomiya High-throughput field crop phenotyping: current status and challenges
CN112288022B (zh) 一种基于ssd算法的特征融合的粮虫识别方法和识别系统
CN112749675A (zh) 一种基于卷积神经网络的马铃薯病害识别方法
Zhang et al. Deep learning based rapid diagnosis system for identifying tomato nutrition disorders
CN109308936B (zh) 一种粮食作物产地的识别方法、识别装置及终端识别设备
Liu et al. Tomato detection based on convolutional neural network for robotic application
Dubey et al. An efficient adaptive feature selection with deep learning model-based paddy plant leaf disease classification
CN110853072B (zh) 基于自引导推理的弱监督图像语义分割方法
Kolhar et al. Phenomics for Komatsuna plant growth tracking using deep learning approach
CN116188855A (zh) 多尺度的植物病害识别方法、设备、存储介质及装置
CN113780335B (zh) 一种小样本商品图像分类方法、装置、设备及存储介质
CN115393631A (zh) 基于贝叶斯层图卷积神经网络的高光谱图像分类方法
Hamila et al. Fusarium head blight detection, spikelet estimation, and severity assessment in wheat using 3D convolutional neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant