CN105372202B - 转基因棉花品种识别方法 - Google Patents
转基因棉花品种识别方法 Download PDFInfo
- Publication number
- CN105372202B CN105372202B CN201510706448.XA CN201510706448A CN105372202B CN 105372202 B CN105372202 B CN 105372202B CN 201510706448 A CN201510706448 A CN 201510706448A CN 105372202 B CN105372202 B CN 105372202B
- Authority
- CN
- China
- Prior art keywords
- particle
- support vector
- vector machines
- perception
- formula
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种转基因棉花识别方法,在波长150um~3mm范围内,采集转基因棉花种子样本的太赫兹光谱信息;将所述转基因棉花种子样本的太赫兹光谱信息与动态自适应粒子群算法结合,利用自适应动态粒子群算法优化和训练支持向量,并建立支持向量机的识别模型;然后利用建好的所述识别模型,对待测样品进行类别判定,得到识别结果。本发明通过采用太赫兹光谱检测,结合基于动态自适应粒子群优化的支持向量机,建立了转基因棉种子的识别模型。该模型对转基因棉种子类别的识别率达97.3%,为定性分析模型在实际样品检测中的应用奠定了基础。为转基因产品的检测提供了一种精确、快速、简便、无损的方法。
Description
技术领域
本发明涉及植物品种识别技术,具体涉及一种基于太赫兹时域光谱和DAPSO-SVM的转基因棉花品种识别方法。
背景技术
随着转基因技术的普及以及转基因产品的推广,转基因产品安全检测和安全评价得到了广泛的重视。目前,检测转基因食品的分子鉴定手段是主要是PCR,虽然该方法有灵敏度高的特点,但是该方法需要国际标准的转基因标准品进行检测,给转基因产品检测带来不便,可见/远红外光谱在对转基因产品进行检测时会带来优化参数难以确定及光谱数据计算量大的问题。故而,需要开发新的检测手段作为补充。
太赫兹通常是指频率在0.1Tz-10THz(波长在30um-3mm)之间的电磁波,其波段在微波与红外光之间,属于远红外波段。理论研究表明,大量生物分子(DNA,蛋白质等)的振动和转动能级正好处于THz的频带范围内,用THz时域光谱技术(THz-TDS)探测生物样品能产生共振吸收峰,从而使利用太赫兹光谱识别生物样品将成为可能。目前近红外光谱在转基因中的应用已经相当广泛,例如近红外光谱在转基因玉米检测识别中的应用,近红外光谱技术在检测转基因油菜籽中芥酸和硫甙上的应用,利用可见/近红外光谱分析技术鉴别转基因番茄叶等。然而在国内外,利用太赫兹鉴别转基因食品的应用几乎没有,所以利用太赫兹光谱鉴别转基因食品具有重要的理论和现实意义。
发明内容
因此,针对上述的问题,本发明提出一种基于太赫兹时域光谱和DAPSO-SVM(Dynamic Adaptive Particle Swarm Optimization and Support Vector Machine)的转基因棉花识别方法,精确快速的识别出转基因作物种子。
为了解决上述技术问题,本发明采用以下技术方案。转基因棉花识别方法,其步骤包括:
步骤一:在波长150um~3mm(也即频率为0.1THz-2THz)范围内,采集转基因棉花种子样本的太赫兹光谱信息;
步骤二:将所述转基因棉花种子样本的太赫兹光谱信息与动态自适应粒子群算法结合,利用自适应动态粒子群算法优化和训练支持向量,并建立支持向量机(SVM,SupportVector Machine)的识别模型;然后利用建好的所述识别模型,对待测样品进行类别判定,得到识别结果;
所述类别判定是将待测物质的太赫兹光谱的特征信息跟所述识别模型的类别数据库进行比对;
所述支持向量机描述如下:
式中ω为惯性权重,ξ为松弛系数,γ为惩罚系数;
所述支持向量机,其参数为采用自适应动态过程进行优化的基于动态自适应粒子群优化。
所述动态自适应粒子群优化的算法包括:加入感知能力,使粒子群获得感知外部环境变化的能力;在感知到环境变化后,采用感知粒子和粒子速度的响应方式对粒子群进行更新,以适应实际动态环境;且感知能力是通过自适应函数来实现,其公式如下:
其中,pij(k)为粒子群算法第k次迭代过程中局部最优解,pij*(k)为粒子群算法k次迭代后的局部最优解的最小值;,b=pij(k)×k,
所述采用感知粒子和粒子速度的响应方式对粒子群进行更新的机制是通过更新初始化感知粒子和粒子速度对粒子群进行更新,更新的判别条件是当F>FT时,
感知粒子更新公式为:xij(t)=rand(M)×xmax;
粒子速度更新公式为:vij(t)=rand(M)×vmax;
其中,rand(m)为m维向量,vmax为感知粒子最大速度,一般取vmax=xmax;当F>FT,将当前更新的感知粒子和粒子速度,代入粒子群公式中,重新计算下一个感知粒子和粒子速度。
所述动态自适应粒子群优化的算法,其具体步骤如下:
1)在可行域空间内,把粒子群分为n1均匀子空间;在每个子空间内,随机选择n2个感知粒子进行初始化,共产生n1×n2个感知粒子;
2)初始化参数包括:惯性权重ω,松弛系数ξ,惩罚系数γ,学习因子c1,c2,动态响应触发阈值FT;
惯性权重
其中:学习因子分别为:c1=1.5、c2=1.7;
式中:γ为支持向量机的惩罚系数,为常数,需要用到动态自适应粒子群算法进行优化获得;ξ为支持向量机松弛系数,当0≤ξ≤1时,支持向量机对样本进行正确分类,当ξ>1时,支持向量机对样本停止进行分类;
3)根据适应度函数计算每个感知粒子的适应度,计算局部最优和全局最优;其中,适应度函数如下:
式中:pij(k)为第k次迭代过程中局部最优解;pij*(k)为第k次迭代过程中的局部最优解的最小值;b=pij(k)×k;
4)按下面两式迭代产生新感知粒子群,并计算适应度值:
vij(t+1)=ωvij(t)+c1r1j(t)(pij(t)-xij(t))+c2r2j(t)(pgj(t)-xij(t));
xij(t+1)=xij(t)+vij(t+1);
5)把新感知粒子群的适应度值同局部最优值进行比较,更新局部最优值;如果所述适应度值优于所述局部最优值,则用所述适用度值取代所述局部最优值;
所述局部最优值由个体局部最优值和群体局部最优值组成;
6)计算并判断F,若F>FT,则按比例更新粒子群及粒子速度,转步骤3),当满足结束条件时,则结束算法。
所述动态自适应粒子群优化的算法,其内容是:利用粒子感知外部环境的变化,将可行域空间分为n1个均匀的子空间,在每个子空间内随机抽取n2个粒子作为感知粒子进行初始化,在迭代过程中计算感知粒子的适应度fi,并比较相邻2次迭代的适应度差值Δf,然后对所适应度差值求和F,公式如下:
Δfi=fi(k+1)-fi(k);
在上式中,如果F≠0,则表明外部环境已发生变化,此时应设定一个响应阈值FT,当F>FT时触发响应,更新机制为按一定方式重新初始化感知粒子和粒子速度,描述如下:
其中,rand(M)为M维向量;V(i)=[Vi1,Vi2,…,Vim],X(i)=[Xi1,Xi2,…,Xim]表示从粒子群中选出的重新进行初始化的第i个感知粒子,m表示维数;Vmax为感知粒子最大速度,一般取Vmax=Xmax。
所述支持向量机(DAPSO-SVM)的算法,包括如下内容:
1)获取的样品的太赫兹光谱数据,把所有样品的太赫兹光谱数据分成n份,将其中k份用来作为训练数据;
2)读取训练样本的太赫兹数据,随机产生一组{γ,ξ},即xij(t)的空间坐标值,作为粒子的初始位置,训练支持向量机;其中,
式中:pij(k)为粒子群算法第k次迭代过程中局部最优解,pij*(k)为粒子群算法k次迭代后的局部最优解的最小值;b=pij(k)×k;
3)根据粒子的初始化位置,计算粒子的适应值,如果粒子适应值优于个体极值pij(t),则pij(t)被粒子的适应值fi(k)取代;如果粒子适应度优于全局极值pgj(t),pgj(t)被粒子的适应值fi(k)取代;其中pgj(t)是全局极值,pgj(t)=min{pij(t)};
4)根据公式(1)和(2),利用步骤3)得到的pij(t)和pgj(t)来更新粒子速度和位置;
vij(t+1)=ωvij(t)+c1r1j(t)(pij(t)-xij(t))+c2r2j(t)(pgj(t)-xij(t)); (1)
xij(t+1)=xij(t)+vij(t+1); (2)
5)根据粒子适应值不同采取自适应动态调整策略,按照惯性权重公式调整惯性权重,转向步骤3);惯性权重公式:
其中c1和c2为学习因子,n1和n2定义如下:在可行域空间内,把粒子群分为n1均匀子空间,在每个子空间内随机选择n2个感知粒子进行初始化,共产生n1×n2个感知粒子;
6)判断支持向量机训练误差是否为0,如果为0,则转向步骤8),否则执行步骤7);
7)根据粒子适应值的采取动态自适应调整策略,按照公式调整惯性权重,转向步骤2);
8)寻优过程结束,输出最优{γ,ξ};
9)根据输出的最优{γ,ξ},建立支持向量机识别模型。
所述学习因子c1=1.5、c2=1.7。
上述步骤中,步骤一采集待测物质的太赫兹光谱,步骤二结合步骤一的太赫兹光谱和动态自适应粒子群算法,优化支持向量机来建立样品的识别模型,进而建立识别模型的类别数据库,在具体进行识别时,将待测物质的太赫兹光谱的特征信息跟识别模型的类别数据库进行比对,即可获知该待测物质属于哪一类,获得识别结果。上述过程简单易行,具有很好的可行性。
其中,支持向量机实现的基本思想是在初始阶段选择一个非线性变换方法,将输入向量由低维非线性样本空间映射到高维或无穷维,使样本空间的非线性分类转化为线性分类,并基于结构风险最小化,在特征空间中寻找最优超平面,解决线性分类问题。支持向量机描述如下:
式中ω为惯性权重,ξ为松弛系数,γ为惩罚系数。
其中,支持向量机大量应用于目前基于可见光/近红外光谱的转基因产品检测,其检测过程中,经常遇到支持向量机建模中参数难以确定及光谱数据计算量过大的问题。本发明为解决该问题,对支持向量机进行改进,对现有的支持向量机的参数采用一个自适应动态过程进行优化,实现一种基于动态自适应粒子群优化的支持向量机(DAPSO-SVM),也即,本发明的步骤二的支持向量机,是基于动态自适应粒子群优化的支持向量机,下面具体介绍该基于动态自适应粒子群优化的支持向量机。
粒子群优化算法是由Eberhart博士和Kennedy博士于1995年提出的一种进化计算技术。源于对鸟群捕食行为的研究。其基本思想是通过群体中个体之间的信息传递及信息共享来寻找最优解。其经典算法如下所示:
vij(t+1)=ωvij(t)+c1r1j(t)(pij(t)-xij(t))+c2r2j(t)(pgj(t)-xij(t)); (1)
xij(t+1)=xij(t)+vij(t+1); (2)
式中i=1,2,…,M,M是该群体中粒子的总数,i表示第几个粒子;j表示微粒的第j维,即算法所优化的第j个参数;ω为惯性权重因子,其值为负,值的大小影响整体寻优能力;t表示此时优化的代数;vij(t)表示t时刻粒子i在j维的空间速度;c1和c2为加速因子,通常在0-2间取值;r1j和r2j为两个之间变化的相对独立的随机函数;pij(t)为粒子i的历史最优解(个体最优)的j维值,即单个粒子i在所优化的第j个参数中的历史最优解;pgj(t)=min{pij(t)}为所有粒子在t时刻的历史最优解(群体最优)的j维值,即所有粒子在所优化的第j个参数中的历史最优解;xij(t)为t时刻粒子i在j维空间位置。
粒子群优化算法是通过粒子跟踪自身记忆的个体最优向种群记忆的全局最优靠近以逐渐逼近更优位置。但在动态环境下,记忆的个体最优位置和全局最优位置对应的适应度值是变化,粒子重新将再次对先前环境进行寻优,算法将可能陷入死循环。因此,普通的粒子群优化算法难以在实际环境下有效逼近最优位置。为了在动态环境下取得最优解,本发明对粒子群算法进行了改进,形成了一种新的优化算法--动态自适应粒子群优化算法。
动态自适应粒子群优化的算法,其改进内容包括:(1)加入感知能力,使粒子群获得感知外部环境变化的能力;(2)引入更新机制,在感知到环境变化后,采用某种响应方式对粒子群进行更新,以适应实际动态环境。其中,感知能力是通过自适应函数来实现的,自适应函数的公式如下:
其中,pij(k)为第k次迭代过程中局部最优解,pij*(k)为第k次迭代过程中的局部最优解的最小值,b=pij(k)×k,
更新机制是通过更新初始化感知粒子和粒子速度,更新的判别条件是当F>FT时,
感知粒子更新公式为:xij(t)=rand(M)×xmax
粒子速度更新公式为:vij(t)=rand(M)×vmax
其中,rand(m)为m维向量,vmax为感知粒子最大速度,一般取vmax=xmax。当F>FT,将当前更新的感知粒子和粒子速度,然后代入经典的粒子群公式中重新计算下一个感知粒子和粒子速度。
基于动态自适应粒子群优化的支持向量机,与普通的支持向量机比起来,其迭代较少的次数即可达到最优解。
本发明通过采用太赫兹光谱检测,结合基于动态自适应粒子群优化的支持向量机(DAPSO-SVM),建立了转基因棉种子的识别模型。该模型对转基因棉种子类别的识别率达97.3%,为定性分析模型在实际样品检测中的应用奠定了基础。该方法为转基因产品的检测提供了一种精确、快速、简便、无损的方法。
附图说明
图1为三种转基因棉种子及参考信号THz时域光谱图;
图2为三种转基因棉种子及参考信号THz频域光谱图;
图3为三种转基因棉种子THz吸收峰光谱图;
图4为PSO-SVM与DAPSO-SVM迭代次数与适应度值关系曲线;
图5为PSO-SVM方法对三种样品的识别结果对比;
图6为DAPSO-SVM方法对三种样品的识别结果对比。
具体实施方式
现结合附图和具体实施方式对本发明进一步说明。参见图1至图6。
为了验证并说明本发明的发明内容,使用太赫兹光谱检测系统对165个转基因棉种子样本进行光谱扫描,并采用基于动态自适应粒子群优化的支持向量机分类对得到的数据进行建模,实现了转基因棉种子种类的识别,取得了良好的效果,结果令人满意。本发明提供的方法具有精确、快速、简便、无损等优点,对实际生活中的转基因棉种子检测有较高的指导意义和应用价值。
本发明针对目前转基因产品检测是基于可见光/近红外光谱,在支持向量机建模中参数难以确定及光谱数据计算量过大的问题,提出了一种基于太赫兹时域光谱和动态自适应粒子群优化的支持向量机算法,用于建立对转基因棉种子品种的分类判别。本发明的思路是,为实现转基因棉种子的分类识别,在波长150um-3mm范围内采集三种最新转基因棉种子165个样本的太赫兹光谱。并用基于动态自适应粒子群优化的支持向量机对165个转基因棉种子进行识别。实验结果表明,综合识别率达到97.3%,太赫兹光谱结合动态自适应粒子群支持向量机可为转基因棉种子类型辨别提供一种精确、快速、简便、无损检测方法。
下面结合转基因棉种子的检测,来介绍本发明。
一、实验部分
1.1实验样品
选取不同种类的转基因棉种子(本实施例中,选取的陆中6号、鑫秋k638、鲁棉研36号,均购于中国农业科学生物技术研究所)。分别将每种转基因棉种子制作成55个片剂,3种转基因棉种子产生165个样品,将165个转基因棉种子样品分为两组,第一组90个样品作为训练集用于自适应粒子群支持向量机建模校正;第二组75个样品作为预测集用于待判样品的预测,并保证3类转基因在训练集和预测集中都存在。
1.2实验仪器及方法
本发明所用的THz-TDS系统为Z3透射式太赫兹时域光谱系统。激光器的中心波长为800nm,为保证实验的准确性,系统内注入氮气直至内部相对湿度达到0.2%以下。室内相对湿度为25%,恒温292K。
将不同种类转基因棉种子分别去壳,烘干后碾压成粉末,然后用压片机对转基因棉种子粉末进行压片,制作165个待测样品。
二、数据处理方法
2.1支持向量机
支持向量机(SVM,Support Vector Machine)实现的基本思想是在初始阶段选择一个非线性变换方法,将输入向量由低维非线性样本空间映射到高维或无穷维,使样本空间的非线性分类转化为线性分类,并基于结构风险最小化在特征空间中寻找最优超平面,解决线性分类问题。
SVM被其描述为:
式中ω为惯性权重,ξ为松弛系数,γ为惩罚系数。
2.2粒子群优化算法
粒子群优化算法是由Eberhart博士和Kennedy博士于1995年提出的一种进化计算技术。源于对鸟群捕食行为的研究。其基本思想是通过群体中个体之间的信息传递及信息共享来寻找最优解。其经典算法如下所示:
vij(t+1)=ωvij(t)+c1r1j(t)(pij(t)-xij(t))+c2r2j(t)(pgj(t)-xij(t))
xij(t+1)=xij(t)+vij(t+1)
式中i=1,2,…,M,M是该群体中粒子的总数,i表示第几个粒子;j表示微粒的第j维,即算法所优化的第j个参数;ω为惯性权重因子,其值为负,值的大小影响整体寻优能力;t表示此时优化的代数;vij(t)表示t时刻粒子i在j维的空间速度;c1和c2为加速因子,通常在0-2间取值;r1j和r2j为两个之间变化的相对独立的随机函数;pij(t)为粒子i的历史最优解(个体最优)的j维值,即单个粒子i在所优化的第j个参数中的历史最优解;pgj(t)=min{pij(t)}为所有粒子在t时刻的历史最优解(群体最优)的j维值,即所有粒子在所优化的第j个参数中的历史最优解;xij(t)为t时刻粒子i在j维空间位置。
2.3动态自适应粒子群优化算法
粒子群优化算法是通过粒子跟踪自身记忆的个体最优向种群记忆的全局最优靠近以逐渐逼近更优位置。但在动态环境下,记忆的个体最优位置和全局最优位置对应的适应度值是变化,粒子重新将再次对先前环境进行寻优,算法将可能陷入死循环。因此,普通粒子群算法难以在实际环境下有效逼近最优位置。
为了在动态环境下取得最优解,本发明对粒子群算法进行了改进:(1)加入感知能力,使粒子群获得感知外部环境变化的能力;(2)引入更新机制,在感知到环境变化后,采用某种响应方式对粒子群进行更新,以适应实际动态环境。其思想是利用粒子感知外部环境是否发生变化,将可行域空间分为n1个均匀的子空间,在每个子空间内随机抽取n2个粒子作为感知粒子进行初始化,在迭代过程中计算感知粒子的适应度fi,并比较相邻2次迭代的适应度差值Δf,然后对所适应度差值求和F,公式如下:
Δfi=fi(k+1)-fi(k)
在上式中,如果F≠0,则表明外部环境已发生变化,此时应设定一个响应阈值FT,当F>FT时触发响应,更新机制为按一定方式重新初始化感知粒子和粒子速度,描述如下:
其中,rand(M)为M维向量;V(i)=[Vi1,Vi2,…,Vim],X(i)=[Xi1,Xi2,…,Xim]表示从粒子群中选出的重新进行初始化的第i个感知粒子,m表示维数;Vmax为感知粒子最大速度,一般取Vmax=Xmax。
三、结果与讨论
3.1转基因棉种子品种的太赫兹光谱识别
研究表明大多数分子振动频率都在太赫兹频段内,主要表现在分子的低频集体振动模式,其位置和强度与分子机构、所处的环境及分子间相互作用等因素有关。对于不同转基因棉种子其内部分子结构不一样可以表现为太赫兹时域及频域响应的差异,如图1、2所示。图3为3类转基因棉种子在太赫兹下的特征吸收峰,从图3中可以看出三中转基因棉种子均呈现出独特的吸收峰,其中鲁研棉36号的吸收峰位于在0.57THz、0.80THz、0.98THz;鑫秋638号的吸收峰位于0.57THz、0.75THz、0.94THz;新陆中6号的吸收峰位于0.55THz。由此,本发明可以根据不同转基因棉种子呈现出的不同吸收峰对转基因棉种子进行区分。
3.2DAPSO-SVM模型的优化
动态自适应粒子(DAPSO)的算法思想如下:
(1)在可行域空间内,把粒子群分为n1均匀子空间,在每个子空间内随机选择n2个感知粒子进行初始化,共产生n1×n2个感知粒子。
(2)初始化参数:惯性权重ω,松弛系数ξ,惩罚系数γ,学习因子c1,c2,动态响应触发阈值FT。
(3)根据适应度函数计算每个感知粒子的适应度,计算局部最优和全局最优。
(4)按式1和2迭代产生新感知粒子群,并计算适应度值。
(5)把新粒子群的适应度值同个体局部最优值,群体局部最优值比较,更新个体局部最优值和群体局部最优值。
(6)计算并判断F,若F>FT,则按比例更新粒子群及粒子速度,转步骤(3),当满足结束条件时,则结束算法。
动态自适应粒子群优化的支持向量机(DAPSO-SVM)思想如下:
(1)获取的样品的太赫兹光谱数据,把所有样品的太赫兹光谱数据分成n份,将其中k份用来作为训练数据。
(2)读取训练样本的太赫兹数据,随机产生一组{γ,ξ}(即xij(t)的空间坐标值)作为粒子的初始位置,训练支持向量机。
(3)根据粒子的初始化位置,计算粒子的适应值,如果粒子适应值优于个体极值pij(t),则pij(t)被粒子的适应值fi(k)取代;如果粒子适应度优于全局极值pgj(t),pgj(t)被粒子的适应值fi(k)取代。
(4)利用新的pij(t)和pgj(t)更新粒子速度和位置。
(5)根据粒子适应值不同采取自适应动态调整策略,按照惯性权重公式调整惯性权重,转向步骤(3)。
(6)判断算法是否满足终止条件(终止条件应根据实实际情况来定,例如可以选择终止条件为当训练误差率小于1.5%时终止算法),若满足转向步骤(8),否则执行步骤(7)。
(7)根据粒子适应值不同采取不同的动态自适应调整策略调整惯性权重,转向步骤(2)。
(8)若满足终止条件,寻优过程结束,输出最优{γ,ξ}。
(9)根据输出的最优{γ,ξ},建立支持向量机识别模型。
图4给出了通过PSO-SVM(Particle Swarm Optimization and Support VectorMachine)和DAPSO-SVM(Dynamic Adaptive Particle Swarm Optimization and SupportVector Machine)优化支持向量机得到的粒子群迭代次数与适应度值关系曲线对比图。从图可见,DAPSO模型在粒子群进化到50代后可达到其最优解,PSO-SVM模型要迭代100次才达到最优解。其具体的参数值及分类正确率,见表1所示。
表1:PSO-SVM与DAPSO各参数对比
3.3判别分析
将3类转基因棉种子的165个样本分成2组,第一组90个作为训练集,第二组75个作为训练集,并保证每类转基因棉种子的30个样本在训练集中,25个样本在预测集中,如表2所示。表3、表4给出了两种不同方法对转基因棉花的分类结果。从表中可以看出PSO-SVM对转基因棉种子的综合识别率为89.3%,DAPSO对转基因棉种子的综合识别率为97.3%.由此可以证明该方法可有效地识别转基因类别。
表2:实验样品表
种类 | 训练集 | 测试集 |
鲁研棉36号 | 30 | 25 |
鑫秋k638号 | 30 | 25 |
新陆中6号 | 30 | 25 |
表3:PSO-SVM模型对样品训练集和测试集的识别情况
表4:DAPSO模型对样品训练集和测试集的识别情况
为了更加直观的比较PSO-SVM和DAPSO-SVM模型的识别结果,图5和图6分别给出了两种方法对三种类别的样品的识别结果二维图,从图中可以看出,PSO-SVM方法中三种类别的样品都出现了不同程度的误判,而DAPSO-SVM方法只对鲁棉研36号出现少量误判,对其他两种类别的样品(鑫秋k638号、新陆中6号)识别率达到了100%,由此可以得出本文提出的方法能够有效对转基因样品进行鉴别。
四、结论
通过太赫兹时域光谱检测,结合DAPSO-SVM,建立了转基因棉种子品种的识别模型。结果表明,该模型对转基因棉种子总的识别率达97.3%,为定性分析模型在实际样品检测中的应用奠定了基础。该方法为转基因产品的检测提供了一种精确、快速、简便、无损的方法,对实际生活中出现的转基因产品检测有一定的指导意义。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。
Claims (6)
1.转基因棉花识别方法,其特征在于,其步骤包括:
步骤一:在波长150um~3mm范围内,采集转基因棉花种子样本的太赫兹光谱信息;
步骤二:将所述转基因棉花种子样本的太赫兹光谱信息与动态自适应粒子群算法结合,利用自适应动态粒子群算法优化和训练支持向量,并建立支持向量机的识别模型;然后利用建好的所述识别模型,对待测样品进行类别判定,得到识别结果;
所述类别判定是将待测物质的太赫兹光谱的特征信息跟所述识别模型的类别数据库进行比对;
所述支持向量机描述如下:
式中表示最优分类面,Jp(ω,ξ)为最优分类面函数,k表示粒子群算法第k次迭代,T为转置符号,ωT表示ω的转置,为线性辨别函数,b=pij(k)×k,pij(k)为粒子群算法第k次迭代过程中局部最优解,为可分的训练样本函数,ω为惯性权重,ξ为支持向量机松弛系数,γ为支持向量机的惩罚系数;
所述支持向量机,其参数为采用动态自适应粒子群算法进行优化;所述支持向量机的算法,包括如下内容:
1)获取的样品的太赫兹光谱数据,把所有样品的太赫兹光谱数据分成n份,将其中k份用来作为训练数据;
2)读取训练样本的太赫兹数据,随机产生一组{γ,ξ},即xij(t)的空间坐标值,作为粒子的初始位置,训练支持向量机;其中,ξ为支持向量机松弛系数,γ为支持向量机的惩罚系数,
式中:pij(k)为粒子群算法第k次迭代过程中局部最优解,pij*(k)为粒子群算法k次迭代后的局部最优解的最小值;b=pij(k)×k;
3)根据粒子的初始化位置,计算粒子的适应值,如果粒子适应值优于个体极值,即粒子i在所优化的第j个参数中的历史最优解pij(t),则pij(t)被粒子的适应值fi(k)取代;如果粒子适应度优于全局极值,即所有粒子在所优化的第j个参数中的历史最优解pgj(t),那么pgj(t)被粒子的适应值fi(k)取代;其中pgj(t)=min{pij(t)};
4)根据公式(1)和(2),利用步骤3)得到的pij(t)和pgj(t)来更新粒子速度和位置;
vij(t+1)=ωvij(t)+c1r1j(t)(pij(t)-xij(t))+c2r2j(t)(pgj(t)-xij(t));(1)
xij(t+1)=xij(t)+vij(t+1);(2)
式中vij(t)表示t时刻粒子i在j维的空间速度;vij(t+1)表示t+1时刻粒子i在j维的空间速度;r1j(t)和r2j(t)为[0,1]之间变化的两个相对独立的随机数;pij(t)为粒子i在所优化的第j个参数中的历史最优解;pgj(t)=min{pij(t)}为所有粒子在所优化的第j个参数中的历史最优解;xij(t)为t时刻粒子i在j维空间位置;xij(t+1)为t+1时刻粒子i在j维空间位置;
5)根据粒子适应值不同采取自适应动态调整策略,按照惯性权重公式调整惯性权重,转向步骤3);惯性权重公式:其中c1和c2为学习因子,n1和n2定义如下:在可行域空间内,把粒子群分为n1均匀子空间,在每个子空间内随机选择n2个感知粒子进行初始化,共产生n1×n2个感知粒子;
6)判断支持向量机训练误差是否为0,如果为0,则转向步骤8),否则执行步骤7);
7)根据粒子适应值的采取动态自适应调整策略,按照公式调整惯性权重,转向步骤2);
8)寻优过程结束,输出最优{γ,ξ};
9)根据输出的最优{γ,ξ},建立支持向量机识别模型。
2.根据权利要求1所述的转基因棉花识别方法,其特征在于,所述动态自适应粒子群优化的算法包括:加入感知能力,使粒子群获得感知外部环境变化的能力;在感知到环境变化后,采用感知粒子和粒子速度的响应方式对粒子群进行更新,以适应实际动态环境;且感知能力是通过自适应函数来实现,其公式如下:
其中,pij(k)为粒子群算法第k次迭代过程中局部最优解,pij*(k)为粒子群算法k次迭代后的局部最优解的最小值;b=pij(k)×k,
3.根据权利要求2所述的转基因棉花识别方法,其特征在于,所述采用感知粒子和粒子速度的响应方式对粒子群进行更新的机制是通过更新初始化感知粒子和粒子速度对粒子群进行更新,更新的判别条件是当F>FT时,
感知粒子更新公式为:xij(t)=rand(M)×xmax;
粒子速度更新公式为:vij(t)=rand(M)×vmax;
其中,FT为动态响应触发阈值,F为适应度差值求和Δf为相邻两次迭代的适应度差值,rand(M)为M维向量,vmax为感知粒子最大速度,xmax为感知粒子最大位置,xij(t)为t时刻粒子i在j维空间位置,vij(t)表示t时刻粒子i在j维的空间速度,vmax=xmax;当F>FT,将当前更新的感知粒子和粒子速度,代入粒子群公式中,重新计算下一个感知粒子和粒子速度。
4.根据权利要求1所述的转基因棉花识别方法,其特征在于,所述动态自适应粒子群优化的算法,其具体步骤如下:
1)在可行域空间内,把粒子群分为n1均匀子空间;在每个子空间内,随机选择n2个感知粒子进行初始化,共产生n1×n2个感知粒子;
2)初始化参数包括:惯性权重ω,支持向量机松弛系数ξ,支持向量机的惩罚系数γ,学习因子c1,c2,动态响应触发阈值FT;
惯性权重
其中:学习因子分别为:c1=1.5、c2=1.7;
式中:γ为支持向量机的惩罚系数,为常数,需要用到动态自适应粒子群算法进行优化获得;ξ为支持向量机松弛系数,当0≤ξ≤1时,支持向量机对样本进行正确分类,当ξ>1时,支持向量机对样本停止进行分类;
3)根据适应度函数计算每个感知粒子的适应度,计算局部最优和全局最优;其中,适应度函数如下:
式中:pij(k)为第k次迭代过程中局部最优解;pij*(k)为第k次迭代过程中的局部最优解的最小值;b=pij(k)×k;
4)按下面两式迭代产生新感知粒子群,并计算适应度值:
vij(t+1)=ωvij(t)+c1r1j(t)(pij(t)-xij(t))+c2r2j(t)(pgj(t)-xij(t));
xij(t+1)=xij(t)+vij(t+1);
式中,vij(t)表示t时刻粒子i在j维的空间速度;vij(t+1)表示t+1时刻粒子i在j维的空间速度;r1j(t)和r2j(t)为[0,1]之间变化的两个相对独立的随机数;pij(t)为粒子i在所优化的第j个参数中的历史最优解;pgj(t)=min{pij(t)}为所有粒子在所优化的第j个参数中的历史最优解;xij(t)为t时刻粒子i在j维空间位置;xij(t+1)为t+1时刻粒子i在j维空间位置;
5)把新感知粒子群的适应度值同局部最优值进行比较,更新局部最优值;如果所述适应度值优于所述局部最优值,则用所述适应 度值取代所述局部最优值;
所述局部最优值由个体局部最优值和群体局部最优值组成;
6)计算并判断F,若F>FT,其中FT为动态响应触发阈值,F为适应度差值求和则按比例更新粒子群及粒子速度,转步骤3),当满足结束条件时,则结束算法。
5.根据权利要求1所述的转基因棉花识别方法,其特征在于,所述动态自适应粒子群优化的算法,其内容是:利用粒子感知外部环境的变化,将可行域空间分为n1个均匀的子空间,在每个子空间内随机抽取n2个粒子作为感知粒子进行初始化,在迭代过程中计算感知粒子的适应度fi,并比较相邻2次迭代的适应度差值Δf,然后对所适应度差值求和F,公式如下:
Δfi=fi(k+1)-fi(k);
在上式中,如果F≠0,则表明外部环境已发生变化,此时应设定一个动态响应触发阈值FT,当F>FT时触发响应,其中其中FT为动态响应触发阈值,F为适应度差值求和更新机制为按一定方式重新初始化感知粒子和粒子速度,描述如下:
若F>FT时
其中,rand(M)为M维向量;V(i)=[Vi1,Vi2,…,Vim],X(i)=[Xi1,Xi2,…,Xim],X(i)表示从粒子群中选出的重新进行初始化的第i个感知粒子,V(i)表示从粒子群中选出的重新进行初始化的第i个粒子速度,m表示维数;Vmax为感知粒子最大速度,Vmax=Xmax。
6.根据权利要求1所述的转基因棉花识别方法,其特征在于,所述学习因子c1=1.5、c2=1.7。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510706448.XA CN105372202B (zh) | 2015-10-27 | 2015-10-27 | 转基因棉花品种识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510706448.XA CN105372202B (zh) | 2015-10-27 | 2015-10-27 | 转基因棉花品种识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105372202A CN105372202A (zh) | 2016-03-02 |
CN105372202B true CN105372202B (zh) | 2019-01-29 |
Family
ID=55374595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510706448.XA Expired - Fee Related CN105372202B (zh) | 2015-10-27 | 2015-10-27 | 转基因棉花品种识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105372202B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106442390A (zh) * | 2016-08-29 | 2017-02-22 | 涂闪 | 基于pca‑svm算法的转基因大豆分类鉴定方法 |
CN106650815A (zh) * | 2016-12-28 | 2017-05-10 | 北京航天测控技术有限公司 | 动态粒子群算法优化的多核支持向量机吊舱故障诊断方法及装置 |
CN106971091B (zh) * | 2017-03-03 | 2020-08-28 | 江苏大学 | 一种基于确定性粒子群优化和支持向量机的肿瘤识别方法 |
CN106959284A (zh) * | 2017-03-27 | 2017-07-18 | 江苏大学 | 一种区分转基因玉米和非转基因玉米的检测方法 |
CN110879953A (zh) * | 2018-09-06 | 2020-03-13 | 华南农业大学 | 植物类别识别方法及系统 |
CN113092403B (zh) * | 2021-04-12 | 2022-07-01 | 桂林电子科技大学 | 一种学生校服纺织品材料太赫兹光谱定性检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1360826A (zh) * | 2000-12-27 | 2002-07-31 | 朱安灿 | 一种转基因棉花田间识别剂及其应用方法 |
CN2932368Y (zh) * | 2006-08-01 | 2007-08-08 | 东北电力大学 | 基于主成分分析和支持向量机的油气水多相流流型信号采集装置 |
CN102609714A (zh) * | 2011-12-31 | 2012-07-25 | 哈尔滨理工大学 | 基于信息增益和在线支持向量机的新型分类器及分类方法 |
CN103679263A (zh) * | 2012-08-30 | 2014-03-26 | 重庆邮电大学 | 基于粒子群支持向量机的雷电临近预测方法 |
CN104988139A (zh) * | 2015-05-19 | 2015-10-21 | 中国科学院微生物研究所 | 培育抗黄萎病的棉花的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE546792T1 (de) * | 2006-07-28 | 2012-03-15 | Mei Inc | Klassifikation unter verwendung von unterstützungsvektormaschinen und variablenauswahl |
-
2015
- 2015-10-27 CN CN201510706448.XA patent/CN105372202B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1360826A (zh) * | 2000-12-27 | 2002-07-31 | 朱安灿 | 一种转基因棉花田间识别剂及其应用方法 |
CN2932368Y (zh) * | 2006-08-01 | 2007-08-08 | 东北电力大学 | 基于主成分分析和支持向量机的油气水多相流流型信号采集装置 |
CN102609714A (zh) * | 2011-12-31 | 2012-07-25 | 哈尔滨理工大学 | 基于信息增益和在线支持向量机的新型分类器及分类方法 |
CN103679263A (zh) * | 2012-08-30 | 2014-03-26 | 重庆邮电大学 | 基于粒子群支持向量机的雷电临近预测方法 |
CN104988139A (zh) * | 2015-05-19 | 2015-10-21 | 中国科学院微生物研究所 | 培育抗黄萎病的棉花的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105372202A (zh) | 2016-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105372202B (zh) | 转基因棉花品种识别方法 | |
CN108663339B (zh) | 基于光谱和图像信息融合的霉变玉米在线检测方法 | |
CN102179375B (zh) | 一种基于近红外作物单籽粒成分无损检测筛选方法 | |
CN103235095B (zh) | 注水肉检测方法和装置 | |
CN102735642B (zh) | 一种快速无损鉴别初榨橄榄油和油橄榄果渣油的方法 | |
CN101713731B (zh) | 一种药物制剂包衣质量的鉴别方法 | |
Liu et al. | Applying near-infrared spectroscopy and chemometrics to determine total amino acids in herbicide-stressed oilseed rape leaves | |
CN108169165B (zh) | 基于太赫兹光谱和图像信息融合的麦芽糖混合物定量分析方法 | |
Pang et al. | Hyperspectral imaging coupled with multivariate methods for seed vitality estimation and forecast for Quercus variabilis | |
CN105158186A (zh) | 一种基于高光谱图像对白萝卜黑心检测的方法 | |
Xie et al. | Quantification of chlorophyll content and classification of nontransgenic and transgenic tomato leaves using visible/near-infrared diffuse reflectance spectroscopy | |
CN110517160A (zh) | 一种农产品的质量分级方法及质量分级系统 | |
CN108051395A (zh) | 一种基于THz-ATR光谱技术的玉米品种鉴别方法 | |
CN104255118B (zh) | 基于近红外光谱技术的水稻种子发芽率快速无损测试方法 | |
US20210063322A1 (en) | Grain mildew detection method and device based on wifi apparatus | |
Wu et al. | Deep convolution neural network with weighted loss to detect rice seeds vigor based on hyperspectral imaging under the sample-imbalanced condition | |
Karoui et al. | Feasibility study of discriminating the manufacturing process and sampling zone in ripened soft cheeses using attenuated total reflectance MIR and fiber optic diffuse reflectance VIS–NIR spectroscopy | |
CN110186871A (zh) | 一种茶鲜叶产地的判别方法 | |
CN103033479A (zh) | 基于太赫兹时域光谱的峰谷位鉴别转基因稻米的方法 | |
Wu et al. | Variety identification of Chinese cabbage seeds using visible and near-infrared spectroscopy | |
CN105866043A (zh) | 一种利用高光谱技术检测苹果酸味的方法 | |
Nansen et al. | Considerations regarding the use of hyperspectral imaging data in classifications of food products, exemplified by analysis of maize kernels | |
Tong et al. | Spectrometric classification of bamboo shoot species by comparison of different machine learning methods | |
Yuan et al. | Application of hyperspectral imaging to discriminate waxy corn seed vigour after aging. | |
CN113049526B (zh) | 一种基于太赫兹衰减全反射的玉米种子水分含量测定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190129 Termination date: 20191027 |