基于电子鼻-人工神经网络的快速检测烟叶中钾含量的方法
技术领域
本发明涉及烟草样品中成分测试技术领域,尤其是涉及一种基于电子鼻-人工神经网络的快速检测烟叶中钾含量的方法。
背景技术
烟叶中主要化学成分有总糖、还原糖、烟碱、淀粉、绿原酸、莨菪亭、芸香苷、总氮、钾、钙、镁、水溶性氯和石油醚提物等等。烟叶中各种化学成分的含量复杂,烟草中的各类化学成分例如:糖类,酚类,氮杂环类,烟碱等会随生长的地域环境,气候条件的不同而产生变化。这些烟叶中的化学成分对烟叶的质量有着决定性的影响,而这些化学成分的含量不仅关系到烟草的品质,也会对烟草的口感产生影响。
烟叶中钾含量是烟叶生长中主要营养元素之一,是影响烟叶品质的主要因素之一,在烟草质量研究中具有重要意义,因此测定烟草中钾含量有着较为重要的意义。目前用化学分析方法测量这些化学成分需要过长的分析周期,而且分析过程复杂,化学分析方法也不适于在线监测。传统上测定烟草中钾含量的方法是用火焰光度法检测,该方法操作都十分繁琐,费时费力,对人员的技术水平要求较高,精密度也不好。由于这些缺点的限制,越来越多的科技工作者研究开发快速分析烟叶中化学成分的方法。
电子鼻(Electronic nose,EN)是模拟人的嗅觉形成过程的一种技术应用。人的嗅觉系统由嗅觉细胞、嗅觉神经网络(包括多个嗅觉神经元)和大脑组成。电子鼻主要由传感器、计算机、进样装置、气体处理装置组成。在进行气味分辨处理过程中,其核心部件为:传感器阵列、运算放大器等电子线路、电子计算机。
人工神经网络是模拟生物神经网络信息处理机制的一种信息处理系统,特别适用于处理输入和输出关系复杂的非线性数据,是从化学化工生产、实验数据中总结规律的一种有效手段。它是一种以有向图为拓扑结构的动态系统,也可看作是一种高维空间的非线性映射:
每一个神经细胞是一个简单的信息处理单元;神经细胞之间按一定的方式相互连接,构成神经网络系统,且按一定的规则进行信息传递与存储;神经网络系统可按已发生的事件积累经验,从而不断修改该系统的网络连接权重与存储数据。
近年来,电子鼻技术以其简便、快速、低成本、无污染及样品的非破坏性和多组分同时测定等优点而受到重视。而且没有看到应用电子鼻技术测定烟草中的钾这方面的报道。本发明方法的优势是不破坏样本,不污染样本,在用量上也比传统方法用量少,而且速度上比统方法更快捷。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷,而提供一种简便快捷、低成本、数据全面准确、无污染、测试简单、快捷的基于一种电子鼻-人工神经网络的快速检测烟叶中钾含量的方法。
本发明的目的可以通过以下技术方案来实现:
一种基于电子鼻-人工神经网络的快速检测烟叶中钾含量的方法,包括以下步骤:
1)收集若干个不同产地的烟叶样品,进行预处理后进行电子鼻扫描,得到这些烟叶样品的电子鼻数据;
2)采用火焰光度法检测得到这些烟叶样品中钾含量;
3)采用偏最小二乘法(Partial Least Squares,PLS)对电子鼻数据进行降维,获取这些烟叶样品的降维数据;
4)以这些烟叶样品的降维数据为自变量,以这些烟叶样品的钾含量为因变量,采用人工神经网络算法建立烟叶钾含量的快速预报模型;
5)根据建立的烟叶钾含量的快速预报模型和待检测烟叶品种的电子鼻数据,快速预报待检测烟叶品种的钾含量。
所述的步骤1)中的预处理包括干燥、研磨和过筛。
所述的电子鼻为法国AlphaMOS公司的Heracles电子鼻指纹分析系统。
所述的步骤3)中具体包括以下步骤:
偏最小二乘法具体步骤如下:
31)取目标变量Y的第一列作为目标负载的初值u:
u←Yj
其中j代表第j列。
32)在自变量X块,让因变量Y块的得分和自变量混合,求其权重w:
w=XTu/(uTu)
其中T为得分矩阵。
33)归一化:
w=w/||w||
其中‖‖为欧式距离。
34)求X块的得分t:
t=Xw/(wTw)
35)在因变量Y块,用X的块得分和因变量混合,求其负载c:
c=Yt/(tTt)
36)求Y块的得分u:
u=Yc/(cTc)
37)如第34)步的t与前次迭代的told的差别小于某一个阈值,即:
||t-told||/||t||<e
一般e取10-8,则转第38)步;否则,转第32)步;
38)计算X块的负载p:
p=XTt/(tTt)
39)计算Y块的负载q:
q=YTu/(uTu)
310)求X和Y内部关系的回归系数:
v=uTt/(tTt)
其中v为PLS的回归系数的对角化矩阵。
311)求残差矩阵并赋给X和Y:
X←X-tpT
Y←Y-vtqT
这样,完成了一个PLS成分,再到第31)步,直到完成所需要的成分,这里PLS成分个数为前15个。
所述的步骤4)中人工神经网络输入层节点数15,隐蔽层节点数8,输出层节点数1。
与现有技术相比,本发明具有以下优点:
一、预报烟叶中钾含量简单、快捷:利用电子鼻仪器扫描一个烟叶样品需要1分钟,把得到的电子鼻数据导入建立的模型,不需要1秒钟就可以计算出结果,方便、快捷,仅需一人即可完成。
二、低成本:本发明利用电子鼻-人工神经网络预报烟叶中钾含量,相比于传统的火焰光度法,操作简单,成本低。
三、数据全面准确:本发明通过偏最小二乘法法对电子鼻数据进行降维,把原来800多维数据中降维到最具有代表性的15个作为PLS成分,在降低了数据维度的同时保留了尽可能多的原始信息,模型简单,计算方便。
四、无污染:本发明在整个过程中不用到化学药品,对环境没有污染。
附图说明
图1为烟叶电子鼻数据图。
图2为烟叶中钾含量建模结果图。
图3为烟叶中钾含量留一法结果图。留一法交叉验证是假设有N个样本,将每一个样本作为测试样本,其它N-1个样本作为训练样本。这样得到N个分类器,N个测试结果。用这N个结果的平均值来衡量模型的性能。
图4为烟叶中钾含量预测结果图。
图5为人工神经网络网络示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
本发明基于电子鼻-人工神经网络的快速检测烟叶中钾含量的方法,包括如下步骤:
(1)由烟草公司提供132个不同产地的烟叶样品,进行除梗、整理等前期工作后称量40g,放置到烘箱中,在60℃烘干1.5小时;用磨粉机对烘干的烟叶进行磨粉,然后将磨粉后的烟叶粉末过60目筛;取2g烟叶粉末在空气温度20-22℃,湿度空气30-45%的环境下用法国AlphaMOS公司的Heracles电子鼻指纹分析系统对样品进行扫描,得到这些烟叶样品的电子鼻数据,如图1所示。
(2)采用火焰光度法检测得到这些烟叶样品中钾含量;
(3)收集烟叶电子鼻数据后,用偏最小二乘法对烟叶电子鼻数据进行降维。偏最小二乘法降维的目的是:排除众多化学信息共存中相互重叠的信息,把原来多个变量组合为少数几个互不相关的变量但同时又尽可能多地表征原变量的数据结构特征而使丢失的信息尽可能地少。偏最小二乘法降维步骤可概括如下:
偏最小二乘法具体步骤如下:
31)取目标变量Y的第一列作为目标负载的初值u:
u←Yj
j代表第j列。
32)在自变量X块,让因变量Y块的得分和自变量混合,求其权重w:
w=XTu/(uTu)
T为得分矩阵。
33)归一化:
w=w/||w||
‖‖为欧式距离。
34)求X块的得分t:
t=Xw/(wTw)
35)在因变量Y块,用X的块得分和因变量混合,求其负载c:
c=Yt/(tTt)
36)求Y块的得分u:
u=Yc/(cTc)
37)如第34)步的t与前次迭代的told的差别小于某一个阈值,即:
||t-told||/||t||<e
一般e取10-8,则转第38)步;否则,转第32)步;
38)计算X块的负载p:
p=XTt/(tTt)
39)计算Y块的负载q:
q=YTu/(uTu)
310)求X和Y内部关系的回归系数:
v=uTt/(tTt)
v为PLS的回归系数的对角化矩阵。
311)求残差矩阵并赋给X和Y:
X←X-tpT
Y←Y-vtqT
这样,完成了一个PLS成分,再到第31)步,直到完成所需要的成分,这里PLS成分个数为前15个。
通过偏最小二乘法降维,得到烟叶电子鼻数据降维后的数据,如表1所示。
表1 烟叶电子鼻降维后数据
PLS(1) |
PLS(2) |
PLS(3) |
PLS(4) |
PLS(5) |
PLS(6) |
8.3015 |
-13.7206 |
-1.3283 |
0.924 |
0.6048 |
-0.9323 |
4.58 |
3.0046 |
6.8636 |
-2.0929 |
0.7147 |
1.2713 |
24.588 |
-3.8736 |
4.3827 |
0.0588 |
-2.1753 |
0.8148 |
-4.3035 |
-9.4767 |
2.2668 |
-3.3989 |
-0.6966 |
0.4042 |
-3.1399 |
-7.578 |
-1.0563 |
-2.3694 |
2.933 |
0.4801 |
2.0018 |
-14.7104 |
1.1679 |
0.3669 |
-2.0605 |
1.0358 |
12.4535 |
-10.1476 |
4.653 |
0.4659 |
-0.8532 |
-1.4086 |
3.6215 |
-16.8694 |
-2.3424 |
0.0022 |
0.36 |
-1.0976 |
10.3122 |
-12.0973 |
0.432 |
1.4936 |
2.6189 |
-0.9049 |
5.1674 |
-15.224 |
-3.2513 |
-0.8821 |
-3.0376 |
-0.5953 |
3.9543 |
-2.6434 |
-0.4412 |
-2.3956 |
2.3977 |
0.4457 |
22.4028 |
-5.3864 |
-0.869 |
0.8864 |
0.4121 |
-1.6846 |
14.6137 |
-2.3448 |
4.2015 |
2.8476 |
-1.2631 |
2.8575 |
-4.3387 |
-18.7868 |
1.5279 |
-0.23 |
-2.8311 |
1.1403 |
(4)以132个烟叶样品的降维数据为自变量,以132个烟叶样品的钾含量为因变量,采用人工神经网络算法建立烟叶钾含量的快速预报模型。
“人工神经网络,它是一种以有向图为拓扑结构的动态系统,也可看作是一种高维空间的非线性映射,如图5所示。
设wji l为l-1层上节点i至l层上节点j的连接权值,Netj l和Outj l分别为l层上节点j的输入值和输出值,且Xi(i=1,…,N)为网络的输入因素,转换函数f为Sigmoid形式
则B-P网络的输出与输入之间的关系如下
其中pot(l)(l=1,2,…,L)为各层节点数,且pot(1)=N,pot(L)=M,为目标Ej的估计值。
BP网络的学习过程是通过误差反传算法调整网络的权值wji,使网络对于已知n个样本目标值的估计值与实际值之误差的平方和
最小;这一过程可用梯度速降法实现。算法流程如下:
a.初始化各权值
b.随机取一个样本,计算其
反向逐层计算误差函数值
c.
d.修正权值
其中t为迭代次数,η为学习效率,α为动量项。
重复步骤b、c、d,直至收敛于给定条件。
通过对上述人工神经网络算法的编程实现,建立烟叶中钾含量的人工神经网络预报模型。
(5)根据建立的烟叶钾含量的预测模型和待检测烟叶品种的电子鼻数据,快速预报待检测烟叶品种的钾含量。
实施例1:132个烟叶中钾含量的人工神经网络预报模型的建模结果,如图2所示。
利用人工神经网络算法对132个预处理后的烟草电子鼻数据进行回归建模,建立烟草中钾含量的人工神经网络预报模型,烟叶中钾含量计算值和实验检测值的相关系数0.93,平均相对误差8.41%。
实施例2:132个烟叶中钾含量的人工神经网络预报模型的留一法结果,如图3所示。
采用留一法对132烟叶样品建立的钾含量的人工神经网络预报模型进行内部交叉验证。留一法的烟叶中钾含量计算值和实验检测值的相关系数0.91,平均相对误差9.64%。
实施例3:对41个新烟草样本钾含量的预报结果,如图4所示。
利用建立的烟叶中钾含量的人工神经网络预报模型对新的41个烟草样本进行预报,得到了很好的预报结果。钾含量计算值和实验检测值的相关系数为0.90,平均相对误差10.91%。