CN106560697A - 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 - Google Patents
联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 Download PDFInfo
- Publication number
- CN106560697A CN106560697A CN201610915255.XA CN201610915255A CN106560697A CN 106560697 A CN106560697 A CN 106560697A CN 201610915255 A CN201610915255 A CN 201610915255A CN 106560697 A CN106560697 A CN 106560697A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- sample
- tea
- infrared
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 239000011435 rock Substances 0.000 title claims abstract description 40
- 239000011573 trace mineral Substances 0.000 title claims abstract description 38
- 235000013619 trace mineral Nutrition 0.000 title claims abstract description 38
- 238000001514 detection method Methods 0.000 title claims abstract description 13
- 241001122767 Theaceae Species 0.000 title claims abstract 20
- 238000004497 NIR spectroscopy Methods 0.000 title abstract description 3
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000004519 manufacturing process Methods 0.000 claims description 40
- 229910052792 caesium Inorganic materials 0.000 claims description 28
- 229910052791 calcium Inorganic materials 0.000 claims description 28
- 239000011575 calcium Substances 0.000 claims description 28
- 229910052802 copper Inorganic materials 0.000 claims description 28
- 239000010949 copper Substances 0.000 claims description 28
- 238000001228 spectrum Methods 0.000 claims description 26
- 229910052701 rubidium Inorganic materials 0.000 claims description 24
- TVFDJXOCXUVLDH-UHFFFAOYSA-N caesium atom Chemical compound [Cs] TVFDJXOCXUVLDH-UHFFFAOYSA-N 0.000 claims description 22
- 230000011218 segmentation Effects 0.000 claims description 22
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 21
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 20
- 238000002329 infrared spectrum Methods 0.000 claims description 18
- IGLNJRXAVVLDKE-UHFFFAOYSA-N rubidium atom Chemical compound [Rb] IGLNJRXAVVLDKE-UHFFFAOYSA-N 0.000 claims description 18
- 229910052712 strontium Inorganic materials 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 239000000470 constituent Substances 0.000 claims description 8
- 239000007788 liquid Substances 0.000 claims description 8
- 241001269238 Data Species 0.000 claims description 7
- 229910052788 barium Inorganic materials 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 238000000120 microwave digestion Methods 0.000 claims description 7
- CIOAGBVUUVVLOB-UHFFFAOYSA-N strontium atom Chemical compound [Sr] CIOAGBVUUVVLOB-UHFFFAOYSA-N 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 229910052749 magnesium Inorganic materials 0.000 claims description 6
- 229910052748 manganese Inorganic materials 0.000 claims description 6
- 238000012850 discrimination method Methods 0.000 claims description 5
- 229910052793 cadmium Inorganic materials 0.000 claims description 4
- 229910052804 chromium Inorganic materials 0.000 claims description 4
- 229910052759 nickel Inorganic materials 0.000 claims description 4
- 238000000918 plasma mass spectrometry Methods 0.000 claims description 4
- 230000035945 sensitivity Effects 0.000 claims description 4
- 229910052725 zinc Inorganic materials 0.000 claims description 4
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 claims description 3
- 230000029087 digestion Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 229910052719 titanium Inorganic materials 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 238000000862 absorption spectrum Methods 0.000 claims 1
- 238000004321 preservation Methods 0.000 claims 1
- 238000012706 support-vector machine Methods 0.000 abstract description 3
- 238000004611 spectroscopical analysis Methods 0.000 abstract 1
- 244000269722 Thea sinensis Species 0.000 description 57
- 235000013616 tea Nutrition 0.000 description 57
- 238000000513 principal component analysis Methods 0.000 description 6
- 241000219991 Lythraceae Species 0.000 description 5
- 235000014360 Punica granatum Nutrition 0.000 description 5
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- 235000009569 green tea Nutrition 0.000 description 4
- 229910052751 metal Inorganic materials 0.000 description 4
- 244000025254 Cannabis sativa Species 0.000 description 3
- 241000209140 Triticum Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 235000006468 Thea sinensis Nutrition 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 235000020279 black tea Nutrition 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 235000012907 honey Nutrition 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 230000000155 isotopic effect Effects 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000009659 non-destructive testing Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 244000296102 Selinum monnieri Species 0.000 description 1
- 235000019084 Selinum monnieri Nutrition 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 238000001479 atomic absorption spectroscopy Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229940126678 chinese medicines Drugs 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004993 emission spectroscopy Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 241000411851 herbal medicine Species 0.000 description 1
- 238000009616 inductively coupled plasma Methods 0.000 description 1
- 238000002354 inductively-coupled plasma atomic emission spectroscopy Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 239000002366 mineral element Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- NCCSSGKUIKYAJD-UHFFFAOYSA-N rubidium(1+) Chemical compound [Rb+] NCCSSGKUIKYAJD-UHFFFAOYSA-N 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
Abstract
本发明涉及联合近红外光谱和微量元素的武夷岩茶产地鉴别方法,属于地理标志产品真实性识别技术领域,其目的在于解决单种检测数据无法代表产地溯源全部关键信息和不同类型检测数据在计量学方法中联合使用的数据匹配等问题。本发明基于最小二乘支持向量机判别模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱数据和微量元素数据联合在一起,建立LS‑SVM分析模型,提取试样后利用模型客观、准确的判定岩茶产地,其识别率最高,达100.0%,远高于近红外或微量元素单类数据组成的LS‑SVM判别结果,且对盲样的识别率达100%,具有较好应用前景。
Description
(一)技术领域
本发明涉及联合近红外光谱和微量元素的武夷岩茶产地鉴别方法,属于地理标志产品真实性识别技术领域。
(二)背景技术
地理标志产品,是指产自特定地域所具有的质量、声誉或其他特性本质上取决于该产地的自然因素和人文因素,经审核批准以地理名称进行命名的产品。茶叶是典型的地理标志保护产品,其品质、口感与产地的地理条件、气候因素、环境等因素密切相关,武夷岩茶是其中代表性茶叶产品。
现今,国内外成品茶产地识别鉴定方法,以单一仪器检测分析结合计量学分析方法为最主要识别方法,仪器检测分析方法主要有以下几种近红外光谱、同位素质谱、微量元素、液相色谱、传感器等;常用计量学方法有主成分分析、偏最小二乘、人工神经网络、支持向量机等。
近红外光谱检测技术广泛应用农产品、中草药等原产地检测中,陈全胜等采用近红外光谱对龙井、碧螺春、铁观音和祁门红茶进行检测,并建立SIMCA(基于主成分分析的一种分类方法)判别模型,龙井、碧螺春、祁门红茶和铁观音的识别准确率分别为90%、80%、100%和100%;周健等利用西湖龙井茶和其他地区以龙井加工工艺制成的扁形茶全区域的近红外原始光谱,分别对其进行赋值,采用PLS法建立了西湖龙井的预测模型(主成分数为15),通过预测值和西湖龙井的临界值进行比对实现了对西湖龙井的真伪的准确鉴定,对70份定标样品和24份外部验证未知样品鉴定结果的准确率都达到了100%。Yong He等选择(325~1075nm)的光谱范围,用主成分分析(principal component analysis,PCA)得到的8个主成分来作为输入层,以8个品牌的茶(毛峰、雪水云绿、羊岩勾青等)200份绿茶样品建立了一个BP判别模型,对40份未知样品的茶叶的品种判别准确率达到了100%。Zhao等获取了中国小麦主要生产基地240个小麦样本的近红外光谱,在对光谱进行预处理后,采取基于主成分分析和偏最小二乘算法(PLS)的线性判别技术对小麦的产地进行了分类和判别。刘荔荔等用近红外漫反射光谱结合信息变换和计算机技术,对8种不同中药材的近红外漫反射光谱进行褶合变换,挖掘隐含的特征信息,通过计算可视化技术获取相应光谱的可视化褶合指纹谱,对中药材进行快速鉴别,拓宽了近红外漫反射光谱在中药材定性鉴别中的应用范围。刘国林等根据42种不同类别和产地的中药蛇床子的近红外光谱图进行类别分析,通过非线性映射处理可得到直观的散布图,用目视法即可进行聚类分析。
罗婷等利用湿法消解结合ICP-AES法测定不同产地28种绿茶中9种矿质元素,通过主成分分析得出对茶叶分类判别贡献较大Mn、Mg、K、Ca、Al等元素,并结合聚类分析的模式识别方法,几个地区的不同茶叶品种基本得到了区分。王睿等采用电感耦合等离子体原子发射光谱法,对新疆6个主要产地的36个石榴样品的可食部分(果肉)和籽中12种金属元素的含量进行测定,采用主成分分析PCA和线性判别分析LDA对石榴可食部分和籽中金属元素进行综合评价。结果表明:PCA得出2个三因子模型,分别解释了石榴可食部分和籽中金属元素数据的84.29%和60.33%;通过对石榴可食部分中金属元素组成进行PCA,PCA更好地将36个石榴样品划分为6类,与实际产地吻合。陈辉等应用电感耦合等离子体质谱测定了北京顺义、河北阜平和河北平山三个地区65个荆条蜜样品中38种元素含量,并采用PCA和反向传输人工神经网络按照不同产地对荆条蜜进行了分析,交叉检验整体准确率为95.4%。
从上述例子可以看出,对地理标志产品鉴别方法有很多,但是很多研究尚有不足之处,如采样不充分、样品数量少,样品不具备代表性;样品空间选择跨度大,往往选自不同国家、甚至不同洲,这类样品由于空间跨度大,本身就具有很大的区别,对小范围的地理标志产品产地判别借鉴意义不大;样品选取所带来的局限性,使得建模方法亦无法代表产地溯源的全部信息,导致产地识别率低,上述这些严重影响了地理标志产品保护技术的创新和突破。针对如上情况,有必要建立一种融合近红外光谱和微量元素数据的产地识别模型。
(三)发明内容
本发明目的在于解决单种检测数据无法代表产地溯源的全部关键信息等问题,也解决不同类型检测数据在计量学方法中的联合使用、分析所存在的数据匹配等问题,提供一种联合近红外光谱数据和微量元素数据的武夷岩茶产地识别模型技术方法,该方法基于最小二乘支持向量机判别模型,将地理标志产地内和产地外岩茶近红外特征光谱数据和微量元素数据联合在一起,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地。
本发明采用的技术方案是:
联合近红外光谱和微量元素的武夷岩茶产地鉴别方法,所述方法包括:
(A)采集不同产地岩茶样品:
武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的近红外特征光谱数据:
近红外检测参数:扫描范围为12000-4000cm-1,64次扫描平均值,数据点间隔为1.928cm-1,采集时室温25℃,湿度保持稳定,每个样本光谱采集1次,无需采用粉碎等前处理,直接无损检测,每次加料方法以及加料量保持一致。
(C)测定不同产地岩茶样品的铯、铜、钙、铷四种微量元素数据:
干茶样品微波消解,消解完毕,待消解罐压力降低后,打开消解罐,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,则进行检测。岩茶样品微波消解后,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,则进行检测,使用原子吸收光谱仪测定样液中Ca、Mg、Mn元素含量,使用电感耦合等离子体质谱测定微波消解液中Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量。
通过SVM-RFE法对微量元素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的微量元素特征变量,并通过预测集计算每一维变量累加之后的模型增维精度,得到铯、铜、钙、铷、锶、钡特征排序顺序。然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,由铯、铜、钙、铷四者微量元素组成的模型,其识别率最高,说明此四种微量元素间的信息具有互补性,只需选择建模的铯、铜、钙、铷四种微量元素进行检测即可。
(D)联合近红外光谱和微量元素建立不同产地岩茶鉴别数据库:
(1)将每条近红外数据(Y轴数据)拼接在Excel数据表格中,每行所有列数据组成每条近红外数据;
(2)将每个样品的微量元素数据按铯、铜、钙、铷顺序拼接在近红外数据中,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.D.Snee和Michal Daszykowski建立的Duplex分割程序,将数据划分为两个子集,使其覆盖近似相同区域和拥有类似的统计性质;将样本数据归一化和正交化,计算两两样本间的欧式距离;选择欧式距离最大的两个样本进入训练集,剩余样本中,欧式距离最大的两个样本进入验证集;第一轮选后的剩余样本中,与训练集欧式距离最大的样本进入训练集,与验证集欧式距离最大的样本进入验证集;重复步骤,直至所选的样品分成两个子集。指定预测集的样本数,指定武夷岩茶产区内总数的65-70%作为原产地内模型数A1,随机取武夷岩茶产区外65-70%作为原产地外模型数A2,建立Duplex分割程序;
(5)K-折交互验证法:将样本数据集随机划分为K个子集(一般是均分),将一个子集作为验证集,其余的K-1组子集作为训练集;轮流将K个子集作为验证集,交叉重复K次,得到K次的结果,并用K次结果的平均值作为分类器或模型的性能指标。K-折法下,每一个样本数据都被用作训练数据,也被用作验证数据,避免了过度学习和欠学习状态的发生。
(6)最小二乘支持向量机(Least Squares Support Vector Machines,LS-SVM)建模思路:数据点对于对象模型的建立非同等重要,包含大的噪声信号的数据若与其它数据以同等权值参与训练,则模型的精度必定受到影响,因此,不同数据点在训练算法的目标函数中应区别对待,LS-SVM中由误差平方代替原松弛变量,将非线性估计函数转化为高维特征空间中线性估计函数,使得LS-SVM的训练过程遵循结构风险最小化原则,将不等式约束改为等式约束,将经验风险由偏差的一次方改为二次方,将求解二次规划问题转化为求解线性方程组,避免不敏感损失函数,极大降低计算复杂度。其设计思路为从机器学习损失函数着手,在其优化问题的目标函数中使用二范数,并利用等式约束条件代替SVM标准算法中的不等式约束条件,使得LS-SVM方法的优化问题的求解变为通过Kuhn-Tucker条件得到的一组线性方程组的求解。
(7)建立LS-SVM鉴别模型:对经过步骤(4)和(5)分割和验证后的近红外及微量元素数据,采用最小二乘支持向量机分析并建立LS-SVM模型;
(E)取待测未知产地样品按照步骤B和C测定近红外特征光谱数据和微量元素数据,将测得数据代入上述LS-SVM模型,判断待测样品的原产地域属性。
具体的,所述步骤D中分割程序为:[model1,test1]=Duplex(data1,A1)和[model2,test2]=Duplex(data2,A2),得到model1、test1、model2、test2。
所述步骤D中最小二乘支持向量机鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)用K-折交互验证:
indices=crossvalidation(′Kfold′,x,k);
(h)建模过程:
预处理:model=initlssvm(x,y,type,[],[],kernel);
模型测定:model=tunelssvm(model,′simplex′,optfun,optargs);
训练集测定:model=trainlssvm(model);
(i)根据测定结果,采用plotlssvm预测结果,并分别输出yp、alpha、b、gam和sig2:
plotlssvm(model);
end
yp=simlssvm(model,x);
alpha=model.alpha;
b=model.b;
gam=model.gam;sig2=model.kernel_pars;
其中Duplex程序如下所示:
其中Kfoldcv程序如下所示:
其中LS-SVM程序如下所示:
LS-SVM程序中所包含的trainlssvm程序如下:
本发明的有益效果主要体现在:本发明基于最小二乘支持向量机判别模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱数据和微量元素数据联合在一起,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地,其识别率高,达100.0%,高于单种数据LS-SVM结果。
(四)具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
实施例1:
A、采集不同产地岩茶样品
国标(GB/T 18745-2006)中规定了武夷岩茶的地理保护范围,即福建省武夷山市行政区划内,本发明在武夷岩茶地理标志保护区武夷街道、崇安街道、上梅、星村、五夫、岚谷、新丰街道、洋庄、兴田、下梅、吴屯11个行政区域内进行样品采集,每个行政区域内随机选择3个取样点(分别以A、B、C进行标注),共33个取样点,取样范围基本涵盖主要产区,每个采样点取样15份(分别以A-1、A-2......A-15进行标注),获得495份地理标志保护区武夷岩茶样品,另在福建省除武夷山市外其他县市(建阳、建瓯、漳州、泉州、松溪、政和),以及广西、贵州、江西(婺源、赣州)等11个地点收集保护区外岩茶样品,每个地点取样15份(分别以1、2......15进行标示),获得165个非地理标志保护区岩茶样品。地理标志产地内样品数与地理标志产地外样品数之比为3∶1。
B、不同产地岩茶近红外特征光谱数据
本发明近红外检测仪器采用德国布鲁克TENSOR37,所有样品均无损检测,采用相同加料方法、加料量(目测),加料完进行检测,采集室温控制在25℃,湿度保持稳定,扫描范围12000-4000cm-1,光谱为64次扫描的平均值,数据点间隔1.928cm-1,共4148个数据点。表1为15个上梅B样品部分近红外数据表,其中X轴为波长范围,Y轴为吸光度。
表1:15个上梅B样品部分近红外数据表
C、测定不同产地岩茶样品的铯、铜、钙、铷四种微量元素数据
使用日立180-50原子吸收光谱仪测定样液中Ca、Mg、Mn元素含量,使用ThermoFisher XSeries II电感耦合等离子体质谱测定微波消解液中Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量,表2为节选部分地理标志产区内、外岩茶样品微量元素数据表。
表2:部分岩茶样品微量元素统计表
通过SVM-RFE对上述武夷岩茶Ca、Mg、Mn等元素数据进行训练和预测,通过预测集计算每一维变量累加之后的模型增维精度,得到铯、铜、钙、铷、锶、钡特征排序顺序,各微量元素对于原产地特征的贡献率从高到低分别为铯、铜、钙、铷。通过预测集计算每一维变量累加之后的模型增维精度,包括分辨率、灵敏度和识别率指标,按重复计算100次的平均结果,其结果见表3。
表3:同位素特征变量组合结果情况
模型特征变量组合 | 灵敏度增维精度 | 分辨率增维精度 | 识别率增维精度 |
铯 | 0.9350 | 0.4155 | 0.8021 |
铯+铜 | 0.9358 | 0.6300 | 0.8023 |
铯+铜+钙 | 0.9187 | 0.4685 | 0.7993 |
铯+铜+钙+铷 | 0.9327 | 0.4510 | 0.8121 |
铯+铜+钙+铷+锶 | 0.9236 | 0.4682 | 0.7936 |
从表3可知,当铯和铜的同位素数据进行组合后,模型识别率上升,说明铯和铜对原产地特征的贡献具有较强的相关性和互补性;而加入钙和铷元素数据后,模型识别率最高,达81.21%,说明钙和铷对原产地特征的贡献具有一定的相关性;加入锶以后,识别率下降至79.36%,说明锶对原产地特征的贡献不具备相关性,可以忽略锶的影响。
D、联合近红外光谱和微量元素建立不同产地岩茶鉴别数据库
(1)将每条近红外数据拼接在Excel数据表格中,每行所有列数据组成每条近红外数据。
(2)将每个样品的微量元素数据按铯、铜、钙、铷顺序拼接在近红外数据中,地理标志产区内样品组成495行、4152列(近红外Y轴数据共4148列,增加4列依次为铯、铜、钙、铷微量元素数据)的Excel数据表,以data1命名;地理标志产区外样品组成165行、4152列的Excel数据表,以data2命名。
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:采用Duplex分割程序,随机选取≥65%武夷岩茶产区内总数作为原产地内模型数A1,随机取≥65%武夷岩茶产区外作为原产地外模型数A2,建立Duplex分割程序,原产地内随机取330(A1)个样品作为模型,原产地外随机取110(A2)个样品作为模型,建立kenstone分割程序,[model1,test1]=Duplex(data1,330)和[model2,test2]=Duplex(data2,110),得到model1、test1、model2、test2。
(5)对近红外及微量元素数据建模LS-SVM:
①合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
②合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
③求训练集平均光谱:mx=mean(xxxc);
④训练集减去平均光谱:xxxc=xxxc-ones(440,1)*mx;
⑤预测集减去平均光谱:xxxp=xxxp-ones(220,1)*mx;
⑥响应变量:yyc=-ones(440,2);yyc(1:330,1)=1;yyc(331:440,2)=1;
⑦用K-折交互验证:
indices=crossvalind(′Kfold′,x,k);
⑧建模过程:
预处理:model=initlssvm(x,y,type,[],[],kernel);
模型测定:model=tunelssvm(model,′simplex′,optfun,optargs);
训练集测定:model=trainlssvm(model);
⑨根据测定结果,采用plotlssvm预测结果,输出yp、alpha、b、gam和sig2:
plotlssvm(model);
end
yp=simlssvm(model,x);
alpha=model.alpha;
b=model.b;
gam=model.gam;sig2=model.kernel_pars;
E、LS-SVM模型识别率
按上述建模方法分别对近红外光谱、微量元素以及二者联合数据进行建模分析,其结果见表4。
表4:PLSDA分类模型判别结果汇总
近红外光谱、微量元素各特征指标之间具有互补性,采用本发明LS-SVM建模方法对近红外光谱和微量元素融合数据进行分析,其识别率最高,达100.0%,远高于单种数据的LS-SVM模型判别结果。
实施例2:
盲样检测:盲样监督小组从武夷岩茶农户处购买岩茶样品,监控晒青、做青、杀青等步骤,确保岩茶样品的原产地域属性,上述样品作为盲样中的地理标志产区内样品;从建阳、建瓯、婺源等地购买岩茶,作为盲样中的地理标志产区外样品,上述盲样与建模岩茶样品出自不同的厂家。分析检测人员事先未能得知待测盲样的产地属性,随机选取若干份,检测,再按本发明方法对盲样产地属性进行判断,并与盲样监督小组进行核对,确定盲样识别率。分别选取20、60、100个盲样,按照实施例中步骤B、C和D方法获得的盲样数据代入上述LS-SVM模型,判断其地理标志属性,其判别识别率均为100%。
实施例3:
采用与实施例1相同的建模数据,数据分割用Duplex分割程序,用K-折交互验证,分别建立最小二乘支持向量机(LS-SVM)模型、神经网络ELM和偏最小二乘(PLSDA)模型,近红外光谱数据不变,微量元素的数据按Cs、Cu、Ca、Rb、Sr、Ba、Mg、Mn、Ti、Cr、Co、Ni、Zn、Cd顺序拼接在近红外数据后,其模型识别率分别为91.3%、87.8%、89.5%。
实施例4:
采用与实施例1相同的建模数据,数据分割用Duplex分割程序,用K-折交互验证,分别建立LS-SVM、神经网络ELM和PLSDA分析模型,近红外光谱数据不变,微量元素的数据按Cs、Cu、Ca、Rb顺序拼接在近红外数据后,其模型识别率分别为100.0%、92.7%、87.9%。
实施例5:
采用与实施例1相同的建模数据,数据分割用Duplex分割程序,用蒙特卡洛交互验证,分别建立LS-SVM、ELM、PLSDA判别模型,近红外光谱数据不变,微量元素的数据按Cs、Cu、Ca、Rb顺序拼接在近红外数据后,其模型识别率分别为80.7%、75.9%和69.5%。
实施例6:
采用与实施例1相同的建模数据,数据分割用Kenstone分割程序,用蒙特卡洛交互验证,分别建立LS-SVM、ELM、PLSDA判别模型,近红外光谱数据不变,微量元素的数据按Cs、Cu、Ca、Rb顺序拼接在近红外数据后,其模型识别率分别为66.2%、70.8%和85.3%。
实施例7~10:
岩茶样品、近红外数据、微量元素数据等与实施例1相同,分别采用不同方法进行鉴别。实施例8-10分别采用现有发明专利CN103630528A(申请号201210307144.2)、CN102455320A(申请号201010526790.9)、CN103245713A(申请号201310095950.2)所述方法进行鉴别,比较情况见表5。
表5:实施例1与实施例7-10比较情况表
从上述比较结果可以得出,采用本发明方法,其盲样检测识别率达100.0%,可作为武夷岩茶产地溯源识别技术方法。
Claims (4)
1.联合近红外光谱和微量元素的武夷岩茶产地鉴别方法,所述方法包括:
(A)采集不同产地岩茶样品:
武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的近红外特征光谱数据:
近红外检测参数:64次扫描,特征光谱条带为64次扫描的平均值,扫描范围为12000-4000cm-1,数据点的间隔为1.928cm-1,采集时室温控制在25℃,湿度保持稳定,每个样本的光谱采集1次;
(C)测定不同产地岩茶样品的铯、铜、钙、铷四种微量元素数据:
干茶样品微波消解,消解完毕,待消解罐压力降低后,打开消解罐,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,则进行检测;岩茶样品微波消解后,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,则进行检测,使用原子吸收光谱仪测定样液中Ca、Mg、Mn元素含量,使用电感耦合等离子体质谱测定微波消解液中Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量;
通过SVM-RFE法对微量元素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的微量元素特征变量,并通过预测集计算每一维变量累加之后的模型增维精度,得到铯、铜、钙、铷、锶、钡特征排序顺序;然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,由铯、铜、钙、铷四者微量元素组成的模型,其识别率最高,说明此四种微量元素间的信息具有互补性,只需要选择建模的铯、铜、钙、铷四种微量元素进行检测即可;
(D)联合近红外和微量元素建立不同产地岩茶鉴别数据库:
(1)将每条近红外数据拼接在Excel数据表格中,每行所有列数据组成每条近红外数据;
(2)将每个样品的微量元素数据按铯、铜、钙、铷顺序拼接在近红外数据中,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.D.Snee和Michal Daszykowski建立的Duplex分割程序,将数据划分为两个子集,指定武夷岩茶产区内总数的65-70%作为原产地内模型数A1,随机取武夷岩茶产区外65-70%作为原产地外模型数A2,建立Duplex分割程序,并对数据采用K-折交互验证法进行验证;
(5)最小二乘支持向量机法鉴别模型的建立:对步骤(4)数据分割后的近红外和微量元素数据,采用最小二乘支持向量机法分析并建立LS-SVM模型;
(E)取待测未知产地样品按照步骤B和C测定近红外特征光谱数据和微量元素数据,将测得数据代入上述LS-SVM模型,判断待测岩茶样品产地属性。
2.如权利要求1所述的方法,其特征在于所述步骤D中分割程序分别为:[model1,test1]=Duplex(data1,A1)和[model2,test2]=Duplex(data2,A2),得到model1、test1、model2、test2。
3.如权利要求1所述的方法,其特征在于所述步骤D中最小二乘支持向量机鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)用K-折交互验证:
indices=crossvalidation(′Kfold′,x,k);
(h)建模过程:
预处理:model=initlssvm(x,y,type,[],[],kernel);
模型测定:model=tunelssvm(model,′simplex′,optfun,optargs);
训练集测定:model=trainlssvm(model);
(i)根据测定结果,采用plotlssvm预测结果,并分别输出yp、alpha、b、gam和sig2:
plotlssvm(model);
end
yp=simlssvm(model,x);
alpha=model.alpha;
b=model.b;
gam=model.gam;sig2=model.kernel_pars。
4.如权利要求1所述的方法,其特征在于本发明所述最小二乘支持向量机LS-SVM建模方法对近红外和稳定同位素的融合数据进行建模分析,模型识别率达100.0%,远高于单种数据LS-SVM的结果;针对20、60、100个盲样,检测识别率均达100.0%,本发明方法可作为武夷岩茶产地溯源识别技术方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610915255.XA CN106560697A (zh) | 2016-10-20 | 2016-10-20 | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610915255.XA CN106560697A (zh) | 2016-10-20 | 2016-10-20 | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106560697A true CN106560697A (zh) | 2017-04-12 |
Family
ID=58485793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610915255.XA Pending CN106560697A (zh) | 2016-10-20 | 2016-10-20 | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106560697A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107037039A (zh) * | 2017-04-19 | 2017-08-11 | 塔里木大学 | 一种新疆核桃产地溯源研究方法 |
CN108717078A (zh) * | 2018-05-28 | 2018-10-30 | 安徽农业大学 | 一种基于化学成分的茶类判别方法 |
CN108760870A (zh) * | 2018-05-28 | 2018-11-06 | 安徽农业大学 | 基于化学成分的茶类判别方法 |
CN109829513A (zh) * | 2019-03-04 | 2019-05-31 | 武汉大学 | 一种顺序式波长色散x射线荧光光谱智能分析方法 |
CN110110789A (zh) * | 2019-05-08 | 2019-08-09 | 杭州麦迪特检测技术服务有限公司 | 一种基于多谱图信息融合技术的中草药品质鉴别方法 |
CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
CN111896495A (zh) * | 2020-08-05 | 2020-11-06 | 安徽大学 | 基于深度学习与近红外光谱太平猴魁产地甄别方法及系统 |
CN112861907A (zh) * | 2020-12-31 | 2021-05-28 | 福建融韵通生态科技有限公司 | 白茶产地溯源方法 |
WO2021112762A1 (en) * | 2019-12-04 | 2021-06-10 | Teapasar Pte. Ltd. | System and method for non-destructive rapid food profiling using artificial intelligence |
CN113418892A (zh) * | 2021-06-23 | 2021-09-21 | 河北大学 | 一种快速无损鉴别黄骅冬枣的方法 |
CN113536927A (zh) * | 2021-06-15 | 2021-10-22 | 南昌海关技术中心 | 一种赣南脐橙鉴别方法、系统及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09248163A (ja) * | 1996-03-14 | 1997-09-22 | Hitachi Zosen Corp | 味品質を確保した杜仲茶 |
CN103389281A (zh) * | 2012-05-09 | 2013-11-13 | 云南天士力帝泊洱生物茶集团有限公司 | 一种基于近红外光谱技术的普洱茶聚类分析方法 |
CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
CN104020128A (zh) * | 2014-02-21 | 2014-09-03 | 中国农业科学院蜜蜂研究所 | 一种快速鉴别蜂胶胶源的方法 |
CN104502299A (zh) * | 2014-12-12 | 2015-04-08 | 深圳市计量质量检测研究院 | 一种利用近红外光谱技术鉴别五常稻花香大米的方法 |
CN105044198A (zh) * | 2015-07-03 | 2015-11-11 | 中国农业大学 | 一种基于矿质元素指纹鉴别葡萄酒原产地的方法 |
CN105190261A (zh) * | 2013-03-21 | 2015-12-23 | Viavi科技有限公司 | 海产品的光谱法表征 |
-
2016
- 2016-10-20 CN CN201610915255.XA patent/CN106560697A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09248163A (ja) * | 1996-03-14 | 1997-09-22 | Hitachi Zosen Corp | 味品質を確保した杜仲茶 |
CN103389281A (zh) * | 2012-05-09 | 2013-11-13 | 云南天士力帝泊洱生物茶集团有限公司 | 一种基于近红外光谱技术的普洱茶聚类分析方法 |
CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
CN105190261A (zh) * | 2013-03-21 | 2015-12-23 | Viavi科技有限公司 | 海产品的光谱法表征 |
CN104020128A (zh) * | 2014-02-21 | 2014-09-03 | 中国农业科学院蜜蜂研究所 | 一种快速鉴别蜂胶胶源的方法 |
CN104502299A (zh) * | 2014-12-12 | 2015-04-08 | 深圳市计量质量检测研究院 | 一种利用近红外光谱技术鉴别五常稻花香大米的方法 |
CN105044198A (zh) * | 2015-07-03 | 2015-11-11 | 中国农业大学 | 一种基于矿质元素指纹鉴别葡萄酒原产地的方法 |
Non-Patent Citations (2)
Title |
---|
GRARD GREMAUD 等: "Characterization of Swiss vineyards using isotopic data in combination with trace elements and classical parameters", 《EUROPEAN FOOD RESEARCH AND TECHNOLOGY》 * |
言思敏: "地理标志产品武夷岩茶的产地识别技术研究", 《中国优秀硕士学位论文全文数据库农业科技辑》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107037039A (zh) * | 2017-04-19 | 2017-08-11 | 塔里木大学 | 一种新疆核桃产地溯源研究方法 |
CN108717078A (zh) * | 2018-05-28 | 2018-10-30 | 安徽农业大学 | 一种基于化学成分的茶类判别方法 |
CN108760870A (zh) * | 2018-05-28 | 2018-11-06 | 安徽农业大学 | 基于化学成分的茶类判别方法 |
CN109829513A (zh) * | 2019-03-04 | 2019-05-31 | 武汉大学 | 一种顺序式波长色散x射线荧光光谱智能分析方法 |
CN109829513B (zh) * | 2019-03-04 | 2023-09-15 | 武汉大学 | 一种顺序式波长色散x射线荧光光谱智能分析方法 |
CN110110789A (zh) * | 2019-05-08 | 2019-08-09 | 杭州麦迪特检测技术服务有限公司 | 一种基于多谱图信息融合技术的中草药品质鉴别方法 |
CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
WO2021112762A1 (en) * | 2019-12-04 | 2021-06-10 | Teapasar Pte. Ltd. | System and method for non-destructive rapid food profiling using artificial intelligence |
CN111896495A (zh) * | 2020-08-05 | 2020-11-06 | 安徽大学 | 基于深度学习与近红外光谱太平猴魁产地甄别方法及系统 |
CN112861907A (zh) * | 2020-12-31 | 2021-05-28 | 福建融韵通生态科技有限公司 | 白茶产地溯源方法 |
CN113536927A (zh) * | 2021-06-15 | 2021-10-22 | 南昌海关技术中心 | 一种赣南脐橙鉴别方法、系统及存储介质 |
CN113418892A (zh) * | 2021-06-23 | 2021-09-21 | 河北大学 | 一种快速无损鉴别黄骅冬枣的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106560697A (zh) | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 | |
Shi et al. | Development of a national VNIR soil-spectral library for soil classification and prediction of organic matter concentrations | |
CN104062256B (zh) | 一种基于近红外光谱的软测量方法 | |
CN104062257B (zh) | 一种基于近红外光谱测定溶液中总黄酮含量的方法 | |
CN106560698A (zh) | 基于多种检测技术的植物产地鉴别方法 | |
CN105300923B (zh) | 一种近红外光谱分析仪在线应用时无测点温度补偿模型修正方法 | |
CN106560691A (zh) | 具有深度学习功能的武夷岩茶产地鉴别方法 | |
CN106560692A (zh) | 联合四种检验技术的武夷岩茶产地鉴别方法 | |
CN106560700A (zh) | 能自动鉴别武夷岩茶产地的机器学习方法 | |
CN106560704A (zh) | 联合同位素和微量元素检验的武夷岩茶产地鉴别方法 | |
CN106560699A (zh) | 用于武夷岩茶产地鉴别的联合检测方法 | |
CN106560841A (zh) | 基于深度学习的武夷岩茶产地鉴别方法 | |
CN104020127B (zh) | 一种利用近红外光谱快速测量烟叶中无机元素的方法 | |
CN103196838B (zh) | 一种海岸河口富营养化高光谱遥感监测方法 | |
CN104062258B (zh) | 一种采用近红外光谱快速测定复方阿胶浆中可溶性固形物的方法 | |
CN103278591B (zh) | 一种色谱指纹图谱相似度计算方法 | |
CN103630528A (zh) | 一种利用茶叶中元素含量鉴别茶叶产地的方法 | |
CN104062259B (zh) | 一种采用近红外光谱快速测定复方阿胶浆中总皂苷含量的方法 | |
CN106560693A (zh) | 基于偏最小二乘判别的武夷岩茶产地鉴别方法 | |
CN106560695A (zh) | 联合三种检测方法的武夷岩茶产地鉴别方法 | |
CN105717066B (zh) | 一种基于加权相关系数的近红外光谱识别模型 | |
CN106680241A (zh) | 一种新型光谱多元分析分类与识别方法及其用途 | |
CN106560701A (zh) | 基于五隐藏层的武夷岩茶产地深度学习系统 | |
CN102778442A (zh) | 一种快速鉴别烟用香液料液种类的方法 | |
CN106560694A (zh) | 基于多种检验技术的武夷岩茶产地智能鉴别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170412 |