CN106560702A - 联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法 - Google Patents
联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法 Download PDFInfo
- Publication number
- CN106560702A CN106560702A CN201610915275.7A CN201610915275A CN106560702A CN 106560702 A CN106560702 A CN 106560702A CN 201610915275 A CN201610915275 A CN 201610915275A CN 106560702 A CN106560702 A CN 106560702A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- sample
- catechin
- tea
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
Landscapes
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Electrochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法,属于地理标志产品真实性识别技术领域,其目的在于解决单种检测数据无法代表产地溯源全部关键信息和不同类型检测数据在计量学方法中联合使用的数据匹配等问题。本发明基于最小二乘支持向量机判别模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)电子舌数据和色谱分离数据(包括氨基酸和儿茶素等)融合在一起,建立LS‑SVM分析模型,提取试样后利用模型客观、准确的判定岩茶产地,融合数据组成的模型其识别率最高,达100.0%,高于单种数据LS‑SVM结果,且对盲样的识别率达100%,具有较好应用前景,可作为武夷岩茶产地溯源识别技术方法。
Description
(一)技术领域
本发明涉及联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法,属于地理标志产品真实性识别技术领域。
(二)背景技术
根据GB/T 17924-2008的定义,地理标志产品是指利用产自特定地域的原材料,按照传统工艺在特定地域内所生产的,质量、特色或者声誉在本质上取决于其原产地域地理特征,并按法定程序经审核批准以原产地域名称命名的产品。茶叶具有明显的地域特色和品质特征,品质、口感与其产地的地理条件、气候因素、环境等因素密切相关,市场认可度和消费者喜爱程度也各有不同,是典型的地理标志保护产品。国家质检总局对特定区域内的茶叶进行原产地域产品的地理标识,如武夷岩茶、安溪铁观音、大红袍、永春佛手、西湖龙井、安吉白茶、祁门红茶、普洱茶、碧螺春茶等近50种地理标志产品茶叶。
目前,国内外已开展成品茶产地识别鉴定研究,仪器检测结合化学计量学分析方法为最主要产地识别方法,仪器检测方法主要有近红外光谱、同位素质谱、液相色谱、传感器等;常用计量学方法包括偏最小二乘、主成分分析、人工神经网络、支持向量机等。
电子舌是感官仿生技术在仪器分析中的一种应用,其原理是用多传感器阵列代替生物体的味觉系统,并由计算机代替大脑进行分析。当检测溶液吸附在传感器上时,传感器的电容发生改变,产生特征响应信号,由电子舌自带的专家自学习系统进行模式识别,做出定性和定量分析。吴飞等通过电子舌对不同产地4种枳实药材进行测定,用主成分分析(PCA)和判别因子分析(DFA)来判断测试枳实药材的产地归属,电子舌对枳实的判断结果与高效液相色谱验证一致;乔方等采用电子舌对深圳、惠东、惠来和钦州四大产区的妃子笑、桂味、糯米糍和怀枝荔枝进行检测,并用主成分分析法进行分析,结果表明,该方法可很好的区分同一品种不同产区的荔枝以及同一产区不同品种的荔枝,辨别指数分别在95%以上和98%以上。Buratti利用电子舌对4种品牌意大利的红酒和产自15个不同地方的干红葡萄酒样品进行检测,用主成分分析和线性判别法模式识别,显示电子舌能区分用同种葡萄酿造的不同红酒和能完全区分不同的产地的葡萄酒。
除了从近红外、同位素、微量元素和滋味(电子舌)等方面对样品进行分析检测外,还可以用色谱技术对样品的一些特征化合物进行定量分析。色谱法的原理是利用固定相和流动相对目标物质进行分离,然后再利用检测器对其进行定性、定量分析,最常检测的项目为儿茶素和氨基酸。康海宁等用高效液相色谱/二极管阵列检测器(HPLC/DAD)对33个茶样5种儿茶素和咖啡碱进行检测,通过聚类分析,可区分不同种类、不同产地及不同工艺的茶叶;王丽鸳等利用HPLC化学指纹图谱,针对儿茶素类和黄酮苷类物质进行武夷岩茶的分类识别试验,依据其判别函数得分值的差异,对不同原料品种、不同地区生产的武夷岩茶进行判别;宁井铭等利用液相色谱技术对来自云南普洱茶主要产区的20个晒青毛茶的儿茶素进行分析,结果表明,不同产地毛茶在主要化学成分组成上存在着差异性,同一地区毛茶基本一致。
从上述例子可以看出,国内外对地理标志产品的鉴别方法已有很多,但是很多研究尚有不足之处,如采样不充分样品数量少,无法保证样品的准确性和代表性;样品空间选择跨度大,往往选自不同国家、甚至不同洲,这类样品由于空间跨度大,本身就具有很大的区别,对小范围的地理标志产品产地判别借鉴意义不大;样品选取所带来的局限性,使得建模方法亦无法代表产地溯源的全部信息,导致产地识别率低;建模方法采用单种检测数据结合计量学方法进行,单种检测数据无法代表产地溯源的全部信息,导致产地识别率较低,上述这些严重影响了地理标志产品保护技术的创新和突破。针对如上情况,有必要建立一种联合电子舌和色谱分离技术的产地识别模型。
(三)发明内容
本发明目的在于解决单种检测数据无法代表产地溯源的全部关键信息以及不同类型检测数据在计量学方法中的联合使用所存在的数据匹配等问题,提供一种联合电子舌数据和色谱分离(包括氨基酸和儿茶素)数据的武夷岩茶产地识别模型技术方法,该方法基于最小二乘支持向量机(LS-SVM),将不同产地岩茶(包括地理标志产地内和产地外岩茶)电子舌数据和色谱分离(氨基酸和儿茶素)数据融合在一起,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地。
本发明采用的技术方案是:
联合电子舌数据和色谱分离技术的武夷岩茶产地鉴别方法,所述方法包括:
(A)采集不同产地岩茶样品:
武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的电子舌数据:
本研究采用ASTREE Electronic电子舌系统,该套系统具有一个电极(Ag/AgCl)以及7个独立传感器(ZZ、BA、BB、CA、GA、HA、JB),电子舌系统使用前用NaCl和C5H8NO4Na标准溶液对传感器进行活化,并依次进行信号校准和仪器自诊断,自诊断通过后可进行茶汤样品滋味的分析检测,检测完毕后,将电子舌数据以文本形式导出,取各传感器最后十秒(第91-100秒)稳定数据的均值作为检测数据进行后续分析。
(C)测定不同产地岩茶样品的氨基酸数据:
利用HPLC法对不同产地岩茶样品中的27种氨基酸进行检测,平行测定三次,取平均值。
通过SVM-RFE(支持向量机回归特征消去法)对武夷岩茶27种氨基酸组分数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出茶叶原产地的特征变量排列顺序为:天冬氨酰、脯氨酸、色氨酸、磷乙醇胺、尿素、缬氨酸。然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度增维精度、分辨率增维精度、识别率增维精度,由天冬酰胺、脯氨酸、色氨酸、磷乙醇胺四种氨基酸组成的模型,其识别率最高,达0.7768,说明此四种氨基酸间的信息具有一定互补性,之后,无论模型增加哪个氨基化合物,识别率基本稳定在0.7768下,说明其他氨基化合物对武夷岩茶的产地信息互补性较弱,可以仅选取排序前四的氨基化合物数据进行分析建模。
(D)测定不同产地岩茶样品的儿茶素数据:
利用HPLC法对不同产地岩茶样品中的6种儿茶素以及咖啡碱进行检测,平行测定3次,取平均值。
采用支持向量机回归特征消去法对儿茶素和咖啡碱共7个特征变量进行逐级组合后,各儿茶素和咖啡碱对于地理特征的贡献率从高到低依次为表没食子儿茶素(EGC)、儿茶素(C)、表没食子儿茶素没食子酸酯(EGCG)、没食子酸(GA)、表儿茶素(EC)、表儿茶素没食子酸酯(ECG)和咖啡碱。然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,最高模型识别率为0.8596,模型中包含EGC、C、EGCG、GA和EC,该模型的灵敏度为0.9322,分辨率为0.6734。基于儿茶素和咖啡碱数据建立的SVM-RFE模型,其灵敏度增维精度均高于0.9000,说明对于保护区内的岩茶样品判别结果较为可靠。而其分辨率均较低,说明对于地理标志保护区外的假冒岩茶样品容易发生误判。在EGC和C的SVM模型中,当增加了EGCG和GA后其识别率略有下降,说明EGC和C这两个儿茶素与EGC和C之间相关性亦较强,但无法提供增益的产地信息。但当EC变量被纳入模型时,模型识别率达到最高,说明EC是对EGC和C的产地信息表征的有益补充。ECG和咖啡碱再纳入模型中,识别率增维精度不断下降,说明ECG和咖啡碱不能对产地判别提供增益效益,且可能与前面的五种儿茶素之间存在一定的负相关关系,因此建模采用EGC、C、EGCG、GA和EC五种儿茶素含量。
(E)联合电子舌和色谱分离技术建立不同产地岩茶鉴别数据库:
(1)将电子舌7个独立传感器(按ZZ、BA、BB、CA、GA、HA、JB顺序)最后十秒(第91-100秒)稳定数据的均值拼接在Excel数据表格中,每行所有7列数据组成电子舌数据;
(2)将氨基酸数据按天冬酰胺、脯氨酸、色氨酸、磷乙醇胺顺序拼接在电子舌数据后,再将儿茶素数据按EGC、C、EGCG、GA和EC顺序拼接在氨基酸数据后,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.W.Kennard和L.A.Stone在Computer aided design ofexperiments中的方法,随机选取武夷岩茶产区内总数的65~70%作为原产地内模型数A1,随机取武夷岩茶产区外65~70%作为原产地外模型数A2,建立kenstone分割程序,其设计思路为:首先计算两两样本之间距离,选择距离最大的两个样品;然后分别计算剩余的样本与已选择的两个样本之间的距离;对于每个剩余样本而言,其与已选样品之间的最短距离被选择,然后选择这些最短距离中相对最长的距离所对应的样本,作为第三个样品;重复上述步骤,直至所选的样品的个数等于事先确定的数目为止。
(5)蒙特卡洛交叉验证(Monte Carlo cross vali-dation,MCCV)是筛选奇异样本的方法,用于解决复杂统计模型和矩阵高维问题,其核心是对样本的抽取,从给定的目标函数分布中进行高效抽样为其关键;随机选取一定的校正集建立最小二乘模型,剩余的样本作预测集对模型进行验证,经过多次循环后能够得到一组预测残差,通过预测残差计算出预测残差的均值与方差,判断异常样本并验证剔除异常样本对模型精度提高作用,可有效检出光谱阵和性质阵方向的奇异点。
(6)最小二乘支持向量机(Least Squares Support Vector Machines,LS-SVM)的建模思路:数据点对于对象模型的建立非同等重要,包含大的噪声信号的数据若与其它数据以同等权值参与训练,则模型的精度必定受到影响,因此,不同数据点在训练算法的目标函数中应区别对待,LS-SVM中由误差平方代替原松弛变量,将非线性估计函数转化为高维特征空间中线性估计函数,使得LS-SVM的训练过程遵循结构风险最小化原则,将不等式约束改为等式约束,将经验风险由偏差的一次方改为二次方,将求解二次规划问题转化为求解线性方程组,避免不敏感损失函数,极大降低计算复杂度。其设计思路为从机器学习损失函数着手,在其优化问题的目标函数中使用二范数,并利用等式约束条件代替SVM标准算法中的不等式约束条件,使得LS-SVM方法的优化问题的求解变为通过Kuhn-Tucker条件得到的一组线性方程组的求解。
(7)最小二乘支持向量机法鉴别模型的建立:对步骤(4)、(5)分割后的电子舌、氨基酸和儿茶素数据,采用最小二乘支持向量机分析并建立LS-SVM模型;
(F)取待测未知产地样品按照上述步骤(B)、(C)和(D)测定电子舌、氨基酸和儿茶素数据,将测得数据代入上述LS-SVM模型,预测待测样品原产地域属性。
具体的,所述步骤(E)中分割程序分别为:[model1,test1]=kenstone(data1,A1)和[model2,test2]=kenstone(data2,A2),得到model1、test1、model2、test2。
具体的,所述步骤(E)中最小二乘支持向量机鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均数据:mx=mean(xxxc);
(d)训练集减去平均数据:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均数据:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)最大隐变量数:lvm=18;
(h)分二列学习,用蒙特卡罗交互验证确定隐变量lvp:
[epmccv1,lvp1]=mccvforpls(xxxc,yyc(:,1),lvm);
[epmccv2,lvp2]=mccvforpls(xxxc,yyc(:,2),lvm);
(i)建模过程:
预处理:model=initlssvm(x,y,type,[],[],kernel);
模型测定:model=tunelssvm(model,′simplex′,optfun,optargs);
训练集测定:model=trainlssvm(model);
(j)根据测定结果,采用plotlssvm预测结果,并分别输出yp、alpha、b、gam和sig2:
plotlssvm(model);
end
yp=simlssvm(model,x);
alpha=model.alpha;
b=model.b;
gam=model.gam;sig2=model.kernel_pars;
其中kenstone程序如下所示:
其中mccvforpls程序如下所示:
其中LS-SVM程序如下所示:
LS-SVM程序中所包含的initlssvm程序如下:
LS-SVM程序中所包含的trainlssvm程序如下:
本发明的有益效果主要体现在:本发明基于最小二乘支持向量机模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)电子舌数据和色谱分离(包括氨基酸和儿茶素)数据融合在一起,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地,其识别率最高,达100.0%,高于单种数据LS-SVM鉴别结果。
(四)具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
实施例1:
A、采集不同产地岩茶样品
国标(GB/T 18745-2006)中规定了武夷岩茶的地理保护范围,即福建省武夷山市行政区划内,本发明在武夷岩茶地理标志保护区武夷街道、崇安街道、上梅、星村、五夫、岚谷、新丰街道、洋庄、兴田、下梅、吴屯11个行政区域内进行样品采集,每个行政区域内随机选择3个取样点(以A、B、C进行标示),共33个取样点,取样范围基本涵盖主要产区,每个采样点取样15份(分别以A-1、A-2......A-15标示),获得495份地理标志保护区武夷岩茶样品,另在福建省除武夷山市外其他县市(建阳、建瓯、漳州、泉州、松溪、政和),以及广西、贵州、江西(婺源、赣州)等11个地点收集保护区外岩茶样品,每个地点取样15份(分别以1、2......15进行标示),获得165个非地理标志保护区岩茶样品。地理标志产地内样品数与地理标志产地外样品数之比为3∶1。
B、不同产地岩茶电子舌数据
ASTREE Electronic电子舌系统,7个独立传感器名称分别为ZZ、BA、BB、CA、GA、HA、JB。各传感器最后十秒(第91-100秒)稳定数据的均值作为检测数据。其数据见表1。
表1 部分岩茶7个传感器最后10秒均值数据表
C、测定不同产地岩茶样品的氨基酸数据
采用高效液相衍生化法对不同产地岩茶样品中的27种氨基酸进行检测,平行测定三次,取平均值,部分岩茶样品7种氨基酸含量数据见表2。
表2 不同产地部分岩茶7种氨基酸含量(单位:百分比)
通过SVM对武夷岩茶氨基酸组分数据进行训练和预测,确定其排序顺序为天冬酰胺、脯氨酸、色氨酸、磷乙醇胺、尿素、缬氨酸。然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,由天冬酰胺、脯氨酸、色氨酸、磷乙醇胺四种氨基酸组成的模型,其识别率最高,达0.7768,说明此四种氨基酸间的信息具有一定互补性,因此仅选取排序前四的氨基化合物数据进行分析建模。
D、测定不同产地岩茶样品的儿茶素数据
利用HPLC法对不同产地岩茶样品中的6种儿茶素以及咖啡碱进行检测,平行测定3次,取平均值,部分岩茶样品儿茶素和咖啡碱含量数据如表3。
表3 不同产地部分岩茶儿茶素和咖啡碱含量
待测样名称 | GA | EGC | C | EC | EGCG | ECG | 咖啡碱 |
上梅A-2 | 0.19 | 2.18 | 0.67 | 0.62 | 4.21 | 1.13 | 3.03 |
星村A-2 | 0.27 | 1.38 | 0.72 | 0.38 | 3.79 | 0.97 | 3.07 |
五夫A-2 | 0.28 | 3.80 | 1.16 | 1.05 | 7.38 | 1.92 | 2.83 |
岚谷A-2 | 0.15 | 1.65 | 0.52 | 0.57 | 3.13 | 0.92 | 2.89 |
崇安街道A-2 | 0.10 | 3.05 | 0.76 | 0.78 | 4.26 | 0.99 | 2.80 |
新丰街道A-2 | 0.13 | 2.06 | 0.44 | 0.70 | 3.08 | 0.95 | 2.96 |
洋庄A-2 | 0.16 | 1.69 | 0 | 0 | 4.20 | 0.10 | 2.36 |
兴田A-2 | 0.11 | 1.89 | 0.37 | 0.53 | 4.08 | 1.19 | 2.13 |
下梅A-2 | 0.23 | 0.98 | 0.58 | 0.32 | 2.85 | 1.08 | 2.66 |
吴屯A-2 | 0.11 | 2.09 | 0.34 | 0.56 | 4.98 | 1.27 | 2.34 |
武夷街道A-2 | 0.18 | 0 | 0.63 | 0.44 | 4.35 | 1.05 | 2.39 |
建阳-2 | 0.15 | 0.10 | 0.45 | 0.38 | 3.69 | 1.08 | 2.29 |
建瓯-2 | 0.14 | 0 | 0.35 | 0.37 | 3.38 | 1.03 | 3.15 |
漳州-2 | 0.13 | 1.66 | 0.22 | 0.55 | 4.26 | 1.28 | 2.33 |
泉州-2 | 0.12 | 1.35 | 0.19 | 0.35 | 3.88 | 1.11 | 1.82 |
浦城-2 | 0.16 | 1.43 | 0.25 | 0.38 | 4.62 | 1.17 | 2.23 |
贵州-2 | 0.38 | 0 | 0.34 | 0.10 | 0.26 | 0.77 | 3.54 |
松溪-2 | 0.20 | 1.06 | 0.25 | 0.32 | 4.09 | 1.12 | 2.05 |
政和-2 | 0.25 | 0.64 | 0.49 | 0.27 | 2.69 | 0.85 | 2.86 |
广西-2 | 0.25 | 1.15 | 0.33 | 0.65 | 4.09 | 1.68 | 3.47 |
婺源-2 | 0.31 | 0.04 | 0.14 | 0 | 0.15 | 0.32 | 3.32 |
赣州-2 | 0.33 | 0.01 | 0.15 | 0 | 0.07 | 0.22 | 2.87 |
通过SVM对武夷岩茶儿茶素和咖啡碱组分数据进行训练和预测,各儿茶素和咖啡碱对于地理特征的贡献率从高到低依次为EGC、C、EGCG、GA、EC、ECG和咖啡碱。这说明各变量经SVM回归特征消去法与全数据模型进行训练集的训练比较后,表没食子儿茶素的识别率增维精度最高。模型最高识别率为0.8596,模型中包含EGC、C、EGCG、GA和EC,该模型的灵敏度为0.9322,分辨率为0.6734。
E、联合电子舌、氨基酸和儿茶素建立不同产地岩茶鉴别数据库
(1)将电子舌7个独立传感器(按ZZ、BA、BB、CA、GA、HA、JB顺序)最后十秒稳定数据的均值拼接在Excel数据表格中,每行所有7列数据组成电子舌数据。
(2)将氨基酸数据按天冬酰胺、脯氨酸、色氨酸、磷乙醇胺顺序拼接在电子舌数据后,儿茶素数据按EGC、C、EGCG、GA和EC顺序拼接在氨基酸数据后,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.W.Kennard和L.A.Stone在Computer aided design ofexperiments上所述方法,原产地内随机取330(A1)个样品作为模型,原产地外随机取110(A2)个样品作为模型,建立kenstone分割程序,[model1,test1]=kenstone(data1,330)和[model2,test2]=kenstone(data2,110),得到model1、test1、model2、test2。
(5)对上述步骤(4)分割后的电子舌、氨基酸和儿茶素数据,采用最小二乘支持向量机分析并建立LS-SVM模型;
F、将待测未知产地样品的电子舌、氨基酸和儿茶素数据,采用上述LS-SVM模型进行分析,判断待测样品原产地域属性。
具体的,所述步骤(E)中最小二乘支持向量机鉴别模型的建立过程如下:
①合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
②合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
③求训练集平均数据:mx=mean(xxxc);
④训练集减去平均数据:xxxc=xxxc-ones(440,1)*mx;
⑤预测集减去平均数据:xxxp=xxxp-ones(220,1)*mx;
⑥响应变量:yyc=-ones(440,2);yyc(1:330,1)=1;yyc(331:440,2)=1;
⑦最大隐变量数:lvm=18;
⑧分二列学习,用蒙特卡罗交互验证确定隐变量lvp:
[epmccv1,lvp1]=mccvforpls(xxxc,yyc(:,1),lvm);
[epmccv2,lvp2]=mccvforpls(xxxc,yyc(:,2),lvm);
⑨建模过程:
预处理:model=initlssvm(x,y,type,[],[],kernel);
模型测定:model=tunelssvm(model,′simplex′,optfun,optargs);
训练集测定:model=trainlssvm(model);
⑩根据测定结果,采用plotlssvm预测结果,输出yp、alpha、b、gam和sig2:
plotlssvm(model);
end
yp=simlssvm(model,x);
alpha=model.alpha;
b=model.b;
gam=model.gm;sig2=model.kernel_pars;
G、LS-SVM模型识别率
按上述建模方法分别对电子舌、氨基酸、儿茶素以及三者联合数据进行建模分析,其结果见表4。
表4:LS-SVM分类模型判别结果汇总
电子舌、氨基酸、儿茶素各特征指标之间具有互补性,采用本发明LS-SVM建模方法对电子舌、氨基酸、儿茶素以及三者融合数据进行分析,由三者组成的融合数据其识别率最高,达100.0%,远高于单种数据LS-SVM鉴别结果。
实施例2:
盲样检测:盲样监督小组从武夷岩茶农户处购买岩茶样品,监控晒青、做青、杀青等步骤,确保岩茶样品的原产地域属性,上述样品作为盲样中的地理标志产区内样品;从建阳、建瓯、婺源等地购买岩茶,作为盲样中的地理标志产区外样品,上述盲样与建模岩茶样品出自不同的厂家。分析检测人员事先未能得知待测盲样的产地属性,随机选取若干份,检测,再按本发明方法对盲样产地属性进行判断,并与盲样监督小组进行核对,确定盲样识别率。分别选取20、60、100个盲样,按照实施例1中步骤(B)、(C)和(D)方法获得的盲样数据代入上述LS-SVM模型,判断其地理标志属性,其判别识别率均为100%。
实施例3:
采用与实施例1相同的建模方法,数据分割用Kenstone分割程序,用蒙特卡洛交互验证,分别建立最小二乘支持向量机(LS-SVM)、神经网络ELM、偏最小二乘(PLSDA)模型,电子舌数据不变(ZZ、BA、BB、CA、GA、HA、JB),氨基酸和儿茶素数据分别按照天冬氨酰、脯氨酸、色氨酸、磷乙醇胺、尿素、缬氨酸、EGC、C、EGCG、GA、EC、ECG和咖啡碱拼接在电子舌数据后,其模型识别率分别为91.3%、80.9%、77.5%。
实施例4:
采用与实施例1相同的建模方法,数据分割用Kenstone分割程序,用蒙特卡洛交互验证,分别建立最小二乘支持向量机(LS-SVM)、神经网络ELM、偏最小二乘(PLSDA)模型,电子舌数据不变(ZZ、BA、BB、CA、GA、HA、JB),氨基酸和儿茶素数据分别按照天冬氨酰、脯氨酸、色氨酸、磷乙醇胺、尿素、缬氨酸、EGC、C、EGCG、GA和EC拼接在电子舌数据后,其模型识别率分别为94.7%、81.3%、80.9%。
实施例5:
采用与实施例1相同的建模方法,数据分割用Kenstone分割程序,用蒙特卡洛交互验证,分别建立最小二乘支持向量机(LS-SVM)、神经网络ELM、偏最小二乘(PLSDA)模型,电子舌数据不变(ZZ、BA、BB、CA、GA、HA、JB),氨基酸和儿茶素数据分别按照天冬氨酰、脯氨酸、色氨酸、磷乙醇胺、EGC、C、EGCG、GA和EC拼接在电子舌数据后,其模型识别率分别为100.0%、85.4%、88.6%。
实施例6~9:
实施例6-9中所述的岩茶样品、电子舌、氨基酸以及儿茶素数据与实施例1相同,但采用不同的分析方法,实施例6采用本发明权利保护范围外的情况,实施例7-9分别采用现有发明专利CN103630528A(申请号201210307144.2)、CN102455320A(申请号201010526790.9)、CN103245713A(申请号201310095950.2)所述方法进行鉴别,实施例6~9与实施例1指标区别见表5。
表5:实施例6~9与实施例1指标情况对比表
从上述比较结果可以得出,采用本发明方法,其盲样检测率达100.0%,可作为武夷岩茶产地溯源识别技术方法。
Claims (4)
1.联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法,所述方法包括:
(A)采集不同产地岩茶样品:
武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的电子舌数据:
本研究采用ASTREE Electronic电子舌系统,该套系统具有一个电极(Ag/AgCl)以及7个独立传感器(ZZ、BA、BB、CA、GA、HA、JB),电子舌系统使用前用NaCl和C5H8NO4Na标准溶液对传感器进行活化,并依次进行信号校准和仪器自诊断,自诊断通过后可进行茶汤样品滋味的分析检测,检测完毕后,将电子舌数据以文本形式导出,取各传感器最后十秒(第91-100秒)稳定数据的均值作为检测数据进行后续分析;
(C)测定不同产地岩茶样品的氨基酸数据:
利用HPLC法对不同产地岩茶样品中的27种氨基酸进行检测,平行测定三次,取平均值;
通过SVM-RFE(支持向量机回归特征消去法)对武夷岩茶27种氨基酸组分数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出茶叶原产地的特征变量排列顺序为:天冬氨酰、脯氨酸、色氨酸、磷乙醇胺、尿素、缬氨酸;然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,由天冬酰胺、脯氨酸、色氨酸、磷乙醇胺四种氨基酸组成的模型,其识别率最高,达0.7768,说明此四种氨基酸间的信息具有一定互补性,之后,无论模型增加哪个氨基化合物,识别率基本稳定在0.7768以下,说明其他氨基化合物对武夷岩茶的产地信息互补性较弱,可以仅选取排序前四的氨基化合物数据进行分析建模;
(D)测定不同产地岩茶样品的儿茶素数据:
利用HPLC法对不同产地岩茶样品中的6种儿茶素以及咖啡碱进行检测,平行测定3次,取平均值;
采用支持向量机回归特征消去法对儿茶素和咖啡碱共7个特征变量进行逐级组合后,各儿茶素和咖啡碱对于地理特征的贡献率从高到低依次为表没食子儿茶素(EGC)、儿茶素(C)、表没食子儿茶素没食子酸酯(EGCG)、没食子酸(GA)、表儿茶素(EC)、表儿茶素没食子酸酯(ECG)和咖啡碱;然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,模型最高识别率为0.8596,模型中包含EGC、C、EGCG、GA和EC,因此建模采用EGC、C、EGCG、GA和EC五种儿茶素含量;
(E)联合电子舌和色谱分离技术建立不同产地岩茶鉴别数据库:
(1)将电子舌7个独立传感器(按ZZ、BA、BB、CA、GA、HA、JB顺序)最后十秒(第91-100秒)稳定数据的均值拼接在Excel数据表格中,每行所有7列数据组成电子舌数据;
(2)将氨基酸数据按天冬酰胺、脯氨酸、色氨酸、磷乙醇胺顺序拼接在电子舌数据后,再将儿茶素数据按EGC、C、EGCG、GA和EC顺序拼接在氨基酸数据后,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.W.Kennard和L.A.Stone在Computer aided design ofexperiments中的方法,随机选取武夷岩茶产区内总数的65~70%作为原产地内模型数A1,随机取武夷岩茶产区外65~70%作为原产地外模型数A2,建立kenstone分割程序,并采用蒙特卡洛交叉验证法进行验证;
(5)最小二乘支持向量机法鉴别模型的建立:对步骤(4)处理后的电子舌、氨基酸和儿茶素数据,采用最小二乘支持向量机分析并建立LS-SVM模型;
(F)取待测未知产地样品按照上述步骤B、C和D测定电子舌、氨基酸和儿茶素数据,将测得数据代入上述LS-SVM模型,预测待测样品原产地域属性。
2.如权利要求1所述的方法,其特征在于所述步骤(E)中分割程序分别为:[model1,test1]=kenstone(data1,A1)和[model2,test2]=kenstone(data2,A2),得到model1、test1、model2、test2。
3.如权利要求1所述的方法,其特征在于所述步骤(E)中最小二乘支持向量机鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均数据:mx=mean(xxxc);
(d)训练集减去平均数据:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均数据:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)最大隐变量数:lvm=18;
(h)分二列学习,用蒙特卡罗交互验证确定隐变量lvp:
[epmccv1,lvp1]=mccvforpls(xxxc,yyc(:,1),lvm);
[epmccv2,lvp2]=mccvforpls(xxxc,yyc(:,2),lvm);
(i)建模过程:
预处理:model=initlssvm(x,y,type,[],[],kernel);
模型测定:model=tunelssvm(model,′simplex′,optfun,optargs);
训练集测定:model=trainlssvm(model);
(j)根据测定结果,采用plotlssvm预测结果,并分别输出yp、alpha、b、gam和sig2:
plotlssvm(model);
end
yp=simlssvm(model,x);
alpha=model.alpha;
b=model.b;
gam=model.gm;sig2=model.kernel_pars。
4.如权利要求1所述的方法,其特征在于本发明所述最小二乘支持向量机(LS-SVM)建模方法对电子舌、氨基酸、儿茶素的融合数据进行建模分析,模型识别率最高,达100.0%,远高于单种数据的LS-SVM判别结果;针对20、60、100个盲样,检测识别率均达100.0%,本发明方法可作为武夷岩茶产地溯源识别技术方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610915275.7A CN106560702A (zh) | 2016-10-20 | 2016-10-20 | 联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610915275.7A CN106560702A (zh) | 2016-10-20 | 2016-10-20 | 联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106560702A true CN106560702A (zh) | 2017-04-12 |
Family
ID=58485772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610915275.7A Pending CN106560702A (zh) | 2016-10-20 | 2016-10-20 | 联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106560702A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
CN110954666A (zh) * | 2019-11-14 | 2020-04-03 | 温州大学 | 一种基于偏最小二乘判别分析模型的茶叶等级判别方法 |
CN113777200A (zh) * | 2021-09-17 | 2021-12-10 | 启东赢维数据信息科技有限公司 | 一种基于电子舌数据预测黄酒中谷氨酸含量的方法 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09248163A (ja) * | 1996-03-14 | 1997-09-22 | Hitachi Zosen Corp | 味品質を確保した杜仲茶 |
CN101303296A (zh) * | 2008-06-20 | 2008-11-12 | 中国农业科学院茶叶研究所 | 地理标志保护的西湖龙井的真伪鉴别方法 |
US20090212663A1 (en) * | 2007-09-10 | 2009-08-27 | The University Of Hong Kong | Electronic tongue sensor |
CN101692053A (zh) * | 2009-10-09 | 2010-04-07 | 江苏大学 | 基于多传感信息融合的名优茶品质仪器智能化审评方法 |
CN101957342A (zh) * | 2009-07-20 | 2011-01-26 | 杭州晟迈智能科技有限公司 | 一种伏安型电子舌 |
US20110166946A1 (en) * | 2008-09-11 | 2011-07-07 | Nestec S.A. | Method of promoting and selling coffee |
CN102222164A (zh) * | 2011-05-30 | 2011-10-19 | 中国标准化研究院 | 一种食品感官质量评价方法及系统 |
CN102279168A (zh) * | 2011-07-20 | 2011-12-14 | 浙江大学 | 基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法 |
CN102645464A (zh) * | 2012-04-23 | 2012-08-22 | 上海应用技术学院 | 一种利用电子舌系统快速检测黄酒中氨基酸的方法 |
CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
CN104450698A (zh) * | 2014-12-11 | 2015-03-25 | 中国计量学院 | 一种蜘蛛线粒体nd4基因全序列扩增引物及鉴定方法 |
CN104483414A (zh) * | 2014-12-30 | 2015-04-01 | 江南大学 | 一种快速鉴定无锡毫茶等级的检测方法 |
CN104506162A (zh) * | 2014-12-15 | 2015-04-08 | 西北工业大学 | 基于ls-svr建模的高阶粒子滤波器的故障预示方法 |
CN104849318A (zh) * | 2015-05-06 | 2015-08-19 | 浙江大学 | 基于味觉嗅觉指纹图谱检测不同成熟度柑橘品质的方法 |
CN104897608A (zh) * | 2015-06-19 | 2015-09-09 | 福建农林大学 | 一种基于近红外光谱技术的乌龙茶品质鉴定方法 |
CN104914190A (zh) * | 2015-06-23 | 2015-09-16 | 福建省农业科学院农业工程技术研究所 | 一种茶叶种类鉴别和21种特征成分含量测定的方法 |
CN105628780A (zh) * | 2015-12-22 | 2016-06-01 | 中国农业科学院茶叶研究所 | 一种扁形茶的产地识别方法 |
CN105866223A (zh) * | 2016-03-29 | 2016-08-17 | 福建农林大学 | 一种基于电子舌检测信息的武夷岩茶滋味等级判别方法 |
-
2016
- 2016-10-20 CN CN201610915275.7A patent/CN106560702A/zh active Pending
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09248163A (ja) * | 1996-03-14 | 1997-09-22 | Hitachi Zosen Corp | 味品質を確保した杜仲茶 |
US20090212663A1 (en) * | 2007-09-10 | 2009-08-27 | The University Of Hong Kong | Electronic tongue sensor |
CN101303296A (zh) * | 2008-06-20 | 2008-11-12 | 中国农业科学院茶叶研究所 | 地理标志保护的西湖龙井的真伪鉴别方法 |
US20110166946A1 (en) * | 2008-09-11 | 2011-07-07 | Nestec S.A. | Method of promoting and selling coffee |
CN101957342A (zh) * | 2009-07-20 | 2011-01-26 | 杭州晟迈智能科技有限公司 | 一种伏安型电子舌 |
CN101692053A (zh) * | 2009-10-09 | 2010-04-07 | 江苏大学 | 基于多传感信息融合的名优茶品质仪器智能化审评方法 |
CN102222164A (zh) * | 2011-05-30 | 2011-10-19 | 中国标准化研究院 | 一种食品感官质量评价方法及系统 |
CN102279168A (zh) * | 2011-07-20 | 2011-12-14 | 浙江大学 | 基于近红外光谱技术快速无损分析整粒棉籽营养品质的方法 |
CN102645464A (zh) * | 2012-04-23 | 2012-08-22 | 上海应用技术学院 | 一种利用电子舌系统快速检测黄酒中氨基酸的方法 |
CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
CN104450698A (zh) * | 2014-12-11 | 2015-03-25 | 中国计量学院 | 一种蜘蛛线粒体nd4基因全序列扩增引物及鉴定方法 |
CN104506162A (zh) * | 2014-12-15 | 2015-04-08 | 西北工业大学 | 基于ls-svr建模的高阶粒子滤波器的故障预示方法 |
CN104483414A (zh) * | 2014-12-30 | 2015-04-01 | 江南大学 | 一种快速鉴定无锡毫茶等级的检测方法 |
CN104849318A (zh) * | 2015-05-06 | 2015-08-19 | 浙江大学 | 基于味觉嗅觉指纹图谱检测不同成熟度柑橘品质的方法 |
CN104897608A (zh) * | 2015-06-19 | 2015-09-09 | 福建农林大学 | 一种基于近红外光谱技术的乌龙茶品质鉴定方法 |
CN104914190A (zh) * | 2015-06-23 | 2015-09-16 | 福建省农业科学院农业工程技术研究所 | 一种茶叶种类鉴别和21种特征成分含量测定的方法 |
CN105628780A (zh) * | 2015-12-22 | 2016-06-01 | 中国农业科学院茶叶研究所 | 一种扁形茶的产地识别方法 |
CN105866223A (zh) * | 2016-03-29 | 2016-08-17 | 福建农林大学 | 一种基于电子舌检测信息的武夷岩茶滋味等级判别方法 |
Non-Patent Citations (5)
Title |
---|
ANNA KUTYLA-OLESIUK: "Evaluation of organoleptic and texture properties of dired apples by hybrid electronic tongue", 《SENSORS AND ACTUATORS B:CHEMICAL》 * |
叶子弘 等: "茶叶原产地检测方法及其应用", 《中国计量学院学报》 * |
王凯丽 等: "基于电子舌和多元数据分析的咖啡焙炒度检测方法研究", 《热带作物学报》 * |
董增川 等: "《滦河流域水资源优化配置与承载能力研究》", 31 January 2015 * |
言思敏: "地理标志产品武夷岩茶的产地识别技术研究", 《中国优秀硕士学位论文全文数据库农业科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110954666A (zh) * | 2019-11-14 | 2020-04-03 | 温州大学 | 一种基于偏最小二乘判别分析模型的茶叶等级判别方法 |
CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
CN113777200A (zh) * | 2021-09-17 | 2021-12-10 | 启东赢维数据信息科技有限公司 | 一种基于电子舌数据预测黄酒中谷氨酸含量的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106560695A (zh) | 联合三种检测方法的武夷岩茶产地鉴别方法 | |
CN106560691A (zh) | 具有深度学习功能的武夷岩茶产地鉴别方法 | |
CN106560693A (zh) | 基于偏最小二乘判别的武夷岩茶产地鉴别方法 | |
CN104914190B (zh) | 一种茶叶种类鉴别和21种特征成分含量测定的方法 | |
CN106560700A (zh) | 能自动鉴别武夷岩茶产地的机器学习方法 | |
Kovács et al. | Geographical origin identification of pure Sri Lanka tea infusions with electronic nose, electronic tongue and sensory profile analysis | |
CN106560692A (zh) | 联合四种检验技术的武夷岩茶产地鉴别方法 | |
CN106560694A (zh) | 基于多种检验技术的武夷岩茶产地智能鉴别方法 | |
CN106560698A (zh) | 基于多种检测技术的植物产地鉴别方法 | |
CN106560841A (zh) | 基于深度学习的武夷岩茶产地鉴别方法 | |
Huang et al. | Improved generalization of spectral models associated with Vis-NIR spectroscopy for determining the moisture content of different tea leaves | |
CN106560697A (zh) | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 | |
CN106560699A (zh) | 用于武夷岩茶产地鉴别的联合检测方法 | |
CN106560701A (zh) | 基于五隐藏层的武夷岩茶产地深度学习系统 | |
CN105044198B (zh) | 一种基于矿质元素指纹鉴别葡萄酒原产地的方法 | |
CN106560702A (zh) | 联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法 | |
CN106560704A (zh) | 联合同位素和微量元素检验的武夷岩茶产地鉴别方法 | |
Sáiz-Abajo et al. | Classification of wine and alcohol vinegar samples based on near-infrared spectroscopy. Feasibility study on the detection of adulterated vinegar samples | |
CN101413883A (zh) | 一种用红外光谱技术鉴别茶叶产地的方法 | |
Wallace et al. | Identification of adulteration in botanical samples with untargeted metabolomics | |
CN110133050A (zh) | 一种基于多传感器指纹图谱定性定量检测茶叶品质的方法 | |
CN103115892A (zh) | 应用近红外光谱分析技术制备银杏叶提取物的方法 | |
CN104807777A (zh) | 一种基于近红外光谱分析技术的槟榔水分含量快速检测方法 | |
Pasquini et al. | Chiral cyclodextrin-modified micellar electrokinetic chromatography and chemometric techniques for green tea samples origin discrimination | |
Cui et al. | Machine learning applications for identify the geographical origin, variety and processing of black tea using 1H NMR chemical fingerprinting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170412 |
|
RJ01 | Rejection of invention patent application after publication |