CN106560701A - 基于五隐藏层的武夷岩茶产地深度学习系统 - Google Patents
基于五隐藏层的武夷岩茶产地深度学习系统 Download PDFInfo
- Publication number
- CN106560701A CN106560701A CN201610915353.3A CN201610915353A CN106560701A CN 106560701 A CN106560701 A CN 106560701A CN 201610915353 A CN201610915353 A CN 201610915353A CN 106560701 A CN106560701 A CN 106560701A
- Authority
- CN
- China
- Prior art keywords
- data
- sample
- tea
- model
- catechin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011435 rock Substances 0.000 title claims abstract description 59
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 52
- 241001122767 Theaceae Species 0.000 title claims abstract 23
- 238000000034 method Methods 0.000 claims abstract description 63
- ADRVNXBAWSRFAJ-UHFFFAOYSA-N catechin Natural products OC1Cc2cc(O)cc(O)c2OC1c3ccc(O)c(O)c3 ADRVNXBAWSRFAJ-UHFFFAOYSA-N 0.000 claims abstract description 46
- 235000005487 catechin Nutrition 0.000 claims abstract description 46
- PFTAWBLQPZVEMU-DZGCQCFKSA-N (+)-catechin Chemical compound C1([C@H]2OC3=CC(O)=CC(O)=C3C[C@@H]2O)=CC=C(O)C(O)=C1 PFTAWBLQPZVEMU-DZGCQCFKSA-N 0.000 claims abstract description 42
- 239000011573 trace mineral Substances 0.000 claims abstract description 42
- 235000013619 trace mineral Nutrition 0.000 claims abstract description 42
- 229950001002 cianidanol Drugs 0.000 claims abstract description 41
- 238000001514 detection method Methods 0.000 claims abstract description 27
- 238000001228 spectrum Methods 0.000 claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 238000013528 artificial neural network Methods 0.000 claims abstract description 6
- LNTHITQWFMADLM-UHFFFAOYSA-N gallic acid Chemical compound OC(=O)C1=CC(O)=C(O)C(O)=C1 LNTHITQWFMADLM-UHFFFAOYSA-N 0.000 claims description 56
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 38
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 claims description 38
- 210000002105 tongue Anatomy 0.000 claims description 37
- XMOCLSLCDHWDHP-IUODEOHRSA-N epi-Gallocatechin Chemical compound C1([C@H]2OC3=CC(O)=CC(O)=C3C[C@H]2O)=CC(O)=C(O)C(O)=C1 XMOCLSLCDHWDHP-IUODEOHRSA-N 0.000 claims description 34
- 229940074391 gallic acid Drugs 0.000 claims description 28
- 235000004515 gallic acid Nutrition 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 27
- 229910052792 caesium Inorganic materials 0.000 claims description 23
- 229910052791 calcium Inorganic materials 0.000 claims description 23
- 239000011575 calcium Substances 0.000 claims description 23
- 229910052802 copper Inorganic materials 0.000 claims description 23
- 239000010949 copper Substances 0.000 claims description 23
- 229910052701 rubidium Inorganic materials 0.000 claims description 22
- WMBWREPUVVBILR-WIYYLYMNSA-N (-)-Epigallocatechin-3-o-gallate Chemical compound O([C@@H]1CC2=C(O)C=C(C=C2O[C@@H]1C=1C=C(O)C(O)=C(O)C=1)O)C(=O)C1=CC(O)=C(O)C(O)=C1 WMBWREPUVVBILR-WIYYLYMNSA-N 0.000 claims description 21
- WMBWREPUVVBILR-UHFFFAOYSA-N GCG Natural products C=1C(O)=C(O)C(O)=CC=1C1OC2=CC(O)=CC(O)=C2CC1OC(=O)C1=CC(O)=C(O)C(O)=C1 WMBWREPUVVBILR-UHFFFAOYSA-N 0.000 claims description 20
- 229940030275 epigallocatechin gallate Drugs 0.000 claims description 20
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 19
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 claims description 19
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 19
- 229960001948 caffeine Drugs 0.000 claims description 19
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 claims description 19
- 229910052799 carbon Inorganic materials 0.000 claims description 19
- 239000001257 hydrogen Substances 0.000 claims description 19
- 229910052739 hydrogen Inorganic materials 0.000 claims description 19
- 229910052757 nitrogen Inorganic materials 0.000 claims description 19
- 229910052760 oxygen Inorganic materials 0.000 claims description 19
- 239000001301 oxygen Substances 0.000 claims description 19
- PFTAWBLQPZVEMU-ZFWWWQNUSA-N (+)-epicatechin Natural products C1([C@@H]2OC3=CC(O)=CC(O)=C3C[C@@H]2O)=CC=C(O)C(O)=C1 PFTAWBLQPZVEMU-ZFWWWQNUSA-N 0.000 claims description 18
- PFTAWBLQPZVEMU-UKRRQHHQSA-N (-)-epicatechin Chemical compound C1([C@H]2OC3=CC(O)=CC(O)=C3C[C@H]2O)=CC=C(O)C(O)=C1 PFTAWBLQPZVEMU-UKRRQHHQSA-N 0.000 claims description 18
- LPTRNLNOHUVQMS-UHFFFAOYSA-N epicatechin Natural products Cc1cc(O)cc2OC(C(O)Cc12)c1ccc(O)c(O)c1 LPTRNLNOHUVQMS-UHFFFAOYSA-N 0.000 claims description 18
- 235000012734 epicatechin Nutrition 0.000 claims description 18
- 230000011218 segmentation Effects 0.000 claims description 18
- XMOCLSLCDHWDHP-UHFFFAOYSA-N L-Epigallocatechin Natural products OC1CC2=C(O)C=C(O)C=C2OC1C1=CC(O)=C(O)C(O)=C1 XMOCLSLCDHWDHP-UHFFFAOYSA-N 0.000 claims description 17
- DZYNKLUGCOSVKS-UHFFFAOYSA-N epigallocatechin Natural products OC1Cc2cc(O)cc(O)c2OC1c3cc(O)c(O)c(O)c3 DZYNKLUGCOSVKS-UHFFFAOYSA-N 0.000 claims description 17
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 claims description 16
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 16
- TVFDJXOCXUVLDH-UHFFFAOYSA-N caesium atom Chemical compound [Cs] TVFDJXOCXUVLDH-UHFFFAOYSA-N 0.000 claims description 16
- IGLNJRXAVVLDKE-UHFFFAOYSA-N rubidium atom Chemical compound [Rb] IGLNJRXAVVLDKE-UHFFFAOYSA-N 0.000 claims description 16
- 229910052712 strontium Inorganic materials 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 13
- 230000035945 sensitivity Effects 0.000 claims description 12
- 238000013135 deep learning Methods 0.000 claims description 11
- CIOAGBVUUVVLOB-UHFFFAOYSA-N strontium atom Chemical compound [Sr] CIOAGBVUUVVLOB-UHFFFAOYSA-N 0.000 claims description 11
- LSHVYAFMTMFKBA-TZIWHRDSSA-N (-)-epicatechin-3-O-gallate Chemical compound O([C@@H]1CC2=C(O)C=C(C=C2O[C@@H]1C=1C=C(O)C(O)=CC=1)O)C(=O)C1=CC(O)=C(O)C(O)=C1 LSHVYAFMTMFKBA-TZIWHRDSSA-N 0.000 claims description 10
- 241001269238 Data Species 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 10
- 230000007935 neutral effect Effects 0.000 claims description 9
- LSHVYAFMTMFKBA-UHFFFAOYSA-N ECG Natural products C=1C=C(O)C(O)=CC=1C1OC2=CC(O)=CC(O)=C2CC1OC(=O)C1=CC(O)=C(O)C(O)=C1 LSHVYAFMTMFKBA-UHFFFAOYSA-N 0.000 claims description 8
- 239000000470 constituent Substances 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 229910052788 barium Inorganic materials 0.000 claims description 6
- 238000013459 approach Methods 0.000 claims description 5
- 150000001765 catechin Chemical class 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 5
- 239000007788 liquid Substances 0.000 claims description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 4
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 230000000155 isotopic effect Effects 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000000918 plasma mass spectrometry Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 238000004092 self-diagnosis Methods 0.000 claims description 4
- 238000001479 atomic absorption spectroscopy Methods 0.000 claims description 3
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 claims description 3
- 229910052793 cadmium Inorganic materials 0.000 claims description 3
- 229910052804 chromium Inorganic materials 0.000 claims description 3
- 230000029087 digestion Effects 0.000 claims description 3
- 229910052749 magnesium Inorganic materials 0.000 claims description 3
- 229910052748 manganese Inorganic materials 0.000 claims description 3
- 238000000120 microwave digestion Methods 0.000 claims description 3
- 229910052759 nickel Inorganic materials 0.000 claims description 3
- 229910052725 zinc Inorganic materials 0.000 claims description 3
- 229910021607 Silver chloride Inorganic materials 0.000 claims description 2
- 238000003556 assay Methods 0.000 claims description 2
- 239000000796 flavoring agent Substances 0.000 claims description 2
- 235000019634 flavors Nutrition 0.000 claims description 2
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 2
- 238000003825 pressing Methods 0.000 claims description 2
- HKZLPVFGJNLROG-UHFFFAOYSA-M silver monochloride Chemical compound [Cl-].[Ag+] HKZLPVFGJNLROG-UHFFFAOYSA-M 0.000 claims description 2
- 239000011780 sodium chloride Substances 0.000 claims description 2
- 125000004435 hydrogen atom Chemical class [H]* 0.000 claims 5
- -1 Can Chemical compound 0.000 claims 1
- 238000004321 preservation Methods 0.000 claims 1
- 235000013616 tea Nutrition 0.000 abstract description 91
- 244000269722 Thea sinensis Species 0.000 description 93
- 150000002431 hydrogen Chemical class 0.000 description 11
- 235000006468 Thea sinensis Nutrition 0.000 description 10
- 235000020279 black tea Nutrition 0.000 description 10
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 6
- 235000009569 green tea Nutrition 0.000 description 6
- 244000294611 Punica granatum Species 0.000 description 5
- 235000014360 Punica granatum Nutrition 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 5
- 238000012850 discrimination method Methods 0.000 description 4
- 238000002329 infrared spectrum Methods 0.000 description 4
- 238000002307 isotope ratio mass spectrometry Methods 0.000 description 4
- 229910052751 metal Inorganic materials 0.000 description 4
- 244000025254 Cannabis sativa Species 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 235000012907 honey Nutrition 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- 238000009659 non-destructive testing Methods 0.000 description 2
- 235000008390 olive oil Nutrition 0.000 description 2
- 239000004006 olive oil Substances 0.000 description 2
- 235000020095 red wine Nutrition 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 244000235603 Acacia catechu Species 0.000 description 1
- 235000006226 Areca catechu Nutrition 0.000 description 1
- 235000019224 Camellia sinensis var Qingmao Nutrition 0.000 description 1
- 240000004307 Citrus medica Species 0.000 description 1
- 235000001938 Citrus medica Nutrition 0.000 description 1
- 235000002555 Citrus medica var sarcodactylis Nutrition 0.000 description 1
- 235000010254 Jasminum officinale Nutrition 0.000 description 1
- 240000005385 Jasminum sambac Species 0.000 description 1
- 241000134253 Lanka Species 0.000 description 1
- 238000004497 NIR spectroscopy Methods 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000001339 gustatory effect Effects 0.000 description 1
- 238000002354 inductively-coupled plasma atomic emission spectroscopy Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 235000020339 pu-erh tea Nutrition 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 235000020334 white tea Nutrition 0.000 description 1
- 235000014101 wine Nutrition 0.000 description 1
- 239000009853 xinfeng Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/3103—Atomic absorption analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
Landscapes
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Electrochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及基于五隐藏层的武夷岩茶产地深度学习系统,属于地理标志产品真实性识别技术领域,其目的在于解决单种检测数据无法代表产地溯源的全部关键信息以及不同类型检测数据在计量学方法中联合使用的数据匹配等问题。本发明基于神经网络ELM模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱、稳定同位素、微量元素、儿茶素和电子舌的数据融合在一起,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地,其识别率最高,达100.0%,高于单种数据ELM结果,且盲样检测识别率均达100.0%,具有较好应用前景,本发明方法可作为武夷岩茶产地溯源识别技术方法。
Description
(一)技术领域
本发明涉及基于五隐藏层的武夷岩茶产地深度学习系统,所述五隐藏层包括近红外光谱、稳定同位素、微量元素、儿茶素以及电子舌这五大类数据,属于地理标志产品真实性识别技术领域。
(二)背景技术
根据GB/T 17924-2008的定义,地理标志产品是指利用产自特定地域的原材料,按照传统工艺在特定地域内所生产的,质量、特色或者声誉在本质上取决于其原产地域地理特征,并按法定程序经审核批准以原产地域名称命名的产品。茶叶是典型的地理标志保护产品,有武夷岩茶、安溪铁观音、大红袍、永春佛手、西湖龙井、安吉白茶、祁门红茶、普洱茶、碧螺春茶等近50种地理标志产品茶叶。
目前,国内外已开展成品茶产地识别鉴定研究,仪器检测结合化学计量学分析方法为最主要产地识别方法,仪器检测方法主要有近红外光谱、同位素质谱、液相色谱、传感器等;常用计量学方法包括偏最小二乘、主成分分析、人工神经网络、支持向量机等。
近红外光谱检测技术广泛应用茶叶原产地检测中,Zhou等利用近红外光谱仪对25个西湖龙井和70个浙江龙井样品进行检测并建立费氏判别函数模型,训练集合、交叉验证集合和测试集合的识别准确率分别96.7%、95.3%和96.7%。周健等对4个龙井茶品种(龙井43、群体种、迎霜和乌牛早)进行近红外检测,并采用PLS建立模型,其4个品种茶叶准确率分别为89.8%、90.9%、96.1%和99.5%。占茉莉等采用近红外光谱仪扫描10份西湖龙井和18份浙江龙井茶叶样品,聚类分析表明,西湖龙井茶具有独特特征而自成一类,缙云和新昌表现出类似光谱特征存在交叉,富阳产的也自成一类。赵杰文等采用近红外光谱仪对龙井、碧螺春、毛峰和铁观音(各20份)进行检测,并采用主成分建立预测模型,校正集和预测集的鉴别准确率分别为98.75%和95.0%,但龙井样品易误判为碧螺春。陈全胜等采用近红外光谱对龙井、碧螺春、铁观音和祁门红茶进行检测,并建立SIMCA(基于主成分分析的一种分类方法)判别模型,龙井、碧螺春、祁门红茶和铁观音的识别准确率分别为90%、80%、100%和100%;李晓丽等对西湖龙井、浙江龙井、羊岩勾青、雪水云绿和庐山云雾茶(各30份)进行近红外检测,并采用主成分分析法建立模型,除西湖龙井和浙江龙井存在部分重叠外,其余均能很好的区分。
同位素是所有生物的一个自然标签,与生物的生长环境密切相关,因此同位素质谱(IRMS)为茶叶原产地识别提供科学的、可靠的鉴别方法。IRMS目前已经广泛应用在各种农产品的原产地检测中,等利用同位素质谱和核磁共振光谱,结合主成分分析,能够理想地鉴别斯洛文尼亚三个不同地区的红酒。Brescia等利用IRMS测定牛奶中的δ13C、δ15N和Ba元素含量,区分了不同原产地的牛奶,证明了IRMS适用于乳制品。
Martinelli等对来自美国、南美、欧洲和澳大利亚的气泡葡萄酒进行同位素检测,发现具有显著差异。Tamara等测定了43份印度、23份斯里兰卡和12份中国茶叶中稳定同位素,非线性分析表明茶叶原产地的判定易受判别函数的影响,很好的区分不同国家产区的茶叶。
王睿等采用电感耦合等离子体原子发射光谱法,对新疆6个主要产地的36个石榴样品的可食部分(果肉)和籽中12种金属元素的含量进行测定,采用主成分分析PCA和线性判别分析LDA对石榴可食部分和籽中金属元素进行综合评价。结果表明:PCA得出2个三因子模型,分别解释了石榴可食部分和籽中金属元素数据的84.29%和60.33%;通过对石榴可食部分中金属元素组成进行PCA,PCA可将36个石榴样品划分为6类,与实际产地吻合。陈辉等应用电感耦合等离子体质谱测定了北京顺义、河北阜平和河北平山三个地区65个荆条蜜样品中38种元素含量,并采用PCA和反向传输人工神经网络按照不同产地对荆条蜜进行了分析,交叉检验整体准确率为95.4%。
不同农产品因所处地理、气候、环境等的不同,常规和特殊化学成分的种类、含量都有所不同,可通过色谱技术测定其种类和含量的差异将来自不同产地的同一种农产品区分开,达到产地溯源的目的。LF等采用反相高效液相色谱法测定绿茶、红茶和黑茶中儿茶素、咖啡因等,来自5个不同国家28批次的茶叶(产自中国的红茶、绿茶、黑茶;产自日本的绿茶;产自斯里兰卡的红茶;产自肯尼亚的红茶以及产自印度的红茶)可采用PCA进行区分区分。Kodama等采用毛细管电泳测定了日本静冈(n=4)、鹿儿岛(n=4)、三重县(n=4)产的茶叶中7种儿茶素(+C、-C、EC、CG、ECG、EGC、EGCG)和咖啡因含量,采用PC(主成分分析),识别准确率100%。
电子舌是感官仿生技术在仪器分析中的一种应用,其原理是用多传感器阵列代替生物体的味觉系统,并由计算机代替大脑进行分析。当检测溶液吸附在传感器上时,传感器的电容发生改变,产生特征响应信号,由电子舌自带的专家自学习系统进行模式识别,做出定性和定量分析。传感器技术是一种快速简便的检测手段,且需要的样品量非常少;缺点是与其他检测方法相比,重复性较差,无法表征单一组分的差异。传感器技术也已有用来鉴定原产地。Guadarrama等利用电子舌对橄榄油进行质量控制,成功辨别出不同品种和不同原产地的西班牙橄榄油;Penza等利用膜传感器阵列结合人工神经网络,能够有效地分辨出9个不同原产地的意大利红酒。
从上述例子可以看出,国内外对地理标志产品的鉴别方法已有很多,但是很多研究尚有不足之处,如采样不充分样品数量少,无法保证样品的准确性和代表性;样品空间选择跨度大,往往选自不同国家、不同地区,本身就具有很大的区别;再加之甚至选择了不同品种样品进行比较,不同品种间本身差异较大,因此这类鉴别方法对小范围的地理标志产品产地判别借鉴意义不大;建模方法采用单种检测数据结合计量学方法进行,单种检测数据无法代表产地溯源的全部信息,导致产地识别率较低,上述这些严重影响了地理标志产品保护技术的创新和突破。针对如上情况,有必要建立一种基于五隐藏层的武夷岩茶产地深度学习系统,该学习系统融合了近红外、稳定同位素、微量元素、儿茶素以及电子舌数据的武夷岩茶产地鉴别方法。
(三)发明内容
本发明目的在于解决单种检测数据无法代表产地溯源的全部关键信息以及不同类型检测数据在计量学方法中联合使用的数据匹配等问题,提供一种融合近红外光谱、稳定同位素、微量元素、儿茶素、电子舌数据的武夷岩茶产地识别模型技术方法,该方法基于具有深度学习功能的神经网络模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱数据、稳定同位素数据、微量元素数据、儿茶素及电子舌数据融合在同一数据表格中,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地。
本发明采用的技术方案是:
基于五隐藏层的武夷岩茶产地深度学习系统,所述深度学习系统融合了近红外光谱、稳定同位素、微量元素、儿茶素以及电子舌数据鉴别武夷岩茶产地的方法,所述方法包括:
(A)采集不同产地岩茶样品:
武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的近红外特征光谱数据:
近红外检测:64次扫描,特征光谱条带取其平均值,扫描范围为12000-4000cm-1,数据点的间隔为1.928cm-1,室温25℃,湿度保持稳定,无损检测,无需采用粉碎等前处理,采用相同加料方法、加料量,加料完毕即可进行检测,每个样本的光谱采集1次。
(C)测定不同产地岩茶样品的氢、氧、氮、碳四种稳定同位素质谱数据:
δ13C、δ15N、δ18O、δ2H、δ86Sr等稳定同位素含量测定,每个样品至少重复分析3次以上,取平均值作为最终结果。
通过SVM-RFE(支持向量机回归特征消去法)对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量,其排序顺序为氢、氧、氮、碳、锶。并利用预测集计算模型的灵敏度增维精度、分辨率增维精度、识别率增维精度,均按重复计算100次平均结果,氢、氧、氮、碳四种数据组成的模型,其识别率最高,达93.93%,因此建模只需要选择氢、氧、氮、碳四种数据即可,无需对锶等其他稳定同位素含量进行检测。
(D)测定不同产地岩茶样品的铯、铜、钙、铷四种微量元素数据
用原子吸收光谱仪测定Ca、Mg、Mn元素含量,用电感耦合等离子体质谱测Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量。干茶样品微波消解,消解完毕,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,则定容后用上述仪器进行测定。
通过SVM-RFE法对微量元素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的微量元素特征变量,并通过预测集计算每一维变量累加之后的模型增维精度,得到铯、铜、钙、铷、锶、钡特征排序顺序。然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度增维精度、分辨率增维精度、识别率增维精度,由铯、铜、钙、铷四者微量元素组成的模型,其识别率增维精度最高,说明此四种微量元素间的信息具有互补性,只需要选择建模的铯、铜、钙、铷四种微量元素进行检测即可,无需对其它微量元素进行检测。
(E)测定不同产地岩茶样品的儿茶素数据:
利用HPLC法对不同产地岩茶样品中的6种儿茶素以及咖啡碱进行检测,平行测定两次,取平均值。
数据经SVM模型训练和预测后,各儿茶素和咖啡碱对于地理特征的贡献率从高到低依次为表没食子儿茶素(EGC)、儿茶素(C)、表没食子儿茶素没食子酸酯(EGCG)、没食子酸(GA)、表儿茶素(EC)、表儿茶素没食子酸酯(ECG)和咖啡碱。
将儿茶素和咖啡碱共7个特征变量按上述顺序进行逐级组合后,基于儿茶素和咖啡碱数据建立的SVM产地溯源模型,其灵敏度增维精度均高于0.9000,说明对于保护区内的岩茶样品判别结果较为可靠。SVM模型的灵敏度增维精度、分辨率增维精度和识别率增维精度,经SVM回归特征消去法与全数据模型进行训练集的训练比较后,表没食子儿茶素的识别率增维精度最高,最高模型识别率为0.8596,模型中包含EGC、C、EGCG、GA和EC,该模型的灵敏度为0.9322,分辨率为0.6734。不断下降的识别率增维精度说明ECG和咖啡碱不能对产地判别提供增益效益,且可能与前面的五种儿茶素之间存在一定的负相关关系。
(F)测定不同产地岩茶样品的电子舌数据:
本研究采用ASTREE Electronic电子舌系统,该套系统具有一个电极(Ag/AgCl)以及7个独立传感器(ZZ、BA、BB、CA、GA、HA、JB),电子舌系统使用前用NaCl和C5H8NO4Na标准溶液对传感器进行活化,并依次进行信号校准和仪器自诊断,自诊断通过后可进行样品滋味的分析检测,检测完毕后,将电子舌数据以文本形式导出,取各传感器最后十秒(第91-100秒)稳定数据的均值作为检测数据进行后续分析。
(G)基于五隐藏层的武夷岩茶产地深度学习系统的建立,即融合近红外、稳定同位素、微量元素、儿茶素以及电子舌数据建立不同产地岩茶鉴别数据库
(1)将每条近红外数据(Y轴数据)拼接在Excel数据表格中,每行所有列数据组成每条近红外数据;
(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序拼接在近红外数据后,将微量元素数据按铯、铜、钙、铷拼接在稳定同位素后,将儿茶素数据按EGC、C、EGCG、GA和EC顺序拼接在微量元素数据后,最后将电子舌7个独立传感器(按ZZ、BA、BB、CA、GA、HA、JB顺序)最后十秒(第91-100秒)稳定数据的均值拼接在儿茶素数据后,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.D.Snee和Michal Daszykowski建立的Duplex分割程序,将数据划分为两个子集,使其覆盖近似相同区域和拥有类似的统计性质;将样本数据归一化和正交化,计算两两样本间的欧式距离;选择欧式距离最大的两个样本进入训练集,剩余样本中,欧式距离最大的两个样本进入验证集;第一轮选后的剩余样本中,与训练集欧式距离最大的样本进入训练集,与验证集欧式距离最大的样本进入验证集;重复步骤,直至所选的样品分成两个子集。指定预测集的样本数,指定武夷岩茶产区内总数的65-70%作为原产地内模型数A1,随机取武夷岩茶产区外65-70%作为原产地外模型数A2,建立Duplex分割程序;
(5)K-折交互验证法:将样本数据集随机划分为K个子集(一般是均分),将一个子集作为验证集,其余的K-1组子集作为训练集;轮流将K个子集作为验证集,交叉重复K次,得到K次的结果,并用K次结果的平均值作为分类器或模型的性能指标。K-折法下,每一个样本数据都被用作训练数据,也被用作验证数据,避免了过度学习和欠学习状态的发生。
(6)神经网络模型的建立:对步骤(4)数据分割后的融合近红外、稳定同位素、微量元素、儿茶素以及电子舌数据,采用神经网络分析并建立ELM模型;
(H)取待测未知产地样品按照B、C、D、E和F步骤,测定近红外特征数据、稳定同位素数据、微量元素数据、儿茶素数据以及电子舌数据,将测得数据代入上述ELM模型,判断待测样品的产地属性。
具体的,所述步骤(G)中分割程序分别为:[model1,test1]=Duplex(data1,A1)和[model2,test2]=Duplex(data2,A2),得到model1、test1、model2、test2。
神经网络ELM建模思路:若训练样本分布均匀,且数量足够,采用神经网络可得到较好的预测能力和泛化效果,ELM在网络参数的确定过程中,随机选取隐层节点参数,在训练过程中无需调节,便可获得唯一的最优解,网络参数的确定无需迭代步骤,可大幅度降低网络参数的调节时间。具体的,所述步骤(G)中ELM鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)用K-折交互验证:
indices=crossvalidation(′Kfold′,x,k);
(h)建模过程:
训练ELM模型:
function[TrainingTime,TrainingAccuracy]=elm_train(TrainingData_File,
Elm_Type,NumberofHiddenNeurons,ActivationFunction);
用训练好的ELM模型进行预测:
function[TestingTime,LabelsPredicted]=elm_predict_TeaData(TestingData_File)
(i)保存预测结果:save LabelsPredicted;
其中Duplex程序如下所示:
其中Kfoldcv程序如下所示:
其中ELM程序如下所示:
本发明的有益效果主要体现在:本发明基于具有深度学习功能的神经网络模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱数据、稳定同位素数据、微量元素数据、儿茶素数据以及电子舌数据融合在一起,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地,其识别率最高,达100.0%,远高于单种数据神经网络ELM结果。
(四)具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
实施例1:
A、采集不同产地岩茶样品
国标(GB/T 18745-2006)中规定了武夷岩茶的地理保护范围,即福建省武夷山市行政区划内,本发明在武夷岩茶地理标志保护区武夷街道、崇安街道、上梅、星村、五夫、岚谷、新丰街道、洋庄、兴田、下梅、吴屯11个行政区域内进行样品采集,每个行政区域内随机选择3个取样点(分别以A、B、C进行标示),共33个取样点,取样范围基本涵盖主要产区,每个采样点取样15份(分别以A-1、A-2......A-15进行标示),获得495份地理标志保护区武夷岩茶样品,另在福建省除武夷山市外其他县市(建阳、建瓯、漳州、泉州、松溪、政和),以及广西、贵州、江西(婺源、赣州)等11个地点收集保护区外岩茶样品,每个地点取样15份(分别以1、2......15进行标示),获得165个非地理标志保护区岩茶样品。地理标志产地内样品数与地理标志产地外样品数之比为3∶1。
B、不同产地岩茶近红外特征光谱数据
无损检测、德国布鲁克TENSOR37,采用相同加料方法、加料量(目测),加料完毕即进行检测。表1为15个武夷街道A样品部分近红外数据表,其中X轴为波长范围,Y轴为吸光度。
表1:15个武夷街道A样品部分近红外数据表
C、不同产地岩茶稳定同位素质谱数据
δ13C、δ15N、δ18O、δ2H、δ86Sr由Thermo Fisher MAT253稳定同位素质谱仪测定。地理标志产区内、外岩茶样品同位素比率经上述方法检测,下表2节选部分岩茶样品同位素比率数据表。
表2:部分岩茶样品同位素比率统计表
通过SVM对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量,各变量经支持向量机回归特征消去法与全数据模型进行训练集的训练比较后,同位素氢的识别率增维最高,其次为氧、氮、碳、锶;然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,当氢和氧的同位素数据进行组合后,模型识别率下降,说明氧和氢对原产地特征的贡献具有较强的相关性;而加入碳和氮同位素数据后,模型识别率上升至最高,达93.93%,说明氮和碳具有较好的互补。
D、测定不同产地岩茶样品的铯、铜、钙、铷四种微量元素数据
使用日立180-50原子吸收光谱仪测定样液中Ca、Mg、Mn元素含量,使用ThermoFisher XSeries II电感耦合等离子体质谱测定微波消解液中Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量。待测茶叶微波消解,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,则采用上述仪器进行测定。表3为节选部分地理标志产区内、外岩茶样品微量元素数据表。
表3:部分岩茶样品微量元素统计表
通过SVM-RFE对微量元素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的微量元素特征变量,并通过预测集计算每一维变量累加之后的模型增维精度,得到铯、铜、钙、铷、锶、钡特征排序顺序。然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,由铯、铜、钙、铷四者组成的模型,其识别率增维精度最高达0.8121,说明此四种微量元素间的信息具有互补性,只需要选择建模的铯、铜、钙、铷四种微量元素即可。
E、测定不同产地岩茶样品的儿茶素数据
用高效液相法对不同产地岩茶样品中的儿茶素和咖啡碱进行检测,平行测两次,取平均值,表4为部分岩茶样品儿茶素和咖啡碱含量数据。
表4不同产地岩茶儿茶素和咖啡碱含量
待测样名称 | GA | EGC | C | EC | EGCG | ECG | 咖啡碱 |
上梅A-4 | 0.19 | 2.18 | 0.66 | 0.61 | 4.25 | 1.12 | 3.13 |
星村A-4 | 0.25 | 1.37 | 0.73 | 0.37 | 3.77 | 0.96 | 3.06 |
五夫A-4 | 0.27 | 3.86 | 1.20 | 1.03 | 7.46 | 1.9 | 2.83 |
岚谷A-4 | 0.13 | 1.69 | 0.52 | 0.57 | 3.12 | 0.9 | 2.89 |
崇安街道A-4 | 0.11 | 3.02 | 0.76 | 0.77 | 4.37 | 0.99 | 2.83 |
新丰街道A-4 | 0.14 | 2.05 | 0.45 | 0.71 | 3.05 | 0.93 | 2.97 |
洋庄A-4 | 0.15 | 1.68 | 0 | 0.01 | 4.28 | 0.99 | 2.34 |
兴田A-4 | 0.11 | 1.85 | 0.36 | 0.52 | 4.15 | 1.17 | 2.12 |
下梅A-4 | 0.22 | 0.96 | 0.55 | 0.37 | 2.87 | 1.05 | 2.63 |
吴屯A-4 | 0.12 | 2.06 | 0.35 | 0.54 | 4.99 | 1.27 | 2.31 |
武夷街道A-4 | 0.18 | 0.02 | 0.57 | 0.43 | 4.43 | 1.09 | 2.38 |
建阳-4 | 0.16 | 0.01 | 0.41 | 0.39 | 3.67 | 1.09 | 2.27 |
建瓯-4 | 0.14 | 0.04 | 0.37 | 0.36 | 3.38 | 1.03 | 3.12 |
漳州-4 | 0.14 | 1.67 | 0.21 | 0.54 | 4.24 | 1.27 | 2.39 |
泉州-4 | 0.12 | 1.38 | 0.17 | 0.36 | 3.89 | 1.18 | 1.81 |
浦城-4 | 0.16 | 1.42 | 0.26 | 0.37 | 4.67 | 1.16 | 2.25 |
贵州-4 | 0.39 | 0 | 0.36 | 0.12 | 0.25 | 0.74 | 3.52 |
松溪-4 | 0.21 | 1.04 | 0.27 | 0.33 | 4.05 | 1.02 | 2.15 |
政和-4 | 0.25 | 0.58 | 0.45 | 0.29 | 2.62 | 0.82 | 2.87 |
广西-4 | 0.25 | 1.11 | 0.34 | 0.67 | 4.01 | 1.64 | 3.47 |
婺源-4 | 0.33 | 0.03 | 0.15 | 0.01 | 0.15 | 0.35 | 3.26 |
赣州-4 | 0.34 | 0.01 | 0.16 | 0 | 0.06 | 0.25 | 2.88 |
将儿茶素和咖啡碱共7个特征变量,经SVM模型训练和预测后,各儿茶素和咖啡碱对于地理特征的贡献率从高到低依次为EGC、C、EGCG、GA、EC、ECG和咖啡碱。对上述特征变量进行逐级组合后SVM模型的灵敏度增维精度、分辨率增维精度和识别率增维精度,其灵敏度增维精度均高于0.9000,说明对于保护区内的岩茶样品判别结果较为可靠;ECG和咖啡碱不能对产地判别提供增益效益,且可能与前面的五种儿茶素之间存在一定的负相关关系,因此最高模型识别率为0.8596,模型中包含EGC、C、EGCG、GA和EC,该模型的灵敏度为0.9322,分辨率为0.6734。
F、测定不同产地岩茶样品的电子舌数据
ASTREE Electronic电子舌系统,7个独立传感器名称分别为ZZ、BA、BB、CA、GA、HA、JB。各传感器最后十秒(第91-100秒)稳定数据的均值作为检测数据,其数据见表5。
表5部分岩茶7个传感器最后10秒均值数据表
G、基于五隐藏层的武夷岩茶产地深度学习系统的建立,即融合近红外、稳定同位素、微量元素、儿茶素以及电子舌数据建立不同产地岩茶鉴别数据库:
(1)将每条近红外数据拼接在Excel数据表格中,每行所有列数据组成每条近红外数据。
(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序,微量元素按铯、铜、钙、铷顺序,儿茶素按EGC、C、EGCG、GA和EC顺序,电子舌按ZZ、BA、BB、CA、GA、HA、JB顺序,依次拼接在近红外数据后,地理标志产区内样品组成495行、4168列(近红外Y轴数据共4148列,依次增加氢、氧、氮、碳、铯、铜、钙、铷、EGC、C、EGCG、GA、EC、ZZ、BA、BB、CA、GA、HA、JB变为4168列)的Excel数据表,以data1命名;地理标志产区外样品组成165行、4168列的Excel数据表,以data2命名。
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)建立Duplex分割程序,[model1,test1]=Duplex(data1,330)和[model2,test2]=Duplex(data2,110),得到model1、test1、model2、test2。
(5)对近红外、稳定同位素、微量元素、儿茶素和电子舌数据建立ELM鉴别模型,其过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)用K-折交互验证:
indices=crossvalidation(′Kfold′,x,k);
(h)建模过程:
训练ELM模型:
function[TrainingTime,TrainingAccuracy]=elm_train(TrainingData_File,
Elm_Type,NumberofHiddenNeurons,ActivationFunction);
用训练好的ELM模型进行预测:
function[TestingTime,LabelsPredicted]=elm_predict_TeaData(TestingData_File)
(i)保存预测结果:save LabelsPredicted;
H、ELM模型识别率
按上述建模方法分别对近红外光谱、同位素、微量元素、儿茶素、电子舌以及五者融合数据进行建模分析,其结果见表6。
表6:ELM分类模型判别结果汇总
从表6可知,各检测技术所代表的特征指标之间具有互补性,采用本发明ELM建模方法分别对近红外光谱、稳定同位素、微量元素、儿茶素、电子舌以及五者融合数据进行分析,五者融合数据的识别率最高,达100.0%,远高于单种数据ELM结果。
J、盲样检测
盲样监督小组从武夷岩茶农户处购买岩茶样品,监控晒青、做青、杀青等步骤,确保岩茶样品的原产地域属性,上述样品作为盲样中的地理标志产区内样品;从建阳、建瓯、婺源等地购买岩茶,作为盲样中的地理标志产区外样品,上述盲样与建模岩茶样品出自不同厂家。分析检测人员事先未得知待测盲样的产地属性,随机选取若干份,检测,再按本发明方法对盲样产地属性进行判断,并与盲样监督小组进行核对,确定盲样识别率。
将20、60、100个盲样按照步骤B、C、D、E和F获得的盲样数据代入上述ELM模型,判断其地理标志属性,其判别准确率均达到100.0%。
实施例2:
采用与实施例1相同的建模方法,数据分割用Duplex分割程序,用K-折交互验证,分别建立神经网络ELM、偏最小二乘PLSDA和最小二乘支持向量机LS-SVM模型,近红外数据不变,稳定同位素、微量元素、儿茶素和电子舌分别按照氢、氧、氮、碳、锶、Cs、Cu、Ca、Rb、Sr、Ba、EGC、C、EGCG、GA、EC、ECG、咖啡碱、ZZ、BA、BB、CA、GA、HA、JB拼接在近红外数据后,其模型识别率分别为90.7%、85.8%、86.9%。
实施例3:
采用与实施例1相同的建模方法,数据分割用Duplex分割程序,用K-折交互验证,分别建立神经网络ELM、偏最小二乘PLSDA和最小二乘支持向量机LS-SVM模型,近红外数据不变,稳定同位素、微量元素、儿茶素和电子舌分别按照氢、氧、氮、碳、锶、Cs、Cu、Ca、Rb、Sr、Ba、EGC、C、EGCG、GA、EC、ZZ、BA、BB、CA、GA、HA、JB拼接在近红外数据后,其模型识别率分别为96.5%、87.4%、89.1%。
实施例4:
采用与实施例1相同的建模方法,数据分割用Duplex分割程序,用K-折交互验证,分别建立神经网络ELM、偏最小二乘PLSDA和最小二乘支持向量机LS-SVM模型,近红外数据不变,稳定同位素、微量元素、儿茶素和电子舌分别按照氢、氧、氮、碳、锶、Cs、Cu、Ca、Rb、EGC、C、EGCG、GA、EC、ZZ、BA、BB、CA、GA、HA、JB拼接在近红外数据后,其模型识别率分别为98.2%、89.8%、90.4%。
实施例5:
采用与实施例1相同的建模方法,数据分割用Duplex分割程序,用K-折交互验证,分别建立神经网络ELM、偏最小二乘PLSDA和最小二乘支持向量机LS-SVM模型,近红外数据不变,稳定同位素、微量元素、儿茶素和电子舌分别按照氢、氧、氮、碳、Cs、Cu、Ca、Rb、EGC、C、EGCG、GA、EC、ZZ、BA、BB、CA、GA、HA、JB拼接在近红外数据后,其模型识别率分别为100.0%、92.3%、93.7%。
实施例6~11:
岩茶样品、近红外数据、同位素数据、微量元素数据、儿茶素及电子舌数据等与实施例1相同,分别采用不同方法进行鉴别。实施例9-11分别采用现有发明专利CN103630528A(201210307144.2)、CN102455320A(201010526790.9)、CN103245713A(201310095950.2)所述方法进行鉴别。实施例6~11与实施例1指标区别见表7。
表7:实施例1与实施例6~11比较情况表
从上述比较结果可以得出,采用本发明方法,其盲样检测率达100.0%以上,可作为武夷岩茶产地溯源识别技术方法。
Claims (4)
1.基于五隐藏层的武夷岩茶产地深度学习系统,,所述方法包括:
(A)采集不同产地岩茶样品:
武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的近红外特征光谱数据:
近红外检测参数:64次扫描,特征光谱条带为64次扫描的平均值,扫描范围为12000-4000cm-1,数据点的间隔为1.928cm-1,采集时室温控制在25℃,湿度保持稳定,每个样本的光谱采集1次;
(C)测定不同产地岩茶样品的氢、氧、氮、碳四种稳定同位素质谱数据:
δ13C、δ15N、δ18O、δ2H、δ86Sr等稳定同位素含量测定,每个样品至少重复分析3次以上,取平均值作为最终结果;通过SVM-RFE(支持向量机回归特征消去法)对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量,其排序顺序为氢、氧、氮、碳、锶;并利用预测集计算模型的灵敏度增维精度、分辨率增维精度、识别率增维精度,均按重复计算100次平均结果,氢、氧、氮、碳四种数据组成的模型,识别率最高,达93.93%,因此建模只需要选择氢、氧、氮、碳四种数据即可,无需对锶等其他稳定同位素含量进行检测;
(D)测定不同产地岩茶样品的铯、铜、钙、铷四种微量元素数据:
用原子吸收光谱仪测定Ca、Mg、Mn元素含量,用电感耦合等离子体质谱测Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量;干茶样品微波消解,消解完毕,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,定容后用上述仪器进行测定;通过SVM-RFE法对微量元素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的微量元素特征变量,并通过预测集计算每一维变量累加之后的模型增维精度,得到铯、铜、钙、铷、锶、钡特征排序顺序;然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度增维精度、分辨率增维精度、识别率增维精度,由铯、铜、钙、铷四者微量元素组成的模型,其识别率增维精度最高,说明此四种微量元素间的信息具有互补性,只需要选择建模的铯、铜、钙、铷四种微量元素进行检测即可,无需对其它微量元素进行检测;
(E)测定不同产地岩茶样品的儿茶素数据:
利用HPLC法对不同产地岩茶样品中的6种儿茶素以及咖啡碱进行检测,平行测定两次,取平均值;数据经SVM模型训练和预测后,各儿茶素和咖啡碱对于地理特征的贡献率从高到低依次为表没食子儿茶素(EGC)、儿茶素(C)、表没食子儿茶素没食子酸酯(EGCG)、没食子酸(GA)、表儿茶素(EC)、表儿茶素没食子酸酯(ECG)和咖啡碱;模型最高识别率为0.8596,模型中包含EGC、C、EGCG、GA和EC;
(F)测定不同产地岩茶样品的电子舌数据:
采用ASTREE Electronic电子舌系统,该套系统具有一个电极(Ag/AgCl)以及7个独立传感器(ZZ、BA、BB、CA、GA、HA、JB),电子舌系统使用前用NaCl和C5H8NO4Na标准溶液对传感器进行活化,并依次进行信号校准和仪器自诊断,自诊断通过后可进行样品滋味的分析检测,取各传感器最后十秒(第91-100秒)稳定数据的均值作为检测数据进行后续分析;
(G)基于五隐藏层的武夷岩茶产地深度学习系统的建立,即融合近红外、稳定同位素、微量元素、儿茶素以及电子舌数据建立不同产地岩茶鉴别数据库
(1)将每条近红外数据(Y轴数据)拼接在Excel数据表格中,每行所有列数据组成每条近红外数据;
(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序拼接在近红外数据后,将微量元素数据按铯、铜、钙、铷拼接在稳定同位素后,将儿茶素数据按EGC、C、EGCG、GA和EC顺序拼接在微量元素数据后,最后将电子舌7个独立传感器(按ZZ、BA、BB、CA、GA、HA、JB顺序)最后十秒(第91-100秒)稳定数据的均值拼接在儿茶素数据后,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.D.Snee和Michal Daszykowski建立的Duplex分割程序;
(5)神经网络模型的建立:对步骤(4)数据分割后的融合近红外、稳定同位素、微量元素、儿茶素以及电子舌数据,采用神经网络分析并建立ELM模型;
(H)取待测未知产地样品按照B、C、D、E和F步骤,测定近红外数据、稳定同位素质谱数据、微量元素数据、儿茶素数据以及电子舌数据,将测得数据代入上述ELM模型,判断待测样品的产地属性。
2.如权利要求1所述的方法,其特征在于所述步骤(G)中分割程序为:
[model1,test1]=Duplex(data1,A1)和[model2,test2]=Duplex(data2,A2),得到model1、test1、model2、test2。
3.如权利要求1所述的方法,其特征在于所述步骤(G)中神经网络ELM鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)用K-折交互验证:
indices=crossvalidation(′Kfold′,x,k);
(h)建模过程:
训练ELM模型:
function[TrainingTime,TrainingAccuracy]=elm_train(TrainingData_File,Elm_Type,NumberofHiddenNeurons,ActivationFunction);
用训练好的ELM模型进行预测:
function[TestingTime,LabelsPredicted]=elm_predict_TeaData(TestingData_File)
(i)保存预测结果:save LabelsPredicted。
4.如权利要求1所述的方法,其特征在于本发明所述神经网络ELM建模方法对近红外、稳定同位素、微量元素、儿茶素、电子舌的融合数据进行建模分析,模型识别率最高,达100.0%,远高于单种数据ELM判别结果;针对20、60、100个盲样,检测识别率均达100.0%,本发明方法可作为武夷岩茶产地溯源识别技术方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610915353.3A CN106560701A (zh) | 2016-10-20 | 2016-10-20 | 基于五隐藏层的武夷岩茶产地深度学习系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610915353.3A CN106560701A (zh) | 2016-10-20 | 2016-10-20 | 基于五隐藏层的武夷岩茶产地深度学习系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106560701A true CN106560701A (zh) | 2017-04-12 |
Family
ID=58485760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610915353.3A Pending CN106560701A (zh) | 2016-10-20 | 2016-10-20 | 基于五隐藏层的武夷岩茶产地深度学习系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106560701A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
CN112232387A (zh) * | 2020-09-29 | 2021-01-15 | 南京财经大学 | 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 |
CN112232388A (zh) * | 2020-09-29 | 2021-01-15 | 南京财经大学 | 基于elm-rfe的购物意图关键因素识别方法 |
CN116559099A (zh) * | 2023-07-07 | 2023-08-08 | 泉州海关综合技术服务中心 | 一种茶叶中重金属测定的设备和方法 |
CN117725437A (zh) * | 2024-02-18 | 2024-03-19 | 南京汇卓大数据科技有限公司 | 一种基于机器学习的数据精准匹配分析方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2334409B1 (en) * | 2008-10-06 | 2012-09-19 | Ivan Smajlovic | Method for determination of delta-d values of non- exchangeable hydrogen stable isotopes on ethanol' s methyl group by means of irms instrumental technique |
CN103235087A (zh) * | 2013-04-10 | 2013-08-07 | 江苏大学 | 一种基于嗅觉和味觉传感器信息融合的乌龙茶原产地的鉴别方法 |
CN103487537A (zh) * | 2013-07-30 | 2014-01-01 | 中国标准化研究院 | 一种基于遗传算法优化西湖龙井茶产地检测方法 |
CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
CN104458891A (zh) * | 2014-12-19 | 2015-03-25 | 北京中防昊通科技中心 | 一种利用电感耦合等离子体质谱进行茶叶产地溯源的方法 |
CN104914190A (zh) * | 2015-06-23 | 2015-09-16 | 福建省农业科学院农业工程技术研究所 | 一种茶叶种类鉴别和21种特征成分含量测定的方法 |
CN105259160A (zh) * | 2015-11-03 | 2016-01-20 | 中国农业科学院茶叶研究所 | 一种基于离子组学的西湖龙井茶产地识别方法 |
-
2016
- 2016-10-20 CN CN201610915353.3A patent/CN106560701A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2334409B1 (en) * | 2008-10-06 | 2012-09-19 | Ivan Smajlovic | Method for determination of delta-d values of non- exchangeable hydrogen stable isotopes on ethanol' s methyl group by means of irms instrumental technique |
CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
CN103235087A (zh) * | 2013-04-10 | 2013-08-07 | 江苏大学 | 一种基于嗅觉和味觉传感器信息融合的乌龙茶原产地的鉴别方法 |
CN103487537A (zh) * | 2013-07-30 | 2014-01-01 | 中国标准化研究院 | 一种基于遗传算法优化西湖龙井茶产地检测方法 |
CN104458891A (zh) * | 2014-12-19 | 2015-03-25 | 北京中防昊通科技中心 | 一种利用电感耦合等离子体质谱进行茶叶产地溯源的方法 |
CN104914190A (zh) * | 2015-06-23 | 2015-09-16 | 福建省农业科学院农业工程技术研究所 | 一种茶叶种类鉴别和21种特征成分含量测定的方法 |
CN105259160A (zh) * | 2015-11-03 | 2016-01-20 | 中国农业科学院茶叶研究所 | 一种基于离子组学的西湖龙井茶产地识别方法 |
Non-Patent Citations (3)
Title |
---|
GRARD GREMAUD 等: "Characterization of Swiss vineyards using isotopic data in combination with trace elements and classical parameters", 《EUROPEAN FOOD RESEARCH AND TECHNOLOGY》 * |
言思敏: "地理标志产品武夷岩茶的产地识别技术研究", 《中国优秀硕士学位论文全文数据库 农业科技辑》 * |
赵峰等: "武夷水仙茶产地判别多元数字化指纹图谱构建", 《热带作物学报》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
CN112232387A (zh) * | 2020-09-29 | 2021-01-15 | 南京财经大学 | 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 |
CN112232388A (zh) * | 2020-09-29 | 2021-01-15 | 南京财经大学 | 基于elm-rfe的购物意图关键因素识别方法 |
CN112232387B (zh) * | 2020-09-29 | 2024-02-06 | 南京财经大学 | 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 |
CN112232388B (zh) * | 2020-09-29 | 2024-02-13 | 南京财经大学 | 基于elm-rfe的购物意图关键因素识别方法 |
CN116559099A (zh) * | 2023-07-07 | 2023-08-08 | 泉州海关综合技术服务中心 | 一种茶叶中重金属测定的设备和方法 |
CN116559099B (zh) * | 2023-07-07 | 2023-09-19 | 泉州海关综合技术服务中心 | 一种茶叶中重金属测定的设备和方法 |
CN117725437A (zh) * | 2024-02-18 | 2024-03-19 | 南京汇卓大数据科技有限公司 | 一种基于机器学习的数据精准匹配分析方法 |
CN117725437B (zh) * | 2024-02-18 | 2024-05-24 | 南京汇卓大数据科技有限公司 | 一种基于机器学习的数据精准匹配分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106560691A (zh) | 具有深度学习功能的武夷岩茶产地鉴别方法 | |
CN106560692A (zh) | 联合四种检验技术的武夷岩茶产地鉴别方法 | |
CN106560700A (zh) | 能自动鉴别武夷岩茶产地的机器学习方法 | |
CN106560694A (zh) | 基于多种检验技术的武夷岩茶产地智能鉴别方法 | |
CN106560693A (zh) | 基于偏最小二乘判别的武夷岩茶产地鉴别方法 | |
CN106560701A (zh) | 基于五隐藏层的武夷岩茶产地深度学习系统 | |
CN106560698A (zh) | 基于多种检测技术的植物产地鉴别方法 | |
Kovács et al. | Geographical origin identification of pure Sri Lanka tea infusions with electronic nose, electronic tongue and sensory profile analysis | |
CN106560697A (zh) | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 | |
CN106560841A (zh) | 基于深度学习的武夷岩茶产地鉴别方法 | |
CN106560695A (zh) | 联合三种检测方法的武夷岩茶产地鉴别方法 | |
Ren et al. | Estimation of Congou black tea quality by an electronic tongue technology combined with multivariate analysis | |
CN102778442B (zh) | 一种快速鉴别烟用香液料液种类的方法 | |
CN106560699A (zh) | 用于武夷岩茶产地鉴别的联合检测方法 | |
Fang et al. | Geographical origin traceability of Keemun black tea based on its non‐volatile composition combined with chemometrics | |
CN104020129A (zh) | 一种基于近红外光谱结合氨基酸分析技术的工夫红茶发酵质量的判别方法 | |
Yu et al. | Emerging techniques for determining the quality and safety of tea products: A review | |
Sanaeifar et al. | Nondestructive monitoring of polyphenols and caffeine during green tea processing using Vis‐NIR spectroscopy | |
CN104062258B (zh) | 一种采用近红外光谱快速测定复方阿胶浆中可溶性固形物的方法 | |
CN106560704A (zh) | 联合同位素和微量元素检验的武夷岩茶产地鉴别方法 | |
CN101929951A (zh) | 一种牛奶中掺羊奶的近红外光谱判别方法 | |
CN101413883A (zh) | 一种用红外光谱技术鉴别茶叶产地的方法 | |
CN101791331B (zh) | 一种快速测定丹参提取液中鞣质含量的方法 | |
Lou et al. | Stable Isotope Ratio and Elemental Profile Combined with Support Vector Machine for Provenance Discrimination of Oolong Tea (Wuyi‐Rock Tea) | |
CN110133050A (zh) | 一种基于多传感器指纹图谱定性定量检测茶叶品质的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170412 |
|
RJ01 | Rejection of invention patent application after publication |