CN106560698A - 基于多种检测技术的植物产地鉴别方法 - Google Patents
基于多种检测技术的植物产地鉴别方法 Download PDFInfo
- Publication number
- CN106560698A CN106560698A CN201610915272.3A CN201610915272A CN106560698A CN 106560698 A CN106560698 A CN 106560698A CN 201610915272 A CN201610915272 A CN 201610915272A CN 106560698 A CN106560698 A CN 106560698A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- origin
- samples
- infrared
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 32
- 238000004519 manufacturing process Methods 0.000 title claims description 25
- 238000005516 engineering process Methods 0.000 title abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 75
- 239000011435 rock Substances 0.000 claims abstract description 58
- 239000011573 trace mineral Substances 0.000 claims abstract description 45
- 235000013619 trace mineral Nutrition 0.000 claims abstract description 45
- 238000012706 support-vector machine Methods 0.000 claims abstract description 18
- 241000196324 Embryophyta Species 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims abstract description 11
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 240000002853 Nelumbo nucifera Species 0.000 claims abstract description 4
- 235000006508 Nelumbo nucifera Nutrition 0.000 claims abstract description 4
- 240000000147 Torreya grandis Species 0.000 claims abstract 2
- 235000016410 Torreya grandis Nutrition 0.000 claims abstract 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 44
- 239000000523 sample Substances 0.000 claims description 34
- 229910052792 caesium Inorganic materials 0.000 claims description 28
- 229910052791 calcium Inorganic materials 0.000 claims description 27
- 239000011575 calcium Substances 0.000 claims description 27
- 229910052802 copper Inorganic materials 0.000 claims description 27
- 239000010949 copper Substances 0.000 claims description 27
- 229910052701 rubidium Inorganic materials 0.000 claims description 24
- 229910052757 nitrogen Inorganic materials 0.000 claims description 23
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 22
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 22
- TVFDJXOCXUVLDH-UHFFFAOYSA-N caesium atom Chemical compound [Cs] TVFDJXOCXUVLDH-UHFFFAOYSA-N 0.000 claims description 22
- 229910052799 carbon Inorganic materials 0.000 claims description 22
- 239000001257 hydrogen Substances 0.000 claims description 22
- 229910052739 hydrogen Inorganic materials 0.000 claims description 22
- 229910052760 oxygen Inorganic materials 0.000 claims description 22
- 239000001301 oxygen Substances 0.000 claims description 22
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 21
- 229910052712 strontium Inorganic materials 0.000 claims description 21
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 claims description 20
- IGLNJRXAVVLDKE-UHFFFAOYSA-N rubidium atom Chemical compound [Rb] IGLNJRXAVVLDKE-UHFFFAOYSA-N 0.000 claims description 18
- CIOAGBVUUVVLOB-UHFFFAOYSA-N strontium atom Chemical compound [Sr] CIOAGBVUUVVLOB-UHFFFAOYSA-N 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 16
- 238000001228 spectrum Methods 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 229910052788 barium Inorganic materials 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 6
- 230000029087 digestion Effects 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 5
- 229910052749 magnesium Inorganic materials 0.000 claims description 5
- 229910052748 manganese Inorganic materials 0.000 claims description 5
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 claims description 4
- 229910052793 cadmium Inorganic materials 0.000 claims description 4
- 229910052804 chromium Inorganic materials 0.000 claims description 4
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 claims description 4
- 238000004949 mass spectrometry Methods 0.000 claims description 4
- 229910052759 nickel Inorganic materials 0.000 claims description 4
- 229910052719 titanium Inorganic materials 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 229910052725 zinc Inorganic materials 0.000 claims description 4
- 238000010521 absorption reaction Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000001095 inductively coupled plasma mass spectrometry Methods 0.000 claims description 3
- 238000001819 mass spectrum Methods 0.000 claims description 3
- 238000000120 microwave digestion Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 229920002472 Starch Polymers 0.000 claims description 2
- 230000000295 complement effect Effects 0.000 claims description 2
- 239000012488 sample solution Substances 0.000 claims description 2
- 235000019698 starch Nutrition 0.000 claims description 2
- 239000008107 starch Substances 0.000 claims description 2
- 241001122767 Theaceae Species 0.000 claims 14
- 125000004435 hydrogen atom Chemical class [H]* 0.000 claims 5
- 238000012843 least square support vector machine Methods 0.000 claims 2
- 244000269722 Thea sinensis Species 0.000 abstract description 52
- 238000004497 NIR spectroscopy Methods 0.000 abstract description 7
- 239000000843 powder Substances 0.000 abstract description 2
- 235000013616 tea Nutrition 0.000 description 52
- 150000002431 hydrogen Chemical class 0.000 description 14
- 238000005070 sampling Methods 0.000 description 8
- 238000002329 infrared spectrum Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000002307 isotope ratio mass spectrometry Methods 0.000 description 3
- 241000488908 Torreya Species 0.000 description 2
- 238000011960 computer-aided design Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 235000019224 Camellia sinensis var Qingmao Nutrition 0.000 description 1
- 244000179970 Monarda didyma Species 0.000 description 1
- 235000010672 Monarda didyma Nutrition 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000009659 non-destructive testing Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 235000020339 pu-erh tea Nutrition 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 235000020095 red wine Nutrition 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- NCCSSGKUIKYAJD-UHFFFAOYSA-N rubidium(1+) Chemical compound [Rb+] NCCSSGKUIKYAJD-UHFFFAOYSA-N 0.000 description 1
- 235000015040 sparkling wine Nutrition 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 235000020334 white tea Nutrition 0.000 description 1
- 239000009853 xinfeng Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N1/00—Sampling; Preparing specimens for investigation
- G01N1/28—Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
- G01N1/44—Sample treatment involving radiation, e.g. heat
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/3103—Atomic absorption analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/3103—Atomic absorption analysis
- G01N2021/3114—Multi-element AAS arrangements
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/84—Greenhouse gas [GHG] management systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Electrochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Business, Economics & Management (AREA)
- Geometry (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Computer Hardware Design (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及基于多种检测技术的植物产地鉴别方法,本发明联合近红外光谱、稳定同位素和微量元素数据鉴别武夷岩茶产地的方法,属于地理标志产品真实性识别技术领域,其目的在于解决单种检测数据无法代表产地溯源全部关键信息和不同类型检测数据在计量学方法中联合使用的数据匹配等问题。本发明基于最小二乘支持向量机(LS‑SVM)模型,将近红外、稳定同位素和微量元素融合在一起建模分析,识别率最高,达100.0%,远高于单种数据所建立的LS‑SVM判别结果,且对盲样的识别率达100%,具有较好应用前景。本发明亦适合对香榧、藕粉等其它植物样品产地进行鉴别,本发明对除茶叶外的植物,其产地鉴别的识别率达99.8%以上。
Description
(一)技术领域
本发明涉及一种基于多种检测技术的植物产地鉴别方法,即一种联合近红外光谱、稳定同位素和微量元素鉴别植物产地的方法,本发明所述方法以武夷岩茶为产地鉴别例子,属于地理标志产品真实性识别技术领域。
(二)背景技术
地理标志产品,指按传统工艺,利用产自特定地域原材料,在该特定地域内生产的,并按法定程序经审核批准以原产地域名称命名的产品,其质量、特色或者声誉在本质上取决于原产地域地理特征。茶叶品质、口感与其产地的地理条件、气候因素、环境等因素密切相关,具有明显地域特色和品质特征,是典型的地理标志保护产品。国家质检总局对特定区域内的茶叶进行原产地域产品的地理标识,如武夷岩茶、安溪铁观音、大红袍、永春佛手、西湖龙井、安吉白茶、祁门红茶、普洱茶、碧螺春茶等近50种地理标志产品茶叶。
目前,国内外已开展成品茶产地识别鉴定研究,仪器检测结合化学计量学分析方法为最主要产地识别方法,仪器检测方法主要有近红外光谱、同位素质谱、液相色谱、传感器等;常用计量学方法包括偏最小二乘、主成分分析、人工神经网络、支持向量机等。
近红外光谱检测技术广泛应用茶叶原产地检测中,Zhou等利用近红外光谱仪对25个西湖龙井和70个浙江龙井样品进行检测并建立费氏判别函数模型,训练集合、交叉验证集合和测试集合的识别准确率分别96.7%、95.3%和96.7%。周健等对4个龙井茶品种(龙井43、群体种、迎霜和乌牛早)进行近红外检测,并采用PLS建立模型,其4个品种茶叶准确率分别为89.8%、90.9%、96.1%和99.5%。占茉莉等采用近红外光谱仪扫描10份西湖龙井和18份浙江龙井茶叶样品,聚类分析表明,西湖龙井茶具有独特特征而自成一类,缙云和新昌表现出类似光谱特征存在交叉,富阳产的也自成一类。赵杰文等采用近红外光谱仪对龙井、碧螺春、毛峰和铁观音(各20份)进行检测,并采用主成分建立预测模型,校正集和预测集的鉴别准确率分别为98.75%和95.0%,但龙井样品易误判为碧螺春。陈全胜等采用近红外光谱对龙井、碧螺春、铁观音和祁门红茶进行检测,并建立SIMCA(基于主成分分析的一种分类方法)判别模型,龙井、碧螺春、祁门红茶和铁观音的识别准确率分别为90%、80%、100%和100%;李晓丽等对西湖龙井、浙江龙井、羊岩勾青、雪水云绿和庐山云雾茶(各30份)进行近红外检测,并采用主成分分析法建立模型,除西湖龙井和浙江龙井存在部分重叠外,其余均能很好的区分。汤丽华等采用近红外光谱技术对宁夏、甘肃、青海、内蒙、河北的8个不同产地40种枸杞样品进行扫描,在主成分分析基础上利用简易分类法模式识别原理分别建立模型,识别率除青海为80%外,其他产地均为100%。刘巍等对47份来自昌黎、沙城和法国波尔多的红葡萄酒样品进行逐步回归分析选取光谱区域,再进行主成分分析和聚类识别,建立了判别葡萄酒原产地的预测模型;利用9个独立预测集样本对由38个训练集样品所建立的预测模型进行验证,产地的正确识别率达到了88.9%。
同位素与生物的生长环境密切相关,是一个自然标签,因此同位素质谱(IRMS)可为茶叶原产地识别提供科学的、可靠的鉴别方法。IRMS目前已经广泛应用在各种农产品的原产地检测中,等利用同位素质谱和核磁共振光谱,结合主成分分析,能够理想地鉴别斯洛文尼亚三个不同地区的红酒。Brescia等利用IRMS测定牛奶中的δ13C、δ15N和Ba元素含量,区分了不同原产地的牛奶,证明了IRMS适用于乳制品。Martinelli等对来自美国、南美、欧洲和澳大利亚的气泡葡萄酒进行同位素检测,发现具有显著差异。Tamara等测定了43份印度、23份斯里兰卡和12份中国茶叶中稳定同位素,非线性分析表明茶叶原产地的判定易受判别函数的影响,很好的区分不同国家产区的茶叶。
陈辉等采用等离子电感耦合法对北京顺义、河北阜平和河北平山三个地区65个荆条蜜样品中38种微量元素进行测定,并采用PCA和反向传输人工神经网络按照不同产地对荆条蜜进行了分析,交叉检验整体准确率为95.4%;王睿等采用等离子电感耦合法对新疆6个主要产地的36个石榴样品中的12种微量金属元素进行测定,并采用主成分分析PCA和线性判别分析LDA对石榴样品中的金属元素进行综合评价。结果表明:用PCA所得的2个三因子模型,可对36个石榴样品进行产地判别,其结果与实际产地吻合。
从上述例子可以看出,国内外对地理标志产品鉴别方法有很多,但是很多研究尚有不足之处,如采样不充分、样品数量少,样品不具备代表性;样品空间选择跨度大,往往选自不同国家、不同地区,本身就具有很大的区别;再加之甚至选择了本身差异较大的不同品种样品进行比较,因此这类鉴别方法对小范围的地理标志产品产地判别借鉴意义不大;样品选取所带来的局限性,使得建模方法亦无法代表产地溯源的全部信息,导致产地识别率低;上述例子所涉及的建模方法采用单种检测数据结合计量学方法进行,单种检测数据无法代表产地溯源的全部信息,这也导致产地识别率低,上述这些严重影响了地理标志产品保护技术的创新和突破。针对如上情况,有必要建立基于多种检测技术的植物产地鉴别方法,即联合近红外光谱、稳定同位素和微量元素数据建立武夷岩茶产地识别模型。
(三)发明内容
本发明目的在于解决单种检测数据无法代表产地溯源的全部关键信息以及传统计量学方法存在的缺陷等问题,提供一种基于多种检测技术的植物产地鉴别方法,即联合近红外光谱数据、稳定同位素以及微量元素数据的武夷岩茶产地识别模型技术方法,该方法基于最小二乘支持向量机判别模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱数据、稳定同位素数据和微量元素数据融合在一起,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地。
本发明采用的技术方案是:
基于多种检测技术的植物产地鉴别方法,所述方法包括:
(A)采集不同产地岩茶样品:
原产地外样品根据以下取样原则,产区外岩茶样品数大于100份,且靠近产区周边50公里范围内样品占比超过50%。原产地内样品根据以下取样原则,武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的近红外特征光谱数据:
近红外检测参数:扫描范围为12000-4000cm-1,64次扫描,特征光谱条带为64次扫描的平均值,数据点的间隔1.928cm-1,室温25℃,湿度保持稳定,每个样本的光谱采集1次;本发明近红外检测仪器采用的是德国布鲁克TENSOR37,所有样品无需采用粉碎等前处理,均采用无损检测,采用相同加料方法、加料量,加料完毕即可进行检测。
(C)测定不同产地岩茶样品的氢、氧、氮、碳四种稳定同位素质谱数据:
δ13C、δ15N、δ18O、δ2H、δ86Sr的含量由Thermo Fisher MAT253稳定同位素质谱仪测定,每个样品至少重复分析3次以上,取平均值作为最终结果。
通过SVM-RFE(支持向量机回归特征消去法)对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量,其排序顺序为氢、氧、氮、碳、锶。并利用预测集计算模型的灵敏度增维精度、分辨率增维精度、识别率增维精度,均按重复计算100次平均结果,氢、氧、氮、碳四种数据组成的模型,其识别率最高,因此建模只需要选择氢、氧、氮、碳四种数据即可,无需对锶等其它稳定同位素含量进行检测。
(D)测定不同产地岩茶样品的铯、铜、钙、铷四种微量元素数据
使用原子吸收光谱仪测定样液中Ca、Mg、Mn元素含量,使用电感耦合等离子体质谱测定微波消解液中Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量。样品微波消解,消解完毕,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,则采用上述设备进行检测。
通过SVM-RFE法对微量元素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的微量元素特征变量,并通过预测集计算每一维变量累加之后的模型增维精度,得到铯、铜、钙、铷、锶、钡特征排序顺序。然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,由铯、铜、钙、铷四者微量元素组成的模型,其识别率最高,说明此四种微量元素间的信息具有互补性,只需要选择建模的铯、铜、钙、铷四种微量元素进行检测,无需对其它微量元素进行检测。
(E)基于多种检测技术,即联合近红外光谱检测、稳定同位素检测和微量元素检测三种检测方法,建立不同产地岩茶鉴别数据库:
(1)将每条近红外数据(Y轴数据)拼接在Excel数据表格中,每行所有列数据组成每条近红外数据;
(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序拼接在近红外数据中(按氢、氧、氮、碳拼接在近红外数据列之后);将每个样品的微量元素数据按铯、铜、钙、铷顺序拼接在稳定同位素数据后,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.W.Kennard和L.A.Stone在Computer aided design ofexperiments中的方法,随机选取武夷岩茶产区内总数的65~70%作为原产地内模型数A1,随机取武夷岩茶产区外65~70%作为原产地外模型数A2,建立kenstone分割程序(其设计思路为:首先计算两两样本之间距离,选择距离最大的两个样品;然后分别计算剩余的样本与已选择的两个样本之间的距离;对于每个剩余样本而言,其与已选样品之间的最短距离被选择,然后选择这些最短距离中相对最长的距离所对应的样本,作为第三个样品;重复上述步骤,直至所选的样品的个数等于事先确定的数目为止);
(5)最小二乘支持向量机(LS-SVM,Least Squares Support Vector Machines)最小偏二乘法鉴别模型的建立。将非线性估计函数转化为高维特征空间中线性估计函数,使得LS-SVM的训练过程遵循结构风险最小化原则,将不等式约束改为等式约束,将经验风险由偏差的一次方改为二次方,将求解二次规划问题转化为求解线性方程组,避免不敏感损失函数,极大降低计算复杂度。其设计思路为从机器学习损失函数着手,在其优化问题的目标函数中使用二范数,并利用等式约束条件代替SVM标准算法中的不等式约束条件,使得LS-SVM方法的优化问题的求解变为通过Kuhn-Tucker条件得到的一组线性方程组的求解。对步骤(4)数据分割后的近红外、稳定同位素以及微量元素融合数据,采用最小二乘支持向量机法分析并建立LS-SVM模型,正确判别率达100%。
(F)取待测未知产地样品按照步骤(B)、(C)和(D)测定近红外特征光谱数据、稳定同位素质谱数据和微量元素数据,将测得数据代入上述LS-SVM模型,判别未知样品产地。
具体的,所述步骤(E)中分割程序分别为:[model1,test1]=kenstone(data1,A1)和[model2,test2]=kenstone(dataa2,A2),得到model1、test1、model2、test2。
具体的,所述步骤(E)中最小二乘支持向量机法鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[dataa1(model1,:);dataa2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)最大隐变量数:lvm=20;
(h)分二列学习,用蒙特卡罗交互验证确定隐变量lvp:
[epmccv1,lvp1]=mccvforpls(xxxc,yyc(:,1),lvm);
[epmccv2,lvp2]=mccvforpls(xxxc,yyc(:,2),lvm);
(i)建模过程:
预处理:model=initlssvm(x,y,type,[],[],kernel);
模型测定:model=tunelssvm(model,′simplex′,optfun,optargs);
训练集测定:model=trainlssvm(model);
(j)根据测定结果,采用plotlssvm预测结果,并分别输出yp、alpha、b、gam和sig2:
plotlssvm(model);
end
yp=simlssvm(model,x);
alpha=model.alpha;
b=model.b;
gam=model.gam;sig2=model.kernel_pars;
其中kenstone程序如下所示:
其中mccvforpls程序如下所示:
其中trainlssvm程序如下:
本发明的有益效果主要体现在:本发明基于最小二乘支持向量机判别模型,将不同产地岩茶(包括地理标志产地内和产地外岩茶)近红外特征光谱数据、稳定同位素、微量元素数据融合在一起,建立分析模型,提取试样后利用模型客观、准确的判定岩茶产地,其识别率具有显著提高,可达到100.0%,高于单种数据LS-SVM结果。
(四)具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
实施例1:
A、采集不同产地岩茶样品
国标(GB/T 18745-2006)中规定了武夷岩茶的地理保护范围,即福建省武夷山市行政区划内,本发明在武夷岩茶地理标志保护区武夷街道、星村、兴田、新丰街道、崇安街道、上梅、五夫、岚谷、洋庄、下梅、吴屯11个行政区域内进行样品采集,每个行政区域内随机选择3个取样点(分别以A、B、C进行标示),共33个取样点,取样范围基本涵盖主要产区,每个采样点取样15份(分别以A-1、A-2......A-15进行标示),获得495份地理标志保护区武夷岩茶样品,另在福建省除武夷山市外其他县市(建阳、建瓯、漳州、泉州、松溪、政和),以及广西、贵州、江西(婺源、赣州)等11个地点收集保护区外岩茶样品,每个地点取样15份(分别以1、2......15进行标示),获得165个非地理标志保护区岩茶样品。地理标志产地内样品数与地理标志产地外样品数之比为3∶1。
B、不同产地岩茶近红外特征光谱数据
本发明采用德国布鲁克TENSOR37进行近红外检测,无损检测,无需采用粉碎等前处理,采用相同加料方法、加料量(目测),加料完毕即可进行检测,64次扫描的平均值,扫描范围12000-4000cm-1,数据点间隔为1.928cm-1,室温控制在25℃,湿度保持稳定,每个样本的光谱采集1次。表1为15个上梅C样品部分近红外数据表,其中X轴为波长范围,Y轴为吸光度。
表1:15个上梅C样品部分近红外数据表
C、不同产地岩茶氢、氧、氮、碳四种稳定同位素质谱数据
δ13C、δ15N、δ18O、δ2H、δ2Sr由Thermo Fisher MAT253稳定同位素质谱仪测定,每个样品至少重复分析3次以上,取平均值作为最终结果。地理标志产区内、外岩茶样品同位素比率经上述方法检测,下表2节选部分岩茶样品同位素比率数据表。
表2:部分岩茶样品同位素比率统计表
通过支持向量机回归特征消去法对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量,同位素特征变量排序表为氢、氧、氮、碳、锶,同位素氢的识别率增维最高,其次为氧、氮、碳。然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度增维精度、分辨率增维精度、识别率增维精度,得到表3同位素特征变量组合结果情况。
表3:同位素特征变量组合结果情况
由表3可知,当氢和氧的同位素数据进行组合后,模型识别率下降,说明氧和氢对原产地特征的贡献具有较强的相关性;而加入碳和氮同位素数据后,模型识别率上升,达到93.93%,说明氮和碳具有较好的互补,因此建模只需要选择氢、氧、氮、碳四种数据即可,建模中无需增加锶的数据,在实际检测中,同位素锶等的含量无需检测。
D、测定不同产地岩茶样品的铯、铜、钙、铷四种微量元素数据
使用日立180-50原子吸收光谱仪和Thermo Fisher XSeries II电感耦合等离子体质谱测定样液中Ca、Mg、Mn、Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量。表4为节选部分地理标志产区内、外岩茶样品微量元素数据表。
表4:部分岩茶样品微量元素统计表
通过SVM(支持向量机)对上述武夷岩茶Ca、Mg、Mn等元素数据进行训练和预测,通过预测集计算每一维变量累加之后的模型增维精度,得到铯、铜、钙、铷特征排序顺序,对于原产地特征的贡献率从高到低分别为铯、铜、钙、铷、锶、钡,这说明各变量经支持向量机回归特征消去法与全数据模型进行训练集的训练比较后,铯的识别率增维最高,其次为铜、钙、铷、锶、钡。然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率以及识别率增维精度,得到表5。
表5:同位素特征变量组合结果情况
模型特征变量组合 | 灵敏度增维精度 | 分辨率增维精度 | 识别率增维精度 |
铯 | 0.9350 | 0.4155 | 0.8021 |
铯+铜 | 0.9358 | 0.6300 | 0.8023 |
铯+铜+钙 | 0.9187 | 0.4685 | 0.7993 |
铯+铜+钙+铷 | 0.9327 | 0.4510 | 0.8121 |
铯+铜+钙+铷+锶 | 0.9236 | 0.4682 | 0.7936 |
从表5可知,当铯和铜的同位素数据进行组合后,模型识别率上升,说明铯和铜对原产地特征的贡献具有较强的相关性和互补性;而加入钙和铷元素数据后,模型识别率最高,达到81.21%,说明钙和铷对原产地特征的贡献具有一定的相关性。加入锶以后,识别率下降至79.36%,说明锶对原产地特征的贡献不具备相关性,可以忽略锶的影响。
E、基于多种检测技术建立岩茶产地鉴别方法,即联合近红外、同位素和微量元素建立不同产地岩茶鉴别数据库
(1)将每条近红外数据拼接在Excel数据表格中,每行所有列数据组成每条近红外数据。
(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序拼接在近红外数据中,地理标志产区内样品组成495行、4156列(近红外Y轴数据共4148列,增加4列依次为氢、氧、氮、碳稳定同位素数据,增加4列依次为铯、铜、钙、铷的微量元素数据)的Excel数据表,以data1命名;地理标志产区外样品组成165行、4156列的Excel数据表,以data2命名。
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:参考R.W.Kennard和L.A.Stone在Computer aided design ofexperiments上所述方法,原产地内随机取330(A1)个样品作为模型,原产地外随机取110(A2)个样品作为模型,建立kenstone分割程序,[model1,test1]=kenstone(data1,330)和[model2,test2]=kenstone(data2,110),得到model1、test1、model2、test2。
(5)对近红外、稳定同位素以及微量元素数据建模LS-SVM:
具体的,所述最小二乘支持向量机法鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)最大隐变量数:lvm=20;
(h)分二列学习,用蒙特卡罗交互验证确定隐变量lvp:
[epmccv1,lvp1]=mccvforpls(xxxc,yyc(:,1),lvm);
[epmccv2,lvp2]=mccvforpls(xxxc,yyc(:,2),lvm);
(i)建模过程:
预处理:model=initlssvm(x,y,type,[],[],kernel);
模型测定:model=tunelssvm(model,′simplex′,optfun,optargs);
训练集测定:model=trainlssvm(model);
(j)根据测定结果,采用plotlssvm预测结果,并分别输出yp、alpha、b、gam和sig2:
plotlssvm(model);
end
yp=simlssvm(model,x);
alpha=model.alpha;
b=model.b;
gam=model.gam;sig2=model.kernel_pars;
F、LS-SVM模型识别率
按上述建模方法对近红外光谱、同位素、微量元素以及三者融合数据进行建模分析,其结果见表6。
表6:LS-SVM模型判别结果汇总
不同检测技术所提供的特征数据之间存在互补性,采用本发明LS-SVM建模方法分别对近红外光谱、稳定同位素、微量元素以及三者融合数据进行分析,识别率具有显著提高,三者融合数据识别率最高,达100.0%,远高于单种数据的LS-SVM判别结果。
G、盲样检测
盲样监督小组从武夷岩茶农户处购买岩茶样品,监控晒青、做青、杀青等步骤,确保岩茶样品的原产地域属性,上述样品作为盲样中的地理标志产区内样品;从建阳、建瓯、婺源等地购买岩茶,作为盲样中的地理标志产区外样品,上述盲样与建模岩茶样品出自不同的厂家。分析检测人员事先未能得知待测盲样的产地属性,随机选取若干份,检测,再按本发明方法对盲样产地属性进行判断,并与盲样监督小组进行核对,确定盲样识别率。分别从上述盲样中选取20、60、100个盲样。按照步骤B、C和D方法获得的盲样数据代入上述LS-SVM模型,判断其地理标志属性,其判别准确率均达到100.0%。
实施例2:
采用与实施例1相同的建模方法,数据分割用Kenstone分割程序,用蒙特卡洛交互验证,分别建立LS-SVM、神经网络ELM和偏最小二乘(PLSDA)判别模型,近红外光谱数据不变,稳定同位素、微量元素按照氢、氧、氮、碳、锶、Cs、Cu、Ca、Rb、Sr、Ba、Mg、Mn、Ti、Cr、Co、Ni、Zn、Cd拼接在近红外数据后,其模型识别率分别为91.3%、83.7%和81.2%。
实施例3:
采用与实施例1相同的近红外和经过SVM-RFE处理的稳定同位素、微量元素数据,分别建立LS-SVM、神经网络ELM和偏最小二乘(PLSDA)判别模型,近红外光谱数据不变,稳定同位素、微量元素按照氢、氧、氮、碳、锶、Cs、Cu、Ca、Rb拼接在近红外数据后,其模型识别率分别为97.8%、87.5%和89.3%。
实施例4:
采用与实施例1相同的近红外和经过SVM-RFE处理的稳定同位素、微量元素数据,分别建立LS-SVM、神经网络ELM和偏最小二乘(PLSDA)判别模型,近红外光谱数据不变,稳定同位素、微量元素按照氢、氧、氮、碳、Cs、Cu、Ca、Rb拼接在近红外数据后,其模型识别率分别为100.0%、89.2%和91.1%。
实施例5~10:
岩茶样品、近红外数据、同位素数据和微量元素数据等与实施例1相同,分别采用不同方法进行产地鉴别。实施例8-10分别采用现有发明专利CN103630528A、CN102455320A、CN103245713A所述方法进行鉴别,实施例5~10与实施例1指标区别见表7。
表7:实施例5~10与实施例1指标对比表
从上述比较结果可以得出,采用本发明方法,其盲样检测率达100.0%以上,本发明可作为武夷岩茶产地溯源识别技术方法。
实施例11:
按实施例1方法,取不同产地的香榧样品,测定其近红外数据、稳定同位素数据以及微量元素数据,采用实施例1中所涉建模方法LS-SVM进行判别,最终识别率达到99.8%,本发明可作为香榧产地溯源识别技术方法。
实施例12:
按实施例1方法,取不同产地的藕粉样品,测定其近红外数据、稳定同位素数据以及微量元素数据,采用实施例1中所涉建模方法LS-SVM进行判别,最终识别率达到99.9%,本发明可作为藕粉产地溯源识别技术方法。从实施例1-12可以看出,本发明可作为植物样品产地鉴别方法。
Claims (5)
1.基于多种检测技术的植物产地鉴别方法,所述方法包括:
(A)采集不同产地岩茶样品:
武夷岩茶产区外样品数>100份,且产区周边50公里范围内样品占比>50%;武夷岩茶产区内样品数为产区外样品的2~3倍,采样范围覆盖主要产区各生产企业,且每家企业应不少于3个样品;
(B)测定不同产地岩茶样品的近红外特征光谱数据:
近红外检测参数:64次扫描,特征光谱条带为64次扫描的平均值,扫描范围为12000-4000cm-1,数据点的间隔为1.928cm-1,采集时室温控制在25℃,湿度保持稳定,每个样本的光谱采集1次;
(C)测定不同产地岩茶样品的氢、氧、氮、碳四种稳定同位素质谱数据:
δ18O、δ2H、δ13C、δ2H、δ86Sr的含量,每个样品至少重复分析3次以上,取平均值作为最终结果;
通过SVM-RFE(支持向量机回归特征消去法)对武夷岩茶稳定同位素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的同位素特征变量,其排序顺序为氢、氧、氮、碳、锶;利用预测集计算模型的灵敏度、分辨率、识别率,均按重复计算100次平均结果,氢、氧、氮、碳四种数据组成的模型,其识别率最高,因此建模只需选择氢、氧、氮、碳四种数据,无需对锶等其它稳定同位素含量进行检测;
(D)测定不同产地岩茶样品的铯、铜、钙、铷微量元素数据
样品微波消解,观察消解液是否澄清,若浑浊,则重复压力消解步骤,若完全澄清,使用原子吸收光谱仪测定样液中Ca、Mg、Mn元素含量,使用电感耦合等离子体质谱测定微波消解液中Ti、Cr、Co、Ni、Cu、Zn、Rb、Cd、Cs、Ba、Sr元素含量;
通过SVM-RFE法对微量元素数据进行训练和预测,随机重复100次,并对各变量的模型特征进行排序,筛选出岩茶原产地的微量元素特征变量,其特征排序顺序为铯、铜、钙、铷、锶、钡;然后对特征变量按自然序逐级进行组合,并利用预测集计算模型的灵敏度、分辨率、识别率,由铯、铜、钙、铷四者微量元素组成的模型,其识别率最高,说明此四种微量元素间的信息具有互补性,只需要选择建模的铯、铜、钙、铷四种微量元素进行检测,无需对其它微量元素进行检测;
(E)基于多种检测技术的植物产地鉴别方法,本发明中联合近红外、稳定同位素以及微量元素建立不同产地岩茶鉴别数据库:
(1)将每条近红外数据拼接在Excel数据表格中,每行所有列数据组成每条近红外数据;
(2)将每个样品的稳定同位素数据按氢、氧、氮、碳顺序拼接在近红外数据中,将每个样品的微量元素数据按铯、铜、钙、铷顺序拼接在稳定同位素数据后,武夷岩茶产区内样品组成的Excel数据表,以data1命名;武夷岩茶产区外样品组成的Excel数据表,以data2命名;
(3)运行MATLAB软件中的edit功能,打开data1.xls、data2.xls,以Mat文件格式保存,文件名对应为data1.mat、data2.mat;
(4)数据分割:随机选取武夷岩茶产区内总数的65~70%作为原产地内模型数A1,随机取武夷岩茶产区外65~70%作为原产地外模型数A2,建立kenstone分割程序;
(5)最小二乘支持向量机鉴别模型的建立:对步骤(4)数据分割后的近红外、稳定同位素以及微量元素数据,采用最小二乘支持向量机分析并建立LS-SVM模型;
(F)取待测未知产地样品按照步骤B、C和D测定近红外特征光谱数据、稳定同位素质谱以及微量元素数据,将测得数据代入上述LS-SVM模型,判断样品产地属性。
2.如权利要求1所述的方法,其特征在于所述步骤(E)中分割程序分别为:[model1,test1]=kenstone(data1,A1)和[model2,test2]=kenstone(data2,A2),得到model1、test1、model2、test2。
3.如权利要求1所述的方法,其特征在于所述步骤(E)中最小二乘支持向量机鉴别模型的建立过程如下:
(a)合并训练集:xxxc=[data1(model1,:);data2(model2,:)];
(b)合并预测集:xxxp=[data1(test1,:);data2(test2,:)];
(c)求训练集平均光谱:mx=mean(xxxc);
(d)训练集减去平均光谱:xxxc=xxxc-ones(A,1)*mx;
A为:A1+A2;
(e)预测集减去平均光谱:xxxp=xxxp-ones(B,1)*mx;
B为:原产地内测试集数B1与原产地外测试集数B2之和;
(f)响应变量:yyc=-ones(A,2);yyc(1:A1,1)=1;yyc(A1+1:A,2)=1;
A1与B1之和为原产地内样品总数C1;
A2与B2之和为原产地外样品总数C2;
(g)最大隐变量数:lvm=20;
(h)分二列学习,用蒙特卡罗交互验证确定隐变量lvp:
[epmccv1,lvp1]=mccvforpls(xxxc,yyc(:,1),lvm);
[epmccv2,lvp2]=mccvforpls(xxxc,yyc(:,2),lvm);
(i)建模过程:
预处理:model=initlssvm(x,y,type,[],[],kernel);
模型测定:model=tunelssvm(model,′simplex′,optfun,optargs);
训练集测定:model=trainlssvm(model);
(j)根据测定结果,采用plotlssvm预测结果,并分别输出yp、alpha、b、gam和sig2:
plotlssvm(model);
end
yp=simlssm(model,x);
alpha=model.alpha;
b=model.b;
gam=model.gam;sig2=model.kernel_pars。
4.如权利要求1所述的方法,其特征在于本发明所述最小二乘支持向量机LS-SVM建模方法,对近红外、稳定同位素、微量元素的三者融合数据进行建模分析,模型识别率最高,达100.0%,远高于单种数据LS-SVM的结果;针对20、60、100个盲样,检测识别率均达100.0%,本发明方法可作为武夷岩茶产地溯源识别技术方法。
5.如权利要求1所述的方法,其特征在于所述方法也适合植物样品产地鉴别方法,本发明所述方法对香榧、藕粉等其它植物样品产地鉴别的识别率达99.8%以上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610915272.3A CN106560698A (zh) | 2016-10-20 | 2016-10-20 | 基于多种检测技术的植物产地鉴别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610915272.3A CN106560698A (zh) | 2016-10-20 | 2016-10-20 | 基于多种检测技术的植物产地鉴别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106560698A true CN106560698A (zh) | 2017-04-12 |
Family
ID=58485761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610915272.3A Pending CN106560698A (zh) | 2016-10-20 | 2016-10-20 | 基于多种检测技术的植物产地鉴别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106560698A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107607485A (zh) * | 2017-08-30 | 2018-01-19 | 浙江医药高等专科学校 | 一种鉴别三叶青产地的方法 |
CN108419751A (zh) * | 2018-03-26 | 2018-08-21 | 四川大学 | 一种四川省阿坝州黑水县产凤尾鸡 |
CN108982692A (zh) * | 2018-07-27 | 2018-12-11 | 深圳出入境检验检疫局食品检验检疫技术中心 | 元素分析-稳定同位素质谱判别奶粉产地的方法 |
CN110412115A (zh) * | 2019-07-30 | 2019-11-05 | 浙江省农业科学院 | 基于稳定同位素和多元素的未知年份绿茶原产地预测方法 |
CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
CN113310943A (zh) * | 2021-05-22 | 2021-08-27 | 福州大学 | 一种基于机器学习的藕粉掺假鉴别方法 |
CN113744075A (zh) * | 2021-09-08 | 2021-12-03 | 农业农村部食物与营养发展研究所 | 一种基于人工智能的农产品营养品质等级划分系统 |
CN115615951A (zh) * | 2022-09-14 | 2023-01-17 | 上海市农业科学院 | 一种不同产地薏仁米轻稳定同位素比值的近红外光谱快速检测方法 |
CN116223440A (zh) * | 2023-05-08 | 2023-06-06 | 四川威斯派克科技有限公司 | 一种烟叶原料配比的近红外检测装置 |
CN116933043A (zh) * | 2023-09-15 | 2023-10-24 | 天津现代创新中药科技有限公司 | 菊花产地的鉴别方法、模型的构建方法及电子设备 |
CN116976915A (zh) * | 2023-05-24 | 2023-10-31 | 南京审计大学 | 地理信息支持的种植类地理标志产品溯源方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101299022A (zh) * | 2008-06-20 | 2008-11-05 | 河南中医学院 | 利用近红外光谱技术评价中药药材综合质量的方法 |
KR20110121838A (ko) * | 2010-05-03 | 2011-11-09 | 강원대학교산학협력단 | 근적외 다변량 분석법을 이용한 곡물 시료의 원산지 판별방법 |
CN102243170A (zh) * | 2010-05-12 | 2011-11-16 | 天津天士力现代中药资源有限公司 | 用近红外光谱技术鉴别麦冬药材产地的方法 |
CN103389281A (zh) * | 2012-05-09 | 2013-11-13 | 云南天士力帝泊洱生物茶集团有限公司 | 一种基于近红外光谱技术的普洱茶聚类分析方法 |
CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
CN104020128A (zh) * | 2014-02-21 | 2014-09-03 | 中国农业科学院蜜蜂研究所 | 一种快速鉴别蜂胶胶源的方法 |
CN104730030A (zh) * | 2015-03-27 | 2015-06-24 | 山东大学 | 基于近红外分析技术的党参真伪鉴别和产地判定的方法 |
CN105021562A (zh) * | 2015-07-06 | 2015-11-04 | 黑龙江八一农垦大学 | 一种大米产地溯源方法及其应用 |
CN105044198A (zh) * | 2015-07-03 | 2015-11-11 | 中国农业大学 | 一种基于矿质元素指纹鉴别葡萄酒原产地的方法 |
CN105190261A (zh) * | 2013-03-21 | 2015-12-23 | Viavi科技有限公司 | 海产品的光谱法表征 |
-
2016
- 2016-10-20 CN CN201610915272.3A patent/CN106560698A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101299022A (zh) * | 2008-06-20 | 2008-11-05 | 河南中医学院 | 利用近红外光谱技术评价中药药材综合质量的方法 |
KR20110121838A (ko) * | 2010-05-03 | 2011-11-09 | 강원대학교산학협력단 | 근적외 다변량 분석법을 이용한 곡물 시료의 원산지 판별방법 |
CN102243170A (zh) * | 2010-05-12 | 2011-11-16 | 天津天士力现代中药资源有限公司 | 用近红外光谱技术鉴别麦冬药材产地的方法 |
CN103389281A (zh) * | 2012-05-09 | 2013-11-13 | 云南天士力帝泊洱生物茶集团有限公司 | 一种基于近红外光谱技术的普洱茶聚类分析方法 |
CN103630528A (zh) * | 2012-08-27 | 2014-03-12 | 深圳出入境检验检疫局食品检验检疫技术中心 | 一种利用茶叶中元素含量鉴别茶叶产地的方法 |
CN105190261A (zh) * | 2013-03-21 | 2015-12-23 | Viavi科技有限公司 | 海产品的光谱法表征 |
CN104020128A (zh) * | 2014-02-21 | 2014-09-03 | 中国农业科学院蜜蜂研究所 | 一种快速鉴别蜂胶胶源的方法 |
CN104730030A (zh) * | 2015-03-27 | 2015-06-24 | 山东大学 | 基于近红外分析技术的党参真伪鉴别和产地判定的方法 |
CN105044198A (zh) * | 2015-07-03 | 2015-11-11 | 中国农业大学 | 一种基于矿质元素指纹鉴别葡萄酒原产地的方法 |
CN105021562A (zh) * | 2015-07-06 | 2015-11-04 | 黑龙江八一农垦大学 | 一种大米产地溯源方法及其应用 |
Non-Patent Citations (2)
Title |
---|
GRARD GREMAUD 等: "Characterization of Swiss vineyards using isotopic data in combination with trace elements and classical parameters", 《EUROPEAN FOOD RESEARCH AND TECHNOLOGY》 * |
言思敏: "地理标志产品武夷岩茶的产地识别技术研究", 《中国优秀硕士学位论文全文数据库农业科技辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107607485A (zh) * | 2017-08-30 | 2018-01-19 | 浙江医药高等专科学校 | 一种鉴别三叶青产地的方法 |
CN108419751A (zh) * | 2018-03-26 | 2018-08-21 | 四川大学 | 一种四川省阿坝州黑水县产凤尾鸡 |
CN108982692B (zh) * | 2018-07-27 | 2022-04-12 | 深圳海关食品检验检疫技术中心 | 元素分析-稳定同位素质谱判别奶粉产地的方法 |
CN108982692A (zh) * | 2018-07-27 | 2018-12-11 | 深圳出入境检验检疫局食品检验检疫技术中心 | 元素分析-稳定同位素质谱判别奶粉产地的方法 |
CN110412115A (zh) * | 2019-07-30 | 2019-11-05 | 浙江省农业科学院 | 基于稳定同位素和多元素的未知年份绿茶原产地预测方法 |
CN110907369A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种融合不同检测方法特征变量的武夷岩茶产地鉴别方法 |
CN113310943A (zh) * | 2021-05-22 | 2021-08-27 | 福州大学 | 一种基于机器学习的藕粉掺假鉴别方法 |
CN113744075A (zh) * | 2021-09-08 | 2021-12-03 | 农业农村部食物与营养发展研究所 | 一种基于人工智能的农产品营养品质等级划分系统 |
CN115615951A (zh) * | 2022-09-14 | 2023-01-17 | 上海市农业科学院 | 一种不同产地薏仁米轻稳定同位素比值的近红外光谱快速检测方法 |
CN116223440A (zh) * | 2023-05-08 | 2023-06-06 | 四川威斯派克科技有限公司 | 一种烟叶原料配比的近红外检测装置 |
CN116976915A (zh) * | 2023-05-24 | 2023-10-31 | 南京审计大学 | 地理信息支持的种植类地理标志产品溯源方法 |
CN116976915B (zh) * | 2023-05-24 | 2024-04-05 | 南京审计大学 | 地理信息支持的种植类地理标志产品溯源方法 |
CN116933043A (zh) * | 2023-09-15 | 2023-10-24 | 天津现代创新中药科技有限公司 | 菊花产地的鉴别方法、模型的构建方法及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106560698A (zh) | 基于多种检测技术的植物产地鉴别方法 | |
CN106560692A (zh) | 联合四种检验技术的武夷岩茶产地鉴别方法 | |
CN106560697A (zh) | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 | |
CN106560691A (zh) | 具有深度学习功能的武夷岩茶产地鉴别方法 | |
CN106560700A (zh) | 能自动鉴别武夷岩茶产地的机器学习方法 | |
CN101975788B (zh) | 低场核磁共振鉴别食用油品质的方法 | |
CN107894408A (zh) | 一种基于近红外光谱仪的食用油多元掺伪鉴别方法 | |
CN106560693A (zh) | 基于偏最小二乘判别的武夷岩茶产地鉴别方法 | |
CN103033486B (zh) | 陈皮及广陈皮药材质量的近红外光谱监控方法 | |
CN104677875B (zh) | 一种三维荧光光谱结合平行因子鉴别不同品牌白酒的方法 | |
CN107424003A (zh) | 一种基于稳定性同位素比率和多元素的杨梅产地溯源方法 | |
CN106560704A (zh) | 联合同位素和微量元素检验的武夷岩茶产地鉴别方法 | |
CN106560695A (zh) | 联合三种检测方法的武夷岩茶产地鉴别方法 | |
CN106560694A (zh) | 基于多种检验技术的武夷岩茶产地智能鉴别方法 | |
CN103630528A (zh) | 一种利用茶叶中元素含量鉴别茶叶产地的方法 | |
CN106560841A (zh) | 基于深度学习的武夷岩茶产地鉴别方法 | |
CN106560699A (zh) | 用于武夷岩茶产地鉴别的联合检测方法 | |
CN103487558A (zh) | 一种应用智能感官信号进行茶叶品质的模式识别分析过程中检测异常样本的方法 | |
CN104020129A (zh) | 一种基于近红外光谱结合氨基酸分析技术的工夫红茶发酵质量的判别方法 | |
CN111007032B (zh) | 一种快速无损鉴别甘草及其伪品刺果甘草的近红外光谱法 | |
CN106018332A (zh) | 一种柑桔黄龙病的近红外光谱田间检测方法 | |
CN101995389A (zh) | 一种由近红外光谱快速识别原油种类的方法 | |
CN105740898A (zh) | 一种利用光谱特征向量结合主成分分析建立分类模型的方法 | |
CN101957316B (zh) | 一种用近红外光谱技术鉴别响水大米的方法 | |
CN104502299A (zh) | 一种利用近红外光谱技术鉴别五常稻花香大米的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170412 |