CN113504200A - 一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法 - Google Patents
一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法 Download PDFInfo
- Publication number
- CN113504200A CN113504200A CN202110891344.6A CN202110891344A CN113504200A CN 113504200 A CN113504200 A CN 113504200A CN 202110891344 A CN202110891344 A CN 202110891344A CN 113504200 A CN113504200 A CN 113504200A
- Authority
- CN
- China
- Prior art keywords
- coumarin
- terahertz
- sample
- food additives
- domain spectroscopy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- ZYGHJZDHTFUPRJ-UHFFFAOYSA-N coumarin Chemical compound C1=CC=C2OC(=O)C=CC2=C1 ZYGHJZDHTFUPRJ-UHFFFAOYSA-N 0.000 title claims abstract description 148
- 235000001671 coumarin Nutrition 0.000 title claims abstract description 74
- 229960000956 coumarin Drugs 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 68
- 235000013373 food additive Nutrition 0.000 title claims abstract description 66
- 239000002778 food additive Substances 0.000 title claims abstract description 66
- 238000001328 terahertz time-domain spectroscopy Methods 0.000 title claims abstract description 26
- 238000000513 principal component analysis Methods 0.000 claims abstract description 24
- 238000012706 support-vector machine Methods 0.000 claims abstract description 22
- 238000005457 optimization Methods 0.000 claims abstract description 20
- 241000282461 Canis lupus Species 0.000 claims abstract description 18
- 238000000862 absorption spectrum Methods 0.000 claims abstract description 18
- 238000001228 spectrum Methods 0.000 claims abstract description 18
- 238000009826 distribution Methods 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 27
- 239000000843 powder Substances 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 239000007787 solid Substances 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000010521 absorption reaction Methods 0.000 claims description 6
- 238000001035 drying Methods 0.000 claims description 6
- 229920001903 high density polyethylene Polymers 0.000 claims description 6
- 239000004700 high-density polyethylene Substances 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 6
- 238000002156 mixing Methods 0.000 claims description 6
- 238000000227 grinding Methods 0.000 claims description 5
- 238000005303 weighing Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 claims description 2
- 238000011049 filling Methods 0.000 claims description 2
- 239000004570 mortar (masonry) Substances 0.000 claims description 2
- 239000002245 particle Substances 0.000 claims description 2
- 239000012086 standard solution Substances 0.000 description 12
- FXFYOPQLGGEACP-UHFFFAOYSA-N 6-methylcoumarin Chemical compound O1C(=O)C=CC2=CC(C)=CC=C21 FXFYOPQLGGEACP-UHFFFAOYSA-N 0.000 description 11
- CBOQJANXLMLOSS-UHFFFAOYSA-N ethyl vanillin Chemical compound CCOC1=CC(C=O)=CC=C1O CBOQJANXLMLOSS-UHFFFAOYSA-N 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- ZENOXNGFMSCLLL-UHFFFAOYSA-N vanillyl alcohol Chemical compound COC1=CC(CO)=CC=C1O ZENOXNGFMSCLLL-UHFFFAOYSA-N 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 9
- ZMQAAUBTXCXRIC-UHFFFAOYSA-N safrole Chemical compound C=CCC1=CC=C2OCOC2=C1 ZMQAAUBTXCXRIC-UHFFFAOYSA-N 0.000 description 8
- WJUFSDZVCOTFON-UHFFFAOYSA-N veratraldehyde Chemical compound COC1=CC=C(C=O)C=C1OC WJUFSDZVCOTFON-UHFFFAOYSA-N 0.000 description 8
- 238000010811 Ultra-Performance Liquid Chromatography-Tandem Mass Spectrometry Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 239000000796 flavoring agent Substances 0.000 description 7
- 235000019634 flavors Nutrition 0.000 description 7
- 235000013305 food Nutrition 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- WBYWAXJHAXSJNI-VOTSOKGWSA-M .beta-Phenylacrylic acid Natural products [O-]C(=O)\C=C\C1=CC=CC=C1 WBYWAXJHAXSJNI-VOTSOKGWSA-M 0.000 description 5
- WBYWAXJHAXSJNI-SREVYHEPSA-N Cinnamic acid Chemical compound OC(=O)\C=C/C1=CC=CC=C1 WBYWAXJHAXSJNI-SREVYHEPSA-N 0.000 description 5
- 229930016911 cinnamic acid Natural products 0.000 description 5
- 235000013985 cinnamic acid Nutrition 0.000 description 5
- 229940073505 ethyl vanillin Drugs 0.000 description 5
- WBYWAXJHAXSJNI-UHFFFAOYSA-N methyl p-hydroxycinnamate Natural products OC(=O)C=CC1=CC=CC=C1 WBYWAXJHAXSJNI-UHFFFAOYSA-N 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- GOLORTLGFDVFDW-UHFFFAOYSA-N 3-(1h-benzimidazol-2-yl)-7-(diethylamino)chromen-2-one Chemical compound C1=CC=C2NC(C3=CC4=CC=C(C=C4OC3=O)N(CC)CC)=NC2=C1 GOLORTLGFDVFDW-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- IDGUHHHQCWSQLU-UHFFFAOYSA-N ethanol;hydrate Chemical compound O.CCO IDGUHHHQCWSQLU-UHFFFAOYSA-N 0.000 description 3
- 239000003205 fragrance Substances 0.000 description 3
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 235000013599 spices Nutrition 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000010355 oscillation Effects 0.000 description 2
- 239000013076 target substance Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- VIIIJFZJKFXOGG-UHFFFAOYSA-N 3-methylchromen-2-one Chemical compound C1=CC=C2OC(=O)C(C)=CC2=C1 VIIIJFZJKFXOGG-UHFFFAOYSA-N 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 231100000357 carcinogen Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000010813 internal standard method Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3581—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using far infrared light; using Terahertz radiation
- G01N21/3586—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using far infrared light; using Terahertz radiation by Terahertz time domain spectroscopy [THz-TDS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Toxicology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法,首先采用操作简单、快速、灵敏的太赫兹时域光谱系统来获取香豆素类食品添加剂的太赫兹光谱,并使用主成分分析(PCA)和流形学习t分布随机邻域嵌入(t‑SNE)联用的方法(P‑t‑SNE)对吸收度光谱进行特征提取,浓缩了有效信息,节省了建模时间和鉴别时间;然后在利用支持向量机(SVM)进行分类鉴别时,优化惩罚因子c和核函数g两个参数是重点,本发明通过差分进化灰狼优化(DEGWO)算法有效地优化上述两个参数,使得分类鉴别模型更加准确有效。
Description
技术领域
本发明属于香豆素类食品添加剂鉴别技术领域,更为具体地讲,涉及一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法。
背景技术
食用香精是一类可以给予食品某种香气的复杂混合物。在食品生产过程中,通过添加天然的或合成的香料可增加或给予食品香气及其独特的风味。随着香精香料等食品添加剂越来越多的应用到食品中,其食用安全性不容忽视。
6-甲基香豆素(6-Methyl Coumarin,6-MC)、甲基香兰素(Methyl Vanillin,MVA)、香草醇(Vanillyl Alcohol,VOH)、乙基香兰素(Ethyl Vanillin,EVA)、肉桂酸(CinnamicAcid,CINN)等为规定允许使用的食用香料成分,而香豆素(Coumarin)于2017年被世卫组织认定为致癌物质,不允许添加到食物中。但是香豆素与这几种物质颜色相近,不仅肉眼难以区别,而且由于香豆素价格实惠,常被非法添加到某些食品香料里。因此,为了使用食品香料的安全,对香豆素类食品添加剂的检测具有重要意义。
目前针对食品添加剂的鉴别方法主要有气相色谱法(GC)、质谱法(MS)、气相色谱-串联质谱法(GC-MS)、液相色谱-串联质谱法(LC-MS)、高效液相色谱法(HPLC)、超高效液相色谱-串联质谱法(UPLC-MS)等,这些检测方法精度相对较高,但往往存在前期样品处理过程复杂、费时费力等问题,很难实现对香豆素类食品添加剂的现场快速鉴别。
如2014年05月22日公布的,公布号为CN103983725A,名称为《一种香精香料中香豆素和黄樟素的快速测定方法》的中国发明专利申请中,公布了一种香精香料中香豆素的超高效液相色谱-串联质谱法(UPLC-MS)。主要鉴别过程为:
①配制乙醇水溶液作为提取液;
②配制内标溶液:称取一定量香豆素-d4,用乙醇水溶液配制浓度为125μg/mL的内标溶液;
③配制混合标准溶液:称取一定量香豆素、黄樟素,用乙醇水溶液配制含黄樟素和香豆素分别为5μg/mL的混合标准溶液;
④样品前处理:称取香精香料样品于三角瓶中,依次加入内标溶液和乙醇水溶液,振荡萃取,取上层清液经有机滤膜过滤后,供超高效液相色谱-串联质谱联用法(UPLC-MS/MS)测定;
⑤标准曲线的绘制:取混合标准溶液0.05ml、0.1mL、0.5mL、1mL、2mL、4mL、8mL,各加入内标溶液40μL,用乙醇水溶液定容至10mL,摇匀,得7级工作标准溶液。对上述系列标准溶液进行UPLC-MS/MS分析,以目标物与内标的峰面积比值对二者相应的浓度比值进行线性回归分析,求得香豆素和黄樟素的标准曲线;
⑥数据处理与检测:由组分峰面积与内标峰面积之比进行内标法定量。检测结果表明香豆素定量和定性母–子离子对分别为147.1/91.1和147.1/103.1,满足其定性和定量分析检测要求。
从上述中国发明专利申请来看,UPLC-MS/MS分析以前,制作混合标准溶液需要多个步骤包括配制提取液、内标溶液,混合标准溶液,振荡萃取,有机滤膜过滤,过程复杂、费时费力,很难实现现场快速鉴别。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法,以实现香豆素类食品添加剂的现场快速鉴别。
为实现上述发明目的,本发明基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法,其特征在于,包括以下步骤:
(1)、将香豆素类食品添加剂作为样品研磨成粉末状,并与高密度聚乙烯按适当比例进行混合,制成实验样片;
(2)、利用太赫兹时域光谱系统,采用透射测量模式对实验样片进行测量,获得太赫兹时域光谱参考信号Eref(t)和样品信号Esam(t);
(3)、利用傅里叶变换、高斯窗处理、数据平滑等方法对太赫兹时域光谱参考信号Eref(t)和样品信号Esam(t)进行处理,得到太赫兹频域光谱参考信号Eref(ω)和样品信号Esam(ω),并依据太赫兹频域光谱参考信号Eref(ω)和样品信号Esam(ω)计算出样品吸收度光谱;
(4)、利用主成分分析(PCA)和流形学习t分布随机邻域嵌入(t-SNE)联用的方法(P-t-SNE)对吸收度光谱进行特征提取,得到特征数据;
(5)、将每种香豆素类食品添加剂按照步骤(1)制作多片实验样片,并按照步骤(2)到(4)进行处理,得到每种香豆素类食品添加剂的多组特征数据,所有种类香豆素类食品添加剂的多组特征数据构成校正集;
(6)、构建一分类鉴别模型;
(7)、将校正集的特征数据进行归一化处理,将香豆素类食品添加剂的类别作为标签,与对应的归一化处理后的特征数据送入鉴别模型对其进行训练,得到最佳分类鉴别模型;
(8)、对于未知香豆素类食品添加剂,按照步骤(1)的方法进行处理,制成实验样本,然后按照步骤(2)~(4)的方法进行处理,得到特征数据并进行归一化处理,然后送入最佳分类鉴别模型,得到其类别。
作为优选,将支持向量机算法的参数选择与优化过程看作一个在一定范围对满足约束条件的参数进行搜索的参数搜索问题,应用差分进化灰狼优化算法确定惩罚因子c和核函数参数g两个参数,建立差分进化灰狼优化-支持向量机模型(DEGWO-SVM)作为分类鉴别模型。
本发明的目的是这样实现的。
本发明基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法,首先采用操作简单、快速、灵敏的太赫兹时域光谱系统来获取香豆素类食品添加剂的太赫兹光谱,并使用主成分分析(PCA)和流形学习t分布随机邻域嵌入(t-SNE)联用的方法(P-t-SNE)对吸收度光谱进行特征提取,浓缩了有效信息,节省了建模时间和鉴别时间;然后再利用支持向量机(SVM)进行分类鉴别时,优化惩罚因子c和核函数g两个参数是重点,本发明通过差分进化灰狼优化(DEGWO)算法有效地优化上述两个参数,使得分类鉴别模型更加准确有效。
附图说明
图1是本发明基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法一种具体实施方式流程图;
图2是样品信号的太赫兹时域光谱图;
图3是样品信号的太赫兹频域光谱图;
图4是6种香豆素类食品添加剂在0.5~2.0THz频段的太赫兹吸收度光谱图;
图5是太赫兹吸收度光谱的主成分贡献率分布图;
图6是6种香豆素类食品添加剂在P-t-SNE的三维空间分布图;
图7是6种香豆素类食品添加剂在PCA的三维空间分布图;
图8是模型最佳参数与适应度曲线图;
图9是混淆矩阵预测结果可视化图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
图1是本发明基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法一种具体实施方式流程图。
在本实施例中,如图1所示,本发明基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法,包括以下步骤:
步骤S1:香豆素类食品添加剂实验样片制备
将香豆素类食品添加剂作为样品研磨成粉末状,并与高密度聚乙烯按适当比例进行混合,制成实验样片。
首先,将香豆素类食品添加剂固体粉末放于YB-1A真空恒温干燥箱内进行干燥,温度设为50℃,干燥2~3h,目的是减小因粉末受潮后水分对太赫兹波吸收而对实验结果产生影响;其次,利用玛瑙研钵对干燥好的固体粉末进行研磨,研磨至200目左右,目的是减小粉末颗粒大小不均匀而产生的散射影响;然后,对AF2004B型电子分析天平进行校准,并利用校准后的电子分析天平对固体粉末进行称量;最后,将固体粉末与高密度聚乙烯进行混合,并均匀地装入HF2型模具中,使用FM4A型压片机进行压片(压力8~10MPa,时间1~2min)。
实验样片制备时,样片厚度为1mm左右,半径为6.5mm,内部均匀,表面相互平行,呈圆片状;制得合格实验样片每种36片,共216片。
步骤S2:太赫兹光谱数据采集
利用太赫兹时域光谱系统,采用透射测量模式对实验样片进行测量,获得太赫兹时域光谱参考信号Eref(t)和样品信号Esam(t)。
本发明使用太赫兹时域光谱(THz-TDS)技术进行测量,在本实施例中,采用的THz-TDS装置为美国Zomega公司研制的Z-3型太赫兹时域光谱仪,其主要由超快飞秒光纤激光器、太赫兹辐射产生装置和相应的探测装置,以及时间延迟控制系统组成。
在本实施例中,测量实验样片在0.5~2.0THz的太赫兹时域光谱信息。为保证测量数据(太赫兹时域光谱参考信号Eref(t)和样品信号Esam(t))的准确性,对6种香豆素类食品添加剂进行测试时,每种香豆素类食品添加剂各有36个实验样片,每个样片正反各测量3次,每6组数据取平均,从而每种香豆素类食品添加剂获得36组数据,共获得216组数据(太赫兹时域光谱参考信号Eref(t)和样品信号Esam(t)),具体见表1:
表1步骤S3:光谱数据预处理
利用傅里叶变换、高斯窗处理、数据平滑等方法对太赫兹时域光谱参考信号Eref(t)和样品信号Esam(t)进行处理,得到太赫兹频域光谱参考信号Eref(ω)和样品信号Esam(ω),并依据太赫兹频域光谱参考信号Eref(ω)和样品信号Esam(ω)计算出样品吸收度光谱。
在本实施例中,样品吸收度光谱为:
图2和图3分别为样品信号的太赫兹时域光谱图和频域光谱图,图4给出了6种香豆素类食品添加剂在0.5~2.0THz频段的太赫兹吸收度光谱图,为方便观察各个样品的吸收度光谱,图中将各个样品的太赫兹吸收度光谱向上进行了一定平移。从上到下依次为香豆素、6-甲基香豆素、甲基香兰素、香草醇、乙基香兰素和肉桂酸。
从图4可见,香豆素、6-甲基香豆素、甲基香兰素3种物质的太赫兹特征光谱与香草醇、乙基香兰素、肉桂酸3种物质存在较大差别,可以较容易的从太赫兹吸收度光谱图中进行区分。但香草醇、乙基香兰素、肉桂酸3种物质的太赫兹光谱特性比较相似,香豆素、6-甲基香豆素、甲基香兰素3种物质的吸收峰也比较相近,如果受到噪声或者测量误差的影响,吸收峰存在偏移而发生重叠,很难对这几类物质进行准确鉴别。因此,为了能对这几类物质做出准确鉴别,需要借助一定的分类识别算法来进行建模区分。
步骤S4:太赫兹光谱特征提取
利用主成分分析(PCA)和流形学习t分布随机邻域嵌入(t-SNE)联用的方法(P-t-SNE)对吸收度光谱进行特征提取,得到特征数据,可获得较好表征样品光谱特征的主要信息。
目前应用较为广泛的频谱特征提取方法有主成分分析法(PCA)和偏最小二乘法(PLS)等。PCA是一种常用的线性降维算法,但它不能解释特征之间复杂的多项式关系,PLS可分区间进行拟合,选取拟合精度最高的频率区间作为特征谱区构造定性模型,但所提取的特征为局部特征,不利于表达频谱波形的整体特征。
t分布随机邻域嵌入(t-SNE)是由Laurens van der Maaten和Geoffrey Hinton提出,用于降维的一种机器学习算法,该方法非常适用于高维数据的非线性降维。t-SNE的核心原理是通过在高维空间中使用归一化的高斯核并在低维空间中使用t分布来对数据点进行相似性建模。遵循该原理,选择相似点的可能性较高,而选择非相似点的可能性较低。
本发明采用PCA与t-SNE联合使用的方法(P-t-SNE)对吸收度光谱进行特征提取。在进行t-SNE之前,先设置高斯核参数为30,然后通过PCA将吸收度光谱的328维数据降到10维,已包含原吸收度光谱99%的信息,主成分贡献率分布见图5,这样减少参数量,再使用t-SNE算法降到3维,最后将处理后的数据作为分类鉴别模型的输入量。
在本实施例中,经特征提取后,6种香豆素类食品添加剂在P-t-SNE的三维空间分布图如图6所示。
作为比较,将通过PCA将吸收度光谱的328维数据直接降到三维,6种香豆素类食品添加剂在PCA的三维空间分布图如图7所示。
对比图6、图7,我们可以发现,经P-t-SNE处理后,各类点的聚集程度明显比PCA单独处理过的要好,这是由于数据集内部可能存在复杂的非线性关系,PCA因其局限性无法很好地处理这种关系,而t-SNE通过t分布来对数据点进行相似性建模,使数据在特征空间的投影呈现良好的分离性,并且具有强大的可视化效果。另一方面,PCA的优势在于处理时间较短,而t-SNE处理时间颇长,综合两者的优势,本发明采用PCA和t-SNE联用的方法(P-t-SNE)进行太赫兹光谱特征的提取。
步骤S5:构建校正集
将每种香豆素类食品添加剂按照步骤S1制作多片实验样片,并按照步骤S2到S4进行处理,得到每种香豆素类食品添加剂的多组特征数据,所有种类香豆素类食品添加剂的多组特征数据构成校正集。
相对于留出法、交叉验证法和自助法划分等方法,随机法更注重样本的随机性,更符合实际情况。具体地,在本实施例中,6种香豆素类食品添加剂共有216组数据,使用随机法选取其中144组作为校正集,其余72组作为预测集,测量结果可测多次,取平均值。
数据集在输入到鉴别模型使用前需要进行归一化处理,鉴别模型通过对归一化的校正集144组数据进行训练,获得模型最佳参数组合;然后,将参数组合设置为SVM算法的参数,再对归一化的预测集72组数据进行预测。
步骤S6:构建一分类鉴别模型
将支持向量机算法的参数选择与优化过程看作一个在一定范围对满足约束条件的参数进行搜索的参数搜索问题,应用差分进化灰狼优化算法确定惩罚因子c和核函数参数g两个参数,建立差分进化灰狼优化-支持向量机模型(DEGWO-SVM)作为分类鉴别模型。
本质上来说,标准SVM属于颇具代表性的二分类器之一,应用“一对一”和“一对多”策略,SVM可用于多分类。本发明使用径向基核函数(RBF)组合而成的SVM,其分类能力取决于惩罚因子c与核参数g,通常可使用网格搜索法(CS)和交叉验证法(CV)等方法找出恰当的SVM参数。但是上述方法因本身局限性可能无法求得最佳SVM参数,诊断结果也会存在一定偏差。
灰狼优化算法(Grey Wolf Optimizer,GWO)是由Seyedali Mirjalili等人提出,它是一种通过模拟自然界中狼群体社会层次和狩猎机制的群智能优化算法,非常适用于参数寻优问题。在GWO算法中,整个狼群按照适应度从高到低分为α,β,δ,ω四层。整个优化过程就是α,β,δ,ω狼位置的更新过程,主要通过寻找猎物、包围猎物和攻击猎物三个步骤来实现算法的优化。基本的GWO算法具有较好的全局搜索能力,并且参数少、易实现,但存在收敛速度慢、寻优精度低、易陷入局部极值等缺陷。
差分进化算法(Differential Evolution,DE)是由Rainer Storn和KennethPrice提出,通过群体内个体间的相互竞争与合作产生的群体智能来指导优化搜索的方向,主要操作包括变异、交叉和选择。针对上述灰狼优化算法的缺陷,本发明引入差分进化机制作为GWO算法的进化方式,利用GWO全局最优解的搜索能力确保算法的收敛,结合两种算法的优势提出一种改进的灰狼优化算法--差分进化灰狼优化(DEGWO)算法。
基本的GWO算法在求解过程中,随着进化代数增加,种群的多样性会变小,易导致早熟现象,本方法通过在灰狼优化的更新过程中引入差分进化策略,利用头狼之间的个体差异性,在空间进行跳跃搜索,增加了种群的多样性,可择优选择下一代灰狼,有效的提高了进化代数收敛性,改进后的算法在优化SVM模型的参数c和g时取得了较好的效果,如图8所示。
步骤S7:训练鉴别模型
将校正集的特征数据进行归一化处理,将香豆素类食品添加剂的类别作为标签,与对应的归一化处理后的特征数据送入分类鉴别模型对其进行训练,得到最佳分类鉴别模型。
步骤S8:鉴别香豆素类食品添加剂
对于未知香豆素类食品添加剂,按照步骤(1)的方法进行处理,制成实验样本,然后按照步骤(2)~(4)的方法进行处理,得到特征数据并进行归一化处理,然后送入最佳分类鉴别模型,得到其类别。,得到其类别。
分类效果
获得混淆矩阵评价模型,计算香豆素类食品添加剂的查准率与查全率,评价综合的分类效果。
假设有一个n分类(本发明为6分类)问题,使用分类方法对这个问题进行处理,得到的分类鉴别结果可以用一个n*n的矩阵来表示,这个矩阵称为混淆矩阵。在本实施例中,使用混淆矩阵将定性鉴别结果可视化。另外,从混淆矩阵中还可以获得查准率(Accuracy)和查全率(Recall)两个指标,这两个指标分别描述了正确分类的样本占总样本的比例和正确分类的样本占应该识别出来的样本的比例。计算公式如下:
式中,下标i表示第i类样本,j表示第j类样本,n表示样本总数量,Nii表示正确分类的样本数量,Nij表示有Nij个预测类别为i的样本被识别为类别为j的样本,Nik表示有Nik个预测类别为i的样本被识别为类别为k的样本。
根据预测集的查准率与查全率可以计算出其精确度,一般来说,在校正集精确度可信的基础上,预测集的平均精确度越高,表示分类模型效果越好。
应用本发明提出的主成分分析-t分布随机邻域嵌入-差分进化灰狼优化-支持向量机(P-t-SNE-DEGWO-SVM)方法得到的预测集结果可用混淆矩阵表示,如图9所示。在混淆矩阵中,预测类别按列进行排列,每一列的样本总和代表识别为该类别样本的数目;真实类别按行进行排列,每一行的样本总和代表该类别样本的真实数目。从图9可见,除了第3行、第4列有一个误判结果,其它部分数据识别结果都集中在在混淆矩阵的对角线上,初步说明本方法鉴别结果较为可靠。
由图9可以计算获得6种香豆素类食品添加剂的查准率与查全率。
表2是各类香豆素类食品添加剂的查准率与查全率及预测集精确度。
表2
如表2所示,除了第3种香豆素类食品添加剂的查准率为100%、查全率为91.67%;第4种香豆素类食品添加剂的查全率为92.31%、查全率为100%,其余物质的查准率与查全率均为100%,且得到的预测集的精确度较高,达到98.61%。
将算法连续运行20次取平均,求得分类鉴别结果如表3所示。
表3
从表3我们可以看出,应用本发明提出的P-t-SNE-DEGWO-SVM方法建立的分类鉴别模型的预测精确度(98.61%)高于主成分分析-差分进化灰狼优化-支持向量机(PCA-DEGWO-SVM)方法的预测精确度(97.22%),说明P-t-SNE方法对香豆素类食品添加剂太赫兹光谱特征信息的提取效果比PCA方法更好,一定程度上解决了太赫兹光谱建模有效信息利用率低的问题;同时,P-t-SNE-DEGWO-SVM方法建立的分类鉴别模型的预测精确度(98.61%)也高于主成分分析-t分布随机邻域嵌入-网格搜索-支持向量机(P-t-SNE-GS-SVM)方法的预测精确度(91.67%),说明DEGWO方法对SVM参数的优化效果比传统GS方法更好,一定程度上解决了SVM参数寻优难的问题。
综上所述,利用本发明方法得出校正集的平均精确度为100%,预测集的平均精确度达到98.61%,校正集和预测集精度均较高,结果表明本发明提出的方法能有效地对香豆素类食品添加剂进行定性分类鉴别。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (4)
1.一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法,其特征在于,包括以下步骤:
(1)、将香豆素类食品添加剂作为样品研磨成粉末状,并与高密度聚乙烯按适当比例进行混合,制成实验样片;
(2)、利用太赫兹时域光谱系统,采用透射测量模式对实验样片进行测量,获得太赫兹时域光谱参考信号Eref(t)和样品信号Esam(t);
(3)、利用傅里叶变换、高斯窗处理、数据平滑等方法对太赫兹时域光谱参考信号Eref(t)和样品信号Esam(t)进行处理,得到太赫兹频域光谱参考信号Eref(ω)和样品信号Esam(ω),并依据太赫兹频域光谱参考信号Eref(ω)和样品信号Esam(ω)计算出样品吸收度光谱;
(4)、利用主成分分析(PCA)和流形学习t分布随机邻域嵌入(t-SNE)联用的方法(P-t-SNE)对吸收度光谱进行特征提取,得到特征数据;
(5)、将每种香豆素类食品添加剂按照步骤(1)制作多片实验样片,并按照步骤(2)到(4)进行处理,得到每种香豆素类食品添加剂的多组特征数据,所有种类香豆素类食品添加剂的多组特征数据构成校正集;
(6)、构建一分类鉴别模型;
(7)、将校正集的特征数据进行归一化处理,将香豆素类食品添加剂的类别作为标签,与对应的归一化处理后的特征数据送入鉴别模型对其进行训练,得到最佳分类鉴别模型;
(8)、对于未知香豆素类食品添加剂,按照步骤(1)的方法进行处理,制成实验样本,然后按照步骤(2)~(4)的方法进行处理,得到特征数据并进行归一化处理,然后送入最佳分类鉴别模型,得到其类别。
2.根据权利要求1所述的基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法,其特征在于,所述构建一分类鉴别模型为:
将支持向量机算法的参数选择与优化过程看作一个在一定范围对满足约束条件的参数进行搜索的参数搜索问题,应用差分进化灰狼优化算法确定惩罚因子c和核函数参数g两个参数,建立差分进化灰狼优化-支持向量机模型(DEGWO-SVM)作为分类鉴别模型。
3.根据权利要求1所述的基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法,其特征在于,所述将香豆素类食品添加剂作为样品研磨成粉末状,并与高密度聚乙烯进行混合,制成实验样片为:
首先,将香豆素类食品添加剂固体粉末放于真空恒温干燥箱内进行干燥,温度设为50℃,干燥2~3h,目的是减小因粉末受潮后水分对太赫兹波吸收而对实验结果产生影响;其次,利用玛瑙研钵对干燥好的固体粉末进行研磨,研磨至200目左右,目的是减小粉末颗粒大小不均匀而产生的散射影响;然后,对电子分析天平进行校准,并利用校准后的电子分析天平对固体粉末进行称量;最后,将固体粉末与高密度聚乙烯按进行混合,并均匀地装入模具中,使用压片机进行压片(压力8~10MPa,时间1~2min)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110891344.6A CN113504200A (zh) | 2021-08-04 | 2021-08-04 | 一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110891344.6A CN113504200A (zh) | 2021-08-04 | 2021-08-04 | 一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113504200A true CN113504200A (zh) | 2021-10-15 |
Family
ID=78014954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110891344.6A Pending CN113504200A (zh) | 2021-08-04 | 2021-08-04 | 一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113504200A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114184574A (zh) * | 2021-11-05 | 2022-03-15 | 太赫兹科技应用(广东)有限公司 | 一种基于太赫兹光谱技术鉴别柴胡品种及真伪的方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103472032A (zh) * | 2013-09-24 | 2013-12-25 | 浙江大学 | 一种利用太赫兹时域光谱技术检测盐酸四环素的方法 |
CN108279217A (zh) * | 2018-04-28 | 2018-07-13 | 江苏建筑职业技术学院 | 一种基于太赫兹时域光谱的煤岩判别方法 |
CN109270044A (zh) * | 2018-11-28 | 2019-01-25 | 安徽理工大学 | 一种激光诱导荧光植物油掺杂浓茶水鉴定方法 |
CN111693484A (zh) * | 2020-06-29 | 2020-09-22 | 河南工业大学 | 一种基于太赫兹时域光谱的芝麻油品种识别方法 |
CN111965134A (zh) * | 2020-08-13 | 2020-11-20 | 桂林电子科技大学 | 一种橡胶硫化促进剂混合物的太赫兹光谱定量分析方法 |
CN113092403A (zh) * | 2021-04-12 | 2021-07-09 | 桂林电子科技大学 | 一种学生校服纺织品材料太赫兹光谱定性检测方法 |
CN113155774A (zh) * | 2021-03-31 | 2021-07-23 | 桂林电子科技大学 | 一种纺织品材料太赫兹光谱定量检测方法 |
-
2021
- 2021-08-04 CN CN202110891344.6A patent/CN113504200A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103472032A (zh) * | 2013-09-24 | 2013-12-25 | 浙江大学 | 一种利用太赫兹时域光谱技术检测盐酸四环素的方法 |
CN108279217A (zh) * | 2018-04-28 | 2018-07-13 | 江苏建筑职业技术学院 | 一种基于太赫兹时域光谱的煤岩判别方法 |
CN109270044A (zh) * | 2018-11-28 | 2019-01-25 | 安徽理工大学 | 一种激光诱导荧光植物油掺杂浓茶水鉴定方法 |
CN111693484A (zh) * | 2020-06-29 | 2020-09-22 | 河南工业大学 | 一种基于太赫兹时域光谱的芝麻油品种识别方法 |
CN111965134A (zh) * | 2020-08-13 | 2020-11-20 | 桂林电子科技大学 | 一种橡胶硫化促进剂混合物的太赫兹光谱定量分析方法 |
CN113155774A (zh) * | 2021-03-31 | 2021-07-23 | 桂林电子科技大学 | 一种纺织品材料太赫兹光谱定量检测方法 |
CN113092403A (zh) * | 2021-04-12 | 2021-07-09 | 桂林电子科技大学 | 一种学生校服纺织品材料太赫兹光谱定性检测方法 |
Non-Patent Citations (5)
Title |
---|
JIN GUO等: "A Reliable Method for Identification of Antibiotics by Terahertz Spectroscopy and SVM", 《JOURNAL OF SPECTROSCOPY》 * |
于慧伶等: "基于PCA与t-SNE特征降维的城市植被SVM识别方法", 《实验室研究与探索》 * |
张同军等: "β-D-吡喃半乳糖的太赫兹光谱研究", 《光谱学与光谱分析》 * |
张文涛等: "基于太赫兹时域光谱技术与PCA-SVM 的转基因大豆油鉴别研究", 《红外与激光工程》 * |
潘炎辉等: "太赫兹光谱与成像技术在炸药检测中的研究进展", 《刑事技术》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114184574A (zh) * | 2021-11-05 | 2022-03-15 | 太赫兹科技应用(广东)有限公司 | 一种基于太赫兹光谱技术鉴别柴胡品种及真伪的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ren et al. | Highly identification of keemun black tea rank based on cognitive spectroscopy: Near infrared spectroscopy combined with feature variable selection | |
CN106501470B (zh) | 利用味觉系统与电子鼻联合评价芥辣酱风味等级的方法 | |
Jiang et al. | Comparison of algorithms for wavelength variables selection from near-infrared (NIR) spectra for quantitative monitoring of yeast (Saccharomyces cerevisiae) cultivations | |
CN108132226B (zh) | 橡胶补强剂炭黑的太赫兹光谱定量分析方法 | |
Kar et al. | Application of near-infrared spectroscopy for the detection of metanil yellow in turmeric powder | |
Ding et al. | NIR spectroscopy and chemometrics for the discrimination of pure, powdered, purple sweet potatoes and their samples adulterated with the white sweet potato flour | |
CN104807787B (zh) | 一种基于激光诱导击穿光谱技术的茶叶分类鉴别方法 | |
CN108875913B (zh) | 一种基于卷积神经网络的松茸快速无损检测系统及方法 | |
Huang et al. | Improved generalization of spectral models associated with Vis-NIR spectroscopy for determining the moisture content of different tea leaves | |
Huang | Chemometric methods in analytical spectroscopy technology | |
CN104990894B (zh) | 一种基于加权吸光度及相似样本的汽油性质检测方法 | |
Liu et al. | Discrimination of Pericarpium Citri Reticulatae in different years using Terahertz Time-Domain spectroscopy combined with convolutional neural network | |
Li et al. | Identification of aged-rice adulteration based on near-infrared spectroscopy combined with partial least squares regression and characteristic wavelength variables | |
Kalogiouri et al. | Liquid chromatographic methods coupled to chemometrics: A short review to present the key workflow for the investigation of wine phenolic composition as it is affected by environmental factors | |
Li et al. | Quantitative analysis of fish meal freshness using an electronic nose combined with chemometric methods | |
CN110646407A (zh) | 一种基于激光诱导击穿光谱技术的水产品中磷元素含量的快速检测方法 | |
Ge et al. | Classification of oolong tea varieties based on hyperspectral imaging technology and BOSS‐LightGBM model | |
Jiang et al. | Determination of acid value during edible oil storage using a portable NIR spectroscopy system combined with variable selection algorithms based on an MPA‐based strategy | |
Chen et al. | Identification of coumarin‐based food additives using terahertz spectroscopy combined with manifold learning and improved support vector machine | |
Ning et al. | Rapid evaluation of soil fertility in tea plantation based on near-infrared spectroscopy | |
Hu et al. | Age discrimination of Chinese Baijiu based on midinfrared spectroscopy and chemometrics | |
Wulandari et al. | Determination of total flavonoid content in medicinal plant leaves powder using infrared spectroscopy and chemometrics | |
CN113504200A (zh) | 一种基于太赫兹时域光谱的香豆素类食品添加剂鉴别方法 | |
Soni et al. | A review of conventional and rapid analytical techniques coupled with multivariate analysis for origin traceability of soybean | |
Zhou et al. | Tomato storage quality predicting method based on portable electronic nose system combined with WOA-SVM model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211015 |