CN112067577A - 基于支持向量机的奶油色素超标鉴别方法、装置及设备 - Google Patents
基于支持向量机的奶油色素超标鉴别方法、装置及设备 Download PDFInfo
- Publication number
- CN112067577A CN112067577A CN202010829774.0A CN202010829774A CN112067577A CN 112067577 A CN112067577 A CN 112067577A CN 202010829774 A CN202010829774 A CN 202010829774A CN 112067577 A CN112067577 A CN 112067577A
- Authority
- CN
- China
- Prior art keywords
- pigment
- cream
- support vector
- vector machine
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000006071 cream Substances 0.000 title claims abstract description 79
- 239000000049 pigment Substances 0.000 title claims abstract description 71
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 50
- 238000012360 testing method Methods 0.000 claims abstract description 29
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 238000002790 cross-validation Methods 0.000 claims abstract description 12
- 238000001514 detection method Methods 0.000 claims abstract description 5
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 230000003321 amplification Effects 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 9
- 238000004451 qualitative analysis Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 6
- 235000005979 Citrus limon Nutrition 0.000 description 5
- 244000131522 Citrus pyriformis Species 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 4
- 235000013310 margarine Nutrition 0.000 description 3
- 239000003264 margarine Substances 0.000 description 3
- 239000001052 yellow pigment Substances 0.000 description 3
- COHYTHOBJLSHDF-UHFFFAOYSA-N Indigo Chemical compound N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 239000005862 Whey Substances 0.000 description 2
- 102000007544 Whey Proteins Human genes 0.000 description 2
- 108010046377 Whey Proteins Proteins 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 235000009328 Amaranthus caudatus Nutrition 0.000 description 1
- 240000001592 Amaranthus caudatus Species 0.000 description 1
- SGHZXLIDFTYFHQ-UHFFFAOYSA-L Brilliant Blue Chemical compound [Na+].[Na+].C=1C=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C(=CC=CC=2)S([O-])(=O)=O)C=CC=1N(CC)CC1=CC=CC(S([O-])(=O)=O)=C1 SGHZXLIDFTYFHQ-UHFFFAOYSA-L 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 235000012735 amaranth Nutrition 0.000 description 1
- 239000004178 amaranth Substances 0.000 description 1
- 235000020244 animal milk Nutrition 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 231100000357 carcinogen Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 235000012730 carminic acid Nutrition 0.000 description 1
- OIQPTROHQCGFEF-UHFFFAOYSA-L chembl1371409 Chemical compound [Na+].[Na+].OC1=CC=C2C=C(S([O-])(=O)=O)C=CC2=C1N=NC1=CC=C(S([O-])(=O)=O)C=C1 OIQPTROHQCGFEF-UHFFFAOYSA-L 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- IINNWAYUJNWZRM-UHFFFAOYSA-L erythrosin B Chemical compound [Na+].[Na+].[O-]C(=O)C1=CC=CC=C1C1=C2C=C(I)C(=O)C(I)=C2OC2=C(I)C([O-])=C(I)C=C21 IINNWAYUJNWZRM-UHFFFAOYSA-L 0.000 description 1
- 235000012732 erythrosine Nutrition 0.000 description 1
- 239000004174 erythrosine Substances 0.000 description 1
- 229940011411 erythrosine Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及基于支持向量机的奶油色素超标鉴别方法、装置及设备,方法包括如下步骤:步骤一,获取色素超标样本奶油样本以及色素未超标的奶油样本在预设波长范围内的原始近红外光谱数据;步骤二,对原始近红外光谱数据进行预处理;步骤三,采用SMOTE算法对奶油样本扩增得到色素超标和色素未超标样本数量均衡的样本集;步骤四,将样本集划分为训练集和测试集,采用交叉验证法对支持向量机进行训练,直至测试集上的分类的准确度高于预设值,得到最优支持向量机模型;步骤五,通过最优支持向量机模型对待测奶油样本中色素是否超标进行鉴。实现了对于奶油色素是否超标的有效鉴定,提高了奶油中色素超标鉴别的准确率以及检测效率。
Description
技术领域
本发明属于奶油质控技术领域,具体涉及基于支持向量机的奶油色素超标鉴别方法、装置及设备。
背景技术
奶油是一种生活中常见的食品,根据原料来源的不同,一般可分为动物奶油和植物奶油,由于动物奶油的产源于动物乳,产能有限,为了满足人们对奶油的需求,开始有了人造奶油。人造奶油的优点在于产量高,成本低。所以快速的占据了奶油市场。为了让人造奶油变得色泽鲜艳,现在很多的商家都会在其里面添加人工色素,但是过量的人工色素会危害人体健康,在人体内转化为致癌物质,也会影响儿童智力发育。因此,如何准确、高效地鉴别奶油中色素含量是否超标,是食品安全领域中的一大重要问题,而现有的奶油色素含量鉴定方法存在效率低下的问题。
发明内容
本发明解决的技术问题为:提供了一种基于支持向量机的奶油色素超标鉴别方法、装置及设备,用以提高奶油中色素超标鉴别的准确率以及检测效率。
本发明提供的具体解决方案包括如下步骤:
本发明提供了一种基于支持向量机的奶油色素超标鉴别方法,其特征在于,包括如下步骤:
步骤一,获取色素超标样本奶油样本以及色素未超标的奶油样本在预设波长范围内的原始近红外光谱数据;
步骤二,对所述原始近红外光谱数据进行预处理;
步骤三,采用SMOTE算法对奶油样本扩增得到色素超标和色素未超标样本数量均衡的样本集;
步骤四,将所述样本集划分为训练集和测试集,采用交叉验证法对支持向量机进行训练,直至测试集上的分类的准确度高于预设值,得到最优支持向量机模型;
步骤五,通过最优支持向量机模型对待测奶油样本中色素是否超标进行鉴别。
基于本发明的方法,采用近红外光谱分析具有分析速度快、分析效率高、分析成本低、无需样品预处理和无损分析的优点;正负样本(即超标和未超标样本)不均衡时,会造成分类效果过拟合,泛化能力差,或者分类效果欠拟合,分类准确率大大降低,采用SMOTE算法解决正负样本(即超标和未超标样本)比例不均衡问题,实现正负样本均衡,有效提高了分类准确率;通过交叉验证法对支持向量机进行训练,得到了奶油色素超标鉴定模型。基于本发明的方法,首次结合近红外光谱和SMOTE-SVM对奶油掺色素进行定性鉴别,实现了对于奶油色素是否超标的有效鉴定,得到了一种高效的、无损的定性分析模型。
具体的,SMOTE的具体算法如下:
(1)取所有的少数样本(x1,x2,...xn),以欧式距离为标准计算它到所有少数样本的距离,得到其k近邻,欧式距离公式如下:
(2)根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个少数类样本x,从其k近邻中随机选择若干个样本,假设选择的近邻为xn;对于每一个随机选出的近邻xn,分别与原样本按照如下的公式构建新的样本,实现正负样本均衡。
xnew=x+rand(0,1)*|x-xn|
在上述方案的基础上,本发明的技术方案还可以进行如下改进:
进一步,所述预处理过程包括:采用均值中心化算法(MC,Mean centering)或标准正态变换算法(SNV)对所述原始红外光谱数据进行降噪处理。
原始光谱图在采集的过程中,由于人为操作或者是仪器自身会造成大量的背景噪声及物理因素的干扰,这些对于建立定量定性分析模型都会造成一定的影响,因此在建立模型之前首先考虑进行适当的光谱预处理,且近红外光谱除了包含有用的化学信息外,还包含了大量有关非目标因素的无用物理信息,如背景噪声和基线漂移等。
具体的,可采用SNV(标准正态修正变换)消除粒子分布不均匀和粒径不同对光谱的影响,该方法的计算公式如下:
具体的,还可采用MC法对所述原始红外光谱数据进行降噪处理,MC法是从每个样品的光谱数据中减去所有样品的平均光谱数据,处理后的光谱矩阵的平均值为零,从而消除了光谱的绝对吸收,第i个样品的均值中心第k波长定义为:
其中,n是样品的数量,k=1,2…,m,m是波长点的数量。
优选的,采用MC方法进行预处理。
实验结果表明,使用MC方法进行预处理效果最好,获得的精确率、召回率及F1值均高于SNV方法。
具体的,所述预处理还包括归一化处理。
进一步,采用简单交叉验证法对支持向量机进行训练。
具体的,所述交叉验证过程如下,将样本集分为的训练集和测试集,然后用训练集来训练模型,在测试集上验证模型及参数;接着,再把样本打乱,重新选择训练集和测试集,继续训练数据和检验模型,直至测试集上的分类的准确度高于预设值,选择该模型作为最优支持向量机模型。
优选的,所述训练集和测试集按照样本数量9:1进行划分。
进一步,步骤1)中的预设波长范围为8000~14000nm。
该波长下涵盖奶油色素的主要红外特征峰且噪音少,提高分析鉴别的准确度,在该条件下,使用含某一色素(柠檬黄色素)的奶油样品进行训练得到训练后的支持向量机模型,然后可使用该模型对含有多种色素(比如含有胭脂红、苋菜红、赤藓红、新红、柠檬黄、日落黄、靛蓝和亮蓝至少两种)的待测奶油进行检测,鉴别其中的柠檬黄色素是否超标。
进一步,采用F1值来评价模型分类的准确度,F1值的具体计算过程如下:
其中TP、TN、FO和FN分别代表真正例、真反例、假正例以及假反例。F1是是精确率和召回率的综合评价指标,其中,正确地预测为正例(真正例),TP;正确地预测为反例(真反例),TN;错误地预测为正例(假正例),FP;错误地预测为反例(假反例),TN。
本发明还提供了一种基于支持向量机的奶油色素超标鉴别装置,包括:
获取单元,用于获取色素超标样本奶油样本以及色素未超标的奶油样本在预设波长范围内的原始近红外光谱数据;
预处理单元,用于对所述原始近红外光谱数据进行预处理;
样本扩增单元,用于采用SMOTE算法对奶油样本扩增得到色素超标和色素未超标样本数量均衡的样本集;
训练单元,用于将所述样本集划分为训练集和测试集,采用交叉验证法对支持向量机进行训练,直至测试集上的分类的准确度高于预设值,得到最优支持向量机模型;
检测分析单元,用于通过最优支持向量机模型对待测奶油样本中色素是否超标进行鉴别。
进一步,所述预处理单元包括降噪子单元,用于采用均值中心化算法和标准正态变换算法对所述原始红外光谱数据进行降噪处理。
进一步,所述训练单元采用简单交叉验证对支持向量机进行训练。
本发明还提供了一种基于支持向量机的奶油色素超标鉴别设备,其特征在于,包括处理器、存储器和存储在所述存储器中的计算机且可运行在所述处理器上的计算机程序,所述计算机程序运行时实现如上所述的方法。
本发明还提供了一种计算机存储介质,所述计算机存储介质包括:至少一个指令,在所述指令被执行时实现如上所述的方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1为基于支持向量机的奶油色素超标鉴别方法流程图。
图2为基于支持向量机的奶油色素超标鉴别装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,下面描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
如图1所示,基于支持向量机的奶油色素超标鉴别装置,包括:
获取单元100,用于获取色素超标样本奶油样本以及色素未超标的奶油样本在预设波长范围内的原始近红外光谱数据;
预处理单元200,用于对原始近红外光谱数据进行预处理;
样本扩增单元300,用于采用SMOTE算法对奶油样本扩增得到色素超标和色素未超标样本数量均衡的样本集;
训练单元400,用于将样本集划分为训练集和测试集,采用交叉验证法对支持向量机进行训练,直至测试集上的分类的准确度高于预设值,得到最优支持向量机模型;
检测分析单元500,用于通过最优支持向量机模型对待测奶油样本中色素是否超标进行鉴别。
实施例1
结合附图2,使用上述基于支持向量机的奶油色素超标鉴别装置进行奶油色素超标鉴别的方法,步骤如下:
S1、获取原始光谱数据。获取数据库中不同浓度的132份含柠檬黄色素的奶油样品(含88份正样品、44份负样品),在8 000-14000nm的波长范围内的近红外光谱。
S2、采用MC方法对获取到的原始光谱数据进行预处理。
S3、使用SMOTE算法对负样品进行扩增。数据集中的正负样品的比例是2:1,正负样本比例不均衡,会造成分类效果过拟合,泛化能力差,或者分类效果欠拟合,准确率较低,使用SMOTE过采样的方法使正负样本均衡的样本集。
S4、构建训练模型。根据最终得到的样本集按照9:1的比例分为训练集和测试集,训练集用来训练模型,使用支持向量机构建光谱定性分析模型,并根据训练集对训练模型进行训练并用测试集检验模型,具体的,在训练之前预先设置好SVM模型的参数,之后将样本打乱,重新选择训练集和测试集,继续训练数据和并用测试集检验模型,直到准确率、精确率、召回率及F1值满足要求,得到最优支持向量机模型。
S5、分析样本。鉴别奶油色素是否超标,将待测样本输入最优支持向量机模型进行分类,并对分析结果进行了评价。
实施例2
基于支持向量机的奶油色素超标鉴别方法,步骤如下:
S1、获取原始光谱数据。对奶油样品进行精确取样,配置不同浓度的132份样品(含88份正样品、44份负样品),将装满适当质量乳膏样品的样品箱放入分光计中进行近红外扫描,在8000-14000nm的波长范围内获得近红外光谱,并以平均3次扫描的光谱分辨率记录下来。
S2、采用MC方法对采集到的光谱数据进行预处理。
S3、使用SMOTE算法对负样品进行样本扩增。数据集中的正负样品的比例是2:1,正负样本比例不均衡,会造成分类效果过拟合,泛化能力差,或者分类效果欠拟合,准确率较低,使用SMOTE过采样的方法得到正负样本均衡的数据样本集。
S4、构建训练模型。根据最终得到的样本集按照9:1的比例分为训练集和测试集,训练集用来训练模型,使用支持向量机构建光谱定性分析模型,并根据训练集对训练模型进行训练并用测试集检验模型,具体的,在训练之前预先设置好SVM模型的参数,之后将样本打乱,重新选择训练集和测试集,继续训练数据和并用测试集检验模型,直到精确率及召回率满足要求,得到最优支持向量机模型。
S5、分析样本。鉴别奶油色素是否超标,将待测样本输入最优支持向量机模型进行分类,对分类鉴别结果进行分析,精确率为0.84,召回率为0.84。
具体的,奶油样品由超市人造黄油制成,在奶油中添加柠檬黄色素,纯度超过99%,采用Sartorius CP224S 10000/10电子天平对0.0012g颜料进行精确称重,在本发明所采用的数据中,所有重量的准确度均达到了0.0001g;乳清液搅拌后,称量不同质量的乳清液,加入色素,配置不同浓度的132份样品(含88份正样品、44份负样品),将装满适当质量乳膏样品的样品箱放入分光计中进行近红外扫描;奶油小心地装载以避免产生气泡(气泡会影响机器的近红外线扫描,导致数据图极不准确),光谱测量使用傅里叶变换红外光谱仪(俄罗斯InfraLUM FT-12),在8000-14000nm范围内获得近红外光谱,并以平均3次扫描的光谱分辨率记录下来。
实施例3
基于支持向量机的奶油色素超标鉴别方法,步骤如下:
S1、获取原始光谱数据。对奶油样品进行精确取样,配置不同浓度的132份样品(含88份负样品、44份正样品),将装满适当质量乳膏样品的样品箱放入分光计中进行近红外扫描,在8000-14000nm的波长范围内获得近红外光谱,并以平均3次扫描的光谱分辨率记录下来。
S2、采用MC方法对采集到的光谱数据进行预处理。
S3、使用SMOTE算法对正样品数量进行样本扩增。数据集中的正负样品的比例是2:1,正负样本比例不均衡,会造成分类效果过拟合,泛化能力差,或者分类效果欠拟合,准确率较低,使用SMOTE过采样的方法得到正负样本均衡的数据样本集。
S4、构建训练模型。根据最终得到的样本集按照7:3的比例分为训练集和测试集,训练集用来训练模型,使用支持向量机构建光谱定性分析模型,采用简单交叉验证法对训练模型进行训练,具体的,在训练之前预先设置好SVM模型的参数,之后将样本打乱,重新选择训练集和测试集,继续训练数据和并用测试集检验模型,直到F1值满足要求,得到最优支持向量机模型。
S5、分析实验结果。鉴别奶油色素是否超标,将待测样本输入最优支持向量机模型进行分类。
对比例1-3
与实施例相同,区别仅在于步骤四中,对比例1使用RF(随机森林)构建光谱定性分析模型,对比例2中采用BP(反向传播)构建光谱定性分析模型,对比例3中采用KNN构建光谱定性分析模型。实验结果表明,SVM模型在所有模型中性能最优,其分析鉴别的准确率、精确率、召回率及F1值分别达到了0.86、0.84、0.84、0.85。
尽管上面已经详细描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (10)
1.一种基于支持向量机的奶油色素超标鉴别方法,其特征在于,包括如下步骤:
步骤一,获取色素超标样本奶油样本以及色素未超标的奶油样本在预设波长范围内的原始近红外光谱数据;
步骤二,对所述原始近红外光谱数据进行预处理;
步骤三,采用SMOTE算法对奶油样本扩增得到色素超标和色素未超标样本数量均衡的样本集;
步骤四,将所述样本集划分为训练集和测试集,采用交叉验证法对支持向量机进行训练,直至测试集上的分类的准确度高于预设值,得到最优支持向量机模型;
步骤五,通过最优支持向量机模型对待测奶油样本中色素是否超标进行鉴别。
2.根据权利要求1所述的基于支持向量机的奶油色素超标鉴别方法,其特征在于,所述预处理过程包括:采用均值中心化算法和标准正态变换算法对所述原始红外光谱数据进行降噪处理。
3.根据权利要求1所述的基于支持向量机的奶油色素超标鉴别方法,其特征在于,采用简单交叉验证法对支持向量机进行训练。
4.根据权利要求1所述的基于支持向量机的奶油色素超标鉴别方法,其特征在于,步骤1)中的预设波长范围为8000~14000nm。
6.一种基于支持向量机的奶油色素超标鉴别装置,其特征在于,包括:
获取单元,用于获取色素超标样本奶油样本以及色素未超标的奶油样本在预设波长范围内的原始近红外光谱数据;
预处理单元,用于对所述原始近红外光谱数据进行预处理;
样本扩增单元,用于采用SMOTE算法对奶油样本扩增得到色素超标和色素未超标样本数量均衡的样本集;
训练单元,用于将所述样本集划分为训练集和测试集,采用交叉验证法对支持向量机进行训练,直至测试集上的分类的准确度高于预设值,得到最优支持向量机模型;
检测分析单元,用于通过最优支持向量机模型对待测奶油样本中色素是否超标进行鉴别。
7.根据权利要求6所述的基于支持向量机的奶油色素超标鉴别装置,其特征在于,所述预处理单元包括降噪子单元,用于采用均值中心化算法和标准正态变换算法对所述原始红外光谱数据进行降噪处理。
8.根据权利要求6所述的基于支持向量机的奶油色素超标鉴别装置,其特征在于,所述训练单元采用简单交叉验证对支持向量机进行训练。
9.一种基于支持向量机的奶油色素超标鉴别设备,其特征在于,包括处理器、存储器和存储在所述存储器中的计算机且可运行在所述处理器上的计算机程序,所述计算机程序运行时实现如权利要求1至5任一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质包括:至少一个指令,在所述指令被执行时实现如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010829774.0A CN112067577A (zh) | 2020-08-18 | 2020-08-18 | 基于支持向量机的奶油色素超标鉴别方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010829774.0A CN112067577A (zh) | 2020-08-18 | 2020-08-18 | 基于支持向量机的奶油色素超标鉴别方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112067577A true CN112067577A (zh) | 2020-12-11 |
Family
ID=73661913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010829774.0A Pending CN112067577A (zh) | 2020-08-18 | 2020-08-18 | 基于支持向量机的奶油色素超标鉴别方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112067577A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449792A (zh) * | 2021-06-28 | 2021-09-28 | 四创电子股份有限公司 | 一种无损快速检测食品质量的方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102313714A (zh) * | 2011-09-21 | 2012-01-11 | 浙江大学 | 一种红花提取液测定方法 |
CN104374731A (zh) * | 2014-11-18 | 2015-02-25 | 湖南省食品测试分析中心 | 用于鉴别稻米镉含量超标的mir光谱分析模型及鉴别方法 |
CN108764589A (zh) * | 2018-08-10 | 2018-11-06 | 武汉工程大学 | 一种基于支持向量机的离子浓度预测方法 |
CN109034261A (zh) * | 2018-08-10 | 2018-12-18 | 武汉工程大学 | 一种基于支持向量机的近红外光谱数据分析方法 |
CN109374573A (zh) * | 2018-10-12 | 2019-02-22 | 乐山师范学院 | 基于近红外光谱分析的黄瓜表皮农药残留识别方法 |
CN110488020A (zh) * | 2019-08-09 | 2019-11-22 | 山东大学 | 一种蛋白质糖化位点鉴定方法 |
CN111044483A (zh) * | 2019-12-27 | 2020-04-21 | 武汉工程大学 | 一种基于近红外光谱的奶油中色素测定方法、系统和介质 |
-
2020
- 2020-08-18 CN CN202010829774.0A patent/CN112067577A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102313714A (zh) * | 2011-09-21 | 2012-01-11 | 浙江大学 | 一种红花提取液测定方法 |
CN104374731A (zh) * | 2014-11-18 | 2015-02-25 | 湖南省食品测试分析中心 | 用于鉴别稻米镉含量超标的mir光谱分析模型及鉴别方法 |
CN108764589A (zh) * | 2018-08-10 | 2018-11-06 | 武汉工程大学 | 一种基于支持向量机的离子浓度预测方法 |
CN109034261A (zh) * | 2018-08-10 | 2018-12-18 | 武汉工程大学 | 一种基于支持向量机的近红外光谱数据分析方法 |
CN109374573A (zh) * | 2018-10-12 | 2019-02-22 | 乐山师范学院 | 基于近红外光谱分析的黄瓜表皮农药残留识别方法 |
CN110488020A (zh) * | 2019-08-09 | 2019-11-22 | 山东大学 | 一种蛋白质糖化位点鉴定方法 |
CN111044483A (zh) * | 2019-12-27 | 2020-04-21 | 武汉工程大学 | 一种基于近红外光谱的奶油中色素测定方法、系统和介质 |
Non-Patent Citations (1)
Title |
---|
覃朗等: "非均衡数据下基于信息增益的SMOTE改进SVM模型研究", 《中国管理科学》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449792A (zh) * | 2021-06-28 | 2021-09-28 | 四创电子股份有限公司 | 一种无损快速检测食品质量的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102735642B (zh) | 一种快速无损鉴别初榨橄榄油和油橄榄果渣油的方法 | |
CN103543123A (zh) | 一种掺假牛奶的红外光谱识别方法 | |
CN104807775B (zh) | 一种用于鉴别煎炸油质量的nir光谱分析模型及方法 | |
CN102830087A (zh) | 基于近红外光谱技术快速鉴别餐饮废弃油脂的方法 | |
CN106841083A (zh) | 基于近红外光谱技术的芝麻油品质检测方法 | |
CN101713731A (zh) | 一种药物制剂包衣质量的鉴别方法 | |
CN109540836A (zh) | 基于bp人工神经网络的近红外光谱糖度检测方法及系统 | |
CN111044483A (zh) | 一种基于近红外光谱的奶油中色素测定方法、系统和介质 | |
CN105486655A (zh) | 基于红外光谱智能鉴定模型的土壤有机质快速检测方法 | |
CN113030001B (zh) | 一种水果糖度检测方法及系统 | |
CN112098357B (zh) | 一种基于近红外光谱的草莓感官品质等级评价方法 | |
CN110068543A (zh) | 一种基于迁移学习的太赫兹光谱识别方法 | |
Wang et al. | Onsite nutritional diagnosis of tea plants using micro near-infrared spectrometer coupled with chemometrics | |
CN110082310A (zh) | 一种橡胶树叶片氮素含量的近红外波段高光谱诊断方法 | |
CN106383088A (zh) | 一种基于多光谱成像技术的种子纯度快速无损检测方法 | |
CN111693487A (zh) | 基于遗传算法和极限学习机的水果糖度检测方法及系统 | |
CN112067577A (zh) | 基于支持向量机的奶油色素超标鉴别方法、装置及设备 | |
CN113504198A (zh) | 一种苋菜红色素浓度检测方法、装置及存储介质 | |
CN101968438A (zh) | 一种原料肌肉注水快速判别方法 | |
CN113310929A (zh) | 高温灭菌奶中掺加豆粉及其掺加比例的光谱鉴定方法 | |
CN113903407A (zh) | 成分识别方法、装置、电子设备和存储介质 | |
CN113310934A (zh) | 骆驼奶中掺加奶牛奶及其掺加比例的快速鉴定方法 | |
CN102809635B (zh) | 一种适宜溶解型蛋白质加工的花生品质测定及其评价方法 | |
Wang et al. | SVM classification method of waxy corn seeds with different vitality levels based on hyperspectral imaging | |
CN110231300A (zh) | 一种无损快速鉴别真假阿克苏红富士苹果的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201211 |