CN117517233A - 一种基于主成分分析与支持向量机模型判别青稞酒的方法 - Google Patents

一种基于主成分分析与支持向量机模型判别青稞酒的方法 Download PDF

Info

Publication number
CN117517233A
CN117517233A CN202311462476.2A CN202311462476A CN117517233A CN 117517233 A CN117517233 A CN 117517233A CN 202311462476 A CN202311462476 A CN 202311462476A CN 117517233 A CN117517233 A CN 117517233A
Authority
CN
China
Prior art keywords
highland barley
barley wine
model
principal component
support vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311462476.2A
Other languages
English (en)
Inventor
张明锦
张世芝
赵玉霞
王振斌
殷博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qinghai Normal University
Original Assignee
Qinghai Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qinghai Normal University filed Critical Qinghai Normal University
Priority to CN202311462476.2A priority Critical patent/CN117517233A/zh
Publication of CN117517233A publication Critical patent/CN117517233A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/33Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明提供一种基于主成分分析与支持向量机模型判别青稞酒的方法,涉及白酒无损检测领域,该方法利用紫外光谱技术采集3种白酒的光谱信息,对紫外光谱进行预处理,然后通过K‑S方法获得校正集和预测集样本光谱数据;将校正集样本光谱数据进行主成分分析,降低数据维度,提取主成分变量输入到支持向量机模型,建立主成分分析‑支持向量机模型,对3种品类的样本进行定性识别;利用预测集样本模型的AUC值评价模型分类性能的优良程度,本发明与传统的检测方法相比,大大缩短测定时间,不需要大量的有机溶剂,节省了大量的人力和物力。本发明有利于提高白酒质量控制水平,保证成品质量稳定、可靠,可在白酒分类检验环节推广应用。

Description

一种基于主成分分析与支持向量机模型判别青稞酒的方法
技术领域
本发明涉及白酒无损检测领域,尤其涉及一种基于主成分分析与支持向量机模型判别青稞酒的方法。
背景技术
不同的青稞酒酿造工艺的差异会直接影响产品的质量,加之其时间成本、物料成本差异巨大,进而反映在产品品质与售价上也是天壤之别,市场上有很多商家以非互助青稞酒冒充互助青稞酒牟利,导致青稞酒市场上存在着不规范现象。
为了检测青稞酒的质量,采用感官评价和气相色谱法(GC)以及化学计量学方法多利用有监督模式识别方法支持向量机等单一的方法建立模型对青稞酒的质量进行检测,为青稞酒质量的不同检测方式,但由于依据人感官分析方式,准确度易受主观因素影响,以及传统检测技术耗时长且耗费大量有机溶剂,对环境不友好,且单一的模式识别技术只能解决品类少的单一分类,未能实现品类繁多的多分类问题,因此,提出一种基于主成分分析与支持向量机模型判别青稞酒的方法解决白酒品类的判别问题。
发明内容
本发明的目的在于提供一种基于主成分分析与支持向量机模型判别青稞酒的方法,以解决上述背景技术提出的技术问题。
本发明为解决上述技术问题,采用以下技术方案来实现:
一种基于主成分分析与支持向量机模型判别青稞酒的方法,包括以下步骤:
1、收集样品:收集3种品类白酒的74个已知样品;
2、采集样品信息:用紫外光谱法采集同样温度下不同白酒样本的光谱信息,每个样本采集3次光谱信息,然后进行平均处理作为各种典型样本各自对应的光谱代表信息,得到光谱数据T,为了减少温度及紫外光谱仪对实验结果的影响,紫外光谱仪采集样品时选择同一天内扫描完,减少采集间隔时间,确保每次实验保持在相同环境及仪器噪声下;
3、获取样本集:步骤2得到的原始光谱曲线中,采集光谱所掺杂的噪声较多,信噪比较低,为了提高模型的准确性,要对采集光谱信息进行预处理,得到新的光谱图数据T1,T2,T3……,并通过K-S方法将74个样本的光谱数据信息按3:2分为校正集和预测集,其中校正集样本44个,预测集样本30个;
4、建立模型:将步骤3预处理后的校正集样本T1、T2、T3……建立PCA-SVM模型;首先,光谱数据经过PCA降维,提取最佳主成分变量,将最佳主成分变量输入到SVM模型中,SVM模型采用线性核函数建模。
5、建立判别模型:利用步骤4中PCA-SVM模型特征工作曲线下的AUC值,对PCA-SVM模型进行评价和检验,并确定模型AUC值,AUC值大于设定数值,此模型为3种品类白酒的判别模型R,若验AUC值低于可接受数值时则需对模型进行优化。
6、预测结果:利用预处理后预测集紫外光谱数据,得到光谱信息P,将P代入判别模型R中,运行步骤3选取的谱图处理方式,得到未知样品是否属于互助青稞酒品类,对所述步骤4所建立模型进行分析,得到3个品类白酒PCA-SVM组合的校正集预测模型,并最终在输入预测集样品光谱数据后完成预测结果的显示。
优选的,所述步骤2中紫外光谱的采集背景为无水乙醇。
优选的,所述步骤2中紫外光谱的采集参数波段范围200~320nm,且单个样品扫描次数为3次,扫描间隔为1nm。
优选的,所述步骤3中光谱预处理的方式为无处理、Savitzky-Golay(SG)平滑、一阶导数、乘性散射校正(MSC)和标准正态变量(SNV),其中,最优的处理方式为标准正态变量(SNV),并对步骤2中经过SNV预处理后的紫外光谱图集T进行PCA分析,考虑前3个主成分时,累计方差贡献率达到96.01%,前3个主成分能够解释数据中96.01%的信息。
优选的,所述步骤4中模型为2分类PCA-SVM模型,所述2分类PCA-SVM模型的数量为四个。
优选的,所述4种模型的测试集工作特征(ROC)曲线下面积(AUC)分别为99.07%、95.56%、91.25%和94.44%。
优选的,所述步骤1中3种品类白酒分别为互助青稞酒、其它品牌青稞酒、非青稞酒,所述互助青稞酒编号为CHQL、其它品牌青稞酒编号为OBQL、非青稞酒编号为NQBL,所述3种品类白酒数量分别为28:20:26(CHQL:OBQL:NQBL)。
本发明的有益效果是:
1、本发明的方法无需进行样品前处理,可以短时间内不耗费有机溶剂的情况下采集白酒样品紫外光谱,通过化学计量学方法计算,客观、准确的鉴定3个品类白酒,成为规范行业和市场、实现青稞酒领域食品安全有效监管的迫切需要。
2、本发明的优点是判别准确率高,可区分互助青稞酒、其他品牌青稞酒和非青稞酒;建立的PCA-SVM的4种模型工作特征曲线下面积(AUC)分别达到99.07%、95.56%、91.25%和94.44%;以互助青稞酒为研究对象的目标类别,紫外光谱结合PCA-SVM建立判别模型均能达到互助青稞酒、其他品牌青稞酒和非青稞酒的快速识别。
3、本发明将紫外光谱和化学计量学技术引入到白酒的判别中,以互助青稞酒为研究对象,采用紫外光谱结合化学计量学实现对互助青稞酒、非互助青稞酒和非青稞酒的快速判别,与传统的检测方法相比,大大缩短测定时间,不需要大量的有机溶剂,节省了大量的人力和物力。
4、本发明有利于提高白酒质量控制水平,保证成品质量稳定、可靠,可在白酒分类检验环节推广应用。
附图说明
图1为本发明一种基于主成分分析-支持向量机的青稞酒判别方法的技术路线图;
图2为74个白酒样品以无水乙醇和水做参比的紫外光谱图;
图3为74个白酒样品原光谱(A)和经预处理后(B)的紫外光谱示意图;
图4为预处理光谱得到的PCA(A:PC1-PC2,B:PC2-PC3)示意图;
图5为支持向量机训练和测试过程的结果[A:CHQL(+1)/NQBL(-1);B:CHQL(+1)/OBQL(-1);C:NQBL(+1)/OBQL;D:CHQL(+1)/OBQL(-1)]示意图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施例和附图,进一步阐述本发明,但下述实施例仅仅为本发明的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其它实施例,都属于本发明的保护范围。
下面结合附图描述本发明的具体实施例。
实施例1
参阅图2-3,收集28瓶互助青稞酒(CHQL)、20瓶其他品牌青稞酒(OBQL)和26瓶非青稞酒(NQBL),采集紫外光谱图,仪器T9型紫外可见分光光度计扫描,光谱分辨率为1nm,选用10mm光程的石英比色皿,分别考察了蒸馏水和无水乙醇两种参比溶液,在200~320nm的波长范围内,对每个样品进行3次扫描,求其平均光谱视为该样品的最后紫外吸收光谱,以减小操作误差。
建模用无水乙醇作为参比的紫外光谱图集,将数据导入MATLAB2016b中,样品的紫外光谱经过SNV预处理的后,通过Kennard-Stone(K-S)采样方法分为训练集和测试集。
对校正集样本光谱T1、T2、T3……建立PCA模型,降低光谱数据集的维度,得到校正集的得分和载荷,通过载荷计算测试集的得分。
选择方差贡献和识别能力较高的两个PC作为SVM的输入变量,从而得到训练后的SVM模型然后将分类属性与预测集的PC2和PC3分数相结合作为SVM的输入变量进行建模,从而得到训练后的SVM模型。
该数据采用两类策略,在3个类别中观察2个类别(CHQL、NQBL和OBQL)的分类效应,例如用CHQL和NQBL样本构造一个数据集,其中CHQL定义为+1,NQBL定义为-1,根据PC的负载情况,将测试样本的负载与测试样本的光谱相乘,即可得到测试集的得分矩阵。
最后,将测试集的得分矩阵输入到训练好的SVM模型中,输出测试样本的类别标签。并利用SVM模型对预测集的样本进行预测。另外,采用与前者相同的处理方法构造了3个数据集。
利用K-S方法随机采样,将该方法采集的30个预测集样本,代入分类模型,图5所示4种PCA-SVM模型AUC分别为99.07%、95.56%、91.25%和94.44%。
上述实例被用来说明本发明定性分析白酒的原理,根据不同的校正集样品,可按白酒品类构建4种PCA-SVM模型,根据本发明中所述定性鉴定互助青稞酒、其他品牌青稞酒和非青稞酒的结果,可选用PCA-SVM模型进行定性分析,从而判别互助青稞酒类型。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (7)

1.一种基于主成分分析与支持向量机模型判别青稞酒的方法,其特征在于,包括以下步骤:
1、收集样品:收集3种品类白酒的74个已知样品;
2、采集样品信息:用紫外光谱法采集同样温度下不同样品的光谱信息,得到光谱信息集T;
3、获取样本集:对步骤2所采集的光谱数据集T进行预处理,得到新的光谱数据集,把所有样品和相对应的样品光谱数据信息通过K-S方法按3:2划分为校正集和预测集;
4、建立模型:降低步骤3中校正集样本光谱数据集的维度,得到校正集的得分和载荷,通过载荷计算测试集的得分,选择方差贡献和识别能力较高的两个PC作为SVM的输入变量,从而得到训练后的SVM模型,将分类属性与预测集的PC2和PC3分数相结合作为SVM的输入变量进行建模,得到PCA-SVM模型;
5、建立判别模型:利用步骤4中PCA-SVM模型特征工作曲线下的AUC值,对PCA-SVM模型进行评价和检验,并确定模型AUC值,AUC值大于设定数值,此模型为3种品类白酒的判别模型R;
6、预测结果:利用预处理后预测集紫外光谱数据,得到光谱信息P,将P代入判别模型R中,运行步骤3选取的谱图处理方式,得到未知样品是否属于互助青稞酒品类,对所述步骤4所建立模型进行分析,得到3个品类白酒PCA-SVM组合的校正集预测模型,并最终在输入预测集样品光谱数据后完成预测结果的显示。
2.根据权利要求1所述的一种基于主成分分析与支持向量机模型判别青稞酒的方法,其特征在于:所述步骤2中紫外光谱的采集背景为无水乙醇。
3.根据权利要求1所述的一种基于主成分分析与支持向量机模型判别青稞酒的方法,其特征在于:所述步骤2中紫外光谱的采集参数波段范围200~320nm,且单个样品扫描次数为3次,扫描间隔为1nm。
4.根据权利要求1所述的一种基于主成分分析与支持向量机模型判别青稞酒的方法,其特征在于:所述步骤3中光谱预处理的方式为无处理、Savitzky-Golay(SG)平滑、一阶导数、乘性散射校正(MSC)和标准正态变量(SNV)。
5.根据权利要求1所述的一种基于主成分分析与支持向量机模型判别青稞酒的方法,其特征在于:所述步骤4中模型为2分类PCA-SVM模型,所述2分类PCA-SVM模型的数量为四个。
6.根据权利要求5所述的一种基于主成分分析与支持向量机模型判别青稞酒的方法,其特征在于:所述4种模型的测试集工作特征(ROC)曲线下面积(AUC)分别为99.07%、95.56%、91.25%和94.44%。
7.根据权利要求1所述的一种基于主成分分析与支持向量机模型判别青稞酒的方法,其特征在于:所述步骤1中3种品类白酒分别为互助青稞酒、其它品牌青稞酒、非青稞酒,所述互助青稞酒编号为CHQL、其它品牌青稞酒编号为OBQL、非青稞酒编号为NQBL,所述3种品类白酒数量分别为28:20:26(CHQL:OBQL:NQBL)。
CN202311462476.2A 2023-11-06 2023-11-06 一种基于主成分分析与支持向量机模型判别青稞酒的方法 Pending CN117517233A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311462476.2A CN117517233A (zh) 2023-11-06 2023-11-06 一种基于主成分分析与支持向量机模型判别青稞酒的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311462476.2A CN117517233A (zh) 2023-11-06 2023-11-06 一种基于主成分分析与支持向量机模型判别青稞酒的方法

Publications (1)

Publication Number Publication Date
CN117517233A true CN117517233A (zh) 2024-02-06

Family

ID=89757783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311462476.2A Pending CN117517233A (zh) 2023-11-06 2023-11-06 一种基于主成分分析与支持向量机模型判别青稞酒的方法

Country Status (1)

Country Link
CN (1) CN117517233A (zh)

Similar Documents

Publication Publication Date Title
Yu et al. A feasibility study on on-line determination of rice wine composition by Vis–NIR spectroscopy and least-squares support vector machines
Ríos-Reina et al. Spectralprint techniques for wine and vinegar characterization, authentication and quality control: Advances and projections
Cozzolino et al. Feasibility study on the use of attenuated total reflectance mid-infrared for analysis of compositional parameters in wine
CN107703097B (zh) 利用近红外光谱仪构建快速预测原油性质的模型的方法
CN111855608B (zh) 基于融合特征波长选择算法的苹果酸度近红外无损检测方法
CN109669023A (zh) 一种基于多传感器融合的土壤属性预测方法
CN113340874B (zh) 一种基于结合岭回归和递归特征消除的定量分析方法
Aleixandre-Tudo et al. Towards on-line monitoring of phenolic content in red wine grapes: A feasibility study
CN105044024A (zh) 一种基于近红外光谱技术对葡萄果实进行无损检测的方法
CN110749565A (zh) 一种快速鉴别普洱茶存储年份的方法
CN111693487A (zh) 基于遗传算法和极限学习机的水果糖度检测方法及系统
Yu et al. Prediction of enological parameters and discrimination of rice wine age using least-squares support vector machines and near infrared spectroscopy
CN116030310A (zh) 一种基于激光诱导击穿光谱技术的样品分类方法及系统
CN111259929A (zh) 基于随机森林的食源性致病菌的分类模型训练方法
Qi et al. Rapid and non-destructive determination of soluble solid content of crown pear by visible/near-infrared spectroscopy with deep learning regression
CN106226263A (zh) 基于红外光谱技术的浓香型白酒基酒等级快速判别方法
CN105954228A (zh) 基于近红外光谱的油砂中金属钠含量的测量方法
CN116952896A (zh) 一种啤酒厂糖化麦汁中总氮的近红外快速检测方法
Shen et al. Discrimination of blended Chinese rice wine ages based on near-infrared spectroscopy
CN105911000A (zh) 基于特征波段的血斑蛋在线检测方法
CN116858822A (zh) 一种基于机器学习和拉曼光谱的水体中磺胺嘧啶定量分析方法
CN111912823A (zh) 一种多成分农药残留荧光检测分析方法
CN117517233A (zh) 一种基于主成分分析与支持向量机模型判别青稞酒的方法
CN107356536B (zh) 葡萄酒品质检测方法、服务器及光谱测量设备
Zhou et al. ATR-FTIR spectroscopy combined with chemometrics to assess the spectral markers of irradiated baijius and their potential application in irradiation dose control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination