CN113963225B - 目标类别判定方法 - Google Patents

目标类别判定方法 Download PDF

Info

Publication number
CN113963225B
CN113963225B CN202111584922.8A CN202111584922A CN113963225B CN 113963225 B CN113963225 B CN 113963225B CN 202111584922 A CN202111584922 A CN 202111584922A CN 113963225 B CN113963225 B CN 113963225B
Authority
CN
China
Prior art keywords
sample
discrimination
type
samples
white spirit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111584922.8A
Other languages
English (en)
Other versions
CN113963225A (zh
Inventor
王晨卉
何兆铭
李贺军
毕海
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202111584922.8A priority Critical patent/CN113963225B/zh
Publication of CN113963225A publication Critical patent/CN113963225A/zh
Application granted granted Critical
Publication of CN113963225B publication Critical patent/CN113963225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/33Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本申请公开了一种目标类别判定方法,所述目标类别判定方法包括:获取待测样本集对应的目标光谱数据,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到。本申请解决白酒样品种类检测的效率低以及准确性低的技术问题。

Description

目标类别判定方法
技术领域
本申请涉及液体样品检测技术领域,尤其涉及一种目标类别判定方法。
背景技术
酒作为中国的传统产品之一,有着悠久的历史。传统的白酒区分方法为色谱法与感官评价方法,其中,色谱法是依据不同色谱的特点对原始样品进行预处理,再应用液相/气象色谱对经预处理的样品进行组分分离,然后以合适的检测器确定分离后的各种组分的化学性质与含量,最后运用化学计量学的方法将不同样品中多种成分的分析结果进行比对,得出区分结果,色谱技术虽然可以实现微量成分的分离与定性定量分析,但仪器操作方法繁琐、工作成本较高,导致白酒样品种类检测的效率较低,而感官评价方法要求有经验的评价人员对白酒样品进行品尝、对样品的各个感官指标进行打分,对评价人员依赖性较高,导致白酒样品种类检测准确性较低。
发明内容
本申请的主要目的在于提供一种目标类别判定方法,旨在解决现有技术中的白酒样品种类检测的效率低以及准确性低的技术问题。
为实现上述目的,本申请提供一种目标类别判定方法,所述目标类别判定方法包括:
获取待测样本集对应的目标光谱数据;
基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到。
本申请提供了一种目标类别判定方法,相比于现有技术采用的通过色谱法或感官评价方法来检测白酒的种类的技术手段,本申请首先获取待测样本集对应的目标光谱数据,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到,实现了不同光谱区分程度白酒样本集的光谱数据建立样本种类判别模型,提升了模型的稳定性与准确程度,进一步地,设计包含多个样本种类判别模型的树状种类判别结构,从而通过树状种类判别结构将样本逐级归类,有效提高复杂白酒品种判别的效率以及准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域默认技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请目标类别判定方法第一实施例的流程示意图;
图2为本申请树状种类判别结构中不同层级样本种类判别模型建立流程示意图;
图3为本申请目标类别判定方法第二实施例的流程示意图;
图4为本申请中对白酒样本进行光谱采集的流程示意图;
图5为本申请目标类别判定方法第三实施例的流程示意图;
图6为本申请进行截取光谱片段数据的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种目标类别判定方法,在本申请目标类别判定方法的第一实施例中,参照图1,所述目标类别判定方法包括:
步骤S10,获取待测样本集对应的目标光谱数据;
在本实施例中,需要说明的是,所述目标光谱数据包括紫外-可见光光谱数据、X射线光谱数据、红外光谱数据以及拉曼光谱数据等,在本申请中,优选地,选取拉曼光谱数据。
具体地,首先通过预设采集设备采集待测样本集对应的光谱数据,进而在光谱数据谱峰聚集的区间中进行采集待测样本集的目标光谱数据。
步骤S20,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到。
在本实施例中,需要说明的是,所述树状种类判别结构包括多个层级样本种类判别模型,所述样本种类判别模型为基于不同种类白酒样本集的光谱数据进行建立,所述不同层级的样本种类判别模型为在不同光谱区分程度的白酒样本集对应的光谱数据中按照特定的光谱区间提取的各光谱片段数据进行训练得到。
具体地,首先,采集不同种类白酒样本集对应的光谱数据,其中,所述不同种类白酒样本集包括各训练样本和各测试样本,进而基于预先设定的窗口宽度和片段步长在各训练样本和各测试样本对应的光谱数据进行选取各光谱片段数据,进而对各所述光谱片段数据进行归一化处理,以降低对剔除对拉曼光谱绝对强度的依赖性,进而将处理后的各所述光谱片段数据,运用主成分分析方法提取各所述光谱片段数据预设数量对应的主成分数据,进而基于预设数量对应的主成分数据,结合监督模式识别方法构建第一层级样本种类判别模型,进而通过所述第一层级样本种类判别模型分别对每一测试样本进行种类预测,获得每一所述测试样本对应的各预测结果,基于每一所述测试样本对应的各预测结果,采取多数预测结果规则确定每一所述测试样本的判别结果,计算不同种类白酒样本集对应的判别精确信息,若所述判别精确信息不满足预设预测阈值条件,则确定所述判别精确信息不满足预设预测阈值对应白酒样本,进而基于不满足预设预测阈值的各测试样本对应的判别结果,分别将不满足预设预测阈值对应白酒样本进行分类,获得各易混淆样品集,进一步地,基于预设的窗口宽度和片段步长分别对各所述易混淆样品集进行片段提取,获得各所述易混淆样品集分别对应的各光谱片段数据,并且运用主成分分析方法提取预设数量对应的主成分数据,通过复合的主成分分析以及结合监督模式识别方法,建立各所述易混淆样品集对应的种类判别模型,从而形成第二层级样本种类判别模型,进一步地,基于不满足预设预测阈值对应白酒样本,通过第二层级样本种类判别模型进行种类预测,以计算不满足预设预测阈值对应白酒样本的判别精确信息,若还存在判别精确信息不满足所述预设预测阈值的白酒样本,则继续构建第三层级样本种类判别模型,循环直至所有种类白酒样本集的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构,进一步地,将待测样本集对应的目标光谱数据输入上述已搭建的树状种类判别结构中,以对所述待测样本集进行逐级预测,获得所述待测样本集的种类预测结果,其中,不同层级的样本种类判别模型对应的窗口宽度和片段步长可以相同,也可以不同,以及主成分数据的数量可相同,也可以不同。
其中,所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果的步骤包括:
步骤S21,基于所述待测样本集的目标光谱数据,通过所述树状种类判别结构的第一层级样本种类判别模型进行种类预测,获得所述待测样本集中各样本对应的种类预测结果,并确定未预测成功的各样本;
步骤S22,基于未预测成功的各样本对应的目标光谱数据,通过所述树状种类判别结构的下一层级样本种类判别模型进行种类预测,直至获得所述待测样本集中所有样本的种类预测结果。
在本实施例中,具体地,参照图2,图2为本申请树状种类判别结构中不同层级样本种类判别模型建立流程示意图,其中,第一层种类区分模型为所述第一层级样本种类判别模型,第二层种类区分模型为所述第二层级样本种类判别模型,第三层种类区分模型为所述第三层级样本种类判别模型,白酒样本集为所述待测样本集,具体地,将待测样本集输入所述树状种类判别结构的第一层级样本种类判别模型中进行种类预测,获得待测样本集中各样本对应的种类预测结果,并且确定未预测成功的各样本,进而基于未预测成功的各样本的种类预测结果,对未预测成功的各样本划分为各易混淆种类集,并基于所述树状种类判别结构的第二层级样本种类判别模型,对各所述易混淆种类进行种类预测,以此类推,直至预测完成所述待测样本集的所有样本,获得所述待测样本集中所有样本的种类预测结果。
本申请实施例提供了一种目标类别判定方法,相比于现有技术采用的通过色谱法或感官评价方法来检测白酒的种类的技术手段,本申请实施例首先获取待测样本集对应的目标光谱数据,基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到,实现了光谱区分程度白酒样本集的光谱数据建立样本种类判别模型,提升了模型的稳定性与准确程度,进一步地,设计包含多层级样本种类判别模型的树状种类判别结构,从而通过树状种类判别结构将样本逐级归类,有效提高复杂白酒品种判别的效率以及准确性。
进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,在所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到的步骤之前,所述目标类别判定方法还包括:
步骤A10,采集不同种类白酒样本集对应的光谱数据,其中,所述不同种类白酒样本集包括各训练样本和各测试样本;
在本实施例中,需要说明的是,所述光谱数据包括紫外-可见光光谱数据、X射线光谱数据、红外光谱数据以及拉曼光谱数据等,在本申请中,优选地,选取拉曼光谱数据,进而所述拉曼光谱数据的采集可通过激光显微共聚焦拉曼光谱仪进行采集。
采集不同种类白酒样本集对应的光谱数据,其中,所述光谱数据包括各训练样本和各测试样本,具体地,分别采集不同种类的白酒样本,并将每一种类白酒样本划分为预设数量的训练样本和测试样本,并且分别将每一种白酒的训练样本和测试样本分别进行划分,进一步地,确定光谱采集区间,以基于所述光谱采集区间,按照相同的激光参数分别对划分后的每一种类白酒对应的训练样本和测试样本进行不同次数的激光扫描,并根据训练样本和测试样本对应的多次扫描结果,按照预设选取规则确定训练样本和测试样本对应的光谱数据。
其中,所述采集不同种类白酒样本集的光谱数据的步骤包括:
步骤A11,获取不同种类白酒样本集;
在本实施例中,具体地,分别采集同品牌不同种类的白酒样本集,并将每一类白酒样本划分为预设数量的训练样本和预设数量的测试样本,例如,每种白酒样本选择3个批次,每个批次10瓶,从每瓶白酒中采集3个样本,共90个样本作为训练样本,每种白酒选择另外1个批次,每个批次10瓶,从每瓶白酒中采集3个样本,共30个样本作为测试样本。
步骤A12,分别将不同种类的白酒样本集进行划分,获得不同种类白酒的划分样本集;
在本实施例中,具体地,将每一类白酒样本对应的训练样本和测试样本进行划分,获得不同种类白酒的划分样本集,例如,分别将90个训练样本和30个测试样本平均分为三部分。
步骤A13,基于预设光谱采集区间,通过预设光谱采集参数分别对各所述划分样本集进行光谱采集,获得所述不同种类白酒样本集对应的光谱数据。
在本实施例中,需要说明的是,所述预设光谱采集区间为光谱谱峰聚集的区间,在本申请中,选择一个尽量窄的范围进行光谱采集,可以大幅度节约实验成本、缩短数据集建立时间,预设光谱采集参数包括红外光参数、激光参数等,在本申请中,优选地,利用激光进行采集光谱,所述预设光谱采集参数包括分辨率、激光波长、功率以及积分时间,例如,所述分辨率可设为1 cm-1、激光波长为532nm、功率为40 mW、积分时间4s。
具体地,首先基于光谱谱峰聚集的区间,确定光谱采集对应的预设光谱采集区间,进而运用相同的激光参数分别对不同种类白酒的划分样本集中的各划分样本进行不同次数的激光扫描,获得各划分样本对应的多个扫描结果,进而按照预设选取方法对每一所述划分样本的多个扫描结果,获得每一所述划分样本对应的光谱,参考图4,图4为本申请中对白酒样本进行光谱采集的流程示意图,分别将90个训练样本和30个测试样本平均分为三部分,将三个部分的训练样本分别进行3次、5次、7次扫描以及将三个部分的测试样本分别进行3次、5次、7次扫描,每一样本多次扫描后的结果取平均值作为该样本光谱采集的结果,每种白酒样品采集90个光谱数据与30个光谱数据,通过多个扫描次数的选取,使得光谱数据在信号强度上的离散化,提高建模的稳定性,此外,需要说明的是,使用单一的扫描次数进行拉曼光谱数据收集,虽然采集的同种样品的拉曼光谱强度一致性较高,但可能导致区分模型过拟合,对区分模型使用时的鲁棒性有负面影响。
步骤A20,基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型;
在本实施例中,具体地,基于各所述训练样本对应的光谱数据与各所述测试样本对应的光谱数据,将每一所述光谱数据按照预先设定的窗口宽度以及片段步长,从所述光谱数据的任意一端开始,依次选取多个光谱片段数据,直至光谱数据的另一端结束,从而获得多个不同位移区间的光谱片段数据,进而将各所述光谱片段数据对应的信号强度数据分别进行归一化预处理,获得各目标片段数据,进而基于各所述目标片段数据,将具有相同位移区间的各目标片段数据,通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据,进而结合监督模式识别方法分别构建树状种类判别结构中第一层级样本种类判别模型,其中,所述监督模式识别方法支持向量机(AVM),决策树(deciAion treeA),K-最邻近(K-NN)等方法,所述第一层级样本种类判别模型对应的数量与在每一所述光谱数据提取的光谱片段数据的片段数量相同。
步骤A30,基于所述第一层级样本种类判别模型,分别对各所述测试样本进行种类预测,获得各测试样本分别对应的各预测结果;
在本实施例中,基于所述第一层级样本种类判别模型,分别对各所述测试样本进行种类预测,获得各测试样本对应的各预测结果,具体地,对于每一所述测试样本均执行以下步骤:
基于所述第一层级样本种类判别模型,对所述测试样本进行种类预测,进而获得所述测试样本对应的各预测结果,例如,假设有41个样本种类判别模型,41个样本种类判别模型多所述测试样本进行预测,进而获得该测试样本对应的41个预测结果。
步骤A40,基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息;
在本实施例中,需要说明的是,所述判别精确信息包括白酒样本对应的精确率、错误率、召回率等信息。
具体地,对于每一所述测试样本对应的各预测结果均执行以下步骤:
根据所述测试样本对应的各预测结果,选取数量最多的预测结果作为所述测试样本对应的判别结果,进而获得全部测试样本对应的判别结果,进而基于各所述测试样本对应的判别结果,按照预设计算方法计算每一种类白酒样本对应的判别精确信息。
其中,在所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤之后,所述目标类别判定方法还包括:
步骤C10,若所述不同种类白酒样本集对应的判别精确信息满足预设预测阈值条件,则将各所述测试样本的判别结果作为各自对应的目标种类判别结果。
在本实施例中,需要说明的是,若该种类白酒样本集对应的判别精确信息满足预设预测阈值,则证明该种类白酒样本归为已判别种类,例如,将精确率达到100%,且召回率至少达到95%的种类归为已判别种类。
其中,所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤包括:
步骤A41,基于每一所述测试样本对应的各预测结果,采取多数预测结果规则确定每一所述测试样本的判别结果;
在本实施例中,需要说明的是,所述多数预测结果规则为在每一预测样本中选取相同预测结果数量最多的规则。
对于每一所述测试样本对应的各预测结果均执行以下步骤:基于所述测试样本对应的各预测结果,选取数量最多的预测结果作为所述测试样本的判别结果,例如,某一测试样本对应的41个预测结果,其中有40个预测结果为A种类白酒,1个预测结果为B种类白酒,进而将40个对应的预测结果作为所述测试样本的判别结果。
步骤A42,基于每一所述测试样本的判别结果,按照预设判别计算方法分别计算不同种类白酒样本集对应的判别精确信息。
在本实施例中,需要说明的是,所述判别精确信息包括精确率和召回率。
具体地,对于每一种类白酒均执行以下步骤:
基于每一所述测试样本的判别结果,统计该种类白酒对应测试样本的判别结果为该种类白酒的样本数量,并统计其他种类白酒的测试样本对应的判别结果为该种类白酒的样本数量,以及统计该种类白酒对应测试样本的判别结果为其他种类白酒的样本数量,精确率与召回率的计算方法如下:
Figure 275060DEST_PATH_IMAGE001
其中,P为精确率,R为召回率,TP代表正确预测为本种类白酒的样本数量,FP代表错误预测为本种类白酒的样本数量,FN代表错误预测为其他种类白酒的样本数量。
例如,A、B、C类白酒分别采集30个测试样本,假设A类白酒的30个测试样本中有30个样本对应的判别结果为A类,B类白酒的30个测试样本中有20个样本对应的判别结果为B类,有10个样本为A类,因此,A类的精确率为100%,以及召回率为100%,而B类的精确率为100%,以及召回率为66.67%。
此外,需要说明的是,不同层级的样本种类判别模型对应的召回率以及精确率可设置不同,例如,第一层级样本种类判别模型的精确率为100%,召回率不小于95%,第二层级样本种类判别模型的精确率不小于90%,召回率不小于90%。
步骤A50,若所述判别精确信息不满足预设预测阈值条件,则获取所述判别精确信息不满足预设预测阈值对应白酒样本的光谱数据,并基于不满足预设预测阈值的各训练样本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型,循环直至所有种类白酒样本集的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构。
在本实施例中,具体地,若存在判别精确信息不满足预设预测阈值条件,则确定所述判别精确信息不满足预设预测阈值对应种类的白酒样本,进而根据不满足预设预测阈值对应白酒样本中各测试样本对应的判别结果,将不满足预设预测阈值对应白酒样本进行分类,获得各易混淆样品集,进而基于获得各易混淆样品集对应的光谱数据,按照预先设定的窗口宽度以及片段步长对所述光谱数据进行选取各光谱片段数据,通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据,进而结合监督模式识别方法分别构建树状种类判别结构中第二层级样本种类判别模型,需要说明的是不同层级的样本种类判别模型的窗口宽度以及片段步长可以相同,也可不同,主成分数据的预设数量可以相同,也可不同,进而根据第二层级样本种类判别模型,对不满足预设预测阈值对应白酒样本中各测试样本进行种类预测,以基于种类预测结果,计算不满足预设预测阈值对应白酒样本对应的判别精确信息,循环直至所有种类白酒样本集的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构,从而实现了通过预先设定的窗口宽度以及片段步长进行选取各光谱片段数据,以及选取预设数量的主成分数据,并且结合监督识别方法,构建出包括多层级样本种类判别模型的树状种类判别结构,提高模型种类预测的准确性,并且及时当白酒样品集的复杂程度提高、同时包含拉曼光谱区分程度不同的品种时,通过树状种类判别结构,将样本进行逐级归类,实现较大光谱数据区分度样品的种类的高效判别,同时提高较小光谱区分度样本的种类判别准确程度。
进一步地,参照图5,基于本申请中第二实施例,在本申请的另一实施例中,所述基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型的步骤包括:
步骤B10,分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据;
在本实施例,具体地,在各所述训练样本以及各所述测试样本对应的光谱数据,按照预先设定的窗口宽度以及片段步长进行选取,获得各光谱片段数据,其中,在一种可实施方式中,窗口宽度以及片段步长的确定方法,可按照预设的窗口宽度的范围以及片段步长的范围进行各种组合从而优化参数,例如,尝试900到1200cm-1的窗口宽度与1到10cm-1片段步长的各种组合,对光谱数据截取方式进行优化得到,在另一种可实施方式中,也可建立算法模型来对光谱区间进行迭代优化,从而确定窗口宽度以及片段步长,例如,参照图6,图6为本申请进行截取光谱片段数据的结构示意图,在400-1500 cm-1光谱采集区间对应的光谱数据中,按照窗口宽度为900 cm-1,以最小分辨率的5倍(5 cm-1)为片段步长进行选取光谱片段数据,从而获得41个窗口宽度为900 cm-1的光谱片段数据。
其中,所述分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据的步骤包括:
步骤B11,基于预先设定的窗口宽度以及片段步长,分别对各所述训练样本以及各所述测试样本对应的光谱数据进行选取,获得各所述光谱片段数据。
在本实施例中,需要说明的是,由于每一光谱数据均按照窗口宽度以及片段步长进行选取,因此,每一光谱片段数据均有其对应的位移区间。
步骤B20,将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;
在本实施例中,需要说明的是,分别对各所述光谱片段数据对应的信号强度数据进行归一化处理,从而消除对拉曼光谱绝对强度的依赖,有效防止建立的模型出现过拟合的现象、增加模型的鲁棒性,归一化处理具体如下:
Figure 607952DEST_PATH_IMAGE002
其中,man(x)与min(x)分别为光谱片段数据内拉曼信号强度的最大值与最小值,x为某个位移上的绝对信号强度,x’为在相同位移上归一化后的相对信号强度。
步骤B30,通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;
在本实施例中,具体地,使用主成分分析方法提取出在每一所述目标片段数据上多个主成分数据,得到各所述目标片段数据对应的主成分数据。
步骤B40,基于各所述主成分数据,结合监督模式识别方法,构建所述第一层级样本种类判别模型。
在本实施例中,具体地,基于具有相同位移区间的各光谱片段数据对应的各所述主成分数据结合支持向量机方法分别构建各所述样本种类判别模型,提升模型的稳定性与准确程度。
进一步地,所述基于不满足预设预测阈值的各训练样本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型的步骤包括:
步骤C10,基于不满足预设预测阈值的各测试样本对应的判别结果,分别将不满足预设预测阈值对应白酒样本进行分类,获得各易混淆样品集;
在本实施例中,例如,A种类白酒样本中测试样本的判别结果为B种类白酒样本,则将A种类白酒样本和B种类白酒样本作为一种易混淆样品集。
步骤C20,分别在各所述易混淆样品集中提取各光谱片段数据;
步骤C30,将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;
步骤C40,通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;
步骤C50,基于所述预设数量的主成分数据,结合监督模式识别方法构建所述第二层级样本种类判别模型。
在本实施例中,具体地,基于各所述易混淆样品集的各训练样本以及各测试样本,分别按照预先设定的窗口宽度以及片段步长对各所述训练样本以及各所述测试样本对应的光谱数据进行选取,获得各所述光谱片段数据,进而对各所述光谱片段数据进行归一化处理,通过主成分分析方法在归一化处理的各光谱片段数据中提取预设数量的主成分数据,进一步地,基于所述预设数量的主成分数据,结合监督模式识别方法构建所述第二层级样本种类判别模型,步骤C20至步骤C50的具体实施内容可参照步骤B10至步骤B40中的具体内容,在此不再赘述。
可选地,提起一种可实施例,具体地,使用激光显微共聚焦拉曼光谱仪(ReinshawinVia)测量同品牌由3类工艺标准的7种30% vol酒精度白酒样本的拉曼光谱,进而从7种同品牌白酒中,每种白酒选择3个批次,每个批次10瓶,从每瓶白酒中采集3个样本,共90个样本作为训练样本,每种白酒选择另外1个批次,10瓶,从每瓶白酒中采集3个样本。共30个样本作为测试样本。
选取400-1500 cm-1作为光谱采集区间,进行分辨率为1 cm-1的拉曼光谱采集,激光波长为532nm,功率为40 mW,积分时间4 s,进而将训练样本与测试样品平均分为三部分,运用相同的激光参数,分别进行3次、5次、7次扫描,多次扫描后取平均值作为一次光谱采集的结果,每种白酒样品采集90个训练集拉曼光谱与30个测试集拉曼光谱,从训练样本与测试样本包括的每个400-1500cm-1区间的拉曼光谱数据中,运用以下经优化的参数进行光谱片段选取,其中,尝试900到1200cm-1的窗口宽度以及1到10cm-1片段步长的各种组合,对光谱数据进行截取优化参数,例如:按照900 cm-1窗口宽度,从拉曼光谱数据的任意一端开始,以最小分辨率的5倍(5 cm-1)为片段步长,依次选取多个拉曼光谱数据片段,到拉曼光谱的另一端结束。从每一个原始拉曼光谱中选取41个长度为900 cm-1拉曼光谱片段数据,对所得到的每个拉曼光片段的信号强度数据分别进行独立的归一化预处理,消除对拉曼光谱绝对强度的依赖,在片段选择与归一化后,基于所有样本有相同的拉曼位移区间的拉曼光谱片段数据,运用主成分分析方法,以及结合支持向量机方法,将主成分值优化至前4个,分别建立41个样本种类判别模型,分别对每个测试集样本的种类进行判别,针对每个测试样本,运用获得的41个种类判别结果进行投票,票数最多的种类作为判别结果,参考表1,表1为同品牌7种30% vol酒精度白酒的种类判别结果,可以看出对白酒样品集中种类4-7的测试样本实现了100%精确率与100%召回率标准的种类判别,而白酒样品集中种类1-3的样本在该节点的样品种类判别模型的预测结果中相互混淆。
进而若所述白酒样品集中种类1至3均互相混淆,则将白酒样品集中种类1-3这3个种类归为同一个未判别种类集,基于白酒种类1-3样本的训练样本与测试样本的400-1500cm-1范围的拉曼光谱数据,运用以下经优化的参数进行光谱片段选取:按照1000 cm-1窗口宽度,从拉曼光谱的任意一端开始,以最小分辨率(1 cm-1)为片段步长,依次选取多个拉曼光谱数据片段,到拉曼光谱的另一端结束。从每一个原始拉曼光谱中选取101个长度为1000cm-1拉曼光谱片段,对所得到的每个拉曼光片段的强度数据分别进行独立的归一化预处理,消除对拉曼光谱绝对强度的依赖,在片段选择与归一化后,基于所有样本有相同的拉曼位移区间的拉曼光谱片段数据,运用主成分分析方法,以及结合支持向量机,将主成分值优化至前25个,分别建立101个白酒样本种类判别模型,分别对每个测试样本的种类进行判别,针对每个测试样本,将获得的101个种类判别结果进行选取票数最多的种类作为判别结果,对白酒样品集中种类1-3的测试样本实现了精确率(≥90%)与召回率(≥90%)的种类判别。
表1 同品牌7种30% vol酒精度白酒的种类判别结果
Figure 360008DEST_PATH_IMAGE003
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (8)

1.一种目标类别判定方法,其特征在于,所述目标类别判定方法包括:
获取待测样本集对应的目标光谱数据;
基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到;
其中,在所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果,其中,所述树状种类判别结构包括多层级样本种类判别模型,不同层级的样本种类判别模型为基于不同光谱区分程度的白酒样本集对应的光谱数据进行训练得到的步骤之前,所述目标类别判定方法还包括:
采集不同种类白酒样本集对应的光谱数据,其中,所述不同种类白酒样本集包括各训练样本和各测试样本;
基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型;
基于所述第一层级样本种类判别模型,分别对各所述测试样本进行种类预测,获得各测试样本分别对应的各预测结果;
基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息;
若所述判别精确信息不满足预设预测阈值条件,则获取所述判别精确信息不满足预设预测阈值对应白酒样本的光谱数据,并基于不满足预设预测阈值的各训练样本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型,循环直至所有种类白酒样本集的判别精确信息均满足所述预设预测阈值,获得所述树状种类判别结构。
2.如权利要求1所述的目标类别判定方法,其特征在于,所述基于树状种类判别结构和所述待测样本集对应的目标光谱数据,对所述待测样本集进行逐级预测,获得所述待测样本集对应的种类预测结果的步骤包括:
基于所述待测样本集的目标光谱数据,通过所述树状种类判别结构的第一层级样本种类判别模型进行种类预测,获得所述待测样本集中各样本对应的种类预测结果,并确定未预测成功的各样本;
基于未预测成功的各样本对应的目标光谱数据,通过所述树状种类判别结构的下一层级样本种类判别模型进行种类预测,直至获得所述待测样本集中所有样本的种类预测结果。
3.如权利要求1所述的目标类别判定方法,其特征在于,在所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤之后,所述目标类别判定方法还包括:
若所述不同种类白酒样本集对应的判别精确信息满足预设预测阈值条件,则将各所述测试样本的判别结果作为各自对应的目标种类判别结果。
4.如权利要求1所述的目标类别判定方法,其特征在于,所述采集不同种类白酒样本集的光谱数据的步骤包括:
获取不同种类白酒样本集;
分别将不同种类的白酒样本集进行划分,获得不同种类白酒的划分样本集;
基于预设光谱采集区间,通过预设光谱采集参数分别对各所述划分样本集进行光谱采集,获得所述不同种类白酒样本集对应的光谱数据。
5.如权利要求1所述的目标类别判定方法,其特征在于,所述基于各所述训练样本以及各所述测试样本对应的光谱数据,构建第一层级样本种类判别模型的步骤包括:
分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据;
将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;
通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;
基于各所述主成分数据,结合监督模式识别方法,构建所述第一层级样本种类判别模型。
6.如权利要求5所述的目标类别判定方法,其特征在于,所述分别在各所述训练样本以及各所述测试样本对应的光谱数据中选取各光谱片段数据的步骤包括:
基于预先设定的窗口宽度以及片段步长,分别对各所述训练样本以及各所述测试样本对应的光谱数据进行选取,获得各所述光谱片段数据。
7.如权利要求1所述的目标类别判定方法,其特征在于,所述基于不满足预设预测阈值的各训练样本以及各测试样本对应的光谱数据,构建第二层级样本种类判别模型的步骤包括:
基于不满足预设预测阈值的各测试样本对应的判别结果,分别将不满足预设预测阈值对应白酒样本进行分类,获得各易混淆样品集;
分别在各所述易混淆样品集中提取各光谱片段数据;
将各所述光谱片段数据对应的信号强度数据进行归一化处理,获得各目标片段数据;
通过主成分分析方法分别在各目标片段数据中提取预设数量的主成分数据;
基于所述预设数量的主成分数据,结合监督模式识别方法构建所述第二层级样本种类判别模型。
8.如权利要求1所述的目标类别判定方法,其特征在于,所述基于每一所述测试样本对应的各预测结果,确定每一所述测试样本的判别结果,并计算不同种类白酒样本集对应的判别精确信息的步骤包括:
基于每一所述测试样本对应的各预测结果,采取多数预测结果规则确定每一所述测试样本的判别结果;
基于每一所述测试样本的判别结果,按照预设判别计算方法分别计算不同种类白酒样本集对应的判别精确信息。
CN202111584922.8A 2021-12-23 2021-12-23 目标类别判定方法 Active CN113963225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111584922.8A CN113963225B (zh) 2021-12-23 2021-12-23 目标类别判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111584922.8A CN113963225B (zh) 2021-12-23 2021-12-23 目标类别判定方法

Publications (2)

Publication Number Publication Date
CN113963225A CN113963225A (zh) 2022-01-21
CN113963225B true CN113963225B (zh) 2022-04-26

Family

ID=79473687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111584922.8A Active CN113963225B (zh) 2021-12-23 2021-12-23 目标类别判定方法

Country Status (1)

Country Link
CN (1) CN113963225B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403198A (zh) * 2017-07-31 2017-11-28 广州探迹科技有限公司 一种基于级联分类器的官网识别方法
CN109858477A (zh) * 2019-02-01 2019-06-07 厦门大学 用深度森林在复杂环境中识别目标物的拉曼光谱分析方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2520758A (en) * 2013-11-29 2015-06-03 Thermo Fisher Scient Bremen Method of mass spectral data analysis
CN107646089B (zh) * 2015-03-06 2020-12-08 英国质谱公司 光谱分析
CN106596513A (zh) * 2017-01-19 2017-04-26 江南大学 一种基于激光诱导击穿光谱茶叶品种识别方法
CN111770720A (zh) * 2018-01-17 2020-10-13 奥迪思医疗公司 用于实时拉曼光谱法以进行癌症检测的系统和方法
US10587356B2 (en) * 2018-03-01 2020-03-10 Qualcomm Incorporated Spectrum partitioning using hilbert transform for improved frequency scan
CN108896527A (zh) * 2018-06-08 2018-11-27 华中科技大学 一种拉曼光谱-主成分分析快速鉴别白酒真伪的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403198A (zh) * 2017-07-31 2017-11-28 广州探迹科技有限公司 一种基于级联分类器的官网识别方法
CN109858477A (zh) * 2019-02-01 2019-06-07 厦门大学 用深度森林在复杂环境中识别目标物的拉曼光谱分析方法

Also Published As

Publication number Publication date
CN113963225A (zh) 2022-01-21

Similar Documents

Publication Publication Date Title
TWI691914B (zh) 用於自動分類的方法,及其裝置、系統,及電腦可讀取媒體
KR102110755B1 (ko) 자동 결함 분류를 위한 알려지지 않은 결함 리젝션의 최적화
KR102137184B1 (ko) 자동 및 수동 결함 분류의 통합
CN107818298B (zh) 用于机器学习物质识别算法的通用拉曼光谱特征提取方法
US11913877B2 (en) Real-time spectral analysis through high-speed spectral classification
CN109684374B (zh) 一种时间序列数据的键值对的提取方法及装置
CN108240978B (zh) 基于拉曼光谱的自学习式定性分析方法
CN112129741A (zh) 绝缘油老化分析方法、装置、计算机设备和存储介质
CN111259929A (zh) 基于随机森林的食源性致病菌的分类模型训练方法
CN117056834A (zh) 基于决策树的大数据分析方法
CN113970532B (zh) 基于近红外光谱的织物纤维成分检测系统和预测方法
CN116030310A (zh) 一种基于激光诱导击穿光谱技术的样品分类方法及系统
CN116881749A (zh) 一种污染场地施工监测方法及系统
CN111693487A (zh) 基于遗传算法和极限学习机的水果糖度检测方法及系统
CN111089856A (zh) 一种拉曼光谱弱信号提取的后处理方法
CN113963225B (zh) 目标类别判定方法
CN106528665A (zh) Aoi设备测试文件查找方法和系统
CN113096737A (zh) 一种用于对病原体类型进行自动分析的方法及系统
CN113408616A (zh) 基于pca-uve-elm的光谱分类方法
CN106485049B (zh) 一种基于蒙特卡洛交叉验证的nirs异常样本的检测方法
CN111912823A (zh) 一种多成分农药残留荧光检测分析方法
JP2011257206A (ja) ピーク検出方法及び装置
CN116579842A (zh) 基于用户行为数据的信用数据分析方法及系统
CN113791062A (zh) 一种基于拉曼光谱判断固定物质类别的方法
CN115406852A (zh) 基于多标签卷积神经网络的织物纤维成分定性方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant