CN114780917B - 一种基于流判别模型的奶粉掺杂非定向检测方法 - Google Patents
一种基于流判别模型的奶粉掺杂非定向检测方法 Download PDFInfo
- Publication number
- CN114780917B CN114780917B CN202210694915.1A CN202210694915A CN114780917B CN 114780917 B CN114780917 B CN 114780917B CN 202210694915 A CN202210694915 A CN 202210694915A CN 114780917 B CN114780917 B CN 114780917B
- Authority
- CN
- China
- Prior art keywords
- sample
- milk powder
- model
- flow
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000843 powder Substances 0.000 title claims abstract description 58
- 235000013336 milk Nutrition 0.000 title claims abstract description 57
- 239000008267 milk Substances 0.000 title claims abstract description 57
- 210000004080 milk Anatomy 0.000 title claims abstract description 57
- 238000001514 detection method Methods 0.000 title claims abstract description 37
- 238000001069 Raman spectroscopy Methods 0.000 claims abstract description 47
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000012546 transfer Methods 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 31
- 230000008569 process Effects 0.000 claims abstract description 14
- 230000003595 spectral effect Effects 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 56
- 230000008878 coupling Effects 0.000 claims description 29
- 238000010168 coupling process Methods 0.000 claims description 29
- 238000005859 coupling reaction Methods 0.000 claims description 29
- 230000009466 transformation Effects 0.000 claims description 12
- 238000000701 chemical imaging Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000004321 preservation Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims 1
- 239000002019 doping agent Substances 0.000 abstract description 7
- 235000013305 food Nutrition 0.000 abstract description 4
- 238000012423 maintenance Methods 0.000 abstract description 2
- 238000013136 deep learning model Methods 0.000 abstract 1
- 238000012216 screening Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000001237 Raman spectrum Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 229920002774 Maltodextrin Polymers 0.000 description 1
- 239000005913 Maltodextrin Substances 0.000 description 1
- 229920000877 Melamine resin Polymers 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 235000006486 human diet Nutrition 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- ZFSLODLOARCGLH-UHFFFAOYSA-N isocyanuric acid Chemical compound OC1=NC(O)=NC(O)=N1 ZFSLODLOARCGLH-UHFFFAOYSA-N 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 229940035034 maltodextrin Drugs 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- JDSHMPZPIAZGSV-UHFFFAOYSA-N melamine Chemical compound NC1=NC(N)=NC(N)=N1 JDSHMPZPIAZGSV-UHFFFAOYSA-N 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Mathematical Optimization (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明公开了一种基于流判别模型的奶粉掺杂非定向检测方法,本方法巧妙地将奶粉掺杂信息转化为正常奶粉拉曼高光谱的深层可信空间边界识别问题,无需依赖掺杂物的先验信息,即可解决奶粉的非定向检测问题,且后续维护与升级只需添加质量公认或严格控制的正常奶粉样品即可。在模型训练中,该方法针对当前深度学习模型迁移效率低、适用性差等问题,设计了一种分布转移策略计算高维复杂拉曼高光谱概率密度,实现了非定向判别模型训练过程直接数值化的控制,极大优化了模型迁移效率;以上相关特性显著提升了流判别模型的广泛适用性,有力捍卫我国的奶粉质量安全,并有望进一步拓展至其它食品体系掺杂的非定向检测。
Description
技术领域
本发明涉及食品安全检测技术领域,更具体的说是涉及奶粉掺杂非定向检测的拉曼高光谱成像流判别模型及方法。
背景技术
奶粉产品作为一种优质的营养源,是目前人类饮食中重要的组成部分。奶粉掺杂检测是奶粉质量安全监管的重要环节,目前主要依赖于定向检测方法,即针对已知的掺杂物按照国标方法进行穷举筛查。相关定向检测方法大都为实验室标准分析方法,面临的最大挑战是如何筛查未知的掺杂物信息,这些掺杂物可能源自数百万种化合物中任何潜在的一种。相关检测方法需要大量的样品前处理过程,检测流程繁琐、昂贵且低效,难以有效满足当前严峻的奶粉质量安全形势。此外,当前奶粉安全的定向检测方法的检测范围有限,难以识别千变万化的未知掺杂物,导致现有奶粉安全监管体系存在一定的监管盲区。因此,基于知识挖掘的食品安全非定向检测方法应运而生,代表着食品安全检测的最新发展方向。
目前非定向检测方法发展仍处于初级阶段, 主要依赖于色谱-质谱联用法,依旧无法摆脱需构建海量质谱数据库以推导后续可能存在的未知化合物种类的传统模式,依旧存在费时、费力、费用高、专业要求高且数据挖掘困难等问题,导致当前的非定向检测依旧依赖于掺杂物质数据库的先验知识,难以有效覆盖未知掺杂物质范围,更难以满足数以百万吨的奶粉安全现场筛查需求;此外,非定向检测模型的建立过程存在诸多不可控因素,导致模型迁移效率低,难以在当前奶粉掺杂大数据应用场景下实现广泛适配。
因此,如何提供一种效率高识别准确的基于流判别模型的奶粉掺杂非定向检测方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于流判别模型的奶粉掺杂非定向检测方法,有效克服传统定向检测方法的效率低、覆盖范围窄、费用高、操作繁琐等问题,有望应用于海量奶粉的真实性监管。
为了实现上述目的,本发明采用如下技术方案:
一种基于流判别模型的奶粉掺杂非定向检测方法,包括以下步骤:
采用拉曼高光谱成像技术,逐点或逐行扫描样本,采集待测奶粉的光谱信息和空间分布信息进行融合后得到拉曼高光谱信息;将所述拉曼高光谱信息输入至训练好的流判别模型获取对应的对数似然值,若所得到的对数似然值大于训练好的流判别模型的深层空间判别边界,则判断当前待测奶粉为有掺杂样本,若小于训练好的流判别模型的深层空间判别边界,则判断当前待测奶粉为正常样本;其中,所述流判别模型的训练过程包括:
S1.设置可信样本,形成训练集,并针对每个所述可信样本获取光谱信息和空间信息并进行融合,对应获得每个所述可信样本的图谱合一的拉曼高光谱信息;
S2.构建流判别模型,通过所述流判别模型的转移函数f分别获取每个拉曼高光谱信息对应的特征数据f(x),根据所述特征数据f(x)计算每个可信样本对应的拉曼高光谱的概率密度;
S3.分别采用刚性变换通道和耦合变换通道提取光谱特征,并在每层网络之间交换刚性通道与耦合通道的顺序并进行耦合操作,经过多次耦合操作后,得到样本最终特征;
S4. 对于所述训练集中的每个训练样本,每次得到所述样本最终特征后计算其在特征空间上的负对数似然值,并按负对数似然梯度下降方向对模型参数进行更新;
S5.重复S2-S4的内容进行迭代训练,直至所述训练集的平均负对数似然值的波动处于稳定阈值范围内,则停止迭代,完成流判别模型的训练,并将所述训练集上最大的对数似然值作为深层空间判别边界。
优选的,S2中构建流判别模型的具体内容包括:
(1)初始化分布转移函数
利用多层卷积神经网络构建分布转移函数,通过随机初始化神经网络得到初始化转移函数f,转移函数f将正常样本的拉曼图像数据x映射到拉曼图像特征空间,得到特征数据f(x);
(2)确定目标转移分布
转移函数将原始复杂数据分布设置为简单数据分布,后续通过耦合迭代的方式有效逼近原始复杂数据的分布;其中,所述简单数据分布为标准正态分布;
(3)概率计算
流模型基于密度保持原理计算概率密度,样本服从正常分布的概率计算方法为:
其中P normal 表示样本服从正常分布的概率,P z 表示样本特征服从标准正态分布的概率,J f 表示转移函数f的雅可比矩阵,具体表示为:
(4)流判别模型训练
流判别模型采用公式(1)的负对数形式作为代价函数,代价函数具体为:
其中,z为特征向量;
优化方向为梯度下降方向,每次迭代沿着该优化方向更新模型的参数,从而使得转移函数能够将原始复杂数据分布变换为简单的标准正态分布,致使原始复杂数据分布边界被变换为简单的已知分布边界,用于区分可信样本与掺杂样本,即为非定向判别模型。
优选的,S3中的耦合操作包括以下内容:
其中h表示每层耦合层所得特征,上标表示通道编号,下标表示层数,所述耦合通道包括s和t两个变换函数,其中s函数称为特征函数,t函数称为偏置函数,函数s和t函数采用深度卷积网络形式,scaling函数表示权重层,latent为对应光谱在特征空间的表示方法。
优选的,所述流判别模型的训练过程还包括:
S6.对训练后的流判别模型进行准确性验证。
优选的,S1中设置的可信样本具体为满足国标要求的不同品种的可信奶粉样品。
优选的,通过拉曼高光谱成像仪获取多个空间点的光谱信息,空间采集范围至少满足50mm×50mm区域的要求,样本采样间距在1mm至5mm之间。
经由上述的技术方案可知,与现有技术相比,本发明公开提供一种基于流判别模型的奶粉掺杂非定向检测方法,有益效果包括:
(1)本方法仅需简单的便携式拉曼高光谱成像设备即可完成奶粉掺杂的非定向筛查,样本无需前处理即可实现原位无损检测,有效避免了复杂且昂贵的实验室检测方法,极大提升了检测效率。
(2)本方法采用的流判别模型只需要采集质量公认的可信样本,即可构建深层可信空间边界,巧妙规避了传统掺杂检测方法需要穷举掺杂物的困境,从理论上全面覆盖所有未知掺杂物的识别范围,使得该方法同时兼备非定向筛查的高灵敏度和广谱检测能力。
(3)流判别模型创新性采用分布转移策略计算高维复杂拉曼高光谱概率密度,巧妙实现了深度学习训练过程的数值化分析,其模型迁移效率高,后续模型维护和更新非常简单,只需添加质量可信的新样本,即可快速自动刻画新的深层可信空间边界,有效克服了非定向建模困难问题,具备良好的实用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的流判别模型的计算流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于流判别模型的奶粉掺杂非定向检测方法,包括以下步骤:
采用拉曼高光谱成像技术,逐点或逐行扫描样本,采集待测奶粉的光谱信息和空间分布信息进行融合后得到拉曼高光谱信息;将拉曼高光谱信息输入至训练好的流判别模型获取对应的对数似然值,若所得到的对数似然值大于训练好的流判别模型的深层空间判别边界,则判断当前待测奶粉为有掺杂样本,若小于训练好的流判别模型的深层空间判别边界,则判断当前待测奶粉为正常样本;其中,流判别模型的训练过程包括:
S1.设置可信样本,形成训练集,并针对每个可信样本获取光谱信息和空间信息并进行融合,对应获得每个可信样本的图谱合一的拉曼高光谱信息;
S2.构建流判别模型,通过流判别模型的转移函数f分别获取每个拉曼高光谱信息对应的特征数据f(x),根据特征数据f(x)计算每个可信样本对应的拉曼高光谱的概率密度;
S3.分别采用刚性变换通道和耦合变换通道提取光谱特征,并在每层网络之间交换刚性通道与耦合通道的顺序并进行耦合操作,经过多次耦合操作后,得到样本最终特征;
S4. 对于训练集中的每个训练样本,每次得到样本最终特征后计算其在特征空间上的负对数似然值,并按负对数似然梯度下降方向对模型参数进行更新;
S5.重复S2-S4的内容进行迭代训练,直至训练集的平均负对数似然值的波动处于稳定阈值范围内,则停止迭代,完成流判别模型的训练,并将训练集上最大的对数似然值作为深层空间判别边界。
需要说明的是:
本发明实施例S1中采用拉曼高光谱成像技术,即二维位移平台与光谱仪联动的方式逐点或逐行扫描样本;
本发明实施例中流判别模型用于可信样本拉曼高光谱特征边界的划分,需要借助一定数据量的可信样本建立可信数据集,其样本数要求大于100以上。
本发明实施例S3中,刚性变换采用恒等变换函数构成,耦合通道采用s和t两个变换函数构成,其中s函数称为特征函数,t函数称为偏置函数。
为了进一步实施上述技术方案,S2中构建流判别模型的具体内容包括:
(1)初始化分布转移函数
利用多层卷积神经网络构建分布转移函数,该神经网络具有双射可逆性,即所得转移函数存在逆函数。通过随机初始化神经网络得到初始化转移函数f,转移函数f将正常样本的拉曼图像数据x映射到拉曼图像特征空间,得到特征数据f(x);
(2)确定目标转移分布
转移函数将原始复杂数据分布设置为简单数据分布,后续通过耦合迭代的方式有效逼近原始复杂数据的分布;其中,简单数据分布为标准正态分布;
需要说明的是:流模型建立过程旨在优化转移函数f,使得所得特征数据f(x)服从标准正态分布,从而直接数值化地计算高维复杂拉曼高光谱的概率密度值,即样本为可信样本的概率;
(3)概率计算
流模型基于密度保持原理计算概率密度;已知转移函数f可将正常样本的拉曼高光谱特征分布变换为简单的标准正态分布,则基于概率密度保持原理可知,样本服从正常分布的概率计算方法为:
其中P normal 表示样本服从正常分布的概率,P z 表示样本特征服从标准正态分布的概率,J f 表示转移函数f的雅可比矩阵,具体表示为:
(4)流判别模型训练
流判别模型采用公式(1)的负对数形式作为代价函数,代价函数具体为:
其中,z为特征向量;
优化方向为梯度下降方向,每次迭代沿着该优化方向更新模型的参数,从而使得转移函数能够将原始复杂数据分布变换为简单的标准正态分布,致使原始复杂数据分布边界被变换为简单的已知分布边界,用于区分可信样本与掺杂样本,即为非定向判别模型。
为了进一步实施上述技术方案,S3中的耦合操作包括以下内容:
其中h表示每层耦合层所得特征,上标表示通道编号,下标表示层数,耦合通道包括s和t两个变换函数,其中s函数称为特征函数,t函数称为偏置函数,函数s和t函数采用深度卷积网络形式,scaling函数表示权重层,latent为对应光谱在特征空间的表示方法。
需要说明的是:具体耦合操作的次数通过测试得到,本实施例中测试一共采用四层结构,每个特征经过两次耦合操作,两次刚性操作。上述公式表示一个4层耦合层结构的流判别模型,可采用堆叠更多层耦合层得到更复杂的网络,具体需要根据训练效果决定,越深的网络可得到越复杂的模型,但也同时可能导致网络容易过拟合。
为了进一步实施上述技术方案,流判别模型的训练过程还包括:
S6.对训练后的流判别模型进行准确性验证。
为了进一步实施上述技术方案,S1中设置的可信样本具体为满足国标要求的不同品种的可信奶粉样品。
为了进一步实施上述技术方案,通过拉曼高光谱成像仪获取多个空间点的光谱信息,空间采集范围至少满足50mm×50mm区域的要求,样本采样间距在1mm至5mm之间。
下面将进一步通过实例来对流判别模型进行训练的过程进行说明:
(1)可信样本数据准备
本实施例中准备了来自不同供应商的不同配方的多种可信奶粉,相关样本经过权威机构测试,且所准备奶粉均满足国标要求。在实验中,一共采集200份可信奶粉样本,单个样本重20g。
(2)可信样本拉曼高光谱成像数据采集
采用拉曼高光谱成像采集设备,高效采集可信样本的拉曼高光谱成像信息,其中拉曼光谱仪的激发光波长为785nm,光谱分辨率为6cm-1,光谱范围覆盖200cm到2000cm波段,激光功率为100mW。奶粉样本放置在透明平底容器中,通过位移平台进行移动采样,采样间隔为1mm,在50mm×50mm的区域内采集2500个样本点的拉曼光谱。在此基础上,结合其空间分布信息,最终得到可信奶粉的拉曼高光谱数据。
(3)流判别模型的建立
依据图1中所示流判别模型框架,在可信样本的拉曼高光谱数据集上,根据上文内容建立流判别模型。在建模过程中,从判别问题出发,建立单条拉曼光谱和判别属性之间的概率关系,然后用可逆的神经网络来迭代训练,通过多次迭代训练后达到收敛条件,建模结束。
流判别模型训练的具体过程可表示为,将输入光谱数据x分成两部分,分别输入流判别模型第一层的相应部分,得到各自对应的特征。随后,不断交换特征顺序并进行相应操作,其中函数s和t函数在本实施例中采用深度卷积网络形式,scaling函数表示权重层,得到的latent即为对应光谱在特征空间的表示方法。模型经过每次迭代后,需要统计整个可信数据集在特征空间上的平均对数似然值,当对数似然值在十次循环中波动在1%之内时,则停止迭代。计算结束后,将可信数据集上最大的对数似然值作为深层空间判别边界,准确判断未知奶粉样本是否掺杂。如果待测样本的拉曼高光谱数据经过流模型投影后,得到的对数似然大于判别边界,则判断为掺杂样本;如小于判别边界,则为正常样本。
下面将根据实例来对多种均匀掺杂奶粉的可信性判断进行说明:
测试样本的准备:
该实施例中对多种存在非法添加剂的奶粉样本进行可信性分析,其中用到的非法添加剂包括三聚氰胺、三聚氰酸、淀粉、乳清粉和麦芽糖糊精,通过将以上添加剂添加入纯奶粉中,共制备了150组单掺杂物奶粉样本和200组多掺杂物奶粉样本。其中,掺杂物浓度范围在0.5%~1.5%之间,且通过搅拌器与奶粉进行均匀混合。
数据采集:
采用上文可信样本数据准备过程中的第二步所述方法,对所有掺杂样本进行拉曼高光谱数据采集,共得到350个大小为50×50×1024大小的拉曼高光谱数据矩阵。
样本可信性分析:
将第二步得到的拉曼高光谱图像数据依次输入训练后的流判别模型中,统计每条样本所得的对数似然值,并与判别边界进行对比,得到判别结果。计算结果表明,在该实施例中,对于掺杂奶粉的判别准确率达到了99.5%,充分说明流判别模型具备奶粉掺杂非定向检测能力,其模型预测精度令人满意。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (6)
1.一种基于流判别模型的奶粉掺杂非定向检测方法,其特征在于,包括以下步骤:
采用拉曼高光谱成像技术,逐点或逐行扫描样本,采集待测奶粉的光谱信息和空间分布信息进行融合后得到拉曼高光谱信息;将所述拉曼高光谱信息输入至训练好的流判别模型获取对应的对数似然值,若所得到的对数似然值大于训练好的流判别模型的深层空间判别边界,则判断当前待测奶粉为有掺杂样本,若小于训练好的流判别模型的深层空间判别边界,则判断当前待测奶粉为正常样本;其中,所述流判别模型的训练过程包括:
S1.设置可信样本,形成训练集,并针对每个所述可信样本获取光谱信息和空间信息并进行融合,对应获得每个所述可信样本的图谱合一的拉曼高光谱信息;
S2.构建流判别模型,通过所述流判别模型的转移函数f分别获取每个拉曼高光谱信息对应的特征数据f(x),根据所述特征数据f(x)计算每个可信样本对应的拉曼高光谱的概率密度;
S3.分别采用刚性变换通道和耦合变换通道提取光谱特征,并在每层网络之间交换刚性通道与耦合通道的顺序并进行耦合操作,经过多次耦合操作后,得到样本最终特征;
S4. 对于所述训练集中的每个训练样本,每次得到所述样本最终特征后计算其在特征空间上的负对数似然值,并按负对数似然梯度下降方向对模型参数进行更新;
S5.重复S2-S4的内容进行迭代训练,直至所述训练集的平均负对数似然值的波动处于稳定阈值范围内,则停止迭代,完成流判别模型的训练,并将所述训练集上最大的对数似然值作为深层空间判别边界。
2.根据权利要求1所述的一种基于流判别模型的奶粉掺杂非定向检测方法,其特征在于,S2中构建流判别模型的具体内容包括:
(1)初始化分布转移函数
利用多层卷积神经网络构建分布转移函数,通过随机初始化神经网络得到初始化转移函数f,转移函数f将正常样本的拉曼图像数据x映射到拉曼图像特征空间,得到特征数据f(x);
(2)确定目标转移分布
转移函数将原始复杂数据分布设置为简单数据分布,后续通过耦合迭代的方式有效逼近原始复杂数据的分布;其中,所述简单数据分布为标准正态分布;
(3)概率计算
流模型基于密度保持原理计算概率密度,样本服从正常分布的概率计算方法为:
其中P normal 表示样本服从正常分布的概率,P z 表示样本特征服从标准正态分布的概率,J f 表示转移函数f的雅可比矩阵,具体表示为:
(4)流判别模型训练
流判别模型采用公式(1)的负对数形式作为代价函数,代价函数具体为:
其中,z为特征向量;
优化方向为梯度下降方向,每次迭代沿着该优化方向更新模型的参数,从而使得转移函数能够将原始复杂数据分布变换为简单的标准正态分布,致使原始复杂数据分布边界被变换为简单的已知分布边界,用于区分可信样本与掺杂样本,即为非定向判别模型。
4.根据权利要求1所述的一种基于流判别模型的奶粉掺杂非定向检测方法,其特征在于,所述流判别模型的训练过程还包括:
S6.对训练后的流判别模型进行准确性验证。
5.根据权利要求1所述的一种基于流判别模型的奶粉掺杂非定向检测方法,其特征在于,S1中设置的可信样本具体为满足国标要求的不同品种的可信奶粉样品。
6.根据权利要求1所述的一种基于流判别模型的奶粉掺杂非定向检测方法,其特征在于,通过拉曼高光谱成像仪获取多个空间点的光谱信息,空间采集范围至少满足50mm×50mm区域的要求,样本采样间距在1mm至5mm之间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210694915.1A CN114780917B (zh) | 2022-06-20 | 2022-06-20 | 一种基于流判别模型的奶粉掺杂非定向检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210694915.1A CN114780917B (zh) | 2022-06-20 | 2022-06-20 | 一种基于流判别模型的奶粉掺杂非定向检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114780917A CN114780917A (zh) | 2022-07-22 |
CN114780917B true CN114780917B (zh) | 2022-09-06 |
Family
ID=82420778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210694915.1A Active CN114780917B (zh) | 2022-06-20 | 2022-06-20 | 一种基于流判别模型的奶粉掺杂非定向检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114780917B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010101777A1 (en) * | 2009-03-06 | 2010-09-10 | Idexx Laboratories, Inc. | Detection of melamine |
CN104819974A (zh) * | 2015-04-23 | 2015-08-05 | 天津大学 | 基于拉曼光谱的肉制品掺杂检测平台 |
CN106596464A (zh) * | 2016-12-23 | 2017-04-26 | 天津农学院 | 一种奶粉中掺三聚氰胺的近红外自相关谱检测方法 |
CN106918586A (zh) * | 2017-02-15 | 2017-07-04 | 中国人民解放军第二军医大学 | 一种奶粉中多种掺杂物同时检出的方法 |
CN110687090A (zh) * | 2019-09-10 | 2020-01-14 | 中国民航大学 | 移动窗口光谱角制图算法及乳粉非定向筛查方法 |
CN111413316A (zh) * | 2020-04-09 | 2020-07-14 | 天津大学 | 基于拉曼光谱的乳粉真实性筛查方法 |
CN113777144A (zh) * | 2021-11-09 | 2021-12-10 | 中国民航大学 | 用于胃液中多巴胺检测的电化学传感器及制备方法与应用 |
WO2022008875A1 (en) * | 2020-07-06 | 2022-01-13 | Agilent Technologies Lda Uk Limited | Raman analysis of pharmaceutical dosage forms |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11074495B2 (en) * | 2013-02-28 | 2021-07-27 | Z Advanced Computing, Inc. (Zac) | System and method for extremely efficient image and pattern recognition and artificial intelligence platform |
CN107024450A (zh) * | 2017-03-27 | 2017-08-08 | 云南小宝科技有限公司 | 一种基于近红外光谱技术鉴别不同品牌和段数奶粉的方法 |
CN111650152B (zh) * | 2020-04-21 | 2022-01-14 | 天津农学院 | 一种减小品牌对掺杂尿素牛奶判别模型影响的异步近红外相关切谱检测方法 |
-
2022
- 2022-06-20 CN CN202210694915.1A patent/CN114780917B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010101777A1 (en) * | 2009-03-06 | 2010-09-10 | Idexx Laboratories, Inc. | Detection of melamine |
CN104819974A (zh) * | 2015-04-23 | 2015-08-05 | 天津大学 | 基于拉曼光谱的肉制品掺杂检测平台 |
CN106596464A (zh) * | 2016-12-23 | 2017-04-26 | 天津农学院 | 一种奶粉中掺三聚氰胺的近红外自相关谱检测方法 |
CN106918586A (zh) * | 2017-02-15 | 2017-07-04 | 中国人民解放军第二军医大学 | 一种奶粉中多种掺杂物同时检出的方法 |
CN110687090A (zh) * | 2019-09-10 | 2020-01-14 | 中国民航大学 | 移动窗口光谱角制图算法及乳粉非定向筛查方法 |
CN111413316A (zh) * | 2020-04-09 | 2020-07-14 | 天津大学 | 基于拉曼光谱的乳粉真实性筛查方法 |
WO2022008875A1 (en) * | 2020-07-06 | 2022-01-13 | Agilent Technologies Lda Uk Limited | Raman analysis of pharmaceutical dosage forms |
CN113777144A (zh) * | 2021-11-09 | 2021-12-10 | 中国民航大学 | 用于胃液中多巴胺检测的电化学传感器及制备方法与应用 |
Non-Patent Citations (3)
Title |
---|
"A Study on the use of Spectroscopic Techniques to Identify Food Adulteration";Ajith Ravindran et al.;《2018 International Conference on Circuits and Systems in Digital Enterprise Technology (ICCSDET)》;20190902;全文 * |
"基于多光谱融合的奶粉掺假诊断方法";陈达 等;《纳米技术与精密工程》;20170930;全文 * |
"奶粉掺假拉曼光谱成像检测新方法";陈达 等;《纳米技术与精密工程》;20170131;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114780917A (zh) | 2022-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jin et al. | Comparison of different satellite bands and vegetation indices for estimation of soil organic matter based on simulated spectral configuration | |
CN106124449B (zh) | 一种基于深度学习技术的土壤近红外光谱分析预测方法 | |
CN101807301B (zh) | 一种基于高阶统计量的高光谱图像目标检测方法 | |
CN104374738B (zh) | 一种基于近红外提高鉴别结果的定性分析方法 | |
CN111161362B (zh) | 一种茶树生长状态光谱影像鉴别方法 | |
CN105486655B (zh) | 基于红外光谱智能鉴定模型的土壤有机质快速检测方法 | |
CN102540271B (zh) | 基于增强约束稀疏回归的半监督高光谱亚像元目标检测法 | |
CN113959974B (zh) | 一种普适性近红外光谱模型的传递方法 | |
CN113008805A (zh) | 基于高光谱成像深度分析的白芷饮片质量预测方法 | |
CN113902646A (zh) | 基于深浅层特征加权融合网络的遥感影像泛锐化方法 | |
CN114332534B (zh) | 一种高光谱图像小样本分类方法 | |
CN117407710A (zh) | 高光谱遥感水质参数反演方法、装置、电子设备及存储介质 | |
CN110321528B (zh) | 一种基于半监督地理空间回归分析的高光谱影像土壤重金属浓度评估方法 | |
CN117789038B (zh) | 一种基于机器学习的数据处理与识别模型的训练方法 | |
Liu et al. | Combination of effective color information and machine learning for rapid prediction of soil water content | |
CN114858782B (zh) | 基于拉曼高光谱对抗判别模型的奶粉掺杂非定向检测方法 | |
CN114780917B (zh) | 一种基于流判别模型的奶粉掺杂非定向检测方法 | |
CN114061766A (zh) | 一种颗粒燃烧过程多光谱重建测温装置与方法 | |
CN109117712A (zh) | 一种最大边缘测度学习的高光谱影像目标探测方法及系统 | |
CN113406057A (zh) | 一种食品中农药残留的快速检测方法及系统 | |
CN108388965B (zh) | 油脂掺伪含量检测方法、终端设备及计算机可读存储介质 | |
CN105761273A (zh) | 一种基于图构造的高光谱遥感影像异常目标探测方法 | |
CN111595802A (zh) | 一种基于nir光谱的忧遁草种源地分类模型的构建方法及应用 | |
CN105842183B (zh) | 一种基于共识选择技术的红外光谱建模方法 | |
CN109406413A (zh) | 基于高光谱成像技术预测枸杞子中圣草酚含量的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |