CN112508070B - 基于近红外光谱在线检测干燥过程脱水量的标定建模方法 - Google Patents

基于近红外光谱在线检测干燥过程脱水量的标定建模方法 Download PDF

Info

Publication number
CN112508070B
CN112508070B CN202011368412.2A CN202011368412A CN112508070B CN 112508070 B CN112508070 B CN 112508070B CN 202011368412 A CN202011368412 A CN 202011368412A CN 112508070 B CN112508070 B CN 112508070B
Authority
CN
China
Prior art keywords
near infrared
infrared spectrum
distribution
data
drying process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011368412.2A
Other languages
English (en)
Other versions
CN112508070A (zh
Inventor
刘涛
穆国庆
仲崇权
夏浩
孟庆伟
朱理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN202011368412.2A priority Critical patent/CN112508070B/zh
Publication of CN112508070A publication Critical patent/CN112508070A/zh
Application granted granted Critical
Publication of CN112508070B publication Critical patent/CN112508070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3554Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for determining moisture content
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N2021/3595Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Algebra (AREA)
  • Chemical & Material Sciences (AREA)
  • Software Systems (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明属于工业过程检测领域,公开了基于近红外光谱在线检测干燥过程脱水量的标定建模方法。本发明是利用配有漫反射式探头的近红外光谱分析仪,搭建流化床干燥过程在线监测实验平台,从而实时原位测量流化床干燥过程水分含量的近红外光谱数据。首先对光谱数据和参考数据进行采集,其次对测量到的近红外光谱数据进行预处理操作,然后利用有标签和无标签的光谱数据建立半监督变分偏最小二乘模型,以此来构建标定模型,并使用变分推断的方法对模型参数进行估计,最后,通过外部实验验证建立模型的有效性,由此实时测量干燥过程的水分含量。本发明能够达到自动快速检测流化床的水分含量,便于实际工业应用和推广。

Description

基于近红外光谱在线检测干燥过程脱水量的标定建模方法
技术领域
本发明属于工业过程检测领域,涉及一种基于近红外光谱在线检测化工干燥过程脱水量的方法,具体是基于近红外光谱分析技术实时测量干燥过程脱水量的方法。
背景技术
干燥工程广泛用于医药、食品、石油化工等生产行业。近红外光谱技术具有对不同物质组分的敏感性较好、非侵入检测等优点,近年来越来越多地用于各种工业干燥过程脱水量的检测,相对于离线检测的技术有较好的实时性。近红外的谱段范围为780nm~2500nm,可以反映分子中含氢基团(如C-H,N-H,O-H)振动合频与倍频特征信息,水分子含有氢基团可以通过近红外光谱强度反映水分的含量,因此近红外光谱技术适合分析干燥过程中被干燥物质的水分含量。
要使用近红外光谱实时检测干燥过程脱水量,需要大量的标签样本建立一个标定模型。工程应用中采集标签数据需要专业技术人员使用特定仪器取样检测,并且花费大量的时间,实际上往往只能获得少量的标签样本与实时采集光谱对应,大部分实时采集的光谱得不到对应的标签测量数据。
目前,虽然有近红外光谱技术开始应用于对干燥过程的检测,但由于建模样本标签不足等影响,造成标定模型的实际测量精度不高,尤其是用于在线检测时,会产生较大的测量误差。
发明内容
本发明要解决的技术问题是:针对干燥过程中样本标签不足的问题,传统的方法不能利用无标签的光谱数据进行建模,导致光谱标定模型的精度不高。
为解决上述问题,本发明系统地提出如何在标签样本不充足条件下采用近红外光谱检测技术对干燥过程脱水量进行实时测量的方法,并进行了解释说明。
本发明是利用配有漫反射式探头的近红外光谱分析仪,搭建流化床干燥过程在线监测实验平台,从而实时原位测量流化床干燥过程的近红外光谱数据,并传输给计算机,根据建立的光谱标定模型进行预测。首先需要对光谱数据和参考样本进行采集,其次对测量的近红外光谱数据进行预处理操作,然后构建半监督的标定模型,并使用变分推断的方法对模型参数进行选择,最后,通过不同批次的干燥实验验证建立模型的有效性,由此定量分析流化床干燥过程的脱水量。本发明的流程如图1所示。
本发明的技术方案如下:
一种基于近红外光谱在线检测干燥过程脱水量的标定建模方法,步骤如下:
第一步:近红外光谱数据和参考数据的采集
在流化床干燥过程中,利用近红外光谱分析仪实时采集被干燥物质的近红外光谱数据,提供标准背景作为参考背景,将近红外光谱分析仪采集的近红外光谱与参考背景的差谱作为每次采样检测的近红外光谱数据,以消除噪声引起的测量误差。采用质量差重法测量水分含量作为标签;收集光谱数据中有标签的光谱表示为
Figure BDA0002805720980000021
和对应的标签为
Figure BDA0002805720980000022
其中
Figure BDA0002805720980000023
是第i个光谱,并且
Figure BDA0002805720980000024
是第i个样品的标签,即水分含量,无标签光谱样本用
Figure BDA0002805720980000025
表示;
Figure BDA0002805720980000026
表示完整的输入矩阵,包括有标签和无标签的光谱样本;NL是有标签样本数,NU是无标签样本数,N是总样本数,M是光谱变量数,K是潜变量数,K小于M,S是标签的维度,这里是1,γ是最大迭代次数;
第二步:近红外光谱数据的预处理
为了消除环境条件变化对光谱测量带来的扰动,在建模之前,需要对近红外光谱的数据进行预处理来消除无关信息和噪声。
将第一步采集到的近红外光谱数据写成光谱数据矩阵,矩阵中的每一行是一条测试样品的光谱,矩阵的每一列是近红外光的指定波长下不同样品的吸收值;
采用中心化的光谱预处理方法:
X=Xi-μ (1)
其中X经过中心化处理的近红外光谱数据第i个样本的吸光度;Xi表示近红外光谱数据第i个样本的吸光度;μ表示近红外光谱数据吸光度的均值;
第三步:建立半监督变分偏最小二乘模型;
将第二步中预处理后的近红外光谱数据作为建模集,采用半监督变分偏最小二乘(PLS)建模方法建立模型;
半监督变分偏最小二乘的定义为,
Figure BDA0002805720980000031
其中
Figure BDA0002805720980000032
Figure BDA0002805720980000033
载荷矩阵;g=1,…,K和h=1,…,S;有标签样本潜变量ZL和无标签样本潜变量ZU组成潜变量空间Z;
Figure BDA0002805720980000034
Figure BDA0002805720980000035
分别是ZL,ZU和Y的残差矩阵;
潜在空间Z中的潜变量定义如下:
Figure BDA0002805720980000036
载荷矩阵P和Q中的载荷变量定义如下:
Figure BDA0002805720980000041
其中pg和qh分别是P和Q的第g和第h列;
Ω-1,Ψ-1,Σ-1和Γ-1分别是Z,Y,P和Q的方差阵Ω,Ψ,Σ和Γ的逆矩阵,即精度矩阵,定义如下:
Figure BDA0002805720980000042
其中A,B,C,D分别是威希特先验分布的矩阵超参数,ι,ν,
Figure BDA0002805720980000048
κ分别是相应的自由度;令Σg=Σ和Γh=Γ,意味着不同的列向量共享方差信息;
样本的标签定义如下:
Figure BDA0002805720980000043
第四步:变分参数推断;
将目标转化为解决P(Θ|X,Y);
P(X,Y|Θ)P(Θ)=P(X,Y,Θ)=P(Θ|X,Y)P(X,Y) (7)
其中Θ是变量集,包含P,Q,ZL,ZU-1-1-1-1
Figure BDA0002805720980000044
由变分推断给出的模型参数的后验分布通过以下因式分解估算,
Figure BDA0002805720980000045
其中F代表近似的易求概率分布;F(ZL)和F(ZU)表示为
Figure BDA0002805720980000046
Figure BDA0002805720980000047
对于公式(8)中的联合概率分布,表示为
Figure BDA0002805720980000051
在变分推断中,最核心的是最优变分解为
Figure BDA0002805720980000052
表示为
Figure BDA0002805720980000053
其中
Figure BDA0002805720980000054
表示对
Figure BDA0002805720980000055
的期望,
Figure BDA0002805720980000056
表示在F(Θ)中除Fjj)以外的因子;
对于F(zi),使用公式(11),将其标识为正态分布,
Figure BDA0002805720980000057
其中
Figure BDA0002805720980000058
Figure BDA0002805720980000059
对于F(zj),将其标识为正态分布,
Figure BDA00028057209800000510
其中
Figure BDA00028057209800000511
Figure BDA00028057209800000512
F(Ω-1)的每列分解为伽玛分布,写成:
Figure BDA00028057209800000513
其中ZLg和ZUg分别是ZL和ZU的第g列;
Figure BDA00028057209800000514
Figure BDA00028057209800000515
对于F(pg),写成
Figure BDA00028057209800000516
其中
Figure BDA00028057209800000517
Figure BDA00028057209800000518
对于F(Σ-1),将其标识为威希特分布;
Figure BDA0002805720980000061
其中
Figure BDA0002805720980000062
Figure BDA0002805720980000063
对于F(Ψ-1),其对角线分量表示为伽玛分布,
Figure BDA0002805720980000064
其中
Figure BDA0002805720980000065
Figure BDA0002805720980000066
F(qh)被识别为高斯分布,
Figure BDA0002805720980000067
其中
Figure BDA0002805720980000068
Figure BDA0002805720980000069
对于F(Γ-1),将其标识为威希特分布
Figure BDA00028057209800000610
其中
Figure BDA00028057209800000611
Figure BDA00028057209800000612
对于变分下界
Figure BDA00028057209800000613
写成如下
Figure BDA00028057209800000614
由于NIR光谱中的波数变量是高维的,通常相对于采集样本数量而言过多,而且存在共线性问题,因此必须对输入变量进行稀疏处理。为了实现输入变量的稀疏性,可以将稀疏先验导入到载荷矩阵的行中。将两个伽玛分布
Figure BDA00028057209800000615
Figure BDA00028057209800000616
引入P和Q的行中以丢弃无用的信息,其表达式如下
Figure BDA0002805720980000071
其中Pt.和Qg.分别是的P第t行和Q的第g行;
相应地,公式(21)中的pg
Figure BDA0002805720980000072
Figure BDA0002805720980000073
的高斯分布;公式(21)中的qh
Figure BDA0002805720980000074
Figure BDA0002805720980000075
的高斯分布;
令Γ-1影响P的列,从而Γ-1影响两个投影矩阵的潜在空间;P表示为
Figure BDA0002805720980000076
其中φ-2是伽玛分布,形式为
Figure BDA0002805720980000077
pg是高斯分布,其参数为
Figure BDA0002805720980000078
Figure BDA0002805720980000079
由于
Figure BDA00028057209800000710
是伽玛分布,
Figure BDA00028057209800000711
写成
Figure BDA00028057209800000712
对于E[φ-2],写成
Figure BDA00028057209800000713
第五步:为了使用无标签和有标签样本进行建模,提出的自适应半监督变分推断偏最小二乘回归模型(ASVIPLS)方法概述如下;
初始化变量;
从N(0,1)生成初始化Zi和Zj;用W(K-0.5,(K-0.5)I1×K)初始化Ω-1;用W(0.01,0.01IM×1)初始化Σ-1;用W(S-0.5,(S-0.5)I1×S)初始化Ψ-1;用W(0.01,0.01IK×1)初始化Γ-1;φ-2初始化为G(0.01,0.01);并用公式(2)初始化P和Q;
通过公式(14)计算Ω-1,通过公式(22)计算P,通过公式(16)计算Σ-1,通过公式(17)计算Ψ-1,通过公式(18)计算Q,通过公式(19)计算Γ-1,通过公式(12)计算Zi和通过公式(13)计算Zj的后验分布;
停止计算,直到
Figure BDA0002805720980000083
满足收敛条件
Figure BDA0002805720980000081
θ∈[0.001,0.05]或者达到最大的迭代次数γ∈[1000,10000];
第六步:在线预测水分含量;
近红外光谱分析仪与监控计算机连接,在干燥过程中近红外光谱分析仪实时采集干燥颗粒在不同波长下的吸光度值(即近红外光谱)xnew,并传输到监控计算机中,利用步骤三到步骤五中的标定模型实现对水分含量
Figure BDA0002805720980000082
实时检测及显示结果。
本发明的有益效果:本发明能实时检测干燥过程的脱水量,相对于仅使用有标签样本数据构建的光谱变量模型有更好的可信度和准确性。该方法可操作性强,对经验技术要求较低,能够达到自动快速检测被干燥物质的脱水量,便于实际工业应用和推广。
附图说明
图1是本发明的建模流程图;
图2是流化床干燥过程近红外光谱图;
图3是方法预测流化床干燥过程水分含量结果图。
具体实施方式
以下结合附图,进一步说明本发明的具体实施方式。
实施例为对批次硅胶颗粒流化床干燥过程的干燥状态的在线检测。该系统由一个5升的矩形腔室和一个用于观察的玻璃钢窗组成,功率为3KW的鼓风机,功率为6KW的加热器,1L进料器,2L储罐,高强度光照灯,温度传感器,颗粒取样器,浸入式漫反射NIR探针和NIR光谱仪(生产号FTPA2000-260,由ABB公司生产)。
为了操作流化床设备,首先要通过鼓风机吸收周围的空气,然后通过电加热器加热。加热的进气通过安装在流化床腔室底部的空气分布板均匀分布,随后,热空气使室内的颗粒流化以进行干燥,最后升至流化床的顶部进行排放。箱内温度由Pt100温度计测量,并由监测计算机命令的可编程逻辑控制器(PLC)进行调节。将焦距为250mm的NIR探头的头部放置在室内空气分布板的上方,与用于离线测量(LOD方法)颗粒水分含量的颗粒取样器高度相同,以便进行比较研究。LOD方法是通过在空气温度为105℃的烘箱中干燥6小时之前和之后的颗粒重量差异来测量水分含量。实验中,硅胶颗粒的平均大小约为100μm。对于分批进行的干燥过程,首先用电动混合器将水分含量为2%的1650g硅胶颗粒与450g的蒸馏水混合,以确保水分含量均匀分布约35%。在每次批次运行结束时,将这些颗粒干燥至水分含量约为2%。
采用本发明的具体实施如下:
第一步:光谱数据和参考数据的采集
近红外光谱分析仪采集的近红外光谱数据为表观光谱信息,样品的表观光谱中包含真实光谱信息和噪声。由于每次实验的仪器和实验条件可能存在着不同,会在测量近红外光谱数据产生较多噪声。为了消除工况产生的噪声,选用近红外光谱分析仪制造公司提供的光学性质稳定的标准背景作为参考背景,每次采样检测的近红外光谱数据由仪器测量的表观光谱与测量空气的近红外光谱的差谱得到。
采用傅里叶近红外光谱分析仪以及配套的浸入式漫反射探头采集近红外光谱,光谱采集设置:测量波数范围为4968cm-1–8,826cm-1,仪器分辨率为8cm-1,光谱扫描次数为32次,采用标准参考收集模块(序列号AS-01158-060,由ABB公司提供)为参考背景。采用离线检测方法检测参考数据,使用质量差重法(LOD法)测量水分含量。
将近红外光谱分析仪采集的近红外光谱与参考背景的差谱作为每次采样检测的近红外光谱数据;采用质量差重法测量水分含量作为标签;收集光谱数据中有标签的光谱表示为
Figure BDA0002805720980000101
和对应的标签为
Figure BDA0002805720980000102
其中
Figure BDA0002805720980000103
是第i个光谱,并且
Figure BDA0002805720980000104
是第i个样品的标签,即水分含量,无标签光谱样本用
Figure BDA0002805720980000105
表示;
Figure BDA0002805720980000106
表示完整的输入矩阵,包括有标签和无标签的光谱样本;NL是有标签样本数,NU是无标签样本数,N是总样本数,M是光谱变量数,K是潜变量数,K小于M,S是标签的维度,γ是最大迭代次数;
第二步:光谱数据的预处理
通常采集到的近红外光谱数据可以写成光谱数据矩阵,矩阵中的每一行都是一条测试样品的光谱,矩阵中的每一列为近红外光谱在某一波长下对不同样品的吸收峰值。图2示例给出了对其中一个批次流化床干燥过程采集的近红外光谱吸光度数据。
随后按照技术方案中的第二到第五步进行计算。
模型的可信度指数由CRED表示,等于
Figure BDA0002805720980000107
期望值。CRED被定义为
Figure BDA0002805720980000108
其中
Figure BDA0002805720980000109
Figure BDA00028057209800001010
通过在测试数据集上的预测均方根误差(RMSEP)来量化研究方法的预测准确性
Figure BDA00028057209800001011
其中
Figure BDA0002805720980000112
Figure BDA0002805720980000111
是测试样本的真实标签和预测值,Nt分别是测试数据集的大小。
使用流化床干燥实验进行了结果验证,并且与偏最小二乘和自适应变分最小二乘方法进行了对比;偏最小二乘,自适应变分最小二乘和本申请的RMSEP值分别为1.8629,1.4931和0.7639,说明本申请自适应半监督变分最小二乘方法的预测精度最高;自适应变分最小二乘和本申请自适应半监督变分最小二乘方法的CRED值分别为0.4528和1.6616,说明本申请自适应半监督变分最小二乘方法的可信度最高;对比的结果见图3。
第六步:在线预测水分含量
近红外光谱分析仪与监控计算机连接,在干燥过程中近红外光谱分析仪实时采集干燥颗粒在不同波长下的吸光度值(即近红外光谱),并传输到监控计算机中,利用第三到第五步中的标定模型实现对水分含量实时检测及显示结果。基于近红外光谱技术建立的在线标定模型可以对流化床干燥过程脱水量进行实时测量,定时20秒给出一次测量结果。

Claims (1)

1.基于近红外光谱在线检测干燥过程脱水量的标定建模方法,其特征在于,包括如下步骤:
第一步:光谱数据和参考数据的采集;
提供标准背景作为参考背景,将近红外光谱分析仪采集的近红外光谱与参考背景的差谱作为每次采样检测的近红外光谱数据;采用质量差重法测量水分含量作为标签;收集光谱数据中有标签的光谱表示为
Figure FDA0002805720970000011
和对应的标签为
Figure FDA0002805720970000012
其中
Figure FDA0002805720970000013
是第i个光谱,并且
Figure FDA0002805720970000014
是第i个样品的标签,即水分含量,无标签光谱样本用
Figure FDA0002805720970000015
表示;
Figure FDA0002805720970000016
表示完整的输入矩阵,包括有标签和无标签的光谱样本;NL是有标签样本数,NU是无标签样本数,N是总样本数,M是光谱变量数,K是潜变量数,K小于M,S是标签的维度,γ是最大迭代次数;
第二步:光谱数据的预处理;
将第一步采集到的近红外光谱数据写成光谱数据矩阵,矩阵中的每一行是一条测试样品的光谱,矩阵的每一列是近红外光的指定波长下不同样品的吸收值;
采用中心化的光谱预处理方法:
X=Xi-μ (1)
其中X经过中心化处理的近红外光谱数据第i个样本的吸光度;Xi表示近红外光谱数据第i个样本的吸光度;μ表示近红外光谱数据吸光度的均值;
第三步:建立半监督变分偏最小二乘模型;
将第二步中预处理后的近红外光谱数据作为建模集,采用半监督变分偏最小二乘建模方法建立模型;
半监督变分偏最小二乘的定义为,
Figure FDA0002805720970000021
其中
Figure FDA0002805720970000022
Figure FDA0002805720970000023
载荷矩阵;g=1,…,K和h=1,…,S;有标签样本潜变量ZL和无标签样本潜变量ZU组成潜变量空间Z;
Figure FDA0002805720970000024
Figure FDA0002805720970000025
分别是ZL,ZU和Y的残差矩阵;
潜在空间Z中的潜变量定义如下:
Figure FDA0002805720970000026
载荷矩阵P和Q中的载荷变量定义如下:
Figure FDA0002805720970000027
其中pg和qh分别是P和Q的第g和第h列;
Ω-1,Ψ-1,Σ-1和Γ-1分别是Z,Y,P和Q的方差阵Ω,Ψ,Σ和Γ的逆矩阵,即精度矩阵,定义如下:
Figure FDA0002805720970000028
其中A,B,C,D分别是威希特先验分布的矩阵超参数,ι,ν,
Figure FDA0002805720970000029
κ分别是相应的自由度;令Σg=Σ和Γh=Γ,意味着不同的列向量共享方差信息;
样本的标签定义如下:
Figure FDA00028057209700000210
第四步:变分参数推断;
将目标转化为解决P(Θ|X,Y);
P(X,Y|Θ)P(Θ)=P(X,Y,Θ)=P(Θ|X,Y)P(X,Y) (7)
其中Θ是变量集,包含P,Q,ZL,ZU-1-1-1-1
Figure FDA0002805720970000031
由变分推断给出的模型参数的后验分布通过以下因式分解估算,
Figure FDA0002805720970000032
其中F代表近似的易求概率分布;F(ZL)和F(ZU)表示为
Figure FDA0002805720970000033
Figure FDA0002805720970000034
对于公式(8)中的联合概率分布,表示为
Figure FDA0002805720970000035
在变分推断中,最核心的是最优变分解为
Figure FDA0002805720970000036
表示为
Figure FDA0002805720970000037
其中
Figure FDA0002805720970000038
表示对
Figure FDA0002805720970000039
的期望,
Figure FDA00028057209700000310
表示在F(Θ)中除Fjj)以外的因子;
对于F(zi),使用公式(11),将其标识为正态分布,
Figure FDA00028057209700000311
其中
Figure FDA00028057209700000312
Figure FDA00028057209700000313
对于F(zj),将其标识为正态分布,
Figure FDA00028057209700000314
其中
Figure FDA00028057209700000315
Figure FDA00028057209700000316
F(Ω-1)的每列分解为伽玛分布,写成:
Figure FDA0002805720970000041
其中
Figure FDA0002805720970000042
Figure FDA0002805720970000043
分别是ZL和ZU的第g列;
Figure FDA0002805720970000044
Figure FDA0002805720970000045
对于F(pg),写成
Figure FDA0002805720970000046
其中
Figure FDA0002805720970000047
Figure FDA0002805720970000048
对于F(Σ-1),将其标识为威希特分布;
Figure FDA0002805720970000049
其中
Figure FDA00028057209700000410
Figure FDA00028057209700000411
对于F(Ψ-1),其对角线分量表示为伽玛分布,
Figure FDA00028057209700000412
其中
Figure FDA00028057209700000413
Figure FDA00028057209700000414
F(qh)被识别为高斯分布,
Figure FDA00028057209700000415
其中
Figure FDA00028057209700000416
Figure FDA00028057209700000417
对于F(Γ-1),将其标识为威希特分布
Figure FDA00028057209700000418
其中
Figure FDA00028057209700000419
Figure FDA00028057209700000420
对于变分下界
Figure FDA00028057209700000421
写成如下
Figure FDA0002805720970000051
将两个伽玛分布
Figure FDA0002805720970000052
Figure FDA0002805720970000053
引入P和Q的行中以丢弃无用的信息,其表达式如下
Figure FDA0002805720970000054
其中Pt.和Qg.分别是的P第t行和Q的第g行;
相应地,公式(21)中的pg
Figure FDA0002805720970000055
Figure FDA0002805720970000056
的高斯分布;公式(21)中的qh
Figure FDA0002805720970000057
Figure FDA0002805720970000058
的高斯分布;
令Γ-1影响P的列,从而Γ-1影响两个投影矩阵的潜在空间;P表示为
Figure FDA0002805720970000059
其中φ-2是伽玛分布,形式为
Figure FDA00028057209700000510
pg是高斯分布,其参数为
Figure FDA00028057209700000511
Figure FDA00028057209700000512
由于
Figure FDA00028057209700000513
是伽玛分布,
Figure FDA00028057209700000514
写成
Figure FDA00028057209700000515
对于E[φ-2],写成
Figure FDA0002805720970000061
第五步:为了使用无标签和有标签样本进行建模,提出的自适应半监督变分推断偏最小二乘回归模型如下;
初始化变量;
从N(0,1)生成初始化Zi和Zj;用W(K-0.5,(K-0.5)I1×K)初始化Ω-1;用W(0.01,0.01IM×1)初始化Σ-1;用W(S-0.5,(S-0.5)I1×S)初始化Ψ-1;用W(0.01,0.01IK×1)初始化Γ-1;φ-2初始化为G(0.01,0.01);并用公式(2)初始化P和Q;
通过公式(14)计算Ω-1,通过公式(22)计算P,通过公式(16)计算Σ-1,通过公式(17)计算Ψ-1,通过公式(18)计算Q,通过公式(19)计算Γ-1,通过公式(12)计算Zi和通过公式(13)计算Zj的后验分布;
停止计算,直到
Figure FDA0002805720970000062
满足收敛条件
Figure FDA0002805720970000063
θ∈[0.001,0.05]或者达到最大的迭代次数γ∈[1000,10000];
第六步:在线预测水分含量;
近红外光谱分析仪与监控计算机连接,在干燥过程中近红外光谱分析仪实时采集干燥颗粒在不同波长下的吸光度值xnew,并传输到监控计算机中,利用步骤三到步骤五中的标定模型实现对水分含量
Figure FDA0002805720970000064
实时检测及显示结果。
CN202011368412.2A 2020-11-30 2020-11-30 基于近红外光谱在线检测干燥过程脱水量的标定建模方法 Active CN112508070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011368412.2A CN112508070B (zh) 2020-11-30 2020-11-30 基于近红外光谱在线检测干燥过程脱水量的标定建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011368412.2A CN112508070B (zh) 2020-11-30 2020-11-30 基于近红外光谱在线检测干燥过程脱水量的标定建模方法

Publications (2)

Publication Number Publication Date
CN112508070A CN112508070A (zh) 2021-03-16
CN112508070B true CN112508070B (zh) 2022-09-27

Family

ID=74967509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011368412.2A Active CN112508070B (zh) 2020-11-30 2020-11-30 基于近红外光谱在线检测干燥过程脱水量的标定建模方法

Country Status (1)

Country Link
CN (1) CN112508070B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113608431B (zh) * 2021-08-06 2024-02-02 山东大学 一种流化床制粒过程水分动态控制方法和应用
CN113670191A (zh) * 2021-08-18 2021-11-19 国家卫星气象中心(国家空间天气监测预警中心) 一种红外高光谱干涉仪关键定标参数在轨优化方法
CN114112978A (zh) * 2021-12-13 2022-03-01 大连理工大学 原位红外光谱检测结晶过程溶液浓度的小波函数标定建模方法
CN115382325A (zh) * 2022-09-07 2022-11-25 交通运输部天津水运工程科学研究所 一种基于红外含水率监测的底层洒水控制方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109668858A (zh) * 2019-02-14 2019-04-23 大连理工大学 基于近红外光谱检测发酵过程生物量和组分浓度的方法
CN110879212A (zh) * 2019-12-06 2020-03-13 大连理工大学 一种基于近红外光谱监测流化床干燥过程状态的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109668858A (zh) * 2019-02-14 2019-04-23 大连理工大学 基于近红外光谱检测发酵过程生物量和组分浓度的方法
CN110879212A (zh) * 2019-12-06 2020-03-13 大连理工大学 一种基于近红外光谱监测流化床干燥过程状态的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于联合区间偏最小二乘判别分析的猪肉近红外光谱定性建模分析;武小红等;《激光与光电子学进展》;20150410(第04期);全文 *
应用手持式近红外光谱仪检测桑椹可溶性固形物含量的偏最小二乘回归模型建立;颜辉等;《蚕业科学》;20161215(第06期);全文 *

Also Published As

Publication number Publication date
CN112508070A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN112508070B (zh) 基于近红外光谱在线检测干燥过程脱水量的标定建模方法
CN110879212B (zh) 一种基于近红外光谱监测流化床干燥过程状态的方法
El Haddad et al. Chemometrics applied to quantitative analysis of ternary mixtures by terahertz spectroscopy
US7919753B2 (en) Method for performing IR spectroscopy measurements to quantify a level of UV effect
CN107703097B (zh) 利用近红外光谱仪构建快速预测原油性质的模型的方法
He et al. Online updating of NIR model and its industrial application via adaptive wavelength selection and local regression strategy
Cotterell et al. Sensitivity and accuracy of refractive index retrievals from measured extinction and absorption cross sections for mobility-selected internally mixed light absorbing aerosols
CN112683840A (zh) 一种利用近红外光谱技术快速无损测定小麦单籽粒直链淀粉含量的方法
Wang et al. Simultaneous detection of different properties of diesel fuel by near infrared spectroscopy and chemometrics
CN114112978A (zh) 原位红外光谱检测结晶过程溶液浓度的小波函数标定建模方法
Liu et al. Wavelet based calibration model building of NIR spectroscopy for in-situ measurement of granule moisture content during fluidized bed drying
CN106529680B (zh) 一种基于经验模态分解的多尺度极限学习机集成建模方法
Yang et al. Feasibility of terahertz spectroscopy for hybrid purity verification of rice seeds
CN110887798B (zh) 基于极端随机树的非线性全光谱水体浊度定量分析方法
Mu et al. Variational PLS-based calibration model building with semi-supervised learning for moisture measurement during fluidized bed drying by NIR spectroscopy
Wang et al. SVM classification method of waxy corn seeds with different vitality levels based on hyperspectral imaging
Issa Parametric and Nonparametric Approaches of Reid Vapor Pressure Prediction for Gasoline Containing Oxygenates: A Comparative Analysis Using Partial Least Squares, Nonlinear, and LOWESS Regression Modelling Strategies with Physical Properties
JP2020139880A (ja) 分析方法、分析装置、印刷装置、および、印刷システム
Baeten et al. Olive oil analysis by infrared and Raman spectroscopy: methodologies and applications
CN110261345B (zh) 一种基于小波函数的近红外光谱软测量方法及系统
Pei et al. Wavelet Function Based Spectral Model Calibration for Measuring Crystallization Solution via ATR-FTIR Spectroscopy
JP2022527850A (ja) 分光測定装置を構成するための方法
Ruckebusch et al. On-line mid-infrared spectroscopic data and chemometrics for the monitoring of an enzymatic hydrolysis
Esteban-Díez et al. GA-ACE: Alternating conditional expectations regression with selection of significant predictors by genetic algorithms
Shakeel et al. Inverse matrix problem in regression for high-dimensional data sets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant