CN116543848B - 基于平行因子和粒子群优化算法的混合物组分定量方法 - Google Patents
基于平行因子和粒子群优化算法的混合物组分定量方法 Download PDFInfo
- Publication number
- CN116543848B CN116543848B CN202310812776.2A CN202310812776A CN116543848B CN 116543848 B CN116543848 B CN 116543848B CN 202310812776 A CN202310812776 A CN 202310812776A CN 116543848 B CN116543848 B CN 116543848B
- Authority
- CN
- China
- Prior art keywords
- sample
- individual
- mixture
- factor
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 139
- 239000002245 particle Substances 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000011002 quantification Methods 0.000 title claims abstract description 83
- 238000005457 optimization Methods 0.000 title claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 114
- 239000000126 substance Substances 0.000 claims abstract description 73
- 239000013598 vector Substances 0.000 claims abstract description 55
- 238000001228 spectrum Methods 0.000 claims abstract description 36
- 230000005284 excitation Effects 0.000 claims abstract description 33
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 238000000556 factor analysis Methods 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 14
- 230000003595 spectral effect Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 239000000470 constituent Substances 0.000 claims description 3
- 238000012804 iterative process Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000004445 quantitative analysis Methods 0.000 abstract description 4
- 230000007613 environmental effect Effects 0.000 abstract description 3
- 238000010183 spectrum analysis Methods 0.000 abstract description 2
- 239000003921 oil Substances 0.000 description 17
- 239000010687 lubricating oil Substances 0.000 description 5
- 238000002189 fluorescence spectrum Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006065 biodegradation reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 238000011173 large scale experimental method Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003305 oil spill Substances 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种基于平行因子和粒子群优化算法的混合物组分定量方法,属于智能光谱分析技术领域,包括如下步骤:步骤1、对各个样品进行激发发射矩阵光谱检测,得到一个三维光谱数据矩阵;步骤2、基于平行因子分析法,得到因子组分得分矩阵;步骤3、将因子组分得分矩阵分解,分解后做线性拟合,获得各个混合物样品的拟合参数行向量;步骤4、基于粒子群优化算法寻找每个拟合参数行向量的最优解,将所有拟合参数行向量的最优解组合得到最优拟合参数矩阵,最优拟合参数矩阵中包含各个单质样品作为单质组分在各个混合物样品中的相对定量。本发明进一步增强光谱技术在环境样品检测方面的优势,为混合物光谱组分定量分析提供一种行之有效的方法。
Description
技术领域
本发明属于智能光谱分析技术领域,具体涉及一种基于平行因子和粒子群优化算法的混合物组分定量方法。
背景技术
目前,在油源对比、生物降解评价、地球化学成因识别、石油开发和精炼、溢油法医鉴定等领域,气相色谱-火焰离子化检测器(GC-FID)和色谱-质谱(GC-MS)是最常用的样品分析工具,具有对有机化合物很好的分离、分辨和鉴别能力。然而当遇到重质组分时,气相色谱的基线常常被抬高,形成一个“不可分辨的复杂混合物”(UCM)的基线大鼓包,导致许多组分隐藏起来而无法被检测到。同时这些技术耗费时间、人工和金钱,不适合大规模实验,很难满足对样本数量的要求。
光谱技术具有操作简单、快速、经济、灵敏度高、鲁棒性高、样品损害小的优势,方便进行大范围大规模的样品检测分析,很容易满足建立谱图参量与样品检测指标关系时对样品数量的要求。制约荧光光谱在复杂混合物检测领域发挥作用的主要原因在于荧光光谱重叠严重,不易得到混合物的组分信息。然而,随着数据分析技术的不断强大以及一些有效的适用软件的开发推广,利用荧光光谱技术进行混合物组分分析的国内外相关研究无论在数量还是质量上都呈迅速增加的趋势,为解决混合物光谱组分定量分析的问题提供了方法和技术上的机遇。
平行因子分析法作为一种三线性多维数据分解的方法,在解析多维光谱检测数据方面逐渐成为近期的研究亮点。这种方法可以获取对应光谱指标点的因子组分。然而,通过大量实验发现,即使是不同的单质化学组分,也可能会在光谱中产生的相同峰值指标点;换言之,对应某一个光谱指标点的因子组分并不能够与混合物中的实际单质化学组分进行直接的对应,而可能对应多个实际特定组分。因此,如何将平行因子分解出的各个因子组分与各实际单质化学组分进行综合解析,进而解析检测混合物的单质化学组分定量,将具有更加重要的意义。
发明内容
为了解决上述问题,本发明提出了一种基于平行因子和粒子群优化算法的混合物组分定量方法,首先采用平行因子分析法得到因子组分得分矩阵,然后进行线性拟合,获得混合物样品的拟合参数矩阵,最后利用粒子群优化算法寻找最优拟合参数矩阵,从而确定混合物中各个单质组分的相对定量。
本发明的技术方案如下:
一种基于平行因子和粒子群优化算法的混合物组分定量方法,包括如下步骤:
步骤1、对各个样品进行激发发射矩阵光谱检测,每个样品得到一个二维光谱数据,将所有样品的二维光谱数据进行组合,得到一个三维光谱数据矩阵;
步骤2、基于平行因子分析法,对三维光谱数据矩阵进行平行因子三线性数据分解,得到因子组分得分矩阵;
步骤3、将因子组分得分矩阵分解为单质样品的因子组分得分矩阵和混合物样品的因子组分得分矩阵,并以单质样品的因子组分得分矩阵为基础,向各个混合物样品的因子组分得分做线性拟合,获得各个混合物样品的拟合参数行向量;
步骤4、基于粒子群优化算法寻找每个拟合参数行向量的最优解,每一个拟合参数行向量均采用粒子群优化算法求取一个最优解,一个拟合参数行向量的最优解对应一个混合物样品中所含各个单质组分的相对定量,所有拟合参数行向量求解结束后,组合得到最优拟合参数矩阵,最优拟合参数矩阵中包含各个单质样品作为单质组分在各个混合物样品中的相对定量。
进一步地,步骤1中,样品包括单质样品和混合物样品;其中,单质样品和混合物样品之间存在相关关系,混合物样品由单质样品作为单质组分混合组成;
设单质样品为个,混合物样品为/>个,则共/>个样品;首先,对各个样品进行激发发射矩阵光谱检测,设发射波长为/>个,激发波长为/>个,则每个样品都对应一个大小为/>的二维光谱数据;然后,将所有样品的二维光谱数据进行组合,最终产生一个大小为/>的三维光谱数据矩阵/>,/>;/>;;/>表示第/>个样品的第/>个发射波长和第/>个激发波长的荧光强度。
进一步地,步骤2中,平行因子分析法是根据荧光强度计算得到因子组分得分、因子组分在发射波长处的权重值、因子组分在激发波长处的权重值和残差值;
平行因子分析法进行平行因子三线性数据分解的计算公式为:
(1);
其中,表示因子组分个数,/>表示因子组分序号;/>表示第/>个样品的第/>个发射波长和第/>个激发波长的荧光强度;/>表示第/>个样品的第/>个因子组分得分,反映第/>个因子组分在第/>个样品中的比例;/>表示第/>个因子组分在第/>个发射波长处的权重值;表示第/>个因子组分在第/>个激发波长处的权重值;/>表示第/>个样品在第/>个发射波长和第/>个激发波长处的残差值;
将根据公式(1)获得的所有因子组分得分进行组合,得到所需的因子组分得分矩阵,/>;/>。
进一步地,步骤3的具体过程为:
将因子组分得分矩阵分解为单质样品的因子组分得分矩阵/>和混合物样品的因子组分得分矩阵/>;
中共有/>行,一行代表一个单质样品的/>个因子组分得分;/>展开表示为:/>;
中共有/>行,一行代表一个混合物样品的/>个因子组分得分;/>展开表示为:/>;其中,/>为第一个混合物样品的/>个因子组分得分;/>为第/>个混合物样品的/>个因子组分得分;
以为基础,向各个混合物样品的/>个因子组分得分做线性拟合;
将向第/>个混合物样品的/>个因子组分得分/>做线性拟合的公式如下:
(2);
其中,第个混合物样品的拟合参数行向量/>表示第1个单质样品/>第/>个单质样品作为单质组分在第一个混合物样品中的权重大小,权重大小即为相对定量,/>;
按照上述线性拟合方式,将依次向第一个至第/>个混合物样品的/>个因子组分得分做线性拟合;最终,得到所有混合物样品的拟合参数行向量。
进一步地,步骤4中,粒子群优化算法的计算过程为:初始化为一群随机粒子的位置和速度/>,然后通过迭代找到位置的最优解;/>,/>表示粒子随机数目,/>表示粒子空间维数,/>表示第/>维空间第/>个粒子的位置;/>表示第/>维空间第/>个粒子的速度;
在每一次迭代中,粒子通过跟踪个体极值和全局极值来更新自己的位置和速度/>;第/>个粒子的最佳适应度值对应的位置,称为个体极值,并表示为/>,/>表示第/>维空间第/>个粒子的个体极值,是粒子本身所找到的最优解;而在种群所有粒子中,最佳适应度值对应的粒子位置,称为全局极值,记为/>,表示在第/>维空间种群所有粒子的全局极值;最后一次迭代结束后得到的全局极值对应所需的粒子位置的最优解;
迭代过程中,位置和速度的更新公式如下:
(3);
(4);
其中,上标表示当前迭代次数,/>,/>为最大迭代次数;/>表示第次迭代时第/>维空间第/>个粒子的速度;/>表示惯性权重;/>表示第/>次迭代时第/>维空间第/>个粒子的速度;/>、/>均表示学习因子,/>表示[0,1]范围内的随机函数;/>表示第/>次迭代时第/>维空间第/>个粒子的个体极值;/>表示第/>次迭代时第/>维空间第/>个粒子的位置;/>表示第/>次迭代时第/>维空间种群所有粒子的全局极值;/>表示第/>次迭代时第/>维空间第/>个粒子的位置;适应度值通过适应度函数/>计算得到。
进一步地,步骤4中,对每个混合物样品的拟合参数行向量均通过粒子群优化算法求取一个最优解;具体的,第个混合物样品的拟合参数行向量的最优解的求解过程为:
将第个混合物样品的拟合参数行向量/>中的/>个参数当作粒子群优化算法中的/>维粒子空间的位置/>,,粒子空间维数/>,/>个参数同步对应/>个单质样品,并通过设置公式(6)所示的适应度函数/>评价个体极值和全局极值,进而根据公式(3)和公式(4)所示粒子自身的速度和位置公式迭代更新粒子,迭代结束后,最终找到最后一次迭代后的全局极值/>,最后一次迭代后的全局极值即对应第/>个混合物样品的拟合参数行向量的最优解,表示为:;其中,/>对应/>,反映第1个单质样品作为单质组分在第/>个混合物样品中的相对定量;/>对应/>,反映第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量;拟合参数行向量表示第1个/>第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量;
按照上述计算过程求解第1个第/>个混合物样品的拟合参数行向量的最优解,将各个拟合参数行向量按顺序排列,得到所需的最优拟合参数矩阵/>,最优拟合参数矩阵能直接获取得到第1个/>第/>个单质样品作为单质组分在第1个/>第/>个混合物样品中的相对定量;
(5);
其中,反映第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量;
适应度函数公式为:
(6);
其中,表示/>中第/>个混合物样品的第/>个因子组分的得分;/>表示第/>个混合物样品的拟合参数行向量/>中对应的第/>个参数,反映第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量;/>表示单质样品的因子组分得分矩阵/>中第/>个单质样品的第/>个因子组分的得分。
本发明所带来的有益技术效果如下。
本发明充分利用平行因子分析法的强大分解功能,对单质样品和各种混合物样品的三维光谱数据矩阵进行三线性数据解析,获取因子组分得分矩阵;同时又不止步于此,在此基础上进一步做线性拟合,构建混合物样品的拟合参数矩阵,并利用粒子群优化算法寻找最优拟合参数矩阵,从而确定混合物中各个单质组分的相对定量。本发明技术将进一步增强光谱技术在环境样品检测方面的优势,为混合物光谱组分定量分析提供一种行之有效的方法。
附图说明
图1为本发明基于平行因子和粒子群优化算法的混合物组分定量方法的流程图。
图2为本发明实施例中3个润滑油单质油样及17个混合油样激发发射矩阵光谱数据的平行因子分解因子组分得分图。
图3为本发明实施例中单质油样作为单质组分在混合油样中的相对定量结果图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
如图1所示,一种基于平行因子和粒子群优化算法的混合物组分定量方法,包括如下步骤:
步骤1、对各个样品进行激发发射矩阵光谱检测,每个样品得到一个二维光谱数据,将所有样品的二维光谱数据进行组合,得到一个三维光谱数据矩阵。
样品包括单质样品和混合物样品;其中,单质样品和混合物样品之间存在相关关系,混合物样品由单质样品作为单质组分混合组成;
设单质样品为个,混合物样品为/>个,则共/>个样品;首先,对各个样品进行激发发射矩阵光谱检测,设发射波长为/>个,激发波长为/>个,则每个样品都对应一个大小为/>的二维光谱数据;然后,将所有样品的二维光谱数据进行组合,最终产生一个大小为/>的三维光谱数据矩阵/>,/>;/>;;/>表示第/>个样品的第/>个发射波长和第/>个激发波长的荧光强度。
步骤2、基于平行因子分析法,对三维光谱数据矩阵进行平行因子三线性数据分解,得到因子组分得分矩阵。具体过程如下:
平行因子分析法是根据荧光强度计算得到因子组分得分、因子组分在发射波长处的权重值、因子组分在激发波长处的权重值和残差值;
平行因子分析法进行平行因子三线性数据分解的计算公式为:
(1);
其中,表示因子组分个数,/>表示因子组分序号;/>表示第/>个样品的第/>个发射波长和第/>个激发波长的荧光强度;/>表示第/>个样品的第/>个因子组分得分,反映第/>个因子组分在第/>个样品中的比例;/>表示第/>个因子组分在第/>个发射波长处的权重值;表示第/>个因子组分在第/>个激发波长处的权重值;/>表示第/>个样品在第/>个发射波长和第/>个激发波长处的残差值;
将根据公式(1)获得的所有因子组分得分进行组合,得到所需的因子组分得分矩阵,/>;/>。
通过,可以看出各个因子组分在所有样品中的所占的主导比例,在本方法中,因子组分得分矩阵/>是后续处理的关键。
步骤3、步骤3、将因子组分得分矩阵分解为单质样品的因子组分得分矩阵和混合物样品的因子组分得分矩阵,并以单质样品的因子组分得分矩阵为基础,向各个混合物样品的因子组分得分做线性拟合,获得各个混合物样品的拟合参数行向量。具体过程如下:
将因子组分得分矩阵分解为单质样品的因子组分得分矩阵/>和混合物样品的因子组分得分矩阵/>;
中共有/>行,一行代表一个单质样品的因子组分得分;/>展开表示为:;
中共有/>行,一行代表一个混合物样品的因子组分得分;/>展开表示为:;其中,/>为第一个混合物样品的/>个因子组分得分;/>为第/>个混合物样品的/>个因子组分得分;
以为基础,向各个混合物样品的/>个因子组分得分做线性拟合;
将向第/>个混合物样品的/>个因子组分得分/>做线性拟合的公式如下:
(2);
其中,第个混合物样品的拟合参数行向量/>表示第1个单质样品/>第/>个单质样品作为单质组分在第一个混合物样品中的权重大小,权重大小即为相对定量,/>;
然后,将依次向第一个至第/>个混合物样品的/>个因子组分得分做线性拟合;最终,得到所有混合物样品的拟合参数行向量。
步骤4、基于粒子群优化算法寻找每个拟合参数行向量的最优解,每一个拟合参数行向量均采用粒子群优化算法求取一个最优解,一个拟合参数行向量的最优解对应一个混合物样品中所含各个单质组分的相对定量,所有拟合参数行向量求解结束后,组合得到最优拟合参数矩阵,最优拟合参数矩阵中包含各个单质组分在各个混合物样品中的相对定量。
如何求出最优拟合参数矩阵也是本发明方法着重解决的问题。粒子群优化算法通过追随当前搜索到的最优解来寻找全局最优。这种算法以其容易实现、精度高、收敛快等优点引起重视,并在解决实际问题中展示了其优越性。粒子群优化算法初始化为一群随机粒子的位置(/>,/>表示粒子随机数目,/>表示粒子空间维数,/>表示第/>维空间第/>个粒子的位置)。然后通过迭代找到位置的最优解。在每一次迭代中,粒子通过跟踪两个极值:个体极值和全局极值来更新自己。第/>个粒子的最佳先前位置(得到最佳适应度值的位置),称为个体极值,并表示为,/>表示第/>维空间第/>个粒子的个体极值,是粒子本身所找到的最优解;而在种群所有粒子(共/>个粒子)中,得到最佳适应度值的粒子的位置,被称为全局极值,记为/>,/>表示在第/>维空间种群所有粒子的全局极值。这两个极值通过适应度函数/>的评价对比得到。粒子通过下面的公式来更新自身的速度/>和位置,
(3);
(4);
其中,上标表示当前迭代次数,/>,/>为最大迭代次数;/>表示第次迭代时第/>维空间第/>个粒子的速度;/>表示惯性权重;/>表示第/>次迭代时第/>维空间第/>个粒子的速度;/>、/>均表示学习因子,/>表示[0,1]范围内的随机函数;/>表示第/>次迭代时第/>维空间第/>个粒子的个体极值;/>表示第/>次迭代时第/>维空间第/>个粒子的位置;/>表示第/>次迭代时第/>维空间种群所有粒子的全局极值;/>表示第/>次迭代时第/>维空间第/>个粒子的位置。
粒子群优化算法的算法流程为:
(1)初始化一群粒子(粒子空间维数为,群体规模即粒子随机数目为/>),包括随机位置和速度;
(2)评价当前粒子的适应度;
(3)对每个粒子,将其适应度值与其自身经过的最好位置作比较,如果较好,则将其作为当前的最好位置,也即个体极值;
(4)对整体种群,将其适应度值与其经过的最好位置作比较,如果较好,则将其作为当前的最好位置,也即全局极值;
(5)根据公式(3)和公式(4)更新粒子的速度和位置;
(6)迭代未结束则转到第(2)步;
(7)达到最大迭代次数,迭代结束,输出全局极值。
在本方法中,对每个混合物样品的拟合参数行向量均通过粒子群优化算法求取一个最优解。以计算第个混合物样品的拟合参数行向量/>的最优解为例,/>,具体求解过程为:
将第个混合物样品的拟合参数行向量/>中的/>个参数当作粒子群优化算法中的/>维粒子空间的位置/>(即粒子空间维数/>,/>个参数同步对应/>个单质样品),并通过设置公式(6)所示的适应度函数/>评价个体极值和全局极值,进而根据公式(3)和公式(4)所示粒子自身的速度和位置公式迭代更新粒子,迭代结束后,最终找到最后一次迭代后的全局极值,最后一次迭代后的全局极值即对应第个混合物样品的拟合参数行向量的最优解,可表示为:。其中,/>对应/>,反映第1个单质样品作为单质组分在第/>个混合物样品中的相对定量;/>对应/>,反映第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量。该拟合参数行向量表示到第1个/>第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量。
按照上述计算过程求解第1个第/>个混合物样品的拟合参数行向量的最优解,将各个拟合参数行向量按顺序排列,得到所需的最优拟合参数矩阵/>,通过最优拟合参数矩阵可以得到第1个/>第/>个单质样品作为单质组分在第1个/>第/>个混合物样品中的相对定量,
(5);
其中,反映第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量。
本发明方法中,适应度函数公式设置为:
(6);
其中,表示/>中第/>行(对应第/>个混合物样品,/>)的第/>个因子组分的得分;/>表示第/>个混合物样品的拟合参数行向量/>中对应第/>个参数,反映第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量;表示单质样品的因子组分得分矩阵/>中第/>个单质样品的第/>个因子组分的得分。
此适应度函数表示拟合目标与拟合参数矩阵计算结果之间的差异度,可知此差异度越小越好,因此两个极值的获得是通过评价适应度函数值是否更小来判断的。
为了证明本发明的可行性与有效性,给出如下实施例。本发明实施例主要针对3个单质样品(即)及其相关17个混合物样品(即/>)展开。这3个单质样品为3个润滑油油样,分别为:GTX(序号1)、博世(序号2)、东风(序号3)。对这3个润滑油油样作为单质组分按照不同比例混合组成相关17个混合物油样。混合物油样名称及其单质组分混合比例见下。
对这3个单质润滑油油样进行两两混合,混合物油样名称及其混合的比例具体为:GTX∶博世=1:1(序号4);GTX∶博世=1:2(序号5);GTX∶博世=2:1(序号6);GTX:东风=1:1(序号7);GTX:东风=1:2(序号8);GTX:东风=2:1(序号9);博世∶东风=1:1(序号10);博世∶东风=1:2(序号11);博世∶东风=2:1(序号12);
直接对这3个润滑油油样进行全混合,混合物油样名称及其混合的比例具体为:GTX∶博世∶东风=1:1:1(序号13);GTX∶博世∶东风=1:1:2(序号14);GTX∶博世∶东风=1:1:3(序号15);GTX∶博世∶东风=1:3:2(序号16);GTX∶博世∶东风=2:1:1(序号17);GTX∶博世∶东风=2:2:1(序号18);GTX∶博世∶东风=3:2:1(序号19);GTX∶博世∶东风=3:2:2(序号20)。
采用荧光光谱分析仪进行光谱检测,激发波长范围为300nm~525nm,采样间隔为5nm;发射波长/>范围为339nm~750nm,采样间隔为0.516nm。检测过程为:首先,对GTX、博世、东风3个单质油样分别进行激发发射矩阵光谱检测,得到它们各自的荧光光谱图(激发发射矩阵光谱数据在实施例中是以光谱图的方式呈现)。然后,将GTX、博世、东风3个单质油样进行两两混合,得到两两混合后的系列三维荧光光谱图。最后,将GTX、博世、东风3个单质油样以不同比例进行全混合,得到3个油样共同混合后的系列三维荧光光谱图。
该实施例的具体步骤如下:
步骤1、对3个单质润滑油油样()及17个不同比例的混合物油样(/>)进行激发发射矩阵光谱检测,得到20组(/>)激发发射矩阵光谱,光谱数据大小为872(发射波长/>)/>46(激发波长,/>)。然后,将20组激发发射矩阵光谱检测数据组成一个三维数据矩阵/>。
步骤2、对三维数据矩阵进行平行因子三线性数据分解。其中因子组分个数/>通过残差值比较获得,当因子组分个数为3时,公式(1)中残差值/>之总和最小,因此确定因子组分个数/>。由平行因子分析法计算得到因子组分得分矩阵/>(),矩阵中因子组分1、因子组分2、因子组分3在不同样品中的(见样品序号1~20)对应得分具体如图2所示。
步骤3、将因子组分得分矩阵分解为单质样品的因子组分得分矩阵和混合物样品的因子组分得分矩阵,并针对每一个混合物样品做线性拟合,得到17个混合物样品的拟合参数行向量;拟合的公式如下:
;
是/>中的第/>行(/>),对应第/>个混合物样品的3个因子组分(/>)的得分。/>表示第/>个混合物样品的拟合参数行向量,反映第/>个混合物样品中3个单质组分(/>)的相对定量。
步骤4、利用粒子群优化算法,将第个混合物样品的拟合参数行向量的3个参数作为粒子群优化算法中的3维粒子空间的位置(),并通过设置适应度函数/>()迭代更新粒子,最终找到拟合参数行向量/>的最优解。其中粒子群优化算法各参数设置见下:
粒子随机数目设置为,学习因子/>,惯性权重/>,最大迭代次数设置为2000,粒子空间维数/>,位置和速度随机状态为0-1均匀分布随机数。
按步骤4计算每个混合物样品的拟合参数行向量的最优解,共得到17个拟合参数行向量的最优解;最终将所有拟合参数行向量的最优解组合得到17个混合物样品的最优拟合参数矩阵:
;
即表示了17个混合物样品()中的3个单质样品作为单质组分(/>)的相对定量。具体数据见附图3,具体为:
当GTX∶博世=1:1时,GTX的相对定量为0.491804,对应最优拟合参数矩阵中的;博世的相对定量为0.487752,对应最优拟合参数矩阵中的/>;东风相对定量为1.44/>,对应最优拟合参数矩阵中的/>;
当GTX∶博世=1:2时,GTX的相对定量为0.269249,对应最优拟合参数矩阵中的;博世的相对定量为0.724348,对应最优拟合参数矩阵中的/>;东风相对定量为3.46/>,对应最优拟合参数矩阵中的/>;
当GTX∶博世=2:1时,GTX的相对定量为0.727266,对应最优拟合参数矩阵中的;博世的相对定量为0.272495,对应最优拟合参数矩阵中的/>;东风相对定量为9.20/>,对应最优拟合参数矩阵中的/>;
当GTX∶东风=1:1时,GTX的相对定量为0.526934,对应最优拟合参数矩阵中的;博世的相对定量为5.25/>,对应最优拟合参数矩阵中的/>;东风相对定量为0.55832,对应最优拟合参数矩阵中的/>;
当GTX∶东风=1:2时,GTX的相对定量为0.344294,对应最优拟合参数矩阵中的;博世的相对定量为1.30/>,对应最优拟合参数矩阵中的/>;东风相对定量为0.833487,对应最优拟合参数矩阵中的/>;
当GTX∶东风=2:1时,GTX的相对定量为0.720573,对应最优拟合参数矩阵中的;博世的相对定量为4.79/>,,对应最优拟合参数矩阵中的/>;东风相对定量为0.361645,对应最优拟合参数矩阵中的/>;
当博世∶东风=1:1时,GTX的相对定量为0.007099,对应最优拟合参数矩阵中的;博世的相对定量为0.6224,对应最优拟合参数矩阵中/>;东风相对定量为0.723493,对应最优拟合参数矩阵中的/>;
当博世∶东风=1:2时,GTX的相对定量为5.03,,对应最优拟合参数矩阵中的;博世的相对定量为0.393065,对应最优拟合参数矩阵中的/>;东风相对定量为0.919328,对应最优拟合参数矩阵中的/>;
当博世∶东风=2:1时,GTX的相对定量为0.008548,对应最优拟合参数矩阵中的;博世的相对定量为0.755315,对应最优拟合参数矩阵中的/>;东风相对定量为0.456867,对应最优拟合参数矩阵中的/>;
当GTX∶博世∶东风=1:1:1时,GTX的相对定量为0.490841,对应最优拟合参数矩阵中的;博世的相对定量为0.334344,对应最优拟合参数矩阵中的/>;东风相对定量为0.438129,对应最优拟合参数矩阵中的/>;
当GTX∶博世∶东风=1:1:2时,GTX的相对定量为0.330963,对应最优拟合参数矩阵中的;博世的相对定量为0.321927,对应最优拟合参数矩阵中的/>;东风相对定量为0.651947,对应最优拟合参数矩阵中的/>;
当GTX∶博世∶东风=1:1:3时,GTX的相对定量为0.271242,对应最优拟合参数矩阵中的;博世的相对定量为0.290898,对应最优拟合参数矩阵中的/>;东风相对定量为0.765853,对应最优拟合参数矩阵中的/>;
当GTX∶博世∶东风=1:3:2时,GTX的相对定量为0.127993,对应最优拟合参数矩阵中的;博世的相对定量为0.540759,对应最优拟合参数矩阵中的/>;东风相对定量为0.377662,对应最优拟合参数矩阵中的/>;
当GTX∶博世∶东风=2:1:1时,GTX的相对定量为0.766446,对应最优拟合参数矩阵中的;博世的相对定量为0.369483,对应最优拟合参数矩阵中的/>;东风相对定量为0.37099,对应最优拟合参数矩阵中的/>;
当GTX∶博世∶东风=2:2:1时,GTX的相对定量为0.641014,对应最优拟合参数矩阵中的;博世的相对定量为0.518847,对应最优拟合参数矩阵中的/>;东风相对定量为0.320702,对应最优拟合参数矩阵中的/>;
当GTX∶博世∶东风=3:2:1时,GTX的相对定量为0.690067,对应最优拟合参数矩阵中的;博世的相对定量为0.209438,对应最优拟合参数矩阵中的/>;东风相对定量为0.1408,对应最优拟合参数矩阵中的/>;
当GTX∶博世∶东风=3:2:2时,GTX的相对定量为0.660101,对应最优拟合参数矩阵中的;博世的相对定量为0.329923,对应最优拟合参数矩阵中的/>;东风相对定量为0.43359,对应最优拟合参数矩阵中的/>。
通过上述拟合参数矩阵的数据和图3的柱状图展示,可以看出,对不同比例的混合油样,对应各单质组分的拟合参数也各不相同,并且拟合参数之间的相对大小基本能够反映出各单质样品作为单质组分在混合样品中的相对定量。比如对于混合油样“GTX∶博世=1:1”,其拟合参数对应GTX、博世、东风三种单质组分的大小分别为0.491804、0.487752、1.44/>,反映到柱状图中能很明显看到,代表GTX和博世的高度是几乎一样的,而代表东风的几乎为0,这恰恰与实际情况“GTX∶博世=1:1”是一致的;再比如对于混合油样“GTX∶博世∶东风=3:2:2”,其拟合参数对应GTX、博世、东风三种单质组分的大小分别为0.660101、0.329923、0.43359,从数值和柱状图的显示可以看出,其相对大小也大致符合实际单质组分的混合比例。
由此可以证明,本发明提出的方法,可以用于解析混合物光谱的组分的相对定量,可进一步增强光谱技术在环境样品检测方面的优势,为混合物组分定量分析提供一种行之有效的方法。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (1)
1.一种基于平行因子和粒子群优化算法的混合物组分定量方法,其特征在于,包括如下步骤:
步骤1、对各个样品进行激发发射矩阵光谱检测,每个样品得到一个二维光谱数据,将所有样品的二维光谱数据进行组合,得到一个三维光谱数据矩阵;
所述步骤1中,样品包括单质样品和混合物样品;其中,单质样品和混合物样品之间存在相关关系,混合物样品由单质样品作为单质组分混合组成;
设单质样品为个,混合物样品为/>个,则共/>个样品;首先,对各个样品进行激发发射矩阵光谱检测,设发射波长为/>个,激发波长为/>个,则每个样品都对应一个大小为/>的二维光谱数据;然后,将所有样品的二维光谱数据进行组合,最终产生一个大小为/>的三维光谱数据矩阵/>,/>;;/>;/>表示第/>个样品的第/>个发射波长和第/>个激发波长的荧光强度;
步骤2、基于平行因子分析法,对三维光谱数据矩阵进行平行因子三线性数据分解,得到因子组分得分矩阵;
所述步骤2中,平行因子分析法是根据荧光强度计算得到因子组分得分、因子组分在发射波长处的权重值、因子组分在激发波长处的权重值和残差值;
平行因子分析法进行平行因子三线性数据分解的计算公式为:
(1);
其中,表示因子组分个数,/>表示因子组分序号;/>表示第/>个样品的第/>个发射波长和第/>个激发波长的荧光强度;/>表示第/>个样品的第/>个因子组分得分,反映第/>个因子组分在第/>个样品中的比例;/>表示第/>个因子组分在第/>个发射波长处的权重值;表示第/>个因子组分在第/>个激发波长处的权重值;/>表示第/>个样品在第/>个发射波长和第/>个激发波长处的残差值;
将根据公式(1)获得的所有因子组分得分进行组合,得到所需的因子组分得分矩阵,/>;/>;
步骤3、将因子组分得分矩阵分解为单质样品的因子组分得分矩阵和混合物样品的因子组分得分矩阵,并以单质样品的因子组分得分矩阵为基础,向各个混合物样品的因子组分得分做线性拟合,获得各个混合物样品的拟合参数行向量;
所述步骤3的具体过程为:
将因子组分得分矩阵分解为单质样品的因子组分得分矩阵/>和混合物样品的因子组分得分矩阵/>;
中共有/>行,一行代表一个单质样品的/>个因子组分得分;/>展开表示为:/>;
中共有/>行,一行代表一个混合物样品的/>个因子组分得分;/>展开表示为:/>;其中,/>为第一个混合物样品的/>个因子组分得分;/>为第/>个混合物样品的/>个因子组分得分;
以为基础,向各个混合物样品的/>个因子组分得分做线性拟合;
将向第/>个混合物样品的/>个因子组分得分/>做线性拟合的公式如下:
(2);
其中,第个混合物样品的拟合参数行向量/>表示第1个单质样品/>第/>个单质样品作为单质组分在第一个混合物样品中的权重大小,权重大小即为相对定量,/>;
按照上述线性拟合方式,将依次向第一个至第/>个混合物样品的/>个因子组分得分做线性拟合;最终,得到所有混合物样品的拟合参数行向量;
步骤4、基于粒子群优化算法寻找每个拟合参数行向量的最优解,每一个拟合参数行向量均采用粒子群优化算法求取一个最优解,一个拟合参数行向量的最优解对应一个混合物样品中所含各个单质组分的相对定量,所有拟合参数行向量求解结束后,组合得到最优拟合参数矩阵,最优拟合参数矩阵中包含各个单质样品作为单质组分在各个混合物样品中的相对定量;
所述步骤4中,粒子群优化算法的计算过程为:初始化为一群随机粒子的位置和速度/>,然后通过迭代找到位置的最优解;/>,/>表示粒子随机数目,/>表示粒子空间维数,表示第/>维空间第/>个粒子的位置;/>表示第/>维空间第/>个粒子的速度;
在每一次迭代中,粒子通过跟踪个体极值和全局极值来更新自己的位置和速度/>;第/>个粒子的最佳适应度值对应的位置,称为个体极值,并表示为,/>表示第/>维空间第/>个粒子的个体极值,是粒子本身所找到的最优解;而在种群所有粒子中,最佳适应度值对应的粒子位置,称为全局极值,记为/>,/>表示在第/>维空间种群所有粒子的全局极值;最后一次迭代结束后得到的全局极值对应所需的粒子位置的最优解;
迭代过程中,位置和速度的更新公式如下:
(3);
(4);
其中,上标表示当前迭代次数,/>,/>为最大迭代次数;/>表示第次迭代时第/>维空间第/>个粒子的速度;/>表示惯性权重;/>表示第/>次迭代时第/>维空间第/>个粒子的速度;/>、/>均表示学习因子,/>表示[0,1]范围内的随机函数;/>表示第/>次迭代时第/>维空间第/>个粒子的个体极值;/>表示第/>次迭代时第/>维空间第/>个粒子的位置;/>表示第/>次迭代时第/>维空间种群所有粒子的全局极值;/>表示第次迭代时第/>维空间第/>个粒子的位置;适应度值通过适应度函数/>计算得到;
所述步骤4中,对每个混合物样品的拟合参数行向量均通过粒子群优化算法求取一个最优解;具体的,第个混合物样品的拟合参数行向量/>的最优解的求解过程为:
将第个混合物样品的拟合参数行向量/>中的/>个参数当作粒子群优化算法中的/>维粒子空间的位置/>,/>,粒子空间维数/>,/>个参数同步对应/>个单质样品,并通过设置公式(6)所示的适应度函数/>评价个体极值和全局极值,进而根据公式(3)和公式(4)所示粒子自身的速度和位置公式迭代更新粒子,迭代结束后,最终找到最后一次迭代后的全局极值/>,最后一次迭代后的全局极值即对应第/>个混合物样品的拟合参数行向量的最优解,表示为:;其中,/>对应,反映第1个单质样品作为单质组分在第/>个混合物样品中的相对定量;/>对应,反映第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量;拟合参数行向量/>表示第1个/>第/>个单质样品作为单质组分在第个混合物样品中的相对定量;
按照上述计算过程求解第1个第/>个混合物样品的拟合参数行向量的最优解,将各个拟合参数行向量按顺序排列,得到所需的最优拟合参数矩阵/>,最优拟合参数矩阵能直接获取得到第1个/>第/>个单质样品作为单质组分在第1个/>第/>个混合物样品中的相对定量;
(5);
其中,反映第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量;
适应度函数公式为:
(6);
其中,表示/>中第/>个混合物样品的第/>个因子组分的得分;/>表示第/>个混合物样品的拟合参数行向量/>中对应的第/>个参数,反映第/>个单质样品作为单质组分在第/>个混合物样品中的相对定量;/>表示单质样品的因子组分得分矩阵/>中第/>个单质样品的第/>个因子组分的得分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310812776.2A CN116543848B (zh) | 2023-07-05 | 2023-07-05 | 基于平行因子和粒子群优化算法的混合物组分定量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310812776.2A CN116543848B (zh) | 2023-07-05 | 2023-07-05 | 基于平行因子和粒子群优化算法的混合物组分定量方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116543848A CN116543848A (zh) | 2023-08-04 |
CN116543848B true CN116543848B (zh) | 2023-09-29 |
Family
ID=87454451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310812776.2A Active CN116543848B (zh) | 2023-07-05 | 2023-07-05 | 基于平行因子和粒子群优化算法的混合物组分定量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116543848B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104062273A (zh) * | 2014-04-29 | 2014-09-24 | 江西农业大学 | 基于粒子群优化算法的同步荧光光谱特征波长筛选方法 |
WO2018072351A1 (zh) * | 2016-10-20 | 2018-04-26 | 北京工业大学 | 一种基于粒子群优化算法对支持向量机的优化方法 |
CN110880369A (zh) * | 2019-10-08 | 2020-03-13 | 中国石油大学(华东) | 基于径向基函数神经网络的气体标志物检测方法及应用 |
CN115035957A (zh) * | 2022-05-31 | 2022-09-09 | 陕西师范大学 | 基于粒子群算法的改进最小残差法分析混合str图谱 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111989747A (zh) * | 2018-04-05 | 2020-11-24 | 伊耐斯克泰克-计算机科学与技术系统工程研究所 | 用于预测样品中的成分的定量的分光光度法和装置 |
-
2023
- 2023-07-05 CN CN202310812776.2A patent/CN116543848B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104062273A (zh) * | 2014-04-29 | 2014-09-24 | 江西农业大学 | 基于粒子群优化算法的同步荧光光谱特征波长筛选方法 |
WO2018072351A1 (zh) * | 2016-10-20 | 2018-04-26 | 北京工业大学 | 一种基于粒子群优化算法对支持向量机的优化方法 |
CN110880369A (zh) * | 2019-10-08 | 2020-03-13 | 中国石油大学(华东) | 基于径向基函数神经网络的气体标志物检测方法及应用 |
CN115035957A (zh) * | 2022-05-31 | 2022-09-09 | 陕西师范大学 | 基于粒子群算法的改进最小残差法分析混合str图谱 |
Also Published As
Publication number | Publication date |
---|---|
CN116543848A (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Frahm et al. | The technological versus methodological revolution of portable XRF in archaeology | |
Moncayo et al. | Exploration of megapixel hyperspectral LIBS images using principal component analysis | |
Kim et al. | Analysis of environmental organic matters by Ultrahigh‐Resolution mass spectrometry—A review on the development of analytical methods | |
US20090001262A1 (en) | System and Method for Spectral Analysis | |
McLaughlin et al. | Universal detection of body fluid traces in situ with Raman hyperspectroscopy for forensic purposes: Evaluation of a new detection algorithm (HAMAND) using semen samples | |
CN112712108A (zh) | 一种拉曼光谱多元数据分析方法 | |
Steen et al. | Analytical and computational advances, opportunities, and challenges in marine organic biogeochemistry in an era of “omics” | |
Bell et al. | “-Omics” workflow for paleolimnological and geological archives: A review | |
Mutter et al. | Calculation of Raman optical activity spectra for vibrational analysis | |
Hou et al. | Hyperspectral Mineral Target Detection Based on Density Peak. | |
CN105973861B (zh) | 基于油品荧光特性Fisher判别法判别海上溢油种类的方法 | |
Xia et al. | Study on fluorescence interaction between humic acid and PAHs based on two-dimensional correlation spectroscopy | |
Goranov et al. | TEnvR: MATLAB-based toolbox for environmental research | |
Goncalves et al. | Suitability of high-resolution mass spectrometry in analytical toxicology: Focus on drugs of abuse | |
CN116543848B (zh) | 基于平行因子和粒子群优化算法的混合物组分定量方法 | |
Hein et al. | Software tool for mining liquid chromatography/multi‐stage mass spectrometry data for comprehensive glycerophospholipid profiling | |
WO2024066642A1 (zh) | 一种获取生态影响机制的方法及系统 | |
Aramendia et al. | A new semi-quantitative Surface-Enhanced Raman Spectroscopy (SERS) method for detection of maleimide (2, 5-pyrroledione) with potential application to astrobiology | |
US20130043869A1 (en) | Deconvolution of chemical mixtures with high complexity by nmr consensus trace clustering | |
CN108287200A (zh) | 质谱参照数据库的建立方法及基于其的物质分析方法 | |
Alexander | Spectral deconvolution and quantification of natural organic material and fluorescent tracer dyes | |
CN108169204B (zh) | 一种基于数据库的拉曼光谱预处理方法 | |
Naeher et al. | A new method for the rapid analysis of 1H-Pyrrole-2, 5-diones (maleimides) in environmental samples by two-dimensional gas chromatography time-of-flight mass spectrometry | |
Baldaino et al. | Characterization and differentiation of aluminum powders used in improvised explosive devices–Part 1: Proof of concept of the utility of particle micromorphometry | |
Lam et al. | Using spectral libraries for peptide identification from tandem mass spectrometry (MS/MS) data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |