CN108362662B - 近红外光谱相似度计算方法、装置和物质定性分析系统 - Google Patents
近红外光谱相似度计算方法、装置和物质定性分析系统 Download PDFInfo
- Publication number
- CN108362662B CN108362662B CN201810146019.5A CN201810146019A CN108362662B CN 108362662 B CN108362662 B CN 108362662B CN 201810146019 A CN201810146019 A CN 201810146019A CN 108362662 B CN108362662 B CN 108362662B
- Authority
- CN
- China
- Prior art keywords
- near infrared
- sample
- infrared spectrum
- similarity
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 104
- 239000000126 substance Substances 0.000 title claims abstract description 21
- 238000004364 calculation method Methods 0.000 title claims abstract description 20
- 238000004451 qualitative analysis Methods 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 65
- 239000013598 vector Substances 0.000 claims abstract description 21
- 230000035945 sensitivity Effects 0.000 claims abstract description 20
- 239000000523 sample Substances 0.000 claims description 128
- 230000003595 spectral effect Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 230000017105 transposition Effects 0.000 claims description 6
- 239000013074 reference sample Substances 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 239000000203 mixture Substances 0.000 abstract description 5
- 238000001228 spectrum Methods 0.000 description 61
- 229920002472 Starch Polymers 0.000 description 43
- 239000008107 starch Substances 0.000 description 43
- 235000019698 starch Nutrition 0.000 description 41
- 239000000463 material Substances 0.000 description 36
- 238000004458 analytical method Methods 0.000 description 10
- 239000001866 hydroxypropyl methyl cellulose Substances 0.000 description 10
- 235000010979 hydroxypropyl methyl cellulose Nutrition 0.000 description 10
- 229920003088 hydroxypropyl methyl cellulose Polymers 0.000 description 10
- UFVKGYZPFZQRLF-UHFFFAOYSA-N hydroxypropyl methyl cellulose Chemical compound OC1C(O)C(OC)OC(CO)C1OC1C(O)C(O)C(OC2C(C(O)C(OC3C(C(O)C(O)C(CO)O3)O)C(CO)O2)O)C(CO)O1 UFVKGYZPFZQRLF-UHFFFAOYSA-N 0.000 description 10
- 229920002153 Hydroxypropyl cellulose Polymers 0.000 description 8
- 239000001863 hydroxypropyl cellulose Substances 0.000 description 8
- 235000010977 hydroxypropyl cellulose Nutrition 0.000 description 8
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 7
- 238000002835 absorbance Methods 0.000 description 7
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 7
- 238000010521 absorption reaction Methods 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000002994 raw material Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 229920002261 Corn starch Polymers 0.000 description 2
- 229910000530 Gallium indium arsenide Inorganic materials 0.000 description 2
- KXNLCSXBJCPWGL-UHFFFAOYSA-N [Ga].[As].[In] Chemical compound [Ga].[As].[In] KXNLCSXBJCPWGL-UHFFFAOYSA-N 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000008120 corn starch Substances 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000011194 good manufacturing practice Methods 0.000 description 2
- 239000001341 hydroxy propyl starch Substances 0.000 description 2
- 235000013828 hydroxypropyl starch Nutrition 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000004497 NIR spectroscopy Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000012569 chemometric method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- -1 infrared spectrum Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N2021/3595—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种近红外光谱相似度计算方法、装置和物质定性分析系统,所述方法包括:建立标准样品近红外光谱;获取待测样品近红外光谱;计算所述标准样品近红外光谱和所述待测样品近红外光谱之间的向量的差异和夹角余弦;基于所述差异和夹角余弦计算相似度:S=Du(cosθ)v,其中,D表示向量差异,cosθ表示夹角余弦;u和v为可调节的灵敏度因子,取值范围均为0≤u(或v)≤+∞。本发明的计算方法能够从样品的化学组成及含量差异两个方面反映样品的相似程度,能够更准确地鉴别物质,并且适用于不同类型复杂样品体系的需要。
Description
技术领域
本发明属于近红外光谱定性分析领域,尤其涉及一种基于样品近红外光谱的相似度评价计算方法、装置和定性分析系统。
背景技术
近红外光谱区域按ASTM定义是指波长在780-2526nm范围内的电磁波,可反映有机物C-H,O-H,N-H等基团的倍频与组合频吸收,近红外光谱分析技术具备多项优势:(1)分析速度快、产出多,光谱采集时间约1-2s,可根据既有模型快速得到样品性质和组成;(2)不破坏样品、不用试剂、不污染环境。近红外光谱的获取可以是透射、漫反射、漫透射,样品可以是气体、液体、固体任何一种形态,不必做任何形态改变,样品分析后不产生任何污染。基于这些优点,近红外光谱分析技术在近年来在各行业领域得到迅速发展,如制药行业、饲料行业、石化行业等。
近红外光谱分析技术在制药领域的应用主要在原辅料鉴别、制药过程在线分析,应用类别主要为定性判别与定量分析,近红外光谱定性分析主要用于物质的定性判别,通过比较未知样品与已知参考样品的光谱来确定未知样品的种类归属,其中在原辅料分析环节,《药品生产质量管理规范》(2015年修订版)(Good Manufacturing Practice,GMP)第一百二十条规定“应用适当的操作规程或措施,确保每一包装内的原辅料正确无误”,由于传统方法的气相法、液相法等费时费力,近红外光谱分析技术的快速、无损特点在制药行业原辅料鉴别环节得到快速发展与应用。但由于近红外光谱的谱带较宽,特征性不强,因此很少像如红外光谱对化合物的特定官能团识别进行分析,需要借助化学计量学方法对光谱进行分析与类别划分,进而实现定性分析。常用近红外定性分析方法包括有监督模式分析与无监督模式分析,无监督方法不需要依据已知类别关系的指导,仅根据样本光谱图的差异进行分类,然后再对每一类样本进行解释;有监督方法需要预先知道特定的类中应包含的对象,通过选择训练集样本建立分类模型,再根据未知样本在已知样本集中的位置对未知样品进行归属。而针对制药行业定性鉴别的应用环节,有监督的分类方法是常用的方法,通过比较待测样品光谱与参比光谱的差异,对待测样品进行定性分析,光谱间的比较可以是原始光谱或者经过预处理的光谱。光谱的比较方法主要有相关系数法、夹角余弦法、光谱距离法等。相关系数法是近红外光谱分析技术原辅料判别定性分析的经典方法,但存在对相似度较高的不同种类光谱无法设定合理阈值进行准确判断的缺点,若阈值过低,会引入不同类的物质;如果阈值过高,可能同类物质由于仪器波动造成的误差也可能被划为不同种类,从而引起定性鉴别结果错误。
如何通过相似度计算准确体现样品化学组成的相似与差异,提高物质鉴别精度,是本领域技术人员目前迫切解决的技术问题。
发明内容
为克服上述现有技术的不足,本发明提供了一种近红外光谱相似度计算方法、装置和物质定性鉴别系统,所述方法结合光谱差异与夹角余弦,引入灵敏度因子的概念,通过调整灵敏度因子,对不同种类物料间的相近光谱进行准确判定,设定合理阈值,以实现不同物料的定性判别。
为实现上述目的,本发明采用如下技术方案:
一种近红外光谱的相似度计算方法,它包括以下步骤:
建立标准样品近红外光谱;
获取待测样品近红外光谱;
计算所述标准样品近红外光谱和所述待测样品近红外光谱之间的向量的差异和夹角余弦;
基于所述差异和夹角余弦计算相似度:
S=Du(cosθ)v
其中,D表示向量差异,cosθ表示夹角余弦;u和v为可调节的灵敏度因子,取值范围均为0≤u(或v)≤+∞。
进一步地,所述向量的差异表达式为:
其中,X表示标准样品近红外光谱,Y表示待测样品近红外光谱,符号“'”表示转置运算。
进一步地,所述灵敏度因子u和v的取值均为1。
进一步地,通过调整参数u和v,能够增加不同类型样品之间相似度的差异性。
进一步地,当cosθ为负值时,v取奇数值。
进一步地,所述方法用于样品的批次间质量检测,或不同类型样品之间的质量差异检测:采用默认阈值或接收用户对阈值的设定值,若样品相似度S大于等于所述阈值,则认为待测样品与标准样品为相同种类样品,否则认为待测样品与标准样品为不同种类样品。
根据本发明的第二目的,本发明还提供了一种用于近红外光谱相似度计算的装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤,包括:
建立标准样品近红外光谱;
获取待测样品近红外光谱;
计算所述标准样品近红外光谱和所述待测样品近红外光谱之间的向量的差异和夹角余弦;
基于所述差异和夹角余弦计算相似度:
S=Du(cosθ)v
其中,D表示向量差异,cosθ表示夹角余弦;u和v为可调节的灵敏度因子,取值范围均为0≤u(或v)≤+∞。
进一步地,所述向量的差异表达式为:
其中,X表示标准样品近红外光谱,Y表示待测样品近红外光谱,符号“'”表示转置运算。
根据本发明的第三目的,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行以下步骤:
建立标准样品近红外光谱;
获取待测样品近红外光谱;
计算所述标准样品近红外光谱和所述待测样品近红外光谱之间的向量的差异和夹角余弦;
基于所述差异和夹角余弦计算相似度:
S=Du(cosθ)v
其中,D表示向量差异,cosθ表示夹角余弦;u和v为可调节的灵敏度因子,取值范围均为0≤u(或v)≤+∞。
根据本发明的第四目的,本发明还提供了一种近红外光谱定性分析系统,包括检测器和计算装置;
所述检测器,用于在相同条件下测定标准参考样品和待测样品的近红外光谱并传输至所述计算装置;
所述计算装置包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-7任一项所述的近红外光谱相似度计算方法;
基于默认阈值或接收用户对于阈值的设定,若所述相似度大于等于所述阈值,则待测样品与标准样品为相同种类样品,否则,待测样品与标准样品为不同种类样品。
本发明的有益效果
1、近红外光谱相似度评价方法一般包括相关系数法、夹角余弦法和光谱距离法等,一般可以分为两类方法,其中相关系数和夹角余弦法主要是从图谱的相关程度体现样品的相似度,而光谱距离法是从图谱的差异体现样品的相似度。两类方法对不同的物料定性判别具有不同的效果,本发明将光谱差异与夹角余弦法进行结合,综合采用各自的优点并摒弃不足,并引入灵敏度因子,可对有物质成分含量差异的信息和化学组成差异两个方面进行相似度评价,适应不同类型样品体系的需要。
2、本发明定义的近红外光谱相似度,可根据光谱情况调整灵敏度因子,并能达将相同种类划为一类并将不同种类进行区分的效果,在实际应用过程中,可避免多种方法的不断考察与摸索,简化使用人工作量。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本发明近红外光谱相似度计算方法流程图;
图2相同的两张近红外光谱;
图3两种原料光谱图;
图4五种原辅料的原始光谱图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例公开了一种近红外光谱相似度计算方法,如图1所示,包括以下步骤:
步骤1:建立样品标准参考近红外光谱X;所述样品标准参考近红外光谱是选定标准参考样品的近红外光谱,或者按照有关技术要求由测定的多个批次样品的近红外光谱生成确定。
步骤2:获取待测样品近红外光谱Y;
步骤3:按如下理论逐步推导光谱相似度计算公式,计算所述样品标准参考近红外光谱和所述待测样品近红外光谱的差谱,则:
也即
将公式进一步转化
因此,将式中最右侧项定义为相似度,也即:
其中,u和v为灵敏度因子,可根据具体情况进行调整,一般取值大于0即可,默认值为u=v=1,在u和v都等于1时,S值最大为1,最小为-1(X=-Y,cosθ=-1)。符号“'”表示矩阵或向量的转置运算。
其中:
当S=1时,X和Y一致,且正相关(X=Y);
当S=-1时,X=-Y,负相关;
当S=0,表示X和Y正交;
当S为正值为正相关;
当S为负值为负相关。
若u和v不等于1,及光谱相似度的表达式中的两项均为非负值(>=0),则S值最大为1,最小值为0。由于v取偶数时,存在cosθ正负无法区分,因此,如果cosθ为负值时,建议v采用奇数值,这样可以增加S值的区分性。
所述计算方法能够用于同类样品批次间的一致匹配,或不同类样品之间的区分。通过调整参数u和v,能够增加不同类型样品之间相似度的差异性。
接收用户对阈值的设定值,若样品相似度S大于等于所述阈值,则认为待测样品与标准样品为相同种类样品,否则认为待测样品与标准样品为不同种类样品。
无论比较相同类型还是不同类型样品的相似度,u和v取值均应该固定。
实施例二
本实施例的目的是提供一种计算装置。
一种用于近红外光谱相似度计算的装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤,包括:
建立标准样品近红外光谱;
获取待测样品近红外光谱;
计算所述标准样品近红外光谱和所述待测样品近红外光谱之间的向量的差异和夹角余弦;
基于所述差异和夹角余弦计算相似度:
其中,X表示标准样品近红外光谱,Y表示待测样品近红外光谱,符号“'”表示转置运算。
实施例三
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行以下步骤:
建立标准样品近红外光谱;
获取待测样品近红外光谱;
计算所述标准样品近红外光谱和所述待测样品近红外光谱之间的向量的差异和夹角余弦;
基于所述差异和夹角余弦计算相似度:
其中,表示向量差异,cosθ表示夹角余弦;u和v为可调节的灵敏度因子,取值范围均为0≤u(或v)≤+∞,默认取值均为1。
其中,X表示标准样品近红外光谱,Y表示待测样品近红外光谱,符号“'”表示转置运算。
实施例四
本实施例的目的是提供一种样品质量评价系统。
为了实现上述目的,本发明采用如下一种技术方案:
本实施例提供了一种基于近红外光谱的物质定性分析系统,包括检测器和计算装置;
所述检测器,用于在相同条件下测定标准参考样品和待测样品的近红外光谱并传输至所述计算装置;
所述计算装置包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤,包括:
建立标准样品近红外光谱;
获取待测样品近红外光谱;
计算所述标准样品近红外光谱和所述待测样品近红外光谱之间的向量的差异和夹角余弦;
基于所述差异和夹角余弦计算相似度:
其中,X表示标准样品近红外光谱,Y表示待测样品近红外光谱,符号“'”表示转置运算。
接收用户对阈值的设定值,若样品相似度S大于等于所述阈值,则认为待测样品与标准样品为相同种类样品,否则认为待测样品与标准样品为不同种类样品。
以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
实验验证
实例1
采用傅里叶变换近红外光谱分析仪测定三种原辅料的原始近红外光谱,其中:
仪器:Antaris II傅里叶变换近红外光谱分析仪(Thermo Fisher,美国),铟镓砷(InGaAs)检测器,积分球采样模块,RESULT光谱采集软件。
光谱采集条件:采用积分球漫反射方式进行光谱的采集,波数范围10000-4000cm-1,扫描次数32次,分辨率4cm-1,每张光谱由3112个数据点组成,每次运行工作流之前进行背景的采集,每种样品分别采集3次,求其平均光谱作为样品光谱。辅料分别为微晶纤维素PH101(Microcrystalline Cellulose,MCC)、羧甲基淀粉钠(Sodium carboxymethylstarch,CMS)、玉米淀粉(Corn starch),羟丙基纤维素(Hydroxy propyl cellulose,HPC)、羟丙基甲基纤维素(Hydroxy propyl methyl cellulose,HPMC),其中辅料Starch采集60批次,其他辅料分别采集30个批次,即辅料Starch共60张光谱,辅料CMS共30张光谱,辅料MCC共30张光谱,辅料HPC共30张光谱,辅料HPMC共30张光谱,五种原辅料的原始光谱如图2示。
从图中可看出,五种原辅料由于化学成分结构相似,体现在近红外图谱中的不同区域均有相似吸收出现,如5000cm-1-4000cm-1处两个吸收峰,5200cm-1处一个吸收峰,在7000cm-1-6000cm-1三种原辅料均有较明显吸收,其中HPMC的吸收峰与其他四者差别相对较大。在近红外光谱定性分析时,有时会根据具体情况对光谱进行预处理,以放大光谱之间的差异。本发明中涉及方法在对光谱不做任何预处理的情况下,比较传统相关系数法、夹角余弦法与本发明中所改进方法对于辅料的区分效果。
以Starch作为标准样品,采用如下公式计算对比样品与标准样品的相关系数R:
其中,Xi为标准样品也即Starch近红外光谱吸光度,为标准样品也即Starch近红外光谱平均吸光度,Yi为对比样品(Starch,MCC,CMS,HPC,HPMC)的近红外光谱吸光度,为对比样品(Starch,MCC,CMS)的近红外光谱平均吸光度,计算光谱个数n为30,计算得到各批次Starch与Starch相关系数Rss,Starch与MCC相关系数Rsm,Starch与CMS相关系数Rsc,Starch与HPC相关系数Rsh,Starch与HPMC相关系数Rsp。
表1
从表中结果可看出,在不对近红外光谱进行任何预处理的前提下,由于各辅料间的光谱较为相似,采用传统相关系数法对5种原辅料进行计算,其中30个批次Starch与Starch标准光谱之间的相关系数均在0.99以上,30个批次MCC与Starch标准光谱之间的相关系数均在0.98以上,30个批次CMS与Starch标准光谱之间的相关系数均在0.99以上,30个批次HPC与Starch标准光谱之间的相关系数均在0.98以上,30个批次HPMC与Starch标准光谱之间的相关系数仅均低于0.95。在近红外光谱采用相关系数法进行定性判别时,一般相关系数大于0.95即可认为二者属于同一种类,因此,在实例1种所验证的5种辅料光谱中,相关系数法可区分Starch与HPMC两种辅料,而无法准确区分Starch与其余三种物料。
实例2
本实施例中测试条件与实例1中所使用光谱相同,以Starch作为标准样品,采用如下公式计算对比样品与标准样品的夹角余弦cosθ:
其中,Xi为标准样品也即Starch近红外光谱吸光度,Yi为对比样品(Starch,MCC,CMS)的近红外光谱吸光度,计算光谱个数n为30,计算得到各批次Starch与Starch夹角余弦cosθss,Starch与MCC夹角余弦cosθsm,Starch与CMS夹角余弦cosθsc,Starch与HPC夹角余弦cosθsh,Starch与HPMC夹角余弦cosθsp。
表2
从表中结果可看出,在不对近红外光谱进行任何预处理的前提下,由于各辅料间的光谱较为相似,采用夹角余弦法对5种原辅料进行计算,其中30个批次Starch与Starch标准光谱之间的夹角余弦值均在0.99以上,30个批次MCC与Starch标准光谱之间的夹角余弦值均在0.98以上,30个批次CMS与Starch标准光谱之间的夹角余弦值均在0.99以上,30个批次HPC与Starch标准光谱之间的夹角余弦值均在0.99以上,30个批次HPMC与Starch标准光谱之间的夹角余弦值均在0.98以上。在近红外光谱采用夹角余弦法进行定性判别时,一般夹角余弦大于0.95即可认为二者属于同一种类,因此,夹角余弦算法依然无法对五种原辅料进行准确区分。
实例3
本实施例中测试条件与实例1所使用光谱相同,以Starch作为标准样品,采用本发明中方法公式计算对比样品与标准样品的相似度S:
其中,X为标准样品也即Starch近红外光谱,Y为对比样品(Starch,MCC,CMS)的近红外光谱吸光度,计算光谱个数n为30,计算得到各批次Starch与Starch相似度Sss,Starch与MCC相似度Ssm,Starch与CMS相似度Ssc,Starch与HPC相似度Ssh,Starch与HPMC相似度Ssp。
表3
从表中结果可看出,针对不同情况的原辅料鉴别,可调整本发明方法中u和v灵敏度因子,本实例为体现差异,将几种物料之间判别均设置为u=100及v=100,从表中结果可实现:
第一:对相同种类物料的完全匹配,如Starch与Starch的30批次物料相似度均可达到0.95以上;
第二:对不同种类物料完全区分,当取值u=100,v=100时,如Starch与MCC的相似度30批次相似度均0.95以下;在Starch与CMS的相似度结果中,除批次19相似度为0.9136,其余批次相似度均在0.95以下;在Starch与HPC的相似度结果中,30批次相似度均0.95以下;在Starch与HPMC的相似度结果中,30批次相似度均0.95以下。
本发明中方法所验证结果与相关系数法和夹角余弦法相比,具有显著改进,在不对近红外光谱做任何预处理的情况下,可对相对种类原辅料进行一致匹配,而对不同种类间原辅料进行区分,使用者在实际原辅料鉴别环节中,通过研究可设定不同批次的判别固定阈值,从而反推计算出对应的灵敏度因子,该相似度计算方法具有极高的实用价值与应用意义。
实例4
根据已发表专利《一种指纹图谱的相似度评价算法》,该专利方法取定性相似度和定量相似度之积为相似度,并通过引入灵敏度系数,该方法步骤如下:
首先计算对比样品与标准样品的相关系数R
其中,Xi为对比样品指纹峰峰面积或峰高;
Yi为标准样品的指纹峰峰面积或峰高,若对比样品中不存在相应的指纹峰,则其峰面积或峰高值记为0;
为标准样品的指纹峰平均峰面积或平均峰高;
其中1≤i≤n,n为指纹峰的峰面积个数或指纹峰峰高个数。
其次,采用下式计算对比样品与标准样品的相对欧式距离D,
最后,采用下式计算对比样品相对于标准样品的相似度S,
S=RjDk
其中,j为种类灵敏度系数,0≤j≤+∞,k为浓度灵敏度系数,0≤k≤+∞。
采用该方法对同样的两样光谱进行分析时,光谱如图2所示,在j和k分别取值为1时,计算得到S=29.3721,说明当两张光谱完全一致时,此公式无法对光谱进行正确判别,而根据本发明中提出的相似度计算方法S=1,可将相同光谱进行正确归类。
实例5
根据已发表专利《一种指纹图谱的相似度评价算法》,该专利方法取定性相似度和定量相似度之积为相似度,并通过引入灵敏度系数,该方法步骤如下:
首先计算对比样品与标准样品的相关系数R
此处应当指出的是,在相关系数的计算公式中,分母为光谱减平均值平方加和的乘积再开根号,正确公式应为:
该方法中采用如下两类光谱时,光谱如图3所示,两类光谱的模长非常接近,其比值为1,无论j和k如何取值,按S=RjDk计算相似度S=1,说明两组数据相似程度完全一致,不能区分它们之间的差异。而按照本发明中提出的相似度计算方法计算相似度S=0.8616(u=8,v=8),可区分这两种光谱之间的不同。
本发明将相关系数法和光谱向量的差异相结合,综合采用各自的优点并摒弃不足,并引入灵敏度因子,可对有物质成分含量差异的信息和化学组成差异两个方面进行相似度评价,适应不同类型样品体系的需要。根据光谱情况调整灵敏度因子,并能达到将相同种类划为一类并将不同种类进行区分的效果,在实际应用过程中,可避免多种方法的不断考察与摸索,简化使用人工作量。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (7)
2.如权利要求1所述的一种近红外光谱的相似度计算方法,其特征在于,所述灵敏度因子u和v的取值均为1。
3.如权利要求1所述的一种近红外光谱的相似度计算方法,其特征在于,当cosθ为负值时,v取奇数值。
4.如权利要求1所述的一种近红外光谱的相似度计算方法,其特征在于,所述方法用于样品的批次间质量检测,或不同类型样品之间的质量差异检测:用默认阈值或接收用户对阈值的设定,若样品相似度S大于等于所述阈值,则认为待测样品与标准样品为相同种类样品,否则认为待测样品与标准样品为不同种类样品。
5.一种用于近红外光谱相似度计算的装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-4任一项所述的方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时执行如权利要求1-4任一项所述的近红外光谱相似度计算方法。
7.一种基于近红外光谱的物质定性分析装置,包括检测器和计算装置;
所述检测器,用于在相同条件下测定标准参考样品和待测样品的近红外光谱并传输至所述计算装置;
所述计算装置包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-4任一项所述的近红外光谱相似度计算方法;
基于默认阈值或接收用户对于阈值的设定,若所述相似度大于等于所述阈值,则待测样品与标准样品为相同种类样品,否则,待测样品与标准样品为不同种类样品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810146019.5A CN108362662B (zh) | 2018-02-12 | 2018-02-12 | 近红外光谱相似度计算方法、装置和物质定性分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810146019.5A CN108362662B (zh) | 2018-02-12 | 2018-02-12 | 近红外光谱相似度计算方法、装置和物质定性分析系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108362662A CN108362662A (zh) | 2018-08-03 |
CN108362662B true CN108362662B (zh) | 2020-01-14 |
Family
ID=63006065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810146019.5A Active CN108362662B (zh) | 2018-02-12 | 2018-02-12 | 近红外光谱相似度计算方法、装置和物质定性分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108362662B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109324014B (zh) * | 2018-10-08 | 2021-09-24 | 华东理工大学 | 一种自适应的原油性质近红外快速预测方法 |
CN109462913A (zh) * | 2018-10-25 | 2019-03-12 | 深圳市光迹科技有限公司 | 一种优化灯珠光谱的控制方法及系统 |
CN111426657B (zh) * | 2019-01-10 | 2023-04-25 | 华夏安健物联科技(青岛)有限公司 | 一种溶解性有机物三维荧光谱图的识别比对方法 |
CN111426648B (zh) * | 2020-03-19 | 2023-04-07 | 甘肃省交通规划勘察设计院股份有限公司 | 一种红外谱图的相似度确定方法及系统 |
CN112304893A (zh) * | 2020-09-17 | 2021-02-02 | 云南烟叶复烤有限责任公司 | 一种快速判定多等级烟叶混合均匀性的方法及存储介质 |
CN112326587B (zh) * | 2020-12-18 | 2023-09-05 | 兰州交通大学 | 一种聚羧酸减水剂分析鉴别方法 |
CN112834451B (zh) * | 2021-01-12 | 2023-04-18 | 深圳网联光仪科技有限公司 | 基于红外光谱的样品识别方法、设备及存储介质 |
CN113030007B (zh) * | 2021-02-10 | 2023-04-18 | 河南中烟工业有限责任公司 | 基于相似度学习算法快速检验烟用香精质量稳定性的方法 |
CN113030012B (zh) * | 2021-04-02 | 2022-05-17 | 山东大学 | 基于多级偏最小二乘算法的光谱分析方法及系统 |
CN113092407B (zh) * | 2021-04-20 | 2024-01-30 | 深圳华创智信科技有限公司 | 基于近红外光谱的五常稻花香水稻原产地品种识别方法 |
CN113406037B (zh) * | 2021-06-17 | 2023-07-25 | 中国科学院合肥物质科学研究院 | 一种基于序列前向选择的红外光谱在线快速识别分析方法 |
CN113390824B (zh) * | 2021-07-09 | 2022-09-27 | 河北建筑工程学院 | 基于近红外光谱的物质类别识别方法及终端设备 |
CN115684316B (zh) * | 2022-11-08 | 2023-12-22 | 中耕生态环境科技(广州)有限公司 | 基于mos气敏传感器阵列的仿生电子鼻的气味识别方法 |
CN115791681B (zh) * | 2022-11-09 | 2024-06-18 | 招商局重庆交通科研设计院有限公司 | 沥青质量管控方法及系统 |
CN115575790B (zh) * | 2022-12-12 | 2023-03-17 | 季华实验室 | 微米发光二极管芯片缺陷检测方法、设备及存储介质 |
CN117288708B (zh) * | 2023-10-07 | 2024-03-26 | 中国标准化研究院 | 一种固体废物玻璃化产物玻璃化程度的检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103278810A (zh) * | 2013-05-10 | 2013-09-04 | 南京航空航天大学 | 基于空间相似度的水下目标尺度特性提取方法 |
CN103760126A (zh) * | 2013-12-16 | 2014-04-30 | 张雪峰 | 冬虫夏草虫体的红外光谱分析鉴定方法 |
WO2015084864A1 (en) * | 2013-12-02 | 2015-06-11 | Rakuten Usa, Inc. | Systems and methods of modeling object networks |
KR101708254B1 (ko) * | 2015-09-25 | 2017-02-21 | 인하대학교 산학협력단 | 협업적 필터링과 캐릭터 넷을 이용한 스토리 기반의 영화 추전 시스템 및 방법. |
JP2017125840A (ja) * | 2016-01-13 | 2017-07-20 | 凸版印刷株式会社 | 呈色反応検出システム、呈色反応検出方法及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120323968A1 (en) * | 2011-06-14 | 2012-12-20 | Microsoft Corporation | Learning Discriminative Projections for Text Similarity Measures |
-
2018
- 2018-02-12 CN CN201810146019.5A patent/CN108362662B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103278810A (zh) * | 2013-05-10 | 2013-09-04 | 南京航空航天大学 | 基于空间相似度的水下目标尺度特性提取方法 |
WO2015084864A1 (en) * | 2013-12-02 | 2015-06-11 | Rakuten Usa, Inc. | Systems and methods of modeling object networks |
CN103760126A (zh) * | 2013-12-16 | 2014-04-30 | 张雪峰 | 冬虫夏草虫体的红外光谱分析鉴定方法 |
KR101708254B1 (ko) * | 2015-09-25 | 2017-02-21 | 인하대학교 산학협력단 | 협업적 필터링과 캐릭터 넷을 이용한 스토리 기반의 영화 추전 시스템 및 방법. |
JP2017125840A (ja) * | 2016-01-13 | 2017-07-20 | 凸版印刷株式会社 | 呈色反応検出システム、呈色反応検出方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
向量相似度测度方法;张宇 等;《声学技术》;20090831;第28卷(第4期);第532-536页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108362662A (zh) | 2018-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108362662B (zh) | 近红外光谱相似度计算方法、装置和物质定性分析系统 | |
CN108072626B (zh) | 一种沥青品牌识别方法 | |
CN110243806B (zh) | 拉曼光谱下基于相似度的混合物组分识别方法 | |
CN111504979B (zh) | 利用已知混合物拉曼光谱改善混合物成分识别精度的方法 | |
US20050175231A1 (en) | Surface defect judging method | |
JP2006292745A (ja) | 薬物を近赤外線分光分析によって特定する方法およびそのための機器 | |
WO2004079347A1 (en) | Method of analysis of nir data | |
CN1831516A (zh) | 用可见光和近红外光谱技术无损鉴别卷烟品种及真假的方法 | |
US20220390374A1 (en) | Method for extracting raman characteristic peaks employing improved principal component analysis | |
CN108398416A (zh) | 一种基于激光拉曼光谱的混合物成分测定方法 | |
Kuzmiakova et al. | An automated baseline correction protocol for infrared spectra of atmospheric aerosols collected on polytetrafluoroethylene (Teflon) filters | |
CN108007912B (zh) | 光谱修正分析装置、修正分析方法以及药品真伪判定系统 | |
Yin et al. | Non-destructive detection of foreign contaminants in toast bread with near infrared spectroscopy and computer vision techniques | |
WO2020248961A1 (zh) | 一种无参考值的光谱波数选择方法 | |
CN113310930A (zh) | 高温灭菌奶、巴氏杀菌奶和掺加高温灭菌奶的巴氏杀菌奶的光谱鉴定方法 | |
CN115420707A (zh) | 一种污水近红外光谱的化学需氧量评估方法及系统 | |
CN109283153B (zh) | 一种酱油定量分析模型的建立方法 | |
CN105223140A (zh) | 同源物质的快速识别方法 | |
CN114611582A (zh) | 一种基于近红外光谱技术分析物质浓度的方法及系统 | |
CN112651173B (zh) | 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统 | |
Shi et al. | An approach of spectra standardization and qualitative identification for biomedical materials based on terahertz spectroscopy | |
CN109146003A (zh) | 一种基于高光谱成像的分类识别方法、装置及系统 | |
Wang et al. | Nondestructive testing of muskmelons varieties based on dielectric spectrum technology | |
CN106970042B (zh) | 一种卡拉胶杂质、水分含量检测方法 | |
CN104777130A (zh) | 一种基于近红外光谱技术的l-苏氨酸的快速检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |