CN105651875A - 一种指纹图谱的相似度评价算法 - Google Patents
一种指纹图谱的相似度评价算法 Download PDFInfo
- Publication number
- CN105651875A CN105651875A CN201511015587.4A CN201511015587A CN105651875A CN 105651875 A CN105651875 A CN 105651875A CN 201511015587 A CN201511015587 A CN 201511015587A CN 105651875 A CN105651875 A CN 105651875A
- Authority
- CN
- China
- Prior art keywords
- similarity
- sample
- standard sample
- fingerprint
- qualitative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N2030/022—Column chromatography characterised by the kind of separation mechanism
- G01N2030/025—Gas chromatography
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种指纹图谱的相似度评价算法,它包括以下步骤:计算对比样品与标准样品的相关系数,计算对比样品与标准样品的相对欧氏距离,计算对比样品相对于标准样品的相似度,本发明将指纹图相似度分成两部分,即定性相似度和定量相似度,以两者之积作为指纹图谱相似度。定性相似度是指样品的种类相似程度,与峰的数目、峰的位置和顺序、各峰强度比例有关,以相关系数度量;定量相似度是指标品浓度相似程度,与峰强度有关。本发明取定性相似度和定量相似度之积为相似度,具备了同时反映样品间浓度、种类差异的能力,并通过引入灵敏度系数,使相似度数值能够适用于不同的评价需求。
Description
技术领域
本发明涉及一种基于样品指纹图谱的相似度评价算法。
背景技术
指纹图谱技术通过对样品色谱峰的相对保留值和其相应的色谱峰面积进行量化处理,实现谱图的数据化,提高了样品间的可比性。在获取了样品指纹图谱后,一个关键问题是如何通过谱图的计算评定样品间的整体相似度,定量描述它们各自的化学组成差异性和波动性。所以指纹图谱相似度计算方法和建立相似度评价指标是化学指纹图谱分析中的核心环节。由于指纹图谱所包含信息量往往很大,对其中一种或几种化学成分进行定性定量分析,很难对其整体状态做有效判断。
指纹图谱相似性评价一般从两个方面考虑,一是色谱峰的整体“面貌”,即有指纹意义的峰的数目、峰的位置和顺序、各峰之间的大致比例等是否相似,以判断样品的种类是否相似。二是以样品与对照样品之间或不同批次样品指纹图谱之间总积分值作量化比较,比较两者之间的相似程度。
理论上,任何一个可以计算两向量关系的函数都可以作为一种相似度算法。不同的相似度计算方法,可以从不同角度反映图谱的相似情况,可能得到不同结论,并不存在矛盾。目前,用于指纹图谱相似度评价方法一般有夹角余弦法、相关系数法和欧氏距离法。一般来说夹角余弦法和相关系数法能灵敏反映样品种类波动,适用于但各组间含量比差异较大的样品,即定性样品的种类相似程度,而对浓度变化不灵敏;欧氏距离法反映的是特征峰数值大小差异,能够定量样品的浓度差异,对样品种类差异反映不灵敏。
发明内容
本发明结合相关系数和欧氏距离的优点,提供一种能够综合反应样品间浓度差异和种类差异的指纹图谱相似度评价算法,以克服现有指纹图谱相似度评价算法的不足。
这种指纹图谱的相似度评价算法,其特征是包括以下步骤:
a.采用下式计算对比样品与标准样品的相关系数R,
其中Xi为对比样品指纹峰峰面积或峰高;
为对比样品指纹峰平均峰面积或平均峰高;
Yi为标准样品的指纹峰峰面积或峰高,若对比样品中不存在相应的指纹峰,则其峰面积或峰高值记为0;
为标准样品的指纹峰平均峰面积或平均峰高;
其中1≤i≤n,n为指纹峰的峰面积个数或指纹峰峰高个数。
b.采用下式计算对比样品与标准样品的相对欧氏距离D,
当<时,,
当>时,;
c.采用下式计算对比样品相对于标准样品的相似度S,
S=RjDk
其中j为种类灵敏度系数,0≤j≤+∞,k为浓度灵敏度系数,0≤k≤+∞。
本发明构思及机理为:用相关系数评价样品的相似度时,对样品的种类更敏感,对浓度不敏感;用欧氏距离评价相似度时,对样品的浓度更敏感。用Rj表示种类相似度,用Dk表示浓度相似度,两者之积既能反应种类差异又能反应浓度差异。其中,j、k的取值根据对浓度和种类的关注程度确定,取值越大越灵敏,在实际应用中,应针对相似度评价的目的进行合理取值。多次评价获得的相似度数值,若j、k取值均相同,则数值具备可比性,若不同,数值不具备可比性。
本发明取得的技术进步:
不同的相似度计算方法,可以从不同角度反映图谱的相似情况,本发明将指纹图相似度分成两部分,即定性相似度和定量相似度,以两者之积作为指纹图谱相似度。定性相似度是指样品的种类相似程度,与峰的数目、峰的位置和顺序、各峰强度比例有关,以相关系数度量;定量相似度是指标品浓度相似程度,与峰强度有关。而经典的相似度评价方法,或者侧重定性,或者侧重定量,在特定的条件下,经典的相似度算法是适用的,比如当两个样品种类差异很小时,用距离法(侧重定量)评价样品的相似度是合适的,而当两个样品浓度差异很小时,用相关系数、夹角余弦法(侧重定性)评价样品的相似度也是合适的。但当两个样品既有种类差异又有浓度差异时,若用距离法计算相似度,不能充分反应种类差异;若用相关系数、夹角余弦计算相似度,不能充分反应浓度差异。因此,以上几种方法均不能合理的表征样品的相似程度。本发明取定性相似度和定量相似度之积为相似度,具备了同时反映样品间浓度、种类差异的能力,并通过引入灵敏度系数,使相似度数值能够适用于不同的评价需求。
具体实施方式
下面结合实施例对本发明作进一部描述。
实施例1:采用GCMS法测定不同批次同一牌号卷烟的主流烟气成分,每次测定标准样品与对比样品的测试条件相同。色谱条件:色谱柱:HP-INNOWAX(60m×0.25mm×0.25μm);进样口温度:220℃;分流比:10:1;进样量:1μL;程序升温:初始温度60℃,保持2min,以2℃/min升至150℃后,再以5℃/min升至230℃后保持40min;载气:氦气;载气流量:1mL/min,恒流模式。质谱条件:EI离子源,传输线温度280℃,离子源温度230℃,电离能量70eV,四极杆温度150℃,质量扫描范围35~450amu。
选取代表性烟气致香物质、代表性性香料成分以及烟碱共计20个色谱峰构成标准样品的指纹峰并积分,得到指纹峰峰高Y1,Y2,…,Y20。
对应标准样品指纹峰,选择相应对比样品的20个指纹峰的峰高X1,X2,…,X20,若对比样品中不存在相应的指纹峰,则其峰高值记为0;
编号 | 名称 | 标准样品峰高Yi | 对比样品峰高Xi |
1 | 尼古丁 | 10583115 | 10537149 |
2 | 三乙酸甘油酯 | 4522046 | 4206962 |
3 | 棕榈酸 | 2160538 | 2130377 |
4 | 维生素E | 1780467 | 1809010 |
5 | 丙二醇 | 1356629 | 1218078 |
6 | 亚麻酸 | 1259792 | 1296028 |
7 | 对苯二酚 | 1282118 | 1252680 |
8 | 亚油酸 | 1071099 | 959693 |
9 | 领苯二酚 | 838213 | 832392 |
10 | 硬脂酸 | 764716 | 678442 |
11 | 3-羟基吡啶 | 706201 | 664494 |
12 | 2,3'-联吡啶 | 623511 | 615233 |
13 | 2,3-二氢苯并呋喃 | 628106 | 542041 |
14 | 棕榈酸甲酯 | 566027 | 588221 |
15 | 油酸 | 552067 | 537907 |
16 | 苯甲酸 | 530981 | 523483 |
17 | 2-羟基-3-甲基-2-环戊烯-1-酮 | 507676 | 463410 |
18 | D-柠檬烯 | 518969 | 470540 |
19 | 巨豆三烯酮 | 404525 | 362073 |
20 | 茄酮 | 401438 | 366901 |
采用下式计算对比样品与标准样品的相关系数R,
其中Xi为对比样品指纹峰峰高,为对比样品指纹峰平均峰高,Yi为标准样品的指纹峰峰高,为标准样品的指纹峰平均峰高),指纹峰的个数n为20,计算得到相关系数R=0.9995,
采用下式计算对比样品与标准样品的相对欧氏距离D,
当<时,相对欧氏距离,
当>时,相对欧氏距离;
计算得到相对欧氏距离为D=0.9841,
本实施例中,由于是对不同批次的同牌号卷烟进对比对,测试样品的配方相同,指纹峰相关系数高达0.9995,因此认为测试样品的主要差异是由加工工艺带来烟气浓度差异,基本不存在种类差异。基于以上实际情况,本实例需要重点反映样品的浓度差异,因此取j值为0.5,k值为2,相似度重点反应测试样品的浓度差异。
计算得到样品间的指纹图谱相似度S=RjDk=0.9682。
实施例2:本实施例评价高仿卷烟与标准样品的相似度,测试条件与实施例1相同,测试结果如下表所示。
编号 | 名称 | 标准样品峰面积Yi | 对比样品峰面积Xi |
1 | 尼古丁 | 10843316711 | 10082510538 |
2 | 三乙酸甘油酯 | 3218262364 | 6536437396 |
3 | 棕榈酸 | 1120402639 | 581070650 |
4 | 维生素E | 849834262 | 612044062 |
5 | 丙二醇 | 576313623 | 1196897925 |
6 | 亚麻酸 | 518456975 | 311718722 |
7 | 对苯二酚 | 531632635 | 428849745 |
8 | 亚油酸 | 411189755 | 657237080 |
9 | 领苯二酚 | 289690986 | 429023608 |
10 | 硬脂酸 | 254097331 | 123737703 |
11 | 3-羟基吡啶 | 226783942 | 375345510 |
12 | 2,3'-联吡啶 | 189822835 | 365697862 |
13 | 2,3-二氢苯并呋喃 | 191824643 | 92183065 |
14 | 棕榈酸甲酯 | 165325033 | 96510764 |
15 | 油酸 | 159531248 | 250409366 |
16 | 苯甲酸 | 150898341 | 129083338 |
17 | 2-羟基-3-甲基-2-环戊烯-1-酮 | 141526763 | 158843847 |
18 | D-柠檬烯 | 146045538 | 365013289 |
19 | 巨豆三烯酮 | 102311068 | 143309503 |
20 | 茄酮 | 101197511 | 251625889 |
计算对比样品与标准样品的相关系数R=0.9485,相对欧氏距离D=0.9420。
本实施例中,对高仿卷烟与标准样品的相似度进行评价,高仿卷烟在配方、工艺条件、辅材选用上均与标准样品存在差异,因此其指纹峰的品种和浓度均存在差异,基于以上实际情况,本实施例需要同时反映样品的品种和浓度差异,因此取j值为1,k值为1,相似度重点反应测试样品的浓度差异。
计算得到样品间的指纹图谱相似度S=RjDk=0.8935。
本例中,高仿样品与标准样品指纹峰的浓度和种类差异均不能忽略,若单独采用欧氏距离法(定量相似度)评价,相似度的数值为0.9420,单独采用相关系数法(定性相似度)评价,相似度的数值为0.9485,二者分别从烟气浓度和烟气种类两个角度反应了样品的相似程度,但均不能完整反映样品之间的差异,而采用本发明所述算法,相似度数值为0.8935,同时包含了浓度和种类差异造成的样品差异,较经典方法更为合理。
实施例3:为降低生产成本,在不降低卷烟品质的基础上对配方进行调整,拟定了三款调整配方。本实施例评价三款调整配方与标准样品的相似度,测试条件与实施例1相同,测试结果如下表所示。
计算调整配方1与标准样品的相关系数R1=0.9972,相对欧氏距离D1=0.9961;调整配方2与标准样品的相关系数R2=0.9970,相对欧氏距离D2=0.9705;调整配方3与标准样品的相关系数R3=0.9959,相对欧氏距离D3=0.9840;
本实施例中,对调整配方与标准样品的相似度进行评价,由于配方产生变化,因此对比样品的品种发生改变。所以本实施例重点考虑品种相似程度,取j值为2,k值为0.2,相似度重点反应测试样品的品种差异。
计算三个调整样品与标准样品指纹图谱相似度分别为S1=0.9937,S2=0.9880,S3=0.9886。
Claims (1)
1.一种指纹图谱的相似度评价算法,其特征是包括以下步骤:
a.采用下式计算对比样品与标准样品的相关系数R,
其中Xi为对比样品指纹峰峰面积或峰高,
为对比样品指纹峰平均峰面积或平均峰高,
Yi为标准样品的指纹峰峰面积或峰高,
为标准样品的指纹峰平均峰面积或平均峰高,
其中1≤i≤n,n为指纹峰的峰面积个数或指纹峰峰高个数;
b.采用下式计算对比样品与标准样品的相对欧氏距离D,
当<时,,
当>时,;
c.采用下式计算对比样品相对于标准样品的相似度S,
S=RjDk
其中j为种类灵敏度系数,0≤j≤+∞,k为浓度灵敏度系数,0≤k≤+∞。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511015587.4A CN105651875A (zh) | 2015-12-31 | 2015-12-31 | 一种指纹图谱的相似度评价算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511015587.4A CN105651875A (zh) | 2015-12-31 | 2015-12-31 | 一种指纹图谱的相似度评价算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105651875A true CN105651875A (zh) | 2016-06-08 |
Family
ID=56477365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511015587.4A Pending CN105651875A (zh) | 2015-12-31 | 2015-12-31 | 一种指纹图谱的相似度评价算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105651875A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106442700A (zh) * | 2016-11-22 | 2017-02-22 | 云南中烟工业有限责任公司 | 一种利用imr‐ms在线快速评价卷烟主流烟气质量稳定性的方法 |
CN107784192A (zh) * | 2017-09-15 | 2018-03-09 | 山东大学 | 指纹图谱相似度计算方法、装置和样品质量评价系统 |
CN108228533A (zh) * | 2018-01-04 | 2018-06-29 | 中煤航测遥感集团有限公司 | 物质分析方法及装置 |
CN113588591A (zh) * | 2021-08-11 | 2021-11-02 | 江门市华讯方舟科技有限公司 | 一种用于蛋氨酸含量快速检验的方法 |
CN114646715A (zh) * | 2020-12-21 | 2022-06-21 | 株式会社岛津制作所 | 波形处理辅助装置以及波形处理辅助方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271092A (zh) * | 2007-03-19 | 2008-09-24 | 沈阳药科大学 | 中药色谱指纹图谱特征数字化和全定性全定量质量控制方法 |
CN102692462A (zh) * | 2012-06-03 | 2012-09-26 | 浙江大学 | 一种丹红注射液质量控制方法 |
CN103278591A (zh) * | 2013-05-16 | 2013-09-04 | 江苏师范大学 | 一种色谱指纹图谱相似度评价方法 |
-
2015
- 2015-12-31 CN CN201511015587.4A patent/CN105651875A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271092A (zh) * | 2007-03-19 | 2008-09-24 | 沈阳药科大学 | 中药色谱指纹图谱特征数字化和全定性全定量质量控制方法 |
CN102692462A (zh) * | 2012-06-03 | 2012-09-26 | 浙江大学 | 一种丹红注射液质量控制方法 |
CN103278591A (zh) * | 2013-05-16 | 2013-09-04 | 江苏师范大学 | 一种色谱指纹图谱相似度评价方法 |
Non-Patent Citations (4)
Title |
---|
R. BRUNELLI,ET AL: "ROBUST ESTIMATION OF CORRELATION WITH APPLICATIONS TO COMPUTER VISION", 《PATTERN RECOGNITION》 * |
曾贵娥等: "中药指纹图谱相似度评价方法的比较研究", 《第十七届中国过程控制会议论文集》 * |
李希强等: "烟用香精UPLC指纹图谱的夹角余弦、相关系数与欧氏距离评价", 《烟草科技》 * |
王玺等: "中药HPLC指纹图谱相似性研究的探讨", 《沈阳药科大学学报》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106442700A (zh) * | 2016-11-22 | 2017-02-22 | 云南中烟工业有限责任公司 | 一种利用imr‐ms在线快速评价卷烟主流烟气质量稳定性的方法 |
CN107784192A (zh) * | 2017-09-15 | 2018-03-09 | 山东大学 | 指纹图谱相似度计算方法、装置和样品质量评价系统 |
CN108228533A (zh) * | 2018-01-04 | 2018-06-29 | 中煤航测遥感集团有限公司 | 物质分析方法及装置 |
CN114646715A (zh) * | 2020-12-21 | 2022-06-21 | 株式会社岛津制作所 | 波形处理辅助装置以及波形处理辅助方法 |
CN114646715B (zh) * | 2020-12-21 | 2023-08-04 | 株式会社岛津制作所 | 波形处理辅助装置以及波形处理辅助方法 |
CN113588591A (zh) * | 2021-08-11 | 2021-11-02 | 江门市华讯方舟科技有限公司 | 一种用于蛋氨酸含量快速检验的方法 |
CN113588591B (zh) * | 2021-08-11 | 2023-05-26 | 江门市华讯方舟科技有限公司 | 一种用于蛋氨酸含量快速检验的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105651875A (zh) | 一种指纹图谱的相似度评价算法 | |
CN107860868A (zh) | 烟草匹配方法和系统 | |
CN101413884B (zh) | 近红外光谱分析仪及其分辨率的校正方法 | |
CN103983705B (zh) | 一种测定卷烟制丝过程中料液持留率的方法 | |
CN104597193A (zh) | 一种花生油掺伪定性鉴别方法 | |
CN105203653A (zh) | 一种卷烟纸质量稳定性的测试方法 | |
CN109507315A (zh) | 复杂样本gc-ms自动解析实现化合物准确鉴别与差异性组分筛查的方法 | |
CN109580497B (zh) | 一种基于奇异性理论的高光谱矿物异常信息提取方法 | |
CN106404884A (zh) | 一种利用hs‐imr‐ms快速评价挥发性烟用香精香料质量一致性的方法 | |
Mascrez et al. | Enhancement of volatile profiling using multiple-cumulative trapping solid-phase microextraction. Consideration on sample volume | |
CN112255344A (zh) | 一种超高效液相色谱串联质谱鉴别不同年份白酒的方法 | |
Henkel et al. | Universal finite-size scaling amplitudes in anisotropic scaling | |
CN109115908B (zh) | 基于层次聚类提取特征的切达奶酪身份的判别标识方法 | |
Teye et al. | Nondestructive authentication of cocoa bean cultivars by FT-NIR spectroscopy and multivariate techniques | |
CN106596814B (zh) | 一种复杂液‑质联用数据中的色谱峰定量分析方法 | |
CN108205042B (zh) | 一种安化黑茶识别方法 | |
Ni et al. | Identification of geographical origin of honeysuckle (Lonicera Japonica Thunb) by discriminant analysis using rare earth elements | |
CN107076713A (zh) | 确定被修饰化合物的身份 | |
KR101578147B1 (ko) | 상품 가격 계산 장치, 상품 가격 계산 방법 및 이를 이용한 상품 정보 제공 방법 | |
Pettersson et al. | Hα emission-line stars in molecular clouds-II. The M 42 region | |
CN104820027B (zh) | 一种脱树脂褐煤蜡的气相色谱指纹图谱检测方法 | |
CN107173844A (zh) | 一种含烟梗预处理的造纸法再造烟叶成品化学成分预测方法 | |
Xu et al. | Modified self‐adaptive model for improving the prediction accuracy of soil organic matter by laser‐induced breakdown spectroscopy | |
Ascenso et al. | The extinction law from photometric data: linear regression methods | |
Kang et al. | Reversed inverse regression for the univariate linear calibration and its statistical properties derived using a new methodology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160608 |
|
RJ01 | Rejection of invention patent application after publication |