CN101865880B - 质谱成像数据的差异分析方法及系统 - Google Patents
质谱成像数据的差异分析方法及系统 Download PDFInfo
- Publication number
- CN101865880B CN101865880B CN2010101946347A CN201010194634A CN101865880B CN 101865880 B CN101865880 B CN 101865880B CN 2010101946347 A CN2010101946347 A CN 2010101946347A CN 201010194634 A CN201010194634 A CN 201010194634A CN 101865880 B CN101865880 B CN 101865880B
- Authority
- CN
- China
- Prior art keywords
- sample
- group
- minimum area
- mass spectrum
- spectrum imaging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明涉及质谱成像数据的差异分析方法及系统,该方法包括:选取需要进行差异分析的区域并确定最小区域的形状和大小,得到被测样品的质谱数据集;分析所选定的最小区域间存在的差异,得到差异系数;按照差异系数进行排序,并以选定的最小区域为核心进行扩展,判定扩展后的区域之间的差异程度是否符合预设的条件。本发明能够使研究人员准确、精确分析不同样品成像数据图间的显著差异、差异所在的样品区域,物质种类与含量差异。
Description
技术领域
本发明涉及质谱分析领域,尤其涉及质谱成像数据的差异分析方法及系统。
背景技术
质谱分析方法是将物质粒子(原子、分子)电离成离子,并通过适当的稳定或变化的电场或磁场将它们按空间位置、时间先后等实现质荷比分离,并检测其强度来作定性、定量分析的分析方法。由于其直接测量的本质和高灵敏、高分辨、高通量和高适用性的特性,使得质谱仪和质谱分析技术在现代科学技术中举足轻重。随着生命科学、环境科学、医药科学、纳米材料等学科的发展,以及食品安全、国家安全、国际反恐的需要,质谱仪已成为增长速度飞快的分析仪器之一。尤其是色谱/质谱联用技术和仪器的出现,因其对复杂基体的高分离功能和检测的高灵敏度,更是在上述各领域倍受青睐,甚至不可或缺。
对于复杂基体的检测分析,其分析流程是:样品前处理、色谱分离、质谱分析检测、数据处理。其中,样品前处理占大部分工作量,操作环节多、而且非常复杂。不同分析目的,前处理操作不同,但通常包括:取样、称量、均匀化、粗分离、提纯、浓缩等步骤。复杂的前处理很容易对被测物产生污染、流失、改性等阻碍真实、精确反映分析检测结果的影响。
利用新兴质谱技术在无需任何样品前处理的情况下对复杂基体的样品的成像则是当前研究的前沿和热点之一。
自1997年美国范德堡大学(Vanderbilt University)的Richard Caprioli等首次提出MALDI质谱分子成像技术以来,质谱成像技术作为质谱技术中的一个新领域迅速发展,质谱成像技术就广泛用于样品表面直接质谱分析,特别是生物组织表面直接分析,用于蛋白组学、代谢组学、脂类组学、药代动力学等领域研究。
质谱成像分析的流程是:将被用来研究的样品置于质谱仪的靶上或样品台上,按照预先定义好的样品扫描范围、样品扫描方式、采样点扫描时间间隔和空间间隔,移动样品台,对样品中的采样点(微区)进行离子化,离子化后的离子进入质谱仪,采集质谱数据信息,如此逐步采集样品中扫描范围内的其他采样点,最后得到具有空间信息的整个样品的质谱数据,这样就可以完成对样品的“分子成像”,该分子成像图是3维图,每个点的x,y与其实际样品中采样点的对应,相对位置一样,z轴为m/z轴,表示该点化合物信息。
设定离子m/z的范围,即可确定该样品区域所含分子的种类,并选定峰高或者峰面积来代表分子的相对丰度。图像中的彩色斑点代表化合物的定位,每个斑点颜色的深浅与该点上检测到的某离子信号大小相关。通过增加单位面积上离子化样品点数量和像素,可以获得更多的样品信息,例如采用4000像素比200像素能够得到更好的样品图像。质谱分子成像技术是一种半定量或相对定量技术,图像上颜色深的部分表明有更多的生物分子聚集在样品的这个部分。然而,不可能据此确定分子在样品的不同部位的实际绝对含量。选择组织图像上的任意一个斑点,图像都能够给出一个质谱谱图或者离子谱图,代表在样品的该部位存在这种分子,然后与做指纹图谱类似,像做指纹图谱那样,将样品的离子谱图与已知标准品进行对照,分析差异,从而进行生物标志物的发现和药物作用的监控。
对于复杂基体样品质谱检测,相对于经过色谱分离后再质谱检测的数据,质谱成像数据更复杂、所包含数据信息丰富,每幅质谱数据往往不是单一组分,是多个组分的混合物,在质谱图上有多个质谱峰,给后续的数据处理和数据解释带来了难度。特别在分析两类不同的样品时,如病变与正常组织切片的差异分析、污染样品与正常样品的差异分析,改性与正常样品的差异分析、实验组与对照组间的差异分析等,存在着很多困难,难以找出差异。
不同样品质谱成像分析的差异有两类:一、是物质差异,反映在质谱图上的不同,种类不同或浓度不同;二是空间分布差异,同种含量的物质,在样品上分布明显不同。
当前分析质谱成像数据的差异方法有两种,假定对A、B两类样品做相同条件的质谱成像分析,获得A、B两类质谱成像数据:一将A、B两类分别做质谱图叠加平均,对比这两类的平均质谱图,找出差异;二是分别在A、B两类质谱成像数据图上选定样品的区域Region of Sample(简称ROS),分别给对ROS区域做平均质谱图,对比ROS内的平均质谱图,找差异。第一种方法的问题是:在对比时增加了很多无关的信息,掩盖或弱化不同样品间的真实差异,容易影响判断,不容易找出物质差异,不能找出空间差异;第二种方法的问题是,如果ROS选大了,就会出现第一种方法的问题,如果ROS选小了,就存在选择的ROS大小、形状、位置是否合适的问题,同时要求A类ROS内的数据一致性好、B类ROS内的数据一致性也好,A类ROS内的数据与B类ROS内的数据差异明显。因此,很难给出两类样品的物质差异,更难给出差异的所在区域。在分析两类不同的样品时,找出物质差异存时在如下的困难:一、同类样品间差异过大,容易掩盖不同样品间的差异;二、化学噪声或局部污染等原因产生的差别,能够被误判为差异。
发明内容
为了解决上述的技术问题,提供了质谱成像数据的差异分析方法及系统,其目的在于计算出实验组与对照组间质谱成像数据的物质差异和空间差异。
本发明提供了质谱成像数据的差异分析方法,包括:
步骤1,从第一组被测样品的质谱成像数据集和第二组被测样品的质谱成像数据集中分别选取进行差异分析的区域;
步骤2,设定代表第一组被测样品最小区域和第二组被测样品最小区域的大小和形状;
步骤3,在为第一组被测样品和第二组被测样品所选取的进行差异分析的区域中选定各最小区域对应的质谱成像数据;
步骤4,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据分别利用主成分分析方法、因子分析方法或统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异程度是否符合预设条件;将符合预设条件的最小区域的空间信息及相应的平均质谱图,或者符合预设条件的最小区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入最小区域信息集;根据区域信息集中的空间信息或者样品点之间的决定系数和样品点平均质谱图之间的决定系数计算得到差异系数;
步骤5,按照差异系数进行排序,选择与每个差异系数对应的第一组被测样品中的最小区域和二组被测样品中的最小区域;分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域存在的差异程度是否符合预设条件;扩展后的以第一组被测样品中的区域为核心的区域的界限不超出第一组被测样品的界限,扩展后的以第二组被测样品中的区域为核心的区域的界限不超出第二组被测样品的界限;将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的平均质谱图,或者将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入区域信息集。
步骤4中,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用主成分分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
步骤21,将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区域对应的质谱成像数据合并,并标记质谱成像数据的来源;
步骤22,对合并后的数据进行主成分分析,得到主成分分析载荷图信息和主成分分析得分图信息;
步骤23,设定以第一主成分为横坐标和以第二主成份为纵坐标的平面图,在该平面图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标值为该样品对应的质谱成像数据在第一主成分上的得分值,样品点的纵坐标值为该样品对应的质谱成像数据在第二主成份上的得分值;
步骤24,在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
步骤4中,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用因子分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
步骤31,将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区域对应的质谱成像数据合并成数据集AB,并标记质谱成像数据的来源;
步骤32,对数据集AB进行因子分析,得到因子载荷图信息和因子得分图信息;
步骤33,设定以第一主因子为横坐标和第二主因子为纵坐标的平面图,在该平面图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标值为该样品点对应的质谱成像数据在第一主因子上的得分值,纵坐标值为该样品点对应的质谱成像数据在第二主因子上的得分值;
步骤34,在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
利用几何判别法或聚类法判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开。
步骤4中,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
步骤41,对第一组被测样品中的最小区域对应的质谱成像数据做一致性检验,对第二组被测样品中的最小区域对应的质谱成像数据做一致性检验;一致性检验通过后,执行步骤42;
步骤42,对第一组被测样品中的最小区域对应的质谱成像数据做平均,获得第一平均质谱数据;对第二组被测样品中的最小区域对应的质谱成像数据做平均,获得第二平均质谱数据;
步骤43,提取第一平均质谱数据的质谱峰,提取第二平均质谱数据的质谱峰;
步骤44,判断第一平均质谱数据图和第二平均质谱数据图的离子种类或离子强度是否存在差异;预设条件为第一平均质谱数据图和第二平均质谱数据图的离子种类存在差异,或者第一平均质谱数据图和第二平均质谱数据图的离子种类不存在差异但离子强度存在差异,离子强度存在差异需要满足下述条件:将第一平均质谱数据图的离子强度和第二平均质谱数据图的离子强度做相关性比较后,决定系数大于或等于0.8。
分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域存在的差异系数是否符合预设条件具体包括:
步骤51,选择一个第一组被测样品中的最小区域和一个第二组被测样品中的最小区域;
步骤51,固定所选定的第一组被测样品中的最小区域,以所选定的第二组被测样品中的最小区域进行扩展,扩展后的以所选定的第二组被测样品中的最小区域为核心的区域与所选定的第一组被测样品中的最小区域存在的差异系数符合预设的条件;
步骤52,固定扩展后的以所选定的二组被测样品中的最小区域为核心的区域,以所选定的第一组被测样品中的最小区域为核心进行扩展,扩展后的以所选定的第一组被测样品中的最小区域为核心的区域与扩展后的以所选定的二组被测样品中的最小区域为核心的区域存在的差异系数符合预设的条件。
差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离除以第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和,或者差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离减去第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和。
差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和除以第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数,或者差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和减去第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数。
本发明提供了质谱成像数据的差异分析系统,包括:
差异分析区域选取模块,用于从第一组被测样品的质谱成像数据集和第二组被测样品的质谱成像数据集中分别选取进行差异分析的区域;
最小区域设定模块,用于设定代表第一组被测样品最小区域和第二组被测样品最小区域的大小和形状;
质谱成像数据选取模块,用于在为第一组被测样品和第二组被测样品所选取的进行差异分析的区域中选定各最小区域对应的质谱成像数据;
差异程度判决模块,用于将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据分别利用主成分分析方法、因子分析方法或统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异程度是否符合预设条件;将符合预设条件的最小区域的空间信息及相应的平均质谱图,或者符合预设条件的最小区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入最小区域信息集;根据区域信息集中的空间信息或者样品点之间的决定系数和样品点平均质谱图之间的决定系数计算得到差异系数;
扩展模块,用于按照差异系数进行排序,选择与每个差异系数对应的第一组被测样品中的最小区域和二组被测样品中的最小区域;分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域存在的差异程度是否符合预设条件;扩展后的以第一组被测样品中的最小区域为核心的区域的界限不超出第一组被测样品的界限,扩展后的以第二组被测样品中的最小区域为核心的区域的界限不超出第二组被测样品的界限;将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的平均质谱图,或者将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入区域信息集。
将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用主成分分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区域对应的质谱成像数据合并,并标记质谱成像数据的来源;
对合并后的数据进行主成分分析,得到主成分分析载荷图信息和主成分分析得分图信息;
设定以第一主成分为横坐标和以第二主成份为纵坐标的平面图,在该平面图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标值为该样品对应的质谱成像数据在第一主成分上的得分值,样品点的纵坐标值为该样品对应的质谱成像数据在第二主成份上的得分值;
在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用因子分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区域对应的质谱成像数据合并成数据集AB,并标记质谱成像数据的来源;
对数据集AB进行因子分析,得到因子载荷图信息和因子得分图信息;
设定以第一主因子为横坐标和第二主因子为纵坐标的平面图,在该平面图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标值为该样品点对应的质谱成像数据在第一主因子上的得分值,纵坐标值为该样品点对应的质谱成像数据在第二主因子上的得分值;
在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
差异程度判决模块利用几何判别法或聚类法判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开。
将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
对第一组被测样品中的最小区域对应的质谱成像数据做一致性检验,对第二组被测样品中的最小区域对应的质谱成像数据做一致性检验;一致性检验通过后,对第一组被测样品中的最小区域对应的质谱成像数据做平均,获得第一平均质谱数据;对第二组被测样品中的最小区域对应的质谱成像数据做平均,获得第二平均质谱数据;
提取第一平均质谱数据的质谱峰,提取第二平均质谱数据的质谱峰;
判断第一平均质谱数据图和第二平均质谱数据图的离子种类或离子强度是否存在差异;预设条件为第一平均质谱数据图和第二平均质谱数据图的离子种类存在差异,或者第一平均质谱数据图和第二平均质谱数据图的离子种类不存在差异但离子强度存在差异,离子强度存在差异需要满足下述条件:将第一平均质谱数据图的离子强度和第二平均质谱数据图的离子强度做相关性比较后,决定系数大于或等于0.8。
分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,扩展后的第一组被测样品中的最小区域和扩展后的第二组被测样品中的最小区域存在的差异系数是否符合预设条件具体包括:
选择一个第一组被测样品中的最小区域和一个第二组被测样品中的最小区域;
固定所选定的第一组被测样品中的最小区域,以所选定的第二组被测样品中的最小区域进行扩展,扩展后的以所选定的第二组被测样品中的最小区域为核心的区域与所选定的第一组被测样品中的最小区域存在的差异系数符合预设的条件;
固定扩展后的以所选定的二组被测样品中的最小区域为核心的区域,以所选定的第一组被测样品中的最小区域为核心进行扩展,扩展后的以所选定的第一组被测样品中的最小区域为核心的区域与扩展后的以所选定的二组被测样品中的最小区域为核心的区域存在的差异系数符合预设的条件。
差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离除以第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和,或者差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离减去第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和。
差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和除以第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数,或者差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和减去第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数。
本发明选定样品对比区域(从A类、B类样品质谱成像数据图中分别选定一个样品区域Region of Sample,简称ROS),定义原子区域(Atom Regionof Sample,简称AROS,能代表样品的最小的区域),在A类样品、B类样品ROS中分别选取AROS,对比这两个AROS区域内的质谱数据差异,遍历对比A类、B类样品ROS区域内的所有AROS,计算每对差异参数,按差异系数大小排序,对有显著差异的AROS进行增长,产生新的成对的子ROS区域(存在显著差异的最大子区域),从而获得精确差异区域,每对差异区域的物质差异信息。
本发明所提出的技术方案,使研究人员准确、精确分析A类样品与B类样品成像数据图间的显著差异、差异所在的样品区域,物质种类与含量差异,对于复杂基体,如病变与正常组织切片的差异分析、污染样品与正常样品的差异分析,改性与原始样品的差异分析、用药组织切片与非用药组织切片的的差异分析,提供了准确、可靠的方法。
附图说明
图1是本发明分析A样品与B样品质谱成像数据差异的方法流程图;
图2是主成分分析计算差异参数并判断差异是否显著的方法流程图;
图3是因子分析计算差异参数并判断差异是否显著的方法流程图;
图4是统计分析计算差异参数并判断差异是否显著的方法流程图;
图5是以AROS为核心的扩增差异区域的方法流程图。
具体实施方式
目前,两类复杂样品(A类、B类)的质谱成像数据图间的显著差异分析是一个难题。本发明,首先通过选定样品对比区域排除无关信息干扰,设定原子区域,在A类样品、B类样品中找出所有存在显著差别的原子区域,再以原子区域为核心逐步扩展区域,确保存在显著差异的前提下最可能的扩展区域,排除重叠的区域,从而获得精确差异区域,每对差异区域的物质差异信息。
图1是本发明分析A样品与B样品质谱成像数据差异的方法流程图。如图所示,包括以下步骤:
步骤S101,从A样品质谱成像数据集、B样品质谱成像数据集中分别选取要对比差异的区域ROS。由于质谱成像数据集,是一张质谱成像数据图像(该图像中每一个点代表一幅全扫描质谱数据),往往是整个质谱分析数据,真正样品数据包含在质谱成像数据图像中,在质谱成像数据图像中选定样品所在的区域,避免将与样品无关的其他信息纳入对比,影像判断。
步骤S102,设定能代表样品的最小的区域原子区域AROS的大小和形状。该AROS的样品点个数大于或等于1,不宜太大,也不宜太小,太大容易出现在AROS就包含了多个不同差异,太小了,给计算带来了负担,可以是2*2或2*3、或3*2、或3*3的区域,具体大小和形状视具体实验特点和目的而定。
步骤S103,按照空间顺序,分别在A样品、B样品质谱成像数据图像样品区域内选定AROS区域的数据,本步骤仅负责按空间顺序,分别选取不同的一对AROS区域数据。选择顺序可以是:首先在A样品做上选一个AROS区域,以该区域为对比对象,遍历B样品上样品区域内所有不同的AROS,每一次选择不同的一对AROS,到步骤S104进行该对AROS的对比计算,完成后再在A样品上选下一个AROS,以该区域为对比对象,遍历B样品上样品区域内所有不同的AROS;也可以在B样品上选一个AROS,以该区域为对比对象,遍历A样品上样品区域内所有不同的AROS的选择顺序。要实现A样品区域内所有不同的AROS与B样品区域内所有不同的AROS进行一次对比,既不遗漏也不重复。
步骤S104,将A类样品中选定的AROS与B样品中选定的AROS进行对比,可以通过主成分分析方法处理这两个AROS的质谱数据来进行对比,判断是否存在显著差异(图2详述),可以通过因子分析方法处理这两个AROS的质谱数据来进行对比(图3详述),判断是否存在显著差异,还可以通过统计方法处理这两个AROS的质谱数据来进行对比,判断是否存在显著差异(图4详述),计算各自的差别参数信息,代表其差异程度。如果存在显著差异,将该对AROS的空间信息及差异参数加入显著差异AROS信息集,继续下一对AROS的选择进入步骤S103,直到所有的AROS对比都完成,进入步骤S105。
步骤S105,对存在显著差异AROS信息集,按照差异系数大小排序,按从大到小选择每一对存在显著差异的AROS区域,以该对AROS区域为核心,以样品区为边界,逐步增加邻近样品点,判断增加邻近样品点后的区域是否还存在显著差别(判断方法类似步骤S104),如果存在则该邻近样品点增加到AROS为核心的区域,形成新区域,如果不存在则该样品点不纳入,直到扩展到不能再扩展为止,将新的区域信息添加到A样品与B样品质谱成像数据显著差异信息集。避免重复计算,扩增的顺序和策略图5详述。A样品与B样品质谱成像数据显著差异信息集中每一元素表示一对差异区域信息,该差异区域信息:该对区域在A样品上的空间位置(记为C1)、该对区域在B样品上的空间位置(记为C2)、该对区域在A样品上的平均质谱图(记为C3)、该对区域在B样品上的平均质谱图(记为C4),差异谱(该对区域在A样品上的平均质谱图-该对区域在B样品上的平均质谱图,记为C5)。
显著差异信息集中每一元素形式如下:
C1 | C2 | C3 | C4 | C5 |
图2是主成分分析计算差异参数并判断差异是否显著的方法流程图。如图所示,包括以下步骤:
步骤S201,将来自A样品AROS质谱成像数据集A与B样品AROS质谱成像数据集B合并形成数据集AB,标记哪些数据来源于A,哪些数据来源于B。
步骤S202,对数据集AB进行主成分分析(Principal Component Analysis,简称PCA)。PCA分析对数据具有降维和精简数据结果的作用,在PCA之前可以对数据进行数据标准化等预处理操作,PCA之后获得PCA载荷图信息和PCA得分图信息,从另一个角度来重新表示数据集AB。PCA载荷图信息表示数据集AB的特征向量,PCA得分图信息表示数据集AB在这些特征向量的投影值。PCA的计算和操作可以参照书籍(任若恩、王惠文.多元统计数据分析——理论、方法、实例.北京国防工业出版社,1997)。
步骤S203,设定以第一主成分(简称PC1)和第二主成分(简称PC2)为坐标轴(PC1为横坐标轴、PC2为纵坐标轴)的平面图,在该平面图上绘制样品点,该样品的横坐标值为该样品数据在PC1上的得分值,纵坐标值为该样品数据在PC2上的得分值。以此将数据集AB上所有样品点均分布在该平面图上。
步骤S204,在以PC1和PC2为坐标轴的平面图上判断A类点与B类点能否分开。如果能分开则认为A样品点与B样品点存在显著差异,否则认为差异不明显。判断的方法很多:如:方法一几何判别法,绘制出包含A样品所有的点的最小多边形,绘制包含B样品所有的点的最小多边形,如果这两个多变型不相交则认为能分开,差异系数可以用A样品点重心到B样品点重心的距离表示,重心距离越远,差异越大;方法二聚类法,将这些点聚类,分成两类,判断这两类是否分别是A样品点、B样品点,如果是就能分开。如果A样品点与B样品点存在显著差异则将信息增加到差异信息集中。差异信息集中每一元素代表一对区域差异信息,每对区域差异信息包括:A样品点所在的空间区域、B样品点所在的空间区域,主成分分析载荷图信息、A样品点所占多变形面积、B样品点所占多变形面积、A样品点多边形与B样品点多边形间最近点间的距离,A样品点多边形与B样品点多边形重心间的距离,差异系数。其中差异系数代表差异的程度,可以是:差异系数=A样品点多边形与B样品点多边形重心间的距离/(A样品点多边形的面积+B样品点多边形的面积),也可以是:差异系数=A样品点多边形与B样品点多边形重心间的距离-(A样品点多边形的面积+B样品点多边形的面积)。
图3是因子分析计算差异参数并判断差异是否显著的方法流程图。如图所示,包括以下步骤:
步骤S301,将来自A样品AROS质谱成像数据集A与B样品AROS质谱成像数据集B合并形成数据集AB,标记哪些数据来源于A,哪些数据来源于B。
步骤S302,对数据集AB进行因子分析。因子分析是一种多元统计分析的方法,通过对数据矩阵进行特征分析、旋转变换等操作,可获取数据的相关信息。在因子之前可以对数据进行数据标准化等预处理操作,可以设定80%以上的因子贡献率阈值,因子后获得因子载荷图信息和因子得分图信息,从另一个角度来重新表示数据集AB,因子载荷图信息表示数据集AB的特征向量,因子得分图信息表示数据集AB在这些特征向量的投影值。因子分析的计算和操作可以参照书籍(王学民.应用多元分析.上海上海财经大学出版社,2009)
步骤S303,设定以第一主因子和第二主因子为坐标轴(第一主因子为横坐标轴、第二主因子为纵坐标轴)的平面图,在该平面图上绘制样品点,该样品的横坐标值为该样品数据在第一主因子上的得分值,纵坐标值为该样品数据在第二主因子上的得分值。以此将数据集AB上所有样品点均分布在该平面图上。
步骤S304,在以第一主因子和第二主因子为坐标轴的平面图上判断A样品点与B样品点能否分开。如果能分开则认为A样品点与B样品点存在显著差异,否则认为差异不明显。判断的方法很多:如:方法一几何判别法,绘制出包含A样品所有的点的最小多边形,绘制包含B样品所有的点的最小多边形,如果这两个多变型不相交则认为能分开,差异系数可以用A样品点重心到B样品点重心的距离表示,重心距离越远,差异越大;方法二聚类法,将这些点聚类,分成两类,判断这两类是否分别是A样品点、B样品点,如果是就能分开。如果A样品点与B样品点存在显著差异则将信息增加到差异信息集中。差异信息集中每一元素代表一对区域差异信息,每对区域差异信息包括:A样品点所在的空间区域、B样品点所在的空间区域,主成分分析载荷图信息、A样品点所占多变形面积、B样品点所占多变形面积、A样品点多边形与B样品点多边形间最近点间的距离,A样品点多边形与B样品点多边形重心间的距离,差异系数。其中差异系数代表差异的程度,可以是:差异系数=A样品点多边形与B样品点多边形重心间的距离/(A样品点多边形的面积+B样品点多边形的面积),也可以是:差异系数=A样品点多边形与B样品点多边形重心间的距离-(A样品点多边形的面积+B样品点多边形的面积)。
图4是统计分析计算差异参数并判断差异是否显著的方法流程图。如图所示,包括以下步骤:
步骤S401,对B样品AROS质谱成像数据集B做一致性检验,计算数据集B的相关性,如果数据集B内的数据一致性优于0.9,可认定为通过一致性检验,认为该数据集自身是一样品数据,彼此间差异不显著,否则,退出计算。
步骤S402,对A样品AROS质谱成像数据集A做一致性检验,计算数据集B的相关性,如果数据集B内的数据一致性优于0.9,可认定为通过一致性检验,认为该数据集自身是一样品数据,彼此间差异不显著,否则,退出计算。
步骤S403,将B样品AROS质谱成像数据集B做平均,获得平均质谱数据。
步骤S404,将A样品AROS质谱成像数据集A做平均,获得平均质谱数据。
步骤S405,提取A平均质谱数据的质谱峰,提取B平均质谱数据的质谱峰,从离子(m/z)种类和离子强度进行对比:首选对比离子种类,看A样品有的离子种类,B样品是否都有,B样品有的离子种类,A样品是否都有;对于A、B样品都有的离子种类,分别比较每一个离子的信号强度是否相同,具体判断是否存在差异,进入步骤406。
步骤S406,判断A、B质谱图是否存在差异。如果离子种类存在差异则认为存在显著差异,如果离子种类没行差异,但是离子强度存在显著差异也认为存在显著差异。离子种类存在差异的判断方法:如果存在A样品有的离子,B样品没有,或者B样品有的离子,A样品没有则认为存在差异;离子强度存在显著差异的判断方法:将两组离子强度做相关性分析,设定离子强度表示a1(x1,y1)、a2(x2,y2)、……、ai(xi,yi)……、an(xn,yn),其中,ai表示第i种离子,xi表示该离子在A样品中的信号强度、yi表示该离子在B样品中的信号强度,计算其相关性(倪永年.化学计量学在分析化学中的应用.北京科学出版社,2004),应用代表相关程度的决定系数(相关系数的平方)R2的大小来判断是否相关,如果相关则认为不存在差异,不过不相关则认为存在差异,若R2小于0.8则认为不相关,存在显著差异。将存在显著差异的对比信息列入A样品与B样品质谱成像数据显著差异信息集。差异信息集中每一元素代表一对区域差异信息,每对区域差异信息包括:A样品点所在的空间区域、B样品点所在的空间区域,A样品点间的决定系数平均值、B样品点间的决定系数平均值、A样品点平均质谱图与B样品点平均质谱图间决定系数,差异系数。其中差异系数代表差异的程度,可以是:差异系数=(A样品点间的决定系数平均值+B样品点间的决定系数平均值)/A样品点平均质谱图与B样品点平均质谱图间决定系数,也可以是:差异系数=(A样品点间的决定系数平均值+B样品点间的决定系数平均值)-A样品点平均质谱图与B样品点平均质谱图间决定系数。
图5是以AROS为核心的扩增差异区域的方法流程图。如图所示,包括以下步骤:
步骤S501,对A样品与B样品AROS质谱成像数据显著差异信息,按照差异系数从大到小排序。
步骤S502,按序选取一对AROS质谱成像数据显著差异信息,即按顺序分布选取A样品AROS区域和B样品AROS区域的数据信息。
步骤S503,判断步骤S502所选取的AROS是否已经包含在扩展的新区域中,如果存在就没有必要继续扩增,对下一对AROS进行扩展。判断的方法是:选取A样品的AROS,与A样品中已成功扩增区域的进行比对,若该AROS包含在任何一个扩增的区域内,则进入步骡S502;如果不是,选取B样品的AROS,与B样品中已成功扩增的区域的进行比对,若该AROS包含在任何一个扩增的区域内,则进入步骤S502,否则进入步骤S504。
步骤S504,以B样品AROS为比较对象,以A样品AROS为核心,逐步扩展A样品的区域,可以按照顺时针方向或逆时针方向,围绕A样品AROS向外临近区域扩增,每增加一个样品点就应用步骤S505所示方法比对实验。
步骤S505,以B样品AROS为比较对象,对于以A样品AROS为核心新增一个像素形成的新区域,再对比这新区域是否存在差异,如果存在则新增像素加入到A样品区域,如果不存在差异,则不需要该像素点,标记该点以免重复计算(该点向外扩增的区域不予考虑)。如此,进入步骤S504,增加下一个点,在保证存在显著差异的前提下,将以A样品AROS为核心增加到最大,不能超过A样品区域边界,对已经判断不存在差异的像素点不再向外扩展,形成A样品的新区域。
步骤S506,以A样品新区域为比较对象,以B样品AROS为核心,逐步扩展B样品的区域,可以按照顺时针方向或逆时针方向,围绕B样品AROS向外临近区域扩增,每增加一个样品点就应用步骤S507所示方法比对实验。。
步骤S507,以A样品新区域为比较对象,对于以B样品AROS为核心新增一个像素形成的新区域,再对比这新区域是否存在差异,如果存在则新增像素加入到A样品区域,如果不存在差异,则不需要该像素点,标记该点以免重复计算。如此,进入步骤S506,增加下一个点,在保证存在显著差异的前提下,将以B样品AROS为核心增加到最大,不能超过B样品区域边界,对已经判断不存在差异的像素点不再向外扩展,形成B样品的新区域。保存A样品的新区域、B样品的新区域的信息到A样品与B样品质谱成像数据显著差异信息(扩增区域)。扩增区域信息包括:A样品的新区域空间信息、B样品的新区域的空间信息。
步骤S508,判断是否所有的AROS均扩增完毕,如果完毕就结束,没有就进行下一对AROS的扩展运算,进入步骤501。
本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条件下,还可以对以上内容进行各种各样的修改。因此本发明的范围并不仅限于以上的说明,而是由权利要求书的范围来确定的。
Claims (16)
1.质谱成像数据的差异分析方法,其特征在于,包括:
步骤1,从第一组被测样品的质谱成像数据集和第二组被测样品的质谱成像数据集中分别选取进行差异分析的区域;
步骤2,设定代表第一组被测样品最小区域和第二组被测样品最小区域的大小和形状;
步骤3,在为第一组被测样品和第二组被测样品所选取的进行差异分析的区域中选定各最小区域对应的质谱成像数据;
步骤4,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据分别利用主成分分析方法、因子分析方法或统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异程度是否符合预设条件;将符合预设条件的最小区域的空间信息及相应的平均质谱图,或者符合预设条件的最小区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入区域信息集;根据区域信息集中的空间信息或者样品点之间的决定系数和样品点平均质谱图之间的决定系数计算得到差异系数;
步骤5,按照差异系数进行排序,选择与每个差异系数对应的第一组被测样品中的最小区域和第二组被测样品中的最小区域;分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,比较扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域存在的差异程度是否符合预设条件;扩展后的以第一组被测样品中的区域为核心的区域的界限不超出第一组被测样品的界限,扩展后的以第二组被测样品中的区域为核心的区域的界限不超出第二组被测样品的界限;将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的平均质谱图,或者将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入区域信息集。
2.如权利要求1所述的质谱成像数据的差异分析方法,其特征在于,步骤4中,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用主成分分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
步骤21,将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区域对应的质谱成像数据合并,并标记质谱成像数据的来源;
步骤22,对合并后的数据进行主成分分析,得到主成分分析载荷图信息和主成分分析得分图信息;
步骤23,设定以第一主成分为横坐标和以第二主成份为纵坐标的平面图,在该平面图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标值为该样品对应的质谱成像数据在第一主成分上的得分值,样品点的纵坐标值为该样品对应的质谱成像数据在第二主成份上的得分值;
步骤24,在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
3.如权利要求1所述的质谱成像数据的差异分析方法,其特征在于,步骤4中,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用因子分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
步骤31,将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区域对应的质谱成像数据合并成数据集AB,并标记质谱成像数据的来源;
步骤32,对数据集AB进行因子分析,得到因子载荷图信息和因子得分图信息;
步骤33,设定以第一主因子为横坐标和第二主因子为纵坐标的平面图,在该平面图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标值为该样品点对应的质谱成像数据在第一主因子上的得分值,纵坐标值为该样品点对应的质谱成像数据在第二主因子上的得分值;
步骤34,在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
4.如权利要求2或3所述的质谱成像数据的差异分析方法,其特征在于,利用几何判别法或聚类法判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开。
5.如权利要求1所述的质谱成像数据的差异分析方法,其特征在于,步骤4中,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
步骤41,对第一组被测样品中的最小区域对应的质谱成像数据做一致性检验,对第二组被测样品中的最小区域对应的质谱成像数据做一致性检验;一致性检验通过后,执行步骤42;
步骤42,对第一组被测样品中的最小区域对应的质谱成像数据做平均,获得第一平均质谱数据;对第二组被测样品中的最小区域对应的质谱成像数据做平均,获得第二平均质谱数据;
步骤43,提取第一平均质谱数据的质谱峰,提取第二平均质谱数据的质谱峰;
步骤44,判断第一平均质谱数据图和第二平均质谱数据图的离子种类或离子强度是否存在差异;预设条件为第一平均质谱数据图和第二平均质谱数据图的离子种类存在差异,或者第一平均质谱数据图和第二平均质谱数据图的离子种类不存在差异但离子强度存在差异,离子强度存在差异需要满足下述条件:将第一平均质谱数据图的离子强度和第二平均质谱数据图的离子强度做相关性比较后,决定系数大于或等于0.8。
6.如权利要求1所述的质谱成像数据的差异分析方法,其特征在于,分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,比较扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域存在的差异系数是否符合预设条件具体包括:
步骤51,选择一个第一组被测样品中的最小区域和一个第二组被测样品中的最小区域;
步骤52,固定所选定的第一组被测样品中的最小区域,以所选定的第二组被测样品中的最小区域进行扩展,比较扩展后的以所选定的第二组被测样品中的最小区域为核心的区域与所选定的第一组被测样品中的最小区域存在的差异系数符合预设的条件;
步骤53,固定扩展后的以所选定的第二组被测样品中的最小区域为核心的区域,以所选定的第一组被测样品中的最小区域为核心进行扩展,比较扩展后的以所选定的第一组被测样品中的最小区域为核心的区域与扩展后的以所选定的第二组被测样品中的最小区域为核心的区域存在的差异系数符合预设的条件。
7.如权利要求2或3所述的质谱成像数据的差异分析方法,其特征在于,差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离除以第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和,或者差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离减去第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和。
8.如权利要求6所述的质谱成像数据的差异分析方法,其特征在于,差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和除以第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数,或者差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和减去第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数。
9.质谱成像数据的差异分析系统,其特征在于,包括:
差异分析区域选取模块,用于从第一组被测样品的质谱成像数据集和第二组被测样品的质谱成像数据集中分别选取进行差异分析的区域;
最小区域设定模块,用于设定代表第一组被测样品最小区域和第二组被测样品最小区域的大小和形状;
质谱成像数据选取模块,用于在为第一组被测样品和第二组被测样品所选取的进行差异分析的区域中选定各最小区域对应的质谱成像数据;
差异程度判决模块,用于将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据分别利用主成分分析方法、因子分析方法或统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异程度是否符合预设条件;将符合预设条件的最小区域的空间信息及相应的平均质谱图,或者符合预设条件的最小区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入区域信息集;根据区域信息集中的空间信息或者样品点之间的决定系数和样品点平均质谱图之间的决定系数计算得到差异系数;
扩展模块,用于按照差异系数进行排序,选择与每个差异系数对应的第一组被测样品中的最小区域和第二组被测样品中的最小区域;分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,比较扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域存在的差异程度是否符合预设条件;扩展后的以第一组被测样品中的最小区域为核心的区域的界限不超出第一组被测样品的界限,扩展后的以第二组被测样品中的最小区域为核心的区域的界限不超出第二组被测样品的界限;将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的平均质谱图,或者将扩展后的第一组被测样品中的区域和扩展后的第二组被测样品中的区域的空间信息及相应的样品点之间的决定系数和相应的样品点平均质谱图之间的决定系数加入区域信息集。
10.如权利要求9所述的质谱成像数据的差异分析系统,其特征在于,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用主成分分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区域对应的质谱成像数据合并,并标记质谱成像数据的来源;
对合并后的数据进行主成分分析,得到主成分分析载荷图信息和主成分分析得分图信息;
设定以第一主成分为横坐标和以第二主成份为纵坐标的平面图,在该平面图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标值为该样品对应的质谱成像数据在第一主成分上的得分值,样品点的纵坐标值为该样品对应的质谱成像数据在第二主成份上的得分值;
在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
11.如权利要求9所述的质谱成像数据的差异分析系统,其特征在于,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用因子分析方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
将第一组被测样品中的最小区域对应的质谱成像数据与第二组被测样品中的最小区域对应的质谱成像数据合并成数据集AB,并标记质谱成像数据的来源;
对数据集AB进行因子分析,得到因子载荷图信息和因子得分图信息;
设定以第一主因子为横坐标和第二主因子为纵坐标的平面图,在该平面图上绘制第一组被测样品中的最小区域与第二组被测样品中的最小区域包含的样品点;样品点的横坐标值为该样品点对应的质谱成像数据在第一主因子上的得分值,纵坐标值为该样品点对应的质谱成像数据在第二主因子上的得分值;
在该平面图上判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开;预设条件为第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能分开。
12.如权利要求10或11所述的质谱成像数据的差异分析系统,其特征在于,差异程度判决模块利用几何判别法或聚类法判断第一组被测样品中的最小区域包含的样品点与第二组被测样品中的最小区域包含的样品点能否分开。
13.如权利要求9所述的质谱成像数据的差异分析系统,其特征在于,将第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据利用统计方法比较第一组被测样品中的最小区域对应的质谱成像数据和第二组被测样品中的最小区域对应的质谱成像数据存在的差异系数是否符合预设条件包括:
对第一组被测样品中的最小区域对应的质谱成像数据做一致性检验,对第二组被测样品中的最小区域对应的质谱成像数据做一致性检验;一致性检验通过后,对第一组被测样品中的最小区域对应的质谱成像数据做平均,获得第一平均质谱数据;对第二组被测样品中的最小区域对应的质谱成像数据做平均,获得第二平均质谱数据;
提取第一平均质谱数据的质谱峰,提取第二平均质谱数据的质谱峰;
判断第一平均质谱数据图和第二平均质谱数据图的离子种类或离子强度是否存在差异;预设条件为第一平均质谱数据图和第二平均质谱数据图的离子种类存在差异,或者第一平均质谱数据图和第二平均质谱数据图的离子种类不存在差异但离子强度存在差异,离子强度存在差异需要满足下述条件:将第一平均质谱数据图的离子强度和第二平均质谱数据图的离子强度做相关性比较后,决定系数大于或等于0.8。
14.如权利要求9所述的质谱成像数据的差异分析系统,其特征在于,分别以第一组被测样品中的最小区域和第二组被测样品中的最小区域为核心扩展样品点,比较扩展后的第一组被测样品中的最小区域和扩展后的第二组被测样品中的最小区域存在的差异系数是否符合预设条件具体包括:
选择一个第一组被测样品中的最小区域和一个第二组被测样品中的最小区域;
固定所选定的第一组被测样品中的最小区域,以所选定的第二组被测样品中的最小区域进行扩展,比较扩展后的以所选定的第二组被测样品中的最小区域为核心的区域与所选定的第一组被测样品中的最小区域存在的差异系数符合预设的条件;
固定扩展后的以所选定的第二组被测样品中的最小区域为核心的区域,以所选定的第一组被测样品中的最小区域为核心进行扩展,比较扩展后的以所选定的第一组被测样品中的最小区域为核心的区域与扩展后的以所选定的第二组被测样品中的最小区域为核心的区域存在的差异系数符合预设的条件。
15.如权利要求10或11所述的质谱成像数据的差异分析系统,其特征在于,差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离除以第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和,或者差异系数等于第一组被测样品中的最小区域包含的样品点组成的多边形的重心与第二组被测样品中的最小区域包含的样品点组成的多边形的重心间的距离减去第一组被测样品中的最小区域包含的样品点组成的多边形的面积与第二组被测样品中的最小区域包含的样品点组成的多边形的面积之和。
16.如权利要求13所述的质谱成像数据的差异分析系统,其特征在于,差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和除以第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数,或者差异系数等于第一组被测样品中的最小区域包含的样品点之间的决定系数平均值与第二组被测样品中的最小区域包含的样品点之间的决定系数平均值之和减去第一组被测样品中的最小区域包含的样品点的平均质谱图与第二组被测样品中的最小区域包含的样品点的平均质谱图之间的决定系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101946347A CN101865880B (zh) | 2010-05-28 | 2010-05-28 | 质谱成像数据的差异分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101946347A CN101865880B (zh) | 2010-05-28 | 2010-05-28 | 质谱成像数据的差异分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101865880A CN101865880A (zh) | 2010-10-20 |
CN101865880B true CN101865880B (zh) | 2012-11-14 |
Family
ID=42957683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010101946347A Active CN101865880B (zh) | 2010-05-28 | 2010-05-28 | 质谱成像数据的差异分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101865880B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112378986A (zh) * | 2021-01-18 | 2021-02-19 | 宁波华仪宁创智能科技有限公司 | 质谱分析方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109100411A (zh) * | 2018-06-14 | 2018-12-28 | 中国矿业大学 | 一种针对煤可溶有机质的化学计量学分析方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101354379A (zh) * | 2008-01-18 | 2009-01-28 | 许洋 | 用质谱检测多发性骨髓瘤特征蛋白的试剂 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000171442A (ja) * | 1998-12-02 | 2000-06-23 | Hitachi Ltd | 質量分析方法及び装置 |
GB2410800B (en) * | 2004-02-06 | 2007-12-12 | Statoil Asa | Fingerprinting of hydrocarbon containing mixtures |
JP4819657B2 (ja) * | 2006-11-24 | 2011-11-24 | 大陽日酸株式会社 | Fabms測定の前処理方法 |
-
2010
- 2010-05-28 CN CN2010101946347A patent/CN101865880B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101354379A (zh) * | 2008-01-18 | 2009-01-28 | 许洋 | 用质谱检测多发性骨髓瘤特征蛋白的试剂 |
Non-Patent Citations (5)
Title |
---|
JP特开2000-171442A 2000.06.23 |
JP特开2008-128923A 2008.06.05 |
刘念等.临床质谱学的最新进展:质谱成像方法及其应用.《中国仪器仪表》.2007,76-80. * |
张莹等.基质辅助激光解吸电离质谱用于生物组织的质谱成像应用进展.《质谱学报》.2009,第30卷(第4期),250-256. * |
黄泽建等.气相色谱矩形离子阱质谱联用仪的设计与性能.《分析化学》.2008,413-418. * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112378986A (zh) * | 2021-01-18 | 2021-02-19 | 宁波华仪宁创智能科技有限公司 | 质谱分析方法 |
CN112378986B (zh) * | 2021-01-18 | 2021-08-03 | 宁波华仪宁创智能科技有限公司 | 质谱分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101865880A (zh) | 2010-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11790629B2 (en) | Intensity normalization in imaging mass spectrometry | |
Angelo et al. | Multiplexed ion beam imaging of human breast tumors | |
CN104297355B (zh) | 一种基于液相色谱/质谱联用的拟靶标代谢组学分析方法 | |
US9606101B2 (en) | Deep MALDI TOF mass spectrometry of complex biological samples, e.g., serum, and uses thereof | |
US8873796B2 (en) | Mass analysis data processing method and mass analysis data processing apparatus | |
US8433122B2 (en) | Method and apparatus for processing mass analysis data | |
JP4602374B2 (ja) | クロマトグラフィー質量分析方法、及びクロマトグラフ質量分析装置 | |
US8743138B2 (en) | Method and system for processing mass analysis data | |
US20120303288A1 (en) | Mass spectrometry data analysis method and analysis device | |
JP5246026B2 (ja) | 質量分析データ処理装置 | |
JP2006528339A (ja) | クロマトグラフィー/質量分析における生体分子パターンのアノテーション法及びシステム | |
Guo et al. | Evaluation of significant features discovered from different data acquisition modes in mass spectrometry-based untargeted metabolomics | |
GB2586710A (en) | Chromatography mass spectrometry method, and chromatograph mass spectrometry device | |
Sampsonidis et al. | Computational analysis and ratiometric comparison approaches aimed to assist column selection in hydrophilic interaction liquid chromatography–tandem mass spectrometry targeted metabolomics | |
Lisec et al. | Extending the dynamic range in metabolomics experiments by automatic correction of peaks exceeding the detection limit | |
Yu et al. | A chemometric-assisted method based on gas chromatography–mass spectrometry for metabolic profiling analysis | |
CN101865880B (zh) | 质谱成像数据的差异分析方法及系统 | |
Ju et al. | A graph density-based strategy for features fusion from different peak extract software to achieve more metabolites in metabolic profiling from high-resolution mass spectrometry | |
JPWO2015052842A1 (ja) | 質量分析データ解析装置 | |
Oppenheimer et al. | Tissue analysis by imaging MS | |
JP2016133339A (ja) | 質量分析データ処理装置および質量分析データ処理方法 | |
GB2595344A (en) | Processing of spatially resolved, ion-spectrometric measurement signal data to determine molecular content scores in two-dimensional samples | |
JP5007326B2 (ja) | クロマトグラフィー質量分析方法、及びクロマトグラフ質量分析装置 | |
Cooper et al. | An assessment of AcquireX and Compound Discoverer software 3.3 for non-targeted metabolomics | |
CN110462783A (zh) | 在质谱分析中生成发现离子电流及其用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |