CN102683149B - 质量分析数据处理方法和质量分析数据处理系统 - Google Patents

质量分析数据处理方法和质量分析数据处理系统 Download PDF

Info

Publication number
CN102683149B
CN102683149B CN201210035543.8A CN201210035543A CN102683149B CN 102683149 B CN102683149 B CN 102683149B CN 201210035543 A CN201210035543 A CN 201210035543A CN 102683149 B CN102683149 B CN 102683149B
Authority
CN
China
Prior art keywords
data
information
index
mass
raw spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210035543.8A
Other languages
English (en)
Other versions
CN102683149A (zh
Inventor
池上将弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of CN102683149A publication Critical patent/CN102683149A/zh
Application granted granted Critical
Publication of CN102683149B publication Critical patent/CN102683149B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3059Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0004Imaging particle spectrometry

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Electron Tubes For Measurement (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及质量分析数据处理方法和质量分析数据处理系统,能够在保持原始的通过对质量分析数据进行行程编码所获得的压缩数据的数组的同时,快速获得压缩数据中的期望m/z值处的强度值。通过将原始谱数据数组中零强度连续出现两次以上的部分的开始位置或原始谱数据数组中强度值有意义的数据的序列的开始位置与压缩数据数组中的相应位置配对来创建索引。将该索引与压缩数据分开地存储在存储区域中。索引的创建不会影响压缩数据数组。因此,即使通过不使用该索引的数据处理系统也可以解压缩该数据。索引有助于快速定位与期望m/z相对应的压缩数据并获得所需的强度值。

Description

质量分析数据处理方法和质量分析数据处理系统
技术领域
本发明涉及一种用于处理通过质量分析所收集到的数据的方法,尤其涉及一种适于能够获取示出试样上的二维区域内的特定质荷比的信号强度的分布的图像(以下将将这一图像称为“质量分析结果图像”)的成像质谱仪的数据处理方法。本发明还涉及使用这一方法的质谱仪。
背景技术
质谱成像是一种通过对诸如一块生物组织等的试样的二维区域内的多个微小区域分别进行质量分析来研究具有指定质荷比(m/z)的物质的分布的技术。该技术可望用于例如药物发现、生物标志物寻找和各种疾病的病因探究。通常将针对质谱成像所设计的质谱仪称为成像质谱仪。由于这种类型的装置的操作通常包括用于对试样上的任意区域进行显微观察、基于观察图像选择感兴趣的区域并且对所选择的区域进行成像质量分析的步骤,所以还可以将其称为质量显微镜。在下面的说明中,将使用术语“成像质谱仪”。非专利文献1和2公开了公知的成像质谱仪的结构和利用这些成像质谱仪进行的分析的例子。
图9示意性示出通过利用成像质谱仪进行分析所获得的数据和基于该数据的图像显示处理。如图所示,在成像质谱仪中,对于试样100上的二维区域101内的大量测量点(微小区域)102中的每一个,获得许多质量分析数据。在非专利文献1和2所公开的成像质谱仪中,根据来自试样的离子的质荷比,通过飞行时间质谱仪来分离这些离子。在具有这一结构的系统中,在每一测量点可以获得示出离子强度的时间变化的飞行时间谱数据,并且将飞行时间值转换成质荷比来创建质谱。成像质谱仪的空间分辩能力依赖于试样100上的测量点102的间隔。为增大空间分辩能力以获得更高分辨率的图像,需要增加测量点102的数量。当设置大量测量点102时,在对于测量所选择的二维区域101内将获得巨大量的飞行时间谱数据。
例如,考虑以采样频率1GHz对约20ms的时间范围的飞行时间谱信号进行采样,并且将该信号的每一样本转换成16位数字信号的情况。在飞行时间谱中,在各测量点收集的样本的数量约为20000。由于每一样本都是2字节数据,所以一个样本的总数据量约为40KB。如果在测量区域内以250×250像素的网格模式二维配置测量点,则测量点的数量为62500,并且从该测量区域所获得的总数据量大约2.32GB。如果缩小测量点的间隔以增大测量点的数量来增强空间分辩能力,或者如果扩大作为测量的对象的二维区域,总数据量将进一步增大。当增大飞行时间谱信号的采样频率以提高质量精度或质量分辩能力时,发生总数据量的进一步增大。因此,以高分辨率和/或高质量分辩能力获得的质谱成像数据具有大的数据大小。
为从以上述方式所收集的质量分析数据提取有意义的信息,必须在视觉上呈现与质谱上的各峰值相对应的质荷比的空间分布,以让分析操作者解释数据的意义或者使用计算机进行估计处理。为有效进行这类工作,如图9所示,需要从各测量点102的质谱提取与指定质荷比(在图9的例子中,m/z=M1)相对应的强度值,并且高速在视觉上呈现该强度值的二维分布。为此,必须将构成质谱或飞行时间谱的质量分析数据装载进计算机的主存储器(通常为随机存取存储器)。
然而,当使用一般类型的个人计算机时,由于主存储器仅存在有限的实际可用空间,所以难以将高分辨率质量分析数据整个装载进主存储器。一种用于处理不能被整个装载进主存储器的大规模的质量分析数据的技术是,将数据的一部分分割成可被装载进主存储器的小规模,并且使用该部分数据创建图像。然而,在这种情况下,不可能同时显示和分析大空间范围和宽质量范围的数据。用于显示和分析大空间范围和宽质量范围的数据的一个可能方法是使用外部存储器装置(例如,硬盘)的一部分作为虚拟主存储器,然而,这不可避免地导致处理速度的明显下降。此外,当分析旨在比较两个以上试样的数据、以及处理各试样的数据时,甚至必须在主存储器上装载和处理更大量的数据。实际上,不可能利用常用的个人计算机来处理这么大量的数据。
对于在计算机上处理大量的数据,通常使用的技术是通过数据压缩来降低数据的大小。该技术也可应用于上述大的大小的质量分析数据来降低数据大小,从而使得可以在计算机的主存储器上处理整个数据量。然而,为了创建质量分析结果或者其它目的,使用数据压缩技术将整个质量分析数据装载进主存储器,这样导致下面的问题。
作为用于压缩构成质谱或飞行时间谱的质量分析数据的方法,通常采用使用邻近数据点之间的相互关系的方法。例如,根据专利文献1所述技术,对于图9所示的各质谱,可以使用质荷比轴上相互邻近的多个数据点的相互关系,进行基于行程编码或熵编码的数据压缩。该操作降低了各质谱的,即各测量点102的质量分析数据的大小,从而使得可以同时将试样100的二维区域101内的所有测量点102的质量分析数据装载进主存储器。
当分析操作者想要观察指定质荷比的质量分析结果图像时,必须利用计算机从各测量点的质谱数据提取指定质荷比的信号强度信息、并使所提取的信息经过图像创建处理。如果存储在主存储器中的质量分析数据是非压缩数据,则通过从与正考虑的质荷比相对应的存储地址读取强度值、并将读取值重建成图像,可以容易地创建图像。另一方面,如果质量分析数据是编码压缩数据,则不可能马上知道与指定质荷比相对应的存储地址。因此,在读取与指定质荷比相对应的强度值之前,需要临时解压缩质谱数据。
必须对在测量点所获得的各质谱重复上述用于收集与指定质荷比相对应的强度值的处理,这使用长的时间段。因此,显示一个质量分析结果图像需要相当长的时间。如上所述,对于成像质量分析,搜索各种质荷比的大量的质量分析数据以找到具有有意义的空间分布的质荷比的工作是根本。如果质量分析结果图像的显示需要长的时间,则该搜索的吞吐量将明显下降。
通常已知,数据压缩技术历史最久且使用范围最广的技术领域是图像处理。这是因为,图像常常包含相对大量的数据,并且常常需要通过具有有限传输速率的信道或者经由具有有限容量的其它类型的介质来发送和接收具有大量数据的图像。例如,在处理黑白二值图像的传真中使用上述行程编码。在这种图像相关的领域中,也非常需要用于快速找到压缩数据数组中的哪一位置对应于原始(非压缩)数据数组中的期望位置的方法。例如,在专利文献2提出的用于利用行程编码压缩位图图像数据的方法中,使用用于示出原始(非压缩)数据数组中的位置和行程编码数据数组中的位置之间的对应关系的索引来提高找到期望位置的速度。更具体地,对于压缩图像数据数组中以一定间隔所定义的每一位置,嵌入用于表示原始数据中的哪一位置对应于该位置的索引信息。
这一使用索引信息的加速技术也可适用于质量分析数据的压缩。然而,在用于在压缩数据中以一定间隔嵌入索引信息的方法中,必须对通过索引分开的各部分都完成行程编码(或者类似压缩处理),这导致数据压缩效率下降。此外,通过在没有预期到数据中存在索引信息的情况下被设计用于读取压缩数据的系统,不能正确读取嵌入了索引信息的压缩数据。也就是说,索引信息的嵌入使一些现有系统对于压缩质量分析数据不能保持向后兼容性。
背景技术文献
专利文献
专利文献1:WO-A 12009-069225
专利文献2:JP-A 2007-103982
非专利文献
非专利文献1:Kiyoshi Ogawa et al.,“Kenbi ShitsuryouBunse ki Souchi No Kaihatsu,”(“Research and Development ofMass Microscope”)Shimadzu Review,Mar.31,2006,vol.62,nos.3·4,pp.125-135
非专利文献2:Takahiro Harada et al.,“Kenbi ShitsuryouBunseki Souchi Ni Yoru Seitai Soshiki Bunseki,”(“BiologicalTissue Analysis Using Mass Microscope”)Shimadzu Review,Apr.24,2008,vol.64,no s.3·4,pp.139-146
发明内容
发明要解决的问题
考虑到上述问题开发了本发明,并且本发明的一个目的是提供一种质量分析数据处理方法,其中,该质量分析数据处理方法能够压缩以高空间分辩能力和高质量分辩能力所获得的质量分析结果图像的数据,以利用最小的信息损失来降低图像的数据大小,而且还能够从压缩数据高速读取与任意质荷比或飞行时间相对应的强度信息。本发明的另一目的是提供一种质量分析数据处理方法,其中,该质量分析数据处理方法能够在不会影响数据压缩效率的情况下压缩质量分析结果图像的数据,通过该质量分析数据处理方法,可以高速读取与任意质荷比或飞行时间相对应的强度信息,并且即使通过不支持高速读取的系统,也可以正确读取所需信息。本发明还提供使用这些方法的质谱仪。
用于解决问题的方案
旨在解决上述问题的本发明的第一方面是一种质量分析数据处理方法,用于处理通过质量分析所收集的强度信息的一维数组形式的原始谱数据,并包括:
a)压缩步骤,根据预定的算法对所述原始谱数据进行压缩处理,并且将由此获得的一维数组形式的压缩数据存储在第一存储区域中;
b)索引信息创建步骤,创建用于将所述原始谱数据的一维数组中某一强度信息的存在位置与所述压缩数据的一维数组中同所述强度信息相对应的压缩信息的存在位置相关联的索引信息,并且将所述索引信息存储在与所述第一存储区域分开的第二存储区域中;以及
c)信息恢复步骤,当给出用于输出所述原始谱数据的一维数组中特定位置处的强度信息的命令时,通过参考所述第二存储区域中的所述索引信息识别与所述特定位置相对应的所需压缩信息的存储位置,从所述第一存储区域读取所需压缩信息,并且解压缩所读取的信息以获得所述特定位置处的强度信息。
本发明的第二方面是一种用于处理质量分析成像数据的质量分析数据处理方法,在所述质量分析成像数据中,通过对试样上的多个测量部位分别进行质量分析所收集的强度信息的一维数组形式的原始谱数据与所述测量部位的空间位置信息相关联,所述质量分析数据处理方法包括:
a)压缩步骤,根据预定算法压缩所述原始谱数据,并且将一维数组形式的压缩数据存储在第一存储区域中;
b)索引信息创建步骤,创建用于将所述原始谱数据的一维数组中某一强度信息的存在位置与所述压缩数据的一维数组中同所述强度信息相对应的压缩信息的存在位置相关联的索引信息,并且将所述索引信息存储在与所述第一存储区域分开的第二存储区域中;
c)位置计算步骤,当指定用于创建质量分析结果图像的质荷比时,计算所述原始谱数据的一维数组中与所指定的质荷比相对应的位置;
d)信息恢复步骤,对于所有的测量部位或者特定范围内的测量部位组中的各测量部位,通过参考存储在所述第二存储区域中的所述索引信息,识别与在所述位置计算步骤中所计算出的位置相对应的所需压缩信息的存储位置,从所述第一存储区域读取所需压缩信息,并且解压缩所读取的信息以获得所计算出的位置处的强度信息;以及
e)图像创建步骤,使用在所述信息恢复步骤中所获得的各测量部位的强度信息和这些测量部位的空间位置信息,创建示出期望质荷比的强度信息的二维分布的质量分析结果图像。
在根据本发明的第二方面的所述质量分析数据处理方法的一个模式下,所述质量分析成像数据是利用具有用于拍摄试样的光学显微图像的摄像装置的成像质谱仪所收集的大量数据,并且在所述图像创建步骤中,通过将期望质荷比的强度信息显示在利用所述摄像装置所拍摄的试样的光学显微图像上的相应位置处来创建所述质量分析结果图像。
在根据本发明第一或第二方面的所述质量分析数据处理方法中,在所述压缩步骤中,通过行程编码、熵编码或者这两种编码的组合以无损方式压缩所述原始谱数据的至少一部分。
“所述原始谱数据的一维数组”通常包括分别与不同质荷比相对应的、按照质荷比顺序排列的强度值。然而,根据质谱仪的类型或其它因素,可针对值与质荷比一一对应的其它参数的各值获得强度值,在这一情况下,可以按照该参数的值的顺序来排列强度值。例如,如果质谱仪是飞行时间质谱仪,则原始谱数据的一维数组可以是分别在不同飞行时间值时所获得的、按照飞行时间值的顺序排列的强度值。
作为根据本发明第一或第二方面的所述质量分析数据处理方法的一个具体模式,可以如下进行上述步骤:
在所述压缩步骤中进行所述压缩处理,以使得:所述原始谱数据的一维数组中等于或小于预定水平的各强度值被替换为特定值,所述特定值按照所述数组的顺序连续出现两次以上的各部分被替换为表示所述特定值的连续出现次数的值,而对于由除所述特定值以外的强度值构成的各序列,紧挨在各序列之前插入表示构成该序列的强度值的个数的值;
在所述索引信息创建步骤中,创建由分别包括如下数值对的多个项构成的列表作为所述索引信息,其中,所述数值对中的一个数值用于保持所述原始谱数据的一维数组中与连续出现所述特定值的开始位置有关的位置信息或与由除所述特定值以外的强度值构成的序列的开始位置有关的位置信息,并且所述数值对中的另一数值用于保持所述压缩数据的一维数组中与连续出现所述特定值的开始位置相对应的位置信息或与由除所述特定值以外的强度值构成的序列的开始位置相对应的位置信息;以及
在所述信息恢复步骤中,当要获得特定位置的强度值时,搜索所述列表以找到包括所述特定位置的强度值的序列的开始位置,并且从所述压缩数据的数组中的相应位置处读取所需强度值。
在质量分析数据处理方法的该模式下,在压缩步骤中,将原始谱数据的一维数组中等于或小于预定水平的各强度值(即,可被认为无意义的各强度值)替换为特定值(例如,0)。随后,将强度值0按照数组的顺序连续出现两次以上的部分替换为表示0的连续出现次数的值,而对于由有意义的强度值构成的序列,紧挨在该序列之前插入表示构成该序列的强度值的个数的值。然后,在索引信息创建步骤中,将原始谱数据的一维数组中强度值0连续出现两次以上的各部分的开始位置与压缩数据的一维数组中同该开始位置相对应的位置配对,并且类似地,将原始谱数据的一维数组中包括有意义的强度值的各数据序列的开始位置与压缩数据的一维数组中同该开始位置相对应的位置配对。将这样所创建的位置对组合成索引信息,并且将索引信息与压缩数据分开地存储在不同的存储区域中。
在任何一维数组中都不是以根据数据内容而变化的一定间隔来创建示出原始谱数据和压缩数据之间位置关系的信息。换句话说,位置关系信息的创建对要压缩的数据的单位(或长度)没有限制,因此不会对压缩效果产生不利影响。由于不将索引信息嵌入压缩数据,而是将其与压缩数据分开地存储在不同的存储区域中,所以可以通过仅使用压缩数据而不参考索引信息的普通解压缩技术来恢复原始谱数据。
例如,在信息恢复步骤中,可以以下面的方式从压缩数据读取所需信息:在原始谱数据的一维数组中,假定X表示需要获得强度值的质荷比值或者与质荷比值相对应的其它参数(例如,飞行时间)的值的位置;在信息恢复步骤中,访问保持索引信息的第二存储区域,以从原始谱数据的位置信息的列表中选择值小于X的位置中的具有最大值的位置;随后,假定T表示索引信息中与所选择的位置值S配对的压缩数据的位置,访问保持在第一存储区域中的压缩数据以读取位置T处的值。例如,考虑下面的情况:以二值形式表示数据值,并且根据各数据的最高有效位的值(0或1)来判断该数据是对应于强度值0的序列还是对应于有意义强度值的序列。如果所读取的数据值的最高有效位是“0”,则意味着从该点开始连续出现0,并且由所读取的数据的值表示出现次数。因此,对于由所表示的数量的0组成的后续部分,由于已推导出该部分内的强度值都是0,所以不必重建原始谱。另一方面,如果在位置T处所读取的数据的最高有效位是“1”,则意味着从该点开始连续出现有意义(非零)强度值,并且所读取的数据的除最高有效位以外的值表示出现次数。因此,可以在压缩数据中从位置T正前X-S的位置处检索到指定位置的强度值。
作为与指定质荷比相对应的位置X,必须搜索索引信息的列表中具有最接近值的位置。这通常可以这样实现:从索引信息中原始谱数据的位置的列表的第一项开始搜索,直到找到具有大于X的值的第一个位置为止,并且选择紧挨在所找到的位置之前的位置。当原始谱数据包括宽的质荷比范围时,或者当质量分辩能力高时,由于一维数组中存在非常大量的元素,所以对于大于X的值的搜索处理可能需要相当大量的时间。为应对该问题,可以使用二级索引作为辅助索引,其中,利用二级索引,可以通过简单数学运算定位索引信息的列表中最接近与指定质荷比相对应的位置X的数值。
二级索引的一个例子是表,其中,该表针对原始质谱数据的一维数组中位于预定数据位置间隔处的多个数据中的每一个数据,示出索引信息的列表中用于保持在关注数据的位置之前的数据中值与关注位置的值最接近的数据的行号(由原始谱数据的一维数组中的位置信息和压缩数据的一维数组中的位置信息构成的对的序号)。
在这种情况下,根据本发明第一或第二方面的所述质量分析数据处理方法还包括二级索引创建步骤,其中,在所述二级索引创建步骤中,任意设置所述原始谱数据的一维数组中的数据位置间隔D,并且通过重复下面的处理直到D×χ的值超过所述原始谱数据的一维数组的元素的数量为止来创建所述二级索引:从所述索引信息中的保持所述原始谱数据的位置的一维数组的第一个元素开始,顺次将该一维数组中的各元素的值P与D×χ的值进行比较,并且当P第一次超过D×χ时,将所述索引信息的紧挨着的上一元素中所包括的原始谱数据存储位置的值写入所述二级索引的第χ个元素。
如果与索引信息分开地保持二级索引,则在信息恢复步骤中,用于获得所述原始谱数据中预定位置X处的强度值的处理可以包括以下步骤:将预定位置X除以数据位置间隔D以获得商M;参考所述二级索引的第M个元素以获得所述索引信息中最接近所述预定位置X的位置;从所获得的所述索引信息中的位置读取原始谱数据存储位置的值W;按照原始谱数据存储位置的升序继续所述读取处理,直到所读取的值W超过所述预定位置X的值为止;一旦所读取的值W超过所述预定位置X的值,读取所述索引信息中所述原始谱数据的存储位置的紧挨着当前读取元素的上一位置处的值;将所读取的值设置为所述压缩数据的一维数组中包括所述预定位置X的强度值的序列的开始位置;以及读取所述预定位置X处的强度值。
当原始谱数据具有大量元素并且谱相对复杂时,索引信息的列表将具有大量的行。即使在这一情况下,在二级索引的帮助下,也可以快速获得所需的位置对应关系信息、确定正确的与期望的原始谱数据部分相对应的压缩数据部分、并且获得原始谱数据的强度值。例如,该技术有效缩短了获得期望质量分析数据或创建期望质荷比处的质量分析结果图像的处理时间。
旨在解决上述问题的本发明的第三方面是一种质量分析数据处理系统,其中,所述质量分析数据处理系统使用根据本发明第一方面的质量分析数据处理方法来处理通过质量分析所收集的强度信息的一维数组形式的原始谱数据、存储处理后的数据、并且基于所存储的数据恢复原始谱数据或者响应于来自用户的指示输出所恢复的数据或基于所恢复的数据的分析结果;所述质量分析数据处理系统包括:
a)数据压缩器,用于根据预定算法压缩所述原始谱数据,并且将一维数组形式的压缩数据存储在第一存储区域中;
b)索引信息创建器,用于创建用于将所述原始谱数据的一维数组中某一强度信息的存在位置与所述压缩数据的一维数组中同所述强度信息相对应的压缩信息的存在位置相关联的索引信息,并且将所述索引信息存储在与所述第一存储区域分开的第二存储区域中;以及
c)信息恢复器,用于响应于输出所述原始谱数据的一维数组中特定位置处的强度信息的命令,通过参考所述第二存储区域中的所述索引信息识别与所述特定位置相对应的所需压缩信息的存储位置,从所述第一存储区域读取所需压缩信息,并且解压缩所读取的信息以获得所述特定位置处的强度信息。
旨在解决上述问题的本发明的第四方面是一种质量分析数据处理系统,其中,所述质量分析数据处理系统使用根据本发明第二方面的质量分析数据处理方法来处理质量分析成像数据、存储处理后的数据、并且基于所存储的数据恢复原始谱数据或者响应于来自用户的指示输出所恢复的数据或基于所恢复的数据的分析结果,其中,在所述质量分析成像数据中,通过对试样上的多个测量部位分别进行质量分析所收集的强度信息的一维数组形式的原始谱数据与所述测量部位的空间位置信息相关联,所述质量分析数据处理系统包括:
a)数据压缩器,用于根据预定算法压缩所述原始谱数据,并且将一维数组形式的压缩数据存储在第一存储区域中;
b)索引信息创建器,用于创建用于将所述原始谱数据的一维数组中某一强度信息的存在位置与所述压缩数据的一维数组中同所述强度信息相对应的压缩信息的存在位置相关联的索引信息,并且将所述索引信息存储在与所述第一存储区域分开的第二存储区域中;
c)位置计算器,用于响应于对质量分析结果图像的质荷比的指定,计算所述原始谱数据的一维数组中与所指定的质荷比相对应的位置;
d)信息恢复器,用于对所有的测量部位或者特定范围内的测量部位组中的各测量部位,通过参考存储在所述第二存储区域中的所述索引信息,识别与所述位置计算器所计算出的位置相对应的所需压缩信息的存储位置,从所述第一存储区域读取所需压缩信息,并且解压缩所读取的信息以获得所计算出的位置处的强度信息;以及
e)图像创建器,用于使用通过所述信息恢复器所获得的各测量部位的强度信息和这些测量部位的空间位置信息,创建示出期望质荷比的强度信息的二维分布的质量分析结果图像。
发明的效果
在根据本发明的第一和第二方面的质量分析数据处理方法、以及根据本发明的第三和第四方面的质量分析数据处理系统中,不必为了创建索引信息而限制要压缩的数据的长度。因此,例如,当使用行程编码时,可以在一维数组的同一值的各序列的整个行程上不中断地连续进行编码处理。因此,可以获得高水平的数据压缩效率。在不对压缩数据作任何改变的情况下创建用于示出原始数据和压缩数据之间的对应关系的索引信息。因此,无需考虑是否存在索引信息,即使通过仅压缩或解压缩数据的简单处理也可以正确地恢复谱数据。也就是说,根据本发明的第一~第四方面,可以在保持对谱数据的处理的向后兼容性的同时,通过使用索引信息来提高数据读取速度。
附图说明
图1是示出根据本发明用于进行质量分析数据处理方法的质谱仪的一个实施例的示意性结构图。
图2是示出根据本发明一个实施例的质量分析数据处理方法中的数据压缩处理的一个例子的图。
图3是示出根据本实施例的质量分析数据处理方法中的索引创建处理的一个例子的图。
图4是示出在根据本实施例的质量分析数据处理方法中用于创建索引的程序的流程图。
图5是示出在根据本实施例的质量分析数据处理方法中用于使用索引恢复原始数据的程序的流程图。
图6是示出在根据本发明的另一(第二)实施例的质量分析数据处理方法中用于创建二级索引的程序的流程图。
图7是示出根据第二实施例的质量分析数据处理方法中的二级索引的例子的流程图。
图8是示出在根据第二实施例的质量分析数据处理方法中使用二级索引恢复原始数据的程序的流程图。
图9是示出利用成像质谱仪所获得的数据的内容和使用所获得的数据的显示处理的示意图。
附图标记说明
1...成像质谱仪单元
2...数据处理器
20...谱数据收集器
21...主存储器
22...数据压缩器
23...数据解压缩器
24...索引创建器
25...数据读取器
26...图像创建器
3...数据存储器
30...压缩数据存储区域
31...索引存储区域
4...操作单元
5...显示单元
具体实施方式
下面将参考附图说明根据本发明的质量分析数据处理方法的一个实施例和使用该方法的质谱仪。
首先参考图2~图5说明根据本发明的一个实施例的质量分析数据处理方法。图2是示出根据本实施例的质量分析数据处理方法中的数据压缩处理的一个例子的图,并且图3是示出根据本实施例的质量分析数据处理方法中的索引创建处理的一个例子的图。
下面说明用于压缩构成质谱的一组数据的情况,其中,横坐标轴表示质荷比m/z,并且纵坐标轴表示信号强度,如图2上部所示。与一个质荷比相对应的每一谱数据都是2字节数据。(下面使用十六进制来示出数据值。当本说明书中出现这些值时,将其括在大括号{}中。)“原始谱数据的一维数组”是按照质荷比的升序排列的数据值序列。在飞行时间质谱仪的情况下,在将飞行时间值转换成质荷比之前,同样可以以上述方式组织通过飞行时间质量分析所获得的构成飞行时间谱的一组数据。
原始谱数据的压缩
在压缩通过质量分析所获得的质谱数据之前,将谱数据的一维数组中的各强度值与预定噪声水平进行比较。以0替换小于该噪声水平的任何强度值,而保持等于或高于该噪声水平的其它强度值。由于检测器中的噪声或其它因素,质谱或飞行时间谱通常包含相当大量的微小的无意义信号,并且通过前面所述的处理可以有效清除这类无意义信号。在作为结果的谱中,除有意义峰值以外的部分中的每一个极有可能由强度值“0”的序列构成。
随后,按照质荷比的升序,分别检查通过上述处理所获得的原始谱数据的一维数组中的强度值。每当强度值“0”连续出现两次以上(如图2和3中的{0000}所示),以表示0的连续出现次数的值替换0序列。在本系统中,一次可处理的最大连续出现次数为32767。如果0序列超过该长度,以{7FFF}替换前述的32767个0,并且将剩余0的数量储存在压缩数据数组的下一行中。
当在原始谱数据数组中发现了一个以上的具有意义的非零强度值的数据时,在压缩数据数组中将表示非零值出现次数的值储存在紧挨在该非零部分之前的位置处,在该位置之后,顺次储存强度值。出现次数的上限32767也适用于该情况。对于超过该长度的序列,重复使用相同算法以储存该序列中剩余强度值的数量。应该注意,将紧挨在非零部分之前要插入的表示非零强度值的连续出现次数的值的最高有效位(MSB)设置成“1”。这意味着,实际上以2字节(16比特)数据的除MSB以外的15比特表示用于表示连续出现次数的数值。如果表示连续出现次数的2字节数据具有等于或大于32768(=215)的标称值,则可以马上明白,2字节数据表示非零强度值的连续出现次数,并且在二进制的情况下,通过从16比特值去除MSB,或者在十六进制的情况下,从2字节数据的值减去{8000},就可以计算实际出现次数。
例如,图2所示的原始谱数据数组以5个有意义的非零数据值开始。因此,将具有被设置成“1”的MSB且其它位表示出现次数即5的值{8005}储存为压缩数据数组的第一个元素,此后,将原始谱数据数组中的上述5个值复制到压缩数据数组。因此,原始谱数据数组中的5个连续数据对应于压缩数据数组中的6个连续数据。随后,在原始谱数据数组中,连续出现强度值为0的4个数据。在压缩数据数组中,以值为{0004}的一个数据来表示该零数据序列。根据这类编码规则,将原始谱数据数组转换成压缩数据数组。通过上述说明,显然原始谱数据数组包含的零强度数据的连续出现次数越大,本压缩算法的压缩效率越高。
用于将原始谱数据与压缩数据相关联的索引的创建
“索引”是表示原始谱数据数组中的位置和压缩数据数组中的位置之间的对应关系的一组信息。索引的具体例子可为如下的项的列表,其中,每一个项将原始谱数据数组中连续两次以上出现零强度值的部分的开始位置或者原始谱数据数组中具有有意义强度值的数据的序列的开始位置与压缩数据数组中的相应位置相关联。例如,将图3的原始谱数据数组的第6个元素与压缩数据数组的第7个元素相关联,同时,将原始谱数据数组的第10个元素与压缩数据数组的第8个元素相关联。
通过图4的流程图示出用于创建索引的程序。图4的左部分的图示出读出点如何根据该流程图中的具体步骤在压缩数据数组中移动。在图4中,i是原始谱数据数组中的位置,j是压缩数据数组中的位置,并且intensity(强度)是从压缩数据数组读取的一个数据值。
当给出原始谱数据数组和压缩数据数组并且启动索引创建处理时,将参数i和j初始化成i=1和j=1,并且将这些值写入索引的第一行(步骤S1)。随后,将储存在压缩数据数组中的j=1(即第一行)处的数据值设置在参数intensity中(步骤S2)。在图3的例子中,从该数组读取{8005},并且将其设置在intensity中。
接着,判断intensity的MSB是否是“0”(步骤S3)。根据上述压缩算法,如果MSB为“0”,则该数据表示零强度数据的连续出现次数,并且如果MSB为“1”,则该数据表示有意义数据的连续出现次数。在图3的例子中,此时设置在intensity中的{8005}的MSB不是“0”。因此,操作从步骤S3进入步骤S4,在步骤S4,以“0”替换intensity的MSB。结果,将intensity的值从{8005}校正成{0005}。随后,将参数i和j更新为i←i+intensity和j←j+intensity+1,并且将i和j的新的值写入索引的下一行(步骤S5)。在图3的例子中,新的值为i=1+5=6且j=1+5+1=7,并且将这些值写入索引的第二行。
随后,压缩数据数组中的读取点从当前位置正向移动intensity+1,并且将新读取点处的数据值设置为intensity的新值(步骤S6)。在本例子中,由于intensity=5,所以读取点从第1个元素(j=1)正向移动6(=intensity+1),并且读取第7个元素(j=7)处的数据值。如果在新读取点没有找到数据值(步骤S9为“否”),则停止该处理,否则,操作返回到步骤S3。在上述例子中,在从第7个数据读取{0004}并且将其设置在intensity中之后,操作返回到步骤S3,并且由于{0004}的MSB为“0”而进一步进入步骤S7。在步骤S7,将参数i和j更新为i←i+intensity和j←j+1,并且将i和j的新值写入索引的下一行。在本例子中,新值为i=6+4=10且j=7+1=8,并且将该一对值写入索引的第三行。
随后,压缩数据数组中的读取点从当前位置正向移动1,将新读取点处的数据值设置在intensity中(步骤S 8),并且操作进入步骤S9。在本例子中,将压缩数据数组中的读取点从第7个元素正向移动1,并且将第8个元素的数据值{8006}设置为intensity的新值。在步骤S9之后,操作返回到步骤S3,并且以上述方式通过步骤S4和S5进一步进入步骤S6。结果,将i=16(=10+6)且j=15(=8+6+1)写入索引的第四行。
通过上述处理,获得列表形式的对应位置信息,其中,列表的每一项将原始谱数据数组中连续出现零强度的部分的开始位置或者有意义的非零强度值的序列的开始位置与压缩数据数组中与该开始位置相对应的位置相关联。该索引不一定是根据压缩数据来恢复原始谱数据所必需。然而,如下所述,该索引有助于快速计算任意质荷比的强度值。
使用索引获得指定质荷比的强度值
当将压缩数据和索引存储在存储器中时,可以通过进行下面的处理来获得任意质荷比的强度值。
通过图5所示的流程图详细示出用于使用索引读取强度值的程序。
当指定任意质荷比时,计算原始谱数据数组中与指定质荷比相对应的位置X(步骤S11)。实际需要的是在原始谱数据的一维数组的元素中定位与指定质荷比最接近的位置。可选地,在用于最终计算强度值的处理中,可以确定在指定质荷比两侧的两个以上的位置,计算所确定的位置处的强度值的加权平均值,并且输出计算出的平均值作为指定质荷比处的强度值。
如果原始谱数据的一维数组的元素不是质荷比而是飞行时间值,则最初应该利用质谱仪特有的质荷比-飞行时间转换表将指定质荷比转换成飞行时间值,并且应该定位最接近所获得的飞行时间值的位置。
在以上述方式计算出位置X之后,访问索引以在索引中的原始数据位置信息的列表中选择小于X的值中的最大值。以S表示所选择的值存在的位置。然后,确定索引中与所选择的值配对的压缩数据数组中位置T(步骤S12)。随后,访问压缩数据以读取第T行处的数据值,并且将其设置在intensity中(步骤S13)。
如上所述,根据本实施例采用的压缩算法的规则,如果读取的压缩数据的值的MSB是“0”,则意味着在该位置之后连续出现了通过所读取的数据的值表示的多次零强度。另一方面,如果读取的压缩数据的值的MSB为“1”,则意味着在该位置之后连续出现了以除MSB以外的值所表示的多次有意义的强度数据。因此,判断intensity的MSB是否为“0”(步骤S 14)。如果发现MSB为“0”,则以零数据替换intensity的值(步骤S15),并且输出该数据作为原始谱数据数组中与指定质荷比m/z相对应的位置X处的强度值(步骤S17)。
另一方面,如果在步骤S14发现intensity的MSB不是“0”,则将压缩数据数组中在第T行之后(X-S)行的行处的数据值设置在intensity中(步骤S16),并且操作进入步骤S17。因此,获得原始质谱数据数组中的位置X处的强度值。
质谱仪的结构和操作
图1是示出用于进行上述质量分析数据处理方法的成像质谱仪的一个实施例的框图。该质谱仪包括用于如以上参考图9所述对试样进行二维质量分析以获得各测量点的质谱数据的成像质谱仪单元1、用于进行上述质量分析数据处理方法的数据处理器2、用于存储通过数据处理器2压缩后的数据和索引的数据存储器3、由用户操作的操作单元4、以及用于显示分析结果或其它信息的显示单元5。数据处理器2实际上是包括中央处理单元(CPU)、随机存取存储器(RAM)、只读存储器(ROM)和其它组件的个人计算机,并且从功能角度看,数据处理器2包括谱数据收集器20、主存储器21、数据压缩器22、数据解压缩器23、索引创建器24、数据读取器25、图像创建器26和其它功能块。数据存储器3具有两个分开的存储区域,即用于存储压缩数据的压缩数据存储区域30和用于存储索引的索引存储区域31。
谱数据收集器20读取通过成像质谱仪单元1中的质量分析所获得的质谱数据,并且将该数据临时存储在外部辅助存储装置(诸如硬盘等,未示出)或者数据存储器3的除上述存储区域30和31以外的区域中。数据压缩器22根据上述算法,压缩与测量点相对应的各质谱数据,并且将压缩后的数据存储在压缩数据存储区域30中。索引创建器24使用质谱数据(原始谱数据)和压缩数据,根据上述处理步骤创建各测量点的索引,并且将该索引存储在数据存储器3的索引存储区域31中。
对于每一对质谱数据(原始谱数据)数组和压缩谱数据数组创建索引。因此,将创建与测量点相同数量的索引。在将通过质量分析所收集的整个质谱数据组的压缩数据和索引存储在数据存储器3中之后,原始质谱数据由于不再需要而被丢弃。
当用户想要使用存储在数据存储器3中的数据显示质量分析结果图像时,用户通过操作单元4指定与质谱有关的期望质荷比的值、并且输入命令。在接收到该命令时,数据读取器25将所需的压缩数据和索引从数据存储器3读入主存储器21。对于各测量点,数据解压缩器23根据上述处理步骤,计算与指定质荷比相对应的强度值。在本实施例中,由于对于数据压缩使用无损行程编码,所以可以根据压缩数据恢复与原始谱数据相同的强度值。图像创建器26通过二维配置分别针对测量点获得的强度值,创建指定质荷比的质量分析结果图像。将创建的图像显示在显示单元5的屏幕上。
如上所述,索引的使用使得系统能够快速地获得期望质荷比的强度值,从而快速显示质量分析结果图像。将索引存储在与压缩数据存储区域30完全分开的索引存储区域31中。因此,尽管这需要较长处理时间,但是可以在不使用索引的情况下通过传统数据解压缩方法来独立地读取和解压缩压缩数据,以确定与期望质荷比相对应的强度值、创建质量分析结果图像并显示所创建的图像。因此,即使在数据恢复处理中不使用索引的系统也可以使用存储在数据存储器3中的数据来显示质量分析结果图像。
质量分析数据处理方法的另一实施例
当以宽质荷比范围或者高质量分辩能力收集质谱数据时,原始谱数据数组的元素的数量将增大。此外,当获得的谱复杂时,索引也复杂(具有大量的行),这可能导致使用索引的搜索需要长的时间段。在这种情况下,使用有助于参考主索引的二级索引能有效缩短搜索时间。下面将参考图6~图8说明除使用主索引以外还使用二级索引的一个实施例。
图6是示出用于创建二级索引的程序的流程图,图7是示出根据图3所示的数据创建的索引的二级索引的例子的流程图,并且图8是示出用于使用二级索引读取强度值的程序的流程图。
参考图6和图7,下面说明在主索引的创建之后所进行的、用于创建二级索引的程序。在图6中,参数i表示二级索引的位置(行),并且参数j表示原始谱数据数组中的位置。在用于创建二级索引的处理中,应该预先设置适当的数据位置间隔D。在下面的例子中,D=10。
当启动二级索引创建处理时,将主索引的第一行处的原始谱数据位置值设置在参数P中(步骤S21)。在图7的例子中,P=1。接着,将参数i和j初始化成i=1和j=1,并且将j的值写入二级索引的第i行(步骤S22)。在该情况下,如图7所示,将值1写入二级索引的第一行。
随后,判断i×D的值(即本例子中的i×10)是否等于或大于P(步骤S23)。当i=1且P=1时,步骤S23的判断结果为“是”,并且操作进入步骤S26,在步骤S26,将主索引的下一行处的原始谱数据位置值设置在P中。随后,将j加1(步骤S27)。在图7的例子中,主索引的第二行处的原始谱数据位置值是6,因而P=6且j=2。如果主索引没有剩余未读取的值,则步骤S28的判断结果为“否”,并且将停止该处理。如果在主索引中保留一个以上的数据未读取,则操作返回到步骤S23。当i=1且P=6时,步骤S23的判断结果再次为“是”,因而以上述方式,操作通过步骤S26和S27进入S28。在图7的例子中,在步骤S26读取主索引的第三行处的原始谱数据位置值,得出P=10且j=3。在步骤S28之后,操作返回到步骤S23。
当i=1且P=10时,步骤S23的判断结果再次为“是”,因而操作通过步骤S26和S27进入S28。在图7的例子中,在步骤S26读取主索引的第四行处的原始谱数据位置值,得出P=16且j=4。在步骤S28之后,操作返回到步骤S23。此时,由于i=1且P=16,所以步骤S23的判断结果为“否”,因而将j-1写入二级索引的第i+1行(步骤S24)。在i=1且j=4的情况下,将j-1=3写入二级索引的第二行。随后,将i加1(步骤S25)并且操作返回到步骤S23。
因此,在图6所示的处理中,从主索引的第一行开始顺次读取原始谱数据位置值的每一个,并且将其与i×D,即作为二级索引中的写入点所选择的行的顺序编号(i)和数据位置间隔D的乘积进行比较。当从主索引读取的值第一次超过i×D时,将主索引的当前读取点的上一行处的位置信息写入二级索引的第i+1行中。通过进行这些操作直到主索引的最后一行为止,完成二级索引。可以任意设置D的值。D的值越大,二级索引越粗,从而导致索引搜索需要越长时间。然而,由于包括索引的总数据量降低,所以压缩效率更高。
下面将参考图8说明用于使用二级索引恢复数据的处理。
当指定感兴趣的质荷比(或飞行时间等)并且确定原始谱数据数组中的相应位置X时,将X除以数据位置间隔D以获得商M(步骤S31)。随后,访问二级索引以读取存储在第M+1行的数值,并且将该值设置在参数V中(步骤S32)。参考图3和图7,考虑需要获得原始谱数据数组的第12行处的强度值,即{0800},的情况。将X=12除以D=10得出M=1。因此,将二级索引的第二行处的值读取为V=3。
接着,将储存在主索引的第U=V+1行中的原始谱数据位置值设置在参数W中(步骤S33),并且将W与X进行比较(步骤S34)。如果X小于W,则将储存在主索引的第U-1行的压缩数据位置设置在T中(步骤S35)。然后,读取压缩数据数组的第W行处的数据值,并且以上述方式进行使用第W行及其随后行的数据值的数据恢复处理。
例如,在V=3的情况下,储存在主索引的第四行中的原始谱数据位置值为16,因而W=16且X=12。利用这些值,步骤S34的判断结果为“否”。因此,读取储存在主索引的第U-1行(即第三行)中的压缩数据位置值,即8,并且将该值设置为T=8。然后,在压缩数据数组中,读取第八个值{8006},并且进行上述数据恢复处理以获得{0800}的强度值。
另一方面,如果X等于或大于W,则读取主索引的下一行的原始谱数据位置值作为W的值(步骤S36),并且在将U加1(步骤S37)之后,操作返回到步骤S34。重复步骤S34、S36和S37的处理直到原始谱数据位置值超过X为止。当原始谱数据位置值超过X时,读取与储存在当前原始谱数据位置的上一行中的值配对的压缩数据位置数值,此后以上述方式进行数据恢复处理。
因此,二级索引的使用使得能够快速访问主索引中的所需信息,从而可以高速进行使用主索引的数据恢复。将每一二级索引与一个特定主索引相关联。因此,在实际系统中,可以在同一存储区域中存储这两个索引。
尽管上述实施例都使用行程编码进行数据压缩,但是上述说明也适用于使用熵编码进行数据压缩的系统。
应该注意,上述实施例仅是本发明的例子。在任何观点来看,除上述实施例以外在本发明的精神内适当进行的任何改变、修改或添加自然落在本专利申请书的权利要求的范围内。

Claims (10)

1.一种质量分析数据处理方法,用于处理通过质量分析所收集的强度信息的一维数组形式的原始谱数据,包括:
a)压缩步骤,根据预定的算法对所述原始谱数据进行压缩处理,并且将所获得的一维数组形式的压缩数据存储在第一存储区域中;
b)索引信息创建步骤,创建用于将所述原始谱数据的一维数组中某一强度信息的存在位置与所述压缩数据的一维数组中同该强度信息相对应的压缩信息的存在位置相关联的索引信息,并且将所述索引信息存储在与所述第一存储区域分开的第二存储区域中;以及
c)信息恢复步骤,当给出用于输出所述原始谱数据的一维数组中特定位置处的强度信息的命令时,通过参考所述第二存储区域中的所述索引信息识别与所述特定位置相对应的所需压缩信息的存储位置,从所述第一存储区域读取所需压缩信息,并且解压缩所读取的信息以获得所述特定位置处的强度信息。
2.一种质量分析数据处理方法,用于处理质量分析成像数据,在所述质量分析成像数据中,通过对试样上的多个测量部位分别进行质量分析所收集的强度信息的一维数组形式的原始谱数据与所述测量部位的空间位置信息相关联,所述质量分析数据处理方法包括:
a)压缩步骤,根据预定的算法压缩所述原始谱数据,并且将所获得的一维数组形式的压缩数据存储在第一存储区域中;
b)索引信息创建步骤,创建用于将所述原始谱数据的一维数组中某一强度信息的存在位置与所述压缩数据的一维数组中同该强度信息相对应的压缩信息的存在位置相关联的索引信息,并且将所述索引信息存储在与所述第一存储区域分开的第二存储区域中;
c)位置计算步骤,当指定用于创建质量分析结果图像的质荷比时,计算所述原始谱数据的一维数组中与所指定的质荷比相对应的位置;
d)信息恢复步骤,对于所有的测量部位或者特定范围内的测量部位组中的各测量部位,通过参考存储在所述第二存储区域中的所述索引信息,识别与在所述位置计算步骤中所计算出的位置相对应的所需压缩信息的存储位置,从所述第一存储区域读取所需压缩信息,并且解压缩所读取的信息以获得所计算出的位置处的强度信息;以及
e)图像创建步骤,使用在所述信息恢复步骤中所获得的各测量部位的强度信息和这些测量部位的空间位置信息,创建示出期望质荷比的强度信息的二维分布的质量分析结果图像。
3.根据权利要求2所述的质量分析数据处理方法,其特征在于,
所述质量分析成像数据是利用具有用于拍摄试样的光学显微图像的摄像装置的成像质谱仪所收集的大量数据;以及
在所述图像创建步骤中,通过将期望质荷比的强度信息显示在利用所述摄像装置所拍摄的试样的光学显微图像上的相应位置处,来创建所述质量分析结果图像。
4.根据权利要求1~3中任一项所述的质量分析数据处理方法,其特征在于,在所述压缩步骤中,通过行程编码、熵编码或者这两种编码的组合以无损方式压缩所述原始谱数据的至少一部分。
5.根据权利要求4所述的质量分析数据处理方法,其特征在于,
在所述压缩步骤中进行压缩处理以使得:
所述原始谱数据的一维数组中等于或小于预定水平的各强度值被替换为特定值,
所述特定值按照数组的顺序连续出现两次以上的各部分被替换为表示所述特定值的连续出现次数的值,而
对于由除所述特定值以外的强度值构成的各序列,紧挨在该序列之前插入表示构成该序列的强度值的个数的值;
在所述索引信息创建步骤中,创建由分别包括如下的数值对的多个项构成的列表作为所述索引信息,其中
所述数值对中的一个数值用于保持所述原始谱数据的一维数组中与连续出现所述特定值的开始位置有关的位置信息或与由除所述特定值以外的强度值构成的序列的开始位置有关的位置信息,并且
所述数值对中的另一数值用于保持所述压缩数据的一维数组中与连续出现所述特定值的开始位置相对应的位置信息或与由除所述特定值以外的强度值构成的序列的开始位置相对应的位置信息;以及
在所述信息恢复步骤中,当要获得给定位置处的强度值时,搜索所述列表以找到包括所述给定位置的强度值的序列的开始位置,并且从所述压缩数据的一维数组中的相应位置处读取所需的强度值。
6.根据权利要求1~3中任一项所述的质量分析数据处理方法,其特征在于,还包括用于创建二级索引的二级索引创建步骤,其中,所述二级索引用于针对所述原始谱数据的一维数组中位于预定数据位置间隔处的多个数据中的每一个数据,示出所述索引信息的列表中用于保持在关注数据的位置之前的数据中值与关注位置的值最接近的数据的行号。
7.根据权利要求6所述的质量分析数据处理方法,其特征在于,进行所述二级索引创建步骤,以
根据需要设置所述原始谱数据的一维数组中的数据位置间隔D,并且
在D×χ的值超过所述原始谱数据的一维数组的元素的数量之前,通过重复以下处理来创建所述二级索引:
从所述索引信息中的保持所述原始谱数据的位置的一维数组的第一个元素开始,顺次将该一维数组中的各元素的值P与D×χ的值进行比较,并且
当P第一次超过D×χ时,将包括在所述索引信息的紧挨着的上一元素中的原始谱数据的存储位置的值写入所述二级索引的第χ个元素,
其中,χ表示作为所述二级索引中的写入点所选择的行的顺序编号。
8.根据权利要求7所述的质量分析数据处理方法,其特征在于,在所述信息恢复步骤中,用于获得所述原始谱数据中预定位置X处的强度值的处理包括以下步骤:
将所述预定位置X除以数据位置间隔D以获得商M;
参考所述二级索引的第M个元素以获得所述索引信息中最接近所述预定位置X的位置;
从所述索引信息中所获得的位置处读取所述原始谱数据的存储位置的值W;
按照所述原始谱数据的存储位置的升序继续所述读取的处理,直到所读取的值W超过所述预定位置X的值为止;
一旦所读取的值W超过所述预定位置X的值,读取所述索引信息中所述原始谱数据的存储位置的紧挨着当前所读取元素的上一位置处的值;
将所读取的值设置为所述压缩数据的一维数组中包括所述预定位置X的强度值的序列的开始位置;以及
读取所述预定位置X处的强度值。
9.一种质量分析数据处理系统,用于处理通过质量分析所收集的强度信息的一维数组形式的原始谱数据、存储处理后的数据、并且基于所存储的数据恢复原始谱数据或者响应于来自用户的指示输出所恢复的数据或基于所恢复的数据的分析结果,所述质量分析数据处理系统包括:
a)数据压缩器,用于根据预定的算法压缩所述原始谱数据,并且将一维数组形式的压缩数据存储在第一存储区域中;
b)索引信息创建器,用于创建用于将所述原始谱数据的一维数组中某一强度信息的存在位置与所述压缩数据的一维数组中同该强度信息相对应的压缩信息的存在位置相关联的索引信息,并且将所述索引信息存储在与所述第一存储区域分开的第二存储区域中;以及
c)信息恢复器,用于响应于输出所述原始谱数据的一维数组中特定位置处的强度信息的命令,通过参考所述第二存储区域中的所述索引信息识别与所述特定位置相对应的所需压缩信息的存储位置,从所述第一存储区域读取所需压缩信息,并且解压缩所读取的信息以获得所述特定位置处的强度信息。
10.一种质量分析数据处理系统,用于处理质量分析成像数据、存储处理后的数据、并且基于所存储的数据恢复原始谱数据或者响应于来自用户的指示输出所恢复的数据或基于所恢复的数据的分析结果,其中,在所述质量分析成像数据中,通过对试样上的多个测量部位分别进行质量分析所收集的强度信息的一维数组形式的原始谱数据与所述测量部位的空间位置信息相关联,所述质量分析数据处理系统包括:
a)数据压缩器,用于根据预定的算法压缩所述原始谱数据,并且将一维数组形式的压缩数据存储在第一存储区域中;
b)索引信息创建器,用于创建用于将所述原始谱数据的一维数组中某一强度信息的存在位置与所述压缩数据的一维数组中同该强度信息相对应的压缩信息的存在位置相关联的索引信息,并且将所述索引信息存储在与所述第一存储区域分开的第二存储区域中;
c)位置计算器,用于响应于对质量分析结果图像的质荷比的指定,计算所述原始谱数据的一维数组中与所指定的质荷比相对应的位置;
d)信息恢复器,用于针对所有的测量部位或者特定范围内的测量部位组中的各测量部位,通过参考存储在所述第二存储区域中的所述索引信息,识别与所述位置计算器所计算出的位置相对应的所需压缩信息的存储位置,从所述第一存储区域读取所需压缩信息,并且解压缩所读取的信息以获得所计算出的位置处的强度信息;以及
e)图像创建器,用于使用通过所述信息恢复器所获得的各测量部位的强度信息和这些测量部位的空间位置信息,创建示出期望质荷比的强度信息的二维分布的质量分析结果图像。
CN201210035543.8A 2011-02-16 2012-02-16 质量分析数据处理方法和质量分析数据处理系统 Expired - Fee Related CN102683149B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-030829 2011-02-16
JP2011030829A JP5556695B2 (ja) 2011-02-16 2011-02-16 質量分析データ処理方法及び該方法を用いた質量分析装置

Publications (2)

Publication Number Publication Date
CN102683149A CN102683149A (zh) 2012-09-19
CN102683149B true CN102683149B (zh) 2015-09-09

Family

ID=46637701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210035543.8A Expired - Fee Related CN102683149B (zh) 2011-02-16 2012-02-16 质量分析数据处理方法和质量分析数据处理系统

Country Status (3)

Country Link
US (1) US8498989B2 (zh)
JP (1) JP5556695B2 (zh)
CN (1) CN102683149B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102129643B1 (ko) * 2012-10-22 2020-07-02 아브 이니티오 테크놀로지 엘엘시 소스 추적으로 데이터 프로파일링
CA2907483C (en) 2013-03-22 2020-07-21 Eth Zurich Laser ablation cell
EP2980579A4 (en) * 2013-04-22 2016-08-31 Shimadzu Corp METHOD FOR PROCESSING IMAGING DATA BY MASS SPECTOMETRY AND MASS IMAGING SPECTOMETER
JP5971184B2 (ja) 2013-04-22 2016-08-17 株式会社島津製作所 イメージング質量分析データ処理方法及びイメージング質量分析装置
CN105208596A (zh) * 2014-06-17 2015-12-30 中兴通讯股份有限公司 一种表头压缩方法、解压方法及装置
WO2017002226A1 (ja) * 2015-07-01 2017-01-05 株式会社島津製作所 データ処理装置
US10564849B2 (en) * 2017-05-24 2020-02-18 Bank Of America Corporation Data compression technologies for micro model advanced analytics
TW201908726A (zh) * 2017-07-21 2019-03-01 日商日立高新技術科學股份有限公司 頻譜資料處理裝置以及頻譜資料處理方法
JP6994961B2 (ja) * 2018-01-23 2022-01-14 日本電子株式会社 マススペクトル処理装置及び方法
US20210210319A1 (en) * 2018-06-01 2021-07-08 Shimadzu Corporation Instrumental analysis data processing method and device
CN108959503B (zh) * 2018-06-26 2020-12-04 北京阿尔山金融科技有限公司 信息存储方法及装置
JP7052688B2 (ja) * 2018-11-19 2022-04-12 株式会社島津製作所 質量分析装置および質量分析システム
JP7172537B2 (ja) * 2018-12-11 2022-11-16 株式会社島津製作所 イメージング分析装置
CN116680426A (zh) * 2023-05-31 2023-09-01 广东省麦思科学仪器创新研究院 Mr-tof质谱数据存储方法、装置、系统及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6378007B1 (en) * 1997-10-31 2002-04-23 Hewlett-Packard Company Data encoding scheme
US20100309031A1 (en) * 2007-11-30 2010-12-09 Shimadzu Corporation Time-of-flight measuring device

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08339267A (ja) * 1995-06-13 1996-12-24 Hudson Soft Co Ltd コンピュータ用外部記憶装置
US5920853A (en) * 1996-08-23 1999-07-06 Rockwell International Corporation Signal compression using index mapping technique for the sharing of quantization tables
JP3504819B2 (ja) * 1997-03-31 2004-03-08 株式会社日立製作所 質量分析方法及び装置
JP2003521800A (ja) * 1999-12-15 2003-07-15 エムディーエス インコーポレーテッド 多重イオン流入オリフィスを通して電子的に割送りを行う並行試料導入電子霧化型質量分析計
US6812863B2 (en) * 2001-06-06 2004-11-02 Seiko Epson Corporation Decoder, decoding method, look-up table, and decoding program
US20040102906A1 (en) * 2002-08-23 2004-05-27 Efeckta Technologies Corporation Image processing of mass spectrometry data for using at multiple resolutions
JP5068541B2 (ja) * 2004-02-13 2012-11-07 ウオーターズ・テクノロジーズ・コーポレイシヨン 液体クロマトグラフィ/質量分析データ中のピークを同定し、スペクトルおよびクロマトグラムを形成するための装置および方法
US7075064B2 (en) * 2004-05-24 2006-07-11 Brigham Young University System and method for extracting spectra from data produced by a spectrometer
JP4642620B2 (ja) * 2004-09-29 2011-03-02 富士フイルム株式会社 ランレングス圧縮データの位置特定方法および装置
JP5542433B2 (ja) * 2006-05-26 2014-07-09 ウオーターズ・テクノロジーズ・コーポレイシヨン イオン検出およびn次元データのパラメータ推定
US7796089B2 (en) * 2006-12-01 2010-09-14 Harris Corporation Antenna system for a portable communications device
GB0909284D0 (en) * 2009-05-29 2009-07-15 Micromass Ltd Acquisition system and method for mass spectrometer data
US8362931B2 (en) * 2010-11-30 2013-01-29 Microsoft Corporation Compression and decompression of mass spectrometry data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6378007B1 (en) * 1997-10-31 2002-04-23 Hewlett-Packard Company Data encoding scheme
US20100309031A1 (en) * 2007-11-30 2010-12-09 Shimadzu Corporation Time-of-flight measuring device

Also Published As

Publication number Publication date
US8498989B2 (en) 2013-07-30
US20120209854A1 (en) 2012-08-16
CN102683149A (zh) 2012-09-19
JP2012169979A (ja) 2012-09-06
JP5556695B2 (ja) 2014-07-23

Similar Documents

Publication Publication Date Title
CN102683149B (zh) 质量分析数据处理方法和质量分析数据处理系统
CN105190303A (zh) 成像质量分析数据处理方法及成像质量分析装置
EP2797104B1 (en) Imaging mass analysis data processing method and imaging mass spectrometer
CN110021369B (zh) 基因测序数据压缩解压方法、系统及计算机可读介质
CN104160409A (zh) 用于图像分析的方法和系统
US20200366315A1 (en) Method and system of content based dynamic data compression
CN103995988A (zh) 一种高通量dna测序质量分数无损压缩系统及压缩方法
WO2019076177A1 (zh) 基因测序数据压缩预处理、压缩、解压方法、系统及计算机可读介质
CN112189136B (zh) 设备分析用数据处理方法以及装置
CN107851137A (zh) 用于压缩基因组数据的方法
JP6292454B2 (ja) 勾配ヒストグラムに基づいて画像記述子を変換する方法および関連する画像処理装置
CN102819834A (zh) 图像处理装置和方法
CN110021368B (zh) 比对型基因测序数据压缩方法、系统及计算机可读介质
CN109698703B (zh) 基因测序数据解压方法、系统及计算机可读介质
CN111385582A (zh) 一种基于谱空联合预测的高光谱遥感图像无损压缩算法
EP1354472A2 (en) Graphic image coding
KR20220089211A (ko) 문자 빈도 기반 서열 재정렬을 통한 fastq 데이터 압축 방법 및 장치
CN109698704B (zh) 比对型基因测序数据解压方法、系统及计算机可读介质
JP5149454B1 (ja) Ykm形式圧縮プログラムを記録した記録媒体
CN109698702A (zh) 基因测序数据压缩预处理方法、系统及计算机可读介质
Beagley et al. Increasing the efficiency of data storage and analysis using indexed compression
CN117560013A (zh) 数据压缩方法和电子设备
Cooper Exclusive-or preprocessing and dictionary coding of continuous-tone images.
JP2008131202A (ja) 画像処理装置及び画像処理プログラム
JP2011239064A (ja) データ圧縮装置およびデータ復元装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150909

Termination date: 20210216

CF01 Termination of patent right due to non-payment of annual fee