CN105940402A - 用于处理分子成像数据的方法及对应的数据服务器 - Google Patents
用于处理分子成像数据的方法及对应的数据服务器 Download PDFInfo
- Publication number
- CN105940402A CN105940402A CN201580004212.XA CN201580004212A CN105940402A CN 105940402 A CN105940402 A CN 105940402A CN 201580004212 A CN201580004212 A CN 201580004212A CN 105940402 A CN105940402 A CN 105940402A
- Authority
- CN
- China
- Prior art keywords
- data set
- molecular
- spectrum
- data
- molecular information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000003384 imaging method Methods 0.000 title claims abstract description 29
- 238000012545 processing Methods 0.000 title claims abstract description 15
- 238000001228 spectrum Methods 0.000 claims abstract description 73
- 230000003595 spectral effect Effects 0.000 claims abstract description 6
- 230000008569 process Effects 0.000 claims description 57
- 238000010606 normalization Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000005481 NMR spectroscopy Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 4
- 238000002203 pretreatment Methods 0.000 claims description 4
- 238000010183 spectrum analysis Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000003325 tomography Methods 0.000 claims description 3
- 238000005520 cutting process Methods 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 14
- 239000000523 sample Substances 0.000 description 7
- 238000011160 research Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000001819 mass spectrum Methods 0.000 description 5
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013480 data collection Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 208000035699 Distal ileal obstruction syndrome Diseases 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 150000001793 charged compounds Chemical class 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000005100 correlation spectroscopy Methods 0.000 description 1
- 238000000688 desorption electrospray ionisation Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000000091 laser ablation electrospray ionisation Methods 0.000 description 1
- 238000001679 laser desorption electrospray ionisation Methods 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000004899 motility Effects 0.000 description 1
- 238000004651 near-field scanning optical microscopy Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/695—Preprocessing, e.g. image segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
- G06T7/0014—Biomedical image inspection using an image reference approach
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
- G06T7/337—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10104—Positron emission tomography [PET]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30024—Cell structures in vitro; Tissue sections in vitro
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Image Processing (AREA)
Abstract
本发明主要涉及用于处理多个谱数据集(J1‑Jn)的方法或用于记录多个谱数据集(J1‑Jn)的方法,所述谱数据集(J1‑Jn)旨在供分子成像方法使用,每个谱数据集(J1‑Jn)由一组空间位置(Xi,Yj)定义,所述空间位置中的每一个与具有包含一组分子信息的至少两个维度的分子谱(S(Xi,Yj))相关联,其特征在于所述方法尤其包括以下步骤:对于每个数据集(J1‑Jn),将与每个位置(Xi,Yj)相关联的所述分子谱切成多个谱分段(T1‑Tm);将针对每个数据集(J1‑Jn)的每个位置(Xi,Yj)所获得的所述分段(T1‑Tm)插入到数据库(BDD)中;按照对于感兴趣的分子信息的请求在所述数据库(BDD)中选择包含所述感兴趣的分子信息的一个或多个分段(T1‑Tm);以及在每个分段(T1‑Tm)内选择所述感兴趣的分子信息。
Description
技术领域
本发明涉及基于使用大容量数据库结构以及基于对应数据的服务器来处理分子成像数据的过程。分子成像通常涵盖通过尽可能少的侵入性手段或尽可能少地破坏被观察的生物或生物物理系统从根本上观察活体外或活体内的器官和/或有机体的分子手术的所有成像技术。
背景技术
分子成像正在许多技术的演进中尤其在质谱成像(MSI)、磁共振成像(MRI)或拉曼光谱法中,经历相当大的上升。这些技术被用来指导对诸如杀虫剂、药物、蛋白质或脂类的定向内生或外生化合物的生物分布的研究,以便研究它们在生物系统中的作用。随着来自软件的竞争,这些技术的应用还搜索潜在的非监视生物标记。
但是,在分子成像中待分析和解释的数据的增加对数个数据集的综合分析构成了限制,该数个数据集中的每个与图像相关联。数据正变得难以用于综合表示或者在统计上进行分析。
确实,数据集信息的大容量常常大于常规计算机的随机存取存储器的大小(与超级计算机对照)。例如利用质谱成像,50,000个位置的图像不再能够将所有原始信息存储在存储器中并且因此需要执行计算以减少对存储器的影响并且允许利用这些图像。计算减少数据并且因此由于不考虑所有可用的信息而导致了偏差。并且,当前的分析工具没有使数个数据集相对于彼此标准化的手段。
存在主要与数据集的采集机器人的制造商相关联的许多存储格式。然而,这些格式当中均未被适配和优化以供细致且迅速地查询。分子成像的一些领域已强调了存储格式,诸如在MRI(磁共振成像)或质谱成像中使用的Analyze 7.5。质谱成像还包含却不构成用于处置成像数据的存储系统的格式iMZML。
基于数据的分层结构的HDF5(“分层数据格式5”)类型的格式近来已被用于在质谱成像中存储大容量数据。这些格式经由互联网导航构建了远程查询接口。它们与利用非分层文件的格式相比使得能够实现更快的统计计算。然而这些格式在研究数个数据集时不同时产生数据的全局比较和可搜索分析。
因此需要如下过程:在信息不丢失的情况下,相对于彼此分析、比较并查询数个数据集以便避免引入分析偏差。
发明内容
本发明的目的在于通过提出用于处理多个谱数据集的过程来有效地应对这种需要,所述谱数据集尤其旨在供分子成像过程利用,每个数据集由一组空间位置定义,其中所述空间位置中的每一个与包含一组分子信息的至少两个维度的分子谱相关联,其特征在于所述过程尤其包括以下步骤:
-对于每个数据集,将与每个位置相关联的分子谱切成分子信息的数个部分或谱的数个部分,每个部分包含分子信息的缩减集,
-将针对每个数据集的每个位置所获得的部分插入到数据库中,使得谱的索引部分的集合与每个数据集的每个位置相关联,
-按照对于感兴趣的分子信息的请求在数据库中选择包含感兴趣的分子信息的部分,以及
-在每个部分内选择所述感兴趣的分子信息。
本发明还涉及用于在分子成像过程期间记录多个谱数据集的过程,每个数据集由一组空间位置定义,具有包含一组分子信息的至少两个维度的分子谱与所述空间位置中的每一个相关联,其特征在于所述过程包括以下步骤:
-在谱数据的采集期间,并且对于每个谱数据集,将与每个位置相关联的分子谱切成谱的数个部分,每个部分包含所述谱的分子信息中的一些,
-将针对每个数据集的每个位置所获得的部分插入到数据库中,使得谱的索引部分的集合与每个数据集的每个位置相关联,并且可选地
-按照对于感兴趣的分子信息的请求在数据库中选择包含感兴趣的分子信息的部分,以及
-在每个部分内选择所述感兴趣的分子信息。
更普遍地,本发明提出了对数据集进行处理,所述数据集以通过将与构成所述数据集的空间位置的集合中的每一个空间位置相关联的分子谱切成部分的自动的方式被有利地采集。与每个谱对应的是谱的连续部分,所有部分包括所关联的谱的全部分子信息。根据本发明,能够在谱数据的采集期间或者在谱数据的分析期间以自动的方式有利地进行切成部分的步骤。
在第一实施例中连续部分不重叠并且仅相邻,使得来自相关谱的分子信息不丢失或不冗余。在另一实施例中相关谱的一些部分可以部分地重叠,使得一些分子信息可以存在于同一谱的两个连续谱部分中。
本发明根本上将待分析的数据的加载周期减少到了能够通过选择部分来恢复数据库中的有用信息的程度。还能够在数据的采集期间当数据被记录时即刻切割谱数据,使得谱数据的部分直接在样本的分析期间通过分子成像过程被集成。
由于将信号切成了部分,在不减少谱的情况下,本发明就在为观察其整体的生理事件的相同分析中的内生或外生分子的药物动力、药效以及定量的组合研究方面而言,在不减少信息的情况下也工作,所述组合研究诸如为筛选方法(数种药物候选的分配比较)、定量的方法、受体或组织筛查的占用研究的方法、新陈代谢或3D重建研究。本发明还优化了对数个数据集的分子数据成像的统计处理和表示所必需的存储器的使用。
根据实施例,本发明的用于数据处理或记录的过程包括以下步骤:以一组数据图的形式查看感兴趣的分子信息,数据图中的每一个对应于数据集。
有利地,根据确定间距来切去分子谱,所述间距可以在谱间相同或不同。
根据实施例,本发明的用于数据处理或记录的过程包括以下步骤:
-根据至少一个预定间距将所有分子信息切成谱的部分,
-插入参考轴,所述参考轴建立了谱的不同部分的点索引与对应的分子信息之间的对应性,以及
-根据参考轴和预定间距来选择包含感兴趣的分子信息的谱部分。
根据实施例,在将部分插入到数据库中之前或之后,所述过程包括由谱校准和/或背景噪声消减和/或数据集内标准化组成的至少一个预处理步骤。
根据实施例,本发明的用于数据处理或记录的过程包括以下步骤:调整具有不同空间大小的数据集的空间位置的大小,以便使得空间位置与具有最细空间大小的数据集相校准。
根据实施例,本发明的用于数据处理或记录的过程还包括提取数据集的步骤,诸如提取所有分子信息的感兴趣的每个峰的最大强度、平均强度、峰下面积、信噪比。
根据实施例,根据由信噪比和/或谱分辨率的质量准则所定义的峰选择准则来实现提取。
根据实施例,本发明的用于数据处理或记录的过程包括以下步骤:使多个数据集的分子信息的集合相互标准化,以便然后将不同的数据集进行相互比较。
根据实施例,为了着手标准化步骤所述过程能够包括以下步骤:
-选择为所有数据集所共有的一个参考分子或数个内生或外生参考分子,
-对于每个数据集,根据这个或这些参考分子来计算标准化因子,以及
-使用这个标准化因子校正感兴趣的分子信息以获得一组标准化的数据集。
根据实施例,根据存在于与数据集对应的一组样本上或者在与数据集对应的样本的特定参考区域中的至少一个参考分子来定义标准化因子。
根据实施例,本发明的用于数据处理或记录的过程包括以下步骤:以多个数据图的形式查看、比较并分析具有为所有图所共有的色标的感兴趣的分子信息,多个数据图中的每一个来自标准化数据集。
根据实施例,所共有的色标基于感兴趣的分子的所有数据集的最小强度和最大强度。
根据实施例,所述数据集是通过质谱分析过程获得的。
根据实施例,所述数据集是通过正电子发射断层扫描(PET)或磁共振成像(MRI)类型的成像过程获得的。
有利地,根据本发明的记录和/或处理过程步骤中的全部或一些是自动的。
本发明的另一目的是数据服务器,所述数据服务器包括存储软件指令的存储器,所述软件指令用于执行根据本发明的所述用于处理多个数据集的过程的至少一些步骤。
本发明的另一目的是可由计算机读取的数据介质,所述数据介质包括指令,所述指令可由计算机执行并且被适配成允许计算机系统执行根据本发明的所述用于处理或者记录谱数据的过程的至少一个步骤。
因此,本发明提出了计算机程序,所述计算机程序包括用于在所述程序在计算机上运行时执行上面所说明的步骤中的全部或一些的程序代码指令。
有利地,计算机程序包括用于执行至少将分子谱切成谱的部分的步骤的程序代码指令。
附图说明
从以下描述以及对附图的检验将更清楚地理解本发明,仅通过图示但非不限制本发明的方式给出附图。
图1示意性地图示了用于获得由根据本发明的过程所利用的数据集的质谱分析过程的不同步骤;
图2是根据本发明的用于执行处理数据的过程的集成数据库管理系统的概况图;
图3是用于获得与数据集的每个位置相关联的谱部分的步骤的示意图示;
图4示出了用于建立分子信息与所对应的谱部分之间的对应性的步骤;
图5示意性地图示了用于精确地比较数个图像的图像间标准化步骤。
相同、类似或模拟元件在附图间保持相同的参考标记。
具体实施方式
针对MALDI类型的质谱分析方法来描述用于执行根据本发明的过程的以下示例。当然,能够本质上相同地使用除MALDI以外的成像装置,诸如例如这些源:SIMS、DESI、LAESI、DIOS、ICP、显微镜MALDI、SNOM、SMALDI、LA-ICP、ESI(组织上的液体提取)、MILDI、JEDI、ELDI等。该过程还适用于产生可由诸如例如PET(“正电子发射断层扫描”)或MRI(磁共振成像)的分子成像的方法利用的数据的任何其它方法。
图1示意性地图示了由MALDI质谱分析过程执行的不同步骤。第一步骤E1包括通常通过冷冻切片来切去组织1的薄片,组织1的薄片然后被放置在载片2上。在步骤E2中离子化基质3的细均匀层然后被沉积在组织1的薄片上。采集步骤E3包括生成具有预定大小(例如每采集区域大约100微米)的自动激光脉冲4,以使基质3的分子离子化。以这种方式离子化的分子由质谱分析仪如其本身已知的那样进行分析。能够参考文档FR2973112以得到关于执行该过程的更多细节。
产生了由一组空间位置(Xi,Yj)所定义的数据集Jk,与该组空间位置中的每一个相关联的是一组分子信息。空间位置被定义为参考X轴和Y轴的标记的函数。所有分子信息在这种情况下尤其由谱S形成,谱S具有将强度指示为分子质量的函数的两个维度。例如,所获得的数据集Jk遍及20,000个空间位置(Xi,Yj)具有每谱50,000个强度(或50,000个点)。根据本发明的过程基于处理多个数据集J1-Jn。
如图3中所示,对于很可能将以图像的形式示出的每个数据集Jk,与每个位置(Xi,Yj)相关联的分子谱S(Xi,Yj)被切成谱的数个部分T1-Tm。部分T1-Tm是按照预定间距P'来切去的。例如,对于每空间位置具有50,000个点的每个谱,能够按照10,000个点的间距P'切割每个谱。或者,谱S(Xi,Yj)被切成五个部分T1-T5,每个部分具有10,000个点。作为变例,所使用的间距P'能够是可变的。
还定义了图4中示出的参考轴Aref,从而建立了不同部分T1-Tm的位置索引与所对应的分子质量之间的对应性。
在插入到数据库BDD中之前,该过程优选地经由模块100执行谱S(Xi,Yj)的至少一个预处理步骤。这个预处理步骤能够包括谱校准。出于这个目的,考虑参考峰并且偏移谱,以使得在这些参考峰上定位对应峰的值。还可以通过根据谱的最小值与谱的最小值将必须与其对应的参考值之间的距离重新调整谱,来执行背景噪声的消减。
此外,能够(通过内部标准、通过使用强度的总数...)执行不同类型的信号标准化(内部标准化)。换句话说,在这里执行数据集内的标准化,即独立于其它数据集而对每个数据集进行标准化,其对应于为技术人员本身所已知的步骤。这个数据集内的标准化作为在下文中详述的数据集J1-Jn之间的后续标准化步骤的补充(数据集间标准化)被执行,数据集J1-Jn之间的后续标准化步骤将精确且安全地将数据集J1-Jn进行相互比较。
并且,该过程包括提取数据集的步骤,诸如提取谱S(Xi,Yj)的感兴趣的每个峰的最大强度Pk1-Pkl、平均强度、峰下面积、信噪比。能够根据被称作“峰拾取”的方法来提取谱S(Xi,Yj)的每个峰Pk1-Pkl的最大强度。根据由信噪比和/或谱分辨率的质量准则所定义的峰选择准则来实现提取。
对每个数据集J1-Jn的每个位置(Xi,Yj)以及参考轴Aref和先前所提取的峰Pk1-PKl所获得的部分T1-Tm被插入到如图2中所示出的数据库BDD中。以这种方式,索引部分T1-TM的集合和峰Pk1-PKl的集合以及上述补充数据(每个峰的平均强度、面积)与每个数据集J1-Jn的每个位置(Xi,Yj)相关联。
数据库BDD是使得能够实现插入数据的查看、管理、解释和统计分析的NoSQL(“Not only Structured Query Language”)或SQL类型的大容量数据库。例如能够从以下非穷尽的系统中选择数据库管理系统:Hypertable、Haddoop、Cassandra、MongoDB、PolyBase、Hadoop on Azure、Hive、Pig。数据库系统确保数据的相干性、可靠性和切合性。用于复制和保存的技术能够确保信息的可靠性。
下面描述用于在数据库BDD中选择切合信息的步骤。按照对于感兴趣的分子信息的请求,选择包含所请求的分子信息的数据集J1-Jn的集合的位置的部分。出于这个目的,对于每个数据集J1-Jn的每个位置(Xi,Yj),根据参考轴Aref以及所请求的分子信息来选择包含所请求的分子信息的部分Tp。
因此,图4图示了根据五个点的间距P'将谱切成部分,以便更容易理解这个步骤。对于起源于质谱分析方法的谱来说情况常常是这样的,分子质量的标度不是线性的。在用户需要关于例如具有值3m/z的分子质量的分子的信息的情况下,参考轴Aref指明与分子质量的这个值对应的点的索引是9,使得能够借助于间距P'推断出包含感兴趣的分子质量的强度的部分Tp是第二部分T2。
替换地,能够使用存储分子质量的最小端点和最大端点以及每个对应部分T1-Tm的点的指数化的表。在这种情况下,对于请求的分子信息,根据这些最小端点和最大端点来选择部分T1-Tm的标识符。
在为所有数据集J1-Jn中的每一个点选择的每个部分T1-Tm内,然后选择所请求的分子质量的对应强度。然后成为可能的是,以一组数据图C1-CN为形式查看感兴趣的分子存在于不同图C1-CN上的强度的分布,数据图C1-CN中的每一个对应于数据集J1-Jn。颜色被认为是分子信息关于色标的强度的函数。替换地,或者通过补充,峰Pk1-PKl的提取迅速地产生了提供对感兴趣的分子的强度分布的初始分析的图像。
该过程优选地包括为随后将数个数据集进行相互比较而使数据集J1-Jn的分子信息标准化的步骤(参考模块101)。出于这个目的,选择为所有数据集J1-Jn所共有的参考分子Mref。替换地,选择为所有数据集J1-Jn所共有的数个内生或外生分子。能够认为参考分子Mref存在于完整样本中或者更具体地在对应样本的参考区域中。
更准确地说,对于每个数据集J1-Jn,标准化因子Fnor是根据这个或这些参考分子Mref来计算的。然后使用这个标准化因子Fnor校正感兴趣的分子信息,以产生标准化集J1-Jn的数据集。
例如,对于与图5中所示出的图C1-C3对应的三个数据集,参考分子Mref=500m/z被选择为标准化分子(标准化标准)。这个分子Mref在图C1-C3的区域Z中分别具有5、10和15的值。对于每个图C1-C3,基于Mref的这些值中的每一个来计算标准化因子Fnor:
Fnor=C1-C3的Mref值的平均值/相关图的Mref值。
在图5中所示出的示例中,对于图C1、C2和C3分别获得了2、1和10/15的标准化因子Fnor。然后这个系数被应用于与所有数据集J1-Jn的不同位置相关联的谱的所有强度值,以及特别是在位置Xi;Yj处的感兴趣的分子Mi=300m/z的强度值。获得了能够直接相互比较的标准化图C1'-C3'。
标准化校正了与在实验条件下由于样本的制备及其分析而导致的改变相关联的强度。实际上,在前面的示例中,显然将一直能够达成感兴趣的分子Mi=300m/z较强存在于与图C3对应的样本中的错误结论,尽管在应用标准化因子Fnor之后,研究揭示了感兴趣的分子Mi均匀存在于在位置(Xi,Yj)处具有强度为200的三个样本中。
按照这个标准化,能够以标准化的数据图C1'-C3'的形式查看、比较并分析具有为所有图C1'-C3'所共有的色标的分子信息(参考模块102)。所获得的标度基于遍及感兴趣的分子Mi的所有数据集而确定的最低强度和最高强度。
当然,能够产生超过三个的数据集以及对应的图以用于横向地通过对数个数据集J1-Jn的统计组合进行分析,而无需将全部数据集加载到存储器中。然后能够对成像数据进行比较以取出潜在标记。还能够组合具有共同行为的位置以允许数据的新颖解释。
换句话说,在单一工具中,本发明对数据进行比较和查询以获得其质量可以计量的更切合的标准化信息。能够使用为使数据标准化而插入到每个图像中的质量控件来加载数个数据集。
此外,该过程能够在需要时调整具有不同空间大小的同一生物样本的数据集J1和J2的位置的大小,以便使得该位置与具有最细空间大小的数据集相校准。能够将来自质谱分析仪(成像MALDI)的图处理与来自PET(正电子发射断层扫描)或MRI(磁共振成像)类型的系统的图处理相组合。
还能够在单个图像中共同地表示数个数据集J1-Jn。能够进行“为当前图的领域z和a选择所有位置x和y(具有相同的空间大小)的所有值v、w”的类型的请求。领域z和a表示两个不同的成像技术的值。
还能够执行能够通过将请求插入到数据库BDD中而添加的临时统计处理。以这种方式,根据本发明的过程提供了到了如下程度的较大灵活性:能够在分析过程的任何时刻添加关于图像的每个位置的信息。
该过程基于客户端/服务器架构。能够通过单个接口来查询数据库BDD。在单用户架构中、或者在本地或经由网络(内部的或外部的)可访问的服务器的集群中来存储以及查询数据。客户端接口软件能够被安装在工作站处或者在web接口版本中。本发明的另一目的是数据服务器10,所述数据服务器10包括存储软件指令的存储器,所述软件指令用于执行处理多个数据集J1-Jn的过程的至少一些步骤。
并且,数据的已处理数目可能容易地增长,使得待分析的数据量不再对分析构成限制。不管数据库BDD的大小如何,数据的插入都是有效的。
当然,已仅通过示例的方式给出了以上描述,并且以上描述不限制本发明的领域,而且以所有其它等同物来代替执行细节将不超过其范围。
Claims (16)
1.一种用于处理多个谱数据集(J1-Jn)的过程,所述谱数据集(J1-Jn)旨在供分子成像过程利用,每个谱数据集(J1-Jn)由一组空间位置(Xi,Yj)定义,其中所述空间位置中的每一个与包含一组分子信息的至少两个维度的分子谱(S(Xi,Yj))相关联,其特征在于所述过程尤其包括以下步骤:
-对于每个数据集(J1-Jn),将与每个位置(Xi,Yj)相关联的所述分子谱切成谱的数个部分(T1-Tm),每个所述部分包含所述谱的所述分子信息中的一些,
-将针对每个数据集(J1-Jn)的每个位置(Xi,Yj)所获得的所述部分(T1-Tm)插入到数据库(BDD)中,使得谱的索引部分(T1-Tm)的集合与每个数据集(J1-Jn)的每个位置(Xi,Yj)相关联,
-按照对于感兴趣的分子信息的请求在所述数据库(BDD)中选择包含所述感兴趣的分子信息的所述部分(T1-Tm),以及
-在每个部分(T1-Tm)内选择所述感兴趣的分子信息。
2.一种用于在分子成像过程期间记录多个谱数据集的过程,每个数据集由一组空间位置定义,所述空间位置中的每一个与包含一组分子信息的至少两个维度的分子谱相关联,其特征在于所述过程包括以下步骤:
-在谱数据的采集期间,并且对于每个谱数据集,将与每个位置相关联的所述分子谱切成谱的数个部分,每个部分包含所述谱的所述分子信息中的一些,
-将针对每个数据集的每个位置所获得的所述部分插入到数据库中,使得谱的索引部分的集合与每个数据集的每个位置相关联,并且可选地
-按照对于感兴趣的分子信息的请求在所述数据库中选择包含所述感兴趣的分子信息的所述部分,以及
-在每个部分内选择所述感兴趣的分子信息。
3.根据权利要求1或2所述的过程,其特征在于所述过程包括以下步骤:以一组数据图(C1-Cn)的形式查看所述感兴趣的分子信息,所述一组数据图中的每一个对应于数据集(J1-Jn)。
4.根据权利要求1至3中任一项所述的过程,其特征在于所述过程包括以下步骤:
-以至少一个预定间距(P')将所述分子谱(S(Xi,Yj))切成谱的部分(T1-Tm),
-插入参考轴(Aref),所述参考轴(Aref)建立了不同部分(T1-Tm)的点索引与所对应的分子信息之间的对应性,以及
-根据所述参考轴(Aref)和所述预定间距(P')来选择包含所述感兴趣的分子信息的所述部分(T1-Tm)。
5.根据权利要求1至4中的任一项所述的过程,其特征在于,在将部分(T1-Tm)插入到所述数据库(BDD)之前或之后,所述过程包括由谱校准和/或背景噪声消减和/或数据集(J1-Jn)内标准化组成的至少一个预处理步骤。
6.根据权利要求1至5中任一项所述的过程,其特征在于所述过程包括以下步骤:调整具有不同空间大小的所述数据集(J1-Jn)的所述空间位置(Xi,Yj)的大小,以便使得所述空间位置(Xi,Yj)与具有最细空间大小的所述数据集(J1-Jn)相校准。
7.根据权利要求1至6中任一项所述的过程,其特征在于所述过程还包括提取诸如下述所述的数据集的步骤:所有所述分子谱的感兴趣的每个峰的最大强度(Pk1-Pkl)、平均强度、峰下面积、信噪比。
8.根据权利要求7所述的过程,其特征在于,根据由信噪比和/或谱分辨率的质量准则所定义的峰选择准则来执行提取。
9.根据权利要求1至8中任一项所述的过程,其特征在于所述过程包括以下步骤:使多个所述数据集(J1-Jn)的所述分子谱相互标准化,以便然后将不同的所述数据集(J1-Jn)进行相互比较。
10.根据权利要求9所述的过程,其特征在于为了执行所述标准化步骤,所述过程包括以下步骤:
-选择为所有所述数据集(J1-Jn)所共有的一个分子或数个内生或外生参考分子(Mref),
-对于每个数据集(J1-Jn),根据这个或这些参考分子(Mref)来计算标准化因子(Fnor),以及
-使用所述标准化因子校正所述感兴趣的分子信息以获得一组标准化的数据集(J1-Jn)。
11.根据权利要求10所述的过程,其特征在于,根据存在于与所述数据集(J1-Jn)对应的一组样本上或者在与所述数据集(J1-Jn)对应的所述样本的特定参考区域(Z)中的至少一个参考分子(Mref)来定义所述标准化因子(Fnor)。
12.根据权利要求9至11中任一项所述的过程,其特征在于所述过程包括以下步骤:以多个数据图(C1'-Cn')的形式查看、比较并分析具有为所有所述图所共有的色标的所述感兴趣的分子信息,所述多个数据图中的每一个来自标准化的数据集(J1-Jn)。
13.根据权利要求12所述的过程,其特征在于,所共有的色标基于感兴趣的分子的所有所述数据集(J1-Jn)的最小强度和最大强度。
14.根据权利要求1至13中任一项所述的过程,其特征在于,所述数据集(J1-Jn)是通过质谱分析过程获得的。
15.根据权利要求1至13中任一项所述的过程,其特征在于,所述数据集(J1-Jn)是通过正电子发射断层扫描(PET)或磁共振成像(MRI)类型的成像过程获得的。
16.一种数据服务器(10),所述数据服务器(10)包括存储软件指令的存储器,所述软件指令用于执行根据前述权利要求中任一项所定义的所述用于处理多个数据集(J1-Jn)的过程的至少一些步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1450176 | 2014-01-10 | ||
FR1450176A FR3016461B1 (fr) | 2014-01-10 | 2014-01-10 | Procede de traitement de donnees d'imagerie moleculaire et serveur de donnees correspondant |
PCT/FR2015/050051 WO2015104512A1 (fr) | 2014-01-10 | 2015-01-09 | Procede de traitement de donnees d'imagerie moleculaire et serveur de donnees correspondant |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105940402A true CN105940402A (zh) | 2016-09-14 |
CN105940402B CN105940402B (zh) | 2019-01-29 |
Family
ID=50933270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580004212.XA Active CN105940402B (zh) | 2014-01-10 | 2015-01-09 | 用于处理分子成像数据的方法及对应的数据服务器 |
Country Status (10)
Country | Link |
---|---|
US (1) | US10013598B2 (zh) |
EP (1) | EP3092589B1 (zh) |
JP (1) | JP6630275B2 (zh) |
CN (1) | CN105940402B (zh) |
CA (1) | CA2935777C (zh) |
DK (1) | DK3092589T3 (zh) |
ES (1) | ES2969953T3 (zh) |
FI (1) | FI3092589T3 (zh) |
FR (1) | FR3016461B1 (zh) |
WO (1) | WO2015104512A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111052251A (zh) * | 2017-09-01 | 2020-04-21 | X开发有限责任公司 | 二分图结构 |
CN111587374A (zh) * | 2018-02-02 | 2020-08-25 | 株式会社岛津制作所 | 成像质谱分析用数据处理装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017180807A1 (en) | 2016-04-15 | 2017-10-19 | Baxalta Incorporated | Method and apparatus for providing a pharmacokinetic drug dosing regiment |
US10896749B2 (en) | 2017-01-27 | 2021-01-19 | Shire Human Genetic Therapies, Inc. | Drug monitoring tool |
US11282683B2 (en) * | 2018-02-05 | 2022-03-22 | Shimadzu Corporation | Imaging mass spectrometric data analyzer |
EP3888021B1 (en) | 2018-11-30 | 2024-02-21 | Caris MPI, Inc. | Next-generation molecular profiling |
WO2021183769A1 (en) * | 2020-03-11 | 2021-09-16 | Biosyntagma, Inc. | Method for predicting disease state, therapeutic response, and outcomes by spatial biomarkers |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1668921A (zh) * | 2002-07-10 | 2005-09-14 | 法米克斯公司 | 分子系统的分子力学分析的方法及装置 |
WO2009156897A1 (en) * | 2008-06-23 | 2009-12-30 | Koninklijke Philips Electronics N.V. | Medical system for retrieval of medical information |
CN101782930A (zh) * | 2009-01-21 | 2010-07-21 | 国际商业机器公司 | 在多处理器系统上进行分子动力学模拟的方法和装置 |
US20120258485A1 (en) * | 2011-03-21 | 2012-10-11 | Imabiotech | Method for detecting and quantifying a target molecule in a sample |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07128450A (ja) * | 1993-10-31 | 1995-05-19 | Shimadzu Corp | 核医学イメージング装置の補正方法 |
US20030031350A1 (en) * | 2001-03-09 | 2003-02-13 | Pe Corporation (Ny) | Methods for large scale protein matching |
US20030156136A1 (en) * | 2002-02-15 | 2003-08-21 | Cattell Herbert F. | Method and system for visualization of results of feature extraction from molecular array data |
JP2009500617A (ja) * | 2005-07-08 | 2009-01-08 | メタノミクス ゲーエムベーハー | 化学試料を特徴づけるシステムおよび方法 |
GB0611669D0 (en) * | 2006-06-13 | 2006-07-19 | Astrazeneca Uk Ltd | Mass spectrometry biomarker assay |
FR2904691B1 (fr) * | 2006-08-02 | 2009-03-06 | Commissariat Energie Atomique | Procede et dispositif de reconstruction 3d de la distribution d'elements fluorescents. |
EP2153407A1 (en) * | 2007-05-02 | 2010-02-17 | Agency for Science, Technology and Research | Motion compensated image averaging |
US7872648B2 (en) * | 2007-06-14 | 2011-01-18 | Microsoft Corporation | Random-access vector graphics |
US8135189B2 (en) * | 2007-10-03 | 2012-03-13 | Siemens Medical Solutions Usa, Inc. | System and method for organ segmentation using surface patch classification in 2D and 3D images |
US9883833B2 (en) * | 2008-05-13 | 2018-02-06 | Spectral Image, Inc. | Systems and methods for hyperspectral medical imaging using real-time projection of spectral information |
US20110142316A1 (en) * | 2009-10-29 | 2011-06-16 | Ge Wang | Tomography-Based and MRI-Based Imaging Systems |
JP5348029B2 (ja) * | 2010-03-16 | 2013-11-20 | 株式会社島津製作所 | 質量分析データ処理方法及び装置 |
JP5673348B2 (ja) * | 2011-05-25 | 2015-02-18 | 株式会社島津製作所 | 質量分析データ解析方法及び解析装置 |
EP2600385A1 (fr) * | 2011-12-02 | 2013-06-05 | bioMérieux, Inc. | Procédé d'identification de microorganismes par spectrométrie de masse |
-
2014
- 2014-01-10 FR FR1450176A patent/FR3016461B1/fr active Active
-
2015
- 2015-01-09 US US15/110,430 patent/US10013598B2/en active Active
- 2015-01-09 ES ES15701558T patent/ES2969953T3/es active Active
- 2015-01-09 EP EP15701558.7A patent/EP3092589B1/fr active Active
- 2015-01-09 WO PCT/FR2015/050051 patent/WO2015104512A1/fr active Application Filing
- 2015-01-09 CA CA2935777A patent/CA2935777C/fr active Active
- 2015-01-09 JP JP2016545874A patent/JP6630275B2/ja active Active
- 2015-01-09 FI FIEP15701558.7T patent/FI3092589T3/fi active
- 2015-01-09 CN CN201580004212.XA patent/CN105940402B/zh active Active
- 2015-01-09 DK DK15701558.7T patent/DK3092589T3/da active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1668921A (zh) * | 2002-07-10 | 2005-09-14 | 法米克斯公司 | 分子系统的分子力学分析的方法及装置 |
WO2009156897A1 (en) * | 2008-06-23 | 2009-12-30 | Koninklijke Philips Electronics N.V. | Medical system for retrieval of medical information |
CN101782930A (zh) * | 2009-01-21 | 2010-07-21 | 国际商业机器公司 | 在多处理器系统上进行分子动力学模拟的方法和装置 |
US20120258485A1 (en) * | 2011-03-21 | 2012-10-11 | Imabiotech | Method for detecting and quantifying a target molecule in a sample |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111052251A (zh) * | 2017-09-01 | 2020-04-21 | X开发有限责任公司 | 二分图结构 |
CN111587374A (zh) * | 2018-02-02 | 2020-08-25 | 株式会社岛津制作所 | 成像质谱分析用数据处理装置 |
CN111587374B (zh) * | 2018-02-02 | 2024-02-06 | 株式会社岛津制作所 | 成像质谱分析用数据处理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2017509945A (ja) | 2017-04-06 |
EP3092589A1 (fr) | 2016-11-16 |
DK3092589T3 (da) | 2024-02-05 |
FI3092589T3 (fi) | 2024-01-30 |
JP6630275B2 (ja) | 2020-01-15 |
WO2015104512A1 (fr) | 2015-07-16 |
US20160335473A1 (en) | 2016-11-17 |
FR3016461A1 (fr) | 2015-07-17 |
CA2935777A1 (fr) | 2015-07-16 |
ES2969953T3 (es) | 2024-05-23 |
CA2935777C (fr) | 2023-08-29 |
US10013598B2 (en) | 2018-07-03 |
EP3092589B1 (fr) | 2023-11-08 |
FR3016461B1 (fr) | 2017-06-23 |
CN105940402B (zh) | 2019-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105940402A (zh) | 用于处理分子成像数据的方法及对应的数据服务器 | |
Alexandrov | Spatial metabolomics and imaging mass spectrometry in the age of artificial intelligence | |
Geier et al. | Spatial metabolomics of in situ host–microbe interactions at the micrometre scale | |
CN107679052B (zh) | 大数据分析方法以及利用了该分析方法的质谱分析系统 | |
Ghaste et al. | Applications of fourier transform ion cyclotron resonance (FT-ICR) and orbitrap based high resolution mass spectrometry in metabolomics and lipidomics | |
Patterson et al. | Three‐dimensional imaging MS of lipids in atherosclerotic plaques: Open‐source methods for reconstruction and analysis | |
JP2017509945A5 (zh) | ||
Mayer et al. | Controlled vocabularies and ontologies in proteomics: overview, principles and practice | |
Guo et al. | Automated annotation and visualisation of high-resolution spatial proteomic mass spectrometry imaging data using HIT-MAP | |
JP6715451B2 (ja) | マススペクトル解析システム,方法およびプログラム | |
JP5725891B2 (ja) | 質量信号のノイズ低減処理方法及び装置 | |
Franceschi et al. | Self‐organizing maps: A versatile tool for the automatic analysis of untargeted imaging datasets | |
Goodwin et al. | Exemplifying the screening power of mass spectrometry imaging over label-based technologies for simultaneous monitoring of drug and metabolite distributions in tissue sections | |
CN106415558A (zh) | 数据处理装置和用于质谱法数据的评估的方法 | |
EP2359257B1 (en) | Systems and methods for automated extraction of high-content information from whole organisms | |
Gustafsson et al. | Balancing sufficiency and impact in reporting standards for mass spectrometry imaging experiments | |
Garro et al. | Confirmation and physical characterization of the new bulge globular cluster Patchick 99 from the VVV and Gaia surveys | |
Dueñas et al. | Single-cell metabolomics by mass spectrometry imaging | |
Savoi et al. | Grapevine and wine metabolomics-based guidelines for FAIR data and metadata management | |
Woloshuk et al. | In situ classification of cell types in human kidney tissue using 3D nuclear staining | |
Ghanat Bari et al. | PeakLink: a new peptide peak linking method in LC-MS/MS using wavelet and SVM | |
Hernández‐Villegas et al. | Extraction of artefactual MRS patterns from a large database using non‐negative matrix factorization | |
Zhang et al. | Elastic net‐based framework for imaging mass spectrometry data biomarker selection and classification | |
Kirchner et al. | Non-linear classification for on-the-fly fractional mass filtering and targeted precursor fragmentation in mass spectrometry experiments | |
Xu et al. | Consistency and variation of protein subcellular location annotations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |