CN112334058A - 光谱分析方法 - Google Patents

光谱分析方法 Download PDF

Info

Publication number
CN112334058A
CN112334058A CN201980039162.7A CN201980039162A CN112334058A CN 112334058 A CN112334058 A CN 112334058A CN 201980039162 A CN201980039162 A CN 201980039162A CN 112334058 A CN112334058 A CN 112334058A
Authority
CN
China
Prior art keywords
cell
tissue
tissue type
metrics
metric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980039162.7A
Other languages
English (en)
Inventor
詹姆斯·约瑟夫·英厄姆
斯蒂芬·大卫·巴雷特
彼得·怀特曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Liverpool
Original Assignee
University of Liverpool
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Liverpool filed Critical University of Liverpool
Publication of CN112334058A publication Critical patent/CN112334058A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0059Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence
    • A61B5/0075Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence by spectroscopy, i.e. measuring spectra, e.g. Raman spectroscopy, infrared absorption spectroscopy
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/55Specular reflectivity
    • G01N21/552Attenuated total reflection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/4833Physical analysis of biological material of solid biological material, e.g. tissue samples, cell cultures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Optics & Photonics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Oncology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Informatics (AREA)
  • Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Public Health (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

描述了将第一细胞或组织类型与不同的细胞或组织类型进行区分的选择辐射波长的方法。获取第一组吸收光谱和第二组吸收光谱,每一组分别包括在第一细胞或组织类型的多个不同空间区域和不同的细胞或组织类型的多个不同空间区域处获取的光谱。为每个空间区域的第一组和第二组吸收光谱定义相应的一组度量。每个度量包括与至少两个不同的波长的吸收相对应的信息。每组中的度量包括不同的波长组合。为每个度量生成特征值。利用针对第一细胞或组织类型的相应特征值和不同的细胞或组织类型的相应特征值为每个度量生成分布,并且将分布进行比较以确定相似程度。基于相似程度对度量进行分级,并且选择与分级较高度量相关联的、具有较高的相似性的波长。

Description

光谱分析方法
技术领域
本发明涉及辐射吸收数据的分析,特别地,涉及能够将一种细胞或组织类型与不同的细胞或组织类型进行区分的选择波长的方法。
背景技术
吸收光谱法是诊断疾病的重要工具。例如,傅立叶变换红外(Fourier transforminfrared,FTIR)光谱法是应用于癌症研究的最成功的红外成像技术之一。分析从FTIR输出的大数据集的已知方法使用例如主成分分析和随机森林分析技术。这些技术涉及识别用于表征不同的样本的辐射吸收“特征图谱(fingerprint)”。当这些技术用于识别患者样本中给定细胞或组织类型(如癌细胞或组织类型)的存在性或不存在性时,已知的是会导致假阳性和/或未能识别细胞或组织类型的存在性。这种故障可能对患者造成很大的损害,并可能导致执行不必要和潜在的有害治疗和/或在需要治疗时缺乏治疗。所希望的是提高诊断的准确度和/或减少出现假阳性的频率。还希望的是提供这样的分析吸收光谱数据的方法:通过与现有技术方法相比更少的密集数据处理来提供较高的准确度。
所希望的是提供一种选择区分在吸收光谱中使用的波长的方法,该方法可以排除或缓解现有技术中的一个或多个无论是在本文或其它地方发现的问题。
发明内容
本发明分析从对不同细胞或组织类型执行的辐射吸收光谱法中获取的数据。本发明能够选择在不同细胞或组织类型中发现的不同辐射吸收特征图谱的辐射波长。因此,所选波长能够以高准确度将一种细胞或组织类型与另一细胞或组织类型进行区分。为了证明该方法的实用性,已证明本发明能区分四种不同细胞类型和四种不同的组织类型,其准确度大于已知方法,且使用较低强度的数据处理。本发明可用于提高疾病诊断的准确度。
根据第一方面,提供了一种选择辐射波长的方法,该方法能够将第一细胞或组织类型与不同的细胞或组织类型进行区分并且用于辐射吸收光谱法,该方法包括获取第一组吸收光谱和第二组吸收光谱,该第一组吸收光谱包括在该第一细胞或组织类型的多个不同空间区域的每个空间区域处获取的吸收光谱,该第二组吸收光谱包括在不同的细胞或组织类型的多个不同空间区域的每个空间区域处获取的吸收光谱;为属于第一组吸收光谱的每个空间区域定义一组度量,并为属于第二组吸收光谱的每个空间区域定义相应的一组度量,其中每个度量包含对应于对给定空间区域至少两个不同波长吸收的辐射量的信息,并且其中的组中的度量包含不同波长组合;对每个度量执行第一数学函数以为每个度量生成特征值,其中,该特征值取决于在属于该度量的至少两个不同波长中每个不同波长处吸收的辐射量;生成分布和相应的分布以及针对所述度量中每一者进行重复,所述分布包括在属于所述第一细胞或组织类型的多个空间区域内的给定度量的特征值,所述相应的分布包括在属于所述不同的细胞或组织类型的所述多个空间区域内的相同给定度量的特征值;针对给定度量对为所述第一细胞或组织类型和所述不同的细胞或组织类型所生成的分布进行比较、确定所述分布之间的相似程度,并且针对其它度量中的每一者重复该步骤;基于属于所述度量的所述分布之间的相似程度对所述度量进行分级,其中,与具有相似程度较低的分布相关联的度量的分级高于与具有更高相似程度的分布相关联的度量;并且选择与分级较高度量相关的辐射波长。用于获取相应的吸收光谱的细胞或组织(即,包含在第一细胞或组织类型的多个不同空间区域的每个空间区域处获取的吸收光谱的第一组吸收光谱和包含在不同的细胞或组织类型的多个不同空间区域的每个空间区域处获取的吸收光谱的第二组吸收光谱)通常作为从患者获取的样本提供。相应的第一种组织类型和不同细胞或组织类型可以分别从患者获取,或者它们可以从患者获取的单个细胞或组织样本中获取(例如,细胞或组织类型可以同时存在于同一活体组织切片(biopsy)中)。
也就是说,根据第一方面的方法定义了一种机器学习方法,以有效地识别(即选择)与分级较高的度量相关联的辐射波长,该度量区分(即分辨)第一细胞或组织类型与不同细胞或组织类型,而不需要事先具备细胞或组织类型的生物和/或化学知识并且/或者没有偏差。特别地,这种机器学习方法产生从细胞或组织类型的多个不同空间区域获取的吸收光谱的度量特征值的分布并对这些分布进行比较,从而考虑大约1011个数据点。相比之下,传统方法最多可考虑104个至105个数据点。由此,举例来说,通过这样确定的波长,癌症相关的肌成纤维细胞(CAM)可以更有效地与癌旁正常组织(ATM)区分开来,允许更早的诊断和改善患者治疗。
根据第一方面的方法有利地被发现提供可用于以高准确度来区分一种或多个细胞或组织类型与一种或多种其它细胞或组织类型的波长。在某些情况下,该方法已经发现了尚未使用已知技术发现的诊断波长。该方法对食管癌OE19、OE21、癌相关的肌成纤维细胞(CAM)和癌旁组织的肌成纤维细胞(ATM)细胞系的FTIR图像进行了区分,准确度在81%~97%之间。后一种细胞在形态上是不可区分的,但在刺激癌细胞生长的能力上已知具有重要功能区别;根据第一方面的方法提供了第一个精确的光谱区分取自同一患者的CAM和ATM细胞。该方法可区分癌变组织、癌相关间质(CAS)、巴雷特组织和巴雷特相关间质(BAS)食管癌组织的FTIR图像,准确度在69%~93%之间。该方法以较高的准确度和速度区分不同细胞和组织类型,比现有的随机森林方法具有明显的优势。特别地,可以实现对细胞类型之间的快速和准确的区分,并确定了区分不同细胞类型的关键波数。根据第一个方面的基于度量的分析(MA)方法被证明对于区分来自同一患者的癌间质细胞是独特的。关键波数与典型波数显著不同,以区分不同食管细胞和组织类型。此外,根据第一方面的方法允许基于癌症分期的间质细胞类型区分,所述间质细胞类型为肿瘤的发展提供了生态位。由于生物样本中发现的化学键种类繁多,预计该方法将广泛适用于其它细胞类型和组织。
分级较高度量可包括分级的度量的任何期望比例。例如,分级较高的度量可以包括在所有度量中排名前50%的度量。在实施例中,分级较高的度量可以不包括在所有度量的前50%之外的任何度量。作为另一个示例,分级较高的度量可以包括在所有度量中排名前30%的度量。在实施例中,分级较高的度量可以不包括在所有度量的前30%之外的任何度量。作为另一个示例,分级较高的度量可以包括在所有度量中排名前10%的度量。在实施例中,分级较高的度量可以不包括所有度量中排名前10%之外的任何度量。例如,分级较高的度量可以包括在所有度量中排名前5%的度量。在实施例中,分级较高的度量可以不包括所有度量中排名前5%之外的任何度量。
可以根据分布之间的重叠区域对度量进行分级。可以根据下列等式的结果对度量进行分级:
Figure BDA0002825527060000031
分布可视为概率分布函数。可以通过量化概率分布函数之间的相似程度对度量进行分级。在一个优选实施例中,利用概率分布函数的参数来量化概率分布函数之间的相似程度。
在一个实施例中,第一细胞或组织类型可以是已知的,并且可以不使用所述空间区域的第一部分来生成所述分布。在这一实施例中,该方法还可以包括定义每一个分级较高度量的成功率,成功率是通过以下步骤来确定的:利用所述分级较高的度量,将所述空间区域的第一部分中的每个空间区域分配给所述第一细胞或组织类型或所述不同的细胞或组织类型;确定利用所述分级较高的度量来正确分配的所述空间区域的第一部分的空间区域的数量;以及将分级较高的度量的成功率计算为所述分级较高的度量将所述空间区域的第一部分正确地分配给所述第一细胞或组织类型或所述不同的细胞或组织类型的频率。可以为任何度量计算成功率。可以为每个度量计算成功率。可以从具有比其它度量更高的成功率的度量中选择波长。在一个优选实施例中,波长选自具有最高成功率的500个度量。在实施例中,波长仅选自与具有最高成功率的500个度量相关联的波长。在实施例中,选择与具有最高成功率的500个度量相关联的所有波长。例如,可以从具有最高成功率的300个度量中选择波长。在实施例中,波长仅选自与成功率最高的300个度量相关联的波长。可以选择与具有最高成功率的300个度量相关的所有波长。例如,可以从多达100个具有最高成功率的度量中选择波长。在实施例中,波长仅选自与成功率最高的100个度量相关联的波长。可以选择与成功率最高的100个度量相关的所有波长。例如,可以从多达50个度量、40个度量、30个度量、20个度量或10个成功率最高的度量中选择波长。在实施例中,仅选择与成功率最高的50个度量相关联的波长。可以选择与成功率最高的50个度量相关的所有波长。可以从多达5个具有最高成功率的度量中选择波长。在实施例中,波长仅选自与成功率最高的5个度量相关联的波长。可以选择与成功率最高的5个度量相关的所有波长。
通过留下一些数据来检验所选定波长的区分准确度,能够有利地评估度量区分不同细胞或组织类型的良好程度,从而提供更多的用于选择区分波长的信息。
将第一部分的特征值与概率密度函数进行比较,以便将每个所述第一部分空间区域分配给第一细胞或组织类型或不同细胞或组织类型。
该方法还可以包括为每个分级较高的度量定义误标记率,所述误标记率是所述分级较高的度量将所述不同的细胞或组织类型识别为所述第一细胞或组织类型的概率。可以为任何度量或度量组计算误标记率。可以为每个度量计算误标记率。可以从比其它度量具有更低的误标记率的度量中选择波长。可以从多达500个具有最低误标记率的度量中选择波长。在实施例中,仅选择与具有最低误标记率的500个度量相关联的波长。可以选择所有与500个具有最低误标记率的度量相关联的波长。波长可以从多达300个具有最低的误标记率的度量中选择。在实施例中,可以仅选择与具有最低误标记率的300个度量相关联的波长。可以选择所有与300个具有最低误标记率的度量相关联的波长。可以从多达100个具有最低的误标记率的度量中选择波长。在实施例中,仅选择与具有最低误标记率的100个度量相关联的波长。可以选择与100个具有最低误标记率的度量相关的所有波长。波长可从多达50个度量、40个度量、30个度量、20个度量或10个度量中选择,这些度量具有最低误标记率。在实施例中,仅选择与具有最低误标记率的50个度量相关联的波长。可以选择所有与50个具有最低误标记率的度量相关联的波长。可以从多达5个具有最低误标记率的度量中选择波长。在实施例中,仅选择与具有最低误标记率的5个度量相关联的波长。所有与5个具有最低误标记率的度量相关联的波长都可以选择。
定义误标记率有利地提供了关于哪些所选择的波长更准确地区分不同细胞或组织类型的进一步的信息。
该方法还可以包括:通过对经计算的成功率和计算的误标记率执行第二数学函数并且比较所述第二数学函数的结果,对所述分级较高的度量进行评分。任何度量或度量组都可以被评分。每个度量都可以被评分。可以从比其它度量更高的度量中选择波长。可以从前500个评分度量中选择波长。在实施例中,仅选择与前500个评分度量相关联的波长。可以从前300个评分度量中选择波长。在实施例中,仅选择与前300个评分度量相关联的波长。可以从前100个评分度量中选择波长。在实施例中,仅选择与前100个评分度量相关联的波长。可以从前50个评分度量中选择波长。在实施例中,仅选择与前50个评分度量相关联的波长。可以从前5个评分度量中选择波长。在实施例中,仅选择与前5个评分度量相关联的波长。
对度量进行评分有利地提供了关于对所选择的哪些波长更准确地区分不同细胞或组织类型的进一步的认识。
第二数学函数可以是:
评分=成功率×(1-误标记率)
这个等式被发现是对度量进行精确评分的非常有用的第二数学函数。
该方法还可以包括为分级较高的度量的多个组合确定总体成功率,通过以下步骤计算所述总体成功率:利用对与两个最高分级的度量相关联的所述空间区域的第一部分的分配来确定所述空间区域的第一部分的平均分配,并且通过确定所述平均分配是正确的频率来确定与所述平均分配相关联的总体成功率;以及利用数量增加的所述分级较高的度量来重复此步骤。可以确定任意度量的多个组合的总体成功率。可以确定度量的所有组合的总体成功率。
为数量增加的度量确定总体成功率有利地提供了哪些度量可以用于进一步提高不同细胞或组织类型之间的区分准确度的概况。
该方法还可以包括将每个总体成功率与用于获取所述总体成功率的所述度量的数量进行比较;以及选择与所述总体成功率大于所需总体成功率的度量相关联的波长子组。举例来说,所期望的总体成功率可以是70%。举例来说,所期望的总体成功率可以是90%。
选择一个基于总体成功率比较的波长子组有利地为最准确地区分细胞类型提供了一个优选的度量数量(由用户定义)。例如,用户可以通过选择使用该方法想要等于或超过的总体成功率,来选择计算时间和识别准确度之间的平衡。在一个优选实施例中,将产生最高成功率的分级较高度量的数量视为用于实现更高区分准确度的度量的优选数量,并选择与优选度量的数量相关联的波长。
第一数学函数可以确定在度量的至少两个不同的辐射波长处吸收的辐射量的比值。
确定在度量的至少两个不同辐射波长处吸收的辐射量之间的比值有利地排除测量变量,例如,获取第一和第二吸收光谱的第一细胞或组织类型和不同细胞或组织类型的样本的厚度。这反过来又提高了选择区分波长的置信度,因为影响选择的、不需要的变量更少。
分布可视为概率分布函数。度量可以通过量化概率分布函数之间的相似程度来进行分级。
在一个优选实施例中,波长选自至多约500个最高分级度量。波长可以从大约300个最高分级度量中选择。波长可以从大约100个最高分级度量中选择。波长可以从最高分级的50、40、30、20或10个标准中选择。波长可以从多达5个最高分级度量中选择。
用于生成第一分布和第二分布的所述空间区域中的部分大于用于计算所述成功率的所述空间区域中的部分,在一个优选的实施例中,来自所述第一细胞或组织类型的图像的约75%的所述空间区域用于生成所述第一分布和第二分布,来自所述第一细胞或组织类型的图像的其余空间区域用于确定所述成功率。这构成了一种优选的提高对该方法的结果的置信度的“机器学习”方法。
用于产生第一组和第二组吸收光谱的辐射波长可以利用对第一细胞或组织类型的辐射吸收行为的现有知识来选择。这有利地避免了在吸收光谱领域花费时间,而这些领域已知不能提供任何有用的信息来区分细胞或组织类型。
第一组和第二组吸收光谱可包括选自约900cm-1至约4000cm-1范围内的波长。第一组和第二组吸收光谱可包括选自约1000cm-1至约3000cm-1范围内的波长。在一个优选实施例中,第一组和第二组吸收光谱包括选自约1000cm-1至约1800cm-1范围内的波长。例如,第一组和第二组吸收光谱可包括例如在约1000cm-1至约1800cm-1范围内的6cm-1间隔处获取的数据。
分布可以是直方图。直方图可以拟合(即近似)为高斯分布。
拟合的高斯分布可视为概率密度函数,将第一部分空间区域的特征值与概率密度函数进行比较,以便将每个所述第一部分空间区域分配给第一细胞或组织类型或不同细胞或组织类型。
第一细胞或组织类型和/或不同细胞或组织类型中的至少一个可以是病变组织。疾病可能是癌症,即病变组织可能是癌性的。在这些实施例中,其它相应的第一细胞或组织类型和/或不同细胞或组织类型中的至少一个可以是病变组织,例如,其中所述方法能够区分患者样本中不同类型的病变组织。其它相应的第一细胞或组织类型和/或不同细胞或组织类型中的至少一个可以是健康的组织,例如,其中所述方法能够区分患者样本中的病变组织和健康组织。
第一细胞或组织类型以及相应的不同细胞或组织类型可能是病变组织。第一种细胞或组织类型和不同细胞或组织类型可能是与不同疾病或同一疾病的不同阶段相关的组织。第一细胞或组织类型和不同细胞或组织类型中的至少一种可能处于病前状态,或已知有发生疾病或导致疾病的风险的状态(例如,处于癌前状态的细胞或组织类型)。
癌症
食管癌是癌症致死的第六大常见病因,是西方世界发病率上升最快的癌症。食管癌有两种主要形式。一种是鳞状细胞癌,在亚洲最常见,与吸烟和饮食不良有关。另一种是腺癌,在西方较为常见,与胃食管反流酸和胆盐以及巴雷特(Barrett)食管化生的癌前情况有关。两种癌症都由恶性上皮细胞和间质组成,后者对于促进癌症的进展至关重要。间质中最重要的细胞类型之一是一种称为肌成纤维细胞的特殊成纤维细胞,它产生生长因子和细胞因子,促进癌细胞生长和转移。食管癌的诊断采用内镜检查切除的组织图像,用血红素和伊红(H&E)染色后进行诊断。这突出了样本在蓝色和红色可见波长处的核酸和蛋白质含量。典型的低度异型增生的诊断是观察者之间的不一致,这种不一致是最早的肿瘤前阶段的特征,这种不一致大于50%。虽然这种不一致在诊断高度异型增生时减少到15%左右,但由于假阳性可引起不必要的手术,而假阴性则是致命的,故有必要提高诊断的准确度。与所有癌症一样,早期检测对患者的最佳结局至关重要,而且需要更便宜、更准确和理想的自动化方法来诊断癌症,并确定那些巴雷特食管的患者最有可能进展为异型增生和癌症。
长期以来人们认识到,扩大组织图像的波长范围将传达更多的信息,并且红外技术在组织检查中的应用已取得相当大的进展,以便将特定的红外波长与特定的化学部分结合起来。傅立叶变换红外光谱(FTIR)技术是应用于癌症研究的最成功的红外成像技术之一,并且具有很大的前景发展为诊断工具。成像FTIR通常在约1000个波长处的二维图像中的每个像素处产生信息,每一个光谱包含关于样本中包含的大量不同分子种类的许多激发模式的信息。大多数报告的工作都使用主要成分分析和表征样本的"特征图谱"识别等技术来分析这些大型数据集,而不是在单一振动模式的详细分配水平上进行分析,这种模式可以用更简单的分子系统来实现。
现在人们已经充分认识到,肿瘤的形成不仅需要肿瘤细胞获取DNA突变,还需要适当的细胞微环境(癌细胞生态位)来促进肿瘤的生长和转移。不同的间质细胞类型与生态位形成有关,包括炎症细胞和免疫细胞、微血管细胞和成纤维细胞系细胞。肌成纤维细胞是成纤维细胞的重要亚群;癌相关的肌成纤维细胞(CAM)在形态学上与癌(ATM)旁肉眼可见正常组织的肌成纤维细胞相似,但它们在生物学上有明显的差异,尤其是癌细胞攻击行为的强刺激物。转录、蛋白质组学和miRNA谱分析研究都为理解CAM和ATM之间的功能差异提供了基础。然而,仍然迫切需要能够快速和准确地识别这些细胞类型的方法,因为这将有助于识别肿瘤形成的细胞微环境。
后面讨论过往的将IR技术应用于食管癌研究中的工作。本文描述了应用一种新的多元分析技术对来源于食管腺癌患者的两种食管癌细胞系OE19和OE2以及两种食管肌成纤维细胞的间质的FTIR光谱进行分析的结果。OE19来源于食管-胃交界部的腺癌,OE21来源于食管鳞状细胞癌。两者都是从HPA文化收藏(Culture Collection)中购买的,并如前所述加以维护。两个肌成纤维细胞系是从同一个患者获取的CAM和ATM,并具有以前的特征。
如本文所述,根据第一方面的方法能够以高准确度和速度区分所有四种细胞类型。这对于CAM和ATM细胞尤其重要,因为前者在刺激癌细胞生长和侵袭方面的能力要强得多。因此,这些数据支持了在识别那些最有可能促进癌细胞生长的肌成纤维细胞的基础上,采用新的肿瘤早期发展分期方法的可行性。由于早期诊断改善了患者的预后,这种方法应该带来明显的好处。
该疾病可能是癌症,即病变组织可能是癌性的,或者疾病前的组织可能有癌变风险。第一细胞或组织类型和不同细胞或组织类型中的至少一种可为癌性,例如,其中第一细胞或组织类型和相应的不同细胞或组织类型为癌性的,例如癌症相关的肌成纤维细胞。癌症可能是食管癌,例如与食管癌细胞系OE19和/或OE21相关的癌症。
该病可能是胃食管反流病,如巴雷特食管。病变组织例如可以是巴雷特的组织或巴雷特的间质。
在一个优选实施例中,利用傅立叶变换红外光谱法获所述第一组和第二组吸收光谱。
第一组和第二组吸收光谱可以通过米氏散射效应来校正。
根据第二方面,提供了一种区分多种不同细胞或组织类型的方法,包括使用根据第一方面或其任何相关选项的方法选择的辐射波长对多个不同细胞或组织类型执行吸收光谱法,以及根据第一方面(或其任何实施例)中所述的步骤为多个细胞或组织类型确定相应的特征值,将吸收光谱获取的特征值与第一方面或其任何相关选择的方法获取的已知细胞或组织类型对应的分布进行比较,确定通过对所述多种不同的细胞或组织类型执行所述吸收光谱法所获取的所述特征值是否对应于所述已知细胞或组织类型的已知分布。用于获取相应吸收光谱的细胞或组织通常作为从患者获取的样本提供。分别的第一种组织类型和不同细胞或组织类型可以分别从患者获取,或者它们可以从患者获取的单个细胞或组织样本中获取(例如,细胞或组织类型可以同时存在于同一活检中)。
根据第三方面,提供了一种区分多种不同细胞或组织类型的方法,包括为多种不同细胞或组织类型获取与根据第一方面的或其任何相关选项/实施例的方法所选择的多种波长辐射中的每种辐射的吸收量相对应的信息,以及根据本发明第一方面所述的步骤为多种细胞或组织类型确定相应的特征值,比较在多个细胞或组织类型的每个波长处获取的特征值与通过第一方面的方法或其与所选波长相关的任何相关选项获取的、与已知细胞或组织类型对应的分布,并确定每种相应细胞或组织类型的特征值是否与已知细胞或组织类型的已知分布相对应。用于获取相应吸收光谱的细胞或组织通常作为从患者获取的样本提供。相应的第一种组织类型和不同细胞或组织类型可以分别从患者获取,或者它们可以从患者获取的单个细胞或组织样本中获取(例如,细胞或组织类型可以同时存在于同一活检中)。
获取与多个辐射波长中的每个波长处的辐射吸收量相对应的信息可以包括对多个不同细胞或组织类型进行辐射光谱。
根据第四方面,提供了一种识别从患者处获取的细胞或组织样本中存在或不存在第一细胞或组织类型的方法,该方法包括获取与根据第一方面的方法选择的多个辐射波长中的每个波长处的辐射吸收量相对应的信息;根据本发明的第一方面记载的步骤确定组织样本中的一个或多个细胞或组织类型的相应特征值;将在所述多个波长中的每个波长处获取的所述组织样本中的相应细胞或组织类型的特征值(即,已确定其特征值的细胞或组织类型)与所述选定波长相关联的所述第一细胞或组织类型的相应已知分布进行比较;确定所述组织样本中的所述细胞或组织类型的特征值是否与所述第一细胞或组织类型的已知分布相对应,并且,当确定组织样本中的细胞或组织类型的特征值与第一细胞或组织类型的已知分布相对应时,识别第一细胞或组织类型的存在,或者当确定组织样本中的细胞或组织类型的特征值与第一细胞或组织类型的已知分布不一致时,确定不存在第一细胞或组织类型。分别的第一种组织类型和一种或多个不同细胞或组织类型可以分别从患者获取,或者它们可以来自从患者获取的单个细胞或组织样本(例如,细胞或组织类型可以同时存在于同一活体组织切片中)。
如果第一细胞或组织类型和不同细胞或组织类型中的至少一种被确定为病变组织,则所述方法(例如,如本发明第四方面所述)还可包括例如通过疗法或手术来治疗患者的确定的疾病,例如通过向患者施用一种或多种具有治疗该疾病疗效的治疗剂,其中所述一种或多种治疗剂以治疗有效量给药。换句话说,本发明还提供了一种治疗患者疾病的方法,包括执行所述方法,以识别从根据第四方面(或其任何实施例)从包括多个不同细胞或组织类型的患者中获取的细胞或组织样本中存在或不存在第一细胞或组织类型,并且如果所述第一细胞或组织类型和所述不同细胞或组织类型中的至少一种被识别为处于疾病或疾病前状态,治疗患者中的相应疾病(例如通过疗法或手术,例如通过向患者施用一种或多种能有效治疗该疾病的治疗剂,即以足以治疗的剂量)。如果所识别的细胞或组织类型被归类为处于病前状态的细胞或组织类型或处于已知的发展为疾病的风险的状态或导致疾病的状态(例如,处于癌前状态的细胞或组织类型),则该方法可包括预防性治疗患者(即,试图预防疾病的发展或进一步发展)。在一些实施例中,该方法不进一步包括治疗患者中确定的疾病,例如通过手术或疗法。在实施例中,当第一细胞或组织类型和不同细胞或组织类型中的至少一种是病变组织时,所述方法可进一步包括在体外使病变细胞或组织类型与活性剂(例如治疗剂)接触,例如与已知在治疗该疾病中有疗效的治疗剂或被确定为治疗该疾病的候选药物。
根据实施例选择的辐射波长可用于识别仅包含单个细胞或组织类型的样本中给定细胞或组织类型的存在或不存在。例如,可以通过比较在组织样本中给定细胞或组织类型的每个波长处获取的特征值与所选波长相关的给定细胞或组织类型的相应已知分布,以及确定组织样本中给定细胞或组织类型的特征值是否与已知分布相对应来实现这一点。
在上述方面和实施例中,第一细胞或组织类型可以是食管癌细胞系OE19。第一细胞或组织类型可能是食管癌细胞系OE21。第一种细胞或组织类型可能是癌症相关的肌成纤维细胞。第一细胞或组织类型可以是相邻组织肌成纤维细胞。第一细胞或组织类型可能是癌变组织。第一种细胞或组织类型可能是癌症相关的间质。第一种细胞或组织类型可能是巴雷特组织。第一种细胞或组织类型可能是巴雷特相关间质。
在一个实施方案中,第一细胞类型是食管癌细胞系OE19,并且从患者获取的组织样本包括食管癌细胞系OE21、癌症相关的肌成纤维细胞和相邻组织肌成纤维细胞中的一者或多者(可选地,其中样本包含所有这些),其中选择的多个辐射波长对应于以下中的至少两个辐射波数(cm-1):1375,1381,1400,1406,1418,1692,1697。
可替换地,第一细胞类型可以是食管癌细胞系OE21,并且从患者获取的组织样本包括食管癌细胞系OE19、癌症相关的肌成纤维细胞和相邻组织肌成纤维细胞中的一者或多者(可选地,其中样本包含所有这些),其中选择的多个辐射波长对应于以下中的至少两个辐射波数(cm-1):1443,1449,1466,1472,1539,1545,1551。
在一个实施方案中,第一细胞类型是癌症相关的肌成纤维细胞,并且从患者获取的组织样本包括食管癌细胞系OE19、食管癌细胞系OE21和相邻组织的肌成纤维细胞中的一者或多者(可选地,其中样本包含所有这些),其中选择的多个辐射波长对应于以下中的至少两个辐射波数(cm-1):1443,1508,1522,1678,1684,1692。
在一个实施例中,第一细胞类型是邻近的组织的肌成纤维细胞,并且从患者获取的组织样本包括食管癌细胞系OE19、食管癌细胞系OE21和癌症相关的肌成纤维细胞(可选地,其中样本包括所有这些)中的一者或多者,其中选择的多个辐射波长对应于以下中的至少两个辐射波数(cm-1):1049,1103,1146,1200,1206,1400,1424,1466,1472。
在一个实施例中,第一种组织类型是食管癌组织,并且从患者获取的组织样本包括癌相关间质、巴雷特组织和巴雷特相关间质中的一者或多者(可选地,其中样本包含所有这些),其中选择的多个辐射波长对应于以下中的至少两个辐射波数(cm-1):1460,1466,1472,1480,1485。
在一个实施例中,第一种组织类型是癌相关间质,从患者获取的组织样本包括食管癌组织、巴雷特组织和巴雷特相关间质中的一者或多者(可选地,其中样本包含全部),其中选择的多个辐射波长对应于以下中的至少两个辐射波数(cm-1):999,1007,1018,1061,1067,1073。
在一个实施例中,第一种组织类型是巴雷特组织,并且从患者获取的组织样本包括食管癌组织、癌相关间质和巴雷特相关间质中的一者或多者(可选地,其中样本包含全部),其中选择的多个辐射波长对应于以下中的至少两个辐射波数(cm-1):1375,1406,1412,1418,1443,1449,1466。
第一种组织类型可以是巴雷特相关间质,患者获取的组织样本包括食管癌组织、癌相关间质和巴雷特组织中的一种或多种(可选地,其中样本包含所有这些),其中选择的多个辐射波长对应于以下中的至少两个辐射波数(cm-1):1375,1406,1412,1418,1443,1449,1466。
根据第五方面,提供了一种包括计算机可读指令的计算机程序,所述计算机可读指令被配置为使计算机执行根据第一方面或其任何相关选项的方法。
根据第六方面,提供了一种载有根据本发明的第五方面的计算机程序的计算机可读介质。
根据第七方面,提供了一种计算机设备,其用于选择辐射吸收光谱中用于区分不同细胞或组织类型的辐射波长,所述计算机设备包括存储处理器可读指令的存储器;以及用于读取和执行存储在所述存储器中的指令的处理器;其中,所述处理器可读指令包括被布设成控制计算机执行根据第一方面或其任何相关选项的方法的指令。
第一细胞类型和第二细胞类型可以选自以下细胞系中的任意两者:食管癌OE19、食管癌OE21、癌相关肌成纤维细胞(CAM)、和相邻组织肌成纤维细胞(ATM)。
第一种组织类型和第二种组织类型可以选自以下项中的任意两者:癌变组织、癌相关间质(CAS)、巴雷特组织、和巴雷特相关间质(BAS)食管癌组织。
如本文所述,患者可以是任何合适的患者,但通常是哺乳动物,优选是人。患者可以已被诊断为患有某种疾病(例如,已确定的疾病),或者可能尚未被诊断为患有待确定的相应疾病。
附图说明
现在将仅以示例的方式参考附图来描述实施例,其中:
图1A示出了根据本发明实施例的用于辐射吸收光谱法的选择辐射波长的方法的流程图,其中该方法能够将第一细胞或组织类型与不同细胞或组织类型进行区分;
图1B示出了根据本发明实施例的确定分布之间相似程度的可替代方法的流程图;
图1C示出了根据本发明实施例的选择与更高的总体成功率相关联的波长的方法的流程图;
由图2A至图2D组成的图2示出了通过根据本发明实施例的方法进行评分的针对构成每个度量的波数对每个度量的相对评分进行绘制的图;
由图3A至图3D组成的图3示出了针对四种不同细胞类型通过根据本发明实施例的方法进行评分的100个最佳评分的度量的图;
图4示出了针对图2和图3所讨论的四种细胞类型通过根据本发明实施例的方法计算的总体成功率的图;
图5示出了属于图2至图4中四个细胞的五个最高评分度量的波长的相对重要性的四个图;
图6示出了通过根据本发明实施例的方法计算的针对四种不同组织类型的总体成功率的图;
图7示出了针对图6的四个细胞通过根据本发明实施例的方法进行评分的属于五个最高评分的波长的相对重要性的四个图;
图8A示出了整合在所有波长上的OE19细胞(约5000个)的FTIR图像;
图8B示出了OE19(绿线)、OE21(红线)、CAM(紫线)和ATM(蓝线)所有像素的平均FTIR光谱;
图9示出了光谱曲线的比较。(a)OE19(绿线)、(b)OE21(红线CAM(紫线)和(d)ATM(蓝线)在1000cm-1至1200cm-1区域中的平均光谱。直方图示出了在区分CAM(紫)和ATM(蓝)细胞时,针对最佳度量的所发现的重要的波数;以及
由图10A至图10D组成的图10示出了具有针对OE19(图10A)、OE21(图10B)、CAM(图10C)和ATM(图10D)的标准偏差的平均光谱的光谱标准偏差。
具体实施方式
傅立叶变换红外光谱法(FTIR)涉及利用一系列的辐射波长照射样本,并且测量该样本吸收每个辐射波长的能力。样本中不同的化学键以不同的量吸收不同波长的辐射。生物样本通常含有很多不同的化学键。本发明通过分析不同细胞类型或不同组织类型以不同的波长下吸收辐射的差异,来区分不同的生物细胞类型或组织类型。FTIR通常在几千个波长范围内产生与样本的辐射吸收行为有关的信息。例如,生物样本的FTIR测量可输出样本的二维图像,该图像的每个像素包括吸收光谱,该吸收光谱包含生物样本中包含的大量不同化学键的众多激发模式的信息。
图1A示出了根据本发明实施例的在辐射吸收光谱法中使用的选择辐射波长的方法的流程图,该方法能够将第一细胞或组织类型与不同细胞或组织类型进行区分。简言之,该方法包括步骤:在S1,获取吸收光谱;在S2,定义一组度量(metric);在S3,对所述度量值执行数学函数;在S4,生成所述度量的分布;在S5,确定分布之间的相似程度;在S6,基于分布之间的相似程度对度量进行分级;在S7,选择与分级较高的度量相关联的波长。
图1A方法中的第一步骤S1包括获取吸收光谱。针对第一细胞或组织类型获取第一组吸收光谱,针对不同的细胞或组织类型获取第二组吸收光谱。第一组吸收光谱包括在第一细胞或组织类型的多个不同空间区域中的每个空间区域处获取的吸收光谱。第二组吸收光谱包括在不同的细胞或组织类型的多个不同空间区域中的每个空间区域处获取的吸收光谱。
例如,所述空间区域可以是第一细胞或组织类型或不同的细胞或组织类型的图像的像素。例如,第一步骤S1可以包括针对第一细胞或组织类型和不同的细胞或组织类型中的每一者对可以被称为FTIR数据立方体(data cube)的获取。FTIR数据立方体可以包括细胞或组织类型中的一者的图像。图像可以包括沿着数据立方体的第一维度的第一数量(i)的像素以及沿着数据立方体的第二维度的第二数量(j)的像素,第一维度与第二维度正交。例如,图像(i×j)的总大小可包括多达约5000个像素,例如,约5000个像素。数据立方体的第三维度与第一维度和第二维度均正交。第三维包括图像的每个像素处的FTIR光谱,FTIR光谱具有k个数据点。例如,第三维度可包括约900cm-1至约4000cm-1波长范围内的吸收光谱。吸收光谱的数据点k可以在波长范围内的间隔阶跃(step)处发生,例如大约2cm-1的阶跃。每种吸收光谱都可以根据米氏散射效应(Mie scattering effects)进行校正。FTIR数据立方体可以理解为包括i×j个像素的细胞或组织类型的图像,其中每个像素是细胞或组织类型的吸收光谱,该吸收光谱具有k个数据点。
图1A所示方法中的第二个步骤S2包括定义一组度量。为属于第一组吸收光谱的第一细胞或组织类型的每个空间区域定义一组度量。为属于第二组吸收光谱的不同的细胞或组织类型的每个空间区域定义相应的一组度量。每个度量包括至少两个数值条目(numerical entry),该数值条目提供与针对给定空间区域的至少两个不同波长所吸收的辐射量相对应的信息。也就是说,通过计算与细胞或组织类型在不同辐射波长下吸收的辐射量相关的度量在吸收光谱中将每个细胞或组织类型参数化。给定组中的度量包括辐射波长的不同组合。也就是说,对于由两个数值条目组成的度量,第一个数值条目可以是在第一个波长(AΛ1)处吸收的辐射量,第二个数值条目可以是在不同的波长(AΛ2)处吸收的辐射量。度量可以包括更多数量的数值条目,例如三个数值条目。这些度量可以被定义为使得一定光谱范围内的所有可能的波长对组合都包含在一组给定的度量中。例如,可以将度量定义为使得包括在约1000CM-1至约1800CM-1的范围内以6CM-1的间隔大小出现的所有可能的波长对。可以使用其它光谱范围和/或其它间隔大小。如果第一细胞或组织类型是已知的,则可以利用第一细胞或组织类型的辐射吸收行为的已有知识来选择所使用的光谱范围。也就是说,可以选择光谱范围,使得至少一些使用的波长以已知可识别的方式与第一细胞或组织类型相互作用。
图1A所示方法中的第三步S3包括对每个度量执行数学函数。第一数学函数作用于每个度量的至少两个条目,以便为每个度量生成特征值。也就是说,第一数学函数的结果是与特定的度量相关联的特征值。第一数学函数的结果(即特征值)取决于在属于度量的至少两个不同波长中的每一者处所吸收的辐射量。例如,第一细胞或组织类型的给定空间区域的给定度量可包括在1750cm-1的波长(例如X)处吸收的辐射量和在1100cm-1的波长(例如Y)处吸收的辐射量。第一数学函数作用于X和Y,以产生一个依赖于X和Y的结果。该结果被赋予该度量作为度量的特征值。
第一数学函数例如可以确定在度量的至少两个不同波长处吸收的辐射量之间的比值。确定在度量的至少两个不同波长处吸收的辐射量之间的比值有利地排除吸收光谱测量变量,例如,从中获取第一和第二吸收光谱的第一细胞或组织类型和不同的细胞或组织类型的样本的厚度。第一数学函数可以确定除比值以外的项。例如,第一数学函数可以确定在给定度量的至少两个不同波长处吸收的辐射量之间的差。
对度量进行定义使得许多或所有可能的波长对被考虑,这意味着图1A的方法平等地处理所有吸收光谱数据。也就是说,在任何特定的辐射波长处都不会被认为具有生物意义。从没有假定重要性开始,该方法能够证明生物标记物(即,不同的特征图谱)的存在性,其可以利用尚未使用已知方法识别的辐射波长来用于区分第一细胞或组织类型和不同细胞或组织类型。
图1A方法中的第四步骤S4包括生成度量的分布。对于每个度量,生成包括给定细胞类型或组织类型的每个空间区域的第一数学函数结果的分布。也就是说,对于给定细胞或组织类型的多个不同空间区域中的每一者,存在给定的度量(即在不同辐射波长处吸收的信息的给定组合)。给定度量的特征值可以在给定细胞或组织类型的不同空间区域之间变化。因此,每个度量都可以具有自己的第一数学函数的结果的分布。特征值可以例如由于细胞或组织类型的不同区域内的细胞或组织类型的结构差异和/或分子组成的差异而在给定细胞或组织类型的不同空间区域之间变化。对于给定的度量,每个分布包括属于给定细胞或组织类型的多个不同空间区域内的第一数学函数的结果。例如,这些分布可以是直方图。通过将直方图处理成高斯分布,可以精确地描述和分析每个直方图。
图1A方法中的第五步骤S5包括确定分布之间的相似程度。将属于第一细胞或组织类型的给定度量的分布与属于不同的细胞或组织类型的相应度量的分布进行比较。确定分布之间的相似程度。
确定分布之间的相似程度可以通过多个不同的方式来实现。图1B示出了根据本发明实施例的确定分布之间相似程度的可替代方法的流程图。从图1B可以看出,图1A方法的第五步骤S5可以以多种不同的方式执行。例如,第一种方法包括第一子步骤S5A:确定分布之间重叠面积。分布的总面积可与分布之间的重叠面积进行比较。具有较大重叠面积的分布可被认为比具有较小重叠面积的分布更相似。
可替代的,第二种方法包括第一子步骤S5B:将分布处理为概率分布函数。也就是说,可以将分布以数学方式处理为概率分布函数,并且可以通过比较概率分布函数的参数来确定概率分布函数之间的相似程度。例如,概率分布函数的参数可以包括概率分布函数的平均值和/或标准偏差。具有独特参数的概率分布可被认为与具有相似参数的概率分布函数相比更不相似。
作为另一种替代方式,分布可以近似为高斯分布,并且可以将高斯分布的参数互相进行比较,以确定分布之间的相似程度。对于每个度量,重复第五步骤S5,使得对于每个度量都知道第一细胞或组织类型与不同细胞或组织类型之间的相似程度。然后可以通过量化概率分布函数之间的相似程度来对度量进行分级。
再次参考图1A,该方法中的第六步骤S6包括基于属于度量的分布之间的相似程度对度量进行分级。所述度量被分级为使得:与相似程度较低的分布相关联的度量的分级高于与相似程度较高的分布相关联的度量。也就是说,生成独特分布的度量比生成相似分布的度量分级更高。对度量进行分级可以通过多种方式来实现。例如,在将分布的总面积与分布之间的重叠面积进行比较时(例如,在图1B所示的第一子步骤S5A中),可以使用以下等式对度量进行分级:
Figure BDA0002825527060000151
参考图1B,图1B所示的第一方法的第二子步骤S6A包括根据分布之间的重叠面积对度量进行分级。两个给定分布之间的重叠面积越大,这些分布就越相似。因此,针对与这两个分布相关联的度量的分级就越低。另一方面,两个给定分布的重叠面积越小,这些分布就越不相似。因此,针对与这两个分布相关联的度量的分级就越高。
如前所讨论的,对度量进行分级的可替代方法包括:将分布以数学方式处理为概率分布函数,并且将具有概率分布函数的独特参数的概率分布函数进行分级。图1B所示的第二方法的第二子步骤S6B包括:利用概率分布函数的参数对度量进行分级。例如,概率分布函数的参数可以包括概率分布函数的平均值和/或标准偏差。所述参数可用于确定概率分布函数之间的相似程度。所述参数可用于确定给定结果属于一个概率分布函数而不是其它概率分布函数的概率。下面参照图1C进行更详细地讨论。
分布可以近似为高斯分布,并且与具有独特参数的高斯分布相关联的度量的分级可以比与具有相似的参数的高斯分布相关联的度量的分级更高。例如,高斯分布的参数可以包括高斯分布的平均值和/或标准偏差。上述参数可用于确定近似的高斯分布之间的相似程度。例如,所述参数可用于确定高斯分布之间的重叠面积。可替代地,还可以将高斯分布处理为概率分布函数,并且可以使用概率分布函数的参数来确定概率分布函数之间的相似程度。
再次参考图1A,该方法中的第七步骤S7包括:选择与分级较高的度量相关联的辐射波长。如上面所讨论的,利用生成最独特分布的最高分级的度量根据与度量相关联的分布的独特程度对所述度量进行分级。两个分布越独特,与生成这两个分布的度量相关联的辐射波长处的第一细胞或组织类型和不同细胞或组织类型之间的吸收行为的差异就越大。因此,分级较高的度量包括这样的辐射波长:其在用于照射细胞或组织类型时,会导致细胞或组织类型吸收行为的较大差异。也就是说,第一细胞或组织类型在与最高分级度量相关联的辐射波长处的吸收行为与不同细胞或组织类型在与任何其它度量相关联的辐射波长处的吸收行为相比具有最大的差异。第一细胞或组织类型与不同的细胞或组织类型之间的吸收行为的差异用于区分第一细胞或组织类型与不同的细胞或组织类型。分级较高的度量包括在辐射吸收光谱法中使用的能够区分第一细胞或组织类型与不同细胞或组织类型的辐射波长。
图1C示出了根据实施例的选择与更高的总体成功率相关联的波长的方法的流程图。第七步骤S7可以包括一个或多个子步骤S7A至子步骤S7E,例如所有这些附加步骤的子步骤S7A至子步骤S7E。当对于第一细胞或组织类型的识别是已知的时,可执行子步骤S7A至子步骤S7E。
简言之,第七步S7可包括一个或多个子步骤:在S7A,为度量定义成功率;在S7B,为度量定义误标记率;在S7C,对度量进行评分;在S7D,确定度量组合的总体成功率;和/或在S7E,选择与更高的总体成功率相关联的波长。
图1C方法的第一子步骤S7A包括为每个较高分级度量定义成功率。可以为每个度量定义成功率。成功率用于评估给定度量正确识别给定吸收光谱是否属于第一细胞或组织类型以及不同细胞或组织类型的频率。为了定义成功率,属于第一细胞或组织类型的第一部分空间区域不用于生成用于每个度量的分布。相反,该第一部分空间区域用于测试每个度量如何能够精确地区分第一细胞或组织类型和不同细胞或组织类型。第一部分空间区域可能小于空间区域的剩余部分。例如,第一部分空间区域可以包括空间区域总数的大约25%,而空间区域的剩余部分包括空间区域总数的大约75%。不过,还设想了其它比值。分级较高的度量用于将属于所述第一部分空间区域的每个空间区域分配给第一细胞或组织类型或不同的细胞或组织类型。即,分级较高的度量用于预测第一部分空间区域的每个空间区域是否属于第一细胞或组织类型或不同的细胞或组织类型。每个度量可用于预测第一部分空间区域的每个空间区域是否属于第一细胞或组织类型或不同的细胞或组织类型。
为了产生测试结果,可以通过针对属于第一细胞或组织类型的空间区域的第一部分的每个空间区域对给定度量执行第一数学函数来定义成功率。将测试结果与属于第一细胞或组织类型以及不同的细胞或组织类型的相应分布(即与给定度量相关联的分布)进行比较。比较用于预测测试结果是否属于第一细胞或组织类型或不同的细胞或组织类型。因为第一细胞或组织类型的身份是已知的,所以由测试结果做出的预测是可以验证的,并且针对给定度量的成功率可以定义为预测正确的频率。一般来说,成功率包括确定利用分级较高的度量来确定被正确分配的第一部分空间区域的数量。可以为任何度量计算成功率。例如,可以为每个度量计算成功率。至少可以为分级较高的度量计算成功率。为度量定义成功率将有利地评估度量在区分细胞或组织类型方面有多良好。成功率表明选择的辐射波长在区分细胞或组织类型方面有多精确。
如果将分布以数学方式处理为概率密度函数,则针对属于第一细胞或组织类型的第一部分空间区域的多个空间区域的测试结果可以用于从概率密度函数中提取属于第一细胞或组织类型空间区域的第一部分的每一者的概率。然后,空间区域被预测为属于具有最高的关联的概率的细胞或组织类型。然后可以验证预测,因为第一细胞或组织类型的身份是已知的,并且针对给定度量的成功率可以被计算为给定度量正确地预测空间区域的第一部分的身份的频率。属于其中一种细胞或组织类型的空间区域的提取概率可被称为针对该细胞或组织类型的置信度。
图1C中的方法的第二子步骤S7B包括为度量定义误标记率。可以为每一个度量确定误标记率。至少可以对分级较高度量确定误标记率。该误标记率表示度量错误地将不同的细胞或组织类型识别为第一细胞或组织类型的概率。该度量用于预测属于第一细胞或组织类型的空间区域所属的细胞或组织类型。从与度量相关联的概率密度函数中提取的属于第一细胞或组织类型(即正确的细胞或组织类型)的度量的概率与该度量的成功率相对应。然后,该度量用于预测属于不同细胞或组织类型的空间区域属于哪个细胞或组织类型。从与度量相关的概率密度函数中提取的属于第一细胞或组织类型(即不正确的细胞或组织类型)的度量的概率与度量的误标记率相对应。为度量定义一个误标记率有利地提供了关于哪个相关联的波长最准确地区分第一细胞或组织类型和不同的细胞或组织类型的进一步的信息。
图1C中的方法的第三子步骤S7C包括对度量进行评分。每个度量都可以被评分。至少可以对分级较高的度量进行评分。可以通过对经计算的成功率和误标记率执行第二数学函数来对度量进行评分。然后可以根据第二数学函数的结果对度量进行评分。由度量接收的评分对应于度量准确区分细胞类型的能力。例如,第二数学函数可以是以下等式:
评分=成功率×(1-误标记率)
如前面所讨论的,成功率是给定细胞类型被正确标记的几率,误标记率是其它一个或多个细胞类型被错误标记为给定细胞类型的几率。
为了举例说明本发明的有效性,对四个FTIR数据立方体执行第二数学函数。第一FTIR数据立方体是从食管癌相关肌成纤维细胞(cancer associated myofibroblast,CAM)细胞系获取的。第二FTIR数据立方体是从相邻组织肌成纤维细胞(adjacent tissuemyofibroblast,ATM)细胞系获取的。第三FTIR数据立方体是从食管癌OE19细胞系获取的。第四FTIR数据立方体是从食管癌OE21细胞系获取的。由图2A至图2D组成的图2示出了针对构成每个度量的波数的为每个度量的相对评分而绘制的图。图2A示出了OE19细胞系的相对评分。图2B示出了OE21细胞系的度量的相对评分。图2C示出了CAM细胞系的度量的相对评分。图2D示出了ATM细胞系的度量的相对评分。在图2的示例中,红色表示较高评分,而蓝色表示较低评分。从图2中可以看出,每个细胞类型显示独特行为(即相似程度低)的光谱区域不同。对于CAM和ATM细胞系,在图2C和图2D的图中分别看到了非常不同的行为。这突出表明了这两种细胞类型之间的明显区别。这是一个重要的结果,因为组织病理学学家发现很难用目前的标准光学显微镜方法在H&E染色的样本上区分这些细胞类型。例如,关于CAM细胞系(图2C),高评分度量是包含至少一个约1750cm-1的高波数的那些度量。相反的情况是ATM(图2D),其中高评分度量通常与至少一个约1150cm-1的低波数相关联。
由图3A至图D组成的图3示出了针对CAM、ATM、OE19和OE21细胞系的第二数学函数结果的100个最佳评分度量的图。图3A示出了针对OE19细胞系的100个最佳评分度量。图3B示出了OE21细胞系的100个最佳评分度量。图3C示出了针对CAM细胞系的100个最佳评分度量。图3D示出了针对ATM细胞系的100个最佳评分度量。在图3的示例中,每个度量由两个不同波长的辐射组成。因此,在图3的图上,每个度量因此表示为两个圆(特别地,分别为一个未填充圆和一个对应的填充圆),其中每个圆对应于度量的一个波数(即波长的倒数)。图3示出了辐射波数的组合,这些组合作为度量的个数从1增加到100的函数。图3A示出了度量的放大区域,更清楚地示出了未填充的圆和相应的填充圆。图3的每个曼哈顿关系图(Manhattan plot)示出了最好的100个度量。该关系图是累积的,其中以度量号N标记的水平行上显示的圆(即未填充圆和相应填充圆)是最佳N度量的圆。例如,针对最佳度量(即,顶部度量,度量数N=1),因此有两个圆,这个最佳度量的每个波数各一个,在图的最顶部。对于下一行的度量数N=2,有4个圆,每个度量有2个,对于最佳的2个度量(即,顶部2个度量),因为关系图是累积的。在第三行,有6个圆,每个度量2个,对于最佳的2个度量(即,顶部3个度量),等等。因此,度量数N所示的波数对于度量数N+1也必须显示,而度量数N+1与度量数N相比,最多可以显示两个额外的波数。注意,某些波数可能从一个度量数到下一个度量数相同,因此有些圆是重叠的。也就是说,在前100个度量中,不是所有度量的波数都是唯一的。相反,有些波数在两个或两个以上度量之间是共有的。例如,从图3A中,对于度量1,对于2个唯一的波数示出了2个圆,而对于度量N=100,对于56个唯一的波数示出了大约56个圆(并非如果针对100个最佳度量的所有波数都是唯一的则是200个圆)。
从图3中的图的独特形式可以清楚地看出,在选择用于区分这四种细胞类型的波长方面存在显著差异。例如,对于CAM和ATM细胞,在图3C和图3D的图中可以看到非常不同的行为。这些差异突出了通过图1A方法在这两种细胞类型之间实现的明确区分。例如,图3C示出了用于区分CAM与ATM的较高评分的度量,OE19和OE21是那些包含至少一个约1750cm-1的波数的度量。相反,图3D示出了ATM细胞系的不同情况,其中评分较高的度量通常与至少一个1150cm-1左右的相对较低的波数相关。这是一个重要的结果,因为组织病理学家发现很难使用已知的方法对血色素和伊红染色样本进行光学显微镜检查来区分这些细胞类型。
第二数学函数可以采取除以上讨论以外的其它形式。作为进一步的示例,第二数学函数可以是下列任何一个等式:
评分=成功率×置信度
评分=(成功率)2×置信度
评分=成功率×(置信度)2
评分=(成功率)2×(置信度)2
评分=成功率×(1-误标记率)2
在一个优选实施例中,第二数学函数是以下等式:
评分=成功率×(1-误标记率)2
图1C中的方法的第四子步骤S7D包括为度量组合确定总体成功率。可以为每个度量组合计算总体成功率。可以为至少分级较高的度量的组合计算总体成功率,例如最高500个、最高400个、最高300个、最高200个、最高100个,或最高50个、40个、30个、20个、10个或5个等等的分级度量。总体成功率可通过利用与两个最高分级度量相关联的第一部分空间区域的分配来计算,以确定第一部分空间区域的平均分配。然后可以通过确定平均分配是正确的频率来确定与平均分配相关的总体成功率。可以利用数量增加的分级较高度量来重复这个步骤。使用多个分级较高度量的细胞或组织类型之间的区分有利地降低了该方法对随机噪声的灵敏度和特定细胞或组织类型内吸收光谱的微小变化。确定总体成功率有利地概括了用于对细胞或组织类型进行区分的最佳总体成功率的优选度量数量。
总体成功率可以被绘制为用于产生总体成功率的度量数量的函数,其表明在改善第一细胞或组织类型与不同的细胞或组织类型之间的区分方面所需的优选的度量数量。产生最高成功率的分级较高度量的数量可被视为用于实现最高区分准确度的优选的度量数量。但是,出于实际目的,可能需要使用比给出最高成功率所需的数量更少的若干分级较高的度量。例如,这可能是这样的情况:较低数量的度量依然提供了对于给定目的而言足够高的区别准确度。这样做的优点是在较短的时间和/或较少的计算工作量内提供适当的准确度。
图4示出了针对图2和图3所讨论的四种细胞类型的总体成功率的图。该图示出了对于每个细胞类型,总体成功率如何随图1C方法的第四子步骤S7D中使用的分级较高度量的数量的增加而变化。不同细胞类型表现出不同的变化。例如,ATM细胞系的总体成功率随着使用多达24个度量的度量数量的增加而增加,随后减少。相比之下,对于较低数量的度量,OE19的总体成功率很高,并且随着包括更多的度量而下降。对于每种细胞类型,用于区分的分级较高度量的优选数量可由最高总体成功率的位置确定。
图1C中的方法的第五子步骤S7E包括选择与更高的总体成功率相关联的波长。可以选择至少与最高总体成功率相关联的波长。选择与更高的总体成功率相关联的波长可能涉及将每一个总体成功率与用于获取总体成功率的度量数量进行比较。与总体成功率大于期望总体成功率的度量相关联的波长可以被选择为波长的子组。总体成功率最高的度量的数量可称为最佳度量数量,因为该度量数量提供了对细胞或组织类型的最准确的区分。
针对不同的细胞或组织类型的总体成功率可能不同。再次参考图4,可以看出,对于ATM的总体成功率针对每个度量的增加而增加,直到使用24个度量,此后,总体成功率下降。相比之下,对于相对较少的度量,OE19的总体成功率相对较高,并且随着使用更多的度量而降低。
实验方法
下面讨论用于生成图2至图7和表1至表4所示数据的实验设置。
在两个食管癌细胞系(OE19和OE21)和两个食管癌肌成纤维细胞系(CAM(癌相关)和ATM(邻近组织相关))上进行了实验。CAM和ATM来源于同一个患者的食管腺癌和手术切除的肉眼可见的邻近正常组织。两个组织标本中一个为癌变组织,另一个为巴雷特(Barrett)组织。OE19和OE21人类高加索(Caucasian)食管癌细胞是从HPA培养物(英国多塞特郡的Sigma公司)获取的。在罗氏公园纪念研究所(RPMI 1640)将细胞在37℃、5%CO2气氛下培养于生长培养基(Sigma)中,添加2mM谷氨酰胺(Sigma)、10%v/v胎牛血清(FBS)(英国佩斯利镇的Invitrogen公司)和1%v/v青霉素/链霉素(Sigma),直至它们达到70%~80%的合流。培养基每隔2天补充一次。培养肌成纤维细胞在37℃,5%CO2的CO2环境下,用含10%FBS的L-谷氨酰胺、1%非必需氨基酸溶液、1%青霉素/链霉素和2%抗菌素的杜尔贝科的改良Eagle培养基中培养。培养基每48小时~60小时更换一次,细胞融合传代12次。将CaF2盘(20mm直径×2mm厚,英国普尔镇的Crystran公司)用乙醇灭菌,用超纯水冲洗,晾干过夜。用紫外线照射盘子30分钟,以确保灭菌。然后将无菌盘置于组织培养的十二孔板(美国纽约州的Corning公司)的每个孔中。细胞(2×104mL)接种在每个培养盘上,在5%CO2培养箱中37℃培养2天。培养2天后取出培养基,用4%v/v多聚甲醛(PFA)(Sigma)溶液固定细胞,在4℃下存储在1×的磷酸盐缓冲盐水(PBS)中,直至需要时。在成像之前,用Millipore超纯水(18MΩcm)冲洗含有固定细胞的CaF2玻片至少三次。然后从孔板中取出清洗过的玻片,用超纯水擦拭后表面以确保完全除去任何磷酸盐残留,然后在载玻片插板中保持干燥至少90分钟。
经伦理委员会的适当批准和知情患者的同意,使用标准活检钳从皇家利物浦和布劳德格林大学医院NHS信托的诊断食管-胃十二指肠镜检查患者的食管活检样本。对巴雷特食管患者(无异型增生的组织学证据)和巴雷特相关食管腺癌患者进行活检。将其固定在10%福尔马林溶液中,包埋在石蜡中。作为常规患者护理的一部分,胃肠道组织病理学顾问对H&E染色后证实了组织学诊断。随后使用微型机切割每个石蜡块的5μm系列切片,安装在氟化钙盘上,并使用二甲苯脱蜡。
利用Varian公司(现为美国加州圣克拉拉的Agilent Technologies公司)生产的Varian Cary670-FTIR光谱仪和Varian Cary 620-FTIR成像显微镜与128×128像素汞-镉-碲化物(MCT)焦平面阵列一起对细胞系和组织切片进行了FTIR研究。在990cm-1至3800cm-1的光谱范围内获取FTIR图像,分辨率为2cm-1,共加256次扫描。红外光谱最初采用基于主成分分析的降噪算法进行预处理。通过保留10个主要组成部分,在不丢失具有生物意义的信息的情况下,对信噪比进行了实质性改善。然后对光谱进行质量检查,以去除不属于细胞(包括样本的空白区域)的或高度散射的光谱。质量检查采用了基于酰胺I带高度的阈值,光谱的吸光度保持在0.03至1.00之间。最后利用RMies-ESMC算法,采用80次迭代和间质凝胶参考谱对红外光谱进行了米氏散射校正。
实验数据和讨论
对每个细胞类型获取了FTIR数据立方体,并对其进行了米氏散射效应校正。每个FTIR数据立方体由i×j个象素(通常为i×j=5000)组成,其中第三维是1406个数据点的FTIR光谱,覆盖波数v=990cm-1至3800cm-1的范围内的2cm-1步。从OE19样本获取的FTIR图像如图8A所示。在1000cm-1至1800cm-1的“特征图谱区”上表征每个细胞类型的FTIR光谱(图8B)是通过平均从该细胞类型的相应FTIR图像中的每个像素获取的光谱而产生的。此平均值不包括图像空白区域中的像素。从这些平均曲线的直接比较中推断信息会存在问题。首先,由于从每一样本中获取的光谱总强度的变化,需要将每一曲线归一化到弧线下同一区域。由于归一化对光谱曲线的影响取决于所使用的波长范围,这可能隐藏或加剧不同试样的曲线之间的差异。最后,给定波数下所有像素的吸光度的标准偏差是显著的,并且在细胞类型之间显示出显著的重叠(图10)。因此,需要更复杂的分析来揭示不同细胞系的光谱分布之间的差异。这是使用多变量分析方法获取的,下文称为度量分析(MA)。这些度量被选择为给定一对波数的吸光度比。重要的是,这种MA方法平等地处理所有数据,并且不将任何生物学意义归于任何特定波数,而是与传统方法相反,在传统方法中,组织的区分使用定义为具有与组织生物化学相关的意义的度量。通过在1000cm-1至1800cm-1的整个范围内检查波数的比值,MA证明波数中存在生物标记物,这些标记物在以前的研究中未用其它分析技术鉴定。
MA方法可分为三个主要部分:第一阶段:训练,第二阶段:测试,第三阶段:分析。关于这里报告的结果,利用随机选择的数据集中75%的频谱完成了训练,并对剩余的25%进行了测试。第一阶段通过计算在两个波数处的吸光度比来对每个细胞类型进行参数化,即度量。对所有波数组,在选定的步长,在1000cm-1至1800cm-1之间进行上述操作。步长为6cm-1,因为任何较小的东西都被证明是不必要的。因此,总共有约18000个度量。在第二阶段中,然后将一个评分与每个度量相关联,以量化该度量能够在多大程度上区分细胞类型。对于每种细胞类型,通过对各种度量(一种为细胞类型,另一种为分析中的其它细胞类型)进行分布直方图来计算评分,其中独特的分布获取较高的评分,因此重叠相对较少。评分定义为:
评分=成功率×(1-误标记率)2
其中成功率(通常称为灵敏度)是指细胞类型被正确标记的几率,而误标记率(通常称为假阳性几率)是指其它细胞类型被错误标记为该细胞类型的几率。考虑到在该测试阶段使用的25%的光谱,已知细胞类型,可计算成功率,并使用识别其它细胞类型的概率来确定误标记率。每个度量的评分用来对该度量区分给定细胞类型的能力进行分级。第三阶段确定了投票系统为获取最佳的细胞类型区分总体成功率所需的度量数量。总体成功率绘制为度量的数量的函数,其表明实现最佳区分所需的度量的最佳数量。
MA方法所发现的对区分最重要的波数可以在度量评分对v1和v2的绘图中显示出来,下面称为蝴蝶图(butterfly plot)。对于CAM和ATM,这四个绘图在图2中示出,如前所述。一般而言,蝴蝶图可被视为热度图,其中热度以度量评分表示,使得红色对应于相对较高的度量评分,而蓝色对应于相对较低的度量评分。蝴蝶图是关于直线v1=v2的对称图。所有可能的度量都在这些绘图中显示。色条刻度从最不重要(蓝色)到最重要(红色)的区分度量不等。对于CAM和ATM样本,在蝴蝶图中可以看到非常不同的行为,这突出了这两种细胞类型之间的明显区别。这是一个重要的结果,因为组织病理学学家发现很难用目前的240标准光学显微镜方法在H&E染色的样本上区分这些细胞类型。对于CAM,高评分度量是指至少包含一个约1750cm-1的高波数(图2C中的红色区域)的度量。相反的情况是ATM,其中高评分度量通常与至少一个约1150cm-1的低波数相关(图2D中的红色区域)。
虽然对所有可能的度量(在选择的步长)的评分进行了评估并显示在图2中,但是可以通过将结果限制为最佳(最高评分)100个度量的可视化,从而获取更多的认识,以下称为曼哈顿图。CAM和ATM的绘图在图3中示出,其中为v1(红色)和v2(蓝色)绘图示出了每种细胞类型的最高分级度量。这些绘图示出了波数的组合,这些波数被用作度量从1增加到100的函数。显然,这两种细胞类型之间用于区分的波数存在显著差异。
除了通过蝴蝶图和曼哈顿图来可视化度量评分之外,成功率还可以在一个绘图(图4)中显示,该绘图显示,对于每个细胞类型,成功率如何随分析中使用的度量数量的增加而变化。总的来说,成功率最终会下降,因为度量加得不够而影响了成功率。不同细胞类型也有不同的变化。例如,ATM的成功率随着使用的度量数量增加到24个而增加,随后下降。相比之下,对于较低数量的度量,OE19的成功率很高,并且随着使用的度量越来越多而下降。对于每个细胞类型,根据最大成功率的位置得出了区分所需的最佳度量数。由于数据是从每个细胞系的单个图像中采集的,因此人们担心,由于成像系统的空间分辨率有限,相邻像素的光谱可能会对分析产生偏差,从而导致不切实际的高分。为了确保这一点,空间有序谱被分成训练和测试集,使得绝大多数训练谱与测试谱不相邻。该分析返回了与原始集不可区分的结果,表明任何这样的像素相关性都不会对结果产生任何显著的偏差。
下表1示出了与图2、图3和图4相关讨论的四种细胞类型中每个细胞的前五个度量的波数。
表1:细胞系度量概览
Figure BDA0002825527060000231
Figure BDA0002825527060000241
每种细胞类型的度量的最佳数量不同。对于给定的细胞类型,相同的波数可能出现在多个前五个评分度量中,因此,不同细胞类型之间的前五个评分度量的波数的数量可能有所不同。当用于区分上述细胞类型时,根据第一方面的方法能够达到81%至97%的准确度。发明人发现,区分不同细胞类型的波数与以前用来描述食管组织类型的波数有显著不同。两种或两种以上细胞类型所共有的波数意味着该波数区分这些细胞类型和所有其它细胞类型。可以理解,这意味着波数(或波长)可能是这些细胞类型中存在或不存在的化学部分的特征,其浓度与所有其它细胞类型中的浓度显著不同。
为了帮助解读在这一分析中被发现很重要的波数,对每个细胞类型检查前五个度量中的波数。选择了五个度量来给出合适的波数,以便能够对不同细胞类型的值进行有意义的比较。这些波数见图5和表1,在讨论部分将进一步讨论。
图5示出了与OE19、OE21、CAM和ATM细胞系的五个最高评分度量相关联的波数重要性的四个图。从图5的图可以看出,每个细胞类型都有一组不同的重要波长,每一个都是通过图1A的方法找到的。波数的重要性可能与波数在区分过程中被发现有用的频率相对应。也就是说,波数的重要性可能与波数在较高评分度量中出现的次数相对应。
下面讨论图1A方法在四种不同组织样本中的应用。内镜活检取自一名巴雷特食管患者(无异型增生的组织学证据)和一名巴雷特相关食管腺癌患者。从这些标本中,经胃肠组织病理学家的组织学诊断,确定了四种不同的组织类型:癌变组织、癌相关间质、巴雷特组织和巴雷特相关间质。图1A的方法实现了对这些组织类型的区分,平均成功率为85%。组织类型的结果见图6和图7。
图6示出了四种不同组织类型(癌变组织、癌相关间质(CAS)、巴雷特组织和巴雷特相关间质(BAS))的总体成功率图。与图4所示细胞类型的情况一样,组织类型的总体成功率随着在图1C方法的第四子步骤S7D中使用的分级较高度量的数量的增加而变化。不同的组织类型表现出不同的变化。与图4中细胞类型的情况一样,对于图6中的每种组织类型,可根据最大总体成功率的位置确定用于区分的分级较高度量的优选数量。
图7示出了与图6的癌变组织、CAS、巴雷特组织和BAS样本的五个最高评分度量相关的波数的重要性的四个图示。图示示出了区分前五个度量的四种组织类型的波数。从图7的图示可以看出,每种组织类型都有一组不同的重要波长,每种波长都是通过图1A的方法找到的。
下面的表2示出了与图6和图7相关讨论的四种组织类型中每一种的前五个度量的波数。
表2:细胞系度量概览
Figure BDA0002825527060000251
与表1所示细胞类型的情况一样,表2中各组织类型之间的最佳度量值数量不同。图1A的方法对四种不同组织类型的准确度达到71%至93%。发现区分不同组织类型的波数与以前用来描述食管组织类型的波数有很大的不同。与表1的情况一样,对于表2,给定的与两种或两种以上组织类型相同的波数意味着该波数区分这些组织类型和所有其它组织类型。这意味着给定的波数(或波长)是那些组织类型中存在或不存在的化学部分的特征,其浓度与所有其它组织类型中的浓度显著不同。从表1和表2之间的比较可以看出,总的来说,组织样本在分析中通常需要使用比细胞系样本更多的度量来进行更准确的区分。考虑到与细胞样本相比,组织样本的化学部分的更有异质性,这样的情况是可以预期的。
下面讨论了图1A的方法与已知的选择区分波长的“随机森林(random forest)”方法进行的比较。为了将图1A的方法与先前用于FTIR数据分析的已知随机森林方法进行比较,针对(i)上文关于图2至图5讨论的四种细胞系和(ii)上文关于图6和7讨论的四种食管组织类型,使用两种技术对相同数据集进行分析。采用随机森林方法构造分类器,对不同样本进行分类。下表3将随机森林方法的结果与根据实施例的方法对四种不同细胞系OE19、OE21、CAM和ATM的结果进行比较。
为了将MA方法与现有分类方法进行比较,我们选择了与已有的随机森林(RF)方法进行定量比较。这是最合适的比较,因为RF封装了特征提取和分类,并且通常用于生物医学领域中的FTIR数据分析。采用这两种方法对四个细胞系的相同数据集进行了分析。RF方法是https://github.com/tingliu/randomforest-matlab提出的标准RF分类算法,用来构造分类器来区分不同样本。表3比较了细胞系的MA和RF分析结果。发明人发现在这两种技术中区分所必需的关键波数显示出一些相似性。当运行RF分析超过约30秒或将树的数量从10棵增加到500棵时,准确度几乎没有提高。一般而言,MA方法在比RF更短的时间(表3)内在区分(尤其是ATM)上达到了更高的准确度。例如,OE21的MA在一分钟内达到79%的成功率,而RF仅限于18至50%。当从四种可能的细胞类型中选择一种细胞类型时,RF似乎无法区分ATM,成功率不高于随机机会(25%)。RF方法的成功率很低,这是与每个细胞系相关的数据集(光谱数)的大小的结果。MA方法给出了较高的成功率,无论数据集是否是平衡的或者大小差不多,而RF方法对这种平衡很敏感,给出的成功率比较差,除非重新平衡数据集或重新加权输入数据。
表3:通过度量分析(MA)和随机森林(RF)方法获取的OE21细胞系成功率(%)
Figure BDA0002825527060000261
发明人发现在这两种技术中区分所必需的关键波数显示出一些相似性。在运行超过30秒的随机森林分析时或通过将树的数量从10棵增加到500棵,准确度几乎没有提高。一般来说,根据一个实施例的方法在较短的时间内(与随机森林方法相比)实现了更高的区分准确度(尤其是对ATM)。例如,根据OE21的一个实施例的方法在一分钟内达到79%的成功率,而随机森林方法仅限于大约50%的成功率。随机森林法不能区分ATM,当从四种可能的类型中选择一种细胞类型时,成功率不高于随机机会(25%)。
下面的表4将随机森林方法的结果与根据实施例的方法对四种不同组织类型癌变组织、癌相关间质(CAS)、巴雷特组织和巴雷特相关间质(BAS)的结果进行比较。
表4:通过度量分析(MA)和随机森林(RF)方法得出的针对组织类型的成功率(%)。
Figure BDA0002825527060000271
对于分析的四种组织类型,根据一个实施例的方法的结果与已知的随机森林方法的比较表明,与细胞系的结果更接近一致。如表4所示,两种方法区分癌变组织的能力相似。根据实施例的方法获取的成功率大约比巴雷特组织的识别率高10%。根据一个实施例的方法获取的成功率大约比癌相关间质组织的识别率高20%。总体而言,与已知的随机森林方法相比,在显著较短的时间内,根据实施例的方法获取了较高的平均成功率。
发明人发现通过图1A方法相关的表1和表2中讨论的区分不同细胞和组织类型的辐射波长与以前用于表征食管组织类型的波长有显著差异。图1A方法中发现的区分细胞和组织类型的波长的含义是微妙的,因为波长是通过盲对比较所有细胞类型和分别所有组织类型的FTIR光谱中的所有波长得出的。因此,必须小心地解读区分波长。当与其它度量结合使用时,所选波长为所有细胞和组织类型提供了极好的区分。
讨论
FTIR在食管正常和癌变组织研究中的应用已有显著进展。例如,对正常组织和癌变组织的FTIR曲线进行了比较,发现在某些波数处有明显的吸收变化。例如,在964cm-1和1237cm-1的变化被认为是恶性组织中核酸含量增加,表明糖原在健康组织中明显存在,但在癌变组织中几乎完全耗尽。例如,采用偏最小二乘拟合方法,在950cm-1至1800cm-1范围内,鳞状细胞、巴雷特非异型增生、巴雷特异型增生和胃组织的FTIR光谱的主要成分可能由DNA、蛋白质、糖原和糖蛋白浓度的变化引起。异型增生的特征可能是糖蛋白和DNA增加。例如,利用共焦FTIR显微术和二阶导数FTIR谱的分层聚类分析的成像研究,对正常和巴雷特食管组织与腺癌进行了区分,证实了糖蛋白带与巴雷特的关联,并在腺窝边缘发现了它们。例如,快速IR标测自动分析技术识别巴雷特异型增生或腺癌的灵敏度为95.6%,特异性为86.4%。二阶导数傅里叶变换红外光谱分析证实正常鳞状组织糖原含量高,巴雷特组织糖蛋白含量高,巴雷特异型增生和腺癌DNA含量高。
然而,从根据第一方面描述的MA的结果中可以注意到的第一点是,发现区分不同细胞类型的波数(表1)与以前用于表征食管组织类型的波数显著不同。例如,使用常规方法区分的糖原、糖蛋白或DNA波峰均未出现在表1中。另外,用另一种常规方法区分正常组织与腺癌的二十种特征性波数中只有四种出现在表1中。这并不意味着使用传统方法识别的波数不是有效的区分子(事实上,当包含更多的度量时,MA会发现这些区分子),但它们并不像前五个度量中发现的那样重要。
另一种常用的方法是对所有其它细胞的四个波数进行区分,准确度为±1cm-1;ATM(1049cm-1)、OE19和ATM(1399cm-1)、OE19和ATM(1465cm-1)以及OE21(1545cm-1)。这些波数可能与糖原、脂质、脂质和蛋白质有关。在MA中发现的区分细胞类型的波数的意义是微妙的,因为这些波数是由所有细胞类型的FTIR光谱中所有波数的盲对比较得出的。因此,必须小心地解读区分波数。很明显的是,当与其它度量结合使用时,它们在所有细胞类型之间提供了极好的区分(图5)。在五个度量水平上的分析示出了24个区分波数,如上文详细描述的,前人的工作中这些波数中只有四个被用于描述食管组织类型之间的差异。表1中的区分波数中的五种对一种以上细胞类型是共有的。一个波数为两种细胞类型所共有意味着其区分这些细胞和所有其它细胞。这意味着它是一个在那些细胞中存在或不存在化学部分的特征,其浓度与它在所有其它细胞中的浓度显著不同。从前人的工作中发现恶性肿瘤的特征是DNA的增加和糖原的大量减少,这显示这些分子的浓度的变化对ATM细胞(其可以作为健康的组织的代表)和CAM细胞及两种恶性细胞系具有重要的区分作用。这使人注意到1000cm-1至1200cm-1之间的区域,其中来自两种分子的强贡献之间有重大重叠。并且表1和图5示出了在该光谱区域中区分波数的强浓度。图9示出了该光谱区域中每个细胞类型的图8A的归一化光谱分布的叠加。正如前面所解释的那样,光谱的这种比较可能是误导的,因为谱线取决于进行归一化的波长范围。然而,通过对正常组织和恶性组织的光谱进行第三次幂导数,前人通过使用常规方法,已经在该区域已发现了四个关键波数:1024cm-1,1049cm-1,1080cm-1和1155cm-1,它们可能分别与糖原、糖原、核酸和蛋白质有关。在表1和图5的区分波数列表中,只发生一个波数1049cm-1。对24个最佳度量值下的数据进行更深入的分析,显示出这一范围内区分波数的大量增加,如图9所示。这些额外的波数都不与前人用常规方法确定的波数相对应。图9中所示的一些区分波数可能来自OE19、OE21和CAM细胞系的DNA中的特定化学或结构406效应,这些效应不能从已知由特定化学部分产生的波数表中识别出来。
其它区分不同细胞类型和已知化学部分特征的波数的比较提供了对细胞和组织化学结构差异的其它认识。例如,来自腺癌的OE19细胞和CAM细胞在1692cm-1处有一个与核酸相关的区分子,而OE21细胞则不存在这种区分子。这种波数可能是腺癌特有的部分。OE21和ATM细胞共有1466cm-1和1472cm-1的区分波数,被识别为脂质特征。特别值得注意的是,度量法在腺癌细胞(OE19)和鳞状细胞癌细胞(OE21)之间提供了极好的区分,而ATM和CAM细胞对15种区分它们和其它细胞类型的细胞中的一种不共享。很明显,各种细胞类型之间的区分波数的识别还包含丰富的信息,值得进一步研究,并可能对食管癌和其它癌症的化学结构产生重大的新认识。
概要
描述将第一细胞或组织类型与不同的细胞或组织类型进行区分的选择辐射波长的方法。获取第一组吸收光谱和第二组吸收光谱,每一组分别包括在第一细胞或组织类型的多个不同空间区域和不同的细胞或组织类型的多个不同空间区域处获取的光谱。为每个空间区域的第一组吸收光谱和第二组吸收光谱定义相应的一组度量。每个度量包括与至少两个不同的波长的吸收相对应的信息。每组中的度量包括不同的波长组合。为每个度量生成特征值。利用针对第一细胞或组织类型的相应特征值和不同的细胞或组织类型的相应特征值为每个度量生成分布,并且将分布进行比较以确定相似程度。基于相似程度对度量进行分级,并且选择与分级较高度量相关联的、具有较高的相似性的波长。
简言之,根据一个实施例的方法可以区分食管癌OE19、OE21、CAM和ATM细胞系之间的FTIR图像,其准确度在81%至97%之间。这为来自同一患者的3cm内的组织中取得的CAM和ATM肌成纤维细胞之间提供了第一准确的区分。这是一个重要的结果,因为组织病理学家发现很难用目前的标准光学显微镜方法在H&E染色的样本上区分这些细胞类型。根据一个实施例的方法提供了一种解读FTIR数据的新方法。该方法揭示了辐射的波长,这种辐射的波长唯一地区分所有四种不同细胞和组织类型,其中许多细胞和组织类型以前未被识别出健康组织中的化学部分。根据一个实施例的方法以高准确度和速度区分不同细胞和组织类型,与已知的随机森林方法相比具有显著的优势。由于生物样本中发现的化学键种类繁多,可以预期根据一个实施例的方法可广泛适用于其它细胞类型和组织。
更详细地,发明人已经证明了一种新的多变量统计分析技术,该技术可以区分OE19、OE21、CAM和ATM细胞系的FTIR图像,其准确度在81%至97%之间。这为来自同一患者的3cm内的组织中取得的CAM和ATM肌成纤维细胞之间提供了第一准确的光谱区分。应该强调的是,这些细胞类型并不是通过常规的形态学方法来区分的,尽管它们具有重要的与刺激癌细胞行为有关的生化差异。这一结果在早期诊断中具有潜在的临床应用价值,这是通过在不依靠生物标记物的分析或大量的组织处理的情况下识别推断的肿瘤细胞的微环境以及通过允许区分肿瘤与邻近组织间质来做到的。这是一个重要的结果,因为组织病理学家发现,用目前标准的光学显微镜方法对H&E染色样本进行区分是很困难的。此外,数据表明,现在有理由进行更大的、适当供电的、针对重要临床群体(尤其是那些巴雷特氏病最有进展风险的患者,包括那些有发育异常病变的患者)的光谱区分的试验。MA方法为FTIR数据的解读提供了一种新的方法。它揭示了波数,这种波数在唯一地区分四种细胞类型,其中许多细胞类型以前未被鉴定出健康组织中的化学部分。该方法能以较高的精度和速度区分细胞类型,并且与射频方法相比具有显著优势。该方法有望广泛地应用于其它细胞类型和组织。
在环境允许的情况下,可以在硬件、固件、软件或其任意组合中实施各个实施例。这些实施例也可实施为存储在机器可读介质上的指令,该指令可由一个或多个处理器读取和执行。机器可读介质可以包括以机器(例如,计算设备)可读的形式存储或传输信息的任何机制。例如,机器可读介质可以包括只读存储器(ROM);随机存取存储器(RAM);磁存储介质;光存储介质;闪存设备;电、光、声或其它形式的传播信号(如载波、红外信号、数字信号等)等。此外,固件、软件、例程、指令可以在本文描述为执行某些操作。然而,应当理解的是,这种描述只是为了方便,这种行为实际上是由于执行固件、软件、例程、指令等的计算设备、处理器、控制器或其它设备造成的,并且这样做将使执行器或其它设备与物理世界进行互动。
虽然已经描述了具体的实施例,但应当理解的是,本发明可以以除所描述方式以外的方式来实践。上文所描述的旨在是说明性的,而不是限制性的。因此,对于本领域技术人员明了的是,在不偏离所附权利要求的范围的情况下,可以对所描述的本发明进行修改。

Claims (30)

1.一种选择辐射波长的方法,该方法能够将第一细胞或组织类型与不同的细胞或组织类型进行区分并且用于辐射吸收光谱法,所述方法包括:
获取第一组吸收光谱和第二组吸收光谱,所述第一组吸收光谱包括在所述第一细胞或组织类型的多个不同空间区域中的每个空间区域处获取的吸收光谱,所述第二组吸收光谱包括在所述不同的细胞或组织类型的多个不同空间区域中的每个空间区域处获取的吸收光谱;
为属于所述第一组吸收光谱的每个空间区域定义一组度量,以及为属于所述第二组吸收光谱的每个空间区域定义相应的一组度量,其中,每个度量包括与针对给定空间区域的至少两个不同的波长所吸收的辐射量相对应的信息,并且所述一组度量包括不同的波长组合;
对每个度量执行第一数学函数,以为每个度量生成特征值,其中,所述特征值取决于在属于所述度量的至少两个不同的波长中的每一者处所吸收的辐射量;
生成分布和相应的分布以及针对所述度量中每一者进行重复,所述分布包括在属于所述第一细胞或组织类型的多个空间区域内的给定度量的特征值,所述相应的分布包括在属于所述不同的细胞或组织类型的所述多个空间区域内的相同给定度量的特征值;
针对给定度量对为所述第一细胞或组织类型和所述不同的细胞或组织类型所生成的分布进行比较、确定所述分布之间的相似程度,并且针对其它度量中的每一者重复该步骤;
基于属于所述度量的所述分布之间的相似程度对所述度量进行分级,其中,与具有相似程度较低的分布相关联的度量的分级高于与具有更高相似程度的分布相关联的度量;以及
选择与分级较高的度量相关的辐射波长。
2.根据权利要求1所述的方法,其中,所述分布被处理为概率分布函数,并且通过量化所述概率分布函数之间的相似程度对所述度量进行分级,优选地,其中,通过利用所述概率分布函数的参数来量化所述概率分布函数之间的所述相似程度。
3.根据前述权利要求中任一项所述的方法,其中,所述第一细胞或组织类型是已知的,并且其中,不使用所述空间区域的第一部分来生成所述分布,并且所述方法还包括:为每个分级较高的度量定义成功率,所述成功率通过以下步骤确定:
利用所述分级较高的度量,将所述空间区域的第一部分中的每个空间区域分配给所述第一细胞或组织类型或所述不同的细胞或组织类型;
确定利用所述分级较高的度量来正确分配的所述空间区域的第一部分的空间区域的数量;以及
将分级较高的度量的成功率计算为所述分级较高的度量将所述空间区域的第一部分正确地分配给所述第一细胞或组织类型或所述不同的细胞或组织类型的频率。
4.根据权利要求3所述的方法,其中,将用于所述空间区域的第一部分的特征值与概率密度函数进行比较,以将所述第一部分中的空间区域中的每一者分配给所述第一细胞或组织类型或所述不同的细胞或组织类型。
5.根据权利要求3或4所述的方法,其中,所述方法还包括:为每个分级较高的度量定义误标记率,所述误标记率是所述分级较高的度量将所述不同的细胞或组织类型识别为所述第一细胞或组织类型的概率。
6.根据权利要求3至5中任一项所述的方法,其中,还包括:通过对经计算的成功率和计算的误标记率执行第二数学函数并且比较所述第二数学函数的结果,对所述分级较高的度量进行评分,优选地,其中,所述第二数学函数为:
评分=成功率×(1-误标记率)2
7.根据权利要求6所述的方法,其中,还包括:为所述分级较高的度量的多个组合确定总体成功率,通过以下步骤计算所述总体成功率:
利用对与两个最高分级的度量相关联的所述空间区域的第一部分的分配来确定所述空间区域的第一部分的平均分配,并且通过确定所述平均分配是正确的频率来确定与所述平均分配相关联的总体成功率;以及
利用数量增加的所述分级较高的度量来重复此步骤。
8.根据权利要求7所述的方法,其中,还包括:
将每个总体成功率与用于获取所述总体成功率的所述度量的数量进行比较;以及
选择与所述总体成功率大于所需总体成功率的度量相关联的波长子组。
9.根据前述权利要求中任一项所述的方法,其中,所述第一数学函数确定在度量的至少两个不同的辐射波长处所吸收的辐射量之间的比值。
10.根据前述权利要求中任一项所述的方法,其中,所述波长是从大约500个最高分级的度量中选择的。
11.根据权利要求3至10中任一项所述的方法,其中,用于生成第一分布和第二分布的所述空间区域中的部分大于用于计算所述成功率的所述空间区域中的部分,优选地,其中,来自所述第一细胞或组织类型的图像的约75%的所述空间区域用于生成所述第一分布和第二分布,来自所述第一细胞或组织类型的图像的其余空间区域用于确定所述成功率。
12.根据权利要求19所述的方法,其中,第一组和第二组吸收光谱包括在约900cm-1至约4000cm-1波长、优选地在约1000cm-1至约1800cm-1波长处获取的数据。
13.根据前述权利要求中任一项所述的方法,其中,所述第一细胞或组织类型和/或所述不同的细胞或组织类型中的至少一者是癌性的。
14.根据前述权利要求中任一项所述的方法,其中,所述第一组和第二组吸收光谱是通过傅立叶变换红外光谱法获取的,和/或其中,所述第一组和第二组吸收光谱是通过米氏散射效应校正的。
15.一种区分多种不同的细胞或组织类型的方法,包括:
利用根据权利要求1至14中任一项所述的方法所选择的辐射波长对所述多种不同的细胞或组织类型执行吸收光谱法;以及
根据权利要求1所述的步骤,为多种细胞或组织类型确定相应的特征值;
将通过所述吸收光谱法获取的所述特征值与根据权利要求1至14中任一项所述的方法获取的已知细胞或组织类型所对应的分布进行比较;以及
确定通过对所述多种不同的细胞或组织类型执行所述吸收光谱法所获取的所述特征值是否对应于所述已知细胞或组织类型的已知分布。
16.一种区分多种不同的细胞或组织类型的方法,包括:
为所述多种不同的细胞或组织类型获取与根据权利要求1至14中任一项所述的方法所选择的多个辐射波长中的每一者处所吸收的辐射量相对应的信息;以及
根据权利要求1所述的步骤,为多种细胞或组织类型确定相应的特征值;
将在所述多种细胞或组织类型的所述多个波长中的每一者处获取的所述特征值与根据权利要求1至14中任一项所述的方法获取的与所选择的波长相关联的已知细胞或组织类型相对应的分布进行比较;以及
确定用于每个相应的细胞或组织类型的所述特征值是否对应于所述已知细胞或组织类型的已知分布。
17.一种识别细胞或组织样本中存在或不存在第一细胞或组织类型的方法,所述细胞或组织样本获取自包括多种不同的细胞或组织类型的患者,所述方法包括:
获取与根据权利要求1所述的方法选择的多个辐射波长中的每一者处所吸收的辐射量相对应的信息,并且根据权利要求1所述的步骤为所述组织样本中的一种或多种细胞或组织类型确定相应的特征值;
将为所述组织样本中的相应的细胞或组织类型在所述多个波长中的每一者处获取的所述特征值与所选择的波长相关联的用于所述第一细胞或组织类型的相对应的已知分布进行比较;
确定用于所述组织样本中的所述细胞或组织类型的所述特征值是否对应于所述第一细胞或组织类型的已知分布;以及
当用于所述组织样本中的所述细胞或组织类型的所述特征值被确定为对应于所述第一细胞或组织类型的所述已知分布时,则识别出存在所述第一细胞或组织类型,或者当用于所述组织样本中的所述细胞或组织类型的所述特征值被确定为不对应于所述第一细胞或组织类型的所述已知分布时,则确定不存在所述第一细胞或组织类型。
18.根据权利要求17所述的方法,其中,所述第一细胞类型为食管癌细胞系OE19,并且获取自所述患者的所述组织样本包括食管癌细胞系OE21、癌症相关肌成纤维细胞和相邻组织肌成纤维细胞中的一者或多者,并且其中,已选择的多个辐射波长对应于以下辐射波数(cm-1)中的至少两者:1375、1381、1400、1406、1418、1692、1697。
19.根据权利要求17所述的方法,其中,所述第一细胞类型为食管癌细胞系OE21,并且获取自所述患者的所述组织样本包括食管癌细胞系OE19、癌症相关肌成纤维细胞和相邻组织肌成纤维细胞中的一者或多者,并且其中,已选择的多个辐射波长对应于以下辐射波数(cm-1)中的至少两者:1443、1449、1466、1472、1539、1545、1551。
20.根据权利要求17所述的方法,其中,所述第一细胞类型为癌症相关肌成纤维细胞,并且获取自所述患者的所述组织样本包括食管癌细胞系OE19、食管癌细胞系OE21和相邻组织肌成纤维细胞中的一者或多者,并且其中,已选择的多个辐射波长对应于以下辐射波数(cm-1)中的至少两者:1443、1508、1522、1678、1684、1692。
21.根据权利要求17所述的方法,其中,所述第一细胞类型为相邻组织肌成纤维细胞,并且获取自所述患者的所述组织样本包括食管癌细胞系OE19、食管癌细胞系OE21和癌症相关肌成纤维细胞中的一者或多者,并且其中,已选择的多个辐射波长对应于以下辐射波数(cm-1)中的至少两者:1049、1103、1146、1200、1206、1400、1424、1466、1472。
22.根据权利要求17所述的方法,其中,所述第一组织类型为食管癌组织,并且获取自所述患者的所述组织样本包括癌相关间质、巴雷特组织和巴雷特相关间质中的一者或多者,并且其中,已选择的多个辐射波长对应于以下辐射波数(cm-1)中的至少两者:1460、1466、1472、1480、1485。
23.根据权利要求17所述的方法,其中,所述第一组织类型为癌相关间质,并且获取自所述患者的所述组织样本包括食管癌组织、巴雷特组织和巴雷特相关间质中的一者或多者,并且其中,已选择的多个辐射波长对应于以下辐射波数(cm-1)中的至少两者:999、1007、1018、1061、1067、1073。
24.根据权利要求17所述的方法,其中,所述第一组织类型为巴雷特组织,并且获取自所述患者的所述组织样本包括食管癌组织、癌相关间质和巴雷特相关间质中的一者或多者,并且其中,已选择的多个辐射波长对应于以下辐射波数(cm-1)中的至少两者:1375、1406、1412、1418、1443、1449、1466。
25.根据权利要求17所述的方法,其中,所述第一组织类型为巴雷特相关间质,并且获取自所述患者的所述组织样本包括食管癌组织、癌相关间质和巴雷特组织中的一者或多者,并且其中,已选择的多个辐射波长对应于以下辐射波数(cm-1)中的至少两者:1375、1406、1412、1418、1443、1449、1466。
26.根据权利要求17至25中任一项所述的方法,其中,还包括:当所述第一细胞或组织类型和所述不同的细胞或组织类型中的至少一者被确认为处于患病状态的细胞或组织类型时,将患病细胞或组织类型与已知对治疗疾病有效的活性剂或被确定为治疗该疾病的候选治疗剂在体外接触。
27.一种治疗患者疾病的方法,其中,所述方法包括根据权利要求17至25中任一项所限定的方法来识别获取自患者的细胞或组织样本中存在或不存在第一细胞或组织类型,并且当所述第一细胞或组织类型被识别为处于患病状态或预患病状态时,则治疗相应的疾病。
28.一种计算机程序,其包括计算机可读指令,所述计算机可读指令被配置成使计算机执行根据权利要求1至27中任一项所述的方法。
29.一种计算机可读介质,其装载有根据权利要求28所述的计算机程序。
30.一种计算机设备,其用于选择辐射吸收光谱法中并且用于区分不同的细胞或组织类型的辐射波长,所述计算机设备包括:
存储处理器可读指令的存储器;以及
用于读取和执行存储在所述存储器中的指令的处理器;
其中,所述处理器可读指令包括被布设成控制计算机执行根据权利要求1至27中任一项所述的方法的指令。
CN201980039162.7A 2018-04-11 2019-04-05 光谱分析方法 Pending CN112334058A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1806002.0 2018-04-11
GBGB1806002.0A GB201806002D0 (en) 2018-04-11 2018-04-11 Methods of spectroscopic analysis
PCT/GB2019/050998 WO2019197806A1 (en) 2018-04-11 2019-04-05 Methods of spectroscopic analysis

Publications (1)

Publication Number Publication Date
CN112334058A true CN112334058A (zh) 2021-02-05

Family

ID=62202870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980039162.7A Pending CN112334058A (zh) 2018-04-11 2019-04-05 光谱分析方法

Country Status (7)

Country Link
US (1) US11340157B2 (zh)
EP (1) EP3773160B1 (zh)
JP (1) JP7241425B2 (zh)
CN (1) CN112334058A (zh)
ES (1) ES2961639T3 (zh)
GB (1) GB201806002D0 (zh)
WO (1) WO2019197806A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3174914A1 (en) * 2020-03-18 2021-09-23 Nutek O.I.D.O Ltd. System and method for detection of residual cancerous tissue
GB202109318D0 (en) 2021-06-29 2021-08-11 Univ Liverpool Method and apparatus
CN116223398B (zh) * 2023-02-01 2023-11-03 广州华立学院 一种基于光谱分析的水肥药一体化浓度配比方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL146521A0 (en) * 2001-11-15 2002-07-25 Univ Ben Gurion Novel optical method for diagnosis and grading of premalignant and malignant human colonic tissues
CN1804593A (zh) * 2006-01-18 2006-07-19 中国科学院上海光学精密机械研究所 单细胞拉曼光谱判别上皮细胞癌症性质的方法
US20070161922A1 (en) * 2006-01-09 2007-07-12 Medical Optical Imaging Systems Ltd. Method of infrared tomography, active and passive, for earlier diagnosis of breast cancer
WO2011143121A2 (en) * 2010-05-10 2011-11-17 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Spatial-domain low-coherence quantitative phase microscopy
CN104094099A (zh) * 2011-04-15 2014-10-08 体质医学股份有限公司 测量细胞体积和成份
CN106324131A (zh) * 2016-08-12 2017-01-11 中国人民解放军第四军医大学 一种食管鳞状细胞癌前lgien和hgien的标记蛋白质的筛选方法
CN107003242A (zh) * 2014-09-16 2017-08-01 劳伦斯·利弗莫尔国家安全有限责任公司 使用荧光剂进行染色之后在紫外激发的情况下使用荧光显微镜控制组织中的成像深度的系统和方法
CN106993996A (zh) * 2016-01-25 2017-08-01 安徽省立医院 一种光纤锥探头及其制备方法与其在制备诊断胃癌的产品中的应用
WO2017161097A1 (en) * 2016-03-16 2017-09-21 Ohio State Innovation Foundation System and method for the discrimination of tissues using a fast infrared cancer probe
CN107209934A (zh) * 2014-12-03 2017-09-26 文塔纳医疗系统公司 用于定量分析异质生物标志物分布的方法、系统和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2438093T3 (es) 2008-05-29 2014-01-15 Northeastern University Método de reconstitución de espectros celulares útiles para la detección de trastornos celulares
EP2577298B1 (en) 2010-06-01 2020-02-26 Todos Medical Ltd. Diagnosis of cancer
US9025850B2 (en) 2010-06-25 2015-05-05 Cireca Theranostics, Llc Method for analyzing biological specimens by spectral imaging
GB201011171D0 (en) * 2010-07-02 2010-08-18 Univ Aberystwyth Method for diagnosing lung cancer
JP5617532B2 (ja) * 2010-10-29 2014-11-05 ソニー株式会社 誘電サイトメトリ装置及び誘電サイトメトリによる細胞分取方法
GB201018628D0 (en) 2010-11-04 2010-12-22 Univ Nottingham Method, apparatus and software for identifying cells
JP2015102542A (ja) 2013-11-28 2015-06-04 住友電気工業株式会社 生体検査装置
US10299684B2 (en) 2013-12-20 2019-05-28 Koninklijke Philips N.V. User interface for photonic tools and electromagnetic tracking guided bronchoscope
JP2016028229A (ja) 2014-07-08 2016-02-25 キヤノン株式会社 データ処理装置、及びそれを有するデータ表示システム、試料情報取得システム、データ処理方法、プログラム、記憶媒体
EP3741303A3 (en) * 2015-03-06 2020-12-30 Micromass UK Limited Chemically guided ambient ionisation mass spectrometry

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL146521A0 (en) * 2001-11-15 2002-07-25 Univ Ben Gurion Novel optical method for diagnosis and grading of premalignant and malignant human colonic tissues
US20070161922A1 (en) * 2006-01-09 2007-07-12 Medical Optical Imaging Systems Ltd. Method of infrared tomography, active and passive, for earlier diagnosis of breast cancer
CN1804593A (zh) * 2006-01-18 2006-07-19 中国科学院上海光学精密机械研究所 单细胞拉曼光谱判别上皮细胞癌症性质的方法
WO2011143121A2 (en) * 2010-05-10 2011-11-17 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Spatial-domain low-coherence quantitative phase microscopy
CN104094099A (zh) * 2011-04-15 2014-10-08 体质医学股份有限公司 测量细胞体积和成份
CN107003242A (zh) * 2014-09-16 2017-08-01 劳伦斯·利弗莫尔国家安全有限责任公司 使用荧光剂进行染色之后在紫外激发的情况下使用荧光显微镜控制组织中的成像深度的系统和方法
CN107209934A (zh) * 2014-12-03 2017-09-26 文塔纳医疗系统公司 用于定量分析异质生物标志物分布的方法、系统和装置
CN106993996A (zh) * 2016-01-25 2017-08-01 安徽省立医院 一种光纤锥探头及其制备方法与其在制备诊断胃癌的产品中的应用
WO2017161097A1 (en) * 2016-03-16 2017-09-21 Ohio State Innovation Foundation System and method for the discrimination of tissues using a fast infrared cancer probe
CN106324131A (zh) * 2016-08-12 2017-01-11 中国人民解放军第四军医大学 一种食管鳞状细胞癌前lgien和hgien的标记蛋白质的筛选方法

Also Published As

Publication number Publication date
JP7241425B2 (ja) 2023-03-17
EP3773160A1 (en) 2021-02-17
WO2019197806A1 (en) 2019-10-17
ES2961639T3 (es) 2024-03-13
GB201806002D0 (en) 2018-05-23
US20210148813A1 (en) 2021-05-20
US11340157B2 (en) 2022-05-24
JP2021520264A (ja) 2021-08-19
EP3773160B1 (en) 2023-08-30

Similar Documents

Publication Publication Date Title
Shipp et al. Intra-operative spectroscopic assessment of surgical margins during breast conserving surgery
Gajjar et al. Diagnostic segregation of human brain tumours using Fourier-transform infrared and/or Raman spectroscopy coupled with discriminant analysis
Kumar et al. Change in the microenvironment of breast cancer studied by FTIR imaging
Benard et al. Infrared imaging in breast cancer: automated tissue component recognition and spectral characterization of breast cancer cells as well as the tumor microenvironment
Pallua et al. Fourier transform infrared imaging analysis in discrimination studies of squamous cell carcinoma
Leslie et al. Identification of pediatric brain neoplasms using Raman spectroscopy
US10012591B2 (en) Measurement of tissue structures
Pilling et al. Infrared spectral histopathology using haematoxylin and eosin (H&E) stained glass slides: a major step forward towards clinical translation
US20110091081A1 (en) Method and system for analyzing the expression of biomarkers in cells in situ in their tissue of origin
Ostrovsky et al. Detection of cancer using advanced computerized analysis of infrared spectra of peripheral blood
EP3773160B1 (en) Methods of spectroscopic analysis
He et al. Raman optical identification of renal cell carcinoma via machine learning
Siqueira et al. A decade (2004–2014) of FTIR prostate cancer spectroscopy studies: An overview of recent advancements
Ollesch et al. An infrared spectroscopic blood test for non-small cell lung carcinoma and subtyping into pulmonary squamous cell carcinoma or adenocarcinoma
Huang et al. Raman spectroscopy and machine learning for the classification of esophageal squamous carcinoma
David et al. In situ Raman spectroscopy and machine learning unveil biomolecular alterations in invasive breast cancer
Kirkby et al. Developing a Raman spectroscopy-based tool to stratify patient response to pre-operative radiotherapy in rectal cancer
Goertzen et al. Quantum cascade laser-based infrared imaging as a label-free and automated approach to determine mutations in lung adenocarcinoma
Ingham et al. A novel FTIR analysis method for rapid high-confidence discrimination of esophageal cancer
US10706536B2 (en) Photon structure and chemometrics pathologic system
CN117038060A (zh) 一种基于机器学习级联的拉曼光谱分子检测及成像装置
WO2015097089A1 (en) Method for marker-free demarcation of tissues
US8824769B2 (en) Process and system for analyzing the expression of biomarkers in a cell
O'Dea Raman microspectroscopy for the discrimination of thyroid and lung cancer subtypes for application in clinical cytopathology
Sattlecker Optimisation of Machine Learning Methods for Cancer Diagnostics using Vibrational Spectroscopy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210205