CN117653040A - 用于实时拉曼光谱法以进行癌症检测的系统和方法 - Google Patents

用于实时拉曼光谱法以进行癌症检测的系统和方法 Download PDF

Info

Publication number
CN117653040A
CN117653040A CN202410028854.4A CN202410028854A CN117653040A CN 117653040 A CN117653040 A CN 117653040A CN 202410028854 A CN202410028854 A CN 202410028854A CN 117653040 A CN117653040 A CN 117653040A
Authority
CN
China
Prior art keywords
raman
tissue
data
classifier
cancerous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410028854.4A
Other languages
English (en)
Inventor
R·亚达夫
J-P·特雷姆布莱
R·阿加瓦尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Audi Medical
Original Assignee
Audi Medical
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Audi Medical filed Critical Audi Medical
Publication of CN117653040A publication Critical patent/CN117653040A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0059Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence
    • A61B5/0075Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence by spectroscopy, i.e. measuring spectra, e.g. Raman spectroscopy, infrared absorption spectroscopy
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0033Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room
    • A61B5/004Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room adapted for image acquisition of a particular organ or body part
    • A61B5/0042Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room adapted for image acquisition of a particular organ or body part for the brain
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4058Detecting, measuring or recording for evaluating the nervous system for evaluating the central nervous system
    • A61B5/4064Evaluating the brain
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7221Determining signal validity, reliability or quality
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/02Details
    • G01J3/0205Optical elements not provided otherwise, e.g. optical manifolds, diffusers, windows
    • G01J3/0218Optical elements not provided otherwise, e.g. optical manifolds, diffusers, windows using optical fibers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/2803Investigating the spectrum using photoelectric array detector
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Neurology (AREA)
  • Physiology (AREA)
  • Immunology (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical & Material Sciences (AREA)
  • Psychiatry (AREA)
  • Biochemistry (AREA)
  • Signal Processing (AREA)
  • Analytical Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Neurosurgery (AREA)
  • Psychology (AREA)
  • Hematology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Urology & Nephrology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)

Abstract

提供的是在外科手术过程期间实时检测肿瘤边缘中的患癌组织的拉曼系统和方法。该系统包括激光激发源、探头、光谱仪和相机,其具体地被设计用于在外科手术期间实时使用拉曼光谱法。发明的方法涉及拉曼数据的质量评估、将获得的拉曼数据对照已知生物标志物进行比较、以及在对应的拉曼数据的基础上将组织分类为患癌的或非患癌的。该系统和方法允许在实时外科应用中利用拉曼光谱法对组织进行先前无法进行的检测和分类,包括标识癌症亚型。

Description

用于实时拉曼光谱法以进行癌症检测的系统和方法
本申请是申请号为201980008945.9的发明专利申请的分案申请,该发明专利申请的申请日为2019年1月17日,发明名称为“用于实时拉曼光谱法以进行癌症检测的系统和方法”。
技术领域
本发明涉及使用拉曼光谱法系统和方法以进行癌症检测。具体地,本发明可以涉及在外科手术过程期间实时使用拉曼系统和方法以检测肿瘤边缘中的患癌组织。发明的系统包括一种布置,该布置包括激光激发源、探头、光谱仪和相机,借此,探头的光学器件具体地被设计成用于外科手术环境中进行拉曼收集,并且该相机适应于拉曼应用的已知限制。可以将数据质量评估、特征提取和分类的各种发明的方法应用于拉曼系统,使得可以去除拉曼数据的已知污染物源,可以对照已知拉曼生物标志物来评估拉曼数据,并且可以实现对拉曼数据的后续分类。更具体地,本发明涉及一种系统和方法,通过该系统和方法,可以在癌症外科手术期间在实时应用中部署拉曼光谱法,以从拉曼数据中滤除已知污染物的方式来评估肿瘤边缘和其他组织,对照已知生物标志物来比较获得的拉曼数据,并且将受试者组织分类为患癌的或非患癌的,并且可以根据患癌组织的亚型附加地对受试者组织分类。
背景技术
尽管在脑肿瘤(以及其他肿瘤类型)的外科手术治疗中取得了进展,但是获得对肿瘤的最佳外科手术结果和标识仍然是一个挑战。拉曼光谱法——一种基于激光的技术,其可以被用来基于光的非弹性散射来非破坏性地区分分子,正被用于改善脑肿瘤外科手术的准确性。最近,已经公开了许多研究来检查拉曼光谱法在区分脑肿瘤与正常组织中的准确性,并且绘制不同脑组织类型的光谱。然而,由于数据样本不足以及缺乏针对构成良好拉曼光谱的内容的标准分类算法或指南,这些研究受限或无定论。不存在允许对跨受试者内和受试者间两者的测量结果以及跨测量条件的光谱质量的比较的量度。
经典地将拉曼光谱建模为所分析样本的分子构成的光谱的线性混合。然而,由于样本的仪器和生物学特性所致的物理失真向拉曼光谱模型中添加线性和非线性污染物。这些失真是暗电流、检测器和光学器件响应、荧光背景、峰未对准和峰宽异质性。在存在这些失真的情况下设计监督分类算法导致差的分类准确性。附加地,来自不同生物学起源的高度可变的受试者内和受试者间的异质数据集的高维数可能给机器学习技术造成重大挑战。
除上述内容以外,还有多种加成失真会污染拉曼光谱。这些包括光谱饱和、宇宙射线干扰、环境光干扰、高背景噪声和低拉曼信号水平。当前的拉曼方法不包括用于滤除这些失真以允许在外科手术环境中实时使用的方法。
许多当前的拉曼光谱方法采用完整的拉曼光谱来训练分类算法。除了前述污染物之外,由于拉曼光谱的非重要部分中的噪声水平,这导致差的分类准确性。对于任何一种特定的组织类型分类,都存在最相关的拉曼光谱特征的子集,并且使用这些特征来训练分类算法可以导致大大提高的分类准确性。然后可以使用比如支持向量机之类的监督学习模型来对拉曼数据进行分类。
因此,需要一种采用数据质量评估、特征提取和监督学习模型的方法的拉曼系统,这些方法导致对照已知的拉曼生物标志物来评估相关的所提取的拉曼特征以得出对癌症和正常组织的准确分类。为了满足癌症检测需要,本文中呈现了用于实时应用的、包括在每个级的新颖方法的发明的系统。
附图说明
图1示出了被适配成供发明的方法使用的发明的拉曼光谱法系统。
图2是示出了根据本发明的方法的数据处理和质量评估步骤的框图。
图3是示出了使用数据采集算法来优化激光激发功率的框图。
图4是示出了用于标识宇宙射线伪影的框架的框图。
图5是示出了使用算法来标识环境光污染的框图。
图6是示出了用于拉曼数据质量评估的步骤的框图。
图7是示出了计算拉曼信背比(signal-to-background ratio)的框图。
图8示出了根据本发明的拉曼生物标志物评估方法的拉曼光谱及其频率加权能量输出的图形表示。
图9示出了根据本发明的拉曼生物标志物评估方法的具有各种生物标志物峰的拉曼光谱特征的图形表示。
图10示出了根据本发明的拉曼特征提取方法的正常组织和患癌组织的拉曼光谱的图形表示。
图11示出了根据本发明的方法的特征提取步骤的框图。
图12示出了根据本发明的特征提取方法的拉曼特征标签的图形表示。
图13示出了根据本发明的方法的拉曼生物标志物特征的无监督检测的图形表示。
图14示出了本发明的拉曼特征提取方法的性能分析的图形表示。
图15示出了根据本发明的方法的表示基于支持向量机制的多级分类器方法的框图。
具体实施方式
现在结合本发明的各种实施例并且参照附图来详细描述本发明。
根据本发明的系统包括:手持式探头;光谱稳定的激光光源,其在785 nm处的近红外(NIR)中发射(Innovative Photonic Solutions,美国新泽西);定制的光谱仪和检测系统,其包括高速、高分辨率的电荷耦合器件(CCD)(ANDOR Technology,英国贝尔法斯特);以及数据处理模块,其包括膝上型计算机或PC。数据处理模块负责控制光源、CCD,并且处理采集的拉曼数据、对采样的组织进行分类,并且为临床医生提供界面。在图1中示出了代表性实施例。图1的代表性发明的实施例能够采集和处理拉曼数据、对采样的组织进行分类并且在外科手术期间实时向临床医生呈现分类答案(例如,癌症/无癌症)。在这种环境下,实时意味着实际上是即时的分类,其不会干扰外科医生的工作流程,最理想地是几百毫秒到也许刚刚超过1秒。
在一个实施例中,探头具有七根300 um的芯收集光纤。圆环形长通滤波器阻挡了激发激光,但是允许样本拉曼移位波长传递到收集光纤。这七根光纤围绕着装有激光递送光纤组装件的不锈钢管。该激发激光递送光纤是200微米的芯光纤,其具有在其前面定位的小型带通滤波器,用以去除在激发光纤中感应的拉曼信号。两件式会聚前透镜由平凸的2毫米直径曲率的蓝宝石背部(高折射率使光急剧弯曲)制成,其具有1毫米厚的平面氟化镁的平坦前部。
拉曼光谱法是一种使用非弹性散射光子的能量的技术,该能量响应于利用单色光源激发的材料。当激发光源与材料分子的不同振动模式相互作用时,散射光子的能级在波长中移位。照此,如此生成的拉曼光谱可以提供对材料的分子组成的洞察。与更常用得多的瑞利(弹性)散射不同,拉曼光谱强度通常是一百万分之一倍,因此,将拉曼光谱法用于组织分类需要仔细的数据采集和处理考虑。图2描述了基于拉曼的发明的癌症检测/组织分类系统的一种可能的工作流程。一旦系统被校准,就将使用诸如图1的代表性实施例之类的硬件实施例来部署图2中表示的分类系统,并且该分类系统将能够在外科手术期间进行实时分类判定(例如,癌症/无癌症)。
参照图2,在每种情况开始时,都必须对系统进行校准和表征,以允许由分类级进行的患者间比较。由于每种数据或组织类型可能需要不同的处理和分类方案,因此有必要选择正在考虑中的数据/组织类型。数据采集块允许系统利用单色光询问组织,并且收集散射光作为拉曼数据。数据质量评估允许对收集的拉曼数据进行过滤,并且评估其在提取拉曼光谱中的可用性。如果采集的拉曼数据的质量不够好,则拒绝该数据,并且重新采集测量结果。在这里,本发明的关键方面是一组可以实时实行的数据质量评估算法。在拉曼光谱提取或预处理块中,信号处理算法被应用于从采集的拉曼数据中提取拉曼光谱。对提取的拉曼光谱进行进一步处理,以估计信噪比(SNR)和其他度量,以确定拉曼光谱对组织类型分类的适用性。SNR的估计是在应用新颖的SNR定义下实行的,该定义可以被应用于拉曼光谱的单个实现。发明的系统的关键要素之一是从拉曼光谱中提取适当的特征,以允许用于组织分类的数据维数减少和分类。
数据采集
如前所述,拉曼数据采集操作包括利用单色光激发组织并且利用光谱仪收集多波长散射光作为拉曼数据。利用CCD图像传感器来捕获光。使用被称为“分箱(binning)”的技术来操纵CCD图像以实现光谱采集。这是一种组合空间相邻像素以增加SNR并且允许从CCD更快读出的过程。然而,通过跨空间像素进行积分,在模数转换之前,我们冒着超过CCD的动态范围的风险。附加地,跨不同的测量位点和组织类型,对激发激光功率或曝光时间的拉曼数据响应高度可变。因此,固定的激发激光功率或曝光时间不适合用于最佳的拉曼光谱采集。为了解决这个问题,我们开发了一种新颖的策略,其旨在自适应地调整激发激光功率或曝光时间,以在不创建饱和条件的情况下使CCD动态范围最大化。
参照图3(a)和A(b),对于每个拉曼测量,数据采集算法首先旨在确定针对所考虑的测量位点的最佳激发激光功率(和/或激发曝光时间)。所得到的优化采集参数被用来收集N个拉曼测量结果。图3(c)示出了一种用于优化激发激光功率的可能方案。这里的主要概念是在两个相对较低的激发激光功率P1和P2下进行拉曼测量。对于每个测量,将最大测量强度确定为maxRS1和maxRS2。通过使用这两个测量对,有可能外推并确定最佳激发激光功率Popt,以使得最大测量强度为允许的光谱仪/CCD动态范围的90%。通过点(P1,maxRS1)和(P2,maxRS2)的最佳拟合线可以被描述为:
其中m和b是线性拟合的斜率,并且y是线性拟合的截距。以类似的方式,有可能优化激发激光曝光时间。
数据质量
拉曼数据包括组织(拉曼光谱)连同多种污染物的拉曼响应。因此,在此数据质量评估步骤中,至关重要的是收集的数据要符合严格的质量规范,然后它才可以被考虑用于拉曼光谱提取。图6提供了数据通过数据质量评估必须满足的顺序滤波器和测试。饱和检测允许在饱和测试失败的情况下标识并拒绝测量结果中的信号的任何一个或多个。对其余信号进行处理以去除任何宇宙射线干扰的影响。对所得到的信号进行测试以查看是否存在强烈的环境光污染。在检测到任何这样的干扰时,拉曼数据质量被设置为差,并且数据被拒绝以免进行进一步处理,并且重新进行测量。在数据质量评估的最后两个步骤中,针对高背景水平和低信号水平来测试测量结果。如果任一个为真,则认为数据质量差,并且重新进行拉曼测量。数据质量评估算法的关键发明的方面是可应用于实时场景中的计算方面的简单性。在我们的应用中,至关重要的是,数据必须具有足够好的质量,然后才能提取拉曼光谱。
提取拉曼光谱
饱和/过度曝光(blooming)
饱和或过度曝光是一种在其中达到个体光电二极管的有限电荷容量或CCD的最大电荷转移容量的条件下,在所有电荷耦合器件(CCD)图像传感器中发生的现象。一旦在电荷收集位点发生饱和,附加的光生电荷的积累就会导致多余电子溢出或过度曝光到相邻的器件结构中。传感器输出中可能会反映出许多潜在不合期望的过度曝光的效果,范围从白色图像条纹和错误的像素信号值到输出放大阶段的完整击穿,从而产生暗图像。
基于模数转换(ADC)的位分辨率,将饱和或过度曝光定义为分箱的光谱达到ADC分辨率的最大值。我们已经开发了一种新颖的算法技术,用以通过自适应地确定对在调查研究中的组织测量位点的最佳激光激发功率和组织/CCD曝光时间来防止光谱饱和。尽管在数据采集阶段期间控制饱和水平,但在孤立的情况下仍然有可能存在饱和。这主要是由于不同组织类型的拉曼响应的高度可变性。因此,需要CCD饱和检测。在其最简单的形式中,我们采用阈值来检测可能超过CCD的动态范围的任何拉曼测量结果。所有这样的测量结果都被认为是不可用的,并且重复进行采集。
宇宙射线干扰
通常在利用CCD检测器的拉曼仪器中观察到宇宙射线。它们会干扰或甚至破坏正常拉曼光谱所表达的有意义的化学信息。宇宙射线可以在拉曼以及暗背景测量中随机发生。尽管宇宙射线可以具有与拉曼峰相似的属性,但可以观察到它们倾向于展现出非常尖锐的变化幅值的活动,并且不会在连续测量中出现。我们使用上面的宇宙射线属性来标识和去除这些伪影。
参照图4,下面描述标识宇宙射线伪影的一般框架。每个测量包括M个光谱值(波数)处的RS、N个拉曼测量结果。宇宙射线(CR)检测中的第一步是使用Teager算子对RS的非线性变换
其许多属性之一是提高尖锐-长钉状活动(诸如CR)的趋势。这是加权的,我们使用被称为Teager算子的非线性能量算子。对每个变换后的RS(即,对于i=1:N的每个)实行峰检测。对于每个i,将所得到的Pk(i,k)、候选CR(CCR)标识为大于95百分位的所有峰。因为期望CR随机发生,所以我们将给定(i)的每个CCR(i,k)的强度对照相同光谱位置处的后续/>中的峰进行比较。如果当前峰强度大于某个阈值,则将CCR(i,k)视为CR检测。在此算法的一个实现方式中,我们使用95%的峰强度作为阈值。通过用三次样条内插值替换光谱位置处的RS,可以消除已标识的CR。
环境光干扰
来自环境的光常常会污染拉曼测量,就像在手术室中,拉曼测量不是在完全黑暗的环境中进行的。环境光可以包括房间照明、头顶灯、来自监视器的光以及其他光源。在术中光谱采集期间需要完全黑暗的环境进行拉曼测量是不切实际的,并且对于临床专业人员来说将是不可接受的。作为最低要求,在拉曼采集期间,头顶灯远离视场指向。然而,这并不一定解决其他环境光污染,并且常常使这样的测量降级为具有很小价值,并且照此必须不被考虑进行分析。为了标识环境光污染,我们开发了以下算法,如图5所示。将平均原始拉曼测量结果(来自N个原始测量结果)分区到M个长度为L的光谱箱中。对于每个箱中的幅值数据,确定变异系数(COV)。最佳拟合直线通过所得到的一组COV进行拟合。在大量的实验估计之后,我们已经确定在没有环境光干扰的情况下该斜率预期为负,但是在存在环境光干扰的情况下预期为正。因此,斜率与经验确定的阈值的比较g允许我们检测环境光干扰。
高背景检测
暗背景光谱是在没有激光激发光施加到样本时进行的测量。这些数据被用来校正拉曼测量结果中可能存在的基线偏移、系统噪声和固定模式噪声。除了这些之外,我们还观察到另一种源自环境的噪声源。在我们的情况下,来自手术室(OR)的灯。这些灯在外科手术期间不会关闭,而是远离视场指向,以减少其对拉曼光谱的影响。我们检查了暗背景测量的强度高度。将该高度与经验确定的阈值进行比较,以检测高背景干扰。所有这样的测量结果均被排除以免进行进一步处理。
低信号强度
拉曼测量在我们的系统中受散粒噪声限制,其由采集参数定义。因此,CCD上必须有最小强度计数,才有资格作为足够好的采集来进行进一步的处理。对于原始拉曼测量,我们采集了对应的暗测量结果(在没有激发激光的情况下的测量结果)。作为第一步,从原始拉曼信号中去除暗测量结果。随后,将所得到的信号的最大值与先验确定的阈值(针对给定系统和采集参数在实验上确定)进行比较,以评估信号水平完整性。
拉曼光谱提取(预处理)
借助几个预处理模块,从测量信号中提取拉曼光谱。这些包括自动荧光去除、仪器响应校正、光谱归一化和平滑。所得到的光谱是在调查研究中的组织/样本的拉曼光谱。预处理步骤的重要方面是确定提取的拉曼光谱的质量。对于实时应用,要完成的方法必须是简单的。下面提供了两种用于量化拉曼光谱质量的新方案——信噪比(SNR)和信背比(SBR)。
信噪比(SNR)
拉曼生物标志物评估允许我们估计拉曼测量结果的质量,特别是来自生物组织的拉曼测量结果的质量。通常,拉曼信噪比(SNR)被定义为拉曼峰高与峰高标准偏差的比率。
其中j对应于光谱指数,并且μ(j)=平均值,并且σ(j)=第j个光谱位置处的拉曼光谱的标准偏差。由于非常的定义,在没有N次测量的情况下,不可能在在线应用期间评估拉曼SNR。本发明提供了一种用于评估拉曼信号SNR的新颖方案
其中,
•C是经验常数,对于操作模式,该常数要表征光谱仪的检测组件(CCD);
•n是被平均以形成最终光谱的个体光谱的数量;
•τ是个体光谱的采集时间,以毫秒为单位;
I是递送到样本的激光功率,以毫瓦为单位;
R (j) 是归一化的系统响应,其可以从系统校准标准诸如NIST 2241材料获得;
l (j) 是归一化的环境光信号对测量结果的贡献的第j个光谱带。它是通过在没有激发的情况下实行组织样本测量(暗测量)而获得的,使得在样本表面收集的光仅仅是环境光信号。然后通过曝光时间、激光功率、归一化的系统响应和检测器增益对此测量结果进行归一化。
α (j) 是归一化的自发荧光信号对测量结果的贡献的第j个光谱带。它是通过利用通过曝光时间、激光功率、归一化的系统响应和检测器增益进行的自动化多项式回归算法后归一化来估计自发荧光信号的线形而获得的;
r (j) 是归一化的拉曼信号对测量结果的贡献的第j个光谱带。它是通过从通过曝光时间、激光强度、系统响应和相机增益归一化的测量结果中减去α (j) 来获得的;
以上新颖的SNR定义提供了特定光谱位置处的信号质量的量度。我们使用此定义来确定总体平均
其中J对应于光谱带的子集,该子集对应于与正被表征的组织样本的任务和类型相对应的最相关的关键拉曼光谱带(峰)。一个示例可以是被用于正常对比患癌的人脑组织分类的光谱特征,或者仅仅是拉曼光谱中所有峰的前10%。更重要的是,可以在实时信号采集期间应用此定义,从而允许确定拉曼测量结果的质量。
信背比(SBR)
借助于非线性Teager算子来快速计算拉曼信背比。图7图示了拉曼光谱和Teager算子的对应输出。此算子的一个重要方面是在抑制基线漂移的同时增强拉曼峰的能力。图7图示了必须实行以获得描述信背比的度量的一组操作。对于正被分析的给定组织类型,我们首先选择一组关键的生物标志物拉曼峰。图4图示了一些易于在脑组织中存在的关键峰,以及主要负责这些峰的构成分子。参照图7,了解相关拉曼峰的位置允许我们对每个峰的左边和右边定义局部背景。基于在包括人脑、肺组织和动物组织(鸡骨头和肌肉、血液、牛肉肌肉、肾脏、肝脏和小牛肉脑)的多种场景中采集的数据,我们实验确定了背景光谱位置的合适定义。通常,这些峰在每个峰的左侧和右侧上的20-30个光谱位置(像素)左右。Teager的非线性变换在拉曼光谱上实行。作为低于最大RS值的5%的所有光谱值的平均值来计算全局背景(GB)。作为第i个峰的GB校正的RS能量和由LBkgdi和RBkgdi定义的局部背景能量的平均值来计算每个峰的SBRi。总体SBR是个体SBRi的平均值。
根据图2,将SNR和SBR度量与阈值进行比较。基于我们广泛的数据分析和构成好光谱或坏光谱的内容的地面实况,我们实验上定义了这两个度量的阈值。只有符合设定的截止阈值的光谱才被认为是高质量拉曼光谱,并且在随后的特征提取和分类方案中使用。
特征提取
通常,任何机器学习中的第一步都是要探索数据的统计属性,以定性和定量地确定数据如何与响应变量相关。此第一探索性步骤常常揭示出反映数据的许多特征可能是不相关和冗余的,这可能导致分类器过度拟合以及增加的计算负担。因此,立即需要找到与相关联的响应标签一致地最好地描述数据、减少维数并改善整体分类性能的特征的子集。特征选择是一个组合的优化问题,其由选择标准和搜索策略组成,从而改善预测性能并减少数据维数的问题。
在拉曼光谱法文献中,大多数情况下,在机器学习组织分类中利用全光谱。全光谱的使用可能导致过度拟合和差的预测统计模型。作为此整体发明的一部分,我们已经开发了一种挖掘可能与组织分类为正常或癌症最相关的光谱峰和光谱带的无监督式方法。在与手动标识的峰和带相比较时,自动标识的光谱带与手动标识的预期峰/带一一映射。
我们采用统计自助技术来标识这些拉曼生物标志物。自助是一种利用具有替换的随机采样的技术。在每个样本池中,我们利用一组信息理论特征选择技术来标识可能适合用于组织分类的光谱带。
图6中示出了用以标识针对分类可能相关的拉曼光谱带的技术的一个可能实施例的框图。训练数据包括被标记为正常或癌症的N个拉曼光谱。具有替换的自助技术被用来对训练数据进行采样以生成第j个分区。在J个分区的情况下,分区数据的大小被设置为M(<N)。将光谱带的数量选择为K。每个自助分区、基于多个(L)信息理论的准则(如下所述)被用来标识K个最主要的光谱带,这些光谱带在给定光谱(强度)和标签的情况下最大化数据类别的条件似然性。自助步骤的每次迭代都会导致减少的一组长度为Kx1的数据点。通过对L准则重复此过程,我们获得L个光谱带向量,,它们可以联系在一起以产生/>
对J自助分区重复该过程。在每次迭代下,将已标识的光谱带与先前迭代的光谱带联系在一起,以产生大小为 的矩阵F。在最终迭代之后,使用投票来选择K个最常出现的光谱带以用于特征计算。在最简单的实现方式中,每一个已标识光谱位置处的拉曼强度都被用作K元素的特征向量以供分类。在一个实现方式中,我们选择了具有J=50个自助迭代的K=300个光谱带。图7描绘了从训练数据集之一中提取此特征的结果。
最大关联最小冗余(MRMR):MRMR技术中的想法是为数据D找到具有m个特征的特征集S,这些特征共同地具有对目标类别c的最大依赖性。最大关联是要搜索满足下式的特征:
其利用个体特征x i 与类别c之间的所有互信息值的平均值来近似D(S,c)。很可能的是,根据最大关联所选择的特征可以具有丰富的冗余,即,这些特征当中的依赖性可以是大的。当两个特征彼此高度依赖时,如果去除它们中的一个,则相应的类别区分能力将不改变太大。因此,可以添加以下最小冗余(minimal redundancy)(最小冗余,Min-Redundancy)条件来选择互斥特征:
结合了上述两个约束的准则被称为“最小限度冗余最大关联”(mRMR)。
互信息最大化(MIM):特征选择的最平凡形式包括没有重复的均匀随机子采样。这样的方法导致的特征与原始特征一样独立,但是没有拾取提供信息的特征。当只有一小部分特征提供有关要预测的类别的信息时,这导致差的结果。为了避免随机采样的主要弱点,MIM技术拾取了K个特征n(1),...,n(K),它们单独地最大化与要预测的类别的互信息。基于这样的排名进行选择并不确保特征当中的弱的依赖性,并且可能导致冗余且差地提供信息的特征族。
互信息由下式定义
其指示从x递送到y的信息等于在x已知时,y的不确定性减小。
条件互信息最大化:条件互信息是在W已知时随机变量U的熵与在V和W都已知时U的熵之间的差。该公式说明了V携带了多少关于U的没有由W携带的信息。
条件互信息最大化(CMIM)方法[24]是一种算法,该算法基于上述条件互信息选择携带尽可能多的信息的小特征子集。具体而言,CMIM的最终目标将是挑选,它们最小化了
H(Y|X)是给定两个随机变量XY中的X的条件熵Y。而且,是我们从整个变量集中选择的变量的数量。
基于快速相关性的滤波器:基于快速相关性的滤波器(FCBF)方法明确地解决了特征之间的相关性。它首先根据它们与要预测的类别的互信息来对特征进行排序,并且去除互信息少于阈值d的那些特征。
在第二步中,如果存在特征X j ,则迭代地去除任何特征X i ,使得等式4.6和4.7被满足。
即,X j 作为Y的预测子更好,并且相比于像Y,X i 更像X j 。阈值d可以被适配以获得一组保留最大信息的良好带。
对实验数据的观察表明不同组织类型的光谱中的独特形态特征。这些形态特征可以帮助改善分类。除了光谱强度之外,在特征估计步骤中,我们还考虑了一些形态特征,诸如给定带内的长钉状峰的数量、长钉峰下的面积、长钉峰左侧和右侧的斜率等。这适用于其中将特征带定义为上面标识的相邻光谱位置的群组的特征带。拉曼光谱中的某些异常可能源自系统本身或生物学。这样的异常必须不得作为机器学习算法中特征的一部分而包括。特征提取中的最后步骤是优化。在此步骤中,我们旨在手动排除明显无法参数化在调查研究中的组织的带/峰。例如,我们想要排除拉曼光谱中可能与血液相对应的特征。
总的来说,拉曼峰、拉曼带、拉曼形态特征被定义为拉曼生物标志物。在光谱仪的一个实施例中,有可能减小有效带的宽度。当可用训练的数量受到约束时,减少拉曼生物标志物的冗余和数量可以帮助解决分类器过度拟合的问题。
首先,我们采取优化的特征向量,然后引入枢轴参数p,该参数自适应地控制有效带的宽度,如图8所示。通过使用留一法交叉验证技术,随着每个宽度变化来检查性能量度,围绕枢轴点自适应地增大或减小宽度。图8示出了使用枢轴参数p的示例,而所选带的每个宽度的性能结果在图9中示出。对于22个波数的带宽,峰的性能显而易见。
鉴于在我们的应用中可能存在多种癌细胞亚型,我们在实践中使用最实用的技术来建立多层级联规划(formulation)中的多类别机器学习技术。举个例子,分类技术(诸如AdaBoost)、逻辑回归、支持向量机(SVM)、提升树、人工神经网络,其采用级联结构具有自助训练数据集,是合适的候选。想法是建立一个用于“一比对其余(one-versus-rest)”的分类器,并且在简单的决策树状网络中使用级联结构,以得出一种解决针对不同类别的癌症浸润脑组织的多类别问题的新颖且有效的方法,如图15所示。
在我们的情况下,对第一级分类器进行微调,以(宽泛地)检测正常和肿瘤类别。肿瘤类别被进一步划分为例如浸润性肿瘤、肿瘤和坏死组织。后续级的输入是得自无监督聚类技术的唯一类别。
本发明的系统和方法如下被应用于拉曼数据。调查了总共40个光谱,这些光谱具有属于正常(N)、肿瘤(T)、浸润(I)或坏死类别的病理标记。此数据集中未考虑坏死类别,因为它们易于标识,并且我们开发了模板匹配技术来标识和拒绝坏死组织,以免成为训练/测试集的一部分。在一个实施例中,对在任何方面都没有考虑的盲脑肿瘤数据集测试经训练的基于SVM的分类器以建立模型。
在表1(训练数据集)中呈现了体内人脑组织的结果。分类器A是能够进行两类(正常或肿瘤)分类的第一级SVM分类器。分类器B是经修饰的SVM分类器,其能够进行2类(正常或肿瘤和浸润)分类。分类器B将浸润类别视为肿瘤,因此我们看到所有性能参数(诸如曲线下面积、准确性、灵敏度和特异性)的下降。而分类器C是多级分类器。我们观察到性能与病理标签高度一致,其中具有主要由于差的输入数据而发生的偶尔的误分类。
类型 准确性 灵敏度 特异性
分类器A(N=24,T=13) 100 84.6 94.5
分类器B(N=24,T+I=16) 84.3 81.5 87.5
分类器C(N=24,T+I=16) 97.6 100 96.1
表1:训练数据集的性能分析。
表2呈现了来自树状多级SVM级联分类器的测试数据集的结果。观察到整体性能的下降。性能下降并不能真实地反映差的性能,因为我们将各种亚型组合成几个全部浸润的(没有明确的肿瘤+罕见的浸润样本<正常的20%)。
类型 准确性 灵敏度 特异性
分类器C(N=24,T+I=16) 84 89 90
表2:在盲测试数据集上的性能结果。

Claims (6)

1.一种标识在分离患癌组织和正常组织中具有重要意义的拉曼数据特征的方法,其包括:
选择标记训练拉曼数据集的随机子集;
实行基于信息理论的特征提取准则,以标识随机子集内的拉曼光谱特征;
利用所标识的拉曼光谱特征来训练分类器,以在患癌组织与正常组织之间进行分离;
利用标记训练拉曼数据集的不同随机子集来重复先前的三个步骤j次;以及
应用选择准则来确定哪些提取的特征跨j次重复最常出现。
2.根据权利要求1所述的方法,其中,通过投票或k均值聚类来确定用于确定哪些提取的特征最常出现的选择准则。
3.根据权利要求1所述的方法,其中,j由分类器的期望性能确定。
4.根据权利要求1所述的方法,其中,使用SVM(添加的分类器技术)来实行利用所标识的拉曼光谱特征来训练分类器,以在患癌组织与正常组织之间进行分离。
5.根据权利要求1所述的方法,其中,训练分类器以在患癌组织与正常组织之间进行分离包括在不同类别的患癌组织之间进行分离,并且使用多层级联分类结构。
6.根据权利要求1所述的方法,其中,使用从以下的组中选择的技术来实行基于信息理论的特征提取准则,所述组包括最大关联最小冗余、互信息最大化、条件互信息最大化和基于快速相关性的滤波器。
CN202410028854.4A 2018-01-17 2019-01-17 用于实时拉曼光谱法以进行癌症检测的系统和方法 Pending CN117653040A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862618607P 2018-01-17 2018-01-17
US62/618607 2018-01-17
PCT/IB2019/050409 WO2019142136A1 (en) 2018-01-17 2019-01-17 System and methods for real-time raman spectroscopy for cancer detection
CN201980008945.9A CN111770720A (zh) 2018-01-17 2019-01-17 用于实时拉曼光谱法以进行癌症检测的系统和方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201980008945.9A Division CN111770720A (zh) 2018-01-17 2019-01-17 用于实时拉曼光谱法以进行癌症检测的系统和方法

Publications (1)

Publication Number Publication Date
CN117653040A true CN117653040A (zh) 2024-03-08

Family

ID=67300951

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202410028854.4A Pending CN117653040A (zh) 2018-01-17 2019-01-17 用于实时拉曼光谱法以进行癌症检测的系统和方法
CN201980008945.9A Pending CN111770720A (zh) 2018-01-17 2019-01-17 用于实时拉曼光谱法以进行癌症检测的系统和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201980008945.9A Pending CN111770720A (zh) 2018-01-17 2019-01-17 用于实时拉曼光谱法以进行癌症检测的系统和方法

Country Status (5)

Country Link
US (1) US20230240538A1 (zh)
EP (1) EP3740121A4 (zh)
JP (1) JP7257009B2 (zh)
CN (2) CN117653040A (zh)
WO (1) WO2019142136A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3148141A1 (en) * 2019-08-16 2021-02-25 Paul Bartholomew Raman spectroscopy for minerals identification
CN110648763A (zh) * 2019-09-29 2020-01-03 江苏拉曼医疗设备有限公司 利用人工智能进行光谱分析以进行肿瘤评估的方法及设备
WO2022047352A1 (en) * 2020-08-31 2022-03-03 Predomix, Inc Method for early treatment and detection of women specific cancers
CN112336310B (zh) * 2020-11-04 2024-03-08 吾征智能技术(北京)有限公司 一种基于fcbf和svm融合的心脏疾病诊断系统
CN112634204A (zh) * 2020-12-03 2021-04-09 北京信息科技大学 一种基于卷积神经网络的癌症边界智能识别方法
CN112716447A (zh) * 2020-12-03 2021-04-30 北京信息科技大学 一种基于拉曼检测光谱数据深度学习的口腔癌分类系统
CN112834483A (zh) * 2021-02-02 2021-05-25 中原工学院 一种溶栓药物的筛选方法及应用
CN113963225B (zh) * 2021-12-23 2022-04-26 季华实验室 目标类别判定方法
GB2622784A (en) * 2022-09-27 2024-04-03 Univ Sheffield Muscle probe, system and method
CN115409830A (zh) * 2022-09-30 2022-11-29 广州医科大学附属第一医院(广州呼吸中心) 一种输尿管肾盂肿瘤的检测系统、装置及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697666B1 (en) * 1999-06-22 2004-02-24 Board Of Regents, The University Of Texas System Apparatus for the characterization of tissue of epithelial lined viscus
WO2004053066A2 (en) * 2002-12-06 2004-06-24 Millennium Pharmaceuticals, Inc. Methods for the identification, assessment, and treatment of patients with proteasome inhibition therapy
US9020581B2 (en) * 2008-12-05 2015-04-28 Vanderbilt University Spatially offset Raman spectroscopy of layered soft tissues and applications of same
US9662047B2 (en) * 2010-08-05 2017-05-30 Massachusetts Institute Of Technology Portable raman diagnostic system
CN103080857A (zh) * 2010-08-24 2013-05-01 特杰什·C·马卡纳瓦拉 智慧型交流电面板
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
WO2013103475A2 (en) * 2011-12-09 2013-07-11 Massachusetts Institute Of Technology Portable optical fiber probe-based spectroscopic scanner for rapid cancer diagnosis
GB2513343A (en) * 2013-04-23 2014-10-29 Univ Singapore Methods related to instrument-independent measurements for quantitative analysis of fiber-optic Raman spectroscopy
EP3128917A4 (en) * 2014-04-08 2018-01-03 Polyvalor, Limited Partnership System and method for assessing a cancer status of biological tissue
CN106793917B (zh) * 2014-07-02 2019-04-30 新加坡国立大学 用于分析、表征和/或诊断如异常生长的样本或组织的类型或性质的拉曼光谱系统、装置和方法
US20190285611A1 (en) * 2015-07-30 2019-09-19 The Research Foundation For The State University Of New York Gender and race identification from body fluid traces using spectroscopic analysis
CN107980093A (zh) * 2017-10-25 2018-05-01 深圳达闼科技控股有限公司 拉曼检测方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
EP3740121A4 (en) 2021-12-15
CN111770720A (zh) 2020-10-13
JP7257009B2 (ja) 2023-04-13
WO2019142136A1 (en) 2019-07-25
JP2021511108A (ja) 2021-05-06
US20230240538A1 (en) 2023-08-03
EP3740121A1 (en) 2020-11-25

Similar Documents

Publication Publication Date Title
JP7257009B2 (ja) がん検出を目的としたリアルタイムラマン分光法のためのシステムおよび方法
ElMasry et al. Early detection of apple bruises on different background colors using hyperspectral imaging
Krishna et al. In vivo Raman spectroscopy for detection of oral neoplasia: a pilot clinical study
Yu et al. Deep convolutional neural networks for tongue squamous cell carcinoma classification using Raman spectroscopy
KR101947859B1 (ko) 광섬유 라만 분광법을 이용하는 내시경검사로 실시간 암 진단과 관련된 방법
US7289835B2 (en) Multivariate analysis of green to ultraviolet spectra of cell and tissue samples
Pilling et al. High-throughput quantum cascade laser (QCL) spectral histopathology: a practical approach towards clinical translation
Cen et al. Hyperspectral imaging-based classification and wavebands selection for internal defect detection of pickling cucumbers
US8239139B2 (en) Multimodal spectroscopic systems and methods for classifying biological tissue
CN102740762A (zh) 由拉曼光谱法表征肺组织的设备和方法
EP3430377A1 (en) System and method for the discrimination of tissues using a fast infrared cancer probe
Chaturvedi et al. Fluorescence spectroscopy for noninvasive early diagnosis of oral mucosal malignant and potentially malignant lesions
US9377613B2 (en) Method and system for spectral unmixing of tissue images
CN108802002B (zh) 一种快速无损鉴别解除滞育的蚕卵拉曼光谱模型构建方法
Dallaire et al. Quantitative spectral quality assessment technique validated using intraoperative in vivo Raman spectroscopy measurements
CN116026808A (zh) 一种拉曼光谱判别方法和系统
Sivakumar et al. Detecting maturity parameters of mango using hyperspectral imaging technique
US20130237842A1 (en) Determining condition of tissue using spectral analysis
US20240185419A1 (en) Systems and processes for automated detection and characterization of skin features using machine learning
Sattlecker Optimisation of Machine Learning Methods for Cancer Diagnostics using Vibrational Spectroscopy
Gowen et al. Development of algorithms for detection of mechanical injury on white mushrooms (Agaricus bisporus) using hyperspectral imaging
Keith et al. Data processing for tissue histopathology using Fourier transform infrared spectral data
WO2022261106A1 (en) A smart tissue classification framework based on multi-classifier systems
Garcia-Allende et al. Automated interpretation of scatter signatures aimed at tissue morphology identification
Sattlecker Optimisation of machine learning methods for cancer detection using vibrational spectroscopy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination