CN116724222A - 用于机器学习分析的细胞术数据的最佳缩放方法及其系统 - Google Patents

用于机器学习分析的细胞术数据的最佳缩放方法及其系统 Download PDF

Info

Publication number
CN116724222A
CN116724222A CN202180087923.3A CN202180087923A CN116724222A CN 116724222 A CN116724222 A CN 116724222A CN 202180087923 A CN202180087923 A CN 202180087923A CN 116724222 A CN116724222 A CN 116724222A
Authority
CN
China
Prior art keywords
interest
parameter
cytometry data
measurement interval
negative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180087923.3A
Other languages
English (en)
Inventor
尼古拉·沙穆西克
约瑟夫·T·特罗特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Becton Dickinson and Co
Original Assignee
Becton Dickinson and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Becton Dickinson and Co filed Critical Becton Dickinson and Co
Publication of CN116724222A publication Critical patent/CN116724222A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1434Optical arrangements
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1429Signal processing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1456Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals
    • G01N15/1459Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals the analysis being performed on a sample stream
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/149Optical investigation techniques, e.g. flow cytometry specially adapted for sorting particles, e.g. by their size or optical properties
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N2015/1006Investigating individual particles for cytology
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N2015/1402Data analysis by thresholding or gating operations performed on the acquired signals or stored data

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Dispersion Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Signal Processing (AREA)
  • Engineering & Computer Science (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本公开的各个方面包括用于处理和缩放细胞术数据的方法。根据某些实施方案的方法包括:获取样本的细胞术数据,其中该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;识别感兴趣参数;指定感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。还提供了用于实践本主题方法的系统。还描述了非暂时性计算机可读存储介质。

Description

用于机器学习分析的细胞术数据的最佳缩放方法及其系统
交叉引用
根据35U.S.C.§119(e),本申请要求于2020年11月19日提交的美国临时专利申请序列号63/115,994的优先权,该申请的全部内容通过引用并入本文。
背景技术
流式颗粒检测和分析系统例如流式细胞仪用于基于颗粒的至少一个测量特征对流体样本中的颗粒进行检测、分析,并在部分情况下进行分选。对从流式颗粒检测和分析系统获得的数据进行可视化是分析和表征所收集数据的重要部分,并可用于例如生物和医学研究。
对从流式颗粒检测系统获得的数据进行分析可能需要对从颗粒检测系统的几个不同检测器通道所获得的数据进行可视化,例如显示从颗粒检测系统的几个不同检测器通道所获得的数据的绘图,其中绘图中显示的一个或更多个参数已被缩放。使用一个或更多个缩放参数来分析数据,例如分析数据的可视化表示,会有助于了解和表征暴露于颗粒检测系统的颗粒,以及重要的是,有助于了解和表征颗粒的群体或聚簇。
使用一个或更多个缩放参数来分析细胞术数据能够通过帮助区分指示颗粒例如细胞类型之间的相似性或差异的信号与由例如测量或仪器误差引起的噪声而在了解数据群体方面发挥重要作用。当细胞术数据是高维数据时,缩放参数在区分信号和噪声方面的作用更加明显,因为高维数据为噪声提供了额外的机会来影响颗粒聚集在一起的方式。细胞术数据、尤其是高维数据、的适当缩放能够通过减轻或压缩细胞术数据中的噪声来改善分析中的信噪比特征。
发明内容
本发明的实施例介绍了更有效地缩放细胞术数据的新技术,该技术提高细胞术数据的信噪比(特别是对于高维细胞术数据而言),从而提高了流式颗粒检测和分析系统的可用性。
本公开的各个方面包括用于缩放细胞术数据的方法。根据某些实施例的方法包括:获取样本的细胞术数据,其中该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;识别感兴趣参数;指定感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。
在部分实施例中,转换感兴趣参数包括重新缩放感兴趣参数的指定负测量区间。在此类实施例中,重新缩放感兴趣参数的指定负测量区间包括减少感兴趣参数的指定负测量区间的标准偏差。在其它实施例中,转换感兴趣参数还包括重新缩放感兴趣参数的指定正测量区间。在此类实施例中,重新缩放指定的正测量区间可以包括将正测量区间重新缩放到预定大小。在部分例子中,该预定大小是与多个参数中的第二参数对应的经缩放的正测量区间的大小。
在本主题方法的实施例中,转换感兴趣参数包括根据来自适应地缩放感兴趣参数,其中s(x)表示感兴趣参数的自适应缩放测量值;x表示感兴趣参数的未缩放测量值;(n-,n+)是感兴趣参数的指定负测量区间;(n+,p)是感兴趣参数的指定正测量区间;c是压缩系数;/>是负测量区间的中位数;SD是负测量区间的标准偏差,并且根据/>来计算,其中IQR是负测量区间的四分位间距;z(x)是根据/>的z转换;g(z)是根据的反向双曲正弦函数;并且/>是μ=z(n+)且σ=1的标准正态分布的累积分布函数。在此类实施例中,默认的压缩系数c的默认值可以为70。
在实施例中,本主题方法还包括显示经缩放的细胞术数据。在部分例子中,显示经缩放的细胞术数据包括显示包含转换后的感兴趣参数的细胞术数据的绘图。
在部分实施例中,指定感兴趣参数的正测量区间和负测量区间中的至少一个包括执行一维门控以指定区间。在其它实施例中,指定感兴趣参数的正测量区间和负测量区间中的至少一个包括应用荧光减一控制来指定区间。在其它实施例中,指定感兴趣参数的正测量区间和负测量区间中的至少一个包括应用数学模型来指定区间。在实例中,指定感兴趣参数的正测量区间和负测量区间中的一者或两者包括应用机器学习算法来指定区间。
本主题方法的实施例还可以包括:识别一个或更多个附加的感兴趣参数;指定附加的感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放细胞术数据。在此类实施例中,可以将每个感兴趣参数的指定正测量区间重新缩放到相同的预定大小。
本主题方法的其它实施例还可以包括通过将聚类算法应用于经缩放的细胞术数据来对细胞术数据进行聚类。在此类实施例中,显示经缩放的细胞术数据可以包括显示经缩放的细胞术数据的聚簇。
在部分实施例中,经缩放的细胞术数据被用于改进应用于细胞术数据的聚类算法的性能。在其他实施例中,经缩放的细胞术数据被用于降低测量噪声的影响。
在部分例子中,颗粒是细胞。在这种情况下,经缩放的细胞术数据可用于区分两个相似的细胞群体。
在本主题方法的实施例中,细胞术数据为高维数据。在此类实施例中,多个测量参数为两个到大约300,000个测量参数。
还提供了用来实践本主题方法的系统。根据某些实施例的系统包括装置和处理器,该装置被配置为获取细胞术数据,该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值,该处理器包括可操作地耦合到处理器的存储器,其中该存储器包括存储在其上的指令,这些指令在被处理器执行时,使处理器:识别感兴趣参数;指定感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。
在本主题系统的实施例中,该系统被配置为使经缩放的细胞术数据显示在显示设备上。在此类实施例中,该系统被配置为通过使包含转换后的感兴趣参数的细胞术数据图进行显示来使经缩放的细胞术数据显示在显示设备上。在部分实施例中,系统被配置成:识别一个或更多个附加的感兴趣参数;指定每个附加的感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放细胞术数据。在部分实施例中,该系统被配置为通过将聚类算法应用于经缩放的细胞术数据来对细胞术数据进行聚类。在其它实施例中,该系统被配置成使经缩放的细胞术数据的聚簇进行显示。在其它实施例中,样本的细胞术数据包括从被配置为分析样本的流式细胞仪获得的测量值。
还描述了非暂时性计算机可读存储介质。根据某些实施例的非暂时性计算机可读存储介质包括存储在其上的指令,这些指令具有以下算法:用于获取细胞术数据的算法,该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;用于识别感兴趣参数的算法;用于指定感兴趣参数的正测量区间和负测量区间的算法;以及用于通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据的算法。
附图说明
结合附图阅读时,可以从以下详细描述中获得对本发明的最佳理解。附图中包括以下图:
图1描述了根据本发明实施例的细胞术数据的感兴趣参数的测量值的示例性直方图。
图2描绘了根据某些实施例的示例性累积分布函数200。
图3描绘了根据某些实施例的颗粒分析仪的控制系统的一个示例的功能框图。
图4描绘了根据某些实施例的流式细胞仪。
图5描绘了根据某些实施例的用于样本分析和颗粒表征的颗粒分析系统的功能框图。
图6A描绘了根据某些实施例的颗粒分析仪和分选系统的示意图。
图6B描绘了根据某些实施例的颗粒分析仪和分选系统的示意图。
图7描绘了根据某些实施例的计算系统的框图。
图8描绘了二维绘图,该二维绘图展现了根据默认缩放方法和根据本发明实施例进行缩放的细胞术数据的两个参数。
图9描绘了二维绘图,该二维绘图展现了根据默认缩放方法和根据本发明实施例进行缩放的细胞术数据的两个参数。
图10描绘了二维绘图,该二维绘图展现了根据默认缩放方法进行缩放和根据本发明实施例进行缩放的细胞术数据的两个参数以及将聚类算法应用于经缩放的细胞术数据的结果。
具体实施方式
本公开的各个方面包括缩放细胞术数据的方法。在实施例中,方法包括:获取样本的细胞术数据,其中该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;识别感兴趣参数;指定感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于相应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。在其他实例中,方法包括重新缩放感兴趣参数的指定负测量区间。在其他例实例中,方法包括重新缩放感兴趣参数的指定正测量区间。如果需要,方法还包括通过将聚类算法应用于经缩放的细胞术数据来对细胞术数据进行聚类。还提供了用于实践主题方法的系统。还描述了非暂时性计算机可读存储介质。
在对本发明进行更详细的描述之前,应当理解,本发明并不限于所描述的特定实施例,其当然可以变化。还应理解,本文使用的术语仅用于描述特定的实施例,而不旨在作为限制,因为本发明的范围将仅受所附权利要求的限制。
在提供值范围的情况下,应当理解,除非上下文另有明确规定,否则在该范围的上限与下限之间的直至其下限单位的十分之一的每个中间值以及在规定范围内的任何其他规定值或中间值都包含在本发明中。这些较小范围的上限和下限可以独立地包含在该较小范围内,并且也包含在本发明中,但受所述范围内任何明确排除限制的约束。如果所述范围包括一个界限或两个界限,则不包括其中一个或两个界限的范围也包括在本发明中。
本文通过在数值前面加上术语“大约”来表示某些范围。在本文中,术语“大约”用于为其前面的确切数字以及接近或近似术语之前的数字的数字提供字面支持。在确定数字是否接近或近似特定的引用数字时,接近或近似的未引用数字可以是一个数字,该数字在它出现的上下文中提供了与特定的引用数字基本等效的数字。
除非另有定义,否则本文中使用的所有技术和科学术语的含义与本发明所属领域的普通技术人员通常理解的含义相同。尽管也能使用与本文所述方法和材料相似或等效的任何方法和材料来实践或测试本发明,但是现在仅对具有代表性的说明性方法和材料进行描述。
说明书中所引用的所有出版物和专利均通过引用并入本文,就如同每个单独的出版物或专利都被明确且单独地指示为将通过引用并入或者通过引用并入本公开,并且与引用出版物的方法和/或材料结合来对方法和/或材料进行公开和描述。对任一出版物的引用都是为了在申请日之前的公开,并且不应被解释为承认本发明由于现有发明而无权先于该等出版物进行公布。此外,所提供的出版日期可能与实际出版日期不同,这可能需要单独确认。
需要注意的是,除非上下文另有明确规定,否则如本文和所附权利要求中使用的单数形式“一”、“一个”和“该”包括复数指代物。还需指出的是,权利要求书可以被起草为排除任意可选内容。因此,本声明旨在作为在叙述权利要求要素或使用“否定”限制时使用“只”、“仅”等排他性术语的先行基础。
在阅读本公开时,对本领域技术人员而言将明显的是,本文所描述和示出的每个单独的实施例都具有离散的组件和特征,在不脱离本发明的范围或精神的情况下,这些组件和特征可以很容易地与其它几个实施例中的任何一个的特征分离或组合。任何所描述的方法都能按照所描述的事件的顺序或任何其他逻辑上可行的顺序来执行。
虽然为了语法的流畅性而通过功能解释对装置和方法进行了描述或将进行描述,但应明确理解,除非根据35U.S.C.§112进行了明确表述,否则不应将权利要求解释为必须以任何方式受到“手段”或“步骤”限制的约束,而应在等同司法原则下赋予权利要求书所提供的定义的全部含义和等同物,并且在根据35U.S.C.§112对权利要求作出明确表述的情况下,根据35U.S.C.§112赋予其全部的法定等同物。
如上所述,本公开提供了用于缩放细胞术数据的方法。在对本公开的实施例作进一步说描述时,首先更详细描述了以下方法:该方法包括重新缩放感兴趣参数的指定负测量区间、重新缩放感兴趣参数的指定正测量区间以及通过将聚类算法应用于经缩放的细胞术数据来聚类细胞术数据。接着,描述了用来实践主题方法的系统。还描述了非暂时性计算机可读存储介质。
用于缩放细胞术数据的方法
本公开的各个方面包括用于缩放细胞术数据的方法。特别地,本公开包括用于以下操作的方法:获取样本的细胞术数据的方法,其中该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;识别感兴趣参数;指定感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。术语“缩放”用于表示对细胞术数据的参数的测量值之间的相对距离进行转换。在部分例子中,可以通过显示或以其他方式分析根据本发明已缩放的细胞术数据来提高分析高维细胞术数据的能力。此外,可以通过根据本发明对细胞术数据进行缩放来提高在细胞术数据中发现群体的有效性,即对细胞术数据进行聚类的有效性,并且可以通过显示或以其他方式分析经缩放的细胞术数据的聚类结果来改善对此类数据的分析。例如,当细胞术数据包括与细胞有关的数据时(即,当样本中的颗粒是细胞时),应用本主题方法可能有助于发现某些细胞群,否则这些细胞群可能错过检测和分析。当与以流式细胞术分析样本结合使用时,本主题方法能够有助于减轻颗粒分析系统中测量噪声的影响。
细胞术数据
在实践本主题方法时,获得样本的细胞术数据。该细胞术数据包括在流动流中流动的样本中被照射颗粒的测量值。例如,细胞术数据可以包括用光源照射样本且用具有一个或更多个光电检测器的光检测系统对来自样本的光进行检测时所检测到的光的测量值。在实施例中,这种光测量值可以包括光强度的测量值。如以下详细描述的,在部分实施例中,该细胞术数据可以包括以下中的一个或更多个:由颗粒主要沿前向方向散射的激发光、由颗粒主要沿侧向方向散射的激发光、以及从用于标记颗粒荧光分子或荧光染料在一个或更多个频率范围内发射的光。在本发明的实施例中,获得样本的细胞术数据包括根据以流式细胞术分析样本来获得测量值。
在部分例子中,样本是生物样本。术语“生物样本”以其常规含义使用,是指整个生物体、植物、真菌或者动物组织、细胞或组成部分的子集,在某些示例中,这些动物组织、细胞或组成部分可以存在于血液、粘液、淋巴液、滑液、脑脊液、唾液、支气管肺泡灌洗液、羊水、羊膜脐带血、尿液、阴道液和精液中。因此,“生物样本”既指天然生物体或其组织的子集,也指从生物体或其组织的子集制备的匀浆、裂解物或提取物,包括但不限于例如血浆、血清、脊髓液、淋巴液、皮肤切片、呼吸系统、胃肠道、心血管、以及泌尿生殖道、眼泪、唾液、奶水、血细胞、肿瘤、器官。生物样本可以是任何类型的生物体组织,包括健康组织和患病组织(例如,癌性、恶性、坏死性组织等)。在某些实施例中,该生物样本是液体样本,例如血液或其衍生物例如血浆、眼泪、尿液、精液等,其中在部分示例中,样本是血液样本,其包括全血,例如从静脉穿刺或手指针刺获得的血液(其中血液在测定前可以与或者不与任何试剂(诸如防腐剂、抗凝剂等)结合)。
在部分实施例中,样本的来源是“哺乳动物”或“哺乳类动物”,其中这些术语广泛用于描述属于哺乳动物类中的生物体,包括食肉动物目(例如,狗和猫)、啮齿动物目(例如,小鼠、豚鼠和大鼠)和灵长类动物目(例如,人类、黑猩猩和猴子)。在部分示例中,受试者是人类。该方法可以应用于从两种性别以及任何发育阶段(即新生儿、婴儿、少年、青少年、成人)的人类受试者所获得的样本的细胞术数据,其中在某些实施例中,人类受试者是少年、青少年或成人。虽然本发明可以应用于来自人类受试者的样本的细胞术数据,但应当理解,该方法也可以针对来自其他动物受试者(即“非人类受试者”)的样本的细胞术数据来执行,其他动物受试者例如但不限于鸟、小鼠、大鼠、狗、猫、家畜和马。
在实施例中,用来自光源的光照射样本(例如,在流式细胞仪的流动流中的样本)。在部分实施例中,光源是宽带光源,其发射具有宽波长范围的光,例如跨越50nm或更宽,例如100nm或更宽,例如150nm或更宽,例如200nm或更宽,例如250nm或更宽,例如300nm或更宽,例如350nm或更宽,例如400nm或更宽,以及包括跨越500nm或更宽。例如,一个合适的宽带光源发射波长从200nm到1500nm的光。合适的宽带光源的另一个示例包括发射波长从400nm至1000nm的光的光源。其中方法包括用宽带光源进行照射,感兴趣的宽带光源方案可以包括但不限于卤素灯、氘弧灯、氙弧灯、稳定光纤耦合宽带光源、具有连续光谱的宽带LED、超发光二极管、半导体发光二极管、广谱LED白光源、多LED集成白光源、以及其他宽带光源或其任意组合。
在其他实施例中,方法包括用发射特定波长或窄波长范围的窄带光源进行照射,例如用发射在窄波长范围内的光的光源进行照射,窄波长范围为例如50nm或更窄的范围,例如40nm或更窄,例如30nm或更窄,例如25nm或更窄,例如20nm或更窄,例如15nm或更窄,例如10nm或更窄,例如5nm或更窄,例如2nm或更窄,以及该窄带光源包括发射特定波长光(即单色光)的光源。其中方法包括用窄带光源进行照射,感兴趣的窄带光源方案可以包括但不限于窄波长LED、耦合到一个或更多个光学带通滤光器的激光二极管或宽带光源、衍射光栅、单色器或其任意组合。
在某些实施例中,方法包括用一个或更多个激光器照射样本。如上所述,激光器的类型和数量将根据样本以及所需收集的光而变化,并且可以为气体激光器,例如氦-氖激光器、氩激光器、氪激光器、氙激光器、氮气激光器、CO2激光器、CO激光器、氩-氟(ArF)准分子激光器、氪-氟(KrF)准分子激光器、氙-氯(XeCl)准分子激光器或氙-氟(XeF)准分子激光器或其组合。在其他例子中,方法包括用染料激光器照射流动流,例如二苯乙烯(stilbene)、香豆素(coumarin)或罗丹明(rhodamine)激光器。在其他例子中,方法包括用金属蒸气激光器照射流动流,例如氦-镉(HeCd)激光器、氦-汞(HeHg)激光器、氦-硒(HeSe)激光器、氦-银(HeAg)激光器、锶激光器,氖-铜(NeCu)激光器、铜激光器或金激光器及其组合。在其他例子中,方法包括用固态激光器照射流动流,例如红宝石激光器、Nd:YAG激光器、NdCrYAG激光器、Er:YAG激光器、Nd:YLF激光器、Nd:YVO4激光器、Nd:YCa4O(BO3)3激光器、Nd:YCOB激光器、钛蓝宝石激光器、铥YAG激光器、镱YAG激光器、氧化镱激光器或铈掺杂激光器及其组合。
可以用上述光源中的一个或更多个光源照射样本,一个或更多个光源为例如两个或更多个光源,例如三个或更多个光源,例如四个或更多个光源,例如五个或更多个光源以及包括用十个或更多个光源。光源可以包括任意类型的光源的组合。例如,在部分实施例中,方法包括用激光器阵列照射流动流中的样本,例如用具有一个或更多个气体激光器、一个或更多个染料激光器和一个或更多个固态激光器的激光器阵列照射流动流中的样本。
可以用以下波长的光照射样本:该波长为从200nm到1500nm,例如从250nm到1250nm,例如从300nm到1000nm,例如从350nm到900nm以及包括从400nm到800nm。例如,在光源是宽带光源的情况下,可以用200nm至900nm的波长照射样本。在其它例子中,在光源包括多个窄带光源的情况下,可以用200nm至900nm范围内的特定波长照射样本。例如,光源可以是多个窄带LED(1nm-25nm),每个窄带LED独立地发射波长范围从200nm至900nm的光。在其它实施例中,窄带光源包括一个或更多个激光器(例如激光器阵列)并且使用200nm至700nm范围内的特定波长照射样本,例如使用具有如上所述的气体激光器、准分子激光器、染料激光器、金属蒸汽激光器和固态激光器的激光器阵列照射样本。
如果采用多于一个光源,则可以同时或依次用这些光源照射样本或用这些光源的组合照射样本。例如,可以用各个光源同时照射样本。在其他实施例中,用各个光源依次照射流动流。当采用多于一个光源依次照射样本时,每个光源照射样本的时间可以独立地为0.001微秒或更长,例如0.01微秒或更长,例如0.1微秒或更长,例如1微秒或更长,例如5微秒或更长,例如10微秒或更长,例如30微秒或更长,以及包括60微秒或更长。例如,方法可以包括用光源(例如激光)照射样本一段时间,该一段时间范围为从0.001微秒至100微秒,例如从0.01微秒至75微秒,例如从0.1微秒至50微秒,例如从1微秒至25微秒,以及包括从5微秒至10微秒。在用两个或更多个光源依次照射样本的实施例中,每个光源照射样本的持续时间可以相同或不同。
每个光源的照射之间的时间段也可以根据需要而变化,每个光源的照射通过0.001毫秒或更长的延迟独立地分开,该延迟为例如0.01微秒或更长,例如0.1微秒或更长,例如1微秒或更长,例如5微秒或更长,例如10微秒或更长,例如15微秒或更长,例如30微秒或更长,以及包括60微秒或更长。例如,每个光源的照射之间的时间段可以为从0.001微秒到60微秒,例如从0.01微秒到50微秒,例如从0.1微秒到35微秒,例如从1微秒到25微秒,以及包括从5微秒到10微秒。在某些实施例中,每个光源的照射之间的时间段为10微秒。在样本被多于两个(即,三个或更多个)光源依次照射的实施例中,每个光源的照射之间的延迟可以相同或不同。
可以连续照射或以离散间隔照射样本。在部分例子中,方法包括用光源连续照射样本中的样本。在其他例子中,用光源以离散的间隔照射样本,例如每0.001毫秒、每0.01毫秒、每0.1毫秒、每1毫秒、每10毫秒、每100毫秒以及包括每1000毫秒照射一次样本或者以其他间隔照射。
根据光源,可以从不同的距离照射样本,该距离为例如0.01mm或更大,例如0.05mm或更大,例如0.1mm或更大,例如0.5mm或更大,例如1mm或更大,例如2.5mm或更大,例如5mm或更大,例如10mm或更大,例如15mm或更大,例如25mm或更大,以及包括50mm或更大。此外,照射的角度也可以变化,该角度从10°到90°,例如从15°到85°,例如从20°到80°,例如从25°到75°,以及包括从30°到60°,例如以90°角照射。
在某些实施例中,方法包括用两束或更多束频移光照射样本。可以采用具有激光器和声光装置的光束发生器组件使激光频移。在这些实施例中,方法包括用激光器照射声光装置。根据在输出激光束中产生的光的期望波长(例如,用于照射流动流中的样本),激光可以具有特定波长,该特定波长为从200nm到1500nm,例如从250nm到1250nm,例如从300nm到1000nm,例如从350nm到900nm,以及包括从400nm到800nm。可以用一个或更多个激光器照射声光装置,一个或更多个激光器例如为两个或更多个激光器,例如三个或更多个激光器,例如四个或更多个激光器,例如五个或更多个激光器,以及包括十个或更多个激光器。激光器可以包括任意类型激光器的组合。例如,在部分实施例中,方法包括用激光器阵列照射声光装置,例如用具有一个或更多个气体激光器、一个或更多个染料激光器和一个或更多个固态激光器的激光器阵列照射声光装置。
在采用多于一个光源的情况下,可以用这些光源同时照射或依次照射声光装置或用这些光源的组合照射声光装置。例如,可以用各个光源同时照射声光装置。在其他实施例中,用各个光源依次照射声光装置。在采用多于一个光源依次照射声光装置时,每个光源照射声光装置的时间可以独立地为0.001微秒或更长,例如0.01微秒或更长,例如0.1微秒或更长,例如1微秒或更长,例如5微秒或更长,例如10微秒或更长,例如30微秒或更长,以及包括60微秒或更长。例如,方法可以包括用激光器照射声光装置一段时间,该一段时间的范围为从0.001微秒至100微秒,例如从0.01微秒至75微秒,例如从0.1微秒至50微秒,例如从1微秒至25微秒,以及包括从5微秒至10微秒。在用两个或更多个激光器依次照射声光装置的实施例中,每个激光器照射声光装置的持续时间可以相同或不同。
每个激光器的照射之间的时间段也可以根据需要而变化,每个激光器的照射通过0.001毫秒或更长的延迟独立地分开,该延迟为例如0.01微秒或更长,例如0.1微秒或更长,例如1微秒或更长,例如5微秒或更长,例如10微秒或更长,例如15微秒或更长,例如30微秒或更长,以及包括60微秒或更长。例如,每个光源的照射之间的时间段可以为从0.001微秒到60微秒,例如从0.01微秒到50微秒,例如从0.1微秒到35微秒,例如从1微秒到25微秒,以及包括从5微秒到10微秒。在某些实施例中,每个激光器的照射之间的时间段为10微秒。在声光装置多于两个(即,三个或更多个)激光器依次照射的实施例中,每个激光器的照射之间的延迟可以相同或不同。
可以连续照射或以离散间隔照射声光装置。在部分例子中,方法包括用激光器连续照射声光装置。在其他例子中,用激光器以离散的间隔照射声光装置,例如每0.001毫秒、每0.01毫秒、每0.1毫秒、每1毫秒、每10毫秒、每100毫秒以及包括每1000毫秒照射一次或者以其他间隔照射。
根据激光器的不同,可以从不同的距离照射声光装置,该距离为例如0.01mm或更大,例如0.05mm或更大,例如0.1mm或更大,例如0.5mm或更大,例如1mm或更大,例如2.5mm或更大,例如5mm或更大,例如10mm或更大,例如15mm或更大,例如25mm或更大,以及包括50mm或更大。此外,照射的角度也可以变化,该角度为从10°到90°,例如从15°到85°,例如从20°到80°,例如从25°到75°,以及包括从30°到60°,例如以90°角照射。
在实施例中,方法包括将射频驱动信号施加到声光装置以生成角度偏转的激光束。可以将两个或更多个射频驱动信号施加到声光装置以生成具有所需数量的角度偏转激光束的输出激光束,两个或更多个射频驱动信号为例如三个或更多个射频驱动信号,例如四个或更多个射频驱动信号,例如五个或更多个射频驱动信号,例如六个或更多个射频驱动信号,例如七个或更多个射频驱动信号,例如八个或更多个射频驱动信号,例如九个或更多个射频驱动信号,例如十个或更多个射频驱动信号,例如15个或更多个射频驱动信号,例如25个或更多个射频驱动信号,例如50个或更多个射频驱动信号,以及包括100个或更多个射频驱动信号。
通过射频驱动信号产生的角度偏转激光束各自具有基于所施加的射频驱动信号的幅值的强度。在部分实施例中,方法包括施加具有足以产生具有所需强度的角度偏转激光束的幅值的射频驱动信号。在部分例子中,每个所施加的射频驱动信号独立地具有从约0.001V到约500V的幅值,例如从约0.005V到约400V,例如从约0.01V到约300V,例如从约0.05V到约200V,例如从约0.1V到约100V,例如从约0.5V到约75V,例如从约1V到50V,例如从约2V到40V,例如从3V到约30V,以及包括从约5V到约25V。在部分实施例中,每个所施加的射频驱动信号具有从约0.001MHZ至约500MHZ的频率,例如从约0.005MHZ至约400MHZ,例如从约0.01MHZ至约300MHZ,例如从约0.05MHZ至约200MHZ,例如从约0.1MHZ至约100MHZ,例如从约0.5MHZ至约90MHZ,例如从约1MHZ至约75MHZ,例如从约2MHZ至约70MHZ,例如从约3MHZ至约65MHZ,例如从约4MHZ至约60MHZ,以及包括从约5MHZ至约50MHZ。
在这些实施例中,输出激光束中的角度偏转激光束在空间上是分开的。根据所施加的射频驱动信号和输出激光束的所需照射分布,角度偏转激光束可以间隔0.001μm或更大,例如0.005μm或更大,例如0.01μm或更大,例如0.05μm或更大,例如0.1μm或更大,例如0.5μm或更大,例如1μm或更大,例如5μm或更大,例如10μm或更大,例如100μm或更大,例如500μm或更大,例如1000μm或更大以及包括5000μm或更大。在部分实施例中,角度偏转激光束重叠,例如沿输出激光束的水平轴线与相邻的角度偏转的激光束重叠。相邻的角度偏转激光束之间的重叠(例如光束光斑的重叠)可以为0.001μm或更大的重叠,例如0.005μm或更大的重叠,例如0.01μm或更大的重叠,例如0.05μm或更大的重叠,例如0.1μm或更大的重叠,例如0.5μm或更大的重叠,例如1μm或更大的重叠,例如5μm或更大的重叠,例如10μm或更大的重叠,以及包括100μm或更大的重叠。
在某些例子中,本发明的流式细胞术系统被配置为利用射频标记发射(radiofrequency tagged emission,FIRE)通过荧光成像对流动流中的颗粒进行成像,例如如以下文献中所描述的:Diebold等人的Nature Photonics第7(10)卷;806-810(2013)和美国专利号9,423,353、9,784,661、9,983,132、10,006,852、10,078,045、10,036,699、10,222,316、10,288,546、10,324,019、10,408,758、10,451,538、10,620,111以及美国专利公开号2017/0133857、2017/0328826、2017/0350803、2018/0275042、2019/0376895和2019/0376894,这些文献的公开内容通过引用并入本文。
如上所述,在实施例中,来自照射样本的光被传送到下文更详细描述的光检测系统并被一个或更多个光电检测器测量。在部分实施例中,方法包括在一定波长范围内(例如,200nm至1000nm)测量所收集的光。例如,方法可以包括在200nm至1000nm波长范围中的一个或更多个波长范围内收集光的光谱。在其它实施例中,方法包括在一个或更多个特定波长下测量所收集的光。例如,可以在450nm、518nm、519nm、561nm、578n m、605nm、607nm、625nm、650nm、660nm、667nm、670nm、668nm、695nm、710nm、723nm、780nm、785nm、647nm、617nm、及其任意组合中的一个或更多个波长下测量所收集的光。在某些实施例中,方法包括测量与荧光团的荧光峰值波长对应的光的波长。在部分实施例中,方法包括在样本中每个荧光团的整个荧光光谱上测量所收集的光。
可以连续测量或以离散间隔测量所收集的光。在部分例子中,方法包括对光进行连续测量。在其他例子中,以离散间隔测量光,例如每0.001毫秒、每0.01毫秒、每0.1毫秒、每1毫秒、每10毫秒、每100毫秒以及包括每1000毫秒测量一次光或者以其他间隔测量光。
在本主题方法期间可以对所收集的光进行一次或更多次测量,例如2次或更多次,例如3次或更多次,例如5次或更多次,以及包括10次或更多次测量。在某些实施例中,对光传播进行2次或更多次测量,并在某些例子中对数据进行平均。
可以在一个或更多个波长下测量来自样本的光,例如在5个或更多个不同的波长下,例如在10个或更多个不同的波长下,例如在25个或更多个不同的波长下,例如在50个或更多个不同的波长下,例如在100个或更多个不同的波长下,例如在200个或更多个不同的波长下,例如在300个或更多个不同波长下测量所收集的光,以及包括在400个或更多个不同波长下测量所收集的光。
识别感兴趣参数并指定正测量区间和负测量区间
实践本主题方法包括识别感兴趣参数。参数是指在样本中被测量的多个特征之一,并且包括细胞术数据。任何能够测量的感兴趣特征都可以包括参数。例如,参数可以对应于从被照射样本颗粒测量的在特定光波长范围内的测量值。在部分例子中,参数可以对应于检测器的通道,该检测器用于检测来自被照射样本颗粒的某些波长的光。在其他例子中,参数可以对应于来自从样本颗粒照射的某些荧光。在本主题方法的实施例中,多个测量参数从两个到约300,000个测量参数。
识别感兴趣参数,意味着根据主题方法选择多个参数之一用于缩放。对于包括细胞术数据的多个参数中的每个参数,本主题方法的实施例连续缩放细胞术数据。因此,识别参数可以包括从待缩放的参数列表中识别一个参数。可以根据任何适用的标准识别感兴趣参数。在部分例子中,当包含样本的颗粒是细胞时,可以基于样本中可能存在的一种或更多种类型的细胞和/或施加到样本的一种或更多种荧光染料或标记物来识别感兴趣参数。
主题方法还包括指定感兴趣参数的正测量区间和负测量区间。测量区间是指感兴趣参数的一系列潜在测量值,例如一组连续的潜在测量值。在实施例中,测量区间可以是有界的或无界的。在实施例中,有界区间是指具有最大测量值和最小测量值(即形成间隔的边界的值)的区间。在实施例中,无界区间是不具有最大潜在测量值或不具有最小潜在测量值的区间。正测量区间是指感兴趣参数的潜在测量值的区间,其中潜在测量值表明特定特征的存在。负测量区间是指感兴趣参数的潜在测量值的区间,其中潜在测量值表明此类特征不存在。在部分例子中,正区间和负区间是连续的。例如,在实施例中,负区间的最大值可以对应于正区间的最小值。区间的最大值和最小值分别是指区间的上限和下限。当是这种连续配置的情况时,能够仅用三个点来指定正区间和负区间,所述三个点为作为负测量区间的最小值的点、作为负测量区间的最大值和正测量区间的最小值二者的点、以及最后作为正测量区间的最大值的点。在部分例子中,负测量区间的最小值或下限称为n-;负测量区间的最大值或上限称为n+;并且正测量区间的最大值或上限称为p。
图1描述了根据本发明实施例的细胞术数据的感兴趣参数的测量值的示例性直方图100。在图中可以看到x轴110上的感兴趣参数的潜在测量值。直方图的y轴120表示每个对应测量值处的事件计数。绘图130示出了连续线,该连续线代表在x轴110上的感兴趣参数的不同测量值处的事件的数量。还示出了示例性负测量区间140和示例性正测量区间150。负测量区间由下限160和上限170限定。正测量区间由下限170和上限180限定。在此,正测量区间和负测量区间是连续范围,其中负测量区间的上限170与正测量区间的下限170是相同的。
在实施例中,可以使用任何方便的手段来选择正区间和负区间,例如正区间150和负区间140。在部分例子中,可以基于目视检查来选择正区间和负区间。例如,可以基于对感兴趣参数的测量值的绘图(例如绘图100)的目视检查来选择正区间和负区间。即,在部分例子中,可以检查感兴趣参数的绘图来获得指示正区间和负区间的特性特征,并且可以基于这样的特征选择正区间和负区间中的一者或两者。在实施例中,指定感兴趣参数的正测量区间和负测量区间中的至少一个包括执行一维门控以指定区间。执行门控,意味着确定与基础颗粒中的感兴趣特征对应的潜在测量值的范围,感兴趣特征的测量值包括细胞术数据。也就是说,门控是指在感兴趣参数内定义某些边界,使得落在边界内的测量值对应于感兴趣的颗粒。可以使用任何方便的方法来确定用于感兴趣参数的门。由于此类门仅适用于感兴趣参数的测量,因此此类门被称为一维门。
在部分例子中,可以通过计算与包括细胞术数据的事件的感兴趣参数的每个测量值对应的概率来确定正测量区间。这种计算出来的概率表示测量值表现出特定特征(即感兴趣的特征)的可能性。换言之,感兴趣参数的每个测量值都被分配了测量值是否表现出感兴趣的特征的概率。在部分例子中,与每个感兴趣参数相关的概率一起可以确定正测量区间。可以采用任何方便的方法来计算测量表现出特定特征的概率,包括例如基于或者考虑到从细胞术数据中的其他事件获得的数据例如来自细胞术数据中其他事件的感兴趣参数的测量值的直方图、来自其它样本的细胞术数据、事件的其它特征例如感兴趣参数以外的参数的测量值等来计算概率。类似地,在实施例中,可以基于所计算的感兴趣参数的测量值没有表现出特定特征的概率来确定负测量区间。在部分示例中,可以将负测量区间标识为不同于正测量区间的区间。在实施例中,可以基于测量值是否落在该负测量区间内来计算测量值没有表现出感兴趣特征的概率。在部分例子中,可以基于测量值是否落在非正测量区间的区间内来计算测量值没有表现出感兴趣特征的概率。
与对感兴趣参数执行一维门控以确定正区间和/或负区间相比,用于指定正区间和/或负区间的其他技术可以自动确定此类区间。此类技术包括但不限于例如应用荧光减一控制(fluorescence minus one control)技术、应用数学模型或应用机器学习算法。自动确定正区间和/或负区间,这意味着技术自身(例如,单独的数学模型、不是用户的全部或部分规范)至少部分地基于包括感兴趣参数的细胞术数据产生对正区间和/或负区间的预测。下文将进一步详细描述包括应用荧光减一控制、应用数学模型和应用机器学习算法的技术,这些技术分别指定了正区间和/或负区间中的一者或者两者。
在其它实施例中,指定感兴趣参数的正测量区间和负测量区间中的至少一个包括应用荧光减一控制来指定区间。荧光减一控制,是指本领域已知的、也被称为FMO控制的技术,在该技术中将除一种以外的其他所有适用的荧光染料、染色剂或类似物都施加到样本的颗粒。基于从如此制备的样本中获得的细胞术数据,该技术可以用于确定区分背景荧光和有意义结果的阈值。然后,可以应用该阈值以选择并指定正测量区间和负测量区间中的至少一个。在实施例中,应用荧光减一技术使得仅发现对给定参数为阴性的细胞,即发现对于给定参数不表现出特定特征的细胞。因此,能够使用荧光减一技术来定义负分布的百分间范围(inter-percentile range),然后将该百分位间范围用作负测量区间(即负范围或负区间)。
在其它实施例中,指定感兴趣参数的正测量区间和负测量区间中的至少一个包括应用数学模型来指定区间。数学模型,是指能够识别假定的正区间和/或负区间的任何方便的模型,例如基于计算的模型。在部分例子中,数学模型可能仅考虑与感兴趣参数对应的细胞术数据。在其他例子中,数学模型可能考虑与除感兴趣参数以外的细胞术数据的其他参数对应的细胞术数据。在其他例子中,数学模型可能考虑基于其他实验数据的其他样本而收集的细胞术数据。该数学模型可以是迭代数学模型,该迭代数学模型被设计为反复改进受某些约束的正区间和/或负区间的限定。在部分实施例中,数学模型可以考虑检测通道、溢出矩阵和/或细胞表达分布的测量噪声特性。
在其它实施例中,指定感兴趣参数的正测量区间和负测量区间中的一者或两者包括应用机器学习算法来指定区间。机器学习算法,是指被设计成通过经验自动学习的任何方便的计算机算法。在实施例中,相关的机器学习算法可以采用监督学习、无监督学习或强化学习方法来预测正区间和/或负区间。相关的机器学习算法可以采用回归和分类技术来预测正区间和/或负区间。在实施例中,用于训练这种学习算法的相关经验可能包括例如专门构建的训练数据或先前收集的细胞术数据或感兴趣参数以外的参数或其组合。
缩放细胞术数据
实践本主题方法还包括通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。在部分例子中,转换感兴趣参数意味着对适用于感兴趣参数的测量值的缩放进行调整。本发明的实施例至少部分地基于正区间和负区间中的每一个来转换感兴趣参数。
本主题方法的部分实施例的目标在于减少背景噪声或测量噪声的不利影响,这些噪声会使分析细胞术数据,特别是分析高维细胞术数据变得更加困难。在本主题方法的实施例中,可以部分地通过转换感兴趣参数来减少负区间的标准偏差来实现减少背景噪声的不利影响。这具有压缩数据中背景噪声的效果。因此,在部分实施例中,转换感兴趣参数包括重新缩放感兴趣参数的指定负测量区间。在此类实施例中,在部分例子中,重新缩放感兴趣参数的指定负测量区间包括减少感兴趣参数的指定负测量区间的标准偏差。
此外,对于正区间,根据本主题方法的实施例能够通过重新缩放正区间来提高分析细胞术数据的能力。在部分例子中,重新缩放正区间可以具有提高应用于细胞术数据的聚类算法的有效性的效果,该细胞术数据包括感兴趣参数。因此,在部分实施例中,转换感兴趣参数还包括重新缩放感兴趣参数的指定正测量区间。在此类实施例中,重新缩放指定的正测量区间包括将正测量区间重新缩放到预定大小。可以应用任意预定大小。在实施例中,该预定大小是负测量区间的大小。在其他实施例中,该预定大小是针对不同参数(即,除感兴趣参数之外的多个参数中的某一参数)的正测量区间的大小。在部分例子中,选择预定大小使得对于包括细胞术数据的多个参数中的每个经缩放参数而言,经缩放的正区间为相同的大小。
在某些实施例中,缩放细胞术数据包括基于测量值表现出感兴趣特征的概率来对细胞术数据中感兴趣参数的每个测量值进行不同的转换。即,至少部分地基于测量值表现出特定特征的计算概率(如上所述)来对细胞术数据中事件的感兴趣参数的每个测量值进行不同的转换。在这种情况下,通过转换细胞仪数据中感兴趣参数的每个测量值来实现感兴趣参数的缩放,其中此类转换是至少部分地基于每个测量值表现出特定特征的概率所进行的差异转换。
在某些实施例中,转换感兴趣参数包括基于规定的数学方法相应地对感兴趣参数进行自适应缩放。例如,在部分例子中,转换感兴趣参数包括根据以下公式对感兴趣参数进行自适应缩放:
其中,上述公式中的每一项具有以下含义:
s(x)表示感兴趣参数的自适应缩放测量值。即,表示至少部分地基于对应的指定正区间和负区间对感兴趣参数进行转换而产生的输出值。
x表示感兴趣参数的未缩放测量值。即,x表示包含在所获得的细胞术数据中的感兴趣参数的值。换言之,x表示原始数据值。
(n-,n+)是感兴趣参数的指定负测量区间。换言之,感兴趣参数的测量值n-是负区间的下限,而感兴趣参数的测量值n+是负区间的上限。
(n+,p)是感兴趣参数的指定正测量区间。换言之,感兴趣参数的测量值n+是正区间的下限,而感兴趣参数的测量值p是正区间的上限。由于负区间的上限和正区间的下限是同一测量值,因此负区间和正区间是连续的,其中与正区间相比,负区间中的测量值落在更低的测量值处。此外,一旦定义了负区间,就能通过仅指定单个测量值(正区间的上限)来定义正区间。
c是压缩系数。定性地讲,压缩系数是数值,在对正值进行放大的情况下,该数值用于确定与噪声相比信号应当大多少。即,通过将正值(例如,Z-得分为3或更高的那些值)乘以压缩系数(也被称为噪声压缩系数)来放大正值。将压缩系数设置为可能的最小压缩系数值1.0意味着在转换中不使用压缩。在部分例子中,压缩系数被设置为值50。在某些实施例中,默认压缩系数被设置为值70。
是负测量区间的中位数。即,/>是先前指定的负测量区间的中间值。
SD是负测量区间的标准偏差,并且根据来计算,其中IQR是负测量区间的四分位间距。四分位间距是指负测量区间的第75百分位数和第25百分位数之间的范围(即负测量区间的上四分位数和下四分位数之间的范围)。
z(x)是根据的z转换。在部分例子中,对感兴趣参数的原始数据值应用z转换的效果是使生成的转换值的平均值等于0,并且使转换值的标准差等于1。
g(z)是根据的反向双曲正弦函数。换言之,使用反双曲正弦(arcsinh)函数对值作进一步转换。这种函数是本领域中已知的gLog函数的基本变型,其用于例如CyTOF数据转换。
是μ=z(n+)且σ=1的标准正态分布的累积分布函数(CDF)。该CDF与正区间和负区间之间的过渡结合使用。特别是,该CDF通过使用以噪声截止为中心(例如转换值为3.0)的sigmoid函数(例如CDF)对缩放量进行加权,从而有助于使正区间和负区间之间的过渡变得平滑。在部分例子中,由于未缩放的负区间与经缩放的正区间之间的过渡,因此可能需要保证平滑的过渡。/>
图2描绘了根据上述累积分布函数的示例性累积分布函数200。在图2中可以看到x轴210上感兴趣参数的潜在z转换的测量值。该图的y轴220表示每个对应z转换值处的累积分布函数。可以沿着x轴看到参考负区间的上限n+的感兴趣参数的测量值的Z转换值,例如,在x轴上的位置210a处可以看到累积分布函数的平均值z(n+)。累积分布函数以符号形式230示出。如上所述,累积分布函数可以用于使转换后的负区间和正区间之间的过渡变得平滑。这种平滑是部分地基于累积分布函数240的绘图的S形(sigmoid)形状来实现的。
显示、分析和聚类细胞术数据
在部分实施例中,实践本主题方法还可以包括显示经缩放的细胞术数据。可以采用任何方便的显示格式。例如,用于显示未根据主题方法进行缩放的细胞术数据的任意显示技术都可以用来显示已根据主题方法经缩放的细胞术数据。在实施例中,经缩放的细胞术数据可以显示在例如一维绘图上,在该一维绘图中x轴表示已根据本主题方法经缩放的测量值,并且y轴表示对应于每个经缩放的测量值的事件计数。在其他实施例中,经缩放的细胞术数据可以显示在例如二维绘图上,在该二维绘图中每个轴线表示已根据本主题方法经缩放的测量值,并且事件计数由例如用于在该二维绘图上显示点或区域的彩色或灰度阴影表示。在实施例中,显示经缩放的细胞术数据包括显示包括转换后的感兴趣参数的细胞术数据的绘图。即,经缩放的感兴趣参数可以显示为一维绘图中的一个维度(即x轴)或者显示为二维绘图中的一个维度或两个维度(即x轴或y轴)。
本主题方法的实施例还可以包括:识别一个或更多个附加的感兴趣参数;指定每个附加的感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放细胞术数据。换言之,本主题方法的实施例可以包括缩放细胞术数据的多于一个参数。因此,可以以与上述针对单个感兴趣参数所采用的方式类似的方式针对附加的感兴趣参数进行以下步骤:识别附加的感兴趣参数、指定正区间和负区间以及通过应用转换来缩放数据。可以识别并缩放任意数量的附加的感兴趣参数。在部分例子中,可以仅识别并缩放构成细胞术数据的多个参数的子集。在其他例子中,可以识别并缩放构成细胞术数据的所有参数。在本主题方法的细胞数数据的多于一个参数被缩放的部分实施例中,正测量区间被缩放到相同的大小。在部分例子中,将正区间缩放到相同大小可以例如通过提高聚类算法的有效性或减少噪声的影响来促进细胞术数据的分析,因为将每个正区间缩放到相同大小可以具有使细胞术数据中弱标记和强标记二者的贡献变得平衡的效果。
本主题方法的某些实施例还包括分析经缩放的数据。经缩放的数据是指根据本主题方法被转换的数据。在部分例子中,经缩放的数据可以包括基于计算出的包括细胞术数据的事件的感兴趣参数的测量值是否表现出特定特征的概率而被不同地转换的数据。分析转换后的数据是指研究、了解和/或表征细胞术数据。例如,分析转换后的数据可以包括使用至少第一数据分析算法来分析此类数据。在其他例子中,分析转换后的数据包括使用第一数据分析算法以及一个或更多个附加数据分析算法来分析此类数据。数据分析算法可以是用于从细胞术数据中得出推论的任何方便或有用的算法。例如,在部分实施例中,数据分析算法可以包含如下文所述的数据聚类算法。在其它实施例中,数据分析算法可以包括降维算法、特征提取算法、模式识别算法等,例如以促进多维数据的可视化。
本主题方法的其它实施例还包括通过将聚类算法应用于经缩放的细胞术数据来对细胞术数据进行聚类。即,使用经缩放的细胞术数据作为聚类算法的输入,使得聚类算法识别经缩放的细胞术数据中的聚簇,而不是例如原始细胞术数据中的聚簇。聚类是指用于识别细胞术数据中的数据亚群的任何算法、技术或方法,其中亚群的每个元素与该亚群的其他元素共享某些特征。
可以应用任何方便的聚类算法来识别经缩放的细胞术数据中的聚簇。在部分例子中,可以自动确定能够被识别的群体聚簇(以及定义群体的限制的门)。例如,美国专利号4,845,653、5,627,040、5,739,000、5,795,727、5,962,238、6,014,904和6,944,338以及美国专利公布号2012/0245889中已经对用于自动门控的方法示例进行了描述描述,这些专利均通过引用并入本文。
在部分例子中,将经缩放的细胞术数据的颗粒分配到聚簇包括应用本领域中已知的、被称为k-平均值聚类的技术。“k-平均值聚类”是指已知的划分技术,该技术旨在将测试样本的每个事件或细胞的数据点划分为k个聚簇,使得每个数据点属于具有最接近的平均值的聚簇。k-平均值聚类技术包括利用k-平均值聚类的各种常用实施例,其在L.M.Weber和M.D.Robinson的Comparison of Clustering Methods for High-Dimensional Single-Cell Flow and Mass Cytometry Data,Cytometry,Part A,Journal of QuantitativeCell Science,第89卷,第12期,第1084-96页中被进一步描述,其全部内容通过引用并入本文。
在其他例子中,将经缩放的细胞术数据的颗粒分配到聚簇包括应用本领域中已知的、被称为应用自组织映射(Self-Organizing Map)的技术。“自组织映射”是指应用一种人工神经网络算法,该人工神经网络算法由于神经网络训练步骤而产生映射,在这种情况下,该映射包括定义样本的数据点或细胞的聚簇的集合。应用自组织映射的技术包括自组织映射、流式自组织映射(FlowSOM)的常用实施例,其在L.M.Weber和M.D.Robinson的Comparison of Clustering Methods for High-Dimensional Single-Cell Flow andMass Cytometry Data,Cytometry,Part A,Journal of Quantitative Cell Science,第89卷,第12期,第1084-96页中被进一步描述,其全部内容通过引用并入本文。可以根据需要应用其他已知或尚未发现的聚类技术或算法。
在其他例子中,将经缩放的细胞术数据的颗粒分分配到聚簇包括应用本领域中已知的、被称为X-Shift群体查找算法(X-Shift population finding algorithm)的技术。X-Shift算法及其实际应用在N.Samusik、Z.Good、M.H.Spitzer、K.L.Davis和G.P.Nolan(2016)的Automated mapping of phenotype space with single-cell data.Naturemethods,第13卷,第6期,第493页中被进一步描述,其全部内容通过引用并入本文。可以根据需要应用其他已知或尚未发现的聚类技术或算法。
在部分例子中,使用经缩放的细胞术数据来提高应用于细胞术数据的聚类算法的性能。即,与原始的、未缩放的细胞术数据相比,聚类算法在被应用于根据本主题方法缩放的细胞术数据时可以表现得更好。表现得更好,意味着当被应用于经缩放的细胞术数据时,聚类算法能够识别颗粒(例如细胞)的亚群,否则将无法检测到这些亚群。即,应用于经缩放细胞术数据的聚类算法可以识别不同的数据亚群,否则这些数据亚群将被聚类到单个更大的亚群中。通常,当由聚类算法产生的结果更接近地反映据其生成细胞术数据的样本的物理特性时,聚类算法会表现得更好。
在部分例子中,使用经缩放的细胞术数据来降低测量噪声的影响。测量噪声是指在收集细胞术数据期间产生的信号,这些信号与基础样本的物理特性不对应,而是与仪器问题或者随机或未知的原因相对应。在部分例子中,当被应用于经缩放的细胞术数据时,聚类算法的性能会得到提高,因为经缩放的细胞术数据减少了数据中的噪声量。例如,在本主题方法的部分实施例中,样本中的颗粒是细胞。在此类实施例中,经缩放的细胞术数据可以用于区分两个相似的细胞群体。
在实施例中,显示经缩放的细胞术数据包括显示经缩放的细胞术数据的聚簇。即,当显示已根据本方法缩放的细胞术数据时,还可以显示用来标识显示器上的聚簇的信息。可以使用任何方便的技术例如使用标记或颜色编码或其他方法来在显示器中标识聚簇。在部分例子中,当使用经缩放的细胞术数据会提高应用于细胞术数据的聚类算法的性能时,显示经缩放的细胞术数据中的聚簇可以有助于区分两个颗粒群体,否则可能检测不到这些颗粒群体。即,虽然例如两种类型的细胞可能已经通过应用于未缩放细胞术数据的聚类算法被分组到单个细胞聚簇中,但当聚类算法被应用于细胞术数据时,聚类算法可以通过将这两种类型的细胞各自聚类到它们自己的聚簇中来识别这两种类型的细胞。然后,每个聚簇将显示在被聚类数据的显示中,以供视觉查看和进一步分析。
用于缩放细胞术数据的系统
如上所述,本公开的各个方面包括被配置成缩放细胞术数据的系统。根据某些实施例的系统包括装置和处理器,该装置被配置为获取细胞术数据,该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值,该处理器包括可操作耦合到该处理器的存储器,其中该存储器包括存储在其上的指令,这些指令在被处理器执行时,使处理器:识别感兴趣参数;指定为感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。通过至少部分地基于正区间和负区间转换感兴趣参数来缩放细胞术数据已在上文中描述。用于收集包括细胞术数据的测量值的系统和设备将在下文中讨论。
光源
在实施例中,对于细胞术数据,可以使用光源照射在流动流中流动的样本中的颗粒。光源可以是任何合适的宽带光源或窄带光源。根据样本中的成分(例如,细胞、珠子、非细胞颗粒等),可以将光源配置为发射光波长,该光波长变化范围为从200nm到1500nm,例如从250nm到1250nm,例如从300nm到1000nm,例如从350nm到900nm,以及包括从400nm到800nm。例如,光源可以包括发射波长为200nm至900nm的光的宽带光源。在其它例子中,光源包括发射200nm至900nm的波长的窄带光源。例如,光源可以是窄带LED(1nm-25nm),其发射波长为200nm至900nm的光。在某些实施例中,光源是激光器。在部分例子中,本主题系统包括气体激光器,例如氦-氖激光器、氩激光器、氪激光器、氙激光器、氮气激光器、CO2激光器、CO激光器、氩-氟(ArF)准分子激光器、氪-氟(KrF)准分子激光器、氙氯(XeCl)准分子激光器或氙-氟(XeF)准分子激光器或其组合。在其他例子中,本主题系统包括染料激光器,例如二苯乙烯、香豆素或罗丹明激光器。在其他例子中,感兴趣的激光器包括金属蒸气激光器,例如氦-镉(HeCd)激光器、氦-汞(HeHg)激光器、氦-硒(HeSe)激光器、氦-银(HeAg)激光器、锶激光器,氖-铜(NeCu)激光器、铜激光器或金激光器及其组合。在其他例子中,本主题系统包括固态激光器,例如红宝石激光器、Nd:YAG激光器、NdCrYAG激光器、Er:YAG激光器、Nd:YLF激光器、Nd:YVO4激光器、Nd:YCa4O(BO3)3激光器、Nd:YCOB激光器、钛蓝宝石激光器、铥YAG激光器、镱YAG激光器、氧化(ytterbium2O3)激光器或铈掺杂激光器及其组合。
在其他例子中,光源为非激光光源,例如灯,包括但不限于卤素灯、氘弧灯、氙弧灯、发光二极管例如具有连续光谱的宽带LED、超发光发光二极管、半导体发光二极管、广谱LED白光光源、多LED集成光源等。在部分例子中,非激光光源是稳定的光纤耦合宽带光源、白光源、其它光源或其任意组合。
光源可以位于距在流动流中流动的样本(例如,流式细胞仪中的流动流)任意合适的距离处,例如在距流动流0.001mm或更远的距离处,例如0.005mm或更远,例如0.01mm或更远,例如0.05mm或更远,例如0.1mm或更远,例如0.5mm或更远,例如1mm或更远,例如5mm或更远,例如10mm或更远,例如25mm或更远,以及包括100mm或更远。此外,光源可以以任何合适的角度(例如,相对于流动流的垂直轴线)照射样本,例如该角度为从10°至90°,例如从15°到85°,例如从20°到80°,例如从25°到75°以及包括从30°到60°,例如以90°角照射样本。
光源可以被配置为连续照射样本或以离散间隔照射样本。在部分例子中,系统包括被配置为例如利用连续波激光器连续照射样本的光源,该连续波激光器在流式细胞仪中的查询点处连续照射流动流。在其他例子中,感兴趣的系统可以使用被配置为以离散间隔照射样本的光源照射样本,例如每0.001毫秒、每0.01毫秒、每0.1毫秒、每1毫秒、每10毫秒、每100毫秒以及包括每1000毫秒照射一次样本或者以其他间隔照射样本。在光源被配置为以离散间隔照射样本的情况下,系统可以包括一个或更多个附加组件,以使用光源对样本进行间歇性照射。例如,在这些实施例中,本主题系统可以包括一个或更多个激光束斩波器、手动控制或计算机控制的阻光器,其用于遮住样本以及使样本暴露在光源下。
在部分例子中,光源是激光器。感兴趣的激光器可以包括脉冲激光器或连续波激光器。例如,该激光器可能是气体激光器,例如氦-氖激光器、氩激光器、氪激光器、氙激光器、氮气激光器、CO2激光器、CO激光器、氩-氟(ArF)准分子激光器、氪-氟(KrF)准分子激光器、氙氯(XeCl)准分子激光器或氙-氟(XeF)准分子激光器或其组合;染料激光器,例如二苯乙烯、香豆素或罗丹明激光器;金属蒸气激光器,例如氦-镉(HeCd)激光器、氦-汞(HeHg)激光器、氦-硒(HeSe)激光器、氦-银(HeAg)激光器、锶激光器,氖-铜(NeCu)激光器、铜激光器或金激光器及其组合;固态激光器,例如红宝石激光器、Nd:YAG激光器、NdCrYAG激光器、Er:YAG激光器、Nd:YLF激光器、Nd:YVO4激光器、Nd:YCa4O(BO3)3激光器、Nd:YCOB激光器、钛蓝宝石激光器、铥YAG激光器、镱YAG激光器、氧化镱激光器或铈掺杂激光器及其组合。
在某些例子中,光源是光束发生器,其被配置为生成两束或更多束频移光。在部分例子中,该光束发生器包括激光器和射频发生器,该射频发生器被配置为将射频驱动信号施加到声光设备以生成两个或更多个角度偏转的激光束。在这些实施例中,激光器可以是如上所述的脉冲激光器或连续波激光器。
声光设备可以是任何方便的声光方案,其被配置为使用所施加的声波使激光发生频移。在某些实施例中,声光设备是声光偏转器。本主题系统中的声光设备被配置为根据来自激光器的光和所施加的射频驱动信号生成角度偏转的激光束。可以利用任何合适的射频驱动信号源(例如直接数字合成器(DDS)、任意的波形发生器(AWG)或电脉冲发生器)将射频驱动信号施加到声光设备。
在实例中,控制器被配置为将射频驱动信号施加到声光设备以在输出激光束中产生所需数量的角度偏转的激光束,例如被配置为施加3个或更多个射频驱动信号,例如4个或更多个射频驱动信号,例如5个或更多个射频驱动信号,例如6个或更多个射频驱动信号,例如7个或更多个射频驱动信号,例如8个或更多个射频驱动信号,例如9个或更多个射频驱动信号,例如10个或更多个射频驱动信号,例如15个或更多个射频驱动信号,例如25个或更多个射频驱动信号,例如50个或更多个射频驱动信号,以及包括被配置成施加100个或更多个射频驱动信号。
在部分例子中,为了在输出激光束中产生角度偏转的激光束的强度分布,控制器被配置为施加具有一定幅值的射频驱动信号,该幅值为例如从约0.001V到约500V、例如从约0.00 5V到约400V、例如从约0.01V到约300V、例如从约0.05V到约200V、例如从约0.1V到约100V、例如从约0.5V到约75V、例如从约1V到50V、例如从约2V到40V、例如从3V到约30V以及包括从约5V到约25V变化。在部分实施例中,每个所施加的射频驱动信号具有从约0.001MHZ至约500MHZ的频率,例如从约0.005MHZ至约400MHZ、例如从约0.01MHZ至约300MHZ、例如从约0.05MHZ至约200MHZ、例如从约0.1MHZ至约100MHZ、例如从约0.5MHZ至约90MHZ、例如从约1MHZ至约75MHZ、例如从约2MHZ至约70MHZ、例如从约3MHZ至约65MHZ、例如从约4MHZ至约60MHZ以及包括从约5MHZ至约50MHZ的频率。
在某些实施例中,控制器具有处理器,该处理器具有可操作地耦合到处理器的存储器,使得该存储器包括存储在其上的指令,这些指令在被处理器执行时,使处理器产生具有角度偏转的激光束的输出激光束,该角度偏转的激光束具有所需的强度分布。例如,存储器可以包括用于产生两个或更多个具有相同强度的角度偏转激光束的指令,所述两个或更多个角度偏转激光束为例如3个或更多个,例如4个或更多个,例如5个或更多个,例如10个或更多个,例如25个或更多个,例如50个或更多个,以及存储器可以包括用于产生100个或更多个具有相同强度的角度偏转激光束的指令。在其它实施例中,存储器可以包括用于产生两个或更多个具有不同强度的角度偏转激光束的指令,所述两个或更多个角度偏转激光束为例如3个或更多个,例如4个或更多个,例如5个或更多个,例如10个或更多个,例如25个或更多个,例如50个或更多个,以及存储器可以包括用于产生100个或更多个具有不同强度的角度偏转激光束的指令。
在某些例子中,控制器具有处理器,该处理器具有可操作地耦合到处理器的存储器,使得该存储器包括存储在其上的指令,这些指令在被处理器执行时,使处理器产生沿水平轴线从输出激光束的中心到边缘强度增加的输出激光束。在这些例子中,输出光束中心处的角度偏转激光束的强度可以是沿水平轴线在输出激光束边缘处的角度偏转激光束的强度的0.1%至约99%,例如0.5%至约95%,例如1%至约90%,例如约2%至约85%,例如约3%至约80%,例如约4%至约75%,例如约5%至约70%,例如约6%至约65%,例如约7%至约60%,例如约8%至约55%,以及包括沿水平轴线在输出激光束边缘处的角度偏转激光束的强度的约10%至约50%。在其它例子中,控制器具有处理器,该处理器具有可操作地耦合到处理器的存储器,使得该存储器包括存储在其上的指令,这些指令在被处理器执行时,使处理器产生沿水平轴线从输出激光束的边缘到中心强度增加的输出激光束。在这些例子中,输出光束边缘处的角度偏转激光束的强度可以是沿水平轴线在输出激光束中心处的角度偏转激光束的强度的0.1%至约99%,例如0.5%至约95%,例如1%至约90%,例如约2%至约85%,例如约3%至约80%,例如约4%至约75%,例如约5%至约70%,例如约6%至约65%,例如约7%至约60%,例如约8%至约55%,以及包括沿水平轴线在输出激光束中心处的角度偏转激光束的强度的约10%至约50%。在其他情况下,控制器具有处理器,该处理器具有可操作地耦合到处理器的存储器,使得该存储器包括存储在其上的指令,这些指令在被处理器执行时,使处理器产生沿水平轴线具有高斯分布的强度分布的输出激光束。在其他情况下,控制器具有处理器,该处理器具有可操作地耦合到处理器的存储器,使得该存储器包括存储在其上的指令,这些指令在被处理器执行时,使处理器产生沿水平轴线具有缩顶(top hat)强度分布的输出激光束。
在实例中,感兴趣的光束发生器可以被配置为产生在输出激光束中在空间上分离的角度偏转激光束。根据所施加的射频驱动信号和输出激光束的所需照射分布,角度偏转激光束可以相隔0.001μm或更远,例如0.005μm或更远,例如0.01μm或更远,例如0.05μm或更远,例如0.1μm或更远,例如0.5μm或更远,例如1μm或更远,例如5μm或更远,例如10μm或更远,例如100μm或更远,例如500μm或更远,例如1000μm或更远以及包括5000μm或更远。在部分例子中,系统被配置为产生在输出激光束中例如沿输出激光束的水平轴线与相邻的角度偏转激光束重叠的角度偏转激光束。相邻的角度偏转激光束之间的重叠(例如光束光斑的重叠)可以为0.001μm或更大的重叠,例如0.005μm或更大的重叠,例如0.01μm或更大的重叠,例如0.05μm或更大的重叠,例如0.1μm或更大的重叠,例如0.5μm或更大的重叠,例如1μm或更大的重叠,例如5μm或更大的重叠,例如10μm或更大的重叠,以及包括100μm或更大的重叠。
在某些例子中,被配置为生成两束或更多束频移光的光束发生器包括美国专利号9,423,353、9,784,661、9,983,132、10,006,852、10,078,045、10,036,699、10,222,316、10,288,546、10,324,019、10,408,758、10,451,538、10,620,111以及美国专利公开号2017/0133857、2017/0328826、2017/0350803、2018/0275042、2019/0376895和2019/0376894中所描述的那些激光激发模块,这些专利的公开内容通过引用并入本文。
检测器
在实施例中,细胞术数据可以包括从在流动流中流动的样本中被照射颗粒检测到的光的测量值(在部分例子中,测量值包括对多个光参数的测量值)。可以采用光检测系统来测量来自样本颗粒的这种光。光检测系统可能具有一个或更多个光电检测器。感兴趣的光电检测器可以包括但不限于光学传感器,例如有源像素传感器(APS)、雪崩光电二极管、图像传感器、电荷耦合器件(CCD)、强化电荷耦合器件(ICCD)、发光二极管、光子计数器、辐射热计、热释电检测器、光敏电阻、光伏电池、光电二极管、光电倍增管、光电晶体管、量子点光电导体或光电二极管及其组合,以及其他光电检测器。在某些实施例中,使用电荷耦合器件(CCD)、半导体电荷耦合器件(CCD)、有源像素传感器(APS)、互补金属氧化物半导体(CMOS)图像传感器或N型金属氧化物半导体(NMOS)图像传感器测量来自样本的光。
在实例中,感兴趣的光检测系统包括多个光电检测器。在部分例子中,光检测系统包括多个固态检测器,例如光电二极管。在某些例子中,光检测系统包括光电检测器阵列,例如光电二极管阵列。在这些实施例中,光电检测器阵列可以包括4个或更多个光电检测器,例如10个或更多个光电检测器,例如25个或更多个光电检测器,例如50个或更多个光电检测器,例如100个或更多个光电检测器,例如250个或更多个光电检测器,例如500个或更多个光电检测器,例如750个或更多个光电检测器,以及包括1000个或更多个光电检测器。例如,检测器可以是光电二极管阵列,其具有4个或更多个光电二极管,例如10个或更多个光电二极管,例如25个或更多个光电二极管,例如50个或更多个光电二极管,例如100个或更多个光电二极管,例如250个或更多个光电二极管,例如500个或更多个光电二极管,例如750个或更多个光电二极管,以及包括1000个或更多个光电二极管。
光电检测器可以根据需要布置成任何几何构造,其中感兴趣的布置包括但不限于方形构造、矩形构造、梯形构造、三角形构造、六边形构造、七边形构造、八角形构造、九边形构造、十边形构造、十二边形构造、圆形构造、椭圆形构造以及不规则图案构造。光电检测器阵列中的光电检测器可以相对于另一个光电检测器(如在X-Z平面中)呈一定角度地定向,该角度为从10°至180°,例如从15°到170°,例如从20°到160°,例如从25°到150°,例如从30°到120°,以及包括从45°到90°。光电检测器阵列可以为任何合适的形状,并且可以为直线型形状,例如正方形、矩形、梯形、三角形、六边形等;曲线型形状,例如圆形、椭圆形;以及不规则形状,例如耦合到平坦顶部部分的抛物线底部部分。在某些例子中,光电检测器阵列具有矩形形状的活动表面。
阵列中的每个光电检测器(例如光电二极管)可以具有活动表面,该活动表面的宽度为从5μm到250μm,例如从10μm到225μm,例如从15μm到200μm,例如从20μm到175μm,例如从25μm到150μm,例如从30μm到125μm,以及包括从50μm到100μm,并且该活动表面的长度为从5μm到250μm,例如从10μm到225μm,例如从15μm到200μm,例如从20μm到175μm,例如从25μm到150μm,例如从30μm到125μm,以及包括从50μm到100μm,其中阵列中的每个光电检测器(例如,光电二极管)的表面积为从25μm2到10000μm2,例如从50μm2到9000μm2,例如从75μm2到8000μm2,例如从100μm2到7000μm2,例如从150μm2到6000μm2,以及包括从200μm2到5000μm2
光电检测器阵列的尺寸可以根据光量及光强度、光电检测器的数量和所需的灵敏度而变化,并且其长度可以为从0.01mm到100mm,例如从0.05mm到90mm,例如从0.1mm到80mm,例如从0.5mm到70mm,例如从1mm到60mm,例如从2mm到50mm,例如从3mm到40mm,例如从4mm到30mm,以及包括从5mm到25mm。光电检测器阵列的宽度也可以变化,从0.01mm到100mm,例如从0.05mm到90mm,例如从0.1mm到80mm,例如从0.5mm到70mm,例如从1mm到60mm,例如从2mm到50mm,例如从3mm到40mm,例如从4mm到30mm,以及包括从5mm到25mm。因此,光电检测器阵列的活动表面可以为从0.1mm2至10000mm2,例如从0.5mm2至5000mm2,例如从1mm2至1000mm2,例如从5mm2至500mm2,以及包括从10mm2至100mm2
感兴趣的光电检测器被配置为在一个或更多个波长下测量所收集的光,例如在2个或更多个波长下,例如在5个或更多个不同的波长下,例如在10个或更多个不同的波长下,例如在25个或更多个不同的波长下,例如在50个或更多个不同的波长下,例如在100个或更多个不同的波长下,例如在200个或更多个不同的波长下,例如在300个或更多个不同的波长下测量所收集的光,以及包括在400个或更多个不同的波长下测量流动流中的样本发射的光。
在部分实施例中,光电检测器被配置成在一定波长范围(例如,200nm-1000nm)内测量所收集的光。在某些实施例中,感兴趣的光电检测器被配置成在一定波长范围内收集光的光谱。例如,系统可以包括一个或更多个检测器,一个或更多个检测器被配置成在200nm-1000nm的波长范围中的一个或更多个波长范围内收集光的光谱。在其它实施例中,感兴趣的检测器被配置成在一个或更多个特定波长下对来自流动流中的样本的光进行测量。例如,系统可以包括一个或更多个检测器,一个或更多个检测器被配置为在450nm、518nm、519nm、561nm、578nm、605nm、607nm、625nm、650nm、660nm、667nm、670nm、668nm、695nm、710nm、723nm、780nm、785nm、647nm、617nm及其任意组合中的一个或更多个下测量光。在某些实施例中,光电检测器可能被配置为与特定的荧光团配对,例如与在荧光测定中与样本一起使用的那些荧光团配对。在部分实施例中,光电检测器被配置为在样本中每个荧光团的整个荧光光谱上测量所收集的光。
光检测系统被配置为连续测量光或以离散间隔测量光。在部分例子中,感兴趣的光电检测器被配置为连续测量所收集的光。在其他例子中,光检测系统被配置为以离散间隔进行测量,例如每0.001毫秒、每0.01毫秒、每0.1毫秒、每1毫秒、每10毫秒、每100毫秒以及包括每1000毫秒测量一次光或者以一些其他间隔测量光。
处理器和存储器的配置
根据本公开的系统包括处理器,该处理器具有可操作地耦合到处理器的存储器,其中该存储器包括存储在其上的指令,这些指令在被处理器执行时,使处理器:识别感兴趣参数;指定感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。
在实例中,处理器和/或存储器可以可操作地连接到被配置成获得细胞术数据的装置,该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值。这种可操作连接可以采用任何方便的形式,使得处理器可以通过任何方便的输入技术获得细胞术数据,例如通过有线网络连接或无线网络连接、共享存储器、具有细胞术数据源的总线或类似通信协议诸如以太网连接或通用串行总线(USB)连接、便携式存储设备等获得细胞术数据。
在实施例中,在获得细胞术数据(例如,通过流式细胞仪获得或从流式细胞仪获得)之后,处理器和存储器被配置成识别感兴趣参数。可以以任何方便的方式识别感兴趣参数。例如,在某些例子中,处理器和存储器可以被配置成接收输入数据,该输入数据对应于识别感兴趣参数的选择。在其它例子中,处理器和存储器可以被配置成从潜在的感兴趣参数列表中选择感兴趣参数,例如,通过遍历一个或更多个潜在参数的列表来从潜在的感兴趣参数列表中选择感兴趣参数。在部分例子中,处理器和存储器可以被配置成接收关于待显示的绘图的特征的输入,并且被进一步配置成基于绘图的特征来识别感兴趣参数。
在根据本公开的系统的实施例中,处理器和存储器还被配置成指定感兴趣参数的正测量区间和负测量区间。可以以任何方便的方式识别这种正测量区间和负测量区间。例如,在部分例子中,处理器和存储器可以被配置成接收对应于测量数据的至少一个范围的输入数据,该至少一个范围对应于正测量区间或负测量区间或者对应于这两个测量区间。在其它实施例中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器使用一维门控来指定感兴趣参数的正测量区间和负测量区间中的至少一个。如上所述,可以手动定义或自动定义(例如,通过算法来定义)此类门的特征。例如,在此类实施例中,处理器可以被配置成接收一维门作为输入,该一维门指定感兴趣参数的正测量区间和负测量区间。在其他实施例中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器应用荧光减一控制来指定感兴趣参数的正测量区间和负测量区间中的至少一个。在部分例子中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器应用数学模型来指定感兴趣参数的正测量区间和负测量区间中的至少一个。在其它例子中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器应用机器学习算法来指定感兴趣参数的正测量区间和负测量区间中的一个或者两个。
在根据本公开的系统的实施例中,处理器和存储器还被配置成通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。在部分实施例中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器通过重新缩放感兴趣参数的指定负测量区间来转换感兴趣参数。在此类实施例中,存储器可以包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器通过减少感兴趣参数的指定负测量区间的标准偏差来重新缩放感兴趣参数的指定负测量区间。
在某些实施例中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器通过重新缩放感兴趣参数的指定正测量区间来转换感兴趣参数。在其它实施例中,重新缩放指定正测量区间包括将正测量区间重新缩放到预定大小。经缩放的正测量区间的预定大小可以是任何方便的大小,并且可以根据需要而变化。在部分例子中,该预定大小是负测量区间的大小。在其它例子中,该预定大小是与多个参数中的第二参数对应的经缩放的正测量区间的大小。
在实施例中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器根据通过自适应地缩放感兴趣参数来转换感兴趣参数。如上文关于根据本公开的方法详细描述的,s(x)表示感兴趣参数的自适应缩放测量值;x表示感兴趣参数的未缩放测量值;(n-,n+)是参数的指定负测量区间;(n+,p)是参数的指定正测量区间;c是压缩系数;/>是负测量区间的中位数;SD是负测量区间的标准偏差,并且根据/>来计算,其中IQR是负测量区间的四分位间距;z(x)是根据/>的z转换;g(z)是根据/>的反向双曲正弦函数;并且/>是μ=z(n+)且σ=1的标准正态分布的累积分布函数(CDF)。噪声压缩系数可以设置为任何方便的值,并且可以根据需要而变化。噪声压缩系数的最小值为1.0,并且默认压缩系数被设置为70。
在实施例中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器将经缩放的细胞术数据显示在显示设备上。在此类实施例中,系统被配置为通过使包括转换后的感兴趣参数的细胞术数据的绘图显示来将经缩放的细胞术数据显示在显示设备上。可以为任何方便的显示设备,例如液晶显示器(LCD)、发光二极管(LED)显示器、等离子(PDP)显示器、量子点(QLED)显示器或阴极射线管显示设备。处理器和/或存储器可以可操作地连接到显示设备,例如,通过有线连接例如通用串行总线(USB)连接或无线连接例如蓝牙连接来可操作地连接到显示设备。在部分例子中,显示二维绘图,该绘图描绘了包括细胞术数据的至少两个参数的测量值,其中所述参数中的至少一个参数被转换,例如,如本文所述被缩放。
在实施例中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器:识别一个或更多个附加的感兴趣参数;指定每个附加的感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放细胞术数据。换言之,在部分例子中,系统可以被配置成通过如本文所描述的缩放此类参数来转换细胞术数据的多于一个参数。在部分例子中,处理器通过显示如本文所述的经缩放的每个参数来使经缩放的细胞术数据显示在例如二维绘图或三维绘图上。
在其它实施例中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器通过将聚类算法应用于经缩放的细胞术数据来对细胞术数据进行聚类。处理器和存储器可以被配置成根据任何方便的聚类算法对经缩放的细胞术数据进行聚类,任何方便的聚类算法例如本文描述的那些聚类算法,包括k-平均值聚类、自组织映射、X-Shift或其它已知或尚未发现的聚类程序。在此类实施例中,存储器包括存储在其上的其他指令,这些其他指令在被处理器执行时,使处理器使经缩放的细胞术数据的聚簇进行显示。在部分例子中,系统被配置为缩放细胞术数据,使得提高应用于细胞术数据的聚类算法的性能。可以通过多种方式改善聚类算法的性能,例如通过使聚类算法能够发现不同颗粒类型(例如不同的细胞)的附加群体或者通过将颗粒识别为属于某一聚簇,否则这些颗粒将被聚类算法忽略,即,未被分类为属于某一群体或属于某一有意义的颗粒聚簇。在部分例子中,聚类算法的性能得到改善,这是因为如本文所述的缩放细胞术数据可以减少噪声对构成细胞术数据的颗粒测量值的影响。在某些实施例中,系统被配置为缩放细胞术数据,使得降低测量噪声的影响。在其它实施例中,颗粒是细胞。在这种情况下,系统被配置为基于经缩放的细胞术数据区分两个相似的细胞群体。即,系统可以被配置为识别细胞类型之间的差异,否则这些细胞类型可能被理解为属于同一细胞类型,而实际上,这些细胞是不同类型的细胞。
在实施例中,细胞术数据为高维数据。高维数据意味着细胞术数据包括大量不同的测量参数。换言之,细胞术数据表示颗粒的许多不同特征的测量值。在部分例子中,所述多个测量参数为两个到大约300,000个测量参数。在部分实施例中,样本的细胞术数据包括从被配置为分析样本的流式细胞仪中所获得的测量值。在部分例子中,被配置为获取细胞术数据的装置可以是流式细胞仪,或者在其它例子中可以是被配置为从流式细胞仪获取细胞术数据的输入设备,例如有线或无线输入设备。
颗粒分析仪
根据本发明所公开的系统还包括被配置为获取细胞术数据的装置,该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值。在系统的部分实施例中,该装置被配置为通过照射在流动流中流动的样本中的颗粒来通过分析样本获得细胞术数据。在其它实施例中,该装置是被配置成从如本文所述的那些颗粒分析仪或分选系统等获取细胞术数据的输入设备。
图3示出了颗粒分析仪示例或分选控制系统(例如分析控制器)的一个示例的功能框图,即可操作地连接到存储器、用于分析和显示数据的处理器300。处理器300可以被配置成实现各种过程,以控制包括生物事件在内的数据的图形显示。
装置302可以被配置成获取细胞术数据,例如获取生物事件数据。例如,流式细胞仪能够生成流式细胞术事件数据。在实施例中,该装置可以是颗粒分析仪或分选系统例如流式细胞仪,或者可以可操作地连接到颗粒分析仪或分选系统例如流式细胞仪。装置302可以被配置成向处理器300提供生物事件数据。在装置302与处理器300之间可以包含数据通信信道。生物事件数据可以通过数据通信信道提供给处理器300。
处理器300可以被配置成从装置302接收生物事件数据。从装置302接收的生物事件数据可以包括流式细胞术事件数据。处理器300可以被配置成向显示设备306提供图形显示,该图形显示包括显示细胞术数据的一个或者更多个直方图或者显示生物事件数据的第一绘图或者显示展现细胞数数据的聚簇数据的绘图。例如,处理器300可以被配置成使显示设备306显示经缩放的细胞术数据。处理器300还能被配置成将感兴趣区域呈现为显示设备306所显示的生物事件数据群体周围的门,例如叠加在第一绘图上。在部分实施例中,该门可以是绘制在单个参数直方图或二元图上的一个或更多个感兴趣图形区域的逻辑组合。在部分实施例中,结合细胞术数据的直方图,该显示可以用于显示适用于装置302的设置,以校准装置302的检测器。
处理器300还能被配置成在显示设备306上与门外的数据中的其他事件不同地显示在门内的数据。例如,处理器300能被配置成对门内包含的生物事件数据的颜色进行渲染,以区别于门外的生物事件数据的颜色。显示设备306能够实现为监视器、平板电脑、智能手机或其它被配置成呈现图形界面的电子设备。
处理器300能被配置成从第一输入设备接收针对装置302的配置设置的调整。当处理器300从第一输入设备接收到这种对配置设置的调整时,可以使用该调整来更新装置302的设置,例如更新颗粒分析仪的设置。例如,在实施例中,可以调整信道检测器的增益设置以避免信道检测器饱和。
另外,处理器300能被配置成从第一输入设备接收识别门的门选择信号。例如,第一输入设备能实现为鼠标310。鼠标310可以向处理器300发起门选择信号,以识别要显示在显示设备306上或要通过显示设备306进行操纵的门(例如,通过当光标定位在期望的门处时,在期望的门上或门内单击)。在部分实现中,第一输入设备能实现为用于向处理器300提供输入信号的键盘308或其它装置,例如触摸屏、手写笔、光学检测器或语音识别系统。部分输入设备可以包含多个输入功能。在此类实现中,输入功能各自都会被视为一个输入设备。例如,如图3所示,鼠标310可以包括鼠标右键和鼠标左键,它们中的每一个均可以生成触发事件。
触发事件会使分析处理器300改变数据的显示方式、数据的哪些部分实际显示在显示设备306上、和/或为其他处理提供输入,例如选择感兴趣的群体进行颗粒分选。
在部分实施例中,处理器300可以被配置成检测鼠标310何时启动门选择。处理器300还能被配置成自动修改绘图可视化以促进门控过程。该修改可以基于处理器300接收到的生物事件数据的特定分布。
处理器300可以连接到存储设备304。存储设备304可以被配置成从处理器300接收生物事件数据并且存储生物事件数据。存储设备304还能被配置成允许处理器300检索生物事件数据,例如检索流式细胞术事件数据。
显示设备306可以被配置成从处理器300接收显示数据。显示数据能够包括生物事件数据的绘图和概述绘图的部分的门。显示设备306还能被配置成根据从处理器300接收到的输入并结合来自装置302、存储设备304、键盘308和/或鼠标310的输入来改变所呈现的信息。
在部分实现中,处理器300可以生成用户界面以接收用于分选的示例事件。例如,用户界面能够包括用于接收示例事件或示例图像的控件。能够在收集样本的事件数据之前提供示例事件或示例图像或示例门,或者基于样本的一部分的初始事件集提供示例事件或示例图像或示例门。
图4示出了根据本发明的说明性实施例的用于流式细胞术的系统400。系统400包括流式细胞仪410、控制器/处理器490和存储器495。流式细胞仪410包括一个或更多个激发激光器415a-415c、聚焦透镜420、流动室425、前向散射检测器430、侧向散射检测器435、荧光收集透镜440、一个或更多个分束器445a-445g、一个或更多个带通滤光器450a-450e、一个或更多个长通(“LP”)滤光器455a-455b、以及一个或更多个荧光检测器460a-460f。
激发激光器415a-415c以激光束的形式发射光。在图4的示例系统中,从激发激光器415a-415c发射的激光束的波长分别为488nm、633nm和325nm。首先,引导激光束穿过分束器445a和445b中的一个或更多个。分束器445a透射488nm的光并反射633nm的光。分束器445b透射紫外光(波长范围为10nm至400nm的光)并反射488nm和633nm的光。
然后,将激光束引导至聚焦透镜420,聚焦透镜420将光束聚焦到流动室425内样本颗粒所在的流体流部分。流动室是流体系统的一部分,流体系统将流中的颗粒(通常一次一个)引导到聚焦的激光束进行查询。流动室能够包括台式细胞仪中的流动池或空气流细胞仪(stream-in-air cytometer)中的喷嘴尖端。
来自激光束的光通过衍射、折射、反射、散射和吸收与样本中的颗粒相互作用,并根据颗粒的特性(例如其尺寸、内部结构以及附着至或自然存在于颗粒上或颗粒中的一种或更多种荧光分子的存在)在各种不同波长下再发射。荧光发射以及衍射光、折射光、反射光和散射光可以通过分束器445a-445g、带通滤光器450a-450e、长通滤光器455a-455b和荧光收集透镜440中的一个或更多个被路由至前向散射检测器430、侧向散射检测器435和一个或更多个荧光检测器460a-460f中的一个或更多个。
荧光收集透镜440收集由于颗粒-激光束相互作用而发出的光,并将该光朝向一个或更多个分束器和滤光器(带通滤光器,例如带通滤光器450a-450e)路由,使得窄范围的波长通过滤光器。例如,带通滤光器450a是510/20滤光器。第一个数字表示光谱带的中心。第二个数字提供光谱带的范围。因此,510/20滤光器在光谱带中心的每一侧延伸10nm,或从500nm延伸到520nm。短通滤光器透射波长等于或短于指定波长的光。长通滤光器例如长通滤光器455a-455b透射波长等于或长于指定光波长的光。例如,作为670nm长通滤光器的长通滤光器455a透射波长等于或长于670nm的光。通常选择滤光器以优化检测器对特定荧光染料的特异性。滤光器能被配置为使得传输到检测器的光的光谱带接近荧光染料的发射峰值。
分束器沿不同的方向引导不同波长的光。能通过诸如短通和长通的滤光器特性来表征分束器。例如,分束器445g是620短通分束器,这意味着分束器455g透射620nm或更短波长的光,并沿不同方向反射波长长于620nm的光。在一个实施例中,分束器445a-445g能够包括光学反射镜,例如二向色镜。
前向散射检测器430被定位成稍微偏离穿过流动池的直接光束的轴线,并且并被配置成检测衍射光,即主要沿着前向方向穿过或围绕颗粒传播的激发光。前向散射检测器所检测到的光的强度取决于颗粒的整体大小。前向散射检测器能够包括光电二极管。侧向散射检测器435被配置成检测来自颗粒表面和内部结构的折射光和反射光,并且随着结构的颗粒复杂性的增加而趋于增加。能通过一个或更多个荧光检测器460a-460f来检测来自与颗粒相关的荧光分子的荧光发射。侧向散射检测器435和荧光检测器能够包括光电倍增管。在前向散射检测器430、侧向散射检测器435和荧光检测器处检测到的信号能被检测器转换为电子信号(电压)。此数据能够提供关于样本的信息。
本领域技术人员将认识到,根据本发明的实施例的流式细胞仪并不局限于图4所示的流式细胞仪,而是能够包括本领域已知的任何流式细胞仪。例如,流式细胞仪可以具有任意数量的具有不同的波长和处于各种不同的配置的激光器、分束器、滤光器和检测器。
在操作中,细胞仪操作由控制器/处理器490控制,并且来自检测器的测量数据能够储存在存储器495中并被控制器/处理器490处理。尽管未明确示出,但控制器/处理器490包括至少一个通用处理器和多个并行处理单元,并且耦合到检测器以接收来自检测器的输出信号,并且还可以耦合到流式细胞仪400的电气和机电组件以控制激光器、流体流参数等。还可以在系统中提供输入/输出(I/O)功能497。存储器495、控制器/处理器490和I/O497可以作为流式细胞仪410的组成部分来整体提供。在此类实施例中,显示器也可以形成I/O功能497的一部分,用于向细胞仪400的用户呈现实验数据,该实验数据包括细胞术数据的一个或更多个直方图。替选地,存储器495和控制器/处理器490以及I/O功能中的部分或全部可以是一个或更多个外部设备(例如通用计算机)的一部分。在部分实施例中,存储器495和控制器/处理器490中的部分或全部能够与细胞仪410进行无线通信或有线通信。控制器/处理器490与存储器495和I/O 497结合能够被配置成执行与流式细胞仪实验的准备和分析相关的各种功能。
图4所示的系统包括六个不同的检测器,其检测六个不同波段(对于给定检测器,在本文中可将其成为“滤光窗口”)的荧光,这些波段由从流动池425到每个检测器的光束路径中的滤光器和/或分束器的配置来限定。用于流式细胞仪实验的不同荧光分子会发出其自己特征波段中的光。可以选择用于实验的特定荧光标记及其相关的荧光发射带,以通常使其与检测器的滤光窗口重合。然而,随着提供更多的检测器以及使用更多的标记,滤光窗口和荧光发射光谱之间的完美对应是不可能的。一般来说,尽管特定荧光分子的发射光谱的峰值可能位于某一特定检测器的滤光窗口内,但该标记的发射光谱中的一部分将会与一个或更多个其他检测器的滤光窗口重叠。可以将此称为溢出。I/O 497能被配置成接收关于流式细胞仪实验的数据,该流式细胞仪实验具有一组荧光标记和具有多个标记物的多个细胞群体,每个细胞群体具有多个标记物的子集。I/O 497还能被配置成接收将一个或更多个标记物分配给一个或更多个细胞群体的生物数据、标记物密度数据、发射光谱数据、将标签分配给一个或更多个标记物的数据和细胞仪配置数据。流式细胞仪实验数据例如标签光谱特性和流式细胞仪配置数据也能储存在存储器495中。控制器/处理器490能被配置成对将一个或更多个标签分配给标记物进行评估。
图5示出了基于计算进行样本分析和颗粒表征的颗粒分析系统的功能框图。在部分实施例中,该颗粒分析系统500是流式系统。图5所示的颗粒分析系统500能被配置成执行本文所述方法的各个方面。颗粒分析系统500包括流体系统502。流体系统502能够包括或耦合到样本管510和样本管内的移动流体柱,样本的颗粒530(例如细胞)在样本管中沿公共样本路径520移动。
颗粒分析系统500包括检测系统504,检测系统504被配置成当每个颗粒沿公共样本路径通过一个或更多个检测站时从每个颗粒收集信号。检测站508通常是指公共样本路径的监测区域540。在部分实现中,检测能够包括当颗粒530通过监测区域540时检测光或检测颗粒530的一种或更多种其它性质。在图5中示出了具有一个监测区域540的一个检测站508。颗粒分析系统500的部分实现方式能够包括多个检测站。此外,部分检测站能监测多于一个区域。
每个信号被分配有信号值,以形成每个颗粒的数据点。如上所述,此数据可称为事件数据。数据点能够是多维数据点,该多维数据点包括针对颗粒测量的相应属性的值。检测系统504被配置成在第一时间间隔内收集一系列这样的数据点。
颗粒分析系统500还能包括控制系统506。控制系统506能够包括一个或更多个通用处理器、多个并行处理单元、如图6A所示并将在下文讨论的幅值控制电路626和/或频率控制电路624。所示的控制系统506能够在操作上与流体系统502相关联。控制系统506能被配置成基于检测系统504在第一时间间隔期间收集的数据点的数量和泊松分布来针对第一时间间隔的至少一部分生成所计算的信号频率。控制系统506还能被配置成基于在第一时间间隔的一部分中的数据点的数量来生成实验信号频率。控制系统506还能将实验信号频率与所计算的信号频率或预定信号频率进行比较。此外,控制系统506能被配置成通过对直方图进行编码来生成细胞术数据的直方图表示。控制系统506能通过使用多个并行处理单元基本上同时为每个直方图值分配颜色并例如使用通用处理器随后复制与直方图值对应的颜色编码来生成直方图表示。
图6A是根据本文的一个实施例的颗粒分析仪和分选系统600(例如,如图3所示的颗粒分析仪302)的示意图。在部分实施例中,该颗粒分选系统600是细胞分选系统。如图6A所示,液滴形成换能器602(例如压电振荡器)耦合到流体管道601,流体管道601可以耦合到、可以包括或可以是喷嘴603。在流体管道601内,鞘流604流体动力学地将包含颗粒609的样本流体606聚焦到移动流体柱608(例如,流)中。在移动流体柱608内,颗粒609(例如,细胞)排成一列以穿过监测区域611(例如,激光-流相交的地方),监测区域611被照射源612(例如,激光器)照射。液滴形成换能器602的振动导致移动流体柱608破碎成多个液滴610,多个液滴610中的部分液滴含有颗粒609。
在操作中,检测站614(例如,事件检测器)识别感兴趣的颗粒(或感兴趣的细胞)何时穿过监测区域611。检测站614馈入计时电路628,计时电路又馈入闪充电路(flashcharge circuit)630。在定时液滴延迟(Δt)所通知的液滴断裂点处,可以向移动流体柱608施加闪充,使得感兴趣的液滴携带电荷。感兴趣的液滴能够包括一个或更多个待分选的颗粒或细胞。然后可以通过激活偏转板(未示出)以将液滴偏转到分区中例如偏转到诸如收集管或多孔或微孔样本板的容器中来对带电液滴进行分选,其中分区或孔或微孔能与特别感兴趣的液滴相关联。如图6A所示,液滴可以被收集在排出容器638中。
检测系统616(例如,液滴边界检测器)用于在感兴趣的颗粒通过监测区域611时自动确定液滴驱动信号的相位。示例性液滴边界检测器在美国专利号7,679,039中进行描述,其全部内容通过引用并入本文。检测系统616允许仪器精确地计算液滴中的每个检测到的颗粒的位置。检测系统616可以馈入幅值信号620和/或相位618信号中,幅值信号620和/或相位618信号又(通过放大器622)馈入幅值控制电路626和/或频率控制电路624中。幅值控制电路626和/或频率控制电路624转而控制液滴形成换能器602。幅值控制电路626和/或频率控制电路624可以被包括在控制系统中。
在部分实现中,分选电子器件(例如,检测系统616、检测站614和处理器640)可以与存储器耦合,该存储器被配置成存储检测到的事件并基于此的分选决策。该分选决策可以被包括在颗粒的事件数据中。在部分实现中,检测系统616和检测站614可以被实现为单个检测单元或通信耦合,使得事件测量结果能被检测系统616或检测站614之一收集并被提供给非收集元件。
图6B是根据本文的一个实施例的颗粒分析仪和分选系统的示意图。如图6B所示的颗粒分析仪和分选系统600包括偏转板652和654。能够经由倒钩中的流式充电线施加电荷。这产生含有颗粒610的液滴流610用于分析。能够用一个或更多个光源(例如激光)照射颗粒以产生光散射和荧光信息。例如通过分选电子器件或其它检测系统(图6B中未示出)来分析颗粒的信息。能够独立地控制偏转板652和654以吸引或排斥带电液滴以朝向诸如隔板的目的地收集容器(例如,672、674、676或678之一)引导液滴。如图6B所示,能够控制偏转板652和654以沿朝向容器674的第一路径662或沿朝向容器678的第二路径668引导颗粒。如果对颗粒不感兴趣(例如,没有表现出在指定的分选范围内的散射或照明信息),则偏转板可以允许颗粒继续沿着流动路径664。这种不带电的液滴可以通过例如抽吸器670进入废物容器。
可以包括分选电子器件以启动测量值的收集、接收颗粒的荧光信号并确定如何调节偏转板以引起颗粒的分选。图6B所示的实施例的示例实现包括由Becton、Dickinson和Company(新泽西州富兰克林湖)所提供的商用BD FACSAriaTM系列流式细胞仪。
在部分实施例中,所描述的用于颗粒分析仪和分选系统600的一个或更多个组件能用来分析和表征颗粒,无论是否将颗粒物理分选到收集容器中。类似地,上述用于颗粒分析系统500(图5)的一个或更多个组件能用来分析和表征颗粒,无论是否将颗粒物理分选到收集容器中。例如,能够使用颗粒分选系统600或颗粒分析系统500的一个或更多个组件以如本文所述的包括至少三个组的树对颗粒进行分组或显示在或者替选地能够以一个或更多个直方图格式显示颗粒。
根据部分实施例的系统可以包括显示器和操作员输入设备。操作员输入设备可以是例如键盘、鼠标等。处理模块包括至少一个通用处理器以及多个并行处理单元,其全部都能访问存储器,该存储器具有存储于其上的指令,所述指令用于执行本主题方法的步骤。该处理模块可以包括操作系统、图形用户界面(GUI)控制器、系统存储器、存储器存储设备和输入输出控制器、高速缓存、数据备份单元和许多其他设备。通用处理器以及每个并行处理单元可以是市售处理器,也可以是已经或将要变得可用的其它处理器之一。处理器执行操作系统,并且操作系统以众所周知的方式与固件和硬件交互并帮助处理器协调和执行各种计算机程序的功能,这些计算机程序可以是用各种编程语言编写的,例如本领域所熟知的Java、Perl、Python、R、Go、JavaScript、.NET、CUDA、Verilog、C++、其他高级或低级语言、以及它们的组合。操作系统通常与处理器合作,协调并执行计算机其他组件的功能。操作系统还提供调度、输入输出控制、文件和数据管理、存储器管理以及通信控制和相关服务,所有这些都符合已知技术。处理器可以是任何合适的模拟或数字系统。在部分实施例中,一个或更多个通用处理器以及并行处理单元包括提供反馈控制(例如负反馈控制)的模拟电子器件。
系统存储器可以是各种已知或将来的存储器存储设备中的任何一种。示例包括任意常用的随机存取存储器(RAM)、磁性介质如常驻硬盘或磁带、光学介质例如读写光盘、闪存设备或其他存储器存储设备。存储器存储设备可以是各种已知或将来设备中的任何一种,包括光盘驱动器、磁带驱动器、可移动硬盘驱动器或软盘驱动器。这种类型的存储器存储设备通常从程序存储介质(未示出)读取和/或向程序存储介质写入,例如光盘、磁带、可移动硬盘或软盘。这些程序存储介质中的任何一种或现在正在使用或以后将要开发的其他程序存储介质,都可以被视为计算机程序产品。应当理解,这些程序存储介质通常存储计算机软件程序和/或数据。计算机软件程序也被称为计算机控制逻辑,其通常被存储在系统存储器中和/或被存储在与存储器存储设备一起使用的程序存储设备中。
在部分实施例中,描述了计算机程序产品,其包括计算机可用介质,该计算机可用介质具有存储在其中的控制逻辑(计算机软件程序,包括程序代码)。控制逻辑在被计算机的处理器执行时,使处理器执行本文所述的功能。在其他实施例中,部分功能主要在硬件中实现,例如用硬件状态机实现。用来执行本文所述的功能的硬件状态机的实现对于相关领域的技术人员将是显而易见的。
存储器可以是任何合适的设备,一个或更多个通用处理器以及多个并行处理单元(例如图形处理器)能够在该设备中存储和检索数据,该设备为例如磁性、光学或固态存储设备(包括磁盘或光盘或磁带或RAM,或任何其他合适的设备,固定式或便携式设备)。通用处理器可以包括通用数字微处理器,该通用数字微处理器从携载必要程序代码的计算机可读介质被适当地编程。并行处理单元可以包括一个或更多个图形处理器,这些图形处理器从携载必要程序代码的计算机可读介质被适当地编程。能够通过一个或更多个通信通道将编程远程提供给处理器,或者使用与存储器连接的任何设备将编程预先保存在计算机程序产品(例如存储器或部分其他便携式或固定式计算机可读存储介质)中。例如,磁盘或光盘可以携载编程,并且能够被磁盘写入器/读取器读取。本发明的系统还包括用于实践上述方法的例如计算机程序产品形式的编程、算法。根据本发明的编程能被记录在计算机可读介质上,例如,任何能被计算机直接读取和访问的介质上。此类介质包括但不限于:磁性存储介质,例如软盘、硬盘存储介质和磁带;光学存储介质,例如CD-ROM;电存储介质,例如RAM和ROM;便携式闪存驱动器;以及这些类别的混合体,例如磁性/光学存储介质。
一个或更多个通用处理器也可以访问通信信道以与远程位置的用户进行通信。远程位置意味着用户与系统不直接接触并将输入信息从外部设备中继到输入管理器,该外部设备是例如连接到广域网(“WAN”)、电话网络、卫星网络或任何其他合适的通信信道的计算机,包括移动电话(即智能手机)。
在部分实施例中,根据本公开的系统可以被配置成包括通信接口。在部分实施例中,该通信接口包括用于与网络和/或另一设备通信的接收器和/或发送器。该通信接口能被配置用于有线通信或无线通信,包括但不限于射频RF通信(例如,射频识别RFID)、Zigbee通信协议、WiFi、红外、无线通用串行总线(USB)、超宽带(UWB)、通信协议和蜂窝通信例如码分多址(CDMA)或全球移动通信系统(GSM)。/>
在一个实施例中,该通信接口被配置成包括一个或更多个通信端口,例如物理端口或接口例如USB端口、RS-232端口或任何其他合适的电气连接端口,以允许在相关系统与其它外部设备之间进行数据通信,这些外部设备是例如被配置为用于类似互补数据通信的计算机终端(例如,在医生办公室或医院环境中)。
在一个实施例中,该通信接口被配置为用于红外通信、通信或任何其他合适的无线通信协议,以使相关系统能够与其它设备进行通信,所述其他设备为例如计算机终端和/或网络、支持通信的移动电话、个人数字助理或用户可以结合使用的任何其它通信设备。
在一个实施例中,该通信接口被配置为通过手机网络、短消息服务(SMS)、与连接到互联网的局域网(LAN)上的个人计算机(PC)的无线连接、或在WiFi热点处与互联网的WiFi连接来利用因特网协议(IP)提供用于数据传输的连接。
在一个实施例中,相关系统被配置成通过通信接口例如使用诸如802.11或RF协议或IrDA红外协议的通用标准与服务器设备进行无线通信。服务器设备可以是另一便携式设备,例如智能手机、个人数字助理(PDA)或笔记本电脑;或较大的设备,如台式计算机、电器等。在部分实施例中,服务器设备具有显示器例如液晶显示器(LCD)和输入设备例如按钮、键盘、鼠标或触摸屏。
在部分实施例中,该通信接口被配置成使用上述通信协议和/或机制中的一个或更多个与网络或服务器设备自动或半自动地传送存储在相关系统中的数据,例如存储在可选数据存储单元中的数据。
输出控制器可以包括用于各种已知显示设备中的任何一种的控制器,该显示设备用于向用户呈现信息,无论该用户是人还是机器,无论是本地的还是远程的。如果显示设备之一提供视觉信息,则通常可以在逻辑上和/或在物理上将该信息组织为图片元素的阵列。图形用户界面(GUI)控制器可以包括各种已知或未来的软件程序中的任何一种,该软件程序用于在系统和用户之间提供图形输入和输出接口并用于处理用户输入。计算机的功能元件可以通过系统总线相互通信。在替代实施例中,这些通信中的一部分可以使用网络或其他类型的远程通信来完成。输出管理器也可以根据已知技术例如通过因特网、电话或卫星网络将处理模块生成的信息提供给远程位置的用户。输出管理器对数据的呈现可以根据各种已知技术来实现。作为部分示例,数据可以包括SQL、HTML或XML文档、电子邮件或其它文件,或其他形式的数据。该数据可以包括因特网URL地址,以便用户可以从远程源检索其他SQL、HTML、XML或其他文档或数据。在相关系统中存在的一个或更多个平台可以是任何类型的已知计算机平台或将来要开发的类型,尽管它们通常属于通常被称为服务器的一类计算机。然而,它们也可以是大型计算机、工作站或其他计算机类型。它们可以通过任何已知或未来类型的线缆或其他通信系统(包括无线系统,无论是联网的还是其他的)连接。它们可以位于同一地点,也可以在物理上分开。可以在任何计算机平台上使用各种操作系统,这可能取决于所选计算机平台的类型和/或结构。合适的操作系统包括Windows 10、 Windows XP、Windows 7、Windows 8、iOS、Oracle Solaris、Linux、OS/400、CompaqTru64 Unix、SGI IRIX、Siemens Reliant Unix、Ubuntu、Zorin OS等。
图7描绘了根据某些实施例的示例计算设备700的通用体系结构。图7所描绘的计算设备700的通用架构包括计算机硬件组件和软件组件的布置。计算设备700可以包括比图7所示的那些元件更多(或更少)的元件。然而,没有必要为了提供能够实现的公开而将所有这些通常为常规的元件都显示出来。如图所示,计算设备700包括处理单元710、网络接口720、计算机可读介质驱动器730、输入/输出设备接口740、显示器750和输入设备760,所有的这些组件都可以通过通信总线相互通信。网络接口720可以提供与一个或更多个网络或计算系统的连接。因此,处理单元710可以通过网络从其它计算系统或服务接收信息和指令。处理单元710还可以与存储器770通信,并且经由输入/输出设备接口740进一步为可选的显示器750提供输出信息。输入/输出设备接口740还可以从可选的输入设备760(例如键盘、鼠标、数字笔、麦克风、触摸屏、手势识别系统、语音识别系统、游戏手柄、加速度计、陀螺仪或其它输入设备)接收输入。
存储器770可以包含计算机程序指令(在部分实施例中被分组为模块或组件),处理单元710执行这些计算机程序指令以便实现一个或更多个实施例。存储器770通常包括RAM、ROM和/或其它持久性、辅助性或非暂时性计算机可读介质。存储器770可以存储操作系统772,操作系统772提供计算机程序指令,在计算设备700的一般管理和操作中,这些计算机程序指令供处理单元710使用。存储器770还可以包括用于实现本公开的各个方面的计算机程序指令和其它信息。
例如,在一个实施例中,存储器770包括参数处理模块774和缩放模块776,参数处理模块774用于识别感兴趣参数和/或指定感兴趣参数的正测量区间和负测量区间,缩放模块776用于通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。
合适的流式细胞术系统可以包括但不限于以下中所描述的流式细胞术系统:Ormerod(编辑),Flow Cytometry:A Practical Approach,Oxford Univ.Press(1997);Jaroszeski等人(编辑),Flow Cytometry Protocols,Methods in Molecular BiologyNo.91,Humana Press(1997);Practical Flow Cytometry,第3版,Wiley-Liss(1995);Virgo等人(2012)Ann Clin Biochem.Jan;49(pt 1):17-28、Linden等人,Semin ThromHemost.2004年10月;30(5):502-11;Alison等人,.J Pathol,2010年12月;222(4):335-344;以及Herbig等人,(2007)Crit Rev Ther Drug Carrier Syst.24(3):203-255,它们的公开内容通过引用并入本文。在某些示例中,感兴趣的流式细胞术系统包括BDBiosciences FACSCantoTM、BD Biosciences FACSCantoTMII流式细胞仪、BD AccuriTM流式细胞仪、BD AccuriTM C6 Plus流式细胞仪、BD Biosciences FACSCelestaTM流式细胞仪、BDBiosciences FACSLyricTM流式细胞仪、BD Bosciences FACSVerseTM流式细胞仪、BDBiosciences FACSymphonyTM流式细胞仪、BD Biosciences LSRFortessTM流式细胞仪、BDBiosciences LSRFortessaTM X-20流式细胞仪、BD Biosciences FACSPrestoTM流式细胞仪、BD Biosciences FACSViaTM流式细胞仪、BD Biosciences FACSCaliburTM细胞分选仪、BD Biosciences FACSCountTM细胞分选仪、BD Bioscience FACSLyricTM细胞分选仪、BDBiosciences ViaTM细胞分选仪、BD Biosciences InfluxTM细胞分选仪、BD BiosciencesJazzTM细胞分选仪、BD Biosciences AriaTM细胞分选仪、BD Biosciences FACSAriaTMII细胞分选仪、BD Biosciences FACSAriaTMIII细胞分选仪、BD Biosciences FACSAriaTMFusion细胞分选仪和BD Biosciences FACSMelodyTM细胞分选仪、BD BiosciencesFACSymphonyTMS6细胞分选仪等。
在部分实施例中,本主题系统是流式细胞术系统,例如以下专利中描述的那些流式细胞术系统:美国专利号10,663,476、10,620,111、10,613,017、10,605,713、10,585,031、10,578,542、10,578,469、10,481,074、10,302,545、10,145,793、10,113,967、10,006,852、9,952,076、9,933,341、9,726,527、9,453,789、9,200,334、9,097,640、9,095,494、9,092,034、8,975,595、8,753,573、8,233,146、8,140,300、7,544,326、7,201,875、7,129,505、6,821,740、6,813,017、6,809,804、6,372,506、5,700,692、5,643,796、5,627,040、5,620,842、5,602,039、4,987,086、4,498,766,其全部公开内容通过引用并入本文。
用于缩放细胞术数据的计算机可读存储介质
本公开的各个方面还包括非暂时性计算机可读存储介质,其具有用于实践本主题方法的指令。可以在一台或更多台计算机上采用计算机可读存储介质以实现系统完全自动化或部分自动化地实践本文所述的方法。在某些实施例中,根据本文所述的方法的指令能以“编程”的形式编码到计算机可读介质上,其中本文所使用的术语“计算机可读介质”是指参与向计算机提供指令和数据以进行执行和处理的任何非暂时性存储介质。合适的非暂时性存储介质的示例包括软盘、硬盘、光盘、磁光盘、CD-ROM、CD-R、磁带、非易失性存储卡、ROM、DVD-ROM、蓝光盘、固态盘和附网存储(NAS),无论此类设备是位于计算机的内部还是外部。包含信息的文件能“存储”在计算机可读介质上,其中“存储”是指记录信息,以便计算机以后可以访问和检索信息。本文描述的计算机实现的方法能使用编程来执行,该编程能够用任意多种计算机编程语言中的一种或更多种来编写。例如,这些语言包括Java(SunMicrosystems公司,加利福尼亚州圣克拉拉)、Visual Basic(Microsoft Corp.,华盛顿州雷德蒙德)和C++(AT&T Corp.,新泽西州贝德明斯特)以及任何其他语言。
在部分实施例中,感兴趣的计算机可读存储介质包括存储在其上的计算机程序,其中该计算机程序在加载到计算机上时包括具有以下算法的指令:用于获取细胞术数据的算法,该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;用于识别感兴趣参数的算法;用于指定感兴趣参数的正测量区间和负测量区间的算法;以及用于通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据的算法。
在实施例中,感兴趣的计算机可读存储介质可以被配置成使得用于获取细胞术数据的算法包括接收识别感兴趣参数的输入。在其它实施例中,感兴趣的计算机可读存储介质可以被配置成使得用于指定感兴趣参数的正测量区间和负测量区间的算法包括接收感兴趣参数的正测量区间和负测量区间中的至少一个作为输入。
在实施例中,感兴趣的计算机可读存储介质可以被配置成使得用于通过转换感兴趣参数来缩放细胞术数据的算法包括重新缩放感兴趣参数的指定负测量区间。在部分实施例中,重新缩放感兴趣参数的指定负测量区间包括减少感兴趣参数的指定负测量区间的标准偏差。在其他实施例中,用于通过转换感兴趣参数来缩放细胞术数据的算法包括重新缩放感兴趣参数的指定正测量区间。在部分例子中,重新缩放指定的正测量区间包括将正测量区间重新缩放到预定大小。在其他例子中,该预定大小是负测量区间的大小。在其他例子中,该预定大小是与多个参数中的第二参数对应的经缩放的正测量区间的大小。
在实施例中,感兴趣的计算机可读存储介质可以被配置成使得用于通过转换感兴趣参数来缩放细胞术数据的算法包括根据来自适应地缩放感兴趣参数,其中s(x)表示感兴趣参数的自适应缩放测量值;x表示感兴趣参数的未缩放测量值;(n-,n+)是参数的指定负测量区间;(n+,p)是参数的指定正测量区间;C是压缩系数;/>是负测量区间的中位数;SD是负测量区间的标准偏差,并且根据/>来计算,其中IQR是负测量区间的四分位间距;Z(x)是根据/>的z转换;g(z)是根据/>的反向双曲正弦函数;并且/>是μ=Z(n+1)且σ=1的标准正态分布的累积分布函数。在实施例中,压缩系数C的默认值为70。
在实施例中,感兴趣的计算机可读存储介质还可以包括用于使经缩放的细胞术数据显示在显示设备上的算法。在此类实施例中,感兴趣的计算机可读存储介质可以被配置成使得用于使经缩放的细胞术数据显示在显示设备上的算法包括使包含转换后的感兴趣参数的细胞术数据的绘图被显示。
在某些实施例中,指定感兴趣参数的正测量区间和负测量区间的算法包括使用一维门控来指定感兴趣参数的正测量区间和负测量区间中的至少一个。在其他实施例中,指定感兴趣参数的正测量区间和负测量区间的算法包括接收一维门作为输入,该一维门指定感兴趣参数的正测量区间和负测量区间。在其它实施例中,指定感兴趣参数的正测量区间和负测量区间的算法包括应用荧光减一控制来指定感兴趣参数的正测量区间和负测量区间中的至少一个。仍在其它实施例中,指定感兴趣参数的正测量区间和负测量区间的算法包括应用数学模型来指定感兴趣参数的正测量区间和负测量区间中的至少一个。仍在其它实施例中,指定感兴趣参数的正测量区间和负测量区间的算法包括应用机器学习算法来指定感兴趣参数指定的正测量区间和负测量区间中的一个或者两个。
在某些例子中,感兴趣的计算机可读存储介质可以被配置成使得指令还包括:用于识别一个或更多个附加的感兴趣参数的算法;用于指定每个附加的感兴趣参数的正测量区间和负测量区间的算法;以及用于通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放细胞术数据的算法。
在部分例子中,感兴趣的计算机可读存储介质可以被配置成使得指令还包括:用于通过将聚类算法应用于经缩放的细胞术数据来对细胞术数据进行聚类的算法。在某些例子中,用于使经缩放的细胞术数据显示在显示设备上的算法包括显示经缩放的细胞术数据的聚簇。
在主题非暂时性计算机可读存储介质的实施例中,细胞术数据是高维数据。在部分例子中,多个测量参数从两个到大约300,000个测量参数。
计算机可读存储介质可以用在具有显示器和操作员输入设备的一个或更多个计算机系统上。操作员输入设备可以是例如键盘、鼠标等。处理模块包括能够访问存储器的处理器,该存储器具有存储于其上的指令,所述指令用于执行本主题方法的步骤。该处理模块可以包括操作系统、图形用户界面(GUI)控制器、系统存储器、存储器存储设备和输入输出控制器、高速缓存、数据备份单元和许多其他设备。该处理器可以是市售处理器,也可以是已经或将要变得可用的其它处理器之一。处理器执行操作系统,并且操作系统以众所周知的方式与固件和硬件交互并帮助处理器协调和执行各种计算机程序的功能,这些计算机程序可以是用各种编程语言编写的,例如本领域所熟知的Java、Perl、C++、其他高级或低级语言、以及它们的组合。操作系统通常与处理器合作来协调并执行计算机其他组件的功能。操作系统还提供调度、输入输出控制、文件和数据管理、存储器管理以及通信控制和相关服务,所有这些都符合已知技术。
实用性
本主题系统、方法和计算机系统可用于各种应用,在这些应用中,需要对流体介质中的样本(例如生物样本)的颗粒成分(例如细胞)进行识别和分析,并且在某些情况下进行分选。在部分实施例中,本文所述的系统和方法可用于用荧光标签标记的生物样本的流式细胞术表征中。在其它实施例中,该系统和方法可用于发射光的光谱学中。此外,本主题系统和方法可用于分析样本,例如通过减少噪声对所收集的数据的影响或者通过提高聚类算法的有效性。因此,在部分例子中,本主题系统和方法可用于区分样本中的不同颗粒类型,例如生物样本中的不同细胞类型。此外,本主题系统和方法可用于提高分选样本(例如,在流动流中的样本)的效率和有效性。提高分选样本的效率意味着在使用本主题系统和方法对样本进行分选或分析时,样本中的更少颗粒(例如细胞)由于例如可与信号区分的测量噪声而被错误表征或误解。特别是,当收集和分析高维数据时,本主题系统和方法可以提高分析或分选的效率和有效性。当期望提供在细胞分选期间具有改进的细胞分选效率、增强的颗粒收集、增强的颗粒充电效率或更准确的颗粒充电的流式细胞仪时,本公开的实施例找到了用途。
本公开的实施例还可用于期望从生物样本制备的细胞用于研究、实验室测试或在治疗中使用的应用中。在部分实施例中,本主题方法和设备可以有助于识别和/或获取从目标流体或组织生物样本制备的各个细胞或其群体。例如,本主题方法和系统有助于从流体或组织样本中识别和/或获取细胞,以用作疾病例如癌症的研究或诊断标本。同样,本主题方法和系统可以有助于从流体或组织样本中识别和/或获取细胞以用于治疗。与传统的流式细胞术系统相比,本公开的方法和设备允许以增强的有效性和效率以及低成本来分析和/或分离并收集来自生物样本(例如器官、组织、组织碎片、液体)的细胞,特别是在收集和/或分析高维数据时。
以下内容仅作为说明而提供,并不用作限制。
实验结果
图8描绘了二维绘图800A,其示出了已经根据默认缩放方法被缩放的细胞术数据的两个参数。相比之下,绘图800B示出了相同的两个参数,但这次是根据主题方法被缩放的两个参数。即,绘图800A和绘图800B中的数据表示之间的唯一区别在于包含这两个参数的数据是如何被缩放的。
图9描绘了如FlowJo 10.7中实现的那样基于opt-SNE算法的1,000次迭代而产生的二维绘图900A,其应用于12-参数PBMC(peripheral blood mononuclear cell,外周血单核细胞)细胞术数据,该细胞术数据已根据默认缩放方法进行缩放,也在FlowJo 10.7软件中实现。由于底层数据代表PBMC的测量值,因此绘图900A和绘图900B中的颜色代码表示局部细胞密度,较深/较蓝的阴影表示细胞密度较低的区域,并且绿色/较浅的阴影表示细胞密度较高的区域。相比之下,绘图900B示出了相同的细胞术数据,但这次是根据本主题方法被缩放的细胞术数据。与绘图900A相比,目视检查根据本主题方法被缩放的数据的绘图900B,很明显,opt-SNE算法所识别出更多明确定义的分组(即,聚簇),其中数据的结构更精细。
图10示出了相同细胞术数据的在图9中看到的同一opt-SNE算法的绘图1000A和1000B,但是细胞根据聚簇身份被着色或涂有阴影,绘图1000A和1000B分别对应于图9中的900A和900B。通过X-shift聚类算法来识别聚簇。与在根据默认(目前最先进的)缩放方法被缩放的数据集中识别了34个聚簇相比,X-shift聚类算法的应用在根据主题方法被缩放的数据集中识别了82个聚簇。因此,根据本主题方法缩放细胞术数据会使X-shift和opt-SNE算法检测到更大量的群体。这些发现表明,本主题缩放方法通过多维分析算法(例如opt-SNE和X-shift)对群体识别的敏感性产生了意想不到的显著提高。也就是说,根据本主题方法缩放数据意外地使相同的聚类算法在相同的细胞术数据(即相同的样本和数据收集技术)中识别出明显更多的聚簇。
在图8、图9和图10的各个图中,所呈现的细胞术数据是在FACSLyric细胞仪上采集的12色PBMC数据集,并按标准操作规程进行溢出补偿。
尽管有所附权利要求,但本公开也由以下条款定义:
1.一种缩放细胞术数据的方法,所述方法包括:
获取样本的细胞术数据,其中,所述细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;
识别感兴趣参数;
指定所述感兴趣参数的正测量区间和负测量区间;以及
通过至少部分地基于对应的指定正区间和负区间转换所述感兴趣参数来缩放所述细胞术数据。
2.根据条款1所述的方法,其中,转换所述感兴趣参数包括重新缩放所述感兴趣参数的指定负测量区间。
3.根据条款2所述的方法,其中,重新缩放所述感兴趣参数的指定负测量区间包括减少所述感兴趣参数的指定负测量区间的标准偏差。
4.根据条款2-3中任一项所述的方法,其中,转换所述感兴趣参数还包括重新缩放所述感兴趣参数的指定正测量区间。
5.根据条款4所述的方法,其中,重新缩放所述指定正测量区间包括将所述正测量区间重新缩放到预定大小。
6.根据条款5所述的方法,其中,所述预定大小为所述负测量区间的大小。
7.根据条款5所述的方法,其中,所述预定大小是与所述多个参数中的第二参数对应的经缩放的正测量区间的大小。
8.根据条款1-7中任一项所述的方法,其中,转换所述感兴趣参数包括根据以下公式自适应地缩放所述感兴趣参数:
其中:
s(x)表示所述感兴趣参数的自适应缩放测量值;
x表示所述感兴趣参数的未缩放测量值;
(n-,n+)是所述感兴趣参数的指定负测量区间;
(n+,p)是所述感兴趣参数的指定正测量区间;
c是压缩系数;
是所述负测量区间的中位数;
SD是所述负测量区间的标准偏差,并且根据来计算,其中IQR是所述负测量区间的四分位间距;
z(x)是根据的z转换;
g(x)是根据的反向双曲正弦函数;并且
是μ=z(n+)且σ=1的标准正态分布的累积分布函数。
9.根据条款8所述的方法,其中,所述压缩系数c的默认值为70。
10.根据前述条款中任一项所述的方法,还包括显示经缩放的细胞术数据。
11.根据条款10所述的方法,其中,显示所述经缩放的细胞术数据包括显示包含转换后的感兴趣参数的细胞术数据的绘图。
12.根据前述条款中任一项所述的方法,其中,指定所述感兴趣参数的正测量区间和负测量区间中的至少一个包括执行一维门控以指定所述区间。
13.根据条款1至11中任一项所述的方法,其中,指定所述感兴趣参数的正测量区间和负测量区间中的至少一个包括应用荧光减一控制以指定所述区间。
14.根据条款1至11中任一项所述的方法,其中,指定所述感兴趣参数的正测量区间和负测量区间中的至少一个包括应用数学模型来指定所述区间。
15.根据条款1至11中任一项所述的方法,其中,指定所述感兴趣参数的正测量区间和负测量区间中的一者或两者包括应用机器学习算法来指定所述区间。
16.根据前述条款中任一项所述的方法,还包括:
识别一个或更多个附加的感兴趣参数;
指定每个附加的感兴趣参数的正测量区间和负测量区间;以及
通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放所述细胞术数据。
17.根据条款16所述的方法,其中,每个感兴趣参数的指定正测量区间被重新缩放到相同的预定大小。
18.根据前述条款中任一项所述的方法,还包括通过将聚类算法应用于经缩放的细胞术数据来对所述细胞术数据进行聚类。
19.根据条款18所述的方法,还包括通过显示所述经缩放的细胞术数据的聚簇来显示所述经缩放的细胞术数据。
20.根据前述条款中任一项所述的方法,其中,经缩放的细胞术数据用于改进应用于所述细胞术数据的聚类算法的性能。
21.根据前述条款中任一项所述的方法,其中,经缩放的细胞术数据用于降低测量噪声的影响。
22.根据前述条款中任一项所述的方法,其中,所述颗粒是细胞。
23.根据条款22所述的方法,其中,经缩放的细胞术数据用于区分两个相似的细胞群体。
24.根据前述条款中任一项所述的方法,其中,所述细胞术数据为高维数据。
25.根据前述条款中任一项所述的方法,其中,多个测量参数为2至大约300,000个测量参数。
26.根据前述条款中任一项所述的方法,其中,所述细胞术数据包括样本中被照射颗粒的光测量值。
27.根据条款26所述的方法,其中,所述光测量值是光强度的测量值。
28.根据条款26至27中任一项所述的方法,其中,所述细胞术数据包括以下中的一个或更多个的测量值:
由所述颗粒主要沿前向方向散射的激发光;
由上述颗粒主要沿侧向方向散射的激发光;以及
从用于标记所述颗粒的荧光分子或荧光染料在一个或更多个频率范围内发射的光。
29.根据前述条款中任一项所述的方法,其中,获取样本的细胞术数据包括根据以流式细胞术分析样本来获取测量值。
30.一种分析经缩放的细胞术数据的方法,所述方法包括:
获取样本的细胞术数据,其中,所述细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;
识别感兴趣参数;
通过针对分别对应于一个或更多个颗粒的感兴趣参数的一个或更多个测量值进行以下操作来缩放所述细胞术数据:
计算测量值表现出特定特征的概率,以及
基于测量值表现出特定特征的概率对所述测量值进行不同地转换;以及
利用至少第一数据分析算法分析经缩放的细胞术数据。
31.根据条款30所述的方法,其中,针对一个或更多个颗粒基于测量值表现出特定特征的概率来指定正测量区间。
32.根据条款31所述的方法,还包括:基于与所述多个参数中的第二参数对应的经缩放的正测量区间的大小来重新缩放所述感兴趣参数的正测量区间。
33.根据条款31-32中任一项所述的方法,还包括指定负测量区间。
34.根据条款33所述的方法,其中,基于测量值是否落在所述负测量区间内来确定所述测量值不表现出特定特征的概率。
35.根据条款33-33中任一项所述的方法,其中对所述测量值进行转换包括根据以下公式自适应地缩放所述测量值:
/>
其中:
s(x)表示所述感兴趣参数的自适应缩放测量值;
x表示所述感兴趣参数的未缩放测量值;
(n-,n+)是所述感兴趣参数的负测量区间;
(n+,p)是所述感兴趣参数的正测量区间;
c是压缩系数;
是所述负测量区间的中位数;
SD是所述负测量区间的标准偏差,并且根据来计算,其中IQR是所述负测量区间的四分位间距;
z(x)是根据的z转换;
g(z)是根据的反向双曲正弦函数;并且
是μ=Z(n+)且σ=1的标准正态分布的累积分布函数。
36.根据条款29-35中任一项所述的方法,还包括用一种或更多种附加数据分析算法分析一个或更多个转换后的测量值。
37.根据条款30-36中任一项所述的方法,其中,所述第一数据分析算法或所述附加分析算法中的一种或更多种包括聚类算法或降维算法。
38.一种用于缩放细胞术数据的系统,所述系统包括:
被配置为获取细胞术数据的装置,所述细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;
处理器,其包括可操作地耦合到所述处理器的存储器,其中,所述存储器包括存储在其上的指令,所述指令在被所述处理器执行时,使所述处理器:
识别感兴趣参数;
指定所述感兴趣参数的正测量区间和负测量区间;以及
通过至少部分地基于对应的指定正区间和负区间转换所述感兴趣参数来缩放所述细胞术数据。
39.根据条款38所述的系统,其中,所述处理器被配置成接收识别所述感兴趣参数的输入。
40.根据条款38至39中任一项所述的系统,其中,所述处理器被配置成接收所述感兴趣参数的正测量区间和负测量区间中的至少一个作为输入。
41.根据条款38至40中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器通过重新缩放所述感兴趣参数的指定负测量区间来转换所述感兴趣参数。
42.根据条款41所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器通过减少所述感兴趣参数的指定负测量区间的标准偏差来重新缩放所述感兴趣参数的指定负测量区间。
43.根据条款41至42中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器通过重新缩放所述感兴趣参数的指定正测量区间来进一步转换所述感兴趣参数。
44.根据条款43所述的系统,其中,重新缩放指定正测量区间包括将所述正测量区间重新缩放到预定大小。
45.根据条款所述44的系统,其中,所述预定大小是所述多个参数中的第二参数对应的经缩放的正测量区间的大小。46.根据条款38至45中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器通过根据以下公式自适应地缩放所述感兴趣参数来转换所述感兴趣参数:
其中:
s(x)表示上述感兴趣参数的自适应缩放测量值;
x表示所述感兴趣参数的未缩放测量值;
(n-,n+)是所述参数的指定负测量区间;
(n+,p)是所述参数的指定正测量区间;
c是压缩系数;
是所述负测量区间的中位数;
SD是所述负测量区间的标准偏差,并且根据来计算,其中IQR是所述负测量区间的四分位间距;
z(x)是根据的z转换;
g(x)是根据的反向双曲正弦函数;并且
是μ=z(n+)且σ=1的标准正态分布的累积分布函数。
47.根据条款46所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器使用压缩系数C的默认值70。
48.根据条款38至47中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器使经缩放的细胞术数据显示在显示设备上。
49.根据条款48所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器通过使包含转换后的感兴趣参数的细胞术数据的绘图进行显示来使经缩放的细胞术数据显示在显示设备上。
50.根据条款38至49中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器使用一维门控来指定所述感兴趣参数的正测量区间和负测量区间中的至少一个。
51.根据条款50所述的系统,其中,所述处理器被配置成接收一维门作为输入,所述一维门指定所述感兴趣参数的正测量区间和负测量区间。
52.根据条款38至50中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器应用荧光减一控制来指定所述感兴趣参数的正测量区间和负测量区间中的至少一个。
53.根据条款38至50中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器应用数学模型来指定所述感兴趣参数的正测量区间和负测量区间中的至少一个。
54.根据条款38至50中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器应用机器学习算法来指定所述感兴趣参数的正测量区间和负测量区间中的一个或者两个。
55.根据条款38至54中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器:
识别一个或更多个附加的感兴趣参数;
指定每个附加的感兴趣参数的正测量区间和负测量区间;以及
通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放所述细胞术数据。
56.根据条款55所述的系统,其中,每个感兴趣参数的指定正测量区间被重新缩放到相同的预定大小。
57.根据条款38至56中任一项所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器通过将聚类算法应用于经缩放的细胞术数据来对所述细胞术数据进行聚类。
58.根据条款57所述的系统,其中,所述存储器包括存储在其上的其他指令,所述其他指令在由所述处理器执行时,使所述处理器使经缩放的细胞术数据的聚簇进行显示。
59.根据条款38至58中任一项所述的系统,其中,所述系统被配置成对所述细胞术数据进行缩放,使得应用于所述细胞术数据的聚类算法的性能得到改进。
60.根据条款38至59中任一项所述的系统,其中,所述系统被配置成对所述细胞术数据进行缩放,使得测量噪声的影响降低。
61.根据条款38至60中任一项所述的系统,其中,所述颗粒是细胞。
62.根据条款61所述的系统,其中,所述系统被配置为基于经缩放的细胞术数据来区分两个相似的细胞群体。
63.根据条款38至62中任一项所述的系统,其中,所述细胞术数据为高维数据。
64.根据条款38至63中任一项所述的系统,其中,多个测量参数为2至大约300,000个测量参数。
65.根据条款38至64中任一项所述的系统,其中,所述细胞术数据包括样本中被照射颗粒的光测量值。
66.根据条款65所述的系统,其中,所述光测量值是光强度的测量值。
67.根据条款65至66中任一项所述的系统,其中,所述细胞术数据包括以下中的一个或更多个的测量值:
由所述颗粒主要沿前向方向散射的激发光;
由所述颗粒主要沿侧向方向散射的激发光;以及
从用于标记所述颗粒的荧光分子或荧光染料在一个或更多个频率范围内发射的光。
68.根据条款38至67中任一项所述的系统,其中,样本的所述细胞术数据包括从被配置为分析样本的流式细胞仪获取的测量值。
69.一种非暂时性计算机可读存储介质,其包括存储在其上的用于缩放细胞术数据的指令,所述指令包括:
用于获取细胞术数据的算法,所述细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;
用于识别感兴趣参数的算法;
用于指定所述感兴趣参数的正测量区间和负测量区间的算法;以及
用于通过至少部分地基于对应的指定正区间和负区间转换所述感兴趣参数来缩放所述细胞术数据的算法。
70.根据条款69所述的非暂时性计算机可读存储介质,其中,用于获取细胞术数据的算法包括接收识别所述感兴趣参数的输入。
71.根据条款69至70中任一项所述的非暂时性计算机可读存储介质,其中,用于指定所述感兴趣参数的正测量区间和负测量区间的算法包括接收所述感兴趣参数的正测量区间和负测量区间中的至少一个作为输入。
72.根据条款69至71中任一项所述的非暂时性计算机可读存储介质,其中,用于通过转换所述感兴趣参数来缩放所述细胞术数据的算法包括重新缩放所述感兴趣参数的指定负测量区间。
73.根据条款72所述的非暂时性计算机可读存储介质,其中,重新缩放所述感兴趣参数的指定负测量区间包括减少所述感兴趣参数的指定负测量区间的标准偏差。
74.根据条款72至73中任一项所述的非暂时性计算机可读存储介质,其中,用于通过转换所述感兴趣参数来缩放所述细胞术数据的算法包括重新缩放所述感兴趣参数的指定正测量区间。
75.根据条款74中的任一项所述的非暂时性计算机可读存储介质,其中,重新缩放指定正测量区间包括将所述正测量区间重新缩放到预定大小。
76.根据条款75所述的非暂时性计算机可读存储介质,其中,所述预定大小是与所述多个参数中的第二参数对应的经缩放的正测量区间的大小。
77.根据条款69至76中任一项所述的非暂时性计算机可读存储介质,其中,用于通过转换所述感兴趣参数来缩放所述细胞术数据的算法包括根据以下公式自适应地缩放所述感兴趣参数:
其中:
s(x)表示所述感兴趣参数的自适应缩放测量值;
x表示所述感兴趣参数的未缩放测量值;
(n-,n+)是所述参数的指定负测量区间;
(n+,p)是所述参数的指定正测量区间;
c是压缩系数;
是所述负测量区间的中位数;
SD是所述负测量区间的标准偏差,并且根据来计算,其中IQR是所述负测量区间的四分位间距;
g(z)是根据的z转换;
g(z)是根据的反向双曲正弦函数;并且
是μ=z(n+)且σ=1的标准正态分布的累积分布函数。
78.根据条款77所述的非暂时性计算机可读存储介质,其中所述压缩系数c的默认值为70。
79.根据条款69至78中任一项所述的非暂时性计算机可读存储介质,还包括用于使经缩放的细胞术数据显示在显示设备上的算法。
80.根据条款79所述的非暂时性计算机可读存储介质,其中,用于使经缩放的细胞术数据显示在显示设备上的算法包括使包含转换后的感兴趣参数的细胞术数据的绘图被显示。
81.根据条款69至80中任一项所述的非暂时性计算机可读存储介质,其中,用于指定所述感兴趣参数的正测量区间和负测量区间的算法包括使用一维门控来指定所述感兴趣参数的正测量区间和负测量区间中的至少一个。
82.根据条款81所述的非暂时性计算机可读存储介质,其中,用于指定所述感兴趣参数的正测量区间和负测量区间的算法包括接收一维门作为输入,所述一维门指定所述感兴趣参数的正测量区间和负测量区间。
83.根据条款69至80中任一项所述的非暂时性计算机可读存储介质,其中,用于指定所述感兴趣参数的正测量区间和负测量区间的算法包括应用荧光减一控制以指定所述感兴趣参数的正测量区间和负测量区间中的至少一个。
84.根据条款69至80中任一项所述的非暂时性计算机可读存储介质,其中,用于指定所述感兴趣参数的正测量区间和负测量区间的算法包括应用数学模型以指定所述感兴趣参数的正测量区间和负测量区间中的至少一个。
85.根据条款69至80中任一项所述的非暂时性计算机可读存储介质,其中,用于指定所述感兴趣参数的正测量区间和负测量区间的算法包括应用机器学习算法以指定所述感兴趣参数的正测量区间和负测量区间中的一者或两者。
86.根据条款69至85中任一项所述的非暂时性计算机可读存储介质,其中,所述指令还包括:
用于识别一个或更多个附加的感兴趣参数的算法;
用于指定每个附加的感兴趣参数的正测量区间和负测量区间的算法;以及
通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放所述细胞术数据的算法。
87.根据条款86所述的非暂时性计算机可读存储介质,其中,每个感兴趣参数的指定正测量区间被重新缩放到相同的预定大小。
88.根据条款69至87中任一项所述的非暂时性计算机可读存储介质,其中,所述指令还包括通过将聚类算法应用于经缩放的细胞术数据来对所述细胞术数据进行聚类的算法。
89.根据条款88所述的非暂时性计算机可读存储介质,其中,用于使经缩放的细胞术数据显示在显示设备上的算法包括使经缩放的细胞术数据的聚簇进行显示。
90.根据条款69至89中任一项所述的非暂时性计算机可读存储介质,其中,所述细胞术数据为高维数据。
91.根据条款69至90中任一项所述的非暂时性计算机可读存储介质,其中,多个测量参数为2至大约300,000个测量参数。
92.根据条款69至91中任一项所述的非暂时性计算机可读存储介质,其中,所述细胞术数据包括样本中被照射颗粒的光测量值。
93.根据条款92所述的非暂时性计算机可读存储介质,其中所述光测量值是光强度的测量值。
94.根据条款92至93中任一项所述的非暂时性计算机可读存储介质,其中,所述细胞术数据包括以下中的一个或更多个的测量值:
由所述颗粒主要沿前向方向散射的激发光;
由所述颗粒主要沿侧向方向散射的激发光;以及
从用于标记所述颗粒的荧光分子或荧光染料在一个或更多个频率范围内发射的光。
95.根据条款69至94中任一项所述的非暂时性计算机可读存储介质,其中,样本的所述细胞术数据包括从被配置为分析样本的流式细胞仪获取的测量值。
尽管为了便于理解,已经通过说明和示例对前述发明进行了部分详细描述,但对于本领域的普通技术人员来说明显的是,在不偏离所附权利要求的精神或范围的情况下,可以根据本发明的教导很容易地对其做出某些变更和修改。
因此,上述内容仅用来说明本发明的原理。应当理解,尽管本文没有明确描述或示出,但本领域技术人员能够设计出各种布置,这些布置体现出了本发明的原则且被包括在本发明的精神和范围内。此外,本文引用的所有示例和条件语言主要旨在帮助读者理解本发明的原则以及发明人为促进技术发展而贡献的概念,并且应被解释为并不限于这样的所具体引用的示例和状况。此外,本文所列举的本发明的原则、方面和实施例的所有陈述以及它们的具体实例,旨在涵盖其结构和功能等同物。此外,这些等同物意在既包括目前已知的等同物,也包括将来开发的等同物,即开发的任何执行相同功能的元素,而不管其结构如何。此外,本文所披露的任何内容均无意专门向公众开放,无论是否在权利要求中明确引用此类公开。
因此,本发明的范围不限于本文所示和所描述的示例性实施例。相反,本发明的范围和精神体现在所附的权利要求中。在权利要求书中,35U.S.C.§112(f)或35U.S.C.§112(6)被明确定义为仅当权利要求书的此类限制的开头记载了确切短语“用于……的装置”或确切短语“用于……的步骤”时,权利要求中的限制才调用35U.S.C.§112(f)或35U.S.C.§112(6);如果在权利要求中的限制中没有使用该确切短语,则不调用35U.S.C.§112(f)或35U.S.C.§112(6)。

Claims (15)

1.一种缩放细胞术数据的方法,所述方法包括:
获取样本的细胞术数据,其中所述细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;
识别感兴趣参数;
指定所述感兴趣参数的正测量区间和负测量区间;以及
通过至少部分地基于对应的指定正区间和负区间转换所述感兴趣参数来缩放所述细胞术数据。
2.根据权利要求1所述的方法,其中,转换所述感兴趣参数包括重新缩放所述感兴趣参数的指定负测量区间。
3.根据权利要求2所述的方法,其中,重新缩放所述感兴趣参数的指定负测量区间包括减少所述感兴趣参数的指定负测量区间的标准偏差。
4.根据权利要求2-3中任一项所述的方法,其中,转换所述感兴趣参数还包括重新缩放所述感兴趣参数的指定正测量区间。
5.根据权利要求4所述的方法,其中,重新缩放所述指定正测量区间包括将所述正测量区间重新缩放到预定大小。
6.根据权利要求5所述的方法,其中,所述预定大小为所述负测量区间的大小。
7.根据权利要求5所述的方法,其中,所述预定大小是与所述多个参数中的第二参数对应的经缩放的正测量区间的大小。
8.根据权利要求1-7中任一项所述的方法,其中,转换所述感兴趣参数包括根据以下公式自适应地缩放所述感兴趣参数:
其中:
s(x)表示所述感兴趣参数的自适应缩放测量值;
x表示所述感兴趣参数的未缩放测量值;
(n-,n+)是所述感兴趣参数的指定负测量区间;
(n+,p)是所述感兴趣参数的指定正测量区间;
C是压缩系数;
是所述负测量区间的中位数;
SD是所述负测量区间的标准偏差,并且根据来计算,其中IQR是所述负测量区间的四分位间距;
z(x)是根据的z转换;
g(z)是根抚的反向双曲正弦函数;并且
是μ=z(n+)且σ=1的标准正态分布的累积分布函数。
9.根据前述权利要求中任一项所述的方法,还包括显示经缩放的细胞术数据。
10.根据前述权利要求中任一项所述的方法,其中,指定所述感兴趣参数的正测量区间和负测量区间中的至少一个包括执行一维门控以指定所述区间。
11.根据前述权利要求中任一项所述的方法,还包括将聚类算法应用于经缩放的细胞术数据来对所述细胞术数据进行聚类。
12.根据前述权利要求中任一项所述的方法,其中,所述细胞术数据为高维数据。
13.根据前述权利要求中任一项所述的方法,其中,获取样本的细胞术数据包括根据以流式细胞术分析样本来获取测量值。
14.一种用于缩放细胞术数据的系统,所述系统包括:
被配置为获取细胞术数据的装置,所述细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;
处理器,其包括可操作地耦合到所述处理器的存储器,其中,所述存储器包括存储在其上的指令,所述指令在被所述处理器执行时,使所述处理器:
识别感兴趣参数;
确定所述感兴趣参数的正测量区间和负测量区间;以及
通过至少部分地基于对应的指定正区间和负区间转换所述感兴趣参数来缩放所述细胞术数据。
15.一种非暂时性计算机可读存储介质,其包括存储在其上的用于缩放细胞术数据的指令,所述指令包括:
用于获取细胞术数据的算法,所述细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;
用于识别感兴趣参数的算法;
用于指定所述感兴趣参数的正测量区间和负测量区间的算法;以及
用于通过至少部分地基于对应的指定正区间和负区间转换所述感兴趣参数来缩放所述细胞术数据的算法。
CN202180087923.3A 2020-11-19 2021-09-09 用于机器学习分析的细胞术数据的最佳缩放方法及其系统 Pending CN116724222A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063115994P 2020-11-19 2020-11-19
US63/115,994 2020-11-19
PCT/US2021/049620 WO2022108645A1 (en) 2020-11-19 2021-09-09 Method for optimal scaling of cytometry data for machine learning analysis and systems for same

Publications (1)

Publication Number Publication Date
CN116724222A true CN116724222A (zh) 2023-09-08

Family

ID=81587565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180087923.3A Pending CN116724222A (zh) 2020-11-19 2021-09-09 用于机器学习分析的细胞术数据的最佳缩放方法及其系统

Country Status (5)

Country Link
US (1) US20220155209A1 (zh)
EP (1) EP4247255A4 (zh)
JP (1) JP2023550130A (zh)
CN (1) CN116724222A (zh)
WO (1) WO2022108645A1 (zh)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7491502B2 (en) * 2004-12-17 2009-02-17 The General Hospital Corporation In vivo flow cytometry system and method
GB2428471A (en) * 2005-07-18 2007-01-31 Mathshop Ltd Flow cytometry
US7299135B2 (en) * 2005-11-10 2007-11-20 Idexx Laboratories, Inc. Methods for identifying discrete populations (e.g., clusters) of data within a flow cytometer multi-dimensional data set
EP2045595B1 (en) * 2007-10-03 2022-03-23 Sysmex Corporation Cell analyser and cell analysing method
EP2252889B1 (en) * 2008-02-08 2020-10-07 Health Discovery Corporation Method and system for analysis of flow cytometry data using support vector machines
US20100070502A1 (en) * 2008-09-16 2010-03-18 Beckman Coulter, Inc. Collision Free Hash Table for Classifying Data
WO2011100334A1 (en) * 2010-02-09 2011-08-18 Sri International Chemical synthesis using up-converting phosphor technology and high speed flow cytometry
AU2014228537A1 (en) * 2013-03-15 2015-08-20 Beckman Coulter, Inc. Systems and methods for panel design in flow cytometry
US11164082B2 (en) * 2017-02-28 2021-11-02 Anixa Diagnostics Corporation Methods for using artificial neural network analysis on flow cytometry data for cancer diagnosis
CA3091799A1 (en) * 2018-02-27 2019-09-06 The Board Of Trustees Of The Leland Stanford Junior University Engineered immune cells as diagnostic probes of disease
WO2021260159A1 (en) * 2020-06-24 2021-12-30 Université de Lausanne Means and methods for classifying microbes
JP2023541718A (ja) * 2020-09-01 2023-10-03 オンコデア・コーポレーション 病気の早期検出および監視のための予測診断検査

Also Published As

Publication number Publication date
EP4247255A4 (en) 2024-05-22
EP4247255A1 (en) 2023-09-27
WO2022108645A1 (en) 2022-05-27
JP2023550130A (ja) 2023-11-30
US20220155209A1 (en) 2022-05-19

Similar Documents

Publication Publication Date Title
CN113544490B (zh) 用于颗粒辨别的参数
JP2021522491A (ja) 粒子分析器のための特性評価および選別
US20210239592A1 (en) Methods and systems for classifying fluorescent flow cytometer data
WO2021225792A1 (en) Methods and systems for characterizing spillover spreading in flow cytometer data
US20210278333A1 (en) Methods and systems for adjusting a training gate to accommodate flow cytometer data
CN217212159U (zh) 粒子分析仪、用于照射流中粒子的系统及套件
US11662295B2 (en) Deep learning method in aiding patient diagnosis and aberrant cell population identification in flow cytometry
CN116724222A (zh) 用于机器学习分析的细胞术数据的最佳缩放方法及其系统
US11493427B2 (en) Systems for cell sorting based on frequency-encoded images and methods of use thereof
US11662297B2 (en) Method for index sorting unique phenotypes and systems for same
US11927522B2 (en) Methods for identifying saturated data signals in cell sorting and systems for same
US20240125689A1 (en) Methods for classifying particles using images based on filtered layers and machine learning models and systems for same
CN117242329A (zh) 对流式细胞仪数据进行分类的方法和系统
CN116569208A (zh) 用于处理和显示多通道光谱直方图的方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination