CN116888278A - 分析癌症基质中免疫浸润以预测临床转归的方法和组合物 - Google Patents

分析癌症基质中免疫浸润以预测临床转归的方法和组合物 Download PDF

Info

Publication number
CN116888278A
CN116888278A CN202180090994.9A CN202180090994A CN116888278A CN 116888278 A CN116888278 A CN 116888278A CN 202180090994 A CN202180090994 A CN 202180090994A CN 116888278 A CN116888278 A CN 116888278A
Authority
CN
China
Prior art keywords
analyte
biological sample
cells
region
cancerous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180090994.9A
Other languages
English (en)
Inventor
F·鲍姆加特纳
V·江加拉
S·泰勒
尹沂峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
10X Genomics Ltd
Original Assignee
10X Genomics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 10X Genomics Ltd filed Critical 10X Genomics Ltd
Priority claimed from PCT/US2021/059959 external-priority patent/WO2022109181A1/en
Publication of CN116888278A publication Critical patent/CN116888278A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文提供了用于使用机器学习模块分析从对象获得的生物样品的癌症基质区域中的免疫细胞浸润的方法。例如,所述方法可以包括(a)识别生物样品中的癌性区域或与癌性区域相关的分析物;(b)识别生物样品中的基质区域或与所述基质区域相关的分析物;(c)识别生物样品中的一个或多个位置的一个或多个免疫细胞或与免疫细胞相关的分析物;和(d)使用(i)识别的生物样品中的癌性和基质区域或其相关分析物,以及(ii)识别的一个或多个免疫细胞或其相关的分析物来分析从对象获得的生物样品的癌症基质区域中的免疫细胞浸润。

Description

分析癌症基质中免疫浸润以预测临床转归的方法和组合物
相关申请的交叉引用
本申请要求2020年11月18日提交的美国临时申请序列号63/115,502、2021年1月28日提交的美国临时申请序列号63/142,772和2021年9月10日提交的美国临时申请号63/242,721的权益,其全部内容通过引用并入本文。
发明背景
对象组织内的细胞由于不同细胞内不同的分析物水平(例如基因和/或蛋白质表达)而在细胞形态和/或功能上存在差异。细胞在组织内的特定位置(例如,细胞相对于相邻细胞的位置或细胞相对于组织微环境的位置)可以影响例如细胞的形态、分化、命运、活力、增殖、行为以及与组织中其他细胞的信号传导和串扰。
先前已经使用仅在完整组织或组织的部分的背景下提供少数分析物的数据,或提供单细胞的大量分析物数据,但未能提供关于单细胞在本体/亲本(parent)生物样品(例如,组织样品)中的位置的信息的技术来研究空间异质性。
理解细胞和遗传异质性的区域可能有助于开发在其他方面看起来相似的患者的个体治疗方法。同时,识别免疫浸润也很重要,免疫浸润在肿瘤的某些区域不准确地表达。肿瘤可以是异质性的(细胞或遗传),肿瘤样品中的不同区域表现出不同的基因表达。
癌症组织中的肿瘤浸润性免疫细胞(例如,肿瘤浸润性淋巴细胞(“TIL”))已被证明是多种癌症免疫-检查点治疗反应的标志物,并与患者的复发状态相关(参见,例如,Fares等,American Society ofClinical OncologyEducational Book,39,147-164(2019))。病理学家已经使用标准化的视觉方法来量化TIL用于治疗预测。然而,即使进行了标准化工作,TIL估计法的成功视觉识别和生物样品中其他免疫细胞的检测仍然是一个挑战。此外,缺乏准确性限制了评估更复杂特性(如免疫细胞分布模式)的能力。因此,仍然需要开发识别和表征生物样品中肿瘤浸润免疫细胞的方法。
发明概述
在一个方面,本发明具有分析生物样品(例如,从对象获得的样品)的癌症基质区域中免疫细胞浸润的方法,包括:(a)识别生物样品中的癌性区域或与癌性区域相关的分析物;(b)识别所述生物样品中的基质区域或与所述基质区域相关的分析物;(c)在所述生物样品中的一个或多个位置中识别一种或多种免疫细胞或与免疫细胞相关的分析物;和(d)使用(i)生物样品中已识别的癌症和基质区域或与其相关的分析物,以及(ii)已识别的一个或多个免疫细胞或与其相关的分析物来分析生物样品(例如,从对象获得的样品)的癌症基质区域中的免疫细胞浸润。
在一些实施方式中,识别癌性区域、识别基质区域和/或识别免疫细胞包括:(a)从生物样品生成数据集,其中该数据集包括以下中的一个或多个:(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;以及(b)使用所述数据集来识别所述生物样品中的所述癌性区域、所述基质区域和/或所述免疫细胞。
在一些实施方式中,(b)包括将数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块至少部分地经以下训练数据训练:包括来自一个或多个参考样品的参考分析物数据集的训练数据,其中一个或多个参考样品包括(1)一个或多个参考癌性区域,(2)一个或多个参考基质区域,和(3)一种或多种参考免疫细胞。
在一些实施方式中,免疫细胞的丰度通过经过训练的机器学习模块来确定。
在一些实施方式中,癌性区域包括良性肿瘤、转移前肿瘤、恶性肿瘤和一个或多个炎性细胞中的一种或多种。
在一些实施方式中,基质区域包括结缔组织、血管和炎性细胞中的一种或多种。
在一些实施方式中,该方法还包括使生物样品透化。
在一些实施方式中,与癌性区域相关联的分析物、与基质区域相关的分析物和/或与免疫细胞相关联的分析物是核酸。在一些实施方式中,核酸是RNA。在一些实施方式中,RNA是mRNA。
在一些实施方式中,通过以下步骤来检测与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物,所述步骤包括:使生物样品与包括多个捕获探针的基质接触,其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,确定步骤包括测序。
在一些实施方式中,与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物是蛋白质。在一些实施方式中,通过以下步骤来检测与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物,所述步骤包括:用多种分析物捕获剂附着生物样品,其中所述多种分析物捕获试剂中的分析物捕获剂包括:(i)特异性结合与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的分析物结合部分;(ii)分析物结合部分条形码;和(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)捕获域和(ii)空间条形码;将与所述癌性区域相关的分析物、与所述基质区域相关的所述分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,确定步骤包括:测序(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,以及(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,分析物结合部分是抗体或其抗原结合片段、细胞表面受体结合分子、受体配体、小分子、T细胞受体衔接体、B细胞受体衔接体、前体、适体、单体、亲和体(affimer)或DARPin。
在一些实施方式中,使用原位测序检测与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物。
在一些实施方式中,使用抗体来检测与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物。
在一些实施方式中,该方法还包括使生物样品与一种或多种染色剂接触。在一些实施方式中,一种或多种染色剂包括苏木精和伊红。在一些实施方式中,一种或多种染色剂包括一种或更多种光学标记。在一些实施方式中,所述一个或多个光学标记选自:荧光标记、放射性标记、化学发光标记、量热标记或比色标记。
在一些实施方式中,该方法还包括使用生物样品的一个或多个染色剂来识别生物样品中的一个或者多个癌性区域。在一些实施方式中,该染色剂对癌症标志物是特异性的。在某些情况下,癌症标志物是广谱细胞角蛋白(Pan-CK或Pan-CK)。
在一些实施方式中,该方法还包括使用生物样品的一种或多种染色识别一个或多个癌性区域内的一个或多种基质区域。在一些实施方式中,所述染色剂对基质标记物是特异性的。在某些情况下,癌症标志物是CD45。在一些实施方式中,使用包括获得生物样品的图像的方法来生成图像数据。在一些实施方式中,该方法还包括将图像数据登记到空间位置。在一些实施方式中,该方法还包括基于图像数据识别(1)一个或多个癌性区域和/或(2)一个或多个基质区域。在一些实施方式中,该方法还包括基于图像数据识别一个或多个免疫细胞。
在一些实施方式中,该方法还包括通过经过训练的机器学习模块识别一个或多个癌性区域。在一些实施方式中,该方法还包括通过经过训练的机器学习模块识别一个或多个基质区域。在一些实施方式中,该方法还包括通过经过训练的机器学习模块识别一个或多个免疫细胞。
在一些实施方式中,对生物样品的癌症基质区域中的免疫细胞浸润的分析包括确定生物样品中癌症基质区域中免疫细胞的丰度。
在一些实施方式中,识别一个或多个癌症区域包括:(i)获取图像并将图像数据登记到空间位置,(ii)使用所确定序列的空间位置,或(iii)获取图像并且将图像数据登记到空间位置并使用所确定序列的空间位置;识别所述一个或多个基质区域包括:(i)获得图像并将所述图像数据登记到空间位置,(ii)使用所确定的序列的空间位置,或(iii)获得图像且将所述图象数据登记到空间位置,并使用所确定序列的空间位置;以及识别生物样品中一个或多个位置中的一个或更多个免疫细胞或其相关分析物包括:(i)获得图像并将图像数据登记到空间位置,(ii)使用所确定序列的空间位置,或(iii)获得图像且将图像数据登记到空间位置,以及使用所确定的序列的空间位置。
在一些实施方式中,癌症基质区域中免疫细胞的丰度被确定为癌症基质区域中属于免疫细胞的细胞的百分比或被免疫细胞占据的癌症基质区域的百分比。
在一些实施方式中,使用一个或多个癌性区域、一个或多个基质区域和一个或多个免疫细胞的所确定序列的空间位置来确定癌症基质区域中免疫细胞的丰度。
在一些实施方式中,使用所确定的序列的空间位置包括使用原位测序来确定序列。在一些实施方式中,使用划分和(i)获取图像并将图像数据登记到空间位置,(ii)使用所确定序列的空间位置,或(iii)获取图像并且将图像数据登记到空间位置来确定癌症基质区域中的免疫细胞的丰度,并使用所确定的序列的空间位置。
在一些实施方式中,所述确定包括:(a)与经每空间位置细胞数量归一化的已知管家相比,鉴定与免疫浸润细胞相关的基因的量;(b)鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润性B细胞(TIB)的比率;和/或(c)基于包括与免疫浸润细胞相关的分析物的空间位置的百分比来计算生物样品中肿瘤浸润免疫细胞的丰度。
在一些实施方式中,一个或多个免疫细胞的识别包括从图像数据中划分(segment)免疫细胞。
在一些实施方式中,进一步包括基于免疫浸润确定癌症预后。
在一些实施方式中,进一步包括基于免疫浸润评分对对象的癌症严重程度进行评分或确定。
在一些实施方式中,所述确定包括鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润B细胞(TIB)或者一种或多种肿瘤浸润型T细胞与一种或多种肿瘤浸润B细胞(TIB)的比率。
在一些实施方式中,进一步包括给与治疗性处理(例如,至对象),其中治疗性处理包括手术、化疗剂、生长抑制剂、细胞毒性剂、放射治疗用剂、抗血管生成剂、癌症免疫治疗剂、凋亡剂、抗微管蛋白剂或其组合。
在一些实施方式中,生物样品从活组织检查物(例如,来自对象)获得。在一些实施方式中,生物样品是从外科切除物(例如,来自对象)获得的。在一些实施方式中,在内窥镜检查或结肠镜检查期间(例如,从对象)收集生物样品。在一些实施方式中,生物样品是组织切片。在一些实施方式中,生物样品是载玻片上的组织切片。在一些实施方式中,生物样品是福尔马林固定的石蜡包埋(FFPE)样品、冷冻样品或新鲜样品。在一些实施方式中,生物样品是FFPE样品。
在一些实施方式中,免疫细胞选自B细胞、T细胞、NK细胞、单核细胞、巨噬细胞、中性粒细胞、粒细胞、先天淋巴细胞或树突状细胞,或其组合。
在一些实施方式中,与癌性区域相关的分析物选自来自AKT途径的分析物、来自JAK-STAT途径的分析物和来自Notch途径的分析物,或其组合。
在一些实施方式中,与癌性区域相关的分析物选自SCGB2A1、MKI67、BRCA1、BRCA2、PIKCD、CALML6、MYC、TP53、PALB2、RAD51和MSH2,或其组合。在一些情况下,与癌性区域相关的分析物选自SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和CALML6,或其组合。在一些情况下,与癌性区域相关的分析物选自PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42和WT1,或其组合。在一些情况下,与癌性区域相关的分析物选自VTCN1、MECOM、TOP2A、XPO1、FUT8、SOX17、PBX1、EIF42和WT1,或其组合。在某些情况下,与癌性区域相关的分析物是TOP2A。在一些情况下,与癌性区域相关的分析物是XPO1。本段中公开的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
在一些实施方式中,与基质区域相关的分析物选自VIM、EPCAM、FAP和CDH1。在一些实施方式中,与基质区域相关的分析物选自FAP、VCAN、ACTA2和PDGFRB。在一些实施方式中,与免疫细胞相关的分析物选自BLK、CD19、FCRL2、MS4A1、KIAA0125、TNFRSF17、TCL1A、SPIB、PNOC、PTRPC、PRF1、GZMA、GZMB、NKG7、GZMH、KLRK1、KLRB 1、KLRD1、CTSW、GNLY、CCL13、CD209、HSD11B1、LAG3、CD244、EOMES、PTGER4、CD68、CD84、CD163、MS4A4A、TPSB2、TPSAB1、CPA3、MS4A2、HDC、FPR1、SIGLEC5、CSF3R、FCAR、FCGR3B、CEACAM3、S100A12、KIR2DL3、KIR3DL1、,KIR3DL2、IL21R、XCL1、XCL2、NCR1、CD6、CD3D、CD3E、SH2D1A、TRAT1、CD3G、TBX21、FOXP3、CD8A、CD8B、CD79A、CD79B、CD4、IGHA1、igg2、JCHAIN、IGKC、CD27、CD38、CD16、IL17RB、FANK1、CTLA4、MSR1、MRC1、NKG7、FCN1、TIGIT/LAG3。本段中描述的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
在一些实施方式中,所述一种或多种免疫细胞选自:(i)CD3+和CD4+T细胞;(ii)CD3+和CD8+T细胞;(iii)调节性T细胞,包括CD4、Foxp3、IL17RB、CTLA4、FANK1、HAVCR1、CD25、CTLA-4、GITR、LAG-3和CD127中的一种或多种;(iv)TH1细胞,其包括CD4、CD3D、S100A4、IL7R和IFNG中的一种或多种;(v)TH2细胞,包括CD4、IL7R、ICOS、CTLA4、TNFRSF4和TNFRS18中的一种或多种;(vi)TH17细胞,其包括CD4、CD3D、IL17A、GZMA和S100A4中的一种或多种;(vii)细胞毒性T细胞,其包括CD8、CD3D、S100A4、IFNG、GZMB、GZMA和IL2RB中的一种或多种;(viii)浆细胞,其包括:一种或多种JCHAIN、MZB1、IGHA1、IGHG1和IGKC;(ix)单核细胞,其包括CD14+CD16-;(x)单核细胞,其包括CD14-CD16+;和(xi)自然杀伤细胞,其包括NKG7。
在一些实施方式中,免疫浸润细胞是肿瘤浸润B细胞(TIB)。在一些实施方式中,TIB选自:(i)浆细胞,其包括MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种;(ii)Ig+B细胞,其包括IGHV3-74、SOCS3、JCHAIN和SPARC中的一种或多种;(iii)活化的B细胞,其包括CD79B、HMGB2、HMGB1、HMGN1和RGS13;(iv)B细胞,其包括MEF2B、RGS13和MS4A1中的一种或多种;和(v)B细胞,其包括CD79A和CD79B。在一些实施方式中,免疫浸润细胞是包括MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种的浆细胞。
在另一个方面,本公开的特征在于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,所述方法包括:(a)根据从对象获得的生物样品生成数据集,其中所述数据集包括:(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物;(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,和(3)来自一个或多个免疫细胞的免疫细胞;以及(c)通过经过训练的机器学习模块确定从对象获得的生物样品中的免疫细胞浸润。
在另一方面,本公开的特征在于确定包括一个或多个癌性区域和一个或多个基质区域的生物样品中的免疫细胞浸润的方法,包括:(a)从获自对象的生物样品生成数据集,其中所述数据集包括:(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物;(ii)图像数据,所述图像数据包括所述生物样品的所述多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,和(3)来自一个或多个免疫细胞的免疫细胞;以及(c)通过经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在一些实施方式中,经过训练的机器学习模块是监督学习模块、半监督学习模块,无监督学习模块,回归分析模块,强化学习模块,自学习模块,特征学习模块,稀疏字典学习模块,异常检测模块,生成对抗性网络,卷积神经网络或关联规则模块中的至少一个。
在一些实施方式中,生成数据集包括:将生物样品(例如来自患有癌症的对象)与包括多个捕获探针的基质接触,其中生物样品包括(1)一个或多个癌性区域,(2)一个或多个基质区域,以及(3)一个或多个肿瘤浸润免疫细胞,并且其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;将来自所述生物样品的分析物附着到所述捕获探针;确定(i)对应于分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全体或部分,或其互补物,并使用(i)和(ii)的所确定的序列来识别生物样品中分析物的空间位置和丰度;以及基于与空间位置处的分析物相对应的所确定序列,将空间位置识别为簇的部分,并使用簇分析癌症患者的癌症基质中的免疫细胞浸润。
在一些实施方式中,使用选自非线性降维、t分布随机邻居嵌入(t-SNE)、全局t分布随机近邻嵌入(g-SNE)和均匀流形近似与投影(UMAP)的方法之一来识别一个或多个免疫细胞簇。
在一些实施方式中,生成数据集包括:用多种分析物捕获剂附着生物样品,其中所述多种分析物捕获剂中的分析物捕获剂包括:(i)特异性结合与癌性区域相关的分析物的分析物结合部分,和/或与免疫细胞相关的分析物;(ii)分析物结合部分条形码;和(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;使所述生物样品与基质接触,其中所述基质包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)所述捕获域和(ii)空间条形码;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,使用原位测序来生成分析物数据。
在另一个方面,本公开的特征在于试剂盒,其包括:(a)组织学染色剂;(b)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;以及(c)用于执行本文所述的任何方法的说明书。
在另一个方面,本公开的特征在于试剂盒,其包括:(a)特异性结合浸润免疫细胞上的抗原的抗体;(b)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;以及(f)用于执行本文所述的任何方法的说明书。
在另一个方面,本公开的特征在于试剂盒,其包括:(a)特异性结合浸润免疫细胞上的抗原的抗体;(b)特异性结合基质细胞上的抗原的第二抗体;(c)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;以及(d)用于执行本文所述的任何方法的说明书。
在另一个方面,本公开的特征在于计算机操作的方法,其中所述方法包括:(a)生成多个生物样品的数据集,其中对于所述多个生物样品中的每个生物样品,所述数据集包括:(i)在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;(ii)参考生物样品的图像数据;以及(iii)根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;其中所述参考生物样品包括(1)所述参考生物样品中的一个或多个癌性区域,(2)所述一个或多个癌性区域内的一个或多个基质区域,以及(3)多个肿瘤浸润淋巴细胞(TIL);(b)用所述数据集训练机器学习模块,从而生成经过训练的机器学习模块;以及(c)通过所述经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在另一个方面,本公开的特征在于系统,其中所述系统包括:(a)存储元件,所述存储元件可操作以存储多个生物样品的数据集,其中对于每个生物样品,所述数据集包括:在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;生物样品的图像数据;以及根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;其中所述生物样品包括(1)所述参考生物样品中的一个或多个癌性区域,(2)所述一个或多个癌性区域内的一个或者多个基质区域,以及(3)多个肿瘤浸润淋巴细胞(TIL);以及(b)处理器,其可操作用于通过机器学习模块处理数据集以训练机器学习模块,从而确定生物样品中的免疫细胞浸润。
本说明书中提及的所有可在互联网上获得的出版物、专利、专利申请和信息均通过引用并入本文,其程度与每个单独的出版物、专利、专利申请或信息项被明确且单独地指示通过引用并入的程度相同。如果通过引用并入的出版物、专利、专利申请和信息项目与说明书中包含的公开内容相矛盾,则说明书旨在取代和/或优先于任何此类矛盾的材料。
在根据范围来描述值的情况下,应当理解,该描述包括公开在这样的范围内的所有可能的子范围,以及落入这样的范围之内的特定数值,而不管是否明确地说明了特定数值或特定子范围。
“每/各种/个”一词在提及物品集合时,旨在识别集合中的单个物品,但不一定指集合中的每个物品,除非另有明确说明,或除非用法上下文另有明确说明。
单数形式“一个”、“一种”和“该”包括复数形式,除非上下文另有明确规定。例如,术语“一个细胞”包括一个或多个细胞,包括它们的混合物。此处使用的“A和/或B”包括以下所有备选方案:“A”、“B”、“A或B”以及“A和B”。
本文描述了本公开的特征的各种实施方式。然而,应当理解,仅通过示例的方式提供这样的实施例,并且在不脱离本公开的范围的情况下,本领域技术人员可以发生许多变化、改变和替换。还应当理解,本文所描述的特定实施方式的各种替代方案也在本公开的范围内。
附图说明
以下附图示出了本公开的特征和优点的某些实施方式。这些实施方式不旨在以任何方式限制所附权利要求的范围。附图中相同的参考符号指示相同的元件。
图1是示出条码化捕获探针的示例的示意图。
图2是示例性分析物捕获剂的示意图。
图3是描绘特征固定的捕获探针324和分析物捕获剂326之间的示例性相互作用的示意图。
图4A-4C是说明如何在基于阵列的系统中利用链霉亲和素细胞标签来产生空间条码化的细胞或细胞内容物的示意图。
图5是用于生物样品中的机器学习模式的示例性系统的框图。
图6是示出将图像数据登记至从捕获区域获得的分析物数据的框图。
图7是图5的系统的示例性过程的流程图。
图8显示卵巢腺癌的组织切片的免疫荧光染色,其显示(i)合并图像、(ii)广谱细胞角蛋白(Pan-CK)和(iii)CD45(上图)以及组织切片中(i)所有基因、(ii)MKi67和(iii)PTPRC的基因表达热图(下图)。
图9显示了Pan-CK抗体的免疫荧光染色(左图)和癌症标志物子集的基因表达热图(右图)。
图10A-10D显示了靶向组的基因表达热图和相关图。图10B-10D进一步提供了靶向组的相关图。
图11A显示了B细胞标志物CD19、CD79A和CD79B在八个不同簇中的每一个中的基因表达的小提琴图。
图11B显示了图11A中的B细胞标志物的基因表达热图(左图)和CD45和Pan-CK的基因表达热图(右图)和免疫荧光染色的重叠。
图11C显示了T细胞标志物CD3D、CD3E、CD4和CD8A在八个不同簇中的每个簇中的基因表达的小提琴图。
图11D显示了图11C中的T细胞标志物的基因表达热图。
图12A显示了T细胞标志物CD4、CD3E和CD3D的基因表达热图以及CD45和Pan-CK的免疫荧光染色的重叠。
图12B显示了T细胞标志物CD4和CD14的基因表达热图以及CD45和Pan-CK的免疫荧光染色的重叠。
图13显示了单核细胞标志物CD14的基因表达热图的重叠。
图14显示了CD4的基因表达热图(左上图)、样品中检测到的所有基因的基因表达热图(右上图)以及CD4的八个不同簇中的每个簇中的基因表达的小提琴图(Log2表达)(下图)。
图15显示了CD8A的基因表达热图(左上图)、样品中检测到的所有基因的基因表达热图(右上图)以及CD8的八个不同簇中的每个簇中的基因表达的小提琴图(下图)。
图16A显示血浆B细胞标志物CD79A、CD79B、CD38、CD27、MZB1、IGHA1、IGHG1、JCHAIN和IGKC的基因表达热图。
图16B显示了JCHAIN的基因表达热图。
图16C显示了CD45的免疫荧光染色。
图17A显示了单核细胞标志物CD14的基因表达热图。
图17B显示了单核细胞标志物CD16(FCGR3A)的基因表达热图。
图17C显示CD45、DAPI和Pan-CK的基因表达热图和免疫荧光染色的重叠。
图18显示了T调节(Treg)细胞标志物FOXP3、IL17RB、CTLA4、FANK1和CD4的基因表达热图(左图)和肿瘤相关巨噬细胞标志物CD163、MSR1和MRC1的基因表达热图(右图)。
图19显示了卵巢肿瘤样品中自然杀伤(NK)标志物NKG7的基因表达热图(左图),卵巢肿瘤样品中NKG 7的基因表达热图和CD45和Pan-CK的免疫荧光染色的重叠(中图),以及乳腺肿瘤IDC样品中自然杀伤(NK)标志物NKG7的基因表达热点图(右图)。
图20显示了CD4的基因表达热图和CD45的免疫荧光染色的重叠(左图),CD8A的基因表达热图和CD4的免疫荧光着色的重叠(中图),以及TIGIT/LAG3的基因表达热和CD45的荧光染色的重叠(右图)。
图21显示CD3E和CD4的基因表达热图(左图)以及CD4和CD14的基因表达热图(右图)。
图22A显示成纤维细胞活化蛋白α(FAP)在八个不同簇中的每一个中的基因表达的小提琴图。
图22B显示了FAP的基因表达热图。
图22C显示钙粘蛋白1(CDH1)在八个不同簇中的每一个中的基因表达的小提琴图。
图22D显示了CDH1的基因表达热图和CD45的免疫荧光染色的重叠。
图23A显示了波形蛋白(VIM)的八个不同簇中的每一个簇中的基因表达的小提琴图。
图23B显示了VIM的基因表达热图和CD45的免疫荧光染色的重叠。
图23C显示了上皮细胞粘附分子(EPCAM)在八个不同簇中的每一个中的基因表达的小提琴图。
图23D显示EPCAM的基因表达热图和CD45的免疫荧光染色的重叠。
图24A显示了卵巢癌症基因BRCA1、BRCA2、MYC、TP53、PALB2、RAD51和MSH2的八个不同簇中每个簇的基因表达小提琴图。
图24B显示了图24A中卵巢癌症基因的基因表达热图和CD45的免疫荧光染色的重叠。
图24C显示了mutS同源物2(MSH2)的八个不同簇中的每一个簇中的基因表达的小提琴图。
图24D显示了MSH2的基因表达热图和CD45的免疫荧光染色的重叠(左图)以及MSH2的遗传表达热图与Pan-CK的免疫荧光染色的重叠(右图)。
图25A显示BRCA1的八个不同簇中的每一个簇中的基因表达的小提琴图。
图25B显示BRCA1的基因表达热图和CD45的免疫荧光染色的重叠。
图25C显示BRCA2的八个不同簇中的每一个簇中的基因表达的小提琴图。
图25D显示BRCA2的基因表达热图和CD45的免疫荧光染色的重叠。
图26显示了PI3K-AKT信号传导成分、Jak-STAT信号传导成分和Notch信号传导成分的基因表达热图以及Pan-CK的免疫荧光染色。
图27显示了细胞核成分、磷蛋白、多态性成分和细胞过程的基因表达热图以及Pan-CK的免疫荧光染色。
图28A和28B显示了使用k均值无监督簇(图28A)和Pan-CK和CD45的免疫荧光染色(图28B)的具有斑点的重叠组织图。
图28C显示了肿瘤(与Pan-CK共定位)和基质簇(与CD45共定位)中大多数失调基因的热图。
图28D显示了提供Pan-CK和CD45与9个簇的共定位检测的组织图。
图28E显示了9个簇中最失调的基因的热图。
图29A显示了癌症标志物基因子集(SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和CALML6)与肿瘤(Pan-CK表达)隔室的组织基因表达。
图29B显示了癌症标志物基因子集(SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和CALML6)与肿瘤或基质隔室的表达的小提琴图。
图30A显示基质标志物基因(FAP、VCAN、ACTA2和PDGFRB)的子集与基质(表达CD45)隔室的组织基因表达。
图30B显示基质标志物基因(FAP、VCAN、ACTA2和PDGFRB)的子集与肿瘤或基质隔室的表达的小提琴图。
图31A显示了Pan-CK和CD45在组织样品中的表达。
图31B-31K显示了Pan-CK和CD45的组织共定位表达与T细胞CD3D、CD3E、CD4、CD8A和CD247(图31B)、CD4 T细胞(图31C)、CD8A T细胞(表31D)、Treg细胞(表31E)、B细胞(图31F)、血浆B细胞(图31G)、NK细胞(图31H)、CD14单核细胞(图31T)、CD16单核细胞(图31J)和TAM(图31K)的表达。
图32A显示了卵巢组织样品中Pan-CK、CD45和DAPI的免疫荧光染色。
图32B显示了图32A组织样品中癌症簇和基质隔室的组织基因表达。簇1主要与Pan-CK肿瘤切片重叠,而簇4主要与CD45基质组织切片重叠。在簇1中,PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42和WT1上调。
图32C显示了TOP2A在图32A的组织样品中的基因表达。
图32D显示了XPO1在图32A的组织样品中的基因表达。
具体实施方式
I.引言
本文所述的空间分析方法和组合物可以以高空间分辨率提供生物样品内各种分析物的大量分析物和/或表达数据,同时保留固有的空间背景。空间分析方法和组合物可以包括,例如,使用捕获探针,所述捕获探针包括空间条形码(例如,提供关于细胞或组织样品(例如,哺乳动物细胞或哺乳动物组织样品)内分析物的位置或定位的信息的核酸序列)和能够与由细胞产生和/或存在于细胞中的分析物(例如,蛋白质和/或核酸)结合的捕获域。空间分析方法和组合物还可以包括使用具有捕获域的捕获探针,该捕获域捕获用于间接检测分析物的中间试剂。例如,中间试剂可以包括与分析物相关的核酸序列(例如条形码)。因此,中间试剂的检测指示细胞或组织样品中的分析物。
空间分析方法和组合物的非限制性方面描述于美国专利号10774374、10724078、10480022、10059990、10041949、10002316、9879313、9783841、9727810、9593365、8951726、8604182、7709198、美国专利申请公开号2020/239946、2020/080136、2020/0277663、2020/024641、2019/330617、2019/2264268、2020/2256867、2020/2224244、2019/194709、2019/161796、2019/085383、2019/055594、2018/216611、2018/051322、2018/0245142、2017/241911、2017/089811、2017/067096、2017/029875、2017/0016053、2016/108458、2015/0008854、2013/171621、WO2018/091676、WO 2020/176788、Rodriques等,Science 363(6434):1463-1467,2019;Lee等,Nat.Protoc.10(3):442-458,2015;Trejo等,PLoS ONE14(2):e0212031,2019;Chen等,Science 348(6233):aaa6090,2015;Gao等,BMCBiol.15:50,2017;和Gupta等,Nature Biotechnol.36:1197-1202,2018;《《Visium空间基因表达试剂盒用户指南》(the Visium Spatial Gene Expression ReagentKits User Guide)(如,日期为2021年7月的C版本),这两个都可以在10xGenomics Support Documentation网站上获得,并且可以在本文中以任何组合使用。本文描述了空间分析方法和组合物的其他非限制性方面。
本公开中可以使用的一些通用术语可以在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(I)(b)节中找到。通常,“条形码”是一种标记或标识符,用于传递或能够传递信息(例如,关于捕获探针、珠和/或样品中分析物的信息)。条形码可以是分析物的部分,也可以独立于分析物。条形码可以附着在分析物上。特定的条形码相对于其他条形码可以是唯一的。为了本公开的目的,“分析物”可以包括任何待分析的生物物质、结构、部分或组分。术语“靶标”可以类似地指感兴趣的分析物。
分析物可以大致分为两组:核酸分析物和非核酸分析物。非核酸分析物的实例包括但不限于脂质、碳水化合物、肽、蛋白质、糖蛋白(N-连接或O-连接)、脂蛋白、磷蛋白、蛋白质的特异性磷酸化或乙酰化变体、蛋白质的酰胺化变体、蛋白质的羟基化变体、蛋白质的甲基化变体、蛋白质的泛素化变体、蛋白质的硫酸化变体、病毒蛋白质(例如,病毒衣壳、病毒包膜、病毒外壳、病毒附件、病毒糖蛋白、病毒刺突等)、胞外和胞内蛋白质、抗体和抗原结合片段。在一些实施方式中,分析物可以定位于亚细胞位置,包括例如细胞器,例如线粒体、高尔基体、内质网、叶绿体、内吞小泡、外泌小泡、液泡、溶酶体等。在一些实施方式中,分析物可以是肽或蛋白质,包括但不限于抗体和酶。分析物的其他实例可在美国专利申请公开号2020/0277663和/或WO2020/176788的第(I)(c)节中找到。在一些实施方式中,可以间接检测分析物,例如通过检测中间试剂,例如连接探针(例如连接产物)或分析物捕获剂(例如寡核苷酸偶联抗体),例如本文所述的那些。
“生物样品”通常从对象身上获得,用于使用多种技术中的任何一种进行分析,包括但不限于活检、手术和激光捕获显微镜(LCM),并且通常包括来自对象的细胞和/或其他生物材料。在一些实施方式中,生物样品可以是组织切片。在一些实施方式中,生物样品可以是固定和/或染色的生物样品(例如,固定和/或染色的组织切片)。染色的非限制性实例包括组织学染色(例如苏木精和/或伊红)和免疫染色(例如荧光染色)。在一些实施方式中,可以对生物样品(例如,固定的和/或染色的生物样品)进行成像。生物样品也描述在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(I)(d)节中。
在一些实施方式中,用一种或多种透化试剂使生物样品透化。例如,生物样品的透化可以促进分析物的捕获。示例性透化剂和条件描述于美国专利申请公开号2020/0277663和/或WO 2020/176788的第(I)(d)(ii)(13)节或示例性实施方式部分中。
基于阵列的空间分析方法涉及将一种或多种分析物从生物样品转移到基材上的特征阵列,其中每个特征与阵列上的唯一空间位置相关联。转移的分析物的后续分析包括确定分析物的特性(identity)和分析物在生物样品内的空间位置。分析物在生物样品内的空间位置是基于分析物在阵列上(例如,直接或间接)结合到的特征以及该特征在阵列内的相对空间位置来确定的。
“捕获探针”是指能够(直接或间接)捕获和/或标记生物样品中的分析物(例如,感兴趣的分析物)的任何分子。在一些实施方式中,捕获探针是核酸或多肽。在一些实施方式中,捕获探针包括条形码(例如,空间条形码和/或独特分子标识符(UMI))和捕获域)。在一些实施方式中,捕获探针可以包括切割结构域和/或功能结构域(例如引物结合位点,例如用于下一代测序(NGS))。
图1是示出如本文所述的示例性捕获探针的示意图。如图所示,捕获探针102任选地通过切割结构域103(例如二硫键)连接到特征101。捕获探针可以包括对后续处理有用的功能序列104。功能序列104可以包括测序仪特异性流动池附着序列的全部或部分(例如,P5或P7序列)、测序引物序列(例如,R1引物结合位点、R2引物结合位点)的全部或部分、或其组合。捕获探针还可以包括空间条形码105。捕获探针还可以包括独特分子标识符(UMI)序列106。虽然图1显示空间条形码105位于UMI序列106的上游(5’),但应理解,其中UMI序列106位于空间条形码105上游(5’)的捕获探针也适用于本文所述的任何方法。捕获探针还可以包括捕获域107,以便于捕获目标分析物。在一些实施方式中,捕获探针包括附加功能序列,该附加功能序列可以位于例如空间条形码105和UMI序列106之间、UMI序列104和捕获域107之间或捕获域107之后。捕获域可以具有与核酸分析物的序列互补的序列。捕获域可以具有与本文所述的连接探针互补的序列。捕获域可以具有与分析物捕获剂中存在的捕获柄序列互补的序列。捕获域可以具有与夹板寡核苷酸互补的序列。这种夹板寡核苷酸除了具有与捕获探针的捕获域互补的序列外,还可以具有核酸分析物的序列、与本文所述的连接探针的部分互补的序列和/或本文所述捕获柄序列。
功能序列通常可以选择为与多种不同测序系统中的任何一种兼容,例如离子洪流质子或PGM、Illumina测序仪器、PacBio、Oxford Nanopore等及其要求。在一些实施方式中,可以选择与非商业化测序系统兼容的功能序列。可以使用合适的功能序列的这种测序系统和技术的实例包括(但不限于)离子洪流质子或PGM测序、Illumina测序、PacBio SMRT测序和Oxford Nanopore测序。此外,在一些实施方式中,可以选择功能序列以与其他测序系统兼容,包括非商业化的测序系统。
在一些实施方式中,空间条形码105和功能序列104对于附着到给定特征的所有探针是共同的。在一些实施方式中,附着到给定特征的捕获探针的UMI序列106不同于附着到该给定特征的不同捕获探针的UMI序列。
在一些情况下,捕获探针是可切割捕获探针,其中切割的捕获探针可以进入非透化的细胞并与样品内的分析物结合。捕获探针包含切割结构域、细胞穿透肽、报告分子和二硫键(-S-S-)。
在一些情况下,本公开提供了多重化的空间条码化特征。例如,特征可以耦合到空间条码化捕获探针,其中特定特征的空间条码化探针可以具有相同的空间条形码,但具有不同的捕获域,其被设计为将特征的空间条码与超过一个的目标分析物相关联。例如,一个特征可以耦合到四种不同类型的空间条码化捕获探针,每种类型的空间条码化捕获探针都具有空间条形码。与该特征相关联的一种类型的捕获探针包括与聚(T)捕获域组合的空间条形码,其被设计为捕获mRNA目标分析物。与该特征相关联的第二种类型的捕获探针包括与用于gDNA分析的随机N-聚体捕获域组合的空间条形码。与所述特征相关联的第三种类型的捕获探针包括与与感兴趣的分析物捕获剂的捕获柄序列互补的捕获域组合的空间条形码。与该特征相关的第四种类型的捕获探针包括与捕获域组合的空间条形码,该捕获域可以特异性结合可以在CRISPR确定中起作用的核酸分子(例如CRISPR/Cas9)。本公开还可用于本文公开的其他分析物的同时分析,包括但不限于:(a)mRNA、谱系追踪构建体、细胞表面或胞内蛋白质和代谢物以及gDNA;(b)mRNA、可及染色质(例如ATAC-seq、DNase-seq和/或MNase-seq)细胞表面或胞内蛋白质和代谢产物,以及扰动剂(例如本文所述的CRISPRcrRNA/sgRNA、TALEN、锌指核酸酶和/或反义寡核苷酸);(c)mRNA、细胞表面或胞内蛋白质和/或代谢物、条码化标记剂(例如本文所述的MHC多聚体)和免疫细胞受体(例如T细胞受体)的V(D)J序列。在一些实施方式中,扰动剂可以是小分子、抗体、药物、适体、miRNA、物理环境(例如,温度变化)或任何其他已知的扰动剂。参见例如美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(b)节(例如,子节(i)-(vi))。捕获探针的产生可以通过任何适当的方法实现,包括美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(d)(II)节中描述的那些方法。
在一些实施方式中,可以使用任何适当的多重化技术(例如美国专利申请公开号2020/0277663和/或WO 2020/176788的第(IV)节中描述的那些)来检测来自生物样品的超过一种分析物类型(例如,核酸和蛋白质)(例如,同时地或顺序地)。
在一些实施方式中,可以使用一种或多种分析物捕获剂来进行一种或多种分析物(例如蛋白质分析物)的检测。如本文所用,“分析物捕获剂”是指与分析物(例如,生物样品中的分析物)和捕获探针(例如,附着到基材或特征的捕获探针)相互作用以识别分析物的试剂。在一些实施方式中,分析物捕获剂包括:(i)分析物结合部分(例如,结合分析物),例如,抗体或其抗原结合片段;(ii)分析物结合部分条形码;和(iii)捕获柄序列。如本文所用,术语“分析物结合部分条形码”是指与分析物结合部相关联或以其他方式识别分析物结合部分的条形码。如本文所用,术语“分析物捕获序列”或“捕获柄序列”是指被配置为与捕获探针的捕获域杂交、结合、偶联或以其他方式相互作用的区域或部分。在一些实施方式中,捕获柄序列与捕获探针的捕获域互补。在一些情况下,分析物结合部分条形码(或其部分)可能能够从分析物捕获剂移除(例如,切割)。
图2是示例性分析物捕获剂202的示意图,其包括分析物结合部分204和分析物结合部条形码结构域208。示例性分析物结合部分204是能够结合分析物206的分子,并且分析物捕获剂能够与空间条码化捕获探针相互作用。分析物结合部分可以以高亲和力和/或高特异性与分析物206结合。分析物捕获剂可以包括分析物结合部分条形码结构域208、核苷酸序列(例如寡核苷酸),其可以与捕获探针的捕获域的至少部分或全部杂交。分析物结合部分条形码结构域408可以包括本文所述的分析物结合部分条形码和捕获柄序列。分析物结合部分204可以包括多肽和/或适体。分析物结合部分204可以包括抗体或抗体片段(例如抗原结合片段)。
图3是描绘特征固定的捕获探针324和分析物捕获剂326之间的示例性相互作用的示意图。特征固定的捕获探针324可以包括空间条形码308以及功能序列306和UMI 310,如本文其他地方所述。捕获探针还可以包括能够结合到分析物捕获剂326的捕获域312。分析物捕获剂326可以包括功能序列318、分析物结合部分条形码516和能够结合到捕获探针324的捕获域312的捕获柄序列314。分析物捕获剂还可以包括接头320,该接头320允许捕获剂条形码结构域316耦合到分析物结合部分322。
图4A、4B和4C是说明如何在基于阵列的系统中利用链霉亲和素细胞标签来产生空间条码化的细胞或细胞内容物的示意图。例如,如图4A所示,肽结合的主要组织相容性复合物(MHC)可以与生物素(β2m)单独结合,并与链霉亲和素部分结合,使得链亲和蛋白部分包括多个pMHC部分。这些部分中的每一个都可以与TCR结合,使得链霉亲和素通过多重MCH/TCR结合相互作用与靶T细胞结合。多重相互作用协同作用,可以显著提高结合亲和力。这种改进的亲和力可以改进T细胞的标记,并且还降低标记物从T细胞表面解离的可能性。如图4B所示,捕获剂条形码结构域401可以用链霉亲和素402修饰并与生物素化MHC 403的多个分子接触,使得生物素化的MHC 403分子与链霉亲和素偶联的捕获剂条形码结构域401偶联。结果是条码化的MHC多聚体复合体405。如图4B所示,捕获剂条形码结构域序列401可以将MHC识别为其相关标记,并且还包括可选的功能序列,例如用于与其他寡核苷酸杂交的序列。如图4C所示,一个实例寡核苷酸是捕获探针406,其包含互补序列(例如,对应于C C C的rGrGrG)、条形码序列和其他功能序列,例如UMI、衔接子序列(例如包含测序引物序列(例如R1或部分R1(“pR1”),R2),流动池附着序列(例如P5或P7或其部分序列)等。在一些情况下,捕获探针406可以首先与特征(例如凝胶珠)相关联并从该特征释放。在其他实施方式中,捕获探针406可以与MHC寡核苷酸复合物405的捕获剂条形码结构域401杂交。杂交的寡核苷酸(间隔子CCC和间隔子rGrGrG)然后可以在引物延伸反应中延伸,从而产生包含与两个空间条形码序列(与捕获探针相关的空间条形码和与MHC寡核苷酸复合物相关的条形码)中的每一个相对应的序列的构建体。在一些情况下,这些对应序列中的一个或两个可以是捕获探针406或捕获剂条形码结构域401中的原始序列的互补物。在其他实施方式中,捕获探针和捕获剂条形码结构域连接在一起。所得构建体可以任选地进一步处理(例如,添加任何附加序列和/或用于清除)并进行测序。如本文其它地方所描述的,来源于捕获探针406的空间条形码序列的序列可以用于识别特征并且来源于捕获剂条形码结构域401上的空间条形码序列的序列可以用来识别结合在细胞表面上的特定肽MHC复合物404(例如当使用MHC肽库筛选免疫细胞或免疫细胞群时)。
分析物捕获剂的其他描述可以在WO2020/176788的第(II)(b)(ix)节和/或美国专利申请公开号2020/0277663的第(II)(b)(viii)节中找到。
存在至少两种将空间条形码与一个或多个相邻细胞相关联的方法,使得空间条形码将一个或多个细胞和/或一个或多个细胞的内容物识别为与特定空间位置相关联。一种方法是促使分析物或分析物替代物(例如,中间试剂)离开细胞并朝向空间条码化阵列(例如,包括空间条码化捕获探针)。另一种方法是从阵列切割空间条码化捕获探针,并促使空间条码化捕获探针朝向生物样品和/或至生物样品中或其上。
在一些情况下,捕获探针可以被配置为从模板(例如DNA或RNA模板,例如分析物或中间试剂(例如连接探针(例如连接产物或分析物捕获试剂,或其部分),或其衍生物(参见例如美国专利申请公开号2020/0277663和/或WO2020/176788的第(II)(b)(vii)节,关于延伸的捕获探针)引发、复制并随后产生任选地条码化的延伸产物。在一些情况下,捕获探针可以被配置为与模板(例如DNA或RNA模板,例如分析物或中间试剂,或其部分)形成连接的探针(例如连接产物),从而产生用作模板的替代物的连接产物。
如本文所用,“延伸的捕获探针”是指在捕获探针的末端(例如,3′或5′端)添加了额外核苷酸的捕获探针,从而延长了捕获探针的总长度。例如,“延伸的3′端”表示附加核苷酸被添加到捕获探针的最3′核苷酸以延伸捕获探针的长度,例如,通过用于延伸核酸分子的聚合反应,包括由聚合酶(例如,DNA聚合酶或逆转录酶)催化的模板化聚合。在一些实施方式中,延伸捕获探针包括向捕获探针的3’端添加核酸序列,该核酸序列与特异性结合到捕获探针的捕获域的分析物或中间试剂的核酸序列互补。在一些实施方式中,使用逆转录来延伸捕获探针。在一些实施方式中,使用一种或多种DNA聚合酶延伸捕获探针。延伸的捕获探针包括捕获探针的序列和捕获探针的空间条形码的序列。
在一些实施方式中,扩增延伸的捕获探针(例如,在本体溶液中或在阵列上)以产生足以进行下游分析的量,例如,通过DNA测序。在一些实施方式中,延伸的捕获探针(例如DNA分子)充当扩增反应(例如聚合酶链式反应)的模板。
在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(a)节中描述了空间分析方法的附加变体,包括在一些实施方式中的成像步骤。捕获的分析物(和/或中间试剂或其部分)的分析,例如,包括样品去除、捕获探针的延伸、测序(例如,切割的延伸的捕获探针和/或与延伸的捕获探针互补的cDNA分子)、阵列测序(例如使用例如原位杂交或原位连接方法)、时间分析、和/或近距离捕获,描述于美国专利申请公开号2020/0277663和/或WO2020/176788的第(II)(g)节。一些质量控制措施描述在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(h)节中。
空间信息可以提供具有生物学和/或医学重要性的信息。例如,本文所述的方法和组合物可以允许:鉴定疾病或病症的一种或多种生物标志物(例如,诊断、预后和/或用于确定治疗的疗效);鉴定用于治疗疾病或病症的候选药物靶标;将对象识别(例如诊断)为患有疾病或病症;鉴定对象的疾病或病症的阶段和/或预后;确定对象患疾病或病症的可能性增加;监测对象的疾病或病症的进展;对于对象的疾病或病症的治疗效果的确定;识别治疗对疾病或病症有效的患者亚群;改变对患有疾病或病症的对象的治疗;选择参与临床试验的对象;和/或选择对患有疾病或病症的对象的治疗。
空间信息可以提供具有生物学重要性的信息。例如,本文所述的方法和组合物可以允许:鉴定转录组和/或蛋白质组表达谱(例如,在健康和/或患病组织中);近距离识别多种分析物类型(例如最近邻分析);确定患病组织中上调和/或下调的基因和/或蛋白质;肿瘤微环境的表征;肿瘤免疫反应的表征;细胞类型的表征及其在组织中的共同定位;以及鉴定组织内的遗传变异(例如基于与特定疾病或病症生物标志物相关的基因和/或蛋白质表达谱)。
通常,对于基于空间阵列的方法,基材起到将捕获探针直接或间接附着到阵列特征的支持物的作用。“特征”是作为空间分析中使用的各种分子实体的支持物或储存库的实体。在一些实施方式中,阵列中的一些或全部特征被功能化以用于分析物捕获。在美国专利申请公开号2020/0277663和/或WO2020/176788的第(II)(c)节中描述了示例性基材。阵列的示例性特征和几何属性可以在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(d)(i)、(II)(d)(iii)和(II)(d)(iv)节中找到。
通常,当生物样品与包括捕获探针的基材(例如,具有嵌入、点样、印刷、制造在基材上的捕获探针的基材,或者具有包括捕获探针在内的特征(例如,珠、孔)的基材)接触时,可以捕获分析物和/或中间试剂(或其部分)。如本文所用,生物样品与基材的“接触”是指任何接触(例如,直接或间接),使得捕获探针可以与来自生物样品的分析物相互作用(例如,共价或非共价结合(例如,杂交))。捕获可以主动(例如使用电泳)或被动(例如使用扩散)实现。在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(e)节中进一步描述了分析物捕获。
在一些情况下,可以通过将具有条形码(例如,空间条形码)的分子(例如,肽、脂质或核酸分子)附着和/或引入生物样品(例如,生物样品中的细胞)来进行空间分析。在一些实施方式中,将具有多个条形码(例如,多个空间条形码)的多个分子(例如,多个核酸分子)引入生物样品(例如,引入生物样品中的多个细胞)以用于空间分析。在一些实施方式中,在将具有条形码的分子附着和/或引入生物样品之后,可以将生物样品物理分离(例如,解离)成单个细胞或细胞组用于分析。一些这样的空间分析方法在美国专利申请公开号2020/0277663和/或WO 2020/176788的第(III)节中进行了描述。
在某些情况下,可以通过检测与分析物杂交的多个寡核苷酸来进行空间分析。在某些情况下,例如,可以使用RNA模板化连接(RTL)进行空间分析。RTL的方法已经在前面进行了描述。参见,例如,Credle等,NucleicAcidsRes.2017年8月21;45(14):e128。通常,RTL包括两个寡核苷酸与分析物(例如RNA分子,如mRNA分子)上的相邻序列的杂交。在某些情况下,寡核苷酸是DNA分子。在一些情况下,寡核苷酸之一在3′端包括至少两个核糖核酸碱基,和/或另一种寡核苷酸包括5′端的磷酸化核苷酸。在一些情况下,两个寡核苷酸中的一个包括捕获域(例如,聚(A)序列、非均聚序列)。在与分析物杂交后,连接酶(例如,SplintR连接酶)将两个寡核苷酸连接在一起,产生连接的探针(例如,连接产物)。在某些情况下,这两个寡核苷酸与彼此不相邻的序列杂交。例如,两个寡核苷酸的杂交在杂交的寡核苷酸之间产生间隙。在某些情况下,聚合酶(例如DNA聚合酶)可以在连接之前延伸寡核苷酸之一。连接后,连接的探针(例如连接产物)从分析物中释放出来。在一些情况下,使用核酸内切酶(例如,RNA酶H)释放连接的探针(例如,连接产物)。释放的连接探针(例如,连接产物)然后可以被阵列上的捕获探针捕获(例如,代替分析物的直接捕获),任选地扩增和测序,从而确定分析物在生物样品中的位置和任选地丰度。
在空间信息的分析期间,获得与分析物相关联的空间条形码的序列信息,并且该序列信息可以用于提供关于生物样品中分析物的空间分布的信息。可以使用各种方法来获得空间信息。在一些实施方式中,特定捕获探针及其捕获的分析物与基材上的特征阵列中的特定位置相关联。例如,在阵列制造之前,特定的空间条形码可以与特定的阵列位置相关联,并且空间条形码的序列可以与特定阵列位置信息一起存储(例如,在数据库中),使得每个空间条形码唯一地映射到特定阵列位置。
或者,在制造过程中,特定的空间条形码可以沉积在特征阵列中的预定位置,使得在每个位置,仅存在一种类型的空间条形码,使得空间条形码与阵列的单个特征唯一关联。在必要的情况下,可以使用本文所述的任何方法对阵列进行解码,使得空间条形码与阵列特征位置唯一关联,并且可以如上所述存储该映射。
当在空间信息的分析过程中获得捕获探针和/或分析物的序列信息时,可以通过参考将每个空间条形码与阵列特征位置唯一关联的存储信息来确定捕获探针和/或分析物的位置。以这种方式,特定的捕获探针和捕获的分析物与特征阵列中的特定位置相关联。每个阵列特征位置表示相对于阵列的坐标参考点(例如,阵列位置、基准标志物)的位置。因此,每个特征位置在阵列的坐标空间中都有一个“地址”或位置。
在WO 2020/176788和/或美国专利申请公开号2020/0277663的示例性实施例部分中描述了一些示例性空间分析工作流程。例如,参见美国专利申请公开号2020/0277663和/或WO 2020/176788的以“在本文所述的工作流程的一些非限制性实例中,样品可以被浸没…”开头的示例性实施方式。另见,例如,《Visium空间基因表达试剂盒用户指南》(如,日期为2020年6月的C版本)和/或《Visium空间基因表达试剂盒用户指南》(如,日期为2020年7月的C版本)。
在一些实施方式中,可以使用专用硬件和/或软件来执行空间分析,例如美国专利申请公开号2020/0277663和/或WO 2020/176788的第(II)(e)(II)和/或(V)节中描述的任何系统,WO 2020/132320的用于成像的对照载玻片、使用对照载玻片和基材的方法、使用对照载玻片和基材用于成像的方法、和/或样品和阵列对准装置和方法、信息标记章节中所述的装置或方法中一种或多种的任一种。
用于进行空间分析的合适系统可以包括诸如用于容纳生物样品的腔室(例如,流动池或可密封的流体密封腔室)之类的部件。生物样品可以例如安装在生物样品支架中。一个或多个流体腔室可以经由流体导管连接到腔室和/或样品支架,并且流体可以经由流体泵、真空源或耦合到流体导管的其它装置输送到腔室和/或样品支架中,其产生压力梯度以驱动流体流动。一个或多个阀也可以连接到流体导管,以调节试剂从储存器到腔室和/或样品支架的流动。
该系统可以可选地包括控制单元,该控制单元包括一个或多个电子处理器、输入接口、输出接口(例如显示器)和存储单元(例如固态存储介质,例如但不限于磁性、光学或其他固态、永久性、可写和/或可重写存储介质)。控制单元可以可选地经由网络连接到一个或多个远程设备。控制单元(及其部件)通常可以执行本文所述的任何步骤和功能。在系统连接到远程设备的情况下,远程设备可以执行本文所述的任何步骤或特征。该系统可以可选地包括用于捕获图像的一个或多个检测器(例如CCD、CMOS)。该系统还可以可选地包括用于照射样品的一个或多个光源(例如,基于LED、基于二极管、激光器)、具有特征的基材、来自捕获在基材上的生物样品的分析物以及各种控制和校准介质。
系统可以可选地包括在一个或多个有形存储介质和硬件组件(例如专用集成电路)中编码和/或实现的软件指令。当由控制单元(尤其是电子处理器)或集成电路执行软件指令时,该软件指令可以使执行软件指令的控制单元、集成电路或其他组件执行本文所述的任何方法步骤或功能。
在一些情况下,本文所述的系统可以检测(例如,登记图像)阵列上的生物样品。在PCT申请号2020/061064和/或美国专利申请序列号16/951,854中描述了检测阵列上的生物样品的示例性方法。
在将分析物从生物样品转移到基材上的特征阵列之前,可以将生物样品与阵列对准。生物样品和包括捕获探针的特征阵列的对准可以促进空间分析,其可以用于检测生物样品中不同位置的分析物存在和/或水平的差异,例如,生成分析物存在或水平的三维图。产生分析物存在和/或水平的二维和/或三维图的示例性方法在PCT申请号2020/053655中描述,并且空间分析方法通常在WO2020/061108和/或美国专利申请序列号16/951,864中描述。
在一些情况下,可以使用一个或多个基准标志物将分析物存在和/或水平的图谱与生物样品的图像对准,例如,放置在成像系统的视场中的物体,其出现在产生的图像中,如WO 2020/132320、PCT申请号2020/061066、和/或美国专利申请序列号16/951,843的基材属性章节、用于成像的对照载玻片章节中所述。基准标志物可以用作参照点或测量标尺,用于对准(例如,对准样品和阵列,对准两个基材,确定样品或阵列在基材上相对于基准标志物的位置)和/或用于尺寸和/或距离的定量测量。
如本文所用,“免疫细胞浸润”是指免疫细胞在生物样品中一个或多个位置的存在、丰度和/或分布。例如,“免疫细胞浸润”可指肿瘤浸润免疫细胞(例如,肿瘤浸润淋巴细胞(TIL))在生物样品(如肿瘤组织样品)中的一个或多个位置的存在、丰度和/或分布。生物样品中的一个或多个位置可以是生物样品中癌性区域(例如肿瘤)。例如,免疫细胞浸润可以是指免疫细胞在生物样品中的癌性区域中,例如在肿瘤中的存在、丰度和/或分布。另外或替代地,生物样品中的一个或多个位置可以是围绕生物样品中癌性区域的区域(例如基质区域)。例如,免疫细胞浸润可以是指在癌性区域周围的区域中,例如在基质区域中,免疫细胞的存在、丰度和/或分布。生物样品中的一个或多个位置也可以是癌症基质区域。例如,免疫细胞浸润可能是指生物样品的癌症基质区域中免疫细胞的存在、丰度和/或分布。特别是,本发明的方法和组合物可用于分析生物样品中一个或多个位置(例如生物样品的癌症基质区域)浸润免疫细胞的存在、丰度和/或分布。例如,本发明的方法和组合物可用于分析生物样品中一个或多个位置(例如生物样品的癌症基质区域)肿瘤浸润免疫细胞(例如TIL)的存在、丰度和/或分布。
如本文所用,“免疫细胞”可指与免疫系统相关的一种或多种细胞。特别是,免疫细胞可以是“浸润免疫细胞”,例如一个或多个免疫细胞浸润(即存在于)生物样品中的一个或更多位置,例如生物样品的癌性区域、基质区域和/或癌症基质区域。免疫细胞或浸润免疫细胞可包括但不限于适应性免疫细胞(例如,T细胞或B细胞)和先天免疫细胞(如自然杀伤(NK)细胞、巨噬细胞(例如,肿瘤相关巨噬细胞(TAM))、单核细胞和树突状细胞(DC)。浸润细胞的非限制性实例如例如在Zhang等(Cellul.Mol.Immuno.,17:808-821(2020))中所述,其全文通过引用并入本文。在一些情况下,免疫细胞或浸润免疫细胞是NK细胞。NK细胞是先天性淋巴细胞,在宿主抵抗肿瘤生长的免疫反应中发挥作用。NK细胞可以包括Melaiu等,Front.Immunol.,10:1-18(2020)和Zhang等,Front.Immunol.11:1242(2020)中所述的属性,其全部内容通过引用并入本文。肿瘤浸润NK细胞的存在与多种人类实体瘤的良好预后有关。在一些实施方式中,NK细胞与NKG7分析物相关联。免疫细胞或浸润细胞的非限制性实例可包括幼稚B细胞、记忆B细胞、浆细胞(浆细胞的标志物包括但不限于CD79A、CD79B、CD38、CD27、MZB1、IGHA1、IGHG1、JCHAIN和IGKC)、CD8 T细胞、CD4幼稚T细胞、CD4记忆-静息T细胞、CD4记忆-活化T细胞、滤泡辅助T细胞、调节性T细胞(Treg)(Treg的标志物包括但不限于FOXP3、IL17RB、CTLA4、FANK1和CD4)、γ-ΔT细胞、静息NK细胞、活化NK细胞、单核细胞、M0巨噬细胞、M1巨噬细胞、M2巨噬细胞、组织相关巨噬细胞(TAM)(TAM的标志物包括但不限于CD163、MSR1和MRC1)、静息树突细胞、活化树突细胞、静息肥大细胞、活化肥大细胞、嗜酸性粒细胞、中性粒细胞及其任何组合。特别地,浸润免疫细胞可以是肿瘤浸润免疫细胞。肿瘤浸润免疫细胞可以是肿瘤浸润淋巴细胞(TIL),例如T细胞,和/或B细胞(TIB)(例如,本文所述的任何示例性B细胞,包括浆细胞)。TIL的非限制性实例如Guo等所述(J.Oncol.,doi:10.1155/2019/2592419(2019),其全部内容通过引用并入本文。在一些情况下,TIL选自:(i)CD3+和CD4+T细胞;(ii)CD3+和CD8+T细胞;(iii)调节性T细胞,其包含CD4、Foxp3、IL17RB、CTLA4、FANK1、HAVCR1、CD25、CTLA-4、GITR、LAG-3和CD127中的一种或多种;(iv)TH1细胞,其包含CD4、CD3D、S100A4、IL7R和IFNG中的一种或多种;(v)TH2细胞,其包含CD4、IL7R、ICOS、CTLA4、TNFRSF4和TNFRS18中的一种或多种;(vi)TH17细胞,其包含CD4、CD3D、IL17A、GZMA和S100A4中的一种或多种;和(vii)细胞毒性T细胞,其包含CD8、CD3D、S100A4、IFNG、GZMB、GZMA和IL2RB中的一种或多种。在一些情况下,肿瘤浸润B细胞(TIB)选自:(i)包含MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种的浆细胞;(ii)Ig+B细胞,其包含IGHV3-74、SOCS3、JCHAIN和SPARC中的一种或多种;(iii)活化的B细胞,其包含CD79B、HMGB2、HMGB1、HMGN1和RGS13;和(iv)包含MEF2B、RGS13和MS4A1中的一种或多种的B细胞。
如本文所用,生物样品的“癌性区域”可以指包括癌性组织的生物样品的一个或多个位置。生物样品的癌性区域可以是肿瘤中的一个或多个位置(例如,转移前肿瘤、转移瘤、恶性肿瘤等)。在生物样品之前已被确定为包括癌组织的某些情况下,生物样品的癌性区域可以代表癌症的某个阶段。例如,癌症样品可以包括对应于不同肺癌阶段的癌性区域,包括肿瘤大小T1、T2、T3或T4。生物样品中的癌性区域可以通过一个或多个标志物(例如,生物标志物)来识别,例如Pan-CK。与癌性区域相关的标志物的其他非限制性实例包括SCGB2A1、MKI67、BRCA1、BRCA2、PIKCD、CALML6、MYC、TP53、PALB2、RAD51和/或MSH2。
如本文所用,生物样品的“基质区域”可以指不是癌性区域的生物样品的一个或多个位置。例如,生物样品的“基质区域”可以指生物样品的癌性区域之外的一个或多个位置。另外或替代地,生物样品的基质区域可以是具有结构或结缔作用的组织或器官的部分。生物样品的基质区域可以包括结缔组织、血管和炎性细胞中的一种或多种。生物样品中的基质区域可以通过一种或多种标志物(例如生物标记物)如CD45来鉴定。
II.用无偏方法检测免疫细胞浸润
本公开基于使用无偏方法来确定生物样品中的免疫细胞浸润。在一些情况下,本文公开的空间方法与机器学习模块和基因簇相结合,以识别样品中包括肿瘤浸润免疫细胞的区域。
本公开的特征在于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,其中所述方法包括:(a)识别癌性区域或与来自所述一个或多种癌性区域中的癌性区域相关的分析物和/或识别基质区域或与来自生物样品中的一个或多个基质区域的基质区域相关的分析物;(b)识别一个或多个免疫细胞或与癌性区域和/或基质区域中的免疫细胞相关的分析物;和(c)确定所述生物样品中所述一种或多种免疫细胞或与免疫细胞相关的分析物的丰度;从而确定生物样品中的免疫细胞浸润。在一些实施方式中,识别癌性区域、识别基质区域和/或识别免疫细胞包括:(a)从生物样品生成数据集,其中该数据集包括以下中的一个或多个:(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;以及(b)使用所述数据集来识别所述生物样品中的癌性区域、基质区域和/或免疫细胞。在一些实施方式中,识别癌性区域、识别基质区域和/或识别免疫细胞包括:(a)从生物样品生成数据集,其中该数据集包括:(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;以及(b)使用所述数据集来识别所述生物样品中的癌性区域、基质区域和/或免疫细胞。
本公开的特征在于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,所述方法包括:(a)从获自对象的生物样品生成数据集,其中所述数据集包括:(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,和(3)来自一个或多个免疫细胞的免疫细胞;以及(c)通过经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在一些情况下,癌性区域包括良性肿瘤、转移前肿瘤、恶性肿瘤和一个或多个炎性细胞中的一种或多种。在一些情况下,基质区域包括结缔组织、血管和炎性细胞中的一种或多种。基于本公开内容,癌性区域和基质区域的其他实例对于本领域技术人员将是显而易见的。
(a)使用机器学习模块确定生物样品中的免疫细胞浸润
本公开的特征在于使用机器学习模块确定生物样品中免疫细胞浸润的方法。在一个非限制性实例中,本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,所述方法包括:(a)从获自对象的生物样品生成数据集,其中所述数据集包括:(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,和(3)来自一个或多个免疫细胞的免疫细胞;以及(c)通过经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在一些实施方式中,一种用于确定生物样品中免疫细胞浸润的方法使用机器学习模块,其中该方法包括:(a)生成多个生物样品的数据集,其中该数据集包括,对于多个生物样品中的每个生物样品(例如,包括一个或多个参考样品):(i)从生物样品中多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据;其中所述参考生物样品包括(1)所述参考生物学样品中的一个或多个癌性区域,(2)所述一个或多个癌性区域内的一个或多个基质区域,以及(3)多个肿瘤浸润免疫细胞;(b)用所述数据集训练机器学习模块,从而生成经过训练的机器学习模块;以及(c)使用经过训练的机器学习模块来确定测试生物样品中的免疫细胞浸润。在一些实施方式中,向经过训练的机器学习模块提供来自生物样品的数据集,其包括(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将所述分析物数据与所述图像数据链接的登记数据,其中所述经过训练的机器学习模块至少部分地经以下训练数据训练:包括来自一个或多个参考样品的一个或多个参考分析物数据集的训练数据,其中所述一个或多个参考样品包括(1)一个或多个参考癌性区域,(2)一个或多个参考基质区域,和(3)一个或多个参考免疫细胞。
在一些实施方式中,一种用于确定生物样品中免疫细胞浸润的方法包括:(a)访问从对象获得的生物样品的数据集,其中该数据集包括(i)从生物样品的多个空间位置捕获的多个分析物的核酸序列数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将所述核酸序列数据链接到所述图像数据的登记数据;(b)将所述生物样品的数据集提供给经过训练的机器学习模块;所述经过训练的机器学习模块至少部分经以下训练数据训练:包括来自一个或多个参考样品的核酸序列数据集的训练数据,所述一个或多个参考样品包括(1)一个或多个癌性区域、(2)一个或多个基质区域、和(3)一个或多个肿瘤浸润免疫细胞;(c)通过经过训练的机器学习模块,提供对对象癌症基质中免疫细胞浸润的分析。
在一些实施方式中,可以使用计算机实现的方法来训练机器学习模块,并使用机器学习模块来确定生物样品中的免疫细胞浸润。在这种情况下,计算机实现的方法包括:生成多个生物样品(例如,一个或多个参考样品)的数据集,其中,对于多个生物样品中的每个生物样品,该数据集包括:(i)在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;(ii)参考生物样品的图像数据;以及(iii)根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;其中所述参考生物样品包括(1)所述参考生物学样品中的一个或多个癌性区域,(2)所述一个或多个癌性区域内的一个或多个基质区域,以及(3)一个或多个免疫细胞;(b)用所述数据集训练机器学习模块,从而生成经过训练的机器学习模块;以及(c)通过所述经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
在一些实施方式中,示例性系统包括如图5所示的示例性图中所描述的组件。图5示出了可操作用于识别生物样品中的感兴趣区域(例如,包括TIL的感兴趣区)的示例性系统500的框图。在该实施方式中,系统500是用计算系统501来实现的。例如,计算系统501可以包括一个或多个处理器、存储设备(例如,包括计算机存储器、固态驱动器、硬盘驱动器等的持久性和易失性存储设备)、网络接口、图形卡等。计算系统501可操作以实现机器学习模块502。在这方面,机器学习模块502可以被实现为与计算系统501一起配置的计算机硬件、软件和/或固件的组合。
在一些实施方式中,计算系统501可操作来处理多个数据元件530-1、530-2至530-N的数据集(其中参考“N”是大于“1”的整数,并且不必等于本文指定的任何其他“N”参考)。在一些实施方式中,每个数据元件530包括与生物样品的捕获和条码化分析物有关的数据。每个数据元件530还可以包括登记到条码化分析物的生物样品的图像数据。可以使用本文所述的任何技术来执行成像。
例如,可以用多个捕获探针在多个捕获区域询问生物样品,所述捕获区域例如是如本文所述的图1的捕获点(例如,空间条码化特征)101。如本文所述的捕获区域包括在基材上的特定位置处的捕获探针。从生物样品的上覆细胞释放的分析物(例如,mRNA)可以被基材上捕获区域内的捕获探针捕获。
在一些实施方式中,包括捕获探针的基材还包括基准标志物(例如,本文所述或本领域已知的任何基准标志物)。例如,可以利用基准标志物获得生物样品的图像。图像的基准标志物可以用于将生物样品的图像与条码化分析物在其已知位置处的数据对准。
在一些实施方式中,数据元件530中的每一个可以包括与生物样品有关的二维信息集。例如,图像可以包括二维像素数据集,其包括图像中每个像素的像素位置、强度、对比度、亮度、颜色(例如,色调)等。该像素数据可以链接到捕获探针询问生物样品的捕获区域的已知位置(例如,空间条码化特征)。捕获探针的数据提供了数据元件530的数据的第三维方面。
在一些实施方式中,示例数据元件如图6中所示和所述。在该实施方式中,数据元件630包括由像素634的二维阵列组成的生物样品(为了简单起见未示出)的图像631。此实施方式中的图像631仅出于说明的目的而显示为像素阵列,因为显示与阵列中的每个像素相关的数据可能会破坏对登记过程的理解。
在一些实施方式中,数据元件630还包括来自基材632(例如,MxN阵列)的数据,基材632包括捕获区域(例如,空间条码化特征)101,其中捕获探针用于询问生物样品(其中参考“M”和“N”是大于“1”的整数,并且不必等于本文中指定的任何其他“M”和“N”参考)。来自这些捕获区域(例如,空间条码化特征)101的数据(例如,从中获得的条码化分析物的数据)被链接到图像631,以将条码化分析物数据登记到图像631的像素634的数据。例如,生物样品的捕获区域101-M-1包括来自多个条码化分析物102的数据。该捕获区域(例如,空间条码化特征)101-M-1被链接(633)到生物样品的图像631中的对应位置101-M-1(图像),从而将条码化分析物的数据登记到图像631的像素数据。在一些实施方式中,在条码化分析物102链接到图像的像素位置的情况下,可以定位各种基因或蛋白质,使得可以可视化或以其他方式识别基因或蛋白质表达(例如,疾病组织、健康组织、疾病和健康组织的边界等)。在一些实施方式中,在条码化分析物102链接到图像的像素位置的情况下,可以定位各种分析物,使得可以可视化或以其他方式识别TIL特异性分析物或TIL特异性分析物特征。
在一些实施方式中,从多个样品获得数据元件630可以适用于机器学习(例如,人工智能处理)。机器学习通常考虑计算机系统(例如计算系统501)用于执行特定任务的算法和统计模型,而不使用明确的指令,而是依赖于模式和推理。例如,机器学习算法可以基于样品数据建立数学模型,称为“训练数据”,以便在没有明确编程执行任务的情况下进行预测或决策。因此,现在返回图5,当从相似的样品(例如,人类)获得多个生物样品时,可以生成来自每个生物样品的数据元件630,以提供可以用于训练计算系统501的机器学习模块502的数据集520。
在一些实施方式中,机器学习模块502可以检测肿瘤浸润免疫细胞和/或识别生物样品中包括肿瘤浸润免疫细胞的各种感兴趣区域。在一个实施方式中,机器学习模块502可以对数据集520进行操作,以学习每个数据元件530中的图案,从而确定在数据元件530-I中是否存在类似的图案。例如,数据集520可以包括从一种样品类型的患病组织的生物样品获得的数据元件530。例如,患病组织包括癌性区域,该癌性区域包括TIL。机器学习模块502可以用数据集520的每个数据元件530进行训练,以学习图像数据中的图案以及可能发生在这种患病组织中的基因或蛋白质表达。此后,机器学习模块502可以将所学习的图案与数据元件530-I中的任何图案进行比较,使得输出模块503可以确定产生数据元件530-I的生物样品是否具有患病组织(例如,在组织样品中存在TIL)。在一些实施方式中,机器学习模块502可以用于通过使用监督学习来检测生物样品内的图案。例如,计算系统501的操作者可以识别样品的图像中与基因表达中的图案相对应的图案。操作者然后可以使用这些识别的图案来训练机器学习模块502,使得机器学习模块502可以在输入到机器学习模块502的后续数据元件530中检测类似的图案。在另一示例中,计算系统501的操作者可以识别样品的图像中的图案,该图案对应于一个或多个染色剂(例如,本文所述的示例性染色剂中的任何一个)的图案。操作员然后可以使用这些识别的图案来训练机器学习模块502,使得机器学习模块502可以在输入到机器学习模块502的后续数据元件530中检测类似的图案。
在一些实施方式中,训练数据甚至可以是或至少包括模拟数据。例如,关于例如疾病组织、健康组织、疾病和健康组织的边界等的生物过程的物理和生物学可以用作生成数据的规则,该数据可以以看起来像实际数据的方式进行格式化(例如,将条形码数据登记到图像数据)。该模拟数据可以单独使用,也可以与实际数据结合使用来训练机器学习模块502。
在一些实施方式中,机器学习模块502包括多种机器学习算法中的一种或多种。机器学习模块502可以实现的机器学习算法的非限制性示例包括:监督学习算法、半监督学习算法、无监督学习算法、回归分析算法、强化学习算法、自学习算法、特征学习算法、稀疏字典学习算法、异常检测算法、生成对抗性网络算法、迁移学习算法和关联规则算法。在一些实施方式中,机器学习模块502并不旨在局限于特定的机器学习算法。在一些实施方式中,可以由机器学习模块实现的机器学习算法的非限制性示例如Svensson等,NatureMethods,15:343-346(2018);Edsgard等,Nature Methods,15:339-324(2018);Sun等,NatureMethods,17(2):193-200(2020);J.N.R.Jeffers,J.Royal Stat.Society,SeriesD,22(4)(1973),doi:10.2307/2986827;Hongfei等,Geographical Analysis,39(4):357-275(2007);Solomon Kullback,《信息论与统计学》(Information TheoryandStatistics),ISBN 0-8446-5625-9(威利出版社(Wiley)1978)中所述,其全部内容通过引用并入本文。
在包括迁移学习算法的一些实施方式中,在解决一个问题时获得的知识可以应用于不同但相关的问题。例如,可以使用初始类型的数据(例如,图像数据、条形码数据等)来训练机器学习模块502,以识别基因表达和图像图案之间的关系。图像数据和基因表达之间的关系可以用于训练机器学习模块502以识别条形码数据和图像数据之间的关系。在一些实施方式中,机器学习模块不旨在限于任何特定类型或数据源,因为来自各种源和类型的数据可以用于训练机器学习模块502。
在一些实施方式中,图像数据可以用于训练机器学习模块502来识别样品中的位置,该位置可以包括样品中材料量的变化。例如,成像样品的部分可以包括比图像的其他部分更高的强度,例如荧光、光或颜色强度。这可能表明在该位置存在更多的分析物(例如,DNA、RNA、蛋白质)。然后,这种关系可以用于训练机器学习模块502来识别其他图像中的DNA密度。在另一个例子中,成像样品的部分可以包括比图像的其他部分更高的强度,从而指示在该位置有更多的mRNA。然后,这种关系可以用于训练机器学习模块502来识别其他图像中的mRNA密度。在又一个例子中,成像样品的部分可以包括比图像的其他部分更高的强度,从而指示在该位置有更多的蛋白质。然后可以使用这种关系来训练机器学习模块502以识别其他图像中的蛋白质密度。
图5和图7示出了计算系统500的示例性过程700。在该实施方式中,过程700以在过程元件701中生成多个生物样品的数据集520开始。例如,如本文所述,可以从特定的样品类型获得多个生物样品。在一些实施方式中,在生物样品中的多个不同位置(例如,捕获区域(例如,空间条码化特征)),来自生物样品的分析物与捕获探针结合,分析物被处理(例如,捕获探针延伸和第二链合成),从而在处理元件702中产生条码化分析物(例如,包括分析物或其互补序列的序列,以及条形码或其互补的序列)。在处理元件703中对样品进行成像,以产生二维像素阵列,可以从中提取像素数据。在一些实施方式中,在处理元件704中,根据捕获区域(例如,空间条码化特征)将与条码化分析物有关的数据登记到图像样品。
在一些实施方式中,在数据集520在手的情况下,计算系统501用数据集520并在过程元件706中训练机器学习模块502。一旦经过训练,机器学习模块502就可以用于在过程元件707中识别第一生物样品(例如,产生数据元件530-I的生物样品)中的感兴趣区域。例如,可以用与样品的健康组织样品有关的数据元件530来训练机器学习模块502,以便将数据元件530-I与数据集520的数据元件530进行比较和对比。
在一些实施方式中,多个生物样品中的生物样品是先前已被识别为具有存在于生物样品中免疫细胞浸润的样品。在一些实施方式中,多个生物样品中的生物样品是先前未被识别为在生物样品中存在免疫细胞浸润的样品。
在一些实施方式中,为生物样品生成数据集。在一些实施方式中,数据集包括但不限于(i)在生物样品的多个空间位置(例如,空间条码化特征)捕获的多个分析物的分析物数据(例如,其中生物样品是测试生物样品或一个或多个参考生物样品);(ii)图像数据,所述图像数据包括所述生物样品的所述多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据。在一些实施方式中,将数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块至少部分地经以下训练数据训练:包括来自一个或多个参考样品的参考分析物数据集的训练数据,和(3)一个或多个参考免疫细胞。在一些实施方式中,数据集用于训练机器学习模块。
如本文所用,“分析物数据”可指通过检测生物样品(例如,测试生物样品或一个或多个参考生物样品)中的一种或多种分析物而产生的数据,其中检测包括:将测试生物样品中的一个或多种分析物附着到捕获探针,其中捕获探针包括捕获域和空间条形码;以及确定(i)对应于分析物的序列的全部或部分,或其互补物,以及(ii)对应于空间条形码的序列的全部或部分,或其互补品,并且使用(i)和(ii)的所确定的序列来识别测试生物样品中分析物的丰度和/或空间位置。在一些实施方式中,分析物数据可以用于训练机器学习模块。
如本文所用,“图像数据”可以是指从获得生物样品的图像中生成的数据;以及将图像数据登记到空间位置。在一些实施方式中,图像数据包括在用一种或多种染色剂对生物样品进行染色之后获得图像。例如,一种或多种染色剂可以包括苏木精和伊红。在一些实施方式中,所述一种或多种染色剂包括一个或多个光学标记。光学标记的非限制性实例包括:荧光、放射性、化学发光、量热或比色标记。
在一些实施方式中,图像数据可以用于使用生物样品的一种或多种染色剂来识别生物样品中的一个或多个癌性区域。例如,图像数据可以包括获得用苏木精和伊红染色的生物样品的图像,其中该染色剂用于识别生物样品中的一个或多个癌性区域。
在一些实施方式中,图像数据可以用于使用生物样品的一种或多种染色剂来识别一个或多个癌性区域内的一个或多个基质区域。例如,图像数据可以包括获得用苏木精和伊红染色的生物样品的图像,其中该染色剂用于识别生物样品中一个或多个癌性区域中的一个或多个基质区域。
在一些实施方式中,图像数据被登记到分析物数据。如本文所用,“登记数据”是链接或编译本文所公开的数据集中的分析物数据和图像数据的数据。例如,根据图像数据和分析物数据的空间位置,将成像数据链接到分析物数据。在一些实施方式中,图像数据可以用于训练机器学习模块。
(b)在生物样品中生成分析物数据
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,其中所述方法包括生成分析物数据。在一些实施方式中,分析物数据来自癌性区域或与来自一个或多个癌性区域的癌性区域相关的分析物;基质区域或与来自生物样品中的一个或多个基质区域的基质区域相关的分析物;和/或一个或多个免疫细胞或与癌性区域和/或基质区域中的免疫细胞相关的分析物。在该方法包括生成分析物数据的一些实施方式中,该方法包括确定一个或多个癌症区域或与癌性区域相关的分析物的丰度;一个或多个基质区域或与基质区域相关的分析物;以及一个或多个免疫细胞或与免疫细胞相关的分析物;从而确定生物样品中的免疫细胞浸润。
(i)当分析物是核酸时生成分析物数据
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,其中该方法包括在基材上捕获核酸(例如,mRNA和gDNA)以鉴定免疫细胞浸润。在一些实施方式中,与相关联的分析物在一些实施方式中,用于确定生物样品中免疫细胞浸润的方法包括生成生物样品的数据集,包括:将来自癌症对象的生物样品与包含多个捕获探针的基材接触,其中所述生物样品包括(1)一个或多个癌性区域,(2)一个或多个基质区域,和(3)一个或多个肿瘤浸润免疫细胞,并且其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;将来自所述生物样品的核酸分子附着到所述捕获探针;确定(i)对应于核酸分子的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,并使用(i)和(ii)的所确定的序列来鉴定核酸分子在生物样品中的空间位置和丰度;以及基于与空间位置处的分析物相对应的所确定序列,将空间位置识别为簇的部分,并使用簇来分析患癌对象的癌症基质中的免疫细胞浸润。
在一些实施方式中,其中用于确定生物样品中免疫细胞浸润的方法包括基材上核酸分子的捕获,该方法包括使生物样品与包括多个捕获探针的基材接触,其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在用于确定位置的方法包括捕获基材上的核酸分子的一些实施方式中,该方法的确定步骤包括对(i)对应于与癌性区域相关的核酸分子,与基质区域相关的核酸分子,和/或与免疫细胞相关的核酸分子的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其补充物,并使用(i)和(ii)的确定的序列鉴定生物样品中的与癌性区域相关的核酸分子,与基质区域相关的核酸分子,和/或与免疫细胞相关的核酸核酸分子,或其互补物的丰度和/或空间位置。在一些实施方式中,测序包括原位测序。
在一些实施方式中,用于确定生物样品中免疫细胞浸润的方法,其中所述方法包括基于所述空间位置处的分析物的量和所述生物样品中多个不同空间位置处分析物的量来鉴定核酸的子集;以及基于在生物样品中的多个不同空间位置处的分析物的量将(d)的分析物的子集分选成簇,其中一个或多个簇包括与肿瘤浸润淋巴细胞表型相关的分析物,以及使用簇来识别肿瘤浸润淋巴细胞在生物样品中的空间位置。
在一些实施方式中,用于确定生物样品中免疫细胞浸润的方法包括基于空间位置处的分析物的量来鉴定分析物;以及基于生物样品中给定空间位置处的分析物的量将空间位置分配到簇中。在一些实施方式中,簇包括空间位置,其中分析物与肿瘤浸润免疫细胞表型相关。在一些实施方式中,簇包括空间位置,其中分析物与癌症细胞表型相关。在一些实施方式中,簇包括空间位置,其中分析物与基质细胞表型相关。在一些实施方式中,基于一个或多个癌症分析物、一个或多个基质区域分析物和/或免疫细胞分析物的存在,将空间位置分组为簇。在一些实施方式中,簇用于识别生物样品中的免疫细胞浸润。
可以使用许多方法来帮助识别簇。这种方法的非限制性示例包括非线性降维方法,例如t分布随机邻域嵌入(t-SNE)、全局t分布随机近邻嵌入(g-SNE)和均匀流形逼近与投影(UMAP)。
可以识别任意数量的簇。在一些实施方式中,可以使用本文所述的方法来识别2至500个簇。例如,可以识别2至10、2至20、2至50、2至75、至100、2至150、2至200、2至300、2至400、400至500、300至500、200至500、100至500、75至500、50至500或25至200个簇。在一些实施方式中,可以识别25至75、50至100、50至150、75至150或100至200个簇。在一些实施方式中,识别2至200个簇。在一些实施方式中,识别2至10个簇。
在一些实施方式中,使用原位测序来检测一种或多种分析物。原位测序通常涉及将标记的核苷酸(例如荧光标记的单核苷酸或二核苷酸)掺入到连续的,模板依赖性方式或标记的引物(例如,标记的随机六聚体)与核酸模板的杂交,从而标记的引物识别(即核苷酸序列)掺入的核苷酸或可以确定或标记的标记的引物延伸产物,并因此确定相应模板核酸的核苷酸序列。原位测序的各方面描述于例如Mitra等,(2003)Anal.Biochem.320,55-65,和Lee等,(2014)Science,343(6177),1360-1363,其中每一个的全部内容通过引用纳入本文。
此外,用于进行原位测序的方法和系统的实例描述于PCT专利申请公开号WO2014/163886、WO2018/045181、WO2018/445186以及美国专利号10138509和10179932中,其中每一个的全部内容通过引用纳入本文。原位测序的示例性技术包括但不限于STARmap(例如在Wang等,(2018)Science,361(6499)5691中描述)、MERFISH(例如在2017/0220733和Moffitt,(2016)Methods in Enzymology,572,1-49中描述),SeqFISH(例如在U.S.10,457,980中描述),杂交链式反应扩增(在U.S.8,507,204中描述)和FISSEQ(例如在美国专利申请公开号2019/0032121中描述)。上述各参考文献的全部内容通过引用纳入本文。
(ii)当分析物是蛋白质时生成分析物数据
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,其中该方法包括使用包括分析物结合部分和分析物结合部条形码的分析物捕获剂来识别免疫细胞浸润。在一些实施方式中,用于确定生物样品中免疫细胞浸润的方法包括生成生物样品的数据集,包括:用多种分析物捕获剂附着生物样品,其中所述多种分析物捕获试剂中的分析物捕获剂包括:(i)特异性结合与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的分析物结合部分;(ii)分析物结合部分条形码;和(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)所述捕获域和(ii)空间条形码;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在一些实施方式中,其中用于确定生物样品中免疫细胞浸润的方法包括使用分析物捕获剂,该方法包括:用多种分析物捕获试剂附着生物样品,其中所述多种分析物捕获剂中的分析物捕获剂包括:(i)特异性结合与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的分析物结合部分;(ii)分析物结合部分条形码;和(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)捕获域和(ii)空间条形码;将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;以及确定(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
在用于确定位置的方法包括使用分析物捕获剂的一些实施方式中,该方法的确定步骤包括测序(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,并使用(i)和(ii)的确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。在一些实施方式中,测序包括原位测序。
“分析物捕获剂”是指与目标分析物和捕获探针相互作用以识别分析物的分子。在一些实施方式中,分析物捕获剂包括标记(例如,荧光标记)。在一些实施方式中,分析物捕获剂可以包括分析物结合部分和捕获剂条形码结构域。分析物结合部分是能够与特定分析物结合的分子。在一些实施方式中,分析物结合部分包括抗体或抗体片段。在一些实施方式中,分析物结合部分包括多肽和/或适体。在一些实施方式中,分析物结合部分包括DNA适体。在一些实施方式中,分析物结合部分包括RNA适体。在一些实施方式中,分析物结合部分包括混合的天然或非天然存在的核苷酸(例如LNA、PNA)的适体。在一些实施方式中,分析物是蛋白质(例如,细胞表面上的蛋白质或胞内蛋白质)。在一些实施方式中,分析物结合部分是抗体或其抗原结合片段、细胞表面受体结合分子、受体配体、小分子、T细胞受体衔接体、B细胞受体衔接体、前体、适体、单体、结合物或DARPin。在一些实施方式中,该方法包括:使生物样品与荧光标记的抗体接触。
捕获剂条形码结构域可以包括分析物捕获序列,其可以与捕获探针的捕获域的至少部分或全部杂交。在一些实施方式中,分析物捕获序列包括聚(A)尾。在一些实施方式中,分析物捕获序列包括能够结合聚(T)结构域的序列。在一些实施方式中,分析物捕获序列的GC含量可以在1%-100%之间,例如,1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、35%、40%、45%、50%、60%、70%、80%等)。在一些实施方式中,分析物捕获序列的GC含量为至少30%。在一些实施方式中,可以向生物样品提供一组或多组分析物捕获剂,其中一组分析物捕集剂与另一组分析物捕获剂的不同之处在于分析物捕获序列。例如,分析物捕获序列A可以与分析物结合部分A相关联,分析物捕获序列B可以与分析物结合部分B相关联。在一些实施方式中,两组分析物捕获剂可以具有相同的分析物结合部分条形码序列。
在一些实施方式中,捕获域包括聚(T)尾。在一些实施方式中,捕获域包括能够结合聚(A)结构域的序列。在一些实施方式中,捕获域可以具有1%-100%之间的GC含量,例如,1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、35%、40%、45%、50%、60%、70%、80%等。在一些实施方式中,捕获域的GC含量为至少30%。
在一些实施方式中,捕获剂条形码结构域包括分析物结合部分条形码。分析物结合部分条形码是指与分析物结合部相关联或以其他方式识别分析物结合部分的条形码。在一些实施方式中,分析物结合部分条形码与分析物结合部的类型相关,使得一次可以向生物样品提供超过一组分析物捕获剂。例如,分析物结合部分条形码A可以与分析物结合部分A相关联,并且分析物结合部将条形码B与分析物连接部分B相关联。两组分析物捕获剂可以具有相同的分析物捕获序列(例如,聚(A))。在一些实施方式中,一个分析物结合部分条形码组与一个分析物捕获序列组相关联。在其他实施方式中,分析物结合部分条形码组不一定与分析物捕获序列组相关联。
在一些实施方式中,捕获剂条形码结构域包括任选的序列,例如但不限于PCR柄、测序启动位点、用于与另一核酸分子杂交的结构域及其组合。在一些实施方式中,PCR柄在所有捕获分析物条形码结构域上是相同的。在一些实施方式中,包括PCR柄用于PCR扩增。在一些实施方式中,分析物捕获剂包括一个或多个任选序列和一个或多个条形码序列(例如,一个或多个分析物结合部分条形码和/或一个或多个UMI)。在一些实施方式中,捕获探针捕获域和/或分析物捕获剂包括切割结构域。在一些实施方式中,可以通过经由捕获剂条形码结构域中的切割结构域将分析物结合部分从捕获剂条形码构造域切割来将捕获剂条形码域从分析物结合不分解离。本文描述了可用于空间蛋白质检测的分析物捕获剂的其他实施方式。
本文提供了用于在生物样品中对生物分析物(例如本文所述的任何分析物)进行空间分析的方法,该方法使用空间标记的分析物捕获剂。生物分析物可以被基材上不同空间位置的分析物捕获剂结合并被检测。结合的生物分析物然后可以与捕获探针的条形码在基材的不同空间位置处相关联。在一些实施方式中,这些方法可以包括从生物样品中的细胞的胞内区域、生物样品中细胞的细胞表面区域、生物样品中特定类型的细胞和生物样品的感兴趣区域中的一个或多个对生物分析物进行空间分析。
(a)阻断探针
在一些实施方式中,在将分析物捕获剂添加到生物样品之前,阻断捕获剂条形码域的分析物捕获序列。在一些实施方式中,在将分析物捕获剂添加到捕获探针阵列之前,阻断捕获剂条形码结构域的分析物捕获序列。在一些实施方式中,将阻断探针添加到阻断缓冲液或应用于IHC和/或IF方案中的其它溶液中。在一些实施方式中,阻断探针用于阻断或修饰捕获剂条形码结构域的游离3’端。在一些实施方式中,阻断探针用于阻断或修饰捕获剂条形码结构域的分析物捕获序列的游离3’端。在一些实施方式中,阻断探针可以与捕获剂条形码结构域的分析物捕获序列杂交,以掩蔽捕获剂条形码结构域的游离3’端。在一些实施方式中,阻断探针可以是发夹探针或部分双链探针。在一些实施方式中,捕获剂条形码结构域的分析物捕获序列的游离3′端可以通过化学修饰来阻断,例如,添加叠氮甲基作为化学可逆的封端部分,使得捕获探针不包括游离3′末端。在分析物捕获剂与基材接触之前,阻断或修饰捕获剂条形码结构域,特别是在捕获剂条形码结构域的游离3’端,防止分析物捕获序列与捕获探针捕获域结合(例如,防止分析物捕获序列聚(A)尾与聚(T)捕获域的结合)。
在一些实施方式中,阻断探针用于阻断或修饰捕获探针的游离3’端。在一些实施方式中,阻断探针用于阻断或修饰捕获探针捕获域的游离3’端。在一些实施方式中,在将分析物捕获剂添加到捕获探针阵列之前阻断分析物捕获序列。在一些实施方式中,将阻断探针添加到阻断缓冲液或应用于IHC和/或IF方案中的其它溶液中。在一些实施方式中,阻断探针可以与捕获域杂交以掩蔽捕获域的游离3’端。在一些实施方式中,阻断探针可以是发夹探针或部分双链探针。在一些实施方式中,捕获域的游离3’端可以通过化学修饰来阻断,例如,添加叠氮甲基作为化学可逆的封端部分,使得捕获探针不包括游离3’端。在分析物捕获剂与捕获探针阵列接触之前,阻断或修饰捕获域,特别是在捕获域的游离3’端,防止分析物捕获序列与捕获探针捕获域结合(例如,防止分析物捕获序列聚(A)尾与聚(T)捕获域相结合)。
在一些实施方式中,阻断探针可以被可逆地移除。例如,可以应用阻断探针来阻断捕获剂条形码结构域和/或捕获探针中的一个或两个的游离3′端。阻断分析物捕获剂和捕获探针阵列之间的相互作用可以减少IHC和/或IF应用中的非特异性背景染色。在分析物结合剂与目标分析物结合后,可以从捕获剂条形码结构域和/或捕获探针的3’端移除阻断探针,并且结合分析物的分析物结合剂可以迁移到捕获探针阵列并被捕获探针阵列结合。在一些实施方式中,去除包括使阻断探针从分析物结合部分条形码和/或捕获探针变性。在一些实施方式中,去除包括去除化学可逆的封端部分。在一些实施方式中,去除包括用RNA酶(例如,RNA酶H)消化阻断探针。
在一些实施方式中,阻断探针是寡聚(dT)阻断探针。在一些实施方式中,寡聚(dT)阻断探针可以具有15-30个核苷酸的长度。在一些实施方式中,寡聚(dT)阻断探针可以具有10-50个核苷酸,例如10-50、10-45、10-40、10-35、10-30、10-25、10-20、10-15、15-50、15-45、15-40、15-35、15-30、15-25、15-20、20-50、20-45、20-40、20-35、20-30、20-25、25-50、25-45、25-40、25-35、25-30、30-50、30-45、30-40、30-35、35-50、35-45、35-40、40-50、40-45或45-50个核苷酸的长度。在一些实施方式中,分析物捕获剂可以在不同的温度(例如,4℃和37℃)下被阻断。在一些实施方式中,当使用较短的阻断探针时,可以在较低的温度下更有效地阻断分析物捕获剂与捕获探针的结合。
(b)空间标记的捕获剂
“空间标记的分析物捕获剂”可以是与分析物(例如,样品中的分析物)和捕获探针相互作用以识别分析物的空间位置的分子。在一些实施方式中,空间标记的分析物捕获剂可以是具有延伸的捕获剂条形码结构域的分析物捕获剂,该延伸的捕获试剂条形码结构域包括与捕获探针的空间条形码互补的序列。在一些实施方式中,将分析物捕获剂同时引入分析物和捕获探针。在一些实施方式中,分析物捕获剂在不同时间被引入分析物和捕获探针。在一些实施方式中,在引入生物样品之前,空间标记的分析物捕获剂从捕获探针变性。在一些实施方式中,在空间标记的分析物捕获剂从捕获探针变性之前,空间标记的分析物捕获剂与生物样品内的生物分析物结合。在一些实施方式中,捕获探针在附着到空间标记的分析物捕获剂上时从基材上切割。在一些实施方式中,一旦捕获探针的捕获域与分析物结合部分条形码结合,分析物捕获序列就向3’尾延伸,以包括与捕获探针空间条形码的序列互补的序列(例如,产生空间标记的分析物捕获剂)。
例如,可以将分析物捕获剂引入生物样品,其中分析物结合部分与目标分析物结合,然后可以处理生物样品以从样品释放结合分析物的分析物捕获剂。结合分析物的分析物捕获剂然后可以迁移并结合到捕获探针捕获域,并且结合分析物的捕获试剂条形码结构域可以被延伸以在捕获试剂条形码结构域的末端产生空间条形码互补物。结合分析物的空间标记的分析物捕获剂可以从捕获探针变性,并使用本文所述的方法进行分析。
在另一个例子中,分析物捕获剂可以与捕获探针阵列上的捕获探针捕获域杂交,其中捕获剂条形码结构域被延伸为包括与捕获探针的空间条形码互补的序列。生物样品可以与分析物捕获剂修饰的捕获探针阵列接触。来自生物样品的分析物细胞可以从样品中释放,迁移到分析物捕获剂修饰的捕获探针阵列,并被分析物结合部分捕获。结合分析物的分析物捕获剂的捕获剂条形码结构域可以从捕获探针变性,并且生物样品可以根据本文所述的方法解离和空间处理。
在一些实施方式中,空间标记的分析物捕获剂可以通过亲脂性连接和共价连接的组合附着到细胞的表面。例如,空间标记的分析物捕获剂可以包括附着到脂质以将寡核苷酸靶向细胞膜的寡核苷酸,以及可以通过本文所述的任何数量的化学物质共价连接到细胞表面蛋白的胺基。在这些实施方式中,脂质可以增加寡核苷酸的表面浓度并且可以促进共价反应。
(c)在生物样品中生成图像数据
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,其中所述方法包括生成图像数据。在一些实施方式中,图像数据来自一个或多个癌性区域的癌性区域或与所述癌性区域相关的分析物;来自生物样品中的一个或多个基质区域的基质区域或与所述基质区域相关的分析物;和/或所述癌性区域和/或基质区域中的一个或多个免疫细胞或与免疫细胞相关的分析物。在该方法包括生成图像数据的一些实施方式中,该方法包括确定一个或多个癌症区域或与癌性区域相关的分析物;一个或多个基质区域或与基质区域相关的分析物;以及一个或多个免疫细胞或与免疫细胞相关的分析物的丰度;从而确定生物样品中的免疫细胞浸润。
在一些实施方式中,使用包括获得生物样品的图像的方法来生成图像数据;以及将图像数据登记到空间位置。在一些实施方式中,该方法包括基于图像数据识别(1)一个或多个癌性区域;和/或(2)一个或多个基质区域。在一些实施方式中,该方法还包括基于图像数据识别一个或多个免疫细胞。在一些实施方式中,获得生物样品的图像;以及将图像数据登记到空间位置。在一些实施方式中,还包括通过经过训练的机器学习模块识别一个或多个癌性区域和一个或多个基质区域。在一些实施方式中,该方法还包括通过经过训练的机器学习模块识别一个或多个免疫细胞。
在一些实施方式中,确定生物样品中免疫细胞的丰度包括:识别一个或多个癌症区域,包括:获取图像并将图像数据登记到空间位置,使用所确定序列的空间位置,或获取图像并把图像数据登记至空间位置,并且使用所确定的序列的空间位置;识别所述一个或多个基质区域,包括:获得图像并将图像数据登记到空间位置,使用所确定的序列的空间位置,或者获得图像并将图像数据登记到空间位置,并且使用所述所确定序列的空间位置;以及识别一种或多种免疫细胞浸润物的丰度,包括:获得图像并将图像数据登记到空间位置,使用所确定序列的空间位置,或者获得图像将图像数据登记到空间位置,并使用所确定的序列的空间位置。
在一些实施方式中,确定免疫细胞浸润的方法包括确定生物样品中免疫细胞的丰度。在一些实施方式中,生物样品中免疫细胞的丰度包括生物样品中细胞的约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%。在一些实施方式中,生物样品中免疫细胞的丰度包括癌症区域中细胞的约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%。在一些实施方式中,生物样品中免疫细胞的丰度包括基质区域中细胞的约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%。
在一些情况下,癌性区域和/或基质区域的生物标志物可用于确定癌性区域和/或基质区域。在某些情况下,可以使用免疫组织化学或免疫荧光来检测这些感兴趣的区域。在某些情况下,Pan-CK可以用于检测癌性区域。在某些情况下,CD45可用于检测基质区域。生物标志物(例如,蛋白质)检测的任何方法都可以用于确定感兴趣的区域,包括但不限于免疫荧光(即,使用一级和任选的二级抗体来观察生物标志物)。在一些情况下,本文提供了分别检测Pan-CK或CD45与癌性标志物或基质生物标志物的表达重叠的方法。在一些情况下,与Pan-CK表达重叠的癌性标志物包括PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42和WT1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。在一些情况下,与Pan-CK表达重叠的癌性标志物包括VTCN1、MECOM、TOP2A、XPO1、FUT8、SOX17、PBX1、EIF42和WT1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
在一些实施方式中,所述确定包括与经每空间位置细胞数量归一化的已知管家相比,鉴定与免疫浸润细胞相关的基因的量。在一些实施方式中,所述确定包括鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润B细胞(TIB)的比率。在一些实施方式中,所述确定包括基于包括与免疫浸润细胞相关的分析物的空间位置的百分比来计算生物样品中肿瘤浸润免疫细胞的丰度。
在一些实施方式中,一个或多个癌性区域的识别包括从图像数据中划分癌性区域。在一些实施方式中,一个或多个基质区域的识别包括从图像数据中划分基质区域。在一些实施方式中,一个或多个免疫细胞的识别包括从图像数据中划分免疫细胞。在一些实施方式中,使用划分和(i)获取图像并将图像数据登记到空间位置,(ii)使用所确定序列的空间位置,或(iii)获取图像并且将图像数据登记到空间位置,并使用所确定的序列的空间位置来确定癌症基质区域中的免疫细胞的丰度。
如本文所用,术语“划分”可以指将生物样品划分成多个区段(例如,但不限于,部分、分区、感兴趣区域和单个细胞)的过程。“分段”和“划分”可以互换使用。在一些实施方式中,划分包括确定一个或多个生物区段(例如,一个或多个癌性区域、一个或多个基质区域和一个或多个免疫细胞)的边界。在某些情况下,可以使用基因或蛋白质表达数据和/或使用经过训练的机器学习模块手动进行划分(例如,由病理学家进行视觉检查)。
(d)载玻片、生物样品和分析物
本公开的特征在于一种使用包括多个捕获探针的基材(例如,第一基材)来确定生物样品中免疫细胞浸润的方法,其中所述多个捕获探针中的捕获探针包括捕获域但不包括空间条形码。在一些实施方式中,捕获探针在5’端被固定到基材上。在一些实施方式中,多个捕获探针均匀地分布在基材的表面上。在一些实施方式中,多个捕获探针位于基材的表面上,但不根据图案分布在基材上。在一些实施方式中,基材(例如,第二基材)包括多个捕获探针,其中多个捕获探针中的捕获探针包括捕获域和空间条形码。
在一些实施方式中,捕获域包括与分析物或分析物衍生分子至少部分互补的序列。在一些实施方式中,捕获探针的捕获域包括聚(T)序列。在一些实施方式中,捕获域包括功能域。在一些实施方式中,所述功能结构域包括引物序列。在一些实施方式中,捕获探针包括切割结构域。在一些实施方式中,切割结构域包括可切割的接头,其选自可光切割接头、可UV切割接头,可酶切割接头或pH敏感的可切割接头。
在一些实施方式中,生物样品包括FFPE样品。在一些实施方式中,生物样品包括组织切片。在一些实施方式中,生物样品包括新鲜冷冻样品。在一些实施方式中,生物样品包括活细胞。
在一些实施方式中,生物样品包括脑组织、脊髓组织、皮肤组织、脂肪组织、肠组织、结肠组织、宫颈组织、阴道组织、肌肉组织、心脏组织、肝组织、胰腺组织、肾组织、脾脏组织、淋巴结组织、骨髓组织、软骨组织、视网膜组织、角膜组织、乳房组织、前列腺组织、膀胱组织、气管组织、肺组织、子宫组织、胃组织、甲状腺组织、胸腺组织或其组合。在一些实施方式中,生物样品从活检物中获得。活检样品的非限制性示例包括:核心针活检和细针抽吸。在一些实施方式中,生物样品是从外科切除术中获得的。在一些实施方式中,在内窥镜检查或阴道镜检查期间收集生物样品。在一些实施方式中,在内窥镜检查或结肠镜检查期间收集生物样品。在一些实施方式中,生物样品或包括脑脊液、全血、血浆和/或血清。
在一些实施方式中,生物样品(例如,参考生物样品或测试生物样品)是先前已被鉴定为包括癌性组织的样品。在生物样品先前已识别为包括癌性组织的一些实施方式中,生物样品代表癌症的特定阶段(例如,包括肿瘤大小T1、T2、T3或T4的肺癌阶段)。
本文提供的方法可应用于分析物或分析物衍生的分子,包括但不限于第二链cDNA分子(“第二链”)。在一些实施方式中,分析物或分析物衍生的分子包括RNA和/或DNA。在一些实施方式中,分析物是蛋白质。
本公开的特征在于用于确定生物样品中免疫细胞浸润的方法,其中所述方法包括确定与免疫浸润细胞相关的分析物的丰度和/或空间位置。与免疫浸润细胞相关的分析物的非限制性实例包括:BLK、CD19、FCRL2、MS4A1、KIAA0125、TNFRSF17、TCL1A、SPIB、PNOC、PTRPC、PRF1、GZMA、GZMB、NKG7、GZMH、KLRK1、KLRB1、KLRD1、CTSW、GNLY、CCL13、CD209、HSD11B1、LAG3、CD244、EOMES、PTGER4、CD68、CD84、CD163、MS4A4A、TPSB2、TPSAB1、CPA3、MS4A2、HDC、FPR1、SIGLEC5、CSF3R、FCAR、FCGR3B、CEACAM3、S100A12、KIR2DL3、KIR3DL1、KIR3DL2、IL21R、XCL1、XCL2、NCR1、CD6、CD3D、CD3E、SH2D1A、TRAT1、CD3G、TBX21、FOXP3、CD8A、CD8B、CD79A、CD79B、CD4、IGHA1、IGHG2、JCHAIN、IGKC、CD27、CD38、CD16、IL17RB、FANK1、CTLA4、MSR1、MRC1、NKG7、FCN1和TIGIT/LAG3。与免疫浸润细胞相关的分析物的非限制性实例还可以包括此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。在一些实施方式中,确定生物样品中免疫细胞浸润的方法包括识别与生物样品中的免疫浸润细胞相关的分析物的丰度和/或空间位置,包括确定管家分析物的丰富度和/或空间位置。可用于本文所述方法的管家分析物的非限制性实例如Eisenberg等,Trends in Genetics,29(10):569-574(2013)和Waxman等,BMC Genomics,8:243(2007)中所述,每种分析物的全部内容通过引用并入本文。在一些实施方式中,管家分析物可以包括但不限于甘油醛-3-磷酸脱氢酶(GAPDH)、TATA结合蛋白(TBP)和核糖体蛋白(RP)。在一些实施方式中,该方法包括鉴定生物样品中(例如,在一个或多个癌性区域中)与免疫浸润细胞相关的一种或多种分析物与管家分析物的比率。
本发明的特征在于确定免疫细胞是肿瘤浸润淋巴细胞(TIL)(例如T细胞)和/或B细胞(TIB)(例如,本文所述的任何示例性B细胞,包括浆细胞)的癌症患者的癌症基质中免疫细胞浸润的方法。TIL的非限制性实例如Guo等所述(J.Oncol.,doi:10.1155/2019/2592419(2019),其全部内容通过引用并入本文。
在一些实施方式中,TIL选自:(i)CD3+和CD4+T细胞;(ii)CD3+和CD8+T细胞;(iii)调节性T细胞,其包含CD4、Foxp3、IL17RB、CTLA4、FANK1、HAVCR1、CD25、CTLA-4、GITR、LAG-3和CD127中的一种或多种;(iv)TH1细胞,其包含CD4、CD3D、S100A4、IL7R和IFNG中的一种或多种;(v)TH2细胞,其包含CD4、IL7R、ICOS、CTLA4、TNFRSF4和TNFRS18中的一种或多种;(vi)TH17细胞,其包含CD4、CD3D、IL17A、GZMA和S100A4中的一种或多种;和(vii)细胞毒性T细胞,其包含CD8、CD3D、S100A4、IFNG、GZMB、GZMA和IL2RB中的一种或多种。
在一些实施方式中,肿瘤浸润B细胞(TIB)选自:(i)浆细胞,其包含MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种;(ii)Ig+B细胞,其包含IGHV3-74、SOCS3、JCHAIN和SPARC中的一种或多种;(iii)活化的B细胞,其包含CD79B、HMGB2、HMGB1、HMGN1和RGS13;和(iv)B细胞,其包含MEF2B、RGS13和MS4A1中的一种或多种。
本公开的特征在于鉴定浸润免疫细胞的丰度和/或空间位置的方法,其中浸润免疫细胞包括但不限于适应性免疫细胞(例如,T细胞或B细胞)和先天免疫细胞(如,自然杀伤(NK)细胞、巨噬细胞(例如,肿瘤相关巨噬细胞(TAM))、单核细胞和树突状细胞(DC))。浸润细胞的非限制性实例如Zhang等(Cellul.Mol.Immuno.,17:808-821(2020))中所述,其全文通过引用并入本文。
在一些实施方式中,免疫浸润细胞是NK细胞。NK细胞是先天性淋巴细胞,在宿主抵抗肿瘤生长的免疫反应中发挥作用。NK细胞可以包括Melaiu等,Front.Immunol.,10:1-18(2020)和Zhang等,Front.Immunol.11:1242(2020)中所述的属性,其全部内容通过引用并入本文。肿瘤浸润NK细胞的存在与多种人类实体瘤的良好预后有关。在一些实施方式中,NK细胞与NKG7分析物相关联。
在一些实施方式中,使用本文公开的方法鉴定的浸润性免疫细胞包括但不限于幼稚B细胞、记忆性B细胞、浆细胞(例如,浆细胞的标志物包括但不局限于CD79A、CD79B、CD38、CD27、MZB1、IGHA1、IGHG1、JCHAIN和IGKC)CD8 T细胞、CD4幼稚T细胞、CD4记忆-静息T细胞、CD4记忆-活化T细胞、滤泡辅助性T细胞、调节性T细胞(Treg)(例如,Treg的标志物包括但不限于FOXP3、IL17RB、CTLA4、FANK1和CD4)、γ-A T细胞、静息NK细胞、活化NK细胞、单核细胞、M0巨噬细胞、M1巨噬细胞、M2巨噬细胞、组织相关巨噬细胞(TAM)(例如,TAM的标志物包括但不限于CD163、MSR1和MRC1)、静息树突细胞、活化树突细胞、静息肥大细胞、活化肥大细胞、嗜酸性粒细胞、中性粒细胞及其任何组合。
在一些实施方式中,单核细胞标志物可以包括但不限于CD14、CD16和FCN1或其任何组合。在一些实施方式中,T细胞标志物包括但不限于CD3D、CD3E和CD4或其任何组合。在一些实施方式中,个体T细胞标志物包括但不限于CD4、CD8、TIGIT和LAG3。在一些实施方式中,B细胞标志物包括但不限于CD19、CD79A和CD79B或其任何组合。在一些实施方式中,癌症标志物可以包括但不限于BRCA1和BRCA2或其任何组合。
在一些实施方式中,该方法还包括鉴定生物样品中一种或多种TIL与一种或多种TIB的比率。本领域技术人员将理解覆盖TIB与TIL的反比的比率。TIL与TIB的比率可以包括生物样品内感兴趣区域的比率。在某些情况下,感兴趣区域可以包括生物样品。可以针对生物样品计算TIL与TIB的一个或多个比率。例如,两个或更多个感兴趣区域中的每个感兴趣区域都包括TIL与TIB的比率。在一些实施方式中,TIL与TIB的比率可以与预后结果相关。
在一些实施方式中,该方法还包括鉴定生物样品中一种或多种肿瘤浸润T细胞与一种或多种TIB的比率。本领域技术人员将理解覆盖TIB与肿瘤浸润T细胞的反比的比率。肿瘤浸润T细胞与TIB的比率可以包括生物样品内感兴趣区域的比率。在某些情况下,感兴趣区域可以包括生物样品。可以针对生物样品计算肿瘤浸润T细胞与TIB的一个或多个比率。例如,两个或更多个感兴趣区域中的每一个均包括肿瘤浸润T细胞与TIB的比率。在一些实施方式中,肿瘤浸润T细胞与TIB的比率可以与预后结果相关。
在一些实施方式中,该方法还包括鉴定生物样品中一个或多个TIL和/或一个或多个TIB与一个或多个基质区域和/或一个癌性区域的比率。本领域技术人员将理解覆盖基质区域和/或癌性区域与TIL和/或TIB的反比的比率。TIL和/或TIB与基质区域和/或癌性区域的比率可以包括生物样品内感兴趣区域的比率。在某些情况下,感兴趣区域可以包括生物样品。在一些情况下,可以为生物样品计算TIL和/或TIB与基质区域和/或癌性区域的一个或多个比率。例如,两个或更多个感兴趣区域中的每一个均包括TIL和/或TIB与基质区域和/或癌性区域的比率。在一些实施方式中,TIL和/或TIB与基质区域和/或癌性区域的比率可以与预后结果相关。
在一些实施方式中,用于确定免疫细胞浸润的方法包括识别与癌性区域相关的分析物的丰度和/或空间位置。与癌性区域相关的分析物的非限制性实例包括:SCGB2A1、MKI67、BRCA1、BRCA2、PIKCD、CALML6、MYC、TP53、PALB2、RAD51和/或MSH2。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。与癌性区域相关的分析物的其他非限制性实例包括(除了本段中先前列出的标志物之外/与该段中先前列出的标志物组合)SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和/或CALML6。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。在一些情况下,与癌性区域相关的分析物的其他非限制性实例包括(除了本段中先前列出的标志物之外/与本段中先前列出的标志物结合)PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42和/或WT1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。在一些情况下,与癌性区域相关的分析物的其他非限制性实例包括(除了本段中先前列出的标志物之外/与本段中先前列出的标志物组合)VTCN1、MECOM、TOP2A、XPO1、FUT8、SOX17、PBX1、EIF42和WT1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
此类分析物的其它非限制性实例描述于https://www.cancer.gov/about-cancer/diagnosis-staging/diagnosis/tumor-markers-list,其全部内容通过引用纳入本文。在一些实施方式中,与癌性区域相关的分析物选自包括来自AKT途径的分析物、来自JAK-STAT途径的分析物和来自Notch途径的分析物的组。
在一些实施方式中,用于确定免疫细胞浸润的方法包括识别与基质区域相关的分析物的丰度和/或空间位置。与基质区域相关的分析物的非限制性实例包括:VIM、EPCAM、FAP和CDH1。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。与基质区域相关的分析物的其他非限制性实例包括:FAP、VCAN、ACTA2和PDGFRB。与免疫浸润细胞相关的分析物的非限制性实例还可包括其此类分析物的副产物、前体和降解产物,以及此类分析物及其副产物、前体和降解产物的任何组合。
在一些实施方式中,该方法包括鉴定上皮细胞粘附分子(EPCAM;NCBI基因ID:4072)和波形蛋白(VIM;NCBI基因组ID:7431)的表达。在一些实施方式中,该方法包括与相同生物样品的其他区域中的相同基因的表达相比,鉴定EPCAM的上调(例如,过表达)和VIM的下调(例如,低表达)。在一些实施方式中,该方法包括与相同生物样品的其他区域中的相同基因的表达相比,鉴定VIM的上调(例如,过表达)和EPCAM的下调(例如,低表达)。在一些情况下,本文公开的任何一种或组合或癌性或基质生物标志物可以使用本文公开的空间方法在EPCAM或VIM表达的位置处确定。
在一些实施方式中,该方法包括鉴定上皮细胞粘附分子(EPCAM;NCBI基因ID:4072)和成纤维细胞活化蛋白(FAP;NCBI基因ID:2191)的表达。在一些实施方式中,该方法包括与相同生物样品的其他区域中的相同基因的表达相比,鉴定EPCAM的上调(例如,过表达)和FAP的下调(即,低表达)。在一些实施方式中,该方法包括与相同生物样品的其他区域中的相同基因的表达相比,鉴定FAP的上调(例如,过表达)和EPCAM的下调(例如,低表达)。在一些情况下,本文公开的任何一种或组合或癌性或基质生物标志物可以使用本文公开的空间方法在EPCAM或FAP表达的位置处确定。
在一些实施方式中,该方法包括鉴定VIM、CDH1和FAP的表达。在一些情况下,可以使用本文公开的空间方法在EPCAM、CDH1或VIM表达的位置处确定本文公开的任何一种或组合或癌性或基质生物标志物。
在一些实施方式中,该方法包括鉴定C型蛋白酪氨酸磷酸酶受体(CD45;NCBI基因ID 5788)的表达。在一些实施方式中,该方法包括CD45多肽的上调(例如,过表达)。在一些情况下,该方法包括CD45多肽的下调(例如,低表达)。在一些实施方式中,该方法包括鉴定人角蛋白(例如,使用广谱细胞角蛋白抗体或抗原结合片段)。在某些情况下,使用广谱细胞角蛋白抗体或抗原结合片段检测角蛋白可用于区分上皮性肿瘤和非上皮性肿瘤。可被识别的角蛋白的非限制性实例包括:I型或LMW细胞角蛋白、碱性(II型或HMW)细胞角蛋白(例如CK1、CK3、CK4、CK5、CK6、CK8、CK10、CK14、CK15、CK16和CK19)。CD45是一种泛白细胞标志物,存在于肿瘤切片的基质中,可作为肿瘤基质的标志物。在一些实施方式中,用于确定免疫细胞浸润的方法包括鉴定与肿瘤基质区域相关的分析物的丰度和/或空间位置。在一些实施方式中,分析物是CD45。
在一些实施方式中,该方法还包括使生物样品与一种或多种染色剂接触。在一些实施方式中,一种或多种染色剂包括组织学染色剂(例如,本文所述或本领域已知的任何组织学染色)。在一些实施方式中,一种或多种染色剂包括苏木精和伊红。在一些实施方式中,一种或多种染色剂包括一种或多种光学标记(例如,本文所述的任何光学标记)。在一些实施方式中,所述一种或多种光学标记选自:荧光标记、放射性标记、化学发光标记、量热标记或比色标记。
在一些实施方式中,该方法还包括使用生物样品的一种或多种染色剂来识别生物样品中的一个或者多个癌性区域。在一些实施方式中,该方法还包括使用生物样品的一种或多种染色剂识别一个或多个癌性区域内的一个或多个基质区域。
在一些实施方式中,该方法还包括基于生物样品中TIL的丰度和/或位置来确定对象中癌症的预后。
在一些实施方式中,该方法还包括基于生物样品中TIL的丰度和/或位置对对象的癌症严重程度进行评分或确定。
(e)治疗方法
在一些实施方式中,所述方法可以进一步包括为对象选择治疗。在一些实施方式中,所述方法可进一步包括对对象实施癌症治疗。在一些实施方式中,癌症的治疗可以是降低癌症进展速度的治疗。在一些实施方式中,癌症的治疗可以包括手术、放射治疗、化疗、靶向药物治疗和肿瘤治疗场(TTF)治疗。
在一些情况中,本文公开的方法包括使用一种或多种治疗剂治疗患有癌症的对象。治疗剂的实例包括但不限于,例如,化学治疗剂、生长抑制剂、细胞毒剂、放射治疗用剂、抗血管生成剂、癌症免疫治疗剂、凋亡剂、抗微管蛋白剂和治疗癌症的其他药剂(例如抗体),例如抗HER-2抗体、抗CD20抗体、表皮生长因子受体(EGFR)拮抗剂(例如酪氨酸激酶抑制剂)、HER1/EGFR抑制剂(例如埃洛替尼血小板衍生生长因子抑制剂(例如 (甲磺酸伊马替尼))、COX-2抑制剂(例如塞来昔布)、干扰素、CTLA-4抑制剂(例如抗CTLA抗体易普利木单抗/>)、PD-1抑制剂(例如,抗PD-1抗体,BMS-936558),PD-L1抑制剂(例如,抗PD-L1抗体,MPDL3280A)、PD-L2抑制剂(例如抗PD-L2抗体)、TIM3抑制剂(例如抗TIM3抗体)、细胞因子、与以下靶标中的一个或多个结合的拮抗剂(例如,中和抗体):ErbB2、ErbB3、ErbB4、PDGFRβ、BlyS、APRIL、BCMA、PD-1、PD-L1、PD-L2、CTLA-4、TIM3或VEGF受体、TRAIL-Apo2,以及其他生物活性和有机化学试剂等。在某些情况下,治疗或疗法包括手术、化疗剂、生长抑制剂、细胞毒剂、放射治疗用剂、抗血管生成剂、癌症免疫治疗剂、凋亡剂、抗微管蛋白剂或其组合。
在某些情况下,化疗剂被提供给患有癌症的患者作为治疗。非限制性示例性化疗剂包括用于调节或抑制激素对癌症的作用的抗激素剂,例如抗雌激素和选择性雌激素受体调节剂(SERM),包括例如他莫昔芬(包括他莫昔芬)、雷洛昔芬、屈洛昔芬、4-羟基三苯氧酯、三苯氧烯、雷洛昔芬、LY117018、奥那普利斯通和/>托雷米芬;抑制芳香化酶的芳香化酶抑制剂,芳香化酶调节肾上腺中雌激素的产生,例如,4(5)-咪唑、氨基谷丙酰胺、/>甲地孕酮乙酸酯、/>依西美坦、福美斯坦、法屈唑、/>伏罗唑、/>来曲唑和/>阿那曲唑;以及抗雄激素,如氟他胺、尼罗他胺、比卡鲁他胺、亮丙瑞林和戈瑟林;以及曲卡他滨(1,3-二氧戊环核苷胞嘧啶类似物);反义寡核苷酸,特别是那些抑制与异常细胞增殖有关的信号途径中的基因表达的反义寡核苷酸(例如PKCα、Ralf和H-Ras);核酶如VEGF表达抑制剂(例如/>核酶)和HER2表达抑制剂;疫苗,例如基因治疗疫苗,例如/>疫苗、/>疫苗和/>疫苗;rIL-2;/>拓扑异构酶1抑制剂;/>rmRH;以及上述任何一种的药学上可接受的盐、酸或衍生物。
在一些实施方式中,对肿瘤病灶局部给予放射治疗,以增强对象肿瘤的局部免疫原性(例如,辅助放射)和/或杀死肿瘤细胞(例如,消融放射)。在某些情况下,对对象进行全身放射治疗。在某些情况下,放射治疗是断层治疗、立体定向放射、调强放射治疗(IMRT)、低划分放射治疗、缺氧引导放射治疗和/或质子治疗。在某些情况下,辐射后给予第二种治疗(例如化疗、免疫疗法)。在一些情况下,辐射与第二种治疗(例如化疗、免疫疗法)的给药同时提供。
在一些情况下,上述治疗剂中的任何一种是在其他治疗模式之前、基本上同时或之后提供的,例如手术、化疗、放射治疗或生物制剂(如另一种治疗性抗体)的给药。在一些实施方式中,在选自手术、化疗和放射治疗或其组合的治疗后,癌症复发或进展。
在一些情况中,如本文所讨论的,为了治疗癌症,抗体与一种或多种其他抗癌剂(例如化疗剂、生长抑制剂、抗血管生成剂和/或抗肿瘤组合物)一起给与。化疗剂、生长抑制剂、抗血管生成剂、抗癌剂和抗癌组合物的非限制性示例。
在一些实施方式中,所述方法可进一步包括用癌症诊断更新对象的临床记录。在一些实施方式中,所述方法可以进一步包括将对象纳入临床试验。在一些实施方式中,所述方法可以进一步包括将诊断告知对象的家属。在一些实施方式中,所述方法可以进一步包括评估或推荐对象加入支持性护理计划或护理机构。在一些实施方式中,所述方法可以进一步包括更频繁地监测对象。
在一些实施方式中,所述方法可进一步包括监测所识别的对象的癌症症状的发展。在一些实施方式中,所述方法可进一步包括在所识别对象的临床记录中记录对象发生癌症的可能性增加。在一些实施方式中,所述方法还可以包括通知对象的家属对象发生癌症的可能性或敏感性增加。
在一些实施方式中,所述方法可进一步包括向对象给与治疗以降低进展速度或降低发生癌症的可能性。在一些实施方式中,癌症的治疗可以包括手术、放射治疗、化疗、手术、放射疗法、化疗、靶向药物治疗和肿瘤治疗场(TTF)治疗。在一些实施方式中,可测试对象是否存在已知与癌症风险相关的基因突变。
在一些实施方式中,所述方法可以进一步包括执行一个或多个测试以进一步确定对象患癌症的风险。进一步确定对象患癌症风险的更多测试的非限制性示例包括检测与癌症相关的基因突变(例如,与1型神经纤维瘤病、Turcot综合征或Li-Fraumeni综合征相关的突变),确定其他生物标志物(例如脑组织、脑脊液或血液或其成分中的生物标志物)的水平表明癌症发病风险增加,也表明癌症发病风险增加。
在一些实施方式中,所述方法可进一步包括更新对象的临床记录以指示发生癌症的风险增加。在一些实施方式中,所述方法可进一步包括将对象纳入临床试验(例如,用于早期治疗和/或预防癌症)。在一些实施方式中,所述方法可进一步包括告知对象的家属对象发生癌症的可能性。在一些实施方式中,所述方法可以进一步包括更频繁地监测对象。
在某些实施例中,根据本文所述方法治疗的癌症包括但不限于前列腺癌症、乳腺癌症、肺癌、结直肠癌、黑色素瘤、支气管癌症、膀胱癌症、脑或中枢神经系统癌症、周围神经系统癌症、子宫或子宫内膜癌症、口腔或咽部癌症、非霍奇金淋巴瘤、甲状腺癌症、肾癌症、胆道癌症、小肠或阑尾癌症、唾液腺癌症、甲状腺癌症、肾上腺癌症、鳞状细胞癌症、间皮瘤、骨癌、甲状腺/胸腺癌、胶质母细胞瘤、骨髓增生异常综合征、软组织肉瘤、DIPG、腺癌、骨肉瘤、软骨肉瘤、白血病或胰腺癌症。在一些实施方式中,根据本文所述方法治疗的癌症包括癌(例如腺癌)、淋巴瘤、母细胞瘤、黑色素瘤、肉瘤或白血病。在某些实施例中,根据本文所述方法治疗的癌症包括鳞状细胞癌症、小细胞癌症、非小细胞肺癌、胃肠道癌症、霍奇金淋巴瘤、非霍奇金淋巴瘤、胰腺癌症、胶质母细胞瘤、胶质瘤、宫颈癌症、卵巢癌症、肝脏癌症(例如,肝癌和肝细胞瘤)、膀胱癌症、乳腺癌症、炎性乳腺癌、梅克尔细胞癌、结肠癌、结直肠癌、胃癌、膀胱癌症、子宫内膜癌、骨髓瘤(如多发性骨髓瘤)、唾液腺、癌、肾癌(如肾细胞癌和威尔姆斯瘤)、基底细胞癌、黑色素瘤、前列腺癌症、外阴癌症、甲状腺癌症、睾丸癌症、食管癌症、浆液腺癌或各种类型的头颈部癌症。在某些实施例中,根据本文所述方法治疗的癌症包括结缔组织增生性黑色素瘤、炎性乳腺癌症、胸腺瘤、直肠癌、肛门癌症或可手术治疗或非手术治疗的脑干胶质瘤。
(f)试剂盒和系统
在一些实施方式中,本文还提供了包括一种或多种试剂的试剂盒,所述试剂用于检测如本文所述的与癌性区域和一个或多个基质区域相关的任何细胞和/或生物标志物中的一种或多种的水平。在一些实施方式中,本文还提供了包括一种或多种试剂的试剂盒,所述试剂用于检测如本文所述的与癌性区域和一个或多个基质区域相关的任何细胞和/或生物标志物中的一种或多种的水平。
在一些实施方式中,试剂可以包括一种或多种抗体(和/或抗原结合抗体片段)、标记的杂交探针和引物。例如,在一些实施方式中,抗体(和/或抗原结合抗体片段)可用于可视化组织样品的一个或多个特征(例如,通过使用免疫荧光或免疫组织化学)。在一些实施方式中,抗体(和/或抗原结合抗体片段)可以是分析物结合部分,例如作为分析物捕获剂的部分。例如,在一些实施方式中,试剂盒可以包括抗PMCH抗体,例如产品编号HPA046055(AtlasAntibodies),目录号PA5-25442、PA5-84521、PA5-83802(ThermoFisherScientific)或产品编号AV13054(MilliporeSigma)。其他有用的市售抗体对于本领域技术人员来说是显而易见的。
在一些实施方式中,标记的杂交探针可用于一种或多种生物标志物和/或候选生物标志物的原位测序。在一些实施方式中,引物可用于扩增(例如克隆扩增)捕获的寡核苷酸分析物。
在一些实施方式中,试剂盒可以进一步包括用于执行本文提供的任何方法或步骤的说明书。在一些实施方式中,试剂盒可以包括具有一个或多个捕获探针的基材,所述捕获探针包括空间条形码和与来自组织样品的生物分析物结合的捕获域,以及用于检测生物分析物的试剂,其中所述生物分析物是本公开的任何生物标志物。在一些实施方式中,试剂盒进一步包括但不限于一种或多种抗体(和/或抗原结合抗体片段)、标记的杂交探针、引物或其任何组合,用于观察组织样品的一个或多个特征。
本文还描述了包括一个或多个存储元件(例如,一个或多个存储设备)和一个或多个处理器的系统。存储元件可以存储多个生物样品的数据集。对于每个生物样品,数据集可以包括在参考生物样品的多个空间位置捕获的多个分析物的分析物数据。数据集可以进一步包括生物样品的图像数据。此外,数据集可以包括根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据。生物样品可以包括参考生物样品中的一个或多个癌性区域、一个或多个癌性区域内的一个或多个基质区域、和/或一个或多个肿瘤浸润淋巴细胞(TIL)。处理器可以通过机器学习模块处理数据集,以训练机器学习模块,从而确定生物样品中的免疫细胞浸润。
实施例
实施例1-生物样品中肿瘤浸润淋巴细胞的检测
本实施例提供了确定测试生物样品的癌症基质中免疫细胞浸润的示例性方法。在非限制性示例中,将测试生物样品与包括多个捕获探针的基材接触,其中所述多个捕获探针中的捕获探针包括空间条形码。生物样品被透化,并且使来自测试生物样品的分析物与捕获探针杂交。捕获探针被延伸,并且产生包括分析物序列或其互补物的第二链。
与分析物相对应的序列的全部或部分,或其互补物,以及(ii)与空间条形码相对应的测序的全部或部分,或其互补物,和(i)和(ii)的所确定序列用于识别测试生物样品中分析物的丰度和/或空间位置。
在包括多个生物样品的数据集上训练机器学习模块。机器学习模块在生物样品包括以下数据的数据上进行训练:(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;(ii)图像数据,所述图像数据包括所述生物样品的多个空间位置的图像;以及(iii)将分析物数据链接到图像数据的登记数据。所述多个生物样品包括参考生物样品,其中参考生物样品包括:(1)参考生物样品中的一个或多个癌性区域,(2)一个或多个癌性区域中的零或一个或多个基质区域,和(3)零或一个或多个免疫浸润细胞。根据图7所示的过程,使用数据集对机器学习模块进行训练,从而产生经过训练的机器学习模块。经过训练的机器学习模块然后用于至少部分基于测试生物样品中分析物的丰度和/或位置来确定生物样品中的免疫细胞浸润。
实施例2-使用基因簇确定浸润免疫细胞
本实施例提供了确定测试生物样品的癌症基质中免疫细胞浸润的示例性方法。使用实施例1中所述的组织检测机器学习模块来识别生物样品内的癌性区域。癌性区域也可以由病理学家通过肉眼或通过确定癌症基因表达特征来识别(例如,使用本文所述或本领域已知的任何方法)。
接下来,使用组织检测机器学习模块、病理学家肉眼或通过确定基质基因表达特征(例如,使用本文所述或本领域已知的任何方法)来识别癌症区域内的基质区域。
测试生物样品与包括多个捕获探针的基材接触,其中所述多个捕获探针中的捕获探针包括空间条形码。生物样品被透化,并且来自测试生物样品的分析物与捕获探针杂交。捕获探针被延伸,并且产生包括分析物序列或其互补物的第二链。
确定与分析物相对应的序列的全部或部分,或其互补物,以及(ii)与空间条形码相对应的序列的全部或部分,或其互补物,并且所确定的序列鉴定与免疫浸润细胞相关的基因簇。基质癌症区域中浸润免疫细胞的丰度按生物样品面积的百分比(0-100%)计算。基质癌症区域中免疫浸润细胞的丰度能预测临床转归。
实施例3-确定卵巢腺癌中免疫细胞浸润物、癌症生物标志物和基质隔室生物标志物的位置
本实施例提供了一种示例性方法,用于使用免疫荧光和空间分析来确定患有癌症的患者的癌症基质中的免疫细胞浸润。生物样品是卵巢的子宫内膜腺癌。根据AJCC/UICC分期,肿瘤为T1N0M0(https://www.cancer.gov/about-cancer/diagnosis-staging/staging),AJCC/UICC阶段组I。卵巢组织切片用广谱细胞角蛋白(Pan-CK)抗体(Biolegend)和/或抗CD45的抗体(Biolegend)和DAPI染色(图8,上图;也见图28B)。Pan-CK用于识别组织切片中的肿瘤隔室,CD45用于识别肿瘤基质隔室。还使用10x Genomics Visium Spatial基因表达平台对组织切片进行基因表达分析(图8,下图)。将空间基因表达数据进行无监督k均值聚类为两个簇。簇1与Pan-CK免疫染色(肿瘤)隔室强相关,而簇2与CD45免疫染色(基质)隔室强相关。参见图28A和图28B。分析基因表达。图28C显示簇1(与Pan-CK免疫染色阳性的肿瘤隔室相关)(热图的顶行)和簇2(CD45免疫染色阳性基质隔室)(热图的底行)中差异表达基因的热图。表1-4列出了来自簇1和簇2的前20个上调和前20个下调的基因。
表1.簇1的前20个上调的基因
表2.簇2的前20个上调的基因
/>
表3.簇1的前20个下调的基因
/>
表4.簇2的前20个下调的基因
/>
将空间基因表达数据进一步进行无监督的基于图的聚类,分为九个簇。如图28D所示,簇1、4、6、7和9与表达Pan-CK的肿瘤隔室相关,簇2、3、5和8与表达CD45的基质隔室相关。图28E是显示每个簇中各种基因的相对基因失调的热图。表5和表6列出了每个簇的前20个上调基因和前20个下调基因(1-9)。
表5.每个簇(1-9)的前20个上调的基因
/>
/>
/>
/>
/>
/>
/>
/>
表6.每个簇(1-9)的前20个下调的基因
/>
/>
/>
/>
/>
/>
/>
如图9所示,Pan-CK染色(左图)与空间测序确定的癌症细胞标志物SCGB2A1、MKi67、BRCA1、BRCA2、PIK3CD和CALML6(右图)的表达相关。
如图10A-10D所示,评估了使用靶向组的基因表达谱的质量和深度。图10A显示了Visium全转录组基因表达文库的点簇。图10B(上图)显示了人免疫学组靶向文库的点簇。图10B的下图显示了本体全转录组分析(WTA)和免疫学靶向分析之间每个基因的log10UMI计数的皮尔逊相关性(R2=0.987)。图10C显示了人类基因特征组靶向文库的点簇。图10C的下图显示了本体全转录组分析(WTA)和基因特征靶向分析之间每个基因的log10UMI计数的皮尔逊相关性(R2=0.987)。图10D显示了人类胰腺癌组靶向库的点簇(7簇,左上;或6簇,右上)。图10D的下图显示了本体全转录组分析(WTA)和泛癌症靶向分析之间每个基因的log10UMI计数的皮尔逊相关性(R2=0.992)。
肿瘤浸润免疫细胞定位的确定
上述方法用于通过部分鉴定测试生物样品中肿瘤浸润T淋巴细胞和肿瘤浸润B细胞(TIB)的丰度和/或位置来确定生物样品中的免疫细胞浸润。使用B细胞标志物CD19、CD79A和/或CD79B的基因表达来检测TIB。使用基因表达T细胞标志物CD3D、CD3E、CD4和/或CD8A检测肿瘤浸润T淋巴细胞。在簇4中观察到B细胞标志物的表达(图11A),并定位于CD45+隔室内的特定区域(图11B),其中在簇4、5和6中观察到T细胞标志物表达(图11C),并存在于整个组织中(图11D)。覆盖有用Pan-CK和CD45染色的组织切片的其他T细胞标志物显示在整个卵巢肿瘤切片中存在T细胞(图12A-12B)。由于肿瘤浸润免疫细胞也可能包括肿瘤浸润单核细胞,单核细胞标志物CD14的空间位置用Pan-CK和CD45染色的组织切片覆盖(图13)。观察特异性T细胞标志物显示CD4的基因表达仅限于簇3(图14,下图)并且存在于整个样品中(图14,上图),并且CD8A的基因表达不富集于任何簇中(图15,下图),而是遍布整个样品(图15,上图)。
上述方法也用于确定生物样品中适应性免疫细胞的存在和/或丰度。血浆B细胞显示聚类在基质隔室的特定区域,表明生物样品中的B细胞对肿瘤有反应。图16A显示了浆细胞标志物的基因表达:CD79A、CD79B、CD38、CD27、MZB1、IGHA1、IGHG1、JCHAIN和IGKC(上图)。图16B显示了JCHAIN的基因表达热图(左下图),图16C显示了CD45在相同组织切片中的表达。使用CD14和CD16(FCGR3A)检测单核细胞(图17A-B),并用DAPI、Pan-CK和CD45的免疫染色覆盖(图17C)。使用FOXP3、IL17RB、CTLA4、FANK1和CD4在样品中鉴定T调节(Treg)细胞(图18,左图),并使用CD163、MSR1和MRC1鉴定肿瘤相关巨噬细胞(TAM)(图18,右图)。使用NKG7鉴定自然杀伤(NK)细胞(图19,左图),并与Pan-CK和CD45染色合并,如图19,中图所示。卵巢肿瘤样品中NK细胞的丰度为5%(计数177个NK条形码),相比之下,乳腺浸润性导管癌样品中为13%(图19,右图))。
肿瘤样品中存在的TIL的不同亚群通过CD4、CD8A和TIGIT/Lag3的存在来指示(图20)。将CD4、CD8A和TIGIT/Lag3基因表达热图与用CD45染色的组织切片合并以显示TIL类型和TIL位置的多样性(图20)。
免疫细胞表达与Pan-CK或CD45共定位。Pan-CK或CD45免疫染色显示于图31A中。如图31B-31K所示,本文的结果显示Pan-CK和CD45的共定位表达与以下的表达:一般T细胞标志物CD3D、CD3E、CD4、CD8A和CD247(图31B);辅助性T细胞标志物CD4(图31C);细胞毒性T细胞标志物CD8A(图31D);Treg细胞的标志物(图31E);B细胞的标志物(图31F);血浆B细胞的标志物(图31G);NK细胞的标志物(图31H)、CD14单核细胞的标志物(图31I);CD16单核细胞的标志物(图31J);和TAM的标志物(图31K)。图31B显示分散在整个Pan-CK和CD45隔室的T细胞,而图31F和31G显示定位于基质隔室的B细胞。这些图像证明了确定与样品中的基质和肿瘤隔室重叠的免疫细胞浸润的能力。
本文所述的方法还用于显示免疫细胞标志物的共表达可以用作免疫细胞共定位的替代物(图21)。
基质细胞定位的确定
利用成纤维细胞活化蛋白(FAP)和钙粘蛋白-1(CDH1)的空间基因表达,在卵巢癌症组织切片中确定基质细胞的丰度和/或位置。在簇4、5和8中观察到FAP表达(图22A),并显示出一些特异性定位(图22B)。CDH1在每个簇中都有表达,这可能是由于其在组织切片中的表达水平(图22C)。图22D显示了CDH1表达和CD45免疫染色的重叠。
此外,还评估了波形蛋白(VIM)和上皮细胞粘附分子(EPCAM)的空间基因表达,以确定基质细胞的丰度和/或空间位置。在每个簇中都观察到VIM表达,这可能是由于其在组织切片中的表达水平(图23A),并且在整个组织中定位。图23B显示了VIM表达和CD45免疫染色的重叠。在每个簇中都观察到EPCAM的表达,这可能是由于其在组织切片中的表达水平(图23C)。图23D显示EPCAM表达和CD45免疫染色的重叠。此外,图30A-30B显示了基质隔室中FAP、VCAN、ACTA2和PDGFRB的基质特异性表达。
簇的表达谱显示簇4中B细胞标志物,簇4-6中T细胞标志物以及每个簇(包括簇4-6)中基质标志物FAP、CDH1、VIM和EPCAM的丰度。这些结果表明卵巢癌症组织切片的基质隔室中的免疫细胞浸润。
癌症基因定位的确定
利用已知在卵巢癌症中表达的基因的空间基因表达,包括但不限于BRCA1、BRCA2、MYC、TP53、PALB2、RAD5,、MSH2、SCGB2A1、MKI67、PIK3CD和CALML6,确定癌细胞在卵巢癌症组织切片中的丰度和/或空间位置。图24A-24B显示BRCA1、BRCA2、MYC、TP53、PALB2、RAD51和MSH2的表达,图29A-29B显示SCGB2A1、MKI67、PIK3CD、BRCA1、BRCA2和CALML6的表达。如图24A-24B和图29A-29B所示,卵巢癌症基因在每个簇中都有表达,并且如预期的那样出现在整个组织中(另参见图9)。特别地,在除了簇4(图24C)之外的每个簇中都观察到MSH2表达,簇4是与B细胞相关的簇,并且如预期的那样定位在整个组织中,但与CD45染色反相关(图24D)。BRCA1不富集于任何簇中,并且用Pan-CK和CD45染色重叠显示主要在癌性区域中定位(图25A-25B,左图)。BRCA2在簇7中富集,并且用Pan-CK和CD45染色重叠显示主要在癌性区域中定位(图25C-25D,右图)。在一项评估与Pan-CK或CD45共同表达癌症基因的平行实验中(图32A),确定了一些簇。如图32B-32D所示,该图中的簇1主要与Pan-CK肿瘤切片重叠,而簇4主要与CD45基质组织切片重叠。将基因表达水平与所有其他簇中的表达进行比较。图32A-32D中的每个点包含大约5000个读数。在簇1中,PRKCI、VTCN1、MECOM、TOP2A(图32C)、SHDH、XPO1(图32D)、TFRC、FUT8、SOX17、PBX1、EIF42和WT1上调,表明这些生物标志物中的每一个都可以用作癌症生物标志物。(例如,卵巢癌症生物标志物)。
本文所述的方法还用于对一组泛癌标志物进行染色,包括与PI3K-AKT信号传导、Jak-STAT信号传导和NOTCH信号传导相关的分析物(图26)。与组织切片的Pan-CK染色的比较显示了癌性区域中每个途径的富集情况(图26)。还将与细胞核、磷蛋白、多态性和细胞过程相关的泛癌基因表达模式与Pan-CK染色进行了比较(图27),以表明该技术作为探索工具的实力。
其他实施方式
应当理解,虽然已经结合本发明的详细描述描述了本发明,但前述描述旨在说明而不是限制本发明的范围,本发明的范围由所附权利要求的范围限定。其他方面、优点和修改都在以下权利要求的范围内。

Claims (77)

1.一种分析生物样品的癌症基质区域中免疫细胞浸润的方法,所述方法包括:
(a)识别所述生物样品中的癌性区域或与所述癌性区域相关的分析物;
(b)识别所述生物样品中的基质区域或与所述基质区域相关的分析物;
(c)识别所述生物样品中的一个或多个位置中的一个或多个免疫细胞或与免疫细胞相关的分析物;和
(d)使用(i)识别的生物样品中的癌性区域和基质区域或与其相关的分析物,以及(ii)识别的一个或多个免疫细胞或与其相关的分析物来分析生物样品的癌症基质区域中的免疫细胞浸润。
2.如权利要求1所述的方法,其中所述识别癌性区域、所述识别基质区域和/或所述识别免疫细胞包括:
(a)从所述生物样品生成数据集,其中所述数据集包括以下的一个或多个:
(i)从生物样品中的多个空间位置捕获的多个分析物的分析物数据;
(ii)包括所述生物样品的多个空间位置的图像的图像数据;和
(iii)将所述分析物数据链接到所述图像数据的登记数据;和
(b)使用所述数据集来识别所述生物样品中的所述癌性区域、所述基质区域和/或所述免疫细胞。
3.如权利要求2所述的方法,其中(b)包括将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块至少部分地经以下训练数据训练:包括来自一个或多个参考样品的参考分析物数据集的训练数据,其中所述一个或多个参考样品包括(1)一个或多个参考癌性区域,(2)一个或多个参考基质区域,和(3)一个或多个参考免疫细胞。
4.如权利要求3所述的方法,其中免疫细胞的丰度通过经过训练的机器学习模块确定。
5.如前述权利要求中任一项所述的方法,其中所述癌性区域包括良性肿瘤、转移前肿瘤、恶性肿瘤和一个或多个炎性细胞中的一种或多种。
6.如前述权利要求中任一项所述的方法,其中所述基质区域包括结缔组织、血管和炎性细胞中的一种或多种。
7.如前述权利要求中任一项所述的方法,进一步包括使所述生物样品透化。
8.如前述权利要求中任一项所述的方法,其中,与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物是核酸。
9.如权利要求8所述的方法,其中所述核酸为RNA。
10.如权利要求9所述的方法,其中所述RNA为mRNA。
11.如前述权利要求中任一项所述的方法,其中通过包括以下的步骤检测与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物:
使所述生物样品与包括多个捕获探针的基材接触,其中所述多个捕获探针中的捕获探针包括空间条形码和捕获域;
将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;和
确定(i)对应于与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于所述空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
12.如权利要求11所述的方法,其中所述确定步骤包括测序。
13.如权利要求1-7中任一项所述的方法,其中,与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物是蛋白质。
14.如权利要求13所述的方法,其中通过包括以下的步骤来检测与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物:
用多种分析物捕获剂附着所述生物样品,其中所述多种分析物捕获剂中的分析物捕获剂包括:
(i)分析物结合部分,其特异性结合与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物;
(ii)分析物结合部分条形码;和
(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;
使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)捕获域和(ii)空间条形码;
将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;和
确定(i)对应于与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于所述空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
15.如权利要求14所述的方法,其中所述确定步骤包括:
测序(i)对应于与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
16.如权利要求14或15所述的方法,其中所述分析物结合部分是抗体或其抗原结合片段、细胞表面受体结合分子、受体配体、小分子、T细胞受体衔接体、B细胞受体衔接体、前体、适体、单体、亲和体或DARPin。
17.如前述权利要求中任一项所述的方法,其中使用原位测序来检测与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物。
18.如前述权利要求中任一项所述的方法,其中使用抗体检测与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物。
19.如前述权利要求中任一项所述的方法,进一步包括使所述生物样品与一种或多种染色剂接触。
20.如权利要求19所述的方法,其中所述一种或多种染色剂包括苏木精和伊红。
21.如权利要求19或20所述的方法,其中所述一种或多种染色剂包括一种或多种光学标记。
22.如权利要求21所述的方法,其中所述一种或多种光学标记选自:荧光标记、放射性标记、化学发光标记、量热标记或比色标记。
23.如权利要求19-22中任一项所述的方法,还包括使用癌症标志物特异性的一种或多种染色剂来识别生物样品中的一个或多个癌性区域。
24.如权利要求23所述的方法,其中所述癌症标志物是广谱细胞角蛋白(Pan-CK)。
25.如权利要求19-24中任一项所述的方法,还包括使用基质标志物特异性的一种或多种染色剂鉴定所述一个或多个癌性区域内的一个或多个基质区域。
26.如权利要求25所述的方法,其中所述基质标志物为CD45。
27.如权利要求2-26中任一项所述的方法,其中所述图像数据通过获得所述生物样品的图像而生成。
28.如权利要求27所述的方法,还包括将所述图像数据登记到空间位置。
29.如权利要求27或28所述的方法,还包括基于所述图像数据识别(1)所述一个或多个癌性区域和/或(2)所述一个或多个基质区域。
30.如权利要求27-29中任一项所述的方法,还包括基于所述图像数据识别所述一个或多个免疫细胞。
31.如权利要求2-30中任一项所述的方法,还包括通过所述经过训练的机器学习模块识别所述一个或多个癌性区域。
32.如权利要求2-31中任一项所述的方法,还包括通过经过训练的机器学习模块识别所述一个或多个基质区域。
33.如权利要求2-32中任一项所述的方法,还包括通过所述经过训练的机器学习模块识别所述一个或多个免疫细胞。
34.如前述权利要求中任一项所述的方法,其中对生物样品的癌症基质区域中的免疫细胞浸润的分析包括确定生物样品中癌症基质区域中免疫细胞的丰度。
35.如权利要求11-34中任一项所述的方法,其中
识别一个或多个癌症区域包括:
(i)获得图像并将图像数据登记到空间位置,
(ii)使用所确定的序列的空间位置,或者
(ii)获得图像并将图像数据登记到空间位置,并使用所确定的序列的空间位置;
识别所述一个或多个基质区域包括:
(i)获得图像并将图像数据登记到空间位置,
(ii)使用所确定的序列的空间位置,或者
(ii)获得图像并将图像数据登记到空间位置,并使用所确定的序列的空间位置;和
在生物样品中的一个或多个位置识别一个或多个免疫细胞或与其相关的分析物包括:
(i)获得图像并将图像数据登记到空间位置,
(ii)使用所确定的序列的空间位置,或者
(iii)获得图像并将图像数据登记到空间位置,并使用所确定的序列的空间位置。
36.如权利要求34所述的方法,其中癌症基质区域中免疫细胞的丰度被确定为癌症基质区域中属于免疫细胞的细胞的百分比或被免疫细胞占据的癌症基质区域的百分比。
37.如权利要求36所述的方法,其中使用一个或多个癌性区域、一个或多个基质区域和一个或多个免疫细胞的所确定序列的空间位置来确定癌症基质区域中免疫细胞的丰度。
38.如权利要求37所述的方法,其中使用所确定的序列的空间位置包括使用原位测序来确定所述序列。
39.如权利要求36所述的方法,其中癌症基质区域中免疫细胞的丰度使用划分及以下手段确定
(i)获得图像并将图像数据登记到空间位置,
(ii)使用所确定的序列的空间位置,或者
(iii)获得图像并将图像数据登记到空间位置,并使用所确定的序列的空间位置。
40.如前述权利要求中任一项所述的方法,其中所述确定包括:
(a)与经每空间位置细胞数量归一化的已知管家相比,鉴定与免疫浸润细胞相关的基因的量;
(b)鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润B细胞(TIB)的比率;和/或
(c)基于包括与免疫浸润细胞相关的分析物的空间位置的百分比来计算生物样品中肿瘤浸润免疫细胞的丰度。
41.如前述权利要求中任一项所述的方法,其中所述一个或多个免疫细胞的识别包括从所述图像数据中划分免疫细胞。
42.如前述权利要求中任一项所述的方法,还包括基于免疫浸润确定癌症预后。
43.如前述权利要求中任一项所述的方法,还包括基于免疫浸润评分对对象的癌症严重程度进行评分或确定。
44.如前述权利要求中任一项所述的方法,其中所述确定包括鉴定一种或多种肿瘤浸润淋巴细胞(TIL)与一种或多种肿瘤浸润B细胞(TIB)或一种或多种肿瘤浸润T细胞与一种或多种肿瘤浸润B细胞(TIB)的比率。
45.如前述权利要求中任一项所述的方法,还包括给予治疗性处理,其中治疗性处理包括手术、化疗剂、生长抑制剂、细胞毒剂、放射治疗用剂、抗血管生成剂、癌症免疫治疗剂、凋亡剂、抗微管蛋白剂或其组合。
46.如前述权利要求中任一项所述的方法,其中所述生物样品从对象的活检物中获得。
47.如前述权利要求中任一项所述的方法,其中所述生物样品从对象的手术切除物中获得。
48.如权利要求46或47所述的方法,其中所述生物样品在对象的内窥镜检查或结肠镜检查期间收集。
49.如前述权利要求中任一项所述的方法,其中所述生物样品是组织切片。
50.如前述权利要求中任一项所述的方法,其中所述生物样品是载玻片上的组织切片。
51.如前述权利要求中任一项所述的方法,其中所述生物样品是福尔马林固定的石蜡包埋(FFPE)样品、冷冻样品或新鲜样品。
52.如前述权利要求中任一项所述的方法,其中所述生物样品是FFPE样品。
53.如前述权利要求中任一项所述的方法,其中所述免疫细胞选自B细胞、T细胞、NK细胞、单核细胞、巨噬细胞、中性粒细胞、粒细胞、先天性淋巴细胞或树突状细胞或其组合。
54.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自来自AKT途径的分析物、来自JAK-STAT途径的分析物和来自Notch途径的分析物或其组合。
55.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自SCGB2A1、MKI67、BRCA1、BRCA2、PIKCD、CALML6、MYC、TP53、PALB2、RAD51和MSH2或其组合。
56.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自SCGB2A1、MKI67、BRCA1、BRCA2、PIK3CD和CALML6或其组合。
57.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自PRKCI、VTCN1、MECOM、TOP2A、SHDH、XPO1、TFRC、FUT8、SOX17、PBX1、EIF42、WT1、其副产物、前体和降解产物,及其任何组合。
58.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物选自VTCN1、MECOM、TOP2A、XPO1、FUT8、SOX17、PBX1、EIF42、WT1、其副产物、前体和降解产物,及其任意组合。
59.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物是TOP2A及其副产物、前体和降解产物。
60.如前述权利要求中任一项所述的方法,其中所述与癌性区域相关的分析物是XPO1及其副产物、前体和降解产物。
61.如前述权利要求中任一项所述的方法,其中所述与基质区域相关的分析物选自VIM、EPCAM、FAP和CDH1。
62.如前述权利要求中任一项所述的方法,其中所述与基质区域相关的分析物选自FAP、VCAN、ACTA2和PDGFRB。
63.如前述权利要求中任一项所述的方法,其中所述与免疫细胞相关的分析物选自BLK、CD19、FCRL2、MS4A1、KIAA0125、TNFRSF17、TCL1A、SPIB、PNOC、PTRPC、PRF1、GZMA、GZMB、NKG7、GZMH、KLRK1、KLRB1、KLRD1、CTSW、GNLY、CCL13、CD209、HSD11B1、LAG3、CD244、EOMES、PTGER4、CD68、CD84、CD163、MS4A4A、TPSB2、TPSAB1、CPA3、MS4A2、HDC、FPR1,SIGLEC5、CSF3R、FCAR、FCGR3B、CEACAM3、S100A12、KIR2DL3、KIR3DL1、kir3dd2、IL21R、XCL1、XCL2、NCR1、CD6、CD3D、CD3E、SH2D1A、TRAT1、CD3G、TBX21、FOXP3、CD8A、CD8B、CD79A、CD79B、CD4、IGHA1、IGHG2、JCHAIN、IGKC、CD27、CD38、CD16、IL17RB、FANK1、CTLA4、MSR1、MRC1、NKG7、FCN1、TIGIT/LAG3。
64.如前述权利要求中任一项所述的方法,其中所述一种或多种免疫细胞选自:
(i)CD3+和CD4+T细胞;
(ii)CD3+和CD8+T细胞;
(iii)调节性T细胞,其包含CD4、Foxp3、IL17RB、CTLA4、FANK1、HAVCR1、CD25、CTLA-4、GITR、LAG-3和CD127中的一种或多种;
(iv)TH1细胞,其包含CD4、CD3D、S100A4、IL7R和IFNG中的一种或多种;
(v)TH2细胞,其包含CD4、IL7R、ICOS、CTLA4、TNFRSF4和TNFRS18中的一种或多种;
(vi)TH17细胞,其包含CD4、CD3D、IL17A、GZMA和S100A4中的一种或多种;
(vii)细胞毒性T细胞,其包含CD8、CD3D、S100A4、IFNG、GZMB、GZMA和IL2RB中的一种或多种;
(viii)浆细胞,其包含一种或多种JCHAIN、MZB1、IGHA1、IGHG1和IGKC;
(ix)单核细胞,其包含CD14+CD16-
(x)单核细胞,其包含CD14-CD16+;和
(xi)自然杀伤细胞,其包含NKG7。
65.如前述权利要求中任一项所述的方法,其中所述免疫浸润细胞是肿瘤浸润B细胞(TIB)。
66.如权利要求65所述的方法,其中所述TIB选自:
(i)浆细胞,其包含MZB1、IGLL5、IGHA1、IGHG1、JCHAIN、IGKC、IGHA2、IGLC2、IGLV3-1和IGLV2-14中的一种或多种;
(ii)Ig+B细胞,其包含IGHV3-74、SOCS3、JCHAIN和SPARC中的一种或多种;
(iii)活化的B细胞,其包含CD79B、HMGB2、HMGB1、HMGN1和RGS 13;
(iv)B细胞,其包含MEF2B、RGS13和MS4A1中的一种或多种;和
(v)B细胞,其包含CD79A和CD79B。
67.一种确定生物样品中免疫细胞浸润的方法,所述生物样品包括对象中的一个或多个癌性区域和一个或多个基质区域,所述方法包括:
(a)从获自对象的生物样品生成数据集,其中所述数据集包括:
(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物;
(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,以及(3)来自一个或多个免疫细胞的免疫细胞;和
(c)通过所述经过训练的机器学习模块确定从对象获得的生物样品中的免疫细胞浸润。
68.一种确定生物样品中免疫细胞浸润的方法,所述生物样品包括一个或多个癌性区域和一个或多个基质区域,所述方法包括:
(a)从获自对象的生物样品生成数据集,其中所述数据集包括:
(i)从所述生物样品的多个空间位置捕获的多个分析物的分析物数据,其中所述多个分析物中的分析物是与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物;
(ii)包括所述生物样品的所述多个空间位置的图像的图像数据;和
(iii)将所述分析物数据链接到所述图像数据的登记数据;
(b)将所述数据集提供给经过训练的机器学习模块,其中所述经过训练的机器学习模块包括来自一个或多个参考样品的参考分析物数据集,其中所述一个或多个参考样品包括(i)来自一个或多个癌性区域的癌性区域,(2)来自一个或多个基质区域的基质区域,以及(3)来自一个或多个免疫细胞的免疫细胞;和
(c)通过所述经过训练的机器学习模块确定所述生物样品中的免疫细胞浸润。
69.如权利要求67或68所述的方法,其中所述经过训练的机器学习模块是监督学习模块、半监督学习模块、无监督学习模块、回归分析模块、强化学习模块、自学习模块、特征学习模块、稀疏字典学习模块、异常检测模块、生成对抗性网络、卷积神经网络或关联规则模块中的至少一种。
70.如权利要求67-69中任一项所述的方法,其中生成所述数据集包括:
将带癌生物样品与包含多个捕获探针的基材接触,其中生物样品中包括(1)一个或多个癌性区域,(2)一个或多个基质区域,以及(3)一个和多个肿瘤浸润免疫细胞,其中多个捕获探针的捕获探针包括空间条形码和捕获域;
将来自所述生物样品的分析物附着到所述捕获探针;
确定(i)对应于分析物的序列的全部或部分,或其互补物,和(ii)对应于空间条形码的序列的全体或部分,或其互补物,并使用(i)和(ii)的所确定的序列来识别生物样品中分析物的空间位置和丰度;和
基于与空间位置处的分析物相对应的所确定序列,将空间位置识别为簇的部分,并使用所述簇分析患癌对象癌症基质中的免疫细胞浸润。
71.如权利要求70所述的方法,其中使用选自非线性降维、t-分布随机邻居嵌入(t-SNE)、全局t-分布随机近邻嵌入(g-SNE)和均匀流形近似与投影(UMAP)的方法之一来识别一个或多个免疫细胞簇。
72.如权利要求67-71中任一项所述的方法,其中生成所述数据集包括:
用多种分析物捕获剂附着所述生物样品,其中所述多种分析物捕获剂中的分析物捕获试剂包括:
(i)分析物结合部分,其特异性结合与癌性区域相关的分析物、与基质区域相关的分析物和/或与免疫细胞相关的分析物;
(ii)分析物结合部分条形码;和
(iii)分析物捕获序列,其中所述分析物捕获序列特异性结合捕获域;
使所述生物样品与基材接触,其中所述基材包括多个捕获探针,所述多个捕获探针中的捕获探针包括(i)捕获域和(ii)空间条形码;
将与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物杂交到所述捕获探针;和
确定(i)对应于与所述癌性区域相关的分析物、与所述基质区域相关的分析物和/或与免疫细胞相关的分析物的序列的全部或部分,或其互补物,和(ii)对应于所述空间条形码的序列的全部或部分,或其互补物,以及使用(i)和(ii)的所确定的序列来鉴定生物样品中与癌性区域相关的分析物、与基质区域相关的分析物、和/或与免疫细胞相关的分析物或其互补物的丰度和/或空间位置。
73.如权利要求66-71中任一项所述的方法,其中所述分析物数据使用原位测序生成。
74.一种试剂盒,其包含:
(a)特异性结合浸润免疫细胞上的抗原的抗体;
(b)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;和
(c)用于执行权利要求1-72中任一项所述的方法的说明书。
75.一种试剂盒,其包含:
(a)特异性结合浸润免疫细胞上的抗原的抗体;
(b)特异性结合基质细胞上的抗原的第二抗体;
(c)基材,包括多个捕获探针,其中所述多个捕获探针中的捕获探针包括捕获域;和
(d)用于执行权利要求1-72所述的方法的说明书。
76.一种计算机实现的方法,其包括:
(a)生成多个生物样品的数据集,其中对于所述多个生物样品中的每个生物样品,所述数据集包括:
(i)在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;
(ii)参考生物样品的图像数据;和
(iii)根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;
其中所述参考生物样品包括
(1)参考生物样品中的一个或多个癌性区域,
(2)在所述一个或多个癌性区域内的一个或多个基质区域,以及
(3)多个肿瘤浸润淋巴细胞(TIL);
(b)用所述数据集训练机器学习模块,从而生成经过训练的机器学习模块;和
(c)通过所述经过训练的机器学习模块确定生物样品中的免疫细胞浸润。
77.一种系统,其包括:
(a)存储元件,其可操作以存储多个生物样品的数据集,其中所述数据集包括:在参考生物样品的多个空间位置捕获的多个分析物的分析物数据;生物样品的图像数据;以及根据参考生物样品的空间位置链接到分析物数据的成像数据的登记数据;其中所述生物样品包括(1)所述参考生物样品中的一个或多个癌性区域,(2)所述一个或多个癌性区内的一个或多个基质区域,以及(3)所述多个肿瘤浸润淋巴细胞(TIL);和
(b)处理器,其可操作以通过机器学习模块处理所述数据集以训练所述机器学习模块以确定生物样品中的免疫细胞浸润。
CN202180090994.9A 2020-11-18 2021-11-18 分析癌症基质中免疫浸润以预测临床转归的方法和组合物 Pending CN116888278A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63/115,502 2020-11-18
US63/142,772 2021-01-28
US202163242721P 2021-09-10 2021-09-10
US63/242,721 2021-09-10
PCT/US2021/059959 WO2022109181A1 (en) 2020-11-18 2021-11-18 Methods and compositions for analyzing immune infiltration in cancer stroma to predict clinical outcome

Publications (1)

Publication Number Publication Date
CN116888278A true CN116888278A (zh) 2023-10-13

Family

ID=88264865

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180090994.9A Pending CN116888278A (zh) 2020-11-18 2021-11-18 分析癌症基质中免疫浸润以预测临床转归的方法和组合物

Country Status (1)

Country Link
CN (1) CN116888278A (zh)

Similar Documents

Publication Publication Date Title
US20230407404A1 (en) Methods and compositions for analyzing immune infiltration in cancer stroma to predict clinical outcome
US20210222253A1 (en) Identification of biomarkers of glioblastoma and methods of using the same
US20230272476A1 (en) Nano46 genes and methods to predict breast cancer outcome
ES2457534T3 (es) Perfiles de expresión génica para predecir desenlaces en cáncer de mama
CN101410532B (zh) 用于检测癌症的尿基因表达比值
US20220127676A1 (en) Methods and compositions for prognostic and/or diagnostic subtyping of pancreatic cancer
JP2015530072A (ja) ゲムシタビン療法による乳癌の治療方法
KR20150132500A (ko) 암 예후용 조성물 및 방법
KR20150005726A (ko) 직장결장암용 예후 예측
Perez et al. Improving patient care through molecular diagnostics
US20210388418A1 (en) Method for Quantifying Molecular Activity in Cancer Cells of a Human Tumour
US20160115551A1 (en) Methods to predict risk of recurrence in node-positive early breast cancer
Nagahata et al. Expression profiling to predict postoperative prognosis for estrogen receptor‐negative breast cancers by analysis of 25,344 genes on a cDNA microarray
Dwivedi et al. Application of single-cell omics in breast cancer
JP6837428B2 (ja) 患者特有の変異の発癌性指数を決定する方法およびシステム
CN116888278A (zh) 分析癌症基质中免疫浸润以预测临床转归的方法和组合物
US20160160293A1 (en) Breast cancer treatment with taxane therapy
EP2271775A1 (en) Biomarker panel for prediction of recurrent colorectal cancer
Mehmood et al. Transforming Diagnosis and Therapeutics Using Cancer Genomics
Zhou et al. Single-cell multi-omics in the study of digestive system cancers
Young A translational study in pancreatic neuroendocrine neoplasms
Jarzab et al. Gene Expression Analysis by DNA Microarray in Papillary and Follicular Differentiated Thyroid Cancer
Byers Molecular Profiling
Fumagalli et al. Strategies to Incorporate Translational Research Science into Clinical Trials in Breast Cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination