CN116403648A

CN116403648A - 一种基于多维分析建立的小细胞肺癌免疫新分型方法

Info

Publication number: CN116403648A
Application number: CN202310657822.6A
Authority: CN
Inventors: 杨琳; 张子城; 周猛
Original assignee: Cancer Hospital and Institute of CAMS and PUMC
Current assignee: Cancer Hospital and Institute of CAMS and PUMC
Priority date: 2023-06-06
Filing date: 2023-06-06
Publication date: 2023-07-07
Anticipated expiration: 2043-06-06
Also published as: CN116403648B

Abstract

本发明提出一种基于多维分析建立的小细胞肺癌免疫新分型方法，包括样本收集、RNA提取、RNA测序、无监督分层聚类分析、构建CCI分析模型、结果验证以及分型确立七个步骤，本发明直接取自临床存档的人体肿瘤样本，比细胞系和动物实验相关的肿瘤微环境研究更加贴合临床实践，并采用全转录组和蛋白质数字空间构象分别从RNA和蛋白质水平解析了SCLC微环境特征，提出免疫分型的概念，将SCLC分为免疫富集型和免疫剥夺型，既适用于局限期手术样本预后的预测，也适用于广泛期患者免疫联合治疗疗效的判断，再通过设定CCI指数阈值0.4可将SCLC区分为IE和ID两个型别，使本发明能够直接应用于临床中。

Description

一种基于多维分析建立的小细胞肺癌免疫新分型方法

技术领域

本发明涉及小细胞肺癌免疫分型技术领域，尤其涉及一种基于多维分析建立的小细胞肺癌免疫新分型方法。

背景技术

SCLC 是高恶性肺癌，几十年来进展非常缓慢，主要原因在于缺乏分子分层策略，尤其缺乏来自临床常规病理石蜡存档样本的分子分层研究。

自1985年以来，SCLC异质性/分子分层研究主要有两大方面的发现：（1）AdiFGazda的神经内分泌分化亚型（NE分型），他的分型主要来自细胞系和动物模型实验，依据转录组测序，提出基于50个基因集表达量高低将SCLC分为NE-Highvs.NE-Low（或有些文献中也称为NEvs.Non-NE)。NE分型的优势意义在于首次从分子层面揭示了SCLC的异质性特征，是继病理形态学分类的一大进步，且目前从部分概念验证性临床试验（如NCT02484404）回顾来看，NE分型伴有NOTCH或C-MYC异常表达的患者部分获益于PARP抑制剂或化疗联合免疫治疗；

NE分型的缺点在于：a.样本来自细胞系和动物试验为主，跟临床人体肿瘤样本有差异；b.50基因集源于转录组测序，缺少定量cut-off值，难用于临床；c.SCLC临床患者70%-80%发现即晚期，晚期活检样本小而少，不适合转录组测序分析。

另外，基于NE分型的概念，也有其他研究提出在蛋白质免疫组化水平去研究几个NE标志物的组合（传统的三个标志物ChrA,Syno,CD56，以及较新的INSM1）但都没有较一致且获公认的结果。

（2）基于谱系转录因子的分子分型（TF分型），2019年Rudinetal基于他们自己一些细胞系实验数据加上2015年Georgeetal新鲜人体肿瘤样本转录组测序数据的聚类分析，提出了TF分子分型概念，即SCLC-A,-N,-P,-Y四个分型，但是后来的单细胞测序研究未发现SCLC-Y亚型，且又有人提出Inflamed亚型。且，TF分型对于预后的分层结果也有争议，对临床用药也仅限于细胞系实验研究，距临床应用相距甚远，因此本发明提出一种基于多维分析建立的小细胞肺癌免疫新分型方法以解决现有技术中存在的问题。

发明内容

针对上述问题，本发明的目的在于提出一种基于多维分析建立的小细胞肺癌免疫新分型方法，该种基于多维分析建立的小细胞肺癌免疫新分型方法具可直接应用于临床的优点，解决现有技术中存在的问题。

为实现本发明的目的，本发明通过以下技术方案实现：一种基于多维分析建立的小细胞肺癌免疫新分型方法，包括以下步骤：

步骤一、样本收集

从医院的档案电子病历系统中选取若干组手术前未接受化学及放射治疗的局限期小细胞肺癌的高质量福尔马林固定和石蜡包埋肿瘤组织，作为研究样本，并将选取的样本均匀的分为分析样本组以及验证样本组；

步骤二、RNA提取

以分析样本组为基准，在其每个样品块上，切下若干组切片，并使用石蜡包埋组织总RNA提取试剂盒从切片中分离总RNA，再使用NanoDrop分光光度法进行定量，同时使用2100生物分析仪进行质量控制，之后利用NanoString nCounter系统提取每个样品的RNA；

步骤三、RNA测序

使用GeoMx全转录组图谱，通过选择每个病例两个代表性的肿瘤组织区域，从分析样本组中切除的小细胞肺癌中构建组织微阵列，然后在Illumina测序平台上进行测序；

步骤四、无监督分层聚类分析

从高通量基因表达和相应的出版物收集若干组多中心SCLC患者队列，获得SCLC患者队列中SCLC患者的临床病理信息，再进行功能和基因富集分析，之后采用无监督一致性聚类分析应用于SCLC肿瘤样本的分子数据，识别聚类数为2-5的潜在分子亚型；

步骤五、构建CCI分析模型

使用两种基于免疫细胞基因特征的方法，其包括xCell方法和ssGSEA方法，构建CCI分析模型，再利用极限梯度增强机器学习算法构建CCI分析模型，并在0-1指数上指定CCI的情况下，训练队列中的上阈值定义为0.4；

步骤六、结果验证

以步骤一中验证样本组为基准，使用定量计算机化IHC分析来测量CCL5和CXCL9的蛋白质表达，以在蛋白质水平上进行实验验证，对步骤五中CCI分析模型的稳定性和可靠性进行分析验证；

步骤七、分型确立

根据步骤六的结果，确认CCI分析模型的稳定性和可靠性后，将CCI分析模型应用至小细胞肺癌免疫新分型中。

进一步改进在于：所述步骤一中，样本分析的纳入标准为：癌症根治术加全身淋巴结清扫术后，组织学证实为纯小细胞肺癌，且无复合型非小细胞肺癌成分，没有其他恶性肿瘤病史，也没有其他器官的共存肿瘤。

进一步改进在于：所述步骤二中，在提取RNA之前，用H&E对每个样本的额外组织切片进行染色，以对肿瘤区域和边界进行病理验证，从而进行宏观解剖。

进一步改进在于：所述步骤二中，RNA完整性定义为300ng的百分比。

进一步改进在于：所述步骤三中，使用用于WTA数据合并的QC归一化方法对所得数据进行QC检查和归一化。

进一步改进在于：所述步骤五中，CCI分析模型的核心函数是二进制逻辑，最大增强迭代次数为3000次。

进一步改进在于：所述步骤六中，CCI分析模型将SCLC病例分为高CCI组和低CCI组，并使用0.4作为代表IE亚型和ID亚型的阈值。

进一步改进在于：所述步骤六中，通过在元队列中进行分层分析，进一步表征CCI分析模型在传统SCLC亚型中的预后价值。

本发明的有益效果为：该种基于多维分析建立的小细胞肺癌免疫新分型方法通过直接取自临床存档的人体肿瘤样本，比细胞系和动物实验相关的肿瘤微环境研究更加贴合临床实践，并采用全转录组和蛋白质数字空间构象分别从RNA和蛋白质水平解析了SCLC微环境特征，提出免疫分型的概念，将SCLC分为免疫富集型和免疫剥夺型，既适用于局限期手术样本预后的预测，也适用于广泛期患者免疫联合治疗疗效的判断，再通过设定CCI指数阈值0.4可将SCLC区分为IE和ID两个型别，由此，本发明更适合于临床常规病理样本，尤其是在晚期小样本中，CXCL9/CCL5两个免疫组化标志物就能完成免疫分型的发现，非常适合临床小样本的分子分型，较之传统的NE和TF分型具有巨大的优势。

附图说明

图1是本发明的步骤流程示意图。

具体实施方式

为了加深对本发明的理解，下面将结合实施例对本发明做进一步详述，本实施例仅用于解释本发明，并不构成对本发明保护范围的限定。

实施例一

根据图1所示，本实施例提出了一种基于多维分析建立的小细胞肺癌免疫新分型方法，包括以下步骤：

步骤一、样本收集

从医院的档案电子病历系统中选取若干组手术前未接受化学及放射治疗的局限期小细胞肺癌的高质量福尔马林固定和石蜡包埋肿瘤组织，作为研究样本，并将选取的样本均匀的分为分析样本组以及验证样本组，样本分析的纳入标准为：癌症根治术加全身淋巴结清扫术后，组织学证实为纯小细胞肺癌，且无复合型非小细胞肺癌成分，没有其他恶性肿瘤病史，也没有其他器官的共存肿瘤；

步骤二、RNA提取

以分析样本组为基准，在其每个样品块上，切下若干组切片，并使用石蜡包埋组织总RNA提取试剂盒从切片中分离总RNA，再使用NanoDrop分光光度法进行定量，同时使用2100生物分析仪进行质量控制，之后利用NanoString nCounter系统提取每个样品的RNA，在提取RNA之前，用H&E对每个样本的额外组织切片进行染色，以对肿瘤区域和边界进行病理验证，从而进行宏观解剖，其中RNA完整性定义为300ng的百分比；

步骤三、RNA测序

使用GeoMx全转录组图谱，通过选择每个病例两个代表性的肿瘤组织区域，从分析样本组中切除的小细胞肺癌中构建组织微阵列，然后在Illumina测序平台上进行测序，使用用于WTA数据合并的QC归一化方法对所得数据进行QC检查和归一化；

步骤四、无监督分层聚类分析

步骤五、构建CCI分析模型

使用两种基于免疫细胞基因特征的方法，其包括xCell方法和ssGSEA方法，构建CCI分析模型，再利用极限梯度增强机器学习算法构建CCI分析模型，并在0-1指数上指定CCI的情况下，训练队列中的上阈值定义为0.4，CCI分析模型的核心函数是二进制逻辑，最大增强迭代次数为3000次；

步骤六、结果验证

以步骤一中验证样本组为基准，使用定量计算机化IHC分析来测量CCL5和CXCL9的蛋白质表达，以在蛋白质水平上进行实验验证，对步骤五中CCI分析模型的稳定性和可靠性进行分析验证，CCI分析模型将SCLC病例分为高CCI组和低CCI组，并使用0.4作为代表IE亚型和ID亚型的阈值；

步骤七、分型确立

实施例二

本实施例提出了一种基于多维分析建立的小细胞肺癌免疫新分型方法，包括以下步骤：

步骤一、样本收集

从中国医学科学院肿瘤医院病理科的档案电子病历系统中选取59组手术前未接受化学及放射治疗的局限期小细胞肺癌（SCLC）的高质量福尔马林固定和石蜡包埋（FFPE）肿瘤组织，作为研究样本，并将选取的样本均匀的分为分析样本组以及验证样本组，其中，分析样本组为29组，验证样本组为30组，具体的样本分析的纳入标准为：癌症根治术加全身淋巴结清扫术后，组织学证实为纯小细胞肺癌，且无复合型非小细胞肺癌成分，没有其他恶性肿瘤病史，也没有其他器官的共存肿瘤；

步骤二、RNA提取

以分析样本组为基准，在其每个样品块上，切下三组切片（厚度为8µm），并使用石蜡包埋组织总RNA提取试剂盒（Qiagen 73504）从切片中分离总RNA，再使用NanoDrop分光光度法进行定量，同时使用2100生物分析仪进行质量控制，其中RNA完整性定义为300ng的百分比，之后利用NanoString nCounter系统上使用定制设计的面板分析提取每个样品的RNA，该面板结合了277个基因的mRNA表达，这些基因涉及免疫检查点抑制剂、先天免疫、免疫细胞类型生物标志物和神经内分泌特征，具体的探针结合后，在nCounter FLEX数字分析仪上对基因特异性荧光条形码进行杂交、扫描和定量；

使用nSolver（v4.0.70）进行质量控制（QC）和原始数据处理，其中0.1-2.25之间的结合密度被认为是良好的成像QC，阳性对照中R2超过0.95的连续稀释尖峰被认为是用于定量的良好内部QC；

在提取RNA之前，用H&E（HE染色法）对每个样本的额外组织切片（厚度为4µm）进行染色，以对肿瘤区域和边界进行病理验证，从而进行宏观解剖；

步骤三、RNA测序

使用GeoMx（空间转录组分析工具）全转录组图谱（WTA），通过选择每个病例两个代表性的肿瘤组织区域，从分析样本组中，即29组切除的小细胞肺癌中构建组织微阵列（TMA），具体的通常，将4μm TMA切片进行脱蜡，并在Tris-EDTA缓冲液中回收抗原20分钟，通过将样品与蛋白酶K孵育来进行RNA靶标暴露，消化后，将样品在室温下固定在10%中性缓冲福尔马林（NBF）中5分钟，之后将GeoMx全转录组图谱面板（GeoMx面板，NanoString）的探针应用于组织切片上，并在杂交室中在37℃下孵育过夜，随后用荧光抗体（上皮细胞用Pan-CK，免疫细胞用CD45，NanoString）和SYTO 13（核染色Thermo Fisher）对组织进行染色，用于形态学可视化，并在数字空间扫描仪（NanoString，西雅图，华盛顿，美国）上扫描，通常选择1-9个ROI，包括每个样本的肿瘤和肿瘤内基质区域，总共选择83个ROI，然后根据制造商的说明，收集、汇集和纯化来自单个ROI的UV裂解探针，用于构建PCR文库，之后对PCR产物进行QC测试；

然后在Illumina测序平台上进行测序，使用用于WTA数据合并的QC归一化方法对所得数据进行QC检查和归一化，每个ROI的定量限（LOQ）是根据以下公式计算：

LOQ=geomian（NegProbei）×geoSD（NegProbei）2

共有18815个基因被纳入下游分析，对于组合ROI RNA表达比较，从标准化的个体ROI计数计算平均值，在本实施例中，WTA数据被覆盖到计数水平和log2（x+1）归一化；

同时使用DSP空间蛋白质组分析（NanoString）对29例切除的SCLC的相同TMA的序列切片进行分析；

步骤四、无监督分层聚类分析

从高通量基因表达（Gene Expression Omnibus）和相应文献中收集四组多中心SCLC患者队列，其中包括来自GSE60052队列的50名患者、来自George研究的49名患者（George队列），GSE149507队列中的18名患者和Roper研究中的17名抗PD-1/PD-L1抗体治疗患者（Roper队列），从Bagaev的研究中获得了29个基于知识的功能性基因表达特征（Fges），涵盖了肿瘤的已知免疫、基质和其他主要细胞功能成分，获得SCLC患者队列中SCLC患者的临床病理信息，从分子特征数据库（MSigDB，v7.2）中获得50个标志性基因集，基因集富集分析（GSEA）通过R软件包“clusterProfiler”（v4.2.2）进行；

GSEA方法的富集分数（ES）用于计算特定基因集或途径的富集水平，若一个基因参与了通路或基因集的组成，ES评分会增加，否则会降低，标准化富集评分（NES）被标准化为相关途径或基因集大小，正NES表示排名顶部的富集水平，负NES表示排行榜底部的富集水平；

使用R包“GSVA”（v1.42.0）进行单样本基因集富集分析（ssGSEA），通过ClueGO（Cytoscape软件插件）对基因本体论（GO）生物过程基因集进行富集分析，之后采用无监督一致性聚类分析应用于SCLC肿瘤样本的分子数据，识别聚类数为2-5的潜在分子亚型，具体的选择80%的项目重采样（pItem）、1000次“reps”重采样、“clusterAlg”的k-means方法和“distance”的欧几里得作为共识聚类模型的关键输入参数，使用累积分布函数（CDF）的参考来选择最佳一致性聚类k；

步骤五、构建CCI分析模型

使用两种基于免疫细胞基因特征的方法，其包括xCell方法和ssGSEA方法，构建CCI分析模型，具体的xCell方法用于评估64种免疫细胞和基质细胞类型的浸润水平，再利用极限梯度增强机器学习算法构建CCI分析模型，CCI分析模型的核心函数是二进制逻辑，最大增强迭代次数为3000次，为了保证模型的鲁棒性，将树的深度考虑为4，每棵树中训练实例和列的子样本比例为50%同时验证数据的评估指标在CCI分析模型上使用“错误”显示，即在本实施例中，通过机器学习建模的CCI分析模型显示出预测性能和模型复杂性之间的最佳权衡，在0-1指数上指定CCI（2-趋化因子签名）的情况下，训练队列中的上阈值定义为0.4；

步骤六、结果验证

以步骤一中验证样本组为基准，即另外30组，使用定量计算机化IHC分析来测量CCL5和CXCL9的蛋白质表达，以在蛋白质水平上进行实验验证，对步骤五中CCI分析模型的稳定性和可靠性进行分析验证，CCI分析模型将SCLC病例分为高CCI组和低CCI组，并使用0.4作为代表IE亚型和ID亚型的阈值，通过在元队列（N=145）中进行分层分析，进一步表征CCI分析模型在传统SCLC亚型中的预后价值；

步骤七、分型确立

结合实施例一和实施例二，本发明使用无监督分层聚类来识别预定义基因的共表达模式和生物活性，为了进一步表征TME的细胞和功能特性，本发明使用ssGSEA从WTA mRNA表达谱中对29个Fges进行评分，29个Fges的无监督分层聚类分析将29个SCLC样本分为两个具有显著不同免疫区室的聚类，一个聚类的特征是免疫浸润水平更高，称为免疫富集亚型（IE亚型），另一个称为免疫剥夺亚型（ID亚型）。

本发明使用RNA测序和蛋白质定量的多维分析来鉴定IE亚型和ID亚型，其特征是不同的免疫特征及临床不同的预后和治疗效果，具体的，本发明构建了一CCI分析模型，通过IHC区分IE亚型和ID亚型，这对患者风险分层和免疫治疗受益人的选择具有很大的潜力。

IE亚型和ID亚型的免疫分类可以进一步对患者的生存率以及患者对化疗或化疗加免疫疗法的反应进行分层，本发明的免疫分类在区分预后和治疗反应方面优于传统的NE和TF亚型。

与免疫亚型相比，NE和TF亚型都不能完全区分小细胞肺癌的免疫状态，尽管NE低的小细胞肺癌与免疫细胞浸润增加有关（即CD45+、CD3+和CD8+细胞），与具有“免疫沙漠”表型的NE高肿瘤相比，这可以被称为“热”或“免疫绿洲”表型。我们的免疫亚型是独特的，因为它可以区分NE和TF的每个亚组的预后，比传统的NE和TF亚组具有更好的适应性和稳健性。

本发明采用全转录组和蛋白质数字空间构象分别从RNA和蛋白质水平解析了SCLC微环境特征，提出免疫分型的概念，将SCLC分为免疫富集型（IE）和免疫剥夺型（ID），并借助机器学习算法确定并验证了CCL5/CXCL9指数（CCI）作为上述免疫表型的预测因子，通过设定CCI指数阈值0.4可将SCLC区分为IE和ID两个型别，IE亚型预后更好且对免疫治疗更起效，而ID亚型预后差且对免疫治疗不敏感，本发明构建的CCI分析模型可用于临床指导患者风险分层及免疫治疗方案的选择。

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于多维分析建立的小细胞肺癌免疫新分型方法，其特征在于：包括以下步骤：

步骤一、样本收集

步骤二、RNA提取

步骤三、RNA测序

步骤四、无监督分层聚类分析

步骤五、构建CCI分析模型

步骤六、结果验证

步骤七、分型确立

2.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法，其特征在于：所述步骤一中，样本分析的纳入标准为：癌症根治术加全身淋巴结清扫术后，组织学证实为纯小细胞肺癌，且无复合型非小细胞肺癌成分，没有其他恶性肿瘤病史，也没有其他器官的共存肿瘤。

3.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法，其特征在于：所述步骤二中，在提取RNA之前，用H&E对每个样本的额外组织切片进行染色，以对肿瘤区域和边界进行病理验证，从而进行宏观解剖。

4.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法，其特征在于：所述步骤二中，RNA完整性定义为300ng的百分比。

5.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法，其特征在于：所述步骤三中，使用用于WTA数据合并的QC归一化方法对所得数据进行QC检查和归一化。

6.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法，其特征在于：所述步骤五中，CCI分析模型的核心函数是二进制逻辑，最大增强迭代次数为3000次。

7.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法，其特征在于：所述步骤六中，CCI分析模型将SCLC病例分为高CCI组和低CCI组，并使用0.4作为代表IE亚型和ID亚型的阈值。

8.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法，其特征在于：所述步骤六中，通过在元队列中进行分层分析，进一步表征CCI分析模型在传统SCLC亚型中的预后价值。