CN116403648A - 一种基于多维分析建立的小细胞肺癌免疫新分型方法 - Google Patents
一种基于多维分析建立的小细胞肺癌免疫新分型方法 Download PDFInfo
- Publication number
- CN116403648A CN116403648A CN202310657822.6A CN202310657822A CN116403648A CN 116403648 A CN116403648 A CN 116403648A CN 202310657822 A CN202310657822 A CN 202310657822A CN 116403648 A CN116403648 A CN 116403648A
- Authority
- CN
- China
- Prior art keywords
- analysis
- lung cancer
- small cell
- cell lung
- cci
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 79
- 206010041067 Small cell lung cancer Diseases 0.000 title claims abstract description 76
- 208000000587 small cell lung carcinoma Diseases 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000002123 RNA extraction Methods 0.000 claims abstract description 8
- 238000012795 verification Methods 0.000 claims abstract description 8
- 238000003559 RNA-seq method Methods 0.000 claims abstract description 6
- 238000007417 hierarchical cluster analysis Methods 0.000 claims abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 32
- 206010028980 Neoplasm Diseases 0.000 claims description 31
- 210000001519 tissue Anatomy 0.000 claims description 22
- 230000014509 gene expression Effects 0.000 claims description 15
- 102000004169 proteins and genes Human genes 0.000 claims description 14
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 238000010200 validation analysis Methods 0.000 claims description 9
- 201000011510 cancer Diseases 0.000 claims description 8
- 210000002865 immune cell Anatomy 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 230000007170 pathology Effects 0.000 claims description 7
- 102100032367 C-C motif chemokine 5 Human genes 0.000 claims description 6
- 102100036170 C-X-C motif chemokine 9 Human genes 0.000 claims description 6
- 101000797762 Homo sapiens C-C motif chemokine 5 Proteins 0.000 claims description 6
- 101000947172 Homo sapiens C-X-C motif chemokine 9 Proteins 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 6
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 5
- 201000005202 lung cancer Diseases 0.000 claims description 5
- 208000020816 lung neoplasm Diseases 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000010802 RNA extraction kit Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 4
- 238000002224 dissection Methods 0.000 claims description 4
- 238000010201 enrichment analysis Methods 0.000 claims description 4
- 238000013388 immunohistochemistry analysis Methods 0.000 claims description 4
- 210000001165 lymph node Anatomy 0.000 claims description 4
- 238000002493 microarray Methods 0.000 claims description 4
- 208000002154 non-small cell lung carcinoma Diseases 0.000 claims description 4
- 210000000056 organ Anatomy 0.000 claims description 4
- 239000012188 paraffin wax Substances 0.000 claims description 4
- 238000002798 spectrophotometry method Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 4
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 claims description 4
- 230000005855 radiation Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 42
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 14
- 238000003908 quality control method Methods 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 8
- 230000006872 improvement Effects 0.000 description 7
- 238000004393 prognosis Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 230000036039 immunity Effects 0.000 description 5
- 238000009169 immunotherapy Methods 0.000 description 5
- 238000010199 gene set enrichment analysis Methods 0.000 description 4
- 230000001575 pathological effect Effects 0.000 description 4
- 238000013517 stratification Methods 0.000 description 4
- 238000002512 chemotherapy Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000008595 infiltration Effects 0.000 description 3
- 238000001764 infiltration Methods 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 101150052384 50 gene Proteins 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000007596 consolidation process Methods 0.000 description 2
- 238000013394 immunophenotyping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000000955 neuroendocrine Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 102000008096 B7-H1 Antigen Human genes 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 101100507451 Drosophila melanogaster sip3 gene Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 101000581981 Homo sapiens Neural cell adhesion molecule 1 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 1
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 1
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 1
- 102100027347 Neural cell adhesion molecule 1 Human genes 0.000 description 1
- 102000005650 Notch Receptors Human genes 0.000 description 1
- 108010070047 Notch Receptors Proteins 0.000 description 1
- 239000012661 PARP inhibitor Substances 0.000 description 1
- 229940121906 Poly ADP ribose polymerase inhibitor Drugs 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007490 hematoxylin and eosin (H&E) staining Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 1
- 230000002055 immunohistochemical effect Effects 0.000 description 1
- 230000001024 immunotherapeutic effect Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000012758 nuclear staining Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000575 proteomic method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 238000011247 total mesorectal excision Methods 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 208000037956 transmissible mink encephalopathy Diseases 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Chemical & Material Sciences (AREA)
- Software Systems (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提出一种基于多维分析建立的小细胞肺癌免疫新分型方法,包括样本收集、RNA提取、RNA测序、无监督分层聚类分析、构建CCI分析模型、结果验证以及分型确立七个步骤,本发明直接取自临床存档的人体肿瘤样本,比细胞系和动物实验相关的肿瘤微环境研究更加贴合临床实践,并采用全转录组和蛋白质数字空间构象分别从RNA和蛋白质水平解析了SCLC微环境特征,提出免疫分型的概念,将SCLC分为免疫富集型和免疫剥夺型,既适用于局限期手术样本预后的预测,也适用于广泛期患者免疫联合治疗疗效的判断,再通过设定CCI指数阈值0.4可将SCLC区分为IE和ID两个型别,使本发明能够直接应用于临床中。
Description
技术领域
本发明涉及小细胞肺癌免疫分型技术领域,尤其涉及一种基于多维分析建立的小细胞肺癌免疫新分型方法。
背景技术
SCLC 是高恶性肺癌,几十年来进展非常缓慢,主要原因在于缺乏分子分层策略,尤其缺乏来自临床常规病理石蜡存档样本的分子分层研究。
自1985年以来,SCLC异质性/分子分层研究主要有两大方面的发现:(1)AdiFGazda的神经内分泌分化亚型(NE分型),他的分型主要来自细胞系和动物模型实验,依据转录组测序,提出基于50个基因集表达量高低将SCLC分为NE-Highvs.NE-Low(或有些文献中也称为NEvs.Non-NE)。NE分型的优势意义在于首次从分子层面揭示了SCLC的异质性特征,是继病理形态学分类的一大进步,且目前从部分概念验证性临床试验(如NCT02484404)回顾来看,NE分型伴有NOTCH或C-MYC异常表达的患者部分获益于PARP抑制剂或化疗联合免疫治疗;
NE分型的缺点在于:a.样本来自细胞系和动物试验为主,跟临床人体肿瘤样本有差异;b.50基因集源于转录组测序,缺少定量cut-off值,难用于临床;c.SCLC临床患者70%-80%发现即晚期,晚期活检样本小而少,不适合转录组测序分析。
另外,基于NE分型的概念,也有其他研究提出在蛋白质免疫组化水平去研究几个NE标志物的组合(传统的三个标志物ChrA,Syno,CD56,以及较新的INSM1)但都没有较一致且获公认的结果。
(2)基于谱系转录因子的分子分型(TF分型),2019年Rudinetal基于他们自己一些细胞系实验数据加上2015年Georgeetal新鲜人体肿瘤样本转录组测序数据的聚类分析,提出了TF分子分型概念,即SCLC-A,-N,-P,-Y四个分型,但是后来的单细胞测序研究未发现SCLC-Y亚型,且又有人提出Inflamed亚型。且,TF分型对于预后的分层结果也有争议,对临床用药也仅限于细胞系实验研究,距临床应用相距甚远,因此本发明提出一种基于多维分析建立的小细胞肺癌免疫新分型方法以解决现有技术中存在的问题。
发明内容
针对上述问题,本发明的目的在于提出一种基于多维分析建立的小细胞肺癌免疫新分型方法,该种基于多维分析建立的小细胞肺癌免疫新分型方法具可直接应用于临床的优点,解决现有技术中存在的问题。
为实现本发明的目的,本发明通过以下技术方案实现:一种基于多维分析建立的小细胞肺癌免疫新分型方法,包括以下步骤:
步骤一、样本收集
从医院的档案电子病历系统中选取若干组手术前未接受化学及放射治疗的局限期小细胞肺癌的高质量福尔马林固定和石蜡包埋肿瘤组织,作为研究样本,并将选取的样本均匀的分为分析样本组以及验证样本组;
步骤二、RNA提取
以分析样本组为基准,在其每个样品块上,切下若干组切片,并使用石蜡包埋组织总RNA提取试剂盒从切片中分离总RNA,再使用NanoDrop分光光度法进行定量,同时使用2100生物分析仪进行质量控制,之后利用NanoString nCounter系统提取每个样品的RNA;
步骤三、RNA测序
使用GeoMx全转录组图谱,通过选择每个病例两个代表性的肿瘤组织区域,从分析样本组中切除的小细胞肺癌中构建组织微阵列,然后在Illumina测序平台上进行测序;
步骤四、无监督分层聚类分析
从高通量基因表达和相应的出版物收集若干组多中心SCLC患者队列,获得SCLC患者队列中SCLC患者的临床病理信息,再进行功能和基因富集分析,之后采用无监督一致性聚类分析应用于SCLC肿瘤样本的分子数据,识别聚类数为2-5的潜在分子亚型;
步骤五、构建CCI分析模型
使用两种基于免疫细胞基因特征的方法,其包括xCell方法和ssGSEA方法,构建CCI分析模型,再利用极限梯度增强机器学习算法构建CCI分析模型,并在0-1指数上指定CCI的情况下,训练队列中的上阈值定义为0.4;
步骤六、结果验证
以步骤一中验证样本组为基准,使用定量计算机化IHC分析来测量CCL5和CXCL9的蛋白质表达,以在蛋白质水平上进行实验验证,对步骤五中CCI分析模型的稳定性和可靠性进行分析验证;
步骤七、分型确立
根据步骤六的结果,确认CCI分析模型的稳定性和可靠性后,将CCI分析模型应用至小细胞肺癌免疫新分型中。
进一步改进在于:所述步骤一中,样本分析的纳入标准为:癌症根治术加全身淋巴结清扫术后,组织学证实为纯小细胞肺癌,且无复合型非小细胞肺癌成分,没有其他恶性肿瘤病史,也没有其他器官的共存肿瘤。
进一步改进在于:所述步骤二中,在提取RNA之前,用H&E对每个样本的额外组织切片进行染色,以对肿瘤区域和边界进行病理验证,从而进行宏观解剖。
进一步改进在于:所述步骤二中,RNA完整性定义为300ng的百分比。
进一步改进在于:所述步骤三中,使用用于WTA数据合并的QC归一化方法对所得数据进行QC检查和归一化。
进一步改进在于:所述步骤五中,CCI分析模型的核心函数是二进制逻辑,最大增强迭代次数为3000次。
进一步改进在于:所述步骤六中,CCI分析模型将SCLC病例分为高CCI组和低CCI组,并使用0.4作为代表IE亚型和ID亚型的阈值。
进一步改进在于:所述步骤六中,通过在元队列中进行分层分析,进一步表征CCI分析模型在传统SCLC亚型中的预后价值。
本发明的有益效果为:该种基于多维分析建立的小细胞肺癌免疫新分型方法通过直接取自临床存档的人体肿瘤样本,比细胞系和动物实验相关的肿瘤微环境研究更加贴合临床实践,并采用全转录组和蛋白质数字空间构象分别从RNA和蛋白质水平解析了SCLC微环境特征,提出免疫分型的概念,将SCLC分为免疫富集型和免疫剥夺型,既适用于局限期手术样本预后的预测,也适用于广泛期患者免疫联合治疗疗效的判断,再通过设定CCI指数阈值0.4可将SCLC区分为IE和ID两个型别,由此,本发明更适合于临床常规病理样本,尤其是在晚期小样本中,CXCL9/CCL5两个免疫组化标志物就能完成免疫分型的发现,非常适合临床小样本的分子分型,较之传统的NE和TF分型具有巨大的优势。
附图说明
图1是本发明的步骤流程示意图。
具体实施方式
为了加深对本发明的理解,下面将结合实施例对本发明做进一步详述,本实施例仅用于解释本发明,并不构成对本发明保护范围的限定。
实施例一
根据图1所示,本实施例提出了一种基于多维分析建立的小细胞肺癌免疫新分型方法,包括以下步骤:
步骤一、样本收集
从医院的档案电子病历系统中选取若干组手术前未接受化学及放射治疗的局限期小细胞肺癌的高质量福尔马林固定和石蜡包埋肿瘤组织,作为研究样本,并将选取的样本均匀的分为分析样本组以及验证样本组,样本分析的纳入标准为:癌症根治术加全身淋巴结清扫术后,组织学证实为纯小细胞肺癌,且无复合型非小细胞肺癌成分,没有其他恶性肿瘤病史,也没有其他器官的共存肿瘤;
步骤二、RNA提取
以分析样本组为基准,在其每个样品块上,切下若干组切片,并使用石蜡包埋组织总RNA提取试剂盒从切片中分离总RNA,再使用NanoDrop分光光度法进行定量,同时使用2100生物分析仪进行质量控制,之后利用NanoString nCounter系统提取每个样品的RNA,在提取RNA之前,用H&E对每个样本的额外组织切片进行染色,以对肿瘤区域和边界进行病理验证,从而进行宏观解剖,其中RNA完整性定义为300ng的百分比;
步骤三、RNA测序
使用GeoMx全转录组图谱,通过选择每个病例两个代表性的肿瘤组织区域,从分析样本组中切除的小细胞肺癌中构建组织微阵列,然后在Illumina测序平台上进行测序,使用用于WTA数据合并的QC归一化方法对所得数据进行QC检查和归一化;
步骤四、无监督分层聚类分析
从高通量基因表达和相应的出版物收集若干组多中心SCLC患者队列,获得SCLC患者队列中SCLC患者的临床病理信息,再进行功能和基因富集分析,之后采用无监督一致性聚类分析应用于SCLC肿瘤样本的分子数据,识别聚类数为2-5的潜在分子亚型;
步骤五、构建CCI分析模型
使用两种基于免疫细胞基因特征的方法,其包括xCell方法和ssGSEA方法,构建CCI分析模型,再利用极限梯度增强机器学习算法构建CCI分析模型,并在0-1指数上指定CCI的情况下,训练队列中的上阈值定义为0.4,CCI分析模型的核心函数是二进制逻辑,最大增强迭代次数为3000次;
步骤六、结果验证
以步骤一中验证样本组为基准,使用定量计算机化IHC分析来测量CCL5和CXCL9的蛋白质表达,以在蛋白质水平上进行实验验证,对步骤五中CCI分析模型的稳定性和可靠性进行分析验证,CCI分析模型将SCLC病例分为高CCI组和低CCI组,并使用0.4作为代表IE亚型和ID亚型的阈值;
步骤七、分型确立
根据步骤六的结果,确认CCI分析模型的稳定性和可靠性后,将CCI分析模型应用至小细胞肺癌免疫新分型中。
实施例二
本实施例提出了一种基于多维分析建立的小细胞肺癌免疫新分型方法,包括以下步骤:
步骤一、样本收集
从中国医学科学院肿瘤医院病理科的档案电子病历系统中选取59组手术前未接受化学及放射治疗的局限期小细胞肺癌(SCLC)的高质量福尔马林固定和石蜡包埋(FFPE)肿瘤组织,作为研究样本,并将选取的样本均匀的分为分析样本组以及验证样本组,其中,分析样本组为29组,验证样本组为30组,具体的样本分析的纳入标准为:癌症根治术加全身淋巴结清扫术后,组织学证实为纯小细胞肺癌,且无复合型非小细胞肺癌成分,没有其他恶性肿瘤病史,也没有其他器官的共存肿瘤;
步骤二、RNA提取
以分析样本组为基准,在其每个样品块上,切下三组切片(厚度为8µm),并使用石蜡包埋组织总RNA提取试剂盒(Qiagen 73504)从切片中分离总RNA,再使用NanoDrop分光光度法进行定量,同时使用2100生物分析仪进行质量控制,其中RNA完整性定义为300ng的百分比,之后利用NanoString nCounter系统上使用定制设计的面板分析提取每个样品的RNA,该面板结合了277个基因的mRNA表达,这些基因涉及免疫检查点抑制剂、先天免疫、免疫细胞类型生物标志物和神经内分泌特征,具体的探针结合后,在nCounter FLEX数字分析仪上对基因特异性荧光条形码进行杂交、扫描和定量;
使用nSolver(v4.0.70)进行质量控制(QC)和原始数据处理,其中0.1-2.25之间的结合密度被认为是良好的成像QC,阳性对照中R2超过0.95的连续稀释尖峰被认为是用于定量的良好内部QC;
在提取RNA之前,用H&E(HE染色法)对每个样本的额外组织切片(厚度为4µm)进行染色,以对肿瘤区域和边界进行病理验证,从而进行宏观解剖;
步骤三、RNA测序
使用GeoMx(空间转录组分析工具)全转录组图谱(WTA),通过选择每个病例两个代表性的肿瘤组织区域,从分析样本组中,即29组切除的小细胞肺癌中构建组织微阵列(TMA),具体的通常,将4μm TMA切片进行脱蜡,并在Tris-EDTA缓冲液中回收抗原20分钟,通过将样品与蛋白酶K孵育来进行RNA靶标暴露,消化后,将样品在室温下固定在10%中性缓冲福尔马林(NBF)中5分钟,之后将GeoMx全转录组图谱面板(GeoMx面板,NanoString)的探针应用于组织切片上,并在杂交室中在37℃下孵育过夜,随后用荧光抗体(上皮细胞用Pan-CK,免疫细胞用CD45,NanoString)和SYTO 13(核染色Thermo Fisher)对组织进行染色,用于形态学可视化,并在数字空间扫描仪(NanoString,西雅图,华盛顿,美国)上扫描,通常选择1-9个ROI,包括每个样本的肿瘤和肿瘤内基质区域,总共选择83个ROI,然后根据制造商的说明,收集、汇集和纯化来自单个ROI的UV裂解探针,用于构建PCR文库,之后对PCR产物进行QC测试;
然后在Illumina测序平台上进行测序,使用用于WTA数据合并的QC归一化方法对所得数据进行QC检查和归一化,每个ROI的定量限(LOQ)是根据以下公式计算:
LOQ=geomian(NegProbei)×geoSD(NegProbei)2
共有18815个基因被纳入下游分析,对于组合ROI RNA表达比较,从标准化的个体ROI计数计算平均值,在本实施例中,WTA数据被覆盖到计数水平和log2(x+1)归一化;
同时使用DSP空间蛋白质组分析(NanoString)对29例切除的SCLC的相同TMA的序列切片进行分析;
步骤四、无监督分层聚类分析
从高通量基因表达(Gene Expression Omnibus)和相应文献中收集四组多中心SCLC患者队列,其中包括来自GSE60052队列的50名患者、来自George研究的49名患者(George队列),GSE149507队列中的18名患者和Roper研究中的17名抗PD-1/PD-L1抗体治疗患者(Roper队列),从Bagaev的研究中获得了29个基于知识的功能性基因表达特征(Fges),涵盖了肿瘤的已知免疫、基质和其他主要细胞功能成分,获得SCLC患者队列中SCLC患者的临床病理信息,从分子特征数据库(MSigDB,v7.2)中获得50个标志性基因集,基因集富集分析(GSEA)通过R软件包“clusterProfiler”(v4.2.2)进行;
GSEA方法的富集分数(ES)用于计算特定基因集或途径的富集水平,若一个基因参与了通路或基因集的组成,ES评分会增加,否则会降低,标准化富集评分(NES)被标准化为相关途径或基因集大小,正NES表示排名顶部的富集水平,负NES表示排行榜底部的富集水平;
使用R包“GSVA”(v1.42.0)进行单样本基因集富集分析(ssGSEA),通过ClueGO(Cytoscape软件插件)对基因本体论(GO)生物过程基因集进行富集分析,之后采用无监督一致性聚类分析应用于SCLC肿瘤样本的分子数据,识别聚类数为2-5的潜在分子亚型,具体的选择80%的项目重采样(pItem)、1000次“reps”重采样、“clusterAlg”的k-means方法和“distance”的欧几里得作为共识聚类模型的关键输入参数,使用累积分布函数(CDF)的参考来选择最佳一致性聚类k;
步骤五、构建CCI分析模型
使用两种基于免疫细胞基因特征的方法,其包括xCell方法和ssGSEA方法,构建CCI分析模型,具体的xCell方法用于评估64种免疫细胞和基质细胞类型的浸润水平,再利用极限梯度增强机器学习算法构建CCI分析模型,CCI分析模型的核心函数是二进制逻辑,最大增强迭代次数为3000次,为了保证模型的鲁棒性,将树的深度考虑为4,每棵树中训练实例和列的子样本比例为50%同时验证数据的评估指标在CCI分析模型上使用“错误”显示,即在本实施例中,通过机器学习建模的CCI分析模型显示出预测性能和模型复杂性之间的最佳权衡,在0-1指数上指定CCI(2-趋化因子签名)的情况下,训练队列中的上阈值定义为0.4;
步骤六、结果验证
以步骤一中验证样本组为基准,即另外30组,使用定量计算机化IHC分析来测量CCL5和CXCL9的蛋白质表达,以在蛋白质水平上进行实验验证,对步骤五中CCI分析模型的稳定性和可靠性进行分析验证,CCI分析模型将SCLC病例分为高CCI组和低CCI组,并使用0.4作为代表IE亚型和ID亚型的阈值,通过在元队列(N=145)中进行分层分析,进一步表征CCI分析模型在传统SCLC亚型中的预后价值;
步骤七、分型确立
根据步骤六的结果,确认CCI分析模型的稳定性和可靠性后,将CCI分析模型应用至小细胞肺癌免疫新分型中。
结合实施例一和实施例二,本发明使用无监督分层聚类来识别预定义基因的共表达模式和生物活性,为了进一步表征TME的细胞和功能特性,本发明使用ssGSEA从WTA mRNA表达谱中对29个Fges进行评分,29个Fges的无监督分层聚类分析将29个SCLC样本分为两个具有显著不同免疫区室的聚类,一个聚类的特征是免疫浸润水平更高,称为免疫富集亚型(IE亚型),另一个称为免疫剥夺亚型(ID亚型)。
本发明使用RNA测序和蛋白质定量的多维分析来鉴定IE亚型和ID亚型,其特征是不同的免疫特征及临床不同的预后和治疗效果,具体的,本发明构建了一CCI分析模型,通过IHC区分IE亚型和ID亚型,这对患者风险分层和免疫治疗受益人的选择具有很大的潜力。
IE亚型和ID亚型的免疫分类可以进一步对患者的生存率以及患者对化疗或化疗加免疫疗法的反应进行分层,本发明的免疫分类在区分预后和治疗反应方面优于传统的NE和TF亚型。
与免疫亚型相比,NE和TF亚型都不能完全区分小细胞肺癌的免疫状态,尽管NE低的小细胞肺癌与免疫细胞浸润增加有关(即CD45+、CD3+和CD8+细胞),与具有“免疫沙漠”表型的NE高肿瘤相比,这可以被称为“热”或“免疫绿洲”表型。我们的免疫亚型是独特的,因为它可以区分NE和TF的每个亚组的预后,比传统的NE和TF亚组具有更好的适应性和稳健性。
本发明采用全转录组和蛋白质数字空间构象分别从RNA和蛋白质水平解析了SCLC微环境特征,提出免疫分型的概念,将SCLC分为免疫富集型(IE)和免疫剥夺型(ID),并借助机器学习算法确定并验证了CCL5/CXCL9指数(CCI)作为上述免疫表型的预测因子,通过设定CCI指数阈值0.4可将SCLC区分为IE和ID两个型别,IE亚型预后更好且对免疫治疗更起效,而ID亚型预后差且对免疫治疗不敏感,本发明构建的CCI分析模型可用于临床指导患者风险分层及免疫治疗方案的选择。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (8)
1.一种基于多维分析建立的小细胞肺癌免疫新分型方法,其特征在于:包括以下步骤:
步骤一、样本收集
从医院的档案电子病历系统中选取若干组手术前未接受化学及放射治疗的局限期小细胞肺癌的高质量福尔马林固定和石蜡包埋肿瘤组织,作为研究样本,并将选取的样本均匀的分为分析样本组以及验证样本组;
步骤二、RNA提取
以分析样本组为基准,在其每个样品块上,切下若干组切片,并使用石蜡包埋组织总RNA提取试剂盒从切片中分离总RNA,再使用NanoDrop分光光度法进行定量,同时使用2100生物分析仪进行质量控制,之后利用NanoString nCounter系统提取每个样品的RNA;
步骤三、RNA测序
使用GeoMx全转录组图谱,通过选择每个病例两个代表性的肿瘤组织区域,从分析样本组中切除的小细胞肺癌中构建组织微阵列,然后在Illumina测序平台上进行测序;
步骤四、无监督分层聚类分析
从高通量基因表达和相应的出版物收集若干组多中心SCLC患者队列,获得SCLC患者队列中SCLC患者的临床病理信息,再进行功能和基因富集分析,之后采用无监督一致性聚类分析应用于SCLC肿瘤样本的分子数据,识别聚类数为2-5的潜在分子亚型;
步骤五、构建CCI分析模型
使用两种基于免疫细胞基因特征的方法,其包括xCell方法和ssGSEA方法,构建CCI分析模型,再利用极限梯度增强机器学习算法构建CCI分析模型,并在0-1指数上指定CCI的情况下,训练队列中的上阈值定义为0.4;
步骤六、结果验证
以步骤一中验证样本组为基准,使用定量计算机化IHC分析来测量CCL5和CXCL9的蛋白质表达,以在蛋白质水平上进行实验验证,对步骤五中CCI分析模型的稳定性和可靠性进行分析验证;
步骤七、分型确立
根据步骤六的结果,确认CCI分析模型的稳定性和可靠性后,将CCI分析模型应用至小细胞肺癌免疫新分型中。
2.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法,其特征在于:所述步骤一中,样本分析的纳入标准为:癌症根治术加全身淋巴结清扫术后,组织学证实为纯小细胞肺癌,且无复合型非小细胞肺癌成分,没有其他恶性肿瘤病史,也没有其他器官的共存肿瘤。
3.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法,其特征在于:所述步骤二中,在提取RNA之前,用H&E对每个样本的额外组织切片进行染色,以对肿瘤区域和边界进行病理验证,从而进行宏观解剖。
4.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法,其特征在于:所述步骤二中,RNA完整性定义为300ng的百分比。
5.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法,其特征在于:所述步骤三中,使用用于WTA数据合并的QC归一化方法对所得数据进行QC检查和归一化。
6.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法,其特征在于:所述步骤五中,CCI分析模型的核心函数是二进制逻辑,最大增强迭代次数为3000次。
7.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法,其特征在于:所述步骤六中,CCI分析模型将SCLC病例分为高CCI组和低CCI组,并使用0.4作为代表IE亚型和ID亚型的阈值。
8.根据权利要求1所述的一种基于多维分析建立的小细胞肺癌免疫新分型方法,其特征在于:所述步骤六中,通过在元队列中进行分层分析,进一步表征CCI分析模型在传统SCLC亚型中的预后价值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310657822.6A CN116403648B (zh) | 2023-06-06 | 2023-06-06 | 一种基于多维分析建立的小细胞肺癌免疫新分型方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310657822.6A CN116403648B (zh) | 2023-06-06 | 2023-06-06 | 一种基于多维分析建立的小细胞肺癌免疫新分型方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116403648A true CN116403648A (zh) | 2023-07-07 |
CN116403648B CN116403648B (zh) | 2023-08-01 |
Family
ID=87016428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310657822.6A Active CN116403648B (zh) | 2023-06-06 | 2023-06-06 | 一种基于多维分析建立的小细胞肺癌免疫新分型方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116403648B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180045727A1 (en) * | 2015-03-03 | 2018-02-15 | Caris Mpi, Inc. | Molecular profiling for cancer |
CN107849613A (zh) * | 2015-04-14 | 2018-03-27 | 基因中心治疗公司 | 用于肺癌分型的方法 |
CN109790583A (zh) * | 2016-05-17 | 2019-05-21 | 基因中心治疗公司 | 对肺腺癌亚型分型的方法 |
CN113373234A (zh) * | 2021-07-07 | 2021-09-10 | 山东第一医科大学附属肿瘤医院(山东省肿瘤防治研究院、山东省肿瘤医院) | 一种基于突变特征的小细胞肺癌分子分型确定方法及应用 |
-
2023
- 2023-06-06 CN CN202310657822.6A patent/CN116403648B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180045727A1 (en) * | 2015-03-03 | 2018-02-15 | Caris Mpi, Inc. | Molecular profiling for cancer |
CN107849613A (zh) * | 2015-04-14 | 2018-03-27 | 基因中心治疗公司 | 用于肺癌分型的方法 |
CN109790583A (zh) * | 2016-05-17 | 2019-05-21 | 基因中心治疗公司 | 对肺腺癌亚型分型的方法 |
CN113373234A (zh) * | 2021-07-07 | 2021-09-10 | 山东第一医科大学附属肿瘤医院(山东省肿瘤防治研究院、山东省肿瘤医院) | 一种基于突变特征的小细胞肺癌分子分型确定方法及应用 |
Non-Patent Citations (1)
Title |
---|
吴杨 等: ""小细胞肺癌的分子分型及其治疗策略的研究进展"", 《中国肺癌杂志》, vol. 26, no. 4, pages 303 - 306 * |
Also Published As
Publication number | Publication date |
---|---|
CN116403648B (zh) | 2023-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7042717B2 (ja) | 癌の臨床転帰を予測する方法 | |
Zhu et al. | Immune gene expression profiling reveals heterogeneity in luminal breast tumors | |
EP2389453B1 (en) | Single cell gene expression for diagnosis, prognosis and identification of drug targets | |
CN113450873B (zh) | 一种预测胃癌预后和免疫治疗适用性的标志物及其应用 | |
CN111128299B (zh) | 一种结直肠癌预后显著相关ceRNA调控网络的构建方法 | |
CN103403543A (zh) | 结肠癌基因表达签名及使用方法 | |
Ping et al. | Mining genome sequencing data to identify the genomic features linked to breast cancer histopathology | |
Yan et al. | Cell-of-origin subtyping of diffuse large B-cell lymphoma by using a qPCR-based gene expression assay on formalin-fixed paraffin-embedded tissues | |
Zhang et al. | DNA methylation profiling to determine the primary sites of metastatic cancers using formalin-fixed paraffin-embedded tissues | |
WO2012149245A2 (en) | Genomic signatures of metastasis in prostate cancer | |
CN116206681A (zh) | 一种免疫浸润细胞模型的预后基因对价值评价方法 | |
Dupont et al. | A gene expression signature associated with metastatic cells in effusions of breast carcinoma patients | |
CN115482935B (zh) | 预测小细胞转化的肺腺癌患者预后模型及其建立方法 | |
CN116403648B (zh) | 一种基于多维分析建立的小细胞肺癌免疫新分型方法 | |
CN110408706A (zh) | 一种评估鼻咽癌复发的生物标志物及其应用 | |
US20170183738A1 (en) | Process, Apparatus or System and Kit for Classification of Tumor Samples of Unknown and/or Uncertain Origin and Use of Genes of the Group of Biomarkers | |
Wilmott et al. | Tumour procurement, DNA extraction, coverage analysis and optimisation of mutation-detection algorithms for human melanoma genomes | |
CN115807084A (zh) | 一种用于预测肿瘤免疫检查点阻断治疗不良事件的生物标志物及其应用 | |
De Groot et al. | Multigene sets for clinical application in glioma | |
CN115472294B (zh) | 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法 | |
CN117373534B (zh) | 一种三阴型乳腺癌预后风险评估系统 | |
Culibrk | Copy number variation in metastatic cancer: methods and analysis of somatic copy number variation in advanced human cancers | |
Kaplan | Targeted RNAseq Characterization of Kidney Cancer Subtypes | |
KR101825369B1 (ko) | 암의 예후 판단용 유전자 바이오 마커 및 이의 용도 | |
Jiang et al. | CXCR4 negatively correlates with NKT cell infiltration during gastric precancerous lesions progression to early gastric cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |