CN114540504A - 用于预测肺鳞癌患者免疫疗效的标志物组及系统 - Google Patents
用于预测肺鳞癌患者免疫疗效的标志物组及系统 Download PDFInfo
- Publication number
- CN114540504A CN114540504A CN202210448091.XA CN202210448091A CN114540504A CN 114540504 A CN114540504 A CN 114540504A CN 202210448091 A CN202210448091 A CN 202210448091A CN 114540504 A CN114540504 A CN 114540504A
- Authority
- CN
- China
- Prior art keywords
- immune
- patient
- curative effect
- rna
- efficacy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Bioethics (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Primary Health Care (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Signal Processing (AREA)
- Biochemistry (AREA)
Abstract
本发明属于医疗领域,公开了用于预测肺鳞癌患者免疫疗效的标志物组及系统。标志物组由长链非编码RNA RP5‑1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA‑DMB组成。通过确定标志物的RNA表达量及其与生存期的COX回归系数值Ci,计算得到疗效预测分值Rscore。可以很好地地指导临床用药,减少副作用,避免不必要的免疫治疗,有利于建立合理的联合治疗方案。通过结合肿瘤突变负荷TMB值,可以更好地确定免疫疗效,可以更好地指导免疫治疗。
Description
技术领域
本发明涉及医疗领域,具体涉及用于预测肺鳞癌患者免疫疗效的标志物组及系统。
背景技术
2018年4月,一项PD-1抗体Keytruda单药一线治疗局部晚期或转移性无突变NSCLC的临床III期研究表明:相比铂类药物化疗,Keytruda可显著延长PD-L1表达阳性(表达水平≥1%)患者的总生存期(OS),副作用也应该更小。至此,无论PD-1/PD-L1单药还是联合化疗均在临床研究中取得了OS获益数据。在非小细胞肺癌的一线治疗中,PD-1相比化疗疗效更佳。
尽管PD1/PD-L1阻断剂已成为临床抗肿瘤治疗一线药物,临床应用的初步成果令人鼓舞。然而该药物价格昂贵。PD-1抑制剂有效的病人,一般疗效持久;但是,目前已经观察到30%左右的患者,出现了疾病的耐药。因此,提高治疗的临床应答率、疗效的预测、用药剂量优化、避免联合用药的毒副作用、提高药物疗效依然是PD1/PD-L1阻断治疗的重大课题。这就需要我们对T细胞活性调节的PD-1/PD-L1通路机制及重要分子的完整全面理解。PD-1/PD-L1信号通路中lncRNA层次的研究有利于抗肿瘤药物的研发、有利于深入探索治疗抗性发生的机制,疗效的预测,用药剂量优化,提高治疗的临床应答率,建立合理的联合治疗方案,避免用药的毒副作用。
自2014年起,PD-1/PD-L1免疫抑制剂已被批准用来治疗包括恶黑、非小细胞肺癌、肾癌、膀胱癌、头颈瘤等多种肿瘤。然而,对大部分实体瘤,PD-1/PD-L1单独使用会有60%-80%的无效率,也就意味着还会有不少的患者用药后无效。此外,PD-1/PD-L1免疫抑制剂昂贵的价格进一步限制了其应用范围。尽管科学家和临床医生在PD-L1表达、肿瘤突变负荷(TMB)、微卫星不稳定性(MSI/MMR状态)、新抗原,新抗原瘤内异质性和MHC抗原等多种角度入手,目前依然找不到高预测性的生物标记物。这些局限性给临床肿瘤学家制定适于个体患者更安全、更经济更有效的PD-1/PD-L1免疫疗法方案带来了挑战。现在免疫疗法的主要判断指标是基于肿瘤突变负荷TMB方法。
lncRNA 通过表观遗传修饰与转录调控、转录后加工、翻译调控等多种机制,在多种生物学过程中发挥重要作用。近年来的研究揭示,lncRNA在免疫系统中起着非常重要的作用,对T细胞、B 细胞、固有免疫细胞和炎症因子亦具有调控作用,其表达异常可以影响多种免疫系统疾病的发生、发展及预后,成为免疫学关注的焦点。现有证据表明lncRNA的表达异常、相应位置的SNP或碱基的突变或许与肿瘤疾病的发生发展高度相关,并可作为肿瘤早期诊断、临床分期、预后、药物疗效的独立预测因子。然而,PD-1/PD-L1信号通路中相关lncRNA研究仍然较少。
鉴于PD-1/PD-L1免疫抑制剂缺乏高预测性生物标记物以及lncRNA在免疫调控中的重要作用,项目拟挖掘与PD-1基因相关的lncRNA及mRNA表达谱,探索预测靶基因表达量与PDCD1/PD-L1抑制剂疗效相关性,开发出PD1/PD-L1免疫治疗敏感性生物标记物试剂盒。
长非编码RNA RP5-1091N2.9转录本(含UTR区域)位置是chrX:71183559-71198175(人类hg38版本),长度为48186bp,位于负链,其对应的Ensembl 转录本ID是ENSG00000228427。其功能研究较少,Mariotti B, Servaas N H, Rossato M, et al. Thelong non-coding RNA NRIR drives IFN-response in monocytes: implication forsystemic sclerosis[J]. Frontiers in immunology, 2019, 10: 100.公开了RP5-1091N2.9 系统性硬化症(systemic sclerosis,SSc)显著高表达,未有数据显示RP5-1091N2.9与肺癌相关。
有研究表明CD48、P2RY10、CD2、CTSS、GMFG、HLA-DMB在某些肿瘤中存在差异表达,但在LUSC中并不具有显著意义。
发明内容
本发明的目的在于克服现有技术的至少一个不足,提供于预测肺鳞癌患者免疫疗效的标志物组及系统。
本发明所采取的技术方案是:
本发明的第一个方面,提供:
用于预测肺鳞癌患者免疫疗效的标志物组,由长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB组成。
本发明的第二个方面,提供:
定量长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量的试剂在制备预测肺鳞癌患者免疫疗效试剂中的应用。
在一些应用的实例中,所述试剂的检测样本为患者的肿瘤组织和/或外周血。
本发明的第三个方面,提供:
一种用于预测肺鳞癌患者免疫疗效的系统,包括:
长链非编码RNA定量装置:用于确定样本中长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量;
免疫疗效预测装置:基于样本中长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量,预测肺鳞癌患者免疫疗效;
结果输出装置:用于输出免疫疗效预测装置分析得到的预测结果。
在一些系统的实例中,所述样本为患者的肿瘤组织和/或外周血;
在一些系统的实例中,所述长链非编码RNA定量装置选自高通量测序装置、RNA定量芯片、RNA qPCR定量装置。
在一些系统的实例中,所述免疫疗效预测装置的计算方法包括:
S1) 根据FPKM公式计算每个RNA的表达值Fk;
S2) 根据公开免疫治疗疗效数据确定RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量与生存期的COX回归系数值Ci;
S3) 根据以下公式计算疗效预测分值Rscore:
S4) 基于疗效预测分值Rscore确定免疫疗效。
在一些系统的实例中,使用R software的survival package确定RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量与生存期的COX回归系数值Ci。
在一些系统的实例中,Rscore≤0.70,判定为肺鳞癌患者免疫治疗疗效好;Rscore>0.70时,判定为肺鳞癌患者免疫治疗疗效差。
在一些系统的实例中,所述长链非编码RNA定量装置选自高通量测序装置,基于高通量测序数据,根据FPKM公式计算每个RNA的表达值Fk,使用R software的survivalpackage确定RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量与生存期的COX回归系数值Ci,Rscore≤0.70,判定为肺鳞癌患者免疫治疗疗效好;Rscore>0.70时,判定为肺鳞癌患者免疫治疗疗效差。
在一些系统的实例中,还包括结合肿瘤突变负荷TMB值确定免疫疗效。
在一些系统的实例中,肿瘤突变负荷TMB值≥15,判定为肺鳞癌患者免疫治疗疗效好;肿瘤突变负荷TMB值<15时,判定为肺鳞癌患者免疫治疗疗效差。
本发明的有益效果是:
本发明一些实例的技术,可以有效预测肺鳞癌患者免疫疗效,有利于更好地指导临床用药,减少副作用,避免不必要的免疫治疗,有利于建立合理的联合治疗方案。
本发明一些实例的技术,通过结合肿瘤突变负荷TMB值,可以更好地确定免疫疗效。
附图说明
图1是肺鳞癌中RP5-1091N2.9和6个辅助蛋白的表达量;
图2~图7分别是CD2、CD48、CTSS、GMFG、 HLA-DMB、P2RY10和RP5-1091N2.9的共表达关系;
图8是文库perkinelmer labchip微量芯片分析仪质检的具体出峰图;
图9是30个文库的出峰图;
图10是30个患者的生存期信息;
图11~17是不同标志物单独使用时的生存时间图。
具体实施方式
下面结合实验,进一步说明本发明的技术方案。
T细胞分离:按照EasySep™ Human T Cell Isolation Cocktail(货号:17951C)和EasySep™ Dextran RapidSpheres™(货号:50103)的说明书进行操作,采用负选方式。
提取RNA:
直接在悬浮液中加入Trizol裂解细胞,加1ml Trizol.用取样器吹打几次(加Trizol前不要洗涤细胞,以免降解RNA)。将匀浆样品在15-30℃放置5mim,使得核酸蛋白复合物完全分离。4 ℃ 12 000rpm离心10min,取上清。加0.2ml氯仿,盖好管盖,在漩涡振荡器上震荡15s,室温放置3min。如不能涡旋混匀,可手动颠倒混匀2min代替。4 ℃ 12 000rpm,离心10-15min,样品会分成三层:红色的有机相,中间层和上层无色的水相,RNA主要在水相中,把水相(约600ul,约为所用Trizol试剂的60%)转移到新管中。在得到的水相溶液中加入等体积(500ul)的异丙醇,上下颠倒混匀,-20℃ 放置20-30min。4 ℃ 12 000rpm离心10min,去上清。加入1ml 75%乙醇(DEPC水处理过的水配制)洗涤沉淀。4 ℃ 12 000rpm离心5min,弃上清;短暂快速离心,用移液器小心吸弃上清,注意不要吸弃沉淀。室温放置晾干(不要晾得过干,RNA完全干燥后会很难溶解,大约晾干2-3min左右即可)。加入适量DEPC水(根据实验需要,可加30-100ul水)或0.5%SDS,用枪头吸打几次,充分溶解RNA。50℃保温1小时。
文库构建:
根据kapa建库试剂盒的说明书进行操作。试剂盒名称和货号为KAPA RNA-seq文库构建试剂盒+RiboErase核糖体RNA去除(人/大鼠/小鼠) (96个反应) KK货号KK8484,产品货号07962304001。对建立的RNA文库,用perkinelmer labchip微量芯片分析仪或者全自动核酸蛋白分析系统Qsep100进行文库质检,确保条带都在300bp范围附近。
高通量测序:
使用illumina novaseq对上述RNAseq文库进行测序。测序量要求为20M reads/样品。也可使用同类型的其他高通量测序仪。
数据分析:
S1) 使用Cutadapt 3.4和FastQC 0.11.9进行测序下机数据的预处理;
S2) 使用STAR Aligner 2.7.9a进行数据的比对,参考基因组为hg38;
S3) 使用featureCounts v1.5.2计算所有n个RNA的read count;
S4) 根据FPKM公式计算每个RNA的表达值F,并用R software的rank函数计算每个RNA的表达值在该样品n个RNA表达量中的秩R;
S5) 提取RP5-1091N2.9及其6个辅助RNA的F值和R值,6个辅助RNA的基因symbol是CD48,P2RY10,CD2,CTSS,GMFG,HLA-DMB;
S6) 用以下公式计算疗效预测分值Rscore:
式中,Fk、Ci计算方式如下:
S6-1) 建立肿瘤RNAseq数据库,例如整合NCBI、Gtex、TCGA、Encode的公开多种细胞类型多组织的数据,按照以下方式进行数据重分析和归一化;
S6-2) 使用Cutadapt 3.4和FastQC 0.11.9进行所有原始下机数据的预处理;
S6-3) 使用STAR Aligner 2.7.9a进行数据的比对,参考基因组为hg38;
S6-4) 使用featureCounts v1.5.2计算所有n个RNA的read count;
S6-5) 根据FPKM公式计算每个RNA的表达值Fk;
S6-6) 使用R software的correlation参数,计算RP5-1091N2.9与其他人体RNA的相关性Corr值,并挑选Corr值>0.6的RNA进行下一步计算;
S6-7) 使用R software的topGO package和STRING软件(https://cn.string-db.org/),检查RP5-1091N2.9与其他Corr值>0.6的RNA所显著富集的通路是否有与免疫调节密切相关的通路,并确认这些通路的基因群形成明显的蛋白互作网络,同时需要确认6个辅助RNA的Corr值>0.6。如果满足以上所述,则认为该肿瘤RNA表达数据库构库成功;
S6-8) 根据样品的生存期信息,把数据库样品分成长生存期和短生存期两组。使用R software的survival package对数据库中的RP5-1091N2.9与其6个辅助RNA计算COX回归系数值Ci;
S7) 分别对生存期长样品和生存期短样品计算RScore值和TMB值,得到疗效判断的阈值。
肿瘤突变负荷TMB值计算方法如下:
肿瘤突变负荷TMB值可以按现有方法计算得到(www.ncbi.nlm.nih.gov/pmc/articles/PMC7710563/),或按如下方法计算:
S1) 获取基于高通量测序的肿瘤组织DNA测序数据(要求覆盖≥400个基因);
S2) 获取基于高通量测序的相应患者的外周血白细胞DNA测序数据(要求覆盖≥400个基因);
S3) 把肿瘤组织DNA+外周血白细胞DNA测序数据进行联合分析:
S4) 使用Cutadapt 3.4和FastQC 0.11.9进行测序数据的预处理;
S5) 使用bwa和samtools 进行数据的比对,参考基因组为hg38,得到外周血正常样品 bam 文件和肿瘤组织样品bam文件;
S6) 使用GATK进行碱基质量重新矫正,使用的软件和命令如下:
S7) 使用STRELKA2.8.2进行somatic snv和indel检测。使用命令如下configureStrelkaSomaticWorkflow.py --normalBam normal.bam --tumorBam tumor.bam --referenceFasta --runDir –disableEVS –reportEVSFeatures;
S8) 根据TMB定义计算每个样品的肿瘤突变负荷
RScore结果可以与TMB计算结果进行分值校正,两者共同预测为较好疗效的,才更应该被认同为疗效较好,可相互降低假阳性。RScore结果基于T细胞RNAseq计算,TMB基于DNAseq计算,确保在DNA和RNA两个层面同时对疗效进行预测。
实施例1:
建立肺鳞癌数据库,计算RP5-1091N2.9及关联蛋白的相关系数,获取疗效阈值
整合Gtex、Gencode、TCGA三个数据库中所有肺鳞癌LUSC样品的基因表达,按照FPKM(Fragment perkilometer, FPKM)的方法对表达量进行样品间和批次间校正,得到RP5-1091N2.9在各个样品的标准化表达量。
然后分析肺鳞癌中RP5-1091N2.9和6个辅助蛋白的表达量,表达量用log(FPKM)展示如图1。
通过R软件的correlation函数计算RP5-1091N2.9与其他人体蛋白的相关性(展示在下表中)。与RP5-1091N2.9高度正向相关(相关系数>0.6)的基因一共486个。
对486个基因进行Reactome富集分析。对486个相关系数>0.6的蛋白,进行Reactome功能富集分析,发现其功能显著,前5个显著富集通路都是免疫相关通路:ImmuneSystem、Adaptive Immune System、Immunoregulatory interactions between aLymphoid and a non-Lymphoid cell、Innate Immune System和Cytokine Signaling inImmune system。
注:使用的数据库为Reactome。
从表2前5个免疫富集通路Immune System、Adaptive Immune System、Immunoregulatory interactions between a Lymphoid and a non-Lymphoid cell、Innate Immune System和Cytokine Signaling in Immune system中挑选出与RP5-1091N2.9的共表达关系最强的基因,一共是如下6个,分别为CD2、CD48、CTSS、GMFG、 HLA-DMB、P2RY10 (图2~7)。
根据数据库样品的生存期信息,把数据库样品分成长生存期(Group-L)和短生存期(Group-S)两组。使用R software的survival package进行逐步回归分析,根据AIC值选取最优的回归方程,使用脚本如下:
library(survival)
cox <- coxph(Surv(futime, fustat) ~ ., data = rt)
cox=step(cox)
value <- predict(cox,type="risk",newdata=rt)
coxSummary=summary(cox)
table=as.data.frame(cbind(coxSummary$coefficients,coxSummary$
conf.int))
最终得到数据库中的RP5-1091N2.9与其6个辅助RNA计算COX回归系数值Ci,总结如表3。
根据技术路线所述,数据库构库成功。对数据库中生存期长样品和生存期短样品分别计算Rscore值和TMB值,得到阈值表(表4)。
实施例2:30例肺癌患者的RNA检测和治疗效果预测
收集30例肺癌患者的癌组织。
对30个癌组织样品进行如下操作:
制作免疫细胞悬浮液:按照EasySep™ Human T Cell Isolation Cocktail(货号:17951C) 和EasySep™ Dextran RapidSpheres™(货号:50103)的说明书进行操作,采用负选方式。
提取RNA:
直接在悬浮液中加入Trizol裂解细胞,加1ml Trizol.用取样器吹打几次(加Trizol前不要洗涤细胞,以免降解RNA)。将匀浆样品在15-30℃放置5mim,使得核酸蛋白复合物完全分离。4 ℃ 12 000rpm离心10min,取上清。加0.2ml氯仿,盖好管盖,在漩涡振荡器上震荡15s,室温放置3min。如不能涡旋混匀,可手动颠倒混匀2min代替。4 ℃ 12 000rpm,离心10-15min,样品会分成三层:红色的有机相,中间层和上层无色的水相,RNA主要在水相中,把水相(约600ul,约为所用Trizol试剂的60%)转移到新管中。在得到的水相溶液中加入等体积(500ul)的异丙醇,上下颠倒混匀,-20℃ 放置20-30min。4 ℃ 12 000rpm离心10min,去上清。加入1ml 75%乙醇(DEPC水处理过的水配制)洗涤沉淀。4 ℃ 12 000rpm离心5min,弃上清;短暂快速离心,用移液器小心吸弃上清,注意不要吸弃沉淀。室温放置晾干(不要晾得过干,RNA完全干燥后会很难溶解,大约晾干2-3min左右即可)。加入适量DEPC水(根据实验需要,可加30-100ul水)或0.5%SDS,用枪头吸打几次,充分溶解RNA。50℃保温1小时。
文库构建:
根据kapa建库试剂盒的说明书进行操作。试剂盒名称和货号为KAPA RNA-seq文库构建试剂盒+RiboErase核糖体RNA去除(人/大鼠/小鼠) (96个反应) KK货号KK8484,产品货号07962304001。对建立的RNA文库,用perkinelmer labchip微量芯片分析仪或者全自动核酸蛋白分析系统Qsep100进行文库质检,确保条带都在300bp范围附近。
以P001为例,把文库perkinelmer labchip微量芯片分析仪质检的具体出峰图结果展示如图8。30个文库的情况均类似,峰值条带都在300bp范围附近。
高通量测序:
使用illumina novaseq对上面质检过的30个RNA文库进行测序。测序量为20Mreads/样品。
数据分析:
使用Cutadapt 3.4和FastQC 0.11.9进行测序下机数据的预处理;
使用STAR Aligner 2.7.9a进行数据的比对,参考基因组为hg38;
使用featureCounts v1.5.2计算所有n个RNA的read count;
根据FPKM公式计算每个RNA的表达值F,并用R software的rank函数计算每个RNA的表达值在该样品n个RNA表达量中的秩R (Ci值);
提取RP5-1091N2.9及其6个辅助RNA的FPKM值(Fk),30个样品中的FPKM值展示如表6。
根据RP5-1091N2.9及其6个辅助RNA的Fk和Ci值,用以下公式计算疗效预测分值RScore;
30个患者的RScore计算结果如表5。根据实施例1数据库的判断,RScore疗效阈值为0.70 (RScore<0.70:疗效较好;RScore>0.70:疗效较差)。根据本计算方法,P001、P013、P019和P026被认为免疫治疗效果可能较好。
注:表中,Score-H表示预测免疫治疗疗效好,Score-L表示预测免疫治疗疗效差。
提取本实施例的30例患者的RP5-1091N2.9及其6个辅助RNA的FPKM值,把样品按照RP5-1091N2.9 的FPKM值分成两组:
1)RP5-1091N2.9 high expression组---大于RP5-1091N2.9平均FPKM值的样品组;
2)RP5-1091N2.9 low expression组---小于RP5-1091N2.9平均FPKM值的样品组;
然后根据两个组别样品的生存期信息,把数据库样品分成长生存期和短生存期两组。使用R software的survival package对数据库中的RP5-1091N2.9与其6个辅助RNA计算生存期差异p值。可见,如果单独使用这7个基因进行疗效预测并做生存分析,结果并不理想,P值均大于0.05,结果如图11~17所示。
实施例3:30例肺癌患者的RNA+DNA并行检测
1、同样的对实施例2相同的30例患者样品,进行RNA+DNA并行检测;
2、收集30例肺癌患者的癌组织*2和外周血*1。
3、对6个癌组织样品进行如下操作:
S1) 制作免疫细胞悬浮液:按照EasySep™ Human T Cell Isolation Cocktail(货号:17951C) 和EasySep™ Dextran RapidSpheres™(货号:50103)的说明书进行操作,采用负选方式。
S2) 提取RNA:直接在悬浮液中加入Trizol裂解细胞,加1ml Trizol.用取样器吹打几次(加Trizol前不要洗涤细胞,以免降解RNA)。将匀浆样品在15-30℃放置5mim,使得核酸蛋白复合物完全分离。4 ℃ 12 000rpm离心10min,取上清。加0.2ml氯仿,盖好管盖,在漩涡振荡器上震荡15s,室温放置3min。如不能涡旋混匀,可手动颠倒混匀2min代替。4 ℃ 12000rpm,离心10-15min,样品会分成三层:红色的有机相,中间层和上层无色的水相,RNA主要在水相中,把水相(约600ul,约为所用Trizol试剂的60%)转移到新管中。在得到的水相溶液中加入等体积(500ul)的异丙醇,上下颠倒混匀,-20℃ 放置20-30min。4 ℃ 12 000rpm离心10min,去上清。加入1ml 75%乙醇(DEPC水处理过的水配制)洗涤沉淀。4 ℃ 12 000rpm离心5min,弃上清;短暂快速离心,用移液器小心吸弃上清,注意不要吸弃沉淀。室温放置晾干(不要晾得过干,RNA完全干燥后会很难溶解,大约晾干2-3min左右即可)。加入适量DEPC水(根据实验需要,可加30-100ul水)或0.5%SDS,用枪头吸打几次,充分溶解RNA。50℃保温1小时。
S3) RNA文库构建:根据kapa建库试剂盒的说明书进行操作。试剂盒名称和货号为KAPA RNA-seq文库构建试剂盒+RiboErase核糖体RNA去除(人/大鼠/小鼠) (96个反应) KK货号KK8484,产品货号07962304001。
S4) 高通量测序:使用illumina novaseq对去核糖体RNA(rRNA)处理后的总RNA样本进行测序。
S5) 数据分析:
S5-1) 使用Cutadapt 3.4和FastQC 0.11.9进行测序下机数据的预处理;
S5-2)使用STAR Aligner 2.7.9a进行数据的比对,参考基因组为hg38;
S5-3)使用featureCounts v1.5.2计算RNA的read count;
S5-4)使用DESeq2 v1.30.1计算差异表达值;
S5-5)提取RP5-1091N2.9及其6个辅助RNA的Fk值和Ci值,用以下公式计算疗效预测分值RScore;
4、继续对30个癌组织样品进行如下操作:
S1) 提取DNA:根据石蜡包埋组织DNA快速提取试剂盒(天根生化,货号DP330-02)的说明书进行操作。
S2) DNA文库构建:根据kapa建库试剂盒的说明书进行操作。试剂盒名称为KAPADNA HyperPrep 文库构建试剂盒,货号KK8504。
S3) 特定基因区域捕获:按照IDT xGen® Exome Research Panel或者其他区域捕获试剂盒的说明书进行操作,要求捕获基因数>400个。
S4) 对建立的肿瘤DNA文库,30个文库均用perkinelmer labchip微量芯片分析仪质检,具体出峰图与实施例2类似,30个样品总体情况如图9所示,峰值条带都在300bp范围附近。
S5) 高通量测序:使用illumina novaseq对DNA文库进行测序。
5、对30个外周血样品进行如下操作:
S1) 分离血液白细胞层;
S2) 提取DNA:根据血液/细胞/组织基因组DNA提取试剂盒(天根生化,货号DP304-02)的说明书进行操作。
S3) DNA文库构建:根据kapa建库试剂盒的说明书进行操作。试剂盒名称为KAPADNA HyperPrep 文库构建试剂盒,货号KK8504。
S4) 特定基因区域捕获:按照IDT xGen® Exome Research Panel或者其他区域捕获试剂盒的说明书进行操作,要求捕获基因数>400个。文库如实施例2和肿瘤组织一样,也用labchip进行文库质检,通过后进行高通量测序。
S5) 高通量测序:使用illumina novaseq对DNA文库进行测序。
、每个患者的肿瘤突变负荷计算:
S1) 把第3步和第4步的测序数据进行联合分析:
i.使用Cutadapt 3.4和FastQC 0.11.9进行测序下机数据的预处理;
ii.使用bwa和samtools 进行数据的比对,参考基因组为hg38;
iii. 使用bamdst 1.0.9软件进行捕获区域的捕获质量鉴定---计算基因覆盖数,捕获特异性等参数,以P001的肿瘤组织和外周血的测序结果为例,TargetRegion为400肿瘤基因,展示结果如表7;
iv. 使用GATK进行somatic snv和indel检测;
v. 根据TMB定义计算每个样品的肿瘤突变负荷(TMB被定义为每百万碱基中被检测出的somatic snv和indel总数,公式如下)
S2) 30个患者的肿瘤突变负荷计算结果如表8。根据实施例1数据库的判断,单纯依据TMB进行判断的疗效阈值为15(TMB≥15:TMB-High疗效较好;TMB<15:TMB-L疗效较差)。
表8、30例患者的肿瘤突变负荷TMB计算结果
注:表中,TMB-High表示预测免疫治疗疗效好,TMB-L表示预测免疫治疗疗效差。
与实施例2的计算结果进行整合,只有同时满足Rscore<0.70和TMB≥15的样品,才能在DNA和RNA两个层面同时判定为疗效较好。因此只有P001和P026两个样品被认为可推荐使用免疫治疗。
后期经临床追踪反馈,这两个患者的免疫治疗效果均好于其他28个患者,图10是30个患者的生存期信息,具有显著差异性(t检验,P.value=5.451E-07)。
以上是对本发明所作的进一步详细说明,不可视为对本发明的具体实施的局限。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的简单推演或替换,都在本发明的保护范围之内。
Claims (10)
1.用于预测肺鳞癌患者免疫疗效的标志物组,其特征在于:由长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB组成。
2.定量长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量的试剂在制备预测肺鳞癌患者免疫疗效试剂中的应用。
3.根据权利要求2所述的应用,其特征在于:所述试剂的检测样本为患者的肿瘤组织和/或外周血。
4.一种用于预测肺鳞癌患者免疫疗效的系统,其特征在于:包括:
长链非编码RNA定量装置:用于确定样本中长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量;
免疫疗效预测装置:基于样本中长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量,预测肺鳞癌患者免疫疗效;
结果输出装置:用于输出免疫疗效预测装置分析得到的预测结果。
5.根据权利要求4所述的系统,其特征在于:所述样本为患者的肿瘤组织和/或外周血;和/或
所述长链非编码RNA定量装置选自高通量测序装置、RNA定量芯片、RNA qPCR定量装置。
7.根据权利要求6所述的系统,其特征在于:使用R software的survival package确定RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量与生存期的COX回归系数值Ci。
8.根据权利要求7所述的系统,其特征在于:Rscore≤0.70,判定为肺鳞癌患者免疫治疗疗效好;Rscore>0.70时,判定为肺鳞癌患者免疫治疗疗效差。
9.根据权利要求8所述的系统,其特征在于:还包括结合肿瘤突变负荷TMB值确定免疫疗效。
10.根据权利要求9所述的系统,其特征在于:肿瘤突变负荷TMB值≥15,判定为肺鳞癌患者免疫治疗疗效好;肿瘤突变负荷TMB值<15时,判定为肺鳞癌患者免疫治疗疗效差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210448091.XA CN114540504B (zh) | 2022-04-27 | 2022-04-27 | 用于预测肺鳞癌患者免疫疗效的标志物组及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210448091.XA CN114540504B (zh) | 2022-04-27 | 2022-04-27 | 用于预测肺鳞癌患者免疫疗效的标志物组及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114540504A true CN114540504A (zh) | 2022-05-27 |
CN114540504B CN114540504B (zh) | 2022-07-08 |
Family
ID=81666806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210448091.XA Active CN114540504B (zh) | 2022-04-27 | 2022-04-27 | 用于预测肺鳞癌患者免疫疗效的标志物组及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114540504B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005100998A2 (en) * | 2004-04-16 | 2005-10-27 | Europroteome Ag | Membrane markers for use in cancer diagnosis and therapy |
US20100021424A1 (en) * | 2006-06-02 | 2010-01-28 | Vincent Brichard | Method For Identifying Whether A Patient Will Be Responder or Not to Immunotherapy |
US20140329704A1 (en) * | 2013-03-28 | 2014-11-06 | President And Fellows Of Harvard College | Markers for mature beta-cells and methods of using the same |
CN105874079A (zh) * | 2013-09-09 | 2016-08-17 | 阿尔玛克诊断有限公司 | 用于肺癌的分子诊断测试 |
-
2022
- 2022-04-27 CN CN202210448091.XA patent/CN114540504B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005100998A2 (en) * | 2004-04-16 | 2005-10-27 | Europroteome Ag | Membrane markers for use in cancer diagnosis and therapy |
US20100021424A1 (en) * | 2006-06-02 | 2010-01-28 | Vincent Brichard | Method For Identifying Whether A Patient Will Be Responder or Not to Immunotherapy |
US20140329704A1 (en) * | 2013-03-28 | 2014-11-06 | President And Fellows Of Harvard College | Markers for mature beta-cells and methods of using the same |
CN105874079A (zh) * | 2013-09-09 | 2016-08-17 | 阿尔玛克诊断有限公司 | 用于肺癌的分子诊断测试 |
Non-Patent Citations (4)
Title |
---|
LAN AIHUA等: "Bioinformatics and survival analysis of glia maturation factor-gamma in pan-cancers", 《BMC CANCER》 * |
SHENG HU等: "DNA methylation of ARHGAP30 is negatively associated with ARHGAP30 expression in lung adenocarcinoma, which reduces tumor immunity and is detrimental to patient survival", 《AGING》 * |
李一然: "基于GEO数据库分析影响纳武单抗及派姆单抗治疗非小细胞肺癌疗效的差异基因", 《中国优秀硕士学位论文全文数据库医药卫生科技辑》 * |
王守正等: "肺鳞癌的免疫治疗进展", 《中国肺癌杂志》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114540504B (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102622305B1 (ko) | 염색체 상호작용 부위를 이용하는 검출 방법 | |
Gasparetto et al. | Transcription and DNA methylation patterns of blood-derived CD8+ T cells are associated with age and inflammatory bowel disease but do not predict prognosis | |
EP3337465B1 (en) | Compositions and methods for use in combination for the treatment and diagnosis of autoimmune diseases | |
Ram et al. | Systematic evaluation of genes and genetic variants associated with type 1 diabetes susceptibility | |
CN116042832B (zh) | 一种预测非小细胞肺癌免疫治疗获益程度及预后的生物标志物及应用 | |
Tängdén et al. | A genome-wide association study in a large community-based cohort identifies multiple loci associated with susceptibility to bacterial and viral infections | |
Hao et al. | Essential genes and MiRNA–mRNA network contributing to the pathogenesis of idiopathic pulmonary arterial hypertension | |
Landmark-Høyvik et al. | Genome-wide association study in breast cancer survivors reveals SNPs associated with gene expression of genes belonging to MHC class I and II | |
CN114540504B (zh) | 用于预测肺鳞癌患者免疫疗效的标志物组及系统 | |
Li et al. | Novel immune-related prognostic model and nomogram for breast cancer based on ssGSEA | |
Zhi et al. | Long non-coding RNA RP11-342L8. 2, derived from RNA sequencing and validated via RT-qPCR, is upregulated and correlates with disease severity in psoriasis patients | |
WO2017220782A1 (en) | Screening method for endometrial cancer | |
Vinitha et al. | PPIA rs6850: A> G single-nucleotide polymorphism is associated with raised plasma cyclophilin A levels in patients with coronary artery disease | |
CN108588201B (zh) | 一种结直肠癌西妥昔单抗耐药性痕量dna突变检测的方法及装置 | |
CN106119406B (zh) | 多发性肉芽肿血管炎及微小动脉炎的基因分型诊断试剂盒及使用方法 | |
CN105950741B (zh) | 一种基于hsp90ab1基因型预测糖皮质激素治疗sle疗效的试剂盒 | |
Gao | Identification of feature autophagy-related genes and DNA methylation profiles in systemic lupus erythematosus patients | |
CN112029858B (zh) | 一种肿瘤免疫治疗的预测指标 | |
Cheng et al. | Exploration of Lung Cancer-Related Genetic Factors via Mendelian Randomization Method Based on Genomic and Transcriptomic Summarized Data | |
CN114317550A (zh) | 一种编码mitf基因突变体的核酸及其应用 | |
CN114231628A (zh) | 预测胃肠肿瘤免疫检查点抑制剂疗效的标志物组合及其应用 | |
Lin et al. | LncRNA DIRC1 is a novel prognostic biomarker and correlated with immune infiltrates in stomach adenocarcinoma | |
JP2023524048A (ja) | 癌の免疫療法のための複合バイオマーカー | |
CN108342488B (zh) | 一种用于检测胃癌的试剂盒 | |
KR102083956B1 (ko) | 다발성 골수종 환자에서 레날리도마이드 및 덱사메타손의 치료에 대한 예후 예측용 바이오 마커 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220727 Address after: 510515, No. 1838, Guangzhou Avenue, Baiyun District, Guangdong, Guangzhou Patentee after: NANFANG HOSPITAL, SOUTHERN MEDICAL University Patentee after: GUANGZHOU WANDE GENE MEDICAL TECHNOLOGY Co.,Ltd. Address before: 510700 floor 6, building D, No. 188, Kaiyuan Avenue, Guangzhou high tech Industrial Development Zone, Huangpu District, Guangzhou, Guangdong Patentee before: GUANGZHOU WANDE GENE MEDICAL TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right |