CN114164273B - 一种鳞癌的预后标志物、预后风险评估模型的建立方法及其应用 - Google Patents

一种鳞癌的预后标志物、预后风险评估模型的建立方法及其应用 Download PDF

Info

Publication number
CN114164273B
CN114164273B CN202111533637.3A CN202111533637A CN114164273B CN 114164273 B CN114164273 B CN 114164273B CN 202111533637 A CN202111533637 A CN 202111533637A CN 114164273 B CN114164273 B CN 114164273B
Authority
CN
China
Prior art keywords
gene
risk
genes
prognosis
cell carcinoma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111533637.3A
Other languages
English (en)
Other versions
CN114164273A (zh
Inventor
刘巧维
许周暘
王李杰
李瑶
黄迪
胡毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Academy of Military Medical Sciences AMMS of PLA
Fifth Medical Center of PLA General Hospital
Original Assignee
Academy of Military Medical Sciences AMMS of PLA
Fifth Medical Center of PLA General Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Academy of Military Medical Sciences AMMS of PLA, Fifth Medical Center of PLA General Hospital filed Critical Academy of Military Medical Sciences AMMS of PLA
Priority to CN202111533637.3A priority Critical patent/CN114164273B/zh
Publication of CN114164273A publication Critical patent/CN114164273A/zh
Application granted granted Critical
Publication of CN114164273B publication Critical patent/CN114164273B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57411Specifically defined cancers of cervix
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57446Specifically defined cancers of stomach or intestine
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明公开了一种鳞癌的预后标志物、预后风险评估模型的建立方法及其应用,与现有技术中鳞癌单一基因表达检测相比,本发明具有更高的特异性和更高的诊断效能,可显著提高检测敏感度及特异度,本发明能够准确、便捷、高效地为鳞癌患者提供有效治疗措施并改善预后,本发明具有良好的临床应用价值,具有敏感性高、特异性好、准确率高的优点,可为临床医师对鳞癌患者的治疗决策提供有效的指导意见,减少无效治疗的发生,从而降低患者的治疗成本和不适体验,能够改善鳞癌患者的远期预后,以期缓解社会疾病负担。

Description

一种鳞癌的预后标志物、预后风险评估模型的建立方法及其 应用
技术领域
本发明涉及生物医学领域,特别涉及一种鳞癌的预后标志物、预后风险评估模型的建立方法及其应用。
背景技术
鳞癌是严重威胁人类健康的常见恶性肿瘤的组织学类型,常见鳞癌包括肺鳞癌、头颈部鳞癌、食管鳞癌和宫颈癌。这些鳞癌严重危害人类健康和生命,全球每年死亡人数超过100万。TP63和SOX2是促进鳞癌发生的主要转录因子,在鳞癌细胞中高水平扩增。目前虽然有许多成熟的治疗方法应用于鳞癌,如化疗、放疗免疫治疗等,但患者的长期生存率仍不理想,平均5年生存率为16%。
目前,常用于鳞癌诊断的筛查方法是计算机体层扫描摄片(CT)、磁共振成像(MRI)和活体组织切取检查。其中,CT、MRI仅能够检测到质量的实际存在,不能验证质量的良恶性,活体组织切取检查技术由于其耗时长、对健康组织造成损伤、引起患者疼痛、存在感染的风险、费用昂贵等特点,让患者依从性差,不易接受。
专利CN110716044A公开了一种用于食管鳞癌早期筛查和诊断的血清蛋白标志物,血清蛋白标志物为P53、GNA11、GNAS、PTEN、ACVR1B、FBXW7、EGFR、PDGFRA、SRSF2、MEN1、DAXX或CASP8基因编码的蛋白中的任意一种或两种以上的联合。但是,传统血清肿瘤标志物因其较低的敏感性及特异性,在早期诊断食管癌方面能力有限。
专利CN113151475A公开了SPINK5基因在制备食管鳞癌诊断和治疗药物中的应用。SPINK5基因及其表达产物可作为诊断食管鳞癌特异性标志基因,使食管鳞癌诊断更加准确、快速。但是,此标志物较单一,仅有一个基因作为标志物,技术特异性和敏感性不高,且检测方法不稳定、价格较高。
现有技术中,作为生物标志物的单个基因对于预测鳞癌的预后不够灵敏和准确,诊断效能低;传统血清肿瘤标志物因其较低的敏感性及特异性,在早期诊断鳞癌方面的能力也有限,并且现有技术中的标志物大多只能预测一种类型鳞癌的预后。因此,寻找作为生物标志物的多个基因对于预测多种类型的鳞癌的预后判定,以便选择最佳治疗方案,显著提高患者生存率,成为生物医学领域亟待解决的重要课题。
发明内容
为克服上述现有技术中存在的不足,本发明提供了一种鳞癌的预后标志物、预后风险评估模型及其应用。
在本发明的第一方面,提供了一种鳞癌的预后标志物,所述预后标志物包括组合基因,所述的组合基因包括如下基因:ZFP42基因,MME基因,FIGN基因,MYBPH基因和KCNH1基因,优选地,所述的组合基因由如下基因组成:ZFP42基因,MME基因,FIGN基因,MYBPH基因和KCNH1基因。
进一步地,所述的KCNH1基因的表达与存活率呈负相关,而ZFP42基因,MME基因,FIGN基因和MYBPH基因的表达与存活率呈正相关。
在本发明的第二方面,提供了一种基因组合作为预后标志物在制备用于评估鳞癌预后风险的产品中的应用。
进一步地,所述评估鳞癌预后风险的产品包括检测组合基因的mRNA表达水平或蛋白表达水平的产品。
进一步地,所述检测组合基因的mRNA表达水平或蛋白表达水平的产品包括能够结合组合基因的核酸或能够结合组合基因所表达的蛋白的物质。
进一步地,所述检测组合基因的mRNA表达水平为检测ZFP42基因,MME基因,FIGN基因,MYBPH基因和KCNH1基因表达的mRNA。
进一步地,所述检测组合基因的蛋白表达水平为检测ZFP42基因,MME基因,FIGN基因,MYBPH基因和KCNH1基因表达的蛋白。
在本发明的一个实施方式中,所述检测组合基因的产品为检测组合基因的mRNA表达水平。
进一步地,所述的评估鳞癌预后风险包括以下步骤:
(1)数据收集和处理
从UCSC Xena数据库、TCGA数据库和GEO数据库获取鳞癌患者的基因数据和临床数据,并对数据进行预处理;
(2)筛选差异表达基因
对步骤(1)中的基因进行识别,通过符合选择标准的R筛选出差异表达的基因;
(3)生存分析
对步骤(2)中得到的差异表达基因取交集后通过R软件“survival”包进行单因素Cox分析,识别出生存相关基因;
(4)预后风险评估模型的开发
对步骤(3)所述的生存相关基因,采用多元Cox回归方法,建立了预后风险评估模型,所述模型用于评估鳞癌预后风险指数,风险指数的计算公式为:风险评分=0.05×ZFP42+0.085×MME+0.08×MYBPH+0.023×FIGN–0.01×KCNH1;
(5)在测试集上验证模型是否构建成功
根据步骤(4)所得的预后风险评估模型计算GEO数据集的风险评分,并将其分为高危组和低危组,对两组进行生存分析;
(6)验证模型是否适用于所有类型的鳞癌。
进一步地,所述风险评分高于-1.89时为高风险;所述风险评分低于-1.89时为低风险。
进一步地,所述检测组合基因mRNA表达水平的产品可以包括能够结合组合基因的核酸。
进一步地,所述检测组合基因mRNA表达水平的产品可基于使用核酸分子的已知方法来发挥其功能:例如,可以采用聚合酶链式反应(PCR)、Southern印迹杂交、Northern印迹杂交、点杂交、荧光原位杂交(FISH)、DNA微阵列、高通量测序平台、芯片检测等,特别是PCR方法,例如实时荧光定量PCR法、恒温扩增技术(滚环核酸扩增、环介导等温扩增、链替代扩增等)。使用该产品可以定性地、定量地、或半定量地实施分析。
进一步地,所述检测组合基因mRNA表达水平的产品中所含的核酸可以通过化学合成来获得,或通过从生物材料制备含有所需核酸的基因,然后使用设计用于扩增所需核酸的引物对其进行扩增来获得,或mRNA通过逆转录形成cDNA,通过引物扩增cDNA获得对应的mRNA水平。
在本发明的一个实施方式中,mRNA通过逆转录形成cDNA,通过引物扩增cDNA获得对应的mRNA水平。
进一步地,所述核酸可以包括特异性扩增组合基因的引物。
进一步地,所述的引物为能够与核酸杂交并容许互补核酸聚合(一般通过提供游离的3’-OH基团)的单链多核苷酸。
进一步地,所述核酸还可包括特异性识别组合基因的探针。
进一步地,所述的探针为一段带有检测标记与目的基因(组合基因)互补的多核苷酸序列。
进一步地,所述检测组合基因mRNA表达水平的产品可以为试剂、试剂盒、试纸、基因芯片等,其可以包含能够结合组合基因的核酸(例如特异性扩增组合基因的引物和/或特异性识别组合基因的探针)或将上述引物/探针制备于承载物上(如固相芯片);检测组合基因mRNA表达水平的产品也可以为高通量测序平台,其可以使用能够结合组合基因的核酸(例如特异性扩增组合基因的引物和/或特异性识别组合基因的探针)针对组合基因进行检测。
进一步地,所述检测组合基因蛋白表达水平的产品可以包括能够结合组合基因所表达的蛋白的物质(例如抗体或其片段)。
进一步地,所述检测组合基因蛋白表达水平的产品可基于使用蛋白的已知方法来发挥其功能:例如,可以采用ELISA、放射免疫测定法、免疫组织化学法、Western印迹、蛋白质组学(例如抗体芯片、质谱(例如数据非依赖采集(Data Independent Acquision,DIA)质谱)等。
进一步地,所述检测组合基因蛋白表达水平的产品可以包括特异性结合组合基因所表达的蛋白的抗体或其片段。可以使用任何结构、尺寸、免疫球蛋白类别、起源等的抗体或其片段,只要它结合靶蛋白质即可。检测组合基因蛋白表达水平的产品中所包括的抗体或其片段可以是单克隆的或多克隆的。抗体片段指保留抗体对抗原的结合活性的抗体一部分(部分片段)或含有抗体一部分的肽。抗体片段可以包括F(ab′)2、Fab′、Fab、单链Fv(scFv)、二硫化物键合的Fv(dsFv)或其聚合物、二聚化V区(双抗体)、或含有CDR的肽。检测组合基因蛋白表达水平的产品可以包括编码抗体或编码抗体片段的氨基酸序列的分离的核酸、包含该核酸的载体或携带该载体的细胞。抗体可以通过本领域技术人员公知的方法来获得,也可采用可用的市售产品。
进一步地,所述检测组合基因蛋白表达水平的产品可以为试剂、试剂盒、试纸、基因芯片等,其可以包含能够结合组合基因所表达的蛋白的物质(例如抗体或其片段);检测组合基因蛋白表达水平的产品也可以为仪器平台,其可以包含测量模块(用于测量待测样本中组合基因所表达的蛋白的含量),还可以包含分析模块(用于分析待测样本与参比样本中组合基因所表达的蛋白的含量差异)。
进一步地,所述测量模块可基于质谱,例如DIA-MS,其中DIA采集方案由32个固定窗口组成,采集范围为400-1200质荷比(m/z)。
进一步地,所述检测组合基因蛋白表达水平的产品为仪器平台时,在检测前待测样本经过预处理,预处理可包括:将待测样本用裂解缓冲液稀释,二硫化物还原,烷基化处理,酶解,酸化,脱盐;具体地,预处理可包括:将待测样本用尿素溶液稀释,用二硫苏糖醇(Dithiothreitol,DTT)在37℃水浴进行二硫化物还原,然后在25℃下用500mmol/L的碘乙酰胺(Iodoacetamide,IAA)避光烷基化处理,用胰蛋白酶37℃下酶解,将酶解的肽用三氟乙酸溶液(Trifluoroacetic acid,TFA,pH=2-3)进行酸化,然后用C18脱盐柱进行脱盐,然后将脱盐的肽在真空下干燥后溶于含有0.1%甲酸和2%乙腈的缓冲液中,用分析柱分离得到定量的肽,用于DIA-MS分析。
进一步地,所述鳞癌包括肺磷癌(LUSC)、头颈部鳞癌(HNSC)、食管磷癌(ESCA)、宫颈磷癌(CESC)和阴道磷癌,特别是肺磷癌、头颈部鳞癌、食管磷癌和宫颈磷癌。
进一步地,用于检测组合基因mRNA表达水平或蛋白表达水平的检测样本,可以使用例如自活检受试者(鳞癌患者)获得的组织样品或流体,例如,组织、细胞、血液、血浆、血清、淋巴液、尿液、浆膜腔液、脊髓液、滑液、房水、泪液、唾液等或其级分或经过处理的材料,优选地,用于检测组合基因mRNA表达水平或蛋白表达水平的检测样本,可以使用自鳞癌患者的肿瘤组织、肿瘤细胞(循环肿瘤细胞)、血液、血浆、血清。
在本发明的一个实施方式中,用于检测组合基因mRNA表达水平或蛋白表达水平的检测样本,可以使用自鳞癌患者的肿瘤组织、肿瘤细胞(循环肿瘤细胞)、血液、血浆、血清。
在本发明的第三方面,提供了一种鳞癌的预后风险评估模型的建立方法。
进一步地,所述的建立方法包括以下步骤:
(1)数据收集和处理
从UCSC Xena数据库、TCGA数据库和GEO数据库获取鳞癌患者的基因数据和临床数据,并对数据进行预处理;
进一步地,所述的预处理步骤包括根据肿瘤类型为鳞癌、TNM分期无缺失以及总体生存时间(OS)>30天的标准对数据进行过滤,得到的样本量为(LUSC 464例,CESC 225例,ESCA 86例,HNSC 509例),将TCGA-LUSC队列作为训练集用于建立预后风险评估模型;从GEO数据库获取GSE37745和GSE29013队列及对应的临床数据,将GEO中的两个队列GSE37745(65个样本)和GSE29013(25个样本)作为测试集用于模型验证;TCGA数据库中的另外三种鳞癌类型(TCGA-CESC、TCGA-ESCA、TCGA-HNSC)用于探索该模型是否在所有鳞癌中均适用;Limma包用于对数据集进行标准化。
(2)筛选差异表达基因
对步骤(1)中的基因进行识别,通过符合选择标准的R筛选出差异表达的基因;
进一步地,所述的选择标准为:p<0.05且|logFC|>1。
进一步地,所述的通过符合选择标准的R筛选出差异表达的基因的步骤,包括:对与主转录因子TP63和SOX2相关的基因进行识别,分别对TCGA四种鳞癌类型进行如下操作:根据TP63表达量中位数将样本分为TP63高表达组(LUSC 232例,CESC 112例,ESCA 43例,HNSC 254例)和其他组(LUSC 232例,CESC 113例,ESCA 43例,HNSC 255例),根据SOX2表达量中位数将样本分为SOX2高表达组(LUSC 232例,CESC 112例,ESCA 43例,HNSC 254例)和其他组(LUSC 232例,CESC 113例,ESCA 43例,HNSC 255例);同时属于TP63高表达组和SOX2高表达组的样本定义为TP63-SOX2高表达组(LUSC 180例,CESC 67例,ESCA 29例,HNSC 152例),其余样本定义为其他组(LUSC 284例,CESC 158例,ESCA 57例,HNSC 357例);采取rawcounts进行差异基因分析;根据TP63-SOX2高表达组/其他组进行差异基因分析,按照p<0.05且|logFC|>1得到差异表达基因,最终得到4组差异基因。
(3)生存分析
对步骤(2)中得到的差异表达基因取交集后通过R软件“survival”包进行单因素Cox分析,识别出生存相关基因(表1)。
进一步地,所述的生存分析为采用TPM进行生存分析。
表1
Figure BDA0003412341870000061
/>
Figure BDA0003412341870000071
/>
Figure BDA0003412341870000081
/>
Figure BDA0003412341870000091
表1中的基因为所得与TP63-SOX2相关的基因,共160个,其中151个在四种类型的鳞癌中变化趋势一致,其中72个均上调,79个均下调。
(4)预后风险评估模型的开发
对步骤(3)所述的生存相关基因,采用多元Cox回归方法,建立了预后风险评估模型,所述模型用于评估鳞癌预后风险指数,风险指数的计算公式为:风险评分=0.05×ZFP42+0.085×MME+0.08×MYBPH+0.023×FIGN–0.01×KCNH1,cutoff值为-1.89。
进一步地,所述的风险评分越高,预测鳞癌患者的预后越差。
进一步地,所述风险评分高于-1.89时为高风险;所述风险评分低于-1.89时为低风险。
进一步地,在所述的步骤(4)前还包括:通过对所述的151个差异基因进行单因素COX分析,识别出21个基因与生存相关,随后利用随机森林算法,得到重要性前10的基因及他们的所有组合共计1023种。通过多因素COX分析,我们最终得到了由5个基因构成的预后风险评估模型。
进一步地,所述的预后风险评估模型是基于5个基因建立;5个基因具体为:ZFP42基因,MME基因,FIGN基因,MYBPH基因和KCNH1基因。
进一步地,根据所述的cutoff值,我们将样本分为高危组和低危组,Kaplan-Meier分析显示高危组的生存预期显著差于低危组。
(5)在测试集上验证模型是否构建成功
根据步骤(4)所得的预后风险评估模型计算GEO数据集的风险评分,并将其分为高危组和低危组,对两组进行生存分析。
进一步地,所述生存分析为通过Kaplan-Meier分析,结果显示高危组的生存预期显著差于低危组。
(6)验证模型是否适用于所有类型的鳞癌
为进一步验证该模型是否普遍适用于所有鳞癌类型,将该模型应用于CESC、ESCA、HNSC三种鳞癌类型中,分别对其进行Kaplan-Meier分析。
进一步地,所述的将模型应用于CESC、ESCA、HNSC三种鳞癌类型中,分别对其进行Kaplan-Meier分析,分析结果显示该模型得到的高危/低危组的生存预期存在差异,在CESC和HNSC中,高危组预后差。
在本发明的第四方面,提供了一种如第一方面所述的预后标志物或第三方面所述的预后风险评估模型在制备鳞癌预后诊断试剂和/或鳞癌治疗药物中的应用。
需要说明的是,具体疾病风险、严重程度、预后情况,还需临床医生结合该受试者的其他检测指标综合评估。
本发明所述的与鳞癌的发生相关的组合基因,与现有技术中鳞癌单一基因表达检测相比,本发明具有更高的特异性和更高的诊断效能,可显著提高检测敏感度及特异度,本发明能够准确、便捷、高效地为鳞癌患者提供有效治疗措施并改善预后,本发明具有良好的临床应用价值,具有敏感性高、特异性好、准确率高的优点,可为临床医师对肺鳞癌患者的治疗决策提供有效的指导意见,减少无效治疗的发生,从而降低患者的治疗成本和不适体验,能够改善鳞癌患者的远期预后,以期缓解社会疾病负担。
附图说明
图1为TCGA数据库肺鳞癌样本中高风险组和低风险组的KM生存分析。
图2为GEO数据库肺鳞癌样本中高风险组和低风险组的KM生存分析。
图3为TCGA数据库宫颈鳞癌样本中高风险组和低风险组的KM生存分析。
图4为TCGA数据库头颈部鳞癌样本中高风险组和低风险组的KM生存分析。
图5为利用随机森林算法,得到重要性前10的基因。
具体实施方式
为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明,其目的仅在于更好理解本发明的内容而非限制本发明的保护范围。
实施例1
通过两个独立队列开发出一种基于TP63-SOX2的鳞癌预后风险评估模型。其中,肺鳞癌TCGA-LUSC队列作为训练集用于建立风险评估模型。GEO中的两个队列GSE37745(65个样本)和GSE29013(25个样本)作为测试集用于模型验证。TCGA数据库中的另外三种鳞癌类型(CESC、ESCA、HNSC)用于探索该模型是否在所有鳞癌中均适用。
用于评估鳞癌的预后风险评估模型的构建方法步骤如下:
(1)数据收集和处理
4种TCGA肿瘤患者的RNA测序数据以及对应的临床信息下载自UCSC Xena dataportal(https://xenabrowser.net/)和The Cancer Genome Atlas Program database(TCGA,https://portal.gdc.cancer.gov/)。
发明人根据肿瘤类型为鳞癌、TNM分期无缺失以及总体生存时间(OS)>30天的标准对数据进行过滤,得到的样本量为(LUSC 464例,CESC 225例,ESCA 86例,HNSC 509例)。我们采取raw counts进行差异基因分析,采用TPM进行生存分析。GSE37745和GSE29013及其临床信息下载自Gene Expression Omnibus(GEO)(https://www.ncbi.nlm.nih.gov/gds/)数据库,当多个探针对应一个基因时取其中的最大值。Limma包用于对数据集进行标准化。
(2)筛选差异表达基因
首先,发明人对TP63-SOX2相关基因进行识别。分别对TCGA四种肿瘤类型进行如下操作:根据TP63表达量中位数将样本分为TP63高表达组(LUSC 232例,CESC 112例,ESCA 43例,HNSC 254例)和其他组(LUSC 232例,CESC 113例,ESCA 43例,HNSC 255例),根据SOX2表达量中位数将样本分为SOX2高表达组(LUSC 232例,CESC 112例,ESCA 43例,HNSC 254例)和其他组(LUSC 232例,CESC 113例,ESCA 43例,HNSC 255例);同时属于TP63高表达组和SOX2高表达组的样本定义为TP63-SOX2高表达组(LUSC 180例,CESC 67例,ESCA 29例,HNSC152例),其余样本定义为其他组(LUSC 284例,CESC 158例,ESCA 57例,HNSC 357例);根据TP63-SOX2高表达组/其他组进行差异基因分析;按照p<0.05且|logFC|>1得到差异基因。
(3)生存分析
将步骤(2)中得到的4组差异表达基因取交集后通过R软件“survival”包进行单因素Cox分析,识别出生存相关基因(得到TP63-SOX2相关基因),共160个,其中151个(表1)在四种鳞癌类型中变化趋势一致,其中72个均上调,79个均下调。通过对151个差异基因进行单因素COX分析,识别出21个基因与生存相关,随后利用随机森林算法,得到重要性前10的基因(图5)及他们的所有组合共计1023种。
表1TP63-SOX2相关基因
Figure BDA0003412341870000121
/>
Figure BDA0003412341870000131
/>
Figure BDA0003412341870000141
/>
Figure BDA0003412341870000151
(4)预后风险评估模型的开发
通过多因素COX分析,发明人最终得到了由5个基因构成的预后风险评估模型,该模型的计算公式是:风险评分=0.05×ZFP42+0.085×MME+0.08×MYBPH+0.023×FIGN–0.01×KCNH1,cutoff值为-1.89。根据cutoff值,发明人将样本分为高危组和低危组,Kaplan-Meier分析显示高危组的生存预期显著差于低危组(图1)。
(5)在测试集上验证模型是否构建成功
根据预后风险评估模型计算GEO数据集的风险得分并分为高危组和低危组,对两组进行生存分析,KM分析显示高危组的生存预期显著差于低危组(图2)。
(6)验证模型是否适用于所有类型的鳞癌
为进一步验证该模型是否普遍适用于所有鳞癌类型,将该模型应用于CESC、ESCA、HNSC三种鳞癌类型中,分别对其进行Kaplan-Meier分析。
进一步地,所述的将模型应用于CESC、ESCA、HNSC三种鳞癌类型中,分别对其进行Kaplan-Meier分析,分析结果显示该模型得到的高危/低危组的生存预期存在差异,在CESC(图3)和HNSC(图4)中,高危组预后差。

Claims (10)

1.一种鳞癌的预后标志物,其特征在于,所述的预后标志物包括组合基因,所述的组合基因包括如下基因:ZFP42基因,MME基因,FIGN基因,MYBPH基因和KCNH1基因。
2.基因组合作为预后标志物在制备用于评估鳞癌预后风险的产品中的应用,其特征在于,所述评估鳞癌预后风险的产品包括检测组合基因的mRNA表达水平或蛋白表达水平的产品,所述的基因组合包括如下基因:ZFP42基因,MME基因,FIGN基因,MYBPH基因和KCNH1基因;
所述的鳞癌选自:肺鳞癌、宫颈鳞癌、头颈部鳞癌。
3.权利要求2所述的应用,其特征在于,所述检测组合基因的mRNA表达水平或蛋白表达水平的产品包括能够结合组合基因的核酸或能够结合组合基因所表达的蛋白的物质。
4.权利要求2所述的应用,其特征在于,所述产品选自:试剂、试剂盒、试纸、基因芯片、高通量测序平台、抗体芯片、仪器平台。
5.权利要求4所述的应用,其特征在于,所述仪器平台包含测量模块,用于测量待测样本中组合基因所表达的蛋白的含量。
6.权利要求2所述的应用,其特征在于,用于所述检测组合基因mRNA表达水平或蛋白表达水平的检测样本为受试者的组织样品或流体。
7.权利要求6所述的应用,其特征在于,所述用于所述检测组合基因mRNA表达水平或蛋白表达水平的检测样本为肿瘤组织、肿瘤细胞、血液、血浆和血清中的一种。
8.一种鳞癌的预后风险评估模型的建立方法,其特征在于,所述的风险评估模型采用如权利要求1所述的预后标志物进行预测;所述的建立方法包括以下步骤:
(1)数据收集和处理
从UCSC Xena数据库、TCGA数据库和GEO数据库获取鳞癌患者的基因数据和临床数据,并对数据进行预处理;
(2)筛选差异表达基因
对步骤(1)中的基因进行识别,通过符合选择标准的R筛选出差异表达的基因;
(3)生存分析
对步骤(2)中得到的差异表达基因取交集后通过R软件“survival”包进行单因素Cox分析,识别出生存相关基因;
(4)预后风险评估模型的开发
对步骤(3)所述的生存相关基因,采用多元Cox回归方法,建立了预后风险评估模型,所述模型用于评估鳞癌预后风险指数,风险指数的计算公式为:风险评分=0.05×ZFP42+0.085×MME+0.08×MYBPH+0.023×FIGN–0.01×KCNH1;
(5)在测试集上验证模型是否构建成功
根据步骤(4)所得的预后风险评估模型计算GEO数据集的风险评分,并将其分为高危组和低危组,对两组进行生存分析;
(6)验证模型是否适用于所有类型的鳞癌。
9.如权利要求8所述的预后风险评估模型的建立方法,其特征在于,所述风险评分高于-1.89时为高风险;所述风险评分低于-1.89时为低风险。
10.一种如权利要求1所述的预后标志物在制备鳞癌预后诊断试剂中的应用,所述的鳞癌选自:肺鳞癌、宫颈鳞癌、头颈部鳞癌。
CN202111533637.3A 2021-12-15 2021-12-15 一种鳞癌的预后标志物、预后风险评估模型的建立方法及其应用 Active CN114164273B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111533637.3A CN114164273B (zh) 2021-12-15 2021-12-15 一种鳞癌的预后标志物、预后风险评估模型的建立方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111533637.3A CN114164273B (zh) 2021-12-15 2021-12-15 一种鳞癌的预后标志物、预后风险评估模型的建立方法及其应用

Publications (2)

Publication Number Publication Date
CN114164273A CN114164273A (zh) 2022-03-11
CN114164273B true CN114164273B (zh) 2023-05-23

Family

ID=80486672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111533637.3A Active CN114164273B (zh) 2021-12-15 2021-12-15 一种鳞癌的预后标志物、预后风险评估模型的建立方法及其应用

Country Status (1)

Country Link
CN (1) CN114164273B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116930498B (zh) * 2023-08-29 2023-12-12 中国人民解放军军事科学院军事医学研究院 一种原发性肝细胞癌切除术后复发风险预测试剂盒及其应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1679379A1 (en) * 2005-01-06 2006-07-12 UMC Utrecht Holding B.V. Diagnosis of metastases in HNSCC tumours
CA2715774A1 (en) * 2008-02-19 2009-08-27 Oncomethylome Sciences Sa Detection and prognosis of lung cancer
JP5808349B2 (ja) * 2010-03-01 2015-11-10 カリス ライフ サイエンシズ スウィッツァーランド ホールディングスゲーエムベーハー セラノーシスのためのバイオマーカー
US20140314792A1 (en) * 2013-03-15 2014-10-23 Institució Catalana De Recerca I Estudis Avançats Method for the diagnosis, prognosis and treatment of cancer metastasis
CA3084826C (en) * 2017-12-20 2023-10-17 Laboratory Corporation Of America Holdings Compositions and methods to detect head and neck cancer
CN109859801B (zh) * 2019-02-14 2023-09-19 辽宁省肿瘤医院 一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法

Also Published As

Publication number Publication date
CN114164273A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
EP2619321B1 (en) Biomarkers for differentiating melanoma from benign nevus in the skin
CN114250299A (zh) 用于膀胱癌检测的尿标记物
CN111662982B (zh) 用于脑胶质瘤早期诊断和/或复发监测的生物标志物及其应用
WO2020148590A1 (en) Nourin molecular biomarkers
CN114164273B (zh) 一种鳞癌的预后标志物、预后风险评估模型的建立方法及其应用
CN113493829B (zh) 生物标志物在肺动脉高压诊疗中的应用
CN113502326B (zh) 基于生物标志物的肺动脉高压的诊断产品及其应用
US20110009284A1 (en) Gene relating to estimation of postoperative prognosis for breast cancer
CN110656169B (zh) 心房颤动的诊断标志物
WO2011146937A1 (en) Methods and kits useful in diagnosing nsclc
CN115927608B (zh) 用于预测胰腺癌发生风险的生物标志物、方法和诊断设备
US11913076B2 (en) Prostate cancer gene profiles and methods of using the same
KR102460127B1 (ko) 치주 질환 진단용 바이오마커 및 이의 용도
US20120034235A1 (en) Marker for Liver-Cancer Diagnosis and Recurrence and Survival Prediction, a Kit Comprising the Same, and Prognosis Prediction in Liver-Cancer Patients Using the Marker
US20140248637A1 (en) Composition for diagnosis of lung cancer and diagnosis kit of lung cancer
CN114107489A (zh) 诊断青光眼的标志物及其应用
KR102643326B1 (ko) 양성 종양 또는 결절로부터 암을 구분하기 위한 바이오마커
CN110331207A (zh) 肺腺癌生物标志物及相关应用
EP4317458A1 (en) Follicular thyroid cancer-specific marker
CN113718032B (zh) 生物标志物在早期检测宫颈癌中的应用
US11497817B2 (en) Senile dementia treatment formulation and application thereof
US20230133776A1 (en) Methods for diagnosing cancer
CN114015780A (zh) 用于卵巢癌诊断或预后风险评估的标志物
RU2468372C1 (ru) Способ оценки эффективности терапии рака мочевого пузыря с помощью онкомаркера nusap1
CN113736886A (zh) 用于食管癌诊断的生物标志物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant