CN117305444A - 利用癌症中剪接异常的短外显子辅助癌症诊断和预后 - Google Patents

利用癌症中剪接异常的短外显子辅助癌症诊断和预后 Download PDF

Info

Publication number
CN117305444A
CN117305444A CN202210701225.4A CN202210701225A CN117305444A CN 117305444 A CN117305444 A CN 117305444A CN 202210701225 A CN202210701225 A CN 202210701225A CN 117305444 A CN117305444 A CN 117305444A
Authority
CN
China
Prior art keywords
cancer
prognosis
risk
short
survival
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210701225.4A
Other languages
English (en)
Inventor
王泽峰
张思蕊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Nutrition and Health of CAS
Original Assignee
Shanghai Institute of Nutrition and Health of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Nutrition and Health of CAS filed Critical Shanghai Institute of Nutrition and Health of CAS
Priority to CN202210701225.4A priority Critical patent/CN117305444A/zh
Priority to PCT/CN2023/101497 priority patent/WO2023246808A1/zh
Publication of CN117305444A publication Critical patent/CN117305444A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pathology (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了利用癌症中剪接异常的短外显子辅助癌症诊断和预后预测。具体地,本发明提供了一种癌症中剪接异常的短外显子(cancer‑associated short exons,CASE)或其检测试剂的用途,用作判断组织样本是否为癌症的标志物或癌症病人预后效果预测,可用于制备试剂或试剂盒,所述试剂或试剂盒用于判断癌症的发生风险和癌症病人的预后情况,所述癌症中剪接异常的短外显子如表A所列,本发明将剪接异常的短外显子作为判断癌症的发生风险和判断癌症患者预后和生存期的标志物,具有高灵敏性、高特异性的特点。

Description

利用癌症中剪接异常的短外显子辅助癌症诊断和预后
技术领域
本发明涉及生物医药领域,具体地涉及利用癌症中剪接异常的短外显子辅助癌症诊断和预后。
背景技术
癌症现已成为中国高发疾病之一,精准判断癌症以及癌症的预后对于癌症治疗是非常必要的,而利用易检测的生物标志物对癌症进行判断以及癌症病人的预后进行预测则具有重要的意义,但是对癌症病人预后进行预测的有效指标尚有不足。
因此,本领域迫切需要开发一种更有效的预测癌症以及癌症患者的预后的新方法。
发明内容
本发明的目的在于,根据癌症中RNA剪接变化,发明一种更有效的预测癌症以及癌症患者的预后的新方法。
在本发明的第一方面,提供了一种癌症中剪接异常的短外显子(cancer-associated short exons,CASE,或称“癌相关短外显子”)或其检测试剂的用途,用作判断样本是否为癌症或判断癌症的发生风险或预测癌症的标志物或用于制备一试剂或试剂盒,所述试剂或试剂盒用于判断样本是否为癌症或判断癌症的发生风险或预测癌症,所述癌症中剪接异常的短外显子包括选自表2A的一个或多个所述短外显子:
表2A(基于人类基因组hg19)
在另一优选例中,所述癌症中剪接异常的短外显子至少包括选自表2A的全部短外显子。
在另一优选例中,所述癌症中剪接异常的短外显子还包括选自表2B的一个或多个短外显子:
表2B(基于人类基因组hg19)
在另一优选例中,所述癌症中剪接异常的短外显子至少包括选自表2A和2B的4个短外显子。
在另一优选例中,所述癌症中剪接异常的短外显子至少包括选自表2A和2B的8个短外显子。
在另一优选例中,所述癌症中剪接异常的短外显子还包括选自表2C的一个或多个短外显子:
表2C(基于人类基因组hg19)
在另一优选例中,所述癌症中剪接异常的短外显子还包括选自表2D的一个或多个短外显子:
表2D(基于人类基因组hg19)
在另一优选例中,所述判断包括预先判断(预测)。
在另一优选例中,所述试剂包括引物、探针、测序文库、核酸芯片(如DNA芯片)。
在另一优选例中,所述的癌症中剪接异常的短外显子来源哺乳动物,较佳地来源于啮齿动物(如小鼠、大鼠)、灵长动物和人,更佳地,来源于被诊断患有癌症的患者或癌症疑似患者。
在另一优选例中,所述癌症选自下组:食道癌、肺腺癌、或其组合。
在另一优选例中,所述的检测是测定肿瘤组织、一般组织样品。
在另一优选例中,所述的一般组织包括癌旁组织。
在另一优选例中,所述检测试剂包括癌症中剪接异常的短外显子的特异性扩增引物、探针或芯片。
在另一优选例中,所述检测试剂选自下组:引物、探针、测序文库、核酸芯片(如DNA芯片)、或其组合。
在另一优选例中,所述的判断包括步骤:
(1)提供一来源于待测对象的样品,对样品中所述组合中各个生物标记物的水平进行检测;
(2)将步骤(1)测得的水平与预定值进行比较。
在另一优选例中,所述的样品选自下组:被诊断患有癌症的患者组织样品或癌旁正常样品。
在另一优选例中,与预定值进行比较,一个或多个选自表2A的生物标志物的水平符合所述预定值,表明待测对象具有癌症发生风险或患有癌症。
在另一优选例中,所述预定值为PSI值。
在另一优选例中,所述预定值是用随机森林算法对测得的PSI值进行评分获得的评分分值。
在另一优选例中,所述对象为人。
在另一优选例中,所述检测是针对离体样本的检测。
在另一优选例中,所述的离体样本为组织样本。
在另一优选例中,在步骤(1)之前,所述的方法还包括对样品进行处理的步骤。
本发明第二方面提供了一种生物标志物组合,所述的组合包括选自表2A的一个或多个癌症中剪接异常的短外显子。
在另一优选例中,所述组合还包括选自表2B的一个或多个癌症中剪接异常的短外显子。
在另一优选例中,所述癌症中剪接异常的短外显子至少包括选自表2A和2B的4个短外显子。
在另一优选例中,所述癌症中剪接异常的短外显子至少包括选自表2A和2B的8个短外显子。
在另一优选例中,所述癌症中剪接异常的短外显子至少包括选自表2A的全部短外显子。
在另一优选例中,所述生物标志物组合用于判断样本是否为癌症或判断癌症的发生风险或预测癌症或用于制备一试剂或试剂盒,所述试剂或试剂盒用于判断样本是否为癌症或判断癌症的发生风险或预测癌症。
在另一优选例中,所述的生物标志物或生物标志物组合来源被诊断患有癌症的患者组织样品或癌旁正常样品。
在另一优选例中,与预定值进行比较,一个或多个选自表2A、或表2A和2B的生物标志物的水平符合所述预定值,表明待测对象具有癌症发生风险或患有癌症。
在另一优选例中,所述预定值为PSI值。
在另一优选例中,所述预定值为根据CASE建立的模型所获得的预测值。
在另一优选例中,所述预定值是用随机森林算法对测得的PSI值进行评分获得的评分分值。
在另一优选例中,通过选自下组的方法对各个生物标志物进行鉴定:RT-PCR,RT-PCR芯片,RNA测序或其组合。
在另一优选例中,所述的组合用于判断待测对象的癌症发生风险或判断待测对象是否患有癌症。
本发明第三方面提供了一种用于判断癌症的发生风险的试剂组合,所述试剂组合包括用于检测本发明第二方面所述的组合中各个生物标志物的试剂。
在另一优选例中,所述的试剂包括用选自下组的方法检测本发明第二方面所述的集合中各个生物标志物的物质:RT-PCR,RT-PCR芯片,RNA测序、或其组合。
本发明第四方面提供了一种试剂盒,所述的试剂盒包括本发明第二方面所述的组合和/或本发明第三方面所述的试剂组合。
在另一优选例中,本发明第二方面所述的组合中各个标志物用作标准品。
本发明第五方面提供了一种判断待测对象的癌症发生风险或判断待测对象是否患有癌症的方法,包括步骤:
(1)提供一来源于待测对象的样品,对样品中集合中各个生物标记物的水平进行检测,所述组合包括一个或多个选自表2A的短外显子;
(2)将步骤(1)测得的水平与一预定值进行比较。
在另一优选例中,所述组合还包括一个或多个选自表2B的短外显子。
在另一优选例中,与预定值进行比较,一个或多个选自表2A、或表2A和2B的生物标志物的水平符合所述预定值,表明待测对象具有癌症发生风险。
在另一优选例中,所述预定值为PSI值。
在另一优选例中,所述预定值为根据CASE建立的模型所获得的预测值。
在另一优选例中,所述预定值是用随机森林算法对测得的PSI值进行评分获得的评分分值。
本发明第六方面提供了一种判断待测对象的癌症发生风险或判断待测对象是否患有癌症的系统,所述系统包括:
(a)癌症发生风险的特征输入模块,所述输入模块用于输入待测对象的癌症发生风险的特征;
其中所述的癌症发生风险的特征包括一个或多个选自表2A的所述短外显子;
(b)癌症发生风险的判别处理模块,所述处理模块对于输入的癌症发生风险的特征,按预定的判断标准进行评分处理,从而获得癌症发生风险的评分;并且将所述癌症发生风险的评分与预定值进行比较,从而得出辅助诊断结果,其中,当所述癌症发生风险的评分符合所述预定值时,则提示该对象具有癌症发生风险或患有癌症;和
(c)辅助诊断结果输出模块,所述输出模块用于输出所述的辅助诊断结果。
在另一优选例中,所述的癌症发生风险的特征还包括一个或多个选自表2B的短外显子。
在另一优选例中,所述的对象是人。
在另一优选例中,所述的评分包括(a)单个特征的评分;和/或(b)多个特征的评分之和。
在另一优选例中,所述评分包括计算各短外显子的PSI值。
在另一优选例中,用RT-PCR或RNA测序方法计算各短外显子的PSI值。
在另一优选例中,所述预定值为PSI值。
在另一优选例中,所述预定值是用随即森林算法对样本进行评分获得的评分分值。
在另一优选例中,所述预定值为根据CASE建立的模型所获得的预测值。
在另一优选例中,所述的特征输入模块选自下组:样本采集器、样本保存管、细胞裂解与核酸样本提取试剂盒、RNA核酸逆转录与扩增试剂盒、二代测序文库构建试剂盒、文库定量试剂盒、测序反应试剂盒、或其组合。
在另一优选例中,所述的癌症发生风险的判别处理模块包括一处理器,以及一储存器,其中所述的储存器中存储有基于癌症发生风险特征的癌症发生风险的评分数据。
在另一优选例中,所述的输出模块包括报告系统。
本发明第七方面提供了一种癌症中剪接异常的短外显子(cancer-associatedshort exons,CASE)或其检测试剂的用途,用作判断癌症患者预后和生存期的标志物或用于制备一试剂或试剂盒,所述试剂或试剂盒用于判断癌症患者预后和生存期,所述癌症中剪接异常的短外显子包括表A中的来自PPP3CC、DST、MBNL1、MARK3、TPD52L2、ARHGAP17、FLNA、RPS24的一种或多种剪接异常的短外显子。
在另一优选例中,所述癌症选自下组:食道癌、肺腺癌、或其组合。
在另一优选例中,所述判断包括预先判断(预测)。
在另一优选例中,所述的判断包括步骤:
(1)提供一来源于待测对象的样品,对样品中所述组合中各个生物标记物的水平进行检测;
(2)将步骤(1)测得的水平与预定值进行比较。
在另一优选例中,所述的样品选自下组:被诊断患有癌症的患者组织样品或癌旁正常样品。
在另一优选例中,所述预定值为风险因子。
在另一优选例中,所述风险因子用如下公式计算:
其中,相对PSI(relative PSI)为根据每个生物标志物(CASE)的量化值进行排序而得到的相对值(详见图4),N为生物标志物的总个数(其中N为任意的正整数,较佳地,4-100个,较佳地,5-80个,更佳地,6-50个更佳地,N为8),i为第i个生物标记物,其中i≤100。
在另一优选例中,与预定值进行比较,通过对选自表A的N个(其中N为任意的正整数,较佳地,4-100个,较佳地,5-80个,更佳地,6-50个,更佳地,N为8)生物标志物的水平计算的风险因子(risk factor)高于所述预定值,表明待测对象预后不良和生存期缩短。
在另一优选例中,与预定值进行比较,通过对选自表A的N个(其中N为任意的正整数,较佳地,4-100个,较佳地,5-80个,更佳地,6-50个,更佳地,N为8)生物标志物的水平计算的风险因子(risk factor)低于所述预定值,表明待测对象预后好和生存期增加。
在另一优选例中,所述对象为人。
在另一优选例中,所述检测是针对离体样本的检测。
在另一优选例中,所述的离体样本包括为组织样本。
在另一优选例中,在步骤(1)之前,所述的方法还包括对样品进行处理的步骤。
本发明第八方面提供了一种生物标志物组合,所述的组合包括一个或多个选自表A中的来自PPP3CC、DST、MBNL1、MARK3、TPD52L2、ARHGAP17、FLNA、RPS24的剪接异常的短外显子。
在另一优选例中,所述生物标志物组合用于判断癌症患者预后和生存期或用于制备一试剂或试剂盒,所述试剂或试剂盒用于判断癌症患者预后和生存期。
在另一优选例中,所述的生物标志物或生物标志物组合来源被诊断患有癌症的患者组织样品或癌旁正常样品。
在另一优选例中,与预定值进行比较,一个或多个选自表A的生物标志物的水平(比如相对PSI值)高于所述预定值,表明待测对象预后不良和生存期缩短。
在另一优选例中,与预定值进行比较,一个或多个选自表A的生物标志物的水平(比如相对PSI值)低于所述预定值,表明待测对象预后好和生存期增加。
在另一优选例中,所述预定值为风险因子。
在另一优选例中,通过选自下组的方法对各个生物标志物进行鉴定:RT-PCR,RT-PCR芯片,RNA测序或其组合。
在另一优选例中,所述的组合用于判断癌症患者预后和生存期。
本发明第九方面提供了一种用于判断癌症患者预后和生存期的试剂组合,所述试剂组合包括用于检测本发明第八方面所述的组合中各个生物标志物的试剂。
在另一优选例中,所述的试剂包括用选自下组的方法检测本发明第八方面所述的组合中各个生物标志物的物质:RT-PCR,RT-PCR芯片,RNA测序或其组合。
本发明第十方面提供了一种试剂盒,所述的试剂盒包括本发明第八方面所述的组合和/或本发明第九方面所述的试剂组合。
在另一优选例中,本发明第八方面所述的组合中各个标志物用作标准品。
本发明第十一方面提供了一种判断癌症患者预后和生存期的方法,包括步骤:
(1)提供一来源于待测对象的样品,对样品中集合中各个生物标记物的水平进行检测,所述组合包括一个或多个选自表A中的来自PPP3CC、DST、MBNL1、MARK3、TPD52L2、ARHGAP17、FLNA、RPS24的剪接异常的短外显子;
(2)将步骤(1)测得的水平与一预定值进行比较。
在另一优选例中,与预定值进行比较,一个或多个选自表A的生物标志物的水平(比如相对PSI值)高于所述预定值,表明待测对象预后不良和生存期缩短。
在另一优选例中,与预定值进行比较,一个或多个选自表A的生物标志物的水平(比如相对PSI值)低于所述预定值,表明待测对象预后良好和生存期增加。
在另一优选例中,所述预定值为风险因子。
本发明第十二方面提供了一种判断癌症患者预后和生存期的系统,所述系统包括:
(a)癌症患者预后和生存期的特征输入模块,所述输入模块用于输入待测对象的癌症患者预后和生存期的特征;
其中所述的癌症患者预后和生存期的特征包括一个或多个选自表A中的来自PPP3CC、DST、MBNL1、MARK3、TPD52L2、ARHGAP17、FLNA、RPS24的剪接异常的短外显子;
(b)癌症患者预后和生存期的判别处理模块,所述处理模块对于输入的癌症患者预后和生存期的特征,按预定的判断标准进行评分处理,从而获得癌症患者预后和生存期的评分;并且将所述癌症患者预后和生存期的评分与预定值进行比较,从而得出辅助诊断结果,其中,当所述症患者预后和生存期的评分高于所述预定值时,则提示该对象预后不良和生存期缩短,当所述癌症发生风险的评分低于所述预定值时,则提示该对象预后良好和生存期增加;和
(c)辅助诊断结果输出模块,所述输出模块用于输出所述的辅助诊断结果。
在另一优选例中,所述的对象是人。
在另一优选例中,所述的评分包括(a)单个特征的评分;和/或(b)多个特征的评分之和。
在另一优选例中,所述评分包括计算各短外显子的相对PSI值。
在另一优选例中,所述评分包括计算各短外显子的PSI值。
在另一优选例中,用RT-PCR或RNA测序的方法计算各短外显子的PSI值。
在另一优选例中,所述预定值为风险因子。
在另一优选例中,所述风险因子(risk factor)用如下公式计算:
其中,相对PSI(relative PSI)为根据每个生物标志物(CASE)的量化值进行排序而得到的相对值(详见图4),N为生物标志物的总个数(其中N为任意的正整数,较佳地为4-100个,较佳地,5-80个,更佳地,6-50个,更佳地,N为8),i为第i个生物标记物,其中i≤100。
在另一优选例中,所述的特征输入模块选自下组:样本采集器、样本保存管、细胞裂解与核酸样本提取试剂盒、RNA核酸逆转录与扩增试剂盒、二代测序文库构建试剂盒、文库定量试剂盒、测序反应试剂盒、或其组合。
在另一优选例中,所述的癌症患者预后和生存期的判别处理模块包括一处理器,以及一储存器,其中所述的储存器中存储有基于癌症患者预后和生存期的癌症发生风险的评分数据。
在另一优选例中,所述的输出模块包括报告系统。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了利用CASE的剪接进行主成分分析(左)和偏最小二乘回归分析(右)可以区分癌症组织与癌旁正常组织。
图2显示了利用CASE的剪接在每种单独的癌症中进行主成分分析(上)和偏最小二乘回归分析(下)可以区分癌症组织与癌旁正常组织。
图3显示了(A)使用CASE的PSI值作为特征训练随机森林模型来预测癌症的流程图。在100次随机试验中使用4倍交叉验证,其中75%的样本被随机选择用于训练,其余25%用于测试。(B)随机森林模型的ROC曲线。(C)随机森林模型在每种癌症类型中的AUC值。(D)使用TCGA LUAD数据作为训练集和中国LUAD数据作为测试集(左),或使用中国ESCC数据进行训练使用TCGA ESCA数据进行测试(右)的两个随机森林模型的性能。
图4显示了A)利用八个CASE的PSI值计算风险因子的流程。将每个CASE的PSI值根据其与生存时间的相关性进行正序或者倒序排序,按照其顺序给予每个患者一个相对PSI评分(1到4的整数),计算八个相对PSI的平均值得到风险因子。将危险因子从低到高进行排序并且将前百分之二十五和后百分之二十五的患者定义为组1和组2。(B)按基于CASE的风险因子进行分组的癌症患者的Kaplan-Meier曲线。
图5显示了按基于CASE的风险因子进行分组的每种类型中的癌症患者的Kaplan-Meier曲线。
图6显示了利用八个CASE计算的风险因子对中国食道癌患者进行分组,两组间的生存时间分布情况。
具体实施方式
本发明人经过广泛而深入地研究,首次发现,剪接异常的短外显子可作为判断癌症的发生风险和判断癌症患者预后和生存期的标志物,并且具有高灵敏性、高特异性的特点。在此基础上,发明人完成了本发明。
术语
本发明所用术语具有相关领域普通技术人员通常理解的含义。然而,为了更好地理解本发明,对一些定义和相关术语的解释如下:
根据本发明,术语“标志物组合”是指两种及两种以上标志物的组合。
根据本发明,标志物质的水平通过RT-PCR或RNA测序等方法进行鉴定。
根据本发明,术语“生物标志物”,也称为“生物学标志物”、“生物标记物”,是指个体的生物状态的可测量指标。这样的生物标记物可以是在个体中的任何物质,只要它们与被检个体的特定生物状态(例如,疾病)有关系,例如,核酸标志物(例如DNA),蛋白质标志物,细胞因子标记物,趋化因子标记物,碳水化合物标志物,抗原标志物,抗体标志物,物种标志物(种/属的标记)和功能标志物(KO/OG标记)等。生物标记物经过测量和评估,经常用以检查正常生物过程,致病过程,或治疗干预药理响应,而且在许多科学领域都是有用的。
根据本发明,术语“个体”指动物,特别是哺乳动物,如灵长类动物,最好是人。
根据本发明,术语如“一”、“一个”和“这”不仅指单数的个体,而是包括可以用来说明特定实施方式的通常的一类。
如本文所用,在提到具体列举的数值中使用时,术语“约”意指该值可以从列举的值变动不多于1%。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由…构成”、或“由…构成”。
需要说明的是,在此提供术语的解释仅为了使本领域技术人员更好地理解本发明,并非对本发明限制。
食道癌
食道癌又叫食管癌,是发生在食管上皮组织的恶性肿瘤。
肺腺癌
肺腺癌是肺癌的一种,属于非小细胞癌,起源于支气管粘膜上皮,少数起源于大支气管的粘液腺。
剪接异常的短外显子
利用TCGA数据库中18种癌症类型,将癌症中剪接异常的短外显子定义为至少在一种癌症中发生剪接异常的外显子。
检测方法
在本发明中,通过选自下组的方法检测本发明的组合中各个生物标志物的物质:RT-PCR,RT-PCR芯片,RNA测序。
试剂盒
在本发明中,本发明的试剂盒包括本发明第二方面或本发明第八方面所述的组合和/或本发明第三方面或本发明第九方面所述的试剂组合。
预定值
在本发明中,预定值是指PSI值(用于判断癌症风险)或风险因子(用于判断癌症患者预后和生存期)。
其中,PSI值是对选择性剪接事件进行定量得到的分值,PSI值一般指这个剪接事件中外显子保留的剪接型所占的比例。
对每个CASE的PSI值进行排名,并为每个PSI四分位数分配一个来自[1,2,3,4]的相对分数作为相对PSI值。
其中,风险因子通过如下公式计算:
其中,相对PSI为根据每个生物标志物(CASE)的量化值进行排序而得到的相对值(详见图4),N为生物标志物的总个数(其中N为任意正整数,较佳地,N为4-100个,较佳地,5-80个,更佳地,6-50个,更佳地,N为8),i为第i个生物标记物,其中i≤100。
本发明的主要优点包括:
(1)本发明首次发现,剪接异常的短外显子可作为判断癌症的发生风险和判断癌症患者预后和生存期的标志物,并且具有高灵敏性、高特异性的特点。
(2)本发明首次在癌症中鉴定出了494个癌症中剪接异常的短外显子(cancer-associated short exons,CASE,见表A),并根据他们的剪接情况建立了模型可用于预测癌症以及癌症患者的预后。
(3)本发明建立的模型与需要大量RNA测序结果的方法相比,只需要对几十个CASE进行定量即可,在操作上更加简单可靠,并可以对90%的样本进行预后预测,弥补了一些方法由于单一变量的数据缺失而造成的只能预测少数样本的问题。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
如无特别说明,本发明实施例中所用的试剂和材料均为市售产品。
通用方法
为了检测CASE作为癌症预测的分子标记物的能力,将所有类型的癌症组合成一个由6788个肿瘤和705个正常样本组成的训练集。我们主要考虑了在至少5500个肿瘤样本和450个正常样本中均可检测到的60个CASE,并使用了至少检测到20个CASE的样本用于我们的分析。根据每个样本中CASE的PSI值进行主成分分析(PCA)和偏最小二乘判别分析(PLS-DA)分析。我们进一步训练了一个基于60个CASE的PSI值来预测癌症的随机森林模型,以对肿瘤和正常样本进行分类。我们进行了100次随机取样,每次利用4倍交叉验证以评估预测准确性,其中每次随机取75%的样本被随机选择用于训练,其余25%用于测试。我们还使用来自中国LUAD和ESCC患者与西方TCGA患者的RNA-seq数据进行了不同数据来源的交叉验证来评估性能。
在预后相关预测分析中,对于每个CASE,我们对所有患者的PSI值进行排序,并将顶部和底部四分位数的患者分为“PSI高”和“PSI低”两组并对这两组之间的总生存率进行比较。为了提高预测的敏感性,我们接下来选择了8个CASE来对每个患者的风险值进行打分。我们对每个CASE的PSI值进行排名,并为每个PSI四分位数分配一个来自[1,2,3,4]的相对分数。然后由所选8个CASE的相对分数的平均值定义了基于CASE的风险因素,并对每个患者进行计算。我们使用该风险因素对患者进行排序,将上下四分之一定义为高风险组和低风险组。
实施例1利用癌症中异常剪接的短外显子对癌症样本进行预测
利用癌症基因组图谱(The cancer genome atlas,TCGA)数据库中的数据,通过主成分分析(PCA)和偏最小二乘回归分析(PLSDA)结果显示利用我们鉴定出的短外显子剪接的情况可以将肿瘤组织和癌旁正常组织显著分开(图1),并且每个单独的癌症中肿瘤组织也均可与癌旁正常组织显著分开(图2),预示着其具有预测癌症的能力。
利用CASE(表A)的剪接情况,对TCGA数据库中的癌症患者进行随机森林建模(图3A,参数为mtry=22,ntree=1300),采用100次随机取样及四倍交叉验证,模型预测能力达到曲线下面积(AUC)为0.913(图3B),在每种单一癌症样本中也达到较好的预测效果(图3C)。
使用TCGA数据库中肺腺癌的数据以CASE剪接(表A或表2A-2B中的CASE)为输入进行随机森林建模,并以中国人群八对肺腺癌样本进行测试,结果显示AUC值为0.881(图3D);使用中国人群食道癌样本进行建模并用TCGA数据库中食道癌样本进行检测AUC值为0.875(图3D),证明利用CASE的剪接做癌症预测具有很好的效果。
在实际临床中,对于肿瘤样本的RNA可直接进行RT-PCR来计算每个剪接事件的PSI值(引物见表1),并输入到随机森林模型中进行癌症及非癌症的判断。
表A(基于人类基因组hg19)
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
上述基因名称均唯一确定地与NCBI网站数据库中的基因相对应(https://www.ncbi.nlm.nih.gov/)。
实施例2利用八个癌症相关的短外显子的剪接情况预测癌症患者预后
我们发现利用八个CASE的剪接情况可以很好的预测癌症病人的预后,具体方法如图3A,根据TCGA数据库中转录组测序数据计算了八个外显子剪接的PSI值,并根据PSI值进行排序,其中四个正序排序(PPP3CC,DST,MBNL1,MARK3),四个倒序排序(TPD52L2,ARHGAP17,FLNA,RPS24),其中每一个都根据其排序结果从低到高给定一个相对的值(1,2,3,4),最终计算八个剪接事件的相对值的平均数作为风险因子(图4A),也就是预测患者预后的指标。根据此风险因子进行生存分析(取上下四分之一进行分组),结果显示风险因子高和低两组间的生存时间具有非常显著的差异(图4B)。这个结果不仅在所有癌症的集合中出现,在每个单独的癌症中也具有优秀的预测效果(图5)。
我们应用此种方法对中国人群食道癌患者进行打分,结果显示根据此风险因子进行分类的两组癌症患者生存时间具有显著差异(图6),证实了此方法的稳定性和可应用的价值。在实际应用中,肿瘤样本提取RNA后可用RT-PCR的方法检测八个外显子的剪接情况(引物见表1),并进行PSI值计算及分组预测。
表1利用CASE做癌症患者预后预测引物列表
引物名称(RT-PCR) 引物序列
MARK3_F GGAGAAACATGTCATTCAGG
MARK3_R CTCCAGGTGAAGCGTAGG
FLNA_F GTACGGTGGTGACGAGATCC
FLNA_R CGCCTTAGTGTCCACAGTG
MBNL1_F CATTTGCAAGCCAAGATCAAG
MBNL1_R AGCAGGCCTCTTTGGTAATG
RPS24_F GGAACGCAAGAACAGAATGAAG
RPS24_R GCTAACATCATTGCAGCACC
ARHGAP17_F CGAGACCAGTACCAAAGC
ARHGAP17_R CTGAGTGCATTTCAGGAAAGATG
DST_F GACAAGGCAGGTAGCTAAGTG
DST_R CAGGATCCGGACCAGTCG
TPD52L2_F CCAGGAGCTGGCATGAC
TPD52L2_R GAGCCCACTGTGGACAGG
PPP3CC_F CCTGACTCCCACAGGCAC
PPP3CC_R CCAGACCTCGCGCTTCTTC
表2A
表2B
表2C
表2D
表2A-2D为部分CASE相关信息的示例,表2A和2B为之前无报道与癌症预测以及预后有关的部分CASE示例,表2C和2D为之前有报道的与癌症预测以及预后有关的部分CASE示例,其中经过大量筛选,从表2A-2D中的数据中可以看出,表2A中的CASE的权重高于表2B的CASE的权重,表2C中的CASE的权重高于表2D的CASE的权重,表2A和2B的优先级高于表2C和2D。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (12)

1.一种癌症中剪接异常的短外显子(cancer-associated short exons,CASE,或称“癌相关短外显子”)或其检测试剂的用途,其特征在于,用作判断样本是否为癌症或判断癌症的发生风险或预测癌症的标志物或用于制备一试剂或试剂盒,所述试剂或试剂盒用于判断样本是否为癌症或判断癌症的发生风险或预测癌症,所述癌症中剪接异常的短外显子包括选自表2A的一个或多个所述短外显子:
表2A(基于人类基因组hg19)
2.一种生物标志物组合,其特征在于,所述的组合包括选自表2A的一个或多个癌症中剪接异常的短外显子。
3.一种用于判断癌症的发生风险的试剂组合,其特征在于,所述试剂组合包括用于检测权利要求2所述的组合中各个生物标志物的试剂。
4.一种试剂盒,其特征在于,所述的试剂盒包括权利要求2所述的组合和/或权利要求3所述的试剂组合。
5.一种判断待测对象的癌症发生风险或判断待测对象是否患有癌症的方法,其特征在于,包括步骤:
(1)提供一来源于待测对象的样品,对样品中集合中各个生物标记物的水平进行检测,所述组合包括一个或多个选自表2A的短外显子;
(2)将步骤(1)测得的水平与一预定值进行比较。
6.一种判断待测对象的癌症发生风险或判断待测对象是否患有癌症的系统,其特征在于,所述系统包括:
(a)癌症发生风险的特征输入模块,所述输入模块用于输入待测对象的癌症发生风险的特征;
其中所述的癌症发生风险的特征包括一个或多个选自表2A的所述短外显子;
(b)癌症发生风险的判别处理模块,所述处理模块对于输入的癌症发生风险的特征,按预定的判断标准进行评分处理,从而获得癌症发生风险的评分;并且将所述癌症发生风险的评分与预定值进行比较,从而得出辅助诊断结果,其中,当所述癌症发生风险的评分符合所述预定值时,则提示该对象具有癌症发生风险或患有癌症;和
(c)辅助诊断结果输出模块,所述输出模块用于输出所述的辅助诊断结果。
7.一种癌症中剪接异常的短外显子(cancer-associated short exons,CASE)或其检测试剂的用途,其特征在于,用作判断癌症患者预后和生存期的标志物或用于制备一试剂或试剂盒,所述试剂或试剂盒用于判断癌症患者预后和生存期,所述癌症中剪接异常的短外显子包括表A中的来自PPP3CC、DST、MBNL1、MARK3、TPD52L2、ARHGAP17、FLNA、RPS24的一种或多种剪接异常的短外显子。
8.一种生物标志物组合,其特征在于,所述的组合包括一个或多个选自表A中的来自PPP3CC、DST、MBNL1、MARK3、TPD52L2、ARHGAP17、FLNA、RPS24的剪接异常的短外显子。
9.一种用于判断癌症患者预后和生存期的试剂组合,其特征在于,所述试剂组合包括用于检测权利要求8所述的组合中各个生物标志物的试剂。
10.一种试剂盒,其特征在于,所述的试剂盒包括权利要求8所述的组合和/或权利要求9所述的试剂组合。
11.一种判断癌症患者预后和生存期的方法,其特征在于,包括步骤:
(1)提供一来源于待测对象的样品,对样品中集合中各个生物标记物的水平进行检测,所述组合包括一个或多个选自表A中的来自PPP3CC、DST、MBNL1、MARK3、TPD52L2、ARHGAP17、FLNA、RPS24的剪接异常的短外显子;
(2)将步骤(1)测得的水平与一预定值进行比较。
12.一种判断癌症患者预后和生存期的系统,其特征在于,所述系统包括:
(a)癌症患者预后和生存期的特征输入模块,所述输入模块用于输入待测对象的癌症患者预后和生存期的特征;
其中所述的癌症患者预后和生存期的特征包括一个或多个选自表A中的来自PPP3CC、DST、MBNL1、MARK3、TPD52L2、ARHGAP17、FLNA、RPS24的剪接异常的短外显子;
(b)癌症患者预后和生存期的判别处理模块,所述处理模块对于输入的癌症患者预后和生存期的特征,按预定的判断标准进行评分处理,从而获得癌症患者预后和生存期的评分;并且将所述癌症患者预后和生存期的评分与预定值进行比较,从而得出辅助诊断结果,其中,当所述症患者预后和生存期的评分高于所述预定值时,则提示该对象预后不良和生存期缩短,当所述癌症发生风险的评分低于所述预定值时,则提示该对象预后良好和生存期增加;和
(c)辅助诊断结果输出模块,所述输出模块用于输出所述的辅助诊断结果。
CN202210701225.4A 2022-06-20 2022-06-20 利用癌症中剪接异常的短外显子辅助癌症诊断和预后 Pending CN117305444A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210701225.4A CN117305444A (zh) 2022-06-20 2022-06-20 利用癌症中剪接异常的短外显子辅助癌症诊断和预后
PCT/CN2023/101497 WO2023246808A1 (zh) 2022-06-20 2023-06-20 利用癌症中剪接异常的短外显子辅助癌症诊断和预后

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210701225.4A CN117305444A (zh) 2022-06-20 2022-06-20 利用癌症中剪接异常的短外显子辅助癌症诊断和预后

Publications (1)

Publication Number Publication Date
CN117305444A true CN117305444A (zh) 2023-12-29

Family

ID=89283551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210701225.4A Pending CN117305444A (zh) 2022-06-20 2022-06-20 利用癌症中剪接异常的短外显子辅助癌症诊断和预后

Country Status (2)

Country Link
CN (1) CN117305444A (zh)
WO (1) WO2023246808A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150132500A (ko) * 2013-03-15 2015-11-25 메타마크 제네틱스, 인크. 암 예후용 조성물 및 방법
CA2928901A1 (en) * 2013-11-04 2015-05-07 The University Of British Columbia Cancer biomarkers and classifiers and uses thereof
CN105067822B (zh) * 2015-08-12 2017-05-24 中山大学附属肿瘤医院 用于食管癌诊断的标志物

Also Published As

Publication number Publication date
WO2023246808A1 (zh) 2023-12-28

Similar Documents

Publication Publication Date Title
CN103299188B (zh) 用于癌症的分子诊断试验
AU2016267392B2 (en) Validating biomarker measurement
US10670610B2 (en) Biomarker test for prediction or early detection of preeclampsia and/or HELLP syndrome
Yang et al. Similarities of ordered gene lists
US20230126920A1 (en) Method and device for classification of urine sediment genomic dna, and use of urine sediment genomic dna
MXPA06009545A (es) Pronosticos del cancer de mama.
CN101194166A (zh) 有关乳癌分类的材料和方法
CN113167782A (zh) 用于样品质量评估的方法
JP2013509169A (ja) 前立腺癌の診断および病期分類のための非侵襲的マーカーとなる血中miRNA
AU2021378868A1 (en) Panel of mirna biomarkers for diagnosis of ovarian cancer, method for in vitro diagnosis of ovarian cancer, uses of panel of mirna biomarkers for in vitro diagnosis of ovarian cancer and test for in vitro diagnosis of ovarian cancer
CN112522412A (zh) 检测生物标志物的试剂、产品及其在疾病中的应用
CN112522413A (zh) 一种用于评估胃癌风险的生物标志物及其应用
CN110760585B (zh) 前列腺癌生物标志物及其应用
CN117079723B (zh) 一种与肌萎缩侧索硬化症相关的生物标志物、诊断模型及其应用
CN112538531A (zh) 用于检测胃癌的产品
CN112795648A (zh) 胃癌诊断用产品
CN112746107A (zh) 胃癌相关生物标志物及其在诊断中的应用
CN113201590A (zh) 用于评估肝细胞癌早期复发风险的lncRNA、评估方法及装置
CN117305444A (zh) 利用癌症中剪接异常的短外显子辅助癌症诊断和预后
CN112575089A (zh) 基因在胃癌诊断中的应用
CN112680521A (zh) 一种以基因作为诊断标志物的产品及其应用
CN113265462A (zh) 与胃癌相关的基因及其应用
CN112725443A (zh) 一种生物标志物组合及其应用
CN113862354B (zh) 用于预测局限期小细胞肺癌患者预后的系统及其应用
CN116254335A (zh) Adam12生物标志物在冠状动脉扩张症诊断中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination