CN112646890B - 用于预测早期乳腺癌远处复发风险的多基因检测引物 - Google Patents

用于预测早期乳腺癌远处复发风险的多基因检测引物 Download PDF

Info

Publication number
CN112646890B
CN112646890B CN202011603440.8A CN202011603440A CN112646890B CN 112646890 B CN112646890 B CN 112646890B CN 202011603440 A CN202011603440 A CN 202011603440A CN 112646890 B CN112646890 B CN 112646890B
Authority
CN
China
Prior art keywords
risk
breast cancer
patients
drgm
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011603440.8A
Other languages
English (en)
Other versions
CN112646890A (zh
Inventor
郑鸿钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Jiahe Yingzhe Biotechnology Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202011603440.8A priority Critical patent/CN112646890B/zh
Publication of CN112646890A publication Critical patent/CN112646890A/zh
Application granted granted Critical
Publication of CN112646890B publication Critical patent/CN112646890B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了用于预测早期乳腺癌远处复发风险的多基因检测引物,属于分子诊断技术领域,多基因包括BUB1B、BLM、TPX2、DTX2、PIM1、OBSL1、YWHAB、CLCA2、SF3B5、ESR1和ERBB2;其引物序列如SEQ ID NO.1‑22,该引物特异性好,PCR扩增产生的所有扩增子都较短,可增强对FFPE样品中提取的RNA的检测灵敏度。本发明还公开预测早期乳腺癌远处复发风险的方法,利用SEQ ID NO.1‑28定量FFPE样本中多基因的相对表达量,建立远处复发遗传模型的统计方法,可以预测早期乳腺癌远处复发的风险,划分低危和高危乳腺癌患者,并为手术后乳腺癌的治疗提供指导。

Description

用于预测早期乳腺癌远处复发风险的多基因检测引物
技术领域
本发明属于分子诊断技术领域,具体涉及用于预测早期乳腺癌远处复发风险的多基因检测引物。
背景技术
乳腺癌是一种全球高发疾病,现因乳腺癌筛查的普及、规范治疗的改善及多种基因检测评估预后的应用,其死亡率显著降低。临床上乳腺癌不再被视为单一疾病,通过雌激素受体(ER)、孕激素受体(PR)和人表皮生长因子受体2(HER-2)基因扩增分为不同亚型,各亚型有不同的肿瘤生物特征、治疗效果及预后等,其中激素受体阳性的乳腺癌患者占70%-80%,而激素受体阳性、HER-2阴性、淋巴结阴性乳腺癌患者临床预后较好。近年来,基因检测技术不断发展,各种类型的基因表检测技术大量运用到临床,包括21基因检测、70基因检测和微阵列50(PAM50)预测技术等,基于基因表达对乳腺癌进行分型和复发风险评估已得到临床上的广泛认可。但是,当前可用的基因表达面板(Oncotype Dx,MammaPrint,EndoPredict)的研发均在美国或欧洲进行,所纳入的病例种族绝大多数为高加索人、少量非洲人和极少数的亚洲人,中国人对测试体系的敏感性和特异性尚未得到有效验证。
发明内容
本发明的另一个目的在于提供一种特异性好的用于预测早期乳腺癌远处复发风险的多基因检测引物,利用本发明多基因检测引物定量组织样本中的多基因表达水平,可以区分低危和高危早期乳腺癌患者的复发情况。
本发明为实现上述目的所采取的技术方案为:
用于预测早期乳腺癌远处复发风险的多基因检测引物,其中多基因包括:BUB1B、BLM、TPX2、DTX2、PIM1、OBSL1、YWHAB、CLCA2、SF3B5、ESR1和ERBB2;
ERBB2基因的引物序列如SEQ ID NO.1-2;
BLM基因的引物序列如SEQ ID NO.3-4;
TPX2基因的引物序列如SEQ ID NO.5-6;
DTX2基因的引物序列如SEQ ID NO.7-8;
PIM1基因的引物序列如SEQ ID NO.9-10;
OBSL1基因的引物序列如SEQ ID NO.11-12;
YWHAB基因的引物序列如SEQ ID NO.13-14;
CLCA2基因的引物序列如SEQ ID NO.15-16;
SF3B5基因的引物序列如SEQ ID NO.17-18;
ESR1基因的引物序列如SEQ ID NO.19-20;
BUB1B基因的引物序列如SEQ ID NO.21-22。
优选地,多基因还包括内参基因:ACTB、RPLPO、TFRC;
ACTB基因的引物序列如SEQ ID NO.23-24;
RPLPO基因的引物序列如SEQ ID NO.25-26;
TFRC基因的引物序列如SEQ ID NO.27-28。
本发明多基因检测引物特异性好,其PCR扩增产生的所有扩增子都相对较短,扩增子的大小均小于100bp(75-95bp),可以增强对福尔马林固定石蜡包埋(Formalin-FixedParaffin Embedded , FFPE)样品中提取的RNA的检测灵敏度。本发明中,DTX2(Deltex E3泛素连接酶2)是一种蛋白质编码基因,与Notch信号通路有关,Notch信号的调节剂参与细胞-细胞通信,其调节广泛的细胞命运决定;OBSL1基因是一种分解不需要的蛋白的细胞机制,与CUL7基因(cullin-7蛋白,组装一个E3泛素连接酶)一起作用;ESR1与ER通路相关,ESR1高表达的肿瘤通常可以通过激素治疗得到控制。因此,利用本发明多基因检测引物进行定量组织样本中的多基因表达水平,可以区分低危和高危早期乳腺癌(Early-stageBreast Cancer , EBC)患者的复发情况,其中较高表达水平的DTX2,ESR1,SF3B5和OBSL1的复发风险较小。综上,本发明多基因检测引物在预测早期乳腺癌远处复发(DistantRecurrence , DR)风险方面表现良好,可以预测早期乳腺癌远处复发的风险,从而划分低危和高危乳腺癌患者,并且能为手术后乳腺癌的治疗提供更为精准的指导,尤其是对于ER/PR阳性和HER2阴性的患者。
本发明的目的在于提供一种用于预测早期乳腺癌远处复发风险的基因表达面板,可以预测早期乳腺癌远处复发的风险,划分低危和高危乳腺癌患者,并且能为手术后乳腺癌的治疗提供更为精准的指导。
本发明为实现上述目的所采取的技术方案为:
一种用于预测早期乳腺癌远处复发风险的基因表达面板,其包括多基因,多基因包括BUB1B、BLM、TPX2、DTX2、PIM1、OBSL1、YWHAB、CLCA2、SF3B5、ESR1和ERBB2。
本发明基因表达面板包括13个基因组,包括11个基因组和ACTB、RPLPO、TFRC 3个内参基因,可以区分低危和高危早期乳腺癌患者的复发情况,其中较高表达水平的DTX2,ESR1,SF3B5和OBSL1的复发风险较小。本发明基因表达面板在预测早期乳腺癌远处复发风险方面表现良好,可以预测早期乳腺癌远处复发的风险,从而划分低危和高危乳腺癌患者,并且能为手术后乳腺癌的治疗提供更为精准的指导,尤其是对于ER/PR阳性和HER2阴性的患者。
本发明还公开了上述基因表达面板在预测早期乳腺癌远处复发风险中的用途。
本发明还公开了上述多基因检测引物在预测早期乳腺癌远处复发风险中的用途。
本发明还公开了一种乳腺癌多基因检测试剂盒,包括:SEQ ID NO.1-28所示的引物序列。
本发明还公开了上述多基因检测试剂盒在预测早期乳腺癌远处复发风险中的用途。
本发明的另一个目的在于提供一种预测早期乳腺癌远处复发风险的方法,可以预测早期乳腺癌远处复发的风险,从而划分低危和高危乳腺癌患者,并且能为手术后乳腺癌的治疗提供更为精准的指导。
本发明为实现上述目的所采取的技术方案为:
一种预测早期乳腺癌远处复发风险的方法,包括:
S1:以标准的医疗样本采集流程收集的FFPE肿瘤组织样本;
S2:利用SEQ ID NO.1-28定量FFPE肿瘤组织样本中多基因的相对表达量;
S3:建立远处复发遗传模型的统计方法。
本发明方法可以预测早期乳腺癌远处复发风险,从而划分低危和高危乳腺癌患者;本发明方法能为手术后乳腺癌的治疗提供更为精准的指导,尤其是对于ER/PR阳性和HER2阴性的患者。根据本发明远处复发遗传模型( Distant Recurrence Genetic Model ,DRGM)分类的低危和高危患者的5年远距离无复发间隔(Distant Recurrence-FreeInterval , DRFI)率分别为100%和71.2%(95%置信区间(CI),59.8%-79.8%,P = 0.0006)。
优选地,远处复发遗传模型的计算方法为:
DRGM score = 0.000290927 × PIM1_1 + 0.000307024 × TPX2_1 -0.006563526 × DTX2_1 + 2.78046E-05 × YWHAB_1 - 0.167402736 × ESR1_1 +0.00044734 × ERBB2_1 - 0.000295266 × SF3B5_1 - 0.080103018 ×OBSL1_1 +0.002146431 ×CLCA2_1 + 0.445623356 × BUB1B_1 + 0.224466639 × BLM_1。
优选地,S3步骤还包括建立综合模型的统计方法,综合模型的统计方法将遗传模型与临床模型结合起来,临床模型变量包括年龄、ER状态、LN阳性、淋巴管浸润、肿瘤大小和核级。本发明遗传模型与6种临床变量(年龄、ER状态、LN阳性、淋巴管浸润、肿瘤大小和核级)相结合,可以更好地预测早期乳腺癌远处复发的风险,从而更好地区分低危和高危患者。
优选地,远处复发综合模型的计算方法为:CV6-DRGM score = 2.969 × DRGMscore + 1.617 × CV6 score。
本发明多基因检测引物特异性好,其PCR扩增产生的所有扩增子都相对较短,扩增子的大小均小于100bp,可以增强对FFPE样品中提取的RNA的检测灵敏度。
本发明基因表达面板由于包括了BUB1B、BLM、TPX2、DTX2、PIM1、OBSL1、YWHAB、CLCA2、SF3B5、ESR1和ERBB2,因而具有如下有益效果:本发明基因表达面板可以区分低危和高危早期乳腺癌患者的复发情况,其中较高表达水平的DTX2,ESR1,SF3B5和OBSL1的复发风险较小;本发明基因表达面板在预测早期乳腺癌远处复发风险方面表现良好,可以预测早期乳腺癌远处复发的风险,从而划分低危和高危乳腺癌患者,并且能为手术后乳腺癌的治疗提供更为精准的指导,尤其是对于ER/PR阳性和HER2阴性的患者。
本发明预测方法由于采用了BUB1B、BLM、TPX2、DTX2、PIM1、OBSL1、YWHAB、CLCA2、SF3B5、ESR1和ERBB2,因而具有如下有益效果:本发明方法可以预测早期乳腺癌远处复发风险,从而划分低危和高危乳腺癌患者;本发明方法能为手术后乳腺癌的治疗提供更为精准的指导,尤其是对于ER/PR阳性和HER2阴性的患者。
附图说明
图1为根据Kaplan和Meier方法估计的LRR;
图2为根据Kaplan和Meier方法估计的任何复发;
图3为CV6在所有原发性手术乳腺癌患者中的应用;
图4为CV6在未进行辅助化疗luminal患者的5年和10年生存率中应用;
图5为实验室程序和质量控制图;
图6为训练数据集:DRGM模型分类的低、高危患者5年DRFI;
图7为训练数据集:CV6-DRGM模型分类的低危和高危患者的5年DRFI;
图8为在BioPortal中提交DRGM基因组的结果图;
图9为在METABRIC中提交DRGM基因组的结果图。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1:
一种预测早期乳腺癌远处复发风险的方法(临床变量模型6 (CV6))
根据我院1990-2001年间治疗的1010例患者,2006年建立了乳腺癌切除术后局部区域复发(Local-Regional Recurrence , LRR)的预后评分系统。这个预后评分系统已经在2002-2007年同一家医院2013年治疗的1545名患者的基础上进行了验证。随后,合并了这两项研究中未行乳房切除术(Post-Mastectomy , PMRT)的患者(n = 1649),并对5年LRR的风险进行了多因素分析(见表1)。
表1 非PMRT患者的5年LRR风险的多因素分析(n=1649)
除涉及腋窝淋巴结(Lymph Node , LN)以外,6个变量的风险率为1.6~1.9。因此,指定一个如下表2所示的临床变量模型。
表2临床变量模型(CV6)
然后检查患者的分布和LRR事件以及这个临床变量模型的每个评分中的复发情况,评分越高,LRR事件越多,复发次数越多(表3);例如,0分患者的5年LRR-free复发间隔为100%,无复发间隔为97.8%;评分5的患者5年LRR无复发间隔为80.3%,无复发间隔为65.8%。
表3. CV6预后评分、LRR和任何复发的分布(n = 1649)
图1为根据Kaplan和Meier方法估计的LRR,图2为根据Kaplan和Meier方法估计的任何复发。图3为CV6在所有原发性手术乳腺癌患者中的应用(n = 5623),在1990年至2007年的同一研究期间,共有5623例患者接受了手术(乳房切除术或保乳手术)作为首次治疗,将CV6应用于这些可手术的原发性乳腺癌,其5年和10年生存率随CV6评分的增加而降低。图4为CV6在未进行辅助化疗luminal患者的5年和10年生存率中应用(n = 876),局限于未辅助化疗的luminal-like亚型(ER/PR阳性和HER2阴性)患者,CV6评分越高,5年和10年生存率越低。
实施例2:
一、一种预测早期乳腺癌远处复发风险的方法
S1:以标准的医疗样本采集流程收集的FFPE肿瘤组织样本;
共168名I-III期乳腺癌患者(其中,训练组为112名患者,测试组为56名患者),排除了术前进行过化学疗法和远处转移的患者。FFPE肿瘤组织来自我们医院在2005年至2015年之间治疗的患者。
S2:利用RT-PCR技术检测多基因的相对表达量;
S21:从FFPE肿瘤组织中提取RNA
将每个存档的FFPE组织样本切成10μm厚的切片,并在40C下储存或运输。按照RNeasy FFPE试剂盒(Qiagen, CA, USA)的说明进行操作,移除石蜡,从FFPE组织切片中提取总RNA,并用DNase处理,然后储存于-80℃备用;使用Agilent RNA 6000 Nano试剂盒(Agilent Technologies,CA, USA)在Agilent 2100生物分析仪上检查RNA的质量;为了估计降解水平,通过生物分析仪计算RNA完整性数(RIN)。使用SABioscience RT²quantitative PCR Primer Assay for Human Genomic DNA Contamination (Qiagen,CA, USA)来检查样品中是否有残留的DNA污染物。实验室程序和质量控制如图5。
S22:RT-PCR
基因表达谱采用RT-PCR,使用SABioscience公司的RT² Profiler™ PCR试剂(Qiagen, CA, USA)。简而言之,使用RT² First Strand Kit (Qiagen, CA, USA)和基因特异性引物对样品(2μg总RNA)进行逆转录。GOI的SYBR-Green PCR的引物见表4,包括BUB1B、BLM、TPX2、DTX2、PIM1、OBSL1、YWHAB、CLCA2、SF3B5、ESR1、ERBB2和3个内参基因(ACTB,RPLP0,TFRC),PCR引物生产的所有扩增子都相对较短(长度为75-95bp),可以增强对FFPE样品中提取的RNA的检测灵敏度。使用RT² qPCR Mastermix(Qiagen, CA, USA),在以下循环条件下进行qPCR,每个反应使用40ng总RNA,每台Geneonan ABI 7500fast仪器进行三次重复反应:95℃, 15 mins;40个循环(95℃, 30 secs; 55℃, 30 secs; 72℃, 30 secs);72℃, 5 mins。为了确认PCR特异性,在每次运行结束时进行了熔解曲线分析。
表4 目的基因(GOI)和引物序列
S23:归一化和数据分析
采用2−ΔCt计算目的基因相对表达量,∆Ct(GOI)=25- Ct(GOI) +[ Ct(ACTB)+ Ct(RPLP0)+ Ct(TFRC)]/3。
用线性回归方法比较微阵列和RT-PCR系统测定的所有GOI的表达水平,对于微阵列系统,每个GOI都有几个探针,如果这些探针在微阵列系统中检测到的表达水平与RT-PCR系统检测到的每个目标基因之间的线性回归系数r>0.3,则认为相关性高。
S3:建立遗传模型和综合模型的统计方法
通过使用最小绝对收缩和选择算子(LASSO)的统计方法,我们对训练组112例患者进行了10倍交叉验证的遗传信息进行了1000次训练,以保持每个基因的截距(β)稳定性和可重复性。这些基因的截距形成了DR遗传评分(DRGM评分)。
通过使用最小绝对收缩和选择算子(LASSO)的统计方法,我们训练112名10倍交叉验证患者的遗传信息保持拦截1000倍(𝛽)的每个基因稳定和可复制。这些基因的截取形成了DR的遗传评分(DRGM评分),其计算公式如下:
DRGM分数=β_1×𝐺𝑒𝑛𝑒1 +β_2×𝐺𝑒𝑛𝑒2 +…+β_N×𝐺𝑒𝑛𝑒𝑁,N≤11。
然后,我们使用Cox比例风险模型的风险比,将遗传模型与临床模型(CV6模型)结合起来,以确定两个模型的权重。我们还使用ROC曲线和一致性指数(C-index)来确定哪种模型最有效。根据早期乳腺癌试验研究人员协作组的研究,Logistic回归用于确定预测低危组5年DR<4%的最佳临界值;Chi-squared检测用于确定低危组和高危组的复发风险有统计学差异;Kaplan-Meier方法用于估计5年DR-free生存期(DRFS);Log-rank用于检验生存曲线是否显著。所有统计分析均在R版本3.4.1和SAS版本9.4中进行。
二、结果
1. 基线特征
本实施例预测方法包括168名乳腺癌患者(训练数据集112名和测试数据集56名)(表5),训练组和测试组之间的基线特征是平衡的,除了测试组中有更多的保留乳房手术的患者(23.2% vs 0%),训练数据集中有更多的患者出现HER2过表达(42.0% vs 23.2%)和辅助化疗(78.6% vs 58.9%)。
表5 训练和测试数据集中患者的基线特征
2. DRGM和CV6-DRGM
如上所述,我们对112例患者的遗传信息进行了10倍交叉验证,训练了1000次,并获得了DRGM算法,如下所示:
DRGM score = 0.000290927 × PIM1_1 + 0.000307024 × TPX2_1 -0.006563526 × DTX2_1 + 2.78046E-05 × YWHAB_1 - 0.167402736 × ESR1_1 +0.00044734 × ERBB2_1 - 0.000295266 × SF3B5_1 - 0.080103018 ×OBSL1_1 +0.002146431 ×CLCA2_1 + 0.445623356 × BUB1B_1 + 0.224466639 × BLM_1;
如果不使用临床模型,则重新缩放至0-100;
CV6-DRGM score = H1× DRGM score + H2× CV6 score;
CV6-DRGM score = 2.969 × DRGM score + 1.617 × CV6 score;
重新缩放为0-100。
选择DRGM的断点得分为37,CV6-DRGM的断点得分为5年时DR率低于4%的低危患者。通过使用断点,基于RT-PCR的DRGM中,112名患者中有30名(26.8%)为低危,82名(73.2%)为高危。同样,CV6-DRGM中,112例患者中有41例(36.6%)为低危,71例(63.4%)为高危(见表6)。
图6为训练数据集:DRGM模型分类的低、高危患者5年DRFI(Distant Recurrence-Free Interval , DRFI),可以看出,低危患者的DRFI为100%,高危患者的DRFI为71.2%(Log-rank test , P = 0.0006)。
图7为训练数据集:CV6-DRGM模型分类的低危和高危患者的5年DRFI,可以看出,低危患者的DRFI为100%,高危患者的DRFI为66.5%(Log-rank test , P<0.0001)。
此外,两个模型的预测能力的性能在一个独立的测试数据集中进行了检验(n =56)(如表6)。可以看出,训练和测试数据集的预测精度相似;测试数据集中,DRGM模型中低危患者的DR率为0%、高危患者的DR率为38.6%(P = 0.0454),CV6-DRGM模型中低危患者的DR率为5.9%、高危患者的DR率为43.6%(P = 0.0055)。
表6 远处转移和局部/区域复发预测
4. 遗传模型和集成模型的一致性统计(C-index)
对训练和测试数据集中的CV6、DRGM和CV6-DRGM的进行了一致性研究,如表7。可以看出,训练数据集中,CV6-DRGM比DRGM具有更好的C指数(88% vs 92%)。训练和测试数据集之间的准确率相似(DRGM:50% vs 48.2%,CV6-DRGM:59.8% vs 58.9%)。
表7 不同模型中C指数的比较
5. DRGM:ER/PR阳性和HER2阴性患者
5.1训练数据集
训练数据集中有50名ER/PR阳性和HER2阳性患者,其中,低危21例(42.0%),其5年DRFI为100%;高危人群29例(58%),他们的5年DRFI为82.6%;Log-rank test , P = 0.0063。DRGM预测的准确率为58.0%。在真正的DR患者中,复发预测的准确率为100%。在非DR患者中,50%(21/42)的患者被归为低危。高危患者的DR率为27.6%(8/29);低风险患者的DR率为0%(0/21),(具体见表8)。
表8 训练数据集的DRGM:ER/PR阳性和HER2阴性的患者分为低危和高危组
5.2测试数据集
测试数据集中有31名ER/PR阳性和HER2阳性患者。在真正的DR患者中,复发预测的准确率为100%。在非DR的患者中,40.9%的患者被归为低危。高危患者的DR率为40.9%(9/22);低危患者的DR率为0%(0/9),Chi-square test P值为0.0315,(具体见表9)。
表9 测试数据集中的DRGM:ER/PR阳性和HER2阴性的患者分为低危和高危组
6. CV6-DRGM:ER/PR阳性和HER2阴性患者
6.1训练数据集
结合CV6和DRGM,低危28例(56.0%),其5年DRFI为100%;高危22例(44%),其5年DRFI为77.0%;Log-rank test , P=0.0004。
在训练数据集中,DRGM预测的准确率为72.0%(36/50)。在DR患者中,复发的准确预测为100%。在非DR的患者中,66.7%(28/42)的患者被归为低危。高危患者的DR率为36.4%(8/22);低危患者的DR率为0%(0/28),(具体见表10)。
表10 训练数据集中的CV6-DRGM:ER/PR阳性和HER2阴性的患者分为低危和高危组
6.2测试数据集
测试数据集(n = 31),在DR患者中,高危组的准确预测为88.9%(8/9)。在非DR的患者中,有72.7%(16/22)的患者被分类为低危。高危患者的DR率为57.1%(8/14);低危患者的DR率为5.9%(1/17);Chi-square test P值为0.0038,(具体见表11)。
表11 测试数据集中的CV6-DRGM:ER/PR阳性和HER2阴性的患者分为低危和高危组
6.3在BioPortal中提交DRGM基因组并使用TCGA数据集时,可以发现,DRGM基因组与TP53(p值= 1.91e-25)高度相关,并且与CDH1、MAP3K1和PIK3CA互斥(见图8)。同样,使用METABRIC数据集时,DRGM基因组与TP54、MUC16和ERBB3显着并存;并与CDH1、MAP3K1、PIK3CA、GATA3、CBFB、AKT1、CTCF和PTEN互斥(见图9)。
三、总结
总之,本实施例使用RT-PCR平台中的优化引物开发FFPE组织的11基因表达面板,具有预测术后DR风险的能力。这11个基因包括PIM1,TPX2,DTX2,YWHAB,ESR1,ERBB2,SF3B5,OBSL1,CLCA2,BUB1B和BLM。其中,其中DTX2(Deltex E3泛素连接酶2)是一种蛋白质编码基因,与Notch信号通路有关,Notch信号的调节剂参与细胞-细胞通信,其调节广泛的细胞命运决定;OBSL1基因是一种分解不需要的蛋白的细胞机制,与CUL7基因(cullin-7蛋白,组装一个E3泛素连接酶)一起作用;ESR1与ER通路相关,ESR1高表达的肿瘤通常可以通过激素治疗得到控制。本实施例基因表达面板可以区分低危和高危早期乳腺癌(Early-stageBreast Cancer , EBC)患者的复发情况,较高表达水平的DTX2、ESR1、SF3B5和OBSL1的复发风险较小。本实施例中11基因表达面板的引物特异性好,其PCR扩增产生的所有扩增子都相对较短,扩增子的大小均小于100bp(75-95bp),可以提高从福尔马林固定石蜡包埋(Formalin-Fixed Paraffin Embedded , FFPE)样品类型提取的RNA的检测灵敏度。此外,与CV6相比,CV6-DRGM提高了训练和测试数据集的准确性。同时,基因表达分析不能单独决定EBC的预后。
总而言之,本实施例证明了RT-PCR系统中的11个基因组可以划分低危和高危乳腺癌患者,且CV6-DRGM模型可以更好地区分低危和高危患者,它在预测DR风险方面表现良好,并且可能为手术后乳腺癌的治疗提供有用的工具,尤其是对于ER/PR阳性和HER2阴性的患者。
本发明的操作步骤中的常规操作为本领域技术人员所熟知,在此不进行赘述。
以上所述的实施例对本发明的技术方案进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充或类似方式替代等,均应包含在本发明的保护范围之内。
序列表
<110> 郑鸿钧
<120> 用于预测早期乳腺癌远处复发风险的多基因检测引物
<160> 28
<170> SIPOSequenceListing 1.0
<210> 1
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
caaagcctta tggaaggtag gg 22
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ggcagcaatc tgtgagactt 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
caaggaaggt cggccaatta 20
<210> 4
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gcagtagatg acactggaag ac 22
<210> 5
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ccactcgatt ccactgctaa a 21
<210> 6
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
cggtcctagg tttgaggtta ag 22
<210> 7
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gatccaccac aagacagaga tg 22
<210> 8
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gcacgttctg caggtagtt 19
<210> 9
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
aacctggagg tcaatgttat gt 22
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
aaactagggc agcagctatg 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gacagagctg ctgttcctac 20
<210> 12
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ctccacttcg agacacacat c 21
<210> 13
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ggcctatcag tctcacagaa tc 22
<210> 14
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
ctcatttcag cagatggaca aac 23
<210> 15
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gctggcatca gggagatatt ta 22
<210> 16
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ctgtggcttt catgtgtttc tc 22
<210> 17
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
actgagactc tgccttacca 20
<210> 18
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ggtcctttgg agacaggaat ac 22
<210> 19
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cacagagagg tcattggtta tagag 25
<210> 20
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tcacctgtga gagaacagaa ac 22
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
agactgtccc tgaaacctag ta 22
<210> 22
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
acaaagcctg gatactgaca c 21
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ccaatctcat cttgttttct gcg 23
<210> 24
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aatgcttcta ggcggactat g 21
<210> 25
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
cttgtctgtg gagacggatt ac 22
<210> 26
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ccacaaaggc agatggatca 20
<210> 27
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gtacgtgcta acaggctcaa ta 22
<210> 28
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
cgagaagaca tctcaagacc ag 22

Claims (2)

1.一种构建早期乳腺癌远处复发风险预测模型的方法,包括:
S1:以标准的医疗样本采集流程收集的FFPE肿瘤组织样本;
S2:利用SEQ ID NO.1-28定量FFPE肿瘤组织样本中多基因的相对表达量;所述多基因包括:BUB1B、BLM、TPX2、DTX2、PIM1、OBSL1、YWHAB、CLCA2、SF3B5、ESR1、ERBB2、ACTB、RPLPO和TFRC;
采用2-ΔCt计算目的基因相对表达量,ΔCt(GOI)=25-Ct(GOI)+[Ct(ACTB)+Ct(RPLP0)+Ct(TF RC)]/3;所述GOI为目的基因;
S3:建立远处复发遗传模型的统计方法;
所述远处复发遗传模型的计算方法为:
DRGM score = 0.000290927 × PIM1_1 + 0.000307024 × TPX2_1 - 0.006563526× DTX2_1 + 2.78046E-05 × YWHAB_1 - 0.167402736 × ESR1_1 + 0.00044734 ×ERBB2_1 - 0.000295266 × SF3B5_1 - 0.080103018 ×OBSL1_1 + 0.002146431 ×CLCA2_1 + 0.445623356 × BUB1B_1 + 0.224466639 × BLM_1;
DRGM的断点得分为37。
2.根据权利要求1所述的方法,其特征是:所述S3步骤还包括建立综合模型的统计方法,所述综合模型的统计方法将遗传模型与临床模型结合起来,所述临床模型变量包括年龄、ER状态、LN阳性、淋巴管浸润、肿瘤大小和核级;
所述综合模型的计算方法为:CV6-DRGM score = 2.969 × DRGM score + 1.617 ×CV6 score;
所述临床模型的计算方法为统计下表评分:
CV6-DRGM的断点得分为5年时DR率低于4%的低危患者。
CN202011603440.8A 2020-12-29 2020-12-29 用于预测早期乳腺癌远处复发风险的多基因检测引物 Active CN112646890B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011603440.8A CN112646890B (zh) 2020-12-29 2020-12-29 用于预测早期乳腺癌远处复发风险的多基因检测引物

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011603440.8A CN112646890B (zh) 2020-12-29 2020-12-29 用于预测早期乳腺癌远处复发风险的多基因检测引物

Publications (2)

Publication Number Publication Date
CN112646890A CN112646890A (zh) 2021-04-13
CN112646890B true CN112646890B (zh) 2024-08-16

Family

ID=75364293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011603440.8A Active CN112646890B (zh) 2020-12-29 2020-12-29 用于预测早期乳腺癌远处复发风险的多基因检测引物

Country Status (1)

Country Link
CN (1) CN112646890B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI783452B (zh) * 2021-04-20 2022-11-11 得圓開發股份有限公司 輔助背架支撐穿戴式外骨骼
TWI847027B (zh) * 2021-04-20 2024-07-01 新加坡商安智生醫私人有限公司 乳癌復發與轉移風險預估方法與套組
CN113278700B (zh) * 2021-06-04 2022-08-09 浙江省肿瘤医院 一种用于乳腺癌分型及预后预测的引物组及试剂盒

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020064966A1 (en) * 2018-09-27 2020-04-02 Biontech Diagnostics Gmbh Predictive and prognostic methods in breast cancer

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9651554B2 (en) * 2010-09-24 2017-05-16 The Methodist Hospital Research Institute Molecular diagnostic methods for predicting brain metastasis of breast cancer
US20160115551A1 (en) * 2013-05-13 2016-04-28 Nanostring Technologies, Inc. Methods to predict risk of recurrence in node-positive early breast cancer
ES2829912T3 (es) * 2013-09-11 2021-06-02 Bio Theranostics Inc Predecir la reaparición de cáncer de mama
TWI582240B (zh) * 2015-05-19 2017-05-11 鄭鴻鈞 以基因體預後評估試劑組預測乳癌患者局部區域復發風險及放射治療有效性的方法、用途及裝置
CN107574243B (zh) * 2016-06-30 2021-06-29 博奥生物集团有限公司 分子标志物、内参基因及其应用、检测试剂盒以及检测模型的构建方法
CN107058523A (zh) * 2017-03-21 2017-08-18 温州迪安医学检验所有限公司 一种乳腺癌复发风险评估21基因检测引物及其应用
CN108456730B (zh) * 2018-02-27 2021-01-05 海门善准生物科技有限公司 一种复发风险基因群作为标志物在制备评估乳腺癌分子分型内远处复发风险的产品中的应用
CN109385474A (zh) * 2018-02-27 2019-02-26 上海善准生物科技有限公司 乳腺癌分子分型及远处转移风险基因群及诊断产品和应用
CN111218512A (zh) * 2020-03-30 2020-06-02 宁波美丽人生医药生物科技发展有限公司 乳腺癌21基因检测试剂盒及其应用方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020064966A1 (en) * 2018-09-27 2020-04-02 Biontech Diagnostics Gmbh Predictive and prognostic methods in breast cancer

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A 23-gene prognostic classifier for prediction of recurrence and survival for Asian breast cancer patients;Ting-Hao Chenet al.;Biosci Rep;第40卷(第12期);摘要、第4页第3-4段、表3 *

Also Published As

Publication number Publication date
CN112646890A (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
JP6246845B2 (ja) 遺伝子発現を用いた前立腺癌の予後を定量化する方法
CN112646890B (zh) 用于预测早期乳腺癌远处复发风险的多基因检测引物
JP5020088B2 (ja) 遺伝子発現マーカーを使用する、化学療法に対する反応の予測
WO2010080933A1 (en) Cancer biomarkers
JP2020500515A (ja) 乳がん患者の予後の予測方法
EP1996729A2 (en) Molecular assay to predict recurrence of dukes&#39; b colon cancer
KR101672531B1 (ko) 조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도
EP1974058A2 (en) Gene expression markers for colorectal cancer prognosis
WO2007123772A2 (en) Genes involved in estrogen metabolism
EP2191020A2 (en) Gene expression markers of recurrence risk in cancer patients after chemotherapy
EP2240609A2 (en) Molecular staging of stage ii and iii colon cancer and prognosis
US20160222461A1 (en) Methods and kits for diagnosing the prognosis of cancer patients
JP2018527886A (ja) 転移性疾患の予測的遺伝子シグネチャー
AU2017268510A1 (en) Method for using gene expression to determine prognosis of prostate cancer
Buechler et al. EarlyR: A Robust Gene Expression Signature for Predicting Outcomes of Estrogen Receptor–Positive Breast Cancer
TW201827603A (zh) 用於膀胱癌預後的生物標記物組合
Reed et al. A simple two-gene prognostic model for adenocarcinoma of the lung
EP1772521A1 (en) Methods for the prognosis of cancer patients
JP5963748B2 (ja) 中枢神経原発悪性リンパ腫患者の予後予測方法、キット及び使用
CN112368399A (zh) miRNA用于高级别浆液性卵巢癌治疗护理的预测和预后用途
WO2020104482A1 (en) Methods for predicting metastatic potential in patients suffering from sdhb-mutated paraganglioma
Parker Clinical implementation of breast cancer genomics
NZ711680B2 (en) Gene expression profile algorithm for calculating a recurrence score for a patient with kidney cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240808

Address after: 110C, Building 7, No. 22 Xinyan Road, Donghu Street, Linping District, Hangzhou City, Zhejiang Province 310000

Patentee after: Hangzhou Jiahe Yingzhe Biotechnology Co.,Ltd.

Country or region after: China

Address before: Floor 5, No. 85, Section 1, Beitou Road, 25 Zhongyang Lane, Beitou District, Taipei, Taiwan, China, China

Patentee before: Zheng Hongjun

Country or region before: TaiWan, China

TR01 Transfer of patent right