CN112501290B - 与乳腺癌预后相关的标志分子以及检测试剂盒 - Google Patents

与乳腺癌预后相关的标志分子以及检测试剂盒 Download PDF

Info

Publication number
CN112501290B
CN112501290B CN202011069999.7A CN202011069999A CN112501290B CN 112501290 B CN112501290 B CN 112501290B CN 202011069999 A CN202011069999 A CN 202011069999A CN 112501290 B CN112501290 B CN 112501290B
Authority
CN
China
Prior art keywords
seq
breast cancer
prognosis
sample
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011069999.7A
Other languages
English (en)
Other versions
CN112501290A (zh
Inventor
王艳
余和芬
黄蔚
杨天殊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Medical University
Original Assignee
Capital Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Medical University filed Critical Capital Medical University
Priority to CN202011069999.7A priority Critical patent/CN112501290B/zh
Publication of CN112501290A publication Critical patent/CN112501290A/zh
Application granted granted Critical
Publication of CN112501290B publication Critical patent/CN112501290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及与乳腺癌预后相关的标志分子,所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6以及SEQ ID NO:7所示的至少一个基因序列。本发明利用乳腺癌基因组突变数据计算TMB并进行分组,高低TMB组间差异表达DDR基因构建乳腺癌预后模型,从而获得与乳腺癌预后相关的标志分子,为乳腺癌患者的预后风险提供依据和参考价值。

Description

与乳腺癌预后相关的标志分子以及检测试剂盒
技术领域
本发明涉及癌症治疗以及预后评价领域,具体涉及与乳腺癌预后相关的标志分子以及检测试剂盒。
背景技术
乳腺癌是女性常见的恶性肿瘤之一,近几年来,其发病率逐年提高,成为危害女性健康的杀手。据报告显示,2018年全球新发乳腺癌病例占女性肿瘤总数的24.2%,约208万,死亡占15%,约63万。由于乳腺癌较高的肿瘤特异性死亡,因此患者的预后值得关注。目前临床上传统的病理分期不能完全反映肿瘤异质性,预测预后能力欠佳,随着基因芯片、高通量测序技术的发展,基于大数据构建基因测序数据与临床数据相结合的预测模型成为了乳腺癌诊疗领域的研究热点。
肿瘤突变负荷(Tumor Mutation Burden,TMB)定义为每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。大量的文献证实TMB的水平与PD1/PD-L1抗体疗效相关,较高的TMB肿瘤细胞更容易被免疫系统识别,免疫治疗有效概率更高。PD-L1的表达和TMB都有望成为免疫检查点抑制剂的生物标志物,评估了与TMB相关的临床和免疫学参数,可以确定潜在的新生物标记物。近年来,TMB被确定为免疫检查点抑制剂给药的一个强有力的生物标志物,分析TP53和EGFR突变可能为预测TMB提供一个相对快速和容易的替代方法。同时有研究证明DNA修复损伤(DNA Damage Repair,DDR)相关基因突变与TMB显著相关,且与能提高免疫治疗疗效,利于预后。相关报导在研究晚期乳腺癌患者的小样本队列中发现,TMB水平与肿瘤浸润淋巴细胞呈正相关,DNA损伤修复基因突变的乳腺癌TMB水平明显增高。TMB水平与其他分析的临床病理特征之间没有明显的相关性。DNA损伤修复蛋白在维持DNA完整性和免疫反应中的重要性,DDR突变的乳腺癌患者可能从免疫治疗中受益。
以往研究都是利用RNA-seq所有基因直接筛选差异基因得到乳腺癌预后有关的基因集;或者分析单个肿瘤的TMB,将免疫治疗与TMB关联进行生物标记物的预测,主要集中研究免疫治疗和TMB在乳腺癌中的调控作用,未有以TMB为出发点,在高TMB数据集中筛选DNA损伤修复相关基因构建乳腺癌风险评估模型。
发明内容
本发明的目的是利用乳腺癌基因组突变数据计算TMB并进行分组,高低TMB组间差异表达DDR基因构建乳腺癌预后模型,从而获得与乳腺癌预后相关的标志分子,为乳腺癌患者的预后风险提供依据和参考价值。
本发明的第一目的在于提供分离的与乳腺癌预后相关的标志分子,包括:如SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6以及SEQ IDNO:7所示的至少一个基因序列。
具体而言,本发明提供的与乳腺癌预后相关的标志分子可以是SEQ ID NO:1~SEQID NO:7中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个或者全部七个序列。
其中,如SEQ ID NO:1所示的基因序列(又名MDC1),即DNA损伤检查点蛋白1,可通过协调双链断裂的修复,在DNA损伤反应中发挥重要作用。MDC1蛋白表达可作为预测口腔鳞癌患者无复发生存率的预后指标,MDC1蛋白低表达的口腔鳞癌患者可接受辅助放疗代替化疗。目前,尚未见该基因序列与乳腺癌预后相关的报道。
如SEQ ID NO:2所示的基因序列(又名PARP3),PARP3基因编码的蛋白质属于PARP家族,可以通过聚ADP核糖化修饰核蛋白,是参与DNA修复、细胞凋亡调节和维持基因组稳定性的关键调节因子。目前,尚未见该基因序列与乳腺癌预后相关的报道。
如SEQ ID NO:3所示的基因序列(又名PSMB1),PSMB1是蛋白酶体β亚单位家族的成员,在病毒感染过程中是先天性免疫反应的负调节因子。此外,PSMB1/β6致病变异体是一种因蛋白酶体组装异常而导致的隐性遗传病,具有智力残疾、小头畸形和发育迟缓的特点。目前,尚未见该基因序列与乳腺癌预后相关的报道。
如SEQ ID NO:4所示的基因序列(又名PSMB9),免疫蛋白酶体亚基PSMB9在糖尿病和系统性红斑狼疮的表皮中表达上调,而在其他皮肤病中不表达。干扰素刺激培养的角质形成细胞PSMB9的表达,可降低真皮成纤维细胞胶原的表达。目前,尚未见该基因序列与乳腺癌预后相关的报道。
如SEQ ID NO:5所示的基因序列(又名PSMD2),PSMD2是组成泛素-蛋白酶体系统的蛋白酶体亚单位基因之一。目前,尚未见该基因序列与乳腺癌预后相关的报道。
如SEQ ID NO:6所示的基因序列(又名PSMD7),PSMD7是一种19S蛋白酶体亚基,在大多数癌细胞中过表达。它与PSMD14形成二聚体,在去除连接的泛素链中起作用。在食管鳞状细胞癌中,PSMD7下调后可抑制mTOR和p70S6K的表达水平和mTOR/p70S6K通路活性。目前,尚未见该基因序列与乳腺癌预后相关的报道。
如SEQ ID NO:7所示的基因序列(又名PSMD14),即去泛素酶26S蛋白酶体非ATPase调节亚单位14(PSMD14),已被报道与结直肠癌患者的恶性进展和生存期相关,表明PSMD14-ALK2轴在Bmp6信号通路的启动中起着重要作用,并与结直肠癌的肿瘤发生和化疗耐药有关。在肝癌中发现PSMD14在肝癌组织中显著上调。PSMD14的过表达与肝癌患者的血管侵犯、肿瘤数目、肿瘤复发、无瘤生存和总生存率差有关。目前,尚未见该基因序列与乳腺癌预后相关的报道。
本发明提供的所述标志分子依据TMB为指标的生物信息学分析结果筛选得到,经验证与乳腺癌预后高度相关,可以作为临床乳腺癌患者预后评价的生物标志,从而提高患者的生命质量。
本发明的第二目的是提供评价乳腺癌预后效果的检测试剂盒,其中包括:用于检测与乳腺癌预后相关的标志分子的试剂;所述标志分子包括:如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6以及SEQ ID NO:7所示的至少一个基因序列。
具体而言,所述标志分子可以是SEQ ID NO:1~SEQ ID NO:7中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个或者全部七个序列。
作为本发明的优选方案,用于检测标志分子的试剂包括针对所述标志分子的引物对,用于检测患者样品中所述标志分子的含量。
作为本发明的优选方案,用于检测标志分子的试剂包括针对所述标志分子的特异性荧光探针,通过实时监控PCR体系中的荧光信号,对检测患者样品中所述标志分子进行定量检测。
本发明的第三目的是提供乳腺癌预后效果的评价系统,所述评价系统包括:(1)数据输入模块,用于将与乳腺癌预后相关的标志分子的含量检测结果输入模型计算模块;(2)模型计算模块,用于对输入的含量检测结果进行计算处理,得到被测患者的预后效果数据;(3)结果输出模块,用于根据乳腺癌预后效果评价标准对被测患者的预后效果数据进行评价,输出评价结果。
所述与乳腺癌预后相关的标志分子包括:如SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6以及SEQ ID NO:7所示的至少一个基因序列。
具体而言,所述标志分子可以是SEQ ID NO:1~SEQ ID NO:7中的任意一个序列,也可以包括其中的任意两个、三个、四个、五个、六个或者全部七个序列。
作为本发明的优选方案,所述模型计算模块采用的模型具体为:
Risk Score=(0.00111493429138514*PSMD2)+(0.0196815829492914*PSMD14)+(0.00317802684087835*PSMD7)+(-0.0218036237660051*PARP3)+(0.0288644260569623*MDC1)+(0.00373312720442856*PSMB1)+(-0.0135053883273147*PSMB9)。
其中,PSMD2代表如SEQ ID NO:5所示基因序列在样品中的含量,PSMD14代表如SEQID NO:7所示基因序列在样品中的含量,PSMD7代表如SEQ ID NO:6所示基因序列在样品中的含量,PARP3代表如SEQ ID NO:2所示基因序列在样品中的含量,MDC1代表如SEQ ID NO:1所示基因序列在样品中的含量,PSMB1代表如SEQ ID NO:3所示基因序列在样品中的含量,PSMB9代表如SEQ ID NO:4所示基因序列在样品中的含量。
在所述结果输出模块,根据Risk Score的值的高低进行风险高低评估,据此对被测患者的预后效果数据进行评价。
在进行临床实际评估之前,可通过大数据的方式采集大量患者数据,并将大量数据汇总后统计得到的中位数为截断值,将样本分为高、低风险组,据此对被测患者的预后效果数据进行评价。即如果患者的Risk Score值高于该截断值,则为高风险;如果患者的RiskScore值低于该截断值,则为低风险。
本发明的第四目的是提供所述标志分子、所述试剂盒或所述评价系统在乳腺癌诊断中的应用。
本发明的第五目的是提供所述标志分子、所述试剂盒或所述评价系统在乳腺癌患者预后评价中的应用。
本发明通过TCGA(The Cancer Genome Atlas,癌症基因组图谱)乳腺癌基因组和转录组数据,根据突变信息计算的每个样本TMB值,将样本分为高低TMB两组,并分析两组间差异表达的DDR基因。对差异表达DDR基因进行单因素Cox回归分析,根据单因素P值选择相关基因进行LASSO回归分析。根据LASSO回归结果,选择基因构建生存相关的线性风险评估模型,计算各个样本的风险值(risk score),取risk score的中位数为截断值,将样本分为高、低风险组。采用时间依赖的ROC曲线评估模型5年和10年的生存期的预测能力,同时分析高、低组的生存曲线。利用GSE26085数据集作为验证数据集,验证该预后风险模型。最后比较了高低风险组间22个免疫细胞的丰度和模型中基因拷贝数亚型免疫细胞浸润差异,成功构建一组由7个基因构成的乳腺癌生存相关的风险评估模型,可作为评价乳腺癌患者生存预后的生物指标。
附图说明
图1为高低TMB组间生存差异及TMB与临床指标相关性;
图2为高低TMB组DDR基因突变景观图;图2A为高TMB组DDR基因突变景观图,图2B为低TMB组DDR基因突变景观图,图2C为高TMB组突变结果汇总图,图2D为高TMB组DDR突变基因间互斥和共现性结果,图2E为低TMB组突变结果汇总图,图2F为低TMB组DDR突变基因间互斥和共现性结果;
图3为高低TMB组差异表达基因火山图及差异表达DDR基因热图;
图4为差异表达DDR基因GO功能富集和GSEA通路富集分析;
图5为PARP3和UBE2T基因高低表达组间生存曲线;
图6为风险预后模型构建及模型效能评估;图6A为单因素Cox回归分析结果森林图,筛选出10个与预后相关的基因,图6B为Lasso回归Lambda系数确定,图6C为模型构建的7个基因的回归系数(即coefficient值),图6D为TCGA ROC曲线图,图6E为GSE20685 ROC曲线图,图6F为TCGA生存曲线图,图6G为GSE20685生存曲线图;
图7为TCGA数据集高低风险分组22个免疫细胞的丰度;
图8为基因拷贝数变化与免疫细胞浸润差异分析(***<0.001,**<0.01,*<0.05,·<0.1)。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例
1、从UCSC Xena数据库中下载乳腺癌基因组和转录组数据,过滤无生存状态和生存时间的样本,保留同时具有基因组和转录组数据的样本,共得到960个样本。
2、计算每个样本的TMB值,分析TMB与临床指标相关性(结果如图1所示),并根据TMB中位数将样本分为高低TMB两组,比较高低TMB组间生存差异。高低TMB组间生存差异不明显。年龄高的患者相对于年龄低的,TMB更高,差异显著;各临床分期TMB并无明显差异;T1与T2、T3、T4相比,TMB差异显著;N0与N1,N1和N2两组TMB差异显著;M0和M1组TMB差异不明显。从10个DDR相关信号通路中整理DDR基因集,共得到193个DDR基因集。
3、利用R的maftools包绘制高低TMB组DDR基因突变景观图(结果如图2所示)。高TMB组中高频突变基因前5位为TP53、PRKDC、BRCA2、BRCA1和ATM,低TMB组中高频突变基因前5位为TP53、ATM、PRKDC、BRCA2和CDKN1B;与低TMB组相比,高TMB组基因突变频率更高,其中TP53在高TMB组中有51%的样本发生突变,而低TMB组中只有18%的样本TP53发生突变。高低TMB组中,样本突变数目中位数分别为51.5个和19个,且90%的突变为点突变。高TMB组中,共获得72个显著共现的突变基因对,低TMB组中,共获得1个显著共现的突变基因对。
4、利用R的edgeR包进行差异表达基因分析,根据|log2(FC)|>0.26且P<0.05条件筛选差异表达基因,共获得6424个差异表达基因,高TMB组相对于低TMB组表达量上调基因2686个,下调基因3738个。与DDR基因取交集,获得67个差异表达DDR基因。上述结果如图3所示。
5、利用R的clusterProfiler软件包对差异表达DDR基因进行GO功能富集分析,利用GSEA软件进行差异表达DDR基因信号通路分析(结果如图4所示)。结果表明差异表达DDR基因主要与受损DNA结合、蛋白酶体复合体、核分裂细胞周期的负调控等功能相关;KEGG_CELL_CYCLE、KEGG_DNA_REPLICATION、KEGG_PROTEASOME等信号通路在高TMB组中富集显著。
6、对差异表达DDR基因,采用单因素Cox回归,以P<0.05为过滤条件,筛选出与预后相关的基因,共筛选获得10个与预后相关基因。根据样本中与预后相关基因表达量的中位数,将样本分为高低表达两组,利用R的survival包进行生存分析,对高低组间的生存率进行Log-Rank test假设性检验,其中PARP3和UBE2T两个基因高、低表达组总体生存率差异具有统计学意义(结果如图5所示)。
对单因素Cox回归获得10个与预后相关基因(结果如图6A所示),采用最小绝对收缩和选择算子(Lasso)-Cox惩罚回归模型进行降维处理,根据参数Lambda值,选择Lambda.min作为临界点(结果如图6B所示),最终筛选出一个由7个基因构成的与生存相关的线性风险评估模型(结果如图6C所示)。风险评分模型为Risk Score=(0.00111493429138514*PSMD2)+(0.0196815829492914*PSMD14)+(0.00317802684087835*PSMD7)+(-0.0218036237660051*PARP3)+(0.0288644260569623*MDC1)+(0.00373312720442856*PSMB1)+(-0.0135053883273147*PSMB9)。
利用模型计算TCGA数据集中每个患者的Risk Score,取所有患者Risk Score的中位数为截断值,将样本分为高风险和低风险组。其中高风险组样本480个,低风险组样本480个。
利用R的survival包进行生存分析,高、低风险组生存曲线表明高风险组患者总体生存率较低,且两组间差异有统计学意义,说明该模型能较好地预测乳腺癌患者的生存预后(结果如图6F所示);同时利用R的survivalROC包绘制ROC曲线,5年和10年生存率的ROC曲线下面积AUC分别为0.632和0.645,说明该模型有较好的预测能力(结果如图6D所示)。
利用GSE26085数据集进行模型验证,高、低风险组生存曲线表明高风险组患者总体生存率较低,且两组间差异有统计学意义,说明该模型能较好地将高低风险病人区分开来(结果如图6G所示);5年和10年生存率的ROC曲线下面积AUC分别为0.641和0.647,说明该模型有较好的预测能力(结果如图6E所示)。
7、利用R的CIBERSORT包(一个使用基因表达数据评估样本中22个免疫细胞丰度的分析工具)评估TCGA数据集高低风险分组22个免疫细胞的丰度(结果如图7所示)。高低风组间免疫细胞丰度使用Wilcoxontest检验,其中活化的CD4+记忆性T细胞(P值为0.026)、静息的肥大细胞(P值为0.013)在高低风险组间丰度差异明显。
8、利用TIMER(https://cistrome.shinyapps.io/timer/)数据库进行模型中的7个基因拷贝数变化与免疫细胞浸润差异分析(结果如图8所示)。其中MDC1基因增加一个拷贝数的样本组与其他组(缺失两个拷贝数、缺失一个拷贝数、拷贝数正常、增加多个拷贝数)样本相比,CD8+T细胞和巨噬细胞免疫细胞丰度差异明显;PARP3基因增加一个拷贝数组与其他组相比,B细胞、CD8+T细胞、CD4+T细胞和树突状细胞免疫细胞丰度差异明显,PARP3基因缺失组与其他组相比,CD4+T细胞免疫细胞丰度差异明显,PARP3基因缺失一个拷贝数组与其他组相比,CD4+T细胞和巨噬细胞免疫细胞丰度差异明显;PSMB1基因缺失一个拷贝数组与其他组相比,B细胞、CD8+T细胞、CD4+T细胞、巨噬细胞和树突状细胞免疫细胞丰度差异明显,PSMB1基因增加一个拷贝数组与其他组相比,巨噬细胞免疫细胞丰度差异明显,PSMB1基因增加多个拷贝数组与其他组相比,CD4+T细胞免疫细胞丰度差异明显;PSMB9基因增加一个拷贝数组与其他组相比,CD8+T细胞和巨噬细胞免疫细胞丰度差异明显;PSMD7基因缺失一个拷贝数组与其他组相比,B细胞、中性粒细胞和树突状细胞免疫细胞丰度差异明显,PSMD7基因缺失两个拷贝数组与其他组相比CD8+T细胞、CD4+T细胞、中性粒细胞和树突状细胞免疫细胞丰度差异明显,PSMD7基因增加一个拷贝数组与其他组相比,CD8+T细胞和巨噬细胞免疫细胞丰度差异明显;PSMD14基因缺失两个拷贝数组与其他组相比,B细胞、CD8+T细胞、CD4+T细胞、巨噬细胞、中性粒细胞和树突状细胞免疫细胞丰度差异明显,PSMD14基因增加多个拷贝数组与其他组相比,B细胞免疫细胞丰度差异明显。表明这7个基因组成的风险评估模型能很好的反应乳腺癌患者的预后。
虽然,上文中已经用一般性说明、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
SEQUENCE LISTING
<110> 首都医科大学
<120> 与乳腺癌预后相关的标志分子以及检测试剂盒
<130> RYP2010722.4
<160> 7
<170> PatentIn version 3.5
<210> 1
<211> 6270
<212> DNA
<213> Homo sapiens
<400> 1
atggaggaca cccaggctat tgactgggat gttgaagaag aggaggagac agagcaatcc 60
agtgaatcct tgaggtgtaa cgtggagcca gtagggcggc tacatatctt tagtggtgcc 120
catggaccag aaaaagattt cccactacac ctcgggaaga atgtggtagg ccgaatgcct 180
gactgctctg tggccctgcc ctttccatct atctccaaac aacatgcaga gattgaaatc 240
ttagcctggg acaaggcacc tatcctccga gactgtggga gccttaatgg tactcaaatc 300
ctgagacctc ctaaggtttt gagccctggg gtgagtcacc gtctgaggga ccaggaattg 360
attctctttg ctgacttgct ctgccagtac catcgcctgg atgtctctct gccctttgtc 420
tcccggggcc ctctgacagt agaagagaca cccagagtac agggagaaac tcaaccccag 480
aggcttctgt tggctgagga ctcggaggag gaagtagatt ttctttctga aaggcgtatg 540
gtaaaaaaat caaggaccac atcttcctct gtgatagttc cagagagtga tgaagagggg 600
cattccccgg tcctgggcgg ccttgggccg ccttttgcct tcaatttgaa cagtgacaca 660
gatgtggaag aaggtcagca accagccaca gaggaggcct cctcagctgc cagaagaggt 720
gccactgtag aggcaaagca gtctgaagct gaagttgtaa ctgaaatcca gcttgaaaag 780
gatcagcctt tagtgaagga gagggacaat gatacaaaag tcaagagggg tgcagggaat 840
ggggtggttc cagctggggt gattctggag aggagccaac ctcctggaga ggacagtgac 900
acagatgtgg atgatgacag caggcctcct ggaaggccag ctgaggtcca tttggaaagg 960
gctcagcctt ttggcttcat cgacagcgac actgatgcgg aagaagagag gatcccagca 1020
accccagttg tcattcctat gaagaagagg aagatcttcc atggagtagg tacaaggggt 1080
cctggagcac caggcctggc ccatctgcag gagagccagg ctggtagtga tacagatgtg 1140
gaagaaggca aggccccaca ggctgtccct ctggagaaaa gccaagcttc catggttatc 1200
aacagcgata cagatgacga ggaagaagtc tcagcagcgc tgactttggc acatctgaaa 1260
gagagccagc ctgctatatg gaacagagat gcagaagagg acatgcccca acgtgtggtc 1320
cttctgcagc gaagccaaac caccactgag agagacagtg acacagacgt ggaggaggaa 1380
gagctcccag tggaaaatag agaagctgtc ctcaaggatc acacaaagat tagagccctt 1440
gttagagcac attcagaaaa ggaccaacct ccttttgggg acagtgatga cagtgtggaa 1500
gcagataaga gctcacctgg gatccacctg gagagaagcc aagcctccac cacagtggac 1560
atcaacacac aagtggagaa ggaagtcccg ccagggtcag ccattataca tataaagaag 1620
catcaggtgt ctgtggaggg gacaaatcaa acagatgtga aagcagttgg gggaccagca 1680
aagctgcttg tggtatctct agaggaagcc tggcctctgc atggggactg tgaaacagat 1740
gcagaggagg gcacctccct aacagcctca gtagttgcag atgtaagaaa gagccagctt 1800
ccagcagaag gggatgctgg ggcagagtgg gctgcagctg ttcttaagca ggagagagct 1860
catgaggtgg gggcccaggg tgggccacct gtggcacaag tggagcagga cctccctatc 1920
tcaagagaga acctcacaga tctggtggtg gacacagaca ctctagggga atccacccag 1980
ccacagagag agggagccca ggtccccaca ggaagggaga gagaacaaca tgtgggtggg 2040
accaaggact ctgaagacaa ctatggtgat tctgaagatc tggacctaca agctacccag 2100
tgctttctgg agaatcaggg cctggaagca gtccagagca tggaggatga acctacccag 2160
gccttcatgt tgactccacc ccaagagctt ggcccttccc attgcagctt ccagacaaca 2220
ggtaccctag atgaaccatg ggaggtcctg gctacacagc cattctgtct gagagagtct 2280
gaggactctg agacccagcc ttttgacacg caccttgagg cctatggacc ttgcctgtct 2340
ccacctaggg caataccagg agaccaacat ccagagagcc cagttcacac agagccaatg 2400
gggattcaag gcagagggag gcagactgtg gataaagtca tgggtatacc aaaagaaaca 2460
gcagagaggg tgggccctga gagagggcca ttggagagag aaactgagaa actgctacca 2520
gaaagacaga cagatgtgac aggagaggaa gaattaacca aggggaaaca ggacagagaa 2580
caaaaacagt tgttagctag agacacccag agacaagaat ctgacaaaaa tggggaaagt 2640
gcaagtcctg aaagagatag ggagagtttg aaggtagaaa ttgagacatc tgaggaaata 2700
caagagaaac aagtacagaa gcagaccctt ccaagcaaag catttgagag agaagtagag 2760
agaccagtag caaacagaga gtgcgatcca gccgagttag aagagaaggt gcccaaagtg 2820
atcctggaga gagatacaca gagaggggag ccagagggag ggagccagga ccagaaaggg 2880
caggcctcca gcccaacacc agagcctggg gtgggggcgg gggaccttcc gggacctacc 2940
tcagcccccg taccttctgg gagccagtca ggtggaaggg gatccccagt gagccccagg 3000
aggcatcaga aaggcctcct gaattgcaag atgccacctg ctgagaaggc ttccaggatc 3060
agagctgctg agaaggtttc caggggcgat caggaatctc cagatgcttg tctgcctcct 3120
acagtacctg aagccccagc cccaccccaa aagcccctta actctcagag ccagaaacat 3180
cttgcacctc cgccccttct ttctcccctt ttaccttcta tcaagccaac cgttcgtaag 3240
accaggcaag atgggagtca ggaagctcca gaggctccct tgtcctcaga gctggagcct 3300
ttccacccaa agcctaaaat tagaactcgg aagtcctcca gaatgacacc ctttccagct 3360
acctctgctg cccctgagcc ccacccttcc acctccacag cccagccagt cactcccaag 3420
cccacatctc aggccactag gagcaggaca aataggtcct ctgtcaagac ccctgaacca 3480
gttgtcccca cagcccctga gctccagcct tccacctcca cagaccagcc tgtcacctct 3540
gagcccacat ctcaggttac taggggaaga aaaagtagat cctctgtcaa gacccctgaa 3600
acagttgtgc ccacagccct tgagctccag ccttccacct ccaccgaccg acctgtcacc 3660
tctgaaccca cctctcaggc tactagggga agaaaaaata gatcctctgt caagacccct 3720
gaaccagttg tccccacagc ccctgagctc cagccttcca cctccacaga ccagcctgtc 3780
acttctgagc ccacatatca ggctactagg ggaagaaaaa atagatcctc tgtcaagacc 3840
cctgaaccag ttgtgcccac agcccctgag ctccggcctt ccacctccac agaccgacct 3900
gtcaccccca agcccacatc tcggaccact aggagcagga caaatatgtc ctctgtcaag 3960
acccctgaaa cagttgtccc cacagcccct gagctccaga tttccacctc cacagaccaa 4020
cctgtcaccc ctaagcccac atctcggacc actaggagca ggacaaatat gtcctctgtg 4080
aagaaccctg aatcaactgt ccctatagcc cctgagctcc caccttccac ctccacagag 4140
cagcctgtca cccctgagcc cacatctcgg gctactaggg gaagaaaaaa tagatcctct 4200
ggcaagaccc ctgaaacact tgtccccaca gcccctaagc tcgagccttc cacttccaca 4260
gaccaacctg tcactcctga gcccacatct caggccacca ggggcaggac aaataggtcc 4320
tctgtgaaga cccctgaaac agttgtcccc acagcccctg agctccagcc ttccacctcc 4380
acagaccagc ctgttacccc tgagcctacg tctcaggcta ctaggggaag aacagataga 4440
tcctctgtca agactcctga aacagttgtc cccacagccc ctgagctaca ggcttccgcc 4500
tccacagacc agcctgtcac ctctgagccc acatctcgga ccactagggg aagaaaaaat 4560
cggtcctctg tcaagacccc tgaaacagtt gtgcccgcag cccctgagct ccagccttcc 4620
acctccacag accaacctgt cacccctgag cccacatctc gggccactag gggcaggaca 4680
aataggtcct ctgtcaagac ccctgaatca attgtcccta tagcccctga gcttcagcct 4740
tccacctcca gaaaccagct tgtcacccct gagcccacat ctcgggccac taggtgcagg 4800
acaaataggt cctctgtcaa gacccctgag ccagttgtcc ccacagcccc tgagccccat 4860
cctaccacct ccacagacca gcctgtcacc cccaagctca catctagggc cactaggaga 4920
aagacaaata ggtcctctgt caagactccc aaaccagttg aaccagcagc ctctgatctt 4980
gagcctttta cccccacaga ccagtccgtc acccctgagg ccatagctca gggtggtcag 5040
agcaaaacac tgaggtcttc cacagtaaga gctatgccgg ttcctaccac ccctgaattc 5100
caatctcctg tcaccacaga ccagcctatt tcccctgagc ctattactca acccagttgc 5160
atcaagaggc agagagccgc tgggaaccct ggctccctcg cagctcccat tgaccataag 5220
ccttgctctg cacccttgga acctaaatcc caggcctcaa ggaaccaaag atggggagca 5280
gtgagagcag ctgaatccct tacagccatt cctgagcctg cctctcccca gcttcttgag 5340
acaccaattc atgcctccca gatccaaaag gtggaaccag caggtagatc taggttcacc 5400
ccggagctcc agcctaaggc ctctcaaagc cgcaagaggt ctttagctac catggattca 5460
ccaccacatc aaaaacagcc ccaaagaggg gaagtctccc agaagacagt gattatcaag 5520
gaagaggaag aagatactgc agagaagcca gggaaggaag aggatgtcgt gactccaaaa 5580
ccaggcaaga gaaagagaga ccaggcagag gaggagccca acagaatacc aagccgcagc 5640
ctccgacgga ccaaacttaa ccaagaatca acagccccca aagtgctctt cacaggagtg 5700
gtggatgctc ggggagagcg ggctgtgctg gcactggggg gaagtctggc tggttcagcg 5760
gcagaggctt cccacctggt cactgatcgc atccgccgga cagtcaagtt cctgtgtgcc 5820
ctggggcggg gaatccccat tctgtccctg gactggctgc atcagtcccg caaggctggt 5880
ttcttcttac ccccggatga atatgtggtg accgaccctg agcaagagaa gaactttggc 5940
tttagccttc aagacgcact gagcagggct cgggagcgaa ggctgctaga gggctatgag 6000
atctatgtga cccctggagt ccagccacca ccacctcaga tgggagagat tattagctgc 6060
tgtggaggca catacctacc cagcatgcct cggtcctata agcctcagag agttgtgatc 6120
acatgccctc aggacttccc tcattgctcc attccactac gggttgggct gcccctcctc 6180
tcgcctgagt tcctgctgac tggagtgctg aagcaggaag ccaagccaga ggcctttgtc 6240
ctctcccctt tggagatgtc atccacctga 6270
<210> 2
<211> 1602
<212> DNA
<213> Homo sapiens
<400> 2
atggctccaa agccgaagcc ctgggtacag actgagggcc ctgagaagaa gaagggccgg 60
caggcaggaa gggaggagga ccccttccgc tccaccgctg aggccctcaa ggccataccc 120
gcagagaagc gcataatccg cgtggatcca acatgtccac tcagcagcaa ccccgggacc 180
caggtgtatg aggactacaa ctgcaccctg aaccagacca acatcgagaa caacaacaac 240
aagttctaca tcatccagct gctccaagac agcaaccgct tcttcacctg ctggaaccgc 300
tggggccgtg tgggagaggt cggccagtca aagatcaacc acttcacaag gctagaagat 360
gcaaagaagg actttgagaa gaaatttcgg gaaaagacca agaacaactg ggcagagcgg 420
gaccactttg tgtctcaccc gggcaagtac acacttatcg aagtacaggc agaggatgag 480
gcccaggaag ctgtggtgaa ggtggacaga ggcccagtga ggactgtgac taagcgggtg 540
cagccctgct ccctggaccc agccacgcag aagctcatca ctaacatctt cagcaaggag 600
atgttcaaga acaccatggc cctcatggac ctggatgtga agaagatgcc cctgggaaag 660
ctgagcaagc aacagattgc acggggtttc gaggccttgg aggcgctgga ggaggccctg 720
aaaggcccca cggatggtgg ccaaagcctg gaggagctgt cctcacactt ttacaccgtc 780
atcccgcaca acttcggcca cagccagccc ccgcccatca attcccctga gcttctgcag 840
gccaagaagg acatgctgct ggtgctggcg gacatcgagc tggcccaggc cctgcaggca 900
gtctctgagc aggagaagac ggtggaggag gtgccacacc ccctggaccg agactaccag 960
cttctcaagt gccagctgca gctgctagac tctggagcac ctgagtacaa ggtgatacag 1020
acctacttag aacagactgg cagcaaccac aggtgcccta cacttcaaca catctggaaa 1080
gtaaaccaag aaggggagga agacagattc caggcccact ccaaactggg taatcggaag 1140
ctgctgtggc atggcaccaa catggccgtg gtggccgcca tcctcactag tgggctccgc 1200
atcatgccac attctggtgg gcgtgttggc aagggcatct actttgcctc agagaacagc 1260
aagtcagctg gatatgttat tggcatgaag tgtggggccc accatgtcgg ctacatgttc 1320
ctgggtgagg tggccctggg cagagagcac catatcaaca cggacaaccc cagcttgaag 1380
agcccacctc ctggcttcga cagtgtcatt gcccgaggcc acaccgagcc tgatccgacc 1440
caggacactg agttggagct ggatggccag caagtggtgg tgccccaggg ccagcctgtg 1500
ccctgcccag agttcagcag ctccacattc tcccagagcg agtacctcat ctaccaggag 1560
agccagtgtc gcctgcgcta cctgctggag gtccacctct ga 1602
<210> 3
<211> 726
<212> DNA
<213> Homo sapiens
<400> 3
atgttgtcct ctacagccat gtattcggct cctggcagag acttggggat ggaaccgcac 60
agagccgcgg gccctttgca gctgcgattt tcgccctacg ttttcaacgg aggtactata 120
ctggcaattg ctggagaaga ttttgcaatt gttgcttctg atactcgatt gagtgaaggg 180
ttttcaattc atacgcggga tagccccaaa tgttacaaat taacagacaa aacagtcatt 240
ggatgcagcg gttttcatgg agactgtctt acgctgacaa agattattga agcaagacta 300
aagatgtata agcattccaa taataaggcc atgactacgg gggcaattgc tgcaatgctg 360
tctacaatcc tgtattcaag gcgcttcttt ccatactatg tttacaacat catcggtgga 420
cttgatgaag aaggaaaggg ggctgtatac agctttgatc cagtagggtc ttaccagaga 480
gactccttca aggctggagg ctcagcaagt gccatgctac agcccctgct tgacaaccag 540
gttggtttta agaacatgca gaatgtggag catgttccgc tgtccttgga cagagccatg 600
cggctggtga aagatgtctt catttctgcg gctgagagag atgtgtacac tggggacgca 660
ctccggatct gcatagtgac caaagagggc atcagggagg aaactgtttc cttaaggaag 720
gactga 726
<210> 4
<211> 660
<212> DNA
<213> Homo sapiens
<400> 4
atgctgcggg cgggagcacc aaccggggac ttaccccggg cgggagaagt ccacaccggg 60
accaccatca tggcagtgga gtttgacggg ggcgttgtga tgggttctga ttcccgagtg 120
tctgcaggcg aggcggtggt gaaccgagtg tttgacaagc tgtccccgct gcacgagcgc 180
atctactgtg cactctctgg ttcagctgct gatgcccaag ccgtggccga catggccgcc 240
taccagctgg agctccatgg gatagaactg gaggaacctc cacttgtttt ggctgctgca 300
aatgtggtga gaaatatcag ctataaatat cgagaggact tgtctgcaca tctcatggta 360
gctggctggg accaacgtga aggaggtcag gtatatggaa ccctgggagg aatgctgact 420
cgacagcctt ttgccattgg tggctccggc agcaccttta tctatggtta tgtggatgca 480
gcatataagc caggcatgtc tcccgaggag tgcaggcgct tcaccacaga cgctattgct 540
ctggccatga gccgggatgg ctcaagcggg ggtgtcatct acctggtcac tattacagct 600
gccggtgtgg accatcgagt catcttgggc aatgaactgc caaaattcta tgatgagtga 660
<210> 5
<211> 2727
<212> DNA
<213> Homo sapiens
<400> 5
atggaggagg gaggccggga caaggcgccg gtgcagcccc agcagtctcc agcggcggcc 60
cccggcggca cggacgagaa gccgagcggc aaggagcggc gggatgccgg ggacaaggac 120
aaagaacagg agctgtctga agaggataaa cagcttcaag atgaactgga gatgctcgtg 180
gaacgactag gggagaagga tacatccctg tatcgaccag cgctggagga attgcgaagg 240
cagattcgtt cttctacaac ttccatgact tcagtgccca agcctctcaa atttctgcgt 300
ccacactatg gcaaactgaa ggaaatctat gagaacatgg cccctgggga gaataagcgt 360
tttgctgctg acatcatctc cgttttggcc atgaccatga gtggggagcg tgagtgcctc 420
aagtatcggc tagtgggctc ccaggaggaa ttggcatcat ggggtcatga gtatgtcagg 480
catctggcag gagaagtggc taaggagtgg caggagctgg atgacgcaga gaaggtccag 540
cgggagcctc tgctcactct ggtgaaggaa atcgtcccct ataacatggc ccacaatgca 600
gagcatgagg cttgcgacct gcttatggaa attgagcagg tggacatgct ggagaaggac 660
attgatgaaa atgcatatgc aaaggtctgc ctttatctca ccagttgtgt gaattacgtg 720
cctgagcctg agaactcagc cctactgcgt tgtgccctgg gtgtgttccg aaagtttagc 780
cgcttccctg aagctctgag attggcattg atgctcaatg acatggagtt ggtagaagac 840
atcttcacct cctgcaagga tgtggtagta cagaaacaga tggcattcat gctaggccgg 900
catggggtgt tcctggagct gagtgaagat gtcgaggagt atgaggacct gacagagatc 960
atgtccaatg tacagctcaa cagcaacttc ttggccttag ctcgggagct ggacatcatg 1020
gagcccaagg tgcctgatga catctacaaa acccacctag agaacaacag gtttgggggc 1080
agtggctctc aggtggactc tgcccgcatg aacctggcct cctcttttgt gaatggcttt 1140
gtgaatgcag cttttggcca agacaagctg ctaacagatg atggcaacaa atggctttac 1200
aagaacaagg accacggaat gttgagtgca gctgcatctc ttgggatgat tctgctgtgg 1260
gatgtggatg gtggcctcac ccagattgac aagtacctgt actcctctga ggactacatt 1320
aagtcaggag ctcttcttgc ctgtggcata gtgaactctg gggtccggaa tgagtgtgac 1380
cctgctctgg cactgctctc agactatgtt ctccacaaca gcaacaccat gagacttggt 1440
tccatctttg ggctaggctt ggcttatgct ggctcaaatc gtgaagatgt cctaacactg 1500
ctgctgcctg tgatgggaga ttcaaagtcc agcatggagg tggcaggtgt cacagcttta 1560
gcctgtggaa tgatagcagt agggtcctgc aatggagatg taacttccac tatccttcag 1620
accatcatgg agaagtcaga gactgagctc aaggatactt atgctcgttg gcttcctctt 1680
ggactgggtc tcaaccacct ggggaagggt gaggccatcg aggcaatcct ggctgcactg 1740
gaggttgtgt cagagccatt ccgcagtttt gccaacacac tggtggatgt gtgtgcatat 1800
gcaggctctg ggaatgtgct gaaggtgcag cagctgctcc acatttgtag cgaacacttt 1860
gactccaaag agaaggagga agacaaagac aagaaggaaa agaaagacaa ggacaagaag 1920
gaagcccctg ctgacatggg agcacatcag ggagtggctg ttctggggat tgcccttatt 1980
gctatggggg aggagattgg tgcagagatg gcattacgaa cctttggcca cttgctgaga 2040
tatggggagc ctacactccg gagggctgta cctttagcac tggccctcat ctctgtttca 2100
aatccacgac tcaacatcct ggatacccta agcaaattct ctcatgatgc tgatccagaa 2160
gtttcctata actccatttt tgccatgggc atggtgggca gtggtaccaa taatgcccgt 2220
ctggctgcaa tgctgcgcca gttagctcaa tatcatgcca aggacccaaa caacctcttc 2280
atggtgcgct tggcacaggg cctgacacat ttagggaagg gcacccttac cctctgcccc 2340
taccacagcg accggcagct tatgagccag gtggccgtgg ctggactgct cactgtgctt 2400
gtctctttcc tggatgttcg aaacattatt ctaggcaaat cacactatgt attgtatggg 2460
ctggtggctg ccatgcagcc ccgaatgctg gttacgtttg atgaggagct gcggccattg 2520
ccagtgtctg tccgtgtggg ccaggcagtg gatgtggtgg gccaggctgg caagccgaag 2580
actatcacag ggttccagac gcatacaacc ccagtgttgt tggcccacgg ggaacgggca 2640
gaattggcca ctgaggagtt tcttcctgtt acccccattc tggaaggttt tgttatcctt 2700
cggaagaacc ccaattatga tctctaa 2727
<210> 6
<211> 975
<212> DNA
<213> Homo sapiens
<400> 6
atgccggagc tggcagtgca gaaggtggtg gtccaccccc tggtgctgct cagtgtggtg 60
gatcatttca accgaatcgg caaggttgga aaccagaagc gtgttgttgg tgtgcttttg 120
gggtcatggc aaaagaaagt acttgatgta tcgaacagtt ttgcagttcc ttttgatgaa 180
gatgacaaag acgattctgt atggttttta gaccatgatt atttggaaaa catgtatgga 240
atgtttaaga aagtcaatgc cagggaaaga atagttggct ggtaccacac aggccctaaa 300
ctacacaaga atgacattgc catcaacgaa ctcatgaaaa gatactgtcc taattccgta 360
ttggtcatca ttgatgtgaa gccgaaggac ctagggctgc ctacagaagc gtacatttca 420
gtggaagaag tccatgatga tggaactcca acctcgaaaa catttgaaca cgtgaccagt 480
gaaattggag cagaggaagc tgaggaagtt ggagttgaac acttgttacg agatatcaaa 540
gacacgacgg tgggcactct gtcccagcgg atcacaaacc aggtccatgg tttgaaggga 600
ctgaactcca agcttctgga tatcaggagc tacctggaaa aagtcgccac aggcaagctg 660
cccatcaacc accagatcat ctaccagctg caggacgtct tcaacctgct gccagatgtc 720
agcctgcagg agttcgtcaa ggccttttac ctgaagacca atgaccagat ggtggtagtg 780
tacttggcct cgctgatccg ttccgtggtc gccctgcaca acctcatcaa caacaagatt 840
gccaaccggg atgcagagaa gaaagaaggg caggagaaag aagagagcaa aaaggatagg 900
aaagaggaca aggagaaaga taaagataag gaaaagagtg atgtaaagaa agaggagaaa 960
aaggagaaaa agtaa 975
<210> 7
<211> 933
<212> DNA
<213> Homo sapiens
<400> 7
atggacagac ttcttagact tggaggaggt atgcctggac tgggccaggg gccacctaca 60
gatgctcctg cagtggacac agcagaacaa gtctatatct cttccctggc actgttaaaa 120
atgttaaaac atggccgtgc tggagttcca atggaagtta tgggtttgat gcttggagaa 180
tttgttgatg attataccgt cagagtgatt gatgtgtttg ctatgccaca gtcaggaaca 240
ggtgtcagtg tggaggcagt tgatccagtg ttccaagcta aaatgttgga tatgttgaag 300
cagacaggaa ggccggagat ggttgttggt tggtatcaca gtcaccctgg ctttggttgt 360
tggctttctg gtgtggatat caacactcag cagagctttg aagccttgtc ggagagagct 420
gtggcagtgg ttgtggatcc cattcagagt gtaaaaggaa aggttgttat tgatgccttc 480
agattgatca atgctaatat gatggtctta ggacatgaac caagacaaac aacttcgaat 540
ctgggtcact taaacaagcc atctatccag gcattaattc atggactaaa cagacattat 600
tactccatta ctattaacta tcggaaaaat gaactggaac agaagatgtt gctaaatttg 660
cataagaaga gttggatgga aggtttgaca cttcaggact acagtgaaca ttgtaaacac 720
aatgaatcag tggtaaaaga gatgttggaa ttagccaaga attacaataa ggctgtagaa 780
gaagaagata agatgacacc tgaacagctg gcaataaaga atgttggcaa gcaggacccc 840
aaacgtcatt tggaggaaca tgtggatgta cttatgacct caaatattgt ccagtgttta 900
gcagctatgt tggatactgt cgtatttaaa taa 933

Claims (1)

1.乳腺癌预后效果的评价系统,其特征在于,所述系统包括:
(1)数据输入模块,用于将与乳腺癌预后相关的标志分子的含量检测结果输入模型计算模块;
所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6以及SEQ ID NO:7所示的基因序列;
(2)模型计算模块,用于对输入的含量检测结果进行计算处理,得到被测患者的预后效果数据;
(3)结果输出模块,用于根据乳腺癌预后效果评价标准对被测患者的预后效果数据进行评价,输出评价结果;
所述模型计算模块采用的模型具体为:
Risk Score=(0.00111493429138514*PSMD2)+(0.0196815829492914*PSMD14)+(0.00317802684087835*PSMD7)+(-0.0218036237660051*PARP3)+(0.0288644260569623*MDC1)+(0.00373312720442856*PSMB1)+(-0.0135053883273147*PSMB9);
其中,PSMD2代表如SEQ ID NO:5所示基因序列在样品中的含量,PSMD14代表如SEQ IDNO:7所示基因序列在样品中的含量,PSMD7代表如SEQ ID NO:6所示基因序列在样品中的含量,PARP3代表如SEQ ID NO:2所示基因序列在样品中的含量,MDC1代表如SEQ ID NO:1所示基因序列在样品中的含量,PSMB1代表如SEQ ID NO:3所示基因序列在样品中的含量,PSMB9代表如SEQ ID NO:4所示基因序列在样品中的含量;
所述用于根据乳腺癌预后效果评价标准对被测患者的预后效果数据进行评价为:通过大数据的方式采集患者数据,并将所述患者数据汇总后统计得到的中位数为截断值,将样本分为高、低风险组,据此对所述患者的预后效果数据进行评价,即如果患者的Risk Score值高于该截断值,则为高风险;如果患者的Risk Score值低于该截断值,则为低风险。
CN202011069999.7A 2020-09-30 2020-09-30 与乳腺癌预后相关的标志分子以及检测试剂盒 Active CN112501290B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011069999.7A CN112501290B (zh) 2020-09-30 2020-09-30 与乳腺癌预后相关的标志分子以及检测试剂盒

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011069999.7A CN112501290B (zh) 2020-09-30 2020-09-30 与乳腺癌预后相关的标志分子以及检测试剂盒

Publications (2)

Publication Number Publication Date
CN112501290A CN112501290A (zh) 2021-03-16
CN112501290B true CN112501290B (zh) 2022-11-22

Family

ID=74954079

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011069999.7A Active CN112501290B (zh) 2020-09-30 2020-09-30 与乳腺癌预后相关的标志分子以及检测试剂盒

Country Status (1)

Country Link
CN (1) CN112501290B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113373220A (zh) * 2021-05-08 2021-09-10 首都医科大学 与非小细胞肺癌预后相关的标志分子

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108456730A (zh) * 2018-02-27 2018-08-28 海门善准生物科技有限公司 乳腺癌分型内远处复发风险基因群及体外诊断产品和应用
CN111564214A (zh) * 2019-02-14 2020-08-21 辽宁省肿瘤医院 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108456730A (zh) * 2018-02-27 2018-08-28 海门善准生物科技有限公司 乳腺癌分型内远处复发风险基因群及体外诊断产品和应用
CN111564214A (zh) * 2019-02-14 2020-08-21 辽宁省肿瘤医院 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Deubiquitinase PSMD7 regulates cell fate and is associated with disease progression in breast cancer.;Yuanjie Zhao 等;《Am J Transl Res》;20200915;摘要 *
Mediator of DNA damage checkpoint protein 1 (MDC1) expression as a prognostic marker for nodal recurrence in early-stage breast cancer patients treated with breast-conserving surgery and radiation therapy;Akshar N. Patel等;《Breast Cancer Res Treat》;20100603;摘要 *
Obesity-associated methylation in breast tumors: a possible link to disparate outcomes?;Whitney L Do等;《Breast Cancer Res Treat》;20200331;摘要 *
PARP-3在乳腺癌中的表达及临床意义的研究;宋志国等;《2015医学前沿论坛暨第十四届全国肿瘤药理与化疗学术会议摘要汇编》;20150424;摘要 *
PSMD2 regulates breast cancer cell proliferation and cell cycle progression by modulating p21 and p27 proteasomal degradation;Yunhai Li等;《Cancer Lett.》;20180517;摘要 *
Significant prognostic values of differentially expressed-aberrantly methylated hub genes in breast cancer;Lina Qi等;《Journal of Cancer》;20191021;摘要,第6623页table 2 *

Also Published As

Publication number Publication date
CN112501290A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
EP2326734B1 (en) Pathways underlying pancreatic tumorigenesis and an hereditary pancreatic cancer gene
KR20150132500A (ko) 암 예후용 조성물 및 방법
CN106978480A (zh) 用于癌症的分子诊断试验
CN106164296A (zh) 用于预测对抗血管生成药的应答和癌症预后的分子诊断测试
US20120015906A1 (en) Uses of bortezomib in predicting survival in multiple myeloma patients
Saleh et al. Differential gene expression of tumor-infiltrating CD8+ T cells in advanced versus early-stage colorectal cancer and identification of a gene signature of poor prognosis
CN107849613A (zh) 用于肺癌分型的方法
CN107312861A (zh) 一种b‑all患者预后风险评估标记物
Yang et al. Potentially functional variants of ERAP1, PSMF1 and NCF2 in the MHC-I-related pathway predict non-small cell lung cancer survival
Singh et al. Differentially expressed full-length, fusion and novel isoforms transcripts-based signature of well-differentiated keratinized oral squamous cell carcinoma
Zhang et al. A novel immune-related prognostic signature predicting survival in patients with pancreatic adenocarcinoma
CN112501290B (zh) 与乳腺癌预后相关的标志分子以及检测试剂盒
KR20180007291A (ko) 암 리스크를 검출하는 방법
CN112921091B (zh) Flt3基因突变在预测非小细胞肺癌患者对免疫检查点抑制剂疗法敏感性中的应用
Ma et al. Gene network-based cancer prognosis analysis with sparse boosting
KR100835296B1 (ko) 암 예측 유전자세트 선정방법
KR20210089240A (ko) 체세포성 돌연변이를 위한 방법 및 시스템 그리고 그 용도
Wilmott et al. Tumour procurement, DNA extraction, coverage analysis and optimisation of mutation-detection algorithms for human melanoma genomes
Shen et al. SRSF7 is a promising prognostic biomarker in hepatocellular carcinoma and is associated with immune infiltration
Lai et al. Determination of a prediction model for therapeutic response and prognosis based on chemokine signaling-related genes in stage I–III lung squamous cell carcinoma
CN110468201B (zh) Escc频繁突变基因的靶向测序及其在获得判断escc预后的生物标记物中的应用
Chen et al. SMIM20: a new biological signal associated with the prognosis of glioblastoma
McVeigh et al. Diagnostic yield of a custom-designed multi-gene cancer panel in Irish patients with breast cancer
CN116500268B (zh) 与骨肉瘤相关的hox基因的用途
CN111670255A (zh) 来自液体瘤和实体瘤的bam特征及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant