CN108277278A - 一种用于正常核型急性髓系白血病预后分层的方法及装置 - Google Patents

一种用于正常核型急性髓系白血病预后分层的方法及装置 Download PDF

Info

Publication number
CN108277278A
CN108277278A CN201810048986.8A CN201810048986A CN108277278A CN 108277278 A CN108277278 A CN 108277278A CN 201810048986 A CN201810048986 A CN 201810048986A CN 108277278 A CN108277278 A CN 108277278A
Authority
CN
China
Prior art keywords
gene
prognosis
aml
sample
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810048986.8A
Other languages
English (en)
Inventor
郭安源
林生彦
陈智超
苗亚茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ezhou Institute of Industrial Technology Huazhong University of Science and Technology
Original Assignee
Ezhou Institute of Industrial Technology Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ezhou Institute of Industrial Technology Huazhong University of Science and Technology filed Critical Ezhou Institute of Industrial Technology Huazhong University of Science and Technology
Priority to CN201810048986.8A priority Critical patent/CN108277278A/zh
Publication of CN108277278A publication Critical patent/CN108277278A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Oncology (AREA)
  • General Engineering & Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明实施例提供了一种用于正常核型急性髓系白血病预后分层的方法及装置,方法包括:获取正常核型急性髓系白血病CN‑AML患者的目标评估基因,所述目标评估基因为STAB1基因;根据CN‑AML患者目标评估基因的基因表达量对所述CN‑AML患者进行分层,将所述CN‑AML患者分为预后良好组及预后不良组;如此,因目标评估基因只有一个,因此能简单地对CN‑AML患者进行预后评估和疾病分层;另外所述目标评估基因为STAB1基因,因STAB1基因为膜蛋白基因,因此能利用现有的检测设备快速检测出,提高了检测效率。

Description

一种用于正常核型急性髓系白血病预后分层的方法及装置
技术领域
本发明属于分子生物技术领域,尤其涉及一种用于正常核型急性髓系白血病预后分层的方法及装置。
背景技术
急性髓性白血病(AML,Acute Myeloid Leukemia)是一种以造血干细胞分化受阻导致不同阶段未成熟细胞异常增殖而正常造血组织减少为特征的恶性克隆性疾病,严重影响人类的健康。
根据细胞遗传学分层可将AML预后分为低危组、中危组和高危组,其中,被划分在中危组的核型正常的(CN-AML,Cytogenetically normal Acute Myeloid Leukemia)患者约占全部AML患者50%,这类患者存在明显异质性,预后存在明显差异。
目前可在CN-AML患者中检测到分子遗传学的变化,包括与CN-AML预后相关的基因突变和基因表达的改变,然后利用分子遗传学并结合联用多项临床指征,比如:基因突变、患者年龄、细胞遗传学水平及基因表达等进行联合打分可以实现CN-AML患者的预后评估。但是这种评估方法的过程非常繁琐,且不能有效地进行预后评估的疾病分层,导致不能辅助临床制定精准分层的治疗方案,不能对患者进行精准治疗。
发明内容
针对现有技术存在的问题,本发明实施例提供了一种用于正常核型急性髓系白血病预后分层的方法及装置,用于解决现有技术中不能有效、简易地对CN-AML患者进行预后评估的疾病分层,导致不能辅助临床制定精准分层的治疗方案,不能对患者进行精准治疗的技术问题。
本发明实施例提供一种用于正常核型急性髓系白血病预后分层的方法,所述方法包括:
获取正常核型急性髓系白血病CN-AML患者的目标评估基因,所述目标评估基因为STAB1基因;
根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组。
上述方案中,所述根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者的预后生存时间进行分层,包括:
获取所述目标评估基因在目标样本中的各基因表达量;
确定各基因表达量的中位数;
当所述CN-AML患者目标评估基因的基因表达量大于所述中值时,确定所述CN-AML患者的目标评估基因为高表达基因,将所述当前CN-AML患者分为预后不良组;
当所述CN-AML患者目标评估基因的基因表达量小于所述中值时,确定所述CN-AML患者的目标评估基因为低表达基因,将所述当前CN-AML患者分为预后良好组。
上述方案中,所述根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组后,包括:
对处于预后不良组的CN-AML患者指示相应的药物信息。
上述方案中,所述对处于预后不良组的CN-AML患者指示相应的药物信息,包括:
获取对目标药物敏感或耐药的基因以及癌症药物数据库中多个药物的拮抗剂的半抑制浓度IC50值,所述目标药物为临床上的经验药物;
利用皮尔森函数确定所述STAB1基因的表达量与所述对药物敏感或者耐药的基因表达量之间的相关性,若所述STAB1基因的表达量与所述对药物敏感或者耐药的基因表达量之间的相关性为正相关,则将所述目标药物作为处于预后不良组的CN-AML患者的指示药物;
利用所述皮尔森函数确定癌症药物数据库中的药物拮抗剂的半抑制浓度IC50值与所述STAB1基因表达量的相关性,若所述IC50值与所述STAB1基因表达量的呈正相关性,则将所述药物作为处于预后不良组的CN-AML患者的指示药物。
上述方案中,所述对处于预后不良组的CN-AML患者指示相应的药物信息,包括:
对处于预后不良组的CN-AML患者指示阿糖胞苷药物、小分子抑制剂NVP-BHG712、小分子抑制剂GSK-J4、小分子抑制剂BRD-K30748066和陶扎塞替Tozasertib药物信息。
上述方案中,所述方法包括:
从数据库中获取目标样本的基因表达信息,所述目标样本为正常核型急性髓系白血病CN-AML患者的样本;
根据预设的生存时间为分类标准,将所述目标样本分为第一类样本及第二类样本,所述第一类样本为生存时间小于2年的样本,所述第二类样本为生存时间大于2年的样本;
根据预设的第一筛选条件对所述第一类样本及所述第二类样本的基因进行筛选,获取多个差异表达基因;
根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;
从所述数据库中获取影响所述CN-AML预后的临床因子,根据影响所述CN-AML预后的临床因子及影响急性髓系白血病AML生存的经验预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取各独立预后基因;
根据预设的验证样本集分别对每个独立预后基因进行验证,根据验证结果确定出所述目标评估基因。
上述方案中,所述根据预设的第一筛选条件对所述第一类样本及所述第二类样本的基因进行筛选,获取多个差异表达基因,包括:
根据所述第一筛选条件对所述第一类样本中的所有基因及所述第二类样本中的所有基因进行筛选,获取多个所述差异表达基因;其中,所述第一筛选条件为假阳性基因的假阳性率FDR<0.05且基因的差异倍数fold-change>1.5。
上述方案中,所述根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因,包括:
获取每个差异表达基因分别在所述目标样本中的生存资料,所述生存资料包括:每个差异表达基因的基因表达量、每个差异表达基因对应样本的生存时间及生存状态;
基于所述每个差异表达基因的生存资料,利用KM统计工具中的曲线函数对每个差异表达基因进行生存分析,生成各差异表达基因的第一KM生存曲线;
从所述各第一KM生存曲线获取每个差异表达基因的第一显著值;
根据预设的第二筛选条件对每个差异表达基因的第一显著值进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;其中,所述第二筛选条件为P≤0.05;所述P为显著值。
上述方案中,所述根据影响所述CN-AML预后的临床因子及影响AML生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取各独立预后基因,包括:
根据影响所述CN-AML预后的临床因子及影响所述AML生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取每个所述预后相关差异表达基因的第二显著值;
根据预设的第二筛选条件对所述各所述预后相关差异表达基因的第二显著值进行筛选,获取各独立预后基因;其中,所述第二筛选条件为P≤0.05;所述P为显著值;
所述影响所述CN-AML预后的临床因子包括:年龄Age、FMS样的酪氨酸激酶3(FLT3)突变、DNA甲基转移酶3A(DNMT3A)突变、异磷酸脱氢酶1(IDH1)突变、异磷酸脱氢酶2(IDH2)突变、RUNT相关转录因子1(RUNX1)突变及线粒体基因B(MTCYB)突变、核磷蛋白(NPM1)突变及威廉姆斯肿瘤抑制因子1(WT1)突变;
所述影响AML生存的经验预后因子包括:NPM1突变、IDH1突变、IDH2突变及WT1突变。
本发明还提供一种用于正常核型急性髓系白血病预后分层的装置,所述装置包括:
获取单元,用于获取正常核型急性髓系白血病CN-AML患者的目标评估基因,所述目标评估基因为STAB1基因;
分层单元,用于根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组。
本发明实施例提供了一种用于正常核型急性髓系白血病预后分层的方法及装置,所述方法包括:获取正常核型急性髓系白血病CN-AML患者的目标评估基因,所述目标评估基因为STAB1基因;根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组;如此,根据CN-AML患者的目标评估基因把CN-AML患者划分为预后良好组和预后不良组,确定患者的疾病分层,以能辅助临床对预后良好组及预后不良组分别制定精准的治疗方案,进而能对患者进行精准治疗;这里,因目标评估基因只有一个,因此能简单地对CN-AML患者进行预后评估和疾病分层;另外所述目标评估基因为STAB1基因,因STAB1基因为膜蛋白基因,因此能利用现有的检测设备快速检测出,提高了检测效率。
附图说明
图1为本发明实施例一提供的用于正常核型急性髓系白血病预后分层的方法流程示意图;
图2为本发明实施例二提供的用于正常核型急性髓系白血病预后分层的装置结构示意图;
图3为本发明实施例三提供的STAB1基因在TCGA CN-AML预测样本中的KM生存曲线示意图;
图4为本发明实施例三提供的STAB1基因在GSE12417A预测样本中的KM生存曲线示意图;
图5为本发明实施例三提供的STAB1基因在GSE71014预测样本中的KM生存曲线示意图;
图6为本发明实施例三提供的STAB1基因在GSE6891预测样本中的KM生存曲线示意图。
具体实施方式
为了解决现有技术中不能有效、简易地对CN-AML患者进行预后评估和疾病分层,导致不能制定精准分层治疗方案,不能对患者进行精准治疗的技术问题,本发明实施例提供了一种正常核型急性髓系白血病预后分层的方法及装置,所述方法包括:获取CN-AML患者的目标评估基因,所述目标评估基因为STAB1基因;根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组。
下面通过附图及具体实施例对本发明的技术方案做进一步的详细说明。
实施例一
本实施例提供一种用于正常核型急性髓系白血病预后分层的方法,如图1所示,所述方法包括:
S111,获取正常核型急性髓系白血病CN-AML患者的目标评估基因,所述目标评估基因为STAB1基因;
本步骤中,获取正常核型急性髓系白血病CN-AML患者的目标评估基因之前,需要先确定出目标评估基因是哪一个基因,具体的确定方式如下:
从数据库中获取目标样本的基因表达信息,所述目标样本为正常核型急性髓系白血病CN-AML患者的样本;
本步骤中,从癌症基因数据库(TCGA,The Cancer Genome Atlas)下载获取预设数量样本的基因表达信息,预设样本包括:正常核型急性髓系白血病CN-AML患者的和异常核型急性髓系白血病患者的基因表达信息,所述基因表达信息包括:基因表达量。
这里,因在数据中,CN-AML患者的和异常核型急性髓系白血病患者的样本标识是不同的,因此可以根据目标样本的样本标识,从所述预设数量样本中提取目标样本的基因表达信息。所述目标样本为CN-AML患者的基因表达信息。
获取到目标样本后,根据预设的生存时间为分类标准,将所述目标样本分为第一类样本及第二类样本;所述预设的生存时间为临床上CN-AML完全缓解的经验指标,具体为2年。本实施中所述第一类样本为生存时间小于2年的样本,所述第二类样本为生存时间大于2年的样本。
获取到第一类样本及第二类样本后,根据所述第一筛选条件,利用统计建模工具R包的Deseq函数对所述第一类样本中的所有基因及所述第二类样本中的所有基因进行筛选,获取多个所述差异表达基因;其中,所述第一筛选条件为假阳性基因的假阳性率(FDR)<0.05且基因的差异倍数(fold-change)>1.5。
获取到差异表达基因后,根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因。
具体地,获取每个差异表达基因分别在所述目标样本中的生存资料,所述生存资料包括:每个差异表达基因的基因表达量、每个差异表达基因对应样本的生存时间及生存状态;所述生存状态为生或死的状态,生的状态可以以1对应,死的状态可以以0对应。
基于所述每个差异表达基因的生存资料,利用R包中的曲线函数survival对每个差异表达基因进行生存分析,生成各差异表达基因的第一KM生存曲线;
从所述各第一KM生存曲线获取每个差异表达基因的第一显著值;
根据预设的第二筛选条件对每个差异表达基因的第一显著值进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;其中,所述第二筛选条件为P≤0.05;所述P为显著值。
比如,以基因A为例,基因A在每个目标样本中都存在一个基因表达量,确定目标样本中基因A的表达量取的中位数(中值),利用KM中的Log Rank test函数将表达量大于中值的样本及表达量小于中值的样本进行区分,生成表格;表达量大于中值的样本为高表达量样本,表达量小于中值的样本为低表达量样本。
然后根据基因A的生存资料,利用R包survival函数生成基因A的第一KM生存曲线,并从所述基因A的第一KM生存曲线上读取基因A的显著值P值,当基因A的P值≤0.05时,确定基因A为与所述生存时间相关的差异表达基因。
确定出所述生存时间相关的多个预后相关差异表达基因后,根据影响所述CN-AML预后的临床因子及影响急性髓系白血病AML生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取各预后基因。
具体地,首先需要对影响所述CN-AML预后的临床因子进行筛选。
这里还需要从所述数据库中获取影响所述CN-AML预后的临床因子。具体如下:从数据库中获取目标样本的临床信息,利用R包的survival函数,结合目标样本的临床信息,筛选出统计学意义显著的临床因子。当所述临床因子的p≤0.1时,视为该临床因子具有统计学意义,即可以作为影响CN-AML预后的临床因子。本实施例中影响CN-AML预后的临床因子包括:年龄Age、FMS样的酪氨酸激酶3(FLT3)突变、DNA甲基转移酶3A(DNMT3A)突变、异磷酸脱氢酶1(IDH1)突变、异磷酸脱氢酶2(IDH2)突变、RUNT相关转录因子1(RUNX1)突变及线粒体基因B(MTCYB)突变、核磷蛋白(NPM1)突变及威廉姆斯肿瘤抑制因子1(WT1)突变。
然后再结合文献及临床上认定的影响AML生存的经验预后因子,所述影响AML生存的预后因子包括:核磷蛋白(NPM1)突变、异磷酸脱氢酶1(IDH1)突变、异磷酸脱氢酶2(IDH2)突变及威廉姆斯肿瘤抑制因子1(WT1)突变。
最后根据影响所述CN-AML预后的临床因子及影响急性髓系白血病AML生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取每个所述预后相关差异表达基因的第二显著值。
当第二显著值P≤0.05时,则说明该基因为独立于Age、FLT3突变、DNMT3A突变、IDH1突变、RUNX1突变、MT_CYB突变、NPM1突变、IDH2突变及WT1突变的独立预后基因。
获取到独立预后基因后,根据预设的验证样本集分别对每个独立预后基因进行验证,根据验证结果确定一个目标评估基因。所述验证样本集可以从NCBI网站(https://www.ncbi.nlm.nih.gov/)的GEO数据平台获取。
具体地,获取每个独立预后基因分别在所述验证样本集中的各基因表达量,所述验证样本集中包括多个验证样本;获取每个独立预后基因分别在每个验证样本中的生存资料,所述生存资料包括:每个独立预后基因的基因表达量、每个独立预后基因对应样本的生存时间及生存状态;基于所述每个独立预后基因在各验证样本中的生存资料,利用KM统计工具中的曲线函数对每个预后基因进行生存分析,生成各预后基因分别在各所述验证样本中的第二KM生存曲线;从所述各第二KM生存曲线获取每个预后基因在各验证样本中的第三显著值;获取符合所述第二筛选条件的每个独立预后基因各验证样本中的第三显著值的数量,符合第二筛选条件的数量最多的第三显著值对应的独立预后基因为所述目标评估基因;所述目标评估基因为STAB1基因。
比如,独立预后基因包括基因B、C和D;验证样本包括:a、b和c;以基因B为例来说,获取每个基因B分别在各所述验证样本中的各基因表达量,同时获取在各验证样本中的生存资料。
然后根据基因B在各验证样本中的生存资料,利用R包survival函数分别生成基因B的第三KM生存曲线,并从所述基因B在不同验证样本中的第三KM生存曲线上读取基因B在不同验证样本中的P值,再统计符合第二筛选条件的P值数量,所述第二筛选条件为显著值P≤0.05。
然后以同样的方法统计基因C和D在各验证样本中P值,确定符合第二筛选条件的P值数量。
假设基因B在各验证样本中的P值符合第二筛选条件的数量是3,基因C在各验证样本中的P值符合第二筛选条件的数量是2,基因D在各验证样本中的P值符合第二筛选条件的数量是1,那么就确定基因B为目标评估基因。
这里,因目标评估基因为STAB1基因,可以利用流式检测仪快速获取CN-AML患者的目标评估基因,因STAB1基因为膜蛋白基因,因此能利用现有的检测设备快速检测出。
S112,根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组。
当目标评估基因确定出之后,获取CN-AML患者的目标评估基因,根据CN-AML患者的目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组。
这里,还需要先评估目标评估基因预测生存时间的准确度。具体地,确定目标评估基因在各预测样本中的各基因表达量,确定目标评估基因在各预测样本中的基因表达量的中值,将基因表达量大于该中值的样本确定为评估基因高表达样本,将基因表达量小于该中值的基因确定评估基因低表达样本。
以预设的生存时间为标准,再分别统计出各预测样本中评估基因高表达样本的第一数量,及各预测样本中评估基因低表达样本的第二数量;根据所述第一数量及所述第二数量确定所述目标评估基因在各预测样本中的准确率。其中,所述预测样本包括目标样本及验证样本。
比如,目标评估基因为基因B,在确定基因B在目标样本中的准确率时,先将样本根据基因B分为评估基因高表达样本及评估基因低表达样本,统计出评估基因高表达样本的生存时间小于2年的数量为m,统计出评估基因低表达样本的生存时间大于2年的数量为n,那么在计算目标评估基因B在目标样本的准确率为:(m+n)/S;所述S为目标样本的数量。
当确定出准确率后,当准确率为60%以上时,认为该目标评估基因的准确度是可行的。
那么可认为根据所述目标评估基因的基因表达量评估CN-AML患者的预后生存时间准确度较高。
然后就可以根据CN-AML患者的目标评估基因的基因表达量对所述CN-AML患者进行分层。当所述CN-AML患者目标评估基因的基因表达量大于所述中值时,确定所述CN-AML患者的目标评估基因为高表达基因,将所述当前CN-AML患者分为预后不良组;
当所述CN-AML患者目标评估基因的基因表达量小于所述中值时,确定所述CN-AML患者的目标评估基因为低表达基因,将所述当前CN-AML患者分为预后良好组。
根据目标评估基因表达量将CN-AML患者分为预后良好组和预后不良组别后,可以对处于预后不良组的CN-AML患者指示相应的药物信息,以辅助临床指定精准的分层治疗方案。
具体如下:先需要获取对目标药物敏感或耐药的基因,所述目标药物为临床上的经验药物,比如阿糖胞苷;获得对阿糖胞苷敏感或者耐药的基因后,采用R包的皮尔森函数计算STAB1和对阿糖胞苷敏感或者耐药基因的表达量相关性,发现STAB1高表达与对阿糖胞苷耐药基因表达呈正相关性,即可说明STAB1高表达样本(预后不良组)能揭示这部分患者对阿糖胞苷耐药,即说明在STAB1高表达患者群体中需要加大阿糖胞苷剂量或者选择其他治疗方案。
同时分别计算GDSC(Drug Sensitivity in Cancer)和CTRP(CancerTherapeutics Response Portal)数据库中药物拮抗剂的半抑制浓度IC50值与STAB1表达量的皮尔森相关性,获得p值<0.05(即相关性具有统计学意义)的药物,包括IC50值与STAB1表达量呈现正相关性和负相关性的药物。IC50值与STAB1呈正相关性表明,STAB1高表达样本中,对该类药物具有敏感性,即说明STAB1高表达患者(预后不良组)对该类药物敏感,可供临床考虑为候选药物/小分子抑制剂。这里STAB1高表达患者对小分子抑制剂NVP-BHG712、小分子抑制剂GSK-J4、小分子抑制BRD-K30748066和陶扎塞替(Tozasertib)敏感。
这里,CN-AML患者的预后生存时间小于2年时,为STAB1高表达的患者,该类型患者对阿糖胞苷具有抗药性,在STAB1高表达患者中需要提高阿糖胞苷药物剂量或选择其他替代药物。
同时,STAB1高表达患者中,对小分子抑制剂GSK-J4、小分子抑制BRD-K30748066和陶扎塞替(Tozasertib)较为敏感,,预示着可能这几类药物能在STAB1高表达患者中有一定的作用。这样就对STAB1高表达患者指示出相应的药物信息,以辅助临床指定精准的分层治疗方案,避免延误治疗时机。
实施例二
相应于实施例一,本实施例提供一种正常核型急性髓系白血病预后的评估装置,如图2所示,所述装置包括:获取单元21、分层单元22及指示单元23;其中,
获取单元21在获取正常核型急性髓系白血病CN-AML患者的目标评估基因之前,需要先确定出目标评估基因是哪一个基因,具体的确定方式如下:
获取单元21用于从癌症基因数据库TCGA中下载获取预设数量样本的基因表达信息,预设样本包括:正常核型急性髓系白血病CN-AML患者的和异常核型急性髓系白血病患者的基因表达信息,所述基因表达信息包括:基因表达量。
因在数据中,CN-AML患者的和异常核型急性髓系白血病患者的样本标识是不同的,因此可以根据目标样本的样本标识,从所述预设数量样本中提取目标样本的基因表达信息。所述目标样本即为CN-AML患者的基因表达信息。
当获取到目标样本后,分类单元24用于根据预设的生存时间为分类标准,将所述目标样本分为第一类样本及第二类样本;所述预设的生存时间为临床上CN-AML完全缓解的经验指标,具体为2年。本实施中所述第一类样本为生存时间小于2年的样本,所述第二类样本为生存时间大于2年的样本。
获取到第一类样本及第二类样本后,第一筛选单元25用于根据预设的第一筛选条件,利用R包的Deseq函数对所述第一类样本中的所有基因及所述第二类样本中的所有基因进行筛选,获取多个所述差异表达基因;其中,所述第一筛选条件为差异表达基因的假阳性率(FDR)<0.05且差异表达基因的差异倍数(fold-change)>1.5。
获取到差异表达基因后,第二筛选单元26用于根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因。
具体地,获取每个差异表达基因分别在所述目标样本中的生存资料,所述生存资料包括:每个差异表达基因的基因表达量、每个差异表达基因对应样本的生存时间及生存状态;所述生存状态为生或死的状态,生的状态可以以0对应,死的状态可以以1对应。
基于所述每个差异表达基因的生存资料,利用R包中的曲线函数survival对每个差异表达基因进行生存分析,生成各差异表达基因的第一KM生存曲线;
从所述各第一KM生存曲线获取每个差异表达基因的第一显著值;
根据预设的第二筛选条件对每个差异表达基因的第一显著值进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;其中,所述第二筛选条件为P≤0.05;所述P为显著值。
比如,以基因A为例,基因A在每个目标样本中都存在一个基因表达量,确定目标样本中基因A的表达量取的中值(中位数),利用KM中的Log Rank test函数将表达量大于中值的样本及表达量小于中值的样本进行区分,生成表格;表达量大于中值的样本为高表达量样本,表达量小于中值的样本为低表达量样本。
然后根据基因A的生存资料,利用R包survival函数生成基因A的第一KM生存曲线,并从所述基因A的第一KM生存曲线上读取基因A的显著值P值,当基因A的P值≤0.05时,确定基因A为与所述生存时间相关的差异表达基因。
确定出所述生存时间相关的多个预后相关差异表达基因后,分析单元27用于根据影响所述CN-AML预后的临床因子及影响AML生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取各预后基因。
具体地,分析单元27首先需要对影响所述CN-AML预后的临床因子进行筛选。
这里还需要从数据库中获取目标样本的临床信息,利用R包的survival函数,结合目标样本的临床信息,筛选出统计学意义显著的临床因子。当所述临床因子的p≤0.1时,视为该临床因子具有统计学意义,即可以作为影响CN-AML预后的临床因子。本实施例中影响CN-AML预后的临床因子包括:年龄Age、FMS样的酪氨酸激酶3(FLT3)突变、DNA甲基转移酶3A(DNMT3A)突变、异磷酸脱氢酶1(IDH1)突变、异磷酸脱氢酶2(IDH2)突变、RUNT相关转录因子1(RUNX1)突变及线粒体基因B(MTCYB)突变、核磷蛋白(NPM1)突变及威廉姆斯肿瘤抑制因子1(WT1)突变。
然后再结合文献及临床上认定的影响AML生存的预后因子,所述影响AML生存的预后因子包括:核磷蛋白(NPM1)突变、异磷酸脱氢酶1(IDH1)突变、异磷酸脱氢酶2(IDH2)突变及威廉姆斯肿瘤抑制因子1(WT1)突变。
最后分析单元27根据影响所述CN-AML预后的临床因子及影响AML生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取每个所述预后相关差异表达基因的第二显著值。
当第二显著值P≤0.05时,则说明该基因为独立于Age、FLT3突变、DNMT3A突变、IDH1突变、RUNX1突变、MTCYB突变、NPM1突变、IDH2突变及WT1 mutation突变的独立预后基因。
获取到独立预后基因后,验证单元28用于根据预设的验证样本集分别对每个独立预后基因进行验证,根据验证结果确定一个目标评估基因。所述验证样本集可以从NCBI网站(https://www.ncbi.nlm.nih.gov/)的GEO数据平台获取。
具体地,验证单元28获取每个独立预后基因分别在所述验证样本集中的各基因表达量,所述验证样本集中包括多个验证样本;获取每个独立预后基因分别在每个验证样本中的生存资料,所述生存资料包括:每个独立预后基因的基因表达量、每个独立预后基因对应样本的生存时间及生存状态;基于所述每个独立预后基因在各验证样本中的生存资料,利用KM统计工具中的曲线函数对每个预后基因进行生存分析,生成各预后基因分别在各所述验证样本中的第二KM生存曲线;从所述各第二KM生存曲线获取每个预后基因在各验证样本中的第三显著值;获取符合所述第二筛选条件的每个独立预后基因各验证样本中的第三显著值的数量,符合第二筛选条件的数量最多的第三显著值对应的独立预后基因为所述目标评估基因;所述目标评估基因为STAB1基因。
比如,独立预后基因包括基因B、C和D;验证样本包括:a、b和c;以基因B为例来说,验证单元28获取每个基因B分别在各所述验证样本中的各基因表达量,同时获取在各验证样本中的生存资料。
然后根据基因B在各验证样本中的生存资料,利用R包survival函数分别生成基因B的第三KM生存曲线,并从所述基因B在不同验证样本中的第三KM生存曲线上读取基因B在不同验证样本中的P值,再统计符合第二筛选条件的P值数量,所述第二筛选条件为显著值P≤0.05。
然后以同样的方法统计基因C和D在各验证样本中P值,确定符合第二筛选条件的P值数量。
假设基因B在各验证样本中的P值符合第二筛选条件的数量是3,基因C在各验证样本中的P值符合第二筛选条件的数量是2,基因D在各验证样本中的P值符合第二筛选条件的数量是1,那么就确定基因B为目标评估基因。
当确定目标评估基因后,分层单元22用于根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组。
这里,评估单元29还需要先评估目标评估基因预测生存时间的准确度。具体地,确定目标评估基因在各预测样本中的各基因表达量,确定目标评估基因在各预测样本中的基因表达量的中值,将基因表达量大于该中值的样本确定为评估基因高表达样本,将基因表达量小于该中值的基因确定评估基因低表达样本。
以预设的生存时间为标准,再分别统计出各预测样本中评估基因高表达样本的第一数量,及各预测样本中评估基因低表达样本的第二数量;根据所述第一数量及所述第二数量确定所述目标评估基因在各预测样本中的准确率。其中,所述预测样本包括目标样本及验证样本。
比如,目标评估基因为基因B,在确定基因B在目标样本中的准确率时,先将样本根据基因B分为评估基因高表达样本及评估基因低表达样本,统计出评估基因高表达样本的生存时间小于2年的数量为m,统计出评估基因低表达样本的生存时间大于2年的数量为n,那么在计算目标评估基因B在目标样本的准确率为:(m+n)/S;所述S为目标样本的数量。
当评估单元29确定出准确率后,当准确率为60%以上时,认为该目标评估基因的准确度是可行的。
那么可认为根据所述目标评估基因的基因表达量评估CN-AML患者的预后生存时间准确度较高。
然后分层单元22就可以根据CN-AML患者的目标评估基因的基因表达量对所述CN-AML患者进行分层。当所述CN-AML患者目标评估基因的基因表达量大于所述中值时,确定所述CN-AML患者的目标评估基因为高表达基因,将所述当前CN-AML患者分为预后不良组;
当所述CN-AML患者目标评估基因的基因表达量小于所述中值时,确定所述CN-AML患者的目标评估基因为低表达基因,将所述当前CN-AML患者分为预后良好组。
分层单元22确定出CN-AML患者的分组后,指示单元23可以对处于预后不良组的CN-AML患者指示相应的药物信息,以辅助临床指定精准的分层治疗方案,避免延误治疗时机。
具体如下:先需要获取对目标药物敏感或耐药的基因,所述目标药物为临床上的经验药物,比如阿糖胞苷;获得对阿糖胞苷敏感或者耐药的基因后,采用R包的皮尔森函数计算STAB1和对阿糖胞苷敏感或者耐药基因的表达量相关性,发现STAB1高表达与对阿糖胞苷耐药基因表达呈正相关性,即可说明STAB1高表达样本(预后不良组)能揭示这部分患者对阿糖胞苷耐药,即说明在STAB1高表达患者群体中需要加大阿糖胞苷剂量或者选择其他治疗方案。
同时分别计算GDSC(Drug Sensitivity in Cancer)和CTRP(CancerTherapeutics Response Portal)数据库中药物拮抗剂的半抑制浓度IC50值与STAB1表达量的皮尔森相关性,获得p值<0.05(即相关性具有统计学意义)的药物,包括IC50值与STAB1表达量呈现正相关性和负相关性的药物。IC50值与STAB1呈正相关性表明,STAB1高表达样本中,对该类药物具有敏感性,即说明STAB1高表达患者(预后不良组)对该类药物敏感,可供临床考虑为候选药物/小分子抑制剂。这里STAB1高表达患者对小分子抑制剂NVP-BHG712、小分子抑制剂GSK-J4、小分子抑制BRD-K30748066和陶扎塞替(Tozasertib)敏感。
这里,CN-AML患者的预后生存时间小于2年时,为STAB1高表达的患者,该类型患者对阿糖胞苷具有抗药性,在STAB1高表达患者中需要提高阿糖胞苷药物剂量或选择其他替代药物。
同时,STAB1高表达患者中,对小分子抑制剂GSK-J4、小分子抑制BRD-K30748066和陶扎塞替(Tozasertib)较为敏感,预示着可能这几类药物能在STAB1高表达患者中有一定的作用。这样就对STAB1高表达患者指示出相应的药物信息,以辅助临床指定精准的分层治疗方案,避免延误治疗时机。
实施例三
实际应用中,可以根据上述方法及装置确定CN-AML的目标评估基因,并利用该基因对CN-AML进行预后分层,指示相应的药物信息,具体如下:
首先从TCGA数据库中下载200例样本的基因表达信息及临床信息,然后根据CN-AML样本的样本标识,从所述预设数量样本中提取CN-AML样本的基因表达信息。所述CN-AML样本的数量为79例。
根据预设的生存时间为分类标准,将所述CN-AML样本分为第一类样本及第二类样本;所述预设的生存时间为临床上CN-AML完全缓解的经验指标,具体为2年。本实施中所述第一类样本为生存时间小于2年的CN-AML样本,所述第二类样本为生存时间大于2年的CN-AML样本。
获取到第一类样本及第二类样本后,用R包的Deseq函数对所述第一类样本中的所有基因及所述第二类样本中的所有基因进行筛选,获取多个所述差异表达基因;其中,所述第一筛选条件为差异表达基因的假阳性率(FDR)<0.05且基因的差异倍数(fold-change)>1.5。这里,所述差异表达基因的数量为353。
获取到差异表达基因后,利用R包survival对每个差异表达基因进行生存分析,生成各差异表达基因的第一KM生存曲线;基于第一KM生存曲线获取每个差异表达基因的第一显著值,筛选出显著值P≤0.05的与所述生存时间相关预后相关差异表达基因,所述预后相关差异表达基因的数量为15个。
然后根据影响所述CN-AML预后的临床因子及影响急性髓系白血病AML生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取各独立预后基因,所述独立预后基因为6个。
本实施例中影响CN-AML预后的临床因子包括:年龄Age、FMS样的酪氨酸激酶3(FLT3)突变、DNA甲基转移酶3A(DNMT3A)突变、异磷酸脱氢酶1(IDH1)突变、异磷酸脱氢酶2(IDH2)突变、RUNT相关转录因子1(RUNX1)突变及线粒体基因B(MTCYB)突变、核磷蛋白(NPM1)突变及威廉姆斯肿瘤抑制因子1(WT1)突变。
所述影响AML生存的预后因子包括:核磷蛋白(NPM1)突变、异磷酸脱氢酶1(IDH1)突变、异磷酸脱氢酶2(IDH2)突变及威廉姆斯肿瘤抑制因子1(WT1)突变。
获取到独立预后基因后,根据预设的基因芯片验证样本集分别对每个独立预后基因进行验证,根据验证结果确定一个目标评估基因。所述验证样本集可以从GEO平台获取。所述验证样本集包括四组,各验证样本的样本数量分别为:79、163、104和187。
获取每个独立预后基因在各验证样本中的显著值P,确定符合第二筛选条件的P值数量;所述第二筛选条件为显著值P≤0.05。符合第二筛选条件的P值数量最多的独立预后基因即为目标评估基因。本实施例中的目标评估基因为STAB1。
然后利用预测样本集来确定STAB1的准确率,具体地,确定STAB1在各预测样本中的各基因表达量,确定STAB1在各预测样本中的基因表达量的中值,将基因表达量大于该中值的基因确定为高表达评估基因,将基因表达量大于该中值的基因确定为低表达基因。
以预设的生存时间为标准,再分别统计出高表达评估基因在各预测样本中的第一数量,及低表达评估基因在各预测样本中的第二数量;根据所述第一数量及所述第二数量确定所述STAB1在各预测样本中的准确率。其中,所述预测样本包括目标样本及验证样本。其中,STAB1在各预测样本中的准确率如表1所示:
表1
在表1中,TCGA CN-AML(79)为目标样本,其余四组为预测样本,以目标样本为例,在计算STAB1在目标样本中的准确率时,具体为:(35+22)/79=0.72。
然后再利用同样的方法计算STAB1在其他验证样本中的准确率,由表1可以看出,STAB1在预测样本中的准确率为60%以上,证明STAB1的准确度是可行的。
进一步地,还可根据STAB1在各预测样本中的KM生存曲线来预测STAB1的可行性,STAB1基因在TCGA CN-AML样本KM生存曲线如图3所示,STAB1基因在GSE12417A(79)样本KM生存曲线如图4所示,STAB1基因在GSE71014(104)样本KM生存曲线如图5所示,STAB1基因在GSE6891(187)样本KM生存曲线如图6所示。其中,在图3、图4、图5及图6中,上方的曲线代表的是低表达STAB1对应的KM生存曲线,下方的曲线代表的是高表达STAB1对应的KM生存曲线,对应的n分别代表的是低表达样本的数量及高表达样本的数量。
需要说明的是,图3、图4、图5及图6是根据STAB1的中值来确定低表达样本的数量及高表达样本的数量。而表1中同样以STAB1的中值来确定STAB1高表达组和STAB1低表达组,但是统计的是STAB1低表达样本中生存时间大于2年的样本数量以及STAB1高表达样本中生存时间小于2年的样本数量,因此数量会出现不一致的情况。
由图3、图4、图5及图6可以看出,在四个预测样本中,STAB1基因的P值均小于0.05,也进一步说明STAB1基因的准确度是可行的。
然后就可以根据CN-AML患者的目标评估基因的基因表达量对所述CN-AML患者进行分层。当所述CN-AML患者目标评估基因的基因表达量大于所述中值时,确定所述CN-AML患者的目标评估基因为高表达基因,将所述当前CN-AML患者分为预后不良组;预后不良组CN-AML患者的预后生存时间小于2年;
当所述CN-AML患者目标评估基因的基因表达量小于所述中值时,确定所述CN-AML患者的目标评估基因为低表达基因,将所述当前CN-AML患者分为预后良好组;预后良好组CN-AML患者的预后生存时间大于2年。
根据目标评估基因表达量将CN-AML患者分为预后良好组和预后不良组别后,可以对处于预后不良组的CN-AML患者指示相应的药物信息,以辅助临床指定精准的分层治疗方案,避免延误治疗时机。
具体如下:先需要获取对目标药物敏感或耐药的基因,所述目标药物为临床上的经验药物,比如阿糖胞苷;获得对阿糖胞苷敏感或者耐药的基因后,采用R包的皮尔森函数计算STAB1和对阿糖胞苷敏感或者耐药基因的表达量相关性,发现STAB1高表达与对阿糖胞苷耐药基因表达呈正相关性,即可说明STAB1高表达样本(预后不良组)能揭示这部分患者对阿糖胞苷耐药,即说明在STAB1高表达患者群体中需要加大阿糖胞苷剂量或者选择其他治疗方案。
同时分别计算GDSC(Drug Sensitivity in Cancer)和CTRP(CancerTherapeutics Response Portal)数据库中药物拮抗剂的半抑制浓度IC50值与STAB1表达量的皮尔森相关性,获得p值<0.05(即相关性具有统计学意义)的药物,包括IC50值与STAB1表达量呈现正相关性和负相关性的药物。IC50值与STAB1呈正相关性表明,STAB1高表达样本中,对该类药物具有敏感性,即说明STAB1高表达患者(预后不良组)对该类药物敏感,可供临床考虑为候选药物/小分子抑制剂。这里STAB1高表达患者对小分子抑制剂NVP-BHG712、小分子抑制剂GSK-J4、小分子抑制BRD-K30748066和陶扎塞替(Tozasertib)敏感。
综上,CN-AML患者的预后生存时间小于2年时,为STAB1高表达的患者,该类型患者对阿糖胞苷具有抗药性,在STAB1高表达患者中需要提高阿糖胞苷药物剂量或选择其他替代药物。
同时,STAB1高表达患者中,对小分子抑制剂NVP-BHG712、GSK-J4,BRD-K30748066和陶扎塞替(Tozasertib)较为敏感,预示着可能这几类药物能在STAB1高表达患者中有一定的作用。这样就对STAB1高表达患者指示出相应的药物信息,以辅助临床指定精准的分层治疗方案,以能对患者进行精准治疗,避免延误治疗时机。
本发明实施例提供的正常核型急性髓系白血病预后的评估装置能带来的有益效果至少是:
本发明实施例提供了一种用于正常核型急性髓系白血病预后分层的方法及装置,所述方法包括:获取正常核型急性髓系白血病CN-AML患者的目标评估基因,所述目标评估基因为STAB1基因;根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组;如此,根据筛选出目标样本中的差异表达基因,再对差异表达基因进行筛选,获取与生存时间相关的多个预后相关差异表达基因,再结合临床信息筛选出多个预后基因,然后利用验证样本集中的多组样本数据分别对每个预后基因进行验证,确定出一个目标评估基因,根据CN-AML患者的目标评估基因把CN-AML患者划分为预后良好组和预后不良组,确定患者的疾病分层;然后还可以对预后不良组的CN-AML患者指示相应的药物信息,以辅助临床制定精准分层的治疗方案,能对患者进行精准治疗,避免延误治疗时机;这里,因确定的目标评估基因只有一个,因此能简单地对CN-AML患者进行预后评估和疾病分层;另外所述目标评估基因为STAB1基因,因STAB1基因为膜蛋白基因,因此能利用现有的RT-PCR或流式细胞仪易于快速检测出,提高了检测效率,进一步提高了预后分层过程的简便性。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网关、代理服务器、系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于正常核型急性髓系白血病预后分层的方法,其特征在于,所述方法包括:
获取正常核型急性髓系白血病CN-AML患者的目标评估基因,所述目标评估基因为STAB1基因;
根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组。
2.如权利要求1所述的方法,其特征在于,所述根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者的预后生存时间进行分层,包括:
获取所述目标评估基因在目标样本中的各基因表达量;
确定各基因表达量的中位数;
当所述CN-AML患者目标评估基因的基因表达量大于所述中值时,确定所述CN-AML患者的目标评估基因为高表达基因,将所述当前CN-AML患者分为预后不良组;
当所述CN-AML患者目标评估基因的基因表达量小于所述中值时,确定所述CN-AML患者的目标评估基因为低表达基因,将所述当前CN-AML患者分为预后良好组。
3.如权利要求1所述的方法,其特征在于,所述根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组后,包括:
对处于预后不良组的CN-AML患者指示相应的药物信息。
4.如权利要求3所述的方法,其特征在于,所述对处于预后不良组的CN-AML患者指示相应的药物信息,包括:
获取对目标药物敏感或耐药的基因以及癌症药物数据库中多个药物的拮抗剂的半抑制浓度IC50值,所述目标药物为临床上的经验药物;
利用皮尔森函数确定所述STAB1基因的表达量与所述对药物敏感或者耐药的基因表达量之间的相关性,若所述STAB1基因的表达量与所述对药物敏感或者耐药的基因表达量之间的相关性为正相关,则将所述目标药物作为处于预后不良组的CN-AML患者的指示药物;
利用所述皮尔森函数确定癌症药物数据库中的药物拮抗剂的半抑制浓度IC50值与所述STAB1基因表达量的相关性,若所述IC50值与所述STAB1基因表达量的呈正相关性,则将所述药物作为处于预后不良组的CN-AML患者的指示药物。
5.如权利要求3所述的方法,其特征在于,所述对处于预后不良组的CN-AML患者指示相应的药物信息,包括:
对处于预后不良组的CN-AML患者指示阿糖胞苷药物、小分子抑制剂NVP-BHG712、小分子抑制剂GSK-J4、小分子抑制剂BRD-K30748066和陶扎塞替Tozasertib药物信息。
6.如权利要求1所述的方法,其特征在于,所述方法包括:
从数据库中获取目标样本的基因表达信息,所述目标样本为正常核型急性髓系白血病CN-AML患者的样本;
根据预设的生存时间为分类标准,将所述目标样本分为第一类样本及第二类样本,所述第一类样本为生存时间小于2年的样本,所述第二类样本为生存时间大于2年的样本;
根据预设的第一筛选条件对所述第一类样本及所述第二类样本的基因进行筛选,获取多个差异表达基因;
根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;
从所述数据库中获取影响所述CN-AML预后的临床因子,根据影响所述CN-AML预后的临床因子及影响急性髓系白血病AML生存的经验预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取各独立预后基因;
根据预设的验证样本集分别对每个独立预后基因进行验证,根据验证结果确定出所述目标评估基因。
7.如权利要求6所述的方法,其特征在于,所述根据预设的第一筛选条件对所述第一类样本及所述第二类样本的基因进行筛选,获取多个差异表达基因,包括:
根据所述第一筛选条件对所述第一类样本中的所有基因及所述第二类样本中的所有基因进行筛选,获取多个所述差异表达基因;其中,所述第一筛选条件为假阳性基因的假阳性率FDR<0.05且基因的差异倍数fold-change>1.5。
8.如权利要求6所述的方法,其特征在于,所述根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因,包括:
获取每个差异表达基因分别在所述目标样本中的生存资料,所述生存资料包括:每个差异表达基因的基因表达量、每个差异表达基因对应样本的生存时间及生存状态;
基于所述每个差异表达基因的生存资料,利用KM统计工具中的曲线函数对每个差异表达基因进行生存分析,生成各差异表达基因的第一KM生存曲线;
从所述各第一KM生存曲线获取每个差异表达基因的第一显著值;
根据预设的第二筛选条件对每个差异表达基因的第一显著值进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;其中,所述第二筛选条件为P≤0.05;所述P为显著值。
9.如权利要求6所述的方法,其特征在于,所述根据影响所述CN-AML预后的临床因子及影响AML生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取各独立预后基因,包括:
根据影响所述CN-AML预后的临床因子及影响所述AML生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险Cox回归分析,获取每个所述预后相关差异表达基因的第二显著值;
根据预设的第二筛选条件对所述各所述预后相关差异表达基因的第二显著值进行筛选,获取各独立预后基因;其中,所述第二筛选条件为P≤0.05;所述P为显著值;
所述影响所述CN-AML预后的临床因子包括:年龄Age、FMS样的酪氨酸激酶3(FLT3)突变、DNA甲基转移酶3A(DNMT3A)突变、异磷酸脱氢酶1(IDH1)突变、异磷酸脱氢酶2(IDH2)突变、RUNT相关转录因子1(RUNX1)突变及线粒体基因B(MTCYB)突变、核磷蛋白(NPM1)突变及威廉姆斯肿瘤抑制因子1(WT1)突变;
所述影响AML生存的经验预后因子包括:NPM1突变、IDH1突变、IDH2突变及WT1突变。
10.一种用于正常核型急性髓系白血病预后分层的装置,其特征在于,所述装置包括:
获取单元,用于获取正常核型急性髓系白血病CN-AML患者的目标评估基因,所述目标评估基因为STAB1基因;
分层单元,用于根据CN-AML患者目标评估基因的基因表达量对所述CN-AML患者进行分层,将所述CN-AML患者分为预后良好组及预后不良组。
CN201810048986.8A 2018-01-17 2018-01-17 一种用于正常核型急性髓系白血病预后分层的方法及装置 Pending CN108277278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810048986.8A CN108277278A (zh) 2018-01-17 2018-01-17 一种用于正常核型急性髓系白血病预后分层的方法及装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810045606.5A CN107974506A (zh) 2018-01-17 2018-01-17 一种用于急性髓系白血病药物指示的方法及装置
CN201810048986.8A CN108277278A (zh) 2018-01-17 2018-01-17 一种用于正常核型急性髓系白血病预后分层的方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201810045606.5A Division CN107974506A (zh) 2018-01-17 2018-01-17 一种用于急性髓系白血病药物指示的方法及装置

Publications (1)

Publication Number Publication Date
CN108277278A true CN108277278A (zh) 2018-07-13

Family

ID=62005994

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201810045606.5A Pending CN107974506A (zh) 2018-01-17 2018-01-17 一种用于急性髓系白血病药物指示的方法及装置
CN201810048989.1A Pending CN108130372A (zh) 2018-01-17 2018-01-17 一种用于急性髓系白血病药物指示的方法及装置
CN201810048986.8A Pending CN108277278A (zh) 2018-01-17 2018-01-17 一种用于正常核型急性髓系白血病预后分层的方法及装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN201810045606.5A Pending CN107974506A (zh) 2018-01-17 2018-01-17 一种用于急性髓系白血病药物指示的方法及装置
CN201810048989.1A Pending CN108130372A (zh) 2018-01-17 2018-01-17 一种用于急性髓系白血病药物指示的方法及装置

Country Status (1)

Country Link
CN (3) CN107974506A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112708675A (zh) * 2020-12-25 2021-04-27 中山大学肿瘤防治中心 骨髓nk细胞联合mcl1抑制剂在抗白血病中的应用
CN113345592A (zh) * 2021-06-18 2021-09-03 山东第一医科大学附属省立医院(山东省立医院) 一种急性髓细胞样白血病预后风险模型的构建及诊断设备

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108676885A (zh) * 2018-06-26 2018-10-19 华中科技大学鄂州工业技术研究院 早期肾癌诊断标记物
JP7059162B2 (ja) 2018-10-29 2022-04-25 株式会社日立製作所 分析装置、分析方法、および分析プログラム
CN110656172A (zh) * 2019-01-14 2020-01-07 南方医科大学珠江医院 一种预测小细胞肺癌对ep化疗方案敏感性的分子标志物及试剂盒
CN110229902A (zh) * 2019-06-24 2019-09-13 至本医疗科技(上海)有限公司 用于胃癌预后预测的评估基因群的确定方法
CN110942808A (zh) * 2019-12-10 2020-03-31 山东大学 一种基于基因大数据的预后预测方法及预测系统
CN114093524A (zh) * 2021-11-02 2022-02-25 深圳市儿童医院 一种儿童抗菌药物使用评估系统、计算机可读存储介质及终端

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006048263A3 (en) * 2004-11-04 2007-04-12 Roche Diagnostics Gmbh Gene expression profiling in acute promyelocytic leukemia
CN105046094A (zh) * 2015-08-26 2015-11-11 深圳谱元科技有限公司 肠道菌群的检测系统及其方法和动态式数据库

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006048263A3 (en) * 2004-11-04 2007-04-12 Roche Diagnostics Gmbh Gene expression profiling in acute promyelocytic leukemia
CN105046094A (zh) * 2015-08-26 2015-11-11 深圳谱元科技有限公司 肠道菌群的检测系统及其方法和动态式数据库

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MING-KAI CHUANG等: ""An mRNA expression signature for prognostication in de novo acute myeloid leukemia patients with normal karyotype", 《ONCOTARGET》 *
郭安源等: ""基于新一代高通量技术的个性化医疗研究进展"", 《重庆医学》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112708675A (zh) * 2020-12-25 2021-04-27 中山大学肿瘤防治中心 骨髓nk细胞联合mcl1抑制剂在抗白血病中的应用
CN113345592A (zh) * 2021-06-18 2021-09-03 山东第一医科大学附属省立医院(山东省立医院) 一种急性髓细胞样白血病预后风险模型的构建及诊断设备
CN113345592B (zh) * 2021-06-18 2022-08-23 山东第一医科大学附属省立医院(山东省立医院) 一种急性髓细胞样白血病预后风险模型的构建及诊断设备

Also Published As

Publication number Publication date
CN107974506A (zh) 2018-05-01
CN108130372A (zh) 2018-06-08

Similar Documents

Publication Publication Date Title
CN108277278A (zh) 一种用于正常核型急性髓系白血病预后分层的方法及装置
de Rezende et al. Physical activity and cancer: an umbrella review of the literature including 22 major anatomical sites and 770 000 cancer cases
Singh et al. Use of biomarkers for assessing radiation injury and efficacy of countermeasures
Aschard et al. Inclusion of gene-gene and gene-environment interactions unlikely to dramatically improve risk prediction for complex diseases
Kornblau et al. Dynamic single-cell network profiles in acute myelogenous leukemia are associated with patient response to standard induction therapy
CN111676288B (zh) 用于预测肺腺癌患者预后的系统及其应用
CN107423578A (zh) 检测体细胞突变的装置
Fenech Current status, new frontiers and challenges in radiation biodosimetry using cytogenetic, transcriptomic and proteomic technologies
Wu et al. Meta-analysis of QTL mapping experiments
Wang et al. A prognostic nomogram for lung adenocarcinoma based on immune-infiltrating Treg-related genes: from bench to bedside
Mehmood et al. Ranking breast cancer drugs and biomarkers identification using machine learning and pharmacogenomics
Moon et al. Effects of temperature, weather, seasons, atmosphere, and climate on the exacerbation of inflammatory bowel diseases: A systematic review and meta-analysis
Men et al. A prognostic 11 genes expression model for ovarian cancer
Wei et al. Screening and identification of potential biomarkers for hepatocellular carcinoma: an analysis of TCGA database and clinical validation
Chen et al. Comprehensive analysis: Necroptosis-related lncRNAs can effectively predict the prognosis of glioma patients
Zhou et al. Blood cell counts can predict adverse events of immune checkpoint inhibitors: a systematic review and meta-analysis
CN107850526A (zh) 评估细胞乳腺样品的方法和用于实践所述方法的组合物
Hong et al. A simple way to detect disease-associated cellular molecular alterations from mixed-cell blood samples
Lourenção et al. Cost-effectiveness of BRCA 1/2 genetic test and preventive strategies: using real-world data from an upper-middle income country
Luo et al. An updated meta-analysis of 37 case-control studies on the association between NFKB1− 94ins/del ATTG promoter polymorphism and cancer susceptibility
CN108913773A (zh) 一种临床评价卵巢癌铂类药物化疗敏感性的多分子标志物及其装置与评价方法
Lin et al. Association between HTR2A T102C polymorphism and major depressive disorder: a meta-analysis in the Chinese population
Bensimon Etzol et al. DosiKit, a new portable immunoassay for fast external irradiation biodosimetry
Yan et al. Construction and Validation of a Newly Prognostic Signature for CRISPR‐Cas9‐Based Cancer Dependency Map Genes in Breast Cancer
Nongrum et al. Identification and preliminary validation of radiation response protein (s) in human blood for a high-throughput molecular biodosimetry technology for the future

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180713

RJ01 Rejection of invention patent application after publication