CN113782087B - 一种慢性淋巴细胞白血病sscr风险模型及其建立方法和应用 - Google Patents

一种慢性淋巴细胞白血病sscr风险模型及其建立方法和应用 Download PDF

Info

Publication number
CN113782087B
CN113782087B CN202111324679.6A CN202111324679A CN113782087B CN 113782087 B CN113782087 B CN 113782087B CN 202111324679 A CN202111324679 A CN 202111324679A CN 113782087 B CN113782087 B CN 113782087B
Authority
CN
China
Prior art keywords
cll
lymphocytic leukemia
chronic lymphocytic
sscr
cell differentiation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111324679.6A
Other languages
English (en)
Other versions
CN113782087A (zh
Inventor
张娅
王欣
田筝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Provincial Hospital Affiliated to Shandong First Medical University
Original Assignee
Shandong Provincial Hospital Affiliated to Shandong First Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Provincial Hospital Affiliated to Shandong First Medical University filed Critical Shandong Provincial Hospital Affiliated to Shandong First Medical University
Priority to CN202111324679.6A priority Critical patent/CN113782087B/zh
Publication of CN113782087A publication Critical patent/CN113782087A/zh
Application granted granted Critical
Publication of CN113782087B publication Critical patent/CN113782087B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Primary Health Care (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioethics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Oncology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Microbiology (AREA)
  • Artificial Intelligence (AREA)
  • Hospice & Palliative Care (AREA)
  • Evolutionary Computation (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)

Abstract

本发明提供一种慢性淋巴细胞白血病SSCR风险模型及其建立方法和应用,属于疾病预后和分子生物学技术领域。本发明采用高通量测序的慢性淋巴细胞白血病(CLL)表达谱,进一步证实CLL的异质性,验证基于CLL细胞分化的CLL患者分类,预测患者预后。本发明将CLL细胞按分化状态分为两组,并对CLL细胞分化相关基因进行鉴定。最后,选择4个最具预后意义的CLL细胞分化相关基因,建立基于CLL细胞分化相关基因的SSCR风险评分模型,经验证该风险评分模型对CLL患者总生存期及首次治疗时间预测具有良好的可靠性。该评分系统可以帮助医生根据CLL细胞分化状况预测患者的预后,选择最佳的治疗方案,具有良好的实际应用价值。

Description

一种慢性淋巴细胞白血病SSCR风险模型及其建立方法和应用
技术领域
本发明属于疾病预后和分子生物学技术领域,具体涉及一种慢性淋巴细胞白血病SSCR风险模型及其建立方法和应用。
背景技术
公开该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
慢性淋巴细胞白血病(CLL)是一种恶性淋巴系统肿瘤,临床过程和生物学行为呈高度异质性。大多数患者经历惰性病程,而一些患者经历侵袭性病程,并需要早期给药。研究人员已经确定了一些预后生物标志物和评分系统,以指导CLL患者的临床管理。IGHV突变状态、染色体畸变和基因突变被证明是有效的预后生物标志物。然而,现有的风险模型难以精准判断患者预后情况。随着新型测序技术的发展,基于CLL患者基因组改变的生物标志物在CLL预后评估中的作用及应用仍有待进一步研究。
近年来,测序技术的进步,包括批量RNA测序和单细胞RNA测序技术的不断进展,使得识别CLL的新驱动因素成为可能。肿瘤内CLL的异质性促进了CLL的克隆进化,从而导致对治疗的耐药性。CLL谱系树显示,CLL细胞从正常B细胞转化后基因表达情况具有快速变化的特点。
单细胞转录组学分析为描述CLL基因状态的改变提供了机会。通过根据伪时序对CLL细胞进行排序,研究者可以揭示癌症进化的生物学过程。Monocle是一种用于R的软件包,它被用于单细胞RNA测序的伪时序分析,即根据生物过程的进展对单细胞进行排序。因此,将单细胞RNA测序与轨迹分析相结合,有望帮助研究者识别处于不同分化状态的肿瘤细胞,完善对患者的分类方法,进而改善患者的治疗及预后。
发明内容
本发明提供一种慢性淋巴细胞白血病SSCR风险模型及其建立方法和应用。本发明采用高通量测序的CLL基因表达谱,进一步证实CLL的异质性,验证基于CLL细胞分化状态的CLL患者分群,以细化患者危险度分层。本发明将CLL细胞按分化状态分为两组,并鉴定了与CLL细胞分化状态相关的CLL细胞分化相关基因。然后,对CLL细胞分化相关基因的特性进行了探讨。最后,选择4个最具预后意义的CLL细胞分化相关基因,建立基于CLL细胞分化相关基因的SSCR风险评分模型,揭示并验证了SSCR风险评分模型的预后价值。
具体的,本发明涉及以下技术方案:
本发明的第一个方面,提供一种用于慢性淋巴细胞白血病预后评估的标志物,所述标志物包括选自下列基因中的任意一种或多种:SORL1、SGK1、CYBB和RPL22L1。
其中,所述预后评估具体包括对慢性淋巴细胞白血病患者总生存期(OS)和首次治疗时间(TTFT)的评估。
本发明的第二个方面,提供检测上述标志物的表达水平的试剂在制备产品中的应用,所述产品用于慢性淋巴细胞白血病预后评估。
本发明的第三个方面,提供一种慢性淋巴细胞白血病SSCR风险模型(SSCR),所述慢性淋巴细胞白血病SSCR风险模型,其具体为基因表达量(SORL1)×(-1.378)+基因表达量(SGK1)×(-0.8055)+基因表达量(CYBB)×1.094+基因表达量(RPL22L1)×2.251。
本发明的第四个方面,提供上述慢性淋巴细胞白血病SSCR风险模型的建立方法,所述建立方法包括:
S1、数据采集:采集人类CLL样本的单细胞RNA测序数据和批量RNA测序数据;
S2、单细胞测序数据处理:采用Seurat包和Monocle包对步骤S1获得的CLL细胞相关数据进行处理;
S3、轨迹分析:选择用于聚类判定的标记基因,根据拟时序对细胞进行排序,并用轨迹描述CLL细胞所经历的生物过程;对位于不同细胞轨迹分支的细胞的基因表达情况进行分析,鉴定分支依赖性表达的基因即CLL细胞分化相关基因;
S4、构建慢性淋巴细胞白血病SSCR风险模型:将上述CLL细胞分化相关基因进行回归分析,并构建慢性淋巴细胞白血病SSCR风险模型。
本发明的第五个方面,提供上述慢性淋巴细胞白血病SSCR风险模型在慢性淋巴细胞白血病预后评估系统中的应用。
本发明的第六个方面,提供一种慢性淋巴细胞白血病预后评估系统,所述系统包括:
i)分析单元,所述分析单元包含:用于确定受试者的待测样品中选自CLL细胞分化相关基因表达水平的检测物质,以及;
ii)评估单元,所述评估单元包含:根据i)中确定的所述CLL细胞分化相关基因表达水平对所述受试者进行预后评估;
其中,所述步骤i)分析单元中,所述CLL细胞分化相关基因选自下列基因中的任意一种或多种:SORL1、SGK1、CYBB和RPL22L1。
所述步骤ii)评估单元具体评估流程包括:根据i)中确定的所述CLL细胞分化相关基因表达水平,基于慢性淋巴细胞白血病SSCR风险模型进行预后评估;
其中,所述SSCR,其计算公式=基因表达量(SORL1)×(-1.378)+ 基因表达量(SGK1)×(-0.8055)+基因表达量(CYBB)×1.094+基因表达量(RPL22L1)×2.251。
本发明的第七个方面,提供一种慢性淋巴细胞白血病预后风险评估方法,所述方法包括使用上述标志物、上述慢性淋巴细胞白血病SSCR风险模型和上述系统进行评估;
所述预后风险评估包括对受试者的总生存期和首次治疗时间进行预测评估。
以上一个或多个技术方案的有益技术效果:
上述技术方案首次基于CLL细胞分化相关基因构建慢性淋巴细胞白血病SSCR风险模型,从而对CLL患者进行风险评估。经验证该风险评分模型对CLL患者总生存期(OS)及首次治疗时间(TTFT)预测具有良好的可靠性。该评分系统可以帮助医生根据CLL细胞分化状况预测患者的预后,选择最佳的治疗方案,因此具有良好的实际应用之价值。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1 是本发明实施例单细胞测序数据中CLL细胞中检测到的基因数量。
图2是本发明实施例单细胞测序数据中前10位高变基因在每个样本中的表达情况。
图3是本发明实施例单细胞测序数据中CLL细胞分群情况。
图4是本发明实施例单细胞测序数据中4个细胞群中的主要标志基因。
图5是本发明实施例轨迹分析结果中展示细胞分化状态的树形结构轨迹图。
图6是本发明实施例中RPL22L1在山东省立医院CLL患者及健康志愿者中的表达情况。
图7是本发明实施例中SGK1在山东省立医院CLL患者及健康志愿者中的表达情况。
图8是本发明实施例中SORL1在山东省立医院CLL患者及健康志愿者中的表达情况。
图9是本发明实施例中CYBB在山东省立医院CLL患者及健康志愿者中的表达情况。
图10是本发明实施例中SORL1、SGK1、CYBB和RPL22L1共4个基因在GSE22762数据集中的患者中的表达情况(OS)。
图11是本发明实施例中SORL1、SGK1、CYBB和RPL22L1共4个基因在山东省立医院数据集中的患者中的表达情况。
图12是本发明实施例中SORL1、SGK1、CYBB和RPL22L1共4个基因在GSE2276数据集中的患者中的表达情况(TTFT)。
图13是本发明实施例中SORL1、SGK1、CYBB和RPL22L1共4个基因在GSE39671数据集中的患者中的表达情况。
图14是本发明实施例中通过K-M曲线分析SSCR风险模型与GSE22762数据集中的患者OS的关系。
图15是本发明实施例中通过K-M曲线分析SSCR风险模型与山东省立医院数据集中的患者OS的关系。
图16是本发明实施例中通过K-M曲线分析SSCR风险模型与GSE22762数据集中的患者TTFT的关系。
图17是本发明实施例中通过K-M曲线分析SSCR风险模型与GSE39671数据集中的患者TTFT的关系。
图18是本发明实施例中通过ROC曲线分析SSCR风险模型与GSE22762数据集中的患者OS的关系。
图19是本发明实施例中通过ROC曲线分析SSCR风险模型与山东省立医院数据集中的患者OS的关系。
图20是本发明实施例中通过ROC曲线分析SSCR风险模型与GSE22762数据集中的患者TTFT的关系。
图21是本发明实施例中通过ROC曲线分析SSCR风险模型与GSE39671数据集中的患者TTFT的关系。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”或“包括”时,其指明存在特征、步骤、操作、器件、组件或它们的组合。下列具体实施方式中如果未注明具体条件的实验方法,通常按照本领域技术内的分子生物学的常规方法和条件,这种技术和条件在文献中有完整解释。参见例如 Sambrook 等人,《分子克隆:实验手册》中所述的技术和条件,或按照制造厂商所建议的条件。
结合具体实例对本发明作进一步的说明,以下实例仅是为了解释本发明,并不对其内容进行限定。如果实施例中未注明的实验具体条件,通常按照常规条件,或按照销售公司所推荐的条件;实施例中所用的材料、试剂等,如无特殊说明,均可通过商业途径购买得到。
术语“标志物”,是指“一种可客观检测和评价的特性,可作为正常生物学过程、病理过程或治疗干预药理学反应的指示因子”。例如,核酸标志物(也可以称为基因标志物,例如DNA),蛋白质标志物,细胞因子标记物,趋化因子标记物,碳水化合物标志物,抗原标志物,抗体标志物等。其中,核酸标志物的含义并不局限于现有可以表达为具有生物活性的蛋白质的基因,还包括任何核酸片段,可以为DNA,也可以为RNA,可以是经过修饰的DNA或者RNA,也可以是未经修饰的DNA或者RNA,以及由它们组成的集合。
术语指标的水平“上调”、“升高”或“提高”是指与参照相比,样品中这样的指标的水平升高。
术语指标的水平“下调”、“降低”或“下降”是指与参照相比,样品中这样的指标的水平降低。
本发明的一个典型具体实施方式中,提供一种用于慢性淋巴细胞白血病预后评估的标志物,所述标志物包括选自下列基因中的任意一种或多种:
SORL1、SGK1、CYBB和RPL22L1。经研究发现,SORL1、SGK1和CYBB的表达在慢性淋巴细胞白血病患者中显著下调,而RPL22L1的表达在慢性淋巴细胞白血病患者中显著上调。
本发明的又一具体实施方式中,所述标志物为上述SORL1、SGK1、CYBB和RPL22L1组成的组。
本发明的又一具体实施方式中,所述预后评估具体包括对慢性淋巴细胞白血病患者总生存期(OS)和首次治疗时间(TTFT)的评估。
本发明的又一具体实施方式中,提供检测上述标志物的表达水平的试剂在制备产品中的应用,所述产品用于慢性淋巴细胞白血病预后评估。
所述产品可以是检测试剂盒。
本发明的又一具体实施方式中,提供一种慢性淋巴细胞白血病SSCR风险模型(SSCR),所述慢性淋巴细胞白血病SSCR风险模型,其具体为基因表达量(SORL1)×(-1.378)+基因表达量(SGK1)×(-0.8055) +基因表达量(CYBB)×1.094+基因表达量(RPL22L1)×2.251。
本发明的又一具体实施方式中,提供上述慢性淋巴细胞白血病SSCR风险模型的建立方法,所述建立方法包括:
S1、数据采集:采集人类CLL样本的单细胞RNA测序数据和批量RNA测序数据;
S2、单细胞测序数据处理:采用Seurat包和Monocle包对步骤S1获得的CLL细胞相关数据进行处理;
S3、轨迹分析:选择用于聚类判定的标记基因,根据拟时间对细胞进行排序,并用轨迹描述CLL细胞所经历的生物过程;进行了分支表达分析,鉴定具有分支依赖性表达的基因即CLL细胞分化相关基因;
S4、构建慢性淋巴细胞白血病SSCR风险模型:将上述CLL细胞分化相关基因进行COX单因素及多因素回归分析,并构建慢性淋巴细胞白血病SSCR风险模型。
本发明的又一具体实施方式中,提供上述慢性淋巴细胞白血病SSCR风险模型在慢性淋巴细胞白血病预后评估系统中的应用。
本发明的又一具体实施方式中,提供一种慢性淋巴细胞白血病预后评估系统,所述系统包括:
i)分析单元,所述分析单元包含:用于确定受试者的待测样品中选自CLL细胞分化相关基因表达水平的检测物质,以及;
ii)评估单元,所述评估单元包含:根据i)中确定的所述CLL细胞分化相关基因表达水平对所述受试者进行预后评估;
本发明的又一具体实施方式中,所述步骤i)分析单元中,所述CLL细胞分化相关基因选自下列基因中的任意一种或多种:SORL1、SGK1、CYBB和RPL22L1。
本发明的又一具体实施方式中,所述CLL细胞分化相关基因为上述SORL1、SGK1、CYBB和RPL22L1组成的组。
本发明的又一具体实施方式中,所述步骤ii)评估单元具体评估流程包括:根据i)中确定的所述CLL细胞分化相关基因的表达水平,基于慢性淋巴细胞白血病SSCR风险模型进行预后评估;
其中,所述SSCR,其计算公式=基因表达量(SORL1)×(-1.378)+ 基因表达量(SGK1)×(-0.8055)+基因表达量(CYBB)×1.094+基因表达量(RPL22L1)×2.251;
所述预后评估包括对慢性淋巴细胞白血病患者总生存期和首次治疗时间的评估。
本发明的又一具体实施方式中,在用于对慢性淋巴细胞白血病患者总生存期进行评估时;
受试者SSCR指数高于阈值时为高表达,则指示受试者总生存期较短;
受试者SSCR指数低于阈值时为低表达,则指示受试者总生存期较长。
所述阈值为利用“surv_cutpoint”函数计算获得的SSCR的最佳截断值,在一个具体实施方式中,所述最佳截断值分别为12.56及0.77。
本发明的又一具体实施方式中,在用于对慢性淋巴细胞白血病患者首次治疗时间进行评估时;
受试者SSCR指数高于阈值时为高表达,则指示受试者首次治疗时间较短;
受试者SSCR指数低于阈值时为低表达,则指示受试者首次治疗时间较长;
所述阈值为利用“surv_cutpoint”函数计算获得的SSCR的最佳截断值,在一个具体实施方式中,所述最佳截断值为12.56及19.27。
本发明的又一具体实施方式中,提供一种慢性淋巴细胞白血病预后风险评估方法,所述方法包括使用上述标志物、上述慢性淋巴细胞白血病SSCR风险模型或上述系统进行评估;
所述预后风险评估包括对受试者的总生存期和首次治疗时间进行预测评估。
以下通过实施例对本发明做进一步解释说明,但不构成对本发明的限制。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围。
实施例
1、材料和方法
1.1数据采集
本研究分析了人类CLL样本的单细胞RNA测序数据和批量RNA测序数据。本研究使用来自山东省立医院的5例CLL患者PBMC样本及来自基因表达数据库(GEO, http://www.ncbi.nlm.nih.gov/geo/)的公共数据集GSE109085的4例CLL细胞样本。本研究使用公共数据集GSE22762和GSE39671的批量RNA测序数据。
1.2单细胞测序数据处理
CLL细胞单细胞测序数据使用R 4.0.5的Seurat包和Monocle包处理。在质量控制过程中,剔除检测到的基因<50个或线粒体表达基因≥5%的细胞。在<3个细胞中检测到的基因也被排除在外。进行主成分分析(PCA),筛选出20个显著主成分。根据20个主成分和聚类算法,识别出4个细胞簇。
1.3轨迹分析
通过分析标志基因的表达情况,判断CLL细胞的分化状态。然后根据细胞分化状态对细胞进行排序,并用细胞树形结构轨迹图描述CLL细胞所经历的生物过程。进而鉴定了具有分支依赖性表达的基因。这些与细胞分化相关的基因被定义为CLL细胞分化相关基因。
1.4慢性淋巴细胞白血病SSCR风险模型
为了进一步探讨CLL细胞分化相关基因的预后价值,选取在CLL患者与健康志愿者之间差异表达,或在CLL细胞间高度可变的CLL细胞分化相关基因,在训练队列(GSE22762)中对CLL细胞分化相关基因进行单因素cox回归分析,并对具有预后价值(p<0.05)的CLL细胞分化相关基因中,进行多变量cox回归分析,鉴定出4个具有独立预后价值的基因。根据以下公式构建风险评分模型:表达量(基因1)× β1 +表达量(基因2)× β2 +…表达量(基因n)×βn。表达量(基因n)为基因n的表达量。βn为通过多变量cox回归分析计算得到的基因n的回归系数。然后在GSE39671及山东省立医院队列中验证该风险评分模型。
2、结果
2.1 轨迹分析揭示CLL细胞异质性
为了进一步研究CLL细胞的分化状态,研究人员构建了4例样本中CLL细胞的mRNA图谱。在CLL细胞中,共检测到36412个基因,而每个细胞中检测到的基因数量与测序深度显著相关(图1)。计算出细胞间差异表达最为明显的1500个基因,命名为高变基因。变化最大的前10个的高变基因在不同样本中的表达情况如图2所示。通过主成分分析(PCA),筛选出20个具有统计学意义的主成分(p<0.05)。利用主成分分析获得的20个主成分,鉴定出4个CLL细胞簇。然后采用t分布随机邻居嵌入(tSNE)算法,将该结果可视化(图3)。4个细胞簇共具有2368个标志性基因,每个细胞簇中排名前10位的标志性基因表达情况被展示在热图中(图4)。其中,细胞簇0包含274个CLL细胞,细胞簇1包含163个CLL细胞,细胞簇2包含131个CLL细胞,细胞簇3包含104个CLL细胞。
细胞树形结构轨迹图中,CLL细胞呈现出从一个起点投射到两个分支的分化历程。CLL细胞的命运在分支点1发生改变,并进入两个不同的分支。来自细胞群0的CLL细胞主要位于分支1,来自集群1的CLL细胞主要位于分支2(图5)。246个基因呈现分支依赖性表达,并被命名为CLL细胞分化相关基因。CLL细胞分化相关基因被认为与CLL的瘤内异质性有关,可能参与CLL的疾病演进过程。
2.2 慢性淋巴细胞白血病SSCR风险模型建立
选取在CLL中异常表达或属于高变基因的CLL细胞分化相关基因进行单变量和多变量COX回归分析。发现SORL1、SGK1、CYBB、RPL22L1是CLL患者总生存期(OS)的独立预后因素,对山东省立医院CLL患者外周血单个核细胞样本行PCR分析,发现SORL1、SGK1和CYBB的表达在慢性淋巴细胞白血病患者中显著下调,而RPL22L1的表达在慢性淋巴细胞白血病患者中显著上调(图6-9)。研究者基于这4个CLL细胞分化相关基因建立慢性淋巴细胞白血病SSCR风险模型:SSCR-Score=基因表达量(SORL1)×(-1.378)+ 基因表达量(SGK1)× (-0.8055) +基因表达量(CYBB )× 1.094+基因表达量(RPL22L1)× 2.251。本研究发现,在分支点1,细胞命运向两个方向发展。一部分细胞显著低表达RPL22L1,高表达SORL1、SGK1和CYBB,这表明以该类细胞占优势的CLL患者肿瘤恶性程度有可能更低。
2.3 慢性淋巴细胞白血病SSCR风险模型验证
对慢性淋巴细胞白血病SSCR风险模型的效能进行验证。训练集及验证集中的SORL1、SGK1、CYBB及RPL22L1表达情况如图10-13所示。依据R软件survminer包中的surv_cutpoint函数计算高危组与低危组的最佳截断值,在GSE22762训练集中,最佳截断值确定为12.56,慢性淋巴细胞白血病SSCR风险评分升高与OS降低显著相关(图14)。受试者工作特征(Receiver operating characteristic, ROC)曲线分析也表明了该评分在预测患者OS方面的良好能力(图18)。此外,在山东省立医院患者队列中,使用实时荧光定量PCR 对这四个基因的表达水平进行测定,并通过surv_cutpoint函数计算高危组与低危组的最佳截断值,最佳截断值被确定为 0.77,K-M曲线分析该评分与患者总生存期显著相关(图15),且ROC分析展示了该评分在预测患者OS方面的良好性能(图19)。
本研究进一步验证了该评分对患者TTFT的预测能力。在训练队列中,慢性淋巴细胞白血病SSCR风险评分升高与患者首次治疗时间(TTFT)降低显著相关(图16),ROC曲线表明SSCR风险评分在预测患者TTFT方面表现良好(图20)。在GSE39671验证队列中,高危组与低危组的最佳截断值被确定为19.27,K-M曲线分析表明,该风险评分的增加与TTFT的缩短显著相关(图17)。ROC曲线分析表明该评分在预测患者TTFT方面表现良好(图21)。
2.4 SSCR模型与COVID-19的关联
KEGG富集分析表明,慢淋分化相关基因可能与COVID-19通路相关。而被纳入SSCR模型中的CYBB及RPL22L1基因,是COVID-19通路中的重要成分。CYBB参与NADPH 氧化酶复合物的作用,在COVID-19中参与AngII-AT1R-NOX2信号通路转导。在CLL患者中,CLL细胞CYBB表达量显著下调,且CYBB高表达与良好的预后显著相关,而在COVID-19患者中,PBMC的CYBB表达显著上调(p<0.001,LogFC=2.32),此外,在COVID-19重症患者中,SORL1表达量相较于轻症患者显著上调,而在CLL细胞中,存在着SORL1基因的表达下调。以上证据可能启示相较正常患者,CLL患者对COVID-19的反应性较差。
本研究鉴定了4个具有不同遗传标记的CLL细胞簇。通过轨迹分析,将CLL细胞投射到两个分支,并且研究了在两个分支中差异表达的基因,即CLL细胞分化相关基因。基于多变量Cox回归分析,本发明发现SORL1、SGK1、CYBB和RPL22L1为具有最显著预后价值的CLL细胞分化相关基因,并基于SORL1、SGK1、CYBB和RPL22L1建立预测患者OS和TTFT的慢性淋巴细胞白血病SSCR风险模型。研究者将CLL患者分为两个具有不同风险等级的亚组,并在两个独立的长期随访队列中分别验证了该风险评分模型预测患者OS及TTFT的可靠性。这是第一个基于CLL细胞分化状态的CLL风险评分模型。该评分系统可以帮助医生根据CLL细胞分化状况预测患者的预后,选择最佳的治疗方案。
应注意的是,以上实例仅用于说明本发明的技术方案而非对其进行限制。尽管参照所给出的实例对本发明进行了详细说明,但是本领域的普通技术人员可根据需要对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。

Claims (4)

1.一种慢性淋巴细胞白血病SSCR风险模型在慢性淋巴细胞白血病预后评估系统中的应用,所述慢性淋巴细胞白血病SSCR风险模型,其具体为基因表达量SORL1×-1.378+基因表达量SGK1×-0.8055+基因表达量CYBB×1.094+基因表达量RPL22L1×2.251;
所述慢性淋巴细胞白血病预后评估系统用于对慢性淋巴细胞白血病患者总生存期和首次治疗时间进行评估。
2.如权利要求1所述应用,其特征在于,所述慢性淋巴细胞白血病SSCR风险模型的建立方法包括:
S1、数据采集:采集人类CLL样本的单细胞RNA测序数据和批量RNA测序数据;
S2、单细胞测序数据处理:采用Seurat包和Monocle包对步骤S1获得的CLL细胞相关数据进行处理;
S3、轨迹分析:选择用于聚类判定的标记基因,根据拟时间对细胞进行排序,并用轨迹描述CLL细胞所经历的生物过程;进行了分支表达分析,鉴定具有分支依赖性表达的基因即CLL细胞分化相关基因;
S4、构建慢性淋巴细胞白血病SSCR风险模型:将CLL细胞分化相关基因进行回归分析,并构建慢性淋巴细胞白血病SSCR风险模型。
3.一种慢性淋巴细胞白血病预后评估系统,其特征在于,所述系统包括:
i)分析单元,所述分析单元包含:用于确定受试者的待测样品中选自CLL细胞分化相关基因表达水平的检测物质,以及;
ii)评估单元,所述评估单元包含:根据i)中确定的所述CLL细胞分化相关基因的表达水平对所述受试者进行预后评估;
所述步骤i)分析单元中,所述CLL细胞分化相关基因选自SORL1、SGK1、CYBB和RPL22L1组成的组;
所述步骤ii)评估单元具体评估流程包括:根据i)中确定的所述CLL细胞分化相关基因表达水平,基于慢性淋巴细胞白血病SSCR风险模型进行预后评估;
其中,所述慢性淋巴细胞白血病SSCR风险模型,其计算公式=基因表达量SORL1×-1.378+基因表达量SGK1×-0.8055+基因表达量CYBB×1.094+基因表达量RPL22L1×2.251。
4.如权利要求3所述的慢性淋巴细胞白血病预后评估系统,其特征在于,所述预后评估包括对慢性淋巴细胞白血病患者总生存期和首次治疗时间的评估;
在用于对慢性淋巴细胞白血病患者总生存期进行评估时;
受试者SSCR指数高于阈值时为高表达,则指示受试者总生存期较短;
受试者SSCR指数低于阈值时为低表达,则指示受试者总生存期较长;
在用于对慢性淋巴细胞白血病患者首次治疗时间进行评估时;
受试者SSCR指数高于阈值时为高表达,则指示受试者首次治疗时间较短;
受试者SSCR指数低于阈值时为低表达,则指示受试者首次治疗时间较长。
CN202111324679.6A 2021-11-09 2021-11-09 一种慢性淋巴细胞白血病sscr风险模型及其建立方法和应用 Active CN113782087B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111324679.6A CN113782087B (zh) 2021-11-09 2021-11-09 一种慢性淋巴细胞白血病sscr风险模型及其建立方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111324679.6A CN113782087B (zh) 2021-11-09 2021-11-09 一种慢性淋巴细胞白血病sscr风险模型及其建立方法和应用

Publications (2)

Publication Number Publication Date
CN113782087A CN113782087A (zh) 2021-12-10
CN113782087B true CN113782087B (zh) 2022-01-18

Family

ID=78873662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111324679.6A Active CN113782087B (zh) 2021-11-09 2021-11-09 一种慢性淋巴细胞白血病sscr风险模型及其建立方法和应用

Country Status (1)

Country Link
CN (1) CN113782087B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115261469B (zh) * 2022-06-23 2023-03-31 山东第一医科大学附属省立医院(山东省立医院) Brd9在慢性淋巴细胞白血病诊治中的应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105969892A (zh) * 2016-07-14 2016-09-28 北京大学人民医院 Csrp2在作为评估成人b-all患者预后风险标记物中的应用
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用
CN113584175A (zh) * 2021-08-30 2021-11-02 南京大学 一组评估肾乳头状细胞癌进展风险的分子标记及其筛选方法和应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2888370A4 (en) * 2012-08-27 2016-06-15 Nodality Inc DIAGNOSIS, FORECASTING AND TREATMENT PROCEDURES
CN109055564B (zh) * 2018-10-30 2022-01-21 金晖 用于慢性淋巴细胞白血病诊断及预后评估的CircRNA标志物
CN109752548B (zh) * 2019-02-01 2022-05-06 广州金域医学检验中心有限公司 评估慢性淋巴细胞白血病预后的组合试剂及系统
CN113252900B (zh) * 2021-06-19 2022-04-08 山东第一医科大学附属省立医院(山东省立医院) 基于ApoA的慢性淋巴细胞白血病预后风险评估系统及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105969892A (zh) * 2016-07-14 2016-09-28 北京大学人民医院 Csrp2在作为评估成人b-all患者预后风险标记物中的应用
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用
CN113584175A (zh) * 2021-08-30 2021-11-02 南京大学 一组评估肾乳头状细胞癌进展风险的分子标记及其筛选方法和应用

Also Published As

Publication number Publication date
CN113782087A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
JP6681337B2 (ja) 敗血症の発症を予測するための装置、キット及び方法
US20190085407A1 (en) Methods and compositions for diagnosis of glioblastoma or a subtype thereof
US20230126920A1 (en) Method and device for classification of urine sediment genomic dna, and use of urine sediment genomic dna
US10246748B2 (en) Biomarker combinations for colorectal tumors
CN111394456B (zh) 早期肺腺癌患者预后评估系统及其应用
CN113234829B (zh) 结肠癌预后评估基因集及其构建方法
CA2753971C (en) Accelerated progression relapse test
CN111321225B (zh) 一种基于lncRNA评分体系在预测肿瘤免疫治疗效果中的应用
CN113782087B (zh) 一种慢性淋巴细胞白血病sscr风险模型及其建立方法和应用
CN114317532B (zh) 用于预测白血病预后的评估基因集、试剂盒、系统及应用
CN114220487A (zh) 一种新型9基因risk急性髓系白血病预后模型的构建方法
CN113201590A (zh) 用于评估肝细胞癌早期复发风险的lncRNA、评估方法及装置
CN116741272A (zh) 基于基因组突变特征及基因集表达特征的卵巢癌hrd分型系统及方法
CN116525005A (zh) 巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型
CN114015773B (zh) 全身炎症反应指数在胃肠道弥漫性大b细胞淋巴瘤预后评估中的应用
CN115798703A (zh) 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质
CN112481380B (zh) 一种评估晚期膀胱癌抗肿瘤免疫治疗反应性和预后生存的标志物及其应用
CN117625793B (zh) 一种卵巢癌生物标志物的筛选方法及其应用
CN109207581A (zh) 一种自身免疫性疾病诊断试剂盒和应用
CN117476097B (zh) 一种基于三级淋巴结构特征基因的结直肠癌预后和治疗反应预测模型及其构建方法和应用
CN117925835A (zh) 一种结直肠癌肝转移标记物模型及其在预后及免疫治疗响应预测的应用
CN117867113A (zh) 用于预测宫颈癌患者预后的ICTR-lncRNAs及预测模型和应用
CN117165683A (zh) 用于评估同源重组修复缺陷的生物标志物及其应用
CN114005538A (zh) Nectin家族和类nectin分子在低级别胶质瘤预后模型中的应用
CN113930511A (zh) Golt1b在乳腺癌的预后中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Wang Xin

Inventor after: Zhang Ya

Inventor after: Tian Zheng

Inventor before: Zhang Ya

Inventor before: Wang Xin

Inventor before: Tian Zheng

CB03 Change of inventor or designer information