CN117153241A - 三阴性乳腺癌预后效果的预测模型及其应用 - Google Patents

三阴性乳腺癌预后效果的预测模型及其应用 Download PDF

Info

Publication number
CN117153241A
CN117153241A CN202311416742.8A CN202311416742A CN117153241A CN 117153241 A CN117153241 A CN 117153241A CN 202311416742 A CN202311416742 A CN 202311416742A CN 117153241 A CN117153241 A CN 117153241A
Authority
CN
China
Prior art keywords
risk
patients
tnbc
breast cancer
gene expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311416742.8A
Other languages
English (en)
Inventor
黄圆
王晓稼
郑亚兵
王晓炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Cancer Hospital
Original Assignee
Zhejiang Cancer Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Cancer Hospital filed Critical Zhejiang Cancer Hospital
Publication of CN117153241A publication Critical patent/CN117153241A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Oncology (AREA)
  • General Engineering & Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Physiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明关于三阴性乳腺癌预后效果的预测模型及其应用,预测模型为:每个样本的风险评分=0.8959575100676907*CTSD基因表达值+0.02107000891980921*CTSL基因表达值+(‑0.64413818956012)*ELK4基因表达值+0.307340530719732*HSPA8基因表达值+1.31660312733179*XRCC4基因表达值。仅用五个标记基因构建的预测模型即可完成对TNBC预后效果的预测,模型具有较高的准确性和特异性,能够将高风险患者和低风险患者进行显著区分,能够很好地预测患者的一年生存率,有利于筛选治疗获益较大化的患者,使患者更好获益。

Description

三阴性乳腺癌预后效果的预测模型及其应用
本申请要求申请号为“2023112201602”、申请日为“2023年09月21日”、发明名称为“三阴性乳腺癌预后效果的预测模型及其应用”的中国发明专利申请的优先权。
技术领域
本发明主要关于基因应用技术领域,特别是关于三阴性乳腺癌预后效果的预测模型及其应用。
背景技术
三阴性乳腺癌(TNBC)占所有乳腺恶性肿瘤的15%~20%。TNBC细胞具有极强的攻击性,缺乏激素和生长因子受体。由于雌激素受体、孕激素受体和人表皮生长因子受体2的缺失或低表达,TNBC对激素和内分泌治疗产生耐药性。与其他乳腺癌症形式相比,TNBC仍然是最具挑战性的,因为它具有更广泛的异质性,远处转移和复发的风险更高,并且验证的治疗靶点不足。目前,化疗被用作对抗TNBC的主要方法。随着实体瘤免疫疗法的发展和TNBC免疫原性的验证,免疫疗法越来越受到关注。为了改善TNBC人群的生存结果,免疫疗法的预测性生物标志物具有挑战性。此外,由于治疗反应不佳,TNBC急需新的治疗靶点和预测预后的生物标志物。
髓系细胞,尤其是巨噬细胞的积聚,是TNBC肿瘤微环境中的主要成分。巨噬细胞对TNBC的调节机制已经得到了广泛的探索。例如,HLF通过激活癌症细胞-巨噬细胞通讯来调节TNBC的铁死亡、进展和化疗耐药。化疗与巨噬细胞抑制相结合可诱导T细胞和B细胞的丰度以及TNBC的持久消退。OTUD5诱导的巨噬细胞中YAP的去泛素化有助于M2表型并有利于TNBC的进展。到目前为止,很少有TNBC患者的巨噬细胞相关预后模型,且未在临床实践中应用。
前述背景技术知识的记载旨在帮助本领域普通技术人员理解与本发明较为接近的现有技术,同时便于对本申请发明构思及技术方案的理解,应当明确的是,在没有明确的证据表明上述内容在本专利申请的申请日前已公开的情况下,上述背景技术不应当用于评价本申请技术方案的新创性。
发明内容
为解决上述背景技术中提及的至少一种技术问题,本发明的目的旨在提供三阴性乳腺癌预后效果的预测模型及其应用,仅用巨噬细胞相关的五个标记基因构建的预测模型即可完成对TNBC预后效果的预测,模型具有较高的准确性和特异性,能够将高风险患者和低风险患者进行显著区分,能够很好地预测患者的一年生存率,有利于筛选治疗获益较大化的患者,使患者更好获益。
在本发明的第一个方面,本发明提供了一种三阴性乳腺癌预后效果的预测模型,所述预测模型为:
每个样本的风险评分=0.8959575100676907*CTSD基因表达值+0.02107000891980921*CTSL基因表达值+(-0.64413818956012)*ELK4基因表达值+0.307340530719732*HSPA8基因表达值+1.31660312733179*XRCC4基因表达值。
作为对本发明技术方案的优化,风险评分>中位风险评分的患者被定义为高风险患者,风险评分≤中位风险评分的患者被定义为低风险患者。
在本发明的第二个方面,本发明提供了所述三阴性乳腺癌预后效果的预测模型的构建方法,所述方法包括:
将与TNBC巨噬细胞相关的差异表达转录因子和DEG纳入单变量cox回归分析,将p≤0.05的基因定义为潜在标记基因;潜在标记基因共有八个,包括C12orf60、CTSD、CTSL、ELK4、FCGR2A、FOLR2、HSPA8和XRCC4;
将TCGA TNBC样本随机分为训练集与测试集;
在训练集中,对回归系数≠0的特征基因进行LASSO分析,在λ最小值=0.0267的情况下,最终确定了五个标记基因,包括CTSD、CTSL、ELK4、HSPA8和XRCC4;
基于LASSO回归分析确定所述五个标记基因的LASSO系数,建立三阴性乳腺癌预后效果的预测模型。
作为对本发明技术方案的优化,使用R语言软件的glmnet包进行LASSO回归分析。
在本发明的第三个方面,本发明提供了用于预测三阴性乳腺癌预后效果的试剂盒,所述试剂盒包括:
标记基因:CTSD基因、CTSL基因、ELK4基因、HSPA8基因和XRCC4基因;及
前述所述预测模型。
在本发明的第四个方面,本发明提供了采用所述的试剂盒预测三阴性乳腺癌预后效果的方法,包括如下步骤:
检测三阴性乳腺癌患者样本中5个标记基因的基因表达,将各基因所对应的基因表达值代入预测模型,依据每个样本的风险评分结果预测对应患者的预后效果。
作为对本发明技术方案的优化,所述样本为肿瘤组织样本。
作为对本发明技术方案的优化,所述依据每个样本的风险评分结果预测对应患者的预后效果具体包括:
风险评分>中位风险评分的患者被定义为高风险患者,风险评分≤中位风险评分的患者被定义为低风险患者;
与低风险患者相比,高风险患者具有更大的死亡或复发/进展风险;和/或
风险评分越高,预测患者治疗后的生存率越高;和/或
更高的风险评分预示着患者的组织学分级更高,相应的T、N、M分期和/或病理分期处于更晚期阶段;和/或
更高风险评分的患者更易对免疫疗法有反应。
在本发明的第五个方面,本发明提供了前述所述试剂盒的应用,包括:检测获得三阴性乳腺癌患者样本中5个标记基因的基因表达值,将各基因表达值代入下述预测模型,获得每个样本所属患者的风险评分,风险评分>中位风险评分的患者被定义为高风险患者,风险评分≤中位风险评分的患者被定义为低风险患者;依据每个样本的风险评分结果预测对应患者的预后效果。
作为对本发明技术方案的优化,所述依据每个样本的风险评分结果预测对应患者的预后效果具体包括:
与低风险患者相比,高风险患者具有更大的死亡或复发/进展风险;和/或
风险评分越高,预测患者治疗后的生存率越高;和/或
更高的风险评分预示着患者的组织学分级更高,相应的T、N、M分期和/或病理分期处于更晚期阶段;和/或
更高风险评分的患者更易对免疫疗法有反应。
将与TNBC巨噬细胞相关的差异表达转录因子和DEG纳入单变量cox回归分析,结果表明包括C12orf60、CTSD、CTSL、ELK4、FCGR2A、FOLR2、HSPA8和XRCC4等在内的8个基因与TNBC预后显著相关(p≤0.05)。我们将TCGA TNBC样本随机分为训练基或测试集,在训练集队列中,对回归系数≠0的特征基因进行LASSO分析,在λ最小值=0.0267的情况下,最终确定了五个特征基因,包括CTSD、CTSL、ELK4、HSPA8和XRCC4可作为用于预测TNBC预后效果的标记基因,进一步藉此构建了三阴性乳腺癌预后效果的预测模型,通过ROC曲线验证了所述预测模型具有较高的准确性和特异性,能够显著区分高风险患者和低风险患者,因此能够用于TNBC预后效果的预测。
本申请的有益效果为:
本发明提供了三阴性乳腺癌预后效果的预测模型,其内含巨噬细胞相关的5个标记基因,模型高风险评分预测预后差。通过ROC曲线验证了所述预后预测模型具有较高的准确性和特异性,能够将高风险患者和低风险患者进行显著区分,因此能够用于预测TNBC预后效果。
模型可以可靠的预测TNBC患者的预后功效,生存分析表明,训练队列中高危患者的OS时间显著缩短,这种生存差异在测试和整个队列中均能够得到证实,在训练、测试和整个队列中,模型均能够很好地预测患者的一年生存率(AUC>0.9)。
本发明仅用巨噬细胞相关的五个标记基因构建的预测模型即可完成对TNBC预后效果的预测,与现有技术相比可以更精准的预测TNBC患者的病理缓解或进展情况,可依据预测结果更变后续治疗方案,可以显著改善TNBC人群的生存结果。可利用较少基因达到稳定且较好的预测效果,有利于筛选治疗获益较大化的患者,使患者更好获益。
附图说明
为让本发明的上述和/或其他目的、特征、优点与实例能更明显易懂,下面将对本发明的具体实施方式中所需要使用的附图进行简单的介绍,显然地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的情况下还可以根据这些附图获得其他的附图。
图1表示UMAP根据scRNA-seq数据绘制已鉴定的细胞群;
图2表示不同基因在不同细胞群中的表达;
图3表示单细胞TNBC和非TNBC中每个细胞群的细胞比例;
图4表示不同细胞群的前10个新标记基因;
图5表示鉴定的细胞群在bulk TNBC和非TNBC组织中的相对细胞丰度;
图6表示bulk TNBC和非TNBC组织之间每个细胞群的细胞比例,其中**表示p≤0.01,***表示p≤0.001;
图7表示非TNBC中的细胞-细胞相互作用网络;
图8表示TNBC中的细胞-细胞相互作用网络;
图9表示LASSO分析中的系数分析;
图10表示10倍交叉验证结果;
图11表示确定的能够预测TNBC预后效果的标记基因的单变量cox回归结果;
图12表示特征基因的风险评分表达分析热图;
图13表示TNBC病例的风险评分的分布图;
图14表示TNBC病例中死亡、存活风险的分布图;
图15表示TNBC病例中痊愈、复发/进展风险的分布图;
图16表示训练集的低风险或高风险患者的OS概率;
图17表示测试集的低风险或高风险患者的OS概率;
图18表示整个队列的低风险或高风险患者的OS概率;
图19表示模型对训练集患者生存期的预测ROC;
图20表示模型对测试集患者生存期的预测ROC;
图21表示模型对整个队列患者生存期的预测ROC;
图22表示GSE96058队列的低风险或高风险患者的OS概率;
图23表示模型基于GSE96058队列预测的一年、三年或五年生存期ROC;
图24表示GSE45255队列的低风险或高风险患者的DFS概率;
图25表示模型基于GSE45255队列预测的一年、三年或五年生存期ROC;
图26表示TCGA TNBC队列中不同T阶段的风险评分分布;
图27表示TCGA TNBC队列中不同N阶段的风险评分分布;
图28表示TCGA TNBC队列中不同M阶段的风险评分分布;
图29表示TCGA TNBC病例不同病理阶段的风险评分分布;
图30表示TCGA TNBC病例的风险评分与肿瘤纯度之间的相关性;
图31表示GSE96058队列中不同组织学分级的风险评分分布;
图32表示GSE45255队列中不同组织学分级的风险评分分布;
图33表示低风险和高风险TCGA TNBC患者T细胞炎症评分的比较;
图34表示低风险和高风险TCGA TNBC患者TIDE评分的比较;
图35表示低风险和高风险TNBC患者组间免疫检查点表达的比较。
具体实施方式
本领域技术人员可以借鉴本文内容,适当替换和/或改动工艺参数实现,然而特别需要指出的是,所有类似的替换和/或改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明所述产品和制备方法已经通过较佳实例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的产品和制备方法进行改动或适当变更与组合,来实现和应用本发明技术。
除非另有定义,本文所使用的技术和科学术语,具有本发明所属领域的普通技术人员通常所理解的相同的含义。本发明使用本文中所描述的方法和材料;但本领域中已知的其他合适的方法和材料也可以被使用。本文中所描述的材料、方法和实例仅是说明性的,并不是用来作为限制。所有出版物、专利申请案、专利案、临时申请案、数据库条目及本文中提及的其它参考文献等,其整体被并入本文中作为参考。若有冲突,以本说明书包括定义为准。
除非具体说明,本文所描述的材料、方法和实例仅是示例性的,而非限制性的。尽管与本文所述的那些方法和材料类似或等同的方法和材料可用于本发明的实施或测试,但本文仍描述了合适的方法和材料。
为了便于理解本发明的实施例,首先对本发明实施例中可能涉及的缩略语和关键术语进行解释说明或定义。
TNBC:三阴性乳腺癌;
scRNA-seq:单细胞RNA测序;
GEO:基因表达综合;
TCGA:癌症基因组图谱;
PCA:主成分分析;
UMAP:均匀流形近似和投影;
FC:折叠变化;
GO:基因本体;
KEGG:京都基因和基因组百科全书;
GSEA:基因集富集分析;
DEG:差异表达的基因;
RT-qPCR:实时定量PCR;
Limma:广义线性差异分析模型;
Glmnet:一个通过惩罚极大似然来适应广义线性和相似模型的软件包;
LASSO:最小绝对收缩和选择运算符;
GDSC2:肿瘤药物敏感性基因组学数据库;
Gibco:胎牛血清;
CTA:癌症抗原;
siRNA:小的干扰RNA;
OS:总体生存期;
DFS:无病生存;
ROC:接收器操作员特征曲线;
Bulk:批量、批处理;
TIDE:代表肿瘤免疫功能障碍和排斥,用来评估肿瘤样本基因表达谱中肿瘤免疫逃脱的可能性;
CIBERSORTx:是一个计算框架,可从细胞、完整组织中推断出细胞类型特异性转录组;
Cell Signaling Technology:即CST,是一家由科学家创立的私营家族公司,致力于提供全球最高品质的创新研究和诊断产品,加速生物学认知以及实现个体化医疗。
巨噬细胞作为肿瘤微环境中的主要成分,在三阴性乳腺癌(TNBC)中发挥着重要作用。本发明探索巨噬细胞相关的标记基因用于预测TNBC患者的预后情况。利用单细胞数据集(GSE180286)和转录组数据(TCGA-TNBC、GSE96058和GSE45255)进行生信分析。通过RT-qPCR和蛋白质印迹验证标记基因在TNBC细胞(MDA-MB-231和MCF-7)和乳腺上皮细胞(MCF10A)中的表达。RNA干扰或过度表达后,进行划痕试验检测细胞迁移。
以下详细描述本发明。
样本选择:
通过GEO数据库,从GSE180286数据集中获取了四个原代TNBC样本的原始单细胞RNA测序(scRNA-seq)数据。从癌症基因组图谱(TCGA)(n=115)、GSE96058(n=3409)和GSE45255(n=95)中获得了三个具有批量转录组分析和临床特征的TNBC队列。
单链核糖核酸序列的质量控制和预处理:
通过执行DropletUtils工具包,将空液滴与所有细胞区分开来,然后去除。基于Scater工具包,进一步去除线粒体基因比例>10%和核糖体基因比例<10%的细胞。过滤后的scRNA-seq数据用Seurat工具包进行标准化。
主成分分析、细胞聚类和注释:
利用Seurat工具包筛选了前2000个高度可变的基因,并对表达谱进行线性缩放,然后进行主成分分析。接下来,选择具有大标准偏差的主成分(PC),随后将其用于细胞聚类。随后实现了均匀流形近似和投影(UMAP)。根据平均log2倍变化(FC)≥0.1、细胞群体表达率≤0.25和校正p≤0.05的标准确定每个细胞簇中的标记基因。
免疫浸润分析:
采用CIBERSORTX,根据单个细胞的鉴定结果制作标签作为参考表达矩阵。根据批量表达矩阵,计算每个样品中鉴定细胞的比例。
细胞通信:
通过执行cellchat软件包,通过使用配体-受体对来评估细胞间的相互作用。细胞间通信网络通过Cytoscape软件进行可视化。
功能富集分析:
通过使用clusterProfiler软件包执行GO或KEGG途径富集分析。KEGG通路通过路径视图网络进行可视化。采用基因集富集分析(GSEA)来确定组间具有显著差异的基因集。
差异表达分析:
以SCENIC计算方法用于指导转录因子的鉴定。在p≤0.05和|t|≥2的标准下,通过limma法在TNBC和非TNBC巨噬细胞之间筛选差异表达的转录因子。此外,在|log2FC|≥0.585和q≤0.05的阈值下,选择各组之间的差异表达基因(DEG)。
最小绝对收缩和选择算子(LASSO)分析:
通过生存包选择与TNBC巨噬细胞相关的差异表达转录因子和DEG进行单因素cox回归分析。LASSO包括p≤0.05的基因。TCGA TNBC样本被随机分为训练集或测试集。通过执行glmnet,选择了特征基因。风险评分是根据回归系数与特征基因的表达相结合来计算的。低风险或高风险患者被定义在中位风险评分下或上。LASSO模型在GSE96058和GSE45255队列中进行了外部验证。
遗传突变评估:
从TCGA数据集中获取TNBC样本的体细胞突变数据和肿瘤抗原(CTA)数量信息。通过实施maftools包,对体细胞突变进行了评估和可视化。
治疗反应评估:
分别计算T细胞炎症评分、TIDE评分以及免疫检查点分子的表达,以反映对免疫疗法的反应。基于GDSC2数据库,通过使用oncoPrecdict软件包来估计药物的IC50值,以推断药物反应。
细胞培养:
将取自中国科学院典型培养物保藏中心细胞库的正常人乳腺上皮细胞(MCF10A)和人TNBC细胞(MDA-MB-231和MCF-7)在Dulbecco改良鹰培养基(Gibco,美国)中培养,补充10%胎牛血清和1%青霉素-链霉素,在37°C的5%CO2气氛进行培养。
RT-qPCR:
使用RNAiso Plus试剂(Takara,中国)进行总RNA分离,并通过HiScript III RTSuperMix试剂(Vazyme,中国)合成互补DNA。所用引物如下:
CTSL,5'-CTTTGCCTGGGGAATTGCCTC-3’(正向引物),
5'-CTCGCCCTTCCTTC-3’(反向引物);
CTSD,5'-TGCTCCAAGAACTACATGGACGC-3'(正向引物),
5'-CGAAGACGACTGTGAAGCACT-3'(反向引物);
ELK4,5'-TGGACCTCTATGATGGGCAG-3'(正向引物),
5'-AGGCTTGTGTGCGAATCCC-3'(反向引物);
XRCC4,5'-ATGTGGTGAACTGAGAAAAGCA-3'(正向引物),
5'-GAATGGTCCAAGCAATAAC-3'(反向引物);
HSPA8,5'-ACCTACTCTTGTGTGGGTGTT-3'(正向引物),
5'-GACATAGCTTGGAGTGGTTCG-3'(反向引物);
GAPDH,5'-ACAACTTTGGTATCGTGGAAGG-3'(正向引物),
5'-GCCATCACGCCACAGTTTC-3'(反向引物)。RT-qPCR通过通用型高灵敏度染料法定量PCR检测试剂盒(Vazyme)进行。用2-ΔΔCt计算相对mRNA水平。
蛋白质印迹:
通过RIPA缓冲液(Cell Signaling Technology,美国)进行所有蛋白质提取,然后通过BCA试剂(Cell Signaling Technology,美国)进行蛋白质定量。通过聚丙烯酰胺凝胶电泳分离蛋白质,随后转移到聚偏氟乙烯膜上(Millipore,德国)。在5%BCA(Yeasen,中国)中阻断并与抗CTSL(1/2000;ab200738)、CTSD(1/2000;ab75852)、XRCC4(1/1000;ab213729)、HSPA8(1/500;ab51052)或GAPDH(1/2500;ab9485)的特异性抗体孵育。通过增强化学发光检测试剂盒(Yeasen)形成条带。
转染:
对于RNA干扰,通过使用Lipofectamine 2000转染试剂(Invitrogen)将针对XRCC4(si-XRCC4)和阴性对照siRNA(si-NC)(Invitragen,USA)的小干扰RNA(siRNA)转染到细胞中。对于基因过表达,将名为OE-CTSL、OE-CTSD或OE-HSPA8的CTSL、CTSD或HSPA8过表达质粒转染到细胞中。
划痕试验:
将细胞种植在6孔板上并生长直至融合,并使用10 µL移液管尖端。接下来,用PBS洗涤平板以除去分离的细胞。划痕后在Olympus IX71光学显微镜下分别于0h、24h 采集照片。
统计分析:
所有分析均使用R软件(4.0.3版)或GraphPad Prism(9.0.1版)进行。两组之间的差异通过Student t检验或单向方差分析进行评估。通过Pearson检验或Spearman检验进行相关分析。通过Kaplan–Meier方法和对数秩检验对总体生存率(OS)或无病生存率(DFS)的生存曲线进行可视化。通过pROC软件包绘制受试者-操作者特征曲线(ROC)。P≤0.05被认为具有统计学意义。
本发明方法利用单细胞数据集(GSE180286)和转录组数据(TCGA-TNBC、GSE96058和GSE45255)进行生信分析。通过RT-qPCR和蛋白质印迹验证标记基因在TNBC细胞(MDA-MB-231和MCF-7)和乳腺上皮细胞(MCF10A)中的表达。RNA干扰或过度表达后,进行划痕试验检测细胞迁移。具体包括下述步骤。
第一部分、单细胞和转录组分析揭示TNBC的细胞异质性
基于四个原代TNBC标本的scRNA-seq数据重建了TNBC的单细胞模式。首先,去除了具有空液滴或低质量的单细胞,在我们的分析中保留了GSM5457199样品中的2599/3267个细胞、GSM457205样品中的3872/4161个细胞、GSM5457208样品中的3755/4064个细胞和GSM5457211样品中的6233/7521个细胞。接下来,基于PCA对保留的scRNA-seq数据进行缩放,PC=9。通过使用UMAP方法,将选定的单细胞聚类为14个聚类,TNBC和非TNBC之间具有显著的细胞异质性。此外,还确定了每个细胞簇中的标记基因。结合已知的细胞类型标记基因,对9个细胞群进行了分类,如图1所示,具体包括B细胞(n=698)、树突状细胞(n=387)、内皮细胞(n=495)、上皮细胞(n=9984)、成纤维细胞(n=350)、巨噬细胞(n=732)、单核细胞(n=32)、浆母细胞(n=1412)和T细胞(n=2369)。
如图2所示,不同基因在相应的细胞群体中特异性表达,具体包括:B细胞的MS4A1,树突细胞的CD1C和FCER1A,内皮细胞的PECAM1、VWF、CDH5、SELE和CD34,上皮细胞的EPCAM、CDH1和KRT18,成纤维细胞的COL1A1和PDGFRB,巨噬细胞的APOE、CD68、MRC1、MSR1和CXCL2,单核细胞的FCN1、LILRA5和S100A8,浆母细胞的JCHAIN,以及T细胞的CD3D、CD3E、CD3G和CD2。
图3示出了上述细胞群在TNBC和非TNBC中的差异表达,这些细胞群在TNBC和非TNBC之间显著不同,与非TNBC相比,TNBC中的B细胞、树突状细胞、成纤维细胞、巨噬细胞、浆细胞和T细胞的细胞比例较高,内皮细胞和上皮细胞的细胞比率较低,基于此,我们确定了每个细胞群体的新标记基因,如图4所示。
我们还从TCGA数据集中收集了TNBC样本的bulk转录组分析。通过执行CIBERSORTx,基于scRNA-seq结果建立了细胞标志物的参考基质,并估计了bulk组织中细胞群体的相对细胞比率,如图5和图6所示,可知与scRNA-seq的研究结果一致,在bulk TNBC中发现巨噬细胞的细胞比例高于非TNBC组织,因此可知,巨噬细胞在TNBC微环境中具有活性。
第二部分、TNBC和非TNBC微环境中的细胞-细胞相互作用
接下来,我们分别基于非TNBC和TNBC中的配体-受体对进一步评估了细胞间的相互作用,如图7和图8所示,与非TNBC相比,在TNBC中细胞-细胞相互作用更活跃,尤其是巨噬细胞与其他细胞群体间的相互作用。
TNBC是一种具有广泛的瘤内异质性的侵袭亚型。最近的技术发展允许在转录水平上对肿瘤微环境进行越来越可靠和综合的单细胞分析,这有助于观察细胞群体和细胞间的串扰。本发明中,我们利用scRNA-seq与bulk转录组数据相结合,系统分析TNBC肿瘤微环境中的细胞成分。肿瘤的发生受基因改变的肿瘤细胞和肿瘤微环境中非恶性宿主细胞的控制,广泛影响肿瘤的进展、转移和治疗结果。TNBC的肿瘤微环境由B细胞、树突状细胞、内皮细胞、上皮细胞、成纤维细胞、巨噬细胞、单核细胞、浆细胞和T细胞组成,它们中的大多数如B细胞、树突状细胞、成纤维细胞、巨噬细胞、浆细胞和T细胞等在TNBC中的丰度高于非TNBC。结合bulk转录组分析,巨噬细胞在TNBC微环境中显著丰富。此外,我们的工作提供了非TNBC和TNBC微环境中细胞相互作用的两个图谱,TNBC微环境中存在更多的活性细胞-细胞串扰,尤其是巨噬细胞与其他细胞群体的串扰,揭示了巨噬细胞在TNBC中的重要意义。
第三部分、确定预测TNBC预后效果的标记基因
将与TNBC巨噬细胞相关的差异表达转录因子和DEG纳入单变量cox回归分析,结果表明八个基因与TNBC预后显著相关(p≤0.05),包括C12orf60、CTSD、CTSL、ELK4、FCGR2A、FOLR2、HSPA8和XRCC4,这些潜在标记基因被用于构建LASSO模型。首先我们将TCGA TNBC样本随机分为训练集与测试集。在训练队列中,对回归系数≠0的特征基因进行LASSO分析。在λ最小值=0.0267的情况下,如图9和图10所示,最终确定了五个特征基因,包括CTSD、CTSL、ELK4、HSPA8和XRCC4,进一步研究发现的,所述基因CTSD、CTSL、HSPA8或XRCC4的基因表达值与预后效果呈现负相关,所述基因ELK4的基因表达值与预后效果呈现正相关,也即是CTSD、CTSL、HSPA8或XRCC4的基因表达值越高提示预后效果越差,ELK4的基因表达值越高提示预后效果越好。
第四部分、构建预测TNBC预后效果的风险评分模型
基于LASSO回归分析确定所述五个标记基因的LASSO系数,如图11和图12所示,建立了用于预测TNBC预后效果的风险评分模型,所述风险评分模型为:
每个样本的风险评分=0.8959575100676907*CTSD基因表达值+0.02107000891980921*CTSL基因表达值+(-0.64413818956012)*ELK4基因表达值+0.307340530719732*HSPA8基因表达值+1.31660312733179*XRCC4基因表达值。风险评分>中位风险评分的患者被定义为高风险、高风险患者或高风险组,而风险评分≤中位风险得分的患者被界定为低风险、低风险患者或低风险组,结合图13、图14和图15可以看出,与低风险组相比,高风险组拥有更多的死亡或复发/进展危险。生存分析表明,训练集中高危患者的OS时间显著缩短,如图16所示,这种生存差异在测试集和整个队列中均得到了证实,如图17和图18所示。此外,绘制了ROC以评估该模型的预测功效,在训练集(图19)、测试集(图20)和整个队列(图21)中,该模型都能够很好地预测患者的一年生存率(AUC>0.9),对三年生存率的预测(AUC>0.74)及对五年生存率的预测(AUC>0.75)均能够给出一定的参考。
GSE96058和GSE45255队列被用于独立证明巨噬细胞相关标记基因对患者生存的作用。在GSE96058队列中,图22显示出高风险病例的OS比低风险病例更差,图23显示出该模型能够准确预测一年生存期。而在GSE45255队列中,图24和图25显示出高危病例具有更短的DFS时间,说明前述所述标记基因及由其构建的风险评分模型在DFS预测方面具有可靠的作用。这些发现进一步证明了基于巨噬细胞相关标记基因的预后模型的适用性。
第五部分、基于巨噬细胞的预后模型与临床病理特征的相关性:
进一步分析了基于巨噬细胞相关标记基因的预后模型与TNBC临床病理特征之间的相关性。图26-图29显示出T、N、M分期和病理分期处于更晚期阶段的TNBC患者的风险评分明显更高。此外,图30显示出风险评分结果与肿瘤纯度呈负相关。图31示出了GSE96058队列中不同组织学分级的风险评分分布,图32示出了GSE45255队列中不同组织学分级的风险评分分布,结果显示组织学分级更高的患者表现出了显著更高的风险评分。因此基于上述结论可知基于巨噬细胞相关标记基因的预后效果预测模型与TNBC患者的更晚期状态有关,也即是评分越高提示患者的T、N、M分期和病理分期越易处于更晚期的阶段。
第六部分、高危患者对免疫疗法更有反应:
与低风险组相比,图33显示了高风险组表现出更高的T细胞炎症评分,图34显示了高风险组表现出更低的TIDE评分。图35显示出,包括CD80、CD86、IDO1、LAG3、LAIR1、PDCD1、HAVCR2和LGALS3在内的大多数免疫检查点在高风险组和低风险组中的表达显著较高。上述发现证明,高危患者更易对免疫疗法有反应,因此前述模型可用于判断患者是否易对免疫疗法有反应,从而可用于免疫疗法患者的前期筛查,更精准性的为患者提供合适的治疗方案。应当理解的是,本发明并非用于对疾病的诊断和治疗,也即是医疗从业者选择何种诊断和/或治疗方法并不被限制于本申请的保护范围之内。
患者间和肿瘤内的异质性使预测性生物标志物的鉴定和TNBC的有效治疗复杂化,基于此,本发明提出了基于巨噬细胞的相关标记基因,所述标记基因包括CTSD、CTSL、ELK4、HSPA8和XRCC4,所述标记基因可用于预测三阴性乳腺癌患者预后效果,特别是基于所述标记基因搭建的风险评分模型可用于预测不良预后。基于外部验证,风险评分模型能够可靠地预测TNBC患者的预后,尤其是一年生存期。体细胞突变在低风险和高风险TNBC患者之间存在广泛的异质性。此外,根据较高的T细胞炎症评分、较低的TIDE评分、上调的免疫检查点分子(CD80、CD86、IDO1、LAG3、LAIR1、PDCD1、HAVCR2和LGALS3),高危患者对免疫疗法表现出较高的反应。因此,巨噬细胞相关标记基因特征在估计TNBC的预后和治疗反应方面显示出潜力。
上述实施例中的常规技术为本领域技术人员所知晓的现有技术,故在此不再详细赘述。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
尽管对本发明已作出了详细的说明并引证了一些具体实施例,但是对本领域熟练技术人员来说,只要不离开本发明的精神和范围可作各种变化或修正是显然的。
虽然上述具体实施方式已经显示、描述并指出应用于各种实施方案的新颖特征,但应理解,在不脱离本公开内容的精神的前提下,可对所说明的装置或方法的形式和细节进行各种省略、替换和改变。另外,上述各种特征和方法可彼此独立地使用,或可以各种方式组合。所有可能的组合和子组合均旨在落在本公开内容的范围内。上述许多实施方案包括类似的组分,并且因此,这些类似的组分在不同的实施方案中可互换。虽然已经在某些实施方案和实施例的上下文中公开了本发明,但本领域技术人员应理解,本发明可超出具体公开的实施方案延伸至其它的替代实施方案和/或应用以及其明显的修改和等同物。因此,本发明不旨在受本文优选实施方案的具体公开内容限制。
本发明未尽事宜均为公知技术。

Claims (10)

1.三阴性乳腺癌预后效果的预测模型,其特征在于所述预测模型为:
每个样本的风险评分=0.8959575100676907*CTSD基因表达值+0.02107000891980921*CTSL基因表达值+(-0.64413818956012)*ELK4基因表达值+0.307340530719732*HSPA8基因表达值+1.31660312733179*XRCC4基因表达值。
2.根据权利要求1所述的三阴性乳腺癌预后效果的预测模型,其特征在于:
风险评分>中位风险评分的患者被定义为高风险患者,风险评分≤中位风险评分的患者被定义为低风险患者。
3.权利要求1或2所述三阴性乳腺癌预后效果的预测模型的构建方法,其特征在于所述方法包括:
将与TNBC巨噬细胞相关的差异表达转录因子和DEG纳入单变量cox回归分析,将p≤0.05的基因定义为潜在标记基因;潜在标记基因共有八个,包括C12orf60、CTSD、CTSL、ELK4、FCGR2A、FOLR2、HSPA8和XRCC4;
将TCGA TNBC样本随机分为训练集与测试集;
在训练集中,对回归系数≠0的特征基因进行LASSO分析,在λ最小值=0.0267的情况下,最终确定了五个标记基因,包括CTSD、CTSL、ELK4、HSPA8和XRCC4;
基于LASSO回归分析确定所述五个标记基因的LASSO系数,建立三阴性乳腺癌预后效果的预测模型。
4.根据权利要求3所述的三阴性乳腺癌预后效果的预测模型的构建方法,其特征在于:
使用R语言软件的glmnet包进行LASSO回归分析。
5.用于预测三阴性乳腺癌预后效果的试剂盒,其特征在于所述试剂盒包括:
标记基因:CTSD基因、CTSL基因、ELK4基因、HSPA8基因和XRCC4基因;及
权利要求1或2所述三阴性乳腺癌预后效果的预测模型。
6.采用权利要求5所述试剂盒预测三阴性乳腺癌预后效果的方法,其特征在于包括如下步骤:
检测三阴性乳腺癌患者样本中5个标记基因的基因表达,将各基因所对应的基因表达值代入预测模型,依据每个样本的风险评分结果预测对应患者的预后效果。
7.根据权利要求6所述的方法,其特征在于:
所述样本为肿瘤组织样本。
8.根据权利要求6或7所述的方法,其特征在于:
所述依据每个样本的风险评分结果预测对应患者的预后效果具体包括:
与低风险患者相比,高风险患者具有更大的死亡或复发/进展风险;和/或
风险评分越高,预测患者治疗后的生存率越高;和/或
更高的风险评分预示着患者的组织学分级更高,相应的T、N、M分期和/或病理分期处于更晚期阶段;和/或
更高风险评分的患者更易对免疫疗法有反应。
9.权利要求5所述试剂盒的应用,其特征在于包括:
检测获得三阴性乳腺癌患者样本中5个标记基因的基因表达值,将各基因表达值代入下述预测模型,获得每个样本所属患者的风险评分,依据每个样本的风险评分结果预测对应患者的预后效果。
10.权利要求9所述的应用,其特征在于:
所述依据每个样本的风险评分结果预测对应患者的预后效果具体包括:
与低风险患者相比,高风险患者具有更大的死亡或复发/进展风险;和/或
风险评分越高,预测患者治疗后的生存率越高;和/或
更高的风险评分预示着患者的组织学分级更高,相应的T、N、M分期和/或病理分期处于更晚期阶段;和/或
更高风险评分的患者更易对免疫疗法有反应。
CN202311416742.8A 2023-09-21 2023-10-30 三阴性乳腺癌预后效果的预测模型及其应用 Pending CN117153241A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2023112201602 2023-09-21
CN202311220160 2023-09-21

Publications (1)

Publication Number Publication Date
CN117153241A true CN117153241A (zh) 2023-12-01

Family

ID=88885263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311416742.8A Pending CN117153241A (zh) 2023-09-21 2023-10-30 三阴性乳腺癌预后效果的预测模型及其应用

Country Status (1)

Country Link
CN (1) CN117153241A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100285456A1 (en) * 2009-05-05 2010-11-11 Jaime Matta Method for using DNA repair capacity as a biomarker of breast cancer risk in women
US20200239968A1 (en) * 2017-10-12 2020-07-30 The Institute Of Cancer Research: Royal Cancer Hospital Prognostic and treatment response predictive method
CN112592977A (zh) * 2020-12-31 2021-04-02 哈尔滨工业大学 一种乳腺癌预后的标记物及应用
CN114300139A (zh) * 2022-01-13 2022-04-08 澳门科技大学 一种乳腺癌预后模型的构建及其应用方法和存储介质
CN114496066A (zh) * 2022-04-13 2022-05-13 南京墨宁医疗科技有限公司 一种三阴性乳腺癌预后的基因模型的构建方法及其应用
CN115424669A (zh) * 2022-08-18 2022-12-02 南方医科大学南方医院 一种基于lr评分的三阴性乳腺癌疗效及预后评估模型
CN116525005A (zh) * 2023-03-30 2023-08-01 浙江大学医学院附属第一医院 巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100285456A1 (en) * 2009-05-05 2010-11-11 Jaime Matta Method for using DNA repair capacity as a biomarker of breast cancer risk in women
US20200239968A1 (en) * 2017-10-12 2020-07-30 The Institute Of Cancer Research: Royal Cancer Hospital Prognostic and treatment response predictive method
CN112592977A (zh) * 2020-12-31 2021-04-02 哈尔滨工业大学 一种乳腺癌预后的标记物及应用
CN114300139A (zh) * 2022-01-13 2022-04-08 澳门科技大学 一种乳腺癌预后模型的构建及其应用方法和存储介质
CN114496066A (zh) * 2022-04-13 2022-05-13 南京墨宁医疗科技有限公司 一种三阴性乳腺癌预后的基因模型的构建方法及其应用
CN115424669A (zh) * 2022-08-18 2022-12-02 南方医科大学南方医院 一种基于lr评分的三阴性乳腺癌疗效及预后评估模型
CN116525005A (zh) * 2023-03-30 2023-08-01 浙江大学医学院附属第一医院 巨噬细胞标记基因在肝癌预后中的应用及其风险评估模型

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUAN HUANG等: "gration of single-cell and bulk transcriptomeanalyses unravels a macrophage-based gene signaturefor prognostication and treatment in triple-negativebreast cancer", RESEARCH SQUARE, pages 4 - 8 *
窦艳;邱鹏;王丽;刘晓丽;庞文帅;: "逆转诱导蛋白、基质金属蛋白酶9联合检测对三阴性乳腺癌的诊断价值", 中国社区医师, no. 11 *

Similar Documents

Publication Publication Date Title
Zhang et al. A novel long noncoding RNA LINC01133 is upregulated in lung squamous cell cancer and predicts survival
Shi et al. Serum miR-626 and miR-5100 are promising prognosis predictors for oral squamous cell carcinoma
Skibsted et al. Bench-to-bedside review: future novel diagnostics for sepsis-a systems biology approach
US20160186270A1 (en) Signature of cycling hypoxia and use thereof for the prognosis of cancer
CN113462776B (zh) m6A修饰相关联合基因组在预测肾透明细胞癌患者免疫治疗疗效中的应用
Limame et al. Expression profiling of migrated and invaded breast cancer cells predicts early metastatic relapse and reveals Krüppel-like factor 9 as a potential suppressor of invasive growth in breast cancer
Kidd et al. High expression of SCHLAP1 in primary prostate cancer is an independent predictor of biochemical recurrence, despite substantial heterogeneity
Liu et al. Long non-coding RNA SNHG25 promotes epithelial ovarian cancer progression by up-regulating COMP
Yamaguchi et al. Molecular and clinical features of the TP53 signature gene expression profile in early-stage breast cancer
Dou et al. An eight-miRNA signature expression-based risk scoring system for prediction of survival in pancreatic adenocarcinoma
Zhou et al. Development of a Ten‐lncRNA Signature Prognostic Model for Breast Cancer Survival: A Study with the TCGA Database
Dwivedi et al. Application of single-cell omics in breast cancer
Shi et al. CircRNA hsa_circ_0006220 acts as a tumor suppressor gene by regulating miR-197-5p/CDH19 in triple-negative breast cancer
Zhang et al. Identification of lung-adenocarcinoma-related long non-coding RNAs by random walking on a competing endogenous RNA network
WO2015154715A1 (en) A method of diagnosis, prognosis or treatment of a cancer
Zhao et al. Glucoside xylosyltransferase 2 as a diagnostic and prognostic marker in gastric cancer via comprehensive analysis
Sun et al. Combining WGCNA and machine learning to construct basement membrane-related gene index helps to predict the prognosis and tumor microenvironment of HCC patients and verifies the carcinogenesis of key gene CTSA
Zheng et al. Construction of the Six-lncRNA prognosis signature as a novel biomarker in esophageal squamous cell carcinoma
CN115505644A (zh) 一种预测头颈部鳞癌化疗药效的试剂盒及其应用
CN117153241A (zh) 三阴性乳腺癌预后效果的预测模型及其应用
CN116970706A (zh) 用于预测三阴性乳腺癌预后效果的标记基因及其应用
EP2550534A1 (en) Prognosis of oesophageal and gastro-oesophageal junctional cancer
CN111808966B (zh) miRNA在诊断乳腺癌患病风险的应用
CN116092674A (zh) 外泌体介导的胃癌总体生存率预后模型及构建方法和应用
Dadiani et al. Tumor evolution inferred by patterns of microRNA expression through the course of disease, therapy, and recurrence in breast cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination