CN116434832A - 一种量化肿瘤高内皮微静脉的基因集的构建方法及系统 - Google Patents

一种量化肿瘤高内皮微静脉的基因集的构建方法及系统 Download PDF

Info

Publication number
CN116434832A
CN116434832A CN202310260957.9A CN202310260957A CN116434832A CN 116434832 A CN116434832 A CN 116434832A CN 202310260957 A CN202310260957 A CN 202310260957A CN 116434832 A CN116434832 A CN 116434832A
Authority
CN
China
Prior art keywords
endothelial
tumor
cells
cell
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310260957.9A
Other languages
English (en)
Other versions
CN116434832B (zh
Inventor
白雪
杜坤恒
张艳培
郭泽钦
董忠谊
吴德华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Hospital Southern Medical University
Original Assignee
Southern Hospital Southern Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Hospital Southern Medical University filed Critical Southern Hospital Southern Medical University
Priority to CN202310260957.9A priority Critical patent/CN116434832B/zh
Publication of CN116434832A publication Critical patent/CN116434832A/zh
Application granted granted Critical
Publication of CN116434832B publication Critical patent/CN116434832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种量化肿瘤高内皮微静脉的基因集的构建方法及系统,包括以下步骤:收集肿瘤患者数据;基于所述肿瘤患者数据,注释出肿瘤组织中的内皮细胞;对所述内皮细胞进行分群,生成内皮细胞亚群;计算各内皮细胞亚群的差异表达基因,并注释出内皮细胞中的毛细血管后微静脉内皮细胞亚群;筛选出在毛细血管后微静脉内皮细胞相对高表达、且在肿瘤中其他类型的细胞中相对低表达的基因;进一步筛选出上一步保留基因中表达量与淋巴细胞丰度显著正相关的基因,构成基因集。本发明不仅可以用于表征肿瘤组织中高内皮微静脉的特点,还有助于筛选出免疫治疗的获益人群,使丰富的转录组数据得到更好的利用,具有重要的意义和临床应用价值。

Description

一种量化肿瘤高内皮微静脉的基因集的构建方法及系统
技术领域
本发明属于生物医药技术领域,具体涉及一种量化肿瘤高内皮微静脉的基因集的构建方法及系统。
背景技术
高内皮微静脉是一种特殊的毛细血管后微静脉,存在于除脾脏外的淋巴器官或淋巴组织。在肿瘤及许多慢性炎症性疾病中,也有高内皮微静脉在非淋巴组织中发育。高内皮微静脉的特征是表达高水平的硫酸化唾液酸黏蛋白以结合淋巴细胞上的L-选择素,其作用是促进淋巴细胞从血液转移到淋巴器官、淋巴组织和发炎组织当中。
利用抗PD-1或抗CTLA-4抗体进行免疫检查点阻断(ICB)治疗已被证明可为不同类型癌症的许多患者提供治疗益处。淋巴细胞,尤其是分化程度较低、功能障碍较少的CD8+T细胞向肿瘤的转移是抗癌症免疫和免疫治疗(ICB、疫苗或过继性T细胞疗法)的关键环节。作为专职运输淋巴细胞的血管,肿瘤中高内皮微静脉是淋巴细胞进入肿瘤的主要途径,更多的高内皮微静脉可以增强这些关键细胞的浸润,从而提高ICI的疗效。
目前识别肿瘤中的高内皮微静脉主要通过形态学的方法或其与硫酸化唾液酸黏蛋白抗体(如MECA-79)的特异性结合,但如何从转录组层面评估肿瘤内高内皮微静脉丰度以及识别高内皮微静脉,仍然缺乏有效的方法。因此构建一个用于评估肿瘤内高内皮微静脉丰度的基因集,对于更好的利用肿瘤组织的转录组数据、表征肿瘤组织中高内皮微静脉的特点、筛选出免疫治疗的获益人群有重要的意义。
发明内容
本发明提出一种量化肿瘤高内皮微静脉的基因集的构建方法及系统,不仅可以用于表征肿瘤组织中高内皮微静脉的特点,还有助于筛选出免疫治疗的获益人群,使丰富的转录组数据得到更好的利用,具有重要的意义和临床应用价值。
为实现上述目的,本发明提供了如下方案:
一种量化肿瘤高内皮微静脉的基因集的构建方法,包括以下步骤:
S1.收集肿瘤患者数据;
S2.基于所述肿瘤患者数据,注释出肿瘤组织中的内皮细胞;
S3.对所述内皮细胞进行分群,生成内皮细胞亚群;
S4.计算各内皮细胞亚群的差异表达基因,并注释出内皮细胞中的毛细血管后微静脉内皮细胞亚群;
S5.筛选出在毛细血管后微静脉内皮细胞相对高表达、且在肿瘤中其他类型的细胞中相对低表达的基因;
S6.进一步筛选出S5保留基因中表达量与淋巴细胞丰度显著正相关的基因,构成基因集。
优选的,S1中收集肿瘤患者数据包括:未经治疗的肿瘤患者的肿瘤组织单细胞转录组测序数据、癌症基因组图谱数据库中肿瘤患者的肿瘤组织转录组测序数据。
优选的,所述肿瘤组织单细胞转录组测序数据包括12种肿瘤的单细胞转录组测序数据:乳腺癌E-MTAB-8107,结直肠癌E-MTAB-8107、GSE132465、GSE144735,卵巢癌E-MTAB-8107,基底细胞癌GSE123813,前列腺癌GSE141445,肝内胆管癌GSE138709,胰腺神经内分泌肿瘤GSE162708,黑色素瘤GSE189889,肾细胞癌GSE152938,胰腺导管腺癌GSE155698,头颈部鳞状细胞癌GSE103322和非小细胞肺癌GSE127465、GSE131907。
优选的,所述S5包括:基因至少在70%单细胞转录组测序数据中满足在毛细血管后微静脉内皮细胞中的平均表达量的z评分大于1.8,且在其他各类型的细胞中的平均表达量的z评分均小于0.8。
优选的,S6中基因中表达量的数据为癌症基因组图谱数据库中19种常见肿瘤的肿瘤组织转录组测序数据,包括子宫内膜癌、甲状腺癌、胃腺癌、皮肤黑色素瘤、直肠腺癌、前列腺癌、胰腺癌、卵巢浆液性囊腺癌、肺鳞状细胞癌、肺腺癌、肝细胞癌、肾乳头状细胞癌、肾透明细胞癌、头颈部鳞状细胞、食管癌、结肠癌、宫颈癌、乳腺癌、膀胱癌。
优选的,所述S6中淋巴细胞包括:B细胞、CD4+T细胞、CD4+初始T细胞、CD8+T细胞、CD8+初始T细胞、细胞毒性T细胞、中央记忆型T细胞、效应记忆型T细胞8类细胞。
优选的,所述S6中的淋巴细胞丰度从免疫细胞丰度识别器数据库中获取。
优选的,S6包括:在19种肿瘤中计算19×8次基因表达量与免疫细胞丰度之间的皮尔森相关系数,至少19次计算得到的相关系数大于0.3且P值小于0.05。
本发明还提供一种量化肿瘤高内皮微静脉的基因集的构建系统,包括:收集数据模块、注释模块、细胞分群模块、计算差异基因模块、筛选模块和筛选构建基因集模块;
所述收集数据模块用于收集肿瘤患者的数据;
所述注释模块基于所述收集数据模块收集的肿瘤患者数据注释出肿瘤组织中的内皮细胞;
所述细胞分群模块用于对所述注释模块注释的内皮细胞进行分群;
所述计算差异基因模块用于对分群后的内皮细胞亚群计算差异表达基因,并注释出内皮细胞中的毛细血管后微静脉内皮细胞亚群;
所述筛选模块用于筛选出在毛细血管后微静脉内皮细胞相对高表达、且在肿瘤中其他类型的细胞中相对低表达的基因;
所述筛选构建基因集模块用于进一步筛选保留基因中表达量与淋巴细胞丰度显著正相关的基因,构成基因集。
本发明的有益效果为:
本发明提供了一种用于评估肿瘤内高内皮微静脉丰度的基因集的构建方法及系统,不仅可以用于表征肿瘤组织中高内皮微静脉的特点,还有助于筛选出免疫治疗的获益人群,使丰富的转录组数据得到更好的利用,具有重要的意义和临床应用价值。
附图说明
为了更清楚地说明本发明的技术方案,下面对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的构建用于评估肿瘤内高内皮微静脉丰度的基因集的流程示意图;
图2为本发明实施例的注释出单细胞数据集中毛细血管后微静脉的主要结果示意图,其中A为内皮细胞整合后的统一流形逼近与投影示意图,B为各亚群中包含来自个数据的细胞数的比例示意图,C为各亚群高表达的标志基因的热示意图,D为根据标记基因确定的细胞类型的UMAP图;
图3为本发明实施例的67个毛细血管后微静脉内皮细胞显著高表达的基因在各类型细胞中的平均表达量热示意图;
图4为本发明实施例的14个在毛细血管后微静脉内皮细胞中特异性高表达基因的表达量与8种淋巴细胞丰度的相关系数气泡示意图;其中UCEC为子宫内膜癌;THCA为甲状腺癌;STAD为胃腺癌;SKCM为皮肤黑色素瘤;READ为直肠腺癌;PRAD为前列腺癌;PAAD为胰腺癌;OV为卵巢浆液性囊腺癌;LUSC为肺鳞状细胞癌;LUAD为肺腺癌;LIHC为肝细胞癌;KIRP为肾乳头状细胞癌;KIRC为肾透明细胞癌;HNSC为头颈部鳞状细胞;ESCA为食管癌;COAD为结肠癌;CESC为宫颈癌;BRCA为乳腺癌;BLCA为膀胱癌;B_cell为B细胞;CD4_T为CD4+T细胞;CD4_naive为CD4+初始T细胞;CD8_T为CD8+T细胞;CD8_naive为CD8+初始T细胞;Tc为细胞毒性T细胞;Tcm为中央记忆型T细胞;Tem为效应记忆型T细胞;实心圆圈代表相关系数为正,空心圆圈代表相关系数为负,颜色越深P值越小;
图5为本发明实施例的高内皮微静脉基因集的评分在不同内皮细胞样本的分组散点示意图;双尾t检验,P<0.05;
图6为本发明实施例的高内皮微静脉基因集评分与淋巴细胞丰度在空间转录组测序肿瘤切片的可视化示意图;
图7为本发明实施例的高内皮微静脉基因集评分高低组的Kaplan-Meier生存曲线,A为GSE91061队列的总生存曲线(log-rank检验,P=0.0417),B为DavidLiu队列的无进展生存曲线(log-rank检验,P=0.0287),C为DavidLiu队列的总生存曲线(log-rank检验,P=0.0052);
图8为本发明实施例的高内皮微静脉基因集评分在不同免疫治疗响应组的分组散点示意图;(其中CR/PR为完全缓解或部分缓解;SD/PD为疾病稳定或疾病进展。双尾t检验,P<0.01);
图9为本发明实施例的整体结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,为本发明实施例的一种量化肿瘤高内皮微静脉的基因集的构建方法流程示意图,包括以下步骤:
S1.收集肿瘤患者数据;
S2.基于所述肿瘤患者数据,注释出肿瘤组织中的内皮细胞;
S3.对所述内皮细胞进行分群,生成内皮细胞亚群;
S4.计算各内皮细胞亚群的差异表达基因,并注释出内皮细胞中的毛细血管后微静脉内皮细胞亚群;
S5.筛选出在毛细血管后微静脉内皮细胞相对高表达、且在肿瘤中其他类型的细胞中相对低表达的基因;
S6.进一步筛选出S5保留基因中表达量与淋巴细胞丰度显著正相关的基因,构成基因集。
实施例1:
筛选高内皮微静脉相关基因:
一、数据来源
来自基因表达综合数据库(GeneExpressionOmnibusdatabase,GEO)的单细胞转录组测序数据GSE123813、GSE132465、GSE144735、GSE141445、GSE138709、GSE162708、GSE189889、GSE131907、GSE152938、GSE155698、GSE103322、GSE127465,来自欧洲分子生物学实验室-欧洲生物信息研究所(EuropeanMolecularBiologyLaboratory-EuropeanBioinformatics Institute,EMBL-EBI)数据库的单细胞转录组测序数据E-MTAB-8107,包括:乳腺癌、结直肠癌、卵巢癌、基底细胞癌、前列腺癌、肝内胆管癌、胰腺神经内分泌肿瘤、黑色素瘤、肾细胞癌、胰腺导管腺癌、头颈部鳞状细胞癌、非小细胞肺癌等癌症。来自癌症基因组图谱(TheCancerGenomeAtlas,TCGA)数据库的子宫内膜癌(UCEC)、甲状腺癌(THCA)、胃腺癌(STAD)、皮肤黑色素瘤(SKCM)、直肠腺癌(READ)、前列腺癌(PRAD)、胰腺癌(PAAD)、卵巢浆液性囊腺癌(OV)、肺鳞状细胞癌(LUSC)、肺腺癌(LUAD)、肝细胞癌(LIHC)、肾乳头状细胞癌(KIRP)、肾透明细胞癌(KIRC)、头颈部鳞状细胞(HNSC)、食管癌(ESCA)、结肠癌(COAD)、宫颈癌(CESC)、乳腺癌(BRCA)、膀胱癌(BLCA)等19种常见肿瘤的组织测序数据。从免疫细胞丰度识别器(ImmuneCell AbundanceIdentifier,ImmuCellAI)数据库中获取的上述19种肿瘤的淋巴细胞丰度数据。
二、筛选毛细血管后微静脉内皮细胞特异性高表达的基因
利用R语言Seurat程序包对上述单细胞数据进行分群,根据数据来源文献的分群方法结合经典的细胞标志基因,对细胞亚群进行注释。提取出其中的内皮细胞亚群,将17个数据中的内皮细胞进行整合,如图2A,2B。用Seurat程序包对整合后的数据进一步分群,再根据VWF、CSRP2、SLCO2A1、NR2F2、VCAN、FBLN2、SELE、SELP、ACKR1等毛细血管后微静脉内皮细胞的标志基因的表达情况,注释出毛细血管后微静脉内皮细胞,如图2C,2D。利用FindMarker函数计算出毛细血管后微静脉内皮细胞显著高表达的基因,设置阈值为log2FC>0.3且校正P值小于0.05,得到67个基因。
在17个单细胞测序数据中分别计算上述67个基因在各类型细胞中的平均表达值的z评分。z评分是一种常用的、公认的统计指标,计算方法是(x-μ)/σ。保留至少在12个数据中满足在毛细血管后微静脉内皮细胞中的平均表达量的z评分大于1.8,且在其他各类型的细胞中的平均表达量的z评分均小于0.8的14个基因,即为在毛细血管后微静脉内皮细胞特异性高表达的基因,如图3。
三、筛选表达量与淋巴细胞丰度显著正相关的基因
根据来自TCGA数据库的19种常见肿瘤中上述14个基因在个样本的表达量和来自ImmuCellAI数据库中对应样本的B细胞、CD4+T细胞、CD4+初始T细胞、CD8+T细胞、CD8+初始T细胞、细胞毒性T细胞、中央记忆型T细胞、效应记忆型T细胞等8类淋巴细胞的丰度,计算基因表达量与各种细胞之间的皮尔森相关系数,保留至少19次计算得到的相关系数大于0.3且P值小于0.05的基因。最终得到HAPLN3、SELP、ACKR1、MEOX1、IL33、SELE、CPXM2等7个基因,其表达量与淋巴细胞丰度显著正相关,如图4。
上述7个基因特异性表达与毛细血管后微静脉,且与淋巴细胞浸润到肿瘤显著相关,即可构成高内皮微静脉相关基因集。
实施例2:
验证基因集用于评估肿瘤中高内皮微静脉丰度及识别高内皮微静脉的效果一、数据来源
来自GEO数据库的组织测序数据GSE196703(包含8个非高内皮微静脉样本和4个高内皮微静脉样本)、空间转录组测序数据GSE175540(包含3个肾癌样本)。
二、高内皮微静脉相关基因集的评分在不同内皮细胞样本中的比较
利用R语言程序包gsva计算高内皮微静脉相关基因集在上述数据GSE196703中12个样本的GSVA评分。评分在高内皮微静脉样本中明显高于非高内皮微静脉(图5,双尾t检验,P<0.05)。
三、高内皮微静脉相关基因集评分高的区域与淋巴细胞聚集区域的共定位
利用R语言程序包Seurat中的AddModuleScore函数计算高内皮微静脉相关基因集在上述空间转录组测序数据中每个检测点的基因集评分,利用xCell程序包计算每个检测点的淋巴细胞丰度,随后对每个检测点的评分或淋巴细胞丰度进行可视化如图6。在上述3个样本中,高内皮微静脉相关基因集评分高的区域与淋巴细胞聚集区域明显共定位。
实施例3:
验证基因集用于预测免疫检查点抑制剂免疫治疗疗效的效果
一、数据来源
来自GEO数据库的临床队列GSE91061(黑色素瘤,包含50例抗PD-1和抗CTLA-4治疗的患者),DavidLiu等2019年公布的临床队列(转移性黑色素瘤,包含121例抗PD-1治疗的患者)。
二、高内皮微静脉相关基因集的评分与患者生存及药物反应之间的关系
利用R语言程序包gsva计算高内皮微静脉相关基因集在上述数据中各样本的GSVA评分。利用评分的中位数将各队列分为基因集评分高和基因集评分低两组。绘制各队列两组患者的总生存或无进展生存的Kaplan-Meier曲线图,如图7。基因集评分高的患者的生存与基因集评分低的患者明显更具有优势(log-rank检验,GSE91061总生存P=0.0417;DavidLiu总生存P=0.0052,无进展生存P=0.0287)。此外,在GSE91061队列中,对免疫治疗有响应的患者(CR/PR)与对免疫治疗无响应的患者(SD/PD),基因及评分显著更高,见图8。双尾t检验,P<0.01。
实施例4:
如图9所示,为本发明的一种量化肿瘤高内皮微静脉的基因集的构建系统结构示意图,包括:收集数据模块、注释模块、细胞分群模块、计算差异基因模块、筛选模块和筛选构建基因集模块;
所述收集数据模块用于收集肿瘤患者的数据;
所述注释模块基于所述收集数据模块收集的肿瘤患者数据注释出肿瘤组织中的内皮细胞;
所述细胞分群模块用于对所述注释模块注释的内皮细胞进行分群;
所述计算差异基因模块用于对分群后的内皮细胞亚群计算差异表达基因,并注释出内皮细胞中的毛细血管后微静脉内皮细胞亚群;
所述筛选模块用于筛选出在毛细血管后微静脉内皮细胞相对高表达、且在肿瘤中其他类型的细胞中相对低表达的基因;
所述筛选构建基因集模块用于进一步筛选保留基因中表达量与淋巴细胞丰度显著正相关的基因,构成基因集。
以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (9)

1.一种量化肿瘤高内皮微静脉的基因集的构建方法,其特征在于,包括以下步骤:
S1.收集肿瘤患者数据;
S2.基于所述肿瘤患者数据,注释出肿瘤组织中的内皮细胞;
S3.对所述内皮细胞进行分群,生成内皮细胞亚群;
S4.计算各内皮细胞亚群的差异表达基因,并注释出内皮细胞中的毛细血管后微静脉内皮细胞亚群;
S5.筛选出在毛细血管后微静脉内皮细胞相对高表达、且在肿瘤中其他类型的细胞中相对低表达的基因;
S6.进一步筛选出S5保留基因中表达量与淋巴细胞丰度显著正相关的基因,构成基因集。
2.根据权利要求1所述的量化肿瘤高内皮微静脉的基因集的构建方法,其特征在于,S1中收集肿瘤患者数据包括:未经治疗的肿瘤患者的肿瘤组织单细胞转录组测序数据、癌症基因组图谱数据库中肿瘤患者的肿瘤组织转录组测序数据。
3.根据权利要求2所述的量化肿瘤高内皮微静脉的基因集的构建方法,其特征在于,所述肿瘤组织单细胞转录组测序数据包括12种肿瘤的单细胞转录组测序数据:乳腺癌E-MTAB-8107,结直肠癌E-MTAB-8107、GSE132465、GSE144735,卵巢癌E-MTAB-8107,基底细胞癌GSE123813,前列腺癌GSE141445,肝内胆管癌GSE138709,胰腺神经内分泌肿瘤GSE162708,黑色素瘤GSE189889,肾细胞癌GSE152938,胰腺导管腺癌GSE155698,头颈部鳞状细胞癌GSE103322和非小细胞肺癌GSE127465、GSE131907。
4.根据权利要求1所述的量化肿瘤高内皮微静脉的基因集的构建方法,其特征在于,所述S5包括:基因至少在70%的单细胞转录组测序数据中满足在毛细血管后微静脉内皮细胞中的平均表达量的z评分大于1.8,且在其他各类型的细胞中的平均表达量的z评分均小于0.8。
5.根据权利要求1所述的量化肿瘤高内皮微静脉的基因集的构建方法,其特征在于,S6中基因中表达量的数据为癌症基因组图谱数据库中19种常见肿瘤的肿瘤组织转录组测序数据,包括子宫内膜癌、甲状腺癌、胃腺癌、皮肤黑色素瘤、直肠腺癌、前列腺癌、胰腺癌、卵巢浆液性囊腺癌、肺鳞状细胞癌、肺腺癌、肝细胞癌、肾乳头状细胞癌、肾透明细胞癌、头颈部鳞状细胞、食管癌、结肠癌、宫颈癌、乳腺癌、膀胱癌。
6.根据权利要求5所述的量化肿瘤高内皮微静脉的基因集的构建方法,其特征在于,所述S6中淋巴细胞包括:B细胞、CD4+T细胞、CD4+初始T细胞、CD8+T细胞、CD8+初始T细胞、细胞毒性T细胞、中央记忆型T细胞、效应记忆型T细胞8类细胞。
7.根据权利要求6所述的量化肿瘤高内皮微静脉的基因集的构建方法,其特征在于,所述S6中的淋巴细胞丰度从免疫细胞丰度识别器数据库中获取。
8.根据权利要求5所述的量化肿瘤高内皮微静脉的基因集的构建方法,其特征在于,步骤S6包括:在19种肿瘤中计算19×8次基因表达量与免疫细胞丰度之间的皮尔森相关系数,至少19次计算得到的相关系数大于0.3且P值小于0.05。
9.一种量化肿瘤高内皮微静脉的基因集的构建系统,其特征在于,包括:收集数据模块、注释模块、细胞分群模块、计算差异基因模块、筛选模块和筛选构建基因集模块;
所述收集数据模块用于收集肿瘤患者的数据;
所述注释模块基于所述收集数据模块收集的肿瘤患者数据注释出肿瘤组织中的内皮细胞;
所述细胞分群模块用于对所述注释模块注释的内皮细胞进行分群;
所述计算差异基因模块用于对分群后的内皮细胞亚群计算差异表达基因,并注释出内皮细胞中的毛细血管后微静脉内皮细胞亚群;
所述筛选模块用于筛选出在毛细血管后微静脉内皮细胞相对高表达、且在肿瘤中其他类型的细胞中相对低表达的基因;
所述筛选构建基因集模块用于进一步筛选保留基因中表达量与淋巴细胞丰度显著正相关的基因,构成基因集。
CN202310260957.9A 2023-03-17 2023-03-17 一种量化肿瘤高内皮微静脉的基因集的构建方法及系统 Active CN116434832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310260957.9A CN116434832B (zh) 2023-03-17 2023-03-17 一种量化肿瘤高内皮微静脉的基因集的构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310260957.9A CN116434832B (zh) 2023-03-17 2023-03-17 一种量化肿瘤高内皮微静脉的基因集的构建方法及系统

Publications (2)

Publication Number Publication Date
CN116434832A true CN116434832A (zh) 2023-07-14
CN116434832B CN116434832B (zh) 2024-03-08

Family

ID=87091727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310260957.9A Active CN116434832B (zh) 2023-03-17 2023-03-17 一种量化肿瘤高内皮微静脉的基因集的构建方法及系统

Country Status (1)

Country Link
CN (1) CN116434832B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000279181A (ja) * 1999-04-01 2000-10-10 Japan Science & Technology Corp ヒト樹状細胞の発現遺伝子群
CN102296115A (zh) * 2011-08-23 2011-12-28 杭州师范大学 Kit信号相关基因qpcr芯片
CN105557510A (zh) * 2014-12-19 2016-05-11 广东省农业科学院果树研究所 防控香蕉枯萎病的生物制剂和方法
CN106407689A (zh) * 2016-09-27 2017-02-15 牟合(上海)生物科技有限公司 一种基于基因表达谱的胃癌预后标志物筛选及分类方法
CN109456970A (zh) * 2018-11-21 2019-03-12 长江师范学院 调控番茄侧芽发育的SlARF10基因和SlmiR160b及其应用
CN110669782A (zh) * 2019-10-10 2020-01-10 南京农业大学 大豆糖转运体基因GmSWEET39的应用
CN110747275A (zh) * 2019-11-21 2020-02-04 中国医学科学院肿瘤医院 肿瘤细胞标记分子及其应用
CN111273010A (zh) * 2018-12-04 2020-06-12 北京蛋白质组研究中心 检测soat1蛋白表达水平的试剂盒在制备筛查肝细胞癌产品中的应用
CN111748627A (zh) * 2020-07-02 2020-10-09 北京化工大学 膀胱癌耗竭型t细胞亚群、其特征基因及其应用
CN113140258A (zh) * 2021-04-28 2021-07-20 上海海事大学 基于肿瘤浸润性免疫细胞筛选肺腺癌的潜在预后生物标志物的方法
CN113891941A (zh) * 2019-03-28 2022-01-04 特拉维夫大学拉莫特有限公司 修饰翻译的方法
CN115478092A (zh) * 2022-09-05 2022-12-16 中南大学湘雅二医院 用于预测乳腺癌免疫治疗效果的模型
CN115699107A (zh) * 2020-04-21 2023-02-03 苏黎世联邦理工学院 确定细胞的生物学特性之间的对应关系的方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000279181A (ja) * 1999-04-01 2000-10-10 Japan Science & Technology Corp ヒト樹状細胞の発現遺伝子群
CN102296115A (zh) * 2011-08-23 2011-12-28 杭州师范大学 Kit信号相关基因qpcr芯片
CN105557510A (zh) * 2014-12-19 2016-05-11 广东省农业科学院果树研究所 防控香蕉枯萎病的生物制剂和方法
CN106407689A (zh) * 2016-09-27 2017-02-15 牟合(上海)生物科技有限公司 一种基于基因表达谱的胃癌预后标志物筛选及分类方法
CN109456970A (zh) * 2018-11-21 2019-03-12 长江师范学院 调控番茄侧芽发育的SlARF10基因和SlmiR160b及其应用
CN111273010A (zh) * 2018-12-04 2020-06-12 北京蛋白质组研究中心 检测soat1蛋白表达水平的试剂盒在制备筛查肝细胞癌产品中的应用
CN113891941A (zh) * 2019-03-28 2022-01-04 特拉维夫大学拉莫特有限公司 修饰翻译的方法
CN110669782A (zh) * 2019-10-10 2020-01-10 南京农业大学 大豆糖转运体基因GmSWEET39的应用
CN110747275A (zh) * 2019-11-21 2020-02-04 中国医学科学院肿瘤医院 肿瘤细胞标记分子及其应用
CN115699107A (zh) * 2020-04-21 2023-02-03 苏黎世联邦理工学院 确定细胞的生物学特性之间的对应关系的方法
CN111748627A (zh) * 2020-07-02 2020-10-09 北京化工大学 膀胱癌耗竭型t细胞亚群、其特征基因及其应用
CN113140258A (zh) * 2021-04-28 2021-07-20 上海海事大学 基于肿瘤浸润性免疫细胞筛选肺腺癌的潜在预后生物标志物的方法
CN115478092A (zh) * 2022-09-05 2022-12-16 中南大学湘雅二医院 用于预测乳腺癌免疫治疗效果的模型

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
M. SUN ET AL: "An Efficient Mixed-Model for Screening Differentially Expressed Genes of Breast Cancer Based on LR-RF", 《IEEE/ACM TRANSACTIONS ON COMPUTATIONAL BIOLOGY AND BIOINFORMATICS》, pages 124 - 130 *
V. K. SHAH ET AL: "Bio-DRN: Robust and Energy-Efficient Bio-Inspired Disaster Response Networks", 《MASS》, pages 326 - 334 *
刘荆恺: "胰腺癌免疫亚型的发现及其在PD-1/PD-L1阻断治疗中的意义与机制研究", 《中国博士学位论文全文数据库医药卫生科技辑》, vol. 2022, no. 2, pages 072 - 359 *
吴亦琳: "通过单细胞转录组测序分析皮肤鳞状细胞癌肿瘤微环境", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》, vol. 2023, no. 1, pages 2 - 3 *
杜春平等: "BRAF基因突变型甲状腺乳头状癌组织基因表达及肿瘤微环境的变化", 《山东医药》, vol. 60, no. 28, pages 25 - 28 *

Also Published As

Publication number Publication date
CN116434832B (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
Chang et al. Haemoglobin, neutrophil to lymphocyte ratio and platelet count improve prognosis prediction of the TNM staging system in nasopharyngeal carcinoma: development and validation in 3237 patients from a single institution
Vatca et al. Retrospective analysis of the impact of HPV status and smoking on mucositis in patients with oropharyngeal squamous cell carcinoma treated with concurrent chemotherapy and radiotherapy
CN116157868A (zh) 用于游离dna片段大小密度以评估癌症的方法和系统
CN115153445A (zh) 腹腔镜肝切除治疗肝内胆管癌的远期预后的动态列线图模型构建方法、系统及应用
Zheng et al. Immune signature-based hepatocellular carcinoma subtypes may provide novel insights into therapy and prognosis predictions
CN109830264A (zh) 肿瘤患者基于甲基化位点进行分类的方法
CN102534008A (zh) 一种与非贲门癌辅助诊断相关的snp标志物及其应用
Nie et al. Characteristics of microbial distribution in different oral niches of oral squamous cell carcinoma
CN105586390A (zh) 一种用于乳腺癌预后判断的试剂盒
CN116434832B (zh) 一种量化肿瘤高内皮微静脉的基因集的构建方法及系统
CN111833963A (zh) 一种cfDNA分类方法、装置和用途
Wuxiao et al. A prognostic model to predict survival in stage III colon cancer patients based on histological grade, preoperative carcinoembryonic antigen level and the neutrophil lymphocyte ratio
Yu et al. Single-cell sequencing and establishment of an 8-gene prognostic model for pancreatic cancer patients
Xu et al. Yin Yang gene expression ratio signature for lung cancer prognosis
CN117038067A (zh) 神经内分泌型前列腺癌风险预测方法及其应用
CN113436741B (zh) 基于组织特异增强子区域dna甲基化的肺癌复发预测方法
WO2022151185A1 (zh) 基于游离dna的疾病预测模型及其构建方法和应用
Vazquez-Levin et al. Artificial intelligence: A step forward in biomarker discovery and integration towards improved cancer diagnosis and treatment
Huang et al. Immune analysis and small molecule drug prediction of hepatocellular carcinoma based on single sample gene set enrichment analysis
Yang et al. Transcriptome mapping of renal clear cell carcinoma revealed by machine learning algorithm based on enhanced computed tomography images
Piyathilake et al. Mandatory fortification with folic acid in the United States is not associated with changes in the degree or the pattern of global DNA methylation in cells involved in cervical carcinogenesis
Ocaña-Tienda et al. The macroscopic growth laws of brain metastases
CN114540493B (zh) 一种用于胰腺癌早期诊断的生物标志物及应用
Li et al. The machine-learning-mediated interface of microbiome and genetic risk stratification in neuroblastoma reveals molecular pathways related to patient survival. Cancers. 2022; 14
Upadhyay et al. EPV129/# 529 Long-term clinical and economic value of pembrolizumab+ lenvatinib compared with chemotherapy in previously treated advanced endometrial cancer patients in Sweden: a cost-effectiveness analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant