CN112863604A - 一种预测肿瘤间质化机制及治疗敏感性的方法 - Google Patents

一种预测肿瘤间质化机制及治疗敏感性的方法 Download PDF

Info

Publication number
CN112863604A
CN112863604A CN202110029152.4A CN202110029152A CN112863604A CN 112863604 A CN112863604 A CN 112863604A CN 202110029152 A CN202110029152 A CN 202110029152A CN 112863604 A CN112863604 A CN 112863604A
Authority
CN
China
Prior art keywords
data
interstitial
types
high strength
tumor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110029152.4A
Other languages
English (en)
Other versions
CN112863604B (zh
Inventor
沈帅
刘行
程文
吴安华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110029152.4A priority Critical patent/CN112863604B/zh
Publication of CN112863604A publication Critical patent/CN112863604A/zh
Application granted granted Critical
Publication of CN112863604B publication Critical patent/CN112863604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biotechnology (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Bioethics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种预测肿瘤间质化机制及治疗敏感性的方法,其属于肿瘤间质化机制分析技术领域。该方法通过样本训练数据集和识别间质化机制特征的基因集建立模型将将上皮来源肿瘤分成一类‑间质化、二类‑间质化、三类‑间质化‑YAP过度激活型和四类‑间质化‑AKT过度激活型四种类型。并通过靶向治疗敏感性和免疫治疗敏感性分析,确定三类‑间质化‑YAP过度激活型对于靶向治疗敏感,四类‑间质化‑AKT过度激活型对于免疫治疗抵抗,而当AKT通路被抑制后,则免疫治疗敏感。该方法能够高效的评估和识别出导致肿瘤间质化的机制,进一步将高间质化的肿瘤区分成两种具有不同治疗敏感性的肿瘤类型,为分析肿瘤间质化及不同间质化类型肿瘤的治疗敏感性提供一种工具。

Description

一种预测肿瘤间质化机制及治疗敏感性的方法
技术领域
本发明涉及一种预测肿瘤间质化机制及治疗敏感性的方法,其属于肿瘤间质化机制分析技术领域。
背景技术
肿瘤是现代医学中导致死亡的主要原因之一。在肿瘤发展过程中,大多数上皮肿瘤将经历间质转变。发生间质转变后肿瘤具有高迁移和侵袭能力,拥有永生增殖并会逃避免疫监视。在临床上,间质转化是提示早期转移,复发以及耐药的指标之一,常与肿瘤的不良预后有关。促癌通路的过度活化是肿瘤间质化的经典机制。近年来,肿瘤微环境对于肿瘤的作用被认为是促进肿瘤发生间质化的另一重要机制。两种机制所导致的间质化所产生的临床结局不同,例如促癌通路导致的间质化常与永生增殖有关,而微环境导致的间质化常与耐药或逃避免疫监视有关。因此,两种机制导致的间质化应该采用不同的治疗方法。然而,目前评估间质化的方法并不能够识别导致肿瘤间质化的机制。本发明涉及了一种能够预测肿瘤间质化机制并分析对应治疗敏感性的方法。
发明内容
为了解决现有技术中存在的问题,本发明提供一种预测肿瘤间质化机制及治疗敏感性的方法。
为实现发明目的,本发明采用如下技术方案:一种预测肿瘤间质化机制及治疗敏感性的方法,该方法包含以下步骤:
步骤一:获取训练样本数据集,从肿瘤基因组图谱TCGA数据库获得训练样本数据集,所述训练样本数据集包括24类上皮肿瘤类型共9415例数据,所述9415例数据包含每例样本的基因突变数据、基因拷贝数变异数据、基因表达count数据和临床信息数据。
步骤二:构建识别间质化机制特征的基因集,从分子特种数据库MsigDB下载四个与肿瘤间质化相关的基因集,所述四个与肿瘤间质化相关的基因集包含①肿瘤间质化,GOID:001837;②正性调控肿瘤间质化,GO ID:0010718;③逆肿瘤间质化,GO ID:0060231和④负性调控肿瘤间质化,GO ID:0010719,去掉基因集之间的重叠数据,识别出只参与肿瘤间质化正性过程的103个基因,利用在线工具蛋白互作分析和在线工具基因共表达分析分析对所述103个基因分析,构建用于识别间质化机制特征的基因集MTCG。
步骤三:根据基因集MTCG特征对TCGA肿瘤数据进行分类,从步骤一的基因表达count数据中提取TCGA肿瘤数据MTCG基因的表达数据,利用K-均值聚类,对训练样本数据集进行分类。
步骤四:四类间质化程度强弱确定,利用ssGSEA算法以步骤三得到的MTCG基因的表达数据为输入,计算每例样本的间质化活性评分,根据表达相对强弱,把样本定义为一类-间质化、二类-间质化、三类-间质化和四类-间质化
步骤五:确定三类-间质化和四类-间质化的驱动机制,利用KEGG分析,确定基因集MTCG基因参与的十个生物学通路,利用ssGSEA算法计算每个生物学通路的评分,进一步把三类-间质化和四类-间质化分别命名为三类-间质化-YAP通路激活和四类-间质化-AKT通路激活。
步骤六:靶向治疗敏感性分析,从肿瘤药敏数据库GDSC获得细胞系数据的基因表达数据和药敏筛选数据,利用R语言预编译包sva包对GDSC数据库的基因表达数据和TCGA数据库中的基因表达count数据进行去批次,提取GDSC数据库中的MTCG基因表达数据,利用MTCG基因表达数据,将细胞系分类到步骤四所述的四类间质化中去,比较每种靶向药的IC50值在四类间质化中的大小,确定三类-间质化-YAP通路激活型靶向治疗敏感,四类-间质化-AKT通路激活型靶向治疗抵抗。
步骤七:免疫治疗敏感性分析,从免疫治疗数据库IMvigor210CoreBiologies获得样本的基因表达和免疫治疗反应性数据,利用R语言预编译包sva包对IMvigor210CoreBiologies数据库的基因表达数据和TCGA数据库中的基因表达count数据进行去批次,提取IMvigor210CoreBiologies数据库中的MTCG基因表达数据,利用MTCG基因表达数据,将IMvigor210CoreBiologies数据库中的患者分类到步骤四所述的四类间质化中,比较四类间质化的免疫治疗反应情况,确定四类-间质化-AKT通路激活型为在AKT通路被抑制后免疫治疗敏感。
步骤八:待测样本的间质化分析,获得待测样本的基因表达数据,利用R语言预编译包sva包对待测样本的基因表达数据和TCGA数据库中的基因表达count数据进行去批次,提取待测样本的MTCG基因表达数据,通过计算待测样本与TCGA数据四个聚类中心点的欧几里得距离,把待测样本划归到欧几里得距离最短的间质化类型中,确定待测样本的间质化类型。
所述步骤二中利用在线工具蛋白互作分析对所述103个基因分析,识别出58个节点基因,利用在线工具基因共表达分析对所述103个基因分析,识别出50个共表达基因,对58个节点基因和50个共表达基因取交集,构建用于识别间质化机制特征的包含35个识别基因的基因集MTCG。
所述步骤三中K-均值聚类的参数设置为:模拟次数=100,距离=欧几里得距离,连接方式=平均,聚类后根据一致性数据将聚类数设定为4。
所述步骤五通过比较三类-间质化和四类-间质化的基因突变数据、基因拷贝数变异数据和利用cibersort算法计算得到的肿瘤微环境构成数据,确定三类-间质化-YAP通路激活型是由于肿瘤体细胞突变过多或者拷贝数改变过多使YAP通路过度活化导致的,四类-间质化-AKT通路激活型是由于微环境中巨噬细胞浸润过多造成AKT通路过度活化导致的。
所述步骤六通过计算GDSC数据库中的样本与TCGA数据四个聚类中心点的欧几里得距离,并把GDSC数据中的样本划归到欧几里得距离最短的间质化类型中去,分别比较每种靶向药的IC50值在四类间质化中的大小,确定三类-间质化-YAP通路激活型靶向治疗敏感,四类-间质化-AKT通路激活型靶向治疗抵抗;步骤七通过计算IMvigor210CoreBiologies数据库中的样本与TCGA数据四个聚类中心点的欧几里得距离,并把IMvigor210CoreBiologies数据中的样本划归到欧几里得距离最短的一类中去,通过比较每类间质化中对于免疫治疗的反应性情况,确定四类-间质化-AKT通路激活型免疫治疗敏感。
本发明的有益效果是:一种预测肿瘤间质化机制及治疗敏感性的方法,该方法通过样本训练数据集和识别间质化机制特征的基因集建立模型将将上皮来源肿瘤分成一类-间质化、二类-间质化、三类-间质化-YAP过度激活型和四类-间质化-AKT过度激活型四种类型。并通过靶向治疗敏感性和免疫治疗敏感性分析,确定三类-间质化-YAP过度激活型对于靶向治疗敏感,四类-间质化-AKT过度激活型在AKT通路被抑制后对于免疫治疗抵抗。该方法能够高效的评估和识别出导致肿瘤间质化的机制,进一步将高间质化的肿瘤区分成两种具有不同治疗敏感性的肿瘤类型,为分析肿瘤间质化及不同间质化类型肿瘤的治疗敏感性提供一种工具。
附图说明
图1是一种预测肿瘤间质化机制及治疗敏感性的方法的流程示意图。
图2是鼠胶质瘤免疫检查点阻断治疗效果对比图。
图3是中国人脑胶质母细胞瘤患者间质化分类预测图。
具体实施方式
为使本发明的技术方案更加清楚,下面将结合本发明的实施例,对实施例中的技术方案进行清楚、完整地描述,以下实施例用于说明本发明,但不用来限制本发明的范围。
图1示出了一种预测肿瘤间质化机制及治疗敏感性的方法的流程示意图。图中,这种预测肿瘤间质化机制及治疗敏感性的方法包含以下步骤:
步骤一:从肿瘤基因组图谱(TCGA)图谱计划数据库获(https://portal.gdc.cancer.gov)得训练样本数据集,该训练集由各个训练样本的基因突变数据、基因拷贝数变异数据、基因表达count数据和临床信息构成。该训练数据集共包括24类上皮肿瘤类型共9415例数据。
步骤二:构建识别间质化机制特征的基因集。从分子特种数据库MsigDB(https://www.gsea-msigdb.org/gsea/index.jsp)下载四个与肿瘤间质化相关的基因集(①肿瘤间质化,GO ID:001837;②正性调控肿瘤间质化,GO ID:0010718;③逆肿瘤间质化,GO ID:0060231;④负性调控肿瘤间质化,GO ID:0010719),四个基因集共包括155个基因。通过韦恩图,识别出103个基因只参与肿瘤间质化的正性过程(即肿瘤间质化和正性调控肿瘤间质化过程)。利用在线工具蛋白互作分析(http://string-db.org)对103个基因分析,构建出蛋白互作网络,利用cytoscape软件对蛋白互作网络中的combined score进行分析,识别出58个节点基因(节点的度在整个网络中排前2/3);利用在线工具基因共表达分析(https://www.coexpedia.org)对103个基因分析,识别出50个共表达基因(评分在前2/3)。对58个节点基因和50个共表达基因取交集,从而构建出用于识别间质化机制特征的基因集,该基因集包括35个基因(MTCG)。
步骤三:根据MTCG特征对TCGA肿瘤数据进行分类。从基因表达count数据中提取TCGA肿瘤数据35个MTCG基因的表达情况。利用K-均值聚类,对步骤一中的训练样本进行聚类,参数如下:模拟次数=100;距离=欧几里得距离;连接方式=平均,输入数据为35个基因的表达情况。聚类后根据一致性数据将聚类数定为4。对35个基因进行PCA分析发现,聚类数为4时,可以很好地把各类患者分开。
步骤四:四类间质化程度强弱确定。利用ssGSEA算法以35个基因表达量为输入,计算每个患者的间质化活性评分。根据表达相对强弱,把患者定义为,一类-间质化,二类-间质化,三类-间质化,四类-间质化
步骤五:三类-间质化,四类-间质化驱动机制确定。利用KEGG分析,确定MTCG基因所参与的生物学通路,共确定十个通路(包括AGE-RAGE通路、Relaxin通路、FoxO通路、Stem Cell通路、MAPK通路、YAP通路、TGF-beta通路、Wnt通路以及PI3K-AKT通路)。利用ssGSEA算法计算通路的评分。通过对通路评分相对大小的比较,进一步把间质化的两类命名为三类-间质化-YAP通路激活,四类-间质化-AKT通路激活。比较三类和四类的基因突变数据、基因拷贝数变异数据以及利用cibersort算法计算得来的肿瘤微环境构成数据后发现,三类-间质化-YAP通路激活型是由于肿瘤体细胞突变过多或者拷贝数改变过多而使YAP通路过度活化导致的,四类-间质化-AKT通路激活型是由于微环境中巨噬细胞浸润过多导致的AKT通路过度活化导致的。
步骤六:靶向治疗敏感性敏感性分析。从肿瘤药敏数据库GDSC(https://www.cancerrxgene.org)获得细胞系数据的基因表达数据和药敏筛选数据。利用R语言预编译包sva包对GDSC数据库的基因表达数据TCGA数据库中的基因表达数据进行去批次。提取GDSC数据库数据中35个MTCG基因的表达情况。利用35个MTCG基因的表达数据,计算GDSC数据库中的样本与TCGA数据四个聚类中心点的欧几里得距离,并把GDSC数据中的样本分别划归到欧几里得距离最短的间质化类型中去。分别比较每种靶向药的IC50值在每类中的大小,从而确定三类-间质化-YAP通路激活型靶向治疗敏感,四类-间质化-AKT通路激活型靶向治疗抵抗。
步骤七:免疫治疗敏感性分析。从免疫治疗数据库IMvigor210CoreBiologies(http://research-pub.gene.com/IMvigor210CoreBiologies/packageVersions/)获得患者样本的基因表达和免疫治疗反应性情况。利用R语言预编译包sva包对IMvigor210CoreBiologies数据库的基因表达数据TCGA数据库中的基因表达数据进行去批次。提取IMvigor210CoreBiologies数据库数据中35个MTCG基因的表达情况。利用35个MTCG基因的表达数据,计算IMvigor210CoreBiologies数据库中的样本与TCGA数据四个聚类中心点的欧几里得距离,并把IMvigor210CoreBiologies数据中的样本分别划归到欧几里得距离最短的那间质化类型中去。比较每类中免疫治疗的反应性情况,从而确定四类-间质化-AKT通路激活型在AKT通路被抑制后免疫治疗敏感。
步骤八:待测样本的间质化分析,获得待测样本的基因表达数据,利用R语言预编译包sva包对待测样本的基因表达数据和TCGA数据库中的基因表达count数据进行去批次,提取待测样本的MTCG基因表达数据,通过计算待测样本与TCGA数据四个聚类中心点的欧几里得距离,把待测样本划归到欧几里得距离最短的间质化类型中,确定待测样本的间质化类型。
实施例1
对鼠胶质瘤细胞系GL261进行测序,获得其基因表达谱,按照具体实施方式中的步骤对鼠胶质瘤细胞系GL261的基因表达谱进行分析,确定鼠胶质瘤细胞系GL261属于四类-间质化-AKT过度激活型。利用小鼠立体定向技术,将GL261原位种植于小鼠脑中,对其分别进行免疫检查点治疗和使用MK2206抑制四类-间质化-AKT过度激活型的AKT通路进行治疗,一组对比不同治疗方法小鼠的存活期。另外一组,在15天时处死小鼠,将小鼠脑组织取出,多聚甲醛固定,石蜡包埋切片,采用苏木精—伊红染色法检测肿瘤大小。
图2是鼠胶质瘤免疫检查点阻断治疗效果对比图,其中,图A是经治疗后生存期对比图,图B是治疗后肿瘤大小对比图,图中,NC是不经任何处理的对照组,MK2206是经AKT通路抑制剂治疗组,PD-L1是免疫检查点治疗组,PD-L1+MK2206是免疫检查点联合AKT通路抑制剂治疗组。从图中可以看出,四类-间质化-AKT过度激活型鼠胶质瘤经免疫检查点联合AKT通路抑制剂治疗后肿瘤明显缩小,小鼠的生存期延长。通过MK2206抑制四类-间质化-AKT过度激活型的AKT通路可以提高免疫检查点治疗的治疗效果。
实施例2
通过中国脑胶质瘤基因组图谱计划CGGA数据库(http://www.cgga.org.cn)下载388例中国人脑胶质母细胞瘤基因表达数据,通过具体实施方式中的步骤八对其进行分析,将388例中国人脑胶质母细胞瘤分成四种间质化类型。同时,按照步骤四和步骤五对分类后的四组间质化类型进行分析。
图3是中国人脑胶质母细胞瘤患者间质化分类预测图,其中,A是间质化分类结果图,B是四种间质化的间质化评分图,C是四种间质化的YAP通路评分图,D是四种间质化的AKT通路评分图。根据图3,中国人脑胶质母细胞瘤患者被分为四种间质化类型,比较四组的间质化评分,发现三类和四类符合高间质化的特点。比较四组的YAP通路评分,发现三类符合YAP通路激活的特点。比较四组的AKT通路评分,发现四类符合AKT通路激活的特点。可以看出,388例中国人脑胶质母细胞瘤基因数据特征符合一类-间质化,二类-间质化,三类-间质化-YAP过度激活型,四类-间质化-AKT过度激活型。
GDSC是药敏数据库,从细胞系的表达谱数据,就可以提取35个基因的表达,然后将其分为四种间质化类型,比较每种药物在四种不同间质化类型中的敏感性情况,从而得到治疗敏感性。
IMvigor210CoreBiologies是免疫治疗数据库,从接受免疫治疗的患者的表达谱中提取35个基因的表达,将其分类,然后比较每类患者中,免疫治疗的反应率,从而得到每类间质化类型的免疫治疗(免疫检查点阻断治疗)敏感或抵抗。之后任意患者样本的数据代入模型中,得到分类。然后根据GDSC和IMvigor210CoreBiologies数据库分析出来的特性,来推定这个患者样本的特性。
以上所述仅是本发明的较佳实施例而已,并非对本发明做任何形式上的限制,任何熟悉本发明的技术人员在不脱离本发明技术范围内,当可利用上述提示的技术内容做出些许变动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化与修饰,均仍属于本发明方案的范围内。

Claims (5)

1.一种预测肿瘤间质化机制及治疗敏感性的方法,其特征在于,该方法包含如下步骤:
步骤一:获取训练样本数据集,从肿瘤基因组图谱TCGA数据库获得训练样本数据集,所述训练样本数据集包括24类上皮肿瘤类型共9415例数据,所述9415例数据包含每例样本的基因突变数据、基因拷贝数变异数据、基因表达count数据和临床信息数据;
步骤二:构建识别间质化机制特征的基因集,从分子特种数据库MsigDB下载四个与肿瘤间质化相关的基因集,所述四个与肿瘤间质化相关的基因集包含①肿瘤间质化,GO ID:001837;②正性调控肿瘤间质化,GO ID:0010718;③逆肿瘤间质化,GO ID:0060231和④负性调控肿瘤间质化,GO ID:0010719,去掉基因集之间的重叠数据,识别出只参与肿瘤间质化正性过程的103个基因,利用在线工具蛋白互作分析和在线工具基因共表达分析分析对所述103个基因分析,构建用于识别间质化机制特征的基因集MTCG;
步骤三:根据基因集MTCG特征对TCGA肿瘤数据进行分类,从步骤一的基因表达count数据中提取TCGA肿瘤数据中MTCG基因的表达数据,利用K-均值聚类,对训练样本数据集进行分类;
步骤四:四类间质化程度强弱确定,利用ssGSEA算法以步骤三得到的MTCG基因的表达数据为输入,计算每例样本的间质化活性评分,根据表达相对强弱,把样本定义为一类-间质化、二类-间质化、三类-间质化和四类-间质化
步骤五:确定三类-间质化和四类-间质化的驱动机制,利用KEGG分析,确定基因集MTCG基因参与的十个生物学通路,利用ssGSEA算法计算每个生物学通路的评分,进一步把三类-间质化和四类-间质化分别命名为三类-间质化-YAP通路激活和四类-间质化-AKT通路激活;
步骤六:靶向治疗敏感性分析,从肿瘤药敏数据库GDSC获得细胞系数据的基因表达数据和药敏筛选数据,利用R语言预编译包sva包对GDSC数据库的基因表达数据和TCGA数据库中的基因表达count数据进行去批次,提取GDSC数据库中的MTCG基因表达数据,利用MTCG基因表达数据,将细胞系分类到步骤四所述的四类间质化中去,比较每种靶向药的IC50值在四类间质化中的大小,确定三类-间质化-YAP通路激活型靶向治疗敏感,四类-间质化-AKT通路激活型靶向治疗抵抗;
步骤七:免疫治疗敏感性分析,从免疫治疗数据库IMvigor210CoreBiologies获得样本的基因表达和免疫治疗反应性数据,利用R语言预编译包sva包对IMvigor210CoreBiologies数据库的基因表达数据和TCGA数据库中的基因表达count数据进行去批次,提取IMvigor210CoreBiologies数据库中的MTCG基因表达数据,利用MTCG基因表达数据,将IMvigor210CoreBiologies数据库中的患者分类到步骤四所述的四类间质化中,比较四类间质化的免疫治疗反应情况,确定四类-间质化-AKT通路激活型在AKT通路被抑制后为免疫治疗敏感;
步骤八:待测样本的间质化分析,获得待测样本的基因表达数据,利用R语言预编译包sva包对待测样本的基因表达数据和TCGA数据库中的基因表达count数据进行去批次,提取待测样本的MTCG基因表达数据,通过计算待测样本与TCGA数据四个聚类中心点的欧几里得距离,把待测样本划归到欧几里得距离最短的间质化类型中,确定待测样本的间质化类型。
2.根据权利要求1所述的一种预测肿瘤间质化机制及治疗敏感性的方法,其特征在于,步骤二中利用在线工具蛋白互作分析对所述103个基因分析,识别出58个节点基因,利用在线工具基因共表达分析对所述103个基因分析,识别出50个共表达基因,对58个节点基因和50个共表达基因取交集,构建用于识别间质化机制特征的包含35个识别基因的基因集MTCG。
3.根据权利要求1所述的一种预测肿瘤间质化机制及治疗敏感性的方法,其特征在于,所述步骤三中K-均值聚类的参数设置为:模拟次数=100,距离=欧几里得距离,连接方式=平均,聚类后根据一致性数据将聚类数设定为4。
4.根据权利要求1所述的一种预测肿瘤间质化机制及治疗敏感性的方法,其特征在于,所述步骤五通过比较三类-间质化和四类-间质化的基因突变数据、基因拷贝数变异数据和利用cibersort算法计算得到的肿瘤微环境构成数据,确定三类-间质化-YAP通路激活型是由于肿瘤体细胞突变过多或者拷贝数改变过多使YAP通路过度活化导致的,四类-间质化-AKT通路激活型是由于微环境中巨噬细胞浸润过多造成AKT通路过度活化导致的。
5.根据权利要求1所述的一种预测肿瘤间质化机制及治疗敏感性的方法,其特征在于,所述步骤六通过计算GDSC数据库中的样本与TCGA数据四个聚类中心点的欧几里得距离,把GDSC数据中的样本划归到欧几里得距离最短的间质化类型中去,分别比较每种靶向药的IC50值在四类间质化中的大小,确定三类-间质化-YAP通路激活型靶向治疗敏感,四类-间质化-AKT通路激活型靶向治疗抵抗;步骤七通过计算IMvigor210CoreBiologies数据库中的样本与TCGA数据四个聚类中心点的欧几里得距离,并把IMvigor210CoreBiologies数据中的样本划归到欧几里得距离最短的间质化类型中去,通过比较每类间质化中对于免疫治疗的反应性情况,确定四类-间质化-AKT通路激活型在AKT通路被抑制后免疫治疗敏感。
CN202110029152.4A 2021-01-10 2021-01-10 一种预测肿瘤间质化机制及治疗敏感性的方法 Active CN112863604B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110029152.4A CN112863604B (zh) 2021-01-10 2021-01-10 一种预测肿瘤间质化机制及治疗敏感性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110029152.4A CN112863604B (zh) 2021-01-10 2021-01-10 一种预测肿瘤间质化机制及治疗敏感性的方法

Publications (2)

Publication Number Publication Date
CN112863604A true CN112863604A (zh) 2021-05-28
CN112863604B CN112863604B (zh) 2024-02-13

Family

ID=76002232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110029152.4A Active CN112863604B (zh) 2021-01-10 2021-01-10 一种预测肿瘤间质化机制及治疗敏感性的方法

Country Status (1)

Country Link
CN (1) CN112863604B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421613A (zh) * 2021-06-08 2021-09-21 吴安华 一种基于铁死亡水平评价胶质母细胞瘤患者免疫治疗反应性的系统及分析方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030073083A1 (en) * 1999-04-09 2003-04-17 Pablo Tamayo Methods for predicting chemosensitivity or chemoresistance
US20180107786A1 (en) * 2016-10-07 2018-04-19 Omniseq, Inc. Methods and systems for determining personalized therapies
KR20190037426A (ko) * 2017-09-29 2019-04-08 사회복지법인 삼성생명공익재단 소화기암 환자의 면역치료 반응성 예측용 tirap 마커 및 이의 용도
CN109913420A (zh) * 2019-03-07 2019-06-21 北京师范大学 Cdc20共表达基因网络作为胶质瘤治疗靶点的应用
US20190214136A1 (en) * 2017-07-11 2019-07-11 Regents Of The University Of Minnesota Predictive biomarkers of drug response in malignancies
WO2020201267A1 (en) * 2019-04-01 2020-10-08 Københavns Universitet Identification of pan-gamma secretase inhibitor (pan-gsi) theranostic response signatures for cancers
JP2020178667A (ja) * 2019-04-26 2020-11-05 国立大学法人 東京大学 がん治療の効果および予後の予測方法および治療手段の選択方法
US20200388348A1 (en) * 2018-01-04 2020-12-10 Nantomics, Llc Immune Gene Expression Signature in Treg Enriched Tumor Samples
CN112133365A (zh) * 2020-09-03 2020-12-25 南方医科大学南方医院 评估肿瘤微环境的基因集、评分模型及其应用
CN112164422A (zh) * 2020-10-12 2021-01-01 郑州大学第一附属医院 一种量化time浸润模式的评分方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030073083A1 (en) * 1999-04-09 2003-04-17 Pablo Tamayo Methods for predicting chemosensitivity or chemoresistance
US20180107786A1 (en) * 2016-10-07 2018-04-19 Omniseq, Inc. Methods and systems for determining personalized therapies
US20190214136A1 (en) * 2017-07-11 2019-07-11 Regents Of The University Of Minnesota Predictive biomarkers of drug response in malignancies
KR20190037426A (ko) * 2017-09-29 2019-04-08 사회복지법인 삼성생명공익재단 소화기암 환자의 면역치료 반응성 예측용 tirap 마커 및 이의 용도
US20200388348A1 (en) * 2018-01-04 2020-12-10 Nantomics, Llc Immune Gene Expression Signature in Treg Enriched Tumor Samples
CN109913420A (zh) * 2019-03-07 2019-06-21 北京师范大学 Cdc20共表达基因网络作为胶质瘤治疗靶点的应用
WO2020201267A1 (en) * 2019-04-01 2020-10-08 Københavns Universitet Identification of pan-gamma secretase inhibitor (pan-gsi) theranostic response signatures for cancers
JP2020178667A (ja) * 2019-04-26 2020-11-05 国立大学法人 東京大学 がん治療の効果および予後の予測方法および治療手段の選択方法
CN112133365A (zh) * 2020-09-03 2020-12-25 南方医科大学南方医院 评估肿瘤微环境的基因集、评分模型及其应用
CN112164422A (zh) * 2020-10-12 2021-01-01 郑州大学第一附属医院 一种量化time浸润模式的评分方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DANIELLE E. DESA等: "Intratumoral heterogeneity of secondharmonic generation scattering from tumor collagen and its effects on metastatic risk prediction", 《BMCCANCER》, 31 December 2020 (2020-12-31), pages 1 - 14 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113421613A (zh) * 2021-06-08 2021-09-21 吴安华 一种基于铁死亡水平评价胶质母细胞瘤患者免疫治疗反应性的系统及分析方法

Also Published As

Publication number Publication date
CN112863604B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
CN110117653A (zh) 肺癌突变位点的突变率的检测方法及试剂盒
Zheng et al. Identification and validation of immunotherapy for four novel clusters of colorectal cancer based on the tumor microenvironment
CN110257518B (zh) 一种用于预测转移性结直肠癌转化治疗疗效的基因集
CN112863604A (zh) 一种预测肿瘤间质化机制及治疗敏感性的方法
Redekar et al. Identification of key genes associated with survival of glioblastoma multiforme using integrated analysis of TCGA datasets
CN107292130A (zh) 基于基因突变与基因表达的药物重定位方法
Pan et al. A robust two‐gene signature for glioblastoma survival prediction
US20230366037A1 (en) Prediction tool for judging drug sensitivity and long-term prognosis of liver cancer based on gene detection and use thereof
CN117757936A (zh) 铜死亡相关基因在肾上腺皮质癌诊断、治疗及预后预测中的应用
CN116590415B (zh) 一种基于组蛋白修饰基因特征开发的前列腺癌预后风险评估模型及应用
Yuan et al. Comparative analysis of methods for identifying recurrent copy number alterations in cancer
Zhou et al. A new method of identifying glioblastoma subtypes and creation of corresponding animal models
Kong et al. Potential therapeutic targets and small molecular drugs for pediatric B-precursor acute lymphoblastic leukemia treatment based on microarray data
Lu et al. Bioinformatics analysis and identification of genes and molecular pathways involved in venous thromboembolism (VTE)
CN108913773A (zh) 一种临床评价卵巢癌铂类药物化疗敏感性的多分子标志物及其装置与评价方法
US20230242992A1 (en) Methods of predicting cancer progression
CN113564259B (zh) 一种用于检测肺腺癌细胞周期进展通路相关基因突变的ncRNA及预测模型
de Sousa et al. RNA sequencing data of different grade astrocytoma cell lines
Yang et al. Identification and verification of five potential biomarkers related to skin and thermal injury using weighted gene co-expression network analysis
Liu et al. Differentially expressed mutant genes reveal potential prognostic markers for lung adenocarcinoma
CN117594118A (zh) 卷积神经网络结合网络医学方法预测肿瘤基因组生物标志物的方法
KR20230140439A (ko) 단일 세포 전사체 분석을 통한 암 미세 환경 내 세포 클러스터의 표적 후보 추천 방법, 그 장치 및 프로그램
CN113707223A (zh) 一种预测肿瘤炎性小体活性状态及治疗敏感性的基因集系统及方法
CN115927616A (zh) 一组用于预测头颈鳞癌预后的标志物及其应用
CN114818988A (zh) 一种预测bcl2抑制剂维奈托克在急性髓系白血病中治疗敏感性的方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant