CN114694745A - 预测免疫疗效的方法、装置、计算机设备和存储介质 - Google Patents

预测免疫疗效的方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114694745A
CN114694745A CN202210294379.6A CN202210294379A CN114694745A CN 114694745 A CN114694745 A CN 114694745A CN 202210294379 A CN202210294379 A CN 202210294379A CN 114694745 A CN114694745 A CN 114694745A
Authority
CN
China
Prior art keywords
immune
curative effect
data
characteristic
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210294379.6A
Other languages
English (en)
Inventor
卢磊磊
曾燕舞
宋智健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhiben Medical Laboratory Co ltd
Origimed Technology Shanghai Co ltd
Original Assignee
Shanghai Zhiben Medical Laboratory Co ltd
Origimed Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhiben Medical Laboratory Co ltd, Origimed Technology Shanghai Co ltd filed Critical Shanghai Zhiben Medical Laboratory Co ltd
Priority to CN202210294379.6A priority Critical patent/CN114694745A/zh
Publication of CN114694745A publication Critical patent/CN114694745A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Physiology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Epidemiology (AREA)
  • Bioethics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种用于预测免疫疗效的方法、装置和存储介质,方法包括:获取目标特征数据集,目标特征数据集包括受试者的个体特征数据、基因突变特征数据以及历史用药特征数据;将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型;获取免疫疗效预测模型输出的受试者的免疫疗效分值,根据受试者的免疫疗效分值输出受试者的免疫疗效预测结果。本发明通过受试者的个体特征、基因突变特征以及历史用药特征预测免疫疗效,能够综合考虑免疫疗效和不同维度特征数据的关联度,提高预测免疫疗效的准确性。

Description

预测免疫疗效的方法、装置、计算机设备和存储介质
技术领域
本发明涉及癌症技术领域,具体而言,涉及一种预测免疫疗效的方法、装置、计算机设备和存储介质。
背景技术
免疫治疗是指利用包括化学小分子在内的各种方式,干扰体内的免疫细胞和分子,达到调节免疫系统、治疗疾病的目的。
肿瘤治疗中常用的免疫检查点抑制剂包括PD1(Programmed cell death protein1,程序性细胞死亡蛋白1)/PD-L1(Programmed cell death protein ligand1,程序性细胞死亡蛋白受体1)抑制剂等。PD-L1是位于T细胞、B细胞等免疫细胞上的蛋白质,PD1结合在其上后,能够下调免疫系统活性,通过抑制T细胞炎症活性提高免疫自身耐受。这种调节机制一方面可以避免自身免疫疾病,另一方面却阻止了免疫系统杀死肿瘤细胞。研究表明,通过抑制PD1、PD-L1或者它们的结合,可以激活免疫系统去杀死肿瘤细胞。
TMB全称“肿瘤基因突变负荷”(tumor mutational burden),是获得NCCN指南推荐的免疫治疗生物标志物(biomarker),通过全外显子组测序(WES)或大基因panel(如MSK-IMPACT、Foundation One等)对肿瘤组织或外周血游离肿瘤DNA(ctDNA)的全部或特定基因编码区进行深度测序,并通过一定的生物信息学变异识别软件,计算得到每Mb基因区域内发生体细胞突变的个数,用于表征基因突变频率。一般来说,TMB越高越可能产生被免疫细胞识别的位点,通过抑制PD1/PD-L1激活免疫系统,就越可能产生好的免疫治疗效果。
然而,在实际应用中,针对泛癌种免疫疗效的预测,TMB作为单一的检测指标,难以得到准确性高的预测结果。
发明内容
为了解决上述问题,本发明的第一目的在于提供一种预测免疫疗效的方法,以提高预测泛癌种免疫疗效的准确性,该方法包括:
获取目标特征数据集,目标特征数据集包括受试者的个体特征数据、基因突变特征数据以及历史用药特征数据;
将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型;
获取免疫疗效预测模型输出的受试者的免疫疗效分值,根据受试者免疫疗效分值输出受试者的免疫疗效预测结果;
其中,受试者的个体特征数据用于表征受试者的个体性差异;受试者的基因突变特征数据用于表征受试者肿瘤组织的基因突变情况;受试者的历史用药数据用于反映受试者历史上使用药品的情况。
本发明的一种实现方式中,将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型之前还包括:
获取训练数据集,训练数据集包括患者的个体特征训练数据、基因突变特征训练数据、历史用药特征训练数据以及患者的免疫疗效训练数据;
将个体特征训练数据、基因突变特征训练数据、历史用药特征训练数据与患者相应的免疫疗效输入初始免疫疗效预测模型,以获得带有预设标记的训练数据子集;
根据训练数据子集构建免疫疗效预测模型,其中,训练数据子集包括带有预设标记的个体特征训练数据、预设标记的基因突变特征训练数据、预设标记的历史用药特征训练数据以及相应患者的免疫疗效数据;
其中,患者的个体特征训练数据用于表征训练数据集中患者的个体性差异;基因突变特征训练数据用于表征训练数据集中患者肿瘤组织的基因突变情况;历史用药数据用于反映训练数据集中患者历史上使用药品的情况。
本发明的一种实现方式中,个体特征训练数据包括年龄、性别、是否进行过前化疗、体重指数、肿瘤类型、分期、中淋细胞比、血小板指标、血红蛋白指标、白蛋白指标和PD-L1表达指标中的至少一种;
基因突变特征训练数据包括肿瘤含量、扩增比、肿瘤突变负荷、HLA进化异质性、HLA杂合性丢失、微卫星不稳定、基因的突变状态、测序基因集和测序方法中的至少一种;
历史用药特征训练数据包括联合用药或者非联合用药。
本发明的一种实现方式中,带有预设标记的个体特征训练数据或者个体特征数据包括性别、体重指数、肿瘤类型、是否进行过前化疗、中淋细胞比、血小板指标和血红蛋白指标中的至少一种;
带有预设标记的基因突变特征训练数据或者基因突变特征数据包括肿瘤突变负荷、HLA进化异质性、HLA杂合性丢失和扩增比中的至少一种;
带有预设标记的历史用药特征训练数据或者历史用药特征数据包括联合用药或者非联合用药。
本发明的一种实现方式中,根据训练数据子集构建免疫疗效预测模型之后还包括:
利用免疫疗效预测模型获取训练数据子集中每个患者的免疫疗效分值;
根据训练数据子集中每个患者的免疫疗效分值确定预测免疫疗效的预设阈值。
本发明的一种实现方式中,根据免疫疗效分值输出受试者的免疫疗效预测结果具体包括:
将免疫疗效分值和预设阈值进行比较,判断免疫疗效分值是否大于预设阈值;
若免疫疗效分值大于预设阈值,则输出受试者的免疫疗效预测结果为治疗有效,否则输出受试者的免疫疗效预测结果为治疗无效。
本发明的一种实现方式中,肿瘤组织包括脑瘤、口腔、食管癌、肺癌、肝癌、胰腺癌、胃癌、结直癌、尿道癌、黑色素瘤、软组织肿瘤、乳腺癌和前列腺癌中的至少一种形成的肿瘤组织。
本发明的第二目的在于提供一种用于预测免疫疗效的装置,包括:
数据获取模块:用于获取目标特征数据集,目标特征数据集包括受试者的个体特征数据、基因突变特征数据以及历史用药特征数据;
输入模块:将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型;
免疫疗效预测模块:获取免疫疗效预测模型输出的受试者的免疫疗效分值,根据免疫疗效分值输出受试者的免疫疗效预测结果;
其中,个体特征数据用于表征受试者的个体性差异;基因突变特征数据用于表征受试者肿瘤组织的基因突变情况;历史用药数据用于反映受试者历史上使用药品的情况。
本发明还涉及一种计算机可读存储介质,计算机存储介质用于存储计算机指令、程序、代码集或指令集,当其在计算机上运行时,使得计算机执行以实现上述预测免疫疗效的方法。
本发明还涉及一种电子设备,包括:
一个或多个处理器;以及
存储装置,存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述预测免疫疗效的方法。
本发明提供了一种用于预测免疫疗效的方法,通过受试者的体特征数据、基因突变特征数据以及历史用药特征数据预测免疫疗效,能够综合考虑免疫疗效和不同维度特征数据的关联度,提高预测免疫疗效的准确性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中免疫疗效预测模型预测免疫疗效获得的受试者操作曲线图;
图2为本发明对比例1中TMB预测免疫疗效获得的受试者操作曲线图。
具体实施方式
现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
因此,旨在本发明覆盖落入所附权利要求的范围及其等同范围中的此类修改和变化。本发明的其它对象、特征和方面公开于以下详细描述中或从中是显而易见的。本领域普通技术人员应理解本讨论仅是示例性实施方式的描述,而非意在限制本发明更广阔的方面。
在本发明中,肿瘤组织或癌症来自人。
在本发明中,免疫治疗(immunotherapy)是指针对机体低下或亢进的免疫状态,人为地增强或抑制机体的免疫功能以达到治疗疾病目的治疗方法。免疫治疗的方法有很多,适用于多种疾病的治疗。肿瘤的免疫治疗旨在激活患者的免疫系统,依靠自身免疫机能杀灭癌细胞和肿瘤组织。与以往的手术、化疗、放疗和靶向治疗不同的是,免疫治疗针对的靶标不是肿瘤细胞和组织,而是患者自身的免疫系统。
目前,癌症免疫治疗已经获得了广泛的应用,但在临床上,有很多免疫治疗是无效的,且缺乏准确预测泛癌种免疫治疗效果的方法。
为了至少部分解决上述技术问题,本发明的第一方面提供了一种预测免疫疗效的方法,包括:
获取目标特征数据集,目标特征数据集包括受试者的个体特征数据、基因突变特征数据以及历史用药特征数据;
将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型;
获取免疫疗效预测模型输出的受试者的免疫疗效分值,根据受试者的免疫疗效分值输出受试者的免疫疗效预测结果;
其中,个体特征数据用于表征受试者的个体性差异;基因突变特征数据用于表征受试者肿瘤组织的基因突变情况;历史用药数据用于反映受试者历史上使用药品的情况。
具体地,通过受试者的体特征数据、基因突变特征数据以及历史用药特征数据预测免疫疗效,将患者的临床特征和基因突变特征结合,能够综合考虑免疫疗效和不同维度特征数据的关联度,提高预测免疫疗效的准确性。
进一步,本发明的预测免疫疗效的方法针对的是泛癌种的免疫治疗效果,受试者可以是脑瘤、口腔、食管癌、肺癌、肝癌、胰腺癌、胃癌、结直癌、尿道癌、黑色素瘤、软组织肿瘤、乳腺癌和前列腺癌中的任意一种、两种或多种的癌症或肿瘤患者;受试者的肿瘤组织可以是脑瘤、口腔、食管癌、肺癌、肝癌、胰腺癌、胃癌、结直癌、尿道癌、黑色素瘤、软组织肿瘤、乳腺癌和前列腺癌中的任意一种、两种或多种形成的肿瘤组织。
一些具体实施方案中,受试者的免疫疗效采用RECIST v1.1标准进行评估:所有靶病灶消失,全部病理淋巴结(包括靶结节和非靶结节)短直径必须减少至<10mm,称为完全缓解(CR);靶病灶直径之和比基线水平减少至少30%,称为部分缓解(PR);以整个实验研究过程中所有测量的靶病灶直径之和的最小值为参照,直径和相对增加至少20%(如果基线测量值最小就以基线值为参照),除此之外,必须满足直径和的绝对值增加至少5mm(出现一个或多个新病灶也视为疾病进展),称为疾病进展(PD);靶病灶减小的程度没达到PR,增加的程度也没达到PD水平,介于两者之间,称为疾病稳定(SD)。免疫治疗效果可据最佳疗效分为有效(CR,PR和SD)和无效(PD)。有一些方案,也可以采用不同的版本或者类似的评价标准,如iRECIST等。
在一些实施方案中,免疫疗法为使用免疫检查点抑制剂的免疫疗法。
如本文所用,术语“免疫检查点”是指免疫系统中存在的一些抑制性信号通路。机体在正常情况下,免疫检查点可以通过调节自身免疫反应的强度来维持免疫耐受,然而机体在受到肿瘤侵袭时,免疫检查点的激活会抑制自身免疫,有利于肿瘤细胞的生长和逃逸。通过使用免疫检查点抑制剂,可以恢复机体正常的抗肿瘤免疫反应,从而控制和清除肿瘤。本领域已知多种可用于肿瘤治疗的免疫检查点抑制剂。例如,本发明免疫检查点抑制剂包括但不限于PD1抑制剂或PD-L1抑制剂,例如国内的特瑞普利单抗、信迪利单抗、卡瑞利珠单抗,以及派姆单抗、纳武单抗、阿特珠单抗、Avelumab以及Durvalumab。
一些具体实施方案中,个体特征数据包括性别、体重指数、肿瘤类型、是否进行过前化疗、中淋细胞比、血小板和血红蛋白中的至少一种个体特征的检测数据;基因突变特征数据包括肿瘤突变负荷、HLA进化异质性、HLA杂合性丢失和扩增比中的至少一种基因突变特征的检测数据;历史用药特征数据包括历史上使用药品的特征的记录数据,历史上使用药品的特征包括联合用药或者非联合用药。通过上述特征组合与免疫疗效的关联度预测免疫疗效能够获取更高的预测准确性。
进一步,免疫疗效预测模型是指可采用诸如但不限于判别分析(discriminantanalysis,DA)(即线性、二次、正则化DA)、核方法(即SVM)、非参数方法(即k最近邻分类器)、PLS(偏最小二乘)、基于树的方法(即逻辑回归、CART、随机森林方法、增强/装袋方法)、广义线性模型(即对数回归)、基于主成分的方法(即SIMCA)、广义加性模型、基于模糊逻辑的方法、基于神经网络和遗传算法的方法、基于深度学习等方法建立的人工智能模型。
一些具体实施方案中,免疫疗效预测模型是由随机森林模型构建,构建随机森林模型是指通过随机的方式建立一个森林,森林里面由很多的决策树组成,且每一棵决策树之间没有关联,得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,分析该样本应该属于哪一类,然后分析哪一类被选择最多,就预测这个样本为哪一类,将受试者的从而能够实现预测输入样本的免疫疗效个体特征数据、基因突变特征数据以及历史用药特征数据。
随机森林模型可以既可以处理属性为离散值的量,也可以处理属性为连续值的量。另外,随机森林模型还可以用来进行无监督学习聚类和异常点检测。决策树是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。
一些实施方案中,为了获取免疫疗效预测模型,将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型之前还包括:
获取训练数据集,训练数据集包括患者的个体特征训练数据、基因突变特征训练数据、历史用药特征训练数据以及患者的免疫疗效训练数据;
将个体特征训练数据、基因突变特征训练数据、历史用药特征训练数据与患者相应的免疫疗效输入初始免疫疗效预测模型,以获得带有重要标记的训练数据子集,重要性标记包括重要标记和不重要标记;
根据训练数据子集构建免疫疗效预测模型,其中,训练数据子集包括带有重要标记的个体特征训练数据、重要标记的基因突变特征训练数据、重要标记的历史用药特征训练数据以及相应患者的免疫疗效数据。
具体地,患者的个体特征训练数据用于表征训练数据集中患者的个体性差异;基因突变特征训练数据用于表征训练数据集中患者肿瘤组织的基因突变情况;历史用药数据用于反映训练数据集中患者历史上使用药品的情况。
一些具体实施方案中,个体特征训练数据包括年龄、性别、是否进行过前化疗、体重指数、肿瘤类型、分期、中淋细胞比、血小板指标、血红蛋白指标、白蛋白指标和PD-L1表达状态中的至少一种;和/或
基因突变特征训练数据涉及的基因突变特征包括肿瘤含量、扩增比、肿瘤突变负荷、HLA进化异质性、HLA杂合性丢失、微卫星不稳定、基因的突变状态、测序基因集和测序方法中的至少一种。
历史用药特征训练数据包括联合用药和非联合用药。
具体地,年龄、性别、是否进行过前化疗可以通过问询和病史调查获得。体重指数可以通过体重身高的检测,进行简单计算。体重指数=体重/身高的平方,公式里体重的单位为公斤,身高的单位为米。
肿瘤类型和分期可以通过影像学和穿刺进行鉴定,具体地,肿瘤类型包括脑瘤,口腔癌,食管癌,肺癌,肝癌,胰腺癌,胃癌,结直癌,尿道癌,黑色素瘤,软组织肿瘤,乳腺癌,前列腺癌,其他癌症。
中淋细胞比、血小板指标、血红蛋白指标、白蛋白指标可以通过血常规医学检查获得。
PD-L1表达状态可以通过免疫组织化学检查,即用PD-L1抗原与PD-L1抗体特异性结合的原理,通过化学反应使标记PD-L1抗体的显色剂(荧光素、酶、金属离子、同位素)显色来确定组织细胞内PD-L1的表达进行定性或者定量检测,从而获得PD-L1表达状态。
肿瘤含量可以通过肿瘤组织或者穿刺样本进行免疫组织学染色(例如,苏木精和伊红染色)计数获得,也可以通过高通量测序,用软件ESTIMATE估计。
其中,高通量测序,也称作二代测序(“NGS”),二代测序在并行的测序过程中同时产生数千至数百万条序列。本发明的NGS的测序平台是商用可得的,包括但不限于Roche/454FLX、Illumina/Solexa Genome Analyzer和Applied Biosystems SOLID system等。
测序可以对全基因组测序,也可以覆盖基因组中部分基因或区域的测序。
多基因或全外显子组测序是利用序列捕获技术将目标基因集或基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。由于它具有对常见和罕见变异高灵敏度,因此仅需对2%的基因组进行测序就能发现外显子区域的大部分疾病相关变异。
扩增比是指基因组中发生倍增的区域比例,可以通过基因芯片或者高通量测序的办法进行测定。当利用基因芯片时,可以利用诸如ROMA、arrayCGH等软件进行检测;当利用高通量测序的方法,可以利用诸如FACETS、CNVkit等软件。当在任一HLA上出现杂合性丢失时,定义为HLA杂合性丢失。
肿瘤突变负荷(TMB)被定义为每百万碱基中被检测出的体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数,将上述基因突变进行计数,除以总的靶向测序的长度作为TMB,单位为每百万碱基突变数,通常TMB与免疫疗效存在显著的正相关关系。
HLA进化异质性是一种度量HLA-I等位基因差异性的打分,高HLA进化异质性的患者,具有更好的免疫疗效,可以根据Chowell的方法进行计算。
微卫星不稳定可以通过免疫组织化学检测MMR蛋白(MLH1、MSH2、MSH6及PMS2)的表达,也可以通过PCR加电泳、高通量测序检测基因组中的特定重复序列(如NR-21、BAT-25、BAT-26、Mono-27、BAT-52、BAT-56、BAT-59、BAT-60)的插入与删除情况。在高通量测序中,可以利用MSIsensor、MANTIS等软件进行评估。
基因的突变状态可以通过高通量测序,并通过生物信息处理获得。处理的流程为:组织样本和血液对照进行靶向扩增,得到的基因组序列文库进行上机测序。测序读长将映射到人类基因组参考序列上,利用计算机分析程序如Varscan等进行变异查找,找到的候选基因突变经过可靠性过滤后,得到最后的基因突变。
得到的候选基因突变,将通过评估,仅筛选出符合以下标准的突变:
(1)对于点突变:
该点突变所在位置的测序覆盖深度>500次;包含该点突变的每个读段质量值>40,包含该点突变的每个读段上与该点突变相对应的碱基质量值>21;包含有该点突变的读段的条数≥5条;包含有该点突变的所有读段中正向的读段与反向的读段比例<1/6;和肿瘤组织的变异等位基因频率/对照组织的变异等位基因频率≥20;
(2)对于插入缺失(indel):
如果插入缺失中连续相同的碱基<5,则该插入缺失所在位置的测序覆盖深度>600次;包含该插入缺失的每个读段质量值>40;包含该插入缺失的每个读段上与该插入缺失突变相对应的碱基质量值>21;包含有该插入缺失的读段的条数≥5条;包含有该插入缺失的所有读段中正向的读长与反向的读长比例<1/6;肿瘤组织的变异等位基因频率/对照组织的变异等位基因频率≥20。
如果插入缺失中连续相同的碱基≥5且<7,则该插入缺失所在位置的测序覆盖深度>60次;包含该插入缺失的每个读段质量值>40;包含该插入缺失的每个读段上与该插入缺失突变相对应的碱基质量值>21;包含有该插入缺失的读段的条数≥5条;包含有该插入缺失的所有读段中正向的读长与反向的读长比例<1/6;肿瘤组织的变异等位基因频率/对照组织的变异等位基因频率>20;且肿瘤组织的变异等位基因频率≥10%。
如果插入缺失中连续相同的碱基≥7,则该插入缺失所在位置的测序覆盖深度>60次;包含该插入缺失的每个读段质量值>40;包含该插入缺失的每个读段上与该插入缺失突变相对应的碱基质量值>21;包含有该插入缺失的读段的条数≥5条;包含有该插入缺失的所有读段中正向的读长与反向的读长比例<1/6;肿瘤组织的变异等位基因频率/对照组织的变异等位基因频率>20;且肿瘤组织的变异等位基因频率≥20%。
进一步,本发明通过训练数据集形成一个原始数据矩阵(包括免疫疗效列),采用过滤法、包装法或者嵌入法对原始数据矩阵进行筛选得到一个带有预设标记的训练数据子集,以根据筛选得到的训练数据子集构建免疫预测模型。其中,预设标记是指通过机器学习算法给特征训练数据添加的标记,以筛选用于构建免疫疗效预测模型的训练数据子集。具体地,过滤法是指根据特征数据与免疫疗效的关联性对个体特征训练数据、肿瘤组织的基因组突变特征训练数据以及历史用药特征训练数据进行筛选得到具有预设标记的训练数据子集,包装法是根据免疫疗效选取不同组合的特征训练数据,从而得到带有预设标记的训练数据子集,嵌入法是先训练得到模型后,根据模型中特征变量的重要性,选取合适的特征变量,从而得到预设标记的训练数据子集。
一些具体实施方案中,本发明利用患者的个体特征训练数据,包括但不限于年龄、性别、是否进行过前化疗、体重指数、肿瘤类型、分期、中淋细胞比、血小板指标、血红蛋白指标、白蛋白指标和PD-L1表达状态,肿瘤组织的基因组突变特征训练数据,包括但不限于肿瘤含量、扩增比、肿瘤突变负荷、HLA进化异质性、HLA杂合性丢失、微卫星不稳定、基因的突变状态和测序基因集,以及历史用药特征训练数据,包括联合用药或者非联合用药,通过过滤法,根据每个特征训练数据和相应患者的免疫疗效的关联度,对每个特征训练数据赋予重要性标记,重要性标记包括重要标记和不重要标记,筛选具有重要标记的训练数据,从而获取用于构建免疫预测模型的训练数据子集。
具体筛选步骤包括:A)扩展原始训练数据表(即原始数据矩阵),为每个特征建立一个影子特征,每个特征的数据值为所有患者该特征的变量值的随机排列;B)用随机森林模型拟合扩展的数据表,得到平均精确性丢失值;C)计算各个特征的z值(平均精确性丢失值除以精确性丢失值的标准差);D)找到影子特征的最大z值;E)原始变量显著大于影子特征最大值时,该变量标示为“重要”;反之为“不重要”;F)重复1000次以上步骤,直到所有原始训练特征数据都被标示为“重要”和“不重要”之一,从而筛选得到肿瘤类型、肿瘤突变负荷、是否进行过化疗、是否是联合治疗、中淋细胞比、血小板指标、血红蛋白指标、HLA进化异质性、HLA杂合性丢失、扩增比、性别和体重指数共12个特征,以作为构建免疫预测模型的特征变量。
进一步,经过上述步骤形成165x13的矩阵(包括免疫疗效列),随后用caret包优化模型参数,统计每个模型参数对应的预测结果的准确性,得到模型的最优超参数mtry=1。具体地,模型参数的优化可以通过网格搜索、梯度下降、组合优化等方法进行。
进一步,利用最优超参数mtry=1和训练数据子集,构建由500个决策树形成的免疫疗效预测模型,构建过程包含如下步骤:A)随机选择一个特征,建立基尼系数最小的决策树,并对每个样本进行打分,得到每个样本的免疫疗效分值;B)重复上述步骤500次;C)最后每个样本的免疫疗效分值为每个决策树打正确分的比例,该值为根据免疫疗效预测模型输出的免疫疗效分值判断预测结果的所需的预设阈值。
一些实施方案中,免疫疗效预测模型构建完成后,根据训练数据子集中每位患者的免疫疗效分值,可以理解的是,根据训练样本的平衡性,可以将训练患者分成同等数量的有反应和无反应两组的临界数值作为预测免疫疗效的预设阈值。
另一些实施方案中,也可以获取测试数据集,测试数据集包括测试患者的肿瘤类型、肿瘤突变负荷、是否进行过化疗、是否是联合治疗、中淋细胞比、血小板指标、血红蛋白指标、HLA进化异质性、HLA杂合性丢失、扩增比、性别和体重指数的特征数据,将测试数据集输入免疫疗效预测模型,获取每个测试患者的免疫疗效分值,将训练患者分成同等数量的有反应和无反应两组的临界数值作为预测免疫疗效的预设阈值。
一些具体实施方案中,该预设阈值为0.909,可以理解的是,该当免疫疗效预测模型输出的免疫疗效分值大于0.909的患者,预测免疫疗效为治疗有效,对于免疫疗效分值小于或等于0.909的患者预测免疫疗效为治疗无效。
进一步,将受试者的个体特征数据、基因突变特征数据和历史用药特征数据输入免疫疗效预测模型,其中,个体特征数据包括性别、体重指数、肿瘤类型、是否进行过前化疗、中淋细胞比、血小板指标和血红蛋白指标中的至少一种个体特征的检测数据;基因突变特征数据包括肿瘤突变负荷、HLA进化异质性、HLA杂合性丢失和扩增比中的至少一种基因突变特征的检测数据;历史用药特征数据包括历史上使用药品的特征的记录数据,历史上使用药品的特征包括联合用药或者非联合用药,获取免疫疗效预测模型输出的受试者的免疫疗效分值,可以根据免疫疗效分值和预设阈值预测受试者的免疫治疗效果。本发明通过上述特征数据和免疫疗效的关联度,可以对不同受试者的免疫疗效进行预测,进而能够获得准确性和可靠度更高的免疫疗效预测结果。
一些实施方案中,根据免疫疗效分值输出受试者的免疫疗效预测结果具体包括:
将免疫疗效分值和预设阈值进行比较,判断免疫疗效分值是否大于预设阈值;
若免疫疗效分值大于预设阈值,则输出受试者的免疫疗效预测结果为治疗有效,否则输出受试者的免疫疗效预测结果为治疗无效。
具体地,预设阈值可以通过训练数据集训练初始免疫疗效预测模型时确定,也可以通过测试数据集对免疫预测模型进行测试获取,具体地,将免疫疗效分值和预设阈值进行比较,判断免疫疗效分值是否大于预设阈值之前还包括:
获取测试数据集,测试数据集包括至少两个患者的个体特征测试数据、基因突变特征测试数据、历史用药特征测试数据以及患者的免疫疗测试练数据;
将至少两个患者的个体特征测试数据、基因突变特征测试数据、历史用药特征测试数据以及患者的免疫疗效测试数据输入免疫疗效预测模型,以得到获取免疫疗效预测结果所需的预设阈值。
一些具体实施方案中,预设阈值为0.909。
需要说明的是,本发明的方法即使能够预测免疫治疗效果,也只可作为诊断或者下一步治疗的参考数据,不能作为治疗或诊断的直接依据,在实际应用中,还需要结合实际的临床诊断或者治疗手段对患者的病情作综合诊断或治疗,因此,不应当认定本发明预测免疫疗效的方法为诊断/治疗方法。
本方面的第二方面提供了一种用于预测免疫疗效的装置,包括:
数据获取模块:用于获取目标特征数据集,目标特征数据集包括受试者的个体特征数据、基因突变特征数据以及历史用药特征数据;
输入模块:将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型;
免疫疗效预测模块:用于获取免疫疗效预测模型输出的受试者的免疫疗效分值,根据免疫疗效分值输出受试者的免疫疗效预测结果;
其中,个体特征数据用于表征受试者的个体性差异;基因突变特征数据用于表征受试者肿瘤组织的基因突变情况;历史用药数据用于反映受试者历史上使用药品的情况。
一些实施方案中,该装置还包括:
预设阈值确定模块:用于获取免疫疗效预测模型输出的训练数据子集中每个患者的免疫疗效分值;根据训练数据子集中每个患者的免疫疗效分值确定预测免疫疗效的预设阈值。
本发明还涉及一种计算机可读存储介质,计算机存储介质用于存储计算机指令、程序、代码集或指令集,当其在计算机上运行时,使得计算机执行以实现上述预测免疫疗效的方法。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本发明还涉及一种电子设备,包括:
一个或多个处理器;以及
存储装置,存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述预测免疫疗效的方法。
可选的,电子设备还可以包括收发器。处理器和收发器相连,如通过总线相连。需要说明的是,实际应用中收发器不限于一个,该电子设备的结构并不构成对本申请实施例的限定。
其中,处理器可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线可包括一通路,在上述组件之间传送信息。总线可以是PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。存储器802可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
下面将结合实施例对本发明的实施方案进行详细描述。
实施例1
一、免疫疗效预测模型的构建
1、获取413位肿瘤患者免疫治疗数据
筛选并下载至本互联网医院的413位肿瘤患者的免疫治疗数据,其中,肿瘤患者需满足以下入组标准
a)病史资料齐全
b)有完整的血常规数据
c)同意参加二代测序检测基因突变
d)计划进行免疫治疗
2、收集患者的临床特征
2.1临床特征的采集
通过整理患者预进行免疫治疗前的病史进行。根据病史调查,收集患者的年龄、性别、身高、体重、肿瘤类型、临床病理分期等基本信息,以及免疫治疗前的血常规信息(包括中淋细胞比、血小板指标含量、血红蛋白指标含量、白蛋白指标含量等)。
2.2肿瘤组织的基因突变特征
肿瘤组织上进行高通量测序前,先进行样本质量检验和PD-1免疫组化检测。肿瘤细胞含量大于等于20%认定为合格样本,将进行高通量测序,测序得到的读长,利用BWE-MEM软件映射到人类基因组序列上,并利用GATK软件包进行校准。进一步地,通过Varscan软件,判断可能的基因突变。
TMB利用得到的基因突变数,除以靶向测序覆盖片段长度(单位为百万碱基)进行计算。利用FACETS来对基因组拷贝进行分段,统计扩增率大于1.15的片段比例作为扩增比。当任一HLA-I类基因的总拷贝数不小于2且另一个等位基因的频率为零时,定义为这个患者具有HLA杂合性丢失。
HLA进化异质性是利用Chowell的方法计算的HLA-A、HLA-B、HLA-C的平均进化距离。
微卫星不稳定采用MSIsensor计算结果进行判断:MSI得分小于3为微卫星稳定;介于3和10之间为中间态;大于10为微卫星不稳定。
2.3免疫治疗随访
患者治疗的效果采用RECIST v1.1标准进行评估。免疫治疗效果可据最佳疗效分为有效(CR,PR和SD)和无效(PD)。
2.4患者随机分组
413名患者通过随机数随机分成甲、乙两组,其中甲组样本占总样本的60%,乙组样本占总样本的40%。
3、建立免疫疗效预测模型
基于2.4中甲组样本患者的20项数据特征(年龄、性别、是否进行过前化疗、是否联合用药特征、体重指数、肿瘤类型、分期、中淋细胞比、血小板指标、血红蛋白指标、白蛋白指标、PD-L1、肿瘤含量、扩增比、肿瘤突变负荷、HLA进化异质性、HLA杂合性丢失、微卫星不稳定、基因的突变状态、测序基因集)及对应的免疫疗效,利用R计算平台的Borut软件包进行特征筛选,筛选后的特征包括:肿瘤类型、肿瘤突变负荷、是否进行过化疗、是否是联合治疗、中淋细胞比、血小板指标、血红蛋白指标、HLA进化异质性、HLA杂合性丢失、扩增比、性别、体重指数。
随后用caret包优化模型参数,得到本发明的免疫疗效预测模型,模型最优参数为mtry=1。
二、免疫疗效预测模型预测免疫疗效
获取实施例1中2.4患者随机分组得到的乙组样本患者的目标特征数据集,包括肿瘤类型、肿瘤突变负荷、是否进行过化疗、是否是联合治疗、中淋细胞比、血小板指标、血红蛋白指标、HLA进化异质性、HLA杂合性丢失、扩增比、性别、体重指数;
利用免疫疗效预测模型,输入一组样本受试者的特征数据进行免疫疗效预测,并与一组样本受试者实际的治疗效果进行比较,作出受试者操作曲线,免疫疗效预测模型预测免疫疗效获得的受试者操作曲线如图一所示。本实施例预测免疫疗效精确度为72.5%,敏感度为71%,特异性为81.8%。
本实施例根据免疫疗效预测模型准确鉴定出的其中5名治疗有效患者和5名治疗无效患者为:
患者一:实际最优治疗效果是SD(有应答)。模型预测的免疫疗效分值为0.968,大于阀值0.909,预测结果为治疗有效。预测结果与实际相符。
患者二:实际最优治疗效果是PR(有应答)。本发明预测的免疫疗效分值为0.984,大于阀值0.909,预测结果为治疗有效。预测结果与实际相符。
患者三:实际最优治疗效果是PR(有应答)。本发明预测的免疫疗效分值为0.966,大于阀值0.909,预测结果为治疗有效。预测结果与实际相符。
患者四:实际最优治疗效果是CR(有应答)。本发明预测的免疫疗效分值为0.994,大于阀值0.909,预测结果为治疗有效。预测结果与实际相符。
患者五:实际最优治疗效果是CR(有应答)。本发明预测的免疫疗效分值为0.976,大于阀值0.909,预测结果为治疗有效。预测结果与实际相符。
患者六:实际最优治疗效果是PD(无应答)。本发明预测的免疫疗效分值为0.602,小于阀值0.909,预测结果为治疗无效。预测结果与实际相符。
患者七:实际最优治疗效果是PD(无应答)。本发明预测的免疫疗效分值为0.848,小于阀值0.909,预测结果为治疗无效。预测结果与实际相符。
患者八:实际最优治疗效果是PD(无应答)。本发明预测的免疫疗效分值为0.778,小于阀值0.909,预测结果为治疗无效。预测结果与实际相符。
患者九:实际最优治疗效果是PD(无应答)。本发明预测的免疫疗效分值为0.904,小于阀值0.909,预测结果为治疗无效。预测结果与实际相符。
患者十:实际最优治疗效果是PD(无应答)。本发明预测的免疫疗效分值为0.906,小于阀值0.909,预测结果为治疗无效。预测结果与实际相符。
对比例1TMB预测免疫疗效
利用TMB进行免疫疗效预测,获得受试者操作曲线如图二所示。
通过比较图一和图二,可知实施例2预测免疫疗效的方法的准确性显著优于利用TMB预测免疫疗效的准确性。具体地,实施例2通过本发明模型作为免疫疗效预测模型,预测免疫疗效的方法,其AUC(受试者操作曲线下面积)达到了77.4%,而TMB对应的AUC仅仅为53.4%。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种预测免疫疗效的方法,其特征在于,包括:
获取目标特征数据集,所述目标特征数据集包括受试者的个体特征数据、基因突变特征数据以及历史用药特征数据;
将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型;
获取免疫疗效预测模型输出的受试者的免疫疗效分值,根据所述受试者的免疫疗效分值输出受试者的免疫疗效预测结果;
其中,所述受试者的个体特征数据用于表征所述受试者的个体性差异;受试者的所述基因突变特征数据用于表征所述受试者肿瘤组织的基因突变情况;受试者的所述历史用药数据用于反映所述受试者历史上使用药品的情况。
2.根据权利要求1所述的方法,其特征在于,所述将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型之前还包括:
获取训练数据集,所述训练数据集包括患者的个体特征训练数据、基因突变特征训练数据、历史用药特征训练数据以及患者的免疫疗效训练数据;
将个体特征训练数据、基因突变特征训练数据、历史用药特征训练数据与患者相应的免疫疗效输入初始免疫疗效预测模型,以获得带有预设标记的训练数据子集;
根据所述训练数据子集构建所述免疫疗效预测模型,其中,所述训练数据子集包括带有预设标记的个体特征训练数据、预设标记的基因突变特征训练数据、预设标记的历史用药特征训练数据以及相应患者的免疫疗效数据;
其中,患者的个体特征训练数据用于表征训练数据集中患者的个体性差异;基因突变特征训练数据用于表征训练数据集中患者肿瘤组织的基因突变情况;历史用药数据用于反映训练数据集中患者历史上使用药品的情况。
3.根据权利要求2所述的方法,其特征在于,所述个体特征训练数据包括年龄、性别、是否进行过前化疗、体重指数、肿瘤类型、分期、中淋细胞比、血小板指标、血红蛋白指标、白蛋白指标和PD-L1表达指标中的至少一种;
所述基因突变特征训练数据包括肿瘤含量、扩增比、肿瘤突变负荷、HLA进化异质性、HLA杂合性丢失、微卫星不稳定、基因的突变状态、测序基因集和测序方法中的至少一种;
所述历史用药特征训练数据包括联合用药或者非联合用药。
4.根据权利要求2所述的方法,其特征在于,所述带有预设标记的个体特征训练数据或者所述个体特征数据包括性别、体重指数、肿瘤类型、是否进行过前化疗、中淋细胞比、血小板指标和血红蛋白指标中的至少一种;
带有预设标记的基因突变特征训练数据或者所述基因突变特征数据包括肿瘤突变负荷、HLA进化异质性、HLA杂合性丢失和扩增比中的至少一种;
带有预设标记的历史用药特征训练数据或者所述历史用药特征数据包括联合用药或者非联合用药。
5.根据权利要求2所述的方法,其特征在于,所述根据所述训练数据子集构建所述免疫疗效预测模型之后还包括:
获取所述免疫疗效预测模型输出的所述训练数据子集中每个患者的免疫疗效分值;
根据训练数据子集中每个患者的免疫疗效分值确定预测免疫疗效的预设阈值。
6.根据权利要求3所述的方法,其特征在于,所述根据所述免疫疗效分值输出受试者的免疫疗效预测结果具体包括:
将所述免疫疗效分值和预设阈值进行比较,判断免疫疗效分值是否大于预设阈值;
若所述免疫疗效分值大于预设阈值,则输出受试者的免疫疗效预测结果为治疗有效,否则输出受试者的免疫疗效预测结果为治疗无效。
7.根据权利要求1~6任一项所述的方法,其特征在于,所述肿瘤组织包括脑瘤、口腔、食管癌、肺癌、肝癌、胰腺癌、胃癌、结直癌、尿道癌、黑色素瘤、软组织肿瘤、乳腺癌和前列腺癌中的至少一种形成的肿瘤组织。
8.一种用于预测免疫疗效的装置,其特征在于,包括:
数据获取模块:用于获取目标特征数据集,所述目标特征数据集包括受试者的个体特征数据、基因突变特征数据以及历史用药特征数据;
输入模块:将受试者的个体特征数据、基因突变特征数据以及历史用药特征数据输入免疫疗效预测模型;
免疫疗效预测模块:用于获取免疫疗效预测模型输出的受试者的免疫疗效分值,根据所述免疫疗效分值输出受试者的免疫疗效预测结果;
其中,所述个体特征数据用于表征所述受试者的个体性差异;所述基因突变特征数据用于表征所述受试者肿瘤组织的基因突变情况;所述历史用药数据用于反映所述受试者历史上使用药品的情况。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202210294379.6A 2022-03-24 2022-03-24 预测免疫疗效的方法、装置、计算机设备和存储介质 Pending CN114694745A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210294379.6A CN114694745A (zh) 2022-03-24 2022-03-24 预测免疫疗效的方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210294379.6A CN114694745A (zh) 2022-03-24 2022-03-24 预测免疫疗效的方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN114694745A true CN114694745A (zh) 2022-07-01

Family

ID=82138697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210294379.6A Pending CN114694745A (zh) 2022-03-24 2022-03-24 预测免疫疗效的方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114694745A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115620894A (zh) * 2022-09-20 2023-01-17 贵州医科大学第二附属医院 基于基因突变的肺癌免疫疗效预测方法、系统及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180107786A1 (en) * 2016-10-07 2018-04-19 Omniseq, Inc. Methods and systems for determining personalized therapies
WO2019109089A1 (en) * 2017-12-01 2019-06-06 Illumina, Inc. Systems and methods for assessing drug efficacy
US20200157635A1 (en) * 2017-04-14 2020-05-21 Genentech, Inc. Diagnostic and therapeutic methods for cancer
CN113215254A (zh) * 2021-03-29 2021-08-06 中国医学科学院肿瘤医院 可用于评估肺腺癌预后的免疫-临床特征联合预测模型
CN113396160A (zh) * 2018-09-19 2021-09-14 国家医疗保健研究所 治疗对免疫检查点疗法具有抗性的癌症的方法和药物组合物
US11145416B1 (en) * 2020-04-09 2021-10-12 Tempus Labs, Inc. Predicting likelihood and site of metastasis from patient records
WO2021222867A1 (en) * 2020-04-30 2021-11-04 Caris Mpi, Inc. Immunotherapy response signature
WO2021228888A1 (en) * 2020-05-12 2021-11-18 Asylia Diagnostics Biomarkers for hyperprogressive disease and therapy response after immunotherapy
CN113913527A (zh) * 2021-11-26 2022-01-11 青岛泱深生物医药有限公司 预测黑色素瘤患者对mage-a3免疫疗法敏感性的产品
CN113981092A (zh) * 2021-11-26 2022-01-28 青岛泱深生物医药有限公司 用于预测肿瘤药物敏感性的生物标志物及其相关产品
CN114184790A (zh) * 2022-01-13 2022-03-15 中国人民解放军海军军医大学第一附属医院 Bgn基因在预测结肠癌患者免疫检查点抑制剂治疗效果中的用途
CN114220486A (zh) * 2021-11-26 2022-03-22 贵州医科大学第二附属医院 一种基于支持向量机的肺癌免疫联合化疗效果预测

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180107786A1 (en) * 2016-10-07 2018-04-19 Omniseq, Inc. Methods and systems for determining personalized therapies
US20200157635A1 (en) * 2017-04-14 2020-05-21 Genentech, Inc. Diagnostic and therapeutic methods for cancer
WO2019109089A1 (en) * 2017-12-01 2019-06-06 Illumina, Inc. Systems and methods for assessing drug efficacy
CN113396160A (zh) * 2018-09-19 2021-09-14 国家医疗保健研究所 治疗对免疫检查点疗法具有抗性的癌症的方法和药物组合物
US11145416B1 (en) * 2020-04-09 2021-10-12 Tempus Labs, Inc. Predicting likelihood and site of metastasis from patient records
WO2021222867A1 (en) * 2020-04-30 2021-11-04 Caris Mpi, Inc. Immunotherapy response signature
WO2021228888A1 (en) * 2020-05-12 2021-11-18 Asylia Diagnostics Biomarkers for hyperprogressive disease and therapy response after immunotherapy
CN113215254A (zh) * 2021-03-29 2021-08-06 中国医学科学院肿瘤医院 可用于评估肺腺癌预后的免疫-临床特征联合预测模型
CN113913527A (zh) * 2021-11-26 2022-01-11 青岛泱深生物医药有限公司 预测黑色素瘤患者对mage-a3免疫疗法敏感性的产品
CN113981092A (zh) * 2021-11-26 2022-01-28 青岛泱深生物医药有限公司 用于预测肿瘤药物敏感性的生物标志物及其相关产品
CN114220486A (zh) * 2021-11-26 2022-03-22 贵州医科大学第二附属医院 一种基于支持向量机的肺癌免疫联合化疗效果预测
CN114184790A (zh) * 2022-01-13 2022-03-15 中国人民解放军海军军医大学第一附属医院 Bgn基因在预测结肠癌患者免疫检查点抑制剂治疗效果中的用途

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
E.E.VOKES等: "《药剂学基础与临床研究》", 《科学技术文献出版社》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115620894A (zh) * 2022-09-20 2023-01-17 贵州医科大学第二附属医院 基于基因突变的肺癌免疫疗效预测方法、系统及存储介质
CN115620894B (zh) * 2022-09-20 2023-05-02 贵州医科大学第二附属医院 基于基因突变的肺癌免疫疗效预测系统、装置及存储介质

Similar Documents

Publication Publication Date Title
US11482303B2 (en) Convolutional neural network systems and methods for data classification
US11621083B2 (en) Cancer evolution detection and diagnostic
CN110305965A (zh) 一种预测非小细胞肺癌(nsclc)患者对免疫疗法的敏感性的方法
CN112086129B (zh) 预测肿瘤组织cfDNA的方法及系统
US11710540B2 (en) Multi-level architecture of pattern recognition in biological data
CN112951327B (zh) 药物敏感预测方法、电子设备及计算机可读存储介质
Radespiel-Tröger et al. Comparison of tree-based methods for prognostic stratification of survival data
Waldron et al. Meta-analysis in gene expression studies
CN114694745A (zh) 预测免疫疗效的方法、装置、计算机设备和存储介质
CN107451422A (zh) 一种基因序列数据分析与在线交互可视化的方法
US20200265919A1 (en) Analyzing device, analysis method program, and non-volatile storage medium
Mauguen et al. Estimating the probability of clonal relatedness of pairs of tumors in cancer patients
Guo et al. Strong positive selection biases identity-by-descent-based inferences of recent demography and population structure in Plasmodium falciparum
CN116844685A (zh) 一种免疫治疗效果评估方法、装置、电子设备及存储介质
Park et al. Deep learning for stage prediction in neuroblastoma using gene expression data
CN114999653B (zh) 一种非小细胞肺癌免疫治疗疗效的预测模型的训练方法以及预测装置
CN110462056B (zh) 基于dna测序数据的样本来源检测方法、装置和存储介质
CN106503489A (zh) 心血管系统对应的基因的突变位点的获取方法及装置
Wolf et al. Ordinal Logic Regression: A classifier for discovering combinations of binary markers for ordinal outcomes
Mogan Biomarker Discovery by Semi-Supervised Non-Negative Matrix Factorization
US20220223227A1 (en) Machine learning techniques for identifying malignant b- and t-cell populations
Lu et al. CNETML: maximum likelihood inference of phylogeny from copy number profiles of multiple samples
US20230253115A1 (en) Methods and systems for predicting in-vivo response to drug therapies
Li et al. An age classification model based on DNA methylation biomarkers of aging in human peripheral blood using random forest and artificial neural network
Mapelli Multi-outcome feature selection via anomaly detection autoencoders: an application to radiogenomics in breast cancer patients

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination