CN114929899A - 一种新抗原的筛选方法、系统及其用途 - Google Patents

一种新抗原的筛选方法、系统及其用途 Download PDF

Info

Publication number
CN114929899A
CN114929899A CN202180008361.9A CN202180008361A CN114929899A CN 114929899 A CN114929899 A CN 114929899A CN 202180008361 A CN202180008361 A CN 202180008361A CN 114929899 A CN114929899 A CN 114929899A
Authority
CN
China
Prior art keywords
cancer
neoantigen
gene
antigen
dependent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180008361.9A
Other languages
English (en)
Inventor
崔正均
房晓恩
朴宰淳
赵大衍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Petmedex Co ltd
Korea Advanced Institute of Science and Technology KAIST
Original Assignee
Petmedex Co ltd
Korea Advanced Institute of Science and Technology KAIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Petmedex Co ltd, Korea Advanced Institute of Science and Technology KAIST filed Critical Petmedex Co ltd
Publication of CN114929899A publication Critical patent/CN114929899A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Library & Information Science (AREA)
  • Hospice & Palliative Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Physiology (AREA)

Abstract

本发明涉及一种新抗原的筛选方法、系统及其用途,更具体地,公开一种新抗原作为诊断和/或治疗靶点的筛选方法、系统及其用途,所述新抗原来源于癌组织内所有细胞中均一的基因,和/或其表达对癌细胞的存活是必需的。

Description

一种新抗原的筛选方法、系统及其用途
技术领域
本发明涉及一种新抗原的筛选方法、系统及其用途。更具体地,本发明涉及一种筛选新抗原作为诊断和/或治疗靶点的筛选方法、系统及其用途,所述新抗原来源于癌组织内所有细胞中均一的基因,和/或其表达对癌细胞的存活是必不可少的。
背景技术
作为目前最备受关注的抗癌疗法,免疫抗癌治疗为抗癌治疗提供一种新的范式,因为在有反应的患者组中可以预期高治愈率。全球已开展了3400多项免疫抗癌剂临床试验,并正在积极研究中。
抗癌疫苗为一种使用癌症特异性抗原激活免疫系统的免疫抗癌治疗剂,正在成为通过与免疫检查点抑制剂(checkpoint blockade)的联合疗法的免疫抗癌治疗的核心技术。然而,免疫检查点抑制剂,例如,抗-PD-1/抗-PD-L1的实际成功率只有15%至20%,并且包括一个导致整体T细胞免疫调节功能丧失的过程,从而存在诸如自身免疫性疾病等副作用的高风险。仍然需要一种可以提高癌症患者的反应率并将副作用最小化的治疗剂。
患者定制型抗癌疫苗可实现针对患者特异性新抗原的最佳疫苗设计,从而能其正在被开发为一种可以提高癌症患者的治疗效果并最大限度地减少副作用的治疗方法。通过诱导患者内免疫作用集中在癌细胞特异性新抗原(neoantigen)上,可以增强免疫抗癌治疗的效果,为此,选择最佳新抗原的技术是至关重要的。
癌细胞通过免疫编辑(immunoediting)过程演变成一种可以逃避抗癌免疫反应的形式。这种演变的癌细胞群被认为是对免疫抗癌治疗的抵抗性和癌症复发的原因。需要开发一种可克服由这些肿瘤的异质性和可塑性引起的免疫逃避机制的新抗原靶点。韩国专利申请公开号第2018-0107102号公开了一种鉴别和选择用于个性化癌症疫苗的新抗原的方法,但没有公开或暗示任何需要克服癌细胞的免疫逃避以及克服其的需要。
本发明人对使得难以发现有效的新抗原作为抗癌疫苗的逃避癌细胞的免疫编辑机制的策略进行研究,以完成了筛选有效新抗原作为诊断和/或治疗靶点的方法的发明。
发明内容
技术问题
本发明的目的在于,提供一种新抗原的筛选方法,其克服癌细胞的免疫逃避。
本发明的另一目的在于,提供一种用于筛选新抗原的系统,其克服癌细胞的免疫逃避。
本发明的再一目的在于,提供一种抗癌疫苗,其包括克服癌细胞的免疫逃避的新抗原。
本发明的再一目的在于,还提供一种用于预测癌症患者的治疗预后的组合物,其包括克服癌细胞的免疫逃避的新抗原。
技术方案
本发明的一方面提供一种新抗原的筛选方法,其包括:
从癌症患者获取外显子组(exome)、转录组(transcriptome)、单细胞转录组(single cell transcriptome)、肽组(peptidome)或全基因组的测序数据;
选择癌细胞存活依赖性基因;以及
获得源自所述癌细胞存活依赖性基因的新抗原。
在本发明的一具体实施例中,新抗原的筛选方法还包括:判断所述新抗原与抗原呈递细胞的人类白细胞抗原(HLA)之间的结合亲和力。
在本发明的一具体实施例中,癌细胞存活依赖性基因在其表达水平降低或去除时,可以导致若干类型的癌细胞或源自该患者的癌细胞的死亡。
在本发明的一具体实施例中,癌细胞存活依赖性基因可以为一种对若干类型的癌症或癌细胞的存活普遍必需的通用性依赖性基因。
在本发明的一具体实施例中,癌细胞存活依赖性基因可以为一种对源自所述癌症患者的癌细胞的存活必需的癌症患者特异性依赖性基因。
在本发明的一具体实施例中,癌细胞存活依赖性基因可以包括通用性依赖性基因或癌症患者特异性依赖性基因,或通用性依赖性基因和癌症患者特异性依赖性基因。
在本发明的一具体实施例中,选择癌细胞存活依赖性基因包括:使用细胞存活依赖性预测模型选择癌细胞存活所必需的癌细胞存活依赖性基因,所述细胞存活依赖性预测模型通过训练细胞基因表达模式与细胞死亡之间的关系来生成,可以将根据基因的表达水平降低或去除导致癌细胞死亡的基因选为癌细胞存活依赖性基因。
在本发明的一具体实施例中,所述细胞存活依赖性预测模型可以根据深度学习从针对细胞基因表达与细胞死亡之间关系的实验数据中学习。
在本发明的一具体实施例中,所述基因表达与细胞死亡之间的关系可以基于关于癌细胞系是否因靶向的基因表达水平降低或去除而被杀死的体外筛选实验数据或计算机数据。
在本发明的一具体实施例中,所述选择癌细胞存活依赖性基因还可以包括:判断从所述细胞存活依赖性预测模型选择的癌细胞存活依赖性基因是否在从癌症患者获得的所有癌细胞中均一表达。
在本发明的一具体实施例中,所述获得源自所述癌细胞存活依赖性基因的新抗原可以包括:根据从癌症患者获得的测序数据,比较来自癌细胞的序列和来自正常细胞的序列以获得癌症患者的新抗原;以及在所述获得的新抗原中,收集源自所述癌细胞存活依赖性基因的新抗原。
在本发明的一具体实施例中,所述获得源自所述癌细胞存活依赖性基因的新抗原可以包括:将根据从癌症患者获得的测序数据中的序列与从正常对照组获得的测序数据中的序列进行比较以获得癌症患者的新抗原;以及在所述获得的新抗原中,收集源自所述癌细胞存活依赖性基因的新抗原。
在本发明的一具体实施例中,所述收集新抗原还可以包括:选择所述癌细胞存活依赖性基因的非同义(nonsynonymous)突变。
在本发明的一具体实施例中,所述判断所述新抗原与抗原呈递细胞的HLA之间的结合亲和力包括:将所述新抗原的序列输入到新抗原结合亲和力预测模型以获得结合亲和力预测,所述新抗原结合亲和力预测模型用于预测抗原肽与抗原呈递细胞的HLA之间的结合亲和力,所述新抗原结合亲和力预测模型可以通过训练肽的氨基酸与HLA的氨基酸之间的相互作用数据来生成。
在本发明的一具体实施例中,所述抗原呈递细胞可以为树突细胞、巨噬细胞、B细胞或其组合。
在本发明的一具体实施例中,所述HLA可以为主要组织相容性等级(MajorHistocompatibility Class,MHC)I类或II类。
在本发明的一具体实施例中,当所述新抗原与所述抗原呈递细胞的HLA之间的CNN-MHC水平>0.5时,可以确定存在结合亲和力。
在本发明的一具体实施例中,根据针对癌细胞存活的必须性,可以选择多个癌细胞存活依赖性基因。
在本发明的一具体实施例中,根据针对癌细胞存活的必须性,可以分别选择前5个和后5个、前10个和后10个或前更多个和后更多个癌细胞存活依赖性基因。
在本发明的一具体实施例中,所述新抗原可以为癌症患者特异性新抗原。
本发明的另一方面提供一种用于筛选新抗原的系统,其包括:
至少一个执行所述存储器中存储的所述至少一条指令的处理器,
所述处理器通过执行所述至少一条指令,
训练细胞基因的表达水平与细胞死亡之间的关系,以生成细胞存活依赖性预测模型,所述细胞存活依赖性预测模型预测细胞存活对基因表达的依赖性,
将癌症患者的基因表达谱输入到所述细胞存活依赖性预测模型以选择癌细胞存活依赖性基因,并从癌症患者的基因表达谱中获得源自所述癌细胞存活依赖性基因的新抗原,
根据肽与抗原呈递细胞的氨基酸相互作用,生成用于预测结合亲和力的新抗原结合亲和力预测模型,
使用所述新抗原结合亲和力预测模型,选择具有与抗原呈递细胞的HLA的结合亲和力的新抗原。
在本发明的一具体实施例中,所述系统可用于实施根据本发明一具体实施例的新抗原的筛选方法。
在本发明的一具体实施例中,所述细胞存活依赖性预测模型可以选择细胞存活依赖性基因或预测新抗原来源基因的细胞存活依赖性。
在本发明的一具体实施例中,所述细胞存活依赖性预测模型通过训练细胞基因的表达水平与细胞死亡之间的关系生成,可以将根据基因表达水平降低或去除导致癌细胞死亡的基因选为癌细胞存活依赖性基因。
在本发明的一具体实施例中,癌细胞存活依赖性基因可以为一种对若干类型的癌症或癌细胞的存活普遍必需的通用性依赖性基因。
在本发明的一具体实施例中,癌细胞存活依赖性基因可以为一种对源自特定癌症患者的癌细胞的存活必需的癌症患者特异性依赖性基因。
在本发明的一具体实施例中,癌细胞存活依赖性基因可以包括通用性依赖性基因或癌症患者特异性依赖性基因,或通用性依赖性基因和癌症患者特异性依赖性基因。
在本发明的一具体实施例中,所述处理器通过执行所述至少一条指令,当所述新抗原与所述抗原呈递细胞的HLA之间的CNN-MHC水平>0.5时,可以将其选为具有结合亲和力的新抗原。
在本发明的一具体实施例中,所述处理器可以通过执行所述至少一条指令,分别学习基因表达与细胞死亡之间的关系和新抗原与抗原呈递细胞的HLA的结合亲和力的关系。
在本发明的一具体实施例中,所述学习可以根据深度学习来执行。
在本发明的一具体实施例中,所述细胞的基因表达与细胞死亡之间的关系可以基于关于癌细胞系是否因靶向的基因表达水平降低或去除而被杀死的体外数据或计算机数据。
在本发明的一具体实施例中,所述新抗原结合亲和力预测模型可以通过训练肽的氨基酸与HLA的氨基酸之间的相互作用数据来生成。
在本发明的一具体实施例中,所述癌症患者的基因表达谱可以为外显子组、转录组、单细胞转录组、肽组或全基因组的测序数据。
在本发明的一具体实施例中,所述HLA可以为MHC I类或II类。
在本发明的一具体实施例中,当所述新抗原与所述抗原呈递细胞的HLA之间的CNN-MHC水平>0.5时,可以确定存在结合亲和力。
在本发明的一具体实施例中,根据针对癌细胞存活的必须性,可以选择多个癌细胞存活依赖性基因。
本发明的再一方面还提供一种抗癌疫苗的制备方法,其包括:
通过前述根据本发明的一方面的筛选方法获得新抗原;以及
制备包括所述新抗原的抗癌疫苗。
在本发明的一具体实施例中,所述抗癌疫苗的制备方法还可以包括:获得包括所述新抗原位点的由9个至30个氨基酸组成的肽序列;以及
从所述肽序列选择具有亲水性和稳定性的肽序列。
在本发明的一具体实施例中,所述选择的肽序列的Kyte-Doolittle GRAVY<0,InstaIndex<40。
在本发明的一具体实施例中,所述肽序列可以由12个至30个、15个至30个或15个至25个氨基酸组成。
本发明的再一方面还提供一种抗癌疫苗,其包括通过前述根据本发明的一方面的筛选方法而获得的新抗原。
抗癌疫苗可以引起特异性细胞毒性T细胞反应和/或特异性辅助T细胞反应。
在本发明的一具体实施例中,所述抗癌疫苗可以包括含有新抗原的肽。
在本发明的一具体实施例中,所述肽具有由15个至30个氨基酸组成的长度,可与抗原呈递细胞的HLA结合并激活新抗原特异性T细胞。
在本发明的一具体实施例中,所述抗癌疫苗可以包括含有两种或更多种新抗原的肽。
在本发明的一具体实施例中,所述抗癌疫苗还可以包括诸如抗癌剂之类的额外的活性成分、添加剂、赋形剂等。
以足以引起抗原特异性免疫反应的量施用抗癌疫苗。本领域技术人员无需过多实验即可确定抗癌疫苗中包括的肽的量或抗癌疫苗的剂量。抗癌疫苗可以通过静脉内注射、皮下注射、皮内注射、腹膜内注射或肌肉内注射来施用。抗癌疫苗中肽的浓度可以广泛变化,例如按重量计小于约0.1%、约2%至约20%、约50%或更多,具体根据施用方式来确定。抗癌疫苗的剂量由临床医生综合考虑含有新抗原的肽的组成、施用方法、目标疾病的病情阶段和严重程度、患者的体重、健康状况等来确定,通常,对于70kg的患者,可以以约1.0μg至约50000μg肽的量施用。
本发明的再一方面还提供一种提供用于预测癌症患者的治疗预后的信息的方法,其包括:通过前述根据本发明的一方面的筛选方法获得新抗原;以及
从癌症患者的样本测量所述新抗原的量。
在本发明的一具体实施例中,所述提供用于预测癌症患者的治疗预后的信息的方法还可以包括:将所述获得的新抗原的量与从由确认治疗预后的癌症患者组成的对照组中获得的所述新抗原的量进行比较。
在本发明的一具体实施例中,所述对照组可以由确认具有良好治疗预后的癌症患者或确认具有不良治疗预后的癌症患者组成。
在本发明的一具体实施例中,所述新抗原的量可以为新抗原的数量。
在本发明的一具体实施例中,当癌症患者的样本中新抗原的量或数量高于治疗预后不良的癌症患者的对照组时,可以预测该癌症患者的治疗预后良好。
在本发明的一具体实施例中,当癌症患者的样本中新抗原的量或数量低于治疗预后良好的癌症患者的对照组时,可以预测该癌症患者的治疗预后较差。
本发明的再一方面还提供一种用于预测癌症患者的治疗预后的组合物,其包括通过前述根据本发明的一方面的筛选方法而获得的新抗原。
根据本发明的一方面的用于预测癌症患者的治疗预后的组合物可以进一步包括预测癌症患者的治疗预后所必需的附加成分。
有益效果
通过根据本发明一具体实施例的方法,可以筛选源自对癌细胞存活必需的通用性依赖性基因或癌症患者特异性依赖性基因的新抗原作为诊断和/或治疗靶点,从而可有效用于基于新抗原的抗癌疫苗开发和癌症患者治疗预后预测,所述新抗原可以最大限度地发挥免疫疗法对癌细胞的作用,而不必担心癌细胞的免疫逃避。
附图说明
图1为根据本发明一具体实施例的计算机进行癌细胞存活依赖性基因预测的方法的示意图。
图2为根据本发明一具体实施例的新抗原的筛选方法的流程图。新抗原的来源基因的癌细胞存活依赖性的判断和新抗原与抗原呈递细胞的结合力的判断可以根据需求调整其执行顺序和次数。
图3为根据本发明一具体实施例的用于筛选新抗原的系统的框图。
图4是为根据本发明一具体实施例的处理器的框图。
图5示出了通过根据本发明一具体实施例的使用体外依赖性数据的新抗原的筛选方法而获得的新抗原作为诊断和/或治疗靶点的显著性。使用针对肺癌和黑色素瘤已公开的群组的体外依赖性数据(Denpendency)和表达均匀性数据(Expression homogeneity),验证了根据本发明的一具体实施例的基于癌细胞存活依赖性的新抗原的筛选方法的显著性。灰色虚线表示根据现有使用的标准方法针对所有基因计算的新抗原数量的差异。
图6为癌细胞的免疫逃避机制的示意图。由此可以看出,当新抗原的来源蛋白质对癌细胞的存活是必需的,并且是一种在所有细胞中均一表达的组成性(constitutive)新抗原时,癌细胞对免疫治疗有有效反应,而当新抗原对癌细胞的存活不是必需的,或是一种在所有细胞中不均一表达的兼性(facultative)新抗原时(下端),发生针对免疫治疗的免疫逃避机制。
图7示出了根据本发明的一具体实施例的通过基于体外依赖性数据和单细胞基因表达数据的新抗原的筛选方法而获得的新抗原对免疫治疗的反应模式。在黑色素瘤免疫检查点抑制剂处方群组(Riaz)中,从新抗原衍生的基因功能对癌症存活的必须性(高依赖性与低依赖性)和基因表达的均匀性(同质表达与异质表达)方面进行比较治疗前后的克隆变化和基因表达变化的结果。CR/PR和SD/PD分别表示积极预后和消极预后。对积极预后患者而言,源自高必须性基因的新抗原主要受到免疫攻击以导致克隆缩小(clonalcontraction),并且作为免疫编辑的结果,基因表达(RNA expression)降低,对消极预后患者而言,可以确认,源自低必须性基因的新抗原主要受到免疫攻击以导致克隆扩增和表达降低。
图8示出了通过根据本发明一具体实施例的使用体外依赖性数据的新抗原的筛选方法而获得的新抗原作为诊断/治疗靶点的显著性。对针对所有类型的癌症患者样本的MSKCC组(基因数量为468个)结果和针对肺癌和黑色素瘤免疫治疗群组的存活分析进行了类似于图5中所示的分析。图8的上端(MSK泛癌)为根据MSKCC全(all)组或针对癌细胞存活的必须性前50%基因(高适应性)或后50%基因(低适应性)分析突变来源基因的结果,并且中间(肺癌)和下端(黑色素瘤)为根据所有基因或癌细胞存活必须性前500个基因(高适应性)和后500个基因(低适应性)分析肺癌和黑色素瘤免疫治疗的已公开的免疫治疗群组的结果。根据每个基因组,分为突变量(mutation burden)或新抗原数量(neoantigen load)多的患者(高)和少的患者(低),并且比较治疗后的存活率以分别显示HR(危险比)值和p值。HR越低,p值越低,这表明针对该基因组治疗预后的解释力越高。结果可以看出,使用少数具有高癌细胞存活依赖性的基因组比根据标准方法使用所有基因组更好地解释治疗预后。
图9示出了根据本发明的一具体实施例的基于癌症患者特异性计算机依赖性数据获得的新抗原作为诊断/治疗靶点的显著性。基于由癌症基因组图谱(The Cancer GenomeAtlas,TCGA)公布的肺癌和乳腺癌患者的转录组数据(https://portal.gdc.cancer.gov/),进行了图1所示的计算机依赖性预测。由于这些都不是真正接受过免疫抗癌治疗的患者,因此分为免疫细胞穿透率高的样本(高白细胞比例)和免疫细胞穿透率低的样本(低白细胞比例),以假设在免疫细胞穿透率高的样本中会看到类似于免疫治疗的效果。如图5所示,测量了新抗原的来源基因对患者存活的解释力,并且仅在免疫细胞穿透率高的样本中获得了类似的结果(R:Responder,NR:Nonresponder)。灰色虚线表示根据现有使用的标准方法针对所有基因计算的新抗原数量的差异。可以证实癌症患者特异性依赖性数据显示出比通用性依赖性数据更高的解释力差异。
图10为预测根据本发明一具体实施例的新抗原的筛选方法中使用的新抗原与MHC的结合亲和力的模型的示意图。根据氨基酸相似性矩阵(amino acid similarity matrix)信息构建HLA与新抗原肽之间的二维矩阵,并在此处应用卷积神经网络(convolutionalneural network,CNN)以显示出预测HLA与抗原肽之间的结合力的模型。
图11示出了使用由免疫表位数据库(Immune Epitope Database,IEDB)官方提供的测试数据集根据本发明一具体实施例的CNN与其他方法(NetMHCpan、NetMHCcon、ANN、SMMPMBEC)的性能(AUC、F1分数)比较结果。
图12示出了根据本发明一具体实施例预测的新抗原的HLA结合能力的确认结果。已证实,80%的含有预测与HLA-A02结合的新抗原的肽实际上与HLA-A02结合。
图13示出了由根据本发明一具体实施例选择的新抗原引起的免疫反应的确认结果。根据基于INFγ分泌进行酶联免疫斑点(ELISpot)分析以确认CD8+T对新抗原反应的结果,15个预测反应性的候选新抗原肽中的10个(66.7%)引发了T细胞分泌INFγ。
具体实施方式
参照附图和下面详细描述的实施例,本发明将变得显而易见。然而,本发明不限于实施例,而可以通过各种形式来实施,本实施例仅用于使本发明的公开内容完整,本文旨在为本发明所属领域的普通技术人员充分告知本发明的范围,并且本发明由权利要求限定。
如本文所用,术语“外显子组(exome)”是指细胞、细胞群或个体中存在的外显子(exon)的组合。
如本文所用,术语“转录组(transcriptome)”是指细胞、细胞群或个体中存在的表达的核糖核酸(ribonucleic acid,RNA)的组合。
如本文所用,术语“基因表达谱(gene expression profile)”作为从细胞的基因组表达或转录的基因分析,是指表示包括一个或多个基因的mRNA水平的基因的表达水平的值的组合。
如本文所用,术语“依赖性”是指针对细胞的增殖或存活的必须性,并且可与“必须性”互换使用。
如本文所用,术语“依赖性基因”是指细胞的增殖或存活所必需的基因。更具体地,依赖性基因作为在其表达减少或被去除时会导致细胞的增殖减少和/或死亡的基因,是指细胞赖以生存的基因,其可以包括通用性依赖性基因和/或癌症患者特异性依赖性基因,所述通用性依赖性基因对各种类型和/或来源的癌症或癌细胞的存活普遍至关重要,所述癌症患者特异性依赖性基因对对来自个体癌症患者的癌细胞的存活至关重要。依赖性基因可以是指在细胞中必须性地组成性地表达并在所有个体细胞中均一地表达的基因。
如本文所用,术语“通用性依赖性基因”是指通过如已知癌细胞系等的体外数据鉴定为对多数不同癌细胞的存活所必需的基因。
如本文所用,术语“癌症患者特异性依赖性基因”是指鉴定为对源自个体癌症患者的癌细胞的存活所必需的基因。
如本文所用,术语“新抗原(neoantigen)”是指引起免疫反应的肽。即,新抗原可以为免疫原性肽。新抗原可以由癌细胞特异性突变诱导,并可以表现为癌细胞的表位。通过癌细胞中的突变或癌细胞特异性翻译后修饰,具有至少一个将其与相应的野生型、亲本(parental)抗原区分开来的修饰的抗原。新抗原可以包括氨基酸序列或核苷酸序列。突变可以包括移码或非移码(non-frameshift)突变、插入缺失(indel)、错义(missense)或无义(nonsense)、剪接位点改变、基因组重排或基因融合,或任何引起新ORF的基因组或表达改变。
由于源自通用性依赖性或癌症患者特异性依赖性基因的新抗原不因癌细胞免疫编辑的免疫逃避而丢失,因此可以作为能够为癌症患者带来较高的免疫治疗效果的癌症患者定制型癌症疫苗的有效治疗靶点,也可以作为免疫治疗预后的有效诊断靶点。
如本文所用,术语“免疫治疗”是指使用免疫反应的疗法。免疫治疗可用于治疗癌症。例如,免疫治疗可以为使用免疫检查点抑制剂的治疗,免疫检查点抑制剂可以为但不限于抗CTLA4阻断剂或抗PD-1/PD-L1阻断剂,其可以为多种免疫治疗。
如本文所用,术语“结合亲和力”是指新抗原肽与抗原呈递细胞的MHC之间的结合力,可以表示为CNN-MHC值。“CNN-MHC值”为一种根据实验值建立深度学习模型来得到的值,所述实验值通过将新抗原与MHC之间的每个氨基酸之间的结合强度转换成矩阵形式而获得,所述CNN-MHC值是指转换为sigmoid激活函数的介于0与1之间的概率值。具体而言,可与MHCⅠ类或Ⅱ类蛋白质结合的免疫原性肽可以具有0.5或更高的MHC CNN-MHC值。另外,CNN-MHC值越接近1,MHCⅠ类或Ⅱ类蛋白质与免疫原性肽的结合力越强。
如本文所用,术语“抗原呈递细胞”是指接受并处理蛋白质抗原,然后将抗原衍生肽片段与MHCⅡ类一起呈递给T细胞以激活的细胞,例如可以为巨噬细胞、B细胞、树突细胞等。
如本文所用,术语“细胞存活依赖性预测模型”是指根据个体基因的表达减少或去除来预测细胞存活或死亡概率的模型。具体地,其为通过机器学习根据基因的敲除/敲低学习对细胞存活的影响来预测特定基因对细胞存活影响的模型,机器学习可以通过使用RNAi或CRISPR/Cas9等基因敲除/敲低的体外数据来执行。若将基因表达谱或序列输入到细胞存活依赖性预测模型中,可以预测该序列的来源基因的细胞存活依赖性。
如本文所用,术语“新抗原结合亲和力预测模型”是指预测新抗原与抗原呈递细胞,特别是抗原呈递细胞的MHC之间的结合亲和力的模型。当通过机器学习学习基于肽序列与HLA序列之间的氨基酸相互作用的结合亲和力并输入新抗原的肽序列时,可以预测其与抗原呈递细胞的HLA之间的结合亲和力,并且可以根据已设置的结合亲和力规模对新抗原进行分类。
实施例1、癌细胞存活依赖性基因的选择
为了确定基因的功能是否对癌症或癌细胞的存活必需的,可以使用能够对所有基因进行敲除/敲低的RNAi或CRISPR文库来进行高通量筛选(HTS,high-throughputscreening)。具体而言,通过用shRNA文库或CRISPR sgRNA转染癌细胞,在一定时间后进行深度测序(deep sequencing)以与初始状态的测序结果进行比较,从而可以通过定量分析哪些基因失活细胞被杀死来在体外选择癌细胞存活所必需的基因。图1示意性地示出了癌细胞存活所必需的基因的预测方法。
通过这些方法,有关癌细胞存活所必需基因的体外数据不断产生,同时增加细胞系的数量,对于主要的实体癌,例如肺癌、卵巢癌、结肠直肠癌、胃癌、乳腺癌等,已经建立了有关大量癌细胞系的依赖性数据(https://depmap.org/portal/或https://depmap.sanger.ac.uk/)。这些数据用作根据本发明一具体实施例的针对通用性依赖性基因的数据或用于基于深度学习在计算机上预测癌症患者特异性依赖性基因的目的。
针对癌细胞系的体外数据可用于获得通用性依赖性基因,而源自癌症患者的数据,例如癌症患者的转录组数据,应用于从针对癌细胞系的体外数据中学习的细胞存活依赖性预测模型,以预测每个患者样本的依赖性(dependency),并用于选择癌症患者特异性依赖性基因。
另外,通过将细胞存活依赖性预测模型应用于单细胞转录组数据,可以通过肿瘤异质性(tumor heterogeneity)确认相互不同细胞的依赖性模式,可以将在多个细胞中表现出相同依赖性的基因选为通用性依赖性基因。癌细胞存活所必需并在单个细胞水平上表现出均一表达的基因被选为可成为有效诊断和/或治疗靶点的依赖性基因。
细胞存活依赖性预测模型为一种基于深度学习神经网络的模型,其由输入层、多个隐藏层和输出层组成。神经网络被配置成,当前述体外数据输入到输入层时,在多个隐藏层中学习细胞的基因表达模式与细胞死亡之间的关系,并且在输出层输出预定概率值。此时,预定概率值包括表示细胞死亡的概率的值和表示细胞生长的概率的值。
当可以使用针对癌症患者的单细胞转录组数据时,其可用于通过细胞存活依赖性模型选择癌症患者特异性依赖性基因,否则,可以使用针对已公开的其他癌症患者样本的数据选择通用性依赖性基因。
实施例2、源自通用性依赖性基因的新抗原的选择和其作为诊断/治疗靶点的显著性
新抗原是指与MHC蛋白结合并源自癌细胞表面以被免疫细胞识别为抗原的肽,是正常细胞中不存在但由癌症特异性突变产生的蛋白质片段。新抗原作为免疫抗癌治疗的关键要素,已知新抗原的数量越多,对免疫抗癌治疗的反应性越好,并且新抗原的量(neoantigen load)用作诊断标志物。然而,由于新抗原来源于各种不同的基因并具有不同的特性,因此作为诊断标志物或治疗靶点的用途会有所不同。在本实施例中,如实施例1所述,选择源自癌细胞存活依赖性基因的新抗原作为能够最大化免疫抗癌治疗效果的有用新抗原,并确认其免疫治疗反应性。
具体而言,使用表1中列出的免疫检查点抑制剂(checkpoint blockade)处方群组比较免疫治疗反应性。
[表1]
Figure BDA0003735852550000091
2-1、治疗前(Pre-therapy)群组
使用针对仅具有治疗前结果的肺癌和黑色素瘤已公开的群组的体外依赖性数据和表达均匀性数据,验证了根据本发明一具体实施例的用于基于癌细胞存活依赖性的新抗原的筛选方法的有用性。分析结果如图5所示。具体地,根据新抗原的来源基因的针对癌细胞存活的必须性排序后,选择前(低依赖性)后(高依赖性)500个至2000个,并使用公式
Figure BDA0003735852550000092
计算针对免疫抗癌治疗的预后良好的患者与不良的患者之间每个基因的新抗原数量差异(Differential neoantigen load)。可见,该差异越大,针对治疗预后的解释力越好。灰色虚线表示根据现有使用的标准方法针对所有基因计算的新抗原数量的差异。结果可见,使用少数高必需性基因或均一表达基因的情况比使用所有基因的情况显示出更好的解释力,而使用低必需性基因或非均一表达基因的情况的解释力较差。同样,根据表达均一性(expression homogeneity)和基因表达水平(expression level)计算新抗原数量的差异。由此可见,基因的必须性和表达均一性比基因的表达水平本身更能描述治疗预后。具体地,根据新抗原的来源基因的针对癌细胞存活的必须性排序后,选择前(低依赖性)后(高依赖性)500个至2000个,并计算每个基因针对免疫抗癌治疗的预后良好的患者与不良的患者之间的新抗原数量差异(Differentialneoantigen load)。可见,该差异越大,针对治疗预后的解释力越好。灰色虚线表示根据现有使用的标准方法针对所有基因计算的新抗原数量的差异。结果可见,使用少数高必需性基因或均一表达基因的情况比使用所有基因的情况显示出更好的解释力,而使用低必需性基因或非均一表达基因的情况的解释力较差。同样,根据表达均一性(expressionhomogeneity)和基因表达水平(expression level)计算新抗原数量的差异。由此可见,基因的必须性和表达均一性比基因的表达值本身更能描述治疗预后。
这些结果表明,当免疫反应集中的新抗原的来源基因的功能对癌症的增殖或存活不是必需的时,免疫逃避机制可以更活跃地发生。图6为癌细胞的免疫逃避机制的示意图。
2-2、治疗前(Pre-therapy)和治疗中(on-therapy)的群组
使用具有免疫检查点抑制剂的治疗前(pre-therapy)和治疗中(on-therapy)数据的Riaz群组的数据,分析了新抗原来源基因的依赖性和免疫治疗反应性。其结果如图7所示。
具体地,在黑色素瘤免疫检查点抑制剂处方群组(Riaz)中,从新抗原衍生的基因功能对癌症存活的必须性(高依赖性与低依赖性)和基因表达的均匀性(同质表达与异质表达)方面进行比较治疗前后的克隆变化和基因表达变化的结果。CR/PR和SD/PD分别表示积极预后和消极预后。
已证实,在具有良好治疗反应的患者组(CR(完全缓解)/PR(部分缓解))中,源自表达均一的基因和癌细胞存活所必需的依赖性基因的新抗原成为主要抗癌免疫反应的靶点,以发生克隆收缩(clonal contraction)的同时,RNA水平的表达水平下降,而在对治疗反应不佳的患者组(SD(稳定疾病)和PD(进行性疾病))中,源自表现出异质表达的基因和对癌细胞存活不是必需的基因的新抗原成为主要免疫攻击的靶点,免疫编辑导致基因表达减少,由于免疫逃避成功,反而发生了克隆扩增(clonal expansion)。
2-3、可操作癌症靶点的综合突变分析(Integrated Mutation Profiling ofActionable Cancer Targets,MSK-IMPACT)
为了验证新抗原来源基因对各种癌症的依赖性和免疫治疗反应性,使用了MSK-IMPACT。
在现有研究中,仅在属于所谓的MSKCC(Memorial Sloan Kettering CancerCenter)组的468个基因中测量了1662名接受免疫检查点抑制剂治疗的各种癌症类型的人的突变量(与新抗原量成正比),且表明该量是免疫治疗反应性的重要决定因素(Nat.Genet.51:202-206,2019)。
本实施例已证实,当通过MSKCC组中存在的468个基因中选择具有高癌细胞存活必需性的前50%基因(高依赖性)来测量突变量时,与使用所有468个基因时相比,其与免疫检查点抑制治疗的反应性具有更高的相关性。其结果如图8的上端所示。这是根据MSKCC全(All)组或针对癌细胞存活的必须性前50%基因(高适应性)或后50%基因(低适应性)进行存活分析的结果,通过比较治疗后的存活率分别显示危险比(hazard ratio,HR)值和p值。HR越低,p值越低,这表明针对该基因组治疗预后的解释力越高。与所有486个基因的突变量相比,对属于癌细胞存活具有高度依赖性的前50%的226个基因的突变量(mutation load)与免疫治疗反应性的相关性更高。
另外,图8的中间和下端显示了分别根据所有基因或对癌细胞存活必须性前500个基因和后500个基因分析肺癌和黑色素瘤免疫治疗的已公开的免疫治疗群组的结果。根据每个基因组,分为突变量(mutation burden)或新抗原数量(neoantigen load)多的患者和少的患者,并且比较治疗后的存活率以分别显示HR值和p值。结果可以看出,使用少数具有高癌细胞存活依赖性的基因组比根据标准方法使用所有基因组更好地解释治疗预后。
结合这些结果已证实,抗原(包括新抗原和表面抗原)的来源基因在癌细胞中的必需性和组织中单个细胞之间表达模式的均一性对癌症的免疫反应非常重要。由此可见,在治疗方面,诱导集中于源自对癌症生存必需的基因和表现出均一表达的基因的新抗原是对最大限度地减少癌症的免疫逃避必须的,这些新抗原的量可以作为预测免疫治疗预后的标志物。
实施例3、源自癌症患者特异性依赖性基因的新抗原的选择和其作为诊断/治疗靶点的显著性
在本实施例中,将特定癌症患者的样本中获得的数据应用于细胞存活依赖性预测模型,以获得源自所选癌症患者特异性依赖性基因的新抗原,并确认了这些新抗原与癌症患者存活之间的相关性。
在实施例2中检查了源自通用性依赖性基因的新抗原与免疫治疗患者的存活率的关联性。实施例2中使用的依赖性数据来源于实施例1所述的体外癌细胞系实验,这不是特定患者的依赖性,而是发现了在若干癌细胞系中具有通用性依赖性的基因。如上所述,通过从体外依赖性数据中训练基因的表达水平模式与细胞死亡之间的关系,生成预测细胞存活对基因表达的依赖性的细胞存活依赖性预测模型,通过将癌症患者的基因表达谱输入到所述预测模型,可以选择癌症患者特异性依赖性基因。为了确认根据癌症患者特异性计算机依赖性数据获得的新抗原作为诊断/治疗靶点的显著性,使用了由癌症基因组图谱(TheCancer Genome Atlas,TCGA)公开的肺癌患者和乳腺癌患者的转录组数据(https://portal.gdc.cancer.gov/)。由于这些都不是真正接受过免疫抗癌治疗的患者,因此分为免疫细胞穿透率高的样本(高白细胞比例)和免疫细胞穿透率低的样本(低白细胞比例),以假设在免疫细胞穿透率高的样本中会看到类似于免疫治疗的效果。
其结果如图9所示。与新抗原总数(图9中的水平线)或源自无助于生存的非依赖性基因(低依赖性)的新抗原的数量相比,源自对癌细胞的增殖或存活必需的癌症患者特异性依赖性基因(高依赖性)的新抗原的数量(图9中的黑色条形图)的解释力更高。尤其,这些结果仅在免疫细胞穿透率高的样本中观察到,并且可以确认癌症患者特异性依赖性数据在解释力上的差异总体上比通用性依赖性数据更大。
实施例4、新抗原与抗原呈递细胞的结合力预测模型
为了使新抗原显示出免疫治疗反应性,新抗原应该由抗原呈递细胞处理并在细胞表面与HLA结合。
为了构建和验证新抗原和抗原呈递细胞的结合力预测模型,使用了现有研究中使用的免疫表位数据库(Immune Epitope Database,IEDB)的基准数据,并与IEDB中公开的现有机器学习算法的预测力结果进行了比较。
新抗原和抗原呈递细胞结合力预测模型作为CNN模型包括多个卷积层、预连接层和输出层,而不包括池化层,以便使用卷积层的所有输出值进行预测。
多个卷积层从输入数据中提取相互作用特征,输入数据是指映射(Map)数据,其包括表示肽的氨基酸和HLA的氨基酸之间的结合亲和力的参数。多个卷积层使用特定数量的内核或权重矩阵执行卷积。全连接层接收并整合卷积层的输出值作为输入,输出层使用sigmoid函数输出有关可结合性的信息。图10为预测根据本发明一具体实施例的新抗原的筛选方法中使用的新抗原与MHC的结合亲和力的模型(CNN-MHC)的示意图。
使用IEDB中50000或更多的肽-MHC体外结合实验结果对所构建的模型进行训练,根据使用IEDB每周新公开的测试数据集(test data set)进行性能评估的结果,对于70%或更多的测试数据集,确认了不仅超过SMMPMBEC、ANN和NetMHCcon等现有算法的性能,还尤其超过使用最广泛的NetMHCpan。其结果如图11所示。
4-1、新抗原与HLA的结合确认
为了使用本实施例的模型(CNN-MHC)确认与所预测的新抗原的HLA分子之间的实际结合,测试了新抗原与HLA之间结合的能力。具体而言,使用表达HLA-A02的T2细胞系(ATCC CRL-1992)分析了预测与HLA-A02结合的肽的结合能力。预计与HLA-A02结合的肽显示于表2(SEQ ID NO:1至SEQ ID NO:50)。表2中,CNN-MHC值为根据实验值构建深度学习模型得到的值,是指转换为介于0与1之间的概率值,所述实验值通过将新抗原与MHC之间的每个氨基酸之间的结合强度转换成矩阵形式而获得,NetMHC值是指使用NetMHCPan-4.1计算的MHC蛋白与多肽之间的结合预测值,NetMHCPan-4.1为一种通过常用于新抗原的结合预测的最新版NetMHC工具基于质谱数据训练的模型。两个数值越高,都表示将结合的概率越高。具体而言,将所培养的T2细胞系(1×106/ml)用浓度为50μg/ml的肽处理24小时,然后用APC标记的HLA-A2单克隆抗体染色。通过流式细胞仪对其进行分析以确认结合能力。此时DMSO作为阴性对照,Mart-1和NY-ESO作为阳性对照。
[表2]
Figure BDA0003735852550000131
图12示出MHC结合分析的结果。经证实,由本实施例的模型(CNN-MHC)预测的80%的肽实际上与HLA-A02结合。与广泛使用的NetMHCpan-4.1的预测值(http://www.cbs.dtu.dk/services/NetMHCpan-4.1/)相比,本实施例的模型具有更好的预测力。
另一方面,前述实施例可以通过处理器(120)执行存储在如图3所示的系统的存储器(110)中的至少一条指令来执行。参见图4,处理器(120)可以包括:数据获取单元(121),其获取外显子组、转录组或全基因组的测序数据;预测模型生成单元(122),其生成细胞存活依赖性预测模型和结合力预测模型;基因选择单元(123),其使用细胞存活依赖性预测模型选择癌细胞存活依赖性基因;以及新抗原选择单元(124),其从癌细胞的基因表达谱收集新抗原,使用结合亲和力预测模型选择与抗原呈递细胞的HLA之间具有结合亲和力的新抗原。
随着预测模型生成单元(122)重复执行指令,可以基于新的输入数据更新细胞存活依赖性预测模型和结合力预测模型。由预测模型生成部生成和更新的预测模型可以存储在存储器中。
实施例5、含有新抗原的抗癌疫苗
如前述实施例所述,可以制备包括源自癌细胞存活依赖性基因的新抗原的抗癌疫苗。
通过对移植了癌细胞或组织的小鼠细胞系进行外显子组测序,可以发现不存在于正常细胞的突变,并将这些突变应用于与抗原呈递细胞的结合力预测模型以选择新抗原候选。使用细胞存活依赖性模型,根据针对该癌的依赖性数据判断针对源自新抗原的基因的癌细胞存活的必需性,根据必需性对新抗原进行排序,可以选择前5个和后5个。生成包括所选新抗原位点的由9个至30个氨基酸组成的所有可能的肽序列,可以选择适合于肽合成的化学性质,例如具有高亲水性(Kyte-Doolittle GRAVY<0)和低不稳定性指数(InstaIndex<40)的序列并合成肽,以制备针对新抗原的抗癌疫苗。
5-1、选择新抗原
使用如实施例1至4所述的细胞存活依赖性预测模型和新抗原与抗原呈递细胞的结合力预测模型,通过分析癌细胞系的外显子组和转录组信息,选择了源自具有高细胞存活必需性的依赖性基因且具有HLA结合能力的突变。
5-2、通过新抗原确认的免疫反应
为了确认免疫反应是否被新抗原诱导,测试了是否生成识别HLA结合能力被预测或实验验证的新抗原肽的T细胞,包括5-1中选择的新抗原肽。具体而言,为了确认显示特异性的T细胞池,使用移植了小鼠癌细胞系的小鼠。小鼠模型通过将小鼠肺癌细胞系LLC-1(ATCC CRL-1642)1×106皮下注射到体重20g的6周龄雄性C57BL/6小鼠的胁腹中来生成。
具体而言,通过分析癌细胞系的外显子组和转录组,将15个预测具有高细胞存活必需性且与抗原呈递细胞具有高结合力的突变体选为可预测HLA结合和CD8+T细胞反应性的新抗原组。所选择的肽信息总结在表3(SEQ ID NO:51至65)中。表3所列的CNN-MHC值为根据实验值建立深度学习模型来得到的值,所述实验值通过将新抗原与MHC的每个氨基酸之间的结合强度转换成矩阵形式而获得,所述CNN-MHC值是指转换为介于0与1之间的概率值,该值越高表示结合的概率越高。为了使用从用由该突变序列合成的9mer或15mer肽进行疫苗处理的小鼠脾脏中提取的脾细胞来确认CD8+T细胞对新抗原的反应,进行了基于IFNγ分泌的ELISpot分析。确认了15个反应性被预测的候选新抗原肽中10个肽(66.7%)对T细胞的IFNγ分泌。其结果如图13所示。据此,证实了使用根据本发明一具体实施例的方法选择的新抗原实际上可以与HLA结合并有效地诱导免疫反应。
[表3]
Figure BDA0003735852550000151
实施例6、使用新抗原的癌症患者的治疗预后预测
如前述实施例所述,可以使用源自癌细胞存活依赖性基因的新抗原来预测癌症患者的治疗预后。
通过对患者样本进行外显子组测序,可以发现不存在于正常细胞中但仅存在于癌细胞中的突变,并将这些突变应用于与抗原呈递细胞的结合力预测模型以选择新抗原候选。使用细胞存活依赖性模型,根据针对该癌的依赖性数据判断针对源自新抗原的基因的癌细胞存活的必需性,根据存活必需性对新抗原进行排序,可以选择前后排序相同数量的基因(例如,500个)。将接受过免疫抗癌治疗的患者组分为对免疫抗癌治疗有反应的患者组和没有反应的患者组,通过比较源自所选的必需性前后排序基因的新抗原的数量,可以确定源自具有高必需性的靠前排序基因的新抗原的数量是否与患者的治疗预后具有高度相关性。通过在改变要选择的基因的数量的同时重复确定新抗原的数量与患者的治疗预后之间的相关性,可以确定源自预测患者的治疗预后所必需的依赖性基因的新抗原。
图8显示,对癌细胞存活具有高必须性的基因来突变量或新抗原的数量对治疗预后具有高解释力,可用于预测癌症患者的治疗预后。
本发明的上述描述仅用于例示,本发明所属领域的普通技术人员将理解,在不改变本发明的技术精神或基本特征的情况下,可以容易地将其修改为其他具体形式。因此,应当理解,如上所述的具体实施例在所有方面都是示例性的,而不是限制性的。例如,描述为单一类型的每个组件也可以以分散形式实现,同样描述为分散的组件也可以以组合形式实现。
<110> 韩国科学技术院
佩特梅迪克斯有限公司
<120> 一种新抗原的筛选方法、系统及其用途
<130> PN190331
<160> 65
<170> KoPatentIn 3.0
<210> 1
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 1
Arg Leu Trp His Leu Leu Leu Gln Val
1 5
<210> 2
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 2
Leu Met Phe Ser Arg Cys Thr Ser Val
1 5
<210> 3
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 3
Arg Leu Leu Asp Glu Tyr Asn Leu Val
1 5
<210> 4
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 4
Leu Leu Ala Leu Trp Leu Cys Trp Ala
1 5
<210> 5
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 5
His Leu Tyr Pro Gly Pro Cys His Leu
1 5
<210> 6
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 6
Arg Leu Met Thr His Tyr Cys Ala Met
1 5
<210> 7
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 7
Gly Leu Leu Pro Leu Ala Ser Thr Val
1 5
<210> 8
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 8
Phe Leu Leu Gly Phe Leu His Ser Gly
1 5
<210> 9
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 9
Leu Met Asn Ser Leu Val Ser Gln Val
1 5
<210> 10
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 10
Cys Leu Tyr Ala Phe Glu Cys Lys Ile
1 5
<210> 11
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 11
Lys Thr Phe Pro Val Gln Leu Trp Val
1 5
<210> 12
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 12
Gly Leu Leu Ala Glu Ser Thr Trp Ala
1 5
<210> 13
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 13
Ser Met Gln Asn His Ile Pro Gln Val
1 5
<210> 14
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 14
Cys Gln Leu Ala Lys Thr Cys Pro Val
1 5
<210> 15
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 15
Leu Leu Gly Pro Asn Ser Phe Glu Val
1 5
<210> 16
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 16
Ser Leu Ser Tyr Trp Arg Ala Ser Val
1 5
<210> 17
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 17
Arg Val Ala Gln Tyr Pro Phe Glu Val
1 5
<210> 18
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 18
Leu Leu Ala Glu Thr Cys Trp Asn Gly
1 5
<210> 19
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 19
Val Leu Gln Pro Ala Pro His Gln Val
1 5
<210> 20
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 20
Tyr Leu His Cys Glu Trp Ala Thr Ile
1 5
<210> 21
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 21
Leu Leu Ala Glu Ser Thr Trp Ala Leu
1 5
<210> 22
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 22
Pro Leu Glu Glu Trp Asn Gln Trp Val
1 5
<210> 23
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 23
Ala Leu Asn Glu Met Phe Cys Gln Leu
1 5
<210> 24
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 24
Leu Leu Arg Arg Asn Ser Phe Glu Val
1 5
<210> 25
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 25
Ala Leu Pro Gln His Leu Ile Arg Val
1 5
<210> 26
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 26
Met Ala Gly Gly Trp Val Ala His Leu
1 5
<210> 27
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 27
Gly Leu Asn Ser Phe Glu Val Arg Val
1 5
<210> 28
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 28
Cys Gln Leu Ala Lys Thr Phe Pro Val
1 5
<210> 29
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 29
Asn Met Ala Asn Met Pro Pro Gln Val
1 5
<210> 30
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 30
Tyr Thr Glu Ala Glu Glu Phe Phe Val
1 5
<210> 31
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 31
Thr Leu Met Ser Val Pro Arg Tyr Leu
1 5
<210> 32
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 32
Lys Met Trp Val Asp Arg Tyr Leu Ala
1 5
<210> 33
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 33
Gly Leu Ala Pro Pro Gln Tyr Leu Ile
1 5
<210> 34
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 34
Phe Leu Ile Asn Ser Ser Tyr Pro Gly
1 5
<210> 35
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 35
Phe Met Tyr Phe Glu Phe Pro Gln Leu
1 5
<210> 36
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 36
Ala Ala Phe Val Leu Leu Phe Phe Val
1 5
<210> 37
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 37
Ile Leu His Val Ala Val Thr Asn Val
1 5
<210> 38
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 38
Arg Leu Arg Ser Arg Thr Cys Leu Leu
1 5
<210> 39
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 39
Ala Leu Asp Thr Ile Asn Ile Leu Leu
1 5
<210> 40
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 40
Leu Ile Tyr Gln Met Ala Pro Ala Val
1 5
<210> 41
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 41
Ser Gln Leu Pro Gly Leu Leu Glu Leu
1 5
<210> 42
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 42
Cys Gln Leu Ala Lys Thr Tyr Pro Val
1 5
<210> 43
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 43
Gly Met Gly Pro Pro Met Pro Thr Val
1 5
<210> 44
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 44
Phe Thr Ile Asn Arg Asn Thr Gly Val
1 5
<210> 45
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 45
Leu Met Asp Gly Arg Asp Val Phe Leu
1 5
<210> 46
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 46
Pro Leu Ile Glu Glu Ala Cys Glu Leu
1 5
<210> 47
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 47
Thr Met Tyr Gln Gln Gln Gln Gln Val
1 5
<210> 48
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 48
Ser Ala Leu His Trp Ala Ala Ala Val
1 5
<210> 49
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 49
Arg Met His Asp Gly Thr Thr Pro Leu
1 5
<210> 50
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> 新抗原_HLA-A02结合
<400> 50
Leu Leu Met Glu Asn Ser Ile Gly Gly
1 5
<210> 51
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Twistnb
<400> 51
Thr Val Val Glu Glu Val Val Glu Lys Thr Pro Lys Lys Lys Lys
1 5 10 15
<210> 52
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Las1l
<400> 52
Ser Thr Gly Lys Ala Pro Tyr Thr Leu Asp Thr Leu His Glu Asp
1 5 10 15
<210> 53
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Irx1
<400> 53
Ala Leu Pro Glu Arg Asp Leu Val Thr Arg Pro Asp Trp Pro Pro
1 5 10 15
<210> 54
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Muc5b
<400> 54
Gly Ala Thr Thr Met Ser Val Asn Ile Ser Thr Ile Gly Thr Asn
1 5 10 15
<210> 55
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Smarca5
<400> 55
Leu Gly Lys Thr Leu Gln Thr Ile Ser Leu Leu Gly Tyr Arg Lys
1 5 10 15
<210> 56
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Eri1
<400> 56
Tyr Asp Tyr Ile Cys Ile Ile Asp Phe Glu Ala Thr Cys Lys Glu
1 5 10 15
<210> 57
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Tph2
<400> 57
Phe Val Lys Ser Ile Thr Arg Pro Phe Ser Val Tyr Phe Asn Arg
1 5 10 15
<210> 58
<211> 9
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Eef2
<400> 58
Arg Ala Pro Ala Gly Ala Ala Ala Gly
1 5
<210> 59
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Ssrp1
<400> 59
Gly Arg Gly Asp Ser Ser Glu Arg Asp Lys Ser Lys Lys Lys Lys
1 5 10 15
<210> 60
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Oas1g
<400> 60
Gly Lys Ser Asp Ala Asp Leu Val Val Phe Leu Asn Asn Leu Thr
1 5 10 15
<210> 61
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Gm15557
<400> 61
Ser Arg His Ser Cys Ala Glu Phe Val Lys Phe Arg Lys Ser Phe
1 5 10 15
<210> 62
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Ppp1cc
<400> 62
Ser Phe Thr Ser Gly Ala Glu Val Val Ala Lys Phe Leu His Lys
1 5 10 15
<210> 63
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Pdcd6ip
<400> 63
Thr Val Gly Thr Arg Ser Leu Ile Met Leu Ala Gln Ala Gln Glu
1 5 10 15
<210> 64
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Dync1h1
<400> 64
Pro Thr Ala Pro Ser Val Pro Ile Ile Asp Tyr Glu Val Ser Ile
1 5 10 15
<210> 65
<211> 15
<212> PRT
<213> 人工序列 (Artificial Sequence)
<220>
<223> Eef2
<400> 65
Ser Gly Val Cys Val Gln Thr Glu Ile Val Leu Arg Gln Ala Ile
1 5 10 15

Claims (27)

1.一种新抗原的筛选方法,其包括:从癌症患者获取外显子组、转录组、单细胞转录组、肽组或全基因组的测序数据;
选择癌细胞存活依赖性基因;以及
获得源自所述癌细胞存活依赖性基因的新抗原。
2.根据权利要求1所述的方法,还包括:判断所述新抗原与抗原呈递细胞的人类白细胞抗原之间的结合亲和力。
3.根据权利要求1所述的方法,其中,所述选择癌细胞存活依赖性基因的步骤包括:使用细胞存活依赖性预测模型选择癌细胞存活所必需的癌细胞存活依赖性基因,
所述细胞存活依赖性预测模型通过训练细胞基因表达与细胞死亡之间的关系来生成,将根据基因的表达水平降低或去除导致癌细胞死亡的基因选为癌细胞存活依赖性基因。
4.根据权利要求3所述的方法,其中,所述选择的癌细胞存活依赖性基因在其表达水平降低或被去除时导致癌细胞死亡,但不影响正常细胞的存活。
5.根据权利要求3所述的方法,其中,所述细胞的基因表达与细胞死亡之间的关系基于关于癌细胞系是否因靶向的基因表达水平降低或去除而被杀死的体外数据或计算机数据。
6.根据权利要求3所述的方法,其中,所述选择癌细胞存活依赖性基因还包括:判断从所述细胞存活依赖性预测模型选择的癌细胞存活依赖性基因是否在从癌症患者获得的所有癌细胞中均一表达。
7.根据权利要求1所述的方法,其中,所述获得源自所述癌细胞存活依赖性基因的新抗原的步骤包括:根据从癌症患者获得的测序数据,比较来自癌细胞的序列和来自正常细胞的序列以获得癌症患者的新抗原;以及在所述获得的新抗原中,收集源自所述癌细胞存活依赖性基因的新抗原。
8.根据权利要求7所述的方法,其中,所述收集新抗原的步骤还包括:选择所述癌细胞存活依赖性基因的非同义突变。
9.根据权利要求1所述的方法,其中,所述新抗原对癌症患者具有特异性。
10.根据权利要求2所述的方法,其中,所述判断所述新抗原与抗原呈递细胞的人类白细胞抗原之间的结合亲和力包括:将所述新抗原的序列输入到新抗原结合亲和力预测模型以获得结合亲和力预测,所述新抗原结合亲和力预测模型用于预测抗原肽与抗原呈递细胞的人类白细胞抗原之间的结合亲和力,
所述新抗原结合亲和力预测模型通过训练肽的氨基酸与人类白细胞抗原的氨基酸之间的相互作用数据来生成。
11.根据权利要求10所述的方法,其中,所述抗原呈递细胞为树突细胞、巨噬细胞、B细胞或其组合。
12.根据权利要求10所述的方法,其中,所述人类白细胞抗原为MHCⅠ类或Ⅱ类。
13.根据权利要求10所述的方法,其中,当所述新抗原与所述抗原呈递细胞的人类白细胞抗原之间的卷积神经网络-主要组织相容性复合体水平>0.5时,确定存在结合亲和力。
14.一种用于筛选新抗原的系统,其包括:用于存储至少一条指令的存储器;以及
至少一个处理器,其被配置为执行所述存储器中存储的所述至少一条指令,
所述处理器通过执行所述至少一条指令,
训练细胞基因的表达水平与细胞死亡之间的关系,以生成细胞存活依赖性预测模型,所述细胞存活依赖性预测模型预测细胞存活对基因表达的依赖性,
将癌症患者的基因表达谱输入到所述细胞存活依赖性预测模型以选择癌细胞存活依赖性基因,并从癌症患者的基因表达谱中获得源自所述癌细胞存活依赖性基因的新抗原,
根据肽与抗原呈递细胞的氨基酸相互作用,生成用于预测结合亲和力的新抗原结合亲和力预测模型,
使用所述新抗原结合亲和力预测模型,选择具有与抗原呈递细胞的人类白细胞抗原的结合亲和力的新抗原。
15.根据权利要求14所述的系统,其中,所述细胞存活依赖性预测模型通过训练细胞基因的表达水平与细胞死亡之间的关系生成,将根据基因表达水平降低或去除导致癌细胞死亡的基因选为癌细胞存活依赖性基因。
16.根据权利要求14所述的系统,其中,所述处理器通过执行所述至少一条指令,当所述新抗原与所述抗原呈递细胞的人类白细胞抗原之间的卷积神经网络-主要组织相容性复合体水平>0.5时,将其选为具有结合亲和力的新抗原。
17.根据权利要求14所述的系统,其中,所述处理器通过执行所述至少一条指令,分别学习基因表达与细胞死亡之间的关系和新抗原与抗原呈递细胞的人类白细胞抗原的结合亲和力的关系。
18.根据权利要求17所述的方法系统,其中,所述细胞的基因表达与细胞死亡之间的关系基于关于癌细胞系是否因靶向的基因表达水平降低或去除而被杀死的体外数据或计算机数据。
19.根据权利要求14所述的系统,其中,所述新抗原结合亲和力预测模型通过训练肽的氨基酸与人类白细胞抗原的氨基酸之间的相互作用数据来生成。
20.根据权利要求14所述的系统,其中,所述癌症患者的基因表达谱为外显子组、转录组、单细胞转录组、肽组或全基因组的测序数据。
21.一种抗癌疫苗的制备方法,其包括:通过权利要求1至13中任一项所述的方法获得新抗原;以及
制备包括所述新抗原的抗癌疫苗。
22.根据权利要求21所述的方法,还包括:获得包括所述新抗原的由9个至30个氨基酸组成的肽序列;以及
从所述肽序列选择具有亲水性和稳定性的肽序列。
23.根据权利要求22所述的方法,其中,所述选择的肽序列的Kyte-Doolittle GRAVY<0,InstaIndex<40。
24.一种抗癌疫苗,其包括通过权利要求1至13中任一项所述的方法而获得的新抗原。
25.一种提供用于预测癌症患者的治疗预后的信息的方法,其包括:通过权利要求1至13中任一项所述的方法获得新抗原;以及
从癌症患者的样本测量所述新抗原的量。
26.根据权利要求25所述的方法,还包括:将所述获得的新抗原的量与从由确认治疗预后的癌症患者组成的对照组中获得的所述新抗原的量进行比较。
27.一种用于预测癌症患者的治疗预后的组合物,其包括通过权利要求1至13中任一项所述的方法而获得的新抗原。
CN202180008361.9A 2020-01-07 2021-01-06 一种新抗原的筛选方法、系统及其用途 Pending CN114929899A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2020-0002260 2020-01-07
KR20200002260 2020-01-07
PCT/KR2021/000116 WO2021141374A1 (ko) 2020-01-07 2021-01-06 신생항원을 스크리닝하는 방법, 시스템 및 그의 용도

Publications (1)

Publication Number Publication Date
CN114929899A true CN114929899A (zh) 2022-08-19

Family

ID=76788126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180008361.9A Pending CN114929899A (zh) 2020-01-07 2021-01-06 一种新抗原的筛选方法、系统及其用途

Country Status (6)

Country Link
US (1) US20230047716A1 (zh)
EP (1) EP4116436A4 (zh)
JP (1) JP2023509540A (zh)
KR (1) KR102278586B1 (zh)
CN (1) CN114929899A (zh)
WO (1) WO2021141374A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230046268A (ko) * 2021-09-29 2023-04-05 (주)펜타메딕스 신생항원 마커 및 글로벌 dna 메틸화 마커를 이용한 면역항암제에 대한 치료 반응성 예측 방법 및 장치
EP4227948A1 (en) * 2022-02-09 2023-08-16 Université de Genève Machine-learning based prediction of the survival potential of cells
WO2023191503A1 (ko) * 2022-03-29 2023-10-05 주식회사 포트래이 단일 세포 전사체 분석을 통한 암 미세 환경 내 세포 클러스터의 표적 후보 추천 방법, 그 장치 및 프로그램

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3193892A4 (en) * 2014-09-14 2018-09-12 Washington University Personalized cancer vaccines and methods therefor
GB201516047D0 (en) * 2015-09-10 2015-10-28 Cancer Rec Tech Ltd Method
MX2018007204A (es) * 2015-12-16 2018-12-11 Gritstone Oncology Inc Identificacion, fabricacion y uso de neoantigeno.
US20210113673A1 (en) * 2017-04-19 2021-04-22 Gritstone Oncology, Inc. Neoantigen Identification, Manufacture, and Use
EP3639170B1 (en) * 2017-06-13 2021-03-24 BostonGene Corporation Systems and methods for identifying responders and non-responders to immune checkpoint blockade therapy
US20200411135A1 (en) * 2018-02-27 2020-12-31 Gritstone Oncology, Inc. Neoantigen Identification with Pan-Allele Models

Also Published As

Publication number Publication date
EP4116436A1 (en) 2023-01-11
US20230047716A1 (en) 2023-02-16
EP4116436A4 (en) 2024-01-31
KR20210089094A (ko) 2021-07-15
JP2023509540A (ja) 2023-03-08
KR102278586B1 (ko) 2021-07-16
WO2021141374A1 (ko) 2021-07-15

Similar Documents

Publication Publication Date Title
JP7217711B2 (ja) 新生抗原の特定、製造、及び使用
CN110799196B (zh) 致免疫性的癌症特异抗原决定位的排名系统
EP2872653B1 (en) Personalized cancer vaccines and adoptive immune cell therapies
US20220154281A1 (en) Identification of neoantigens with mhc class ii model
CN114929899A (zh) 一种新抗原的筛选方法、系统及其用途
CN108601731A (zh) 新抗原的鉴别、制造及使用
IL273030B1 (en) Neoantigen identification for T-CELL therapy
KR20200016265A (ko) 신생항원 동정, 제조, 및 용도
CN111868080A (zh) 利用泛等位基因模型进行的新抗原鉴别
JP6710004B2 (ja) 免疫療法のためのモニタリングまたは診断ならびに治療剤の設計
CN112771214A (zh) 用于选择新表位的方法
Karandikar et al. Identification of epitopes in ovalbumin that provide insights for cancer neoepitopes
KR20210092723A (ko) 개인 맞춤형 암 백신 생성을 위한 암 돌연변이 선택
CN112210596B (zh) 基于基因融合事件的肿瘤新生抗原预测方法及其应用
US20210233610A1 (en) Methods for ranking and/or selecting tumor-specific neoantigens

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination