TW201920686A - 用於t細胞療法之新抗原鑑別 - Google Patents

用於t細胞療法之新抗原鑑別 Download PDF

Info

Publication number
TW201920686A
TW201920686A TW107131173A TW107131173A TW201920686A TW 201920686 A TW201920686 A TW 201920686A TW 107131173 A TW107131173 A TW 107131173A TW 107131173 A TW107131173 A TW 107131173A TW 201920686 A TW201920686 A TW 201920686A
Authority
TW
Taiwan
Prior art keywords
allele
mhc
peptide
cells
presentation
Prior art date
Application number
TW107131173A
Other languages
English (en)
Inventor
羅門 葉嫩史基
蘇利文 布萊登 布理克
珍妮佛 巴斯比
馬修 喬瑟夫 戴維斯
蘿倫 伊莉莎白 楊
喬許瓦 麥可 法蘭西斯
克莉絲汀 帕瑪
莫伊卡 斯科博恩
Original Assignee
美商葛利史東腫瘤科技公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商葛利史東腫瘤科技公司 filed Critical 美商葛利史東腫瘤科技公司
Publication of TW201920686A publication Critical patent/TW201920686A/zh

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56966Animal cells
    • G01N33/56977HLA or MHC typing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • A61K35/17Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/461Cellular immunotherapy characterised by the cell type used
    • A61K39/4611T-cells, e.g. tumor infiltrating lymphocytes [TIL], lymphokine-activated killer cells [LAK] or regulatory T cells [Treg]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/463Cellular immunotherapy characterised by recombinant expression
    • A61K39/4632T-cell receptors [TCR]; antibody T-cell receptor constructs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/46Cellular immunotherapy
    • A61K39/464Cellular immunotherapy characterised by the antigen targeted or presented
    • A61K39/4643Vertebrate antigens
    • A61K39/4644Cancer antigens
    • A61K39/464401Neoantigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2503/00Use of cells in diagnostics
    • C12N2503/02Drug screening
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Genetics & Genomics (AREA)
  • Hematology (AREA)
  • Molecular Biology (AREA)
  • Mycology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)

Abstract

本發明係關於一種用於鑑別T細胞之方法,該等T細胞對於可能呈遞於個體之腫瘤細胞表面上之至少一個新抗原具有抗原特異性。腫瘤新抗原之肽序列係藉由定序該個體之腫瘤細胞獲得。將該等肽序列輸入機器學習呈遞模型中,以產生該等腫瘤新抗原之呈遞可能性,各呈遞可能性表示新抗原由該個體之腫瘤細胞表面上之MHC等位基因呈遞的可能性。基於該等呈遞可能性選擇該等新抗原之子集。鑑別對於該子集中該等新抗原中之至少一者具有抗原特異性的T細胞。此等T細胞可經擴增用於T細胞療法中。此等經鑑別之T細胞之TCR亦可經定序,且選殖至用於T細胞療法之新T細胞中。

Description

用於T細胞療法之新抗原鑑別
基於腫瘤特異性新抗原之治療性疫苗及T細胞療法具有巨大的前景作為下一代個人化癌症免疫療法。1-3 考慮到新抗原產生之可能性相對較大,具有高突變負荷之癌症,諸如非小細胞肺癌(NSCLC)及黑素瘤,為此類療法之特別有吸引力的靶標。4,5 早期證據表明,基於新抗原之疫苗接種可引起T細胞反應6 ,且靶向新抗原之細胞療法可在選定患者之某些情況下引起腫瘤消退。7 MHC I類及MHC II類兩者對於T細胞反應均具有影響70 - 71
然而,新抗原及識別新抗原之T細胞之鑑別已變為評定腫瘤反應77 , 110 、檢查腫瘤進展111 及設計下一代個人化療法112 中之主要難題。目前新抗原鑑別技術為耗時且費力的84,96 或不夠精確的87 , 91 - 93 。儘管近年來已表明,識別新抗原之T細胞為TIL之主要組分84 , 96 , 113 , 114 且在癌症患者之周邊血液中循環107 ,但用於鑑別新抗原反應性T細胞之目前方法具有以下三個限制之某一組合:(1)其依賴於難以獲得的臨床樣本,諸如TIL97 , 98 或白血球分離(leukaphereses)107 ,(2)其需要篩選異常大的肽文庫95 或(3)其依賴於MHC多聚體,該等MHC多聚體可能幾乎僅對於少數MHC等位基因為可獲得的。
此外,已提出初步方法,其併入使用下一代定序的基於突變之分析、RNA基因表現及預測候選新抗原肽之MHC結合親和力8 。然而,此等所提出之方法可能未能使抗原決定基產生過程全部模型化,除基因表現及MHC結合以外,該抗原決定基產生過程含有許多步驟(例如TAP轉運、蛋白酶體裂解、MHC結合、將肽-MHC複合物轉運至細胞表面及/或針對MHC-I之TCR識別;內吞或自體吞噬、經由胞外或溶酶體蛋白酶(例如組織蛋白酶)之裂解、與CLIP肽競爭HLA-DM催化的HLA結合、將肽-MHC複合物轉運至細胞表面及/或針對MHC-II之TCR識別)9 。因此,現有方法可能會降低低陽性預測值(PPV)。(圖1A)
實際上,由多個組進行的由腫瘤細胞呈遞之肽的分析已展示,使用基因表現及MHC結合親和力預測將呈遞之肽的<5%可在腫瘤表面MHC上發現10 , 11 (圖1B)。結合受限之新抗原對檢查點抑制劑反應之預測準確性相對於單獨突變數目沒有提高的最新觀察結果進一步加強結合預測與MHC呈遞之間的此種低相關性。12
用於預測呈遞之現有方法之此低陽性預測值(PPV)呈現基於新抗原之疫苗設計及基於新抗原之T細胞療法的問題。若使用PPV低的預測來設計疫苗,則大多數患者不太可能接受治療性新抗原,且更少的患者可能接受多於一種(即使假設所有呈遞肽均為免疫原性的)。類似地,若基於PPV低的預測來設計治療性T細胞,則大部分患者不太可能接受對於腫瘤新抗原具有反應性的T細胞,且使用下游實驗室技術後預測鑑別預測性新抗原的時間及物理資源成本可能過高。因此,利用目前方法的新抗原疫苗接種及T細胞療法不太可能在大量患有腫瘤個體中成功。(圖1C)
此外,先前方法僅使用順式作用突變產生候選新抗原,且很大程度上忽視考慮neo-ORF之其他來源,包括在多種腫瘤類型中發生且導致許多基因異常剪接的剪接因子之突變13 ,及形成或移除蛋白酶裂解位點之突變。
最後,由於文庫構建、外顯子組及轉錄組捕捉、定序或資料分析中之次最佳條件,腫瘤基因組及轉錄組分析之標準方法可能會遺漏產生候選新抗原之體細胞突變。同樣,標準腫瘤分析方法可能無意中促進序列偽影或生殖系多形現象作為新抗原,分別導致低效使用疫苗能力或自體免疫性風險。
本文揭示一種用於鑑別及選擇用於個人化癌症疫苗、T細胞療法或兩者之新抗原的最佳化方法。首先,解決使用下一代定序(NGS)用於新抗原候選鑑別之最佳化腫瘤外顯子組及轉錄組分析方法。此等方法建構用於NGS腫瘤分析的標準方法,以確保在所有基因組改變類別中,包括最高敏感性及特異性的新抗原候選者為先進的。其次,提出用於高PPV新抗原選擇之新穎方法,以克服特異性問題,且確保用於疫苗包含物及/或作為T細胞療法中之靶標的先進新抗原更可能引起抗腫瘤免疫性。視實施例而定,此等方法包括受訓統計學回歸或非線性深度學習模型,該等模型聯合地使肽-等位基因定位以及多個長度(在不同長度之肽中,共用統計學強度)之肽之每一等位基因(per-allele)基元模型化。非線性深度學習模型尤其可經設計及訓練以獨立地處理同一細胞中之不同MHC等位基因,從而解決線性模型之將使其彼此干擾的問題。最後,解決針對基於新抗原之個人化疫苗設計及生產、及用於T細胞療法之個人化新抗原特異性T細胞之生產的另外考慮。
本文所揭示之模型勝過關於結合親和力訓練之目前先進技術預測器及基於MS肽資料之早期預測器多達一個數量級。藉由更可靠地預測肽之呈遞,該模型使得使用利用有限體積之患者周邊血液、每患者篩選少量肽且並不依賴於MHC多聚體的臨床上實踐過程,鑑別用於個人化療法的新抗原特異性T細胞能夠更節約時間及成本。
本文所揭示之模型對於TIL新抗原決定基資料集之預測效能及預計新抗原-反應性T細胞鑑別任務表明,現在藉由使HLA加工及呈遞模型化而有可能獲得治療學上適用的新抗原決定基預測。總之,此研究提供電腦切實可行的用於抗原靶向免疫療法之抗原鑑別,從而加速朝治癒患者的方向發展。
I.定義
一般而言,申請專利範圍及本說明書中所用之術語意欲解釋為具有一般熟習此項技術者所理解之普通含義。為了更清楚,某些術語定義如下。在普通含義與所提供之定義之間存在矛盾之情況下,將使用所提供之定義。
如本文所用,術語「抗原」為誘導免疫反應之物質。
如本文所用,術語「新抗原」為具有使得其不同於對應野生型親本抗原,例如經由腫瘤細胞中之突變或對腫瘤細胞具有特異性之轉譯後修飾,的至少一個改變的抗原。新抗原可包括多肽序列或核苷酸序列。突變可包括讀框轉移或非讀框轉移插入缺失、誤義或無義取代、剪接位點改變、基因組重排或基因融合、或產生neoORF之任何基因組或表現改變。突變亦可包括剪接變體。對腫瘤細胞具有特異性之轉譯後修飾可包括異常磷酸化。對腫瘤細胞具有特異性之轉譯後修飾亦可包括蛋白酶體產生之剪接抗原。參見Liepe等人, A large fraction of HLA class I ligands are proteasome-generated spliced peptides; Science. 2016年10月21日;354(6310):354-358。
如本文所用,術語「腫瘤新抗原」為存在於個體之腫瘤細胞或組織中但不存在於個體之對應正常細胞或組織中的新抗原。
如本文所用,術語「基於新抗原之疫苗」為基於一或多個新抗原(例如複數個新抗原)之疫苗構築體。
如本文所用,術語「候選新抗原」為產生可表示新抗原之新序列的突變或其他畸變。
如本文所用,術語「編碼區」為編碼蛋白質之基因的部分。
如本文所用,術語「編碼突變」為在編碼區中出現之突變。
如本文所用,術語「ORF」意指開放閱讀框架。
如本文所用,術語「NEO-ORF」為由突變或其他畸變(諸如剪接)產生之腫瘤特異性ORF。
如本文所用,術語「誤義突變」為引起一個胺基酸至另一個胺基酸之取代的突變。
如本文所用,術語「無義突變」為引起胺基酸至終止密碼子之取代的突變。
如本文所用,術語「讀框轉移突變」為引起蛋白質框架改變之突變。
如本文所用,術語「插入缺失」為一或多個核酸之插入或缺失。
如本文所用,在兩個或更多個核酸或多肽序列之上下文中,術語「一致性」百分比係指當出於最大對應性比較及比對時,兩個或更多個序列或子序列具有指定百分比之核苷酸或胺基酸殘基為相同的,如使用下文所描述之序列比較演算法(例如BLASTP及BLASTN或技術人員可用之其他演算法)中之一者或藉由目視檢查所量測。視應用而定,「一致性」百分比可存在於所比較之序列之區內,例如存在於功能域內,或替代地存在於待比較之兩個序列之全長內。
關於序列比較,通常一個序列充當與測試序列進行比較之參考序列。使用序列比較演算法時,將測試及參考序列輸入電腦,必要時指定子序列座標,且指定序列演算法程式參數。隨後,序列比較演算法基於所指定之程式參數來計算測試序列相對於參考序列之序列一致性百分比。或者,序列相似性或不相似性可藉由組合存在或不存在特定核苷酸,或對於轉譯序列,在所選擇之序列位置(例如序列基元)處之胺基酸來建立。
可例如藉由以下來對用於比較之序列進行最佳比對:Smith及Waterman之局部同源性演算法, Adv. Appl. Math. 2:482 (1981);Needleman及Wunsch之同源性對比演算法, J. Mol. Biol. 48:443 (1970);Pearson及Lipman之相似性方法之尋找, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988);此等演算法(Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Madison, Wis.博士中之GAP、BESTFIT、FASTA及TFASTA)之電腦化實施方案;或目視檢查(一般參見Ausubel等人,見下文)。
適合於測定序列一致性百分比及序列相似性之演算法的一個實例為BLAST演算法,其描述於Altschul等人, J. Mol. Biol. 215:403-410 (1990)中。執行BLAST分析之軟體為可經由國家生物技術資訊中心(National Center for Biotechnology Information)公開獲得。
如本文所用,術語「無終止或通讀」為引起天然終止密碼子移除之突變。
如本文所用,術語「抗原決定基」為通常由抗體或T細胞受體結合之抗原的特異性部分。
如本文所用,術語「免疫原性」為例如經由T細胞、B細胞或兩者引起免疫反應之能力。
如本文所用,術語「HLA結合親和力」、「MHC結合親和力」意謂特異性抗原與特異性MHC等位基因之間結合的親和力。
如本文所用,術語「誘鉺」為用於自樣本富集DNA或RNA之特定序列的核酸探針。
如本文所用,術語「變體」為個體之核酸與用作對照之參考人類基因組之間的差異。
如本文所用,術語「變體調用」為通常根據定序之變體存在的演算法判定。
如本文所用,術語「多形現象」為生殖系變體,亦即在個體之所有攜帶DNA的細胞中發現的變體。
如本文所用,術語「體細胞變體」為在個體之非生殖系細胞中產生之變體。
如本文所用,術語「等位基因」為基因之形式或基因序列之形式或蛋白質之形式。
如本文所用,術語「HLA型」為HLA基因等位基因之補體。
如本文所用,術語「無義介導之衰變」或「NMD」為因過早終止密碼子所致的細胞對mRNA之降解。
如本文所用,術語「軀幹突變」為起源於腫瘤發展早期且存在於大部分腫瘤細胞中之突變。
如本文所用,術語「次純系突變」為起源於腫瘤發展後期且僅存在於腫瘤細胞子集中之突變。
如本文所用,術語「外顯子組」為編碼蛋白質之基因組的子集。外顯子組可為基因組之集合外顯子。
如本文所用,術語「邏輯回歸」為來自統計之二進位資料的回歸模型,其中因變數等於1之機率的邏輯經模型化為因變數之線性函數。
如本文所用,術語「神經網路」為用於分類或回歸之機器學習模型,其由多層線性轉變組成,隨後為通常經由隨機梯度下降及反向傳播進行訓練之元素級非線性。
如本文所用,術語「蛋白質組」為由細胞、細胞群或個體表現及/或轉譯之全部蛋白質的集合。
如本文所用,術語「肽組」為由MHC-I或MHC-II在細胞表面上呈遞之所有肽的集合。肽組可指細胞或細胞集合(例如腫瘤肽組,意謂構成腫瘤之所有細胞的肽組的聯合)之特性。
如本文所用,術語「ELISPOT」意指酶聯免疫吸附斑點分析,其為用於監測人類及動物中之免疫反應的常用方法。
如本文所用,術語「葡聚糖肽多聚體」為在流式細胞測量術中用於抗原特異性T細胞染色之基於葡聚糖的肽-MHC多聚體。
如本文所用,術語「MHC多聚體」為包含多個單體單元之肽-MHC。
如本文所用,術語「MHC四聚體」為包含四個單體單元之肽-MHC。
如本文所用,術語「耐受性或免疫耐受性」為對一或多種抗原(例如自身抗原)免疫無反應性的狀態。
如本文所用,術語「中心耐受性」為藉由缺失自身反應性T細胞純系或藉由促進自身反應性T細胞純系分化成免疫抑制性調節性T細胞(Treg)而在胸腺中遭受的耐受性。
如本文所用,術語「周邊耐受性」為藉由下調或不激活經受中心耐受性之自身反應性T細胞或促進此等T細胞分化成Treg而在周邊遭受的耐受性。
術語「樣本」可包括藉由包括靜脈穿刺、排泄、射精、按摩、活組織檢查、針抽吸、灌洗樣本、刮取、手術切口或干預之手段或此項技術中已知的其他手段自個體獲取之單細胞或多細胞或細胞碎片或體液等分試樣。
術語「個體」涵蓋人類或非人類、無論活體內、離體或活體外、雄性或雌性的細胞、組織或生物體。術語個體包括涵蓋人類之哺乳動物。
術語「哺乳動物」涵蓋人類及非人類兩者,且包括(但不限於)人類、非人類靈長類動物、犬科動物、貓科動物、鼠科動物、牛科動物、馬科動物及豬科動物。
術語「臨床因素」係指個體狀況之量度,例如疾病活動或嚴重程度。「臨床因素」涵蓋個體健康狀況之所有標記,包括非樣本標記,及/或個體之其他特徵,諸如(但不限於)年齡及性別。臨床因素可為可在確定條件下評估來自個體之樣本(或樣本群體)或個體而獲得的評分、值或值集合。臨床因素亦可藉由標記及/或其他參數(諸如基因表現代替物)來預測。臨床因素可包括腫瘤類型、腫瘤亞型及吸菸史。
縮寫:MHC:主要組織相容複合物;HLA:人類白血球抗原或人類MHC基因座;NGS:下一代定序;PPV:陽性預測值;TSNA:腫瘤特異性新抗原;FFPE:福馬林固定、石蠟包埋;NMD:無義介導之衰變;NSCLC:非小細胞肺癌;DC:樹突狀細胞。
應注意,除非上下文另外明確規定,否則如本說明書及隨附申請專利範圍中所用,單數形式「一(a/an)」及「該」包括複數個指示物。
本文中未直接定義之任何術語應理解為具有與本發明之技術領域中所理解通常相關的含義。本文論述某些術語,以向從業者描述本發明之態樣的組合物、裝置、方法及其類似物以及如何製造或使用其提供額外的指導。應瞭解,相同事物可以多於一種方式來表達。因此,替代性措辭及同義詞可用於本文所論述之術語中之任何一或多者。無論術語是否在本文中詳述或論述均無任何意義。提供一些同義詞或可取代方法、材料及其類似物。除非明確陳述,否則對一個或數個同義詞或等效物的敍述不排除使用其他同義詞或等效物。包括術語實例在內之實例的使用僅用於說明性目的,且不應在本文中限制本發明之態樣的範疇及含義。
出於所有目的,在本說明書正文內引用之所有參考文獻、頒佈專利及專利申請案均以全文引用之方式併入本文中。 II. 鑑別新抗原之方法
本文揭示用於鑑別來自個體腫瘤之新抗原的方法,該等新抗原可能呈遞於腫瘤之細胞表面上及/或可能為免疫原性的。舉例而言,一種此類方法可包含以下步驟:自個體之腫瘤細胞獲得外顯子組、轉錄組或全基因組腫瘤核苷酸定序資料中之至少一者,其中該腫瘤核苷酸定序資料用於獲得表示新抗原集中之每一者之肽序列的資料,且其中各新抗原之肽序列包含至少一個使其不同於對應野生型、親本肽序列之改變;將各新抗原之肽序列輸入至一或多個呈遞模型中,以產生新抗原中之每一者在個體腫瘤細胞之腫瘤細胞表面或腫瘤中存在之細胞上由一或多個MHC等位基因呈遞的數值可能性集,該數值可能性集已至少基於所接收之質譜資料進行鑑別;及基於該數值可能性集選擇該新抗原集之子集,以產生經選擇之新抗原集。
呈遞模型可包含在參考資料集(亦稱為訓練資料集)上訓練的統計回歸或機器學習(例如深度學習)模型,該參考資料集包含對應標記集,其中該參考資料集獲自複數個不同個體中之每一者,其中視情況一些個體可具有腫瘤,且其中該參考資料集包含以下中之至少一者:表示來自腫瘤組織之外顯子組核苷酸序列的資料、表示來自正常組織之外顯子組核苷酸序列的資料、表示來自腫瘤組織之轉錄組核苷酸序列的資料、表示來自腫瘤組織之蛋白質組序列的資料、表示來自腫瘤組織之MHC肽組序列的資料以及表示來自正常組織之MHC肽組序列的資料。參考資料可進一步包含經工程改造以表現隨後暴露於合成蛋白質之預定MHC等位基因的單等位基因細胞株、正常及腫瘤人類細胞株、以及新鮮及冷凍原始樣本的質譜資料、定序資料、RNA定序資料及蛋白質組學資料,以及T細胞分析(例如ELISPOT)。在某些態樣中,該參考資料集包括每種形式之參考資料。
呈遞模型可包含至少部分自該參考資料集導出的特徵集,且其中該特徵集包含等位基因依賴性特徵及等位基因非依賴性特徵中之至少一者。在某些態樣中,包括每一特徵。
樹突狀細胞呈遞於初始T細胞之特徵可包含以下中之至少一者:上文所描述之特徵。疫苗中之抗原之劑量及類型。(例如肽、mRNA、病毒等):(1)樹突狀細胞(DC)吸收抗原類型之途徑(例如內吞、微胞飲);及/或(2)伴隨DC吸收抗原之功效。疫苗中之佐劑之劑量及類型。疫苗抗原序列之長度。疫苗投與之數目及位點。基礎患者免疫功能(例如如藉由近期感染病史、血液計數等所量測)。對於RNA疫苗:(1)樹突狀細胞中mRNA蛋白質產物之轉換率;(2)在樹突狀細胞攝取後mRNA之轉譯速率,如活體外或活體內實驗中所量測;及/或(3)在樹突狀細胞攝取後mRNA之轉譯的數目或回合數,如藉由活體內或活體外實驗所量測。肽中蛋白酶裂解基元之存在,視情況給予通常在樹突狀細胞中表現之蛋白酶的額外重量(如藉由RNA-seq或質譜法所量測)。典型的活化樹突狀細胞中蛋白酶體及免疫蛋白酶體的表現量(其可藉由RNA-seq、質譜法、免疫組織化學或其他標準技術量測)。所討論之個體中之特定MHC等位基因之表現量(例如如藉由RNA-Seq或質譜法所量測),視情況在活化樹突狀細胞或其他免疫細胞中特異性量測。在表現特定MHC等位基因之其他個體中由特定MHC等位基因呈遞肽之機率,視情況在活化樹突狀細胞或其他免疫細胞中特異性量測。在其他個體中由同一家族分子(例如HLA-A、HLA-B、HLA-C、HLA-DQ、HLA-DR、HLA-DP)中之MHC等位基因呈遞肽之機率,視情況在活化樹突狀細胞或其他免疫細胞中特異性量測。
免疫耐受逃避特徵可包含以下中之至少一者:經由對一個或數個細胞類型進行之蛋白質質譜法直接量測自身肽組。藉由採用自身蛋白質之所有k聚體(例如5-25)子串的聯合來評估自身肽組。使用與上文所描述應用於所有非突變自身蛋白質之呈遞模型類似的呈遞模型評估自身肽組,視情況考慮生殖系變體。
可使用由至少一個模型提供的複數個新抗原,至少部分地基於數值可能性來執行排序。在排序後,可執行選擇以根據選擇標準來選擇經排序之新抗原的子集。選擇後,提供經排序之肽的子集作為產出。
該經選擇之新抗原集的數目可為20個。
呈遞模型可表示以下兩者之間的依賴性:MHC等位基因中之一對特定等位基因及在肽序列之特定位置處之特定胺基酸的存在;與在腫瘤細胞表面上由該對MHC等位基因中之一特定者呈遞在特定位置處包含特定胺基酸之此類肽序列的可能性。
本文所揭示之方法亦可包括將一或多種呈遞模型應用於對應新抗原之肽序列,以產生一或多個MHC等位基因中之每一者的依賴性分數,指示MHC等位基因是否將至少基於對應新抗原之肽序列的胺基酸位置呈遞對應新抗原。
本文所揭示之方法亦可包括轉變依賴性分數以產生各MHC等位基因之對應的每一等位基因的可能性,指示對應的MHC等位基因將呈遞對應的新抗原的可能性;及組合每一等位基因的可能性以產生數值可能性。
轉變依賴性分數之步驟可使對應新抗原之肽序列的呈遞模型化為彼此排斥的。
本文所揭示之方法亦可包括轉變依賴性分數組合以產生數值可能性。
轉變依賴性分數組合之步驟可使對應新抗原之肽序列的呈遞模型化為在MHC等位基因之間為干擾的。
該數值可能性集可藉由至少一個等位基因非相互作用特徵進一步鑑別,且本文所揭示之方法亦可包括將不與一或多個呈遞模型中之一者相互作用的等位基因應用於等位基因非相互作用特徵,以產生等位基因非相互作用特徵之依賴性分數,指示對應新抗原之肽序列是否將基於等位基因非相互作用特徵呈遞。
本文所揭示之方法亦可包括將一或多個MHC等位基因中之各MHC等位基因的依賴性分數與等位基因非相互作用特徵的依賴性分數組合;轉變各MHC等位基因之組合依賴性分數以產生MHC等位基因中對應的每一等位基因的可能性,指示對應的MHC等位基因將呈遞對應的新抗原的可能性;及組合每一等位基因的可能性以產生數值可能性。
本文所揭示之方法亦可包括轉變每個MHC等位基因之依賴性分數與等位基因非相互作用特徵之依賴性分數的組合以產生數值可能性。
用於呈遞模型之數值參數集可基於訓練資料集來訓練,該訓練資料集包括鑑別為存在於複數個樣本中之至少一個訓練肽序列集及與個訓練肽序列相關之一或多個MHC等位基因,其中訓練肽序列係經由對自來源於複數個樣本之MHC等位基因溶離的經分離之肽進行質譜法來鑑別。
樣本亦可包括經工程改造以表現單個MHC I類或II類等位基因之細胞株。
樣本亦可包括經工程改造以表現複數個MHC I類或II類等位基因之細胞株。
樣本亦可包括獲自或來源於複數個患者之人類細胞株。
樣本亦可包括獲自複數個患者之新鮮或冷凍的腫瘤樣本。
樣本亦可包括獲自複數個患者之新鮮或冷凍的組織樣本。
樣本亦可包括使用T細胞分析鑑別之肽。
訓練資料集可另外包括與以下相關之資料:樣本中存在之訓練肽集的肽豐度;樣本中之訓練肽集的肽長度。
訓練資料集可藉由將訓練肽序列集與包含已知蛋白質序列集之資料庫經由比對進行比較來產生,其中訓練蛋白質序列集比訓練肽序列更長且包括訓練肽序列。
訓練資料集可基於對細胞株執行或已執行核苷酸定序以獲得該細胞株之外顯子組、轉錄組或全基因組定序資料中之至少一者來產生,該定序資料包括至少一個包括改變之核苷酸序列。
訓練資料集可基於自正常組織樣本獲得外顯子組、轉錄組及全基因組正常核苷酸定序資料中之至少一者來產生。
訓練資料集可另外包括與樣本相關之蛋白質組序列相關的資料。
訓練資料集可另外包括與樣本相關之MHC肽組序列相關的資料。
訓練資料集可另外包括與至少一種經分離之肽的肽-MHC結合親和力量測相關的資料。
訓練資料集可另外包括與至少一種經分離之肽的肽-MHC結合穩定性量測相關的資料。
訓練資料集可另外包括與樣本相關之轉錄組相關的資料。
訓練資料集可另外包括與樣本相關之基因組相關的資料。
訓練肽序列之長度可在k聚體之範圍內,其中k對於MHC I類而言在8-15之間(包括端點)或對於MHC II類而言在6-30之間(包括端點)。
本文所揭示之方法亦可包括使用獨熱編碼方案編碼肽序列。
本文所揭示之方法亦可包括使用左填充獨熱編碼方案編碼訓練肽序列。
治療具有腫瘤之個體的方法包含執行技術方案1之步驟,且另外包含獲得包含經選擇之新抗原集的腫瘤疫苗,且向該個體投與該腫瘤疫苗。
本文亦揭示一種用於製造腫瘤疫苗之方法,其包含以下步驟:自個體之腫瘤細胞獲得外顯子組、轉錄組或全基因組腫瘤核苷酸定序資料中之至少一者,其中該腫瘤核苷酸定序資料用於獲得表示新抗原集中之每一者之肽序列的資料,且其中各新抗原之肽序列包含至少一個使其不同於對應野生型肽序列之突變;將各新抗原之肽序列輸入至一或多個呈遞模型中,以產生新抗原中之每一者在個體腫瘤細胞之腫瘤細胞表面上由一或多個MHC等位基因呈遞的數值可能性集,該數值可能性集已至少基於所接收之質譜資料進行鑑別;及基於該數值可能性集選擇該新抗原集之子集,以產生經選擇之新抗原集;及產生或已產生包含該經選擇之新抗原集的腫瘤疫苗。
本文亦揭示一種包括經選擇之新抗原集的腫瘤疫苗,該經選擇之新抗原集藉由執行包含以下步驟之方法來選擇:自個體之腫瘤細胞獲得外顯子組、轉錄組或全基因組腫瘤核苷酸定序資料中之至少一者,其中該腫瘤核苷酸定序資料用於獲得表示新抗原集中之每一者之肽序列的資料,且其中各新抗原之肽序列包含至少一個使其不同於對應野生型肽序列之突變;將各新抗原之肽序列輸入至一或多個呈遞模型中,以產生新抗原中之每一者在個體腫瘤細胞之腫瘤細胞表面上由一或多個MHC等位基因呈遞的數值可能性集,該數值可能性集已至少基於所接收之質譜資料進行鑑別;及基於該數值可能性集選擇該新抗原集之子集,以產生經選擇之新抗原集;及產生或已產生包含該經選擇之新抗原集的腫瘤疫苗。
腫瘤疫苗可包括核苷酸序列、多肽序列、RNA、DNA、細胞、質體或載體中之一或多者。
腫瘤疫苗可包括在腫瘤細胞表面上呈遞之一或多個新抗原。
腫瘤疫苗可包括在個體中具有免疫原性之一或多個新抗原。
腫瘤疫苗可不包含在個體中誘導針對正常組織之自體免疫反應的一或多個新抗原。
腫瘤疫苗可包括佐劑。
腫瘤疫苗可包括賦形劑。
本文所揭示之方法亦可包括基於呈遞模型選擇相對於未經選擇之新抗原在腫瘤細胞表面上呈遞之可能性增加的新抗原。
本文所揭示之方法亦可包括基於呈遞模型選擇相對於未經選擇之新抗原能夠在個體中誘導腫瘤特異性免疫反應之可能性增加的新抗原。
本文所揭示之方法亦可包括基於呈遞模型選擇相對於未經選擇之新抗原能夠由專職抗原呈遞細胞(APC)呈遞於初始T細胞之可能性增加的新抗原,視情況其中該APC為樹突狀細胞(DC)。
本文所揭示之方法亦可包括基於呈遞模型選擇相對於未經選擇之新抗原經由中心或周邊耐受性受抑制之可能性降低的新抗原。
本文所揭示之方法亦可包括基於呈遞模型選擇相對於未經選擇之新抗原能夠在個體中誘導針對正常組織之自體免疫反應之可能性降低的新抗原。
外顯子組或轉錄組核苷酸定序資料可藉由對腫瘤組織進行定序而獲得。
定序可為下一代定序(NGS)或任何大規模平行定序方法。
數值可能性集可藉由至少MHC-等位基因相互作用特徵來進一步鑑別,該等特徵包含以下中之至少一者:經預測之MHC等位基因與新抗原編碼肽結合之親和力;經預測之新抗原編碼肽-MHC複合物之穩定性;新抗原編碼肽之序列及長度;在來自表現特定MHC等位基因之其他個體的細胞中呈遞具有類似序列之新抗原編碼肽的機率,如藉由質譜蛋白質組學或其他手段所評定;所討論之個體中特定MHC等位基因之表現量(例如,如藉由RNA-Seq或質譜法所量測);在表現特定MHC等位基因之其他不同個體中由特定MHC等位基因呈遞之總體新抗原編碼肽序列獨立性機率;在其他不同個體中由同一家族分子(例如HLA-A、HLA-B、HLA-C、HLA-DQ、HLA-DR、HLA-DP)中之MHC等位基因呈遞之總體新抗原編碼肽序列獨立性機率。
數值可能性集由至少MHC-等位基因非相互作用特徵來進一步鑑別,該等特徵包含以下中之至少一者:在其源蛋白質序列內側接新抗原編碼肽之C端及N端序列;新抗原編碼肽中之蛋白酶裂解基元之存在,視情況根據腫瘤細胞中之對應蛋白酶之表現進行加權(如藉由RNA-seq或質譜法所量測);如在適當細胞類型中量測之源蛋白質之轉換率;源蛋白質之長度,視情況考慮在腫瘤細胞中最高度表現之特異性剪接變體(「同功異型物」),如藉由RNA-seq或蛋白質組質譜法所量測,或如根據DNA或RNA序列資料中之偵測到之生殖系或體細胞剪接突變之註解所預測;腫瘤細胞中之蛋白酶體、免疫蛋白酶體、胸腺蛋白酶體或其他蛋白酶之表現量(其可藉由RNA-seq、蛋白質組質譜法或免疫組織化學來量測);新抗原編碼肽之源基因之表現(例如,如藉由RNA-seq或質譜法所量測);在細胞週期之不同階段期間,新抗原編碼肽之源基因之典型組織特異性的表現;來源蛋白質及/或其域之綜合特徵目錄,如可在例如uniProt或PDB http://www.rcsb.org/pdb/home/home.do中找到;描述含有肽(例如二級或三級結構(例如α螺旋與β摺疊)之來源蛋白質之域之特性的特徵;替代性剪接;在其他不同個體中,由所討論之新抗原編碼肽之源蛋白質之肽呈遞的機率;歸因於技術偏差,將質譜法偵測不到或過量表示之到肽的機率;各基因模組/路徑之表現,如藉由RNASeq (其不需要含有肽之源蛋白質)所量測,其對於腫瘤細胞、基質或腫瘤浸潤淋巴細胞(TIL)之狀態為有用的;腫瘤細胞中之新抗原編碼肽之源基因的複本數;肽結合於TAP或肽針對TAP之經量測或預測之結合親和力的機率;腫瘤細胞中之TAP的表現量(其可藉由RNA-seq、蛋白質組質譜法、免疫組織化學來量測);腫瘤突變存在或不存在,該等腫瘤突變包括(但不限於):已知癌症驅動子基因(諸如EGFR、KRAS、ALK、RET、ROS1、TP53、CDKN2A、CDKN2B、NTRK1、NTRK2、NTRK3)及編碼涉及抗原呈遞機制之蛋白質之基因(例如B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或編碼蛋白酶體或免疫蛋白酶體組分之基因中之任一者)中的突變。呈遞依賴於腫瘤中經受功能喪失性突變之抗原呈遞機制之組分的肽具有降低的呈遞機率;存在或不存在功能性生殖系多形現象,包括(但不限於):在編碼抗原呈遞機制中所涉及之蛋白質的基因(例如B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或編碼蛋白酶體或免疫蛋白酶體組分之基因中之任一者)中;腫瘤類型(例如NSCLC、黑素瘤);臨床腫瘤亞型(例如鱗狀肺癌與非鱗狀);吸菸史;該肽之源基因在相關腫瘤類型或臨床亞型中之典型表現,視情況藉由驅動子突變分層。
至少一個突變可為讀框轉移或非讀框轉移插入缺失、誤義或無義取代、剪接位點改變、基因組重排或基因融合、或產生neoORF之任何基因組或表現改變。
腫瘤細胞可選自由以下組成之群:肺癌、黑素瘤、乳癌、卵巢癌、前列腺癌、腎癌、胃癌、結腸癌、睪丸癌、頭頸癌、胰臟癌、腦癌、B細胞淋巴瘤、急性骨髓性白血病、慢性骨髓性白血病、慢性淋巴球性白血病、T細胞淋巴球性白血病、非小細胞肺癌及小細胞肺癌。
本文所揭示之方法亦可包括獲得包含經選擇之新抗原集或其子集的腫瘤疫苗,視情況另外包含向個體投與該腫瘤疫苗。
當呈多肽形式時,經選擇之新抗原集中之新抗原中之至少一者可包括以下中之至少一者:對於長度為8-15 (8、9、10、11、12、13、14或15)個胺基酸之MHC I類多肽、對於長度為6-30 (6、7、8、9、10、11、12、13、14、15、16、17、18,19、20、21、22、23、24、25、26、27、28、29或30)個胺基酸之MHC II類多肽,與MHC的結合親和力的IC50值小於1000 nM;在親本蛋白質序列中之多肽內或附近存在促進蛋白酶體裂解的序列基元;及存在促進TAP轉運的序列基元。對於MHC II類,在肽內或附近存在促進藉由胞外或溶酶體蛋白酶(例如組織蛋白酶)裂解或HLA-DM催化的HLA結合的序列基元。
本文亦揭示一種產生用於鑑別可能在腫瘤細胞之腫瘤細胞表面上呈遞之一或多個新抗原之模型的方法,其包含以下步驟:接收包含與自來源於複數個樣本之主要組織相容複合物(MHC)溶離的複數個經分離之肽相關之資料的質譜資料;藉由至少鑑別樣本中存在之訓練肽序列集及與各訓練肽序列相關之一或多個MHC獲得訓練資料集;使用包含訓練肽序列之訓練資料集來訓練呈遞模型之數值參數集,呈遞模型提供來自腫瘤細胞之肽序列在腫瘤細胞表面上由一或多個MHC等位基因呈遞之複數個數值可能性。
呈遞模型可表示以下兩者之間的依賴性:在肽序列之特定位置處存在特定胺基酸;與由腫瘤細胞上之MHC等位基因中之一者呈遞在該特定位置處含有該特定胺基酸之肽序列的可能性。
樣本亦可包括經工程改造以表現單個MHC I類或II類等位基因之細胞株。
樣本亦可包括經工程改造以表現複數個MHC I類或II類等位基因之細胞株。
樣本亦可包括獲自或來源於複數個患者之人類細胞株。
樣本亦可包括獲自複數個患者之新鮮或冷凍的腫瘤樣本。
樣本亦可包括使用T細胞分析鑑別之肽。
訓練資料集可另外包括與以下相關之資料:樣本中存在之訓練肽集的肽豐度;樣本中之訓練肽集的肽長度。
本文所揭示之方法亦可包括藉由將訓練肽序列集與包含已知蛋白質序列集之資料庫經由比對進行比較來獲得基於訓練肽序列之訓練蛋白質序列集,其中訓練蛋白質序列集比訓練肽序列更長且包括訓練肽序列。
本文所揭示之方法亦可包括對細胞株執行或已執行質譜法以獲得該細胞株之外顯子組、轉錄組或全基因組核苷酸定序資料中之至少一者,該核苷酸定序資料包括至少一個包括突變之蛋白質序列。
本文所揭示之方法亦可包括:使用獨熱編碼方案編碼訓練肽序列。
本文所揭示之方法亦可包括自正常組織樣本獲得外顯子組、轉錄組及全基因組正常核苷酸定序資料中之至少一者;及使用正常核苷酸定序資料訓練呈遞模型之參數集。
訓練資料集可另外包括與樣本相關之蛋白質組序列相關的資料。
訓練資料集可另外包括與樣本相關之MHC肽組序列相關的資料。
訓練資料集可另外包括與至少一種經分離之肽的肽-MHC結合親和力量測相關的資料。
訓練資料集可另外包括與至少一種經分離之肽的肽-MHC結合穩定性量測相關的資料。
訓練資料集可另外包括與樣本相關之轉錄組相關的資料。
訓練資料集可另外包括與樣本相關之基因組相關的資料。
本文所揭示之方法亦可包括使參數集邏輯回歸。
訓練肽序列之長度可在k聚體之範圍內,其中k對於MHC I類而言在8-15之間(包括端點)或對於MHC II類而言在6-30之間(包括端點)。
本文所揭示之方法亦可包括使用左填充獨熱編碼方案編碼訓練肽序列。
本文所揭示之方法亦可包括使用深度學習演算法判定參數集之值。
本文揭示用於鑑別可能在腫瘤細胞之腫瘤細胞表面上呈遞之一或多個新抗原的方法,其包含執行以下步驟:接收包含與自來源於複數個新鮮或冷凍腫瘤樣本之主要組織相容複合物(MHC)溶離的複數個經分離之肽相關之資料的質譜資料;藉由至少鑑別腫瘤樣本中存在且呈遞在與各訓練肽序列相關之一或多個MHC等位基因上的訓練肽序列集來獲得訓練資料集;基於訓練肽序列獲得訓練蛋白質序列集;及使用訓練蛋白質序列及訓練肽序列訓練呈遞模型之數值參數集,呈遞模型提供來自腫瘤細胞之肽序列在腫瘤細胞表面上由一或多個MHC等位基因呈遞之複數個數值可能性。
呈遞模型可表示以下兩者之間的依賴性:MHC等位基因中之一對特定等位基因及在肽序列之特定位置處之特定胺基酸的存在;與在腫瘤細胞表面上由該對MHC等位基因中之一特定者呈遞在特定位置處包含特定胺基酸之此類肽序列的可能性。
本文所揭示之方法亦可包括選擇新抗原之子集,其中新抗原之子集係因為相對於一或多種不同腫瘤新抗原各自在腫瘤細胞表面上呈遞之可能性增加而被選擇。
本文所揭示之方法亦可包括選擇新抗原之子集,其中新抗原之子集係因為相對於一或多個不同腫瘤新抗原各自能夠在個體中誘導腫瘤特異性免疫反應之可能性增加而被選擇。
本文所揭示之方法亦可包括選擇新抗原之子集,其中新抗原之子集係因為相對於一或多個不同腫瘤新抗原各自能夠由專職抗原呈遞細胞(APC)呈遞於初始T細胞之可能性增加而被選擇,視情況其中該APC為樹突狀細胞(DC)。
本文所揭示之方法亦可包括選擇新抗原之子集,其中新抗原之子集係因為相對於一或多個不同腫瘤新抗原各自經由中心或周邊耐受性受抑制之可能性降低而被選擇。
本文所揭示之方法亦可包括選擇新抗原之子集,其中新抗原之子集係因為相對於一或多個不同腫瘤新抗原各自能夠在個體中誘導針對正常組織之自體免疫反應之可能性降低而被選擇。
本文所揭示之方法亦可包括選擇新抗原之子集,其中新抗原之子集係因為相對於APC各自將在腫瘤細胞中經差異性轉譯後修飾之可能性降低而被選擇,視情況其中該APC為樹突狀細胞(DC)。
除非另外指明,否則本文方法之實踐將採用此項技術之技能範圍內的蛋白質化學、生物化學、重組DNA技術及藥理學之習知方法。在文獻中充分解釋此類技術。參見例如T.E. Creighton,Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993);A.L. Lehninger,Biochemistry (Worth Publishers, Inc.,最新版);Sambrook等人,Molecular Cloning: A Laboratory Manual (第2版, 1989);Methods In Enzymology (S. Colowick及N. Kaplan編, Academic Press, Inc.);Remington's Pharmaceutical Sciences , 第18版(Easton, Pennsylvania: Mack Publishing Company, 1990);Carey 及SundbergAdvanced Organic Chemistry3 版 (Plenum Press)第A及B卷(1992)。
呈遞可能性集亦可基於新抗原集之源基因而產生。
呈遞可能性集亦可基於新抗原集之源基因及其源組織類型而產生。
本文所揭示之方法亦可包括鑑別用於用新抗原疫苗處理之患者之子集,步驟包含:對於各患者,獲得患者腫瘤細胞之外顯子組、轉錄組或全基因組腫瘤核苷酸定序資料中之至少一者,腫瘤核苷酸定序資料用於獲得新抗原集中之每一者之肽序列,且各新抗原之肽序列包含使得其不同於對應野生型親本肽序列的至少一個改變;對於各患者,藉由將新抗原集中之每一者之肽序列輸入至一或多個呈遞模型中,產生患者之新抗原集的數值呈遞可能性集,該呈遞可能性集指示新抗原集中之每一者由一或多個MHC等位基因呈遞於患者腫瘤細胞表面上的可能性,該呈遞可能性集已至少基於所接收質譜資料而鑑別;對於各患者,鑑別來自患者之新抗原集的新抗原之治療子集,該治療子集對應於在對於患者產生之呈遞可能性集中具有最高呈遞可能性的預定數目個新抗原;及選擇用於用新抗原疫苗處理之患者子集,基於經選擇之子集中之對於各患者獲得之新抗原集或基於腫瘤核苷酸定序資料,該經選擇之患者子集符合納入標準。
本文所揭示之方法亦可包括用對應新抗原疫苗治療經選擇之患者子集中之各患者,患者之新抗原疫苗包括經由患者之呈遞可能性集鑑別的治療子集。
本文所揭示之方法亦可包括選擇腫瘤突變負荷(TMB)高於最小臨限值之患者子集,患者之TMB指示與患者相關之新抗原集中之新抗原的數目。
本文所揭示之方法亦可包括:針對各患者,鑑別指示自患者之治療子集之所呈遞新抗原之評估數目的量測的效用評分;及選擇效用評分高於最小臨限值的患者子集。
新抗原呈遞可模型化為Bernoulli隨機變數,效用評分可表示患者之治療子集中之所呈遞新抗原的預期數目,效用評分可藉由對患者之治療子集中之各新抗原之所呈遞可能性進行求和來得出。
新抗原呈遞可模型化為Poisson二項隨機變數,效用評分可為患者之治療子集中之所呈遞新抗原之數目高於最小臨限值的機率。 III.新抗原中之腫瘤特異性突變的鑑別
本文亦揭示用於鑑別某些突變(例如存在於癌細胞中之變體或等位基因)的方法。特定言之,此等突變可存在於患有癌症之個體之癌細胞的基因組、轉錄組、蛋白質組或外顯子組中,而非個體之正常組織中。
若腫瘤中之基因突變引起腫瘤中特有之蛋白質的胺基酸序列變化,則認為其可用於免疫靶向腫瘤。有用的突變包括:(1)非同義突變,導致蛋白質中之胺基酸不同;(2)通讀突變,其中終止密碼子經修飾或缺失,導致轉譯在C端具有新穎腫瘤特異性序列之較長蛋白質;(3)剪接位點突變,導致在成熟mRNA中包括內含子且因此導致特有的腫瘤特異性蛋白質序列;(4)染色體重排,在2種蛋白質之接合處產生具有腫瘤特異性序列之嵌合蛋白質(亦即基因融合);(5)框移突變或缺失,導致具有新穎腫瘤特異性蛋白質序列之新的開放閱讀框架。突變亦可包括非讀框轉移插入缺失、誤義或無義取代、剪接位點改變、基因組重排或基因融合、或產生neoORF之任何基因組或表現改變中之一或多者。
由例如腫瘤細胞中之剪接位點、讀框轉移、通讀或基因融合突變產生之具有突變之肽或突變多肽可藉由對腫瘤與正常細胞中之DNA、RNA或蛋白質進行定序來鑑別。
突變亦可包括先前鑑別之腫瘤特異性突變。已知腫瘤突變可見於癌症體細胞突變目錄(COSMIC)資料庫。
多種方法可用於偵測個體之DNA或RNA中特定突變或等位基因的存在。舉例而言,已描述數種技術,包括動態等位基因特異性雜交(DASH)、微量盤陣列對角線凝膠電泳(MADGE)、焦磷酸定序、寡核苷酸特異性連接、TaqMan系統以及各種DNA「晶片」技術,諸如Affymetrix SNP晶片。此等方法利用通常藉由PCR擴增靶基因區。仍有其他方法,基於藉由侵入性裂解產生小信號分子,隨後進行質譜法或固定化掛鎖探針及滾環擴增。下文彙總此項技術中已知用於偵測特異性突變之數種方法。
基於PCR之偵測手段可包括同時多重擴增複數個標記。舉例而言,選擇PCR引子以產生大小不重疊且可同時分析之PCR產物為此項技術中所熟知的。或者,可用經差異性標記且因此可各自經差異性偵測之引子擴增不同的標記。當然,基於雜交之偵測手段允許樣本中多個PCR產物之差異偵測。此項技術中已其他技術以允許複數個標記之多重分析。
已研發數種方法以便於基因組DNA或細胞RNA中單核苷酸多形現象之分析。舉例而言,單鹼基多形現象可藉由使用特殊化核酸外切酶抗性核苷酸來偵測,如例如Mundy, C. R. (美國專利第4,656,127號)中所揭示。根據該方法,使緊接著多形位點之3'之等位基因序列互補的引子,與自特定動物或人類獲得的靶分子雜交。若靶分子上之多形位點含有與所存在之特定核酸外切酶抗性核苷酸衍生物互補的核苷酸,則該衍生物將併入於雜交引子之末端上。此類併入使得引子對核酸外切酶具有抗性,且從而允許其偵測。由於樣本之核酸外切酶抗性衍生物的身分為已知的,故引子已對核酸外切酶具有抗性之發現揭露靶分子之多形位點中存在之核苷酸與反應中所用之核苷酸衍生物互補。此方法之優勢在於其不需要判定大量無關序列資料。
可使用基於溶液之方法判定多形位點之核苷酸的身分。Cohen, D.等人 (法國專利2,650,840;PCT申請案第WO91/02087號)。如在美國專利第4,656,127號之Mundy方法中,採用與緊靠著多形位點3'之等位基因序列互補的引子。該方法使用經標記之雙去氧核苷酸衍生物判定該位點之核苷酸的身分,若該核苷酸與多形位點之核苷酸互補,則將併入於引子之末端上。稱為遺傳位元分析或GBA之替代方法由Goelet, P.等人(PCT申請案第92/15712號)描述。Goelet, P.等人之方法使用經標記之終止子及與多形位點3'序列互補之引子的混合物。因此,所併入的經標記之終止子藉由所評估之靶分子之多形位點中存在的核苷酸判定且與其互補。與Cohen等人(法國專利2,650,840;PCT申請案第WO91/02087號)之方法相比,Goelet, P.等人之方法可為非均相分析,其中引子或靶分子固定於固相。
已描述數種用於分析DNA中多形位點之引子引導的核苷酸併入程序(Komher, J. S.等人, Nucl. Acids. Res. 17:7779-7784 (1989);Sokolov, B. P., Nucl. Acids Res. 18:3671 (1990);Syvanen, A.-C.等人, Genomics 8:684-692 (1990);Kuppuswamy, M. N.等人, Proc. Natl. Acad. Sci. (U.S.A.) 88:1143-1147 (1991);Prezant, T. R.等人, Hum. Mutat. 1:159-164 (1992);Ugozzoli, L.等人, GATA 9:107-112 (1992);Nyren, P.等人, Anal. Biochem. 208:171-175 (1993))。此等方法與GBA的不同之處在於其利用併入經標記之去氧核苷酸來區分多形位點處的鹼基。在此類格式中,由於信號與併入之去氧核苷酸之數目成比例,故在同一核苷酸之操作中發生的多形現象可產生與操作之長度成比例的信號(Syvanen, A.-C.等人, Amer. J. Hum. Genet. 52:46-59 (1993))。
許多方案直接自數百萬個單獨的DNA或RNA分子中並行獲取序列資訊。即時單分子合成定序技術依賴於螢光核苷酸之偵測,因為其併入至與所定序之模板互補的DNA的新生鏈中。在一種方法中,將長度為30-50個鹼基之寡核苷酸在5'端共價錨定於玻璃蓋玻片上。此等錨定鏈執行兩種功能。首先,若模板經組態具有與表面結合之寡核苷酸互補的捕捉尾部,則其充當靶模板鏈之捕捉位點。其亦充當模板引導之引子延伸的引子,形成序列閱讀的基礎。捕捉引子充當固定位點以便使用多個合成、偵測及化學裂解染料連接子以移除染料之循環進行序列測定。各循環由添加聚合酶/經標記之核苷酸混合物、沖洗、成像及染料之裂解組成。在一替代方法中,聚合酶經螢光供體分子修飾且固定在載玻片上,而各核苷酸用連接至γ-磷酸之受體螢光部分進行顏色編碼。系統偵測經螢光標記之聚合酶與經螢光修飾之核苷酸之間的相互作用,因為核苷酸併入至從頭鏈中。亦存在其他合成定序技術。
可使用任何適合之合成定序平台來鑑別突變。如上所描述,目前可用四種主要合成定序平台:來自Roche/454 Life Sciences之基因組定序儀、來自Illumina/Solexa之1G分析儀、來自Applied BioSystems之SOLiD系統及來自Helicos Biosciences之Heliscope系統。合成定序平台亦已由Pacific BioSciences及VisiGen Biotechnologies描述。在一些實施例中,將所定序之複數個核酸分子結合於支撐物(例如固體支撐物)。為了將核酸固定於支撐物上,可在模板之3'及/或5'端添加捕捉序列/通用引發位點。核酸可藉由將捕捉序列與共價連接於支撐物之互補序列雜交而結合於支撐物。捕捉序列(亦稱為通用捕捉序列)為與連接至支撐物之序列互補的核酸序列,其可雙重充當通用引子。
作為捕捉序列之替代例,偶聯對(諸如抗體/抗原、受體/配體或如例如美國專利申請案第2006/0252077號中所描述的抗生素蛋白-生物素對)之成員可連接於塗佈有該偶聯對之各別第二成員的表面上待捕獲的各片段。
在捕捉之後,可例如藉由單分子偵測/定序(例如如實例及美國專利第7,283,337號中所描述) (包括模板依賴性合成定序)來分析序列。在合成定序中,表面結合之分子在聚合酶存在下暴露於複數個經標記之核苷酸三磷酸。模板之序列藉由併入至生長鏈之3'端的經標記之核苷酸的順序來測定。此可即時進行或可以分步重複模式進行。對於即時分析,可將不同的光學標記併入各核苷酸且可利用多個雷射刺激併入的核苷酸。
定序亦可包括其他大規模平行定序或下一代定序(NGS)技術及平台。大規模平行定序技術及平台之額外實例為the Illumina HiSeq或MiSeq、Thermo PGM或Proton、the Pac Bio RS II或Sequel、Qiagen之Gene Reader及the Oxford Nanopore MinION。可使用其他類似的當前大規模平行定序,以及此等技術之下一代。
可利用任何細胞類型或組織來獲得用於本文所描述之方法的核酸樣本。舉例而言,DNA或RNA樣本可獲自腫瘤或體液,例如藉由已知技術(例如靜脈穿刺)獲得之血液或唾液。或者,可對乾燥樣本(例如頭髮或皮膚)執行核酸測試。另外,可自腫瘤獲得樣本用於定序且可自正常組織獲得另一樣本用於定序,其中正常組織具有與腫瘤相同的組織類型。可自腫瘤獲得樣本用於定序且可自正常組織獲得另一樣本用於定序,其中正常組織相對於腫瘤具有不同的組織類型。
腫瘤可包括肺癌、黑素瘤、乳癌、卵巢癌、前列腺癌、腎癌、胃癌、結腸癌、睪丸癌、頭頸癌、胰臟癌、腦癌、B細胞淋巴瘤、急性骨髓性白血病、慢性骨髓性白血病、慢性淋巴球性白血病、T細胞淋巴球性白血病、非小細胞肺癌及小細胞肺癌中之一或多者。
或者,可使用蛋白質質譜法鑑別或驗證與腫瘤細胞上之MHC蛋白質結合之突變肽的存在。肽可自腫瘤細胞或自腫瘤免疫沈澱之HLA分子酸溶離,且隨後使用質譜法鑑別。 IV. 新抗原
新抗原可包括核苷酸或多肽。舉例而言,新抗原可為編碼多肽序列之RNA序列。因此,適用於疫苗中之新抗原可包括核苷酸序列或多肽序列。
本文揭示包含藉由本文所揭示之方法鑑別的腫瘤特異性突變的經分離之肽、包含已知腫瘤特異性突變之肽及藉由本文所揭示之方法鑑別的突變多肽或其片段。新抗原肽可描述於其編碼序列之上下文中,其中新抗原包括編碼相關多肽序列之核苷酸序列(例如DNA或RNA)。
由新抗原核苷酸序列編碼之一或多個多肽可包含以下中之至少一者:對於長度為8-15 (8、9、10、11、12、13、14或15)個胺基酸之MHC I類多肽,與MHC的結合親和力的IC50值小於1000 nM;在肽內或附近存在促進蛋白酶體裂解的序列基元;及存在促進TAP轉運的序列基元。對於長度為6-30 (6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30)個胺基酸之MHC II類肽,在肽內或附近存在促進藉由胞外或溶酶體蛋白酶(例如組織蛋白酶)裂解或HLA-DM催化的HLA結合的序列基元。
一或多個新抗原可呈遞在腫瘤之表面上。
一或多個新抗原在患有腫瘤之個體中可為免疫原性的,例如能夠在個體中引起T細胞反應或B細胞反應。
在疫苗生產背景下,對於患有腫瘤之個體,可不考慮在個體中誘導自體免疫反應之一或多個新抗原。
至少一個新抗原肽分子之大小可包含(但不限於)約5個、約6個、約7個、約8個、約9個、約10個、約11個、約12個、約13個、約14個、約15個、約16個、約17個、約18個、約19個、約20個、約21個、約22個、約23個、約24個、約25個、約26個、約27個、約28個、約29個、約30個、約31個、約32個、約33個、約34個、約35個、約36個、約37個、約38個、約39個、約40個、約41個、約42個、約43個、約44個、約45個、約46個、約47個、約48個、約49個、約50個、約60個、約70個、約80個、約90個、約100個、約110個、約120個或更多個胺基分子殘基,及其中可導出之任何範圍。在特定實施例中,新抗原肽分子等於或小於50個胺基酸。
新抗原肽及多肽可為:對於MHC I類,長度為15個殘基或更小,且通常由約8與約11個之間的殘基,特定言之9或10個殘基組成;對於MHC II類,6-30個殘基,為包括性的。
若需要,可以數種方式設計較長的肽。在一種情況下,當HLA等位基因上肽之呈遞可能性經預測或已知時,較長的肽可由以下任一者組成:(1)個別呈遞之具有朝向各對應基因產物之N端及C端延伸2-5個胺基酸的肽;(2)所呈遞之肽中之一些或全部與各自之延伸序列的串接。在另一種情況下,當定序揭露腫瘤中所存在之長(>10個殘基)新抗原決定基元列(例如歸因於產生新穎肽序列之讀框轉移、通讀或內含子包含)時,較長的肽將由以下組成:(3)新穎腫瘤特異性胺基酸之整個延伸段,因此繞過對基於計算或活體外測試選擇最強HLA呈遞之較短肽的需要。在兩種情況下,使用較長的肽允許患者細胞進行內源性加工,且可引起更有效的抗原呈遞及誘導T細胞反應。
新抗原肽及多肽可呈遞於HLA蛋白上。在一些態樣中,新抗原肽及多肽以比野生型肽更大的親和力呈遞於HLA蛋白上。在一些態樣中,新抗原肽或多肽之IC50可至少小於5000 nM、至少小於1000 nM、至少小於500 nM、至少小於250 nM、至少小於200 nM、至少小於150 nM、至少小於100 nM、至少小於50 nM或更小。
在一些態樣中,新抗原肽及多肽向個體投與時不誘導自體免疫反應及/或引起免疫耐受性。
亦提供包含至少兩個或大於兩個新抗原肽之組合物。在一些實施例中,組合物含有至少兩個不同的肽。至少兩個不同的肽可來源於相同的多肽。不同的多肽意指肽根據長度、胺基酸序列或兩者而變化。該等肽來源於已知或已發現含有腫瘤特異性突變之任何多肽。可例如在COSMIC資料庫中發現可獲得新抗原肽之適合之多肽。COSMIC策劃關於人類癌症體細胞突變之綜合資訊。該肽含有腫瘤特異性突變。在一些態樣中,腫瘤特異性突變為特定癌症類型之驅動突變。
具有所需活性或特性之新抗原性肽及多肽可經修飾以提供某些所需屬性,例如改良之藥理學特徵,同時增加或至少保留未經修飾之肽的實質上所有生物活性以結合所需MHC分子且活化適當T細胞。舉例而言,新抗原肽及多肽可進行各種變化,諸如保守或非保守取代,其中此類變化可在其使用中提供某些優勢,諸如改良之MHC結合、穩定性或呈遞。保守取代意謂用生物及/或化學類似的另一胺基酸殘基(例如一個疏水性殘基置換另一個胺基酸殘基或一個極性殘基置換另一胺基酸殘基)置換胺基酸殘基。取代包括以下組合,諸如Gly、Ala;Val、Ile、Leu、Met;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;及Phe、Tyr。單胺基酸取代之效果亦可使用D-胺基酸探測。可使用如例如以下中所描述的熟知的肽合成程序來進行此類修飾:Merrifield, Science 232:341-347 (1986);Barany及Merrifield, The Peptides, Gross及Meienhofer編(N.Y., Academic Press), 第1-284頁(1979);以及Stewart及Young, Solid Phase Peptide Synthesis, (Rockford, Ill., Pierce), 第2版(1984)。
肽及多肽用各種胺基酸模擬物或非天然胺基酸修飾可在提高肽及多肽之活體內穩定性方面特別有用。穩定性可以多種方式加以分析。舉例而言,肽酶及各種生物介質(諸如人類血漿及血清)已用於測試穩定性。參見例如Verhoef等人, Eur. J. Drug Metab Pharmacokin. 11:291-302 (1986)。肽之半衰期可使用25%人類血清(v/v)分析來方便地測定。方案一般如下。合併之人類血清(AB型,非加熱不活化)在使用之前藉由離心去脂。隨後,血清用RPMI組織培養基稀釋至25%且用於測試肽穩定性。在預定時間間隔下,移出少量反應溶液且添加至6%三氯乙酸或乙醇水溶液中。將混濁的反應樣本冷卻(4℃) 15分鐘,且隨後旋轉集結沈澱的血清蛋白質。隨後使用穩定性特異性層析條件藉由逆相HPLC來判定肽之存在。
肽及多肽可經修飾以提供除改良之血清半衰期以外的所需屬性。舉例而言,肽誘導CTL活性之能力可藉由與含有至少一個能夠誘導T輔助細胞反應之抗原決定基的序列連接來增強。免疫原性肽/T輔助細胞結合物可藉由間隔分子連接。間隔子通常由相對較小的中性分子(諸如胺基酸或胺基酸模擬物)構成,其在生理條件下實質上不帶電。間隔子通常選自例如Ala、Gly或非極性胺基酸或中性極性胺基酸之其他中性間隔子。應理解,視情況存在之間隔子無需由相同殘基構成,且因此可為異源寡聚物或同源寡聚物。當存在時,間隔子將通常為至少一個或兩個殘基,更通常三至六個殘基。或者,肽可在無間隔子之情況下連接於T輔助肽。
新抗原肽可直接或經由在肽之胺基或羧基端處的間隔子連接於T輔助肽。新抗原肽或T輔助肽之胺基端可經醯化。例示性T輔助肽包括破傷風類毒素830-843、流感307-319、瘧疾環子孢子382-398及378-389。
蛋白質或肽可藉由熟習此項技術者已知的任何技術製造,包括經由標準分子生物學技術表現蛋白質、多肽或肽;自天然來源分離蛋白質或肽;或化學合成蛋白質或肽。先前已揭示對應於各種基因之核苷酸及蛋白質、多肽及肽序列,且可見於一般熟習此項技術者已知的電腦化資料庫中。一種此類資料庫為位於美國國家衛生研究院(National Institutes of Health)網站的國家生物技術資訊中心(National Center for Biotechnology Information)的Genbank及GenPept資料庫。已知基因之編碼區可使用本文所揭示或一般熟習此項技術者應知曉之技術來擴增及/或表現。或者,蛋白質、多肽及肽之各種市售製劑已為熟習此項技術者所知。
在另一態樣中,新抗原包括編碼新抗原肽或其部分之核酸(例如聚核苷酸)。聚核苷酸可為例如DNA、cDNA、PNA、CNA、RNA (例如mRNA)、單鏈及/或雙鏈、或天然或穩定形式之聚核苷酸,諸如具有硫代磷酸主鏈之聚核苷酸,或其組合,且其可含有或可不含內含子。又另一態樣提供一種能夠表現多肽或其部分之表現載體。不同細胞類型的表現載體為此項技術中所熟知且無需過度實驗便可選擇。一般而言,DNA以適當定向插入至表現載體(諸如質體)中且以正確閱讀框架進行表現。若需要,DNA可連接於由所需宿主識別之適當轉錄及轉譯調節控制核苷酸序列,而此類控制件一般可用於表現載體中。載體隨後經由標準技術引入至宿主中。指導可見於例如Sambrook等人 (1989) Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.中。 IV.疫苗組合物
本文亦揭示一種能夠引起特異性免疫反應(例如腫瘤特異性免疫反應)之免疫原性組合物,例如疫苗組合物。疫苗組合物通常包含例如使用本文所描述之方法選擇的複數個新抗原。疫苗組合物亦可稱為疫苗。
疫苗可含有1至30個肽;2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30個不同的肽;6、7、8、9、10、11、12、13或14個不同的肽;或12、13或14個不同的肽。肽可包括轉譯後修飾。疫苗可含有1至100或更多個核苷酸序列;2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多個不同的核苷酸序列;6、7、8、9、10、11、12、13或14個不同的核苷酸序列;或12、13或14個不同的核苷酸序列。疫苗可含有1至30個新抗原序列;2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多個不同的新抗原序列;6、7、8、9、10、11、12、13或14個不同的新抗原序列;或12、13或14個不同的新抗原序列。
在一個實施例中,選擇不同肽及/或多肽或編碼其之核苷酸序列,使得肽及/或多肽能夠與不同MHC分子(諸如不同MHC I類分子及/或不同MHC II類分子)結合。在一些態樣中,一個疫苗組合物包含肽及/或多肽之編碼序列,該等肽及/或多肽能夠與最頻繁存在的MHC I類分子及/或MHC II類分子結合。因此,疫苗組合物可包含能夠與至少2個較佳的,至少3個較佳的或至少4個較佳的MHC I類分子及/或MHC II類分子結合的不同片段。
疫苗組合物能夠引起特異性細胞毒性T細胞反應及/或特異性輔助T細胞反應。
疫苗組合物可另外包含佐劑及/或載劑。有用的佐劑及載劑之實例在下文中給出。組合物可與載劑結合,該載劑諸如蛋白質或能夠將肽呈遞至T細胞之抗原呈遞細胞(諸如樹突狀細胞(DC))。
佐劑為混合至疫苗組合物中增加或以其他方式修飾對新抗原之免疫反應的任何物質。載劑可為骨架結構,例如能夠與新抗原結合之多肽或多糖。視情況,佐劑為共價或非共價結合的。
佐劑提高對抗原之免疫反應的能力通常顯現為免疫介導的反應之顯著或實質性增加或疾病症狀之減少。舉例而言,體液免疫的增強典型地顯現為針對抗原所產生之抗體效價的顯著增強,且T細胞活性的增強典型地顯現為細胞增殖或細胞性細胞毒性或細胞介素分泌的增強。佐劑亦可改變免疫反應,例如藉由將主要體液或Th反應變為主要細胞或Th反應。
適合之佐劑包括(但不限於) 1018 ISS、礬、鋁鹽、Amplivax、AS15、BCG、CP-870,893、CpG7909、CyaA、dSLIM、GM-CSF、IC30、IC31、咪喹莫特(Imiquimod)、ImuFact IMP321、IS Patch、ISS、ISCOMATRIX、JuvImmune、LipoVac、MF59、單磷醯基脂質A、Montanide IMS 1312、Montanide ISA 206、Montanide ISA 50V、Montanide ISA-51、OK-432、OM-174、OM-197-MP-EC、ONTAK、PepTel載體系統、PLG微粒、雷西莫特(resiquimod)、SRL172、病毒顆粒及其他病毒樣顆粒、YF-17D、VEGF捕獲劑、R848、β-葡聚糖、Pam3Cys、Aquila之來源於皂素之QS21刺激子(Aquila Biotech, Worcester, Mass., USA)、分支桿菌提取物及合成細菌細胞壁模擬物,及其他專用佐劑,諸如Ribi之Detox. Quil或Superfos。諸如弗氏(Freund's)不完全或GM-CSF之佐劑為有用的。先前已描述對樹突狀細胞具有特異性之數種免疫佐劑(例如MF59)及其製備(Dupuis M,等人, Cell Immunol. 1998; 186(1):18-27; Allison A C; Dev Biol Stand. 1998; 92:3-11)。亦可使用細胞介素。數種細胞介素已直接關聯於:影響樹突狀細胞遷移至淋巴組織(例如TNF-α)、加速樹突狀細胞成熟變為T-淋巴球之有效抗原呈遞細胞(例如GM-CSF、IL-1及IL-4) (美國專利第5,849,589號,其以全文引用的方式特別併入本文中)及充當免疫佐劑(例如IL-12) (Gabrilovich D I,等人, J Immunother Emphasis Tumor Immunol. 1996 (6):414-418)。
亦已報導CpG免疫刺激性寡核苷酸增強佐劑在疫苗環境中之效果。亦可使用其他TLR結合分子,諸如結合RNA之TLR 7、TLR 8及/或TLR 9。
有用佐劑之其他實例包括(但不限於)經化學修飾之CpG (例如CpR、Idera)、聚(I:C) (例如聚i:CI2U)、非CpG細菌DNA或RNA以及免疫活性小分子及抗體,諸如環磷醯胺、舒尼替尼(sunitinib)、貝伐單抗(bevacizumab)、西樂葆(celebrex)、NCX-4016、西地那非(sildenafil)、他達拉非(tadalafil)、伐地那非(vardenafil)、索拉菲尼(sorafinib)、XL-999、CP-547632、帕佐泮尼(pazopanib)、ZD2171、AZD2171、伊匹單抗(ipilimumab)、曲美單抗(tremelimumab)及SC58175,其可起治療作用及/或充當佐劑。佐劑及添加劑之量及濃度可容易地由熟習此項技術者判定而無需過度實驗。額外佐劑包括群落刺激因子,諸如顆粒球巨噬細胞群落刺激因子(GM-CSF,沙格司亭(sargramostim))。
疫苗組合物可包含多於一種不同的佐劑。此外,治療性組合物可包含任何佐劑物質,包括以上各者中之任一者或其組合。亦預期,疫苗及佐劑可一起或以任何適當的順序分開投與。
載劑(或賦形劑)可獨立於佐劑存在。載劑之功能可例如為增加特定突變體之分子量以提高活性或免疫原性、賦予穩定性、增加生物活性或增加血清半衰期。此外,載劑可輔助呈遞肽至T細胞。載劑可為熟習此項技術者已知的任何適合之載劑,例如蛋白質或抗原呈遞細胞。載劑蛋白質可為(但不限於)匙孔螺血氰蛋白、血清蛋白質(諸如轉鐵蛋白)、牛血清白蛋白、人類血清白蛋白、甲狀腺球蛋白或卵白蛋白、免疫球蛋白或激素,諸如胰島素或棕櫚酸。為了用於人類免疫接種,載劑一般為生理學上可接受之載劑,其為人類可接受的且為安全的。然而,破傷風類毒素及/或白喉類毒素為適合之載劑。或者,載劑可為葡聚糖,例如瓊脂糖。
細胞毒性T細胞(CTL)識別呈結合於至MHC分子之肽形式而非完整外來抗原自身的抗原。MHC分子本身位於抗原呈遞細胞之細胞表面上。因此,若存在肽抗原、MHC分子及APC之三聚體複合物,則可能活化CTL。對應地,若不僅肽用於活化CTL,而且若另外添加具有各別MHC分子之APC,則可增強免疫反應。因此,在一些實施例中,疫苗組合物另外含有至少一種抗原呈遞細胞。
新抗原亦可包括於基於病毒載體之疫苗平台中,諸如牛痘、禽痘、自我複製α病毒、馬拉巴病毒(marabavirus)、腺病毒(參見例如Tatsis等人, Adenoviruses,Molecular Therapy (2004) 10, 616-629)或慢病毒,包括(但不限於)第二、第三或雜交第二/第三代慢病毒及任一代之重組慢病毒,其設計成靶向特定細胞類型或受體(參見例如Hu等人, Immunization Delivered by Lentiviral Vectors for Cancer and Infectious Diseases,Immunol Rev . (2011) 239(1): 45-61, Sakuma等人, Lentiviral vectors: basic to translational,Biochem J . (2012) 443(3):603-18, Cooper等人, Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promoter,Nucl . Acids Res . (2015) 43 (1): 682-690, Zufferey等人, Self-Inactivating Lentivirus Vector for Safe and Efficient In Vivo Gene Delivery,J . Virol . (1998) 72 (12): 9873-9880)。視上述基於病毒載體之疫苗平台的包裝能力而定,此方法可遞送編碼一或多個新抗原肽之一或多個核苷酸序列。序列可側接非突變序列,可由連接子分開或可在前面有一或多個靶向亞細胞區室之序列(參見例如Gros等人, Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients,Nat Med . (2016) 22 (4):433-8, Stronen等人, Targeting of cancer neoantigens with donor-derived T cell receptor repertoires,Science . (2016) 352 (6291):1337-41, Lu等人, Efficient identification of mutated cancer antigens recognized by T cells associated with durable tumor regressions,Clin Cancer Res . (2014) 20( 13):3401-10)。在引入宿主後,經感染細胞表現新抗原,且從而引起針對肽之宿主免疫(例如CTL)反應。適用於免疫方案中之牛痘載體及方法描述於例如美國專利第4,722,848號中。另一種載體為BCG (Bacille Calmette Guerin)。BCG載體描述於Stover等人(Nature 351:456-460 (1991))中。根據本文描述,適用於新抗原之治療性投與或免疫接種的各種其他疫苗載體,例如傷寒沙門氏菌(Salmonella typhi)載體及其類似物對於熟習此項技術者將為顯而易見的。 IV.A.疫苗設計及製造的額外考慮 IV.A.1.判定覆蓋所有腫瘤次純系之肽集合
軀幹肽,意謂由所有或大部分腫瘤次純系呈遞之彼等肽,將優先包括於疫苗中。53 視情況,若不存在經預測以高機率呈遞且具有免疫原性之軀幹肽,或若經預測以高機率呈遞且具有免疫原性之軀幹肽的數目足夠小以致額外非軀幹肽可包括於疫苗中,則其他肽可藉由估計腫瘤次純系之數目及身分且選擇肽以使疫苗所覆蓋之腫瘤次純系之數目達到最大而進行優先排序。54 IV.A.2.新抗原優先排序
在應用所有以上新抗原過濾器後,與疫苗技術可支持的相比,更多候選新抗原仍可包含於疫苗中。另外,可保留關於新抗原分析之各種態樣的不判定性,且候選疫苗新抗原之不同特性之間可存在折衷。因此,可考慮整合式多維模型代替選擇過程之各步驟中的預定過濾器,將候選新抗原置於具有至少以下軸之空間中且使用整合方法最佳化選擇。 1. 自體免疫或耐受性之風險(生殖系之風險) (較低的自體免疫之風險通常為較佳的) 2. 定序偽影之機率(較低的偽影之機率通常為較佳的) 3. 免疫原性之機率(較高的免疫原性之機率通常為較佳的) 4. 呈遞之機率(較高的呈遞之機率通常為較佳的) 5. 基因表現(較高表現通常為較佳的) 6. HLA基因之覆蓋率(較大數目的參與新抗原集呈遞之HLA分子可降低腫瘤經由HLA分子之下調或突變逃避免疫攻擊的機率) 7. HLA類別之覆蓋率(覆蓋HLA-I及HLA-II兩者可增加治療反應之機率且降低腫瘤逃避之機率) V.治療及製造方法
亦提供一種藉由向個體投與一或多個新抗原(諸如使用本文所揭示之方法鑑別的複數個新抗原)在個體中誘導腫瘤特異性免疫反應、針對腫瘤接種疫苗、治療及或緩解個體之癌症症狀的方法。
在一些態樣中,個體已診斷患有癌症或處於罹患癌症之風險下。個體可為人類、犬、貓、馬或需要腫瘤特異性免疫反應之任何動物。腫瘤可為任何實體腫瘤,諸如乳房腫瘤、卵巢腫瘤、前列腺腫瘤、肺腫瘤、腎臟腫瘤、胃腫瘤、結腸腫瘤、睪丸腫瘤、頭頸部腫瘤、胰腺腫瘤、腦腫瘤、黑素瘤及其他組織器官腫瘤,以及血液腫瘤,諸如淋巴瘤及白血病,包括急性骨髓性白血病、慢性骨髓性白血病、慢性淋巴球性白血病、T細胞淋巴球性白血病及B細胞淋巴瘤。
新抗原可以足以誘導CTL反應之量投與。
新抗原可單獨或與其他治療劑組合投與。治療劑為例如化學治療劑、輻射或免疫療法。可針對特定癌症投與任何適合之治療性治療。
另外,可向個體進一步投與抗免疫抑制劑/免疫刺激劑,諸如檢查點抑制劑。舉例而言,可向個體進一步投與抗CTLA抗體或抗PD-1或抗PD-L1。藉由抗體阻斷CTLA-4或PD-L1可增強患者對癌細胞之免疫反應。特定言之,已展示在按照疫苗接種方案時CTLA-4阻斷為有效的。
可判定包括於疫苗組合物中之各新抗原的最佳量及最佳給藥方案。舉例而言,可製備用於靜脈內(i.v.)注射、皮下(s.c.)注射、皮內(i.d.)注射、腹膜內(i.p.)注射、肌肉內(i.m.)注射的新抗原或其變體。注射方法包括s.c.、i.d.、i.p.、i.m.及i.v.。DNA或RNA注射方法包括i.d.、i.m.、s.c.、i.p.及i.v.。疫苗組合物之其他投與方法為熟習此項技術者已知的。
疫苗可經編譯以使得組合物中存在之新抗原的選擇、數目及/或量為組織、癌症及/或患者特異性的。舉例而言,肽之精確選擇可藉由親本蛋白質在給定組織中之表現模式來指導。選擇可取決於癌症之具體類型、疾病狀態、先前治療方案、患者免疫狀態及當然患者之HLA單倍型。此外,疫苗可根據特定患者之個人需要而含有個別化組分。實例包括根據新抗原在特定患者中之表現改變新抗原之選擇或在第一輪或治療方案之後調整二次治療。
對於待用作癌症疫苗之組合物,在正常組織中大量表現之具有類似正常自身肽的新抗原可避免或以低量存在於本文所描述之組合物中。另一方面,若已知患者之腫瘤表現大量特定新抗原,則用於治療此癌症之各別醫藥組合物可大量存在及/或可包括多於一種對此特定新抗原或此新抗原之途徑具有特異性的新抗原。
可向已罹患癌症之個體投與包含新抗原之組合物。在治療應用中,組合物以足以引起對腫瘤抗原之有效CTL反應且治癒或至少部分遏制症狀及/或併發症之量投與患者。足以實現此目標之量定義為「治療有效劑量」。對此用途有效之量將取決於例如組合物、投藥方式、所治療疾病之階段及嚴重程度、患者之體重及一般健康狀況、以及處方醫師之判斷。應記住,組合物一般可用於嚴重的疾病病況中,亦即危及生命或可能危及生命之情形,尤其當癌症已轉移時。在此類情況下,鑒於外來物質之最小化及新抗原之相對無毒性,治療醫師可能且可能感覺需要投與實質性過量之此等組合物。
對於治療用途,可在偵測或手術移除腫瘤時開始投藥。隨後為增強免疫劑量,直至症狀至少實質上減弱且隨後持續一段時間。
用於治療性治療之醫藥組合物(例如疫苗組合物)意欲非經腸、體表、經鼻、經口或局部投與。醫藥組合物可非經腸投與,例如靜脈內、皮下、皮內或肌內投與。組合物可在手術切除位點投與以誘導針對腫瘤的局部免疫反應。本文揭示用於非經腸投與之組合物,其包含新抗原及疫苗組合物溶解或懸浮於可接受之載劑(例如水性載劑)中之溶液。可使用多種水性載劑,例如水、緩衝水、0.9%生理鹽水、0.3%甘胺酸、玻尿酸及其類似物。此等組合物可藉由習知的熟知滅菌技術滅菌或可經無菌過濾。所得水溶液可封裝以按原樣使用或凍乾,凍乾製劑在投與之前與無菌溶液組合。組合物可含有為接近生理條件而必需的醫藥學上可接受之輔助物質,諸如pH調節劑及緩衝劑、張力調節劑、濕潤劑及其類似物,例如乙酸鈉、乳酸鈉、氯化鈉、氯化鉀、氯化鈣、脫水山梨糖醇單月桂酸酯、三乙醇胺油酸酯等。
新抗原亦可經由脂質體投與,脂質體使其靶向特定的細胞組織,諸如淋巴組織。脂質體亦用於增加半衰期。脂質體包括乳液、泡沫、膠束、不可溶單層、液晶、磷脂分散體、層狀層及其類似物。在此等製劑中,待遞送之新抗原作為脂質體之一部分單獨或與結合於例如淋巴細胞中普遍存在之受體的分子(諸如結合於CD45抗原之單株抗體)或與其他治療性或免疫原性組合物一起併入。因此,用所需新抗原填充之脂質體可引導至淋巴細胞之位點,在此脂質體隨後遞送經選擇之治療性/免疫原性組合物。脂質體可由標準的形成囊泡之脂質形成,其一般包括中性及帶負電荷之磷脂及固醇(諸如膽固醇)。脂質之選擇一般藉由考慮例如脂質體大小、脂質體在血流中之酸不穩定性及穩定性來指導。多種方法可用於製備脂質體,如例如Szoka等人, Ann. Rev. Biophys. Bioeng. 9; 467 (1980);美國專利第4,235,871號、第4,501,728號、第4,501,728號、第4,837,028號及第5,019,369號中所描述。
對於靶向免疫細胞,待併入至脂質體中之配體可包括例如對所需免疫系統細胞之細胞表面決定子具有特異性的抗體或其片段。脂質體懸浮液可以一定劑量靜脈內、局部、體表等投與,該劑量尤其根據投藥方式、所遞送之肽及所治療疾病之階段而變化。
出於治療或免疫目的,亦可向患者投與編碼肽及視情況選用之一或多種本文所描述之肽的核酸。多種方法方便地用於將核酸遞送至患者。舉例而言,核酸可以「裸DNA」形式直接遞送。此方法描述於例如Wolff等人, Science 247: 1465-1468 (1990)以及美國專利第5,580,859號及第5,589,466號中。核酸亦可使用彈道式遞送投與,如例如美國專利第5,204,253號中所描述。可投與僅包含DNA之顆粒。或者,DNA可黏附於顆粒,諸如金顆粒。在存在或不存在電穿孔之情況下,用於遞送核酸序列之方法可包括病毒載體、mRNA載體及DNA載體。
核酸亦可與陽離子化合物(諸如陽離子脂質)複合遞送。脂質介導的基因遞送方法描述於例如9618372WOAWO 96/18372;9324640WOAWO 93/24640;Mannino及Gould-Fogerite, BioTechniques 6(7): 682-691 (1988);美國專利第5,279,833號;Rose美國專利第5,279,833號;9106309WOAWO 91/06309;及Felgner等人, Proc. Natl. Acad. Sci. USA 84: 7413-7414 (1987)中。
新抗原亦可包括於基於病毒載體之疫苗平台中,諸如牛痘、禽痘、自我複製α病毒、馬拉巴病毒(marabavirus)、腺病毒(參見例如Tatsis等人, Adenoviruses,Molecular Therapy (2004) 10, 616-629)或慢病毒,包括(但不限於)第二、第三或雜交第二/第三代慢病毒及任一代之重組慢病毒,其設計成靶向特定細胞類型或受體(參見例如Hu等人, Immunization Delivered by Lentiviral Vectors for Cancer and Infectious Diseases,Immunol Rev . (2011) 239(1): 45-61, Sakuma等人, Lentiviral vectors: basic to translational,Biochem J . (2012) 443(3):603-18, Cooper等人, Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promoter,Nucl . Acids Res . (2015) 43 (1): 682-690, Zufferey等人, Self-Inactivating Lentivirus Vector for Safe and Efficient In Vivo Gene Delivery,J . Virol . (1998) 72 (12): 9873-9880)。視上述基於病毒載體之疫苗平台的包裝能力而定,此方法可遞送編碼一或多個新抗原肽之一或多個核苷酸序列。序列可側接非突變序列,可由連接子分開或可在前面有一或多個靶向亞細胞區室之序列(參見例如Gros等人, Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients,Nat Med . (2016) 22 (4):433-8, Stronen等人, Targeting of cancer neoantigens with donor-derived T cell receptor repertoires,Science . (2016) 352 (6291):1337-41, Lu等人, Efficient identification of mutated cancer antigens recognized by T cells associated with durable tumor regressions,Clin Cancer Res . (2014) 20( 13):3401-10)。在引入宿主後,經感染細胞表現新抗原,且從而引起針對肽之宿主免疫(例如CTL)反應。適用於免疫方案中之牛痘載體及方法描述於例如美國專利第4,722,848號中。另一種載體為BCG (Bacille Calmette Guerin)。BCG載體描述於Stover等人(Nature 351:456-460 (1991))中。根據本文描述,適用於新抗原之治療性投與或免疫接種的各種其他疫苗載體,例如傷寒沙門氏菌(Salmonella typhi)載體及其類似物對於熟習此項技術者將為顯而易見的。
投與核酸之手段使用編碼一或多個抗原決定基之小型基因構築體。為了產生在人類細胞中表現之編碼所選CTL抗原決定基之DNA序列(小型基因),逆轉譯該等抗原決定基的胺基酸序列。使用人類密碼子使用表來指導各胺基酸之密碼子選擇。使編碼此等抗原決定基之DNA序列直接聯接,產生連續多肽序列。為了使表現及/或免疫原性最佳,可將其他元件併入小型基因設計中。可逆轉譯且包括於小型基因序列中的胺基酸序列之實例包括:輔助淋巴細胞、抗原決定基、前導(信號)序列及內質網滯留信號。另外,可藉由包括鄰近於CTL抗原決定基之合成(例如聚丙胺酸)或天然存在的側接序列來改良CTL抗原決定基之MHC呈遞。藉由組裝編碼該小型基因之正股及負股的寡核苷酸而將該小型基因序列轉化成DNA。重疊寡核苷酸(30-100個鹼基長)係在適當條件下使用熟知技術合成、磷酸化、純化及黏接。寡核苷酸之末端係使用T4 DNA連接酶連接。隨後,可將此編碼CTL抗原決定基多肽之合成小型基因選殖至所需表現載體中。
可製備經純化之質體DNA以使用多種調配物注射。其中最簡單的為凍乾DNA在無菌磷酸鹽緩衝鹽水(PBS)中復原。已描述多種方法,且可使用新技術。如上文指出,核酸宜用陽離子脂質調配。另外,醣脂、融合脂質體(fusogenic liposomes)、肽及化合物(統稱為保護、相互作用、非縮合(PINC)的)亦可與純化的質體DNA複合,以影響諸如穩定性、肌肉內分散或移行至特定器官或細胞類型之變數。
亦揭示一種製造腫瘤疫苗之方法,其包含執行本文所揭示方法的步驟;及產生包含複數個新抗原或複數個新抗原之子集的腫瘤疫苗。
本文所揭示之新抗原可使用此項技術中已知之方法製造。舉例而言,一種產生本文所揭示之新抗原或載體(例如包括至少一個編碼一或多種新抗原之序列的載體)的方法可包括在適於表現新抗原或載體之條件下培養宿主細胞,其中該宿主細胞包含至少一個編碼新抗原或載體之聚核苷酸,及純化新抗原或載體。標準純化方法包括層析技術、電泳、免疫、沈澱、透析、過濾、濃縮及層析聚焦技術。
宿主細胞可包括中國倉鼠卵巢(CHO)細胞、NS0細胞、酵母或HEK293細胞。宿主細胞可用一或多個包含至少一個編碼本文所揭示之新抗原或載體之核酸序列的聚核苷酸轉化,視情況其中該經分離之聚核苷酸另外包含可操作地連接於編碼新抗原或載體之至少一個核酸序列的啟動子序列。在某些實施例中,經分離之聚核苷酸可為cDNA。 VI. 新抗原鑑別 VI.A.新抗原候選鑑別。
已描述關於腫瘤及正常外顯子組及轉錄組之NGS分析的研究方法且將其應用於新抗原鑑別空間。6,14,15 以下實例考慮在臨床環境中對新抗原鑑別之更大靈敏度及特異性的某些最佳化。此等最佳化可分為兩個領域:與實驗室方法相關之彼等最佳化及與NGS資料分析相關之彼等最佳化。 VI.A.1.實驗室方法最佳化
此處提出之方法改良藉由將對靶向癌症小組16 中可靠的癌症驅動基因評定研發之概念擴展至新抗原鑑別所必需之全外顯子組及轉錄組環境來解決來自腫瘤含量低及體積小之臨床樣品之高精確性新抗原發現的問題。具體而言,此等改良包括: 1. 靶向整個腫瘤外顯子組之深度(>500×)獨特的平均覆蓋率,以偵測由於低腫瘤含量或次純系狀態而以低突變等位基因頻率出現的突變。 2. 靶向整個腫瘤外顯子組之均勻覆蓋率,其中在<100×下覆蓋<5%之鹼基,以使得錯過新抗原之可能最低,例如藉由: a. 採用基於DNA之捕捉探針及個別探針QC17 b. 包括不良覆蓋區之額外誘餌 3. 靶向整個正常外顯子組之均勻覆蓋率,其中在<20×下覆蓋<5%之鹼基,以使得最少的新抗原對於體細胞/生殖系狀態可能保持未分類(且因此不能用作TSNA) 4. 為了使所需定序總量降到最小,序列捕捉探針將經設計以僅用於基因之編碼區,因為非編碼RNA無法產生新抗原。額外最佳化包括: a. 用於HLA基因之補充探針,其富含GC且很難由標準外顯子組定序捕捉18 b. 排除由於以下因素而經預測產生極少或不產生候選新抗原之基因:諸如表現不足、蛋白酶體消化次最佳或異常序列特徵。 5. 腫瘤RNA將同樣在高深度(>100M讀段)下定序,以便能夠進行變體偵測、基因及剪接變體(「同功異型物」)表現定量及融合偵測。來自FFPE樣本之RNA將使用基於探針之富集19 來提取,其中相同或類似探針用於捕捉DNA中之外顯子組。 VI.A.2. NGS資料分析最佳化
分析方法之改良解決常見研究突變調用方法之次最佳靈敏度和特異性,且具體考慮臨床環境中與新抗原鑑別相關的定製。此等包括: 1. 使用HG38參考人類基因組或後續版本進行比對,因為其含有較佳反映群體多形現象之多個MHC區組裝,與先前的基因組版本相反。 2. 藉由合併來自不同程式5 之結果來克服單個變體調用者20 之侷限性。 a. 用一套工具自腫瘤DNA、腫瘤RNA及正常DNA中偵測單核苷酸變體及插入缺失,該等工具包括:基於腫瘤及正常DNA比較之程式,諸如Strelka21 及Mutect22 ;及併入腫瘤DNA、腫瘤RNA及正常DNA之程式,諸如UNCeqR,其在低純度樣本中特別有利23 。 b. 插入缺失將用進行局部再組裝之程式來判定,諸如Strelka及ABRA24 。 c. 結構重排將使用專用工具來判定,諸如Pindel25 或Breakseq26 。 3. 為了偵測及防止樣本調換,將在選定數目之多形位點比較來自同一患者之樣本的變體調用。 4. 假性調用之廣泛過濾將例如藉由以下來執行: a. 移除在正常DNA中發現的變體,在低覆蓋率情況下可能使用放鬆的偵測參數,且在插入缺失情況下使用容許的接近準則 b. 移除歸因於低映射品質或低鹼基品質之變體27 。 c. 即使在對應的正常情況下沒有觀察到,亦移除源自復發序列偽影之變體27 。實例包括主要在一條鏈上偵測之變體。 d. 移除不相關之對照集中所偵測之變體27 5. 使用seq2HLA28 、ATHLATES29 或Optitype中之一者自正常外顯子組精確調用HLA且亦將外顯子組與RNA定序資料組合28 。其他潛在最佳化包括採用專用HLA分型分析,諸如長讀段DNA定序30 ,或調適連接RNA片段以保持連續性的方法31 。 6. 由腫瘤特異性剪接變體產生之neo-ORF的穩固偵測將藉由使用CLASS32 、Bayesembler33 、StringTie34 或其參考引導模式中的類似程式自RNA-seq資料組裝轉錄物來進行(亦即,使用已知的轉錄物結構而非試圖自各實驗中全部重新創建轉錄物)。雖然Cufflinks35 通常用於此目的,但其經常產生難以置信的大量剪接變體,其中許多比全長基因短得多,且可能無法恢復簡單的陽性對照。編碼序列及無義介導的衰變可能性將藉由諸如SpliceR36 及MAMBA37 之工具來測定,其中重新引入突變序列。基因表現將藉由諸如Cufflinks35 或Express (Roberts及Pachter, 2013)之工具來判定。野生型及突變體特異性表現計數及/或相對水準將藉由開發用於此等目的之工具(諸如ASE38 或HTSeq39 )來測定。可能過濾步驟包括: a. 移除視為不充分表現之候選neo-ORF。 b. 移除經預測會觸發無義介導的衰變(NMD)的候選neo-ORF。 7. 僅在RNA中觀察到的不能直接驗證為腫瘤特異性之候選新抗原(例如neoORF)將根據額外參數歸類為可能的腫瘤特異性的,例如藉由考慮: a. 存在支持腫瘤DNA之僅順式作用讀框轉移或剪接位點突變 b. 在剪接因子中存在確證的腫瘤DNA之僅反式作用的突變。舉例而言,在用R625突變型SF3B1進行的三個獨立公開的實驗中,儘管一個實驗檢查葡萄膜黑素瘤患者40 ,第二個檢查葡萄膜黑素瘤細胞株41 且第三個檢查乳癌患者42 ,但表現出最大差異剪接之基因為一致的。 c. 對於新穎的剪接同功異型物,在RNASeq資料中存在確證的「新穎」剪接連接讀段。 d. 對於新穎的重新排列,腫瘤DNA中存在確證的近似外顯子讀段,而正常DNA中不存在 e. 不存在基因表現綱要,諸如GTEx43 (亦即使生殖系起源不太可能) 8. 藉由直接比較組裝的DNA腫瘤與正常讀段(或來自此類讀段之k聚體)來補充基於參考基因組比對之分析,以避免基於比對及註解的錯誤及偽影。(例如對於在生殖系變體或重複內容插入缺失附近出現的體細胞變體)
在具有聚腺苷酸化RNA之樣本中,RNA-seq資料中之病毒及微生物RNA的存在將使用RNA CoMPASS44 或類似方法評定,以鑑別可預測患者反應的其他因素。 VI.B. HLA肽之分離及偵測
在裂解及溶解組織樣本後,使用經典免疫沈澱(IP)方法進行HLA-肽分子之分離55 - 58 。澄清的溶解物用於HLA特異性IP。
免疫沈澱係使用與珠粒偶聯之抗體來進行,其中抗體對HLA分子具有特異性。對於泛I類HLA免疫沈澱,使用泛I類CR抗體;對於II類HLA-DR,使用HLA-DR抗體。在隔夜培育期間,抗體共價連接於NHS-瓊脂糖珠粒。在共價連接後,將珠粒洗滌且等分用於IP。59, 60 免疫沈澱反應亦可用未共價連接於珠粒之抗體來進行。通常使用塗佈有蛋白A及/或蛋白G之瓊脂糖或磁性珠粒來完成此,該等珠粒將抗體固定於管柱。下文列舉可用於選擇性地富集MHC/肽複合物之一些抗體。
將澄清的組織裂解物添加至抗體珠粒中進行免疫沈澱。在免疫沈澱後,自裂解物移除珠粒且將裂解物儲存用於額外實驗,包括額外IP。洗滌IP珠粒以移除非特異性結合且使用標準技術自珠粒溶離HLA/肽複合物。使用分子量旋轉管柱或C18分餾自肽移除蛋白質組分。所得肽藉由SpeedVac蒸發變乾,且在一些情況下,在MS分析之前儲存在-20℃下。
乾燥的肽在適於逆相層析之HPLC緩衝液中復原,且裝載於C-18微毛細管HPLC管柱上,以便在Fusion Lumos質譜儀(Thermo)中梯度溶離。在Orbitrap偵測器中以高解析度收集肽質量/電荷(m/z)之MS1譜,隨後在經選擇之離子的HCD片段化後,在離子阱偵測器中收集MS2低解析度掃描。另外,可使用CID或ETD片段化方法或三種技術之任何組合來獲得MS2譜,以達到肽之更大的胺基酸覆蓋率。MS2譜亦可在Orbitrap偵測器中以高解析度質量精度量測。
使用Comet61 , 62 對來自各分析之MS2譜進行蛋白質資料庫搜尋,且使用Percolator63 - 65 對肽鑑別進行評分。使用PEAKS studio (Bioinformatics Solutions Inc.)來進行額外定序,且可使用其他搜尋引擎或定序方法,包括頻譜匹配及從頭定序75 。 VI.B.1.支援綜合HLA肽定序之MS偵測極限研究。
使用肽YVYVADVAAK (SEQ ID NO: 1),使用裝載於LC管柱上之不同量的肽來測定偵測極限。所測試之肽的量為1 pmol、100 fmol、10 fmol、1 fmol及100 amol。(表1)結果展示於圖1F中。此等結果表明,最低偵測極限(LoD)在阿莫耳(attomol)範圍(10-18 )中,動態範圍跨越五個數量級,且信噪比足以在低飛莫耳範圍(10-15 )下定序。 VII.呈遞模型 VII.A.系統概述
圖2A係根據一實施例,用於鑑別患者中肽呈遞之可能性之環境100的概述。環境100提供背景以引入呈遞鑑別系統160,其本身包括呈遞資訊儲存器165。
呈遞鑑別系統160為一個或多個如以下關於圖30所論述體現在計算系統中之電腦模型,其接收與MHC等位基因集相關之肽序列且判定肽序列將由相關MHC等位基因集中之一或多者呈遞的可能性。呈遞鑑別系統160可應用於I類及II類MHC等位基因兩者。此在各種情形下均適用。呈遞鑑別系統160之一個具體使用情況為其能夠接收與來自患者110之腫瘤細胞之MHC等位基因集相關之候選新抗原的核苷酸序列且判定候選新抗原將由腫瘤之相關MHC等位基因中之一或多者呈遞的可能性及/或在患者110之免疫系統中誘導免疫原性反應。可選擇由系統160判定的具有高可能性之彼等候選新抗原以包括於疫苗118中,此類抗腫瘤免疫反應可由提供腫瘤細胞之患者110的免疫系統引起。另外,可製造具有對高呈遞可能性之候選新抗原有反應之TCR的T細胞以用於T細胞療法中,從而亦引起患者110之免疫系統的抗腫瘤免疫反應。
呈遞鑑別系統160經由一或多個呈遞模型來判定呈遞可能性。具體言之,呈遞模型產生給定肽序列是否將由相關MHC等位基因集呈遞之可能性,且係基於儲存於儲存器165中之呈遞資訊產生的。舉例而言,呈遞模型可產生肽序列「YVYVADVAAK (SEQ ID NO: 1)」是否將由等位基因集HLA-A*02:01、HLA-A*03:01、HLA-B*07:02、HLA-B*08:03、HLA-C*01:04呈遞於樣本之細胞表面上的可能性。呈遞資訊165含有關於肽是否結合於不同類型的MHC等位基因以使得彼等肽由MHC等位基因呈遞之資訊,其在模型中視肽序列中胺基酸之位置而判定。呈遞模型可基於呈遞資訊165預測未鑑別之肽序列是否將與相關MHC等位基因集相關聯地呈遞。如先前所提及,呈遞模型可應用於I類及II類MHC等位基因兩者。 VII.B.呈遞資訊
圖2說明根據一實施例,獲得呈遞資訊之方法。呈遞資訊165包括兩個一般類別之資訊:等位基因相互作用資訊及等位基因非相互作用資訊。等位基因相互作用資訊包括影響視MHC等位基因類型而定之肽序列之呈遞的資訊。等位基因非相互作用資訊包括影響與MHC等位基因類型無關之肽序列之呈遞的資訊。 VII.B.1.等位基因相互作用資訊
等位基因相互作用資訊主要包括經鑑別之肽序列,已知該等肽序列已由來自人類、小鼠等之一或多種經鑑別之MHC分子呈遞。值得注意的是,此可包括或可不包括獲自腫瘤樣本之資料。所呈遞之肽序列可自表現單個MHC等位基因之細胞來鑑別。在此情況下,所呈遞之肽序列一般自經工程改造以表現預定MHC等位基因且隨後暴露於合成蛋白質之單等位基因細胞株收集。在MHC等位基因上呈遞之肽係藉由諸如酸溶離之技術分離且經由質譜法鑑別。圖2B展示此種情況之實例,其中在預定MHC等位基因HLA-DRB1*12:01上呈遞之實例肽YEMFNDKSQRAPDDKMF (SEQ ID NO: 2)經分離且經由質譜法鑑別。因為在此情況下,肽係經由經工程改造以表現單個預定MHC蛋白質之細胞來鑑別,所以所呈遞之肽及與其結合之MHC蛋白之間的直接關聯無疑為已知的。
所呈遞之肽序列亦可自表現多個MHC等位基因之細胞收集。通常在人體內,針對細胞,表現6種不同類型之MHC-I及至多12種不同類型之MHC-II分子。此類所呈遞之肽序列可自經工程改造以表現多個預定MHC等位基因之多等位基因細胞株鑑別。此類所呈遞之肽序列亦可自組織樣本(正常組織樣本或腫瘤組織樣本)鑑別。尤其在此情況下,MHC分子可自正常或腫瘤組織免疫沈澱。呈遞於多個MHC等位基因上之肽可類似地藉由諸如酸溶離之技術分離且經由質譜法鑑別。圖2C展示此情況之實例,其中六個實例肽YEMFNDKSF (SEQ ID NO: 3)、HROEIFSHDFJ (SEQ ID NO: 4)、FJIEJFOESS (SEQ ID NO: 5)、NEIOREIREI (SEQ ID NO: 6)、JFKSIFEMMSJDSSUIFLKSJFIEIFJ (SEQ ID NO: 7)及KNFLENFIESOFI (SEQ ID NO: 8)呈遞於經鑑別之I類MHC等位基因HLA-A*01:01、HLA-A*02:01、HLA-B*07:02、HLA-B*08:01及II類MHC等位基因HLA-DRB1*10:01、HLA-DRB1:11:01上,且經分離並經由質譜法鑑別。與單等位基因細胞株相反,所呈遞之肽及與其結合之MHC蛋白質之間的直接關聯可為未知的,因為所結合之肽在鑑別之前與MHC分子分離。
等位基因相互作用資訊亦可包括質譜離子電流,其視肽-MHC分子複合物之濃度及肽之離子化效率而定。離子化效率在肽與肽之間以序列依賴性方式變化。一般而言,離子化效率在肽與肽之間在約兩個數量級內變化,而肽-MHC複合物之濃度在與之相比較大的範圍內變化。
等位基因相互作用資訊亦可包括給定MHC等位基因與給定肽之間的結合親和力的量測或預測。(72, 73, 74)一或多個親和力模型可產生此類預測。舉例而言,回到圖1D中展示之實例,呈遞資訊165可包括在肽YEMFNDKSF (SEQ ID NO: 3)與I類等位基因HLA-A*01:01之間的1000 nM結合親和力預測。很少肽以IC50>1000 nm由MHC呈遞,且較低IC50值增加呈遞之機率。呈遞資訊165可包括在肽KNFLENFIESOFI (SEQ ID NO: 8)與II類等位基因HLA-DRB1:11:01之間的結合親和力預測。
等位基因相互作用資訊亦可包括對MHC複合物穩定性之量測或預測。一或多個穩定性模型可產生此類預測。更穩定的肽-MHC複合物(亦即具有較長半衰期之複合物)更可能以高複本數呈遞在腫瘤細胞及遭遇疫苗抗原之抗原呈遞細胞上。舉例而言,回到圖2C中展示之實例,呈遞資訊165可包括I類分子HLA-A*01:01之1 h半衰期的穩定性預測。呈遞資訊165亦可包括II類分子HLA-DRB1:11:01之半衰期的穩定性預測。
等位基因相互作用資訊亦可包括經量測或經預測之肽-MHC複合物形成反應速率。以較高速率形成之複合物更可能以高濃度呈遞在細胞表面上。
等位基因相互作用資訊亦可包括肽之序列及長度。MHC I類分子通常偏好呈遞長度在8與15個肽之間的肽。60-80%之所呈遞肽的長度為9。MHC II類分子通常偏好呈遞長度在6-30個肽之間的肽。
等位基因相互作用資訊亦可包括新抗原編碼肽上激酶序列基元之存在,及新抗原編碼肽上特異性轉譯後修飾之不存在或存在。激酶基元之存在影響轉譯後修飾之機率,轉譯後修飾可增強或干擾MHC結合。
等位基因相互作用資訊亦可包括涉及轉譯後修飾過程之蛋白質(例如激酶)的表現或活性水準(如自RNA seq、質譜法或其他方法所量測或預測)。
等位基因相互作用資訊亦可包括來自表現特定MHC等位基因之其他個體的細胞中具有類似序列之肽的呈遞機率,如藉由質譜蛋白質組學或其他手段所評定。
等位基因相互作用資訊亦可包括所討論之個體中特定MHC等位基因之表現量(例如藉由RNA-seq或質譜法所量測)。與高水準表現之MHC等位基因結合最強的肽比與低水準表現之MHC等位基因結合最強的肽更可能被呈遞。
等位基因相互作用資訊亦可包括表現特定MHC等位基因之其他個體中由特定MHC等位基因呈遞之總體新抗原編碼肽序列獨立性機率。
等位基因相互作用資訊亦可包括在其他個體中由同一家族分子(例如HLA-A、HLA-B、HLA-C、HLA-DQ、HLA-DR、HLA-DP)中之MHC等位基因呈遞之總體肽序列獨立性機率。舉例而言,HLA-C分子通常以低於HLA-A或HLA-B分子之水準表現,且因此,由HLA-C呈遞肽憑經驗比由HLA-A或HLA-B呈遞之可能性低。對於另一實例,HLA-DP通常以低於HLA-DR或HLA-DQ之水準表現;因此,由HLA-DP呈遞肽憑經驗比由HLA-DR或HLA-DQ呈遞之可能性低。
等位基因相互作用資訊亦可包括特定MHC等位基因之蛋白質序列。
以下部分列出之任何MHC等位基因非相互作用資訊亦可經模型化為MHC等位基因相互作用資訊。 VII.B.2.等位基因非相互作用資訊
等位基因非相互作用資訊可包括在其源蛋白序列內側接新抗原編碼肽之C端序列。對於MHC-I,C端側接序列可影響肽之蛋白酶體加工。然而,在將肽轉運至內質網且遭遇細胞表面上之MHC等位基因之前,C端側接序列由蛋白酶體自肽裂解。因此,MHC分子不接收關於C端側接序列之資訊,且因此,C端側接序列之效果無法視MHC等位基因類型而變化。舉例而言,回到圖2C中展示之實例,呈遞資訊165可包括自肽之源蛋白鑑別之呈遞肽FJIEJFOESS (SEQ ID NO: 5)的C端側接序列FOEIFNDKSLDKFJI (SEQ ID NO: 9)。
等位基因非相互作用資訊亦可包括mRNA定量量測。舉例而言,可獲得提供質譜訓練資料之相同樣本的mRNA定量資料。如稍後參考圖13H所描述,RNA表現經鑑別為肽呈遞之強預測因子。在一個實施例中,mRNA定量量測係自軟體工具RSEM鑑別。RSEM軟體工具之詳細實施方案可見於Bo Li及Colin N. Dewey.RSEM : accurate transcript quantification from RNA - Seq data with or without a reference genome . BMC Bioinformatics, 12:323, 2011年8月。在一個實施例中,mRNA定量係以片段/千鹼基轉錄物/百萬定位讀段(FPKM)為單位量測。
等位基因非相互作用資訊亦可包括在其源蛋白序列內側接肽之N端序列。
等位基因非相互作用資訊亦可包括肽序列之源基因。源基因可定義為肽序列之Ensembl蛋白家族。在其他實例中,源基因可定義為肽序列之源DNA或源RNA。源基因可例如表示為編碼蛋白質之一串核苷酸,或替代地基於已知編碼特定蛋白質之已知DNA或RNA序列之指定集合更絕對地表示。在另一實例中,等位基因非相互作用資訊亦可包括取自資料庫(諸如Ensembl或RefSeq)之肽序列的源轉錄物或同功異型物或可能源轉錄物或同功異型物的集合。
等位基因非相互作用資訊亦可包括肽序列來源的組織類型、細胞類型或細胞腫瘤類型。
等位基因非相互作用資訊亦可包括肽中蛋白酶裂解基元之存在,視情況根據腫瘤細胞中對應蛋白酶之表現進行加權(如藉由RNA-seq或質譜法所量測)。含有蛋白酶裂解基元之肽不大可能被呈遞,因為其將更容易由蛋白酶降解,且因此在細胞內會更不穩定。
等位基因非相互作用資訊亦可包括在適當細胞類型中所量測之源蛋白的轉換率。較快轉換率(亦即較低半衰期)增加呈遞之機率;然而,當在不同細胞類型中量測時,此特徵之預測能力很低。
等位基因非相互作用資訊亦可包括源蛋白之長度,視情況考慮在腫瘤細胞中最高度表現之特異性剪接變體(「同功異型物」),如藉由RNA-seq或蛋白質組質譜法所量測,或如由DNA或RNA序列資料中所偵測之生殖系或體細胞剪接突變的註解所預測。
等位基因非相互作用資訊亦可包括蛋白酶體、免疫蛋白酶體、胸腺蛋白酶體或其他蛋白酶在腫瘤細胞中之表現量(其可藉由RNA-seq、蛋白質組質譜法或免疫組織化學量測)。不同的蛋白酶體具有不同的裂解位點偏好。將賦予與其表現量成比例之各類型蛋白酶體之裂解偏好較大的權重。
等位基因非相互作用資訊亦可包括肽之源基因的表現(例如,如藉由RNA-seq或質譜法所量測)。可能的最佳化包括調節所量測之表現以考慮腫瘤樣本內基質細胞及腫瘤浸潤性淋巴球的存在。來自較高度表現之基因的肽更可能被呈遞。來自表現量不可偵測之基因的肽可排除在考慮外。
等位基因非相互作用資訊亦可包括新抗原編碼肽之源mRNA將經受無義介導之衰變的機率,如由無義介導之衰變的模型(例如來自Rivas等人, Science 2015之模型)所預測。
等位基因非相互作用資訊亦可包括肽之源基因在細胞週期之各種階段期間的典型組織特異性表現。以總體低水準表現(如藉由RNA-seq或質譜蛋白質組學所量測)但已知在細胞週期之特定階段期間以高水準表現之基因與以極低水準穩定表現之基因相比,可能產生更多呈遞肽。
等位基因非相互作用資訊亦可包括源蛋白之綜合特徵目錄,如例如uniProt或PDB http://www.rcsb.org/pdb/home/home.do中可所給出。此等特徵可尤其包括:蛋白質之二級及三級結構、亞細胞定位11、基因本體(GO)項。具體言之,此資訊可含有在蛋白質層級上起作用之註解(例如5' UTR長度),及在特定殘基層級上起作用之註解(例如殘基300與310之間的螺旋基元)。此等特徵亦可包括轉角基元、摺疊基元及無序殘基。
等位基因非相互作用資訊亦可包括描述源蛋白之含有例如以下之肽之域的特性的特徵:二級或三級結構(例如α螺旋與β摺疊);替代性剪接。
等位基因非相互作用資訊亦可包括描述在肽之源蛋白中在肽之位置處存在或不存在呈遞熱點的特徵。
等位基因非相互作用資訊亦可包括在其他個體中由所討論之肽的源蛋白呈遞肽的機率(在調節彼等個體中源蛋白之表現量及彼等個體之不同HLA類型的影響之後)。
等位基因非相互作用資訊亦可包括由於技術偏差,肽將不會由質譜法偵測到或過量表示之機率。
如藉由基因表現分析(諸如RNASeq)、微陣列、靶向組(諸如Nanostring)所量測之各種基因模組/路徑之表現,或藉由諸如RT-PCR之分析(其無需含有肽之源蛋白)量測之基因模組的單/多基因代表,提供關於腫瘤細胞、基質或腫瘤浸潤性淋巴球(TIL)狀態之資訊。
等位基因非相互作用資訊亦可包括肽之源基因在腫瘤細胞中之複本數。舉例而言,來自腫瘤細胞中經受純合缺失之基因的肽可經指定呈遞機率為零。
等位基因非相互作用資訊亦可包括肽結合於TAP之機率或肽與TAP之經量測或經預測之結合親和力。更可能結合於TAP之肽或以較高親和力結合TAP之肽更可能被MHC-I呈遞。
等位基因非相互作用資訊亦可包括TAP在腫瘤細胞中之表現量(其可藉由RNA-seq、蛋白質組質譜法、免疫組織化學量測)。對於MHC-I,較高TAP表現量增加所有肽之呈遞機率。
等位基因非相互作用資訊亦可包括存在或不存在腫瘤突變,其包括(但不限於): i. 已知癌症驅動基因(諸如EGFR、KRAS、ALK、RET、ROS1、TP53、CDKN2A、CDKN2B、NTRK1、NTRK2、NTRK3)中之驅動突變 ii. 在編碼抗原呈遞機制中所涉及之蛋白質的基因(例如B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOBHLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或編碼蛋白酶體或免疫蛋白酶體組分之基因中之任一者)中 呈遞依賴於腫瘤中經受功能喪失性突變之抗原呈遞機制之組分的肽具有降低的呈遞機率。
存在或不存在功能性生殖系多形現象,其包括(但不限於): i. 在編碼抗原呈遞機制中所涉及之蛋白質的基因(例如B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOBHLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或編碼蛋白酶體或免疫蛋白酶體組分之基因中之任一者)中。
等位基因非相互作用資訊亦可包括腫瘤類型(例如NSCLC、黑素瘤)。
等位基因非相互作用資訊亦可包括HLA等位基因之已知功能,如由例如HLA等位基因後綴所反映。舉例而言,等位基因名稱HLA-A*24:09N中之N後綴指示未表現且因此不大可能呈遞抗原決定基之剔除式等位基因;完整HLA等位基因後綴命名法描述於https://www.ebi.ac.uk/ipd/imgt/hla/nomenclature/suffixes.html。
等位基因非相互作用資訊亦可包括臨床腫瘤亞型(例如鱗狀肺癌與非鱗狀肺癌)。
等位基因非相互作用資訊亦可包括吸菸史。
等位基因非相互作用資訊亦可包括曬傷史、太陽曝曬史或暴露於其他誘變劑之歷史。
等位基因非相互作用資訊亦可包括肽之源基因在相關腫瘤類型或臨床亞型中之典型表現,視情況藉由驅動突變分層。通常在相關腫瘤類型中以高水準表現之基因更可能被呈遞。
等位基因非相互作用資訊亦可包括所有腫瘤中、或相同類型之腫瘤中、或具有至少一個共用MHC等位基因之個體的腫瘤中、或具有至少一個共有MHC等位基因之個體之相同類型的腫瘤中的突變頻率。
在突變的腫瘤特異性肽之情況下,用於預測呈遞機率之特徵清單亦可包括突變之註解(例如誤義、通讀、讀框轉移、融合等)或預測突變是否導致無義介導之衰變(NMD)。舉例而言,由於純合早期終止突變而在腫瘤細胞中不轉譯之蛋白質區段的肽可經指定呈遞機率為零。NMD使得mRNA轉譯降低,其降低呈遞機率。 VII.C.呈遞鑑別系統
圖3為說明根據一個實施例,呈遞鑑別系統160之電腦邏輯組件的高級框圖。在此實例實施例中,呈遞鑑別系統160包括資料管理模組312、編碼模組314、訓練模組316及預測模組320。呈遞鑑別系統160亦由訓練資料儲存器170及呈遞模型儲存器175構成。模型管理系統160之一些實施例具有與此處所描述不同的模組。類似地,功能可以不同於此處描述之方式分佈於模組當中。 VII.C.1.資料管理模組
資料管理模組312自呈遞資訊165產生數組訓練資料170。各組訓練資料含有複數個資料例子,其中各資料例子i含有一組自變數 zi ,其包括至少一個經呈遞或未經呈遞之肽序列 pi 、與該肽序列 pi 相關聯之一或多個相關MHC等位基因 ai ;及一個相依變數yi ,其表示呈遞鑑別系統160有意預測自變數之新值之資訊。
在本說明書其餘部分通篇提及的一個特定實施方案中,相依變數yi 係一種二元標記,指示肽 pi 是否經一或多個相關MHC等位基因 ai 呈遞。然而,應瞭解,在其他實施方案中,取決於自變數 zi ,相依變數 yi 可以表示呈遞鑑別系統160有意進行預測的任何其他種類之資訊。舉例而言,在另一實施方案中,相依變數 yi 亦可為指示對資料例子所鑑別的質譜離子電流的數值。
資料例子 i 之肽序列 pi 為具有ki 個胺基酸之序列,其中ki 可以隨資料例子i 而在一定範圍內變化。舉例而言,該範圍對於I類MHC可以為8-15或對於II類MHC為6-30。在系統160之一個特定實施方案中,一訓練資料集中的所有肽序列 pi 可以具有相同長度,例如9。肽序列中之胺基酸數目可以視MHC等位基因之類型(例如人體中之MHC等位基因等)而變化。資料例子i 之MHC等位基因 ai 指示存在與對應肽序列 pi 相關聯之MHC等位基因。
資料管理模組312亦可包括另外的等位基因相互作用變數,諸如與訓練資料170中所含的肽序列 pi 及相關MHC等位基因 ai 有關之結合親和力 bi 及穩定性 si 預測。舉例而言,訓練資料170可含有肽 pi ai 中指示之相關MHC分子中之每一者之間的結合親和力預測 bi 。作為另一實例,訓練資料170可含有關於 ai 中指示之MHC等位基因中之每一者的穩定性預測 si
資料管理模組312亦可包括等位基因非相互作用變數 wi ,諸如與肽序列 pi 有關的C端側接序列及mRNA定量量測值。
資料管理模組312亦鑑別未經MHC等位基因呈遞之肽序列,以產生訓練資料170。一般而言,此涉及在呈遞之前,鑑別源蛋白質中包括經呈遞肽序列之「較長」序列。當呈遞資訊含有經工程改造之細胞株時,資料管理模組312鑑別該等細胞所暴露之合成蛋白質中未呈遞於細胞之MHC等位基因上的一系列肽序列。當呈遞資訊含有組織樣本時,資料管理模組312鑑別用於得到經呈遞肽序列之源蛋白,且鑑別源蛋白中未呈遞於組織樣本細胞之MHC等位基因上的一系列肽序列。
資料管理模組312亦可利用隨機胺基酸序列來人工產生肽,且鑑別出所產生之序列為不呈遞於MHC等位基因上之肽。此可以藉由隨機地產生肽序列實現,由此允許資料管理模組312容易地產生大量不呈遞於MHC等位基因上之肽的合成資料。由於實際上,MHC等位基因呈遞一小部分肽序列,故合成產生之肽序列極有可能不會被MHC等位基因呈遞,即使該等序列係包括在經細胞加工之蛋白質中。
圖4說明根據一個實施例,一組實例訓練資料170A。具體言之,訓練資料170A中之前3個資料例子指示由包含等位基因HLA-C*01:03之單等位基因細胞株得到的肽呈遞資訊以及3個肽序列QCEIOWAREFLKEIGJ (SEQ ID NO: 10)、FIEUHFWI (SEQ ID NO: 11)及FEWRHRJTRUJR (SEQ ID NO: 12)。訓練資料170A中的第四個資料例子指示由包含等位基因HLA-B*07:02、HLA-C*01:03、HLA-A*01:01之多等位基因細胞株得到的肽資訊以及肽序列QIEJOEIJE (SEQ ID NO: 13)。第一個資料例子指示肽序列QCEIOWARE (SEQ ID NO: 14)未被等位基因HLA-DRB3:01:01呈遞。如先前兩個段落中所論述,陰性標記的肽序列可由資料管理模組312隨機產生或自所呈遞肽之源蛋白鑑別。訓練資料170A亦包括肽序列-等位基因對的1000 nM之結合親和力預測及1 h半衰期之穩定性預測。訓練資料170A亦包括等位基因非相互作用變數,諸如肽FJELFISBOSJFIE (SEQ ID NO: 15)之C端側接序列及102 TPM之mRNA定量量測值。第四個資料例子指示,肽序列QIEJOEIJE (SEQ ID NO: 13)經等位基因HLA-B*07:02、HLA-C*01:03或HLA-A*01:01中之一者呈遞。訓練資料170A亦包括有關等位基因中之每一者的結合親和力預測及穩定性預測,以及肽之C端側接序列及該肽之mRNA定量量測值。 VII.C.2.編碼模組
編碼模組314將訓練資料170中所含之資訊編碼成可以用於產生一或多個呈遞模型的數字表示。在一個實施方案中,編碼模組314經預定的20字母胺基酸字母表獨熱編碼序列(例如肽序列或C端側接序列)。具體言之,具有ki 個胺基酸之肽序列 pi 表示為具有20ki 個元素之列向量,其中pi 20 ( j - 1 )+ 1 , pi 20 ( j - 1 )+ 2 , , pi 20 j 當中對應於字母表中在該肽序列第j 位之胺基酸的單一元素之值為1。另外,其餘元素的值為0。作為一實例,對於既定字母表{A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, Y},資料例子i 之3個胺基酸之肽序列EAF可由具有60個元素之列向量表示: pi =[0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]。C端側接序列 ci ,以及MHC等位基因之蛋白質序列 dh ,及呈遞資訊中之其他序列資料可以與上文所描述類似之方式編碼。
當訓練資料170含有胺基酸長度不同之序列時,編碼模組314亦可藉由添加PAD字符以擴展預定字母表,將該等肽進一步編碼成相等長度之向量。舉例而言,此可以藉由用PAD字符對該肽序列左側填充直至該肽序列之長度達到訓練資料170中具有最大長度之肽序列來進行。因此,當具有最大長度之肽序列具有kmax 個胺基酸時,編碼模組314將各序列以數字方式表示為具有(20 + 1 ) kmax 個元素之列向量。作為一實例,對於擴展字母表{PAD, A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, Y}及kmax = 5 之最大胺基酸長度,3個胺基酸之相同實例肽序列EAF可由具有105個元素之列向量表示: pi =[1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]。C端側接序列 ci 或其他序列資料可以與上文所描述類似之方式編碼。因此,肽序列 pi ci 中的各自變數或各行表示在該序列特定位置處特定胺基酸之存在。
儘管以上編碼序列資料之方法係參考具有胺基酸序列之序列描述,但該方法可類似地擴展至其他類型之序列資料,諸如DNA或RNA序列資料,及類似序列資料。
編碼模組314亦將資料例子i 之一或多個MHC等位基因 ai 編碼為具有m 個元素之列向量,其中各元素h=1, 2, , m 對應於唯一鑑別之MHC等位基因。對應於所鑑別的資料例子i 之MHC等位基因的元素之值為1。另外,其餘元素的值為0。作為一實例,m = 4 唯一鑑別之MHC等位基因類型{HLA-A*01:01, HLA-C*01:08, HLA-B*07:02, HLA-DRB1*10:01 }當中對應於多等位基因細胞株的資料例子i 之等位基因HLA-B*07:02及HLA-DRB1*10:01可以由具有4個元素之列向量表示: ai =[0 0 1 1],其中a3 i =1及a4 i =1。儘管本文中用4種經鑑別之MHC等位基因類型描述實例,但MHC等位基因類型之數目實際上可以為數百種或數千種。如先前所論述,各資料例子i 通常含有至多6種不同的與肽序列 pi 相關聯之MHC等位基因類型。
編碼模組314亦將各資料例子i 之標記yi 編碼為具有來自集合{0, 1}之值的二元變數,其中值1指示肽 xi 經相關MHC等位基因 ai 中之一者呈遞,且值0指示肽 xi 未經相關MHC等位基因 ai 中之任一者呈遞。當相依變數yi 表示質譜離子電流時,編碼模組314可以另外使用各種函數,諸如對於在[0, ∞)之間的離子電流值具有(-∞, ∞)之範圍的對數函數縮放該等值。
編碼模組314可以將有關肽pi 及相關MHC等位基因h 的一對等位基因相互作用變數 xh i 表示為列向量,其中等位基因相互作用變數之數字表示係相繼地串接。舉例而言,編碼模組314可以將 xh i 表示為等於[pi ][pi bh i ] [pi sh i ][pi bh i sh i ] 之列向量,其中bh i 係肽 pi 及相關MHC等位基因h 之結合親和力預測值,且類似地適用於有關穩定性之sh i 。或者,等位基因相互作用變數之一或多個組合可以個別地儲存(例如以個別向量或矩陣形式)。
在一個實例中,編碼模組314藉由將結合親和力之量測值或預測值併入等位基因相互作用變數 xh i 中來表示結合親和力資訊。
在一個實例中,編碼模組314藉由將結合穩定性之量測值或預測值併入等位基因相互作用變數 xh i 中來表示結合穩定性資訊。
在一個實例中,編碼模組314藉由將結合締合速率之量測值或預測值併入等位基因相互作用變數 xh i 中來表示結合速率資訊。
在一個實例中,對於由I類MHC分子呈遞之肽,編碼模組314將肽長度表示為向量 Tk =[(Lk =8) (Lk =9) (Lk =10) (Lk =11) (Lk =12) (Lk =13) (Lk =14) (Lk =15)],其中為指標函數,且Lk 表示肽 pk 之長度。向量 Tk 可以包括在等位基因相互作用變數 xh i 中。在另一例子中,對於由II類MHC分子呈遞之肽,編碼模組314將肽長度表示為載體 Tk =[ (Lk =6) (Lk =7) (Lk =8) (Lk =9) (Lk =10) (Lk =11) (Lk =12) (Lk =13) (Lk =14) (Lk =15) (Lk =16) (Lk =17) (Lk =18) (Lk =19) (Lk =20) (Lk =21) (Lk =22) (Lk =23) (Lk =24) (Lk =25) (Lk =26) (Lk =27) (Lk =28) (Lk =29) (Lk =30)],其中為指標函數,且Lk 表示肽 pk 之長度。向量 Tk 可以包括在等位基因相互作用變數 xh i 中。
在一個實例中,編碼模組314藉由將基於RNA-seq之MHC等位基因表現量併入等位基因相互作用變數 xh i 中來表示MHC等位基因之RNA表現資訊。
類似地,編碼模組314可以將等位基因非相互作用變數 wi 表示為列向量,其中等位基因非相互作用變數之數字表示係相繼地串接。舉例而言, wi 可以為等於[ci ][ci mi wi ] 之列向量,其中 wi 係表示除肽 pi 之C端側接序列及與該肽有關之mRNA定量量測值 mi 外的任何其他等位基因非相互作用變數之列向量。或者,等位基因非相互作用變數之一或多個組合可以個別地儲存(例如以個別向量或矩陣形式)。
在一個實例中,編碼模組314藉由將轉換率或半衰期併入等位基因非相互作用變數 wi 中來表示源蛋白之轉換率。
在一個實例中,編碼模組314藉由將蛋白質長度併入等位基因非相互作用變數 wi 中來表示源蛋白或同功異型物之長度。
在一個例子中,編碼模組314藉由將包括β1 iβ2 iβ5 i 次單元在內之免疫蛋白酶體特異性蛋白酶體次單元之平均表現量併入等位基因非相互作用變數 wi 中來表示免疫蛋白酶體之活化。
在一個實例中,編碼模組314藉由將源蛋白之豐度併入等位基因非相互作用變數 wi 中來表示肽之源蛋白或肽之基因或轉錄物的RNA-seq豐度(藉由諸如RSEM之技術,以FPKM、TPM為單位定量)。
在一個例子中,編碼模組314藉由將利用例如Rivas等人,Science , 2015中之模型評估的肽之源轉錄物經歷無義介導之衰減(NMD)的機率併入等位基因非相互作用變數 wi 中來表示此機率。
在一個例子中,編碼模組314例如藉由使用例如經RNA-seq評定之路徑中各基因之RSEM,隨後計算該路徑中所有基因之概括統計量(例如平均值),以TPM為單位定量該路徑中基因之表現,以此表示基因模組或路徑之活化狀態。該平均值可以併入等位基因非相互作用變數 wi 中。
在一個例子中,編碼模組314藉由將複本數併入等位基因非相互作用變數 wi 中來表示源基因之複本數。
在一個例子中,編碼模組314藉由將量測或預測之TAP結合親和力(例如以奈莫耳為單位)包括在等位基因非相互作用變數 wi 中來表示TAP結合親和力。
在一個例子中,編碼模組314藉由將利用RNA-seq量測(且藉由例如RSEM以TPM為單位定量)的TAP表現量包括在等位基因非相互作用變數 wi 中來表示TAP表現量。
在一個例子中,編碼模組314在等位基因非相互作用變數 wi 中將腫瘤突變表示為指標變數之向量(亦即,若肽 pk 來自具有KRAS G12D突變之樣本,則 dk =1,否則為0)。
在一個例子中,編碼模組314將抗原呈遞基因中之生殖系多形現象表示為指標變數之向量(亦即,若肽 pk 來自在TAP中具有物種生殖系多形現象之樣本,則 dk =1)。該等指標變數可以包括在等位基因非相互作用變數 wi 中。
在一個例子中,編碼模組314經腫瘤亞型(例如NSCLC、黑素瘤、結腸直腸癌等)之字母表將腫瘤亞型表示為一位數長度獨熱編碼的向量。此等獨熱編碼之變數可以包括在等位基因非相互作用變數 wi 中。
在一個例子中,編碼模組314藉由用不同後綴處理4數位之HLA等位基因來表示MHC等位基因後綴。舉例而言,出於該模型之目的,HLA-A*24:09N被視為與HLA-A*24:09不同之等位基因。或者,由於以N後綴結尾之HLA等位基因不表現,故可以將所有肽中經加N後綴之MHC等位基因呈遞之機率設定成零。
在一個例子中,編碼模組314經腫瘤亞型(例如肺腺癌、肺鱗狀細胞癌等)之字母表將腫瘤亞型表示為一位數長度獨熱編碼之向量。此等獨熱編碼之變數可以包括在等位基因非相互作用變數 wi 中。
在一個例子中,編碼模組314將吸菸史表示為二元指標變數(若患者有吸菸史,則 dk =1,否則為0),該變數可以包括在等位基因非相互作用變數 wi 中。或者,吸菸史可以經吸菸嚴重程度之字母表編碼為一位數長度獨熱編碼之變數。舉例而言,吸菸狀態可以在1-5級量表上評級,其中1級指示非吸菸者,且5級指示當前重度吸菸者。由於吸菸史主要與肺腫瘤相關,故當訓練有關多個腫瘤類型之模型時,此變數亦可定義為當患者有吸菸史時等於1且腫瘤類型係肺腫瘤,否則為0。
在一個實例中,編碼模組314將曬傷史表示為二元指標變數(若患者有重度曬傷史,則 dk =1,否則為0),該變數可以包括在等位基因非相互作用變數 wi 中。由於重度曬傷主要與黑素瘤相關,故當訓練有關多個腫瘤類型之模型時,此變數亦可定義為當患者有重度曬傷史時等於1且腫瘤類型係黑素瘤,否則為0。
在一個例子中,編碼模組314藉由使用參考資料庫(諸如TCGA)將有關人類基因組中各基因或轉錄物之特定基因或轉錄物表現量分佈表示為表現量分佈之概括統計量(例如平均值、中值)。具體言之,對於腫瘤類型為黑素瘤之樣本中的肽 pk ,不僅肽 pk 之源基因或轉錄物的經量測基因或轉錄物表現量包括在等位基因非相互作用變數 wi 中,而且如藉由TCGA所量測的黑素瘤中肽 pk 之源基因或轉錄物之平均及/或中值基因或轉錄物表現量亦可包括在內。
在一個例子中,編碼模組314經突變類型(例如誤義、讀框轉移、NMD誘導等)之字母表將突變類型表示為一位數長度獨熱編碼之變數。該等獨熱編碼之變數可以包括在等位基因非相互作用變數 wi 中。
在一個例子中,編碼模組314在等位基因非相互作用變數 wi 中將蛋白質層級之蛋白質特徵表示為註解值(例如5'UTR長度)。在另一例子中,編碼模組314藉由包括指標變數來表示肽 pi 之源蛋白質之殘基層級註解,亦即當肽 pi 與螺旋基元重疊時等於1,否則為0;或亦即當肽 pi 完全含於等位基因非相互作用變數 wi 中之螺旋基元內時等於1。在另一例子中,表示肽 pi 中包含在螺旋基元註解內之殘基之比例的特徵可以包括在等位基因非相互作用變數 wi 中。
在一個實例中,編碼模組314將人類蛋白質組中蛋白質或同功異型物之類型表示為指標向量 ok ,該向量之長度等於人類蛋白質組中蛋白質或同功異型物之數目,且若肽 pk 來自蛋白質i ,則對應元素ok i 為1,否則為0。
在一個例子中,編碼模組314將肽 pi 之源基因G =gene( pi )表示為具有L 個可能類別的分類變數,其中L 表示索引式源基因1, 2, …,L 之數目上限。
在一個例子中,編碼模組314將肽 pi 之組織類型、細胞類型、腫瘤類型或腫瘤組織學類型T = tissue( pi )表示為具有M 個可能類別的分類變數,其中L表示索引式類型1, 2, …,M 之數目上限。組織之類型可包括例如肺組織、心臟組織、腸組織、神經組織及類似組織。細胞之類型可包括樹突狀細胞、巨噬細胞、CD4 T細胞及類似細胞。腫瘤之類型可包括肺腺癌、肺鱗狀細胞癌、黑素瘤、非霍奇金淋巴瘤(non-Hodgkin lymphoma)及類似腫瘤。
編碼模組314亦可將有關肽 pi 及相關MHC等位基因h 之變數 zi 的總體集合表示為列向量,其中等位基因相互作用變數 xi 及等位基因非相互作用變數 wi 之數字表示係相繼地串接。舉例而言,編碼模組314可以將 zh i 表示為等於[xh i wi ][wi xh i ] 之列向量。 VIII. 訓練模組
訓練模組316構築一或多個呈遞模型,該等模型產生肽序列是否會經與該等肽序列相關聯之MHC等位基因呈遞的可能性。具體言之,已知肽序列 pk 及與該肽序列 pk 相關聯之一組MHC等位基因 ak ,每個呈遞模型產生估計值uk ,其指示該肽序列 pk 將由相關MHC等位基因 ak 中之一或多者呈遞的可能性。 VIII.A.概述
訓練模組316基於由儲存於165中之呈遞資訊產生的儲存於儲存器170中之訓練資料集構築該一或多個呈遞模型。一般而言,不管呈遞模型之具體類型如何,所有該等呈遞模型均捕捉訓練資料170中自變數與相依變數之間的相關性以使損失函數降至最低。具體言之,損失函數(yi S , ui S ; θ )表示訓練資料170中一或多個資料例子S 之相依變數yi S 值與由呈遞模型產生的資料實例S 之估計可能性ui S 之間的偏差。在本說明書其餘部分通篇所提及的一個特定實施方案中,損失函數(yi S , ui S ; θ )係由以下等式(1a)提供的負對數可能性函數:。 (1a) 然而,實際上可以使用另一損失函數。舉例而言,當對質譜離子電流進行預測時,損失函數係由以下等式1b提供的均方損失:。 (1b)
呈遞模型可以為一種參數模型,其中一或多個參數 θ 在數學上指明自變數與相依變數之間的相關性。通常,使損失函數(yi S , ui S ; θ )降至最低的參數型呈遞模型之各種參數係經由基於梯度之數值最佳化演算法,諸如批量梯度演算法、隨機梯度演算法及類似演算法判定。或者,呈遞模型可以為一種非參數模型,其中模型結構係由訓練資料170決定且並不嚴格基於固定參數集。 VIII.B.每一等位基因模型
訓練模組316可以基於每一等位基因來構築呈遞模型以預測肽之呈遞可能性。在此情況下,訓練模組316可以基於由表現單一MHC等位基因之細胞產生的訓練資料170中之資料例子S 訓練呈遞模型。
在一個實施方案中,訓練模組316藉由下式使特定等位基因h 對於肽 pk 之估計呈遞可能性uk 模型化:, (2) 其中肽序列 xh k 表示編碼的有關肽 pk 及對應MHC等位基因h 之等位基因相互作用變數,f (∙)為任何函數且為便於說明,在本文通篇稱為轉變函數。另外,gh (∙)為任何函數,為便於說明,在本文通篇稱為依賴性函數(dependency function),且基於所測定的MHC等位基因h 之參數集 θh 產生對於等位基因相互作用變數 xh k 的依賴性分數。有關各MHC等位基因h 之參數集 θh 的值可藉由使有關 θh 之損失函數降至最低來測定,其中i 係由表現單一MHC等位基因h 之細胞產生的訓練資料170之子集S 中的各例子。
依賴性函數gh ( xh k ;θh )之輸出值表示至少基於等位基因相互作用特徵 xh k ,且特定言之,基於肽 pk 之肽序列中之胺基酸位置的針對MHC等位基因h 之依賴性分數,其指示MHC等位基因h 是否會存在於對應新抗原中。舉例而言,若MHC等位基因h 可能呈遞肽 pk ,則有關MHC等位基因h 之依賴性分數可以具有較高值,且若不大可能呈遞,則可能具有較低值。轉變函數f (∙)將輸入轉變成,且更具體言之,在此情況下將由gh ( xh k ; θh )產生之依賴性分數轉變成適當值以指示肽 pk 將經MHC等位基因呈遞之可能性。
在本說明書其餘部分通篇提及的一個特定實施方案中,f (∙)為對於適當域範圍具有在[0, 1]內之範圍的函數。在一個實例中,f(∙)為由以下提供之expit函數:。 (4) 作為另一實例,f (∙)亦可為由以下提供之雙曲正切函數:(5) 當域z 之值等於或大於0時。或者,當質譜離子電流之預測值超出範圍[0, 1]時,f (∙)可為任何函數,諸如恆等函數、指數函數、對數函數及類似函數。
因此,可以藉由將有關MHC等位基因h 之依賴性函數gh (∙)應用於肽序列 pk 之經編碼形式以產生對應依賴性分數來產生肽序列 pk 會經MHC等位基因h 呈遞之每一等位基因可能性。依賴性分數可以藉由轉變函數f (∙)轉變以產生肽序列 pk 會經MHC等位基因h 呈遞之每一等位基因可能性。 VIII.B.1有關等位基因相互作用變數之依賴性函數
在本說明書通篇提及的一個特定實施方案中,依賴性函數gh (∙)係由下式提供之仿射函數:. (6) 該函數將 xh k 中的每個等位基因相互作用變數與所測定的相關MHC等位基因h 之參數集 θh 中的對應參數線性地組合。
在本說明書通篇提及的另一特定實施方案中,依賴性函數 gh ( ) 係由下式提供之網路函數:. (7) 以具有排列在一或多層中之一系列節點的網路模型NNh (∙)表示。一個節點可以經由連接來連接至其他節點,該等連接各自在參數集 θh 中具有相關參數。在一個特定節點處之值可以表示為藉由與該特定節點相關聯之激發函數所映射之相關參數加權的連接至該特定節點之節點之值的總和。與仿射函數相比,由於呈遞模型可以併入具有不同胺基酸序列長度之非線性及製程資料,故網路模型係有利的。具體言之,經由非線性模型化,網路模型可以捕捉在肽序列中不同位置處之胺基酸之間的相互作用及此相互作用如何影響肽呈遞。
一般而言,網路模型NNh (∙)可以經結構化為前饋網路,諸如人工神經網路(ANN)、迴旋神經網路(CNN)、深度神經網路(DNN),及/或循環網路,諸如長短期記憶網路(LSTM)、雙向循環網路、深度雙向循環網路及類似網路。
在本說明書其餘部分通篇提及的一個例子中,h =1 , 2 , , m 中之各MHC等位基因與獨立網路模型相關聯,且NNh (∙)表示與MHC等位基因h 相關之網路模型的結果。
圖5說明與任意MHC等位基因h = 3相關之實例網路模型NN3 (∙)。如圖5中所示,關於MHC等位基因h = 3 之網路模型NN3 (∙)包括在層l = 1 處之三個輸入節點、在層l = 2 處之四個節點、在層l = 3 處之兩個節點及在層l = 4 處之一個輸出節點。網路模型NN3 (∙)與十個參數θ3 (1),θ3 (2),…,θ3 (10)之集合相關。網路模型NN3 (∙)接收關於MHC等位基因h=3 之三個等位基因相互作用變數x3 k (1)、x3 k (2)及x3 k (3)之輸入值(包括經編碼之多肽序列資料及所用任何其他訓練資料之個別資料實例)且輸出值NN3 (x3 k )。網路函數亦可包括各自採用不同等位基因相互作用變數作為輸入之一或多個網路模型。
在另一例子中,經鑑別之MHC等位基因h = 1 , 2 , , m 與單一網路模型NNH (∙)相關聯,且NNh (∙)表示與MHC等位基因h 相關聯之單一網路模型的一或多個輸出。在此類例子中,參數集 θh 可以對應於該單一網路模型之參數集,且因此,參數集 θh 可以為所有MHC等位基因共有的。
圖6A說明MHC等位基因h = 1 , 2 , , m 共有的實例網路模型NNH (∙)。如圖6A中所示,該網路模型NNH (∙)包括m 個輸出節點,各自對應於MHC等位基因。網路模型NN3 (∙)接受有關MHC等位基因h=3 之等位基因相互作用變數 x3 k 並輸出m 個值,包括對應於MHC等位基因h=3 之值NN3 (x3 k )。
在又一例子中,單一網路模型NNH (∙)可為在給出MHC等位基因h 之等位基因相互作用變數 xh k 及所編碼之蛋白質序列 dh 情況下,輸出依賴性分數的網路模型。在此類例子中,參數集 θh 同樣可以對應於該單一網路模型之參數集,且因此,參數集 θh 可以為所有MHC等位基因共有的。因此,在此類例子中,NNh (∙)可表示在向單一網路模型給予輸入[ xh k dh ] 時單一網路模型NNH (∙)的輸出。由於訓練資料中未知之MHC等位基因的肽呈遞機率只能藉由鑑別其蛋白質序列進行預測,故此類網路模型係有利的。
圖6B說明MHC等位基因共有的實例網路模型NNH (∙)。如圖6B中所示,網路模型NNH (∙)接收MHC等位基因h = 3 之等位基因相互作用變數及蛋白質序列作為輸入,且輸出對應於MHC等位基因h = 3 之依賴性分數NN3 (x3 k )。
在又一例子中,依賴性函數 gh ( ) 可表示為:其中g ' h ( xh k ; θ ' h )係具有參數集 θ ' h 的仿射函數、網路函數或類似函數,其中有關MHC等位基因之等位基因相互作用變數的參數集中之偏差參數 θh 0 表示MHC等位基因h 之基線呈遞機率。
在另一實施方案中,偏差參數 θh 0 可以為MHC等位基因h 之基因家族共有的。亦即,MHC等位基因h 之偏差參數 θh 0 可以等於 θgene ( h ) 0 ,其中gene (h )為MHC等位基因h 之基因家族。舉例而言,I類MHC等位基因HLA-A*02:01、HLA-A*02:02及HLA-A*02:03可歸為「HLA-A」之基因家族,且此等MHC等位基因中之每一者之偏差參數 θh 0 可為共有的。作為另一實例II類MHC等位基因HLA-DRB1:10:01、HLA-DRB1:11:01及HLA-DRB3:01:01可歸為「HLA-DRB」之基因家族,且此等MHC等位基因中之每一者之偏差參數 θh 0 可為共有的。
再回到等式(2),作為一個實例,在使用仿射依賴性函數gh (∙)鑑別的m=4 種不同MHC等位基因中,肽 pk 會經MHC等位基因h=3 呈遞之可能性可以由下式產生:, 其中 x3 k 係所鑑別的MHC等位基因h=3 之等位基因相互作用變數,且 θ3 係經由損失函數最小化測定的MHC等位基因h=3 之參數集。
作為另一實例,在使用獨立網路轉變函數gh (∙)鑑別的m=4 種不同MHC等位基因當中,肽 pk 會經MHC等位基因h=3 呈遞之可能性可以藉由下式產生:, 其中 x3 k 係所鑑別的MHC等位基因h=3 之等位基因相互作用變數,且 θ3 係所測定的與MHC等位基因h=3 相關聯之網路模型NN3 (∙)的參數集。
圖7說明使用實例網路模型NN3 (∙)產生與MHC等位基因h = 3相關聯之肽 pk 之呈遞的可能性。如圖7中所示,網路模型NN3 (∙)接收有關MHC等位基因h = 3 之等位基因相互作用變數 x3 k 並產生輸出NN3 ( x3 k )。該輸出經函數 f ( ) 映射以產生估計的呈遞可能性uk 。 VIII.B.2.具有等位基因非相互作用變數之每一等位基因
在一個實施方案中,訓練模組316併入等位基因非相互作用變數且藉由下式使肽 pk 之所估計呈遞可能性uk 模型化:, (8) 其中 wk 表示關於肽 pk 之經編碼等位基因非相互作用變數,gw (∙)係基於所測定的等位基因非相互作用變數之參數集 θw 的有關等位基因非相互作用變數 wk 之函數。具體言之,有關各MHC等位基因h 之參數集 θh 及有關等位基因非相互作用變數之參數集 θw 的值可以藉由使關於 θh θw 之損失函數降至最低來測定,其中i 係由表現單一MHC等位基因之細胞產生的訓練資料170之子集S 中的各例子。
依賴性函數gw ( wk ;θw )之輸出表示基於等位基因非相互作用變數之影響進行的等位基因非相互作用變數之依賴性分數,其指示肽 pk 是否會經一或多個MHC等位基因呈遞。舉例而言,若肽 pk 與已知會積極地影響肽 pk 之呈遞的C端側接序列相關,則等位基因非相互作用變數之依賴性分數可能具有較高值,且若肽 pk 與已知會不利地影響肽 pk 之呈遞的C端側接序列相關,則可能具有較低值。
根據等式(8),肽序列 pk 會經MHC等位基因h 呈遞之每一等位基因可能性可以藉由將有關MHC等位基因h 之函數gh (∙)應用於肽序列 pk 之經編碼形式以產生等位基因相互作用變數之對應依賴性分數來產生。有關等位基因非相互作用變數之函數gw (∙)亦應用於等位基因非相互作用變數之經編碼形式以產生等位基因非相互作用變數之依賴性分數。將兩個評分合併,且藉由轉變函數f (∙)轉變該合併之評分以產生肽序列 pk 會經MHC等位基因h 呈遞之每一等位基因可能性。
或者,訓練模組316可以藉由在等式(2)中將等位基因非相互作用變數 wk 添加至等位基因相互作用變數 xh k 而在預測值中包括等位基因非相互作用變數 wk 。因此,呈遞可能性可以藉由下式提供:。 (9) VIII.B.3有關等位基因非相互作用變數之依賴性函數
與有關等位基因相互作用變數之依賴性函數gh (∙)類似,有關等位基因非相互作用變數之依賴性函數gw (∙)可以為仿射函數或網路函數,其中獨立網路模型與等位基因非相互作用變數 wk 相關聯。
具體言之,依賴性函數gw (∙)係由下式提供之仿射函數:該函數將等位基因非相互作用變數 wk 與參數集 θw 中之對應參數線性地組合。
依賴性函數 gw ( ) 亦可為由下式提供之網路函數:. 其由具有參數集 θw 中之相關參數之網路模型NNw (∙)表示。網路函數亦可包括一或多個網路模型,各自採用不同等位基因非相互作用變數作為輸入。
在另一例子中,有關等位基因非相互作用變數之依賴性函數 gw ( ) 可以由下式提供:, (10)其中g ' w ( wk ; θ ' w )為仿射函數、具有等位基因非相互作用參數集 θ ' w 之網路函數或類似函數,mk 為肽 pk 之mRNA定量量測值,h (∙)為轉變該定量量測值之函數,且θw m 為有關等位基因非相互作用變數之參數集中之參數,其與該mRNA定量量測值組合以產生mRNA定量量測值之依賴性分數。在本說明書其餘部分通篇提及的一個特定實施例中,h (∙)為對數函數,然而實際上,h (∙)可以為多種不同函數中之任一種。
在另一例子中,有關等位基因非相互作用變數之依賴性函數 gw ( ) 可以由下式提供:, (11) 其中g ' w ( wk ; θ ' w )為仿射函數、具有等位基因非相互作用參數集 θ ' w 之網路函數或類似函數, ok 為在VII.C.2部分描述的表示人類蛋白質組中有關肽 pk 之蛋白質及同功異型物的指標向量,且 θw o 為與指標向量組合的有關等位基因非相互作用變數之參數集中的參數集。在一種變化形式中,當 ok 之維度及參數集 θw o 明顯較高時,可以在測定參數值時將參數正則項,諸如,添加至損失函數中,其中||∙||表示L1範數、L2範數、組合或類似者。超參數λ之最佳值可以經由適當方法判定。
在另一例子中,有關等位基因非相互作用變數之依賴性函數 gw ( ) 可以由下式提供:, (12) 其中g ' w ( wk ; θ ' w )為仿射函數、具有等位基因非相互作用參數 θ ' w 集之網路函數或類似函數, (gene( pk =l ))為指標函數,當肽 pk 來自如上文關於等位基因非相互作用變數所描述之源基因l 時,其等於1,且 θw l 為指示源基因l 之「抗原性」的參數。在一個變化形式中,當L 顯著較高時,且因此參數 θw l = 1 , 2 , , L 之數目顯著較高,可當測定參數值時將參數正則項(諸如)添加至損失函數,其中||∙||表示L1範數、L2範數組合或類似者。超參數λ之最佳值可以經由適當方法判定。
在另一例子中,有關等位基因非相互作用變數之依賴性函數 gw ( ) 可以由下式提供:, (12) 其中g ' w ( wk ; θ ' w )為仿射函數、具有等位基因非相互作用參數 θ ' w 集之網路函數或類似函數, (gene( pk )=l , tissue( pk )=m )為指標函數,當肽 pk 來自源基因l 時及當肽 pk 來自如上文關於等位基因非相互作用變數所描述之組織類型m 時,其等於1,且 θw lm 為指示源基因l 及組織類型m 之組合的抗原性的參數。具體言之,有關於組織類型m 之基因l 的抗原性可表示,組織類型m 之細胞在控制RNA表現及肽序列情況之後呈遞來自基因l 的肽的殘餘傾向。
在一個變化形式中,當LM 顯著較高時,且因此參數 θw lm = 1 , 2 , , LM 之數目顯著較高,可當測定參數之值時將參數正則項(諸如)添加至損失函數,其中||∙||表示L1範數、L2範數、組合或類似者。超參數λ之最佳值可以經由適當方法判定。在另一變化形式中,可當測定參數之值時將參數正則項添加至損失函數,使得同一源基因之係數在組織類型之間無顯著地不同。舉例而言,懲罰項,諸如:其中為源基因l 之所有組織類型的平均抗原性,可損失函數中之所有不同組織類型的抗原性的標準差。
實際上,可將等式(10)、(11)、(12a)及(12b)中之任一者之額外項進行組合,產生有關於等位基因非相互作用變數的依賴性函數gw (∙)。舉例而言,可將等式(10)中指示mRNA定量測量的項h (∙)及等式(12)中指示源基因抗原性的項以及任何其他仿射或網路函數加總在一起,產生有關於等位基因非相互作用變數的依賴性函數。
返回到等式(8),作為一實例,在使用仿射轉變函數gh (∙)、gw (∙)鑑別的m = 4 種不同MHC等位基因中,肽 pk 會經MHC等位基因h = 3 呈遞之可能性可以由下式產生:, 其中 wk 為所鑑別的有關肽 pk 之等位基因非相互作用變數,且 θw 為所測定的等位基因非相互作用變數之參數集。
作為另一實例,在使用網路轉變函數gh (∙)、gw (∙)鑑別的m = 4 種不同MHC等位基因當中,肽 pk 會經MHC等位基因h = 3 呈遞之可能性可以藉由下式產生:其中 wk 為所鑑別的有關肽 pk 之等位基因相互作用變數,且 θw 為所測定的等位基因非相互作用變數之參數集。
圖8說明使用實例網路模型NN3 (∙)及NNw (∙)產生與MHC等位基因h = 3相關聯之肽 pk 之呈遞的可能性。如圖8中所示,網路模型NN3 (∙)接收有關MHC等位基因h = 3 之等位基因相互作用變數 x3 k 並產生輸出NN3 ( x3 k )。網路模型NNw (∙)接收有關肽 pk 之等位基因非相互作用變數 wk 並產生輸出NNw ( wk )。將該等輸出合併並藉由函數f (∙)映射以產生估計的呈遞可能性uk 。 VIII.C.多等位基因模型
訓練模組316亦可在存在兩個或更多個MHC等位基因之多等位基因環境中構築呈遞模型以預測肽之呈遞可能性。在此情況下,訓練模組316可基於由表現單一MHC等位基因之細胞、表現多個MHC等位基因之細胞或其組合產生的訓練資料170中之資料例子S 訓練呈遞模型。 VIII.C.1.實例1:每一等位基因模型最大值
在一個實施方案中,訓練模組316使與多個等位基因H 之集合相關聯之肽 pk 的所估計呈遞可能性uk 隨基於表現單等位基因之細胞所測定的集合H 中各MHC等位基因h 之呈遞可能性uk h H 的變化模型化,如上文結合等式(2)-(11)所描述。具體言之,呈現可能性uk 可為uk h H 之任何函數。在一個實施方案中,如等式(12)中所示,該函數係最大函數,且呈現可能性uk 可測定為集合H 中各MHC等位基因h 之呈遞可能性最大值。。 VIII.C.2.實例2.1:求和模型之函數
在一個實施方案中,訓練模組316藉由下式使肽 pk 之所估計呈遞可能性uk 模型化:, (13) 其中元素ah k 對於與肽序列 pk 相關聯之多個MHC等位基因H 為1且 xh k 表示編碼的有關肽 pk 及對應MHC等位基因之等位基因相互作用變數。有關各MHC等位基因h 之參數集 θh 的值可以藉由使關於 θh 之損失函數降至最低來測定,其中i 係由表現單一MHC等位基因之細胞及/或表現多個MHC等位基因之細胞產生的訓練資料170之子集S 中的各例子。依賴性函數 gh 可以呈以上VIII.B.1部分中介紹的依賴性函數 gh 中之任一者的形式。
根據等式(13),肽序列 pk 會經一或多個MHC等位基因h 呈遞的呈遞可能性可以藉由將依賴性函數gh (∙)應用於有關MHC等位基因H 中之每一者的肽序列 pk 之經編碼形式以產生等位基因相互作用變數之對應評分來產生。將每個MHC等位基因h 之評分合併,且藉由轉變函數f (∙)轉變以產生肽序列 pk 會經MHC等位基因集H 呈遞之呈遞可能性。
等式(13)之呈遞模型與等式(2)之每一等位基因模型之不同之處在於,各肽 pk 之相關等位基因的數目可以大於1。換言之,對於與肽序列 pk 相關聯之多個MHC等位基因Hah k 中多於一個元素的值可以為1。
舉例而言,在使用仿射轉變函數gh (∙)鑑別的m=4 種不同MHC等位基因中,肽 pk 會經MHC等位基因h=2h=3 呈遞之可能性可以藉由下式產生:, 其中 x2 k x3 k 為鑑別的有關MHC等位基因h=2h=3 之等位基因相互作用變數,且 θ2 θ3 為測定的有關MHC等位基因h=2h=3 之參數集。
作為另一實例,在使用網路轉變函數gh (∙)、gw (∙)鑑別的m = 4 種不同MHC等位基因當中,肽 pk 會經MHC等位基因h = 2h = 3 呈遞之可能性可以藉由下式產生: 其中NN2 (∙)、NN3 (∙)為鑑別的有關MHC等位基因h = 2h = 3 之網路模型,且 θ2 θ3 為所測定的有關MHC等位基因h = 2h = 3 之參數集。
圖9說明使用實例網路模型NN2 (∙)及NN3 (∙)產生與MHC等位基因h = 2、h = 3相關聯之肽 pk 之呈遞的可能性。如圖9中所示,網路模型NN2 (∙)接收有關MHC等位基因h = 2 之等位基因相互作用變數 x2 k 並產生輸出NN2 ( x2 k ),且網路模型NN3 (∙)接收有關MHC等位基因h = 3 之等位基因相互作用變數 x3 k 並產生輸出NN3 ( x3 k )。將該等輸出合併並藉由函數f (∙)映射以產生估計的呈遞可能性uk 。 VIII.C.3.實例2.2:利用等位基因非相互作用變數,求和模型之函數
在一個實施方案中,訓練模組316併入等位基因非相互作用變數且藉由下式使肽 pk 之所估計呈遞可能性uk 模型化:, (14) 其中 wk 表示編碼的有關肽 pk 之等位基因非相互作用變數。具體言之,有關每一MHC等位基因h 之參數集 θh 及有關等位基因非相互作用變數之參數集 θw 的值可以藉由使關於 θh θw 之損失函數降至最低來測定,其中i 為由表現單一MHC等位基因之細胞及/或表現多個MHC等位基因之細胞產生的訓練資料170之子集S 中的各例子。依賴性函數 gw 可以呈以上VIII.B.3部分中介紹的依賴性函數 gw 中之任一者的形式。
因此,根據等式(14),肽序列 pk 會經一或多個MHC等位基因H 呈遞之呈遞可能性可以藉由將函數gh (∙)應用於有關MHC等位基因H 中之每一者的肽序列 pk 之經編碼形式以產生有關各MHC等位基因h 之等位基因相互作用變數的對應依賴性分數來產生。有關等位基因非相互作用變數之函數gw (∙)亦應用於等位基因非相互作用變數之經編碼形式以產生等位基因非相互作用變數之依賴性分數。將該等評分合併,且藉由轉變函數f (∙)轉變該合併之評分以產生肽序列 pk 會經MHC等位基因H 呈遞之呈遞可能性。
在等式(14)之呈現模型中,各肽 pk 之相關等位基因的數目可以大於1。換言之,對於與肽序列 pk 相關聯之多個MHC等位基因Hah k 中多於一個元素的值可以為1。
作為另一實例,在使用網路轉變函數gh (∙)、gw (∙)鑑別的m = 4 種不同MHC等位基因當中,肽 pk 會經MHC等位基因h = 2h = 3 呈遞之可能性可以藉由下式產生:, 其中 wk 為所鑑別的有關肽 pk 之等位基因非相互作用變數,且 θw 為所測定的等位基因非相互作用變數之參數集。
作為另一實例,在使用網路轉變函數gh (∙)、gw (∙)鑑別的m = 4 種不同MHC等位基因當中,肽 pk 會經MHC等位基因h = 2h = 3 呈遞之可能性可以藉由下式產生:其中 wk 為所鑑別的有關肽 pk 之等位基因相互作用變數,且 θw 為所測定的等位基因非相互作用變數之參數集。
圖10說明使用實例網路模型NN2 (∙)、NN3 (∙)及NNw (∙)產生與MHC等位基因h = 2h = 3相關聯之肽 pk 之呈遞的可能性。如圖10中所示,網路模型NN2 (∙)接收有關MHC等位基因h = 2 之等位基因相互作用變數 x2 k 並產生輸出NN2 ( x2 k )。網路模型NN3 (∙)接收有關MHC等位基因h = 3 之等位基因相互作用變數 x3 k 並產生輸出NN3 ( x3 k )。網路模型NNw (∙)接收有關肽 pk 之等位基因非相互作用變數 wk 並產生輸出NNw ( wk )。將該等輸出合併並藉由函數f (∙)映射以產生估計的呈遞可能性uk
或者,訓練模組316可以藉由在等式(15)中將等位基因非相互作用變數 wk 添加至等位基因相互作用變數 xh k 而在預測值中包括等位基因非相互作用變數 wk 。因此,呈遞可能性可以藉由下式提供:。 (15) VIII.C.4.實例3.1:使用隱式每一等位基因可能性之模型
在另一實施方案中,訓練模組316藉由下式使肽 pk 之所估計呈遞可能性uk 模型化:, (16) 其中元素ah k 對於與肽序列 pk 相關聯之多個MHC等位基因h H 為1,u ' k h 為MHC等位基因h 之隱式每一等位基因呈遞可能性,向量 v 為元素vh 對應於ah k ∙ u ' k h 之向量,s (∙)為映射元素 v 之函數,且r (∙)為限幅函數(clipping function),其將輸入值削減至給定範圍中。如以下更詳細地描述,s (∙)可以為求和函數或二階函數,但應理解,在其他實施例中,s (∙)可以為任何函數,諸如最大函數。有關隱式每一等位基因可能性之參數集 θ 的值可以藉由使關於 θ 之損失函數降至最低來測定,其中i 為由表現單一MHC等位基因之細胞及/或表現多個MHC等位基因之細胞產生的訓練資料170之子集S 中的各例子。
使等式(17)之呈遞模型中的呈遞可能性隨各自對應於肽 pk 會經個別MHC等位基因h 呈遞之可能性的隱式每一等位基因呈遞可能性u ' k h 變化的函數模型化。隱式每一等位基因可能性與VIII.B部分之每一等位基因呈遞可能性的不同之處在於,隱式每一等位基因可能性參數可以自多等位基因環境習得,其中除單一等位基因環境外,經呈遞之肽與對應MHC等位基因之間的直接關聯為未知的。因此,在多等位基因環境中,呈遞模型不僅可以估計肽 pk 是否會經作為整體之MHC等位基因集H 呈遞,而且亦可提供指示最可能呈遞肽 pk 之MHC等位基因h 的個體可能性u ' k h H 。其優勢在於,呈遞模型可以在無有關表現單一MHC等位基因之細胞的訓練資料情況產生隱式可能性。
在本說明書其餘部分通篇提及的一個特定實施方案中,r (∙)為範圍為[0, 1]的函數。舉例而言,r (∙)可為限幅函數:, 其中選擇z 與1之間的最小值作為呈遞可能性uk 。在另一實施方案中,r (∙)為由下式提供之雙曲正切函數:當域z 之值等於或大於0時。 VIII.C.5.實例3.2:函數求和模型
在一個特定實施方案中,s (∙)為求和函數,且呈遞可能性係藉由對隱式每一等位基因呈遞可能性求和得到:。 (17)
在一個實施方案中,MHC等位基因h 之隱式每一等位基因呈遞可能性係藉由下式產生:, (18) 由此藉由下式估計出呈遞可能性:。 (19)
根據等式(19),肽序列 pk 會經一或多個MHC等位基因該呈遞的呈遞可能性可以藉由將依賴性函數gh (∙)應用於有關MHC等位基因H 中之每一者的肽序列 pk 之經編碼形式以產生等位基因相互作用變數之對應評分來產生。各依賴性分數首先藉由函數f (∙)轉變以產生隱式每一等位基因呈遞可能性u ' k h 。將每一等位基因可能性u ' k h 合併,且可以將限幅函數應用於該合併之可能性以將值削減至範圍[0, 1]中以產生肽序列 pk 會經MHC等位基因集H 呈遞之呈遞可能性。依賴性函數 gh 可以呈以上VIII.B.1部分中介紹的依賴性函數 gh 中之任一者的形式。
舉例而言,在使用仿射轉變函數gh (∙)鑑別的m=4 種不同MHC等位基因中,肽 pk 會經MHC等位基因h=2h=3 呈遞之可能性可以藉由下式產生:, 其中 x2 k x3 k 為鑑別的有關MHC等位基因h=2h=3 之等位基因相互作用變數,且 θ2 θ3 為測定的有關MHC等位基因h=2h=3 之參數集。
作為另一實例,在使用網路轉變函數gh (∙)、gw (∙)鑑別的m = 4 種不同MHC等位基因當中,肽 pk 會經MHC等位基因h = 2h = 3 呈遞之可能性可以藉由下式產生:, 其中NN2 (∙)、NN3 (∙)為鑑別的有關MHC等位基因h = 2h = 3 之網路模型,且 θ2 θ3 為所測定的有關MHC等位基因h = 2h = 3 之參數集。
圖11說明使用實例網路模型NN2 (∙)及NN3 (∙)產生與MHC等位基因h = 2、h = 3相關聯之肽 pk 之呈遞的可能性。如圖9中所示,網路模型NN2 (∙)接收有關MHC等位基因h = 2 之等位基因相互作用變數 x2 k 並產生輸出NN2 ( x2 k ),且網路模型NN3 (∙)接收有關MHC等位基因h = 3 之等位基因相互作用變數 x3 k 並產生輸出NN3 ( x3 k )。將各輸出藉由函數f (∙)映射並合併以產生所估計的呈遞可能性uk
在另一實施方案中,當對質譜離子電流之對數進行預測時,r (∙)為對數函數且f (∙)為指數函數。 VIII.C.6.實例3.3:利用等位基因非相互作用變數之函數求和模型
在一個實施方案中,MHC等位基因h 之隱式每一等位基因呈遞可能性係藉由下式產生:, (20) 由此藉由下式產生呈遞可能性:, (21) 以併入等位基因非相互作用變數對肽呈遞之影響。
根據等式(21),肽序列 pk 會經一或多個MHC等位基因H 呈遞之呈遞可能性可以藉由將函數gh (∙)應用於有關MHC等位基因H 中之每一者的肽序列 pk 之經編碼形式以產生有關各MHC等位基因h 之等位基因相互作用變數的對應依賴性分數來產生。有關等位基因非相互作用變數之函數gw (∙)亦應用於等位基因非相互作用變數之經編碼形式以產生等位基因非相互作用變數之依賴性分數。將等位基因非相互作用變數之評分與等位基因相互作用變數之依賴性分數中之每一者合併。藉由函數f (∙)轉變各合併之評分以產生隱式每一等位基因呈遞可能性。將隱式可能性合併,且可以將限幅函數應用於該合併輸出以將值削減至範圍[0,1]中以產生肽序列 pk 會經MHC等位基因H 呈遞之呈遞可能性。依賴性函數 gw 可以呈以上VIII.B.3部分中介紹的依賴性函數 gw 中之任一者的形式。
作為另一實例,在使用網路轉變函數gh (∙)、gw (∙)鑑別的m = 4 種不同MHC等位基因當中,肽 pk 會經MHC等位基因h = 2h = 3 呈遞之可能性可以藉由下式產生:, 其中 wk 為所鑑別的有關肽 pk 之等位基因非相互作用變數,且 θw 為所測定的等位基因非相互作用變數之參數集。
作為另一實例,在使用網路轉變函數gh (∙)、gw (∙)鑑別的m = 4 種不同MHC等位基因當中,肽 pk 會經MHC等位基因h = 2h = 3 呈遞之可能性可以藉由下式產生:其中 wk 為所鑑別的有關肽 pk 之等位基因相互作用變數,且 θw 為所測定的等位基因非相互作用變數之參數集。
圖12說明使用實例網路模型NN2 (∙)、NN3 (∙)及NNw (∙)產生與MHC等位基因h = 2h = 3相關聯之肽 pk 之呈遞的可能性。如圖12中所示,網路模型NN2 (∙)接收有關MHC等位基因h = 2 之等位基因相互作用變數 x2 k 並產生輸出NN2 ( x2 k )。網路模型NNw (∙)接收有關肽 pk 之等位基因非相互作用變數 wk 並產生輸出NNw ( wk )。將輸出合併並藉由函數f (∙)映射。網路模型NN3 (∙)接收有關MHC等位基因h = 3 之等位基因相互作用變數 x3 k 並產生輸出NN3 ( x3 k ),再次將該輸出與相同網路模型NNw (∙)之輸出NNw ( wk )合併且藉由函數f (∙)映射。將兩個輸出合併以產生所估計呈遞可能性uk
在另一實施方案中,MHC等位基因h 之隱式每一等位基因呈遞可能性係藉由下式產生:。 (22) 由此藉由下式產生呈遞可能性:。 VIII.C.7.實例4:二階模型
在一個實施方案中,s (∙)為二階函數,且肽 pk 之所估計呈遞可能性uk 係藉由下式提供:(23) 其中元素u ' k h 為MHC等位基因h 之隱式每一等位基因呈遞可能性。有關隱式每一等位基因可能性之參數集 θ 的值可以藉由使關於 θ 之損失函數降至最低來測定,其中i 為由表現單一MHC等位基因之細胞及/或表現多個MHC等位基因之細胞產生的訓練資料170之子集S 中的各例子。隱式每一等位基因呈遞可能性可以呈以上描述之等式(18)、(20)及(22)中所示之任何形式。
在一個態樣中,等式(23)之模型可以暗示存在肽 pk 會同時經兩個MHC等位基因呈遞之可能,其中兩個HLA等位基因之呈遞在統計學上係獨立的。
根據等式(23),肽序列 pk 會經一或多個MHC等位基因H 呈遞之呈遞可能性可以藉由合併隱式每一等位基因呈遞可能性並自總和中減去每對MHC等位基因將同時呈遞肽 pk 之可能性以產生肽序列 pk 會經MHC等位基因H 呈遞之呈遞可能性來產生。
舉例而言,在使用仿射轉變函數gh (∙)鑑別的m=4 種不同HLA等位基因中,肽 pk 會經HLA等位基因h=2h=3 呈遞之可能性可以藉由下式產生:, 其中 x2 k x3 k 為鑑別的有關HLA等位基因h=2h=3 之等位基因相互作用變數,且 θ2 θ3 為測定的有關HLA等位基因h=2h=3 之參數集。
作為另一實例,在使用網路轉變函數gh (∙)、gw (∙)鑑別的m = 4 種不同HLA等位基因當中,肽 pk 會經HLA等位基因h = 2h = 3 呈遞之可能性可以藉由下式產生:, 其中NN2 (∙)、NN3 (∙)為所鑑別的有關HLA等位基因h = 2h = 3 之網路模型,且 θ2 θ3 為測定的有關HLA等位基因h = 2h = 3 之參數集。 IX. 實例5:預測模組
預測模組320接收序列資料且使用呈遞模型選擇序列資料中之候選新抗原。具體言之,序列資料可以為自患者之腫瘤組織細胞提取的DNA序列、RNA序列及/或蛋白質序列。預測模組320將序列資料處理成複數個肽序列 pk ,該等肽序列具有8-15個胺基酸(對於MHC-I)或6-30個胺基酸(對於MHC-II)。舉例而言,預測模組320可以將給定序列「IEFROEIFJEF(SEQ ID NO: 16)」處理成三個具有9個胺基酸之肽序列,即「IEFROEIFJ(SEQ ID NO: 17)」、「EFROEIFJE(SEQ ID NO: 18)」及「FROEIFJEF(SEQ ID NO: 19)」。在一個實施例中,預測模組320可以藉由將自患者之正常組織細胞提取的序列資料與自患者之腫瘤組織細胞提取的序列資料相比較以鑑別含有一或多個突變之部分,由此鑑別出呈突變肽序列之新抗原。
預測模組320將一或多個呈遞模型應用於經處理之肽序列以估計該等肽序列之呈遞可能性。具體言之,預測模組320可以藉由將呈遞模型應用於候選新抗原來選擇可能在腫瘤HLA分子上呈遞之一或多個候選新抗原肽序列。在一個實施方案中,預測模組320選擇估計呈遞可能性高於預定臨限值之候選新抗原序列。在另一實施方案中,呈遞模型選擇具有最高估計呈遞可能性之v 個候選新抗原序列(其中v 一般為可以在疫苗中遞送的最大抗原決定基數目)。可將包括選擇用於給定患者之候選新抗原的疫苗注射至患者體內以誘導免疫反應。 X.實例6:患者選擇模組
基於患者是否滿足納入標準,患者選擇模組324選擇用於疫苗治療及/或T細胞療法之患者子集。在一個實施例中,納入標準係基於如由呈遞模型所產生之患者新抗原候選者的呈遞可能性而判定。藉由調整納入標準,基於他或她之新抗原候選者之呈遞可能性,患者選擇模組324可調整將接受疫苗及/或T細胞療法之患者的數目。具體言之,嚴格的納入標準產生較少數目的將用疫苗及/或T細胞療法治療之患者,但可產生較高比例的接受有效治療(例如1或多個腫瘤特異性新抗原(TSNA)及/或1或多個新抗原反應性T細胞)的疫苗及/或T細胞療法治療的患者。另一方面,寬鬆的納入標準產生較大數目的將用疫苗及/或T細胞療法治療之患者,但可產生較低比例的接受有效治療的疫苗及/或T細胞療法治療的患者。患者選擇模組324基於將接受治療之患者之目標比例與接受有效治療之患者之比例之間的期望平衡來調節納入標準。
在一些實施例中,選擇接受疫苗治療之患者的納入標準與選擇接受T細胞療法之患者的納入標準相同。然而,在替代實施例中,選擇接受疫苗治療之患者的納入標準可不同於選擇接受T細胞療法之患者的納入標準。以下X.A及X.B部分分別論述選擇接受疫苗治療之患者的納入標準及選擇接受T細胞療法之患者的納入標準。 X.A.針對疫苗治療的患者選擇
在一個實施例中,患者與可潛在地包括於患者之具有疫苗能力v 定製疫苗中的v 新抗原候選者的對應治療子集相關。在一個實施例中,患者之治療子集為具有最高呈遞可能性的新抗原候選者,如藉由呈遞模型所測定。舉例而言,若疫苗可包括v =20抗原決定基,則疫苗可包括具有最高呈遞可能性之各患者的治療子集,如藉由呈遞模型所測定。然而,應理解,在其他實施例中,患者之治療子集可基於其他方法而判定。舉例而言,患者之治療子集可隨機地選自患者之新抗原候選者集合,或可部分地基於以下來判定:使肽序列之結合親和力或穩定性模型化的目前先進技術模型,或包括來自呈遞模型之呈遞可能性及關於彼等肽序列之親和力或穩定性資訊的一些因素組合。
在一個實施例中,若患者之腫瘤突變負荷等於或大於最小突變負荷,則患者選擇模組324判定患者滿足納入標準。患者之腫瘤突變負荷(TMB)指示腫瘤外顯子組中之非同義突變之總數目。在一個實施中,若患者之TMB之絕對數等於或大於預定臨限值,則患者選擇模組324可選擇患者以用於疫苗治療。在另一實施方案中,若患者之TMB在針對患者集合所測定之TMB的臨限值百分點內,則患者選擇模組324可選擇患者以用於疫苗治療。
在另一實施例中,若基於患者之治療子集之患者的效用評分等於或大於最小效用評分,則患者選擇模組324判定患者滿足納入標準。在一個實施中,效用評分為自治療子集之經呈遞新抗原的所估計數目的量測。
經呈遞新抗原的所估計數目可藉由使新抗原呈遞模型化為一或多個機率分佈的隨機變數來預測。在一個實施中,患者i 之效用評分為自治療子集或其一些函數之經呈遞新抗原候選者的預期數目。作為一實例,各新抗原之呈遞可模型化為Bernoulli隨機變數,其中呈遞(成功)之機率藉由新抗原候選者之呈遞可能性來給出。具體言之,對於v 個新抗原候選項 pi1 , pi2 , , piv 之治療子集Si ,各自具有最高呈遞可能性ui1 ,ui2 ,…,uiv ,新抗原候選者 pij 之呈遞藉由隨機變數Aij 來給出,其中:。 (24) 經呈遞新抗原之預期數目藉由對各新抗原候選者之呈遞可能性進行求和來給出。換言之,患者i 之效用評分可表示為:。(25) 患者選擇模組324選擇效用評分等於或大於最小疫苗治療效用之患者子集。
在另一實施方案中,患者i 之效用評分為將呈遞至少臨限數目個新抗原k 的機率。在一個例子中,將新抗原候選項之治療子集Si 中之經呈遞新抗原的數目模型化為Poisson二項隨機變數,其中呈遞(成功)之機率藉由抗原決定基中之每一者的呈遞可能性來給出。具體言之,患者i 之經呈遞新抗原之數目可藉由隨機變數Ni 來給出,其中:。(26) 其中PBD(∙)表示Poisson二項分佈。將呈遞至少臨限數目個新抗原k 之機率藉由隊經呈遞新抗原Ni 之數目將等於或大於k 的機率進行求和來給出。換言之,患者i 之效用評分可表示為:。 (27) 患者選擇模組324選擇效用評分等於或大於最小疫苗治療效用之患者子集。
在另一實施方案中,患者i 之效用評分為新抗原候選項之治療子集Si 中針對患者之一或多個HLA等位基因的結合親和力或所預測結合親和力低於固定臨限值(例如500 nM)的新抗原的數目。在一個例子中,固定臨限值為1000 nM至10 nM之範圍。視情況,效用評分可僅計數經由RNA-seq偵測為經表現的彼等新抗原。
在另一實施方案中,患者i 之效用評分為新抗原候選項之治療子集Si 中針對患者之一或多個HLA等位基因的結合親和力等於或低於隨機肽針對等HLA等位基因之結合親和力的臨限值百分點的新抗原的數目。在一個例子中,臨限值百分點為10%至0.1%之範圍。視情況,效用評分可僅計數經由RNA-seq偵測為經表現的彼等新抗原。
應理解,產生關於等式(25)及(27)說明之效用評分之實例僅為說明性的,且患者選擇模組324可使用其他統計或機率分佈以產生效用評分。 X.B.針對T細胞療法之患者選擇
在另一實施例中,替代接受疫苗治療或除接受疫苗治療以外,患者可接受T細胞療法。如疫苗治療,在患者接收T細胞療法之實施例中,患者可能與如上文所描述之v 個新抗原候選者之對應治療子集相關聯。此v 個新抗原候選者之治療子集可用於活體外鑑別來自對該v 個新抗原候選者中之一或多者有反應之患者的T細胞。此等經鑑別T細胞隨後可進行擴增且輸注至患者中以進行定製T細胞療法。
患者可經選擇以在兩個不同時間點接受T細胞療法。第一點係在已使用模型預測患者之v 個新抗原候選者之治療子集之後,但在活體外篩選對所預測的v 個新抗原候選者之治療子集具有特異性的T細胞之前。第二點係在活體外篩選對所預測的v 個新抗原候選者之治療子集具有特異性的T細胞之後。
首先,患者可經選擇,以在已預測患者之v 個新抗原候選者之治療子集之後,但在活體外鑑別來自患者之對所預測的v 個新抗原候選者之治療子集具有特異性的T細胞之前,接受T細胞療法。具體言之,因為活體外篩選來自患者之新抗原特異性T細胞可能為昂貴的,所以可能需要當患者可能具有新抗原特異性T細胞時僅選擇患者來篩選新抗原特異性T細胞。為了在活體外T細胞篩選步驟之前選擇患者,可使用用來選擇進行疫苗治療之患者的相同標準。具體言之,在一些實施例中,當患者之腫瘤突變負荷等於或大於如上文所描述之最小突變負荷時,患者選擇模組324可選擇該患者來接受T細胞療法。在另一實施例中,當基於患者之v 個新抗原候選者之治療子集的患者之效用評分等於或大於如上文所描述的最小效用評分時,患者選擇模組324可選擇該患者來接受T細胞療法。
其次,除在活體外鑑別來自患者之對所預測的v 個新抗原候選者之子集具有特異性的T細胞之前,選擇接受T細胞療法的患者以外或代替此,患者亦可經選擇以在活體外鑑別對所預測的v 個新抗原候選者之治療子集具有特異性的T細胞之後,接受T細胞療法。具體言之,當在活體外篩選用於新抗原識別之患者T細胞期間鑑別患者的至少臨限值數量的新抗原特異性TCR時,患者可經選擇來接受T細胞療法。舉例而言,僅當鑑別患者的至少兩個新抗原特異性TCR時,或僅當鑑別兩個不同新抗原的新抗原特異性TCR時,患者可經選擇來接受T細胞療法。
在另一實施例中,僅當患者之v 個新抗原候選者之治療子集的至少臨限值數量的新抗原被患者之TCR識別時,患者可經選擇以接受T細胞療法。舉例而言,僅當患者之v 個新抗原候選者之治療子集的至少一個新抗原被患者之TCR識別時,患者可經選擇以接受T細胞療法。在其他實施例中,僅當患者之至少臨限值數量的TCR鑑別為對特定HLA限制類別之新抗原肽具有特異性的新抗原時,患者可經選擇以接受T細胞療法。舉例而言,僅當患者之至少一個TCR鑑別為新抗原特異性的HLA I類受限新抗原肽時,患者可經選擇以接受T細胞療法。
在甚至其他實施例中,僅當特定HLA限制類別之至少臨限值數量的新抗原肽由患者之TCR識別時,患者可經選擇以接受T細胞療法。舉例而言,僅當至少一個HLA I類受限新抗原肽由患者之TCR識別時,患者可經選擇以接受T細胞療法。作為另一實例,僅至少兩個HLA II類受限新抗原肽由患者之TCR識別當時,患者可經選擇以接受T細胞療法。亦可使用以上標準之任何組合來選擇,在活體外鑑別對患者之所預測的v 個新抗原候選者之治療子集具有特異性的T細胞之後,接受T細胞療法的患者。 XI.實例7:展示實例患者選擇效能之實驗結果
藉由在模擬患者之集合上執行患者選擇,來測試X部分中描述之患者選擇方法的有效性,該等模擬患者各自與模擬新抗原候選者之測試集相關聯,其中在質譜資料中已知模擬新抗原之子集被呈遞。具體言之,測試集中之各模擬新抗原候選者與標記相關聯,該標記指示該新抗原是否存在於來自Bassani-Sternberg資料集(資料集「D1」) (資料可在www.ebi.ac.uk/pride/archive/projects/PXD0000394處找到)之多等位基因JY細胞株HLA-A*02:01及HLA-B*07:02質譜資料集中。如下文結合圖13A更詳細地描述,基於非小細胞肺癌(NSCLC)患者中之已知突變負荷頻率分佈,自人類蛋白質組取樣模擬患者的多個新抗原候選者。
使用訓練集來訓練相同HLA等位基因的每一等位基因呈遞模型,該訓練集為來自IEDB資料集(資料集「D2」) (資料可在http://www.iedb.org/doc/mhc_ligand_full.zip處找到)之單一等位基因HLA-A*02:01及HLA-B*07:02質譜資料之子集。具體言之,各等位基因之呈遞模型為等式(8)中展示之每一等位基因模型,其併入N端及C端側接序列作為等位基因非相互作用變數,利用網路依賴性函數gh ( )gw ( ) 及expit函數f ( ) 。假定肽序列作為等位基因相互作用變數,且N端及C端側接序列作為等位基因非相互作用變數,則等位基因HLA-A*02:01之呈遞模型產生既定肽將會呈遞在等位基因HLA-A*02:01上的呈遞可能性。假定肽序列作為等位基因相互作用變數,且N端及C端側接序列作為等位基因非相互作用變數,則等位基因HLA-B*07:02之呈遞模型產生既定肽將會呈遞在等位基因HLA-B*07:02上的呈遞可能性。
如在以下實例及參考圖13A-13E所示,將各種模型(諸如訓練呈遞模型及肽結合預測之目前先進技術模型)應用於各模擬患者之新抗原候選者之測試集,以基於預測鑑別患者的不同治療子集。選擇滿足納入標準之患者來進行疫苗治療,且該等患者與定製疫苗相關聯,該等定製疫苗包括患者之治療子集中之抗原決定基。治療子集之大小根據不同疫苗能力而變化。在用於訓練呈遞模型之訓練集與模擬新抗原候選者之測試集之間不引入重疊。
在以下實例中,分析在包括於疫苗中之抗原決定基中具有至少某些數目之經呈遞新抗原之經選擇之患者的比例。此統計量指示模擬疫苗遞送將在患者體內引起免疫反應之潛在新抗原的效果。具體言之,當新抗原存在於質譜資料集D2中時,測試集中之模擬新抗原被呈遞。大比例的具有經呈遞新抗原之患者指示經由新抗原疫苗藉由誘導免疫反應成功治療的潛能。 XI.A.實例7A:NSCLC癌症患者之突變負荷頻率分佈
圖13A說明NSCLC患者中之突變負荷之樣本頻率分佈。可例如在癌症基因組圖譜(cancer genome atlas,TCGA) (https://cancergenome.nih.gov)處找到不同腫瘤類型(包括NSCLC)之突變負荷及突變。x軸表示各患者中之非同義突變的數目,且y軸表示具有給定數目之非同義突變之樣本患者的比例。圖13A中的樣本頻率分佈展示3-1786個突變之範圍,其中30%之患者具有少於100個突變。儘管圖13A中未展示,但研究指示相較於非吸菸者,突變負荷在吸菸者中更高,及突變負荷可能為患者中之新抗原負載的強力指標。
如以上XI部分開頭所介紹的,多個模擬患者中之每一者與新抗原候選者之測試集相關。藉由自展示於圖13A中各患者之頻率分佈取樣突變負荷mi 來產生各患者的測試集。對於各突變,隨機選擇來自人類蛋白質組的21-聚體肽序列,以表示模擬突變的序列。藉由跨越21-聚體中之突變鑑別各(8、9、10、11)-聚體肽序列,來產生患者i 之新抗原候選者序列的測試集。各新抗原候選者與指示質譜資料集D1中是否存在新抗原候選者序列的標記相關聯。舉例而言,存在於資料集D1中之新抗原候選者序列可能與標記「1」相關聯,而不存在於資料集D1中之序列可能與標記「0」相關聯。如下文更詳細地描述,圖13B至13E說明基於測試集中之患者之經呈遞新抗原,對於患者選擇的實驗結果。 XI.B.實例7B:基於突變負荷納入標準,具有新抗原呈遞之經選擇之患者的比例
圖13B說明基於患者是否滿足最小突變負荷之納入標準,經選擇之患者之模擬疫苗中之經呈遞新抗原的數目。鑑別在對應測試中具有至少某些數目之經呈遞新抗原之經選擇之患者的比例。
在圖13B中,x軸指示基於最小突變負荷,排除疫苗治療在外之患者的比例,如由標記「最小突變數目(minimum # of mutations)」指示。舉例而言,在200「最小突變數目」下之資料點指示患者選擇模組324僅選擇具有至少200個突變之突變負荷之模擬患者的子集。作為另一實例,在300「最小突變數目」下之資料點指示患者選擇模組324選擇較低比例的具有至少300個突變之模擬患者。y軸指示與測試集中無任何疫苗能力v 之至少某一數目之經呈遞新抗原相關的經選擇之患者的比例。具體言之,上方曲線展示呈遞至少1個新抗原之經選擇之患者的比例,中間曲線展示呈遞至少2個新抗原之經選擇之患者的比例,且下方曲線展示呈遞至少3個新抗原之經選擇之患者的比例。
如圖13B中所指示,具有經呈遞新抗原之經選擇之患者的比例隨著突變負荷增加而顯著地增加。此指示,突變負荷作為納入標準在選擇新抗原疫苗更可能誘導成功免疫反應之患者中可為有效的。 XI.C.實例7C:藉由呈遞模型鑑別之疫苗的新抗原呈遞與藉由目前先進技術模型鑑別之疫苗的新抗原呈遞的比較
圖13C比較以下兩者之間的模擬疫苗中之經呈遞新抗原的數目:基於呈遞模型鑑別之與疫苗相關之經選擇的患者(包括治療子集),與經由目前先進技術模型鑑別之與疫苗相關之經選擇的患者(包括治療子集)。左側曲線採取受限疫苗能力v =10,且右側曲線採取受限疫苗能力v = 20。基於指示預期數目之經呈遞新抗原之效用評分,來選擇患者。
在圖13C中,實線指示基於等位基因HLA-A*02:01及HLA-B*07:02之呈遞模型鑑別之與疫苗相關的患者(包括治療子集)。藉由將各呈遞模型應用於測試集中之序列,及鑑別具有最高呈遞可能性之v 個新抗原候選者,來鑑別各患者之治療子集。虛線指示基於單一等位基因HLA-A*02:01之目前先進技術模型NETMHCpan鑑別之與疫苗相關的患者(包括治療子集)。詳述NETMHCpan之實施方案在http://www.cbs.dtu.dk/services/NetMHCpan處詳細提供。藉由將NETMHCpan模型應用於測試集中之序列,及鑑別具有最高估計結合親和力之v 個新抗原候選者,來鑑別各患者的治療子集。兩個圖之x軸指示基於期望效用評分排除在疫苗治療外之患者的比例,該等期望效用評分指示基於呈遞模型鑑別之治療子集中之經呈遞新抗原的預期數目。如參考X部分中之等式(25)所描述來測定期望效用評分。y軸指示呈遞包括於疫苗中之至少某一數目之新抗原(1、2或3個新抗原)之經選擇之患者的比例。
如圖13C中所指示,基於呈遞模型與疫苗相關的患者(包括治療子集),比基於目前先進技術模型與疫苗相關的患者(包括治療子集)顯著更高的比率,接受含有經呈遞新抗原的疫苗。舉例而言,如右圖中所示,相較於基於目前先進技術模型與疫苗相關之經選擇之患者的僅40%,基於呈遞模型與疫苗相關之經選擇之患者的80%接受含至少一個經呈遞新抗原的疫苗中。結果指示,如本文所描述之呈遞模型對選擇可能引起免疫反應以治療腫瘤之疫苗的新抗原候選者有效。 XI.D.實例7D:HLA覆蓋對於經由呈遞模型鑑別之疫苗之新抗原呈遞的效果
圖13D比較以下兩者之間的模擬疫苗中的經呈遞新抗原的數目:基於HLA-A*02:01之每一等位基因呈遞模型鑑別之與疫苗相關的所選擇患者(其包括治療子集),與基於HLA-A*02:01及HLA-B*07:02之每一等位基因呈遞模型鑑別之與疫苗相關的所選擇患者(其包括治療子集)。將疫苗能力設定為v =20抗原決定基。對於各實驗,基於期望效用評分來選擇患者,該等期望效用評分基於不同治療子集而判定。
在圖13D中,實線指示基於HLA等位基因HLA-A*02:01及HLA-B*07:02之兩個呈遞模型,與疫苗相關的患者(包括治療子集)。藉由將各呈遞模型應用於測試集中之序列,及鑑別具有最高呈遞可能性之v 個新抗原候選者,來鑑別各患者之治療子集。虛線指示基於HLA等位基因HLA-A*02:01之單一呈遞模型,與疫苗相關的患者(包括治療子集)。藉由將僅單一HLA等位基因之呈遞模型應用於測試集中之序列,及鑑別具有最高呈遞可能性之v 個新抗原候選者,來鑑別各患者之治療子集。對於實線,x軸指示基於針對藉由兩個呈遞模型鑑別之治療子集之期望效用評分,排除在疫苗治療外之患者的比例。對於虛線,x軸指示基於針對藉由單一呈遞模型鑑別之治療子集之期望效用評分,排除在疫苗治療外之患者的比例。y軸指示呈遞至少某一數目之新抗原(1、2或3個新抗原)之經選擇之患者的比例。
如圖13D中所指示,藉由兩個HLA等位基因之呈遞模型鑑別之與疫苗相關的患者(包括治療子集),以比藉由單一呈遞模型鑑別之與疫苗相關的患者(包括治療子集)顯著更高個比率呈遞新抗原。結果指示建立具有高HLA等位基因覆蓋之呈遞模型的重要性。 XI.E.實例7E:藉由突變負荷選擇之患者的新抗原呈遞與經呈遞新抗原之預期數目的比較
圖13E比較基於突變負荷選擇之患者與藉由期望效用評分選擇之患者之間的模擬疫苗中之經呈遞新抗原的數目。期望效用評分係基於藉由呈遞模型鑑別之大小為v = 20 抗原決定基的治療子集而判定。
在圖13E中,實線指示與疫苗相關,基於期望效用評分選擇的患者,包括藉由呈遞模型鑑別之治療子集。藉由將呈遞模型應用於測試集中之序列,及鑑別具有最高呈遞可能性之v = 20 個新抗原候選者,來鑑別各患者之治療子集。期望效用評分係基於X部分中之等式(25),基於所鑑別之治療子集之呈遞可能性而判定。虛線指示基於與疫苗相關之突變負荷選擇的患者,亦包括藉由呈遞模型鑑別之治療子集。x軸指示基於期望效用評分(對於實線)排除在疫苗治療外之患者的比例,及基於突變負荷(虛線)所排除的患者的比例。y軸指示經選擇接受含有至少某一數目之經呈遞新抗原(1、2或3個新抗原)之疫苗的患者的比例。
如圖13E中所指示,基於期望效用評分選擇之患者,以比基於突變負荷選擇之患者更高的比率,接受含有經呈遞新抗原的疫苗。然而,基於突變負荷選擇之患者,以比未經選擇之患者更高的比率,接受含有經呈遞新抗原的疫苗。因此,突變負荷為成功新抗原疫苗治療的有效患者選擇標準,但期望效用評分更有效。 XII.實例8:質譜法訓練模型對於留存質譜資料之評估
因為藉由腫瘤細胞之HLA肽呈遞為抗腫瘤免疫的關鍵要求91 , 96 , 97 ,所以藉助於使用此等及公開可獲得的資料92 , 98 , 99 來訓練新穎深度學習模型100 來預測人類癌症中之抗原呈遞,來產生具有配對I類HLA肽序列、HLA類型及轉錄組RNA-seq(方法)之人類腫瘤及正常組織樣本的大型(N=74名患者)整合資料集。樣本選自所關注的用於免疫療法發展之數種腫瘤類型,且係基於組織可獲得性來選擇。在肽層級上,質譜法鑑別平均3,704個肽/樣本,FDR<0.1 (範圍344-11,301)。肽遵循特徵性I類HLA長度分佈:長度8-15個胺基酸,其中模態長度為9 (56%之肽)。與先前報導一致,預測大部分肽(中值79%)以標準500 nM親和力臨限值(藉由MHCflurry)結合至少一個患者HLA等位基因90 ,但在樣本中具有實質性變化(例如一個樣本中33%之肽具有>500 nM的預測親和性)。通常使用101 之50 nM之「強力結合劑」臨限值捕捉中值僅42%的經呈遞肽。轉錄組定序產生平均131M獨特讀段/樣本,且68%之基因在至少一個樣本中以至少1轉錄物/百萬(TPM)之含量表現,突顯大型及多種多樣的樣本集用於觀測最大基因數目之表現的價值。藉由HLA之肽呈遞很大程度上與mRNA表現相關。除可藉由單獨RNA表現或序列中之差異闡述的差異以外,在基因之間觀測到顯著及可再現的肽呈遞率上的差異。所觀測的HLA類型符合來自主要歐洲血統患者組的期望。
使用此等及公開可得的HLA肽資料92 , 98 , 99 ,訓練神經網路(NN)模型以預測HLA抗原呈遞。為了自腫瘤質譜資料學習等位基因特異性模型,其中各肽可已藉由六個HLA等位基因中之任一者呈遞,研發能夠聯合學習等位基因-肽定位及等位基因-特異性呈遞基元(方法)之新穎網路架構。對於各患者,陽性標記的資料點為經由質譜法偵測的肽,且陰性標記的資料點為來自參考蛋白質組之肽(SwissProt),在該樣本中未經由質譜法偵測到。將資料分成訓練、驗證及測試集(方法)。訓練集由來自101個樣本(69個為此研究中最新描述的且32個為先前公開的)之142,844個HLA呈遞肽(FDR<~0.02)組成。驗證集(用於早期終止)由來自相同101個樣本之18,004個呈遞肽組成。使用兩個質譜資料集來測試:(1)腫瘤樣品測試集,其由來自訓練資料之另外5個腫瘤樣本(2個肺、2個結腸、1個卵巢)的571個呈遞肽組成;及(2)單一等位基因細胞株測試集,其由來自鄰近於(但不同於)訓練資料中所包括之單一等位基因肽位置的基因組位置窗口(區塊)的2,128個呈遞肽組成(參見關於訓練/測試劃分的其他細節之方法)。
訓練資料鑑別53個HLA等位基因之預測模型。與先前研究92 , 104 不同的是,此等模型捕捉HLA呈遞對於多種長度肽的各序列位置的依賴性。此模型亦正確地學習對於基因RNA表現及基因特異性呈遞傾向的關鍵依賴性,其中mRNA豐度及學習的每一基因呈遞傾向獨立地組合,在最低表現、最小呈遞傾向及最高表現、最大呈遞傾向基因之間,產生多達~60倍差異的呈遞率。進一步觀測到,此模型預測所量測IEDB88 中HLA/肽複合物的穩定性(對於10個等位基因,p<1e-10),即使在控制所預測結合親和力之後(對於所測試的8/10等位基因,p<0.05)。共同地,此等特徵形成用於改良預測免疫原性HLA I類肽之基礎。
評估此NN模型作為HLA呈遞預測器對於留存質譜法測試集之效能,且與目前最新技術結合親和力預測器MHCFlurry90 (版本1.2.0,方法) (一種關於活體外HLA結合資料訓練的神經網路工具)比較。基於突顯mRNA水準對於HLA呈遞之重要性的先前報導,併入對於基因表現增加的臨限值,如RNA-seq81 , 92 , 103 所分析。
圖14A-D比較「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值之MHCFlurry 1.2.0結合親和力模型的預測效能。「全MS模型」及「肽MS模型」均為如上文所描述之關於質譜資料訓練的神經網路模型。然而,「全MS模型」係基於樣本之所有特徵來訓練及測試,而「肽MS模型」係僅基於樣本之HLA類型及肽序列來訓練及測試。測試MHCFlurry 1.2.0結合親和力模型之三個不同型式:基因表現臨限值為TPM > 0的MHCFlurry 1.2.0結合親和力模型,基因表現臨限值為TPM > 1的MHCFlurry 1.2.0結合親和力模型,及基因表現臨限值為TPM > 2的MHCFlurry 1.2.0結合親和力模型。因為「肽MS模型」及基因表現臨限值為TPM > 1之MHCFlurry 1.2.0結合親和力模型均為僅基於樣本之HLA類型及肽序列來訓練及測試,且兩個具有相同RNA表現臨限值,所以比較此等兩種模型之效能直接量化可歸因於自質譜法與結合親和力訓練資料學習的肽基元之差異的預測改良。
首先回到圖14A,圖14A比較針對「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,在40%召回下,當各模型在包含五個不同測試樣本之測試集上測試時的陽性預測值(PPV),各測試樣本包含經呈遞肽:非經呈遞肽之比率為1:2500的留存腫瘤樣本(方法)。圖14A亦描繪針對「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,在40%召回下,五個測試樣本的平均PPV。如圖14A中所展示,在40%召回下之平均PPV:對於「全MS模型」為0.54 ;及對於基因表現臨限值為TPM >2、1及0之MHCFlurry 1.2.0結合親和力模型分別為0.076、0.072與0.061。在p<1e-6下,「全MS模型」與基因表現臨限值為TPM > 0之MHCFlurry 1.2.0結合親和力模型之間的所有比較統計學上均顯著。
接下來轉到圖14B,圖14B比較針對「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,在40%召回下,當各模型在包含15個不同測試樣本之測試集上測試時的PPV,各測試樣本包含來自單一等位基因細胞株測試資料集、經呈遞肽:非經呈遞肽之比率為1:10,000的留存肽(方法)。圖14B亦描繪針對「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,在40%召回下,15個測試樣本的平均PPV。如圖14B中所展示,在40%召回下之平均PPV:對於「全MS模型」為0.37 ;及對於基因表現臨限值為TPM >2、1及0之MHCFlurry 1.2.0結合親和力模型分別為0.094、0.090與0.071。在p<1e-6下,除包含HLA-A*01:01之測試樣本以外,其係在p=1.6e-4下,「全MS模型」與基因表現臨限值為TPM > 0之MHCFlurry 1.2.0結合親和力模型間的所有比較統計學上均顯著。
圖16比較針對「全MS模型」及「僅錨殘基MS模型」,在40%召回下,當各模型在上文關於圖14A所描述之測試集上測試時的陽性預測值(PPV) (方法)。圖16亦描繪針對「全MS模型」及「僅錨殘基MS模型」,在40%召回下,五個測試樣本的平均PPV。類似於「全MS模型」,「僅錨殘基MS模型」為如上文所描述關於質譜資料訓練的神經網路模型。然而,並非基於樣本中之整個肽序列來訓練及測試「僅錨殘基MS模型」,「僅錨殘基MS模型」僅基於樣本之肽序列之「錨」殘基(第一個、第二個及最後一個殘基)來訓練及測試。因此,圖16中所描繪的結果量化錨及非錨殘基對於模型之預測效能的相對重要性。如圖16中所展示,「僅錨殘基MS模型」之效能相較於全MS模型實質上降低。相較於針對全MS模型在40%召回下之0.50的平均PPV,針對僅錨殘基MS模型之平均PPV為0.13。因此,可推論,利用肽序列之非錨殘基來訓練及測試模型使得模型之預測改良。
圖17A描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14A之測試樣本0上測試時的完全精確度-召回曲線(方法)。如圖17A中所展示,「全MS模型」及「肽MS模型」得到比具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型更佳的效能。
圖17B比較針對「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,在40%召回下,當各模型在包含15個不同測試樣本之測試集上測試時的PPV,各測試樣本包含經呈遞肽:非呈遞肽之比率為1:5,000的來自單一等位基因細胞株測試資料集的留存肽(方法)。圖17B亦描繪針對「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,在40%召回下,15個測試樣本的平均PPV。藉由比較圖14B (其中各測試樣本包含經呈遞肽:非經呈遞肽之比率為1:10,000的來自單一等位基因細胞株測試資料集的留存肽)之結果與圖17A (其中各測試樣本包含經呈遞肽:非經呈遞肽之比率為1:5,000的來自單一等位基因細胞株測試資料集的留存肽)之結果,可推論,肽呈遞之發生率很大程度上與絕對PPV相關。一般而言,所預測之事件(例如呈遞)的發生率越低,達成高PPV預測越困難。因此,降低(升高)測試資料中之發生率將降低(升高)所有模型的絕對PPV。然而,不同模型之PPV之間的相對差異不受期望測試集發生率之改變影響。
圖17C-G描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14A之測試樣本0-4上測試時的完全精確度-召回曲線(方法)。
圖17H-V描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在包含15個圖14B之不同測試樣本上測試時的完全精確度-召回曲線,各測試樣本包含來自單一等位基因細胞株測試資料集、經呈遞肽:非經呈遞肽之比率為1:10,000的留存肽(方法)。
圖18比較MS模型及在人類腫瘤中使HLA呈遞之肽104 模型化之先前方法之不同型式,在40%召回下,當各模型在圖14A之五個不同測試樣本上測試時的陽性預測值(PPV) (方法)。圖18亦描繪五個測試樣本之模型,在40%召回下的平均PPV。圖18中測試之模型包括「全MS模型」、「MS模型,無側接序列」、「MS模型,無側接序列或每一基因係數」、「僅肽MS模型,所有長度聯合地訓練」、「僅肽MS模型,所有長度分開地訓練」、「僅線性肽MS模型」、「MixMHCPred 1.1」模型及「結合親和力」模型。所有「全MS模型」、「MS模型,無側接序列」、「MS模型,無側接序列或每一基因係數」、「僅肽MS模型,所有長度聯合地訓練」、「僅肽MS模型,所有長度分開地訓練」及「僅線性肽MS模型」均為如上文所描述關於質譜資料訓練的神經網路模型。然而,各模型使用不同樣本之特徵來訓練及測試。「MixMHCPred 1.1」模型及「結合親和力」模型為使HLA呈遞之肽模型化的先前方法104
總體而言,NN模型達成HLA肽呈遞之預測顯著改良,其中在腫瘤測試集(圖14A)上PPV高於標準結合親和力+基因表現至多9倍,及在單一等位基因資料集(圖14B)上PPV高至多5倍。基於MS之NN模型之大的PPV優勢在所有各種召回臨限值中保持(圖17A),且統計學上顯著(對於圖14A及14B中之所有腫瘤及單一等位基因樣本,p<10- 6 ,除HLA-A*01:01外,其為p=1.6e-4)。HLA肽呈遞之標準結合親和力+基因表現之陽性預測值達到低至6%,符合先前估計87 , 93 。然而值得注意的是,此~6% PPV仍表示高於基線發生率>100倍富集,因為僅小比例之肽偵測為經呈遞(例如在腫瘤MS測試資料集中,~1/2500)。
藉由比較僅使用HLA類型及肽序列作為輸入(「肽MS模型」,圖14A-B;參見方法)、關於質譜資料訓練的消減模型與全MS模型,測定到,相對於結合親和力預測PPV增加之~30%係來自肽非本徵特徵(RNA豐度、側接序列、每一基因係數) (其可用質譜法而非結合親和力分析捕捉)的模型化(圖14A-B;亦參見圖17A及18)。增加之另外~70%係來自使肽序列之模型化改良(圖14A-B)。其不僅為訓練資料集(HLA呈遞之肽)之性質、而且為引起效能改良之總體模型架構,同樣其亦勝過使人類腫瘤中之HLA呈遞之肽模型化的先前方法104 (圖18)。新模型架構使得能夠經由端對端訓練過程來學習等位基因特異性模型,該訓練過程並不需要使用結合親和力預測或硬群集方法104 - 106 事先將肽指定至傳說的呈遞等位基因。重要的是,其亦避免對於等位基因特異性子模型施加準確度降低限制來作為去卷積(諸如線性)或獨立考慮各肽長度104 的前提條件。全模型勝過數種簡化模型及施加此等限制之先前公開方法(圖18)。
圖18說明數種簡化模型對於MS測試集的效能。藉由一次移除一個模型化改良及測試對於MS測試集之預測效能,來量化併入於全模型中之模型化改良之相對重要性。另外,將本文所揭示之呈遞模型與使自質譜法溶離肽模型化之近年來公開的方法(MixMHCPred)進行比較。僅9及10聚體用於比較,此係因為MixMHCPred目前並不使使除9及10以外之長度的肽模型化。模型(自左至右)為:「全MS模型」,方法中描述之全NN模型;「MS模型,無側接序列」,除移除側接序列特徵外,其與全NN模型一致;「MS模型,無側接序列或每一基因係數」,除移除側接序列及每一基因係數特徵外,其與全NN模型一致;「僅肽MS模型,所有長度聯合地訓練」,除唯一使用特徵為肽序列及HLA類型外,其與全NN模型一致;「僅肽MS模型,各長度分開地訓練」,對於此模型,除訓練9及10聚體之獨立模型外,模型結構與僅肽MS模型相同;「僅線性肽MS模型(利用集合)」,除使用神經網路(使用藉由與全模型中使用及方法中所描述相同的最佳化步驟訓練的線性模型集合)代替模型化肽序列外,其與分開地訓練各肽長度之僅肽MS模型一致;「MixMHCPred 1.1」,其為在預設設定情況下之MixMHCPred;「結合親和力」,其為如正文中之MHCflurry 1.2.0。最後5個模型(「僅肽MS模型,所有長度聯合地訓練」至「結合親和力」)具有相同的輸入:僅肽序列及HLA類型。特定言之,最後5個模型中無一者使用RNA豐度來進行預測。最佳執行的僅肽模型(「僅肽MS模型,所有長度聯合地訓練」)在40%召回下達成0.41的平均PPV,而關於質譜資料訓練之最差執行的僅肽模型(「僅線性肽MS模型(利用集合)」)達成僅28%的平均PPV (僅稍微高於MixMHCpred在18%下的平均PPV),突顯肽序列之NN模型化改良的價值。應注意,相較於僅線性肽MS模型,關於不同資料來訓練MixMHCpred,但具有許多相同的模型化特徵(例如其為線性模型,其中分開地訓練各肽長度的模型)。 XIII.實例9:回溯性新抗原T細胞資料之模型評價
隨後,吾等評價HLA肽呈遞之此精確預測是否轉換為鑑別人類腫瘤CD8T細胞抗原決定基(亦即免疫療法靶標)的能力。用於此評價之適當測試資料集包括由T細胞識別且由HLA呈遞在腫瘤細胞表面上的肽。另外,正式效能評定不僅需要陽性標記的(亦即T細胞識別的)肽,而且需要足夠數目之陰性標記的(亦即測試但不識別的)肽。質譜資料集處理腫瘤呈遞但不處理T細胞識別;相對地,在疫苗接種後之誘發或T細胞分析處理T細胞前體之存在及T細胞識別但不處理腫瘤呈遞。舉例而言,強力HLA結合肽(其源基因在腫瘤中以低含量表現)可在免疫接種後引起強力CD8 T細胞反應,此將為治療不適用的,因為該肽不被腫瘤呈遞。
為了獲得適當資料集,自滿足所需標準的4個近期研究收集公開的CD8 T細胞抗原決定基:研究A96 檢查患有腸胃腫瘤之9名患者的TIL,且藉由IFN-γ ELISPOT使用串聯小型基因(TMG)方法在自體樹突狀細胞(DC)中所測試,報導T細胞識別12/1,053體細胞SNV突變。研究B107 亦使用TMG,且報導由來自4名黑素瘤患者之CD8+PD-1+循環淋巴球T細胞識別6/574 SNV。研究C97 使用經脈衝肽刺激評定來自3名黑素瘤患者的TIL,且發現對5/381所測試的SNV突變有反應。研究D108 使用TMG分析與用最小抗原決定基肽脈衝之組合評定來自一名乳癌患者的TIL,且報導識別2/62 SNV。所合併資料集由來自17名患者之2,009個經分析SNV組成,包括具有預先存在T細胞反應的26個新抗原。重要的是,因為資料集很大程度上包含藉由腫瘤浸潤性淋巴球之新抗原識別,所以成功預測暗示不僅鑑別如先前文獻81 , 82 , 97 中能夠激活T細胞的新抗原而且更嚴格地藉由腫瘤呈遞至T細胞的新抗原的能力。
為了模擬選擇用於個人化免疫療法之抗原,使用「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,將體細胞突變按照呈遞機率之次序來排列。因為抗原特異性免疫療法技術上在靶向之特異性數目上受到限制(例如目前個人化疫苗編碼~10-20個體細胞突變80 - 82 ),藉由計數在具有至少一個預先存在T細胞反應之各患者的排名前5、10或20的體細胞突變中的預先存在T細胞反應的數目,來比較預測方法。此等結果描繪於圖14C中。具體言之,圖14C比較針對由「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型針對測試集鑑別之排名前5、10及20的體細胞突變,由T細胞識別(例如預先存在的T細胞反應)的體細胞突變的比例,該測試集包含12個不同測試樣本,各測試樣本取自具有至少一個預先存在的T細胞反應的患者。在p<0.005下,除排名前5之體細胞突變以外,其係在p=0.056下,「全MS模型」與基因表現臨限值為TPM > 0之MHCFlurry 1.2.0結合親和力模型間的所有比較統計學上均顯著。
如所預期,結合親和力預測僅包括優先排序的突變中之少數預先存在的T細胞反應,例如在TPM>0下,在排名前20之突變中總共26個中之9個(35%) (補充表1)。相比之下,藉由全MS模型,大部分(19/26,73%)之預先存在的T細胞反應排在前20,且優勢在不同排名及基因表現臨限值中保持(圖14C,補充表1)。在患者層級上,相較於在TPM>0下結合親和力模型的預先存在的平均新抗原T細胞反應僅0.69,對於全MS模型,具有至少一個預先存在的T細胞反應之13名患者的前20名預測突變中的平均預先存在的新抗原T細胞反應為1.54 (p=1.4e-4)。
隨後,吾等評價在最小新抗原決定基層級上的突變(亦即識別哪個8-11聚體重疊突變),此係由於可能適用於鑑別用於細胞療法的T細胞/TCR。換言之,使用「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,對最小新抗原決定基按照呈遞機率之次序排列。如上文所提及,由於抗原特異性免疫療法技術上在所靶向之特異性之數目上受限制,藉由計數具有至少一個預先存在T細胞反應之各患者的排名前5、10或20之最小新抗原決定基中之預先存在T細胞反應的數目,來比較預測方法。陽性標記的抗原決定基為經由基於肽之分析(替代的或除其以外,基於TMG之分析)確認為免疫原性最小抗原決定基的彼等抗原決定基,且陰性實例為在基於肽之分析中未識別的所有抗原決定基及未識別的小型基因中所含的所有突變跨越抗原決定基。結果描繪於圖14D中。
具體言之,圖14D比較針對由「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型針對測試集鑑別之排名前5、10及20的最小新抗原決定基,由T細胞識別(例如預先存在的T細胞反應)的最小新抗原決定基的比例,該測試集包含12個不同測試樣本,各測試樣本取自具有至少一個預先存在的T細胞反應的患者。在p<0.05下,除排名前5之最小新抗原決定基以外,其係在p=0.082下,「全MS模型」與基因表現臨限值為TPM > 0之MHCFlurry 1.2.0結合親和力模型間的所有比較統計學上均顯著。在所有圖中,誤差杠表示90%信賴區間。
如圖14D中所展示,NN模型由於在TPM>0下之結合親和力的優勢比圖14C中的甚至更明顯:多至少4倍的新抗原決定基包括於前方排名的最小抗原決定基中。值得注意的是,此比較偏向於對結合親和力預測有利,此係因為僅獨立地在研究A、B及D中測試具有強力結合親和力之肽。可能的係,存在以弱預測的HLA結合親和力T細胞識別的肽,該等肽從未在此等研究中進行分析,但應已由模型選擇。在此研究中觀測到此類肽,且在下文關於圖15A及補充表3詳細地論述。
儘管已知質譜法在偵測含有半胱氨酸之肽中有限制92 , 104 ,但NN模型在含半胱胺酸之T細胞識別抗原決定基上勝過結合親和力預測,3/7之含半胱胺酸之抗原決定基(43%)排在前5,相比較下,對於TPM>0基因表現臨限值之結合親和力,1/7的排在前5。如同質譜法測試集,可模型化而得到質譜法訓練資料(RNA、側接序列、每一基因係數)之額外特徵實質性地有助於增加預測效能;然而,如在質譜法測試資料中,僅肽MS模型之預測效能相對於結合親和力預測實質上改良,指示大部分改良係來自肽序列之模型化改良(圖14C-D,比較淺藍色條與綠色條)。
值得注意的是,觀測到此改良,而不管歸因於目前TIL分析之限制,可能的測試集新抗原決定基富集假陰性(亦即,由腫瘤呈遞之新抗原決定基能夠由T細胞識別,但未偵測到T細胞反應)。此等限制可包括:(a)免疫抑制的腫瘤微環境及低效T細胞誘發,(b)新抗原決定基反應性T細胞枯竭,(c)TIL生產除IFNg以外之細胞介素,及(d)所使用腫瘤級分中之異源性。因此,有可能的是,相對於其他情況,例如投與強效新抗原癌症疫苗,關於本文所描述之前5-20名之免疫原性肽的數目的絕對預測效能係悲觀的。 XIII.A.資料
吾等自Gros等人84 、Tran等人140 、Stronen等人141 及Zacharakis等人之補充資訊獲得突變調用、HLA類型及T細胞識別資料。無法獲得患者特異性RNA-seq資料。推理,腫瘤RNA表現在具有相同腫瘤類型之不同患者上係相關的,取代來自TCGA之來自腫瘤類型匹配的患者的RNA-seq資料,該資料用於神經網路預測及在結合親和力預測之前在TPM>1下的RNA表現過濾中。添加腫瘤類型匹配的RNA-seq資料改良預測效能(圖14C-D)。
對於突變水準分析(圖14C),在TMG分析或最小抗原決定基肽脈衝分析兩者中,Gros等人、Tran等人及Zacharakis等人之陽性標記的資料點為由患者T細胞識別的突變。陰性標記的資料點為在TMG分析中測試之所有其他突變。對於Stronen等人,陽性標記的突變為由至少一個經識別肽跨越的突變,且陰性資料點為經測試但在四聚體分析中未識別的所有突變。對於Gros、Tran及Zacharakis資料,當突變的25聚體TMG分析測試跨越突變之所有肽的T細胞識別時,藉由對呈遞機率求和或在所有跨越突變之肽中採用最小結合親和力來對突變排列。對於Stronen資料,藉由對呈遞機率求和或在四聚體分析中測試之所有跨越突變之肽中採用最小結合親和力來對突變排列。突變及特徵之完全清單可在補充表1中獲得。
對於抗原決定基水準分析,陽性標記的資料點為在肽脈衝或四聚體分析中由患者T細胞識別之所有最小抗原決定基,且陰性資料點為在肽脈衝或四聚體分析中未由T細胞識別的所有最小抗原決定基及來自所測試TMG之未由患者T細胞識別的所有跨越突變的肽。在Gros等人、Tran等人及Zacharakis等人之情況下,自分析移除在TMG分析中識別的未經由肽脈衝分析測試的跨越突變的最小抗原決定基肽,此係因為此等肽之T細胞識別情況未以實驗方式測定。 XIV.實例10:癌症患者中之新抗原反應性T細胞的鑑別
此實例表明,預測改良可使得能夠自常規患者樣本進行新抗原鑑別。為了達成此,分析來自具有轉移性NSCLC經歷抗PD(L)1療法之9名患者的存檔FFPE腫瘤切片及5-30ml周邊血液(補充表2:圖15A-C中研究之N=9患者的患者人口統計資料及治療資訊。關鍵領域包括腫瘤階段及亞型、所接受的抗PD1療法及NGS結果之概述。)。腫瘤全外顯子組定序、腫瘤轉錄組定序及匹配的正常外顯子組定序引起平均198個體細胞突變/患者(SNV及短插入或缺失),其中平均118個經表現(方法,補充表2)。將全MS模型應用於每患者之優先排序的20個新抗原決定基,以測試預先存在的抗腫瘤T細胞反應。為了將分析聚焦於可能的CD8反應,將優先排序的肽合成為8-11聚體最小抗原決定基(方法),且隨後將周邊血液單核細胞(PBMC)與合成的肽在活體外刺激(IVS)培養基短暫培養,以擴增新抗原反應性T細胞(補充表3)。在兩周之後,使用針對優先排序的新抗原決定基之IFN-γ ELISpot,來評定抗原特異性T細胞之存在。在可獲得足夠PBMC之七名患者中,亦進行獨立實驗以完全或部分地對所識別的特異性抗原進行去卷積。結果描繪於圖15A-C及19A-22中。
圖15A描繪對於九名患者之患者特異性新抗原肽庫的T細胞反應的偵測。對於各患者,各自根據模型排行及任何序列同源性(同源肽分開至不同庫中),將所預測新抗原合併成具有10個肽之2個庫。隨後,對於各患者,在IFN-γ ELISpot中,用2個患者特異性新抗原肽庫來刺激患者之活體外擴增的PBMC。圖15A中的資料呈現為減去背景(對應DMSO陰性對照)的點形成單位(SFU)/105 個塗鋪細胞。背景量測(DMSO陰性對照)展示於圖22中。展示患者1-038-001、1-050-001、1-001-002、CU04、1-024-001、1-024-002及CU05之單一孔(患者1-038-001、CU02、CU03及1-050-001)或重複(具有平均值及標準差) (所有其他患者)針對1號及2號同源肽庫的反應。對於患者CU02及CU03,細胞數目僅允許測試特異性肽1號庫。值高於背景>2倍增加的樣本認為為陽性的,且用星形指示(反應性供體包括患者1-038-001、CU04、1-024-001、1-024-002及CU02)。無反應的供體包括患者1-050-001、1-001-002、CU05及CU03。圖15C描繪ELISpot孔的像片,該等孔利用來自患者CU04之活體外擴增的PBMC,在IFN-γ ELISpot中用DMSO陰性對照、PHA陽性對照、CU04-特異性新抗原肽1號庫、CU04-特異性肽1、CU04特異性肽6及CU04特異性肽8刺激。
圖19A-B描繪利用HLA匹配的健康供體中之患者新抗原的對照實驗的結果。此等實驗之結果驗證,活體外培養條件僅擴增預先存在的活體內誘發的記憶T細胞,而不能夠從頭在活體外誘發。
圖20描繪對於各供體之PHA陽性對照及圖15A中所描繪的各活體外擴增之T細胞反應的偵測。對於圖15A中的各供體及各活體外擴增,為了最大T細胞活化,用PHA來刺激活體外擴增的患者PBMC。圖20中的資料呈現為減去背景(對應DMSO陰性對照)之點形成單位(SFU)/105 個塗鋪細胞。展示患者1-038-001、1-050-001、1-001-002、CU04、1-024-001, 、1-024-002、CU05及CU03之單一孔或生物學重複之反應。患者CU02不進行利用PHA之測試。分析中包括來自患者CU02之細胞,作為針對1號肽庫、指示活的及功能性T細胞的陽性反應(圖15A)。如圖15A中所展示,對肽庫有反應之供體包括患者1-038-001、CU04、1-024-001及1-024-002。如亦展示於圖15A中,對肽庫無反應的供體包括患者1-050-001、1-001-002、CU05及CU03。
圖21A描繪對於患者CU04之2號庫中之各個別患者特異性新抗原肽之T細胞反應的偵測。圖21A亦描繪患者CU04之對於PHA陽性對照之T細胞反應的偵測。(此為亦展示於圖20中之陽性對照資料。) 對於患者CU04,在IFN-γ ELISpot中,用來自患者CU04之2號庫之患者特異性個別新抗原肽來刺激患者的活體外擴增的PBMC。在IFN-γ ELISpot中,亦用作為陽性對照之PHA來刺激患者之活體外擴增的PBMC。資料呈現為減去背景(對應DMSO陰性對照)之點形成單位(SFU)/105 個塗鋪細胞。
圖21B描繪對於三次患者CU04問診中之每一者及兩次患者1-024-002問診中之每一者的個別患者特異性新抗原肽的T細胞反應的偵測,各問診發生在不同時間點時。對於兩個患者,在IFN-γ ELISpot中,用患者特異性個別新抗原肽來刺激患者之活體外擴增的PBMC。對於各患者,各問診之資料呈現為減去背景(對應DMSO對照)之累積(相加)點形成單位(SFU)/105 個塗鋪細胞。患者CU04之資料展示為3次問診之減去背景的累積SFU。對於患者CU04,展示初次問診(T0)及初次問診(T0)後之隨後2個月(T0 + 2個月)問診及14個月(T0 + 14個月)問診的減去背景之SFU。患者1-024-002之資料展示為2次問診之減去背景的累積SFU。對於患者1-024-002,展示初次問診(T0)及初次問診(T0)後之隨後1個月問診(T0 + 1個月)的減去背景之SFU。值高於背景>2倍增加之樣本認為為陽性的,且用星形指示。
圖21C描繪對於個別患者特異性新抗原肽及對於兩次患者CU04問診中之每一者及兩次患者1-024-002問診中之每一者之患者特異性新抗原肽庫的T細胞反應的偵測,各問診發生在不同時間點時。對於兩個患者,在IFN-γ ELISpot中,用患者特異性個別新抗原肽以及用患者特異性新抗原肽庫來刺激患者之活體外擴增的PBMC。具體言之,對於患者CU04,在IFN-γ ELISpot中,用CU04特異性個別新抗原肽6及8以及用CU04特異性新抗原肽庫來刺激患者CU04之活體外擴增的PBMC;且對於患者1-024-002,在IFN-γ ELISpot中,用1-024-002特異性個別新抗原肽16以及用1-024-002特異性新抗原肽庫來刺激患者1-024-002之活體外擴增的PBMC。對於具有平均值及範圍之各技術性重複,圖21C之資料呈現為減去背景(對應DMSO對照)之點形成單位(SFU)/105 個塗鋪細胞。患者CU04之資料展示為2次問診之減去背景的SFU。對於患者CU04,展示初次問診(T0;技術性重複三次)及初次問診(T0)後在2個月時的隨後問診(T0 + 2個月;技術性重複三次)之減去背景的SFU。患者1-024-002之資料展示為2次問診之減去背景的SFU。對於患者1-024-002,展示初次問診(T0;技術性重複三次)及初次問診(T0)後1個月的隨後問診(T0 + 1個月;技術性重複兩次,除樣本用患者1-024-002-特異性新抗原肽庫來刺激以外)。
圖22描繪對於圖15A之患者之兩個患者特異性新抗原肽庫及對於DMSO陰性對照的T細胞反應的偵測。對於各患者,在IFN-γ ELISpot中,用兩個患者特異性新抗原肽庫來刺激患者之活體外擴增的PBMC。對於各供體及各活體外擴增,亦在IFN-γ ELISpot中,用作為陰性對照之DMSO來刺激活體外擴增的患者PBMC。圖22中的資料呈現為患者特異性新抗原肽庫及對應DMSO對照之加上背景(對應DMSO陰性對照)之點形成單位(SFU)/105 個塗鋪細胞。展示患者1-038-001、1-050-001、1-001-002、CU04、1-024-001、1-024-002及CU05之單一孔(患者1-038-001、CU02、CU03及1-050-001)針對同源肽庫1號及2號的反應或生物學重複之具有標準差的平均值(所有其他患者)。對於患者CU02及CU03,細胞數目僅允許測試特異性肽1號庫。值高於背景>2倍增加的樣本認為為陽性的,且用星形指示(反應性供體包括患者1-038-001、CU04、1-024-001、1-024-002及CU02)。無反應的供體包括患者1-050-001、1-001-002、CU05及CU03。
如以上關於圖19A-B所簡要地論述,為了驗證活體外培養條件僅擴增預先存在的活體內誘發的記憶T細胞,而不能夠從頭在活體外誘發,利用HLA匹配的健康供體中之新抗原來進行一系列對照實驗。此等實驗之結果描繪於圖19A-B中及補充表5中。此等實驗之結果確認在使用IVS培養技術之健康供體中不存在從頭誘發且不存在可偵測的新抗原特異性T細胞反應。
相比之下,在使用IFN-γ ELISpot、用患者特異性肽庫(圖15A及20-22)測試之大部分患者(5/9,56%)中,鑑別到預先存在的新抗原反應性T細胞。在細胞數目允許完全或部分地測試個別新抗原同源肽之7名患者中,4名患者對所測試新抗原肽中之至少一者有反應,且所有此等患者具有對應庫反應(圖15B)。用個別新抗原測試之剩餘3名患者(患者1-001-002、1-050-001及CU05)針對單一肽無可偵測的反應(資料未展示),確定在針對新抗原庫之此等患者中所見的無反應(圖15A)。在4名反應性患者中,具有反應之2名患者(患者1-024-001及1-038-001)之單一問診的樣本為可獲得的,而具有反應之另外2名患者(CU04及1-024-002)之多次問診的樣本為可獲得的。對於具有多次問診之樣本的2名患者,3次問診(患者CU04)或2次問診(患者1-024-002)之累積(相加)點形成單位(SFU)展示於圖15B中且由圖21B中的問診中斷。患者1-024-002及CU04之相同問診的額外PBMC樣本亦為可獲得的,且重複IVS培養及ELISpot確認對患者特異性新抗原有反應(圖21C)。
總之,在如所展示藉由對圖15A中之10個肽之庫有反應來鑑別至少一個T細胞識別的新抗原決定基的患者中,所識別的新抗原決定基之數目平均為至少2個/患者(5名患者中鑑別之10抗原決定基的最小值,計數可能不去卷積為1個所識別肽的經識別庫)。除藉由ELISpot測試IFN-γ反應以外,亦藉由ELISA測試培養上清液之顆粒酶B,及藉由MSD細胞介素多工分析測試培養上清液之TNF-α、IL-2及IL-5。來自陽性ELISpots之4/5患者的細胞分泌3種或更多種分析物(包括顆粒酶B) (補充表4),指示新抗原特異性T細胞之多功能性。重要的是,因為合併的預測及IVS方法並不依賴於可獲得的MHC多聚體之限制集合,所以在限制性HLA等位基因中廣泛地測試反應。此外,與串聯小型基因篩選(其鑑別經識別之突變)相比,此方法直接鑑別最小抗原決定基,且需要獨立去卷積步驟來鑑別最小抗原決定基。總之,新抗原鑑別產率與先前最佳方法96 相當,該等先前最佳方法用血球分離術樣本測試針對所有突變之TIL,同時用常規5-30 mL全血篩選僅20個合成肽。 XIV.A. 肽
訂製重組凍乾肽購自JPT Peptide Technologies (Berlin, Germany)或Genscript (Piscataway, NJ, USA),且在無菌DMSO (VWR International, Pittsburgh, PA, USA)中以10-50 mM復原,等分並儲存在-80℃下。 XIV.B.人類周邊血液單核細胞(PBMC)
低溫保存的來自健康供體(確認HIV、HCV及HBV血清陰性)之HLA分型的PBMC購自Precision for Medicine (Gladstone, NJ, USA)或Cellular Technology, Ltd. (Cleveland, OH, USA),且儲存於液氮中直至使用。新鮮血液樣本購自Research Blood Components (Boston, MA, USA),leukopak來自AllCells (Boston, MA, USA),且在低溫保存之前藉由Ficoll-Paque密度梯度(GE Healthcare Bio, Marlborough, MA, USA)來分離PBMC。在當地臨床處理中心根據當地臨床標準操作程序(SOP)及IRB批准方案來處理患者PBMC。批准IRBs為法定審核IRB、聖路易吉岡薩諾迪奧巴薩諾之國際關係委員會Comitato Etico Interaziendale A.O.U. San Luigi Gonzaga di Orbassano及Comité Ético de la Investigación del Grupo Hospitalario Quirón en Barcelona。
簡言之,PBMC經由密度梯度離心來分離,洗滌,計數且以5 × 106 個細胞/毫升低溫保存在CryoStor CS10 (STEMCELL Technologies, Vancouver, BC, V6A 1B6, Canada)中。在低溫孔中運送低溫保存的細胞,且進行轉移以在到達後儲存於LN2 中。患者人口統計資料列於補充表2中。將低溫保存的細胞解凍,且在OpTmizer具有Benzonase核酸酶之(EMD Millipore, Billerica, MA, USA)之T細胞擴增基本培養基(Gibco, Gaithersburg, MD, USA)中洗滌兩次,且一次在在Benzonase核酸酶的情況下。使用Guava ViaCount試劑及Guava easyCyte HT細胞計數器(EMD Millipore)上之模組來評定細胞計數及存活力。隨後,將細胞以各濃度再懸浮且再懸浮於適合於進行分析之培養基(參見下一部分)中。 XIV.C.活體外刺激(IVS)培養
在同源肽及IL-2存在下,以類似於Ott等人應用之方法,將來自健康供體或患者樣本之預先存在的T細胞擴增。81 簡言之,將經解凍的PBMC靜置隔夜,且在肽庫(10 µM/肽,10肽/庫)存在下在24孔組織培養盤中之具有10 IU/ml rhIL-2 (R&D Systems Inc., Minneapolis, MN)之ImmunoCult™-XF T細胞擴增培養基(STEMCELL Technologies)中刺激14天。以2 × 106 個細胞/孔接種細胞,且每2-3天藉由置換2/3之培養基來饋料。一個患者樣本展示與方案的偏差,且應視為可能假陰性:在解凍後患者CU03不產生足夠數量之細胞,且以2 × 105 個細胞/肽庫(每方案少10倍)接種細胞。 XIV.D.IFNγ酶聯免疫斑點(ELISpot)分析
藉由ELISpot分析142 來進行產生IFNγ之T細胞的偵測。簡言之,收集PBMC (離體或活體外擴增後),在不含血清之RPMI (VWR International)中洗滌,且在對照或同源肽存在下在OpTmizer T細胞擴增基本培養基(離體)中或在ImmunoCult™-XF T細胞擴增培養基(擴增培養基)中,在塗佈有抗-人類IFNγ捕捉抗體(Mabtech, Cincinatti, OH, USA)之ELISpot多螢幕培養盤(EMD Millipore)中培養。在5% CO2 、37℃含濕氣培育箱中培育18 h後,自培養盤移除細胞,且使用抗-人類IFNγ偵測抗體(Mabtech)、Vectastain抗生素蛋白過氧化酶複合物(Vector Labs, Burlingame, CA, USA)及AEC受質(BD Biosciences, San Jose, CA, USA)來偵測膜結合的IFNγ。使ELISpot培養盤乾燥,避光儲存且發送至Zellnet Consulting, Inc. (Fort Lee, NJ, USA)進行標準化評價143 。資料呈現為點形成單位(SFU)/塗鋪數目之細胞。 XIV.E.顆粒酶B ELISA及MSD多工分析
使用3工分析MSD U工生物標記分析(目錄號K15067L-2)來進行ELISpot上清液中之分泌性IL-2、IL-5及TNF-α的偵測。根據製造商之說明書來進行分析。使用各細胞介素之已知標準物的連續稀釋液來計算分析物濃度(pg/ml)。對於圖形資料表示,低於標準曲線之最小範圍的值表示為等於零。使用顆粒酶B DuoSet® ELISA (R & D Systems, Minneapolis, MN)根據製造商之說明書來進行ELISpot上清液中之顆粒酶B的偵測。簡言之,將ELISpot上清液以1:4稀釋於樣本稀釋劑中,且與顆粒酶B標準物之連續稀釋液在一起操作,以計算濃度(pg/ml)。對於圖形資料表示,低於標準曲線之最小範圍的值表示為等於零。 XIV.F.來自健康供體中測試之腫瘤細胞株之新抗原的IVS分析的陰性對照實驗
圖19A說明來自健康供體中測試之腫瘤細胞株之新抗原的IVS分析的陰性對照實驗。在IVS培養基中,用肽庫來刺激健康供體PBMC,該等肽庫含有陽性對照肽(先前暴露於傳染性疾病)、來源於腫瘤細胞株之HLA匹配的新抗原(未暴露)及來源於供體為血清陰性之病原體的肽。隨後,藉由IFNγ ELISpot (105 個細胞/孔),在用DMSO (陰性對照,黑色圓圈)、PHA及常見傳染性疾病肽(陽性對照,紅色圓圈)、新抗原(未暴露的,淺藍色圓圈)或HIV及HCV肽(供體確認為血清陰性,藏藍色,A及B)刺激後,來分析所擴增細胞。資料展示為點形成單位(SFU)/105 個接種細胞。展示具有平均值及SEM之生物重複。對於新抗原或對於來源於供體尚未暴露(血清陰性)於其之病原體的肽,未觀測到反應。 XIV.G.來自健康供體中測試之患者之新抗原的IVS分析的陰性對照實驗
圖19A說明來自健康供體中測試反應性之患者之新抗原的IVS分析的陰性對照實驗。評定健康供體中對於HLA匹配的新抗原肽庫的T細胞反應。左圖:在離體IFN-γ ELISpot中,用對照(DMSO、CEF及PHA)或HLA匹配的患者來源的新抗原肽,來刺激健康供體PBMC。資料呈現為重複三次的孔的點形成單位(SFU)/2 × 105 個塗鋪細胞。右圖:在IFN-γ ELISpot中,用對照(DMSO、CEF及PHA)或HLA匹配的患者來源的新抗原肽庫,來刺激IVS後在新抗原庫或CEF庫存在下擴增之健康供體PBMC。資料呈現為重複三次的孔的SFU/1 × 105 個塗鋪細胞。未看到對於健康供體中之新抗原的反應。 XIV.H.補充表3:NSCLC患者中之測試T細胞識別的肽
關於測試圖15A-C中研究之N=9患者的新抗原肽(鑑別來自NSCLC患者之新抗原反應性T細胞)的詳情。關鍵領域包括源突變、肽序列及庫以及觀測到的個別肽反應。「most_probable_restriction」欄指示哪個所預測之等位基因模型最可能呈遞各肽。亦包括此等肽在所有各患者之突變肽中的排名(如用結合親和力預測所計算) (方法)。
存在全MS模型高排名且由CD8 T細胞以低預測結合親和力識別或結合親和力預測低排名的四個肽。
對於此等肽中之三個,此係由模型與MHCflurry 1.2.0之間的HLA覆蓋差異引起的。預測肽YEHEDVKEA (SEQ ID NO: 20)將由不由MHCflurry 1.2.0覆蓋之HLA-B*49:01呈遞。類似地,預測肽SSAAAPFPL (SEQ ID NO: 21)及FVSTSDIKSM (SEQ ID NO: 22)將由亦不由MHCflurry 1.2.0覆蓋之HLA-C*03:04呈遞。線上NetMHCpan 4.0 (BA)預測器(一種泛特異性結合親和力預測器,其其原則上覆蓋所有等位基因)將SSAAAPFPL (SEQ ID NO: 21)排名為對於HLA-C*03:04的強力結合劑(23.2 nM,對於患者1-024-002,排名第2),預測FVSTSDIKSM (SEQ ID NO: 22)與HLA-C*03:04之弱結合(943.4 nM,對於患者1-024-002,排名第39)及YEHEDVKEA (SEQ ID NO: 20)與HLA-B*49:01之弱結合(3387.8 nM),但更強結合於HLA-B*41:01 (208.9 nM,對於患者1-038-001,排名第11),其亦在此患者中呈遞但未由模型覆蓋。因此,在此等三個肽中,FVSTSDIKSM (SEQ ID NO: 22)將由結合親和力預測遺漏,SSAAAPFPL (SEQ ID NO: 21)將已被捕捉,且YEHEDVKEA (SEQ ID NO: 20)之HLA限制性不明確。
將肽特異性T細胞反應去卷積之剩餘五個肽來自最可能呈遞等位基因的患者,如藉由亦由MHCflurry 1.2.0覆蓋之模型所測定。在此等五個肽中,4/5具有比標準500 nM臨限值更強的結合親和力,且排名前20,但排名略微低於該模型的排名 (肽DENITTIQF (SEQ ID NO: 23)、QDVSVQVER (SEQ ID NO: 24)、EVADAATLTM (SEQ ID NO: 25)、DTVEYPYTSF (SEQ ID NO: 26)的該模型排名分別為0、4、5、7,而MHCflurry排名為2、14、7及9)。肽GTKKDVDVLK (SEQ ID NO: 27)由CD8T細胞識別,且該模型排名第1,但MHCflurry排名第70且所預測結合親和力為2169 nM。
總之,6/8之獨立識別、全MS模型高排名的肽使用結合親和力預測亦有高排名,且具有<500 nM之預測結合親和力;而當使用結合親和力預測而非全MS模型時,將遺漏2/8之獨立識別的肽。 XIV.I.補充表4:對於來自NSCLC新抗原肽之ELISpot上清液的MSD細胞介素多工分析及ELISA分析
展示在來自陽性ELISpot (IFNγ)孔之上清液中偵測到之分析物的顆粒酶B (ELISA)、TNFα、IL-2及IL-5 (MSD)。值展示為技術性重複的平均pg/ml。陽性值(Positive value)以斜體展示。顆粒酶B ELISA:值高於DMSO背景≥1.5倍認為為陽性的。U工MSD分析:值高於DMSO背景≥1.5倍認為為陽性的 XIV.J.補充表5: IVS對照實驗中之新抗原及傳染性疾病抗原決定基
關於在IVS對照實驗中測試之腫瘤細胞株新抗原及病毒肽之詳情展示於圖19A-B中。關鍵領域包括源細胞株或病毒、肽序列及所預測的呈遞HLA等位基因。 XIV.K.資料
用於訓練及測試預測模型(圖14A-D)之MS肽資料集可在MassIVE Archive (massive.ucsd.edu)處獲得,登錄號MSV000082648。手稿中包括藉由ELISpot測試之新抗原肽(圖15A-C及19A-B) (補充表3及5)。 XV.實例8-10之方法 XV.A.質譜法 XV.A.1.樣品
用於質譜分析之經存檔冷凍組織樣品獲自市售來源,包括BioServe (Beltsville, MD)、ProteoGenex (Culver City, CA)、iSpecimen (Lexington, MA)及Indivumed (Hamburg, Germany)。亦在Hopital Marie Lannelongue (Le Plessis-Robinson, France)處,根據經Comité de Protection des Personnes, Ile-de-France VII批准之研究方案,自患者預期地收集樣品子集。 XV.A.2.HLA免疫沈澱
在裂解及溶解組織樣本後,使用建立的免疫沈澱(IP)方法進行HLA-肽分子之分離87 , 124 - 126 。粉碎新鮮冷凍組織(CryoPrep; Covaris, Woburn, MA),添加裂解緩衝液(1%CHAPS,20 mM Tris-HCl,150 mM NaCl,蛋白酶及磷酸酶抑制劑,pH=8)以溶解組織,且在4℃下離心所得溶液2小時以使碎片集結(pellet)。澄清裂解物用於HLA特異性IP。如先前描述,使用抗體W6/32127 來進行免疫沈澱。將裂解物添加至抗體珠粒中且在4℃下旋轉隔夜以進行免疫沈澱。在免疫沈澱之後,自裂解物移除珠粒。洗滌IP珠粒以移除非特異性結合,且用2N乙酸自珠粒溶離出HLA/肽複合物。使用分子量旋轉管柱,自肽移除蛋白質組分。藉由SpeedVac蒸發,使所得肽乾燥,且在MS分析之前儲存在-20℃下。 XV.A.3.肽定序
在HPLC緩衝液A中復原乾燥肽,且裝載至C-18微毛細管HPLC管柱上以梯度溶離至質譜儀中。0-40% B (溶劑A,0.1%甲酸;溶劑B,含0.1%甲酸之80%乙腈)之梯度,180分鐘,用於將肽溶離至Fusion Lumos質譜儀(Thermo)中。在120,000解析度之軌道阱偵測器中收集肽質量/電荷(m/z)的MS1譜,隨後在所選擇離子之HCD片段化後在軌道阱或離子阱偵測器中收集20個MS2低解析度掃描。使用資料依賴型採集模式及在MS2選擇離子後之30秒動力學排除來進行MS2離子的選擇。MS1掃描之自動增益控制(AGC)設定成4 × 105 ,且MS2掃描設定成1 × 104 。對於定序HLA肽,可選擇+1、+2及+3電荷狀態以用於MS2片段化。
使用Comet128 , 129 對來自各分析之MS2譜進行蛋白質資料庫搜尋,且使用Percolator130 - 132 對肽鑑別進行評分。 XV.B.機器學習 XV.B.1.資料編碼
對於各樣本,訓練資料點為來自參考蛋白質組映射至在樣本中表現之精確地一個基因的所有8-11聚體(包括性)肽。藉由將來自各訓練樣本之訓練資料集串接來形成總訓練資料集。選擇8-11長度,慈禧因為此長度範圍捕獲~95%之所有HLA I類呈遞的肽;然而,可使用相同方法,以適當增加計算需求為代價,來實現向模型中添加長度12-15。使用獨熱編碼方案,來使肽及側接序列向量化。藉由用字符擴充胺基酸字母表及填充所有肽至最大長度11,將多個長度(8-11)之肽表示為固定長度的向量。訓練肽之源蛋白質之RNA豐度表示為同功異型物層級轉錄物/百萬(TPM)估計值(獲自RSEM133 )的對數。對於各肽,單個肽TPM計算為含有肽之同功異型物中之每一者之單個同功異型物TPM估計值的總和。在0 TPM下由基因表現之肽排除在訓練資料外,且在測試時間,指定自非表現基因之肽之呈遞機率為0。最後,將各肽指定為Ensembl蛋白家族ID,且各獨特Ensembl蛋白質家族ID對應於每一基因呈遞傾向截距(參見下一部分)。 XV.B.2.模型架構之規格
完全呈遞模型具有以下函數形式:( 等式 1) , 其中k 指出資料集中之HLA等位基因,其為1至m ;且為指示變數,當等位基因k 存在於肽i 來源的樣本中時,值為1,否則為0。應注意,對於既定肽i ,幾乎至多之6(6對應於肽i 來源之樣本的HLA類型)將為零。以(例如=)消減機率之總和。
如下模型化每一等位基因之呈遞機率:, 其中變數具有以下含義:為S型(亦稱為expit)函數;為獨熱編碼的中間填充的肽i 的胺基酸序列;為神經網路,其中線性最後一層活化使肽序列對於呈遞機率之作用模型化;為獨熱編碼的其源蛋白質中之肽i 的側接序列;為神經網路,其中線性最後一層活化使使側接序列對於呈遞機率之作用模型化;為肽i 之源mRNA的表現,其以TPM單位表示;為肽i 之來源的樣本(亦即患者);為單個樣本截距;為肽i 之源蛋白質;及為單個蛋白質截距(亦稱為每一基因呈遞傾向)。
對於結果部分中描述之模型,組分神經網路具有以下架構: ·中之每一者含一個隱藏層之多層感知器(MLP)之一個輸出節點,其具有輸入維度231 (11殘基×21可能字符/殘基,包括填充字符)、寬度256、隱藏層中之校正線性單元(ReLU)激活函數、輸出層中之線性激活函數及一個輸出節點/訓練資料集中之HLA等位基因a 。 ·為含一個隱藏層之MLP,其具有輸入維度210 (N端側接序列之5個殘基+C端側接序列之5個殘基×21個字符/殘基,包括填充字符)、寬度32、隱藏層中之校正線性單元(ReLU)激活函數及輸出層中之線性激活函數。 ·為含一個隱藏層之MLP,其具有輸入維度1、寬度16、隱藏層中之校正線性單元(ReLU)激活函數及輸出層中之線性激活函數。
應注意,模型中之一些組分(例如)視特定HLA等位基因而定,但許多組分()則不。前者被稱作「等位基因相互作用」,且後者被稱作「等位基因非相互作用」。基於生物學先驗知識來選擇模型化為等位基因相互作用或非相互作用的特徵:HLA等位基因看到肽,因此肽序列應模型化為等位基因相互作用,但沒有關於源蛋白質、RNA表現或側接序列之資訊傳送至HLA分子(因為在肽遇到內質網中之HLA時,其已與其源蛋白質間隔開),因此此等特徵應模型化為等位基因非相互作用。在Keras v2.0.4134 及Theano v0.9.0135 中實施模型。
肽MS模型使用與全MS模型(等式1)相同的去卷積步驟,但使用僅考慮肽序列及HLA等位基因之消減每一等位基因模型來產生每一等位基因呈遞機率:
肽MS模型使用與結合親和力預測相同的特徵,但模型之權重係關於不同資料類型(亦即質譜資料相對於HLA-肽結合親和力資料)來訓練。因此,比較肽MS模型與全MS模型之預測效能揭露非肽特徵(亦即RNA豐度、側接序列、基因ID)對於總體預測效能的作用;且比較肽MS模型與結合親和力模型之預測效能揭露肽序列之模型化改良對於總體預測效能的重要性。 XV.B.3.訓練/驗證/測試劃分
吾等使用以下程序來確保沒有肽存在於超過一個之訓練/驗證/測試集中:首先藉由自參考蛋白質組移除存在於超過一個蛋白質中之所有肽,隨後藉由將蛋白質組分割至具有10個相鄰肽的區塊中。各區塊獨特地指定為訓練、驗證或測試集。以此方式,沒有肽存在於超過一個之訓練、驗證或測試集中。驗證集僅用於早期終止。圖14A中之腫瘤樣本測試資料表示來自五個腫瘤樣本完全保持在訓練及驗證集外的測試集肽(亦即來自獨特地指定至測試集之相鄰肽的區塊的肽)。訓練資料中包括來自單一等位基因樣本之肽,但併入至訓練及驗證集中的肽集合(呈遞及非呈遞兩者)與用作圖14B中之測試資料之肽集合不相交。 XV.B.4.模型訓練
對於模型訓練,所有肽獨立地模型化,其中單個肽損失為負Bernoulli對數可能性損失函數(亦稱為對數損失)。正式地,肽i 對於總體損失之作用為, 其中為肽i 之標記;亦即當肽i 被呈遞時,,否則為0;且給出i.i.d.二進位觀測向量y表示參數之Bernoulli可能性。藉由使損失函數降至最低來訓練模型。
為了降低訓練時間,藉由隨機移除90%之陰性標記的訓練資料來調整類別平衡,產生一個呈遞肽/~2000非呈遞肽之總體訓練集類別平衡。使用Glorot均一程序61來初始化模型權重,且使用具有Nvidia Maxwell TITAN X GPUs上之標準參數的ADAM62隨機最佳化器來訓練。由10%之總資料組成之驗證集用於早期終止。每四分之一時期在驗證集上評價模型,且在首個四分之一時期(其中驗證損失(亦即關於驗證集之負Bernoulli對數可能性)未能降低)之後模型訓練終止。
完全呈遞模型為10個模型重複之集合,其中各重複用不同隨機初始化的集合內之每一模型的模型權重,關於同一訓練資料之混洗複本獨立地訓練。在測試時間,藉由採用模型重複之機率輸出的平均值來產生預測。 XV.B.5.基元標識
使用weblogolib Python API v3.5.0138 來產生基元標識。為了產生結合親和力標識,在2017年7月自免疫抗原決定基資料庫(Immune Epitope Database,IEDB88 )下載mhc_ligand_full.csv檔案,且保留滿足以下標準之肽:呈奈莫耳(nM)單位之量測、參考日期在2000之後、對象類型等於「線性肽」及肽中之所有殘基係取自典型20字母胺基酸字母表。使用所量測結合親和力低於常規結合臨限值500 nM之經過濾肽子集,來產生標識。對於在IEDB中具有過少結合劑之等位基因對,不產生標識。為了產生表示學習呈遞模型的標識,對於各等位基因及各肽長度,預測2,000,000個隨機肽的模型預測。對於各等位基因及各長度,使用學習呈遞模型排名前1% (亦即前20,000)之肽,來產生標識。重要的是,來自IEDB之此結合親和力資料不用於模型訓練或測試中,而是僅用於所學習之基元的比較。 XV.B.6.結合親和力預測
吾等使用來自MHCflurry v1.2.0139 之僅結合親和力預測器來預測肽-MHC結合親和力,該預測器為一種開放式來源、GPU相容的HLA I類結合親和力預測器,其中效能與NetMHC家族模型相當。為了組合多個HLA等位基因中之單一肽的結合親和力預測,選擇最小結合親和力。為了組合多個肽中之結合親和力(亦即為了對由圖14C中之多突變的肽跨越的突變排名),選擇肽中之最小結合親和力。對於在T細胞資料集上定限之RNA表現,使用在TPM>1下定限的來自TCGA之腫瘤類型匹配的RNA-seq資料。所有初始T細胞資料集均在初始公開案中之TPM>0下進行過濾,因此不使用在TPM>0下過濾的TCGA RNA-seq資料。 XV.B.7.呈遞預測
為了組合多個HLA等位基因中之單一肽之呈遞機率,如在等式1中鑑別機率之總和。為了組合多個肽中之呈遞機率(亦即為了對由如圖14C中之多個肽跨越的突變進行排名),鑑別呈遞機率之總和。機率性地,若肽之呈遞視為i.i.d.Bernoulli隨機變數,則機率之總和對應於經呈遞突變肽的預期數目:, 其中藉由將經訓練呈遞模型應用於抗原決定基j 來獲得,且表示跨越突變i 之突變抗原決定基的數目。舉例而言,對於遠離其源基因末端之SNVi ,存在8個跨越8聚體、9個跨越9聚體、10個跨越10聚體及11個跨越11聚體,總共跨越突變抗原決定基。 XV.C.下一代定序 XV.C.1.樣品
對於冷凍切除之腫瘤之轉錄組分析,自與用於MS分析相同的組織樣品(腫瘤或鄰近於正常)獲得RNA。對於在患者中對於抗PD1療法之新抗原外顯子組及轉錄組分析,自存檔FFPE腫瘤切片獲得DNA及RNA。鄰近於正常之匹配的血液或PBMC用於獲得正常外顯子組及HLA分型的正常DNA。 XV.C.2.核酸提取及文庫構築
使用Qiagen DNeasy管柱(Hilden, Germany)按照製造商建議程序,來分離來源於血液之正常/生殖系DNA。使用Qiagen Allprep DNA/RNA分離套組按照製造商建議程序,來分離來自組織樣品的DNA及RNA。藉由Picogreen及Ribogreen螢光(Molecular Probes)來定量DNA及RNA,分別具有>50 ng產量的樣品用於文庫構築。藉由聲波剪切(Covaris, Woburn, MA),隨後DNA Ultra II (NEB, Beverly, MA)文庫製備套組,按照製造商建議方案,來產生DNA定序文庫。藉由熱片段化及利用RNA Ultra II (NEB)之文庫構築,來產生腫瘤RNA定序文庫。藉由Picogreen (Molecular Probes)來定量所得文庫。 XV.C.3.全外顯子組捕捉
使用xGEN全外顯子組組(Integrated DNA Technologies),來進行DNA及RNA定序文庫兩者的外顯子富集。將1至1.5 µg正常DNA或腫瘤DNA或RNA來源的文庫用作輸入,且使其雜交大於12小時,隨後進行抗生蛋白鏈菌素純化。藉由PCR對所捕捉文庫進行最低限度地擴增,且藉由NEBNext文庫定量套組(NEB)來定量。以等莫耳濃度合併所捕捉文庫,且使用c-bot (Illumina)來聚集,且在HiSeq4000 (Illumina)上之75鹼基對末端定序,以靶向>500x腫瘤外顯子組、>100x正常外顯子組及>100M讀段腫瘤轉錄組的獨特平均覆蓋。 XV.C.4.分析
使用BWA-MEM144 (v.0.7.13-r1126),將外顯子組讀段(FFPE腫瘤及匹配的正常樣本)與參考人類基因組(hg38)進行比對。使用STAR (v.2.5.1b),將RNA-seq讀段(FFPE及冷凍腫瘤組織樣本)與基因組及GENCODE轉錄物(v.25)進行比對。使用RSEM133 (v.1.2.31),利用相同參考轉錄物,來量化RNA表現。Picard (v.2.7.1)用於標記重複比對及計算比對度量值。對於在利用GATK145 (v.3.5-0)再校準鹼基品質評分後之FFPE腫瘤樣本,使用配對的腫瘤-正常外顯子組利用FreeBayes146 (1.0.2)來測定取代及短插入或缺失變體。過濾器包括等位基因頻率>4%;中值鹼基品質>25、支撐讀段30之最小映射品質及正常樣本中之獲得足夠覆蓋的替代讀段計數<=2。變體亦必須對於兩條鏈進行偵測。排除在重複區中發現之體細胞變體。利用snpEff147 (v.4.2)使用RefSeq轉錄物進行轉譯及註解。在腫瘤RNA比對中驗證之非同義非終止變體用於新抗原預測。Optitype148 1.3.1用於產生HLA類型。 XV.C.5.圖19A-B:IVS對照實驗之腫瘤細胞株及匹配的正常細胞株
按照賣方說明書,使均購自ATCC (Manassas, VA)之腫瘤細胞株H128、H122、H2009、H2126、Colo829及其正常供體匹配的對照細胞株BL128、BL2122、BL2009、BL2126及Colo829BL生長至1083 -1084 個細胞,隨後快速冷凍以進行核酸提取及定序。一般如上文所描述來進行NGS處理,除MuTect149 (3.1-0)僅用於取代突變偵測以外。IVS對照分析中使用之肽列於補充表5中。 XV.D. II類模型概念驗證
吾等評價本文所揭示之預測模型是否亦可應用於II類HLA肽呈遞。為進行此操作,獲得兩個細胞株之公開的II類質譜資料,該兩個細胞株各自表現單一HLA I類等位基因。一個細胞株表現HLA-DRB1*15:01,且另一個表現HLA-DRB5*01:01150 。此等兩個細胞株用於訓練資料。對於測試資料,II類質譜資料獲自表現HLA-DRB1*15:01及HLA-DRB5*01:01兩者之單獨細胞株。151 訓練或測試細胞株之RNA定序資料為不可獲得的,因此用來自不同B細胞株B721.22192 的RNA定序資料來替代。
使用與用於HLA I類資料相同的步驟,將肽集合分成訓練、驗證及測試集,除對於II類資料,包括長度在9與20之間的肽以外。訓練資料包括由HLA-DRB1*15:01呈遞之330個肽及由HLA-DRB5*01:01呈遞之103個肽。測試資料集包括由HLA-DRB1*15:01或HLA-DRB5*01:01呈遞之223個肽以及4708個非呈遞肽。
吾等關於訓練資料集訓練10個模型之集合,以預測HLA II類肽呈遞。此等模型之架構及訓練程序與用於預測I類呈遞之彼等一致,除II類模型採用輸入肽序列為獨熱編碼及零填充至長度20而不是11以外。
圖23比較以下之預測效能:「MS模型」、「NetMHCIIpan排名」(NetMHCIIpan 3.177 ,採用在HLA-DRB1*15:01及HLA-DRB5*01:01之間的最低NetMHCIIpan百分點排名)及「NetMHCIIpan nM」(NetMHCIIpan 3.1,採用以nM為單位的在HLA-DRB1*15:01及HLA-DRB5*01:01之間的最強親和力),對HLA-DRB1*15:01/HLA-DRB5*01:01測試資料集中之肽進行排名。「MS模型」為本文所揭示之MHC II類呈遞預測模型。
具體言之,圖23描繪此等排名方法之接收者操作特徵(ROC)曲線及在ROC曲線AUC (A圖)及AUC0 . 1 (B圖)統計下的面積。AUC0 . 1 為在0與0.1FPR × 10之間的AUC,通常在抗原決定基預測領域19 中考慮。NetMHCIIpan nM及排名方法類似地進行。MS模型表現最佳,顯著地超過比較方法之效能,特定言之在ROC曲線之關鍵高特異性區中(AUC0 . 1 0.41相對於0.27)。 XVI.實例11:來自NSCLC患者之周邊血液之新抗原特異性記憶T細胞的TCR定序
圖24描繪一種用於對來自NSCLC患者之周邊血液之新抗原特異性記憶T細胞之TCR進行定序的方法。在ELISpot培育之後,收集NSCLC患者CU04 (上文關於圖15A-22所描述)之周邊血液單核細胞(PBMC)。具體言之,如上文所論述,在IFN-γ ELISpot中,用CU04特異性個別新抗原肽(圖21C)、用CU04特異性新抗原肽庫(圖21C)及用DMSO陰性對照(圖22),來刺激來自2次患者CU04問診的活體外擴增PBMC。在培育之後且在添加偵測抗體之前,將PBMC轉移至新培養盤且在完成ELISpot分析期間維持在培育箱中。基於ELISpot結果,來鑑別陽性(反應性)孔。如圖21中所展示,所鑑別之陽性孔包括用CU04特異性個別新抗原肽8刺激的孔及用CU04特異性新抗原肽庫刺激的孔。將來自此等陽性孔及陰性對照(DMSO)孔之細胞組合,且利用磁性標記的抗體進行CD137染色以用於使用Miltenyi磁性分離管柱來富集。
使用10×基因組學單一細胞解析度配對的免疫TCR分析方法,對如上文所描述經分離及擴增的CD137富集及CD137消耗的T細胞級分進行定序。具體言之,將活的T細胞分成單一細胞乳液以用於隨後單一細胞cDNA產生及全長TCR分析(5' UTR至恆定區,確保α及β配對)。一個方法係在轉錄物5'端處利用分子帶條碼的模板切換寡聚物,第二個方法係在3'端處利用分子帶條碼的恆定區寡聚物,且第三個方法係將RNA聚合酶啟動子偶聯至TCR之5'或3'端。所有此等方法使得能夠在單細胞層級上鑑別α及β TCR對及對其進行去卷積。所得帶條碼的cDNA轉錄物經受最佳化酶催化及文庫構築工作流程以降低偏差,且確保細胞庫內之純系型的精確表示。在Illumina之MiSeq或HiSeq4000儀器(雙末端(paired-end) 150個循環)上對文庫進行定序,靶標定序深度為約五至五十千讀段/細胞。所得TCR核酸序列描繪於補充表6中。描述於補充表6中之TCRa及TCRb鏈之存在藉由基於正交錨-PCR的TCR定序方法(Archer)來確認。當相較於基於10×基因組學之TCR定序時,此特定方法的優勢為使用有限細胞數目作為輸入及更少的酶催化操作。
使用10x軟體及定製生物資訊管線來分析定序輸出,以如亦展示於補充表6中之鑑別T細胞受體(TCR) α及β鏈對。補充表6進一步列舉最普遍的TCR純系型的α及β可變區(V)、接合(J)區、恆定區(C)及β多樣性區(D)以及CDR3胺基酸序列。純系型定義為具有獨特CDR3胺基酸序列之α、β鏈對。過濾以高於2個細胞之頻率存在之單一α及單一β鏈對的純系型,產生患者CU04中之純系型/靶肽的最終清單(補充表6)。
總之,使用上文關於圖24所描述之方法,鑑別對如上文在XIV.部分中關於實例10所論述鑑別之患者CU04的腫瘤新抗原具有新抗原特異性、來自患者CU04之周邊血液的記憶CD8+ T細胞。對此等經鑑別之新抗原特異性T細胞的TCR進行定序。且另外,鑑別對如由上文呈遞模型鑑別之患者CU04的腫瘤新抗原具有新抗原特異性的經定序TCR。 XVII.實例12:新抗原特異性記憶T細胞用於T細胞療法之用途
在鑑別對由患者之腫瘤呈遞之新抗原具有新抗原特異性的T細胞及/或TCR之後,此等經鑑別的新抗原特異性T細胞及/或TCR可用於患者之T細胞療法中。具體言之,此等經鑑別的新抗原特異性T細胞及/或TCR可用於產生治療性數量之新抗原特異性T細胞,以在T細胞療法期間輸注至患者中。用於產生治療性數量之用於患者之T細胞療法中的新抗原特異性T細胞的兩個方法在本文XVII.A.及XVII.B部分論述。第一個方法包含將來自患者樣本之經鑑別的新抗原特異性T細胞擴增(XVII.A.部分)。第二個方法包含對經鑑別的新抗原特異性T細胞之TCR進行定序,及將經定序之TCR選殖至新的T細胞中(XVII.B.部分)。未明確地在本文中提及、用於產生用於T細胞療法中之新抗原特異性T細胞的替代性方法,亦可用於產生治療性數量之用於T細胞療法中的新抗原特異性T細胞。一旦經由此等方法中之一或多者獲得新抗原特異性T細胞,可將此等新抗原特異性T細胞輸注至患者中以進行T細胞療法。 XVII.A.用於T細胞療法、來自患者樣本之新抗原特異性記憶T細胞的鑑別及擴增
用於產生治療性數量之供患者T細胞療法中之新抗原特異性T細胞的第一種方法包含擴增來自患者樣本之經鑑別的新抗原特異性T細胞。
具體言之,為了將新抗原特異性T細胞擴增至供患者T細胞療法中的治療性數量,使用如上文所描述之呈遞模型來鑑別最可能由患者之癌細胞呈遞的新抗原肽集。另外,自患者獲得含有T細胞之患者樣本。患者樣本包含患者之周邊血液、腫瘤浸潤性淋巴球(TIL)或淋巴結細胞。
在患者樣本包含患者之周邊血液之實施例中,以下方法可用於將新抗原特異性T細胞擴增至治療性數量。在一個實施例中,可進行誘發。在另一實施例中,可使用上文所描述之方法中之一或多者來鑑別已經活化的T細胞。在另一實施例中,可進行誘發及鑑別已經活化的T細胞兩者。誘發及鑑別已經活化的T細胞的優勢係使所表示之特異性達到最大。誘發及鑑別已經活化的T細胞兩者的缺點在於此方法係困難的且耗時的。在另一實施例中,可分離未必活化的新抗原特異性細胞。在此類實施例中,亦可進行此等新抗原特異性細胞之抗原特異性或非特異性擴增。在收集此等誘發的T細胞之後,經誘發的T細胞可經受快速擴增方案。舉例而言,在一些實施例中,經誘發的T細胞可經受Rosenberg快速擴增方案(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2978753/,https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2305721/)153 , 154
在患者樣本包含患者之TIL之實施例中,以下方法可用於將新抗原特異性T細胞擴增至治療性數量。在一個實施例中,新抗原特異性TIL可進行四聚體/多聚體離體分選,且隨後經分選的TIL可經受如上文所描述之快速擴增方案。在另一實施例中,可進行TIL之新抗原非特異性擴增,隨後新抗原特異性TIL可進行四聚體分選,且隨後經分選的TIL可經受如上文所描述之快速擴增方案。在另一實施例中,可在使TIL經受快速擴增方案之前進行抗原特異性培養。(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4607110/,https://onlinelibrary.wiley.com/doi/pdf/10.1002/eji.201545849)155 , 156
在一些實施例中,可修改Rosenberg快速擴增方案。舉例而言,可向TIL培養物中加入抗PD1及/或抗41BB以模擬更快速的擴增。(https://jitc.biomedcentral.com/articles/10.1186/s40425-016-0164-7)157 。 XVII.B.新抗原特異性T細胞之鑑別、經鑑別的新抗原特異性T細胞之TCR的定序及將經定序TCR選殖至新的T細胞中
第二種用於產生治療性數量之用於患者T細胞療法中之新抗原特異性T細胞的方法包含:鑑別來自患者樣本之新抗原特異性T細胞、經鑑別的新抗原特異性T細胞之TCR的定序及將經定序的TCR選殖至新的T細胞中。
首先,鑑別來自患者樣本之新抗原特異性T細胞,且對經鑑別的新抗原特異性T細胞之TCR進行定序。可自其中分離T細胞之患者樣本可包含血液、淋巴結或腫瘤中之一或多者。更具體言之,可自其中分離T細胞之患者樣本可包含以下中之一或多者:周邊血液單核細胞(PBMC)、腫瘤浸潤性細胞(TIL)、離散的腫瘤細胞(DTC)、活體外誘發的T細胞及/或自淋巴結分離的細胞。此等細胞可為新鮮及/或冷凍的。可自癌症患者及/或健康個體獲得PBMC及活體外誘發的T細胞。
在獲得患者樣本之後,可對樣本進行擴增及/或誘發。可實施各種方法以擴增及誘發患者樣本。在一個實施例中,可在肽或串聯小型基因存在下,刺激新鮮及/或冷凍的PBMC。在另一實施例中,可在肽或串聯小型基因存在下用抗原呈遞細胞(APC)來刺激及誘發新鮮及/或冷凍經分離的T細胞。APC之實例包括B細胞、單核球、樹突狀細胞、巨噬細胞或人工抗原呈遞細胞(諸如呈遞相關HLA及共刺激分子的細胞或珠粒,回顧於https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2929753中)。在另一實施例中,可在細胞介素(例如IL-2、IL-7及/或IL-15)存在下,來刺激PBMC、TIL及/或經分離之T細胞。在另一實施例中,可在最大刺激物、細胞介素及/或飼養細胞存在下,來刺激TIL及/或經分離之T細胞。在此類實施例中,可藉由活化標記物及/或多聚體(例如四聚體)來分離T細胞。在另一實施例中,可用刺激性及/或協同刺激性標記(例如CD3抗體、CD28抗體及/或珠粒(例如戴諾珠粒(DynaBead))來刺激TIL及/或經分離之T細胞。在另一實施例中,可使用飼養細胞快速擴增方案以高IL-2劑量在富集培養基中擴增DTC。
隨後,鑑別新抗原特異性T細胞且進行分離。在一些實施例中,自離體患者樣本分離T細胞而無需先前擴增。在一個實施例中,上文關於XVI.部分所描述之方法可用於鑑別來自患者樣本的新抗原特異性T細胞。在一替代實施例中,分離如下進行:藉由陽性選擇富集特定細胞群體,或藉由陰性選擇消耗特定細胞群體。在一些實施例中,陽性或陰性選擇如下完成:將細胞與一或多種特異性結合於一或多種表面標記的抗體或其他結合劑一起培育來完成選擇,該等表面標記分別表現或以相對較高的含量(標記 )表現(標記+)於陽性或陰性選擇的細胞上。
在一些實施例中,T細胞藉由陰性選擇非T細胞(諸如B細胞、單核球或其他白血球)上所表現之標記(諸如CD14)而與PBMC樣本分離。在一些態樣中,使用CD4+或CD8+選擇步驟來分離CD4+輔助細胞與CD8+細胞毒性T細胞。此類CD4+及CD8+群體可藉由對一或多種初始、記憶及/或效應T細胞亞群上所表現或表現至相對較高程度的標記進行陽性或陰性選擇而進一步分選成亞群。
在一些實施例中,CD8+細胞諸如藉由基於與各別亞群相關聯之表面抗原的陽性或陰性選擇而相對於初始、中樞記憶、效應記憶及/或中樞記憶幹細胞進一步富集或消耗。在一些實施例中,針對中樞記憶T (TCM)細胞進行富集以提高功效,諸如在投藥之後改良長期存活率、擴增及/或移植,在一些態樣中,功效在此類亞群中特別穩定。參見Terakura等人 (2012) Blood. 1:72-82;Wang等人 (2012) J Immunother. 35(9):689-701。在一些實施例中,組合TCM富集之CD8+ T細胞與CD4+ T細胞進一步增強功效。
在實施例中,記憶T細胞存在於CD8+周邊血液淋巴球之CD62L+與CD62L-亞群兩者中。可諸如使用抗CD8及抗CD62L抗體富集或消耗PBMC之CD62L-CD8+及/或CD62L+CD8+部分。
在一些實施例中,中樞記憶T (TCM)細胞的富集係基於CD45RO、CD62L、CCR7、CD28、CD3及/或CD 127之表面表現呈陽性或表現較高;在一些態樣中,其係基於對表現或高度表現CD45RA及/或顆粒酶B之細胞進行的陰性選擇。在一些態樣中,藉由消耗表現CD4、CD14、CD45RA之細胞及對表現CD62L之細胞進行陽性選擇或富集來分離TCM細胞富集之CD8+群體。在一個態樣中,如下進行中樞記憶T (TCM)細胞富集:以基於CD4表現所選擇之陰性細胞部分為起始物,基於CD14及CD45RA之表現進行陰性選擇,且基於CD62L進行陽性選擇。此類選擇在一些態樣中同時進行且在其他態樣中按任一次序依次進行。在一些態樣中,製備CD8+細胞群或亞群所用的基於CD4表現之相同選擇步驟亦用於產生CD4+細胞群或亞群,從而保留基於CD4之分離所得的陽性與陰性部分且用於方法之後續步驟,視情況在一或多個其他陽性或陰性選擇步驟之後。
在一特定實例中,對PBMC樣本或其他白血球樣本進行CD4+細胞之選擇,其中陰性及陽性部分均保留。隨後基於CD14及CD45RA或ROR1之表現對陰性部分進行陰性選擇,且基於中樞記憶T細胞所特有之標記(諸如CD62L或CCR7)進行陽性選擇,其中陽性及陰性選擇以任一次序進行。
藉由鑑別具有細胞表面抗原的細胞群將CD4+ T輔助細胞分選為初始、中樞記憶及效應細胞。CD4+淋巴球可藉由標準方法獲得。在一些實施例中,初始CD4+T淋巴球為CD45RO-、CD45RA+、CD62L+、CD4+ T細胞。在一些實施例中,中樞記憶CD4+細胞為CD62L+及CD45RO+。在一些實施例中,效應CD4+細胞為CD62L-及CD45RO-。
在一個實例中,為了藉由陰性選擇來富集CD4+細胞,單株抗體混合物典型地包括針對CD14、CD20、CD11b、CD16、HLA-DR及CD8之抗體。在一些實施例中,抗體或結合搭配物結合於固體載體或基質,諸如磁性珠粒或順磁珠粒,以便根據陽性及/或陰性選擇來分離細胞。舉例而言,在一些實施例中,細胞及細胞群體使用免疫磁性(或親和磁性)分離技術來分開或分離(回顧於Methods in Molecular Medicine, 第58卷: Metastasis Research Protocols, 第2卷: Cell Behavior In Vitro and In Vivo, 第17-25頁, 編輯: S. A. Brooks及U. Schumacher © Humana Press Inc., Totowa, NJ)。
在一些態樣中,所分離之細胞之樣本或組合物係與可磁化或磁性反應的小物質(諸如磁性反應顆粒或微粒,諸如順磁珠粒(例如戴諾珠粒或MACS珠粒))一起培育。磁性反應物質(例如顆粒)一般直接地或間接地連接於特異性結合於分子(例如表面標記)之結合搭配物(例如抗體),該分子存在於需要分離(例如需要陰性或陽性選擇)的細胞或細胞群體上。
在一些實施例中,磁性顆粒或珠粒包含結合於特異性結合成員(諸如抗體或其他結合搭配物)上之磁性反應物質。存在磁性分離方法中所用之多種熟知磁性反應物質。適合的磁性顆粒包括Molday之美國專利第4,452,773號及歐洲專利說明書EP 452342 B中所描述之彼等顆粒,該等專利以引用的方式併入本文中。膠態尺寸化顆粒(諸如Owen之美國專利第4,795,698號及Liberti等人之美國專利第5,200,084號中所描述之彼等顆粒)為其他實例。
培育一般在一定條件下進行,藉此附接於磁性顆粒或珠粒之抗體或結合搭配物或特異性結合於此類抗體或結合搭配物之分子(諸如二級抗體或其他試劑)特異性結合於樣本內之細胞的細胞表面分子(若存在)。
在一些態樣中,將樣本置放於磁場中,且附接於磁性反應或可磁化顆粒的彼等細胞將吸引至磁體且與未標記之細胞分離。陽性選擇時,吸引至磁體的細胞得以保留;陰性選擇時,未吸引的細胞(未標記之細胞)得以保留。在一些態樣中,在同一選擇步驟期間進行陽性及陰性選擇之組合,其中陽性及陰性部分保留且進一步處理或進行其他分離步驟。
在某些實施例中,磁性反應顆粒經一級抗體或其他結合搭配物、二級抗體、凝集素、酶或抗生蛋白鏈菌素塗佈。在某些實施例中,磁性顆粒經由對一或多種標記具有特異性之一級抗體的塗佈而附接於細胞。在某些實施例中,細胞(而非珠粒)經一級抗體或結合搭配物標記,且隨後添加經細胞類型特異性二級抗體或其他結合搭配物(例如抗生蛋白鏈菌素)塗佈之磁性顆粒。在某些實施例中,經抗生蛋白鏈菌素塗佈之磁性顆粒與經生物素標記之一級或二級抗體結合使用。
在一些實施例中,磁性反應顆粒保持附接於待隨後培育、培養及/或工程改造之細胞;在一些態樣中,該等顆粒保持附接於向患者投與之細胞。在一些實施例中,自細胞移除可磁化或磁性反應顆粒。自細胞移除可磁化顆粒的方法已知且包括例如使用未經標記之競爭性抗體、可磁化顆粒或抗體與可裂解連接子之結合物等。在一些實施例中,可磁化顆粒為可生物降解的。
在一些實施例中,基於親和力之選擇係經由磁性活化細胞分選術(MACS) (Miltenyi Biotech, Auburn, Calif.)。磁性活化細胞分選術(MACS)系統能夠高純度選擇附接於磁化顆粒的細胞。在某些實施例中,MACS係以其中施加外部磁場之後依序溶離非目標及靶標物種的模式操作。亦即,附接於磁化顆粒之細胞保持在適當位置,而溶離未附接之物種。隨後,在此第一溶離步驟完成之後,在磁場中捕獲且防止溶離之物種以某一方式釋放,使其可溶離及回收。在某些實施例中,非大型T細胞經標記且自非均質細胞群體消耗。
在某些實施例中,使用進行該等方法之分離(isolation)、細胞製備、分離(separation)、處理、培育、培養及/或調配步驟中之一或多者的系統、裝置或設備來進行分離(isolation)或分離(separation)。在一些態樣中,系統用於在封閉或無菌環境中進行此等步驟中之每一者,以例如使誤差、使用者操作及/或污染降至最低。在一個實例中,系統為如國際專利申請案公開案第WO2009/072003號或US 20110003380 A1中所描述之系統。
在一些實施例中,系統或設備在整合式或整裝式系統中及/或以自動化或可程式化方式進行分離、處理、工程改造及調配步驟中之一或多者(例如全部)。在一些態樣中,系統或設備包括與系統或設備通信之電腦及/或電腦程式,其允許使用者對處理、分離、工程改造及調配步驟進行程式化、控制、評估其結果及/或調整其各個態樣。
在一些態樣中,分離及/或其他步驟係使用例如在封閉的無菌系統中、在臨床規模水準自動化分離細胞的CliniMACS系統(Miltenyi Biotic)進行。組件可包括整合式微電腦、磁性分離單元、蠕動泵及各種夾閥。在一些態樣中,整合式電腦控制儀器之所有組件且導引系統以標準化順序執行重複程序。在一些態樣中,磁性分離單元包括可移動永久磁體及用於選擇管柱之固持器。蠕動泵控制通過管組的流速且連同夾閥一起確保控制緩衝液通過系統之流動及細胞之持續懸浮。
在一些態樣中,CliniMACS系統使用以無菌非熱解溶液供應之抗體偶聯可磁化顆粒。在一些實施例中,在細胞經磁性顆粒標記之後,洗滌細胞以移除過量顆粒。隨後使細胞製劑袋連接至管組,管組又連接至含有緩衝液之袋及細胞收集袋。管組由預組裝之無菌管組成,包括前管柱及分離管柱,且僅用於單次使用。起始分離程式之後,系統自動地將細胞樣本施加至分離管柱上。經標記之細胞保留於管柱內,而未標記之細胞藉由一系列洗滌步驟移除。在一些實施例中,適用於本文所描述方法的細胞群未標記且未保留於管柱中。在一些實施例中,適用於本文所描述方法的細胞群經標記且保留於管柱中。在一些實施例中,移除磁場之後,自管柱溶離適用於本文所描述方法的細胞群,且收集於細胞收集袋內。
在某些實施例中,使用CliniMACS Prodigy系統(Miltenyi Biotec)執行分離及/或其他步驟。在一些態樣中,CliniMACS Prodigy系統裝備有允許自動化洗滌及藉由離心對細胞進行分級分離的細胞處理單元。CliniMACS Prodigy系統亦可包括機載照相機及影像識別軟體,該軟體藉由辨別源細胞產物之宏觀層來判定最佳的細胞分級分離終點。舉例而言,周邊血液可自動分離成紅血球、白血球及血漿層。CliniMACS Prodigy系統亦可包括整合式細胞培養室,從而完成細胞培養方案,諸如細胞分化及擴增、抗原負載及長期細胞培養。輸入埠能允許對培養基進行無菌移除及補充且可使用整合式顯微鏡監測細胞。參見例如Klebanoff等人 (2012) J Immunother. 35(9): 651-660,Terakura等人 (2012) Blood. 1:72-82及Wang等人 (2012) J Immunother. 35(9):689-701。
在一些實施例中,本文所描述之細胞群體經由流動式細胞量測術收集及富集(或消耗),其中經多種細胞表面標記染色之細胞運載於流體流中。在一些實施例中,本文所描述之細胞群體經由製備級(FACS)分選術收集及富集(或消耗)。在某些實施例中,本文所描述之細胞群體藉由使用微機電系統(MEMS)晶片與基於FACS之偵測系統的組合來收集及富集(或消耗) (參見例如WO 2010/033140;Cho等人(2010) Lab Chip 10, 1567-1573;及Godin等人(2008) J Biophoton. 1(5):355-376)。在兩種情況下,細胞可經多種標記物標記,從而允許以高純度對界限分明之T細胞亞群進行分離。
在一些實施例中,抗體或結合搭配物經一或多種可偵測標記物標記,以促進根據陽性及/或陰性選擇進行的分離。舉例而言,分離可基於與經螢光標記之抗體的結合。在一些實例中,基於對一或多個細胞表面標記具有特異性之抗體或其他結合搭配物之結合的細胞分離運載於流體流中,諸如藉由螢光活化細胞分選(FACS),包括例如與流式細胞偵測系統組合的製備級(FACS)及/或微機電系統(MEMS)晶片。此類方法允許基於多種標記物同時進行陽性及陰性選擇。
在一些實施例中,製備方法包括在分離、培育及/或工程改造之前或之後,冷凍(例如低溫保藏)細胞的步驟。在一些實施例中,冷凍及後續解凍步驟移除細胞群體中之粒細胞及在一定程度上移除單核球。在一些實施例中,將細胞懸浮於冷凍溶液中,例如在洗滌步驟之後將細胞懸浮於冷凍溶液中,以移除血漿及血小板。在一些態樣中,可使用多種已知冷凍溶液及參數中之任一者。一個實例涉及使用含有20% DMSO及8%人類血清白蛋白(HSA)之PBS,或其他適合之細胞冷凍培養基。隨後可用培養基對此進行1:1稀釋,使得DMSO及HSA之最終濃度分別為10%及4%。其他實例包括Cryostor®、CTL-Cryo™ ABC冷凍培養基及類似培養基。隨後,以1℃/分鐘之速率將細胞冷凍至-80℃,且儲存於液氮儲槽之氣相中。
在一些實施例中,所提供方法包括培養(cultivation)、培育、培養(culture)及/或基因工程改造步驟。舉例而言,在一些實施例中,提供對所消耗之細胞群體進行培育及/或工程改造的方法及起始培養之組合物。
因此,在一些實施例中,在起始培養之組合物中培育細胞群體。培育及/或工程改造可在培養容器中進行,諸如用於培養或培育細胞的單元、腔室、孔、管柱、管、管組、閥、小瓶、培養盤、袋或其他容器。
在一些實施例中,細胞在基因工程改造之前或與基因工程改造結合進行培育及/或培養。培育步驟可包括培養(culture)、培養(cultivation)、刺激、活化及/或繁殖。在一些實施例中,組合物或細胞在刺激條件或刺激劑存在下培育。此類條件包括經設計以誘導群體中之細胞增殖、擴增、活化及/或存活、模擬抗原暴露及/或將用於基因工程改造的細胞誘發,諸如引入重組抗原受體。
條件可包括以下中之一或多者:特定培養基、溫度、氧含量、二氧化碳含量、時間、藥劑(例如營養物質、胺基酸、抗生素、離子及/或刺激性因子,諸如細胞介素、趨化介素、抗原、結合搭配物、融合蛋白、重組可溶受體)及設計成活化細胞之任何其他藥劑。
在一些實施例中,刺激條件或藥劑包括能夠活化TCR複合物之胞內信號傳導域的一或多種藥劑,例如配體。在一些態樣中,藥劑開啟或起始T細胞中之TCR/CD3胞內信號傳導級聯。此類藥劑可包括例如結合於諸如珠粒及/或一或多種細胞介素之固體載體的抗體(例如抗CD3、抗CD28),諸如對TCR組分及/或協同刺激受體具有特異性的彼等抗體。視情況,擴增方法可進一步包含向培養基中添加抗CD3及/或抗CD28抗體(例如以至少約0.5 ng/ml之濃度)的步驟。在一些實施例中,刺激劑包括IL-2及/或IL-15,例如至少約10個單位/毫升濃度的IL-2。
在一些態樣中,根據以下技術進行培育,諸如Riddell等人之美國專利第6,040,177號、Klebanoff等人 (2012) J Immunother. 35(9): 651-660、Terakura等人 (2012) Blood.1:72-82及/或Wang等人 (2012) J Immunother. 35(9):689-701中所描述之彼等技術。
在一些實施例中,藉由以下來擴增T細胞:向中培養起始組合物中添加飼養細胞(諸如非分裂的周邊血液單核細胞(PBMC)) (例如對於待擴增之初始群體中之各T淋巴球,使得所得細胞群體含有至少約5、10、20或40或更多的PBMC飼養細胞);及培育培養物(例如足以擴增一定數量之T細胞的一段時間)。在一些態樣中,非分裂飼養細胞可包含γ輻射PBMC飼養細胞。在一些實施例中,PBMC經約3000 rads至3600 rads範圍內之γ射線輻射以防止細胞分裂。在一些實施例中,PBMC飼養細胞不用絲裂黴素C活化。在一些態樣中,飼養細胞在添加T細胞群體之前添加至培養基中。
在一些實施例中,刺激條件包括適用於人類T淋巴球生長的溫度,例如至少約25攝氏度,通常至少約30度,且通常為37或約37攝氏度。視情況,培育可進一步包含添加非分裂EBV轉型類淋巴母細胞(LCL)作為飼養細胞。LCL可經約6000 rads至10,000 rads範圍內之γ射線輻射。在一些態樣中,LCL飼養細胞以任何適合量提供,諸如LCL飼養細胞與初始T淋巴球之比率至少約10:1。
在實施例中,抗原特異性T細胞(諸如抗原特異性CD4+及/或CD8+ T細胞)藉由用抗原刺激初始或抗原特異性T淋巴球來獲得。舉例而言,針對巨細胞病毒抗原之抗原特異性T細胞株或純系可藉由自經感染之個體分離T細胞且用相同抗原活體外刺激該等細胞來產生。
在一些實施例中,利用功能性分析(例如ELISpot),在刺激後鑑別及/或分離新抗原特異性T細胞。在一些實施例中,藉由利用胞內細胞介素染色分選多功能細胞來分離新抗原特異性T細胞。在一些實施例中,使用活化標記物(例如CD137、CD38、CD38/HLA-DR雙陽性及/或CD69)來鑑別及/或分離新抗原特異性T細胞。在一些實施例中,使用I類或II類多聚體及/或活化標記物,來鑑別及/或分離新抗原特異性CD8+、自然殺手T細胞、記憶T細胞及/或CD4+ T細胞。在一些實施例中,使用記憶標記物(例如CD45RA、CD45RO、CCR7、CD27及/或CD62L),來鑑別及/或分離新抗原特異性CD8+及/或CD4+ T細胞。在一些實施例中,鑑別及/或分離增殖性細胞。在一些實施例中,鑑別及/或分離活化T細胞。
在鑑別來自患者樣本之新抗原特異性T細胞之後,對經鑑別的新抗原特異性T細胞之新抗原特異性TCR進行定序。為了對新抗原特異性TCR進行定序,必須首先鑑別TCR。一個鑑別T細胞之新抗原特異性TCR之方法可包括:使T細胞與包含至少一個新抗原之HLA多聚體(例如四聚體)接觸;及經由HLA-多聚體與TCR之間的結合來鑑別TCR。另一鑑別新抗原特異性TCR之方法可包括:獲得包含TCR之一或多個T細胞;使具有呈遞在至少一個抗原呈遞細胞(APC)上之至少一個新抗原的一或多個T細胞活化;及經由選擇活化的一或多個細胞,藉由與至少一個新抗原之相互作用來鑑別TCR。
在鑑別新抗原特異性TCR之後,可對TCR進行定序。在一個實施例中,上文關於XVI.部分所描述之方法可用於對TCR進行定序。在另一實施例中,TCR之TCRa及TCRb可整體定序,且隨後基於頻率配對。在另一實施例中,可使用Howie等人Science Translational Medicine 2015 (doi: 10.1126/scitranslmed.aac5624)之方法來對TCR進行定序及配對。在另一實施例中,可使用Han等人Nat Biotech 2014 (PMID 24952902, doi 10.1038/nbt.2938)之方法來對TCR進行定序及配對。在另一實施例中,可使用由https://www.biorxiv.org/content/ early/2017/05/05/134841 及https://patents.google.com/patent/US20160244825A1/所描述之方法來獲得配對TCR序列。158 , 159
在另一實施例中,可藉由限制稀釋法來產生T細胞之純系群體,且隨後可對T細胞之純系群體之TCRa及TCRb進行定序。在又一實施例中,可將T細胞分選至具有孔之培養盤上,使得呈1個T細胞/孔,且隨後可對各孔中之各T細胞的TCRa及TCRb進行定序及配對。在另一實施例中,可藉由AbVitro分選來分選T細胞。
接下來,在鑑別來自患者樣本之新抗原特異性T細胞及對經鑑別的新抗原特異性T細胞之TCR進行定序之後,將經定序的TCR選殖至新的T細胞中。此等選殖T細胞含有新抗原特異性受體,例如含有包括胞外域之TCR。亦提供此類細胞之群體及含有此類細胞之組合物。在一些實施例中,富集此類細胞(諸如表現TCR之細胞)之組合物或群體,構成某一類型(諸如T細胞或CD8+或CD4+細胞)之組合物或細胞中之總細胞的至少1、5、10、20、30、40、50、60、70、80、90、91、92、93、94、95、96、97、98、99或大於99%。在一些實施例中,組合物包含至少一個含有本文所揭示之TCR的細胞。在組合物當中為用於投藥(諸如用於授受細胞療法)之醫藥組合物及調配物。亦提供向個體(例如患者)投與細胞及組合物的治療方法。
因此,亦提供經基因工程改造的表現TCR之細胞。細胞一般為真核細胞,諸如哺乳動物細胞,且通常為人類細胞。在一些實施例中,細胞來源於血液、骨髓、淋巴或淋巴器官,為免疫系統細胞,諸如先天性或適應性免疫細胞,例如骨髓或淋巴細胞,包括淋巴球,典型地為T細胞及/或NK細胞。其他例示性細胞包括幹細胞,諸如多潛能(multipotent)及多能(pluripotent)幹細胞,包括經誘導之多能幹細胞(iPSC)。細胞通常為初代細胞,諸如直接自個體分離及/或自個體分離且冷凍之細胞。在一些實施例中,細胞包括T細胞或其他細胞類型之一或多個亞群,諸如完整T細胞群體、CD4+細胞、CD8+細胞及其亞群,諸如根據以下定義之細胞:功能、活化狀態、成熟度、分化潛能、擴增、再循環、位置及/或持久能力、抗原特異性、抗原受體類型、特定器官或區室中之存在、標記物或細胞激素分泌概況及/或分化程度。提及所治療之個體時,細胞可為同種異體細胞及/或自體細胞。在該等方法當中包括現成方法。在一些態樣中,諸如在現成技術中,細胞為多能及/或多潛能細胞,諸如幹細胞,諸如經誘導之多能幹細胞(iPSC)。在一些實施例中,方法包括如本文所描述自個體分離出細胞、對其進行製備、處理、培養及/或工程改造,及低溫保存之前或之後將其再引入同一患者中。
T細胞及/或CD4+ T細胞及/或CD8+ T細胞的亞型及亞群為初始T (TN)細胞、效應T細胞(TEFF)、記憶T細胞及其亞型,諸如幹細胞記憶T (TSCM)、中樞記憶T (TCM)、效應記憶T (TEM)或末期分化效應記憶T細胞;腫瘤浸潤性淋巴球(TIL)、不成熟T細胞、成熟T細胞、輔助T細胞、細胞毒性T細胞、黏膜相關不變T (MAIT)細胞、天然存在及適應性調節T (Treg)細胞、輔助T細胞,諸如TH1細胞、TH2細胞、TH3細胞、TH17細胞、TH9細胞、TH22細胞、濾泡性輔助T細胞;α/β T細胞及δ/γ T細胞。
在一些實施例中,細胞為自然殺手(NK)細胞。在一些實施例中,細胞為單核球或粒細胞,例如骨髓細胞、巨噬細胞、嗜中性球、樹突狀細胞、肥大細胞、嗜伊紅血球及/或嗜鹼性球。
細胞可經基因修飾以降低表現或基因剔除內源性TCR。此類修飾描述於以下中:Mol Ther Nucleic Acids. 2012年12月; 1(12): e63; Blood. 2011年8月11日;118(6):1495-503; Blood. 2012年6月 14日; 119(24): 5697-5705; Torikai, Hiroki等人「HLA and TCR Knockout by Zinc Finger Nucleases: Toward 「off-the-Shelf」 Allogeneic T-Cell Therapy for CD19+ Malignancies..」 Blood 116.21 (2010): 3766; Blood. 2018年1月18日;131(3):311-322. doi: 10.1182/blood-2017-05-787598;及WO2016069283,其以全文引用之方式併入。
細胞可經基因修飾以促進細胞介素分泌。此類修飾描述於以下中:Hsu C、Hughes MS、Zheng Z、Bray RB, 、Rosenberg SA、Morgan RA, Primary human T lymphocytes engineered with a codon-optimized IL-15 gene resist cytokine withdrawal-induced apoptosis and persist long-term in the absence of exogenous cytokine. J Immunol. 2005;175:7226-34;Quintarelli C、Vera JF、Savoldo B、Giordano Attianese GM 、Pule M、Foster AE, Co-expression of cytokine and suicide genes to enhance the activity and safety of tumor-specific cytotoxic T lymphocytes. Blood. 2007;110:2793-802;及Hsu C、Jones SA、Cohen CJ、Zheng Z、Kerstann K、Zhou J, Cytokine-independent growth and clonal expansion of a primary human CD8+ T-cell clone following retroviral transduction with the IL-15 gene. Blood. 2007;109:5168-77。
已展示T細胞上之趨化介素受體與腫瘤分泌的趨化介素的錯配,造成使T細胞次最佳地遷移至腫瘤微環境中。為了改良療法之功效,細胞可經基因修飾以增加腫瘤微環境中之趨化介素之識別。此類修飾之實例描述於以下中:Moon、EKCarpenito、CSun、JWang、LCKapoor、VPredina, J Expression of a functional CCR2 receptor enhances tumor localization and tumor eradication by retargeted human T-cells expressing a mesothelin-specific chimeric antibody receptor.Clin Cancer Res. 2011; 17: 4719-4730;及Craddock、JALu、ABear、APule、MBrenner、MKRooney、CM等人 Enhanced tumor trafficking of GD2 chimeric antigen receptor T-cells by expression of the chemokine receptor CCR2b.J Immunother. 2010; 33: 780-788。
細胞可經基因修飾以增強協同刺激/增強受體(諸如CD28及41BB)之表現。
T細胞療法之不良效果可包括細胞介素釋放症候群及長時間B細胞消耗。接受者細胞中之自殺/安全開關之引入可改良基於細胞之療法的安全分佈。因此,細胞可經基因修飾以包括自殺/安全開關。自殺/安全開關可為賦予在其中表現基因之細胞具有針對藥劑(例如藥物)之敏感性的基因,當細胞與藥劑接觸或暴露於藥劑時,該基因使得細胞死亡。例示性自殺/安全性開關描述於Protein Cell. 2017年8月; 8(8): 573-589中。自殺/安全開關可為HSV-TK。自殺/安全開關可為胞嘧啶脫胺酶(daminase)、嘌呤核苷磷酸化酶或硝基還原酶。自殺/安全開關可為描述於美國專利申請案公開案第US20170166877A1號中之RapaCIDeTM 。自殺/安全開關系統可為描述於Haematologica. 2009年9月; 94(9): 1316-1320中之CD20/利妥昔單抗。此等參考文獻係以全文引用的方式併入。
可將TCR引入至接受者細胞中作為拆分受體,其僅在雜二聚小分子存在下聚集。此類系統描述於Science. 2015年10月16日; 350(6258): aab4077及美國專利第9,587,020號中, 其以引用的方式併入本文中。
在一些實施例中,細胞包括一或多個核酸,例如編碼本文所揭示之TCR的聚核苷酸,其中該聚核苷酸經由基因工程改造來引入,且由此表現重組或基因工程改造的如本文所揭示之TCR。在一些實施例中,核酸為異源核酸,亦即通常不存在於細胞或自該細胞獲得之樣本中的核酸,諸如自另一生物體或細胞獲得之核酸,此類核酸例如在經工程改造之細胞及/或此類細胞所來源之生物體中通常未發現。在一些實施例中,核酸為非天然存在之核酸,諸如自然界中未發現之核酸,包括包含編碼來自多種不同細胞類型之不同域之核酸之嵌合組合的核酸。
核酸可包括密碼子最佳化的核苷酸序列。不受特定理論或機制束縛,咸信,核苷酸序列之密碼子最佳化增加mRNA轉錄物之轉譯效率。核苷酸序列之密碼子最佳化可涉及用另一密碼子取代初始密碼子,該另一密碼子編碼相同胺基酸但可由更容易地在細胞內可用的tRNA轉譯,因此增加轉譯效率。核苷酸序列之最佳化亦可減少會干擾轉譯之二級mRNA結構,因此增加轉譯效率。
構築體或載體可用於將TCR引入至接受者細胞中。本文描述例示性構築體。編碼TCR之α及β鏈之聚核苷酸可在單一構築體中或在單獨構築體中。編碼α及β鏈之聚核苷酸可可操作地連接於啟動子,例如異源啟動子。異源啟動子可為強啟動子,例如EF1α、CMV、PGK1、Ubc、β肌動蛋白、CAG啟動子及類似啟動子。異源啟動子可為弱啟動子。異源啟動子可為誘導性啟動子。例示性誘導性啟動子包括(但不限於) TRE、NFAT、GAL4、LAC及其類似物。其他例示性誘導性表現系統描述於美國專利第5,514,578號、第6,245,531號、第7,091,038號及歐洲專利第0517805號中,其以全文引用之方式併入。
用於將TCR引入至接受者細胞中之構築體亦可包含編碼信號肽的聚核苷酸(信號肽元件)。信號肽可促進所引入TCR的表面遷移。例示性信號肽包括(但不限於) CD8信號肽、免疫球蛋白信號肽,其中具體實例包括GM-CSF及IgGκ。此類信號肽描述於以下中:Trends Biochem Sci. 2006年10月;31(10):563-71. 電子版2006年8月21日;及An等人 「Construction of a New Anti-CD19 Chimeric Antigen Receptor and the Anti-Leukemia Function Study of the Transduced T-cells.」 Oncotarget 7.9 (2016): 10638-10649. PMC. Web. 2018年8月16日;其以引用的方式併入本文中。
在一些情況下,例如其中α及β鏈由單一構築體或開放閱讀框表現之情況,或其中構築體中包括標記基因之情況,構築體可包含核糖體跳躍序列。核糖體跳躍序列可為2A肽,例如P2A或T2A肽。例示性P2A及T2A肽描述於Scientific Reports 第7卷, 文章編號: 2193 (2017)中,其以全文引用之方式併入本文中。在一些情況下,在2A元件之上游引入FURIN/PACE裂解位點。FURIN/PACE裂解位點描述於例如http://www.nuolan.net/substrates.html中。裂解肽亦可為Xa因子裂解位點。在α及β鏈由單一構築體或開放閱讀框表現之情況下,構築體可包含內部核糖體進入位點(IRES)。
構築體可進一步包含一或多個標記基因。例示性標記基因包括(但不限於) GFP、螢光素酶、HA、lacZ。標記可為可選標記,諸如如熟習此項技術者已知的抗生素抗性標記、重金屬抗性標記或殺生物劑抗性標記。標記可為用於營養缺陷型宿主中的補充標記。例示性補充標記及營養缺陷型宿主描述於Gene. 2001年1月24日;263(1-2):159-69中。此類標記可經由IRES、讀框轉移序列、2A肽連接子、與TCR之融合物表現,或與獨立啟動子分開地表現。
用於將TCR引入至接受者細胞中之例示性載體或系統包括(但不限於):腺相關病毒、腺病毒、腺病毒+改良型牛痘、安卡拉病毒(Ankara virus,MVA)、腺病毒+反轉錄病毒、腺病毒+仙台病毒(Sendai virus)、腺病毒+牛痘病毒、α病毒(Alphavirus,VEE)複製子疫苗、反義寡核苷酸、龍根雙叉桿菌(Bifidobacterium longum)、CRISPR-Cas9、大腸桿菌(E.coli)、黃病毒、基因槍、疱疹病毒、單純疱疹病毒、雷特氏乳球菌(Lactococcus lactis)、電穿孔、慢病毒、脂質體轉染、單核球增多性李氏菌(Listeria monocytogenes)、麻疹病毒、改良型安卡拉痘苗病毒(MVA)、mRNA電穿孔、裸/質體DNA、裸/質體DNA +腺病毒、裸/質體DNA+改良型安卡拉痘苗病毒(MVA)、裸/質體DNA +轉移RNA、裸/質體DNA +牛痘病毒、裸/質體DNA +水泡性口炎病毒、新城雞瘟病毒、非病毒、PiggyBacTM (PB)轉位子、基於奈米粒子之系統、脊髓灰白質炎病毒(Poliovirus)、痘病毒、痘病毒+牛痘病毒、反轉錄病毒、轉移RNA、轉移RNA+裸/質體DNA、RNA病毒、釀酒酵母、鼠傷寒沙門桿菌、勝利基森林病毒、仙台病毒、痢疾志賀菌、猴病毒、siRNA、睡美人轉位子、變異鏈球菌、牛痘病毒、委內瑞拉馬腦炎病毒複製子(Venezuelan equine encephalitis virus replicon)、水泡性口炎病毒及霍亂弧菌。
在較佳實施例中,經由腺相關病毒(AAV)、腺病毒、CRISPR-CAS9、疱疹病毒、慢病毒、脂質體轉染、mRNA電穿孔、PiggyBacTM (PB)轉位子、反轉錄病毒、轉移RNA或睡美人轉位子,將TCR引入至接受者細胞中。
在一些實施例中,用於將TCR引入至接受者細胞中之載體為病毒載體。例示性病毒載體包括腺病毒載體、腺相關病毒(AAV)載體、慢病毒載體、疱疹病毒載體、反轉錄病毒載體及其類似物。本文描述此類載體。
用於將TCR引入至接受者細胞中之TCR構築體之例示性實施例展示於圖25中。在一些實施例中,自5'-3'方向,TCR構築體包括以下聚核苷酸序列:啟動子序列、信號肽序列、TCR β可變(TCRβv)序列、TCR β恆定(TCRβc)序列、裂解肽(例如P2A)序列、信號肽序列、TCR α可變(TCRαv)序列及TCR α恆定(TCRαc)序列。在一些實施例中,構築體之TCRβc及TCRαc序列包括一或多個鼠類區,例如如本文所描述之全鼠類恆定序列或人類è鼠類胺基酸交換。在一些實施例中,構築體進一步包括TCRαc序列之3'、裂解肽序列(例如T2A),隨後報導基因。在一實施例中,自5'-3'方向,構築體包括以下聚核苷酸序列:啟動子序列、信號肽序列、TCR β可變(TCRβv)序列、含有一或多個鼠類區之TCR β恆定(TCRβc)序列、裂解肽(例如P2A)序列、信號肽序列、TCR α可變(TCRαv)序列及含有一或多個鼠類區之TCR α恆定(TCRαc)序列、裂解肽(例如T2A)序列及報導基因。
圖26描繪用於將TCR選殖至用於療法發展之表現系統中之例示性P526構築體主鏈核苷酸序列。
圖27描繪用於將純系型1 TCR (p526 TCR1003 NONE TRB P2A TRA T2A copGFP二硫化物)選殖至用於療法發展之表現系統中之例示性構築體序列。
圖28描繪用於將純系型3 TCR (p526 TCR1005 NONE TRB P2A TRA T2A copGFP二硫化物)選殖至用於療法發展之表現系統中之例示性構築體序列。
亦提供編碼TCR之經分離之核酸、包含該等核酸之載體及包含該等載體及核酸之宿主細胞,以及用於生產TCR之重組技術。
核酸可為重組型的。可在活細胞外,藉由將天然或合成的核酸片段接合於可在活細胞中複製或複製其產物之核酸分子,來構築重組核酸。出於本文之目的,複製可為活體外複製或活體內複製。
為了重組產生TCR,編碼其之核酸可經分離,且插入至可複製的載體中以進行進一步選殖(亦即DNA擴增)或表現。在一些態樣中,核酸可藉由同源重組來產生,例如如中美國專利第5,204,244號所描述,其以全文引用的方式併入本文中。
許多不同載體為此項技術中已知的。載體組分一般包括以下中之一或多者:信號序列、複製起點、一或多個標記基因、增強子元件、啟動子及轉錄終止序列,例如如美國專利第5,534,615號中所描述,其以全文引用的方式併入本文中。
適合於表現TCR、抗體或其抗原結合片段之例示性載體或構築體包括:例如pUC系列(Fermentas Life Sciences)、pBluescript系列(Stratagene, LaJolla, CA)、pET系列(Novagen, Madison, WI)、pGEX系列(Pharmacia Biotech, Uppsala, Sweden)及pEX系列(Clontech, Palo Alto, CA)。噬菌體載體,諸如AGTlO、AGTl 1、AZapII (Stratagene)、AEMBL4及ANMl 149,亦適合於表現本文所揭示之TCR。 XVIII.治療概述流程圖
圖29為根據一實施例,用於向患者提供定製、新抗原特異性治療之方法的流程圖。在其他實施例中,方法可包括不同於展示於圖29中之彼等步驟的及/或額外步驟。另外,方法之步驟可在各種實施例中,以不同於結合圖29描述之次序的次序來進行。
使用如上文所描述之質譜資料來訓練呈遞模型2901。獲得患者樣本2902。患者樣本可包含患者之周邊血液及/或任何其他患者樣本。使用經訓練之呈遞模型,預測患者血液樣本內之肽之呈遞可能性2903。基於所預測之呈遞可能性,鑑別患者之治療新抗原2904。接下來,獲得患者樣本2905。患者樣本可包含患者之周邊血液、腫瘤浸潤性淋巴球(TIL)、淋巴、淋巴結細胞及/或任何其他T細胞源。活體內篩選患者樣本之新抗原特異性T細胞2906。
此時,在治療過程中,患者可接受T細胞療法及/或疫苗治療。對於接受疫苗治療,鑑別患者之T細胞對其具有特異性之新抗原2914。隨後,產生包括經鑑別之新抗原的疫苗2915。最後,向患者投與疫苗2916。
對於接受T細胞療法,進行擴增之新抗原特異性T細胞及/或新新抗原特異性T細胞經基因工程改造。對於對用於T細胞療法中之新抗原特異性T細胞進行擴增,僅擴增該等細胞2907,且輸注至患者中2908。
對於對用於T細胞療法中之新新抗原特異性T細胞進行基因工程改造,對活體內鑑別之新抗原特異性T細胞的TCR進行定序2909。接下來,將此等TCR序列選殖至表現載體中2910。隨後,將表現載體2910轉染至新的T細胞中2911。對經轉染之T細胞進行擴增2912。及最終,將所擴增的T細胞輸注至患者中2913。
患者可接受T細胞療法及疫苗療法兩者。在一個實施例中,患者首先接收疫苗療法隨後接收T細胞療法。此方法之一個優勢在於疫苗療法可增加腫瘤特異性T細胞的數目及由可偵測含量之T細胞識別之新抗原的數目。
在另一實施例中,患者可接受T細胞療法隨後接受疫苗療法,其中包括於疫苗中之抗原決定基集合包含由T細胞療法靶向之抗原決定基中之一或多者。此方法之一個優勢在於投與疫苗可促進擴增及治療性T細胞之持久性。 XIX. 實例電腦
圖30說明用於實施圖1及圖3中所展示之實體的實例電腦3000。電腦3000包括與晶片組3004耦合之至少一個處理器3002。晶片組3004包括記憶體控制器集線器3020及輸入/輸出(I/O)控制器集線器3022。記憶體3006及圖形適配器3012係耦合至記憶體控制器集線器3020,且顯示器3018係耦合至圖形適配器3012。儲存裝置3008、輸入裝置3014及網路適配器3016係耦合至I/O控制器集線器3022。電腦3000之其他實施例具有不同架構。
儲存裝置3008係非暫時性電腦可讀儲存媒體,諸如硬盤驅動器、緊密光碟唯讀記憶體(CD-ROM)、DVD或固態記憶體裝置。記憶體3006保存處理器3002所使用之指令及資料。輸入介面3014係觸控式螢幕介面,滑鼠、軌跡球或其他類型之指向裝置、鍵盤或其某一組合,且用於將資料輸入電腦3000中。在一些實施例中,電腦3000可經組態以經由使用者之示意動作自輸入介面3014接收輸入(例如命令)。圖形適配器3012將影像及其他資訊顯示於顯示器3018上。網路適配器3016將電腦3000耦合至一或多個電腦網路。
電腦3000經調適以執行電腦程式模組以提供本文所描述之功能。如本文所使用,術語「模組」係指用於提供指定功能之電腦程式邏輯。因此,模組可以在硬體、韌體及/或軟體中實施。在一個實施例中,程式模組係儲存於儲存裝置3008上,裝載至記憶體3006中且由處理器3002執行。
圖1之實體所使用之電腦3000的類型可以視實施例及實體所需之處理功率而變化。舉例而言,呈遞鑑別系統160可以在單一電腦3000中或在經由網路(諸如在伺服器群中)彼此連通之多台電腦3000中運行。電腦3000可以缺少以上描述之組件中之一部分,諸如圖形適配器3012及顯示器3018。參考文獻 1. Desrichard, A., Snyder, A. & Chan, T. A. Cancer Neoantigens and Applications for Immunotherapy. Clin. Cancer Res. Off. J. Am. Assoc. Cancer Res. (2015). doi:10.1158/1078-0432.CCR-14-3175 2. Schumacher, T. N. & Schreiber, R. D. Neoantigens in cancer immunotherapy. Science 348, 69-74 (2015). 3. Gubin, M. M., Artyomov, M. N., Mardis, E. R. & Schreiber, R. D. Tumor neoantigens: building a framework for personalized cancer immunotherapy. J. Clin. Invest. 125, 3413-3421 (2015). 4. Rizvi, N. A. et al. Cancer immunology. Mutational landscape determines sensitivity to PD-1 blockade in non-small cell lung cancer. Science 348, 124-128 (2015). 5. Snyder, A. et al. Genetic basis for clinical response to CTLA-4 blockade in melanoma. N. Engl. J. Med. 371, 2189-2199 (2014). 6. Carreno, B. M. et al. Cancer immunotherapy. A dendritic cell vaccine increases the breadth and diversity of melanoma neoantigen-specific T-cells. Science 348, 803-808 (2015). 7. Tran, E. et al. Cancer immunotherapy based on mutation-specific CD4+ T-cells in a patient with epithelial cancer. Science 344, 641-645 (2014). 8. Hacohen, N. & Wu, C. J.-Y. United States Patent Application: 0110293637 - COMPOSITIONS AND METHODS OF IDENTIFYING TUMOR SPECIFIC NEOANTIGENS. (A1). at <http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1=20110293637.PGNR.> 9. Lundegaard, C., Hoof, I., Lund, O. & Nielsen, M. State of the art and challenges in sequence based T-cell epitope prediction. Immunome Res. 6 Suppl 2, S3 (2010). 10. Yadav, M. et al. Predicting immunogenic tumour mutations by combining mass spectrometry and exome sequencing. Nature 515, 572-576 (2014). 11. Bassani-Sternberg, M., Pletscher-Frankild, S., Jensen, L. J. & Mann, M. Mass spectrometry of human leukocyte antigen class I peptidomes reveals strong effects of protein abundance and turnover on antigen presentation. Mol. Cell. Proteomics MCP 14, 658-673 (2015). 12. Van Allen, E. M. et al. Genomic correlates of response to CTLA-4 blockade in metastatic melanoma. Science 350, 207-211 (2015). 13. Yoshida, K. & Ogawa, S. Splicing factor mutations and cancer. Wiley Interdiscip. Rev. RNA 5, 445-459 (2014). 14. Cancer Genome Atlas Research Network. Comprehensive molecular profiling of lung adenocarcinoma. Nature 511, 543-550 (2014). 15. Rajasagi, M. et al. Systematic identification of personal tumor-specific neoantigens in chronic lymphocytic leukemia. Blood 124, 453-462 (2014). 16. Downing, S. R. et al. United States Patent Application: 0120208706 - OPTIMIZATION OF MULTIGENE ANALYSIS OF TUMOR SAMPLES. (A1). at <http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1=20120208706.PGNR.> 17. Target Capture for NextGen Sequencing - IDT. at <http://www.idtdna.com/pages/products/nextgen/target-capture> 18. Shukla, S. A. et al. Comprehensive analysis of cancer-associated somatic mutations in class I HLA genes. Nat. Biotechnol. 33, 1152-1158 (2015). 19. Cieslik, M. et al. The use of exome capture RNA-seq for highly degraded RNA with application to clinical cancer sequencing. Genome Res. 25, 1372-1381 (2015). 20. Bodini, M. et al. The hidden genomic landscape of acute myeloid leukemia: subclonal structure revealed by undetected mutations. Blood 125, 600-605 (2015). 21. Saunders, C. T. et al. Strelka: accurate somatic small-variant calling from sequenced tumor-normal sample pairs. Bioinforma. Oxf. Engl. 28, 1811-1817 (2012). 22. Cibulskis, K. et al. Sensitive detection of somatic point mutations in impure and heterogeneous cancer samples. Nat. Biotechnol. 31, 213-219 (2013). 23. Wilkerson, M. D. et al. Integrated RNA and DNA sequencing improves mutation detection in low purity tumors. Nucleic Acids Res. 42, e107 (2014). 24. Mose, L. E., Wilkerson, M. D., Hayes, D. N., Perou, C. M. & Parker, J. S. ABRA: improved coding indel detection via assembly-based realignment. Bioinforma. Oxf. Engl. 30, 2813-2815 (2014). 25. Ye, K., Schulz, M. H., Long, Q., Apweiler, R. & Ning, Z. Pindel: a pattern growth approach to detect break points of large deletions and medium sized insertions from paired-end short reads. Bioinforma. Oxf. Engl. 25, 2865-2871 (2009). 26. Lam, H. Y. K. et al. Nucleotide-resolution analysis of structural variants using BreakSeq and a breakpoint library. Nat. Biotechnol. 28, 47-55 (2010). 27. Frampton, G. M. et al. Development and validation of a clinical cancer genomic profiling test based on massively parallel DNA sequencing. Nat. Biotechnol. 31, 1023-1031 (2013). 28. Boegel, S. et al. HLA typing from RNA-Seq sequence reads. Genome Med. 4, 102 (2012). 29. Liu, C. et al. ATHLATES: accurate typing of human leukocyte antigen through exome sequencing. Nucleic Acids Res. 41, e142 (2013). 30. Mayor, N. P. et al. HLA Typing for the Next Generation. PloS One 10, e0127153 (2015). 31. Roy, C. K., Olson, S., Graveley, B. R., Zamore, P. D. & Moore, M. J. Assessing long-distance RNA sequence connectivity via RNA-templated DNA-DNA ligation. eLife 4, (2015). 32. Song, L. & Florea, L. CLASS: constrained transcript assembly of RNA-seq reads. BMC Bioinformatics 14 Suppl 5, S14 (2013). 33. Maretty, L., Sibbesen, J. A. & Krogh, A. Bayesian transcriptome assembly. Genome Biol. 15, 501 (2014). 34. Pertea, M. et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nat. Biotechnol. 33, 290-295 (2015). 35. Roberts, A., Pimentel, H., Trapnell, C. & Pachter, L. Identification of novel transcripts in annotated genomes using RNA-Seq. Bioinforma. Oxf. Engl. (2011). doi:10.1093/bioinformatics/btr355 36. Vitting-Seerup, K., Porse, B. T., Sandelin, A. & Waage, J. spliceR: an R package for classification of alternative splicing and prediction of coding potential from RNA-seq data. BMC Bioinformatics 15, 81 (2014). 37. Rivas, M. A. et al. Human genomics. Effect of predicted protein-truncating genetic variants on the human transcriptome. Science 348, 666-669 (2015). 38. Skelly, D. A., Johansson, M., Madeoy, J., Wakefield, J. & Akey, J. M. A powerful and flexible statistical framework for testing hypotheses of allele-specific gene expression from RNA-seq data. Genome Res. 21, 1728-1737 (2011). 39. Anders, S., Pyl, P. T. & Huber, W. HTSeq--a Python framework to work with high-throughput sequencing data. Bioinforma. Oxf. Engl. 31, 166-169 (2015). 40. Furney, S. J. et al. SF3B1 mutations are associated with alternative splicing in uveal melanoma. Cancer Discov. (2013). doi:10.1158/2159-8290.CD-13-0330 41. Zhou, Q. et al. A chemical genetics approach for the functional assessment of novel cancer genes. Cancer Res. (2015). doi:10.1158/0008-5472.CAN-14-2930 42. Maguire, S. L. et al. SF3B1 mutations constitute a novel therapeutic target in breast cancer. J. Pathol. 235, 571-580 (2015). 43. Carithers, L. J. et al. A Novel Approach to High-Quality Postmortem Tissue Procurement: The GTEx Project. Biopreservation Biobanking 13, 311-319 (2015). 44. Xu, G. et al. RNA CoMPASS: a dual approach for pathogen and host transcriptome analysis of RNA-seq datasets. PloS One 9, e89445 (2014). 45. Andreatta, M. & Nielsen, M. Gapped sequence alignment using artificial neural networks: application to the MHC class I system. Bioinforma. Oxf. Engl. (2015). doi:10.1093/bioinformatics/btv639 46. Jørgensen, K. W., Rasmussen, M., Buus, S. & Nielsen, M. NetMHCstab - predicting stability of peptide-MHC-I complexes; impacts for cytotoxic T lymphocyte epitope discovery. Immunology 141, 18-26 (2014). 47. Larsen, M. V. et al. An integrative approach to CTL epitope prediction: a combined algorithm integrating MHC class I binding, TAP transport efficiency, and proteasomal cleavage predictions. Eur. J. Immunol. 35, 2295-2303 (2005). 48. cytotoxic T-cell epitopes: insights obtained from improved predictions of proteasomal cleavage. Immunogenetics 57, 33-41 (2005). 49. Boisvert, F.-M. et al. A Quantitative Spatial Proteomics Analysis of Proteome Turnover in Human Cells. Mol. Cell. Proteomics 11, M111.011429-M111.011429 (2012). 50. Duan, F. et al. Genomic and bioinformatic profiling of mutational neoepitopes reveals new rules to predict anticancer immunogenicity. J. Exp. Med. 211, 2231-2248 (2014). 51. Janeway's Immunobiology: 9780815345312: Medicine & Health Science Books @ Amazon.com. at <http://www.amazon.com/Janeways-Immunobiology-Kenneth-Murphy/dp/0815345313> 52. Calis, J. J. A. et al. Properties of MHC Class I Presented Peptides That Enhance Immunogenicity. PLoS Comput. Biol. 9, e1003266 (2013). 53. Zhang, J. et al. Intratumor heterogeneity in localized lung adenocarcinomas delineated by multiregion sequencing. Science 346, 256-259 (2014) 54. Walter, M. J. et al. Clonal architecture of secondary acute myeloid leukemia. N. Engl. J. Med. 366, 1090-1098 (2012). 55. Hunt DF, Henderson RA, Shabanowitz J, Sakaguchi K, Michel H, Sevilir N, Cox AL, Appella E, Engelhard VH. Characterization of peptides bound to the class I MHC molecule HLA-A2.1 by mass spectrometry. Science 1992. 255: 1261-1263. 56. Zarling AL, Polefrone JM, Evans AM, Mikesh LM, Shabanowitz J, Lewis ST, Engelhard VH, Hunt DF. Identification of class I MHC-associated phosphopeptides as targets for cancer immunotherapy. Proc Natl Acad Sci U S A. 2006 Oct 3;103(40):14889-94. 57. Bassani-Sternberg M, Pletscher-Frankild S, Jensen LJ, Mann M. Mass spectrometry of human leukocyte antigen class I peptidomes reveals strong effects of protein abundance and turnover on antigen presentation. Mol Cell Proteomics. 2015 Mar;14(3):658-73. doi: 10.1074/mcp.M114.042812. 58. Abelin JG, Trantham PD, Penny SA, Patterson AM, Ward ST, Hildebrand WH, Cobbold M, Bai DL, Shabanowitz J, Hunt DF. Complementary IMAC enrichment methods for HLA-associated phosphopeptide identification by mass spectrometry. Nat Protoc. 2015 Sep;10(9):1308-18. doi: 10.1038/nprot.2015.086. Epub 2015 Aug 6 59. Barnstable CJ, Bodmer WF, Brown G, Galfre G, Milstein C, Williams AF, Ziegler A. Production of monoclonal antibodies to group A erythrocytes, HLA and other human cell surface antigens-new tools for genetic analysis. Cell. 1978 May;14(1):9-20. 60. Goldman JM, Hibbin J, Kearney L, Orchard K, Th'ng KH. HLA-DR monoclonal antibodies inhibit the proliferation of normal and chronic granulocytic leukaemia myeloid progenitor cells. Br J Haematol. 1982 Nov;52(3):411-20. 61. Eng JK, Jahan TA, Hoopmann MR. Comet: an open-source MS/MS sequence database search tool. Proteomics. 2013 Jan;13(1):22-4. doi: 10.1002/pmic.201200439. Epub 2012 Dec 4. 62. Eng JK, Hoopmann MR, Jahan TA, Egertson JD, Noble WS, MacCoss MJ. A deeper look into Comet--implementation and features. J Am Soc Mass Spectrom. 2015 Nov;26(11):1865-74. doi: 10.1007/s13361-015-1179-x. Epub 2015 Jun 27. 63. Lukas Käll, Jesse Canterbury, Jason Weston, William Stafford Noble and Michael J. MacCoss. Semi-supervised learning for peptide identification from shotgun proteomics datasets. Nature Methods 4:923 - 925, November 2007 64. Lukas Käll, John D. Storey, Michael J. MacCoss and William Stafford Noble. Assigning confidence measures to peptides identified by tandem mass spectrometry. Journal of Proteome Research, 7(1):29-34, January 2008 65. Lukas Käll, John D. Storey and William Stafford Noble. Nonparametric estimation of posterior error probabilities associated with peptides identified by tandem mass spectrometry. Bioinformatics, 24(16):i42-i48, August 2008 66. Bo Li and C. olin N. Dewey. RSEM: accurate transcript quantification from RNA-Seq data with or without a referenfe genome. BMC Bioinformatics, 12:323, August 2011 67. Hillary Pearson, Tariq Daouda, Diana Paola Granados, Chantal Durette, Eric Bonneil, Mathieu Courcelles, Anja Rodenbrock, Jean-Philippe Laverdure, Caroline Côté, Sylvie Mader, Sébastien Lemieux, Pierre Thibault, and Claude Perreault. MHC class I-associated peptides derive from selective regions of the human genome. The Journal of Clinical Investigation, 2016, 68. Juliane Liepe, Fabio Marino, John Sidney, Anita Jeko, Daniel E. Bunting, Alessandro Sette, Peter M. Kloetzel, Michael P. H. Stumpf, Albert J. R. Heck, Michele Mishto. A large fraction of HLA class I ligands are proteasome-generated spliced peptides. Science, 21, October 2016. 69. Mommen GP., Marino, F., Meiring HD., Poelen, MC., van Gaans-van den Brink, JA., Mohammed S., Heck AJ., and van Els CA. Sampling From the Proteome to the Human Leukocyte Antigen-DR (HLA-DR) Ligandome Proceeds Via High Specificity. Mol Cell Proteomics 15(4): 1412-1423, April 2016. 70. Sebastian Kreiter, Mathias Vormehr, Niels van de Roemer, Mustafa Diken, Martin Löwer, Jan Diekmann, Sebastian Boegel, Barbara Schrörs, Fulvia Vascotto, John C. Castle, Arbel D. Tadmor, Stephen P. Schoenberger, Christoph Huber, Özlem Türeci, and Ugur Sahin. Mutant MHC class II epitopes drive therapeutic immune responses to caner. Nature 520, 692-696, April 2015. 71. Tran E., Turcotte S., Gros A., Robbins P.F., Lu Y.C., Dudley M.E., Wunderlich J.R., Somerville R.P., Hogan K., Hinrichs C.S., Parkhurst M.R., Yang J.C., Rosenberg S.A. Cancer immunotherapy based on mutation-specific CD4+ T-cells in a patient with epithelial cancer. Science 344(6184) 641-645, May 2014. 72. Andreatta M., Karosiene E., Rasmussen M., Stryhn A., Buus S., Nielsen M. Accurate pan-specific prediction of peptide-MHC class II binding affinity with improved binding core identification. Immunogenetics 67(11-12) 641-650, November 2015. 73. Nielsen, M., Lund, O. NN-align. An artificial neural network-based alignment algorithm for MHC class II peptide binding prediction. BMC Bioinformatics 10:296, September 2009. 74. Nielsen, M., Lundegaard, C., Lund, O. Prediction of MHC class II binding affinity using SMM-align, a novel stabilization matrix alignment method. BMC Bioinformatics 8:238, July 2007. 75. Zhang, J., et al. PEAKS DB: de novo sequencing assisted database search for sensitive and accurate peptide identification. Molecular & Cellular Proteomics. 11(4):1-8. 1/2/2012. 76. Snyder, A. et al. Genetic basis for clinical response to CTLA-4 blockade in melanoma. N. Engl. J. Med. 371, 2189-2199 (2014). 77. Rizvi, N. A. et al. Cancer immunology. Mutational landscape determines sensitivity to PD-1 blockade in non-small cell lung cancer. Science 348, 124-128 (2015). 78. Gubin, M. M., Artyomov, M. N., Mardis, E. R. & Schreiber, R. D. Tumor neoantigens: building a framework for personalized cancer immunotherapy. J. Clin. Invest. 125, 3413-3421 (2015). 79. Schumacher, T. N. & Schreiber, R. D. Neoantigens in cancer immunotherapy. Science 348, 69-74 (2015). 80. Carreno, B. M. et al. Cancer immunotherapy. A dendritic cell vaccine increases the breadth and diversity of melanoma neoantigen-specific T-cells. Science 348, 803-808 (2015). 81. Ott, P. A. et al. An immunogenic personal neoantigen vaccine for patients with melanoma. Nature 547, 217-221 (2017). 82. Sahin, U. et al. Personalized RNA mutanome vaccines mobilize poly-specific therapeutic immunity against cancer. Nature 547, 222-226 (2017). 83. Tran, E. et al. T-Cell Transfer Therapy Targeting Mutant KRAS in Cancer. N. Engl. J. Med. 375, 2255-2262 (2016). 84. Gros, A. et al. Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients. Nat. Med. 22, 433-438 (2016). 85. The problem with neoantigen prediction. Nat. Biotechnol. 35, 97-97 (2017). 86. Vitiello, A. & Zanetti, M. Neoantigen prediction and the need for validation. Nat. Biotechnol. 35, 815-817 (2017). 87. Bassani-Sternberg, M., Pletscher-Frankild, S., Jensen, L. J. & Mann, M. Mass spectrometry of human leukocyte antigen class I peptidomes reveals strong effects of protein abundance and turnover on antigen presentation. Mol. Cell. Proteomics MCP 14, 658-673 (2015). 88. Vita, R. et al. The immune epitope database (IEDB) 3.0. Nucleic Acids Res. 43, D405-412 (2015). 89. Andreatta, M. & Nielsen, M. Gapped sequence alignment using artificial neural networks: application to the MHC class I system. Bioinforma. Oxf. Engl. 32, 511-517 (2016). 90. O'Donnell, T. J. et al. MHCflurry: Open-Source Class I MHC Binding Affinity Prediction. Cell Syst. (2018). doi:10.1016/j.cels.2018.05.014 91. Bassani-Sternberg, M. et al. Direct identification of clinically relevant neoepitopes presented on native human melanoma tissue by mass spectrometry. Nat. Commun. 7, 13404 (2016). 92. Abelin, J. G. et al. Mass Spectrometry Profiling of HLA-Associated Peptidomes in Mono-allelic Cells Enables More Accurate Epitope Prediction. Immunity 46, 315-326 (2017). 93. Yadav, M. et al. Predicting immunogenic tumour mutations by combining mass spectrometry and exome sequencing. Nature 515, 572-576 (2014). 94. Stranzl, T., Larsen, M. V., Lundegaard, C. & Nielsen, M. NetCTLpan: pan-specific MHC class I pathway epitope predictions. Immunogenetics 62, 357-368 (2010). 95. Bentzen, A. K. et al. Large-scale detection of antigen-specific T-cells using peptide-MHC-I multimers labeled with DNA barcodes. Nat. Biotechnol. 34, 1037-1045 (2016). 96. Tran, E. et al. Immunogenicity of somatic mutations in human gastrointestinal cancers. Science 350, 1387-1390 (2015). 97. Stronen, E. et al. Targeting of cancer neoantigens with donor-derived T-cell receptor repertoires. Science 352, 1337-1341 (2016). 98. Trolle, T. et al. The Length Distribution of Class I-Restricted T-cell Epitopes Is Determined by Both Peptide Supply and MHC Allele-Specific Binding Preference. J. Immunol. Baltim. Md 1950 196, 1480-1487 (2016). 99. Di Marco, M. et al. Unveiling the Peptide Motifs of HLA-C and HLA-G from Naturally Presented Peptides and Generation of Binding Prediction Matrices. J. Immunol. Baltim. Md 1950 199, 2639-2651 (2017). 100. Goodfellow, I., Bengio, Y. & Courville, A. Deep Learning. (MIT Press, 2016). 101. Sette, A. et al. The relationship between class I binding affinity and immunogenicity of potential cytotoxic T-cell epitopes. J. Immunol. Baltim. Md 1950 153, 5586-5592 (1994). 102. Fortier, M.-H. et al. The MHC class I peptide repertoire is molded by the transcriptome. J. Exp. Med. 205, 595-610 (2008). 103. Pearson, H. et al. MHC class I-associated peptides derive from selective regions of the human genome. J. Clin. Invest. 126, 4690-4701 (2016). 104. Bassani-Sternberg, M. et al. Deciphering HLA-I motifs across HLA peptidomes improves neo-antigen predictions and identifies allostery regulating HLA specificity. PLoS Comput. Biol. 13, e1005725 (2017). 105. Andreatta, M., Lund, O. & Nielsen, M. Simultaneous alignment and clustering of peptide data using a Gibbs sampling approach. Bioinforma. Oxf. Engl. 29, 8-14 (2013). 106. Andreatta, M., Alvarez, B. & Nielsen, M. GibbsCluster: unsupervised clustering and alignment of peptide sequences. Nucleic Acids Res. (2017). doi:10.1093/nar/gkx248 107. Gros, A. et al. Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients. Nat. Med. 22, 433-438 (2016). 108. Zacharakis, N. et al. Immune recognition of somatic mutations leading to complete durable regression in metastatic breast cancer. Nat. Med. 24, 724-730 (2018). 109. Chudley, L. et al. Harmonisation of short-term in vitro culture for the expansion of antigen-specific CD8+ T-cells with detection by ELISPOT and HLA-multimer staining. Cancer Immunol. Immunother. 63, 1199-1211 (2014). 110. Van Allen, E. M. et al. Genomic correlates of response to CTLA-4 blockade in metastatic melanoma. Science 350, 207-211 (2015). 111. Anagnostou, V. et al. Evolution of Neoantigen Landscape during Immune Checkpoint Blockade in Non-Small Cell Lung Cancer. Cancer Discov. 7, 264-276 (2017). 112. Carreno, B. M. et al. Cancer immunotherapy. A dendritic cell vaccine increases the breadth and diversity of melanoma neoantigen-specific T-cells. Science 348, 803-808 (2015). 113. Stevanović, S. et al. Landscape of immunogenic tumor antigens in successful immunotherapy of virally induced epithelial cancer. Science 356, 200-205 (2017). 114. Pasetto, A. et al. Tumor- and Neoantigen-Reactive T-cell Receptors Can Be Identified Based on Their Frequency in Fresh Tumor. Cancer Immunol. Res. 4, 734-743 (2016). 115. Gillette, M. A. & Carr, S. A. Quantitative analysis of peptides and proteins in biomedicine by targeted mass spectrometry. Nat. Methods 10, 28-34 (2013). 116. Boegel, S., Löwer, M., Bukur, T., Sahin, U. & Castle, J. C. A catalog of HLA type, HLA expression, and neo-epitope candidates in human cancer cell lines. Oncoimmunology 3, e954893 (2014). 117. Johnson, D. B. et al. Melanoma-specific MHC-II expression represents a tumour-autonomous phenotype and predicts response to anti-PD-1/PD-L1 therapy. Nat. Commun. 7, 10582 (2016). 118. Robbins, P. F. et al. A Pilot Trial Using Lymphocytes Genetically Engineered with an NY-ESO-1-Reactive T-cell Receptor: Long-term Follow-up and Correlates with Response. Clin. Cancer Res. 21, 1019-1027 (2015). 119. Snyder, A. et al. Genetic basis for clinical response to CTLA-4 blockade in melanoma. N. Engl. J. Med. 371, 2189-2199 (2014). 120. Calis, J. J. A. et al. Properties of MHC class I presented peptides that enhance immunogenicity. PLoS Comput. Biol. 9, e1003266 (2013). 121. Duan, F. et al. Genomic and bioinformatic profiling of mutational neoepitopes reveals new rules to predict anticancer immunogenicity. J. Exp. Med. 211, 2231-2248 (2014). 122. Glanville, J. et al. Identifying specificity groups in the T-cell receptor repertoire. Nature 547, 94-98 (2017). 123. Dash, P. et al. Quantifiable predictive features define epitope-specific T-cell receptor repertoires. Nature 547, 89-93 (2017). 124. Hunt, D. F. et al. Pillars article: Characterization of peptides bound to the class I MHC molecule HLA-A2.1 by mass spectrometry. Science 1992. 255: 1261-1263. J. Immunol. Baltim. Md 1950 179, 2669-2671 (2007). 125. Zarling, A. L. et al. Identification of class I MHC-associated phosphopeptides as targets for cancer immunotherapy. Proc. Natl. Acad. Sci. U. S. A. 103, 14889-14894 (2006). 126. Abelin, J. G. et al. Complementary IMAC enrichment methods for HLA-associated phosphopeptide identification by mass spectrometry. Nat. Protoc. 10, 1308-1318 (2015). 127. Barnstable, C. J. et al. Production of monoclonal antibodies to group A erythrocytes, HLA and other human cell surface antigens-new tools for genetic analysis. Cell 14, 9-20 (1978). 128. Eng, J. K., Jahan, T. A. & Hoopmann, M. R. Comet: an open-source MS/MS sequence database search tool. Proteomics 13, 22-24 (2013). 129. Eng, J. K. et al. A deeper look into Comet--implementation and features. J. Am. Soc. Mass Spectrom. 26, 1865-1874 (2015). 130. Käll, L., Storey, J. D., MacCoss, M. J. & Noble, W. S. Assigning significance to peptides identified by tandem mass spectrometry using decoy databases. J. Proteome Res. 7, 29-34 (2008). 131. Käll, L., Storey, J. D. & Noble, W. S. Non-parametric estimation of posterior error probabilities associated with peptides identified by tandem mass spectrometry. Bioinforma. Oxf. Engl. 24, i42-48 (2008). 132. Käll, L., Canterbury, J. D., Weston, J., Noble, W. S. & MacCoss, M. J. Semi-supervised learning for peptide identification from shotgun proteomics datasets. Nat. Methods 4, 923-925 (2007). 133. Li, B. & Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics 12, 323 (2011). 134. Chollet, F. & others. Keras. (2015). 135. Bastien, F. et al. Understanding the difficulty of training deep feedforward neural networks. Proc. Thirteen. Int. Conf. Artif. Intell. Stat. 249-256 (2010). 136. Glorot, X. & Bengio, Y. Understanding the difficulty of training deep feedforward neural networks. in Proceedings of the Thirteenth International Conference on Artificial Intelligence and Statistics 249-256 (2010). 137. Kingma, D. & Ba, J. Adam: A method for stochastic optimization. ArXiv Prepr. ArXiv14126980 (2014). 138. Schneider, T. D. & Stephens, R. M. Sequence logos: a new way to display consensus sequences. Nucleic Acids Res. 18, 6097-6100 (1990). 139. Rubinsteyn, A., O'Donnell, T., Damaraju, N. & Hammerbacher, J. Predicting Peptide-MHC Binding Affinities With Imputed Training Data. biorxiv (2016). doi:https://doi.org/10.1101/054775 140. Tran, E. et al. Immunogenicity of somatic mutations in human gastrointestinal cancers. Science 350, 1387-1390 (2015). 141. Stronen, E. et al. Targeting of cancer neoantigens with donor-derived T-cell receptor repertoires. Science 352, 1337-1341 (2016). 142. Janetzki, S., Cox, J. H., Oden, N. & Ferrari, G. Standardization and validation issues of the ELISPOT assay. Methods Mol. Biol. Clifton NJ 302, 51-86 (2005). 143. Janetzki, S. et al. Guidelines for the automated evaluation of Elispot assays. Nat. Protoc. 10, 1098-1115 (2015). 144. Li, H. & Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinforma. Oxf. Engl. 25, 1754-1760 (2009). 145. DePristo, M. A. et al. A framework for variation discovery and genotyping using next-generation DNA sequencing data. Nat. Genet. 43, 491-498 (2011). 146. Garrison, E. & Marth, G. Haplotype-based variant detection from short-read sequencing. arXiv (2012). 147. Cingolani, P. et al. A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3. Fly (Austin) 6, 80-92 (2012). 148. Szolek, A. et al. OptiType: precision HLA typing from next-generation sequencing data. Bioinforma. Oxf. Engl. 30, 3310-3316 (2014). 149. Cibulskis, K. et al. Sensitive detection of somatic point mutations in impure and heterogeneous cancer samples. Nat. Biotechnol. 31, 213-219 (2013). 150. Scholz, E. M. et al. Human Leukocyte Antigen (HLA)-DRB1*15:01 and HLA-DRB5*01:01 Present Complementary Peptide Repertoires. Front. Immunol. 8, 984 (2017). 151. Ooi, J. D. et al. Dominant protection from HLA-linked autoimmunity by antigen-specific regulatory T-cells. Nature 545, 243-247 (2017). 152. Karosiene, E. et al. NetMHCIIpan-3.0, a common pan-specific MHC class II prediction method including all three human MHC class II isotypes, HLA-DR, HLA-DP and HLA-DQ. Immunogenetics 65, 711-724 (2013). 153. Dudley ME, Gross CA, Langhan MM, et al. CD8+ enriched “young” tumor infiltrating lymphocytes can mediate regression of metastatic melanoma.Clinical cancer research : an official journal of the American Association for Cancer Research . 2010;16(24):6122-6131. doi:10.1158/1078-0432.CCR-10-1297. 154. Dudley ME, Wunderlich JR, Shelton TE, Even J, Rosenberg SA. Generation of Tumor-Infiltrating Lymphocyte Cultures for Use in Adoptive Transfer Therapy for Melanoma Patients.Journal of immunotherapy (Hagerstown, Md : 1997) . 2003;26(4):332-342. 155. Cohen CJ, Gartner JJ, Horovitz-Fried M, et al. Isolation of neoantigen-specific T cells from tumor and peripheral lymphocytes.The Journal of Clinical Investigation . 2015;125(10):3981-3991. doi:10.1172/JCI82416. 156. Kelderman, S. , Heemskerk, B. , Fanchi, L. , Philips, D. , Toebes, M. , Kvistborg, P. , Buuren, M. M., Rooij, N. , Michels, S. , Germeroth, L. , Haanen, J. B. and Schumacher, N. M. (2016), Antigen‐specific TIL therapy for melanoma: A flexible platform for personalized cancer immunotherapy. Eur. J. Immunol., 46: 1351-1360. doi:10.1002/eji.201545849. 157. Hall M, Liu H, Malafa M, et al. Expansion of tumor-infiltrating lymphocytes (TIL) from human pancreatic tumors.Journal for Immunotherapy of Cancer . 2016;4:61. doi:10.1186/s40425-016-0164-7. 158. Briggs A, Goldfless S, Timberlake S, et al. Tumor-infiltrating immune repertoires captured by single-cell barcoding in emulsion.bioRxiv . 2017. doi.org/10.1101/134841. 159. US Patent Application No. 20160244825A1. 補充表1 具有預先存在反應之突變的預測排名 補充表2 NSCLS患者之人口統計資料 補充表2 NSCLS患者之人口統計資料 補充表 3 測試 NSCLC 患者中之 T 細胞識別之肽 補充表 3 測試 NSCLC 患者中之 T 細胞識別之肽 補充表 3 測試 NSCLC 患者中之 T 細胞識別之肽 補充表 3 測試 NSCLC 患者中之 T 細胞識別之肽 補充表 3 測試 NSCLC 患者中之 T 細胞識別之肽 補充表4 補充表5 IVS對照實驗中之TSNA及傳染性疾病抗原決定基 補充表6
110‧‧‧患者
118‧‧‧疫苗
160‧‧‧呈遞鑑別系統/模型管理系統
165‧‧‧儲存器/呈遞資訊
170‧‧‧訓練資料儲存器/訓練資料
170A‧‧‧訓練資料
175‧‧‧呈遞模型
312‧‧‧管理模組
314‧‧‧編碼模組
316‧‧‧訓練模組
320‧‧‧預測模組
324‧‧‧患者選擇模組
2901‧‧‧步驟
2902‧‧‧步驟
2903‧‧‧步驟
2904‧‧‧步驟
2905‧‧‧步驟
2906‧‧‧步驟
2907‧‧‧步驟
2908‧‧‧步驟
2909‧‧‧步驟
2910‧‧‧步驟
2911‧‧‧步驟
2912‧‧‧步驟
2913‧‧‧步驟
2914‧‧‧步驟
2915‧‧‧步驟
2916‧‧‧步驟
3000‧‧‧電腦
3002‧‧‧處理器
3004‧‧‧晶片組
3006‧‧‧記憶體
3008‧‧‧儲存裝置
3012‧‧‧圖形適配器
3014‧‧‧輸入裝置/輸入介面
3016‧‧‧網路適配器
3018‧‧‧顯示器
3020‧‧‧記憶體控制器集線器及
3022‧‧‧輸入/輸出(I/O)控制器集線器
就以下描述及隨附圖式將更好地理解本發明之此等及其他特徵、態樣及優勢,其中:
圖1A展示目前用於新抗原鑑別之臨床方法。
圖1B展示<5%之預測結合肽呈遞於腫瘤細胞上。
圖1C展示新抗原預測特異性問題之影響。
圖1D展示結合預測不足以進行新抗原鑑別。
圖1E展示MHC-I呈遞之機率隨肽長度之變化。
圖1F展示由普洛麥格之動態範圍標準(Promega's dynamic range standard)產生的實例肽譜圖。圖1F揭示SEQ ID NO: 1。
圖1G展示添加何種特徵增加模型陽性預測值。
圖2A為根據一實施例,用於鑑別患者中肽呈遞之可能性之環境的概述。
圖2B及圖2C說明根據一實施例,獲得呈遞資訊之方法。圖2B揭示SEQ ID NO: 28。圖2C以出現次序分別揭示SEQ ID NO 3-8。
圖3為說明根據一個實施例,呈遞鑑別系統之電腦邏輯組件的高級框圖。
圖4說明根據一個實施例,一組實例訓練資料。圖4以出現次序分別揭示作為SEQ ID NO 10-13之「肽序列」及作為SEQ ID NO 15、29-30與30之「C-側接序列」。
圖5說明與MHC等位基因相關聯之實例網路模型。
圖6A說明根據一個實施例,由MHC等位基因共用的實例網路模型NNH (∙)。
圖6B說明根據另一實施例,由MHC等位基因共用的實例網路模型NNH (∙)。
圖7說明使用實例網路模型產生與MHC等位基因相關聯之肽之呈遞可能性。
圖8說明使用實例網路模型產生與MHC等位基因相關聯之肽之呈遞可能性。
圖9說明使用實例網路模型產生與MHC等位基因相關聯之肽之呈遞可能性。
圖10說明使用實例網路模型產生與MHC等位基因相關聯之肽之呈遞可能性。
圖11說明使用實例網路模型產生與MHC等位基因相關聯之肽之呈遞可能性。
圖12說明使用實例網路模型產生與MHC等位基因相關聯之肽之呈遞可能性。
圖13A說明NSCLC患者中之突變負荷之樣本頻率分佈。
圖13B說明根據一實施例,所選擇患者之模擬疫苗中之經呈遞之新抗原的數目,該等患者係基於患者是否滿足最小突變負荷的納入標準來選擇。
圖13C根據一實施例,比較同疫苗相關的所選擇患者(其包括基於呈遞模型鑑別之治療子集)與同疫苗相關的所選擇患者(其包括經由目前先進技術模型鑑別之治療子集)之間的模擬疫苗中的經呈遞新抗原的數目。
圖13D比較以下兩者之間的模擬疫苗中的經呈遞新抗原的數目:基於HLA-A*02:01之每一等位基因呈遞模型鑑別之與疫苗相關的所選擇患者(其包括治療子集),與基於HLA-A*02:01及HLA-B*07:02之每一等位基因呈遞模型鑑別之與疫苗相關的所選擇患者(其包括治療子集)。根據一實施例,疫苗能力設定為v =20抗原決定基。
圖13E根據一實施例,比較基於突變負荷所選擇患者與藉由期望效用評分所選擇患者之間的模擬疫苗中的經呈遞新抗原的數目。
圖14A比較針對「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,在40%召回下,當各模型在包含五個不同測試樣本之測試集上測試時的陽性預測值(PPV),各測試樣本包含經呈遞肽:非呈遞肽之比率為1:2500的留存腫瘤樣本。
圖14B比較針對「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,在40%召回下,當各模型在包含15個不同測試樣本之測試集上測試時的PPV,各測試樣本包含經呈遞肽:非呈遞肽之比率為1:10,000的來自單一等位基因細胞株測試資料集的留存肽。
圖14C比較針對由「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型針對測試集鑑別之排名前5、10及20的體細胞突變,由T細胞識別(例如預先存在的T細胞反應)的體細胞突變的比例,該測試集包含12個不同測試樣本,各測試樣本取自具有至少一個預先存在的T細胞反應的患者。
圖14D比較針對由「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型針對測試集鑑別之排名前5、10及20的最小新抗原決定基,由T細胞識別(例如預先存在的T細胞反應)的最小新抗原決定基的比例,該測試集包含12個不同測試樣本,各測試樣本取自具有至少一個預先存在的T細胞反應的患者。
圖15A描繪對於九名患者之患者特異性新抗原肽庫的T細胞反應的偵測。
圖15B描繪對於四名患者之個別患者特異性新抗原肽的T細胞反應的偵測。
圖15C描繪患者CU04之ELISpot孔之實例影像。
圖16比較針對「全MS模型」及「錨殘基僅MS模型」,在40%召回下,當各模型在包含五個不同測試樣本之測試集上測試時的陽性預測值(PPV),各測試樣本包含經呈遞肽:非呈遞肽之比率為1:2500的留存腫瘤樣本。
圖17A描繪具有三個不同基因表現臨限值(TPM >0、1及2)之「全MS模型」、「肽MS模型」及MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14A之測試樣本0上測試時的完全精確度-召回曲線。
圖17B比較針對「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,在40%召回下,當各模型在包含15個不同測試樣本之測試集上測試時的PPV,各測試樣本包含經呈遞肽:非呈遞肽之比率為1:5,000的來自單一等位基因細胞株測試資料集的留存肽。
圖17C描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14A之測試樣本0上測試時的完全精確度-召回曲線。
圖17D描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14A之測試樣本1上測試時的完全精確度-召回曲線。
圖17E描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14A之測試樣本2上測試時的完全精確度-召回曲線。
圖17F描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14A之測試樣本3上測試時的完全精確度-召回曲線。
圖17G描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14A之測試樣本4上測試時的完全精確度-召回曲線。
圖17H描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*01:01細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17I描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*02:01細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17J描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*02:03細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17K描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*02:07細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17L描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*03:01細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17M描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*24:02細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17N描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*29:02細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17O描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*31:01細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17P描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*68:02細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17Q描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*35:01細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17R描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*44:02細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17S描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*44:03細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17T描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*51:01細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17U描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*54:01細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖17V描繪「全MS模型」、「肽MS模型」及具有三個不同基因表現臨限值(TPM >0、1及2)之MHCFlurry 1.2.0結合親和力模型,當各模型在來自圖14B之HLA-A*57:01細胞株測試資料集的留存肽上測試時的完全精確度-召回曲線,該等留存肽之經呈遞肽:非呈遞肽之比率為1:10,000。
圖18比較不同MS模型型式及模型化人類腫瘤中之HLA呈遞肽之先前方法29 ,在40%召回下,當各模型在圖14A之測試集上測試時的陽性預測值(PPV),該測試集包含五個不同測試樣本,各測試樣本包含經呈遞肽:非呈遞肽之比率為1:2500的留存腫瘤樣本。
圖19A描繪在HLA匹配的健康供體中利用新抗原進行的對照實驗的結果。
圖19B描繪在HLA匹配的健康供體中利用新抗原進行的對照實驗的結果。圖19B以出現次序分別揭示SEQ ID NO 27、24、21-22、31-36、21、37-45。
圖20描繪對於各供體之PHA陽性對照及圖15A中所描繪的各活體外擴增之T細胞反應的偵測。
圖21A描繪對於患者CU04之2號庫中之各個別患者特異性新抗原肽之T細胞反應的偵測。
圖21B描繪對於三次患者CU04問診中之每一者及兩次患者1-024-002問診中之每一者的個別患者特異性新抗原肽的T細胞反應的偵測,各問診發生在不同時間點時。
圖21C描繪對於個別患者特異性新抗原肽及對於兩次患者CU04問診中之每一者及兩次患者1-024-002問診中之每一者之患者特異性新抗原肽庫的T細胞反應的偵測,各問診發生在不同時間點時。
圖22描繪對於圖15A之患者之兩個患者特異性新抗原肽庫及對於DMSO陰性對照的T細胞反應的偵測。
圖23比較以下之預測效能:「MS模型」、「NetMHCIIpan排名」(NetMHCIIpan 3.177 ,採用在HLA-DRB1*15:01及HLA-DRB5*01:01之間的最低NetMHCIIpan百分點排名)及「NetMHCIIpan nM」(NetMHCIIpan 3.1,採用以nM為單位的在HLA-DRB1*15:01及HLA-DRB5*01:01之間的最強親和力),對HLA-DRB1*15:01/HLA-DRB5*01:01測試資料集中之肽進行排名。
圖24描繪一種用於對來自NSCLC患者之周邊血液之新抗原特異性記憶T細胞之TCR進行定序的方法。圖24以出現次序分別揭示SEQ ID NO 46-48。
圖25描繪用於將TCR引入至接受者細胞中之TCR構築體的例示性實施例。
圖26描繪用於將TCR選殖至用於療法發展之表現系統中之例示性P526構築體主鏈核苷酸序列。圖26揭示SEQ ID NO: 49。
圖27描繪用於將純系型1 TCR (p526 TCR1003 NONE TRB P2A TRA T2A copGFP二硫化物)選殖至用於療法發展之表現系統中之例示性構築體序列。圖27揭示SEQ ID NO: 50。
圖28描繪用於將純系型3 TCR (p526 TCR1005 NONE TRB P2A TRA T2A copGFP二硫化物)選殖至用於療法發展之表現系統中之例示性構築體序列。圖28揭示SEQ ID NO: 51。
圖29為根據一實施例,用於向患者提供定製、新抗原特異性治療之方法的流程圖。
圖30說明用於實施圖1及圖3中所展示之實體的實例電腦。

Claims (39)

  1. 一種用於鑑別一或多個T細胞之方法,該一或多個T細胞對於來自個體之一或多個腫瘤細胞之至少一個新抗原具有抗原特異性,該至少一個新抗原可能呈遞於該等腫瘤細胞表面上,該方法包含以下步驟: 自該個體之腫瘤細胞及正常細胞獲得外顯子組、轉錄組或全基因組核苷酸定序資料中之至少一者,其中該核苷酸定序資料用於獲得表示新抗原集中之每一者的肽序列的資料,該等新抗原藉由比較來自腫瘤細胞之核苷酸定序資料與來自正常細胞之核苷酸定序資料經鑑別,其中各新抗原之肽序列包含至少一個使其不同於由該個體正常細胞鑑別的對應野生型肽序列的改變; 將該等新抗原中之每一者之肽序列編碼成對應數值向量,各數值向量包括關於構成該肽序列之複數個胺基酸及該等胺基酸在該肽序列中之位置集的資訊; 使用電腦處理器,將該等數值向量輸入機器學習呈遞模型中,以產生該新抗原集之呈遞可能性集,該集中之各呈遞可能性表示對應新抗原由該個體之腫瘤細胞表面上之一或多個MHC等位基因呈遞的可能性,該機器學習呈遞模型包含: 至少基於訓練資料集所鑑別的複數個參數,包含: 對於複數個樣本中之各樣本,藉由質譜法量測結合於經鑑別存在於該樣本之MHC等位基因集中之至少一個MHC等位基因之肽的存在所獲得的標記;及 對於該等樣本中之每一者,訓練肽序列編碼成數值向量,包括關於構成該等肽之複數個胺基酸及該等胺基酸在該等肽中之位置集的資訊; 表示作為輸入所接收之該數值向量與基於該數值向量及該等參數作為輸出所產生的呈遞可能性之間關係的函數; 基於該呈遞可能性集選擇該新抗原集之子集,以產生經選擇之新抗原集; 鑑別對於該子集中該等新抗原中之至少一者具有抗原特異性的一或多個T細胞;及 返回該一或多個所鑑別T細胞。
  2. 如請求項1之方法,其中將該數值向量輸入該機器學習呈遞模型中包含: 將該機器學習呈遞模型應用於該新抗原之肽序列,以產生針對該一或多個MHC等位基因中每一者之依賴性分數,該依賴性分數指示該MHC等位基因是否將基於該肽序列之特定位置之特定胺基酸呈遞該新抗原。
  3. 如請求項2之方法,其中將該數值向量輸入該機器學習呈遞模型中進一步包含: 轉變該等依賴性分數,以產生各MHC等位基因之對應每一等位基因(per-allele)的可能性,該可能性指示對應MHC等位基因將呈遞對應新抗原的可能性;及 組合該等每一等位基因可能性,以產生該新抗原之呈遞可能性。
  4. 如請求項3之方法,其中轉變該等依賴性分數使該新抗原之呈遞模型化為該一或多個MHC等位基因之間係為互斥性的。
  5. 如請求項2之方法,其中將該數值向量輸入該機器學習呈遞模型中進一步包含: 轉變該等依賴性分數之組合,以產生呈遞可能性,其中轉變該等依賴性分數之組合使該新抗原之呈遞模型化為該一或多個MHC等位基因之間係干擾的。
  6. 如請求項2之方法,其中該呈遞可能性集進一步由至少一或多個等位基因非相互作用特徵鑑別,且進一步包含: 將該機器學習呈遞模型應用於等位基因非相互作用特徵,以產生針對該等位基因非相互作用特徵之依賴性分數,該依賴性分數指示該對應新抗原之肽序列是否將基於該等位基因非相互作用特徵被呈遞。
  7. 如請求項6之方法,其進一步包含: 組合該一或多個MHC等位基因中之各MHC等位基因的依賴性分數與該等位基因非相互作用特徵的依賴性分數;及 轉變各MHC等位基因之組合依賴性分數,以產生各MHC等位基因的每一等位基因的可能性,該可能性指示對應MHC等位基因將呈遞對應新抗原的可能性;及 組合該等每一等位基因可能性,以產生呈遞可能性。
  8. 如請求項6之方法,其進一步包含: 組合該等MHC等位基因中之每一者之依賴性分數與該等等位基因非相互作用特徵的依賴性分數;及 轉變該經組合依賴性分數,以產生呈遞可能性。
  9. 如請求項1之方法,其中該一或多個MHC等位基因包括兩個或更多個不同MHC等位基因。
  10. 如請求項1之方法,其中該等肽序列包含長度不為9個胺基酸的肽序列。
  11. 如請求項1之方法,其中編碼該肽序列包含使用獨熱編碼方案(one-hot encoding scheme)來編碼該肽序列。
  12. 如請求項1之方法,其中該複數個樣本包含以下中之至少一者: (a)一或多個細胞株,其經工程改造以表現單個MHC等位基因; (b)一或多個細胞株,其經工程改造以表現複數個MHC等位基因; (c)一或多個人類細胞株,其獲自或源自複數個患者; (d)新鮮或冷凍腫瘤樣本,其獲自複數個患者;及 (e)新鮮或冷凍組織樣本,其獲自複數個患者。
  13. 如請求項1之方法,其中該訓練資料集進一步包含以下中之至少一者: (a)與經分離肽中至少一者之肽-MHC結合親和力量測相關的資料;及 (b)與經分離肽中至少一者之肽-MHC結合穩定性量測相關的資料。
  14. 如請求項1之方法,其中該呈遞可能性集進一步經至少由該個體中該一或多個MHC等位基因之表現量鑑別,如藉由RNA-seq或質譜法所量測。
  15. 如請求項1之方法,其中該呈遞可能性集進一步係經包含以下中至少一者之特徵鑑別: (a)該新抗原集中之新抗原與該一或多個MHC等位基因之間的經預測親和力;及 (b)該新抗原編碼的肽-MHC複合物之經預測穩定性。
  16. 如請求項1之方法,其中該數值可能性集進一步係經包含以下中至少一者之特徵鑑別: (a)在其源蛋白序列內側接該新抗原編碼肽序列之C端序列;及 (b)在其源蛋白序列內側接該新抗原編碼肽序列之N端序列。
  17. 如請求項1之方法,其中選擇該經選擇之新抗原集包含基於該機器學習呈遞模型,選擇相對於未經選擇之新抗原在該腫瘤細胞表面上呈遞之可能性增加的新抗原。
  18. 如請求項1之方法,其中選擇該經選擇之新抗原集包含基於該機器學習呈遞模型,選擇相對於未經選擇之新抗原能夠在該個體中誘導腫瘤特異性免疫反應之可能性增加的新抗原。
  19. 如請求項1之方法,其中選擇該經選擇之新抗原集包含基於該呈遞模型,選擇相對於未經選擇之新抗原能夠由專職抗原呈遞細胞(APC)呈遞於初始T細胞之可能性增加的新抗原,視情況其中該APC為樹突狀細胞(DC)。
  20. 如請求項1之方法,其中選擇該經選擇之新抗原集包含基於該機器學習呈遞模型,選擇相對於未經選擇之新抗原經由中心或周邊耐受性受抑制之可能性降低的新抗原。
  21. 如請求項1之方法,其中選擇該經選擇之新抗原集包含基於該機器學習呈遞模型,選擇相對於未經選擇之新抗原能夠在該個體中誘導針對正常組織之自體免疫反應之可能性降低的新抗原。
  22. 如請求項1之方法,其中該一或多個腫瘤細胞係選自由以下組成之群:肺癌、黑素瘤、乳癌、卵巢癌、前列腺癌、腎癌、胃癌、結腸癌、睪丸癌、頭頸癌、胰臟癌、腦癌、B細胞淋巴瘤、急性骨髓性白血病、慢性骨髓性白血病、慢性淋巴球性白血病、T細胞淋巴球性白血病、非小細胞肺癌及小細胞肺癌。
  23. 如請求項1之方法,其進一步包含產生從該經選擇之新抗原集構築個人化癌症疫苗的產出。
  24. 如請求項23之方法,其中用於該個人化癌症疫苗之產出包含至少一個肽序列或至少一個編碼該經選擇之新抗原集之核苷酸序列。
  25. 如請求項1之方法,其中該機器學習呈遞模型為神經網路模型。
  26. 如請求項25之方法,其中該神經網路模型包括用於該至少兩個不同MHC等位基因之複數個網路模型,各網路模型指派至該至少兩個不同MHC等位基因中之對應MHC等位基因,且包括排列於一或多層中的一系列節點(nodes)。
  27. 如請求項26之方法,其中該神經網路模型係藉由更新該神經網路模型之參數訓練,且其中至少兩個網路模型之參數聯合更新以進行至少一個訓練迭代。
  28. 如請求項25之方法,其中該機器學習呈遞模型為包括一或多層節點之深度學習模型。
  29. 如請求項1之方法,其中鑑別該一或多個T細胞包含該一或多個T細胞與該子集中之該等新抗原中之一或多者在擴增該一或多個T細胞之條件下共培養。
  30. 如請求項1之方法,其中鑑別該一或多個T細胞包含使該一或多個T細胞與包含該子集中之該等新抗原中之一或多者之MHC多聚體在允許該T細胞與MHC多聚體之間結合的條件下接觸。
  31. 如請求項1之方法,其進一步包含鑑別該一或多個經鑑別之T細胞之一或多個T細胞受體(TCR)。
  32. 如請求項31之方法,其中鑑別該一或多個T細胞受體包含將該一或多個經鑑別之T細胞之T細胞受體序列定序。
  33. 一種經分離T細胞,其對於如請求項1之子集中之至少一個經選擇之新抗原具有抗原特異性。
  34. 如請求項32之方法,其進一步包含: 以基因工程改造複數個T細胞,以表現一或多個經鑑別之T細胞受體中之至少一者; 該複數個T細胞在擴增該複數個T細胞之條件下培養;及 將經擴增之T細胞輸注至該個體中。
  35. 如請求項34之方法,其中以基因工程改造該複數個T細胞以表現該一或多個經鑑別之T細胞受體中之至少一者包含: 將該一或多個經鑑別之T細胞之T細胞受體序列選殖至表現載體中;及 用該表現載體轉染該複數個T細胞中之每一者。
  36. 如請求項1之方法,其進一步包含: 該一或多個經鑑別之T細胞在擴增該一或多個經鑑別之T細胞之條件下培養鑑別;及 將經擴增之T細胞輸注至該個體中。
  37. 如請求項1之方法,其中使用來自該個體之5至30 mL之間的全血來鑑別對於該子集中之該等新抗原中之至少一者具有抗原特異性之該一或多個T細胞。
  38. 如請求項1之方法,其中該新抗原子集包含至多20個新抗原,且其中該一或多個經鑑別之T細胞識別該新抗原子集中之至少2個新抗原。
  39. 如請求項1之方法,其中該一或多個MHC等位基因為I類MHC等位基因。
TW107131173A 2017-09-05 2018-09-05 用於t細胞療法之新抗原鑑別 TW201920686A (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US201762554286P 2017-09-05 2017-09-05
US62/554,286 2017-09-05
US201762579734P 2017-10-31 2017-10-31
US62/579,734 2017-10-31
US201862644191P 2018-03-16 2018-03-16
US62/644,191 2018-03-16
US201862703197P 2018-07-25 2018-07-25
US62/703,197 2018-07-25

Publications (1)

Publication Number Publication Date
TW201920686A true TW201920686A (zh) 2019-06-01

Family

ID=65635144

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107131173A TW201920686A (zh) 2017-09-05 2018-09-05 用於t細胞療法之新抗原鑑別

Country Status (11)

Country Link
US (1) US20200363414A1 (zh)
EP (1) EP3679578A4 (zh)
JP (2) JP2020532323A (zh)
KR (1) KR20200066305A (zh)
CN (1) CN111315390A (zh)
AU (1) AU2018328220A1 (zh)
CA (1) CA3073812A1 (zh)
IL (1) IL273030B2 (zh)
TW (1) TW201920686A (zh)
WO (1) WO2019050994A1 (zh)
ZA (1) ZA202001531B (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014180490A1 (en) 2013-05-10 2014-11-13 Biontech Ag Predicting immunogenicity of t cell epitopes
WO2016128060A1 (en) 2015-02-12 2016-08-18 Biontech Ag Predicting t cell epitopes useful for vaccination
EP3389630B1 (en) 2015-12-16 2023-11-08 Gritstone bio, Inc. Neoantigen identification, manufacture, and use
US10828330B2 (en) 2017-02-22 2020-11-10 IO Bioscience, Inc. Nucleic acid constructs comprising gene editing multi-sites and uses thereof
CA3078744A1 (en) 2017-10-10 2019-04-18 Gritstone Oncology, Inc. Neoantigen identification using hotspots
KR20200090855A (ko) 2017-11-22 2020-07-29 그릿스톤 온콜로지, 인코포레이티드 신생항원에 대한 접합 에피토프 제시 감소
US11730387B2 (en) * 2018-11-02 2023-08-22 University Of Central Florida Research Foundation, Inc. Method for detection and diagnosis of lung and pancreatic cancers from imaging scans
US11599774B2 (en) * 2019-03-29 2023-03-07 International Business Machines Corporation Training machine learning model
CN110298036B (zh) * 2019-06-06 2022-07-22 昆明理工大学 一种基于词性增量迭代的在线医疗文本症状识别方法
EP3990011A4 (en) * 2019-06-24 2023-11-01 H. Lee Moffitt Cancer Center & Research Institute, Inc. PEPTIDE-BASED SCREENING METHOD FOR IDENTIFYING NEO-ANTIGENS FOR USE WITH TUMOR-INFILTRATING LYMPHOCYTES
WO2021011544A1 (en) 2019-07-16 2021-01-21 Gilead Sciences, Inc. Hiv vaccines and methods of making and using
WO2021022081A1 (en) * 2019-07-30 2021-02-04 Breakbio Corp. Method for treating solid tumors
CN110277135B (zh) * 2019-08-10 2021-06-01 杭州新范式生物医药科技有限公司 一种基于预期疗效选择个体化肿瘤新抗原的方法和系统
CN110514845B (zh) * 2019-08-22 2022-09-27 深圳新合睿恩生物医疗科技有限公司 一种肿瘤新生抗原免疫原性检测方法及检测平台
CN110534156B (zh) * 2019-09-02 2022-06-17 深圳市新合生物医疗科技有限公司 一种提取免疫治疗新抗原的方法及系统
WO2021048400A1 (en) * 2019-09-13 2021-03-18 Evaxion Biotech Aps Method for identifying t-cell epitopes
KR102184720B1 (ko) * 2019-10-11 2020-11-30 한국과학기술원 암 세포 표면의 mhc-펩타이드 결합도 예측 방법 및 분석 장치
WO2021091541A1 (en) * 2019-11-05 2021-05-14 Kri Technologies Incorporated Identifying cancer neoantigens for personalized cancer immunotherapy
GB202003669D0 (en) * 2020-03-13 2020-04-29 Univ Oxford Innovation Ltd Method for identifying neo-antigens
CN111599410B (zh) * 2020-05-20 2023-06-13 深圳市新合生物医疗科技有限公司 一种整合多组学数据提取微卫星不稳定免疫治疗新抗原的方法和应用
CN111709867B (zh) * 2020-06-10 2022-11-25 四川大学 基于新型全卷积网络的等模矢量分解图像加密分析方法
CN112086129B (zh) * 2020-09-23 2021-04-06 深圳吉因加医学检验实验室 预测肿瘤组织cfDNA的方法及系统
WO2022098936A1 (en) * 2020-11-06 2022-05-12 Amazon Technologies, Inc. Selecting neoantigens for personalized cancer vaccine
EP4248368A1 (en) * 2020-11-18 2023-09-27 Kiromic BioPharma, Inc. Disease-associated isoform identifier
CN113106062A (zh) * 2021-04-12 2021-07-13 赜誉(上海)生物科技有限公司 一种肿瘤新生抗原特异性肿瘤浸润淋巴细胞共培养方法
CN113160887B (zh) * 2021-04-23 2022-06-14 哈尔滨工业大学 一种融合了单细胞tcr测序数据的肿瘤新生抗原筛选方法
JP2024518302A (ja) 2021-04-29 2024-05-01 イェダ リサーチ アンド デベロップメント カンパニー リミテッド Ras誘導性再発性ネオアンチゲンに対するt細胞受容体およびそれらを同定するための方法
US20220383996A1 (en) * 2021-05-27 2022-12-01 Amazon Technologies, Inc. Assigning peptides to peptide groups for vaccine development
WO2023077113A1 (en) 2021-10-29 2023-05-04 Immunoracle Inc. Methods of analyzing a sample for cancer-specific immune cells
CN114420200A (zh) * 2022-01-19 2022-04-29 时代生物科技(深圳)有限公司 一种功能性肽的筛选方法
CN114649094B (zh) * 2022-03-30 2022-11-15 广东省人民医院 一种基于核磁共振的乳腺癌多参数临床决策辅助装置
GB202216453D0 (en) * 2022-11-04 2022-12-21 Lisziewicz Julianna Identification of antigens which induce t-cell responses
CN116469473B (zh) * 2023-06-15 2023-09-22 北京智因东方转化医学研究中心有限公司 T细胞亚型鉴定的模型训练方法、装置、设备及存储介质
CN117316273A (zh) * 2023-11-02 2023-12-29 聊城市人民医院 基于图神经网络的肿瘤个体化新抗原多肽筛选方法及装置
CN117743957B (zh) * 2024-02-06 2024-05-07 北京大学第三医院(北京大学第三临床医学院) 一种基于机器学习的Th2A细胞的数据分选方法及相关设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE404669T1 (de) * 2000-04-04 2008-08-15 Univ Rochester In brust- und blasenkrebs differentiell exprimiertes gen und durch dieses kodierte polypeptide
CA2743669C (en) * 2008-11-24 2018-10-16 Helmholtz Zentrum Muenchen Deutsches Forschungszentrum Fuer Gesundheit Und Umwelt (Gmbh) High affinity t cell receptor and use thereof
ES2729759T3 (es) * 2012-07-12 2019-11-06 Persimmune Inc Vacunas contra el cáncer personalizadas y terapias celulares inmunitarias adoptivas
KR102341899B1 (ko) * 2013-04-07 2021-12-21 더 브로드 인스티튜트, 인코퍼레이티드 개인맞춤화 신생물 백신을 위한 조성물 및 방법
WO2014180490A1 (en) * 2013-05-10 2014-11-13 Biontech Ag Predicting immunogenicity of t cell epitopes
KR101503341B1 (ko) * 2014-03-12 2015-03-18 국립암센터 자가암항원 특이적 cd8+ t 세포의 분리 및 증식방법
US20150278441A1 (en) * 2014-03-25 2015-10-01 Nec Laboratories America, Inc. High-order semi-Restricted Boltzmann Machines and Deep Models for accurate peptide-MHC binding prediction
US10987412B2 (en) * 2014-09-17 2021-04-27 The John Hopkins University Reagents and methods for identifying, enriching, and/or expanding antigen-specific T cells
EP3234193B1 (en) * 2014-12-19 2020-07-15 Massachusetts Institute of Technology Molecular biomarkers for cancer immunotherapy
WO2016145578A1 (en) * 2015-03-13 2016-09-22 Syz Cell Therapy Co. Methods of cancer treatment using activated t cells
AU2016264623B2 (en) * 2015-05-20 2022-06-30 Dana-Farber Cancer Institute, Inc. Shared neoantigens
EP3389630B1 (en) * 2015-12-16 2023-11-08 Gritstone bio, Inc. Neoantigen identification, manufacture, and use
BR112019016657A2 (pt) * 2017-02-12 2020-04-07 Neon Therapeutics Inc métodos baseados em hla e composições e usos destes

Also Published As

Publication number Publication date
US20200363414A1 (en) 2020-11-19
ZA202001531B (en) 2021-08-25
IL273030A (en) 2020-04-30
CN111315390A (zh) 2020-06-19
AU2018328220A1 (en) 2020-04-23
IL273030B1 (en) 2023-11-01
KR20200066305A (ko) 2020-06-09
EP3679578A1 (en) 2020-07-15
CA3073812A1 (en) 2019-03-14
JP2020532323A (ja) 2020-11-12
IL273030B2 (en) 2024-03-01
WO2019050994A1 (en) 2019-03-14
WO2019050994A8 (en) 2020-04-02
JP2023162369A (ja) 2023-11-08
AU2018328220A8 (en) 2020-05-07
EP3679578A4 (en) 2021-06-30

Similar Documents

Publication Publication Date Title
TWI816702B (zh) 利用熱點識別新抗原之方法及電腦系統
JP7480064B2 (ja) パンアレルモデルによる新生抗原の特定方法
TW201920686A (zh) 用於t細胞療法之新抗原鑑別
US20220154281A1 (en) Identification of neoantigens with mhc class ii model
US20200105377A1 (en) Neoantigen identification, manufacture, and use
AU2024202903A1 (en) Neoantigen identification, manufacture, and use
TW201733598A (zh) 新抗原辨識、製造及用途