JP2022518355A - Hlaクラスii特異的エピトープの予測およびcd4+ t細胞の特徴付けのための方法およびシステム - Google Patents

Hlaクラスii特異的エピトープの予測およびcd4+ t細胞の特徴付けのための方法およびシステム Download PDF

Info

Publication number
JP2022518355A
JP2022518355A JP2021536205A JP2021536205A JP2022518355A JP 2022518355 A JP2022518355 A JP 2022518355A JP 2021536205 A JP2021536205 A JP 2021536205A JP 2021536205 A JP2021536205 A JP 2021536205A JP 2022518355 A JP2022518355 A JP 2022518355A
Authority
JP
Japan
Prior art keywords
hla
peptide
drb1
sequence
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021536205A
Other languages
English (en)
Other versions
JP7236543B2 (ja
JPWO2020132586A5 (ja
Inventor
マイケル スティーブン ルーニー,
ジェニファー グレイス アベリン,
ドミニク バーセルミ,
ロバート カメン,
Original Assignee
ビオンテック ユーエス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ビオンテック ユーエス インコーポレイテッド filed Critical ビオンテック ユーエス インコーポレイテッド
Publication of JP2022518355A publication Critical patent/JP2022518355A/ja
Publication of JPWO2020132586A5 publication Critical patent/JPWO2020132586A5/ja
Priority to JP2023028268A priority Critical patent/JP7531009B2/ja
Application granted granted Critical
Publication of JP7236543B2 publication Critical patent/JP7236543B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/39Medicinal preparations containing antigens or antibodies characterised by the immunostimulating additives, e.g. chemical adjuvants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70539MHC-molecules, e.g. HLA-molecules
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • C07K16/2833Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against MHC-molecules, e.g. HLA-molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Organic Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Medicinal Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)

Abstract

本開示は、個別化がんワクチンを調製するための方法を提供する。本開示は、機械学習HLA-ペプチド提示予測モデルを訓練するための方法も提供する。本明細書に記載の方法および組成物は、広範囲の適用に使用される。例えば、本明細書に記載の方法および組成物を、免疫原性抗原ペプチドを同定するために使用することができ、また、個別化医薬品などの薬物の開発、ならびに抗原特異的T細胞の単離および特徴付けのために使用することができる。

Description

相互参照
本出願は、それぞれの全体が参照により本明細書に組み込まれる、2018年12月21日出願の米国仮出願第62/783,914号;2019年3月29日出願の米国仮出願第62/826,827号;2019年5月31日出願の米国仮出願第62/855,379号;および2019年8月23日出願の米国仮出願第62/891,101号の利益を主張する。
背景
主要組織適合性遺伝子複合体(MHC)は、ヒト白血球抗原(HLA)遺伝子をコードする遺伝子複合体である。HLA遺伝子は、循環T細胞に対してヒト細胞の表面上にディスプレイされるタンパク質ヘテロ二量体として発現される。HLA遺伝子は、高度に多型的であり、それにより、HLA遺伝子による適応免疫系の微調整が可能になる。適応免疫応答は、一部において、ヒト白血球抗原(HLA)ヘテロ二量体と結合した疾患関連ペプチド抗原をディスプレイする細胞を同定し、排除するT細胞の能力に依拠する。
ヒトでは、内因性および外因性タンパク質は、プロテアソームによって、ならびに細胞質基質およびエンドソーム/リソソームのプロテアーゼおよびペプチダーゼによってプロセシングされてペプチドになり、MHC遺伝子によってコードされる2つのクラスの細胞表面タンパク質によって提示される。これらの細胞表面タンパク質は、ヒト白血球抗原(HLAクラスIおよびクラスII)と称され、それらに結合し、免疫応答を引き出すペプチドの群はHLAエピトープと称される。HLAエピトープは、免疫系が病原体感染および自己がん化(transformation of self)などの危険シグナルを検出することを可能にする重要な構成成分である。CD4+ T細胞は、樹状細胞およびマクロファージなどの抗原提示細胞(APC)上にディスプレイされるクラスII MHC(HLA-DR、HLA-DQ、およびHLA-DP)エピトープを認識する。HLAクラスII-リガンドの内因性プロセシングおよび提示は複雑な過程であり、種々のシャペロン、および酵素のサブセットを必要とするが、それらの全てが十分に特徴付けられているわけではない。HLAクラスII-ペプチドの提示により、ヘルパーT細胞が活性化され、その後、B細胞分化および抗体産生ならびにCTL応答が促進される。活性化されたヘルパーT細胞により、他のT細胞を活性化し、その分化を誘導するサイトカインおよびケモカインの分泌もなされる。
HLAクラスIIヘテロ二量体毎のペプチド結合の優先性を理解することが、いずれのがんまたは腫瘍特異的抗原によりがんまたは腫瘍特異的T細胞応答が引き出される可能性が高いかを首尾よく予測するための鍵になる。特定のHLAクラスII関連ペプチド(例えば、新抗原ペプチド)を同定し、単離する方法が必要とされている。そのような方法体系および単離された分子は、例えば、これだけに限定されないが、免疫に基づく治療薬を含めた治療薬の開発に有用である。
概要
本明細書に記載の方法および組成物は、広範囲の適用に使用される。例えば、本明細書に記載の方法および組成物を、免疫原性抗原ペプチドを同定するために使用することができ、また、個別化医薬品などの薬物の開発、ならびに抗原特異的T細胞の単離および特徴付けのために使用することができる。
CD4+ T細胞応答は、抗腫瘍活性を有し得る。クラスII予測を使用しない場合、CD4+ T細胞応答が高い率で示される可能性がある(例えば、NeoVaxによる試験においてSLPエピトープの60%(NT-001において49%、Ott et al., Nature, 2017 Jul 13; 547 (7662): 217-221を参照されたい)、およびBiontechによる試験においてmRNAエピトープの48%、Sahin et al., Nature, 2017 Jul 13; 547 (7662): 222-226を参照されたい)。これらのエピトープが一般にはネイティブなまま(腫瘍によってまたは食作用性DCによって)提示されるかどうかは明らかでない場合がある。真に提示されるHLAクラスII結合性エピトープの同定を改善することにより、高CD4+ T応答率を治療有効性に変換することが望ましい可能性がある。
遺伝子発現、酵素による切断、および経路/局在化の偏りの役割は、頑強には数量化されていない可能性がある。より関連性のある経路がオートファジー(腫瘍細胞によるHLAクラスII提示)であるかファゴサイトーシス(APCによる腫瘍エピトープのHLAクラスII提示)であるかは不明であり得るが、大多数の既存のMSデータはオートファジーに由来すると推定することができる。NetMHCIIpanが現行の予測標準であり得るが、これは正確ではないと考えられる場合がある。3つのHLAクラスII遺伝子座(DR、DP、およびDQ)のうち、HLA-DRのある特定の共通の対立遺伝子に関してのみデータが存在し得る。
HLA Class II提示の規則の学習に関しては、当該分野の標準および本提唱手法を含めた、種々のデータ生成手法が存在し得る。当該分野の標準は、NetMHCIIpan予測器の基礎であり得る親和性測定、ロースループットがもたらされることおよび放射性試薬の必要性を含み得、また、当該分野の標準では、プロセシングの役割が欠損している。本提唱手法は、質量分析を含み得、その場合、細胞株/組織/腫瘍からのデータがオートファジーに関するプロセシング規則の決定に役立ち得、また、単一対立遺伝子MSにより、対立遺伝子特異的結合規則の決定が可能になり得る(複対立遺伝子MSデータは、効率的な学習のためにはあまりにも複雑であることが推定される(Bassani-Sternberg. MCP. 2018))。
新しいHLAクラスII予測器を検証するための以下のような種々のやり方があり得る:デフォルト設定であり得る、提出されたMSデータに対する検証;免疫モニタリングデータにより、腫瘍提示ではなくAPCに対するワクチンペプチドローディングを評価することができ、データを多くの異なる対立遺伝子にわたって薄く広げることができる遡及的ワクチン試験(例えば、NT-001);不調和に予測されるペプチド(2~3の対立遺伝子に対してのみ)についての測定値を得るように構成することができる生化学的親和性測定;Neon優先エピトープおよびNetMHCIIpan優先エピトープによりex vivoにおけるT細胞応答が誘導される率を試験するために構成することができるT細胞誘導。
T細胞誘導による検証に関しては、デフォルトの手法は、不調和に予測されるTCGAのneoORFを評価することを含み得、誘導材料は、健康なドナーAPCおよびT細胞を含み得、誘導および読み取りは、SLP(約15merのペプチド)によるものであり得る。ランダムなペプチドでは高い応答率が生じる可能性があり、また、SLPではプロセシングへの対処が不十分である可能性がある。可能性のある解決法は、mRNAによる誘導を含み得る。
本明細書に開示される方法は、エピトープ予測のための対立遺伝子特異的機械学習法の訓練のためのLC-MS/MS単一対立遺伝子データを生成することを含み得る。そのような方法は、予測モデルの性能を向上させる偽陽性を厳密に取り除くために品質メトリクスのセットを利用してLC-MS/MSデータ品質を向上させること;HLA-リガンドームLC-MS/MSデータセットから対立遺伝子特異的HLAクラスII結合性コアを同定すること;機械学習アルゴリズムを利用してHLAクラスII-リガンドおよびエピトープ予測を改善すること;ならびに/または、HLAクラスII-リガンド提示に影響を及ぼし、HLAクラスIIエピトープ予測を改善する生物学的変数、例えば、遺伝子発現、切断性、遺伝子の偏り、細胞の局在化、および二次構造などを同定することを含み得る。
(a)複数の提示予測を生成するために、機械学習HLAペプチド提示予測モデルを使用して複数の候補ペプチド配列のアミノ酸情報を処理するステップであって、複数の候補ペプチド配列の各候補ペプチド配列は、対象のゲノムもしくはエクソームによってコードされ、複数の提示予測は、複数の候補ペプチド配列の各々についてのHLA提示予測を含み、各HLA提示予測により、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質により複数の候補ペプチド配列のうちの所与の候補ペプチド配列が提示され得る可能性が示され、機械学習HLAペプチド提示予測モデルは、訓練用細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された訓練用ペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、(b)少なくとも複数の提示予測に基づいて、複数のペプチド配列のうち、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つによって提示されるペプチド配列を同定するステップと、を含み、機械学習HLAペプチド提示予測モデルの陽性適中率(PPV)は、提示PPV決定法に従うと少なくとも0.07である、方法が本明細書で提供される。
(a)複数の結合予測を生成するために、機械学習HLAペプチド結合予測モデルを使用して対象のゲノムまたはエクソームによってコードされる複数のペプチド配列のアミノ酸情報を処理するステップであって、複数の結合予測は、複数の候補ペプチド配列の各々についてのHLA結合予測を含み、各結合予測により、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質が複数の候補ペプチド配列のうちの所与の候補ペプチド配列に結合する可能性が示され、機械学習HLAペプチド結合予測モデルは、HLAクラスIIタンパク質またはHLAクラスIIタンパク質類似体に結合することが同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、(b)少なくとも複数の結合予測に基づいて、複数のペプチド配列のうち、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つとの結合に関する閾値結合予測確率値よりも大きな確率を有するペプチド配列を同定するステップとを含み、機械学習HLAペプチド結合予測モデルの陽性適中率(PPV)は、結合PPV決定法に従うと少なくとも0.1である、方法が本明細書で提供される。
一部の実施形態では、機械学習HLAペプチド提示予測モデルは、訓練用細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された訓練用ペプチドの配列の配列情報を含む訓練用データを使用して訓練される。
一部の実施形態では、方法は、提示予測に基づいて、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つによって提示されることが同定された少なくとも2つのペプチドに順位を付けることを含む。
一部の実施形態では、方法は、2つまたはそれよりも多くの順位付けされたペプチドのうちの1つまたは複数のペプチドを選択することを含む。
一部の実施形態では、方法は、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つによって提示されることが同定された複数のうちの1つまたは複数のペプチドを選択することを含む。
一部の実施形態では、方法は、提示予測に基づいて順位付けされた2つまたはそれよりも多くのペプチドのうちの1つまたは複数のペプチドを選択することを含む。
一部の実施形態では、複数の試験ペプチド配列のアミノ酸情報を処理して、複数の試験提示予測を生成し、各試験提示予測により、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質により複数の試験ペプチド配列のうちの所与の試験ペプチド配列が提示され得る可能性が示される場合に、機械学習HLAペプチド提示予測モデルの陽性適中率(PPV)が少なくとも0.07であり、複数の試験ペプチド配列は、(i)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された少なくとも1つのヒットペプチド配列と、(ii)生物体のゲノムによってコードされるタンパク質内に含有される少なくとも499のデコイペプチド配列とを含む少なくとも500の試験ペプチド配列を含み、生物体と対象が同じ種であり、複数の試験ペプチド配列は、少なくとも1つのヒットペプチド配列と少なくとも499のデコイペプチド配列を1:499の比で含み、機械学習HLAペプチド提示予測モデルにより、複数の試験ペプチド配列の上位パーセンテージは、細胞において発現されるHLAタンパク質によって提示されることが予測される。
一部の実施形態では、複数の試験ペプチド配列のアミノ酸情報を処理して、複数の試験結合予測を生成し、各試験結合予測により、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質が複数の試験ペプチド配列のうちの所与の試験ペプチド配列に結合する可能性が示される場合に、機械学習HLAペプチド提示予測モデルの陽性適中率(PPV)が少なくとも0.1であり、複数の試験ペプチド配列は、(i)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された少なくとも1つのヒットペプチド配列と、(ii)細胞において発現されるHLAタンパク質、例えば、細胞において発現される単一HLAタンパク質(例えば、単一対立遺伝子細胞)によって提示されることが質量分析によって同定された少なくとも1つのペプチド配列を含むタンパク質内に含有される少なくとも19のデコイペプチド配列とを含む少なくとも20の試験ペプチド配列を含み、複数の試験ペプチド配列は、少なくとも1つのヒットペプチド配列と少なくとも19のデコイペプチド配列を1:19の比で含み、機械学習HLAペプチド提示予測モデルにより、複数の試験ペプチド配列の上位パーセンテージが細胞において発現されるHLAタンパク質に結合することが予測される。
一部の実施形態では、少なくとも1つのヒットペプチド配列とデコイペプチド配列の間にアミノ酸配列の重複が存在しない。
一部の実施形態では、機械学習HLAペプチド提示予測モデルの陽性適中率(PPV)は、少なくとも0.08、0.09、0.1、0.11、0.12、0.13、0.14、0.15、0.16、0.17、0.18、0.19、0.2、0.21、0.22、0.23、0.24、0.25、0.26、0.27、0.28、0.29、0.3、0.31、0.32、0.33、0.34、0.35、0.36、0.37、0.38、0.39、0.4、0.41、0.42、0.43、0.44、0.45、0.46、0.47、0.48、0.49、0.5、0.51、0.52、0.53、0.54、0.55、0.56、0.57、0.58、0.59、0.6、0.61、0.62、0.63、0.64、0.65、0.66、0.67、0.68、0.69、0.7、0.71、0.72、0.73、0.74、0.75、0.76、0.77、0.78、0.79、0.8、0.81、0.82、0.83、0.84、0.85、0.86、0.87、0.88、0.89、0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98または0.99である。
一部の実施形態では、少なくとも1つのヒットペプチド配列は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100のヒットペプチド配列を含む。
一部の実施形態では、少なくとも499のデコイペプチド配列は、少なくとも500 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、23000、24000、25000、26000、27000、28000、29000、30000、31000、32000、33000、34000、35000、36000、37000、38000、39000、40000、41000、42000、43000、44000、45000、46000、47000、48000、49000、50000、52500、55000、57500、60000、62500、65000、67500、70000、72500、75000、77500、80000、82500、85000、87500、90000、92500、95000、97500、100000、125000、150000、175000、200000、225000、250000、275000、300000、325000、350000、375000、400000、425000、450000、475000、500000、600000、700000、800000、900000または1000000のデコイペプチド配列を含む。当業者は、ヒット:デコイの比の変化によりPPVが変化することを理解することができる。
一部の実施形態では、少なくとも500の試験ペプチド配列は、少なくとも600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、23000、24000、25000、26000、27000、28000、29000、30000、31000、32000、33000、34000、35000、36000、37000、38000、39000、40000、41000、42000、43000、44000、45000、46000、47000、48000、49000、50000、52500、55000、57500、60000、62500、65000、67500、70000、72500、75000、77500、80000、82500、85000、87500、90000、92500、95000、97500、100000、125000、150000、175000、200000、225000、250000、275000、300000、325000、350000、375000、400000、425000、450000、475000、500000、600000、700000、800000、900000または1000000の試験ペプチド配列を含む。
一部の実施形態では、上位パーセンテージは、上位0.20%、0.30%、0.40%、0.50%、0.60%、0.70%、0.80%、0.90%、1.00%、1.10%、1.20%、1.30%、1.40%、1.50%、1.60%、1.70%、1.80%、1.90%、2.00%、2.10%、2.20%、2.30%、2.40%、2.50%、2.60%、2.70%、2.80%、2.90%、3.00%、3.10%、3.20%、3.30%、3.40%、3.50%、3.60%、3.70%、3.80%、3.90%、4.00%、4.10%、4.20%、4.30%、4.40%、4.50%、4.60%、4.70%、4.80%、4.90%、5.00%、5.10%、5.20%、5.30%、5.40%、5.50%、5.60%、5.70%、5.80%、5.90%、6.00%、6.10%、6.20%、6.30%、6.40%、6.50%、6.60%、6.70%、6.80%、6.90%、7.00%、7.10%、7.20%、7.30%、7.40%、7.50%、7.60%、7.70%、7.80%、7.90%、8.00%、8.10%、8.20%、8.30%、8.40%、8.50%、8.60%、8.70%、8.80%、8.90%、9.00%、9.10%、9.20%、9.30%、9.40%、9.50%、9.60%、9.70%、9.80%、9.90%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%である。
一部の実施形態では、少なくとも1つのヒットペプチド配列は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100のヒットペプチド配列を含む。
一部の実施形態では、少なくとも19のデコイペプチド配列は、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、23000、24000、25000、26000、27000、28000、29000、30000、31000、32000、33000、34000、35000、36000、37000、38000、39000、40000、41000、42000、43000、44000、45000、46000、47000、48000、49000、50000、52500、55000、57500、60000、62500、65000、67500、70000、72500、75000、77500、80000、82500、85000、87500、90000、92500、95000、97500、100000、125000、150000、175000、200000、225000、250000、275000、300000、325000、350000、375000、400000、425000、450000、475000、500000、600000、700000、800000、900000または1000000のデコイペプチド配列を含む。
一部の実施形態では、少なくとも20の試験ペプチド配列は、少なくともを含み、少なくとも500の試験ペプチド配列は、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、23000、24000、25000、26000、27000、28000、29000、30000、31000、32000、33000、34000、35000、36000、37000、38000、39000、40000、41000、42000、43000、44000、45000、46000、47000、48000、49000、50000、52500、55000、57500、60000、62500、65000、67500、70000、72500、75000、77500、80000、82500、85000、87500、90000、92500、95000、97500、100000、125000、150000、175000、200000、225000、250000、275000、300000、325000、350000、375000、400000、425000、450000、475000、500000、600000、700000、800000、900000または1000000の試験ペプチド配列試験ペプチド配列を含む。
一部の実施形態では、上位パーセンテージは、上位5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%または40%である。
一部の実施形態では、PPVは、表11の対応するHLA対立遺伝子によってコードされるタンパク質についての表11の2列目のそれぞれのPPVよりも大きい。一部の実施形態では、PPVは、表11の対応するHLA対立遺伝子によってコードされるタンパク質についての表11の3列目のそれぞれのPPVと少なくとも等しい。
一部の実施形態では、PPVは、HLAクラスII対立遺伝子によってコードされるタンパク質についての表12の2列目のそれぞれのPPVと等しいまたはそれよりも大きい。
一部の実施形態では、PPVは、HLAクラスII対立遺伝子によってコードされるタンパク質についての表16の2列目のそれぞれのPPVよりも大きい。
一部の実施形態では、対象は、単一の対象である。
一部の実施形態では、対象は、哺乳動物である。
一部の実施形態では、対象は、ヒトである。
一部の実施形態では、訓練用細胞は、対象の細胞のクラスII HLA対立遺伝子によってコードされる単一のタンパク質を発現する細胞である。
一部の実施形態では、訓練用細胞は、単一対立遺伝子HLA細胞、またはアフィニティータグを有するHLA対立遺伝子を発現する細胞である。
一部の実施形態では、対象の細胞は、がん細胞を含む。
一部の実施形態では、方法は、ペプチド配列を同定するためのものである。
一部の実施形態では、方法は、ペプチド配列を選択するためのものである。
一部の実施形態では、方法は、がん治療を調製するためのものである。
一部の実施形態では、方法は、対象特異的がん治療を調製するためのものである。
一部の実施形態では、方法は、がん細胞特異的がん治療を調製するためのものである。
一部の実施形態では、複数のペプチド配列の各ペプチド配列は、がんに関連付けられる。
一部の実施形態では、複数のペプチド配列のうちの少なくとも1つのペプチド配列は、対象のがん細胞によって過剰発現される。
一部の実施形態では、複数のペプチド配列の各ペプチド配列は、対象のがん細胞によって過剰発現される。
一部の実施形態では、複数のペプチド配列のうちの少なくとも1つのペプチド配列は、がん細胞特異的ペプチドである。
一部の実施形態では、複数のペプチド配列の各ペプチド配列は、がん細胞特異的ペプチドである。
一部の実施形態では、複数のペプチド配列の各ペプチド配列は、対象のがん細胞によって発現される。
一部の実施形態では、複数のペプチド配列のうちの少なくとも1つのペプチド配列は、対象の非がん細胞によってコードされない。
一部の実施形態では、複数のペプチド配列の各ペプチド配列は、対象の非がん細胞によってコードされない。
一部の実施形態では、複数のペプチド配列のうちの少なくとも1つのペプチド配列は、対象の非がん細胞では発現されない。
一部の実施形態では、複数のペプチド配列の各ペプチド配列は、対象の非がん細胞では発現されない。
一部の実施形態では、方法は、対象の複数のペプチド配列を得ることを含む。
一部の実施形態では、方法は、対象の複数のポリヌクレオチド配列を得ることを含む。
一部の実施形態では、方法は、対象のゲノムもしくはエクソームによってまたは対象における病原体もしくはウイルスによってコードされる複数のペプチド配列をコードする対象の複数のポリヌクレオチド配列を得ることを含む。
一部の実施形態では、方法は、対象のゲノムまたはエクソームによってコードされる複数のペプチド配列をコードする対象の複数のポリヌクレオチド配列をコンピュータプロセッサによって得ることを含む。
一部の実施形態では、方法は対象の複数のポリヌクレオチド配列をゲノム配列決定またはエクソーム配列決定によって得ることを含む、請求項のいずれか一項に記載の方法。
一部の実施形態では、方法は、対象の複数のポリヌクレオチド配列を全ゲノム配列決定または全エクソーム配列決定によって得ることを含む。
一部の実施形態では、処理するステップは、コンピュータプロセッサによって処理することを含む。
一部の実施形態では、処理するステップは、少なくとも複数のペプチド配列のアミノ酸情報に基づいて複数の予測変数を生成することを含む。
一部の実施形態では、機械学習HLA-ペプチド提示予測モデルを使用して複数の予測変数を処理すること。
一部の実施形態では、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質は、対象によって発現されるクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質である。
一部の実施形態では、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質は、対象のがん細胞によって発現されるクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質である。
一部の実施形態では、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質は、対象の細胞のクラスII HLA対立遺伝子によってコードされる単一のタンパク質である。
一部の実施形態では、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質は、対象の細胞のクラスII HLA対立遺伝子によってコードされる2種、3種、4種、5種または6種またはそれよりも多くのタンパク質である。
一部の実施形態では、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質は、対象の細胞のクラスII HLA対立遺伝子によってコードされる各タンパク質である。
一部の実施形態では、方法は、対象に、ペプチド配列の選択されたサブセットの1つまたは複数を含む組成物を投与するステップをさらに含む。
一部の実施形態では、複数のペプチド配列を同定するステップは、対象のがん細胞由来のDNA、RNA、またはタンパク質配列を対象の正常細胞由来のDNA、RNA、またはタンパク質配列と比較することを含み、ここで、複数のペプチドの各々は、対象のがん細胞に存在し、対象の正常な細胞には存在しない少なくとも1つの変異を含む。
一部の実施形態では、機械学習HLA-ペプチド提示予測モデルは、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、ここで、訓練用データは、アミノ酸位置情報を含む訓練用ペプチド配列情報を含み、訓練用ペプチド配列情報は、細胞において発現されるHLAタンパク質に関連付けられる、複数の予測変数;ならびに、アミノ酸位置情報と、アミノ酸位置情報および複数の予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む。
一部の実施形態では、同定するステップは、複数のペプチド配列のうち、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つによって提示される確率が提示予測確率値の閾値よりも大きいペプチド配列を同定することを含む。
一部の実施形態では、機械学習HLAペプチド提示予測モデルによって提示されることが予測された複数の試験ペプチド配列の0.2%のうちの1つまたは複数の、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つによって提示される確率が提示予測確率値の閾値よりも高い。
一部の実施形態では、機械学習HLAペプチド提示予測モデルによって提示されることが予測された複数の試験ペプチド配列の0.2%の各々の、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つによって提示される確率が提示予測確率値の閾値よりも高い。
一部の実施形態では、陽性の数は、ヒットの数と等しくなるように制約される。
一部の実施形態では、質量分析は、単一対立遺伝子質量分析である。
一部の実施形態では、ペプチドは、オートファジーを通じて、細胞において発現されるHLAタンパク質によって提示される。
一部の実施形態では、ペプチドは、ファゴサイトーシスを通じて、細胞において発現されるHLAタンパク質によって提示される。
一部の実施形態では、複数の予測変数は、ペプチドを含む供給源タンパク質の発現レベル予測器を含む。
一部の実施形態では、複数の予測変数は、ペプチドを含む供給源タンパク質の安定性予測器を含む。
一部の実施形態では、複数の予測変数は、ペプチドを含む供給源タンパク質の分解速度予測器を含む。
一部の実施形態では、複数の予測変数は、ペプチドを含む供給源タンパク質のタンパク質切断性予測器を含む。
一部の実施形態では、複数の予測変数は、ペプチドを含む供給源タンパク質の細胞または組織局在化予測器を含む。
一部の実施形態では、複数の予測変数は、ペプチドを含む供給源タンパク質の細胞内プロセシング方式の予測器を含み、供給源タンパク質のプロセシング方式は、供給源タンパク質が、とりわけ、オートファジー、ファゴサイトーシス、および細胞内輸送に供されるかどうかの予測器を含む。
一部の実施形態では、訓練用データの品質を、複数の品質メトリクスを使用して向上させる。
一部の実施形態では、複数の品質メトリクスは、一般的な夾雑ペプチド除去、高いスコア化ピーク強度、高いスコア、および高い質量精度を含む。
一部の実施形態では、スコア化ピーク強度は、少なくとも50%である。
一部の実施形態では、スコア化ピーク強度は、少なくとも60%である。
一部の実施形態では、スコアは、少なくとも7である。
一部の実施形態では、質量精度は、最大で5ppmである。
一部の実施形態では、細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の免疫沈降HLAタンパク質によって提示されるペプチドである。
一部の実施形態では、細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の外因性HLAタンパク質によって提示されるペプチドである。
一部の実施形態では、細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の組換えHLAタンパク質によって提示されるペプチドである。
一部の実施形態では、複数の予測変数は、ペプチド-HLA親和性予測変数を含む。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、酵素特異性なし修飾なしペプチドデータベースを検索することによって同定されるペプチドを含む。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、逆データベース検索戦略を使用してペプチドデータベースを検索することによって同定されるペプチドを含む。
一部の実施形態では、HLAタンパク質は、HLA-DRタンパク質、HLA-DQタンパク質、またはHLA-DPタンパク質を含む。
一部の実施形態では、HLAタンパク質は、HLA-DPB101:01/HLA-DPA101:03、HLA-DPB102:01/HLA-DPA101:03、HLA-DPB103:01/HLA-DPA101:03、HLA-DPB104:01/HLA-DPA101:03、HLA-DPB104:02/HLA-DPA101:03、HLA-DPB106:01/HLA-DPA101:03、HLA-DQB102:01/HLA-DQA105:01、HLA-DQB102:02/HLA-DQA102:01、HLA-DQB106:02/HLA-DQA101:02、HLA-DQB106:04/HLA-DQA101:02、HLA-DRB101:01、HLA-DRB101:02、HLA-DRB103:01、HLA-DRB103:02、HLA-DRB104:01、HLA-DRB104:02、HLA-DRB104:03、HLA-DRB104:04、HLA-DRB104:05、HLA-DRB104:07、HLA-DRB107:01、HLA-DRB108:01、HLA-DRB108:02、HLA-DRB108:03、HLA-DRB108:04、HLA-DRB109:01、HLA-DRB110:01、HLA-DRB111:01、HLA-DRB111:02、HLA-DRB111:04、HLA-DRB112:01、HLA-DRB112:02、HLA-DRB113:01、HLA-DRB113:02、HLA-DRB113:03、HLA-DRB114:01、HLA-DRB115:01、HLA-DRB115:02、HLA-DRB115:03、HLA-DRB116:01、HLA-DRB301:01、HLA-DRB302:02、HLA-DRB303:01、HLA-DRB401:01、HLA-DRB501:01からなる群から選択されるHLAクラスIIタンパク質を含む。
一部の実施形態では、HLA-DRは、DRA01:01と対形成する。
一部の実施形態では、HLAタンパク質は、DPA01:03/DPB04:01、DRB101:01、DRB101:02、DRB103:01、DRB104:01、DRB104:02、DRB104:04、DRB104:05、DRB107:01、DRB108:01、DRB108:02、DRB108:03、DRB109:01、DRB111:01、DRB111:02、DRB111:04、DRB112:01、DRB113:01、DRB113:02、DRB113:03、DRB114:01、DRB115:01、DRB115:02、DRB115:03、DRB116:02、DRB301:01、DRB302:01、DRB302:02、DRB303:01、DRB401:01、DRB401:03およびDRB501:01からなる群から選択されるHLAクラスIIタンパク質である。
一部の実施形態では、HLA-DRタンパク質は、DRA01:01を二量体中に含む。
一部の実施形態では、HLAタンパク質は、DPB101:01、DPB102:01、DPB102:02、DPB103:01、DPB104:01、DPB104:02、DPB105:01、DPB106:01、DPB111:01、DPB113:01、DPB117:01からなる群から選択されるHLA-DPタンパク質を含む。
一部の実施形態では、HLA-DPタンパク質は、DPA101:03を含んで対形成する。
一部の実施形態では、HLAタンパク質は、A101:01+B105:01、A101:02+B106:02、A101:02+B106:04、A101:03+B106:03、A102:01+B102:02、A102:01+B103:03、A103:01+B103:02、A103:03+B103:01、A105:01+B102:01およびA105:05+B103:01からなる群から選択されるHLA-DQタンパク質複合体を含む。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、HLA-ペプチドのMS/MSスペクトルをペプチドまたはタンパク質データベース内の1つまたは複数のペプチドまたはタンパク質のMS/MSスペクトルと比較することによって同定されるペプチドを含む。
一部の実施形態では、変異は、点変異、スプライス部位変異、フレームシフト変異、リードスルー変異、および遺伝子融合変異からなる群から選択される。
一部の実施形態では、HLAタンパク質によって提示されるペプチドの長さは、15~40アミノ酸である。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、HLAタンパク質によって提示されるペプチドを、HLA-ペプチドのMS/MSスペクトルとペプチドまたはタンパク質データベース内の1つまたは複数のペプチドまたはタンパク質のMS/MSスペクトルと比較することによって同定することにより同定されるペプチドを含む。
一部の実施形態では、個別化がん治療は、アジュバントをさらに含む。
一部の実施形態では、個別化がん治療は、免疫チェックポイント阻害剤をさらに含む。
一部の実施形態では、訓練用データは、構造化されたデータ、時系列データ、構造化されていないデータ、リレーショナルデータ、またはこれらの任意の組合せを含む。
一部の実施形態では、構造化されていないデータは、画像データを含む。
一部の実施形態では、リレーショナルデータは、顧客システム、企業システム、運用システム、ウェブサイト、ウェブアクセス可能なアプリケーションプログラムインターフェース(API)、またはこれらの任意の組合せからのデータを含む。
一部の実施形態では、訓練用データを、クラウドに基づくデータベースにアップロードする。
一部の実施形態では、訓練を、畳み込みニューラルネットワークを使用して実施する。
一部の実施形態では、畳み込みニューラルネットワークは、少なくとも2つの畳み込み層を含む。
一部の実施形態では、畳み込みニューラルネットワークは、少なくとも1つのバッチ正規化ステップを含む。
一部の実施形態では、畳み込みニューラルネットワークは、少なくとも1つの空間ドロップアウトステップを含む。
一部の実施形態では、畳み込みニューラルネットワークは、少なくとも1つグローバルマックスプーリングステップを含む。
一部の実施形態では、畳み込みニューラルネットワークは、少なくとも1つの高密度層を含む。
一部の実施形態では、ペプチド配列を同定するステップは、対象のがん細胞において発現される変異を用いてペプチド配列を同定することを含む。
一部の実施形態では、ペプチド配列を同定するステップは、対象の正常細胞では発現されないペプチド配列を同定することを含む。
一部の実施形態では、ペプチド配列を同定するステップは、ウイルス性ペプチド配列を同定することを含む。
一部の実施形態では、ペプチド配列を同定するステップは、過剰発現されたペプチド配列を同定することを含む。
対象に対する免疫治療のためのHLAクラスII特異的ペプチドを同定する方法であって、コンピュータプロセッサにより、エピトープを含む候補ペプチド、およびそれぞれがエピトープを含む複数のペプチド配列を得るステップと、免疫細胞に対する複数のペプチド配列の各々についての提示予測を生成するために、コンピュータプロセッサにより、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、HLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルは、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、対象の細胞のHLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質から、候補ペプチドに結合することが機械学習HLA-ペプチド提示予測モデルによって予測されたタンパク質を選択するステップであって、タンパク質は、免疫細胞に対する候補ペプチドの提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、候補ペプチドを選択されたタンパク質と接触させ、したがって、候補ペプチドを、選択されたタンパク質と会合したプレースホルダーペプチドと競合させるステップと、候補ペプチドがプレースホルダーに置き換わるかどうかに基づいて、候補ペプチドを選択されたタンパク質に特異的な免疫治療のためのペプチドとして同定するステップとを含む方法が本明細書で提供される。
一部の実施形態では、得るステップは、候補ペプチドを同定することを含み、候補ペプチドを同定することは、対象のがん細胞由来のDNA、RNA、またはタンパク質配列を対象の正常細胞由来のDNA、RNA、またはタンパク質配列と比較することを含む。
一部の実施形態では、処理するステップは、少なくとも複数のペプチド配列のアミノ酸情報に基づいて複数の予測変数を同定すること、および機械学習HLA-ペプチド提示予測モデルを使用して複数の予測変数を処理することを含む。
一部の実施形態では、機械学習HLA-ペプチド提示予測モデルは、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、ここで、訓練用データは、アミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる訓練用ペプチド配列情報;ならびに、アミノ酸位置情報と、アミノ酸位置情報および複数の予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む。
一部の実施形態では、陽性の数は、ヒットの数と等しくなるように制約される。
一部の実施形態では、質量分析は、単一対立遺伝子質量分析である。
一部の実施形態では、複数の予測変数は、ペプチドを含む供給源タンパク質の発現レベル予測器、安定性予測器、分解速度予測器、切断性予測器、細胞または組織局在化予測器、ならびにオートファジー、ファゴサイトーシス、および細胞内輸送を含む細胞内プロセシング方式予測器のうちの任意の1つまたは複数を含む。
一部の実施形態では、訓練用データの品質を、複数の品質メトリクスを使用して向上させる。
一部の実施形態では、複数の品質メトリクスは、一般的な夾雑ペプチド除去、高いスコア化ピーク強度、高いスコア、および高い質量精度を含む。
一部の実施形態では、スコア化ピーク強度は、少なくとも50%である。
一部の実施形態では、スコア化ピーク強度は、少なくとも60%である。
一部の実施形態では、プレースホルダーペプチドは、CLIPペプチドである。
一部の実施形態では、プレースホルダーペプチドは、CMVペプチドである。
一部の実施形態では、3方法は、標的ペプチドによるプレースホルダーペプチドの置換えのIC50を測定するステップをさらに含む。
一部の実施形態では、標的ペプチドによるプレースホルダーペプチドの置換えのIC50は、500nM未満である。
一部の実施形態では、対象の細胞のHLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質からの少なくとも1つのタンパク質は、HLAクラスII四量体または多量体である。
一部の実施形態では、標的ペプチドを質量分析によってさらに同定する。
一部の実施形態では、対象の細胞のHLAクラスII対立遺伝子によってコードされる少なくとも1つのタンパク質は、組換えタンパク質である。
一部の実施形態では、対象の細胞のHLAクラスII対立遺伝子によってコードされる少なくとも1つのタンパク質は、真核細胞において発現するものである。
一部の実施形態では、ペプチドは、オートファジーを通じて、細胞において発現されるHLAタンパク質によって提示される。
一部の実施形態では、ペプチドは、ファゴサイトーシスを通じて、細胞において発現されるHLAタンパク質によって提示される。
一部の実施形態では、細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の免疫沈降HLAタンパク質によって提示されるペプチドである。
一部の実施形態では、細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の外因性HLAタンパク質によって提示されるペプチドである。
一部の実施形態では、細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の組換えHLAタンパク質によって提示されるペプチドである。
一部の実施形態では、複数の予測変数は、ペプチド-HLA親和性予測変数を含む。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、酵素特異性なし修飾なしペプチドデータベースを検索することによって同定されるペプチドを含む。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、逆データベース検索戦略を使用してペプチドデータベースを検索することによって同定されるペプチドを含む。
一部の実施形態では、HLAタンパク質は、HLA-DRタンパク質、HLA-DQタンパク質、またはHLA-DPタンパク質を含む。
一部の実施形態では、免疫治療は、がん免疫治療である。
一部の実施形態では、エピトープは、がん特異的エピトープである。
一部の実施形態では、HLAクラスII対立遺伝子によってコードされる少なくとも1つのタンパク質は、二量体形態で存在するHLAタンパク質の少なくともアルファ1サブユニットおよびベータ1サブユニットを含む。
一部の実施形態では、ペプチドがいかなるペプチドかは既知である。
一部の実施形態では、ペプチドがいかなるペプチドかは未知である。
一部の実施形態では、ペプチドがいかなるペプチドかを質量分析によって決定する。
一部の実施形態では、ペプチド交換アッセイは、ペプチド蛍光プローブまたはタグの検出を含む。
一部の実施形態では、プレースホルダーペプチドは、CLIPペプチドである。一部の実施形態では、プレースホルダーペプチドは、PVSKMRMATPLLMQAというアミノ酸配列を有する。
一部の実施形態では、ポリ核酸構築物は、プロモーター、分泌シグナル、二量体形成因子、リボソームスキッピング配列、精製および/または検出用の1つまたは複数のタグのうちの1つまたは複数をさらに含む発現ベクターを含む。
一部の実施形態では、プレースホルダーペプチド配列は、ベクター内の核酸配列によってコードされる。
一部の実施形態では、切断可能ドメインをコードする配列を、プレースホルダーペプチドをコードする配列とHLAベータ1ペプチドをコードする配列の間に配置する。
MHCクラスII結合性ペプチドの免疫原性をアッセイするための方法であって、MHCクラスII結合性ペプチドに結合することが機械学習HLA-ペプチド提示予測モデルによって予測された、HLAクラスII対立遺伝子によってコードされるタンパク質を選択するステップであって、機械学習HLA-ペプチド提示予測モデルは、所与のペプチド配列についての提示予測を生成するように構成されており、提示予測により、HLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質により所与のペプチド配列が提示され得る可能性が示され、タンパク質は、MHCクラスII結合性ペプチドの提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、ペプチドを選択されたタンパク質と接触させ、したがって、ペプチドを、選択されたタンパク質と会合したプレースホルダーペプチドと競合させ、プレースホルダーペプチドを置き換え、それにより、HLAクラスIIタンパク質とMHCクラスII結合性ペプチドとを含む複合体を形成するステップと、複合体をCD4+ T細胞と接触させるステップと、サイトカインの誘導、ケモカインの誘導、および細胞表面マーカーの発現からなる群から選択されるCD4+ T細胞の活性化パラメータの1つまたは複数についてアッセイするステップとを含む方法が本明細書で提供される。
一部の実施形態では、HLAクラスII対立遺伝子は、四量体または多量体である。
一部の実施形態では、サイトカインはIL-2である。
がん免疫治療のために対象におけるCD4+ T細胞活性化を誘導するための方法であって、がんに関連付けられ、がん変異を含むペプチド配列を同定するステップであって、ペプチド配列の同定は、対象のがん細胞由来のDNA、RNA、またはタンパク質配列を対象の正常細胞由来のDNA、RNA、またはタンパク質配列と比較することを含む、ステップと、対象の細胞によって通常発現され、ペプチドに結合することが機械学習HLA-ペプチド提示予測モデルによって予測された、HLAクラスII対立遺伝子によってコードされるタンパク質を選択するステップであって、予測モデルの陽性適中率は、少なくとも0.1%、0.1%~50%または最大で50%の再現率で少なくとも0.1であり、タンパク質は、同定されたペプチド配列の提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、同定されたペプチドを、選択された、HLAクラスII対立遺伝子によってコードされるタンパク質と接触させて、同定されたペプチドは、500nM未満のIC50値で、選択された、HLAクラスII対立遺伝子によってコードされるタンパク質と会合したプレースホルダーペプチドと競合してプレースホルダーペプチドに置き換わるかどうかを検証するステップと、必要に応じて、同定されたペプチドを精製するステップと、同定されたペプチドの配列を含むポリペプチドまたはポリペプチドをコードするポリヌクレオチドを対象に有効量で投与するステップとを含む方法が本明細書で提供される。
ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、コンピュータプロセッサにより、ポリペプチド配列の複数のペプチド配列を得るステップと、複数のペプチド配列の各々についての提示予測を生成するために、コンピュータプロセッサにより、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルは、細胞において発現されるHLAタンパク質に関連する配列情報を含む訓練用データを使用して訓練される、ステップと、複数の提示予測に基づいて、ポリペプチド配列の複数のペプチド配列の各々が対象に対して免疫原性ではないことを決定または予測するステップと、対象に、薬物を含む組成物を投与するステップとを含む方法が本明細書で提供される。
4つの個々のHLAタンパク質アルファ1およびベータ1ヘテロ二量体をコンジュゲートすることによってHLAクラスII四量体または多量体を製造するための方法であって、真核細胞において、HLAタンパク質のアルファ鎖およびベータ鎖をコードする核酸配列、分泌シグナル、ビオチン化モチーフおよび同定用または精製用の少なくとも1つのタグを含むベクターを発現させ、したがって、各HLAタンパク質アルファ1およびベータ1ヘテロ二量体を、二量体を形成した状態で分泌させるステップであって、ヘテロ二量体が、プレースホルダーペプチドと会合している、ステップと、分泌されたヘテロ二量体を細胞培地から精製するステップと、ペプチド交換アッセイを使用してペプチド結合活性を検証するステップと、ストレプトアビジンを添加し、それにより、ヘテロ二量体をコンジュゲートして四量体にするステップと、四量体を精製し、1mg/Lを超える収量を得るステップとを含む方法が本明細書で提供される。多量体、例えば、五量体、六量体または八量体も同様に生成することができ、本明細書において同等に意図されている。
一部の実施形態では、ベクターは、CMVプロモーターを含む。
一部の実施形態では、ベクターは、ベータ1鎖と切断可能部位を介して連結したプレースホルダーペプチドをコードする配列を含む。
一部の実施形態では、ペプチド交換アッセイは、プレースホルダーペプチドをベータ鎖から予め切断することを伴う。
一部の実施形態では、切断可能部位は、トロンビン切断部位である。
一部の実施形態では、ペプチド交換アッセイは、FRETアッセイである。
一部の実施形態では、精製は、カラムクロマトグラフィー、イオン交換クロマトグラフィー、分子ふるいクロマトグラフィー、アフィニティークロマトグラフィー、またはLC-MSのうちのいずれか1つによるものである。
HLA-DRヘテロ二量体、またはHLA-DPヘテロ二量体、またはHLA-DQヘテロ二量体のいずれかを含むHLAクラスII四量体または多量体であって、各ヘテロ二量体がアルファ鎖とベータ鎖とを含み、ヘテロ二量体が精製されたものであり、1mg/Lを超える濃度で存在する、HLAクラスII四量体または多量体が本明細書で提供される。
一部の実施形態では、HLAクラスII四量体は、表8A~8Cから選択される。
一部の実施形態では、HLAクラスII四量体は、HLA-DRタンパク質、HLA-DPタンパク質、およびHLA-DQタンパク質からなる群から選択されるヘテロ二量体対を含む。
一部の実施形態では、HLAタンパク質は、HLA-DPB101:01/HLA-DPA101:03、HLA-DPB102:01/HLA-DPA101:03、HLA-DPB103:01/HLA-DPA101:03、HLA-DPB104:01/HLA-DPA101:03、HLA-DPB104:02/HLA-DPA101:03、HLA-DPB106:01/HLA-DPA101:03、HLA-DQB102:01/HLA-DQA105:01、HLA-DQB102:02/HLA-DQA102:01、HLA-DQB106:02/HLA-DQA101:02、HLA-DQB106:04/HLA-DQA101:02、HLA-DRB101:01、HLA-DRB101:02、HLA-DRB103:01、HLA-DRB103:02、HLA-DRB104:01、HLA-DRB104:02、HLA-DRB104:03、HLA-DRB104:04、HLA-DRB104:05、HLA-DRB104:07、HLA-DRB107:01、HLA-DRB108:01、HLA-DRB108:02、HLA-DRB108:03、HLA-DRB108:04、HLA-DRB109:01、HLA-DRB110:01、HLA-DRB111:01、HLA-DRB111:02、HLA-DRB111:04、HLA-DRB112:01、HLA-DRB112:02、HLA-DRB113:01、HLA-DRB113:02、HLA-DRB113:03、HLA-DRB114:01、HLA-DRB115:01、HLA-DRB115:02、HLA-DRB115:03、HLA-DRB116:01、HLA-DRB301:01、HLA-DRB302:02、HLA-DRB303:01、HLA-DRB401:01およびHLA-DRB501:01からなる群から選択されるHLAクラスIIタンパク質である。
一部の実施形態では、ヘテロ二量体対は、真核細胞において発現される。
一部の実施形態では、ヘテロ二量体対は、ベクターによってコードされる。
本明細書に記載のHLAタンパク質のアルファ鎖およびベータ鎖をコードする核酸配列、分泌シグナル、ビオチン化モチーフおよび同定用または精製用の少なくとも1つのタグを含み、したがって、各HLAタンパク質アルファ1およびベータ1ヘテロ二量体を、二量体を形成した状態で分泌させるベクターであって、分泌されたヘテロ二量体が、必要に応じてプレースホルダーペプチドと会合している、ベクターが本明細書で提供される。
本明細書に記載のベクターを含む細胞が本明細書で提供される。
一部の実施形態では、HLAクラスIIヘテロ二量体を真核細胞から細胞培養培地中に分泌させ、それを、カラムクロマトグラフィー、イオン交換クロマトグラフィー、分子ふるいクロマトグラフィー、アフィニティークロマトグラフィーまたはLC-MSのうちのいずれか1つによってさらに精製する。
ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、コンピュータプロセッサにより、ポリペプチド配列の複数のペプチド配列を得るステップと、複数のペプチド配列の各々についての提示予測を生成するために、コンピュータプロセッサにより、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルは、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練されるステップと、複数の提示予測に基づいて、ポリペプチド配列の複数のペプチド配列のうちの少なくとも1つが対象に対して免疫原性であることを決定または予測するステップとを含む方法が本明細書で提供される。
ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、コンピュータプロセッサを使用してポリペプチド配列のペプチド配列のアミノ酸情報を機械学習HLA-ペプチド提示予測モデルに入力して、ペプチド配列についての提示予測のセットを生成するステップであって、各提示予測により、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により所与のペプチド配列のエピトープ配列が提示される確率が示され、機械学習HLA-ペプチド提示予測モデルは、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、訓練用データは、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;アミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む、ステップと、提示予測のセットに基づいて、ポリペプチド配列のペプチド配列の各々が対象に対して免疫原性ではないことを決定または予測するステップと、対象に、薬物を含む組成物を投与するステップとを含む方法が本明細書で提供される。
ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、コンピュータプロセッサを使用してポリペプチド配列のペプチド配列のアミノ酸情報を機械学習HLA-ペプチド提示予測モデルに入力して、ペプチド配列についての提示予測のセットを生成するステップであって、各提示予測により、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により所与のペプチド配列のエピトープ配列が提示される確率が示され、機械学習HLA-ペプチド提示予測モデルは、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、訓練用データは、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;アミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む、ステップと、提示予測のセットに基づいて、ポリペプチド配列のペプチド配列のうちの少なくとも1つが対象に対して免疫原性であることを決定または予測するステップとを含む方法が本明細書で提供される。
ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、コンピュータプロセッサにより、ポリペプチド配列の複数のペプチド配列を得るステップと、複数のペプチド配列の各々についての提示予測を生成するために、コンピュータプロセッサにより、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルは、細胞において発現されるHLAタンパク質に関連する配列情報を含む訓練用データを使用して訓練されるステップと、複数の提示予測に基づいて、ポリペプチド配列の複数のペプチド配列の各々が対象に対して免疫原性ではないことを決定または予測するステップと、対象に、薬物を含む組成物を投与するステップとを含む方法が本明細書で提供される。
一部の実施形態では、方法は、薬物を対象に投与しないことを決定することをさらに含む。
一部の実施形態では、薬物は、抗体またはその結合性断片を含む。
一部の実施形態では、ポリペプチド配列のペプチド配列は、8、9、10、11、または12アミノ酸の長さを有し、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされるタンパク質は、対象の細胞のクラスI MHC対立遺伝子によってコードされるタンパク質である。
一部の実施形態では、ポリペプチド配列のペプチド配列は、15、16、17、18、19、20、21、22、23、24、または25アミノ酸の長さを有し、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされるタンパク質は、対象の細胞のクラスII MHC対立遺伝子によってコードされるタンパク質である。
自己免疫疾患または状態を有する対象を処置する方法であって、(a)対象の細胞のクラスIまたはクラスII MHCによって提示される発現されたタンパク質のエピトープを同定または予測するステップであって、同定または予測されたエピトープとクラスIまたはクラスII MHCとを含む複合体が、対象のCD8 T細胞またはCD4 T細胞の標的とされる、ステップと、(b)複合体に結合するT細胞受容体(TCR)を同定するステップと、(c)TCRを対象由来の調節性T細胞または同種異系の調節性T細胞において発現させるステップと、(d)TCRを発現する調節性T細胞を対象に投与するステップとを含む方法が本明細書で提供される。
一部の実施形態では、自己免疫疾患または状態は、糖尿病である。
一部の実施形態では、細胞は、膵島細胞である。
自己免疫疾患または状態を有する対象を処置する方法であって、対象に、(i)対象の細胞のクラスIまたはクラスII MHCによって提示されることが同定または予測された発現されたタンパク質のエピトープと(ii)クラスIまたはクラスII MHCとを含む複合体であって、対象のCD8 T細胞またはCD4 T細胞の標的とされる、複合体に結合するT細胞受容体(TCR)を発現する調節性T細胞を投与するステップを含む方法が本明細書で提供される。
対象の個別化がん治療のためのペプチド配列を同定するためのコンピュータシステムであって、対象の複数のペプチド配列が保存されるように構成されたデータベースと、前記データベースと作動可能にカップリングした1つまたは複数のコンピュータプロセッサであって、複数のペプチド配列の各々についての提示予測を生成するために、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、対象の細胞のクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップ;および対象の個別化がん治療のための複数のペプチド配列のサブセットを少なくとも複数の提示予測に基づいて選択するステップを行うように個別に集合的にプログラムされた1つまたは複数のコンピュータプロセッサとを含むコンピュータシステムが本明細書で提供される。
対象に対する免疫治療のためのHLAクラスII特異的ペプチドを同定するためのコンピュータシステムであって、エピトープおよびそれぞれがエピトープを含む複数のペプチド配列を含む候補ペプチドが保存されるように構成されたデータベースと、前記データベースと作動可能にカップリングした1つまたは複数のコンピュータプロセッサであって、免疫細胞に対する複数のペプチド配列の各々についての提示予測を生成するために、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、HLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップ;対象の細胞のHLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質から、候補ペプチドに結合することが機械学習HLA-ペプチド提示予測モデルによって予測されたタンパク質を選択するステップであって、当該タンパク質が、免疫細胞に対する候補ペプチドの提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップ;および、候補ペプチドを選択されたタンパク質と接触させ、したがって、候補ペプチドを選択されたタンパク質と会合したプレースホルダーペプチドと競合させた際に、候補ペプチドによってプレースホルダーペプチドが置き換えられるかどうかに基づいて、候補ペプチドを、選択されたタンパク質に特異的な免疫治療のためのペプチドとして同定するステップを行うように個別に集合的にプログラムされた1つまたは複数のコンピュータプロセッサとを含む、コンピュータシステムが本明細書で提供される。
ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングするためのコンピュータシステムであって、ポリペプチド配列の複数のペプチド配列が保存されるように構成されたデータベースと、前記データベースと作動可能にカップリングした1つまたは複数のコンピュータプロセッサであって、複数のペプチド配列の各々についての提示予測を生成するために、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質に関連する配列情報を含む訓練用データを使用して訓練される、ステップ;および、複数の提示予測に基づいて、ポリペプチド配列の複数のペプチド配列の各々が対象に対して免疫原性ではないことを決定または予測するステップであって、薬物を含む組成物を対象に投与する、ステップを行うように個別に集合的にプログラムされた、1つまたは複数のコンピュータプロセッサとを含む、コンピュータシステムが本明細書で提供される。
ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングするためのコンピュータシステムであって、ポリペプチド配列の複数のペプチド配列が保存されるように構成されたデータベースと、前記データベースと作動可能にカップリングした1つまたは複数のコンピュータプロセッサであって、複数のペプチド配列の各々についての提示予測を生成するために、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップ;および、複数の提示予測に基づいて、ポリペプチド配列の複数のペプチド配列のうちの少なくとも1つが対象に対して免疫原性であることを決定または予測するステップを行うように個別に集合的にプログラムされた、1つまたは複数のコンピュータプロセッサとを含む、コンピュータシステムが本明細書で提供される。
1つまたは複数のコンピュータプロセッサによって実行されると、対象の個別化がん治療のためのペプチド配列を同定するための方法であって、対象の複数のペプチド配列を得るステップと、複数のペプチド配列の各々についての提示予測を生成するために、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、対象の細胞のクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、少なくとも複数の提示予測に基づいて、対象の個別化がん治療のための複数のペプチド配列のサブセットを選択するステップとを含む方法をインプリメントする、機械により実行可能なコードを含む非一時的コンピュータ可読媒体が本明細書で提供される。
1つまたは複数のコンピュータプロセッサによって実行されると、対象に対する免疫治療のためのHLAクラスII特異的ペプチドを同定する方法であって、エピトープおよびそれぞれがエピトープを含む複数のペプチド配列を含む候補ペプチドを得るステップと、免疫細胞に対する複数のペプチド配列の各々についての提示予測を生成するために、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、HLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、対象の細胞のHLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質から、候補ペプチドに結合することが機械学習HLA-ペプチド提示予測モデルによって予測されたタンパク質を選択するステップであって、当該タンパク質が、免疫細胞に対する候補ペプチドの提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、候補ペプチドを選択されたタンパク質と接触させ、したがって、候補ペプチドをプレースホルダーペプチドと競合させた際に、候補ペプチドによってプレースホルダーペプチドが置き換えられるかどうかに基づいて、候補ペプチドを、選択されたタンパク質に特異的な免疫治療のためのペプチドとして同定するステップとを含む方法をインプリメントする、機械により実行可能なコードを含む非一時的コンピュータ可読媒体が本明細書で提供される。
1つまたは複数のコンピュータプロセッサによって実行されると、ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、ポリペプチド配列の複数のペプチド配列を得るステップと、複数のペプチド配列の各々についての提示予測を生成するために、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質に関連する配列情報を含む訓練用データを使用して訓練される、ステップと、複数の提示予測に基づいて、ポリペプチド配列の複数のペプチド配列の各々が対象に対して免疫原性ではないことを決定または予測するステップであって、薬物を含む組成物を対象に投与する、ステップを含む方法をインプリメントする、機械により実行可能なコードを含む非一時的コンピュータ可読媒体が本明細書で提供される。
1つまたは複数のコンピュータプロセッサによって実行されると、ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、ポリペプチド配列の複数のペプチド配列を得るステップと、複数のペプチド配列の各々についての提示予測を生成するために、機械学習HLA-ペプチド提示予測モデルを使用して複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、複数の提示予測に基づいて、ポリペプチド配列の複数のペプチド配列のうちの少なくとも1つが対象に対して免疫原性であることを決定または予測するステップとを含む方法をインプリメントする、機械により実行可能なコードを含む非一時的コンピュータ可読媒体が本明細書で提供される。
複数の提示予測を生成するために、機械学習HLAペプチド提示予測モデルを使用して複数の候補ペプチド配列のアミノ酸情報を処理するステップであって、複数のうちの各候補ペプチド配列が、対象のゲノムまたはエクソームによってコードされ、複数の提示予測が、複数の候補ペプチド配列の各々についてのHLA提示予測を含み、各提示予測により、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質により複数のうちの所与の候補ペプチド配列が提示され得る可能性が示され、機械学習HLAペプチド提示予測モデルが、訓練用細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された訓練用ペプチドの配列に関する配列情報を含む訓練用データを使用して訓練される、ステップと、少なくとも複数の提示予測に基づいて、複数のペプチド配列のうち、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つによって提示される確率が提示予測確率値の閾値よりも大きいペプチド配列を同定するステップとを含み、複数の試験ペプチド配列のアミノ酸情報を処理して、複数の試験提示予測を生成し、各試験提示予測により、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質により複数の試験ペプチド配列のうちの所与の試験ペプチド配列が提示され得る可能性が示される場合に、機械学習HLAペプチド提示予測モデルの陽性適中率(PPV)が少なくとも0.07であり、複数の試験ペプチド配列が、(i)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された少なくとも1つのヒットペプチド配列と、(ii)生物体のゲノムによってコードされるタンパク質内に含有される少なくとも499のデコイペプチド配列とを含む少なくとも500の試験ペプチド配列を含み、生物体と対象が同じ種であり、複数の試験ペプチド配列が、少なくとも1つのヒットペプチド配列と少なくとも499のデコイペプチド配列を1:499の比で含み、機械学習HLAペプチド提示予測モデルにより、複数の試験ペプチド配列の0.2%が細胞において発現されるHLAタンパク質によって提示されることが予測される、方法が本明細書で提供される。
複数の結合予測を生成するために、機械学習HLA-ペプチド結合予測モデルを使用して対象のゲノムまたはエクソームによってコードされる複数のペプチド配列のアミノ酸情報を処理するステップであって、複数の結合予測が、複数の候補ペプチド配列の各々についてのHLA結合予測を含み、各結合予測により、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質が複数の候補ペプチド配列のうちの所与の候補ペプチド配列に結合する可能性が示され、機械学習HLAペプチド結合予測モデルが、HLAクラスIIタンパク質またはHLAクラスIIタンパク質類似体に結合することが同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、少なくとも複数の結合予測に基づいて、複数のペプチド配列のうち、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つとの結合に関する閾値結合予測確率値よりも大きな確率を有するペプチド配列を同定するステップとを含み、複数の試験ペプチド配列のアミノ酸情報を処理して、複数の試験結合予測を生成し、各試験結合予測により、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質が複数の試験ペプチド配列のうちの所与の試験ペプチド配列に結合する可能性が示される場合に、機械学習HLAペプチド結合予測モデルの陽性適中率(PPV)が少なくとも0.1であり、複数の試験ペプチド配列が、(i)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された少なくとも1つのヒットペプチド配列および(ii)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定されたペプチド配列を含むタンパク質に含有される少なくとも19のデコイペプチド配列を含む試験ペプチド配列を少なくとも50含み、生物体と対象が同じ種であり、複数の試験ペプチド配列が、少なくとも1つのヒットペプチド配列と少なくとも19のデコイペプチド配列を1:19の比で含み、機械学習HLAペプチド提示予測モデルにより、複数の試験ペプチド配列の5%が細胞において発現されるHLAタンパク質に結合することが予測される、方法が本明細書で提供される。
一部の実施形態では、機械学習HLAペプチド提示予測モデルは、訓練用細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された訓練用ペプチドの配列に関する配列情報を含む訓練用データを使用して訓練される
一部の実施形態では、機械学習HLAペプチド提示予測モデルによって提示されることが予測された複数の試験ペプチド配列の0.2%のうちの1つまたは複数の、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つによって提示される確率が提示予測確率値の閾値よりも高い。
一部の実施形態では、機械学習HLAペプチド提示予測モデルによって提示されることが予測された複数の試験ペプチド配列の0.2%の各々の、対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質のうちの少なくとも1つによって提示される確率が提示予測確率値の閾値よりも高い。
一部の実施形態では、PPVは、表13の対応するHLA対立遺伝子によってコードされるタンパク質についての表11の2列目のそれぞれのPPVよりも大きい。一部の実施形態では、PPVは、表11の対応するHLA対立遺伝子によってコードされるタンパク質についての表11の3列目のそれぞれのPPVと少なくとも等しい。
一部の実施形態では、PPVは、HLAクラスII対立遺伝子によってコードされるタンパク質についての表12の2列目のそれぞれのPPVよりも大きい。
一部の実施形態では、PPVは、表16の対応するHLA対立遺伝子によってコードされるタンパク質についての表16の2列目のそれぞれのPPVと少なくとも等しい。
個別化がん治療を調製するための方法であって、がんに関連付けられるペプチド配列を同定するステップであって、対象のがん細胞由来のDNA、RNAまたはタンパク質配列を対象の正常細胞由来のDNA、RNAまたはタンパク質配列と比較することを含む、ステップと、同定されたペプチド配列についての提示予測のセットを生成するために、コンピュータプロセッサを使用して同定されたペプチド配列のアミノ酸位置情報を機械学習HLA-ペプチド提示予測モデルに入力するステップであって、各提示予測が、対象の細胞のHLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質が同定されたペプチド配列のうちの所与の配列を提示する確率を表し、機械学習HLA-ペプチド提示予測モデルが、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、訓練用データが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;アミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む、ステップと、提示予測のセットに基づいて同定された、個別化がん治療を調製するためのペプチド配列のサブセットを選択するステップであって、予測モデルの陽性適中率が、少なくとも0.1%、0.1%~50%または最大で50%の再現率で少なくとも0.1である、ステップとを含む方法が本明細書で提供される。
機械学習HLA-ペプチド提示予測モデルを訓練するステップであって、コンピュータプロセッサを使用して、HLAクラスII対立遺伝子を発現する細胞由来の1つまたは複数のHLA-ペプチド複合体から単離されたHLA-ペプチドのアミノ酸位置情報配列をHLA-ペプチド提示予測モデルに入力することを含むステップを含み、機械学習HLA-ペプチド提示予測モデルが、少なくとも訓練用データに基づいて同定された複数の予測変数が、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;訓練用ペプチドのアミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む、方法が本明細書で提供される。
一部の実施形態では、提示モデルの陽性適中率は、少なくとも0.1%、0.1%~50%または最大で50%の再現率で、少なくとも0.25である。
一部の実施形態では、提示モデルの陽性適中率は、少なくとも0.1%、0.1%~50%または最大で50%の再現率で、少なくとも0.4である。
一部の実施形態では、提示モデルの陽性適中率は、少なくとも0.1%、0.1%~50%または最大で50%の再現率で、少なくとも0.6である。
一部の実施形態では、質量分析は、単一対立遺伝子質量分析である。
一部の実施形態では、ペプチドは、オートファジーを通じて、細胞において発現されるHLAタンパク質によって提示される。
一部の実施形態では、ペプチドは、ファゴサイトーシスを通じて、細胞において発現されるHLAタンパク質によって提示される。
一部の実施形態では、訓練用データの品質を、複数の品質メトリクスを使用して向上させる。
一部の実施形態では、複数の品質メトリクスは、一般的な夾雑ペプチド除去、高いスコア化ピーク強度、高いスコア、および高い質量精度を含む。
一部の実施形態では、スコア化ピーク強度は、少なくとも50%である。
一部の実施形態では、スコア化ピーク強度は、少なくとも60%である。
一部の実施形態では、スコアは、少なくとも7である。
一部の実施形態では、質量精度は、最大で5ppmである。
一部の実施形態では、質量精度は、最大で2ppmである。
一部の実施形態では、骨格切断スコアは、少なくとも5である。
一部の実施形態では、骨格切断スコアは、少なくとも8である。
一部の実施形態では、細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の免疫沈降HLAタンパク質によって提示されるペプチドである。
一部の実施形態では、細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の外因性HLAタンパク質によって提示されるペプチドである。
一部の実施形態では、細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の組換えHLAタンパク質によって提示されるペプチドである。
一部の実施形態では、複数の予測変数は、ペプチド-HLA親和性予測変数を含む。
一部の実施形態では、複数の予測変数は、供給源タンパク質発現レベル予測変数を含む。
一部の実施形態では、複数の予測変数は、ペプチド切断性予測変数を含む。
一部の実施形態では、訓練用ペプチド配列情報は、ペプチドデータベースに対して酵素特異性なし修飾なしを検索することによって同定されるペプチドを含む、HLAタンパク質によって提示されるペプチド由来の配列を含む。一部の実施形態では、HLAタンパク質によって提示されるペプチドは、新規のペプチド配列決定ツールを検索することによって同定されるペプチドを含む。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、逆データベース検索戦略を使用してペプチドデータベースを検索することによって同定されるペプチドを含む。
一部の実施形態では、HLAタンパク質は、HLA-DRタンパク質、およびHLA-DPタンパク質またはHLA-DQタンパク質を含む。一部の実施形態では、HLAタンパク質は、HLA-DRタンパク質、およびHLA-DPタンパク質またはHLA-DQタンパク質からなる群から選択されるHLA-DRタンパク質を含む。一部の実施形態では、HLAタンパク質は、HLA-DPB101:01/HLA-DPA101:03、HLA-DPB102:01/HLA-DPA101:03、HLA-DPB103:01/HLA-DPA101:03、HLA-DPB104:01/HLA-DPA101:03、HLA-DPB104:02/HLA-DPA101:03、HLA-DPB106:01/HLA-DPA101:03、HLA-DQB102:01/HLA-DQA105:01、HLA-DQB102:02/HLA-DQA102:01、HLA-DQB106:02/HLA-DQA101:02、HLA-DQB106:04/HLA-DQA101:02、HLA-DRB101:01、HLA-DRB101:02、HLA-DRB103:01、HLA-DRB103:02、HLA-DRB104:01、HLA-DRB104:02、HLA-DRB104:03、HLA-DRB104:04、HLA-DRB104:05、HLA-DRB104:07、HLA-DRB107:01、HLA-DRB108:01、HLA-DRB108:02、HLA-DRB108:03、HLA-DRB108:04、HLA-DRB109:01、HLA-DRB110:01、HLA-DRB111:01、HLA-DRB111:02、HLA-DRB111:04、HLA-DRB112:01、HLA-DRB112:02、HLA-DRB113:01、HLA-DRB113:02、HLA-DRB113:03、HLA-DRB114:01、HLA-DRB115:01、HLA-DRB115:02、HLA-DRB115:03、HLA-DRB116:01、HLA-DRB301:01、HLA-DRB302:02、HLA-DRB303:01、HLA-DRB401:01およびHLA-DRB501:01からなる群から選択されるHLA-DRタンパク質を含む。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、HLA-ペプチドのMS/MSスペクトルとペプチドデータベース内の1つまたは複数のHLA-ペプチドのMS/MSスペクトルと比較することによって同定されるペプチドを含む。
一部の実施形態では、変異は、点変異、スプライス部位変異、フレームシフト変異、リードスルー変異、および遺伝子融合変異からなる群から選択される。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、15~40アミノ酸の長さを有する。
一部の実施形態では、HLAタンパク質によって提示されるペプチドは、(a)単一のHLAクラスII対立遺伝子を発現する細胞株から1つまたは複数のHLA複合体を単離するステップと、(b)1つまたは複数の単離されたHLA複合体から1つまたは複数のHLA-ペプチドを単離するステップと、(c)1つまたは複数の単離されたHLA-ペプチドについてのMS/MSスペクトルを得るステップと、(d)ペプチドデータベースから1つまたは複数の単離されたHLA-ペプチドのMS/MSスペクトルに対応するペプチド配列を得るステップであって、ステップ(d)で得られた1つまたは複数の配列により、1つまたは複数の単離されたHLA-ペプチドの配列が同定される、ステップによって同定されるペプチドを含む。
一部の実施形態では、個別化がん治療は、アジュバントをさらに含む。
一部の実施形態では、個別化がん治療は、免疫チェックポイント阻害剤をさらに含む。
一部の実施形態では、訓練用データは、構造化されたデータ、時系列データ、構造化されていないデータ、リレーショナルデータ、またはこれらの任意の組合せを含む。
一部の実施形態では、構造化されていないデータは、画像データを含む。
一部の実施形態では、リレーショナルデータは、顧客システム、企業システム、運用システム、ウェブサイト、ウェブアクセス可能なアプリケーションプログラムインターフェース(API)、またはこれらの任意の組合せからのデータを含む。
一部の実施形態では、訓練用データを、クラウドに基づくデータベースにアップロードする。
一部の実施形態では、訓練するステップを、畳み込みニューラルネットワークを使用して実施する。
一部の実施形態では、畳み込みニューラルネットワークは、少なくとも2つの畳み込み層を含む。
一部の実施形態では、畳み込みニューラルネットワーク(CNN)は、少なくとも1つのバッチ正規化ステップを含む。
一部の実施形態では、畳み込みニューラルネットワークは、少なくとも1つの空間ドロップアウトステップを含む。
一部の実施形態では、畳み込みニューラルネットワークは、少なくとも1つグローバルマックスプーリングステップを含む。
一部の実施形態では、畳み込みニューラルネットワークは、少なくとも1つの高密度層を含む。
一部の実施形態では、ペプチド配列を同定するステップは、対象のがん細胞において発現される変異を用いてペプチド配列を同定することを含む。
一部の実施形態では、ペプチド配列を同定するステップは、対象の正常細胞では発現されないペプチド配列を同定することを含む。
一部の実施形態では、ペプチド配列を同定するステップは、過剰発現されたペプチド配列を同定することを含む。
一部の実施形態では、ペプチド配列を同定するステップは、ウイルス性ペプチド配列を同定することを含む。一態様では、対象に特異的な免疫治療のためのHLAクラスII特異的ペプチドを同定するための方法であって、エピトープを含む候補ペプチドを同定するステップと、コンピュータプロセッサを使用して、各々がエピトープを含む複数のペプチド配列のアミノ酸情報を機械学習HLA-ペプチド提示予測モデルに入力して、免疫細胞に対するペプチド配列のHLA提示予測のセットを生成するステップであって、各提示予測が、対象の細胞のHLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質がエピトープを含む所与のペプチド配列を提示する確率を表し、予測モデルの陽性適中率が、少なくとも0.1%、0.1%~50%または最大で50%の再現率で少なくとも0.1である、ステップと、対象の細胞のHLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質から候補ペプチドに結合することが予測モデルによって予測されたタンパク質を選択するステップであって、当該タンパク質が、免疫細胞に対する候補ペプチドの提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、候補ペプチドをHLAクラスII対立遺伝子によってコードされるタンパク質と接触させ、したがって、候補ペプチドをHLAクラスII対立遺伝子によってコードされるタンパク質と会合したプレースホルダーペプチドと競合させるステップと、候補ペプチドによってプレースホルダーペプチドが置き換えられるかどうかに基づいて、候補ペプチドをHLAクラスII対立遺伝子によってコードされるタンパク質に特異的な免疫治療のためのペプチドとして同定するステップとを含む方法が本明細書で提供される。
一部の実施形態では、免疫治療は、がん免疫治療である。
一部の実施形態では、同定するステップは、対象のがん細胞由来のDNA、RNAまたはタンパク質配列を対象の正常細胞由来のDNA、RNAまたはタンパク質配列と比較することを含む。一部の実施形態では、エピトープは、がん特異的エピトープである。
一部の実施形態では、HLAクラスII対立遺伝子によってコードされる少なくとも1つのタンパク質は、二量体形態で存在するHLAタンパク質の少なくともアルファ1サブユニットおよびベータ1サブユニットまたはその断片を含む。一部の実施形態では、プレースホルダーペプチドは、CLIPペプチドである。一部の実施形態では、プレースホルダーペプチドは、CMVペプチドである。一部の実施形態では、方法は、標的ペプチドによるプレースホルダーペプチドの置換えのIC50を測定するステップをさらに含む。一部の実施形態では、標的ペプチドによるプレースホルダーペプチドの置換えのIC50は、500nM未満である。一部の実施形態では、対象の細胞のHLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質からの少なくとも1つのタンパク質は、HLAクラスII四量体または多量体である。一部の実施形態では、標的ペプチドを質量分析によってさらに同定する。一部の実施形態では、対象の細胞のHLAクラスII対立遺伝子によってコードされる少なくとも1つのタンパク質は、組換えタンパク質である。一部の実施形態では、対象の細胞のHLAクラスII対立遺伝子によってコードされる少なくとも1つのタンパク質は、真核細胞において発現される。
一態様では、HLAクラスIIタンパク質との結合に関する候補ペプチドの特異性を検証するためのアッセイ方法であって、真核細胞において、MHC-II結合性エピトープを含むペプチドに結合することができるアルファ鎖およびベータ鎖またはその一部を含むHLAクラスIIタンパク質をコードする核酸配列を含むポリ核酸構築物を発現させるステップであって、発現されたHLAクラスIIタンパク質またはその一部が、プレースホルダーペプチドと会合したままである、ステップと、真核細胞において発現されたHLAクラスIIタンパク質またはその一部を単離するステップと、(a)漸増量の候補ペプチドを添加して、候補ペプチドによってHLAクラスIIタンパク質またはその一部と会合したプレースホルダーペプチドが置き換えられるかどうかを決定し、(b)置換え反応のIC50を算出してプレースホルダーペプチドと比べた候補ペプチドのHLAクラスIIタンパク質またはその一部に対する親和性を決定し、それにより、候補ペプチドのHLAクラスIIタンパク質との結合に関する特異性を検証することによってペプチド交換アッセイを実施するステップとを含む方法が本明細書で提供される。
一部の実施形態では、ペプチドがいかなるペプチドかは既知である。一部の実施形態では、ペプチドがいかなるペプチドかは未知である。一部の実施形態では、ペプチドがいかなるペプチドかを質量分析によって決定する。
一部の実施形態では、ペプチド交換アッセイは、ペプチド蛍光プローブまたはタグの検出を含む。一部の実施形態では、プレースホルダーペプチドは、CLIPペプチドである。
一部の実施形態では、ポリ核酸構築物は、プロモーター、リンカー、1つまたは複数のプロテアーゼ切断部位、分泌シグナル、二量体形成因子、リボソームスキッピング配列、精製および/または検出のための1つまたは複数のタグのうちの1つまたは複数をさらに含む発現ベクターを含む。
一態様では、MHCクラスII結合性ペプチドの免疫原性をアッセイするための方法であって、ペプチドに結合することが機械学習HLA-ペプチド提示予測モデルによって予測された、HLAクラスII対立遺伝子によってコードされるタンパク質を選択するステップであって、予測モデルの陽性適中率が、少なくとも0.1%、0.1%~50%または最大で50%の再現率で少なくとも0.1であり、タンパク質が、同定されたペプチド配列の提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、ペプチドを、選択された、HLAクラスII対立遺伝子によってコードされるタンパク質と接触させ、したがって、ペプチドを、選択された、HLAクラスII対立遺伝子によってコードされるタンパク質と会合したプレースホルダーペプチドと競合させ、プレースホルダーペプチドを置き換え、それにより、HLAクラスIIタンパク質と同定されたペプチドとを含む複合体を形成するステップと、HLAクラスIIタンパク質と同定されたペプチドの複合体をCD4+ T細胞と接触させるステップと、サイトカインの誘導、ケモカインの誘導および細胞表面マーカーの発現から選択されるCD4+ T細胞の活性化パラメータの1つまたは複数についてアッセイするステップとを含む方法が本明細書で提供される。
一部の実施形態では、HLAクラスII対立遺伝子は、四量体または多量体である。一部の実施形態では、サイトカインはIL-2である。一部の実施形態では、サイトカインはIFN-ガンマである。
一態様では、がん免疫治療のために対象におけるCD4+ T細胞活性化を誘導するための方法であって、がんに関連付けられ、がん変異を含むペプチド配列を同定するステップであって、対象のがん細胞由来のDNA、RNAまたはタンパク質配列を対象の正常細胞由来のDNA、RNAまたはタンパク質配列と比較することを含む、ステップと、対象の細胞によって通常発現され、ペプチドに結合することが機械学習HLA-ペプチド提示予測モデルによって予測された、HLAクラスII対立遺伝子によってコードされるタンパク質を選択するステップであって、予測モデルの陽性適中率が、少なくとも0.1%、0.1%~50%または最大で50%の再現率で少なくとも0.1であり、タンパク質が、同定されたペプチド配列の提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、同定されたペプチドを、選択された、HLAクラスII対立遺伝子によってコードされるタンパク質と接触させて、同定されたペプチドが、500nM未満のIC50値で、選択された、HLAクラスII対立遺伝子によってコードされるタンパク質と会合したプレースホルダーペプチドと競合してプレースホルダーペプチドに置き換わるかどうかを検証するステップと、同定されたペプチドを精製するステップと、同定されたペプチドを対象に有効量で投与するステップとを含む方法が本明細書で提供される。
一態様では、HLAクラスII四量体または多量体を製造する方法であって、真核細胞において、HLAタンパク質のアルファ鎖およびベータ鎖をコードする核酸配列、リンカー、1つまたは複数のプロテアーゼ切断部位、分泌シグナル、ビオチン化モチーフおよび同定用または精製用の少なくとも1つのタグを含むベクターを発現させ、したがって、各HLAタンパク質アルファ1およびベータ1ヘテロ二量体を、二量体を形成した状態で分泌させるステップであって、ヘテロ二量体がプレースホルダーペプチドと会合している、ステップと、分泌されたヘテロ二量体を細胞培地から精製するステップと、ペプチド交換アッセイを使用してペプチド結合活性を検証するステップと、ストレプトアビジンを添加し、それにより、ヘテロ二量体をコンジュゲートして四量体にするステップと、四量体を精製するステップと、1mg/Lを超える収量を得るステップとを含む方法が本明細書で提供される。
一部の実施形態では、ベクターは、CMVプロモーターを含む。一部の実施形態では、ベクターは、ベータ1鎖と切断可能部位を介して連結したプレースホルダーペプチドをコードする配列を含む。一部の実施形態では、ペプチド交換アッセイは、プレースホルダーペプチドをベータ鎖から予め切断することを伴う。一部の実施形態では、切断可能部位は、トロンビン切断部位である。一部の実施形態では、ペプチド交換アッセイは、FRETアッセイである。一部の実施形態では、精製は、カラムクロマトグラフィー、バッチクロマトグラフィー、イオン交換クロマトグラフィー、分子ふるいクロマトグラフィー、アフィニティークロマトグラフィーまたはLC-MSのうちのいずれか1つによる。
一態様では、HLA-DRヘテロ二量体、またはHLA-DPヘテロ二量体、またはHLA-DQヘテロ二量体のいずれかを含むHLAクラスII四量体を含む組成物であって、各ヘテロ二量体が、アルファ鎖およびベータ鎖を含み、精製されており、0.25mg/Lよりも高い濃度で存在する、組成物が本明細書で提供される。一部の実施形態では、HLAクラスII四量体は、HLA-DRタンパク質、およびHLA-DPタンパク質またはHLA-DQタンパク質からなる群から選択することができるタンパク質からなる群から選択されるヘテロ二量体対を含む。一部の実施形態では、HLAタンパク質は、HLA-DPB101:01/HLA-DPA101:03、HLA-DPB102:01/HLA-DPA101:03、HLA-DPB103:01/HLA-DPA101:03、HLA-DPB104:01/HLA-DPA101:03、HLA-DPB104:02/HLA-DPA101:03、HLA-DPB106:01/HLA-DPA101:03、HLA-DQB102:01/HLA-DQA105:01、HLA-DQB102:02/HLA-DQA102:01、HLA-DQB106:02/HLA-DQA101:02、HLA-DQB106:04/HLA-DQA101:02、HLA-DRB101:01、HLA-DRB101:02、HLA-DRB103:01、HLA-DRB103:02、HLA-DRB104:01、HLA-DRB104:02、HLA-DRB104:03、HLA-DRB104:04、HLA-DRB104:05、HLA-DRB104:07、HLA-DRB107:01、HLA-DRB108:01、HLA-DRB108:02、HLA-DRB108:03、HLA-DRB108:04、HLA-DRB109:01、HLA-DRB110:01、HLA-DRB111:01、HLA-DRB111:02、HLA-DRB111:04、HLA-DRB112:01、HLA-DRB112:02、HLA-DRB113:01、HLA-DRB113:02、HLA-DRB113:03、HLA-DRB114:01、HLA-DRB115:01、HLA-DRB115:02、HLA-DRB115:03、HLA-DRB116:01、HLA-DRB301:01、HLA-DRB302:02、HLA-DRB303:01、HLA-DRB401:01、HLA-DRB501:01)からなる群から選択される。
一部の実施形態では、ヘテロ二量体対を真核細胞において発現させる。一部の実施形態では、ヘテロ二量体対は、ベクターによってコードされる。一部の実施形態では、ベクターは、HLAタンパク質のアルファ鎖およびベータ鎖をコードする核酸配列、分泌シグナル、ビオチン化モチーフおよび同定用または精製用の少なくとも1つのタグを含み、したがって、各HLAタンパク質アルファ1およびベータ1ヘテロ二量体は二量体を形成した状態で分泌され、分泌されたヘテロ二量体はプレースホルダーペプチドと会合している。一部の実施形態では、ベクターは、HLAタンパク質のアルファ鎖およびベータ鎖をコードする核酸配列、分泌シグナル、ビオチン化モチーフおよび同定用または精製用の少なくとも1つのタグを含み、したがって、各HLAタンパク質アルファ1およびベータ1ヘテロ二量体は二量体を形成した状態で分泌され、分泌されたヘテロ二量体はプレースホルダーペプチドと会合している。
一部の実施形態では、HLAクラスIIヘテロ二量体を真核細胞から細胞培養培地中に分泌させ、カラムまたはバッチクロマトグラフィー、イオン交換クロマトグラフィー、分子ふるいクロマトグラフィー、アフィニティークロマトグラフィーまたはLC-MSのうちのいずれか1つによって精製する。
一態様では、ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、コンピュータプロセッサを使用してポリペプチド配列のペプチド配列のアミノ酸情報を機械学習HLA-ペプチド提示予測モデルに入力して、ペプチド配列についての提示予測のセットを生成するステップであって、各提示予測が、対象の細胞のHLAクラスIまたはクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質により所与のペプチド配列のエピトープ配列が提示される確率を表し、機械学習HLA-ペプチド提示予測モデルが、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、訓練用データが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;アミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む、ステップと、(b)提示予測のセットに基づいて、ポリペプチド配列のペプチド配列の各々が対象に対して免疫原性ではないことを決定または予測するステップと、(c)対象に、薬物を含む組成物を投与するステップとを含む方法が本明細書で提供される。
一態様では、ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、(a)コンピュータプロセッサを使用してポリペプチド配列のペプチド配列のアミノ酸情報を機械学習HLA-ペプチド提示予測モデルに入力して、ペプチド配列についての提示予測のセットを生成するステップであって、各提示予測が、対象の細胞のHLAクラスIまたはクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質により所与のペプチド配列のエピトープ配列が提示される確率を表し、機械学習HLA-ペプチド提示予測モデルが、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、訓練用データが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;アミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む、ステップと、(b)提示予測のセットに基づいて、ポリペプチド配列のペプチド配列のうちの少なくとも1つが対象に対して免疫原性であることを決定または予測するステップとを含む方法が本明細書で提供される。
一実施形態では、方法は、薬物を対象に投与しないことを決定することをさらに含む。
一実施形態では、薬物は、抗体またはその結合性断片を含む。
一実施形態では、ポリペプチド配列のペプチド配列は、8、9、10、11または12アミノ酸の長さを有するポリペプチド配列の各連続したペプチド配列を含み、対象の細胞のHLAクラスIまたはクラスII対立遺伝子によってコードされるタンパク質は、対象の細胞のHLAクラスI対立遺伝子によってコードされるタンパク質である。
一実施形態では、ポリペプチド配列のペプチド配列は、15、16、17、18、19、20、21、22、23、24、または25アミノ酸の長さを有するポリペプチド配列の各連続したペプチド配列を含み、対象の細胞のHLAクラスIまたはクラスII対立遺伝子によってコードされるタンパク質は、対象の細胞のクラスII MHC対立遺伝子によってコードされるタンパク質である。
一態様では、自己免疫疾患または状態を有する対象を処置する方法であって、(a)対象の細胞のHLAクラスIまたはクラスIIによって提示される、発現されたタンパク質のエピトープを同定または予測するステップであって、同定または予測されたエピトープとHLAクラスIまたはクラスIIとを含む複合体が、対象のCD8 T細胞またはCD4 T細胞の標的とされる、ステップと、(b)複合体に結合するT細胞受容体(TCR)を同定するステップと、(c)TCRを対象由来の調節性T細胞または同種異系の調節性T細胞において発現させるステップと、(d)TCRを発現する調節性T細胞を対象に投与するステップとを含む方法が本明細書で提供される。
一実施形態では、自己免疫疾患または状態は、糖尿病である。
一実施形態では、細胞は、膵島細胞である。
一態様では、自己免疫疾患または状態を有する対象を処置する方法であって、対象に、(i)対象の細胞のHLAクラスIまたはクラスIIによって提示されることが同定または予測された、発現されたタンパク質のエピトープと(ii)HLAクラスIまたはクラスIIとを含む複合体に結合するT細胞受容体(TCR)を発現する調節性T細胞を投与するステップを含み、複合体が、対象のCD8 T細胞またはCD4 T細胞の標的とされる、方法が本明細書で提供される。
本開示の単に例示的な実施形態が示され、記載されている以下の詳細な説明から、本開示のさらなる態様および利点が当業者には容易に明らかになろう。理解される通り、本開示は、他のおよび異なる実施形態も可能であり、全て本開示から逸脱することなく、そのいくつかの詳細を種々の明白な観点で改変することができる。したがって、図および説明は、事実上例示的なものであり、制限するものではないとみなされるべきである。
MAPTAC(商標)をハイスループットペプチド結合アッセイのために使用することができ、その場合、LC-MS/MSを使用し、異なる時点において異なる条件下で、例えば37℃での加熱下で、MAPTAC(商標)構築物を用いた単離後にHLAクラスIIに結合したペプチドを測定して、異なる安定性を有するペプチドの集団の配列を得る。
一態様では、対象におけるがんを処置するための方法であって、がんに関連付けられるペプチド配列を同定するステップであって、対象のがん細胞由来のDNA、RNAまたはタンパク質配列を対象の正常細胞由来のDNA、RNAまたはタンパク質配列と比較することを含むステップと、コンピュータプロセッサを使用して、同定されたペプチド配列のアミノ酸情報を機械学習HLA-ペプチド提示予測モデルに入力して、同定されたペプチド配列についての提示予測のセットを生成するステップであって、各提示予測が、対象の細胞のHLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質が同定されたペプチド配列のうちの所与の配列を提示する確率を表し、機械学習HLA-ペプチド提示予測モデルが、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、訓練用データが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;アミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む、ステップと、提示予測のセットに基づいて同定された、個別化がん治療を調製するためのペプチド配列のサブセットを選択するステップと、対象にペプチドの1つまたは複数を含む組成物を投与するステップであって、予測モデルの陽性適中率が、少なくとも0.1%、0.1%~50%または最大で50%の再現率で少なくとも0.1である、ステップとを含む方法が本明細書で提供される。
一部の実施形態では、機械学習HLA-ペプチド提示予測モデルは、細胞において発現されるHLAタンパク質によって提示され、逆相オフライン分画を実施した後に質量分析によって同定されたペプチドの配列の配列情報を含む。
一部の実施形態では、予測モデルは、NetMHCIIpanと比較して1.1倍~100倍の改善を示す。一部の実施形態では、予測モデルは、NetMHCIIpanと比較して1.1倍、2倍、3倍、4倍、5倍、6倍、7倍、7.4倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、18倍、20倍、21倍、22倍、23倍、24倍、25倍、26倍、27倍、28倍、29倍、30倍、31倍、32倍、33倍、34倍、35倍、36倍、37倍、38倍、39倍、40倍、41倍、42倍、43倍、44倍、45倍、50倍、55倍、60倍、61倍、62倍、63倍、64倍、65倍、66倍、67倍、68倍、69倍、70倍、71倍、72倍、73倍、74倍、75倍、76倍、77倍、78倍、79倍、80倍、81倍、8倍、83倍、84倍、85倍、86倍、87倍、88倍、89倍、90倍、91倍、92倍、93倍、94倍、95倍、96倍、97倍、98倍、99倍、100倍またはそれよりも大きな改善を示す。
参照による組込み
本明細書において言及されている全ての刊行物、特許および特許出願は、個々の刊行物、特許、または特許出願が、具体的にかつ個別に参照により組み込まれることが示されたものと同じく参照により本明細書に組み込まれる。参照により組み込まれている刊行物および特許または特許出願が本明細書に含有される開示と矛盾する範囲では、本明細書がそのような矛盾する材料のいずれにも取って代わり、かつ/または優先するものとする。
本発明の新規の特徴は、添付の特許請求の範囲において詳細に記載されている。本発明の原理が利用されている例示的な実施形態が記載されている以下の詳細な説明、および以下の付属図(本明細書では「図」とも)を参照することにより、本発明の特徴および利点のよりよい理解が得られよう。
図1Aは、MHCクラスIタンパク質とドッキングしたペプチドを表す図である。
図1Bは、MHCクラスIIタンパク質とドッキングしたペプチドを表す例示的な図を示す。
図2は、単一対立遺伝子HLAクラスII結合性ペプチドデータを生成するための例示的な実験手法を示す。HLAクラスIIペプチドを、HLAクラスIIを発現しない細胞を含めた任意の細胞に導入し、その結果、特定のHLAクラスII対立遺伝子(複数可)を細胞において発現させる。遺伝子操作されたHLA発現細胞の集団を回収し、溶解させ、それらのHLA-ペプチド複合体にタグ付けし(例えば、ビオチン化)、免疫精製する(例えば、ビオチン-ストレプトアビジン相互作用を使用して)。単一のHLAに特異的なHLA付随ペプチドをそれらのタグ付けされた(例えば、ビオチン化された)複合体から溶出させ、評価する(例えば、高分解能LC-MS/MSを使用して配列決定を行う)ことができる。
図3は、Neon BAP、Expi293細胞株;Neon BAP、A375細胞株;IEDB、親和性<50nM;および汎HLA Class II Ab、ホモ接合性LCLにわたるHLAクラスII-DRB111:01関連ペプチドの例示的な配列ロゴ表示を示す。図3は、MS由来モチーフの例が既知パターンとマッチし、トランスフェクトされた細胞株にわたって一貫性を示すことを示す。
図4は、HLAクラスII結合予測器の性能の例示的な描写である。図4は、ヒットペプチドをランダムにシャッフリングすることによって1:19(ヒット:デコイ)の比で生成された観察された質量分析ペプチドおよびデコイペプチドからなる検証用データセットに適用した結合予測器(neonmhc2)およびNetMHCIIpanの性能を示す棒プロットである。NEON結合予測器neonmhc2に関しては、示されている各MHC II対立遺伝子に対して別々のモデルを築く。棒の高さは、検証セット内の実際にヒットペプチドであった予測された結合体の分率と定義される陽性適中率(PPV)を示す。対立遺伝子は、その対立遺伝子について予測した場合のモデルの性能によってソートされている。
図5は、結合予測器の検証に対するスコア化ピーク強度(SPI)閾値の例示的な影響を示す。図5は、種々のスコア化ピーク強度(SPI)カットオフを有するペプチドのセットで訓練/検証を行った場合のHLAクラスII結合予測器の性能を示す。訓練された各対立遺伝子特異的モデルについて、以下の3つの設定でのモデルの性能が示されている:70 SPIよりも大きいまたはそれと等しい観察されたMSヒットペプチドを使用してデータセットに対して訓練および評価を行う、50 SPIよりも大きいまたはそれと等しいペプチドで訓練を行い、70 SPIよりも大きいまたはそれと等しいペプチドで検証を行う、ならびに、50 SPIよりも大きいまたはそれと等しいペプチドで訓練および検証を行う。
図6は、LC-MS/MSによる対立遺伝子プロファイリングによって観察された、70スコア化ピーク強度(SPI)カットオフよりも大きいまたはそれと等しいペプチドの数からの代表的データを示す例示的な棒プロットを示す。各棒は、対立遺伝子の観察されたペプチドの総数を表す。35種のHLA-DR対立遺伝子についての収集データが存在する。35種のHLA-DR対立遺伝子についての収集データは、HLA-DRに関して>95%の集団カバレッジを有する(USA対立遺伝子頻度)。
図7Aは、示されているHLAクラスII対立遺伝子についてデータの試験区分に適用した場合のモデルのPPVを示す。使用したデコイペプチドは、ヒット対デコイ比1:19で陽性(ヒット)ペプチド配列のスクランブル配列であった。PPVを、試験区分におけるペプチドの上位スコア化5%を同定し、それぞれのHLAクラスII対立遺伝子によってコードされるタンパク質への結合について陽性であるそれらの分率を決定することによって決定した。
図7Bは、訓練セットのサイズに応じた例示的な予測性能(訓練セットを人為的にダウンサンプリングすることによって得られた曲線)を示す。図7Bは、一般に、収集した35種のHLA-DR対立遺伝子について、訓練セットのサイズを拡大すると、PPVの値が増大することを示す。 図7Bは、訓練セットのサイズに応じた例示的な予測性能(訓練セットを人為的にダウンサンプリングすることによって得られた曲線)を示す。図7Bは、一般に、収集した35種のHLA-DR対立遺伝子について、訓練セットのサイズを拡大すると、PPVの値が増大することを示す。 図7Bは、訓練セットのサイズに応じた例示的な予測性能(訓練セットを人為的にダウンサンプリングすることによって得られた曲線)を示す。図7Bは、一般に、収集した35種のHLA-DR対立遺伝子について、訓練セットのサイズを拡大すると、PPVの値が増大することを示す。
図8は、プロセシングに関連する変数により予測をさらに改善することができることを実証する例示的なグラフを示す。タンパク質をコードするエクソームから選択されたMSにより観察されたペプチドランダム配列を区別することができる。訓練用データ区分に対して、結合強度(NetMHCIIpanまたはNeonの予測器)およびプロセシング特色(RNA-Seq発現および派生遺伝子レベルの偏り項)を使用してロジスティック回帰を当てはめて、HLAクラスII提示を予測することができる。別々の評価区分に対して、MSにより観察されたMHC IIペプチド(「ヒット」)と重複するエクソンの位置を、MSで観察されなかったランダムなエクソンの位置と並行してスコア化することができる(1:499の比)。上位0.2%(1/500)を陽性とコールすることができ、陽性適中率を、この閾値を用いて評価することができる。
図9は、例示的なニューラルネットワークアーキテクチャを示す。入力ペプチドが20merとして示され、それよりも短いペプチドには「欠損」文字が記入される。各ペプチドは31次元の埋め込みを有し、したがって、ニューラルネットワークへの入力は20×31行列である。ニューラルネットワークによって処理する前に、20×31行列に対する特色の正規化を訓練セットにおける特色値の平均および標準偏差に基づいて実施する。第1の畳み込み層は、9アミノ酸および50フィルター(チャネルとも称される)のカーネルを有し、Rectified Linear Unit(ReLU)活性化関数を用いる。この後に、バッチ正規化、次いでドロップアウト率20%での空間ドロップアウトが続く。この後に、3アミノ酸および20フィルターのカーネルを有し、ReLU活性化関数を用いる別の畳み込み層、次いで、再度バッチ正規化およびドロップアウト率20%での空間ドロップアウトが続く。次いで、20フィルターの各々において最大限に活性化されたニューロンを取ってグローバル最大プーリングを適用し、次いで、これらの20個の値を、シグモイド活性化関数を使用して単一のニューロンを有する全結合(高密度)層を通過させる。この層の出力を結合/非結合予測として扱う。L2正則化をそれぞれ0.05、0.1、および0.01の重みを有する第1の畳み込み層、第2の畳み込み層、および高密度層の重みに適用する。使用した追加的なモデルでは畳み込み層の数および各層のカーネルサイズを変動させた。
図10は、本明細書で提供される方法をインプリメントするようにプログラムされたまたは他のやり方で構成された例示的なコンピュータ制御システムを示す。
図11Aは、MAPTAC(商標)実験ワークフローの例示的な概要を示す。
図11Bは、反復実験にわたってマージした例示的な対立遺伝子当たりのペプチド計数を示す。
図11Cは、MAPTAC(商標)によってプロファイリングされたHLAクラスIおよびHLAクラスII対立遺伝子についての例示的なペプチド長分布を示す。
図11Dは、MAPTAC(商標)およびIEDB(対立遺伝子DRB101:01、DRB103:01、DRB109:01、およびDRB111:01)、ヒトプロテオーム、ならびに以前の刊行物からの複対立遺伝子MSデータについて観察された例示的な残基当たりのシステイン頻度を示す。
図12Aは、個体の>1%に存在するHLA-DR、HLA-DP、およびHLA-DQ対立遺伝子についてのコーカサス人での頻度、および、強力な結合体(<50nM)として測定された、示されている供給源由来のペプチドの計数を示す。
図12Bは、IEDBペプチドの例示的な長さ分布を関連するHLAクラスII親和性測定値と共に示す。
図12Cは、(1)Expi293、(2)HeLa、および(3)2種のHLAクラスI対立遺伝子および2種のHLAクラスII対立遺伝子:HLA-A02:01、HLA-B45:01、HLA-DRB101:01、およびHLA-DRB111:01を個別にトランスフェクトしたA375細胞株の例示的なウエスタンブロットを示す。膜に抗ビオチンリガーゼエピトープタグをブロットして、ビオチンアクセプターペプチド(BAP)、およびローディング対照として抗ベータ-チューブリンを可視化した。レーンはMAPTAC(商標)プロトコールの間に収集された以下の画分に対応した:レーン1、入力、レーン2、ビオチン化入力、およびレーン3、プルダウン後の入力。
図12Dは、MAPTAC(商標)およびIEDB(対立遺伝子DRB101:01、DRB103:01、DRB109:01、およびDRB111:01)、ヒトプロテオーム、ならびに以前の刊行物からの複対立遺伝子MSデータについて観察された例示的な残基当たりのアミノ酸頻度を示す。
図12Eは、個体の>1%に存在するHLA-DR、HLA-DP、およびHLA-DQ対立遺伝子についてのコーカサス人での頻度、および、強力な結合体(<50nM)として測定された、示されている供給源由来のペプチドの計数を示す。この図は、図12Aに対する追加的なデータを含む。追加的なデータはtools.iedb.org/main/datasets/から取得した。
図12Fは、MAPTAC(商標)(還元およびアルキル化されたもの)、MAPTAC(商標)(無処理)およびIEDB(対立遺伝子DRB101:01、DRB103:01、DRB109:01、およびDRB111:01)、ヒトプロテオーム、ならびに以前の刊行物からの複対立遺伝子MSデータについて観察された例示的な残基当たりのアミノ酸頻度を示す。
図13は、MAPTAC(商標)およびIEDB毎のMHC II対立遺伝子についてのコア結合性配列ロゴの例示的な表示を示す。配列ロゴは図表示であり、各アミノ酸の高さは、対立遺伝子によってコードされるMHCタンパク質に結合するペプチドにおけるそのアミノ酸の発生頻度に比例する。エントロピーが最も低い位置が色で示されており、その色がアミノ酸特性に対応する。ペプチドは示されているデータセットに由来し、CNNに基づく予測器(方法)に従ってアラインメントされている。ロゴは、全体的なモチーフと密接にはマッチしないものを含めた全てのペプチドを表す(例えば、「トラッシュ」クラスターに隔離されるペプチドがない)。
図14Aは、2つの異なる細胞株(A375&expi293)において、結合アッセイ、安定性アッセイ、可溶性HLA(sHLA)質量分析、単一対立遺伝子質量分析、およびMAPTAC(商標)を含めた異なるHLA-リガンドプロファイリング技術を使用して解析されたHLA-A02:01結合性ペプチド(リガンド)についての例示的な配列ロゴを示す。
図14Bは、ヒューリスティックに定義されたアンカーを0個、1個、2個、3個、および4個示すMAPTAC(商標)ペプチドの例示的な分率を示す。
図14Cは、MAPTAC(商標)により観察されたペプチド(対立遺伝子当たり20種のペプチド、各々がSPI>70およびサイズが2以上の入れ子セットを有する)ならびにプロテオームからサンプリングした、長さを釣り合わせたデコイについてのNetMHCIIpanにより予測された結合親和性の例示的な分布を示す。
図15Aは、単一対立遺伝子MHCペプチドとスクランブルされた長さを釣り合わせたデコイを区別するように訓練された畳み込みニューラルネットワーク(CNN)の例示的なアーキテクチャを示す。概略図は、アミノ酸特色の埋め込み、フィルターサイズが異なる2つの畳み込み層の使用、ならびにグローバル最大プーリングの、最終的なロジスティック出力ノードへの入力としての使用を示す。
図15Bは、neonmhc2またはNetMHCIIpanのいずれかからの結合予測を用いて測定されたIEDB親和性の相関についてのケンドールのタウ統計値を示す例示的な結果である。評価されたペプチドは、NetMHCIIpanが発表された翌年にIEDBにポストされたもののみを含む。
図16は、訓練用データセットのサイズに応じたneonmhc2の性能の例示的な描写である。
図17Aは、汎DRおよび汎クラスII MHC MSデータセットにスパイクされたMAPTAC(商標)ペプチド(対立遺伝子当たり20種)についての例示的なクラスター割り当てを示す。データセットに対して、GibbsClusterを使用して逆畳み込みを行った。各四角は1つのMAPTAC(商標)ペプチドを表す。四角の色は、それが割り当てられるクラスターを示し、灰色の棒は、ペプチドが実際に由来する対立遺伝子を示す。ギブスクラスター解法におけるクラスターの総数(右側)を、相互情報(MI)メトリクスを使用して選択した。MIスコアにより、試料がどのように選別されるかも決定される;高MI解法の試料が上位に現れる。
図17Bは、GibbsClusterによって逆畳み込みされた複対立遺伝子MSデータについての例示的なコア結合性配列ロゴを示す。ペプチドの各セットは、MAPTAC(商標)スパイクインに最良にアラインメントされるクラスターに対応する。
図17Cは、MAPTAC(商標)データまたは逆畳み込みされた複対立遺伝子データのいずれかを使用してホールドアウトMAPTAC(商標)ペプチドを予測するモデルの代表的な性能を示す。各対立遺伝子について、2つのデータ供給源のうちの大きい方(通常MAPTAC(商標))をダウンサンプリングし、したがって、予測器は等しい数の訓練例に基づく。NetMHCIIpan性能がさらなる比較として示されている。
図17Dは、示されている供給源からの複対立遺伝子MSデータに由来する例示的なコア結合性配列ロゴを示す。
図18Aは、ペプチド対供給源遺伝子発現の分率(MSにより観察されたペプチドおよびランダムなプロテオームデコイについての百万当たりの転写物数(TPM))の例示的なグラフを示す(Schuster et al. 2017から再プロットしたデータ)。
図18Bは、結腸直腸がん、黒色腫、および卵巣がんデータセットの共同解析によって決定される、遺伝子当たりのクラスIIペプチドの例示的な観察数と予測数とを示す(Loeffler et al., 2018、およびSchuster et al., 2017)。予測計数は、遺伝子の長さに発現レベルを掛けることによって導き出される。予測計数および観察計数を関連性のある試料にわたって合計した。血漿中に存在することが公知である遺伝子にそれらの濃度に従って印をつけた(挿入図)。
図18Cは、オートファジーに関連する遺伝子についての富化スコア(観察された観察対予測された観察の比、図18Bと同様)の例示的な分布を示す。
図18Dは、各供給源遺伝子の局在化に従った富化スコアの例示的な分布を示す。供給源遺伝子の局在化を、Uniprot(uniprot_sprot.dat)を使用して決定した。
図18Eは、細胞内局在化特性に基づいて隔離されたMHC-II結合親和性を有するペプチドの総数の分率の予測された頻度と観察された頻度の比較を表す例示的なデータを示す。
図18Fは、2つの異なる遺伝子発現プロファイルに関する観察におけるペプチドの相対的一致の例示的な代表的データを示す。各試料について、遺伝子レベルペプチド計数をバルク腫瘍遺伝子発現およびプロフェッショナルAPC(マクロファージ)遺伝子発現プロファイルの線形結合としてモデル化した。係数の比により、各発現プロファイルとペプチドレパートリーの相対的一致が決定される。エラーバーはブートストラップリサンプリングによってコンピュータ計算された95%信頼区間に対応した。
図19Aは、5つの試験例におけるHLA-DRB1の発現レベルの例示的な代表的データを示す。各ドットは、細胞にわたって平均した、個々の患者の個々の細胞型における発現を表す。
図19Bは、TCGA患者のRNA-Seqから入力された腫瘍および間質由来HLA-DRB1発現の例示的な代表的データを示す。横棒は個々の患者に対応し、腫瘍型によって群分けされている。患者が、DNAに基づく変異コールによって決定されるHLAクラスII経路遺伝子(CIITA、CD74またはCTSSS)の変異を有する場合、その患者を含めた。各患者について、腫瘍に起因するHLA-DRB1発現の分率をmin(1,2f)として推定し、ここで、fは、変異を示すCIITA、CD74、またはCTSSにおけるRNA-Seqリードの分率である。
図19Cは、チェックポイント遮断免疫治療前およびチェックポイント遮断免疫治療後の生検を含む追加的な単一細胞RNA-Seq試験の例示的な代表的データを示す。
図20は、天然のドナー組織に対する予測の全体的な性能を評価する例示的な代表的な実験データを示す。
図21Aは、細胞HLAクラスIIリガンドームを予測する統合された提示モデルを示す例示的な代表的データを示す。これは、汎DRデータセットについてのヒット対デコイ比1:499でのPPVを表す(図30Bおよび図32Eにおいても解析されている)。予測器は、結合予測(NetMHCIIpanまたはneonmhc2)を使用し、必要に応じて遺伝子発現、遺伝子の偏り(図32Aの通り)、および以前に観察されたHLA-DQペプチドとの重複を使用するものである。各候補ペプチドについて、結合スコアを、試料遺伝子型におけるHLA-DR対立遺伝子にわたる最大値として算出した。
図21Bは、樹状細胞(細胞溶解物から解析)によって提示されるSILACを使用して同定された腫瘍由来ペプチドについての、図21Aと同じヒット:デコイ比および性能メトリクスを使用し、プロセシング特色の使用を伴うまたは伴わない予測性能を示す例示的な代表的データを示す。
図21Cは、UV処理実験において観察された、重標識されたペプチドについての例示的な発現および遺伝子の偏りのスコア(赤色のドット、K562発現に従ってプロットした)を、軽標識されたペプチド(灰色のドット、DC発現に従ってプロットした)と比較して示す。
図21Dは、溶解物およびUV処理実験による重標識されたペプチド供給源遺伝子の重複を表す例示的な図を示す。遺伝子名に機能的クラス毎に色が付いている。
図22Aは、HLAクラスIIにより駆動されるCD4+ T細胞およびT細胞応答を検証するための、本明細書に開示されるアッセイプロトコールを表す例示的なフロー図を示す。
図22Bは、ペプチド交換アッセイのための例示的なHLAタンパク質二量体構築物の設計(上のパネル)および例示的なアッセイワークフローの図表示(下のパネル)を示す。
図23は、新しい結合性ペプチドをスクリーニングするためのMHC-II発現のための例示的なベクター設計の例示的な図解、および発現されたタンパク質産物の表示を示す。
図24は、プレースホルダーペプチドのトランスフェクション、精製およびベータ鎖からの切断の例示的な流れ図を示す。
図25Aは、発現されたMHC-IIペプチドの分泌の増加に関連するCLIPペプチドをコードするベクターを示す例示的な図解を示す。
図25Bは、それぞれCLIP0をコードする核酸およびCLIP1をコードする核酸のより短い形態およびより長い形態の例示的な図表示を示す。
図25Cは、より長いクリップを伴うまたは伴わないアルファ鎖およびベータ鎖のクーマシーゲル分析の例示的な代表的結果を示す。
図26Aは、TR-FRETアッセイの例示的な図解を示す。
図26Bは、特定のペプチドを使用した蛍光共鳴エネルギー移動(FRET)アッセイを使用したHLAクラスIIペプチド結合アッセイからの例示的な代表的な極性化データを示す。
図26Cは、特定のペプチドを使用した蛍光共鳴エネルギー移動(FRET)アッセイを使用したHLAクラスIIペプチド結合アッセイからの例示的な代表的な極性化データを示す。
図26Dは、蛍光の増大から算出したMHC-構築物結合ペプチドの例示的なパーセント置換えを示す。
図26Eは、蛍光の増大から算出したMHC-構築物結合ペプチドの例示的なパーセント置換えを示す。
図26Fは、示差走査蛍光光度法(DSF)を使用したアッセイを使用した例示的なペプチド交換を示す。フルオロフォアの結合および高い蛍光がもたらされる、MHCクラスIIヘテロ二量体も同様に解離させる熱を用いたMHCクラスIIからのペプチド解離の検出の例示的な機構を示す図表示が示されている。エピトープペプチドによるプレースホルダーペプチドの移動の例示的な概略図も示されている。温度に対してプロットした例示的な融解曲線も示されている。
図26Gは、例示的な可溶性HLA-DM構築物およびMHCクラスIIペプチド交換を実施するためのその使用を示す。示されている構築物は、CMVプロモーター、分泌配列(リーダー)の下流のHLA-DMベータ鎖のコード配列およびHLA-DMアルファ鎖のコード配列、ならびにベータ鎖コード配列の3’末端のBAP配列;アルファ鎖コード配列の3’末端におけるHisタグを含有する。2つの鎖は介在するリボソームスキッピング配列によって分離されている。構築物をExpi-CHO細胞において発現させ、培養培地中に分泌されたタンパク質を精製した。
図26Hは、ペプチド交換を実施するためのHLA-sDMを使用した例示的な分子ふるいクロマトグラフィーデータを示す。
図27Aは、例示的なDRB四量体レパートリーを築く例示的な図解を示す。
図27Bは、例示的なクラスII四量体レパートリーを築く例示的な図解を示す。
図27Cは、ペプチド交換のためのDRB1対立遺伝子についてのDRB四量体レパートリーカバレッジの要約の例示的な図解を示す。
図27Dは、ヒトMHCクラスII対立遺伝子産生の例示的なカバレッジを示す。
図27Eは、Fluエピトープ(記憶応答)またはHIVエピトープ(ナイーブな応答)を用いて誘導された試料の四量体染色からの例示的な結果を示す。
図28Aは、ペプチドを、HLAクラスII制限について、エピトープペプチドについての対立遺伝子制限を迅速に同定するためのスクリーニング方法を可能にする蛍光偏光アッセイによって評価する方法の例示的な図表示を示す。図28Aのアッセイ原理により、親和性測定、およびペプチド交換の明白な測定が可能になる。
図28Bは、DRB101:01を用いた蛍光偏光アッセイにおいて探究された多数のアッセイ条件の例示的な要約を示す(上のパネル)。可溶性MHCクラスII対立遺伝子および界面活性剤ミセル内に膜貫通ドメインを有する全長MHCクラスII対立遺伝子の図表も示されており(下のパネル)、これらはどちらも、アッセイに使用するための切断可能なリンカーを有するプレースホルダーペプチドを用いて構築されたものである。
図28Cは、図28Bの下のパネルにおいて前に示された全長対立遺伝子および可溶性対立遺伝子を調査するためのアッセイの例示的な図表示を示す。手短に言えば、全長対立遺伝子および可溶性対立遺伝子の両方を細胞において発現させる。膜に結合した全長対立遺伝子の形態は膜を透過処理することによって回収し、一方、分泌形態は細胞の上清から回収する。回収されたクラスII HLA対立遺伝子タンパク質を、ニッケル(Ni2+)カラムを通過させることによって精製する。
図28Dは、精製方法がペプチド効力に影響を及ぼさないことを示す例示的なデータを示す。左側にはL243により精製された全長HLA-DR1およびNi2+により精製された全長HLA-DR1を使用した実験からの平均IC50値が示されている。
図28Eは、可溶性形態(sDR1)または全長形態(fDR1)の選択がペプチド効力に影響を及ぼさないことを示す例示的なデータを示す。左側にはsDR1形態またはfDR1を使用した実験からの平均IC50値が示されている。FP、蛍光偏光。
図28Fは、neonmhc2により予測されたペプチドおよびNetMHCIIpanにより予測されたペプチドの結合アッセイおよび不調和ペプチドの同定における例示的な評価の例示的な図解を示す。
図28Gは、neonmhc2により予測されたペプチドを評価するための例示的な蛍光偏光結合スクリーニングデータを示す;ヒートマップとして、また使用したペプチドの各濃度について示されているプローブ結合のパーセント阻害としても示されている。緑色は、色の強度に比例して良好な結合を示す。黄色は中間の結合を示し、赤色は不十分な結合を示し、また、対応するパーセント阻害値としても示されている。
図28Hは、neonmhc2により予測されたペプチドの評価の例示的な結合アッセイにおける要約を示す。
図29は、各HLA対立遺伝子毎の平均MAPTAC(商標)実験的反復(細胞5000万個)からのペプチドの例示的な平均計数を示す。
図30A~30Cは、HLAクラスII MAPTAC(商標)対立遺伝子+/-HLA-DMについての例示的な結合性コア解析および複対立遺伝子逆畳み込みの忠実度を示す。図30Aは、HLA-DM同時トランスフェクション(expi293細胞株)を伴うまたは伴わないMAPTAC(商標)およびIEDBに従った、HLA-DR、HLA-DQ、およびHLA-DP対立遺伝子についての代表的な例示的な配列ロゴの1つを示し、各アミノ酸の高さはその頻度に比例する。頻度が10%よりも高いアミノ酸は化学的特性に応じて色で示されている;他のアミノ酸は全て灰色で示されている。ペプチドをGibbsClusterツール(補足的方法)に従ってアラインメントし、ロゴは、モチーフ全体と密接にはマッチしないものを含めた全てのペプチドを表す(例えば、「トラッシュ」クラスターに隔離されるペプチドがない)。図30Bは、汎DR MSデータセットにスパイクインされたMAPTAC(商標)ペプチド(対立遺伝子当たり20種)についてのクラスター割り当ての例示的な記述を示す。データセットに対して、GibbsClusterを使用して逆畳み込みを行った。色付きの四角は各々が1つのMAPTAC(商標)ペプチドを表す。四角の色は、それが割り当てられるクラスターを示し、灰色の棒は、ペプチドが由来する対立遺伝子を示す。図30Cは、図30Bに示されている対立遺伝子についての、アンカー位置において予測された残基を0個、1個、2個、3個、または4個を示すペプチドの共有を示す例示的なグラフを示す。アンカー位置をエントロピーが最も低い4つの位置と定義し、「予測される」残基をそれらの位置における頻度が10%以上である残基と定義した。 図30A~30Cは、HLAクラスII MAPTAC(商標)対立遺伝子+/-HLA-DMについての例示的な結合性コア解析および複対立遺伝子逆畳み込みの忠実度を示す。図30Aは、HLA-DM同時トランスフェクション(expi293細胞株)を伴うまたは伴わないMAPTAC(商標)およびIEDBに従った、HLA-DR、HLA-DQ、およびHLA-DP対立遺伝子についての代表的な例示的な配列ロゴの1つを示し、各アミノ酸の高さはその頻度に比例する。頻度が10%よりも高いアミノ酸は化学的特性に応じて色で示されている;他のアミノ酸は全て灰色で示されている。ペプチドをGibbsClusterツール(補足的方法)に従ってアラインメントし、ロゴは、モチーフ全体と密接にはマッチしないものを含めた全てのペプチドを表す(例えば、「トラッシュ」クラスターに隔離されるペプチドがない)。図30Bは、汎DR MSデータセットにスパイクインされたMAPTAC(商標)ペプチド(対立遺伝子当たり20種)についてのクラスター割り当ての例示的な記述を示す。データセットに対して、GibbsClusterを使用して逆畳み込みを行った。色付きの四角は各々が1つのMAPTAC(商標)ペプチドを表す。四角の色は、それが割り当てられるクラスターを示し、灰色の棒は、ペプチドが由来する対立遺伝子を示す。図30Cは、図30Bに示されている対立遺伝子についての、アンカー位置において予測された残基を0個、1個、2個、3個、または4個を示すペプチドの共有を示す例示的なグラフを示す。アンカー位置をエントロピーが最も低い4つの位置と定義し、「予測される」残基をそれらの位置における頻度が10%以上である残基と定義した。
図31A~31Fは、neonmhc2結合予測アルゴリズムの例示的なアーキテクチャおよびベンチマーキングを示す。図31Aは、単一対立遺伝子HLAクラスIIペプチドと、スクランブルされた長さを釣り合わせたデコイとを区別するように訓練された畳み込みニューラルネットワーク(CNN)の例示的なアーキテクチャを示す。概略図は、アミノ酸特色の埋め込み層、幅6の2つの畳み込み層、最後までスキップ接続の存在、および最終的なロジスティック出力ノードへの入力として平均プーリング操作と最大プーリング操作の組合せの使用を示す。図31Bは、訓練またはハイパーパラメータ最適化に使用していないMAPTAC(商標)データの区分に関して評価した、NetMHCIIpanおよびneonmhc2についての例示的な陽性適中率(PPV)を示す。各対立遺伝子について、MSにより観察されたペプチドn個を、供給源遺伝子の同じセットからサンプリングした長さを釣り合わせたデコイ19n個と併せてスコア化し、各予測器の上位に順位付けされたペプチド(例えば、上位5%)n個を陽性とコールした。この評価プロトコールによると、偽陽性の数と偽陰性の数が必ず等しくなるので、PPVは再現率と同一である。図31Cは、TGEMデータセットに対する例示的なNetMHCIIpanのPPVおよびneonmhc2のPPVを示す。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価したセット内の確認された免疫原性エピトープの数である。図31Dは、新抗原ペプチドについての例示的なex vivoにおけるT細胞誘導の結果を示す。ペプチドを、HLA-DRB111:01についての高neonmhc2スコアおよび弱いNetMHCIIpanスコアに基づいて選択した。図31Eは、単一対立遺伝子MAPTACデータに対して訓練したモデルと、ホールドアウト単一対立遺伝子データに対して評価される逆畳み込みされた複対立遺伝子データとの比較を示す。値は、訓練用データセットをダウンサンプリングして逆畳み込み訓練セットのサイズをマッチさせた場合のneonmhc2について示されている通りである。図31Fは、NetMHCIIpan-v3.1、逆畳み込みにより訓練された予測器、およびneonmhc2のTGEMデータセットに対するPPVを示す(ダウンサンプリングを伴う、および伴わない)。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価されたセットにおいて確認された免疫原性エピトープの数である。 図31A~31Fは、neonmhc2結合予測アルゴリズムの例示的なアーキテクチャおよびベンチマーキングを示す。図31Aは、単一対立遺伝子HLAクラスIIペプチドと、スクランブルされた長さを釣り合わせたデコイとを区別するように訓練された畳み込みニューラルネットワーク(CNN)の例示的なアーキテクチャを示す。概略図は、アミノ酸特色の埋め込み層、幅6の2つの畳み込み層、最後までスキップ接続の存在、および最終的なロジスティック出力ノードへの入力として平均プーリング操作と最大プーリング操作の組合せの使用を示す。図31Bは、訓練またはハイパーパラメータ最適化に使用していないMAPTAC(商標)データの区分に関して評価した、NetMHCIIpanおよびneonmhc2についての例示的な陽性適中率(PPV)を示す。各対立遺伝子について、MSにより観察されたペプチドn個を、供給源遺伝子の同じセットからサンプリングした長さを釣り合わせたデコイ19n個と併せてスコア化し、各予測器の上位に順位付けされたペプチド(例えば、上位5%)n個を陽性とコールした。この評価プロトコールによると、偽陽性の数と偽陰性の数が必ず等しくなるので、PPVは再現率と同一である。図31Cは、TGEMデータセットに対する例示的なNetMHCIIpanのPPVおよびneonmhc2のPPVを示す。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価したセット内の確認された免疫原性エピトープの数である。図31Dは、新抗原ペプチドについての例示的なex vivoにおけるT細胞誘導の結果を示す。ペプチドを、HLA-DRB111:01についての高neonmhc2スコアおよび弱いNetMHCIIpanスコアに基づいて選択した。図31Eは、単一対立遺伝子MAPTACデータに対して訓練したモデルと、ホールドアウト単一対立遺伝子データに対して評価される逆畳み込みされた複対立遺伝子データとの比較を示す。値は、訓練用データセットをダウンサンプリングして逆畳み込み訓練セットのサイズをマッチさせた場合のneonmhc2について示されている通りである。図31Fは、NetMHCIIpan-v3.1、逆畳み込みにより訓練された予測器、およびneonmhc2のTGEMデータセットに対するPPVを示す(ダウンサンプリングを伴う、および伴わない)。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価されたセットにおいて確認された免疫原性エピトープの数である。 図31A~31Fは、neonmhc2結合予測アルゴリズムの例示的なアーキテクチャおよびベンチマーキングを示す。図31Aは、単一対立遺伝子HLAクラスIIペプチドと、スクランブルされた長さを釣り合わせたデコイとを区別するように訓練された畳み込みニューラルネットワーク(CNN)の例示的なアーキテクチャを示す。概略図は、アミノ酸特色の埋め込み層、幅6の2つの畳み込み層、最後までスキップ接続の存在、および最終的なロジスティック出力ノードへの入力として平均プーリング操作と最大プーリング操作の組合せの使用を示す。図31Bは、訓練またはハイパーパラメータ最適化に使用していないMAPTAC(商標)データの区分に関して評価した、NetMHCIIpanおよびneonmhc2についての例示的な陽性適中率(PPV)を示す。各対立遺伝子について、MSにより観察されたペプチドn個を、供給源遺伝子の同じセットからサンプリングした長さを釣り合わせたデコイ19n個と併せてスコア化し、各予測器の上位に順位付けされたペプチド(例えば、上位5%)n個を陽性とコールした。この評価プロトコールによると、偽陽性の数と偽陰性の数が必ず等しくなるので、PPVは再現率と同一である。図31Cは、TGEMデータセットに対する例示的なNetMHCIIpanのPPVおよびneonmhc2のPPVを示す。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価したセット内の確認された免疫原性エピトープの数である。図31Dは、新抗原ペプチドについての例示的なex vivoにおけるT細胞誘導の結果を示す。ペプチドを、HLA-DRB111:01についての高neonmhc2スコアおよび弱いNetMHCIIpanスコアに基づいて選択した。図31Eは、単一対立遺伝子MAPTACデータに対して訓練したモデルと、ホールドアウト単一対立遺伝子データに対して評価される逆畳み込みされた複対立遺伝子データとの比較を示す。値は、訓練用データセットをダウンサンプリングして逆畳み込み訓練セットのサイズをマッチさせた場合のneonmhc2について示されている通りである。図31Fは、NetMHCIIpan-v3.1、逆畳み込みにより訓練された予測器、およびneonmhc2のTGEMデータセットに対するPPVを示す(ダウンサンプリングを伴う、および伴わない)。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価されたセットにおいて確認された免疫原性エピトープの数である。 図31A~31Fは、neonmhc2結合予測アルゴリズムの例示的なアーキテクチャおよびベンチマーキングを示す。図31Aは、単一対立遺伝子HLAクラスIIペプチドと、スクランブルされた長さを釣り合わせたデコイとを区別するように訓練された畳み込みニューラルネットワーク(CNN)の例示的なアーキテクチャを示す。概略図は、アミノ酸特色の埋め込み層、幅6の2つの畳み込み層、最後までスキップ接続の存在、および最終的なロジスティック出力ノードへの入力として平均プーリング操作と最大プーリング操作の組合せの使用を示す。図31Bは、訓練またはハイパーパラメータ最適化に使用していないMAPTAC(商標)データの区分に関して評価した、NetMHCIIpanおよびneonmhc2についての例示的な陽性適中率(PPV)を示す。各対立遺伝子について、MSにより観察されたペプチドn個を、供給源遺伝子の同じセットからサンプリングした長さを釣り合わせたデコイ19n個と併せてスコア化し、各予測器の上位に順位付けされたペプチド(例えば、上位5%)n個を陽性とコールした。この評価プロトコールによると、偽陽性の数と偽陰性の数が必ず等しくなるので、PPVは再現率と同一である。図31Cは、TGEMデータセットに対する例示的なNetMHCIIpanのPPVおよびneonmhc2のPPVを示す。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価したセット内の確認された免疫原性エピトープの数である。図31Dは、新抗原ペプチドについての例示的なex vivoにおけるT細胞誘導の結果を示す。ペプチドを、HLA-DRB111:01についての高neonmhc2スコアおよび弱いNetMHCIIpanスコアに基づいて選択した。図31Eは、単一対立遺伝子MAPTACデータに対して訓練したモデルと、ホールドアウト単一対立遺伝子データに対して評価される逆畳み込みされた複対立遺伝子データとの比較を示す。値は、訓練用データセットをダウンサンプリングして逆畳み込み訓練セットのサイズをマッチさせた場合のneonmhc2について示されている通りである。図31Fは、NetMHCIIpan-v3.1、逆畳み込みにより訓練された予測器、およびneonmhc2のTGEMデータセットに対するPPVを示す(ダウンサンプリングを伴う、および伴わない)。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価されたセットにおいて確認された免疫原性エピトープの数である。 図31A~31Fは、neonmhc2結合予測アルゴリズムの例示的なアーキテクチャおよびベンチマーキングを示す。図31Aは、単一対立遺伝子HLAクラスIIペプチドと、スクランブルされた長さを釣り合わせたデコイとを区別するように訓練された畳み込みニューラルネットワーク(CNN)の例示的なアーキテクチャを示す。概略図は、アミノ酸特色の埋め込み層、幅6の2つの畳み込み層、最後までスキップ接続の存在、および最終的なロジスティック出力ノードへの入力として平均プーリング操作と最大プーリング操作の組合せの使用を示す。図31Bは、訓練またはハイパーパラメータ最適化に使用していないMAPTAC(商標)データの区分に関して評価した、NetMHCIIpanおよびneonmhc2についての例示的な陽性適中率(PPV)を示す。各対立遺伝子について、MSにより観察されたペプチドn個を、供給源遺伝子の同じセットからサンプリングした長さを釣り合わせたデコイ19n個と併せてスコア化し、各予測器の上位に順位付けされたペプチド(例えば、上位5%)n個を陽性とコールした。この評価プロトコールによると、偽陽性の数と偽陰性の数が必ず等しくなるので、PPVは再現率と同一である。図31Cは、TGEMデータセットに対する例示的なNetMHCIIpanのPPVおよびneonmhc2のPPVを示す。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価したセット内の確認された免疫原性エピトープの数である。図31Dは、新抗原ペプチドについての例示的なex vivoにおけるT細胞誘導の結果を示す。ペプチドを、HLA-DRB111:01についての高neonmhc2スコアおよび弱いNetMHCIIpanスコアに基づいて選択した。図31Eは、単一対立遺伝子MAPTACデータに対して訓練したモデルと、ホールドアウト単一対立遺伝子データに対して評価される逆畳み込みされた複対立遺伝子データとの比較を示す。値は、訓練用データセットをダウンサンプリングして逆畳み込み訓練セットのサイズをマッチさせた場合のneonmhc2について示されている通りである。図31Fは、NetMHCIIpan-v3.1、逆畳み込みにより訓練された予測器、およびneonmhc2のTGEMデータセットに対するPPVを示す(ダウンサンプリングを伴う、および伴わない)。各対立遺伝子について、上位に順位付けされたペプチドn個を陽性とコールし、ここで、nは、評価されたセットにおいて確認された免疫原性エピトープの数である。
図32A~32Eは、HLAクラスII腫瘍ペプチドームにおける例示的な遺伝子表示およびタンパク質プロセシングを示す。図32Aは、結腸直腸がん、黒色腫、および卵巣がんデータセットの共同解析によって決定された遺伝子当たりのHLAクラスIIペプチドの観察数と予測数の例示的な結果を示す。予測計数は、遺伝子の長さに発現レベルを掛けることによって導き出される。予測計数および観察計数を関連性のある試料にわたって合計した。血漿中に存在することが公知である遺伝子にそれらの濃度に従って印をつけた。図32Bは、細胞内局在当たりのペプチドの予測された頻度と観察された頻度の例示的な結果を示す。図32Cは、プロテアソームによって調節される遺伝子についての富化スコアの分布の例示的な結果を示す(観察された観察対予測された観察の比、一部図32Bの通り)。遺伝子セットは、既知のユビキチン化部位を含むもの、およびプロテアソーム阻害剤を適用すると存在量が増加するものを含んだ。図32Dは、HLAクラスIIペプチドが、i)カテプシンおよび他の酵素によりタンパク質を破壊切断してペプチド断片にし、その後、それらにHLAが結合する、ii)タンパク質またはアンフォールディングされたポリペプチドがHLAに結合し、その後、切断されてペプチド長になる、iii)タンパク質が部分的に消化された後、結合し、結合後にさらにトリミングされる、のいずれに従ってプロセシングされるかに関する3つの例示的なワーキングモデルを示す図を示す。各モデルは異なる予測手法に対応する。図32Eは、プロセシングに関連する変数およびneonmhc2結合予測を含むロジスティック回帰モデルについて観察されたPPVの、結合予測のみを使用したモデルと比較した絶対的な上昇を示す。HLA-DR抗体によってプロファイリングされた11の試料に対して評価を行った(図30Bにおける解析と同じ試料);各点は1つの試料に対応する。アスタリスクは、両側の対応のあるt検定に従った有意な改善を示す(:p<0.01、**:p<0.001、***:p<0.0001)。同じ解析が図40Bに示されているが、代わりにNetMHCIIpanを基本の予測器として使用する。デコイ選択およびPPV算出のための方法は図31Bにおいて使用されているものと同一である。
図33A~33Gは、樹状細胞によって提示される腫瘍抗原の同定および予測の例示的な結果を示す。図33Aは、がん細胞(K562)に由来するDC提示HLA-IIリガンドを同定するための実験的なワークフローの例示的な図表示を示す。がん細胞を、完全な組み入れのためにSILAC培地中で成長させ、溶解させたかまたは照射処理し、次いで、単球由来樹状細胞と一緒にプレーティングした。提示されたペプチドを汎DR抗体によって単離し、LC-MS/MSによって配列決定した。図33Bは、樹状細胞によって提示される腫瘍由来ペプチドについての、図21Aと同じヒット対デコイ比および性能メトリクスを使用した予測性能を表す例示的なデータを示す。プロセシング特色の使用を伴うまたは伴わない、NetMHCIIpanに基づくモデルおよびneonmhc2に基づくモデルについての性能が示されている。図33Cは、UV処理実験において観察された、重標識されたペプチドの供給源遺伝子についての例示的な遺伝子発現分布(赤色の曲線、K562発現に従ってプロットした)を軽標識されたペプチドの供給源遺伝子(灰色の曲線、DC発現に従ってプロットした)と比較して示す。図33Dは、NetMHCIIpanに基づくモデルおよびneonmhc2に基づくモデルを使用し、プロセシング特色を用いて、および用いずに、提示された腫瘍抗原を予測することについてのヒット対デコイ比1:499でのPPVの例示的なグラフを示す。データ点は、左から右に、試料:ドナー1 HOClで処理した細胞:NetMHCIIpan連続した発現;NetMHCIIpan連続した発現+遺伝子の偏り;NetMHCIIpan連続した発現+遺伝子の偏り+DQ重複、完全プロセシング方式;ドナー1、UV処理:neonmhc2;neonmhc2+閾値発現;neonmhc2+連続した発現;neonmhc2+連続した発現+遺伝子の偏り;neonmhc2+連続した発現+遺伝子の偏り+DQ重複を表す。図33Eは、それぞれ重(K562由来)ペプチドおよび軽(DC由来)ペプチドの予測における種々の遺伝子の局在および機能的クラスの有意性を示す。P値を、neonmhc2結合スコアおよび供給源遺伝子発現を制御するロジスティック回帰に従って算出する。棒の色は、回帰において係数に関連するサインを示す。図33Fは、UV処理実験およびHOCl処理実験における腫瘍細胞由来ペプチド供給源遺伝子の重複を示す結果の例示的な図表示を示す(機能的クラス毎に色付けされている)。図33Gは、第1のドナーにおいて観察された重標識されたペプチドに当てはめたロジスティックモデルを使用して第2のドナーにおいて提示される腫瘍抗原を予測することについてのPPVを示す例示的なデータを示す。モデルを、neonmhc2結合単独で;結合および発現;または結合、発現、およびペプチドがミトコンドリア遺伝子に由来するものであるかどうかを示すバイナリ変数を使用して当てはめた。 図33A~33Gは、樹状細胞によって提示される腫瘍抗原の同定および予測の例示的な結果を示す。図33Aは、がん細胞(K562)に由来するDC提示HLA-IIリガンドを同定するための実験的なワークフローの例示的な図表示を示す。がん細胞を、完全な組み入れのためにSILAC培地中で成長させ、溶解させたかまたは照射処理し、次いで、単球由来樹状細胞と一緒にプレーティングした。提示されたペプチドを汎DR抗体によって単離し、LC-MS/MSによって配列決定した。図33Bは、樹状細胞によって提示される腫瘍由来ペプチドについての、図21Aと同じヒット対デコイ比および性能メトリクスを使用した予測性能を表す例示的なデータを示す。プロセシング特色の使用を伴うまたは伴わない、NetMHCIIpanに基づくモデルおよびneonmhc2に基づくモデルについての性能が示されている。図33Cは、UV処理実験において観察された、重標識されたペプチドの供給源遺伝子についての例示的な遺伝子発現分布(赤色の曲線、K562発現に従ってプロットした)を軽標識されたペプチドの供給源遺伝子(灰色の曲線、DC発現に従ってプロットした)と比較して示す。図33Dは、NetMHCIIpanに基づくモデルおよびneonmhc2に基づくモデルを使用し、プロセシング特色を用いて、および用いずに、提示された腫瘍抗原を予測することについてのヒット対デコイ比1:499でのPPVの例示的なグラフを示す。データ点は、左から右に、試料:ドナー1 HOClで処理した細胞:NetMHCIIpan連続した発現;NetMHCIIpan連続した発現+遺伝子の偏り;NetMHCIIpan連続した発現+遺伝子の偏り+DQ重複、完全プロセシング方式;ドナー1、UV処理:neonmhc2;neonmhc2+閾値発現;neonmhc2+連続した発現;neonmhc2+連続した発現+遺伝子の偏り;neonmhc2+連続した発現+遺伝子の偏り+DQ重複を表す。図33Eは、それぞれ重(K562由来)ペプチドおよび軽(DC由来)ペプチドの予測における種々の遺伝子の局在および機能的クラスの有意性を示す。P値を、neonmhc2結合スコアおよび供給源遺伝子発現を制御するロジスティック回帰に従って算出する。棒の色は、回帰において係数に関連するサインを示す。図33Fは、UV処理実験およびHOCl処理実験における腫瘍細胞由来ペプチド供給源遺伝子の重複を示す結果の例示的な図表示を示す(機能的クラス毎に色付けされている)。図33Gは、第1のドナーにおいて観察された重標識されたペプチドに当てはめたロジスティックモデルを使用して第2のドナーにおいて提示される腫瘍抗原を予測することについてのPPVを示す例示的なデータを示す。モデルを、neonmhc2結合単独で;結合および発現;または結合、発現、およびペプチドがミトコンドリア遺伝子に由来するものであるかどうかを示すバイナリ変数を使用して当てはめた。 図33A~33Gは、樹状細胞によって提示される腫瘍抗原の同定および予測の例示的な結果を示す。図33Aは、がん細胞(K562)に由来するDC提示HLA-IIリガンドを同定するための実験的なワークフローの例示的な図表示を示す。がん細胞を、完全な組み入れのためにSILAC培地中で成長させ、溶解させたかまたは照射処理し、次いで、単球由来樹状細胞と一緒にプレーティングした。提示されたペプチドを汎DR抗体によって単離し、LC-MS/MSによって配列決定した。図33Bは、樹状細胞によって提示される腫瘍由来ペプチドについての、図21Aと同じヒット対デコイ比および性能メトリクスを使用した予測性能を表す例示的なデータを示す。プロセシング特色の使用を伴うまたは伴わない、NetMHCIIpanに基づくモデルおよびneonmhc2に基づくモデルについての性能が示されている。図33Cは、UV処理実験において観察された、重標識されたペプチドの供給源遺伝子についての例示的な遺伝子発現分布(赤色の曲線、K562発現に従ってプロットした)を軽標識されたペプチドの供給源遺伝子(灰色の曲線、DC発現に従ってプロットした)と比較して示す。図33Dは、NetMHCIIpanに基づくモデルおよびneonmhc2に基づくモデルを使用し、プロセシング特色を用いて、および用いずに、提示された腫瘍抗原を予測することについてのヒット対デコイ比1:499でのPPVの例示的なグラフを示す。データ点は、左から右に、試料:ドナー1 HOClで処理した細胞:NetMHCIIpan連続した発現;NetMHCIIpan連続した発現+遺伝子の偏り;NetMHCIIpan連続した発現+遺伝子の偏り+DQ重複、完全プロセシング方式;ドナー1、UV処理:neonmhc2;neonmhc2+閾値発現;neonmhc2+連続した発現;neonmhc2+連続した発現+遺伝子の偏り;neonmhc2+連続した発現+遺伝子の偏り+DQ重複を表す。図33Eは、それぞれ重(K562由来)ペプチドおよび軽(DC由来)ペプチドの予測における種々の遺伝子の局在および機能的クラスの有意性を示す。P値を、neonmhc2結合スコアおよび供給源遺伝子発現を制御するロジスティック回帰に従って算出する。棒の色は、回帰において係数に関連するサインを示す。図33Fは、UV処理実験およびHOCl処理実験における腫瘍細胞由来ペプチド供給源遺伝子の重複を示す結果の例示的な図表示を示す(機能的クラス毎に色付けされている)。図33Gは、第1のドナーにおいて観察された重標識されたペプチドに当てはめたロジスティックモデルを使用して第2のドナーにおいて提示される腫瘍抗原を予測することについてのPPVを示す例示的なデータを示す。モデルを、neonmhc2結合単独で;結合および発現;または結合、発現、およびペプチドがミトコンドリア遺伝子に由来するものであるかどうかを示すバイナリ変数を使用して当てはめた。
図34A~34Bは、図29に関連するMAPTAC(商標)データの例示的な特徴付けを示す。図34Aは、親和性タグ付けされたHLA-A02:01-BAPをコードするMAPTAC(商標)構築物をトランスフェクトしたExpi293細胞株のFACSによる例示的なHLA細胞表面解析を示す。図34Bは、親和性タグ付けされたHLA-DRB111:01-BAPをコードするMAPTAC(商標)構築物をトランスフェクトしたExpi293細胞株のFACSによる例示的なHLA細胞表面解析を示す(下)。トランスフェクトされたExpi293細胞(オレンジ色)のHLA細胞表面発現を染色されたトランスフェクトされていないExpi293(青色)、無染色のトランスフェクトされていないExpi293(赤色)、染色したPBMC(暗い緑色)、および無染色のPBMC(明るい緑色)と比較した。全てのHLAクラスI染色にW6/32(汎HLAクラスI)を利用し、一方、HLAクラスII染色にはREA332(汎HLAクラスII)を利用した。
図35は、図30Aに関連する、MAPTAC(商標)とIEDBロゴの例示的な比較を示す。良好なNetMHCIIpanスコアを示さなかったが、MSではよく支持された(スコア化ピーク強度>70および入れ子セットサイズ≧1)、MSにより観察されたペプチドに対する測定された親和性およびNetMHCIIpanで予測された親和性。
図36A~36Cは、図30A~30Cに関連する、HLA-DR1 MAPTAC(商標)データ忠実度の例示的な解析を示す。図36Aは、一般的な対立遺伝子についての、HLA-DR1 MAPTAC(商標)ペプチド(緑色)(長さ12~23)の、ランダムにプロテオームからサンプリングした50,000の長さを釣り合わせたデコイペプチド(青色)と比較した、例示的なNetMHCIIpan3.1スコアを示す。図36Bは、良好なNetMHCIIpanスコアを示さないが、MSではよく支持される(スコア化ピーク強度>70および入れ子セットサイズ≧1)例示的なMSにより観察されたペプチドに対する例示的な測定された親和性およびNetMHCIIpanにより予測された親和性を示す。図36Cは、異なる細胞型においてMAPTAC(商標)によって決定されるHLA-DRB1対立遺伝子についての例示的なHLAクラスII配列ロゴを示す。 図36A~36Cは、図30A~30Cに関連する、HLA-DR1 MAPTAC(商標)データ忠実度の例示的な解析を示す。図36Aは、一般的な対立遺伝子についての、HLA-DR1 MAPTAC(商標)ペプチド(緑色)(長さ12~23)の、ランダムにプロテオームからサンプリングした50,000の長さを釣り合わせたデコイペプチド(青色)と比較した、例示的なNetMHCIIpan3.1スコアを示す。図36Bは、良好なNetMHCIIpanスコアを示さないが、MSではよく支持される(スコア化ピーク強度>70および入れ子セットサイズ≧1)例示的なMSにより観察されたペプチドに対する例示的な測定された親和性およびNetMHCIIpanにより予測された親和性を示す。図36Cは、異なる細胞型においてMAPTAC(商標)によって決定されるHLA-DRB1対立遺伝子についての例示的なHLAクラスII配列ロゴを示す。 図36A~36Cは、図30A~30Cに関連する、HLA-DR1 MAPTAC(商標)データ忠実度の例示的な解析を示す。図36Aは、一般的な対立遺伝子についての、HLA-DR1 MAPTAC(商標)ペプチド(緑色)(長さ12~23)の、ランダムにプロテオームからサンプリングした50,000の長さを釣り合わせたデコイペプチド(青色)と比較した、例示的なNetMHCIIpan3.1スコアを示す。図36Bは、良好なNetMHCIIpanスコアを示さないが、MSではよく支持される(スコア化ピーク強度>70および入れ子セットサイズ≧1)例示的なMSにより観察されたペプチドに対する例示的な測定された親和性およびNetMHCIIpanにより予測された親和性を示す。図36Cは、異なる細胞型においてMAPTAC(商標)によって決定されるHLA-DRB1対立遺伝子についての例示的なHLAクラスII配列ロゴを示す。
図37A~37Cは、図30A~30Cに関連する、MAPTAC(商標)モチーフの追加的な例示的な解析を示す。図37Aは、HLA-DM同時トランスフェクション(expi293細胞株)を伴う、および伴わない実験についてのMAPTAC(商標)由来の配列ロゴを示す。図37Bは、MAPTAC(商標)およびIEDBに従ったいくつかのHLAクラスI対立遺伝子についての配列ロゴを示す。A32:01はP2において高頻度Qを示さず、C03:03はP9において高頻度Yを示さず、複対立遺伝子逆畳み込みを使用した以前の試験とは異なることに留意されたい;B52:01のロゴについては以前に発表されていない。図37Cは、MAPAC(商標)により観察されたペプチドのCD74の遺伝子配列に対する例示的なアラインメントを示す。 図37A~37Cは、図30A~30Cに関連する、MAPTAC(商標)モチーフの追加的な例示的な解析を示す。図37Aは、HLA-DM同時トランスフェクション(expi293細胞株)を伴う、および伴わない実験についてのMAPTAC(商標)由来の配列ロゴを示す。図37Bは、MAPTAC(商標)およびIEDBに従ったいくつかのHLAクラスI対立遺伝子についての配列ロゴを示す。A32:01はP2において高頻度Qを示さず、C03:03はP9において高頻度Yを示さず、複対立遺伝子逆畳み込みを使用した以前の試験とは異なることに留意されたい;B52:01のロゴについては以前に発表されていない。図37Cは、MAPAC(商標)により観察されたペプチドのCD74の遺伝子配列に対する例示的なアラインメントを示す。
図38Ai~38Dは、図31A~31Dに関連する例示的なneonmhc2性能統計値およびT細胞フロー染色を示す。図38Aiは、例示的な訓練用データセットのサイズに応じたneonmhc2の性能を示す。PPVを、図31Bにおけるものと同じ様式で、同じ評価ペプチドを使用して評価した;しかし、より小さな訓練用データセットを模倣するために訓練用データをランダムにダウンサンプリングした。図38Aiiは、GibbsCluster(デフォルト設定;「トラッシュクラスター許容)を使用した複対立遺伝子HLA-DRリガンドームに由来するペプチドクラスターについての例示的な配列ロゴを示す。図38Bは、neonmhc2を用いた新抗原ペプチド予測で再コールされた誘導試料由来のCD4+細胞によるIFN-γ発現の例示的な代表的なフローサイトメトリープロットを示す。デルタ値を、新抗原を伴って再コールされた場合のIFN-γを発現するCD4+細胞のパーセント(+ペプチド)を、新抗原の非存在下で再コールされたIFN-γを発現するCD4+のパーセント(ペプチドなし)から差し引くことによって算出した。左の2つのフロープロットは、CD4+ T細胞によるT細胞応答を誘導した新抗原(PEASLYGALSKGSGG)およびT細胞応答を誘導しなかった新抗原(PATYILILKEFCLVG)を表す。図38Cは、単一のneonmhc2新抗原ペプチドを伴って再コールされたウェルからの例示的なデルタ値を示す。ペプチドを、陽性応答(3%を超えるデルタ応答、強調表示されている)を有する場合には誘導ヒットとみなした。図38Dは、GibbsCluster(デフォルト設定;「トラッシュ」クラスター許容)を使用して複対立遺伝子HLA-DRリガンドームについて導き出されたペプチドクラスターについての例示的な配列ロゴを示す。 図38Ai~38Dは、図31A~31Dに関連する例示的なneonmhc2性能統計値およびT細胞フロー染色を示す。図38Aiは、例示的な訓練用データセットのサイズに応じたneonmhc2の性能を示す。PPVを、図31Bにおけるものと同じ様式で、同じ評価ペプチドを使用して評価した;しかし、より小さな訓練用データセットを模倣するために訓練用データをランダムにダウンサンプリングした。図38Aiiは、GibbsCluster(デフォルト設定;「トラッシュクラスター許容)を使用した複対立遺伝子HLA-DRリガンドームに由来するペプチドクラスターについての例示的な配列ロゴを示す。図38Bは、neonmhc2を用いた新抗原ペプチド予測で再コールされた誘導試料由来のCD4+細胞によるIFN-γ発現の例示的な代表的なフローサイトメトリープロットを示す。デルタ値を、新抗原を伴って再コールされた場合のIFN-γを発現するCD4+細胞のパーセント(+ペプチド)を、新抗原の非存在下で再コールされたIFN-γを発現するCD4+のパーセント(ペプチドなし)から差し引くことによって算出した。左の2つのフロープロットは、CD4+ T細胞によるT細胞応答を誘導した新抗原(PEASLYGALSKGSGG)およびT細胞応答を誘導しなかった新抗原(PATYILILKEFCLVG)を表す。図38Cは、単一のneonmhc2新抗原ペプチドを伴って再コールされたウェルからの例示的なデルタ値を示す。ペプチドを、陽性応答(3%を超えるデルタ応答、強調表示されている)を有する場合には誘導ヒットとみなした。図38Dは、GibbsCluster(デフォルト設定;「トラッシュ」クラスター許容)を使用して複対立遺伝子HLA-DRリガンドームについて導き出されたペプチドクラスターについての例示的な配列ロゴを示す。 図38Ai~38Dは、図31A~31Dに関連する例示的なneonmhc2性能統計値およびT細胞フロー染色を示す。図38Aiは、例示的な訓練用データセットのサイズに応じたneonmhc2の性能を示す。PPVを、図31Bにおけるものと同じ様式で、同じ評価ペプチドを使用して評価した;しかし、より小さな訓練用データセットを模倣するために訓練用データをランダムにダウンサンプリングした。図38Aiiは、GibbsCluster(デフォルト設定;「トラッシュクラスター許容)を使用した複対立遺伝子HLA-DRリガンドームに由来するペプチドクラスターについての例示的な配列ロゴを示す。図38Bは、neonmhc2を用いた新抗原ペプチド予測で再コールされた誘導試料由来のCD4+細胞によるIFN-γ発現の例示的な代表的なフローサイトメトリープロットを示す。デルタ値を、新抗原を伴って再コールされた場合のIFN-γを発現するCD4+細胞のパーセント(+ペプチド)を、新抗原の非存在下で再コールされたIFN-γを発現するCD4+のパーセント(ペプチドなし)から差し引くことによって算出した。左の2つのフロープロットは、CD4+ T細胞によるT細胞応答を誘導した新抗原(PEASLYGALSKGSGG)およびT細胞応答を誘導しなかった新抗原(PATYILILKEFCLVG)を表す。図38Cは、単一のneonmhc2新抗原ペプチドを伴って再コールされたウェルからの例示的なデルタ値を示す。ペプチドを、陽性応答(3%を超えるデルタ応答、強調表示されている)を有する場合には誘導ヒットとみなした。図38Dは、GibbsCluster(デフォルト設定;「トラッシュ」クラスター許容)を使用して複対立遺伝子HLA-DRリガンドームについて導き出されたペプチドクラスターについての例示的な配列ロゴを示す。 図38Ai~38Dは、図31A~31Dに関連する例示的なneonmhc2性能統計値およびT細胞フロー染色を示す。図38Aiは、例示的な訓練用データセットのサイズに応じたneonmhc2の性能を示す。PPVを、図31Bにおけるものと同じ様式で、同じ評価ペプチドを使用して評価した;しかし、より小さな訓練用データセットを模倣するために訓練用データをランダムにダウンサンプリングした。図38Aiiは、GibbsCluster(デフォルト設定;「トラッシュクラスター許容)を使用した複対立遺伝子HLA-DRリガンドームに由来するペプチドクラスターについての例示的な配列ロゴを示す。図38Bは、neonmhc2を用いた新抗原ペプチド予測で再コールされた誘導試料由来のCD4+細胞によるIFN-γ発現の例示的な代表的なフローサイトメトリープロットを示す。デルタ値を、新抗原を伴って再コールされた場合のIFN-γを発現するCD4+細胞のパーセント(+ペプチド)を、新抗原の非存在下で再コールされたIFN-γを発現するCD4+のパーセント(ペプチドなし)から差し引くことによって算出した。左の2つのフロープロットは、CD4+ T細胞によるT細胞応答を誘導した新抗原(PEASLYGALSKGSGG)およびT細胞応答を誘導しなかった新抗原(PATYILILKEFCLVG)を表す。図38Cは、単一のneonmhc2新抗原ペプチドを伴って再コールされたウェルからの例示的なデルタ値を示す。ペプチドを、陽性応答(3%を超えるデルタ応答、強調表示されている)を有する場合には誘導ヒットとみなした。図38Dは、GibbsCluster(デフォルト設定;「トラッシュ」クラスター許容)を使用して複対立遺伝子HLA-DRリガンドームについて導き出されたペプチドクラスターについての例示的な配列ロゴを示す。
図39A~39Cは、図32A~32Eに関連する、HLAクラスIIについての追加的な例示的な細胞起源解析を示す。図39Aは、汎DR抗体によってプロファイリングされた4つのPBMC試料(図30BのRG1248、RG1104、RG1095、およびHDSC)において観察されたHLAクラスIIペプチドについての、ペプチド供給源遺伝子がヒト血漿中に存在するかどうかに応じた例示的なパーセント順位neonmhc2スコアを示す。各ペプチドについて、ドナーに存在する対立遺伝子にわたって最良(最低)のパーセント順位を使用した。ランダムな長さを釣り合わせたプロテオームデコイについてのスコアが比較のために示されている。箱型図は5パーセンタイル、25パーセンタイル、50パーセンタイル、75パーセンタイル、および95パーセンタイルを示す。図39Bは、図32Aにおけるものと同じ方法体系を使用してHLAクラスIについて遺伝子毎の観察されたペプチドと予測されたペプチドの例示的な計数を示す。データは同じ腫瘍型(結腸直腸、卵巣、および黒色腫)に対応する。ヒト血漿中に存在する遺伝子が青色で強調表示されており、それらの濃度に応じたサイズになっている。図39Cは、2つの異なる遺伝子発現プロファイルに関する例示的なペプチド観察の相対的一致を示す。各試料について、遺伝子レベルペプチド計数をバルク腫瘍遺伝子発現およびプロフェッショナルAPC遺伝子発現プロファイルの線形結合としてモデル化した。係数の比により、各発現プロファイルのペプチドレパートリーとの相対的一致が決定される。エラーバーはブートストラップリサンプリングによってコンピュータ計算された95%信頼区間に対応する。
図40A~40Bは、図32A~32Eに関連するプロセシングモチーフの追加的な例示的な解析を示す。図40Aは、ドナーPBMC、単球由来樹状細胞、結腸直腸がん、黒色腫、卵巣がん、およびexpi293細胞株(大多数のMAPTAC(商標)データ生成に使用される)において観察される、平均プロテオーム頻度(上流位置U3~U1および下流位置D1~D3を適用する)に対するまたは平均ペプチド頻度(内部の位置N1~C1を適用する)に対するN末端およびC末端ペプチドカット部分付近の例示的なアミノ酸頻度を示す。図40Bは、図32Eと同じであるが、NetMHCIIpanを基本の予測器として使用した解析を示す。HLA-DR抗体によってプロファイリングされた8つの試料(図31Bにおいて解析したものと同じ試料)について、NetMHCIIpanによる予測に加えてプロセシングに関連する変数を含めたロジスティック回帰モデルに関してはPPVの絶対的な上昇が観察された(NetMHCIIpanのみのモデルと比較して)。アスタリスクは有意な改善を示す(:p<0.01、**:p<0.001、***:p<0.0001)両側の対応のあるt検定に従った。
図41は、ペプチドの上流、ペプチド内部、およびペプチドの下流の位置を指すために使用した例示的な命名システムを示す。
図42Aは、nLC-MS/MSによる、内因性にプロセシングされ、HLA-1およびHLAクラスIIによって提示されるペプチドの解析の例示的なワークフローを表す図を示す。
図42Bは、トリプシンペプチドの、FAIMSを伴うまたは伴わないnLC-MS/MS分析からの例示的な実験結果を示すグラフを示す。示されている分析規模でのFAIMSを伴うまたは伴わないnLC-MS/MS分析によるHLA-1およびHLAクラスIIペプチドの検出における代表的な重複も示されている。
図43Aは、FAIMSを伴うまたは伴わない例示的なHLAクラスI酸性および塩基性逆相分画ペプチド検出を示す。
図43Bは、保持時間に対してプロットした、HLAクラスIと結合した独特のペプチドの検出を示す例示的な実験結果を示す。
図44Aは、FAIMSを伴うまたは伴わない例示的なHLAクラスII酸および塩基性逆相分画ペプチド検出を示す。
図44Bは、保持時間に対してプロットした、HLAクラスIIと結合した独特のペプチドの検出を示す例示的な実験結果を示す。
図45は、示されている方法を使用して検出したHLAクラスI結合性ペプチドの交差サイズの例示的なグラフ(左)ならびに、HLAクラスI結合性ペプチドのLC-MS/MSによる検出のための例示的な標準のワークフローおよび最適化されたワークフローのベン図を示す(右)。 図45は、示されている方法を使用して検出したHLAクラスI結合性ペプチドの交差サイズの例示的なグラフ(左)ならびに、HLAクラスI結合性ペプチドのLC-MS/MSによる検出のための例示的な標準のワークフローおよび最適化されたワークフローのベン図を示す(右)。
図46は、示されている方法を使用して検出したHLAクラスII結合性ペプチドの交差サイズの例示的なグラフ(左)、ならびにHLAクラスII結合性ペプチドのLC-MS/MSによる検出の例示的な標準のワークフローおよび最適化されたワークフローのベン図を示す(右)。 図46は、示されている方法を使用して検出したHLAクラスII結合性ペプチドの交差サイズの例示的なグラフ(左)、ならびにHLAクラスII結合性ペプチドのLC-MS/MSによる検出の例示的な標準のワークフローおよび最適化されたワークフローのベン図を示す(右)。
詳細な説明
用語は全て、当業者によって理解される通り理解されることが意図されている。別段の定義のない限り、本明細書において使用される全ての科学技術用語は、本開示が関係する分野の当業者に一般に理解されるものと同じ意味を有する。
本明細書で使用される節の見出しは、単に構成目的のものであり、記載の主題を限定するものとは解釈されない。
本開示の種々の特色は単一の実施形態に関して記載され得るが、特色を別々にまたは任意の適切な組合せで提供することもできる。逆に、本開示は本明細書では明確にするために別々の実施形態に関して記載されている場合があるが、本開示を単一の実施形態で実施することもできる。
本開示は、改善された免疫治療のためのHLAクラスII特異的ペプチドの使用を可能にする新しいコンピュータに基づく機械学習HLA-ペプチド提示予測モデルを使用して、特定のHLAクラスIIアルファ鎖およびベータ鎖対による抗原、具体的にはがん抗原の提示を高度な信頼度で予測することができるという重要な所見に基づく。
一態様では、本開示は、ペプチドのHLAクラスIIタンパク質(アルファ鎖とベータ鎖のヘテロ二量体で構成される)への高忠実度の結合により、特定のペプチドがTリンパ球に提示され、それにより、特異的な免疫応答が引き出され、あらゆる交差反応性または無差別免疫が回避されることが確実になるような、特定のHLAクラスIIアルファ鎖およびベータ鎖ヘテロ二量体と正確に対形成または結合し得るペプチドを予測するための方法を提供する。いくつかの最近の試験により、CD4+ T細胞がHLAクラスIIにより提示されたリガンドを認識し、腫瘍の制御に寄与することができることも示されている。がんワクチンおよび他の免疫治療はCD4+ T細胞応答を方向付けることを利用することが理想的であるが、現行の試みでは、現行の予測ツールの正確度が不十分なことから、HLAクラスII抗原予測が完全に無視されている。
一態様では、本開示は、特定の同類HLAクラスIIタンパク質を発現する対象にペプチドを治療的に投与した場合に、CD4+ T細胞を活性化し、免疫記憶を刺激するHLAクラスIIタンパク質の能力によって、ペプチドを用いてより持続的かつ頑強な免疫応答を活性化することができるような、特定のHLAクラスIIタンパク質に正確に結合し得るペプチドを予測するための方法を提供する。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して改善が示される。一部の実施形態では、本発明で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約1.1倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約2倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約3倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約4倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約5倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約6倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約7倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約8倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約9倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約10倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約15倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約20倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約30倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約40倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約50倍の改善が示される。一部の実施形態では、本明細書で提供される方法では、特定のHLAクラスIIタンパク質予測に関して、現在利用可能な予測器に対して少なくとも約60倍の改善が示される。
一態様では、特定の対象に対して調整または個別化された免疫治療の方法が本明細書で提示される。あらゆる対象または患者がHLAクラスIおよびHLAクラスIIタンパク質の特定のアレイを発現する。HLAタイピングは、対象によって発現されるHLAタンパク質の特定のレパートリーを決定することを可能にする周知の技法である。特定の対象によって発現されるHLAヘテロ二量体が分かったら、特定のHLAクラスIIアルファ鎖およびベータ鎖ヘテロ二量体に高忠実度で結合することができるペプチドを予測するための、本明細書に記載の、改善され洗練された信頼できる方法により、対象に対して特異的に調整された特異的な免疫応答を生じさせることができることを確実にする。
本出願では、他に特に指定がなければ、単数形の使用は複数形を含む。本明細書において使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈により明確に別段の規定がなされない限り、複数の指示対象を包含することに留意しなければならない。本出願では、「または(or)」の使用は、別段の指定のない限り、「および/または(and/or)」を意味する。さらに、「含む(including)」という用語ならび「含む(include)」、「含む(includes)」、および「含まれる(included)」などの他の形態の使用は限定されるものではない。「1つまたは複数の(one or more)」または「少なくとも1つの(at least one)」という用語、例えば、メンバーの群のうちの1つまたは複数の(one or more)または少なくとも1つの(at least one)メンバー(複数可)などは、それ自体は明らかであり、さらなる例証により、この用語は、とりわけ、前記メンバーのうちのいずれか1つへの言及、または前記メンバーのうちの任意の2つまたはそれよりも多く、例えば、前記メンバーのうちのいずれか≧3、≧4、≧5、≧6または≧7など、および最大前記メンバー全てなどへの言及を包含する。
本明細書における「一部の実施形態」、「ある実施形態」、「一実施形態」または「他の実施形態」への言及は、実施形態に関連して記載されている特色、構造、または特徴が本開示の少なくとも一部の実施形態に含まれるが、必ずしも全ての実施形態に含まれるわけではない。
本明細書および請求項(複数可)において使用される場合、「含む(comprising)」(ならびに「含む(comprise)」および「含む(comprises)」などの、含む(comprising)の任意の形態)、「有する(having)」(ならびに「有する(have)」および「有する(has)」などの、有する(having)の任意の形態)、「含む(including)」(ならびに「含む(includes)」および「含む(include)」などの、含む(including)の任意の形態)または「含有する(containing)」(ならびに、「含有する(contains)」および「含有する(contain)」などの、含有する(containing)の任意の形態)という単語は、包括的またはオープンエンドであり、追加的な、列挙されていない要素または方法のステップは排除されない。本明細書において考察されている任意の実施形態を本開示の任意の方法または組成物に関して実施することができ、逆もまた同じであることが意図されている。さらに、本開示の組成物を使用して本開示の方法を実現することができる。
「約」または「およそ」という用語は、パラメータ、量、持続時間などの測定可能な値について言及する際に本明細書で使用される場合、指定の値から+/-20%またはそれ未満、+/-10%またはそれ未満、+/-5%またはそれ未満、または+/-1%またはそれ未満の変動を、そのような変動が本開示の実施に適する限りは包含するものとする。「約」または「およそ」という修飾語が指す値は、それ自体も具体的に開示されることが理解されるべきである。
「免疫応答」という用語は、T細胞共刺激のモジュレーションによる影響を受けるT細胞媒介性および/またはB細胞媒介性免疫応答を含む。例示的な免疫応答としては、T細胞応答、例えば、サイトカイン産生、および細胞性細胞傷害性が挙げられる。さらに、免疫応答という用語は、T細胞活性化の影響を間接的に受ける免疫応答、例えば、抗体産生(体液性応答)およびサイトカイン応答性細胞、例えばマクロファージの活性化を含む。
「受容体」は、リガンドに結合することができる生体分子または分子群を意味すると理解されるべきである。受容体は、細胞、細胞形成または生物体における情報の伝達に役立ち得る。受容体は、少なくとも1つの受容体単位を含み、2つまたはそれよりも多くの受容体単位を含有し得、その場合、各受容体単位は、タンパク質分子、例えば、糖タンパク質分子からなり得る。受容体は、リガンドの構造を補完する構造を有し、そのリガンドを結合パートナーとして複合体を形成し得る。細胞の表面上のリガンドに結合した後の受容体のコンフォメーションの変化によってシグナル伝達情報が伝達され得る。本開示によると、受容体は、リガンド、例えば、適切な長さのペプチドまたはペプチド断片と受容体/リガンド複合体を形成することができるMHCクラスIおよびクラスIIのタンパク質を指し得る。HLAクラスIおよびクラスII対立遺伝子によってコードされるクラスIおよびクラスII MHCペプチドは、本明細書では、当業者の考察の状況の範囲内でよく理解される通り、それぞれHLAクラスIペプチドおよびHLAクラスIIペプチド、またはHLAクラスIおよびHLAクラスIIペプチド、またはHLAクラスIクラスIIタンパク質、またはHLAクラスIおよびHLAクラスIIタンパク質、またはHLAクラスIおよびクラスII分子、またはそのようなそれらの一般的なバリアントと称されることも多い。
「リガンド」は、受容体と複合体を形成することができる分子である。本開示によると、リガンドは、例えば、適切な長さを有し、そのアミノ酸配列内に適切な結合性モチーフを有するペプチドまたはペプチド断片を意味し、したがって、ペプチドまたはペプチド断片は、MHCクラスIまたはMHCクラスIIのタンパク質(すなわち、HLAクラスIおよびHLAクラスIIタンパク質)に結合し、それと複合体を形成することができると理解されるべきである。
「抗原」は、免疫応答を刺激することができる分子であり、がん細胞または感染因子または自己免疫疾患によって産生され得る。ヘルパーTリンパ球(Tヘルパー(TH)細胞)であれ細胞傷害性Tリンパ球(CTL)であれ、T細胞によって認識される抗原は、インタクトなタンパク質として認識されるのではなく、細胞の表面上でHLAクラスIまたはクラスIIタンパク質と会合した小さなペプチドとして認識される。天然に存在する免疫応答の過程中、抗原提示細胞(APC)上でHLAクラスII分子と会合して認識される抗原は、細胞の外側から取得され、内部移行し、HLAクラスII分子と会合する小さなペプチドにプロセシングされる。APCはまた、外因性抗原をプロセシングし、プロセシングされた抗原をHLAクラスI分子上に提示することによってペプチド抗原を交差提示し得る。HLAクラスI MHC分子と会合して認識されるペプチドを生じる抗原は、一般に、細胞内で産生されるペプチドであり、これらの抗原は、プロセシングされ、クラスI MHC分子と会合する。所与のHLAクラスIまたはクラスII分子と会合するペプチドは共通の結合性モチーフを有することを特徴とすることが現在理解されており、多数の異なるHLAクラスIおよびクラスII分子の結合性モチーフが決定されている。所与の抗原のアミノ酸配列に対応し、所与のHLAクラスIまたはクラスII分子の結合性モチーフを含有する合成ペプチドを合成することもできる。次いで、これらのペプチドを妥当なAPCに付加することができ、APCを使用してin vitroまたはin vivoにおけるTヘルパー細胞またはCTL応答を刺激することができる。結合性モチーフ、ペプチドを合成するための方法、およびTヘルパー細胞またはCTL応答を刺激するための方法は全て当業者には公知であり、容易に利用可能である。
「ペプチド」という用語は、本明細書では「変異体ペプチド」および「新抗原性ペプチド」と互換的に使用される。同様に、「ポリペプチド」という用語は、本明細書では「変異体ポリペプチド」および「新抗原性ポリペプチド」と互換的に使用される。「新抗原」または「ネオエピトープ」とは、発現されたタンパク質において腫瘍特異的変異から生じる腫瘍抗原または腫瘍エピトープのクラスを意味する。本開示は、腫瘍特異的変異を含むペプチド、既知の腫瘍特異的変異、および本開示の方法によって同定された変異体ポリペプチドまたはその断片を含むペプチドをさらに含む。これらのペプチドおよびポリペプチドは、本明細書では「新抗原性ペプチド」または「新抗原性ポリペプチド」と称される。ポリペプチドまたはペプチドは、種々の長さであり得、中性(非荷電)形態または塩の形態のいずれかであり得、また、グリコシル化、側鎖の酸化、リン酸化、または任意の翻訳後修飾などの修飾を有さないかまたはこれらの修飾を含有し得、修飾により本明細書に記載のポリペプチドの生物活性が破壊されない条件に供され得る。一部の実施形態では、本開示の新抗原性ペプチドは、HLAクラスIに関しては、22残基またはそれ未満の長さ、例えば、約8残基から約22残基まで、約8残基から約15残基まで、または9残基または10残基を含み得、HLA Class IIに関しては、40残基またはそれ未満の長さ、例えば、約8残基から約40残基までの長さ、約8残基から約24残基までの長さ、約12残基から約19残基まで、または約14残基から約18残基までを含み得る。一部の実施形態では、新抗原性ペプチドまたは新抗原性ポリペプチドは、ネオエピトープを含む。
「エピトープ」という用語は、本明細書で定義される抗体、抗体ペプチド、および/または抗体様分子(これだけに限定されないが、T細胞受容体を含む)に特異的に結合することができる任意のタンパク質決定因子を含む。エピトープ決定因子は、一般には、アミノ酸または糖側鎖などの分子の化学的に活性な表面基からなり、一般に、特定の3次元構造的特徴ならびに特定の電荷特徴を有する。
「T細胞エピトープ」は、クラスIまたはクラスIIのMHC分子がペプチド提示MHC分子またはMHC複合体の形態に結合し得、次いで、これらの形態で、それぞれ細胞傷害性Tリンパ球またはヘルパーT細胞によって認識され、それが結合する、ペプチド配列である。
「抗体」という用語は、本明細書で使用される場合、IgG(IgG1、IgG2、IgG3、およびIgG4を含む)、IgA(IgA1およびIgA2を含む)、IgD、IgE、IgM、ならびにIgYを含み、また、単鎖全抗体を含めた全抗体、およびその抗原結合性(Fab)断片を包含するものとする。抗原結合性抗体断片としては、これだけに限定されないが、Fab、Fab’およびF(ab’)2、Fd(VHおよびCH1からなる)、単鎖可変断片(scFv)、単鎖抗体、ジスルフィド連結した可変断片(dsFv)およびVLドメインまたはVHドメインのいずれかを含む断片が挙げられる。抗体は、任意の起源動物に由来するものであり得る。単鎖抗体を含めた抗原結合性抗体断片は、可変領域(複数可)を単独で、または以下の全体もしくは部分と組み合わせて含み得る:ヒンジ領域、CH1ドメイン、CH2ドメイン、およびCH3ドメイン。可変領域(複数可)およびヒンジ領域、CH1ドメイン、CH2ドメイン、およびCH3ドメインの任意の組合せも含まれる。抗体は、例えば、HLA付随ポリペプチドまたはHLA-HLA結合性ペプチド(HLA-ペプチド)複合体に特異的に結合するモノクローナル抗体、ポリクローナル抗体、キメラ抗体、ヒト化抗体、およびヒトモノクローナル抗体およびポリクローナル抗体であり得る。可溶性HLA-ペプチド複合体または膜結合HLA付随ポリペプチド、例えば、膜からタンパク質分解により切断されたものなどの可溶性タンパク質を富化するために種々の免疫親和性技法が適することが当業者には理解されよう。これらとしては、(1)可溶性タンパク質に特異的に結合することができる1種または複数種の抗体を固定されたまたは可動性の基材(例えば、プラスチックウェルまたは樹脂、ラテックスまたは常磁性ビーズ)に固定化し、(2)生体試料由来の可溶性タンパク質を含有する溶液を、抗体をコーティングした基材を通過させ、それにより、可溶性タンパク質を抗体に結合させる技法が挙げられる。抗体および結合した可溶性タンパク質を伴う基材を溶液から分離し、必要に応じて、例えば抗体を浸す溶液のpHおよび/またはイオン強度および/またはイオン組成を変動させることによって抗体および可溶性タンパク質を引き離す。あるいは、抗体と可溶性タンパク質を合わせ、高分子凝集体を形成させる免疫沈降技法を使用することができる。高分子凝集体を分子ふるい技法によってまたは遠心分離によって溶液から分離することができる。
「免疫精製(IP)」(または免疫アフィニティー精製または免疫沈降)という用語は、所望の抗原を試料から単離するための、当技術分野で周知のおよび広く使用されているプロセスである。一般に、このプロセスは、所望の抗原を含有する試料を、抗原に対する抗体を固相に共有結合により付着させた親和性マトリックスと接触させることを伴う。試料中の抗原は親和性マトリックスに免疫化学的結合を通じて結合するようになる。次いで、親和性マトリックスを洗浄して、あらゆる結合しなかった種を除去する。親和性マトリックスと接触している溶液の化学組成を変更することによって抗原を親和性マトリックスから取り出す。親和性マトリックスを含有するカラムで免疫精製を行うことができ、その場合、溶液は溶離液である。あるいは、免疫精製はバッチプロセスにおけるものであってよく、その場合、親和性マトリックスを溶液中で懸濁液として維持する。このプロセスの重要なステップは、マトリックスから抗原を取り出すステップである。これは、一般に、親和性マトリックスと接触している溶液のイオン強度を、例えば無機塩を添加することによって増大させることによって実現される。pHを変更することも、抗原と親和性マトリックスの免疫化学的結合を解離させるために有効であり得る。
「作用物質」は、任意の小分子化学化合物、抗体、核酸分子、またはポリペプチド、またはその断片である。
「変更」または「変化」は、増大または低減である。変更は、わずか1%、2%、3%、4%、5%、10%、20%、30%、もしくは40%、50%、60%、またはさらには70%、75%、80%、90%、もしくは100%もの大きさであり得る。
「生物学的試料」は、生物体に由来する任意の組織、細胞、流体、または他の材料である。本明細書で使用される場合、「試料」という用語は、生物体に由来する任意の組織、細胞、流体、または他の材料などの生物学的試料を含む。「特異的に結合する」は、化合物(例えば、ペプチド)が、試料、例えば生体試料中のある分子(例えば、ポリペプチド)を認識し、それに結合するが、他の分子には実質的に認識せず、それに結合しないことを指す。
「捕捉用試薬」は、分子(例えば、核酸分子またはポリペプチド)を選択または単離するための、分子(例えば、核酸分子またはポリペプチド)に特異的に結合する試薬を指す。
本明細書で使用される場合、「決定すること」、「評価すること」、「アッセイすること」、「測定すること」、「検出すること」という用語およびそれらの文法上の等価物は、定量的決定および定性的決定の両方を指し、したがって、「決定すること」という用語は、本明細書では「アッセイすること」、「測定すること」などと互換的に使用される。定量的決定が意図されている場合、分析物の「量を決定すること」という句などが使用される。定性的決定および/または定量的決定が意図されている場合、分析物の「レベルを決定すること」または分析物を「検出すること」という句が使用される。
「断片」は、参照タンパク質または核酸と実質的に同一のタンパク質または核酸の部分である。一部の実施形態では、部分は、本明細書に記載の参照タンパク質または核酸の生物活性の少なくとも50%、75%、または80%、または90%、95%、またはさらには99%を保持する。
「単離された」、「精製された」、「生物学的に純粋な」という用語およびそれらの文法上の等価物は、材料が、そのネイティブな状態で見いだされる、通常はそれに付随する構成成分を種々の程度で含まないことを指す。「単離する」は、元々の供給源または周囲のものからのある程度の分離を示す。「精製する」は、単離よりも高い程度の分離を示す。「精製された」または「生物学的に純粋な」タンパク質は、他の材料を十分に含まず、したがって、いかなる不純物もタンパク質の生物学的特性に実質的な影響を及ぼすこともなく、他の有害な結果を引き起こすこともない。すなわち、本開示の核酸またはペプチドは、組換えDNA技法によって作製された場合には細胞性材料、ウイルス性材料、もしくは培養培地、または、化学的に合成された場合には化学的前駆体もしくは他の化学物質を実質的に含まなければ、精製されている。純度および均一性は、一般には、分析化学技法、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィーを使用して決定される。「精製された」という用語は、電気泳動ゲルにおいて核酸またはタンパク質から基本的に1つのバンドが生じることを示し得る。修飾、例えばリン酸化またはグリコシル化に供することができるタンパク質に関しては、異なる修飾により異なる単離されたタンパク質を生じさせることができ、それを別々に精製することができる。
「単離された」ポリペプチド(例えば、HLA-ペプチド複合体由来のペプチド)またはポリペプチド複合体(例えば、HLA-ペプチド複合体)は、天然に付随する構成成分から分離された本開示のポリペプチドまたはポリペプチド複合体である。一般には、ポリペプチドまたはポリペプチド複合体は、少なくとも60重量%が天然に付随するタンパク質および天然に存在する有機分子を含まなければ、単離されている。調製物は、少なくとも75重量%、少なくとも90重量%、または少なくとも99重量%が本開示のポリペプチドまたはポリペプチド複合体であり得る。本開示の単離されたポリペプチドまたはポリペプチド複合体は、例えば、天然のソースから抽出することによって、そのようなポリペプチドまたはポリペプチド複合体の1つもしくは複数の構成成分をコードする組換え核酸を発現させることによって、またはポリペプチドまたはポリペプチド複合体の1つもしくは複数の構成成分を化学的に合成することによって、得ることができる。純度は、任意の妥当な方法によって、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。一部の場合では、HLA対立遺伝子にコードされるMHCクラスIIタンパク質(すなわち、MHCクラスIIペプチド)は、本文書内では互換的にHLAクラスIIタンパク質(またはHLAクラスIIペプチド)と称される。
「ベクター」という用語は、異種核酸を輸送することまたは異種核酸の発現を媒介することができる核酸分子を指す。プラスミドは、「ベクター」という用語に包含される属のうちの1種である。ベクターは、一般には、複製開始点ならびに宿主細胞における複製および/または維持のために必要な他の実体を含有する核酸配列を指す。作動可能に連結した遺伝子および/または核酸配列の発現を方向付けることができるベクターは、本明細書では、「発現ベクター」と称される。一般に、有用な発現ベクターは、多くの場合、「プラスミド」の形態であり、これは、それらのベクター形態では染色体に結合せず、一般にはコードされるDNAの安定発現または一過性発現のために必要な実体を含む環状二本鎖DNA分子を指す。本明細書に開示される方法に使用することができる他の発現ベクターとしては、これだけに限定されないが、プラスミド、エピソーム、細菌人工染色体、酵母人工染色体、バクテリオファージまたはウイルスベクターが挙げられ、そのようなベクターは、宿主のゲノムに組み込まれるものまたは細胞において自律的に複製することができるものであり得る。ベクターは、DNAベクターまたはRNAベクターであり得る。当業者に公知の、同等の機能を果たす他の形態の発現ベクター、例えば、自己複製する染色体外ベクターまたは宿主ゲノム内に組込むことができるベクターも使用することができる。例示的なベクターは、自律複製することができ、かつ/またはそれらが連結した核酸を発現させることができるものである。
「スペーサー」または「リンカー」という用語は、融合タンパク質に関して使用される場合、融合タンパク質を構成するタンパク質を接合するペプチドを指す。一般に、スペーサーは、タンパク質またはRNA配列間を接合することまたはタンパク質またはRNA配列間のいくらかの最小距離または他の空間的関係を保存すること以外の特定の生物活性を有さない。しかし、一部の実施形態では、スペーサーの構成物であるアミノ酸を、分子のフォールディング、正味の電荷、または疎水性などの分子のいくつかの特性に影響を及ぼすように選択することができる。本開示のある実施形態における使用に適したリンカーは当業者には周知であり、それらとしては、これだけに限定されないが、直鎖状または分枝鎖炭素リンカー、複素環式炭素リンカー、またはペプチドリンカーが挙げられる。リンカーは、2つの抗原性ペプチドを、一部の実施形態では各抗原性ペプチドが適当にフォールディングすることを確実にするために十分な距離をあけて分離するために使用される。例示的なペプチドリンカー配列は柔軟な伸長したコンフォメーションをとり、順序づけられた二次構造を生じさせる傾向を示さない。柔軟なタンパク質領域内の典型的なアミノ酸は、Gly、AsnおよびSerを含む。Gly、AsnおよびSerを含有するアミノ酸配列の事実上あらゆる順列が上記のリンカー配列の基準を満たすと予測される。他のほぼ中性のアミノ酸、例えば、ThrおよびAlaなどもリンカー配列に使用することができる。リンカーとして使用することができるさらに他のアミノ酸配列は、Maratea et al. (1985), Gene 40: 39-46;Murphy et al. (1986) Proc. Nat'l. Acad. Sci. USA 83: 8258-62;米国特許第4,935,233号;および米国特許第4,751,180号に開示されている。
「新形成」という用語は、不適切に高レベルの細胞分裂、不適切に低レベルのアポトーシス、またはその両方によって引き起こされるまたはそれをもたらす任意の疾患を指す。神経膠芽腫は新形成またはがんの1つの非限定的な例である。「がん」または「腫瘍」または「過剰増殖障害」という用語は、制御されない増殖、不死性、転移能、急速な成長および増殖率、ならびにある特定の特徴的な形態学的特色などの、がんを引き起こす細胞に典型的な特徴を有する細胞が存在することを指す。がん細胞は、多くの場合、腫瘍の形態であるが、そのような細胞は、動物内に単独で存在し得る、または、白血病細胞などの非腫瘍形成性がん細胞であり得る。がんとしては、これだけに限定されないが、B細胞がん(例えば、多発性骨髄腫、ワルデンストレームマクログロブリン血症)、重鎖病(例えば、アルファ鎖病、ガンマ鎖病、およびミュー鎖病など)、良性単クローン性免疫グロブリン血症、および免疫細胞アミロイドーシス、黒色腫、乳がん、肺がん、気管支がん、結腸直腸がん、前立腺がん(例えば、転移性前立腺がん、ホルモン難治性前立腺がん)、膵がん、胃がん、卵巣がん、膀胱がん(urinary bladder cancer)、脳または中枢神経系がん、末梢神経系がん、食道がん(esophageal cancer)、子宮頸がん、子宮または子宮体がん、口腔または咽頭のがん、肝がん、腎がん(kidney cancer)、精巣がん、胆道がん、小腸または虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液学的組織のがんなどが挙げられる。本開示に包含される方法に適用可能ながんの型の他の非限定的な例としては、ヒト肉腫および癌腫、例えば、線維肉腫、粘液肉腫、脂肪肉腫、軟骨肉腫、骨原性肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、結腸癌、結腸直腸がん、膵がん、乳がん、卵巣がん、扁平上皮癌、基底細胞癌、腺癌、汗腺癌、脂腺癌、乳頭癌、乳頭状腺癌、嚢胞腺癌、髄様癌、気管支原性肺癌、腎細胞癌、ヘパトーマ、胆管癌、肝がん、絨毛癌、セミノーマ、胎児性癌、ウィルムス腫瘍、子宮頸がん、骨がん、脳腫瘍、精巣がん、肺癌、小細胞肺癌、膀胱癌、上皮癌、神経膠腫、星状細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽細胞腫、聴神経腫、乏枝神経膠腫、髄膜腫、黒色腫、神経芽細胞腫、網膜芽細胞腫;白血病、例えば、急性リンパ性白血病および急性骨髄球性白血病(骨髄芽球性白血病、前骨芽球性白血病、骨髄単球性白血病、単球性白血病および赤白血病);慢性白血病(慢性骨髄球性(顆粒球性)白血病および慢性リンパ性白血病);ならびに真性赤血球増加症、リンパ腫(ホジキン病および非ホジキン病)、多発性骨髄腫、ワルデンストレームマクログロブリン血症、および重鎖病が挙げられる。一部の実施形態では、がんは、これだけに限定されないが、膀胱がん(bladder cancer)、乳がん、子宮頸がん、結腸がん、婦人科のがん、腎がん(renal cancer)、喉頭がん、肺がん、口腔がん、頭頸部がん、卵巣がん、膵がん、前立腺がん、または皮膚がんなどの上皮がんである。他の実施形態では、がんは、乳がん、前立腺がん、肺がん、または結腸がんである。さらに他の実施形態では、上皮がんは、非小細胞肺がん、非乳頭状腎細胞癌、子宮頸癌、卵巣癌(例えば、漿液性卵巣癌)、または乳癌である。上皮がんは、これだけに限定されないが、漿液性、類内膜、粘液性、明細胞、ブレンナー、または未分化を含めた種々の他のやり方で特徴付けることができる。一部の実施形態では、本開示を、これだけに限定されないが、マントル細胞リンパ腫を含めたリンパ腫またはそのサブタイプの処置、診断、および/または予後判定に使用する。リンパ球増殖性障害も増殖性疾患とみなされる。
「ワクチン」という用語は、疾患(例えば、新形成/腫瘍/感染因子/自己免疫疾患)の予防および/または処置のために免疫を生じさせるための組成物を意味すると理解されるべきである。したがって、ワクチンは、抗原を含む医薬であり、ヒトまたは動物においてワクチン接種によって特定の防御および保護物質を生成するために使用されることが意図されたものである。「ワクチン組成物」は、薬学的に許容される賦形剤、担体または希釈剤を含み得る。本開示の態様は、抗原に基づくワクチンの調製における当該技術の使用に関する。これらの実施形態では、ワクチンは、1つまたは複数の疾患特異的抗原性ペプチド(またはそれらをコードする対応する核酸)を指すものとする。一部の実施形態では、抗原に基づくワクチンは、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、少なくとも6種、少なくとも7種、少なくとも8種、少なくとも9種、少なくとも10種、少なくとも11種、少なくとも12種、少なくとも13種、少なくとも14種、少なくとも15種、少なくとも16種、少なくとも17種、少なくとも18種、少なくとも19種、少なくとも20種、少なくとも21種、少なくとも22種、少なくとも23種、少なくとも24種、少なくとも25種、少なくとも26種、少なくとも27種、少なくとも28種、少なくとも29種、少なくとも30種、またはそれよりも多くの抗原性ペプチドを含有する。一部の実施形態では、抗原に基づくワクチンは、2~100種、2~75種、2~50種、2~25種、2~20種、2~19種、2~18種、2~17種、2~16種、2~15種、2~14種、2~13種、2~12種、2~10種、2~9種、2~8種、2~7種、2~6種、2~5種、2~4種、3~100種、3~75種、3~50種、3~25種、3~20種、3~19種、3~18種、3~17種、3~16種、3~15種、3~14種、3~13種、3~12種、3~10種、3~9種、3~8種、3~7種、3~6種、3~5種、4~100種、4~75種、4~50種、4~25種、4~20種、4~19種、4~18種、4~17種、4~16種、4~15種、4~14種、4~13種、4~12種、4~10種、4~9種、4~8種、4~7種、4~6種、5~100種、5~75種、5~50種、5~25種、5~20種、5~19種、5~18種、5~17種、5~16種、5~15種、5~14種、5~13種、5~12種、5~10種、5~9種、5~8種、または5~7種の抗原性ペプチドを含有する。一部の実施形態では、抗原に基づくワクチンは、2種、3種、4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、または20種の抗原性ペプチドを含有する。一部の場合では、抗原性ペプチドは、新抗原性ペプチドである。一部の場合では、抗原性ペプチドは、1つまたは複数のネオエピトープを含む。
「薬学的に許容される」という用語は、連邦または州政府の規制当局によって承認されたもしくは承認可能であることまたは米国薬局方または他のヒトを含めた動物における使用に関して一般に認識されている薬局方に収載されていることを指す。「薬学的に許容される賦形剤、担体または希釈剤」は、作用物質と一緒に対象に投与することができ、作用物質の薬理活性を破壊せず、かつ、治療量の作用物質を送達するために十分な用量で投与された場合に非毒性である、賦形剤、担体または希釈剤を指す。本明細書に記載のプールされた疾患特異的抗原の「薬学的に許容される塩」は、過剰な毒性、刺激、アレルギー反応、または他の問題もしくは併発症を伴わずにヒトまたは動物の組織と接触させて使用するのに適すると当技術分野において一般にみなされる酸または塩基塩であり得る。そのような塩としては、アミンなどの塩基性残基の無機酸塩および有機酸塩、ならびにカルボン酸などの酸性残基のアルカリまたは有機塩が挙げられる。特定の医薬塩としては、これだけに限定されないが、塩酸、リン酸、臭化水素酸、リンゴ酸、グリコール酸、フマル酸、硫酸、スルファミン酸、スルファニル酸、ギ酸、トルエンスルホン酸、メタンスルホン酸、ベンゼンスルホン酸、エタン二スルホン酸、2-ヒドロキシエチルスルホン酸、硝酸、安息香酸、2-アセトキシ安息香酸、クエン酸、酒石酸、乳酸、ステアリン酸、サリチル酸、グルタミン酸、アスコルビン酸、パモン酸、コハク酸、フマル酸、マレイン酸、プロピオン酸、ヒドロキシマレイン酸、ヨウ化水素酸、フェニル酢酸、アルカン酸、例えば、酢酸、HOOC-(CH2)n-COOH(式中、nは0~4である)などの酸の塩などが挙げられる。同様に、薬学的に許容されるカチオンとしては、これだけに限定されないが、ナトリウム、カリウム、カルシウム、アルミニウム、リチウムおよびアンモニウムが挙げられる。当業者は、本開示および当技術分野における知見から、Remington's Pharmaceutical Sciences, 17th ed., Mack Publishing Company, Easton, PA, p.1418 (1985)によって列挙されているものを含めた、本明細書で提供されるプールされた疾患特異的抗原のためのさらなる薬学的に許容される塩を理解されよう。一般に、薬学的に許容される酸または塩基塩は、塩基性または酸性部分を含有する親化合物から、任意の従来の化学的方法によって合成することができる。簡単に述べると、そのような塩は、遊離の酸または塩基の形態のこれらの化合物を化学量論量の妥当な塩基または酸と妥当な溶媒中で反応させることによって調製することができる。
本開示の方法に有用な核酸分子としては、本開示のポリペプチドまたはその断片をコードする任意の核酸分子が挙げられる。そのような核酸分子は、内因性核酸配列と100%同一である必要はないが、一般には実質的な同一性を示す。内因性配列に対して実質的な同一性を有するポリヌクレオチドは、一般には、二本鎖核酸分子の少なくとも一方の鎖とハイブリダイズすることができる。「ハイブリダイズする」は、種々のストリンジェンシーの条件下で相補的なポリヌクレオチド配列またはその一部の間で核酸分子が対形成して二本鎖分子を形成する場合を指す(例えば、Wahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152: 399;Kimmel, A. R. (1987) Methods Enzymol. 152: 507を参照されたい)。例えば、ストリンジェントな塩濃度は、普通は、約750mM未満のNaClおよび75mMのクエン酸三ナトリウム、約500mM未満のNaClおよび50mMのクエン酸三ナトリウム、または約250mM未満のNaClおよび25mMのクエン酸三ナトリウムであり得る。低ストリンジェンシーのハイブリダイゼーションは有機溶媒、例えばホルムアミドを用いずに得ることができるが、一方、高ストリンジェンシーのハイブリダイゼーションは少なくとも約35%ホルムアミド、または少なくとも約50%ホルムアミドの存在下で得ることができる。ストリンジェントな温度条件は、普通は、少なくとも約30℃、少なくとも約37℃、または少なくとも約42℃の温度を含み得る。ハイブリダイゼーション時間、界面活性剤、例えばドデシル硫酸ナトリウム(SDS)の濃度、およびキャリアDNAを含めるか除外するかなどの変動する追加的なパラメータは当業者には周知である。これらの種々の条件を必要に応じて組み合わせることにより、種々のレベルのストリンジェンシーが実現される。例示的な実施形態では、ハイブリダイゼーションを30℃、750mMのNaCl、75mMのクエン酸三ナトリウム、および1%SDSで行うことができる。別の例示的な実施形態では、ハイブリダイゼーションを37℃、500mMのNaCl、50mMのクエン酸三ナトリウム、1%SDS、35%ホルムアミド、および100μg/mlの変性サケ精子DNA(ssDNA)で行うことができる。別の例示的な実施形態では、ハイブリダイゼーションを42℃、250mMのNaCl、25mMのクエン酸三ナトリウム、1%SDS、50%ホルムアミド、および200μg/mlのssDNAで行うことができる。これらの条件の有用な変動は当業者には容易に明らかになるであろう。大多数の適用に関しては、ハイブリダイゼーション後の洗浄ステップに関してもストリンジェンシーを変動させることができる。洗浄ストリンジェンシー条件は、塩濃度によって、および温度によって定義することができる。上記の通り、洗浄ストリンジェンシーは、塩濃度を低下させることによって、または温度を上昇させることによって高めることができる。例えば、洗浄ステップのストリンジェントな塩濃度は、約30mM未満のNaClおよび3mMのクエン酸三ナトリウム、または約15mM未満のNaClおよび1.5mMのクエン酸三ナトリウムであり得る。洗浄ステップのストリンジェントな温度条件は、少なくとも約25℃、少なくとも約42℃、または少なくとも約68℃の温度を含み得る。例示的な実施形態では、洗浄ステップを25℃、30mMのNaCl、3mMのクエン酸三ナトリウム、および0.1%SDSで行うことができる。他の例示的な実施形態では、洗浄ステップを42℃、15mMのNaCl、1.5mMのクエン酸三ナトリウム、および0.1%SDSで行うことができる。別の例示的な実施形態では、洗浄ステップを68℃、15mMのNaCl、1.5mMのクエン酸三ナトリウム、および0.1%SDSで行うことができる。これらの条件の追加的な変動は当業者には容易に明らかになるであろう。ハイブリダイゼーション技法は当業者には周知であり、例えば、Benton and Davis (Science 196: 180, 1977);Grunstein and Hogness (Proc. Natl. Acad. Sci., USA 72: 3961, 1975);Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001);Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York);およびSambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記載されている。
「実質的に同一」とは、ポリペプチドまたは核酸分子が参照アミノ酸配列(例えば、本明細書に記載のアミノ酸配列のうちのいずれか1つ)または参照核酸配列(例えば、本明細書に記載の核酸配列のうちのいずれか1つ)に対して少なくとも50%の同一性を示すことを指す。そのような配列は、アミノ酸または核酸レベルで、比較のために使用される配列に対して少なくとも60%、80%または85%、90%、95%、96%、97%、98%、またはさらには99%またはそれよりも大きく同一であり得る。配列同一性は、一般には、配列解析ソフトウェア(例えば、Sequence Analysis Software Package of the Genetics Computer Group,University of Wisconsin Biotechnology Center,1710 University Avenue,Madison,Wis.53705、BLAST、BESTFIT、GAP、またはPILEUP/PRETTYBOXプログラム)を使用して測定される。そのようなソフトウェアでは、種々の置換、欠失、および/または他の修飾に対して相同性の程度を割り当てることにより、同一または同様の配列を適合させる。保存的置換は、一般には、以下の群内での置換を含む:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、トレオニン;リシン、アルギニン;およびフェニルアラニン、チロシン。同一性の程度を決定するための例示的な手法では、BLASTプログラムを、密接に関連する配列を示すe-3からe-m°の間の確率スコアで使用することができる。「参照」は比較標準である。
「対象」または「患者」という用語は、処置、観察、または実験の対象となる動物を指す。単に例として、対象としては、これだけに限定されないが、これだけに限定されないが、ヒトまたは非ヒト哺乳動物、例えば、非ヒト霊長類、マウス、ウシ、ウマ科の動物、イヌ科の動物、ヒツジ、またはネコ科の動物などを含めた哺乳動物が挙げられる。
「処置する(treat)」、「処置された(treated)」、「処置すること(treating)」、「処置(treatment)」などという用語は、障害および/またはそれに伴う症状(例えば、新形成または腫瘍または感染因子または自己免疫疾患)を低減すること、防止すること、または好転させることを指すものとする。「処置すること(treating)」は、疾患(例えば、がんまたは感染因子による感染症または自己免疫疾患)の発症後、または発症の疑い後に対象に対して治療を施行することを指し得る。「処置すること(treating)」は、「緩和すること(alleviating)」という概念を含み、これは、疾患に関連する任意の症状もしくは他の病的影響の発生もしくは再発の頻度、もしくは重症度、および/または治療に付随する副作用を少なくすることを指す。「処置すること(treating)」という用語は、「管理すること(managing)」という概念も包含し、これは、患者における疾患または障害の重症度を低下させること、例えば、疾患を有する患者の寿命を延ばすこともしくは生存を延長すること、またはその再発を遅延させること、例えば、疾患に罹患している患者における寛解の期間を長くすることを指す。除外するものではないが、障害または状態を処置することとは、障害、状態、またはそれに伴う症状を完全に排除することを求めるものではないことが理解される。
「防止する(prevent)」、「防止すること(preventing)」、「防止(prevention)」という用語およびそれらの文法上の等価物は、本明細書で使用される場合、作用物質または化合物の投与の開始時点では疾患または状態に付随する症状が発生していない対象におけるそのような症状の発症を回避するまたは遅延させることを意味する。
「治療効果」という用語は、障害(例えば、新形成、腫瘍、または感染因子による感染症または自己免疫疾患)またはそれに付随する病的逸脱の症状の1つまたは複数のいくらかの程度の軽減を指す。「治療有効量」は、本明細書で使用される場合、単回用量または複数回用量を細胞または対象に投与した際に、そのような処置の非存在下で予測されるものを超えた、そのような障害を有する患者の生存の延長、障害の1つまたは複数の徴候または症状の低減、防止または遅延などに有効な作用物質の量を指す。「治療有効量」は、治療効果を実現するために必要な量を限定するものと意図されている。当技術分野における通常の技術を有する医師または獣医師は、必要な医薬組成物の「治療有効量」(例えば、ED50)を容易に決定し、処方することができる。例えば、医師または獣医師は、医薬組成物に使用する本開示の化合物の用量を所望の治療効果を実現するために必要な用量よりも低いレベルで開始し、所望の効果が実現されるまで投薬量を徐々に増加することができる。疾患、状態、および障害は、本明細書では互換的に使用される。
当業者は、「ペプチドタグ」、「アフィニティータグ」、「エピトープタグ」、または「親和性アクセプタータグ」という用語は、本明細書では互換的に使用されることを理解されよう。本明細書で使用される場合、「親和性アクセプタータグ」という用語は、タグ付けされたタンパク質を例えばアフィニティー精製によって容易に検出または精製することを可能にするアミノ酸配列を指す。親和性アクセプタータグは、一般に(必ずしもではないが)HLA対立遺伝子のN末端またはC末端またはその付近に配置される。種々のペプチドタグが当技術分野で周知である。非限定的な例として、ポリ-ヒスチジンタグ(例えば、4~15個の連続したHis残基、例えば、8個の連続したHis残基など);ポリ-ヒスチジン-グリシンタグ;HAタグ(例えば、Field et al., Mol. Cell. Biol., 8: 2159, 1988);c-mycタグ(例えば、Evans et al., Mol. Cell. Biol., 5: 3610, 1985);単純ヘルペスウイルス糖タンパク質D(gD)タグ(例えば、Paborsky et al., Protein Engineering, 3: 547, 1990);FLAGタグ(例えば、Hopp et al., BioTechnology, 6: 1204, 1988;米国特許第4,703,004号および4,851,341号);KT3エピトープタグ(例えば、Martine et al., Science, 255: 192, 1992);チューブリンエピトープタグ(例えば、Skinner, Biol. Chem., 266: 15173, 1991);T7遺伝子10タンパク質ペプチドタグ(例えば、Lutz-Freyemuth et al., Proc. Natl. Acad. Sci. USA, 87: 6393, 1990);ストレプトアビジンタグ(StrepTag(商標)またはStrepTagII(商標);例えば、Schmidt et al., J. Mol. Biol., 255 (5):753-766, 1996または米国特許第5,506,121号を参照されたい;Sigma-Genosysからも市販されている);またはVesicular Stomatisウイルス糖タンパク質に由来するVSV-Gエピトープタグ;またはサルウイルス5(SV5)パラミクソウイルスのPタンパク質およびVタンパク質に見いだされる小さなエピトープ(Pk)に由来するV5タグが挙げられる。一部の実施形態では、親和性アクセプタータグは「エピトープタグ」であり、これは、認識可能なエピトープ(抗体結合性部位)をHLA-タンパク質に付加して、対応する抗体の結合をもたらし、それにより、タグ付けされたタンパク質の同定またはアフィニティー精製を可能にするペプチドタグの一種である。エピトープタグの非限定的な例は、IgGに結合するプロテインAまたはプロテインGである。一部の実施形態では、IgG Sepharose 6 Fast Flowクロマトグラフィー樹脂のマトリックスをヒトIgGに共有結合によりカップリングする。この樹脂は、プロテインAでタグ付けされたタンパク質を迅速かつ好都合に精製するための高い流速を可能にするものである。多数の他のタグ部分が当業者には公知であり、当業者が構想することができ、また、本明細書で意図されている。親和性アクセプターでタグ付けされたHLA-ペプチド複合体のエレメントとして発現させることができる限りは、任意のペプチドタグを使用することができる。
本明細書で使用される場合、「親和性分子」という用語は、親和性アクセプターペプチドに化学的特異性で結合する分子またはリガンドを指す。化学的特異性は、タンパク質の結合性部位の、特異的なリガンドに結合する能力である。タンパク質が結合することができるリガンドが少ないほど、その特異性は大きくなる。特異性は、所与のタンパク質とリガンドの結合の強度を記述するものである。この関係は、タンパク質-リガンド系に関して結合した状態と結合していない状態の平衡を特徴付けるものである解離定数(KD)によって説明することができる。
「親和性アクセプターでタグ付けされたHLA-ペプチド複合体」という用語は、HLAクラスIまたはクラスII関連ペプチドまたはその一部と、それと特異的に結合した、親和性アクセプターペプチドを含む単一の対立遺伝子の組換えHLAクラスIまたはクラスIIペプチドとを含む複合体を指す。
「特異的結合(specific binding)」または「特異的に結合(specifically binding)」という用語は、親和性分子および親和性アクセプタータグまたはエピトープおよびHLAペプチドの相互作用に関して使用される場合、相互作用がタンパク質上の特定の構造(例えば、抗原性決定因子またはエピトープ)の存在に依存することを意味する;言い換えれば、親和性分子は、タンパク質全般にではなく、特異的な親和性アクセプターペプチド構造を認識し、それに結合する。
本明細書で使用される場合、「親和性」という用語は、結合対の2つのメンバー、例えば、「親和性アクセプタータグ」と「親和性分子」およびHLA結合性ペプチドとHLAクラスIまたはクラスII分子の間の結合の強度の評価基準を指す。KDは解離定数であり、容量モル濃度の単位を有する。親和定数は解離定数の逆である。親和定数は、時にはこの化学的実体を記載するための一般用語として使用される。親和定数は結合のエネルギーの直接評価基準である。親和性は、例えば、市販のBiacore SPR単位を使用して表面プラズモン共鳴(SPR)によって実験的に決定することができる。親和性はまた、阻害性濃度50(IC50)として表すこともでき、これは、ペプチドの50%が置き換えられる濃度である。同様に、lnIC50はIC50の自然対数を指す。Koffは、例えば、親和性アクセプターでタグ付けされたHLA-ペプチド複合体からの親和性分子の解離に関する解離速度定数を指す。
一部の実施形態では、親和性アクセプターでタグ付けされたHLA-ペプチド複合体は、ビオチンアクセプターペプチド(BAP)を含み、ストレプトアビジン/NeutrAvidinビーズを使用して複合体細胞混合物から免疫精製される。ビオチン-アビジン/ストレプトアビジン結合は、天然で知られている最も強い非共有結合性相互作用である。この特性は、ビオチンが共有結合により付着したタンパク質の免疫精製などの広範囲の適用のための生物学的ツールとして活用される。例示的な実施形態では、HLA対立遺伝子をコードする核酸配列に免疫精製のための親和性アクセプタータグとしてビオチンアクセプターペプチド(BAP)を組み込む。BAPを、in vivoまたはin vitroにおいて、タグ内の単一のリシン残基を特異的にビオチン化することができる(例えば、米国特許第5,723,584号;5,874,239号;および5,932,433号;および英国特許第GB2370039号)。BAPは、一般には15アミノ酸長であり、ビオチンアクセプター残基として単一のリシンを含有する。一部の実施形態では、BAPを単一の対立遺伝子HLAペプチドのN末端またはC末端またはその付近に配置する。一部の実施形態では、BAPをHLAクラスIペプチドの重鎖ドメインとβ2ミクログロブリンドメインの間に配置する。一部の実施形態では、BAPをHLAクラスIIペプチドのβ鎖ドメインとα鎖ドメインの間に配置する。一部の実施形態では、BAPをHLAクラスIの重鎖のα1ドメイン、α2ドメイン、およびα3ドメインの間のループ領域内、またはHLAクラスIIのそれぞれα鎖およびβ鎖のα1ドメインとα2ドメインの間およびβ1ドメインとβ2ドメインの間に配置する。ビオチン化のためにBAPが組み込まれたHLAクラスIおよびクラスII発現のために設計された例示的な構築物および免疫精製は図2に記載されている。
本明細書で使用される場合、「ビオチン」という用語は、化合物ビオチン自体ならびにその類似体、誘導体およびバリアントを指す。したがって、「ビオチン」という用語は、ビオチン様化合物を含めたビオチン(シス-ヘキサヒドロ-2-オキソ-1H-チエノ[3,4]イミダゾール-4-ペンタン酸)および任意の誘導体およびその類似体を含む。そのような化合物としては、例えば、ビオチン-e-N-リシン、ビオシチンヒドラジド、2-イミノビオチンのアミノまたはスルフヒドリル誘導体およびビオチニル-E-アミノカプロン酸-N-ヒドロキシスクシンイミドエステル、スルホスクシンイミドイミノビオチン、ビオチンブロモアセチルヒドラジド、p-ジアゾベンゾイルビオシチン、3-(N-マレイミドプロピオニル)ビオシチン、デスチオビオチンなどが挙げられる。「ビオチン」という用語は、リザビジン、アビジン、ストレプトアビジン、タマビジン部分、または他のアビジン様ペプチドのうちの1つまたは複数に特異的に結合し得るビオチンバリアントも含む。
本明細書で使用される場合、「PPV決定法」は、提示PPV決定法を指し得る。例えば、「PPV決定法」は、(a)複数の試験提示予測を生成するために、機械学習HLAペプチド提示予測モデルなどのHLAペプチド提示予測モデルを使用して複数の試験ペプチド配列のアミノ酸情報を処理するステップであって、各試験提示予測により、対象の細胞のクラスII HLA対立遺伝子などの細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質により複数の試験ペプチド配列のうちの所与の試験ペプチド配列が提示され得る可能性が示され、複数の試験ペプチド配列が、(i)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された少なくとも1つのヒットペプチド配列および(ii)対象と同じ種の生物体などの生物体のゲノムによってコードされるタンパク質内に含有される少なくとも499のデコイペプチド配列を含む少なくとも500の試験ペプチド配列を含み、複数の試験ペプチド配列が、デコイペプチド配列の数に対するヒットペプチド配列の数が1つ未満という比、例えば、少なくとも1つのヒットペプチド配列の少なくとも499のデコイペプチド配列に対する1:499の比などを含む、ステップと、(b)複数の試験ペプチド配列の上位パーセンテージ、例えば、上位複数の試験ペプチド配列の0.2%などを、細胞のクラスII HLA対立遺伝子によって提示されるものとして同定またはコールするステップと、(c)HLAペプチド提示予測モデルのPPVを算出するステップであって、PPVが、複数のうちの、質量分析によって細胞のクラスII HLA対立遺伝子によって提示されるものとして観察されたペプチドである、細胞のクラスII HLA対立遺伝子によって提示されるものとして同定またはコールされた試験ペプチド配列の分率である、ステップとを含む方法を指し得る。一部の実施形態では、デコイペプチドは、同じ長さのものである、すなわち、ヒットペプチドと同じ数のアミノ酸を含む。一部の実施形態では、デコイペプチドは、ヒットペプチドと比較してアミノ酸を1つ多くまたは1つ少なく含み得る。一部の実施形態では、デコイペプチドは、内因性ペプチドであるペプチドである。一部の実施形態では、デコイペプチドは合成ペプチドである。一部の実施形態では、デコイペプチドは、第1のMHCクラスIまたはクラスIIタンパク質に結合することが質量分析によって同定された内因性ペプチドであり、第1のMHCクラスIまたはクラスIIタンパク質は、ヒットペプチドに結合する第2のMHCクラスIまたはクラスIIタンパク質とは別個である。一部の実施形態では、デコイペプチドは、スクランブルペプチドであり得、例えば、デコイペプチドは、ペプチドの長さの範囲内でアミノ酸位がヒットペプチドのアミノ酸位に対して再配列されたアミノ酸配列を含み得る。一部の実施形態では、PPV決定法は、提示PPV決定法であり得る。一部の実施形態では、ヒットペプチド配列の数とデコイペプチド配列の数の比は、約1:10、1:20、1:50、1:100、1:250、1:500、1:1000、1:1500、1:2000、1:2500、1:5000、1:7500、1:10000、1:25000、1:50000または1:100000である。一部の実施形態では、少なくとも1つのヒットペプチド配列は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100のヒットペプチド配列を含む。一部の実施形態では、少なくとも499のデコイペプチド配列は、少なくとも500 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、23000、24000、25000、26000、27000、28000、29000、30000、31000、32000、33000、34000、35000、36000、37000、38000、39000、40000、41000、42000、43000、44000、45000、46000、47000、48000、49000、50000、52500、55000、57500、60000、62500、65000、67500、70000、72500、75000、77500、80000、82500、85000、87500、90000、92500、95000、97500、100000、125000、150000、175000、200000、225000、250000、275000、300000、325000、350000、375000、400000、425000、450000、475000、500000、600000、700000、800000、900000または1000000のデコイペプチド配列を含む。一部の実施形態では、少なくとも500の試験ペプチド配列は、少なくとも600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、23000、24000、25000、26000、27000、28000、29000、30000、31000、32000、33000、34000、35000、36000、37000、38000、39000、40000、41000、42000、43000、44000、45000、46000、47000、48000、49000、50000、52500、55000、57500、60000、62500、65000、67500、70000、72500、75000、77500、80000、82500、85000、87500、90000、92500、95000、97500、100000、125000、150000、175000、200000、225000、250000、275000、300000、325000、350000、375000、400000、425000、450000、475000、500000、600000、700000、800000、900000または1000000の試験ペプチド配列を含む。一部の実施形態では、複数の試験ペプチド配列の上位パーセンテージを細胞のクラスII HLA対立遺伝子によって提示されるものとして同定またはコールするステップは、上位0.20%、0.30%、0.40%、0.50%、0.60%、0.70%、0.80%、0.90%、1.00%、1.10%、1.20%、1.30%、1.40%、1.50%、1.60%、1.70%、1.80%、1.90%、2.00%、2.10%、2.20%、2.30%、2.40%、2.50%、2.60%、2.70%、2.80%、2.90%、3.00%、3.10%、3.20%、3.30%、3.40%、3.50%、3.60%、3.70%、3.80%、3.90%、4.00%、4.10%、4.20%、4.30%、4.40%、4.50%、4.60%、4.70%、4.80%、4.90%、5.00%、5.10%、5.20%、5.30%、5.40%、5.50%、5.60%、5.70%、5.80%、5.90%、6.00%、6.10%、6.20%、6.30%、6.40%、6.50%、6.60%、6.70%、6.80%、6.90%、7.00%、7.10%、7.20%、7.30%、7.40%、7.50%、7.60%、7.70%、7.80%、7.90%、8.00%、8.10%、8.20%、8.30%、8.40%、8.50%、8.60%、8.70%、8.80%、8.90%、9.00%、9.10%、9.20%、9.30%、9.40%、9.50%、9.60%、9.70%、9.80%、9.90%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%を細胞のクラスII HLA対立遺伝子によって提示されるものとして同定またはコールすることを含む。一部の実施形態では、細胞は、単一対立遺伝子細胞である。
本明細書で使用される場合、「PPV決定法」は、結合PPV決定法を指し得る。例えば、「PPV決定法」は、(a)複数の試験結合予測を生成するために、機械学習HLAペプチド結合予測モデルなどのHLAペプチド結合予測モデルを使用して複数の試験ペプチド配列のアミノ酸情報を処理するステップであって、各試験結合予測により、対象の細胞のクラスII HLA対立遺伝子などの細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質が複数の試験ペプチド配列のうちの所与の試験ペプチド配列に結合する可能性が示され、複数の試験ペプチド配列が、(i)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された少なくとも1つのヒットペプチド配列および(ii)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された少なくとも1つのペプチド配列を含むタンパク質内に含有される少なくとも19のデコイペプチド配列を含む少なくとも20の試験ペプチド配列を含み、複数の試験ペプチド配列が、デコイペプチド配列の数に対するヒットペプチド配列の数が1つ未満という比、例えば、少なくとも1つのヒットペプチド配列と少なくとも19のデコイペプチド配列である1:19の比などを含み、(b)複数の試験ペプチド配列の上位パーセンテージ、例えば、上位複数の試験ペプチド配列の5%などを、HLAタンパク質に結合するものとして同定またはコールするステップと、(c)HLAペプチド結合予測モデルのPPVを算出するステップであって、PPVが、複数のうちの、質量分析によって細胞のクラスII HLA対立遺伝子によって提示されるものとして観察されたペプチドである、細胞のクラスII HLA対立遺伝子に結合するものとして同定またはコールされた試験ペプチド配列の分率である方法を指し得る。一部の実施形態では、ヒットペプチド配列の数とデコイペプチド配列の数の比は、約1:2、1:3、1:4、1:5、1:10、1:20、1:25、1:30、1:40、1:50、1:75、1:100、1:200、1:250、1:500または1:1000である。一部の実施形態では、少なくとも1つのヒットペプチド配列は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100のヒットペプチド配列を含む。一部の実施形態では、少なくとも19のデコイペプチド配列は、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、23000、24000、25000、26000、27000、28000、29000、30000、31000、32000、33000、34000、35000、36000、37000、38000、39000、40000、41000、42000、43000、44000、45000、46000、47000、48000、49000、50000、52500、55000、57500、60000、62500、65000、67500、70000、72500、75000、77500、80000、82500、85000、87500、90000、92500、95000、97500、100000、125000、150000、175000、200000、225000、250000、275000、300000、325000、350000、375000、400000、425000、450000、475000、500000、600000、700000、800000、900000または1000000のデコイペプチド配列を含む。一部の実施形態では、少なくとも20の試験ペプチド配列は、少なくとも30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、21000、22000、23000、24000、25000、26000、27000、28000、29000、30000、31000、32000、33000、34000、35000、36000、37000、38000、39000、40000、41000、42000、43000、44000、45000、46000、47000、48000、49000、50000、52500、55000、57500、60000、62500、65000、67500、70000、72500、75000、77500、80000、82500、85000、87500、90000、92500、95000、97500、100000、125000、150000、175000、200000、225000、250000、275000、300000、325000、350000、375000、400000、425000、450000、475000、500000、600000、700000、800000、900000または1000000の試験ペプチド配列を含む。一部の実施形態では、複数の試験ペプチド配列の上位パーセンテージを細胞のクラスII HLA対立遺伝子によって提示されるものとして同定またはコールするステップは、上位5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、または40%を細胞のクラスII HLA対立遺伝子によって提示されるものとして同定またはコールすることを含む。一部の実施形態では、細胞は、単一対立遺伝子細胞である。
ヒト白血球抗原(HLA)系
免疫系は、2つの機能的下位系:自然免疫系および適応免疫系に分類することができる。自然免疫系は、感染に対する防御の第一選択であり、大多数の潜在的な病原体が、例えば注目すべき感染症を引き起こす前に自然免疫系によって迅速に中和される。適応免疫系は、侵入生物体の抗原と称される分子構造に反応する。自然免疫系とは異なり、適応免疫系は病原体に対して高度に特異的である。適応免疫では長続きする保護ももたらされ得る;例えば、麻疹から回復したある人はそれから生涯にわたって麻疹から保護される。適応免疫反応には2つの型が存在し、それらには体液性免疫反応および細胞媒介性免疫反応が含まれる。体液性免疫反応では、B細胞によって体液中に分泌された抗体が病原体由来の抗原に結合し、それにより、種々の機構、例えば、補体媒介性溶解を通じた病原体の消失が導かれる。細胞媒介性免疫反応では、他の細胞を破壊することができるT細胞が活性化される。例えば、疾患に関連するタンパク質が細胞に存在する場合、それらのタンパク質は細胞内でタンパク質分解により断片化されてペプチドになる。次いで、特定の細胞内タンパク質自体が抗原またはこのように形成されたペプチドに付着し、それらを細胞の表面に輸送し、そこで、それらを体のT細胞内の分子防御機構に対して提示する。細胞傷害性T細胞がこれらの抗原を認識し、その抗原を有する細胞を死滅させる。
「主要組織適合性遺伝子複合体(MHC)」、「MHC分子」、または「MHCタンパク質」という用語は、タンパク質抗原のタンパク質分解による切断の結果生じたペプチドに結合することができる、潜在的なT細胞エピトープを表し、それらを細胞表面に輸送し、ペプチドを特定の細胞、例えば、細胞傷害性Tリンパ球またはヘルパーT細胞に提示するタンパク質を指す。ヒトMHCはHLA複合体とも称される。したがって、「ヒト白血球抗原(HLA)系」、「HLA分子」または「HLAタンパク質」という用語は、ヒトにおけるMHCタンパク質をコードする遺伝子複合体を指す。MHCという用語は、マウス種では「H-2」複合体と称される。「主要組織適合性遺伝子複合体(MHC)」、「MHC分子」、「MHCタンパク質」および「ヒト白血球抗原(HLA)系」、「HLA分子」、「HLAタンパク質」という用語は本明細書では互換的に使用されることが当業者には理解されよう。
HLAタンパク質は、HLAクラスIおよびHLAクラスIIと称される2つの型に分類される。2つのHLAクラスのタンパク質の構造は非常に類似しているが、全く異なる機能を有する。HLAクラスIタンパク質は、大多数の腫瘍細胞を含めた、体のほとんど全ての細胞の表面上に存在する。HLAクラスIタンパク質には、通常、内因性タンパク質または細胞の内側に存在する病原体を起源とする抗原がローディングされ、次いで、ナイーブなまたは細胞傷害性Tリンパ球(CTL)に提示される。HLAクラスIIタンパク質は、これだけに限定されないが、樹状細胞、B細胞、およびマクロファージを含めた抗原提示細胞(APC)上に存在する。HLAクラスIIタンパク質は主に、外部の抗原供給源、例えば、細胞の外側からプロセシングされたペプチドをヘルパーT細胞に提示する。HLAクラスIタンパク質が結合するペプチドの大部分は、生物体自体の健康な宿主細胞において産生される細胞質タンパク質を起源とし、通常は免疫反応を刺激しない。
HLAクラスI分子(図1)は、非共有結合により連結した2つのポリペプチド鎖、HLAによりコードされるα鎖(重鎖、44~47kD)およびβ2ミクログロブリン(またはβ2m)と称されるHLAによりコードされないサブユニット(12kD)からなる。α鎖は、3つの細胞外ドメイン、α1、α2およびα3、ならびに膜貫通領域を有し、α1領域およびα2領域は、約7~13アミノ酸(例えば、約8~11アミノ酸、または9アミノ酸または10アミノ酸)のペプチドに結合することができる。HLAクラス1分子は、適切な結合性モチーフを有するペプチドに結合し、それを細胞傷害性Tリンパ球に提示する。HLAクラス1重鎖は、HLA-A単量体とも称されるHLA-A対立遺伝子のタンパク質産物、またはHLA-B対立遺伝子のタンパク質産物(同様に、HLA-B単量体)またはHLA-C対立遺伝子のタンパク質産物(HLA-C単量体)であり得、その各々がβ-2-ミクログロブリンと複合体を形成する。α1は、非HLAタンパク質β2mの上に載っている;β2mは、ヒト15番染色体上に位置するベータ2-ミクログロブリン遺伝子によってコードされる。α3ドメインは膜貫通領域と接続しており、それにより、HLAクラスI分子が細胞膜とつながっている。提示されるペプチドは、α1/α2ヘテロ二量体(2つの同一でないサブユニットで構成される分子)の中心領域にあるペプチド結合性溝の底に保持される。HLAクラスI-A、HLAクラスI-BまたはHLAクラスI-Cは、高度に多型的である。HLAクラス1-A遺伝子(HLA-A遺伝子と称される)、HLAクラス1-B遺伝子(HLA-B遺伝子と称される)およびHLAクラス1-C遺伝子(HLA-C遺伝子と称される)の各々は、8つのエクソンを含有し、エクソン1はリーダーペプチドをコードし、エクソン2および3はα1およびα2ドメインをコードし、エクソン5は膜貫通領域をコードし、エクソン6および7は細胞質尾部をコードする。エクソン2およびエクソン3の多型が各クラス1分子のペプチド結合特異性を担う。HLAクラスI-B遺伝子(HLA-B)は多くの可能性のあるバリエーション、発現パターンおよび提示される抗原を有する。この群は、HLA遺伝子座内でコードされる群、例えば、HLA-E、HLA-F、HLA-Gに細分され、また、例えば、ULBP、Rae1およびH60などのストレスリガンドではない。これらの分子の多くの抗原/リガンドは依然として不明であるが、CD8+ T細胞、NKT細胞、およびNK細胞の各々と相互作用し得る。
一部の実施形態では、本開示は、非古典的HLAクラスI-E対立遺伝子を利用する。HLA-E分子は、ナチュラルキラー(NK)細胞およびCD8+ T細胞によって認識される。HLA-Eは、肺、肝臓、皮膚および胎盤細胞を含めたほとんど全ての組織において発現される。HLA-E発現は固形腫瘍(例えば、骨肉腫および黒色腫)においても検出される。HLA-E分子は、CD8+ T細胞に発現されるTCRに結合し、その結果、T細胞活性化がもたらされる。HLA-Eは、NK細胞およびCD8+ T細胞上に発現されるCD94/NKG2受容体に結合することも公知である。CD94は、NKG2のいくつかの異なるアイソフォームと対形成して、細胞の活性化を阻害する潜在性を有する受容体(NKG2A、NKG2B)または細胞の活性化を促進する潜在性を有する受容体(NKG2C)を形成し得る。HLA-Eは、大多数のHLA-A分子、HLA-B分子、HLA-C分子、およびHLA-G分子のリーダー配列のアミノ酸残基3~11に由来するペプチドに結合することができるが、それ自体のリーダーペプチドには結合することができない。HLA-Eは、HLA-A、HLA-B、およびHLA-C対立遺伝子と同様に、内因性タンパク質に由来するペプチドを提示することも示されている。生理的条件下で、CD94/NKG2Aと、HLAクラスIリーダー配列由来のペプチドがローディングされたHLA-Eの会合により、通常、阻害シグナルが誘導される。サイトメガロウイルス(CMV)は、HLA-Aリーダーを模倣するUL40糖タンパク質を発現することにより、NK細胞免疫サーベイランスからエスケープする機構を利用する。しかし、CD8+ T細胞が、CMV Toledo株に由来するUL40ペプチドがローディングされたHLA-Eを認識することができ、CMVに対する防御において役割を果たすことも報告されている。いくつかの試験により、感染性疾患およびがんにおけるHLA-Eのいくつかの重要な機能が明らかになっている。
ペプチド抗原は、それ自体が小胞体内HLAクラスIの分子に競合的な親和性結合によって付着した後、細胞表面上に提示される。ここで、個々のペプチド抗原の親和性は、そのアミノ酸配列およびアミノ酸配列内の規定された位置における特定の結合性モチーフの存在に直接結びつけられる。そのようなペプチドの配列が既知である場合、疾患細胞に対する免疫系を、例えばペプチドワクチンを使用して操作することが可能である。
MHC分子は、高度に多型的である、すなわち、多くのMHCバリアントが存在する。各バリアントは、タンパク質をコードする遺伝子のバリエーションによってコードされ、そのようなバリアント遺伝子の各々は対立遺伝子と称される。ヒトに関しては、MHCはヒト白血球抗原(HLA)として公知であり、3つの型のHLAクラスII分子:DP、DQおよびDRを伴う。HLAクラスIIペプチド(図1)は、2つの鎖、αおよびβを有し、各々が2つのドメイン-α1およびα2ならびにβ1およびβ2を有し、各鎖が、膜貫通ドメイン、それぞれα2およびβ2を有し、それによりHLAクラスII分子と細胞膜が繋がっている。α1とβ1のヘテロ二量体からペプチド結合性溝が形成される。最も広く研究されているHLA-DR分子は、それぞれαドメインおよびβドメインに対応するDRAおよびDRBを有する。DRBは多様であり、DRAはほぼ同一である。したがって、DRB対立遺伝子の結合特異性により、対応するHLA-DRの結合特異性が示される。各MHCタンパク質はそれ自体の結合特異性を有する、つまり、MHC分子に対するペプチド結合性のセットは、別のMHC分子に対するものとは異なり得る。古典的分子は、ペプチドをCD4+リンパ球に提示する。細胞内機能を有する付属因子である非古典的分子は、細胞膜上には露出せず、リソソームの膜内部にあり、通常、抗原性ペプチドを古典的HLAクラスII分子にローディングする。
HLAクラスII系では、マクロファージおよび未成熟樹状細胞などの食細胞が実体をファゴサイトーシスによってファゴソームに取り込み(しかしB細胞は、エンドソームへのより一般的なエンドサイトーシスを示す)、それらはリソソームと融合し、リソソームの酸性酵素により取り込まれたタンパク質が切断されて多くの異なるペプチドになる。オートファジーは、HLAクラスIIペプチドの別の供給源である。宿主のゲノムにコードされる宿主で生じるHLAクラスIIバリアントとの分子間相互作用における物理化学ダイナミクスにより、特定のペプチドは、免疫優性を示し、HLAクラスII分子にローディングされる。これらは、細胞表面に輸送され、外面化する。最も多く研究されているHLAクラスII遺伝子のサブクラスは、HLA-DPA1、HLA-DPB1、HLA-DQA1、HLA-DQB1、HLA-DRA、およびHLA-DRB1である。
HLAクラスII分子によるCD4+ヘルパーT細胞へのペプチドの提示は、外来抗原に対する免疫応答に必要である(Roche and Furuta, 2015)。CD4+ T細胞は、活性化されたら、B細胞分化および抗体産生、ならびにCD8+ T細胞(CTL)応答を促進する。CD4+ T細胞はまた、他の免疫細胞を活性化し、その分化を誘導するサイトカインおよびケモカインも分泌する。HLAクラスII分子は、相互作用してHLAクラスIペプチド結合性溝よりも大きく開いたペプチド結合性溝を形成するα鎖とβ鎖のヘテロ二量体である(Unanue et al., 2016)。HLAクラスIIに結合したペプチド分子は、N末端側またはC末端側のいずれかに、溝から突出した隣接残基を伴う9-アミノ酸結合性コアを有すると考えられている(Jardetzky et al., 1996;Stern et al., 1994)。これらのペプチドは、通常、12~16アミノ酸の長さであり、多くの場合、結合レジスターのP1位、P4位、P6/7位およびP9位にアンカー残基を3~4個含有する(Rossjohn et al., 2015)。
HLA対立遺伝子は、共優性様式で発現される、つまり、両親から遺伝した対立遺伝子(バリアント)が同等に発現される。例えば、人は各々が、3つのクラスI遺伝子(HLA-A、HLA-BおよびHLA-C)の各々の対立遺伝子を2つ有し、したがって、6つの異なる型のHLAクラスIIを発現し得る。HLAクラスII遺伝子座では、人は各々がHLA-DP遺伝子の対(DPA1およびDPB1、α鎖およびβ鎖をコードする)、HLA-DQ(DQA1およびDQB1、α鎖およびβ鎖について)、1つの遺伝子HLA-DRα(DRA1)、および1つまたは複数の遺伝子HLA-DRβ(DRB1およびDRB3、DRB4またはDRB5)を受け継ぐ。例えば、HLA-DRB1は、ほぼ400種よりも多くの公知の対立遺伝子を有する。これは、1つのヘテロ接合性個体が6種または8種の機能性HLAクラスII対立遺伝子:各親から3種またはそれよりも多くを受け継ぎ得ることを意味する。したがって、HLA遺伝子は、高度に多型的である;多くの異なる対立遺伝子が異なる集団内の個体に存在する。HLAタンパク質をコードする遺伝子は、多くの可能性のあるバリエーションを有し、それにより、各人の免疫系が広範囲の外来インベーダーと反応することが可能になる。いくつかのHLA遺伝子は、数百の同定されたバージョン(対立遺伝子)を有し、その各々に特定の数字が与えられる。一部の実施形態では、HLAクラスI対立遺伝子は、HLA-A02:01、HLA-B14:02、HLA-A23:01、HLA-E01:01(非古典的)である。一部の実施形態では、HLAクラスII対立遺伝子は、HLA-DRB01:01、HLA-DRB01:02、HLA-DRB11:01、HLA-DRB15:01、およびHLA-DRB07:01である。
対象の対象特異的HLA対立遺伝子またはHLA遺伝子型は、当技術分野で公知の任意の方法によって決定することができる。例示的な実施形態では、HLA遺伝子型を、その全体が参照により本明細書に組み込まれる、2015年6月11日に公開されたW02015085147としての国際特許出願第PCT/US2014/068746号に記載の任意の方法によって決定する。簡単に述べると、方法は、多型遺伝子型を決定することを含み、これは、配列決定データセットから抽出されたリードの、多型遺伝子の対立遺伝子バリアントを含む遺伝子参照セットに対するアラインメントを生成するステップと、アラインメント内の各対立遺伝子バリアントについて第1の事後確率または事後確率由来スコアを決定するステップと、最大の第1の事後確率または事後確率由来スコアを有する対立遺伝子バリアントを第1の対立遺伝子バリアントとして同定するステップと、第1の対立遺伝子バリアントおよび1つまたは複数の他の対立遺伝子バリアントとアラインメントされる1つまたは複数の重複リードを同定するステップと、重み付け因子を使用して1つまたは複数の他の対立遺伝子バリアントについて第2の事後確率または事後確率由来スコアを決定するステップと、最大の第2の事後確率または事後確率由来スコアを有する対立遺伝子バリアントを選択することによって第2の対立遺伝子バリアントを同定するステップであって、第1の対立遺伝子バリアントおよび第2の対立遺伝子バリアントにより多型遺伝子の遺伝子型が定義される、ステップと、第1の対立遺伝子バリアントおよび第2の対立遺伝子バリアントの出力をもたらすステップとを含み得る。
一部の実施形態では、本明細書に記載のMHCクラスIIペプチド:抗原性ペプチド結合および提示予測方法は、個々のHLA対立遺伝子によってコードされるMHCクラスIIペプチドの大きなレパートリーから結合体を予測することができるものである。一部の実施形態では、MAPTAC技術を、質量分析により検証されたHLA適合ペプチドの大きなデータベースを用いて訓練する。一部の実施形態では、質量分析により検証されたHLA適合ペプチドの大きなデータベースは、1.2×10種よりも多くのそのようなHLA適合ペプチドを含む。一部の実施形態では、質量分析により検証されたHLA適合ペプチドの大きなデータベースは、MHCクラスIおよびクラスII対立遺伝子亜型の両方を含む150種よりも多くのHLA対立遺伝子を包含する。一部の実施形態では、データベースは、HLA-IおよびHLA-II(DR亜型)のUS集団の少なくとも95%を包含する。
本明細書に記載の通り、変異エピトープが誘導免疫応答において有効であること、および自発性腫瘍退縮または長期生存の場合が、変異エピトープに対するCD8+ T細胞応答と相関すること、および「免疫編集」を追跡して、マウスおよび人間における優性の変異抗原の発現を変更することができることのエビデンスが動物およびヒトの両方において数多く存在する。
配列決定技術により、各腫瘍が、遺伝子のタンパク質コード内容を変更する患者特異的変異を多数含有することが明らかになった。そのような変異により、単一のアミノ酸の変化(ミスセンス変異によって引き起こされる)から、フレームシフト、終結コドンのリードスルーまたはイントロン領域の翻訳(新規のオープンリーディングフレーム変異;neoORF)に起因した新規アミノ酸配列の長い領域の付加までにわたって変更されたタンパク質が創出される。これらの変異タンパク質は、ネイティブなタンパク質とは異なり、自己寛容の免疫を弱める効果を受けないので、腫瘍に対する宿主の免疫応答の有益な標的である。したがって、変異タンパク質は、患者の正常細胞と比較して、免疫原性である可能性がより高く、また、腫瘍細胞に対してより特異的である。本質的に、がん関連変異を含有する短いペプチド(8~24アミノ酸長)は、がん免疫治療の候補である。
一部の実施形態では、ペプチドに対する変異コールのために、予測方法を駆動するアルゴリズムをさらに利用することができる。一部の実施形態では、予測方法を、ペプチド内のドライバー変異の状態、および/またはRNA発現の状態、および/または切断予測を決定するために使用することができる。
「T細胞」という用語は、CD4+ T細胞およびCD8+ T細胞を含む。T細胞という用語はまた、Tヘルパー1型T細胞およびTヘルパー2型T細胞の両方を含む。T細胞は、本明細書で使用される場合、一般に、機能および細胞表面抗原(クラスター分類抗原、またはCD)によって分類され、T細胞はまた、抗原に対するT細胞受容体の結合を容易にし、2種の主要なクラス:ヘルパーT(TH)細胞および細胞傷害性Tリンパ球(CTL)に分類される。
成熟ヘルパーT(TH)細胞は、表面タンパク質CD4を発現し、CD4+ T細胞と称される。T細胞の発生後、成熟したナイーブなT細胞は胸腺を離れ、リンパ節を含めた体の中に拡散し始める。ナイーブT細胞は、それらが応答するようにプログラムされた抗原に曝露したことがないT細胞である。全てのT細胞と同様に、ナイーブT細胞は、T細胞受容体-CD3複合体を発現する。T細胞受容体(TCR)は、定常領域および可変領域の両方からなる。可変領域により、いずれの抗原にT細胞が応答しうるかが決定される。CD4+ T細胞は、MHCクラスIIに対する親和性を有するTCRを有し、タンパク質およびCD4が胸腺における成熟化の間のMHC親和性の決定に関与する。MHCクラスIIタンパク質は、一般に、特殊化された抗原提示細胞(APC)の表面にしか見いだされない。特殊化された抗原提示細胞(APC)は、主に、樹状細胞、マクロファージおよびB細胞であるが、樹状細胞は、MHCクラスIIを構成的に(いつでも)発現する唯一の細胞群である。濾胞樹状細胞などの一部のAPCの表面にはネイティブな(またはプロセスされていない)抗原も結合するが、プロセシングされていない抗原はT細胞と相互作用せず、T細胞の活性化に関与しない。HLAクラスIタンパク質に結合するペプチド抗原は、一般には、HLAクラスIIタンパク質に結合するペプチド抗原よりも短い。
細胞傷害性Tリンパ球(CTL)は、細胞傷害性T細胞、細胞溶解性T細胞、CD8+ T細胞、またはキラーT細胞としても公知であり、標的化された細胞においてアポトーシスを誘導するリンパ球を指す。CTLは、標的細胞と、TCRと標的細胞表面上のプロセシングされた抗原(Ag)の相互作用を介して抗原特異的コンジュゲートを形成し、その結果、標的化された細胞のアポトーシスがもたらされる。アポトーシス小体はマクロファージによって排除される。「CTL応答」という用語は、CTL細胞によって媒介される一次免疫応答を指すために使用される。細胞傷害性Tリンパ球は、それらの表面上にT細胞受容体(TCR)およびCD8分子の両方を有する。T細胞受容体は、HLAクラスIの分子と複合体を形成したペプチドを認識し、それに結合することができる。各細胞傷害性Tリンパ球は、特異的なMHC/ペプチド複合体に結合することができる独特のT細胞受容体を発現する。大多数の細胞傷害性T細胞は、特異的な抗原を認識することができるT細胞受容体(TCR)を発現する。TCRがHLAクラスI分子と結合するためには、HLAクラスI分子の定常部分に結合するCD8と称される糖タンパク質がTCRに付随していなければならない。したがって、これらのT細胞は、CD8+ T細胞と称される。CD8とMHC分子の親和性により、抗原特異的活性化の間、T細胞と標的細胞が密接に結合した状態に保たれる。CD8+ T細胞は、活性化されたらT細胞として認識される、一般に、免疫系内で所定の細胞傷害性役割を有するものと分類される。しかし、CD8+ T細胞はまた、いくつかのサイトカインを作り出す能力も有する。
「T細胞受容体(TCR)」は、抗原の提示に応答したT細胞の活性化に関与する細胞表面受容体である。TCRは、一般に、2つの鎖、アルファおよびベータで構成され、これらがアセンブルしてヘテロ二量体を形成し、CD3形質導入サブユニットと会合して、細胞表面に存在するT細胞受容体複合体を形成する。TCRの各アルファ鎖およびベータ鎖は、免疫グロブリン様N末端可変(V)領域および定常(C)領域、疎水性膜貫通ドメイン、および短い細胞質内領域からなる。免疫グロブリン分子に関しては、アルファ鎖およびベータ鎖の可変領域はV(D)J組換えによって生成され、T細胞の集団内で抗原特異性の大きな多様性が創出される。しかし、インタクトな抗原を認識する免疫グロブリンとは対照的に、T細胞は、MHC分子に付随するプロセシングされたペプチド断片によって活性化され、T細胞による抗原認識に対して、MHC拘束性として公知の余分の要素が導入される。T細胞受容体を通じたドナーとレシピエントの間のMHC不一致の認識により、T細胞の増殖およびGVHDの潜在的な発生が導かれる。TCRの正常な表面発現は、複合体の7つの構成成分の全ての調和した合成およびアセンブリに依存することが示されている(Ashwell and Klusner 1990)。TCRαまたはTCRβの不活化の結果、T細胞の表面からのTCRの消失がもたらされ得、それにより、アロ抗原の認識、したがってGVHDが防止される。しかし、TCR破壊の結果、一般に、CD3シグナル伝達構成成分の消失がもたらされ、さらなるT細胞増大の手段が変更される。
「HLAペプチドーム」という用語は、特定のHLAクラスと特異的に相互作用し、何千もの異なる配列を包含し得るペプチドのプールを指す。HLAペプチドームは、細胞において発現される正常なタンパク質および異常なタンパク質の両方に由来するペプチドの多様性を含む。したがって、HLAペプチドームを、がん特異的ペプチドを同定するため、腫瘍免疫治療薬の開発のため、ならびにがん細胞内のタンパク質合成および分解スキームに関する情報源として研究することができる。一部の実施形態では、HLAペプチドームは、可溶性HLAペプチド(sHLA)のプールである。一部の実施形態では、HLAペプチドームは、膜結合HLA(mHLA)のプールである。
「抗原提示細胞」または「APC」は、プロフェッショナル抗原提示細胞(例えば、Bリンパ球、マクロファージ、単球、樹状細胞、ランゲルハンス細胞)、ならびに他の抗原提示細胞(例えば、ケラチノサイト、内皮細胞、アストロサイト、線維芽細胞、オリゴデンドロサイト、胸腺上皮細胞、甲状腺上皮細胞、グリア細胞(脳)、膵ベータ細胞、および血管内皮細胞)を含む。「抗原提示細胞」または「APC」は、主要組織適合性遺伝子複合体(MHC)分子を発現し、MHCと複合体を形成した外来抗原をその表面上に提示することができる細胞である。
単一対立遺伝子HLA細胞株
単一のHLAクラスI対立遺伝子、HLAクラスII対立遺伝子の単一の対、または単一のHLAクラスI対立遺伝子およびHLAクラスII対立遺伝子の単一の対を発現する単一対立遺伝子細胞株を、適切な細胞集団に単一のHLA対立遺伝子をコードするポリ核酸、例えばベクターを形質導入またはトランスフェクトすることによって生成することができる(図2)。適切な細胞集団としては、例えば、単一のHLAクラスI対立遺伝子を外因的に発現するHLAクラスI欠損細胞株、HLAクラスII対立遺伝子の単一の外因性対を発現するHLAクラスII欠損細胞株、または単一のHLAクラスIおよび/またはクラスII対立遺伝子の単一の対を外因的に発現するクラスIおよびクラスII欠損細胞株が挙げられる。例示的な実施形態として、HLAクラスI欠損B細胞株は、B721.221である。しかし、HLAクラスIおよび/またはHLAクラスIIが欠損した他の細胞集団を生成することができることが当業者には明らかである。内因性HLAクラスIまたはHLAクラスII遺伝子を欠失させる/不活化するための典型的な方法としては、例えばTHP-1細胞におけるCRISPR-Cas9媒介性ゲノム編集が挙げられる。一部の実施形態では、細胞の集団は、マクロファージ、B細胞、および樹状細胞などのプロフェッショナル抗原提示細胞である。細胞は、B細胞または樹状細胞であり得る。一部の実施形態では、細胞は、腫瘍細胞または腫瘍細胞株に由来する細胞である。一部の実施形態では、細胞は、患者から単離されたものである。一部の実施形態では、細胞は、感染因子またはその一部を含有する。一部の実施形態では、細胞の集団は、少なくとも107個の細胞を含む。一部の実施形態では、細胞の集団を、例えば、少なくとも1つの遺伝子の発現および/または活性を増大させるまたは低減することによってさらに改変する。一部の実施形態では、遺伝子は、免疫プロテアソームのメンバーをコードする。免疫プロテアソームは、HLAクラスI結合性ペプチドのプロセシングに関与し、LMP2(β1i)、MECL-1(β2i)、およびLMP7(β5i)サブユニットを含むことが公知である。免疫プロテアソームはまた、インターフェロン-ガンマによって誘導することができる。したがって、一部の実施形態では、細胞の集団を、1つまたは複数のサイトカイン、増殖因子、または他のタンパク質と接触させることができる。細胞を、インターフェロン-ガンマ、IL-10、IL-6、および/またはTNF-αなどの炎症性サイトカインで刺激することができる。細胞の集団を、ストレス(熱ストレス、酸素欠乏、グルコース飢餓性、DNA損傷剤など)などの種々の環境条件に供することもできる。一部の実施形態では、細胞を、化学療法薬、放射線、標的化治療、または免疫治療のうちの1つまたは複数と接触させる。したがって、本明細書に開示される方法を使用して、HLAペプチドのプロセシングおよび提示に対する種々の遺伝子または条件の影響を試験することができる。一部の実施形態では、使用する条件を、HLA-ペプチドの集団を同定する患者の状態に適合するように選択する。
本開示の単一のHLA-対立遺伝子は、ウイルスに基づく系(例えば、アデノウイルス系、アデノ随伴ウイルス(AAV)ベクター、ポックスウイルス、またはレンチウイルス)を使用してコードし、発現させることができる。アデノ随伴ウイルスによる送達、アデノウイルスによる送達、およびレンチウイルスによる送達に使用することができるプラスミドは以前に記載されている(例えば、参照により本明細書に組み込まれる米国特許第6,955,808号および同第6,943,019号、および米国特許出願第20080254008号を参照されたい)。本開示の実施に使用することができるベクターの中で、細胞の宿主ゲノムへの組込みは、レトロウイルス遺伝子移入法を用いて可能であり、多くの場合、挿入された導入遺伝子の長期発現がもたらされる。例示的な実施形態では、レトロウイルスは、レンチウイルスである。さらに、多くの異なる細胞型および標的組織において高い形質導入効率が観察されている。レトロウイルスのトロピズムは、外来エンベロープタンパク質を組み入れ、標的細胞の潜在的な標的集団を増大させることによって変更することができる。レトロウイルスを工学的に操作して、レンチウイルスがある特定の細胞型のみに感染するように、挿入された導入遺伝子の条件付き発現を可能にすることができる。細胞型特異的プロモーターを使用して、特定の細胞型における発現を標的とすることができる。レンチウイルスベクターは、レトロウイルスベクターである(したがって、レンチウイルスベクターおよびレトロウイルスベクターのどちらも本開示の実施に使用することができる)。さらに、レンチウイルスベクターは、非分裂細胞に形質導入または感染することができ、また、一般には高いウイルス力価を生じる。
レトロウイルスによる遺伝子移入系の選択は、標的組織に依存し得る。レトロウイルスベクターは、最大6~10kbの外来配列をパッケージングする能力を有するシス作用性の長い末端リピートで構成される。最小のシス作用性LTRは、複製およびベクターのパッケージングに十分なものであり、したがって、恒久的な発現をもたらすために所望の核酸を標的細胞に組み込むために使用する。本開示の実施に使用することができる、広く使用されているレトロウイルスベクターとしては、マウス白血病ウイルス(MuLV)に基づくもの、テナガザル白血病ウイルス(GaLV)に基づくもの、サル免疫不全ウイルス(SIV)に基づくもの、ヒト免疫不全ウイルス(HIV)に基づくもの、およびこれらの組合せが挙げられる(例えば、Buchscher et al., (1992) J. Virol. 66: 2731-2739;Johann et al., (1992) J. Virol. 66: 1635-1640;Sommnerfelt et al., (1990) Virol. 176: 58-59;Wilson et al., (1998) J. Virol. 63: 2374-2378;Miller et al., (1991) J. Virol. 65: 2220-2224;PCT/US94/05700を参照されたい)。また、最小の非霊長類レンチウイルスベクター、例えば、ウマ伝染性貧血ウイルス(EIAV)に基づくレンチウイルスベクターが本開示の実施に有用である(例えば、Balagaan, (2006) J Gene Med; 8: 275-285, Published online 21 November 2005 in Wiley InterScience DOI: 10.1002/jgm.845を参照されたい)。ベクターは、標的遺伝子の発現を駆動するサイトメガロウイルス(CMV)プロモーターを有し得る。したがって、本開示は、本開示の実施に有用なベクターの中でも、レトロウイルスベクターおよびレンチウイルスベクターを含めたウイルスベクターを意図している。
任意のHLA対立遺伝子を細胞集団において発現させることができる。例示的な実施形態では、HLA対立遺伝子は、HLAクラスI対立遺伝子である。一部の実施形態では、HLAクラスI対立遺伝子は、HLA-A対立遺伝子またはHLA-B対立遺伝子である。一部の実施形態では、HLA対立遺伝子は、HLAクラスII対立遺伝子である。HLAクラスIおよびクラスII対立遺伝子の配列は、IPD-IMGT/HLAデータベースにおいて見いだすことができる。例示的なHLA対立遺伝子としては、これだけに限定されないが、HLA-A02:01、HLA-B14:02、HLA-A23:01、HLA-E01:01、HLA-DRB01:01、HLA-DRB01:02、HLA-DRB11:01、HLA-DRB15:01、およびHLA-DRB07:01が挙げられる。
一部の実施形態では、HLA対立遺伝子を、目的の遺伝子型に対応するように選択する。一部の実施形態では、HLA対立遺伝子は、変異HLA対立遺伝子であり、罹患患者において天然に存在しない対立遺伝子または天然に存在する対立遺伝子であり得る。本明細書に開示される方法には、種々の障害に関連するHLA対立遺伝子ならびに低頻度で存在する対立遺伝子に対するHLA結合性ペプチドの同定という別の利点がある。したがって、一部の実施形態では、本明細書で提供される方法により、HLA対立遺伝子を、それが集団内、例えばコーカサス人集団内で1%未満の頻度で存在する場合であっても同定することができる。
一部の実施形態では、HLA対立遺伝子をコードする核酸配列は、HLA-タンパク質を免疫精製するために使用することができる親和性アクセプタータグをさらに含む。適切なタグは当技術分野で周知である。一部の実施形態では、親和性アクセプタータグは、ポリ-ヒスチジンタグ、ポリ-ヒスチジン-グリシンタグ、ポリ-アルギニンタグ、ポリ-アスパラギン酸タグ、ポリ-システインタグ、ポリ-フェニルアラニン、c-mycタグ、単純ヘルペスウイルス糖タンパク質D(gD)タグ、FLAGタグ、KT3エピトープタグ、チューブリンエピトープタグ、T7遺伝子10タンパク質ペプチドタグ、ストレプトアビジンタグ、ストレプトアビジン結合性ペプチド(SPB)タグ、Strep-タグ、Strep-タグII、アルブミン結合性タンパク質(ABP)タグ、アルカリホスファターゼ(AP)タグ、ブルータングウイルスタグ(B-タグ)、カルモジュリン結合性ペプチド(CBP)タグ、クロラムフェニコール アセチルトランスフェラーゼ(CAT)タグ、コリン結合性ドメイン(CBD)タグ、キチン結合性ドメイン(CBD)タグ、セルロース結合性ドメイン(CBP)タグ、ジヒドロ葉酸レダクターゼ(DHFR)タグ、ガラクトース結合性タンパク質(GBP)タグ、マルトース結合性タンパク質(MBP)、グルタチオン-S-トランスフェラーゼ(GST)、Glu-Glu(EE)タグ、ヒトインフルエンザ赤血球凝集素(HA)タグ、西洋ワサビペルオキシダーゼ(HRP)タグ、NE-タグ、HSVタグ、ケトステロイドイソメラーゼ(KSI)タグ、KT3タグ、LacZタグ、ルシフェラーゼタグ、NusAタグ、PDZドメインタグ、AviTag、カルモジュリン-タグ、E-タグ、S-タグ、SBP-タグ、Softag1、Softag3、TCタグ、VSV-タグ、Xpressタグ、Isopeptag、SpyTag、SnoopTag、Profinity eXactタグ、プロテインCタグ、S1-タグ、S-タグ、ビオチン-カルボキシ担体タンパク質(BCCP)タグ、緑色蛍光タンパク質(GFP)タグ、小さなユビキチン様修飾因子(SUMO)タグ、タンデムアフィニティー精製(TAP)タグ、HaloTag、Nus-タグ、チオレドキシン-タグ、Fc-タグ、CYDタグ、HPCタグ、TrpEタグ、ユビキチンタグ、Vescular Stomatisウイルス糖タンパク質に由来するVSV-Gエピトープタグ、またはサルウイルス5(SV5)のパラミクソウイルスのPタンパク質およびVタンパク質において見いだされる小さなエピトープ(Pk)に由来するV5タグである。一部の実施形態では、親和性アクセプタータグは、「エピトープタグ」であり、これは、認識可能なエピトープ(抗体結合性部位)をHLA-タンパク質に付加して、対応する抗体への結合をもたらし、それにより、タグ付けされたタンパク質の同定またはアフィニティー精製を可能にする、ペプチドタグの一種である。エピトープタグの非限定的な例は、IgGに結合するプロテインAまたはプロテインGである。一部の実施形態では、親和性アクセプタータグとしては、ビオチンアクセプターペプチド(BAP)またはヒトインフルエンザ赤血球凝集素(HA)ペプチド配列が挙げられる。多数の他のタグ部分が当業者には公知であり、当業者が構想することができ、また、本明細書で意図されている。親和性アクセプターでタグ付けされたHLA-ペプチド複合体のエレメントとして発現させることができる限りは、任意のペプチドタグを使用することができる。
本明細書で提供される方法は、HLA構築物の親和性プルダウンをトランスフェクトまたは形質導入した細胞からHLA-ペプチド複合体を単離することを含む(図3)。一部の実施形態では、複合体を、市販の抗体を用い、当技術分野で公知の標準の免疫沈降技法を使用して単離することができる。細胞をまず溶解させることができる。HLAクラスI-ペプチド複合体は、W6/32抗体などのHLAクラスI特異的抗体を使用して単離することができ、一方、HLAクラスII-ペプチド複合体は、M5/114.15.2モノクローナル抗体などのHLAクラスII特異的抗体を使用して単離することができる。一部の実施形態では、単一の(またはその対)HLA対立遺伝子をペプチドタグとの融合タンパク質として発現させ、HLA-ペプチド複合体を、ペプチドタグを認識する結合性分子を使用して単離する。
方法は、前記HLA-ペプチド複合体からペプチドを単離し、ペプチドの配列決定を行うことをさらに含む。酸溶出などの当業者に公知の任意の方法によって複合体からペプチドを単離する。任意の配列決定方法を使用することができるが、一部の実施形態では、質量分析を使用する方法、例えば、液体クロマトグラフィー-質量分析(LC-MSまたはLC-MS/MS、またはその代わりにHPLC-MSまたはHPLC-MS/MS)などが利用される。これらの配列決定方法は当業者に周知であり、Medzihradszky KF and Chalkley RJ. Mass Spectrom Rev. 2015 Jan-Feb; 34 (1): 43-63に概説されている。
一部の実施形態では、細胞の集団は、1つまたは複数の内因性HLA対立遺伝子を発現する。一部の実施形態では、細胞の集団は、工学的に操作された1つまたは複数の内因性HLAクラスI対立遺伝子を欠く細胞の集団である。一部の実施形態では、細胞の集団は、工学的に操作された内因性HLAクラスI対立遺伝子を欠く細胞の集団である。一部の実施形態では、細胞の集団は、工学的に操作された1つまたは複数の内因性HLAクラスII対立遺伝子を欠く細胞の集団である。一部の実施形態では、細胞の集団は、工学的に操作された内因性HLAクラスII対立遺伝子を欠く細胞の集団または工学的に操作された内因性HLAクラスI対立遺伝子および内因性HLAクラスII対立遺伝子を欠く細胞の集団である。一部の実施形態では、細胞の集団は、例えば、蛍光活性化細胞選別(FACS)によって富化または選別された細胞を含む。一部の実施形態では、蛍光活性化細胞選別(FACS)を使用して、細胞の集団を選別する。一部の実施形態では、細胞の集団を、HLAクラスIまたはクラスIIのいずれかまたはHLAクラスIおよびクラスIIの両方の細胞表面発現について予めFACSにより選別する。例えば、FACSを使用して、細胞の集団をHLAクラスI対立遺伝子、HLAクラスII対立遺伝子、またはこれらの組合せの細胞表面発現について選別することができる。
個別化がんワクチンを調製するための方法
がん特異的変異、したがって、同じヒト対象のがん細胞にはDNAに変異が存在するが正常細胞にはその変異が存在しないこと、および変異によりDNAによってコードされるタンパク質の1つまたは複数のアミノ酸の変化が導かれることが同定されたら、その変異を宿主免疫応答の標的とすることができる。天然の免疫応答を変異タンパク質に方向付けることができ、それにより、そのタンパク質を発現するがん細胞の破壊を導くことができる。がん性組織における天然の寛容性応答および免疫無防備状態の環境に起因して、免疫治療は、そのような免疫応答を強化して、体の寛容性および免疫抑制効果を無効にすることを試みる臨床経路である。したがって、上記の変異を含むタンパク質またはペプチドは免疫治療の適切な候補である。
変異タンパク質は、抗原提示細胞(APC)として作用するプロフェッショナル食細胞によって摂取され、細かく切られ、T細胞活性化のための抗原として主要組織適合性遺伝子複合体(MHC)タンパク質を含む抗原提示複合体として細胞表面上にディスプレイされる。ヒトMHCタンパク質は、ヒト白血球抗原、HLAと称される。MHCタンパク質は、MHC-クラスIまたはクラスIIタンパク質であり得、いくつかの機能的な違いはクラスIまたはクラスII MHCタンパク質(HLAクラスIおよびHLAクラスIIタンパク質)のいずれかによるペプチドの提示に起因するが、顕著な違いの1つは、HLAクラスI-ペプチド複合体は細胞傷害性CD8+ T細胞に対して抗原を提示し、一方、HLAクラスIIペプチド複合体もCD4+ T細胞を活性化し持続的な免疫応答を導くことができるという事実にある。CD8+ T細胞は、感染細胞または腫瘍細胞などの疾患細胞の細胞毎の消失という課題に不可欠である。CD4+ T細胞は、活性化されるとより持続的な効果を有し、最も重要なのは免疫記憶の生成である。CD4サブセットは、免疫学的脅威の型に応じて示差的に動員され、重複するまたは異なる機能を有する多数のサブセットが共動員され得る。これは、病原性脅威に対する免疫学的応答の平衡を保つのに役立つ。これらに関して、HLAクラスIIペプチド媒介性抗原提示により、持続的な調整された免疫応答がもたらされる。他方では、ペプチドへのHLAクラスIIの結合はプロミスキャスであり得、したがって、非特異的なペプチド結合および免疫系への提示により、自己免疫などの異所性免疫応答が導かれる。
一態様では、本開示は、ペプチドのHLAクラスIIタンパク質(アルファ鎖とベータ鎖のヘテロ二量体で構成される)への高忠実度の結合により、特定のペプチドがTリンパ球に提示され、それにより、特異的な免疫応答が引き出され、あらゆる交差反応性または無差別免疫が回避されることが確実になるような、特定のHLAクラスIIアルファ鎖およびベータ鎖ヘテロ二量体と正確に対形成または結合し得るペプチドを予測するための方法を提供する。
一態様では、本開示は、特定の同類HLAクラスIIタンパク質を発現する対象にペプチドを治療的に投与した場合に、CD4+ T細胞を活性化し、免疫記憶を刺激するHLAクラスIIタンパク質の能力により、ペプチドを用いてより持続的かつ頑強な免疫応答を活性化することができるような、特定のHLAクラスIIタンパク質に正確に結合し得るペプチドを予測するための方法を提供する。一部の実施形態では、HLAクラスIIタンパク質に高い特異性で結合することが予測される所与のペプチドは、変異を含むペプチドであり、変異は、対象のがんまたは腫瘍細胞において蔓延しているものである;一方、変異ペプチドに結合することが予測される同じHLAクラスIIタンパク質は、対応する変異していない野生型ペプチドに(a)結合しないか、または(b)対象の変異ペプチドとの結合に対する親和性と比較して別個に低親和性で結合する。HLAの変異ペプチドに対する優先的な結合は、野生型ペプチドを発現する細胞は、HLAにより提示されたペプチドに対して反応性のT細胞による免疫攻撃から容赦されるので、免疫治療薬の開発に有利である。一部の実施形態では、HLAクラスIIタンパク質に特異的に結合することが予測されるペプチドは、翻訳後修飾を有するペプチドである。例示的な翻訳後修飾としては、これだけに限定されないが、リン酸化、ユビキチン化、脱リン酸化、グリコシル化、メチル化、またはアセチル化が挙げられる。一部の実施形態では、予測されるペプチドを、免疫治療に使用する前に翻訳後修飾に供する。
一部の実施形態では、本明細書に開示される免疫治療法および戦略は、自己免疫反応におけるものなどの望ましくない免疫活性化の抑制にも適用可能であり得る。具体的には、特定のHLA亜型に対する潜在的な結合体として同定されたペプチドを、特定のHLA分子に結合し、免疫原性応答を引き起こすのではなく、寛容性を誘導するように調整することができる。
一態様では、特定の対象に対して調整または個別化された免疫治療の方法が本明細書で提示される。あらゆる対象または患者がHLAクラスIおよびHLAクラスIIタンパク質の特定のアレイを発現する。HLAタイピングは、対象によって発現されるHLAタンパク質の特定のレパートリーを決定することを可能にする周知の技法である。特定の対象によって発現されるHLAヘテロ二量体が分かったら、特定のHLAクラスIIアルファ鎖およびベータ鎖ヘテロ二量体に高忠実度で結合することができるペプチドを予測するための、本明細書に記載の、改善され洗練された信頼できる方法により、対象に対して特異的に調整された特異的な免疫応答を生じさせることができることを確実にする。
HLAヘテロ二量体をコードする遺伝子は高度に多型的であり、ヒト集団にわたって4,000種よりも多くのHLAクラスII対立遺伝子バリアントが同定されている。母系および父系HLAハプロタイプから、個体は、HLAクラスII遺伝子座の各々について異なる対立遺伝子を受け継ぐことができ、各HLAクラスIIヘテロ二量体はα鎖およびβ鎖で構成される。特にHLA-DPおよびHLA-DQ対立遺伝子について、多数のαおよびβ鎖対形成の組合せに起因して、可能性のあるHLAヘテロ二量体の集団は高度に複雑である。HLAクラスIIヘテロ二量体は、小胞体(ER)に変換され、タンパク質CD74に由来するインバリアント鎖(Ii)と共にアセンブリされて安定な複合体になる。Iiにより、適当なタンパク質フォールディングが可能になることによってクラスII複合体が安定化され、また、HLAクラスIIヘテロ二量体のエンドソーム/リソソーム区画への移出が可能になる。これらのHLAクラスIIローディング区画内で、Iiはカテプシンによってタンパク質分解により切断されてCLIPと称されるプレースホルダーペプチドになる。次いで、低pH環境において、非古典的HLAクラスIIヘテロ二量体であるシャペロンHLA-DMによってCLIPがより親和性が高いペプチドに交換される。次いで、高親和性ペプチドがローディングされたHLAクラスII複合体がトランス-ゴルジに向かい、最終的にCD4+ T細胞に対するディスプレイのために細胞表面に向かう。
各HLAヘテロ二量体は、対立遺伝子特異的結合優先性を有する何千ものペプチドと結合すると推定される。実際、各HLA対立遺伝子は、約1,000~10,000種の独特のペプチドと結合し、それらをT細胞に提示すると推定される。そのようなHLA結合の多様性を考慮すると、ペプチドが特定のHLA対立遺伝子に結合する可能性があるかどうかの正確な予測は非常に困難である。α鎖とβ鎖の対形成の不均一性、コア結合性エピトープを確信的に割り当てる能力を限定するデータの複雑さ、および高分解能生化学的分析に必要な免疫沈降グレードの対立遺伝子特異的抗体の欠如に起因して、HLAクラスII分子の対立遺伝子特異的ペプチド結合性特徴に関してはほとんど分かっていない。さらに、所与のHLA対立遺伝子に由来するペプチドエピトープの分析では、多数のHLA対立遺伝子が細胞表面に提示される場合に不明確性が生じる。
候補新抗原の予測は、主にHLAクラスIエピトープについて行われる(クラスI予測アルゴリズムについての実験データが、クラスIIと比べて利用可能なので)が、前臨床的および臨床的個別化新抗原ワクチン接種試験のどちらにおいても、多くの場合、CD4+ T細胞応答が観察される。これらの知見から、HLAクラスIIエピトーププロセシングおよび提示もがん処置において極めて重要な役割を果たし得ることが実証される。HLAクラスII予測アルゴリズムは存在するが、HLAクラスIIヘテロ二量体のオープンエンドのペプチド結合性溝により、より長いペプチド(一般に、15~40アミノ酸)が結合することが可能になり、それにより、エピトープ提示の不均一性および複雑さが増大することが原因で、不正確である。したがって、HLAクラスIIペプチド結合性コアおよびクラスIIエピトーププロセシングおよび提示に関与する細胞プロセス特徴をよりよく理解するためのさらなる研究が必要とされている。プロテオミクス分野は、現在、HLAクラスIIヘテロ二量体形成の複雑さおよびHLAクラスII-ペプチド複合体を単離するための免疫沈降グレードの抗体の利用可能性により限定されている。これらの難題を克服するために、クラスIIエピトープ予測方法のための対立遺伝子特異的HLAクラスII-リガンドームの特徴付けに関してLC-MS/MSに依拠する単一対立遺伝子HLAプロファイリングワークフローを開発した。以下の定義は、当業者への補足であり、本出願を対象とし、いかなる関連するまたは関連しない場合、例えば、いかなる共同所有の特許または出願にも帰するものではない。本明細書に記載の方法および材料と類似した、またはそれと等しい任意の方法および材料を本開示を試験するための実施に使用することができるが、例示的な材料および方法が本明細書に記載されている。したがって、本明細書において使用される用語法は、特定の実施形態を説明するためだけのものであり、限定的なものではない。
個別化がんワクチンを調製する方法が本明細書に開示される。個別化がんワクチンを調製するための方法は、対象のがん細胞において発現される変異を用いてペプチド配列を同定するステップと、同定されたペプチド配列についての提示予測のセットを生成するために、コンピュータプロセッサを使用して同定されたペプチド配列のアミノ酸位置情報を機械学習HLA-ペプチド提示予測モデルに入力するステップであって、各提示予測が、対象のがん細胞のクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質が同定されたペプチド配列のうちの所与の配列を提示する確率を表す、ステップと、個別化がんワクチンを調製するために、提示予測のセットに基づいて同定されたペプチド配列のサブセットを選択するステップとを含み得る。
一部の実施形態では、本明細書に記載の方法で得られた1つまたは複数の結果は、定量的な値または以下の1つまたは複数を示す値をもたらすものである:診断の正確度の可能性、対象における状態の存在の可能性、対象に状態が発生している可能性、特定の処置の成功の可能性、またはこれらの任意の組合せ。一部の実施形態では、本明細書に記載の方法により、状態が発生するリスクまたは可能性を予測することができる。一部の実施形態では、本明細書に記載の方法は、状態の発生に関する早期診断指標であり得る。一部の実施形態では、本明細書に記載の方法により、状態の診断または存在を確認することができる。一部の実施形態では、本明細書に記載の方法により、状態の増悪をモニタリングすることができる。一部の実施形態では、本明細書に記載の方法により、対象における状態に対する処置の有効性をモニタリングすることができる。
MHC-IIペプチドを同定するための方法
一態様では、免疫活性化のために、MHC-IIタンパク質によって提示される1つまたは複数のペプチドを同定する方法が本明細書で提示される。一部の実施形態では、1つまたは複数のペプチドは、エピトープを含む。一部の実施形態では、方法は、特異的なエピトープがMHC-IIタンパク質によって提示される可能性のコンピュータによる予測を伴う。一部の実施形態では、方法は、MHC-II提示に対するエピトープの特異性のコンピュータによる予測を伴う。一部の実施形態では、コンピュータによる予測方法は、ペプチド-MHC相互作用の評価を伴う。一部の実施形態では、コンピュータによる予測方法は、抗原提示に対するペプチドの対立遺伝子特異性の予測を伴う。一部の実施形態では、コンピュータによる予測方法は、バイオインフォマティクス情報、例えば、ヌクレオチド配列、生体分子の構造モチーフ、タンパク質間相互作用の特色および免疫原性などの機能的力価の組込みを伴う。一部の実施形態では、コンピュータによる予測方法は、機械学習を伴う。MHCクラスIおよびクラスIIの両方について、単純パターンモチーフ、サポートベクターマシン(SVM)、隠れマルコフモデル(HMM)、ニューラルネットワーク(NN)モデル、定量的構造と活性の関連性(QSAR)分析、構造に基づく方法、および生物物理学的方法などの機械学習手法に基づいてペプチド-MHC相互作用を予測するためのイムノインフォマティクス方法が多数開発されている。これらの方法は、2つのカテゴリー、すなわち、対立遺伝子内(対立遺伝子特異的)方法およびトランス-対立遺伝子(汎特異的)方法に分けることができる。対立遺伝子内方法は、実験的なペプチド結合性データの限定されたセットに対して特定のMHC分子についての訓練を行い、ペプチド結合性の予測をその分子に適用する。MHC分子が極度に多型的であり、何千もの対立遺伝子バリアントが存在することから、十分な実験的な結合データが欠如していることと相まって、各対立遺伝子に対して予測モデルを築くことは不可能である。したがって、多くの対立遺伝子または種間にわたって拡大するペプチド結合性データを使用して、トランス-対立遺伝子および汎用方法、例えば、NetMHCIIpan(Karosiene E etal., NetMHCIIpan-3.0, a common pan-specific MHC class II prediction method including all three human MHC class II isotypes, HLA-DR, HLA-DP and HLADQ. Immunogenetics (2013) 65(10):711-24)、およびTEPITOPEpan(Zhang L、et al., TEPITOPEpan: extending TEPITOPE for peptide binding prediction covering over 700 HLA-DR molecules. PLoS One (2012) 7(2):e30483)などが開発されている。NetMHCpanおよびKISSなどの、MHC-Iに対する同様の方法も利用可能である。
一部の実施形態では、ペプチド配列は、対象の正常細胞では発現されないものであり得る。一部の実施形態では、対象のありとあらゆる細胞ががん細胞ではない場合がある。がん細胞は、これだけに限定されないが、甲状腺がん、副腎皮質性がん、肛門がん、再生不良性貧血、胆管がん、膀胱がん(bladder cancer)、骨がん、骨転移、中枢神経系(CNS)がん、末梢神経系(PNS)がん、乳がん、キャッスルマン病、子宮頸がん、小児期非ホジキンリンパ腫、リンパ腫、結腸がん・直腸がん、子宮体がん、食道がん(esophagus cancer)、ユーイングファミリーの腫瘍(例えば、ユーイング肉腫)、眼がん、胆嚢がん(gallbladder cancer)、消化管カルチノイド腫瘍、消化管間質腫瘍、妊娠性絨毛疾患、ヘアリー細胞白血病、ホジキン病、カポジ肉腫、腎がん(kidney cancer)、喉頭・下咽頭がん、急性リンパ性白血病、急性骨髄性白血病、小児白血病、慢性リンパ性白血病、慢性骨髄性白血病、肝がん、肺がん、肺カルチノイド腫瘍、非ホジキンリンパ腫、男性乳がん、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細胞腫、口腔・中咽頭がん、骨肉腫、卵巣がん、膵がん、陰茎がん、下垂体腫瘍、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫(成人軟部組織がん)、黒色腫皮膚がん、非黒色腫皮膚がん、胃がん、精巣がん、胸腺がん、子宮がん(例えば、子宮肉腫)、膣がん、外陰がん、またはワルデンストレームマクログロブリン血症を含めた異なるがんによって産生されたものであり得る。
同定するステップは、対象のがん細胞由来のDNA、RNAまたはタンパク質配列を対象の正常細胞由来のDNA、RNAまたはタンパク質配列と比較することを含み得る。対象のがん細胞由来のDNA、RNAまたはタンパク質配列は、対象の正常細胞由来のDNA、RNAまたはタンパク質配列とは異なり得る。同定するステップにより、感受性が高い核酸バリアントを同定することができる。
機械学習HLA-ペプチド提示予測モデルは、少なくとも訓練用データに基づいて同定された複数の予測変数を含み得る。訓練用データは、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;アミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含み得る。
一部の実施形態では、訓練用データは、構造化されたデータ、時系列データ、構造化されていないデータ、およびリレーショナルデータをさらに含み得る。構造化されていないデータは、ロボット工学またはシミュレーションの正確なシミュレートまたは訓練における使用のための、音声データ、画像データ、ビデオ、機械的データ、電気的データ、化学的データ、およびこれらの任意の組合せを含み得る。時系列データは、スマートメーター、スマート電化製品、スマートデバイス、モニタリングシステム、遠隔測定デバイス、またはセンサーのうちの1つまたは複数からのデータを含み得る。リレーショナルデータは、顧客システム、企業システム、運用システム、ウェブサイト、ウェブアクセス可能なアプリケーションプログラムインターフェース(API)、またはこれらの任意の組合せからのデータを含む。これは、ユーザーが、ファイルまたは他のデータフォーマットをソフトウェアまたはシステムに入力する任意の方法によって行うことができる。
一部の実施形態では、訓練用データはデータベースに保存することができる。データベースは、コンピュータ可読フォーマットで保存することができる。コンピュータプロセッサを、コンピュータ可読メモリに保存されたデータにアクセスするように構成することができる。一部の実施形態では、結果を得るために、コンピュータシステムを使用してデータを解析することができる。結果を遠隔操作でまたは内部で記憶媒体に保存することができ、薬物適用専門家などの人員と通信することができる。一部の実施形態では、コンピュータシステムを、結果を伝達するための構成要素と作動可能にカップリングすることができる。伝達用の構成要素は、有線および無線構成要素を含み得る。有線伝達構成要素の例としては、Universal Serial Bus(USB)接続、同軸ケーブル接続、Cat5またはCat6ケーブルなどのイーサネット(登録商標)ケーブル、光ファイバーケーブル、または電話線を挙げることができる。無線通信構成要素の例としては、Wi-Fiレシーバー、3Gもしくは4G LTEデータシグナルなどの、移動データ標準にアクセスするための構成要素、またはBluetooth(登録商標)レシーバーを挙げることができる。一部の実施形態では、記憶媒体内のこれらのデータの全てを収集し、アーカイブに入れて、データウェアハウスを築く。
一部の実施形態では、データベースは、外部データベースを含む。外部データベースは、医学的データベース、例えば、これだけに限定されないが、Adverse Drug Effects Database、AHFS Supplemental File、Allergen Picklist File、Average WAC Pricing File、Brand Probability File、Canadian Drug File v2、Comprehensive Price History、Controlled Substances File、Drug Allergy Cross-Reference File、Drug Application File、Drug Dosing & Administration Database、Drug Image Database v2.0/Drug Imprint Database v2.0、Drug Inactive Date File、Drug Indications Database、Drug Lab Conflict Database、Drug Therapy Monitoring System(DTMS)v2.2 / DTMS Consumer Monographs、Duplicate Therapy Database、Federal Government Pricing File、Healthcare Common Procedure Coding System Codes(HCPCS)Database、ICD-10 Mapping Files、Immunization Cross-Reference File、Integrated A to Z Drug Facts Module、Integrated Patient Education、Master Parameters Database、Medi-Span Electronic Drug File(MED-File)v2、Medicaid Rebate File,Medicare Plans File、Medical Condition Picklist File,Medical Conditions Master Database、Medication Order Management Database(MOMD)、Parameters to Monitor Database、Patient Safety Programs File、Payment Allowance Limit-Part B(PAL-B)v2.0、Precautions Database、RxNorm Cross-Reference File、Standard Drug Identifiers Database,Substitution Groups File、Supplemental Names File、Uniform System of Classification Cross-Reference File、またはWarning Label Databaseであり得る。
一部の実施形態では、訓練用データを、他のデータ供給源を通じて得ることもできる。データ供給源は、センサーまたはスマートデバイス、例えば、電化製品、スマートメーター、ウェアラブル、モニタリングシステム、データストア、顧客システム、課金システム、財務システム、クラウドソースデータ、気象データ、ソーシャルネットワーク、または任意の他のセンサー、企業システムまたはデータストアなどを含み得る。スマートメーターまたはセンサーの例としては、顧客サイトに位置するメーターもしくはセンサー、または顧客と、生成もしくは供給源場所の間に位置するメーターもしくはセンサーを挙げることができる。広範な供給源のアレイからのデータを組み入れることにより、システムを、複雑かつ詳細な解析を実施できるものにすることができる。一部の実施形態では、データ供給源は、限定することなく他の医学的プラットフォームのためのセンサーまたはデータベースを含み得る。
HLAタイピングは、抗体を使用した血清学的方法、または、配列特異的オリゴヌクレオチドプローブハイブリダイゼーション(Sequence Specific Oligonucleotide Probe Hybridization)(SSOP)、もしくは配列に基づくタイピング(Sequence Based Typing)(SBT)などのPCRに基づく方法のいずれかによって慣習的に行われる。前者は潜在的に高度な交差反応性および限定された分解能によって妨害され、一方、後者では、多型位置が原因でプライマー位置決めの可能性が非常に限られることに起因する、PCRの効率に関連する困難が生じる。
一部の実施形態では、配列情報を、配列決定方法または質量分析を使用する方法、例えば、液体クロマトグラフィー-質量分析(LC-MSまたはLC-MS/MS、またはその代わりにHPLC-MSまたはHPLC-MS/MS)などのいずれかによって同定する。これらの配列決定方法は当業者には周知であり得、また、Medzihradszky KF and Chalkley RJ. Mass Spectrom Rev. 2015 Jan-Feb; 34 (1): 43-63に概説されている。一部の実施形態では、質量分析は、単一対立遺伝子質量分析である。一部の実施形態では、質量分析は、MS分析、MS/MS分析、LC-MS/MS分析、またはこれらの組合せであり得る。一部の実施形態では、MS分析を使用して、インタクトなペプチドの質量を決定することができる。例えば、決定することは、インタクトなペプチドの質量を決定すること(例えば、MS分析)を含み得る。一部の実施形態では、MS/MS分析を使用して、ペプチド断片の質量を決定することができる。例えば、決定することは、ペプチド断片の質量を決定することを含み得、それを使用して、ペプチドまたはその一部のアミノ酸配列を決定することができる(例えば、MS/MS分析)。一部の実施形態では、ペプチド断片の質量を使用して、ペプチド内のアミノ酸の配列を決定することができる。一部の実施形態では、LC-MS/MS分析を使用して、複雑なペプチド混合物を分離することができる。例えば、決定することは、液体クロマトグラフィーによってなどで複雑なペプチド混合物を分離すること、およびインタクトなペプチドの質量、ペプチド断片の質量、またはこれらの組合せを決定することを含み得る(例えば、LC-MS/MS分析)。このデータを、例えばペプチド配列決定のために使用することができる。
一部の実施形態では、訓練用ペプチド配列情報は、訓練用ペプチドのアミノ酸位置情報を含む。一部の実施形態では、訓練用ペプチド配列情報は、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報の最大で約90%、80%、70%、60%、50%、40%、30%、20%、10%またはそれ未満を含む。一部の実施形態では、訓練用ペプチド配列情報は、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%またはそれよりも多くを含み得る。
任意の情報およびデータを、情報およびデータの供給源である対象と対にすることができる。対象または医療専門家は、ストレージまたはサーバーから情報およびデータを対象のアイデンティティーによって検索することができる。対象のアイデンティティーは、患者の写真、名前、住所、社会保障番号、誕生日、電話番号、郵便番号、またはこれらの任意の組合せを含み得る。対象のアイデンティティーは、暗号化し、視覚的な図式コードに符号化することができる。視覚的な図式コードは、対象のアイデンティティーに一意的に関連付けることができるワンタイムバーコードであり得る。バーコードは、UPCバーコード、EANバーコード、Code 39バーコード、Code 128バーコード、ITFバーコード、CodaBarバーコード、GS1 DataBarバーコード、MSI Plesseyバーコード、QRバーコード、Datamatrixコード、PDF417コード、またはAztecバーコードであり得る。視覚的な図式コードは、表示画面上に表示されるように構成することができる。バーコードは、機械によって光学的に捕捉し、読み取ることができるQRを含み得る。バーコードにより、バージョン、フォーマット、位置、アラインメント、またはバーコードの読み取りおよび復号が可能になるバーコードのタイミングなどの要素を規定することができる。バーコードは、種々の型の情報をバイナリまたは英数字情報などの任意の型の適切なフォーマットでコードし得る。QRコード(登録商標)は、QRコード(登録商標)を画像処理デバイスによって合理的な距離からスキャンすることができる限りは種々のシンボルサイズを有し得る。QRコード(登録商標)は、任意の画像ファイルフォーマットのものであり得る(例えば、EPSまたはSVGベクトルグラフ、PNG、TIF、GIF、またはJPEGラスターグラフィックスフォーマット)。
一部の実施形態では、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数は、線形関数または非線形関数を含む。関数は、例えば、正規化線形ユニット(ReLU)活性化関数、Leaky ReLu活性化関数、または、飽和双曲線正接関数、同一性関数、バイナリステップ関数、ロジスティック関数、arcTan関数、ソフトサイン関数、パラメトリック正規化線形ユニット関数、指数関数線形ユニット関数、softPlus関数、ベントアイデンティティ(bent identity)関数、softExponential関数、Sinusoid関数、Sinc関数、Gaussian関数、またはシグモイド関数などの他の関数、またはこれらの任意の組合せであり得る。
一部の実施形態では、線形関数を線形回帰によって得る。一部の実施形態では、線形回帰は、従属変数と独立変数の間の最良の直線関係を当てはめることによって標的変数を予測するための方法である。最良当てはめは、各点における形状と実際の観察値の間の距離の全ての合計が最小であることを意味する。線形回帰は、単純線形回帰または多重線形回帰を含み得る。単純線形回帰では、単一の独立変数を使用して従属変数を予測することができる。多重線形回帰では、1つよりも多くの独立変数を使用して、最良の直線関係を当てはめることによって、従属変数を予測することができる。非線形関数は非線形回帰によって得ることができる。非線形回帰は、観察に基づくデータが、モデルパラメータの非線形組合せであり、1つまたは複数の独立変数に依存する関数によってモデル化される、回帰分析の一形態であり得る。非線形回帰は、ステップ関数、区分的関数、スプライン、および一般加法モデルを含み得る。
一部の実施形態では、提示可能性は、一次元の値(例えば、確率)によって示される。一部の実施形態では、確率は、事象が起こり得る可能性が測定されるように構成される。一部の実施形態では、確率は、約0からおよび1まで、0.1~0.9、0.2~0.8、0.3~0.7、または0.4~0.6にわたる。確率が高い事象ほど、その事象が起こり得る可能性が大きい。一部の実施形態では、事象は、非限定的な例として、HLA-ペプチドがある特定のアミノ酸位置情報を有するいくつかのペプチドを提示するかどうか、および人がアミノ酸位置情報に基づいて病気にかかるかどうかを含めた、任意の型の状況を含む。一部の実施形態では、可能性は、多次元の値で示すことができる。多次元の値は、多次元空間、ヒートマップ、またはスプレッドシートによって示すことができる。
一実施形態では、提示予測のセットに基づいて同定されたペプチド配列のサブセットの選択を、個別化がんワクチンが調製されるように構成する。一部の実施形態では、サブセットは、提示予測のセットに基づいて同定された、最大で約90%、80%、70%、60%、50%、40%、30%、20%、10%またはそれ未満のペプチド配列を含む。他の場合では、サブセットは、提示予測のセットに基づいて同定された、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%またはそれよりも多くのペプチド配列を含み得る。がんワクチンは、既存のがんを処置するか、またはがんの発生を防止するワクチンであり得る。ワクチンは、患者から取得した試料から調製することができ、その患者に対して特定のものであり得る。
一部の実施形態では、ポックスウイルスを疾患(例えば、がん)ワクチンまたは免疫原性組成物に使用する。これらとしては、オルソポックスウイルス、アビポックス、ワクシニア、MVA、NYVAC、カナリアポックス、ALVAC、鶏痘、TROVACなどが挙げられる。ベクターの利点としては、構築が簡単であること、大量の外来DNAを適応させることができること、および発現レベルが高いことを挙げることができる。Chordopoxvirinaeサブファミリーポックスウイルス(脊椎動物のポックスウイルス)、例えば、とりわけ、オルソポックスウイルスおよびアビポックスウイルス、例えば、ワクシニアウイルス(例えば、Wyeth株、WR株(例えば、ATCC(登録商標)VR-1354)、Copenhagen株、NYVAC、NYVAC.1、NYVAC.2、MVA、MVA-BN)、カナリアポックスウイルス(例えば、Wheatley C93株、ALVAC)、鶏痘ウイルス(例えば、FP9株、Webster株、TROVAC)、鳩痘、鳩痘、ウズラ痘、およびアライグマ痘、それらの合成のまたは天然に存在しない組換えなどの、本開示の実施に使用することができるポックスウイルス、その使用、ならびにそのような組換えの作出および使用方法に関する情報は、科学文献および特許文献に見いだすことができる。
一部の実施形態では、ワクシニアウイルスを、抗原を発現させるために疾患ワクチンまたは免疫原性組成物に使用する。組換えワクシニアウイルスは、感染した宿主細胞の細胞質内で複製することができるものであり得、したがって、目的のポリペプチドにより免疫応答を誘導することができる。
一部の実施形態では、ALVACを疾患ワクチンまたは免疫原性組成物にベクターとして使用する。ALVACは、外来導入遺伝子を発現するように改変することができ、原核生物抗原および真核生物抗原の両方のワクチン接種の方法として使用されてきた、カナリアポックスウイルスであり得る。
一部の実施形態では、改変ワクシニアアンカラ(Modified Vaccinia Ankara)(MVA)ウイルスを抗原ワクチンまたは免疫原性組成物のためのウイルスベクターとして使用する。MVAは、オルソポックスウイルスファミリーのメンバーであり得、ワクシニアウイルス(CVA)のAnkara株のニワトリ胚線維芽細胞に対する約570回の段階的継代によって生成された。これらの継代の結果として、得られたMVAウイルスは、CVAと比較して31キロベース少ないゲノム情報を含み得、また、高度に宿主細胞により制限される。MVAは、極度の弱毒化、すなわち、毒力または感染能の減弱を特徴とし得るが、それでもなお優れた免疫原性を保持する。種々の動物モデルにおいて試験した場合、MVAは、免疫抑制された個体においてさえ、弱毒性であることが証明され得る。さらに、MVA-BN(登録商標)-HER2は、HER-2陽性乳がんの処置のために設計された免疫治療の候補になり得、現在臨床試験中である。
一部の実施形態では、陽性適中率(PPV)を予測モデルの一部として使用する。PPVは、精度測定値としても公知であり、例えば検査またはモデルによって疾患または状態を有すると診断された個体が実際にその疾患または状態を有する確率である。PPVは、真陽性結果の数を陽性が返された結果の総数(偽陽性を含む結果)で割ることによって算出することができる。PPV=真陽性/(真陽性+偽陽性)。例えば、患者100名のセットにおいて、モデルにより50名の患者で陽性結果が同定され、そのうちの25名が真陽性であった場合、PPVは、25/50=0.5になる。PPVが1に近いことにより、検査またはモデルなどの診断方法がより正確であることが表される。PPVを使用して、予測モデルの正確度を決定することができる。PPVを使用して、モデルによって生成される可能性がある偽陽性の結果に適応するように予測モデルを調整することができる。
再現率を予測モデルの一部として使用することができる。再現率は、試料セットにおける陽性の総数のうちの真陽性結果のパーセンテージとみなすことができる。再現率=真陽性/(真陽性+偽陰性)。例えば、患者100名のセットにおいて、モデルにより50名の患者で陽性結果が同定され、そのうちの25名が真陽性であり、患者のセットにおいて合計75名の陽性が存在した場合、再現率は、{25/(25+25)}×100=50%になる。再現率を使用して、予測モデルの正確度を決定することができる。再現率を使用して、予測モデルを、モデルによって生成される可能性がある偽陽性の結果または偽陰性の結果に適応するように調整することができる。
一部の実施形態では、予測モデルの陽性適中率は、0.1%~10%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれよりも高いものである。一部の実施形態では、予測モデルの陽性適中率は、0.1%~10%の再現率で、最大で0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2、0.1またはそれ未満であり得る。予測モデルの陽性適中率は、0.1%未満の再現率で、少なくとも0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれよりも高いものであり得る。一部の実施形態では、予測モデルの陽性適中率は、0.1%未満の再現率で、最大で0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2、0.1またはそれ未満であり得る。予測モデルの陽性適中率は、10%よりも高い再現率で、少なくとも0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれよりも高いものであり得る。一部の実施形態では、予測モデルの陽性適中率は、10%よりも高い再現率で、最大で0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2、0.1またはそれ未満であり得る。
一部の実施形態では、予測モデルの陽性適中率は、0.1%~10%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。一部の実施形態では、予測モデルの陽性適中率は、0.1%~0.5%、0.1%~1%、0.1%~2%、0.1%~3%、0.1%~4%、0.1%~5%、0.1%~6%、0.1%~7%、0.1%~8%、0.1%~9%、0.1%~10%、0.5%~1%、0.5%~2%、0.5%~3%、0.5%~4%、0.5%~5%、0.5%~6%、0.5%~7%、0.5%~8%、0.5%~9%、0.5%~10%、1%~2%、1%~3%、1%~4%、1%~5%、1%~6%、1%~7%、1%~8%、1%~9%、1%~10%、2%~3%、2%~4%、2%~5%、2%~6%、2%~7%、2%~8%、2%~9%、2%~10%、3%~4%、3%~5%、3%~6%、3%~7%、3%~8%、3%~9%、3%~10%、4%~5%、4%~6%、4%~7%、4%~8%、4%~9%、4%~10%、5%~6%、5%~7%、5%~8%、5%~9%、5%~10%、6%~7%、6%~8%、6%~9%、6%~10%、7%~8%、7%~9%、7%~10%、8%~9%、8%~10%または9%~10%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。一部の実施形態では、予測モデルの陽性適中率は、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%または10%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。一部の実施形態では、予測モデルの陽性適中率は、少なくとも0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%または9%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。一部の実施形態では、予測モデルの陽性適中率は、最大で0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%または10%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。
一部の実施形態では、予測モデルの陽性適中率は、10%~20%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。一部の実施形態では、予測モデルの陽性適中率は、10%~11%、10%~12%、10%~13%、10%~14%、10%~15%、10%~16%、10%~17%、10%~18%、10%~19%、10%~20%、11%~12%、11%~13%、11%~14%、11%~15%、11%~16%、11%~17%、11%~18%、11%~19%、11%~20%、12%~13%、12%~14%、12%~15%、12%~16%、12%~17%、12%~18%、12%~19%、12%~20%、13%~14%、13%~15%、13%~16%、13%~17%、13%~18%、13%~19%、13%~20%、14%~15%、14%~16%、14%~17%、14%~18%、14%~19%、14%~20%、15%~16%、15%~17%、15%~18%、15%~19%、15%~20%、16%~17%、16%~18%、16%~19%、16%~20%、17%~18%、17%~19%、17%~20%、18%~19%、18%~20%または19%~20%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。一部の実施形態では、予測モデルの陽性適中率は、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。一部の実施形態では、予測モデルの陽性適中率は、少なくとも10%、11%、12%、13%、14%、15%、16%、17%、18%または19%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。一部の実施形態では、予測モデルの陽性適中率は、最大で11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれより高い。
一部の実施形態では、予測モデルの陽性適中率は、少なくとも0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、または20%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれよりも高いものである。例えば、予測モデルの陽性適中率は、少なくとも10%の再現率で少なくとも0.1であり得る。例えば、予測モデルの陽性適中率は、少なくとも10%の再現率で、少なくとも0.2であり得る。例えば、予測モデルの陽性適中率は、少なくとも10%の再現率で、少なくとも0.3であり得る。例えば、予測モデルの陽性適中率は、少なくとも10%の再現率で、少なくとも0.4であり得る。例えば、予測モデルの陽性適中率は、少なくとも10%の再現率で、少なくとも0.5であり得る。例えば、予測モデルの陽性適中率は、少なくとも10%の再現率で、少なくとも0.6であり得る。例えば、予測モデルの陽性適中率は、少なくとも10%少なくとも0.7であり得る。例えば、予測モデルの陽性適中率は、少なくとも10%の再現率で、少なくとも0.8であり得る。例えば、予測モデルの陽性適中率は、少なくとも10%の再現率で、少なくとも0.9であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.1であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.2であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.3であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.4であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.5であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.6であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.7であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.8であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.9であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.1であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.2であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.3であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.4であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.5であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.6であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.7であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.8であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.9であり得る。
一部の実施形態では、予測モデルの陽性適中率は、約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、または20%の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれよりも高いものである。例えば、予測モデルの陽性適中率は、約10%の再現率で少なくとも0.1であり得る。例えば、予測モデルの陽性適中率は、約10%の再現率で、少なくとも0.2であり得る。例えば、予測モデルの陽性適中率は、約10%の再現率で、少なくとも0.3であり得る。例えば、予測モデルの陽性適中率は、約10%の再現率で、少なくとも0.4であり得る。例えば、予測モデルの陽性適中率は、約10%の再現率で、少なくとも0.5であり得る。例えば、予測モデルの陽性適中率は、約10%の再現率で、少なくとも0.6であり得る。例えば、予測モデルの陽性適中率は、約10%の再現率で、少なくとも0.7であり得る。例えば、予測モデルの陽性適中率は、約10%の再現率で、少なくとも0.8であり得る。例えば、予測モデルの陽性適中率は、約10%の再現率で、少なくとも0.9であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.1であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.2であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.3であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.4であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.5であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.6であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.7であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.8であり得る。例えば、予測モデルの陽性適中率は、少なくとも5%の再現率で、少なくとも0.9であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.1であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.2であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.3であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.4であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.5であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.6であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.7であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.8であり得る。例えば、予測モデルの陽性適中率は、少なくとも20%の再現率で、少なくとも0.9であり得る。
一部の実施形態では、予測モデルの陽性適中率は、0.1%未満、0.5%未満、1%未満、2%未満、3%未満、4%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、11%未満、12%未満、13%未満、14%未満、15%未満、16%未満、17%未満、18%未満、19%未満、または20%未満の再現率で、少なくとも0.05、0.1、0.2、0.25、0.3、0.4、0.5、0.6、0.7、0.8、0.9またはそれよりも高いものである。例えば、予測モデルの陽性適中率は、最大で10%の再現率で少なくとも0.1であり得る。例えば、予測モデルの陽性適中率は、最大で10%の再現率で、少なくとも0.2であり得る。例えば、予測モデルの陽性適中率は、最大で10%の再現率で、少なくとも0.3であり得る。例えば、予測モデルの陽性適中率は、最大で10%の再現率で、少なくとも0.4であり得る。例えば、予測モデルの陽性適中率は、最大で10%の再現率で、少なくとも0.5であり得る。例えば、予測モデルの陽性適中率は、最大で10%の再現率で、少なくとも0.6であり得る。例えば、予測モデルの陽性適中率は、最大で10%の再現率で、少なくとも0.7であり得る。例えば、予測モデルの陽性適中率は、最大で10%の再現率で、少なくとも0.8であり得る。例えば、予測モデルの陽性適中率は、最大で10%の再現率で、少なくとも0.9であり得る。例えば、予測モデルの陽性適中率は、最大で5%の再現率で、少なくとも0.1であり得る。例えば、予測モデルの陽性適中率は、最大で5%の再現率で、少なくとも0.2であり得る。例えば、予測モデルの陽性適中率は、最大で5%の再現率で、少なくとも0.3であり得る。例えば、予測モデルの陽性適中率は、最大で5%の再現率で、少なくとも0.4であり得る。例えば、予測モデルの陽性適中率は、最大で5%の再現率で、少なくとも0.5であり得る。例えば、予測モデルの陽性適中率は、最大で5%の再現率で、少なくとも0.6であり得る。例えば、予測モデルの陽性適中率は、最大で5%の再現率で、少なくとも0.7であり得る。例えば、予測モデルの陽性適中率は、最大で5%の再現率で、少なくとも0.8であり得る。例えば、予測モデルの陽性適中率は、最大で5%の再現率で、少なくとも0.9であり得る。例えば、予測モデルの陽性適中率は、最大で20%の再現率で、少なくとも0.1であり得る。例えば、予測モデルの陽性適中率は、最大で20%の再現率で、少なくとも0.2であり得る。例えば、予測モデルの陽性適中率は、最大で20%の再現率で、少なくとも0.3であり得る。例えば、予測モデルの陽性適中率は、最大で20%の再現率で、少なくとも0.4であり得る。例えば、予測モデルの陽性適中率は、最大で20%の再現率で、少なくとも0.5であり得る。例えば、予測モデルの陽性適中率は、最大で20%の再現率で、少なくとも0.6であり得る。例えば、予測モデルの陽性適中率は、最大で20%の再現率で、少なくとも0.7であり得る。例えば、予測モデルの陽性適中率は、最大で20%の再現率で、少なくとも0.8であり得る。例えば、予測モデルの陽性適中率は、最大で20%の再現率で、少なくとも0.9であり得る。
一部の実施形態では、約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、または20%の再現率で、予測モデルの陽性適中率は0.05%~0.6%である。約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、予測モデルの陽性適中率は、0.05%~0.1%、0.05%~0.15%、0.05%~0.2%、0.05%~0.25%、0.05%~0.3%、0.05%~0.35%、0.05%~0.4%、0.05%~0.45%、0.05%~0.5%、0.05%~0.55%、0.05%~0.6%、0.1%~0.15%、0.1%~0.2%、0.1%~0.25%、0.1%~0.3%、0.1%~0.35%、0.1%~0.4%、0.1%~0.45%、0.1%~0.5%、0.1%~0.55%、0.1%~0.6%、0.15%~0.2%、0.15%~0.25%、0.15%~0.3%、0.15%~0.35%、0.15%~0.4%、0.15%~0.45%、0.15%~0.5%、0.15%~0.55%、0.15%~0.6%、0.2%~0.25%、0.2%~0.3%、0.2%~0.35%、0.2%~0.4%、0.2%~0.45%、0.2%~0.5%、0.2%~0.55%、0.2%~0.6%、0.25%~0.3%、0.25%~0.35%、0.25%~0.4%、0.25%~0.45%、0.25%~0.5%、0.25%~0.55%、0.25%~0.6%、0.3%~0.35%、0.3%~0.4%、0.3%~0.45%、0.3%~0.5%、0.3%~0.55%、0.3%~0.6%、0.35%~0.4%、0.35%~0.45%、0.35%~0.5%、0.35%~0.55%、0.35%~0.6%、0.4%~0.45%、0.4%~0.5%、0.4%~0.55%、0.4%~0.6%、0.45%~0.5%、0.45%~0.55%、0.45%~0.6%、0.5%~0.55%、0.5%~0.6%または0.55%~0.6%であり得る。約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、予測モデルの陽性適中率は、0.05%、0.1%、0.15%、0.2%、0.25%、0.3%、0.35%、0.4%、0.45%、0.5%、0.55%または0.6%であり得る。約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、予測モデルの陽性適中率は、少なくとも0.05%、0.1%、0.15%、0.2%、0.25%、0.3%、0.35%、0.4%、0.45%、0.5%または0.55%であり得る。約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、予測モデルの陽性適中率は、最大で0.1%、0.15%、0.2%、0.25%、0.3%、0.35%、0.4%、0.45%、0.5%、0.55%または0.6%であり得る。
約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、予測モデルの陽性適中率は、0.45%~0.98%であり得る。約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、予測モデルの陽性適中率は、0.45%~0.5%、0.45%~0.55%、0.45%~0.6%、0.45%~0.65%、0.45%~0.7%、0.45%~0.75%、0.45%~0.8%、0.45%~0.85%、0.45%~0.9%、0.45%~0.96%、0.45%~0.98%、0.5%~0.55%、0.5%~0.6%、0.5%~0.65%、0.5%~0.7%、0.5%~0.75%、0.5%~0.8%、0.5%~0.85%、0.5%~0.9%、0.5%~0.96%、0.5%~0.98%、0.55%~0.6%、0.55%~0.65%、0.55%~0.7%、0.55%~0.75%、0.55%~0.8%、0.55%~0.85%、0.55%~0.9%、0.55%~0.96%、0.55%~0.98%、0.6%~0.65%、0.6%~0.7%、0.6%~0.75%、0.6%~0.8%、0.6%~0.85%、0.6%~0.9%、0.6%~0.96%、0.6%~0.98%、0.65%~0.7%、0.65%~0.75%、0.65%~0.8%、0.65%~0.85%、0.65%~0.9%、0.65%~0.96%、0.65%~0.98%、0.7%~0.75%、0.7%~0.8%、0.7%~0.85%、0.7%~0.9%、0.7%~0.96%、0.7%~0.98%、0.75%~0.8%、0.75%~0.85%、0.75%~0.9%、0.75%~0.96%、0.75%~0.98%、0.8%~0.85%、0.8%~0.9%、0.8%~0.96%、0.8%~0.98%、0.85%~0.9%、0.85%~0.96%、0.85%~0.98%、0.9%~0.96%、0.9%~0.98%または0.96%~0.98%であり得る。約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、予測モデルの陽性適中率は、0.45%、0.5%、0.55%、0.6%、0.65%、0.7%、0.75%、0.8%、0.85%、0.9%、0.96%または0.98%であり得る。約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、予測モデルの陽性適中率は、少なくとも0.45%、0.5%、0.55%、0.6%、0.65%、0.7%、0.75%、0.8%、0.85%、0.9%または0.96%であり得る。約0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%または20%の再現率で、予測モデルの陽性適中率は、最大で0.5%、0.55%、0.6%、0.65%、0.7%、0.75%、0.8%、0.85%、0.9%、0.96%または0.98%であり得る。
機械学習HLA-ペプチド提示予測モデルを訓練する方法
ある態様では、機械学習HLA-ペプチド提示予測モデルを訓練する方法は、コンピュータプロセッサを使用して、HLAクラスII対立遺伝子を発現する細胞由来の1つまたは複数のHLA-ペプチド複合体から単離されたHLA-ペプチドのアミノ酸位置情報配列をHLA-ペプチド提示予測モデルに入力するステップを含み得、機械学習HLA-ペプチド提示予測モデルを訓練することは、ニューラルネットワークのノードに対する重み付けされた値を、提供された訓練用データに最良に適合するように調整することを含み得る。
訓練用データは、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;訓練用ペプチドのアミノ酸位置情報を含む訓練用ペプチド配列情報であって、細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られたアミノ酸位置情報とアミノ酸位置情報および予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含み得る。訓練用データ、訓練用ペプチド配列情報、関数、および提示可能性は本明細書の他の箇所で開示されている。
訓練されたアルゴリズムは、1つまたは複数のニューラルネットワークを含み得る。ニューラルネットワークは、一連の層におけるいくつかの接続したニューロン(またはノード)のグラフに基づくコンピューティングシステムの一種であり得る。ニューラルネットワークは、データが提示される入力層;1つまたは複数の内部層および/または「隠れ」層;ならびに結果が提示される出力層を含み得る。ニューラルネットワークは、入力データセットと標的データセットの関係を、一連の接続の重みを調整することによって学習することができる。ニューロンは、他の層内のニューロンと、接続の強度を制御するパラメータである重みを有する接続を介して接続することができる。各層内のニューロンの数は、解かれる問題の複雑さに関連付けることができる。層内の必要なニューロンの最小数は問題の複雑さによって決定することができ、最大数はニューラルネットワークの一般化能力によって限定され得る。入力ニューロンは、提示されたデータを受けとり、次いで、そのデータを第1の隠れ層内のノードに接続の重みを通じて伝達することができ、接続の重みは、訓練中に改変される。結果ノードは、入力とそれらの付随する重みの全ての対の積を合計することができる。重み付けされた合計をバイアスでオフセットして、結果ノードの値を調整することができる。ノードまたはニューロンの出力を、閾値または活性化関数を使用してゲーティングすることができる。活性化関数は線形または非線形関数であり得る。活性化関数は、例えば、正規化線形ユニット(ReLU)活性化関数、Leaky ReLu活性化関数、または飽和双曲線正接関数、同一性関数、バイナリステップ関数、ロジスティック関数、arcTan関数、ソフトサイン関数、パラメトリック正規化線形ユニット関数、指数関数線形ユニット関数、softPlus関数、ベントアイデンティティ関数、softExponential関数、Sinusoid関数、Sinc関数、Gaussian関数、またはシグモイド関数などの他の関数、またはこれらの任意の組合せであり得る。
ニューラルネットワーク内の隠れ層は、データを処理し、その結果を次の層に重み付けされた接続の第2のセットを通じて伝達することができる。その後の各層は、前の層からの結果を、より複雑な関係に「プール」することができる。ニューラルネットワークを、それら自体が訓練の間(およびその後)に、出力値などの、所与の入力のセットからの所望の出力がもたらされるように改変されることを可能にすることにより、訓練用データ(1つまたは複数のセンサーから収集されたデータ)の既知の試料セットを用いて訓練することができる。訓練されるアルゴリズムは、畳み込みニューラルネットワーク、再帰型ニューラルネットワーク、拡張畳み込みニューラルネットワーク、全結合ニューラルネットワーク、深層生成モデル、およびボルツマンマシンを含み得る。
ニューラルネットワークの重み付け因子、バイアス値、および閾値、または他の計算パラメータは、訓練相において、訓練用データの1つまたは複数のセットを使用して「教えられる」または「学習する」。例えば、パラメータを、訓練用データセットからの入力データおよび最急降下法または逆伝播法を使用して訓練することができ、したがって、ニューラルネットワークからの出力値(複数可)は、訓練用データセットに含まれる例と一致する。
ニューラルネットワークの入力層に使用されるノードの数は、少なくとも約10、50、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000またはそれよりも多くであり得る。他の場合では、入力層に使用されるノードの数は、最大で約100,000、90,000、80,000、70,000、60,000、50,000、40,000、30,000、20,000、10,000、9000、8000、7000、6000、5000、4000、3000、2000、1000、900、800、700、600、500、400、300、200、100、50、または10またはそれ未満であり得る。一部の場合では、ニューラルネットワークに使用される層の総数(入力層および出力層を含める)は、少なくとも約3、4、5、10、15、20、またはそれよりも多くであり得る。他の場合では、層の総数は最大で約20、15、10、5、4、3またはそれ未満であり得る。
一部の場合では、ニューラルネットワークに使用される学習可能または訓練可能パラメータ、例えば、重み付け因子、バイアス、または閾値の総数は少なくとも約10、50、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000またはそれよりも多くであり得る。他の場合では、学習可能パラメータの数は、最大で約100,000、90,000、80,000、70,000、60,000、50,000、40,000、30,000、20,000、10,000、9000、8000、7000、6000、5000、4000、3000、2000、1000、900、800、700、600、500、400、300、200、100、50、または10またはそれ未満であり得る。
ニューラルネットワークは、畳み込みニューラルネットワークを含み得る。畳み込みニューラルネットワークは、1つまたは複数の畳み込み層、拡張型層または全結合層を含み得る。畳み込み層の数は1~10の間であり得、拡張型層の数は0~10の間であり得る。畳み込み層の総数(入力層および出力層を含める)は、少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くであり得、拡張型層の総数は少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くであり得る。畳み込み層の総数は最大で約20、15、10、5、4、3またはそれ未満であり得、拡張型層の総数は最大で約20、15、10、5、4、3またはそれ未満であり得る。一部の実施形態では、畳み込み層の数は1~10の間であり、全結合層の数は0~10の間である。畳み込み層の総数(入力層および出力層を含める)は少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くであり得、全結合層の総数は少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くであり得る。畳み込み層の総数は最大で約20、15、10、5、4、3またはそれ未満であり得、全結合層の総数は最大で約20、15、10、5、4、3またはそれ未満であり得る。
畳み込みニューラルネットワーク(CNN)は、ディープおよびフィードフォワード人工ニューラルネットワークであり得る。CNNは、視覚心像の解析に適用可能であり得る。CNNは、入力層、出力層、および多数の隠れ層を含み得る。CNNの隠れ層は、畳み込み層、プーリング層、全結合層および正規化層を含み得る。層は、3次元:幅、高さおよび深さで組織化することができる。
畳み込み層では、入力に対して畳み込み操作を適用し、畳み込み操作の結果を次の層に渡すことができる。画像を処理するために、畳み込み操作により、フリーパラメータの数を減らし、ネットワークが少数のパラメータでより深くなることを可能にすることができる。畳み込み層では、ニューロンは、前の層の制限された下位領域のみから入力を受け取ることができる。畳み込み層のパラメータは、学習可能フィルター(またはカーネル)のセットを含み得る。学習可能フィルターは、小さな受容野を有し、入力体積の全深さを通じて広がる。フォワードパスの間、各フィルターを入力体積の幅および高さにわたって畳み込み、フィルターのエントリーと入力の間のドット積をコンピュータ計算し、そのフィルターの2次元活性化マップを作製することができる。結果として、ネットワークは、入力のいくつかの空間的位置において特定の型の特色を検出した場合に活性化するフィルターを学習することができる。
プーリング層は、グローバルプーリング層を含み得る。グローバルプーリング層では、1つの層におけるニューロンクラスターの出力を組み合わせて単一のニューロンにして次の層に入れることができる。例えば、最大プーリング層では、前の層におけるニューロンのクラスターの各々からの最大値を使用することができ、平均プーリング層では、前の層におけるニューロンのクラスターの各々からの平均値を使用することができる。全結合層では、1つの層内のあらゆるニューロンを別の層内のあらゆるニューロンと接続することができる。全結合層では、各ニューロンが前の層のあらゆる要素から入力を受け取ることができる。正規化層はバッチ正規化層であり得る。バッチ正規化層では、ニューラルネットワークの性能および安定性を改善することができる。バッチ正規化層では、ニューラルネットワーク内の任意の層にゼロ平均/単位分散である入力を提供することができる。バッチ正規化層を使用する利点としては、ネットワークの訓練がより速いこと、学習率がより高いこと、重みを初期化するのが容易であること、実行可能な活性化関数がより多いこと、およびディープネットワークを創出するプロセスがより単純であることを挙げることができる。
ニューラルネットワークは、再帰型ニューラルネットワークを含み得る。再帰型ニューラルネットワークは、例えば連続したデータ入力など、逐次的データを入力として受け取るように構成することができ、再帰型ニューラルネットワークソフトウェアモジュールにより、あらゆる時間ステップにおいて内部状態を更新することができる。再帰型ニューラルネットワークでは、内部状態(メモリ)を使用して入力の順序をプロセシングできる。再帰型ニューラルネットワークは、手書き文字認識または音声認識、次の単語の予測、作曲、画像キャプション生成、時系列異常検知、機械翻訳、シーンラベリング、および株式市場予測などの課題に適用可能であり得る。再帰型ニューラルネットワークは、完全再帰型ニューラルネットワーク、独立型再帰型ニューラルネットワーク、エルマンネットワーク、ジョーダンネットワーク、エコー状態、ニューラルヒストリーコンプレッサ、長・短期記憶、ゲート付き再帰型ユニット、多重時間スケールモデル、ニューラルチューリングマシン、微分可能ニューラルコンピュータ、ニューラルネットワーク・プッシュダウン・オートマトン、またはこれらの任意の組合せを含み得る。
訓練されたアルゴリズムは、例えば、SVM、ランダムフォレスト、クラスタリングアルゴリズム(またはソフトウェアモジュール)、勾配ブースティング、ロジスティック回帰、および/または決定木などの教師ありまたは教師なし学習法を含み得る。教師あり学習アルゴリズムは、入力データと出力データの関係を推測するために、標識された対になった訓練用データ例のセットを使用することに依拠するアルゴリズムであり得る。教師なし学習アルゴリズムは、訓練用データセットから出力データに推測を引き出すために使用されるアルゴリズムであり得る。教師なし学習アルゴリズムは、処理データにおける隠れパターンまたは群分けを見いだすための探索的データ解析に使用することができるクラスター解析を含み得る。教師なし学習法の1つの例は、主成分分析を含み得る。主成分分析は、1つまたは複数の変数の次元を縮約することを含み得る。所与の変数の次元は、少なくとも1、5、10、50、100、200、300、400、500、600、700、800、900、1000、1100、1200 1300、1400、1500、1600、1700、1800、またはそれよりも大きいものであり得る。所与の変数の次元は、最大で1800、1600、1500、1400、1300、1200、1100、1000、900、800、700、600、500、400、300、200、100、50、10またはそれ未満であり得る。
訓練用アルゴリズムは、統計学的技法によって達成することができる。一部の実施形態では、統計学的な技法は、線形回帰、分類、リサンプリング法、サブセット選択、縮小、次元縮約、非線形モデル、木に基づく方法、サポートベクターマシン、教師なし学習、またはこれらの任意の組合せを含み得る。
線形回帰は、従属変数と独立変数の間に最良の直線関係を当てはめることによって標的変数を予測するための方法であり得る。最良当てはめは、各点における形状と実際の観察の間の全ての距離の合計が最小であることを意味し得る。線形回帰は、単純線形回帰および多重線形回帰を含み得る。単純線形回帰では、単一の独立変数を使用して従属変数を予測することができる。多重線形回帰では、1つよりも多くの独立変数を使用して、最良の直線関係を当てはめることによって、従属変数を予測することができる。
分類は、正確な予測および解析を実現するために、データの集合にカテゴリーを割り当てるデータマイニング技法であり得る。分類技法は、ロジスティック回帰および判別分析を含み得る。ロジスティック回帰は、従属変数が二分法(バイナリ)である場合に使用することができる。ロジスティック回帰は、1つの従属バイナリ変数と1つまたは複数の名義、順序、間隔または比率-レベル独立変数の関係を発見し、記述するために使用することができる。リサンプリングは、元のデータサンプルから繰り返されたサンプルを引き出すことを含む方法であり得る。リサンプリングは、概算確率値をコンピュータ計算するために一般的な分布表の利用を伴わなくてよい。リサンプリングにより、実際のデータに基づいて独特のサンプリング分布を生成することができる。一部の実施形態では、リサンプリングには、独特のサンプリング分布を生成するために、分析的方法ではなく実験的方法を使用することができる。リサンプリング技法は、ブートストラッピングおよび交差検証を含み得る。ブートストラッピングは、元のデータからの、元に戻すことを伴うサンプリングによって実施することができ、「選択されなかった」データ点を試験事例として取る。訓練用データを複数の部分に分割することにより、交差検証を実施することができる。
サブセット選択により、応答に関連する予測器のサブセットを同定することができる。サブセット選択は、最良のサブセット選択、フォワードステップワイズ選択、バックワードステップワイズ選択、ハイブリッド法、またはこれらの任意の組合せを含み得る。一部の実施形態では、縮小が、全ての予測器を伴うモデルに合うが、推定される係数は最小二乗推定値に対してゼロに向かって縮小する。この縮小により、分散が減少し得る。縮小は、リッジ回帰およびラッソを含み得る。次元縮約により、m<nとして、n+1係数を推定する問題がm+1係数という、より単純な問題に縮小し得る。これは、変数のn個の異なる線形結合、または投影をコンピュータ計算することによって達成することができる。次いで、これらのn個の投影を予測器として使用して最小二乗によって線形回帰モデルに当てはめる。次元縮約は、主成分回帰および部分最小二乗を含み得る。主成分回帰を使用して、変数の大きなセットから特色の低次元セットを導き出すことができる。主成分回帰に使用される主成分により、引き続き直交方向にデータの線形結合を使用してデータの大多数の分散を捕捉することができる。部分最小二乗は主成分回帰に対する教師あり代替であり得、これは、部分最小二乗では、新しい特色を同定するために応答変数が使用され得るからである。
非線形回帰は、観察に基づくデータが、モデルパラメータの非線形組合せであり、1つまたは複数の独立変数に依存する関数によってモデル化される、回帰分析の一形態であり得る。非線形回帰は、ステップ関数、区分的関数、スプライン、一般加法モデル、またはこれらの任意の組合せを含み得る。
木に基づく方法は、回帰および分類問題のどちらにも使用することができる。回帰および分類問題は、予測器空間をいくつかの単純領域への層別化またはセグメント化することを伴い得る。木に基づく方法は、バギング、ブースティング、ランダムフォレスト、またはこれらの任意の組合せを含み得る。バギングにより、反復との組合せを使用して元のデータと同じカーナリティ/サイズの多段階を生成して元のデータセットから訓練用の追加的なデータを生成することによって予測の分散を減少させることができる。ブースティングにより、いくつかの異なるモデルを使用して出力を算出し、次いで、加重平均手法を使用して結果を平均することができる。ランダムフォレストアルゴリズムにより、訓練セットのランダムなブートストラップサンプルを引き出すことができる。サポートベクターマシンは、分類技法であり得る。サポートベクターマシンは、2つのクラスの点を最大の余地で最良に分離する超平面を見いだすことを含み得る。サポートベクターマシンでは、最適化問題を制約することができ、したがって、データを完璧に分類するという制約に供される余地が最大化される。
教師なし方法は、入力データを含むデータセットから、標識された応答を伴わずに推測を引き出す方法であり得る。教師なし方法は、クラスタリング、主成分分析、k平均クラスタリング、階層クラスタリング、またはこれらの任意の組合せを含み得る。
質量分析は、単一対立遺伝子質量分析であり得る。一部の実施形態では、質量分析は、MS分析、MS/MS分析、LC-MS/MS分析、またはこれらの組合せであり得る。一部の実施形態では、MS分析を使用して、インタクトなペプチドの質量を決定することができる。例えば、決定することは、インタクトなペプチドの質量を決定すること(例えば、MS分析)を含み得る。一部の実施形態では、MS/MS分析を使用して、ペプチド断片の質量を決定することができる。例えば、決定することは、ペプチド断片の質量を決定することを含み得、それを使用して、ペプチドまたはその一部のアミノ酸配列を決定することができる(例えば、MS/MS分析)。一部の実施形態では、ペプチド断片の質量を使用して、ペプチド内のアミノ酸の配列を決定することができる。一部の実施形態では、LC-MS/MS分析を使用して、複雑なペプチド混合物を分離することができる。例えば、決定することは、液体クロマトグラフィーによってなどで複雑なペプチド混合物を分離すること、およびインタクトなペプチドの質量、ペプチド断片の質量、またはこれらの組合せを決定することを含み得る(例えば、LC-MS/MS分析)。このデータを、例えばペプチド配列決定のために使用することができる。
ペプチドは、オートファジーを通じて、細胞において発現されるHLAタンパク質によって提示され得る。オートファジーにより、細胞構成成分の順序正しい分解および再利用が可能になり得る。オートファジーは、マクロオートファジー、ミクロオートファジーおよびシャペロン媒介性オートファジーを含み得る。ペプチドは、ファゴサイトーシスを通じて、細胞において発現されるHLAタンパク質によって提示され得る。ファゴサイトーシスは、病原体および細胞片を除去するために使用される主要な機構であり得る。例えば、マクロファージが病原性微生物を摂取すると、病原体はファゴソーム内に捕捉され、次いで、それがリソソームと融合して、ファゴリソソームを形成する。HLAクラスIIでは、マクロファージおよび未成熟樹状細胞などの食細胞が実体をファゴサイトーシスによってファゴソームに取り込み得(しかし、B細胞はエンドソームへのより一般的なエンドサイトーシスを示すが)、それらはリソソームと融合し、リソソームの酸性酵素により取り込まれたタンパク質が切断されて多くの異なるペプチドになる。
訓練用データの品質は、複数の品質メトリクスを使用して向上させることができる。複数の品質メトリクスは、一般的な夾雑ペプチド除去、高スコア化ピーク強度、高スコア、および高い質量精度を含み得る。スコア化ピーク強度を、スコア化を実施する前に使用することができる。MS/MS検索により、まず、単純なフィルターを使用してMS/MSスペクトルを候補配列に対してスクリーニングする。このフィルターは最小のスコア化ピーク強度であり得る。スコア化ピーク強度の使用により、十分な数のスペクトルピークが調査され、このフィルターによって確立された閾値を満たさないことが見いだされたら、候補配列を迅速かつ即座にはねることが可能になることにより、検索スピードが増強され得る。スコア化ピーク強度は少なくとも50%であり得る。スコア化ピーク強度は少なくとも70%であり得る。スコア化ピーク強度は少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%またはそれよりも大きいものであり得る。一部の場合では、スコア化ピーク強度は最大で90%、80%、70%、60%、50%、40%、30%、20%、10%またはそれ未満であり得る。スコアは少なくとも7であり得る。スコアは、少なくとも1、2、3、4、5、6、7、8、9、10、15、20またはそれよりも大きいものであり得る。一部の場合では、スコアは、最大で約20、15、10、9、8、7、6、5、4、3、2、1またはそれ未満であり得る。質量精度は最大で5ppmであり得る。質量精度は最大で10ppm、9ppm、8ppm、7ppm、6ppm、5ppm、4ppm、3ppm、2ppm、1ppmまたはそれ未満であり得る。質量精度は少なくとも1ppm、2ppm、3ppm、4ppm、5ppm、6ppm、7ppm、8ppm、9ppm、10ppmまたはそれよりも大きいものであり得る。
一部の実施形態では、質量精度は、最大で2ppmである。一部の実施形態では、骨格切断スコアは、少なくとも5である。一部の実施形態では、骨格切断スコアは、少なくとも8である。
細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の免疫沈降HLAタンパク質によって提示されるペプチドであり得る。免疫沈降(IP)は、タンパク質抗原を溶液から、その特定のタンパク質に特異的に結合する抗体を使用して沈殿させる技法であり得る。このプロセスを使用して、多くの何千もの異なるタンパク質を含有する試料から特定のタンパク質を単離し、濃縮することができる。免疫沈降では、手順のある時点で抗体を固体基質にカップリングすることが必要になり得る。
細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の外因性HLAタンパク質によって提示されるペプチドであり得る。単一の外因性HLAタンパク質は、1つまたは複数の外因性ペプチドを細胞の集団に導入することによって創出することができる。一部の実施形態では、導入することは、細胞の集団を1つもしくは複数の外因性ペプチドと接触させること、または細胞の集団において1つもしくは複数の外因性ペプチドを発現させることを含む。一部の実施形態では、導入することは、細胞の集団を1つまたは複数の外因性ペプチドをコードする1つまたは複数の核酸と接触させることを含む。一部の実施形態では、1つまたは複数のペプチドをコードする1つまたは複数の核酸はDNAである。一部の実施形態では、1つまたは複数のペプチドをコードする1つまたは複数の核酸はRNAであり、必要に応じて、RNAはmRNAである。一部の実施形態では、富化することは、四量体(または多量体)試薬の使用を含まない。
細胞において発現されるHLAタンパク質によって提示されるペプチドは、細胞において発現される単一の組換えHLAタンパク質によって提示されるペプチドであり得る。組換えHLAタンパク質は、組換えHLAクラスIまたはHLAクラスII対立遺伝子によってコードされるものであり得る。HLAクラスIは、HLA-A、HLA-B、HLA-Cからなる群から選択することができる。HLAクラスIは、非古典的クラス-I-b群であり得る。HLAクラスIは、HLA-E、HLA-F、およびHLA-Gからなる群から選択することができる。HLAクラスIは、HLA-E、HLA-F、およびHLA-Gからなる群から選択される非古典的クラス-I-b群であり得る。一部の実施形態では、HLAクラスIIは、HLAクラスII α鎖、HLAクラスII β鎖、またはこれらの組合せを含む。
複数の予測変数は、ペプチド-HLA親和性予測変数を含み得る。複数の予測変数は、供給源タンパク質発現レベル予測変数を含み得る。供給源タンパク質発現レベルは、細胞内のペプチドの供給源タンパク質の発現レベルであり得る。一部の実施形態では、発現レベルは、供給源タンパク質の量または供給源タンパク質をコードするRNAの量を測定することによって決定することができる。複数の予測変数は、ペプチド配列、アミノ酸の物理的性質、ペプチドの物理的性質、細胞内のペプチドの供給源タンパク質の発現レベル、タンパク質の安定性、タンパク質の翻訳率、ユビキチン化部位、タンパク質分解速度、リボソームのプロファイリングからの翻訳効率、タンパク質切断性、タンパク質の局在化、TAP輸送を容易にする宿主タンパク質のモチーフ、オートファジーに供される宿主タンパク質、リボソームの停止に有利なモチーフ(例えば、ポリプロリンまたはポリリシンのひと続き)、NMDに有利なタンパク質の特色(例えば、長い3’UTR、最後のエクソンの>50nt上流の終止コドン:エクソン接合部およびペプチド切断性)を含み得る。
複数の予測変数は、ペプチド切断性予測変数を含み得る。ペプチド切断性は、切断可能なリンカーまたは切断配列に関連し得る。一部の実施形態では、切断可能なリンカーは、リボソームスキッピング部位または配列内リボソーム進入部位(IRES)エレメントである。一部の実施形態では、リボソームスキッピング部位またはIRESは細胞において発現された時に切断される。一部の実施形態では、リボソームスキッピング部位は、F2A、T2A、P2A、およびE2Aからなる群から選択される。一部の実施形態では、IRESエレメントは、一般的な細胞IRES配列またはウイルスIRES配列から選択される。F2A、または配列内リボソーム進入部位(IRES)などの切断配列を、α鎖とβ2-ミクログロブリン(HLAクラスI)の間、またはα鎖とβ鎖(HLAクラスII)の間に配置することができる。一部の実施形態では、単一のHLAクラスI対立遺伝子は、HLA-A02:01、HLA-A23:01およびHLA-B14:02、またはHLA-E01:01であり、HLAクラスII対立遺伝子は、HLA-DRB01:01、HLA-DRB01:02およびHLA-DRB11:01、HLA-DRB15:01、またはHLA-DRB07:01である。一部の実施形態では、切断配列は、T2A、P2A、E2A、またはF2A配列である。例えば、切断配列は、E G R G S L T C G D V E N P G P(T2A)、A T N F S L K Q A G D V E N P G P(P2A)、Q C T N Y A L K L A G D V E S N P G P(E2A)、またはV K Q T L N F D L K L A G D V E S N P G P(F2A)であり得る。
一部の実施形態では、切断配列は、トロンビン切断部位CLIPであり得る。
HLAタンパク質によって提示されるペプチドは、酵素特異性なし修飾なしペプチドデータベースを検索することによって同定されるペプチドを含み得る。ペプチドデータベースは、修飾なしデータベースまたは修飾あり(例えば、リン酸化またはシステイニル化)データベースなどの酵素特異性なしペプチドデータベースであり得る。一部の実施形態では、ペプチドデータベースは、ポリペプチドデータベースである。一部の実施形態では、ポリペプチドデータベースは、タンパク質データベースであり得る。一部の実施形態では、方法は、逆データベース検索戦略を使用してペプチドデータベースを検索することをさらに含む。一部の実施形態では、方法は、逆データベース検索戦略を使用してタンパク質データベースを検索することをさらに含む。一部の実施形態では、例えば、通常のペプチドまたはタンパク質データベースには含まれない新しいペプチドを発見するために、新規の検索を実施する。ペプチドデータベースは、親和性アクセプターでタグ付けされたHLAを含む1つまたは複数の細胞をそれぞれが含む第1の細胞の集団および第2の細胞の集団を準備するステップであって、配列親和性アクセプターでタグ付けされたHLAが、親和性アクセプターペプチドに作動可能に連結した異なるHLA対立遺伝子によってコードされる異なる組換えポリペプチドを含む、ステップと、親和性アクセプターでタグ付けされたHLA-ペプチド複合体を富化するステップと、富化するステップからの、親和性アクセプターでタグ付けされたHLA-ペプチド複合体に結合したペプチドまたはその一部を特徴付けるステップと、HLA-対立遺伝子特異的ペプチドデータベースを生成するステップとによって生成することができる。
HLAタンパク質によって提示されるペプチドは、HLA-ペプチドのMS/MSスペクトルとペプチドデータベース内の1つまたは複数のHLA-ペプチドのMS/MSスペクトルと比較することによって同定されるペプチドを含み得る。
ペプチドまたはペプチドをコードする核酸のいずれかに変異が存在し得る。変異は、点変異、スプライス部位変異、フレームシフト変異、リードスルー変異、および遺伝子融合変異からなる群から選択することができる。点変異は、DNAまたはRNAの配列から単一のヌクレオチド塩基が変化した、挿入されたまたは欠失した遺伝子変異であり得る。スプライス部位変異は、前駆体メッセンジャーRNAの成熟メッセンジャーRNAへのプロセシングの間にスプライシングが生じる特定の部位においていくつかのヌクレオチドが挿入された、欠失した、または変化した遺伝子変異であり得る。フレームシフト変異は、DNA配列における3で割り切れないいくつかのヌクレオチドのインデル(挿入または欠失)によって引き起こされる遺伝子変異であり得る。変異はまた、挿入、欠失、置換変異、遺伝子重複、染色体転座、および染色体逆位も含み得る。
一部の実施形態では、HLAクラスIIタンパク質は、HLA-DRタンパク質を含む。
一部の実施形態では、HLAクラスIIタンパク質は、HLA-DPタンパク質を含む。
一部の実施形態では、HLAクラスIIタンパク質は、HLA-DQタンパク質を含む。
一部の実施形態では、HLAクラスIIタンパク質は、HLA-DRタンパク質、およびHLA-DPタンパク質またはHLA-DQタンパク質からなる群から選択することができる。一部の実施形態では、HLAタンパク質は、HLA-DPB101:01/HLA-DPA101:03、HLA-DPB102:01/HLA-DPA101:03、HLA-DPB103:01/HLA-DPA101:03、HLA-DPB104:01/HLA-DPA101:03、HLA-DPB104:02/HLA-DPA101:03、HLA-DPB106:01/HLA-DPA101:03、HLA-DQB102:01/HLA-DQA105:01、HLA-DQB102:02/HLA-DQA102:01、HLA-DQB106:02/HLA-DQA101:02、HLA-DQB106:04/HLA-DQA101:02、HLA-DRB101:01、HLA-DRB101:02、HLA-DRB103:01、HLA-DRB103:02、HLA-DRB104:01、HLA-DRB104:02、HLA-DRB104:03、HLA-DRB104:04、HLA-DRB104:05、HLA-DRB104:07、HLA-DRB107:01、HLA-DRB108:01、HLA-DRB108:02、HLA-DRB108:03、HLA-DRB108:04、HLA-DRB109:01、HLA-DRB110:01、HLA-DRB111:01、HLA-DRB111:02、HLA-DRB111:04、HLA-DRB112:01、HLA-DRB112:02、HLA-DRB113:01、HLA-DRB113:02、HLA-DRB113:03、HLA-DRB114:01、HLA-DRB115:01、HLA-DRB115:02、HLA-DRB115:03、HLA-DRB116:01、HLA-DRB301:01、HLA-DRB302:02、HLA-DRB303:01、HLA-DRB401:01、HLA-DRB501:01)からなる群から選択されるHLAクラスIIタンパク質である。HLAタンパク質によって提示されるペプチドの長さは、15~40アミノ酸であり得る。HLAタンパク質によって提示されるペプチドの長さは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27アミノ酸、またはそれよりも多くのアミノ酸であり得る。一部の実施形態では、HLAタンパク質によって提示されるペプチドの長さは、最大で30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11アミノ酸、またはそれ未満であり得る。
HLAタンパク質によって提示されるペプチドは、(a)単一のHLAクラスII対立遺伝子を発現する細胞株から1つまたは複数のHLA複合体を単離するステップと、(b)1つまたは複数の単離されたHLA複合体から1つまたは複数のHLA-ペプチドを単離するステップと、(c)1つまたは複数の単離されたHLA-ペプチドについてのMS/MSスペクトルを得るステップと、(d)ペプチドデータベースから1つまたは複数の単離されたHLA-ペプチドのMS/MSスペクトルに対応するペプチド配列を得るステップであって、1つまたは複数の配列が、ステップ(a、b、c)から得られたものである、ステップと、(d)1つまたは複数の単離されたHLA-ペプチドの配列を同定するステップとによって同定されるペプチドを含み得る。
単離するステップは、アフィニティータグが付されたHLA構築物をトランスフェクトまたは形質導入した細胞からHLA-ペプチド複合体を単離することを含み得る。一部の実施形態では、複合体を、市販の抗体を用い、当技術分野で公知の標準の免疫沈降技法を使用して単離することができる。細胞をまず溶解させることができる。HLAクラスII-ペプチド複合体を、M5/114.15.2モノクローナル抗体などのHLAクラスII特異的抗体を使用して単離することができる。一部の実施形態では、単一の(またはその対)HLA対立遺伝子をペプチドタグとの融合タンパク質として発現させ、HLA-ペプチド複合体を、ペプチドタグを認識する結合性分子を使用して単離する。
単離するステップは、ペプチドをHLA-ペプチド複合体から単離し、ペプチドの配列決定を行うことを含み得る。酸溶出などの当業者に公知の任意の方法によって複合体からペプチドを単離する。任意の配列決定方法を使用することができるが、一部の実施形態では、質量分析を使用する方法、例えば、液体クロマトグラフィー-質量分析(LC-MSまたはLC-MS/MS、またはその代わりにHPLC-MSまたはHPLC-MS/MS)などが利用される。これらの配列決定方法は当業者には周知であり得、また、Medzihradszky KF and Chalkley RJ. Mass Spectrom Rev. 2015 Jan-Feb; 34 (1): 43-63に概説されている。
単離または精製に適した追加的な候補構成成分および分子は、ビオチン(ビオチン-アビジン特異的結合対)、抗体、受容体、リガンド、レクチン、または、例えば、プラスチックまたはポリスチレンビーズ、プレートまたはビーズ、磁気ビーズ、テストストリップ、および膜を含めた固体支持体を含む分子などの結合性分子を含み得る。コンジュゲートがそれらの種々の分子量に有効に分離される電荷差異によってコンジュゲートを分離するために、陽イオン交換クロマトグラフィーなどの精製方法を使用することができる。陽イオン交換クロマトグラフィーによって得られた画分の内容物は、従来の方法、例えば、質量分析、SDS-PAGE、または分子実体を分子量によって分離するための他の公知の方法を使用して、分子量によって同定することができる。
一部の実施形態では、方法は、特徴付けるステップの前にペプチドを親和性アクセプターでタグ付けされたHLA-ペプチド複合体から単離するステップをさらに含む。一部の実施形態では、HLA-ペプチド複合体を、抗HLA抗体を使用して単離する。一部の場合では、アフィニティータグを伴うまたは伴わないHLA-ペプチド複合体を、抗HLA抗体を使用して単離する。一部の場合では、アフィニティータグを伴うまたは伴わない可溶性HLA(sHLA)を細胞培養の培地から単離する。一部の場合では、アフィニティータグを伴うまたは伴わない可溶性HLA(sHLA)を、抗HLA抗体を使用して単離する。例えば、アフィニティータグを伴うまたは伴わない可溶性HLA(sHLA)などのHLAを、抗HLA抗体を含有するビーズまたはカラムを使用して単離することができる。一部の実施形態では、ペプチドを、抗HLA抗体を使用して単離する。一部の場合では、アフィニティータグを伴うまたは伴わない可溶性HLA(sHLA)を、抗HLA抗体を使用して単離する。一部の場合では、アフィニティータグを伴うまたは伴わない可溶性HLA(sHLA)を、抗HLA抗体を含有するカラムを使用して単離する。一部の実施形態では、方法は、親和性アクセプターでタグ付けされたHLA-ペプチド複合体に結合したペプチドの末端から1つまたは複数のアミノ酸を除去するステップをさらに含む。
個別化がんワクチンは、アジュバントをさらに含み得る。例えば、TLR3ならびにMDA5およびRIG3のRNAヘリカーゼ-ドメインのアゴニストであるポリ-ICLCは、ワクチンアジュバントとしてのいくつかの望ましい特性が示されている。これらの特性としては、in vivoにおける免疫細胞の局所的な活性化および全身性の活性化の誘導、刺激性ケモカインおよびサイトカインの産生、ならびにDCによる抗原提示の刺激を挙げることができる。さらに、ポリ-ICLCにより、ヒトにおける長続きするCD4+およびCD8+応答を誘導することができる。重要なことに、ポリ-ICLCを用いたワクチン接種を受けた対象と、高度に有効な複製コンピテント黄熱病ワクチンを受けた志願者において、転写およびシグナルトランスダクション経路の上方制御の著しい類似性を認めることができる。さらに、最近の第1相試験において、ポリ-ICLCとNYESO-1ペプチドワクチン(モンタニドに加えて)の組合せを用いて免疫化した卵巣癌患者の>90%でCD4+ T細胞およびCD8+ T細胞の誘導、ならびにペプチドに対する抗体応答が示された。
個別化がんワクチンは、免疫チェックポイント阻害剤をさらに含み得る。免疫チェックポイント阻害剤は、T細胞などの一部の型の免疫系細胞、および一部のがん細胞によって作られるある特定のタンパク質を遮断する薬物の1つの型を含み得る。これらのタンパク質は、免疫応答を制止するのに役立ち、また、T細胞によるがん細胞の死滅を防ぐことができる。これらのタンパク質が遮断されると、免疫系に対する「ブレーキ」が放出され、T細胞がより良好にがん細胞を死滅させることができるようになる。T細胞またはがん細胞に見いだされるチェックポイントタンパク質の例としては、PD-1/PD-L1およびCTLA-4/B7-1/B7-2が挙げられる。一部の免疫チェックポイント阻害剤は、がんを処置するために使用される。
訓練用データは、構造化されたデータ、時系列データ、構造化されていないデータ、およびリレーショナルデータをさらに含み得る。構造化されていないデータは、ロボット工学またはシミュレーションの正確なシミュレートまたは訓練における使用のための、音声データ、画像データ、ビデオ、機械的データ、電気的データ、化学的データ、およびこれらの任意の組合せを含み得る。時系列データは、スマートメーター、スマート電化製品、スマートデバイス、モニタリングシステム、遠隔測定デバイス、またはセンサーのうちの1つまたは複数からのデータを含み得る。リレーショナルデータは、顧客システム、企業システム、運用システム、ウェブサイト、ウェブアクセス可能なアプリケーションプログラムインターフェース(API)、またはこれらの任意の組合せからのデータを含む。これは、ユーザーが、ファイルまたは他のデータフォーマットをソフトウェアまたはシステムに入力する任意の方法によって行うことができる。
訓練用データをクラウドに基づくデータベースにアップロードすることができる。クラウドに基づくデータベースは、機械学習に基づくセンサー信号処理アルゴリズムを実行するローカルおよび/またはリモートコンピュータシステムからアクセス可能なものであり得る。クラウドに基づくデータベースおよび関連するソフトウェアを、電子データをアーカイブに入れるため、電子データを共有するため、および電子データを解析するために使用することができる。ローカルで生成したデータまたはデータセットを、それがアクセスすることができるクラウドに基づくデータベースにアップロードし、同じサイトまたは異なるサイトにある他の機械学習に基づく検出システムを訓練するために使用することができる。センサーデバイスおよび検出システムの試験性能を連続して改善するために、ローカルで生成したセンサーデバイスおよびシステムによる試験結果をクラウドに基づくデータベースにアップロードし、訓練用データセットをリアルタイムで更新するために使用することができる。
訓練は、畳み込みニューラルネットワークを使用して実施することができる。畳み込みニューラルネットワーク(CNN)は本明細書の他の箇所に記載されている。畳み込みニューラルネットワークは、少なくとも2つの畳み込み層を含み得る。畳み込み層の数は1~10の間であり、拡張型層の数は0~10の間である。畳み込み層の総数(入力層および出力層を含める)は、少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くであり得、拡張型層の総数は少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くであり得る。畳み込み層の総数は最大で約20、15、10、5、4、3またはそれ未満であり得、拡張型層の総数は最大で約20、15、10、5、4、3またはそれ未満であり得る。一部の実施形態では、畳み込み層の数は1~10の間であり、全結合層の数は0~10の間である。畳み込み層の総数(入力層および出力層を含める)は、少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くであり得、全結合層の総数は少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くであり得る。畳み込み層の総数は最大で約20、15、10、5、4、3またはそれ未満であり得、全結合層の総数は最大で約20、15、10、5、4、3またはそれ未満であり得る。
畳み込みニューラルネットワークは、少なくとも1つのバッチ正規化ステップを含み得る。バッチ正規化層により、ニューラルネットワークの性能および安定性を改善することができる。バッチ正規化層では、ニューラルネットワーク内の任意の層にゼロ平均/単位分散である入力をもたらすことができる。バッチ正規化層の総数は、少なくとも約3、4、5、10、15、20またはそれよりも多くであり得る。バッチ正規化層の総数は、最大で約20、15、10、5、4、3またはそれ未満であり得る。
畳み込みニューラルネットワークは、少なくとも1つの空間ドロップアウトステップを含み得る。空間ドロップアウトステップの総数は、少なくとも約3、4、5、10、15、20またはそれよりも多くであり得、また、空間ドロップアウトステップの総数は、最大で約20、15、10、5、4、3またはそれ未満であり得る。
畳み込みニューラルネットワークは、少なくとも1つグローバル最大プーリングステップを含み得る。グローバルプーリング層では、1つの層におけるニューロンクラスターの出力を組み合わせて単一のニューロンにして次の層に入れることができる。例えば、最大プーリング層では、前の層におけるニューロンのクラスターの各々からの最大値を使用することができ、平均プーリング層では、前の層におけるニューロンのクラスターの各々からの平均値を使用することができる。畳み込みニューラルネットワークは、少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くのグローバル最大プーリングステップを含み得る。畳み込みニューラルネットワークは、最大で約20、15、10、5、4、3またはそれ未満のグローバル最大プーリングステップを含み得る。
畳み込みニューラルネットワークは、少なくとも1つの高密度層を含み得る。畳み込みニューラルネットワークは、少なくとも約1、2、3、4、5、10、15、20、またはそれよりも多くの高密度層を含み得る。畳み込みニューラルネットワークは、最大で約20、15、10、5、4、3またはそれ未満の高密度層を含み得る。
治療方法
腫瘍特異的ペプチドを使用した個別化免疫治療が記載されている。悪性細胞内の遺伝子変化(例えば、逆位、転座、欠失、ミスセンス変異、スプライス部位変異など)の結果として生じる腫瘍新抗原は、最も腫瘍特異的なクラスの抗原を表す。新抗原は、同定、最適化された抗原の選択、およびワクチンまたは免疫原性組成物に使用するための新抗原の産生が技術的に難しいことから、がんワクチンまたは免疫原性組成にはめったに使用されていない。免疫原として利用する特定のペプチドの効率的な選択には、いずれの腫瘍特異的ペプチドが患者に存在するHLA対立遺伝子に効率的に結合するかおよび抗腫瘍免疫の誘導のために患者の免疫系に有効に提示されるかを予測できることが必要である。治癒的かつ腫瘍特異的免疫治療を開発するための極めて重要な関門の1つは、自己免疫を回避するために、高度に特異的かつ制限された腫瘍抗原を同定および選択することである。これは、免疫治療のための候補腫瘍特異的ペプチドがMHCクラスII抗原によって提示されるものである場合に、MHCクラスII-ペプチド結合および免疫系への提示にある特定のレベルの柔軟なプロミスキャス性が存在するので、特に重要である。同時に、MHCクラスIIにより提示されるペプチドは、細胞傷害性細胞の活性化だけでなくCD4+veメモリーT細胞の活性化にも必要である。したがって、MHCクラスII媒介性免疫原性応答は、頑強な、腫瘍からの保護における大きな効果のための長期の免疫原性をもたらすために必要である。これらの問題には、信頼できるペプチド-MHC予測アルゴリズムを有すること、ならびにペプチド-MHC相互作用および免疫原性をアッセイおよび検証するための信頼できるシステムを有することによって対処することができる。したがって、一部の実施形態では、高度に効率的かつ免疫原性のがんワクチンを、DNAレベルで腫瘍には存在するが高い割合のがんを有する対象由来の対応する生殖細胞系列試料には存在しない、新形成/腫瘍における候補変異を同定し、同定された変異を1つまたは複数のペプチド-MHC結合予測アルゴリズムを用いて解析して、いずれのMHC(ヒト白血球抗原またはヒトの場合HLA)が高い割合の患者HLA対立遺伝子に結合するかを同定し、高い割合のがんを有する対象を処置するために適したがんワクチンまたは免疫原性組成物への使用のための、全ての新抗原ペプチドおよび予測された結合性ペプチドのセットから選択された複数の新抗原性ペプチドを合成することによって作製することができる。
例えば、ペプチド配列決定情報を治療ワクチンに変換することは、高い割合の個体のHLAペプチドに結合し得る変異ペプチドの予測を含み得る。免疫原として利用する特定の変異の効率的な選択には、いずれの変異ペプチドが高い割合の患者のHLA対立遺伝子に効率的に結合するかを予測できることが必要である。最近、検証された結合性ペプチドおよび非結合性ペプチドを用いたニューラルネットワークに基づく学習手法により、主要なHLA-AおよびHLA-B対立遺伝子に関する予測アルゴリズムの正確度が進歩した。しかし、進歩したニューラルネットワークに基づくアルゴリズムの使用はHLA-ペプチド結合規則を符号化することには役立っているが、いくつかの因子により、HLA対立遺伝子に提示されるペプチドの予測力が限定されている。
例えば、ペプチド配列決定情報を治療ワクチンに変換することは、薬物を長いペプチドの多エピトープワクチンとして製剤化することを含み得る。事実上できる限り多くの変異エピトープを標的とすることにより、免疫系の巨大な能力が活用され、免疫標的化遺伝子産物のダウンモジュレーションによって免疫学的エスケープの機会が防止され、エピトープ予測手法の公知の不正確さが補償される。合成ペプチドにより、多数の免疫原を効率的に調製するため、および変異体エピトープの同定を有効なワクチンに迅速に変換するための有用な手段がもたらされる。ペプチドは、細菌または動物性物質が夾雑していない試薬を利用して容易に化学合成することおよび容易に精製することができる。サイズが小さいことにより、タンパク質の変異領域に明確に焦点を当てることが可能になり、また、他の構成成分(変異していないタンパク質またはウイルスベクター抗原)に由来する無関連の抗原性競合も低減する。
例えば、ペプチド配列決定情報を治療ワクチンに変換することは、強力なワクチンアジュバントとの組合せを含み得る。有効なワクチンには、免疫応答を開始するために強力なアジュバントが必要になり得る。例えば、TLR3ならびにMDA5およびRIG3のRNAヘリカーゼ-ドメインのアゴニストであるポリ-ICLCは、ワクチンアジュバントとしてのいくつかの望ましい特性が示されている。これらの特性としては、in vivoにおける免疫細胞の局所的な活性化および全身性の活性化の誘導、刺激性ケモカインおよびサイトカインの産生、ならびにDCによる抗原提示の刺激が挙げられる。さらに、ポリ-ICLCにより、ヒトにおける長続きするCD4+およびCD8+応答を誘導することができる。重要なことに、ポリ-ICLCを用いたワクチン接種を受けた対象と高度に有効な複製コンピテント黄熱病ワクチンを受けた志願者で転写およびシグナルトランスダクション経路の上方制御の著しい類似性が認められた。さらに、最近の第1相試験において、ポリ-ICLCとNYESO-1ペプチドワクチン(モンタニドに加えて)の組合せを用いて免疫化した卵巣癌患者の>90%でCD4+ T細胞およびCD8+ T細胞の誘導、ならびにペプチドに対する抗体応答が示された。同時に、ポリ-ICLCは現在までに25件を超える臨床試験において広範囲にわたって試験されており、比較的良性の毒性プロファイルが示されている。
一部の実施形態では、免疫原性ペプチドを疾患または状態を有する対象由来の細胞から同定することができる。一部の実施形態では、免疫原性ペプチドは、疾患または状態を有する対象に対して特異的なものであり得る。一部の実施形態では、免疫原性ペプチドは、疾患または状態を有する対象のHLAハプロタイプと適合するHLAに結合し得る。
一部の実施形態では、ペプチドのライブラリーを細胞において発現させることができる。一部の実施形態では、細胞は、同定されるまたは特徴付けられるペプチドを含む。一部の実施形態では、同定されるまたは特徴付けられるペプチドは、内因性ペプチドである。一部の実施形態では、ペプチドは、外因性ペプチドである。例えば、同定されるまたは特徴付けられるペプチドを、ペプチドのライブラリーをコードする複数の配列から発現させることができる。
本明細書の開示前に、HLAペプチドームに関する大多数のLC-MS/MS試験で多数のHLAペプチドを発現する細胞が使用されており、これには、既存のバイオインフォマティクス予測器または「逆畳み込み」を使用してペプチを最大6種のHLAクラスI対立遺伝子のうちの1種に割り当てることが必要である(Bassani-Sternberg and Gfeller, 2016)。したがって、既知のモチーフに密接に適合しないペプチドは、所与のHLA対立遺伝子に対する結合体として確信的に報告することができない。
個体のHLAペプチドに結合し得る変異ペプチドなどのペプチドの予測方法が本明細書で提供される。一部の実施形態では、本出願は、抗原を含むペプチドの所与のセットから、対象に対する免疫原性組成物を調製するために最も適したペプチドを同定する方法であって、ペプチドの所与のセットから、対象のHLAタンパク質に結合することができる複数のペプチドを選択することを含み、HLAタンパク質に結合する前記能力が、ペプチドの配列を、前記対象のHLA-対立遺伝子の各々に対して特異的なHLA結合性ペプチドに対応するペプチド配列データベースを用いて訓練された機械を用いて解析することによって決定される、方法を提供する。抗原を含むペプチドの所与のセットから、対象に対する免疫原性組成物を調製するために最も適したペプチドを同定する方法であって、ペプチドの所与のセットから、対象のHLAタンパク質に結合することができるものと決定された複数のペプチドを選択することを含み、HLAタンパク質に結合する能力が、ペプチドの配列を、本明細書において上に記載されている方法を行うことによって得られたペプチド配列データベースを用いて訓練された機械を用いて解析することによって決定される、方法が本明細書で提供される。したがって、一部の実施形態では、本開示は、対象特異的免疫原性組成物を調製するための複数の対象特異的ペプチドを同定する方法であって、対象が腫瘍を有し、対象特異的ペプチドが、対象および対象の腫瘍に特異的であり、対象の腫瘍の試料および対象の非腫瘍試料の配列決定を行うステップと、核酸配列決定に基づいて、対象のがん細胞のゲノムには存在するが対象由来の正常な組織には存在しない非サイレント変異、および対象のHLA遺伝子型を決定するステップと、同定された非サイレント変異から複数の対象特異的ペプチドを選択するステップであって、複数の対象特異的ペプチドの各々が、対象の腫瘍に特異的な異なる腫瘍エピトープを有し、各々が、本明細書に記載のHLA結合を予測するための方法において非サイレント変異に由来するペプチドの配列を解析することによって決定して、対象のHLAタンパク質に結合することができるものと同定される、ステップとを含む方法を提供する。
一部の実施形態では、個体に特異的なHLA-ペプチド複合体を特徴付ける方法が本明細書に開示される。
一部の実施形態では、個体に特異的なHLA-ペプチド複合体を特徴付ける方法を使用して、状態または疾患を有する対象などの、それを必要とする個体における免疫治療薬を開発する。
哺乳動物において抗腫瘍免疫もたらす方法であって、哺乳動物に、記載の方法に従って同定されたペプチドをコードする配列を含むポリ核酸を投与することを含む方法が本明細書で提供される。哺乳動物において抗腫瘍免疫もたらす方法であって、哺乳動物に、本明細書に記載の方法に従って同定されたペプチドの配列を有するペプチドを有効量で投与することを含む方法が本明細書で提供される。哺乳動物において抗腫瘍免疫もたらす方法であって、哺乳動物に、本明細書に記載の方法に従って同定されたペプチドの配列を含むペプチドを含む細胞を投与することを含む方法が本明細書で提供される。哺乳動物において抗腫瘍免疫もたらす方法であって、哺乳動物に、本明細書に記載の方法に従って同定されたペプチドの配列を含むペプチドをコードする配列を含むポリ核酸を含む細胞を投与することを含む方法が本明細書で提供される。一部の実施形態では、細胞は、ペプチドをHLA-ペプチド複合体として提示する。
対象における疾患または障害を処置する方法であって、対象に、本明細書に記載の方法に従って同定されたペプチドをコードする配列を含むポリ核酸を投与することを含む方法が本明細書で提供される。対象における疾患または障害を処置する方法であって、対象に、本明細書に記載の方法に従って同定されたペプチドの配列を含むペプチドを有効量で投与することを含む方法が本明細書で提供される。対象における疾患または障害を処置する方法であって、対象に、本明細書に記載の方法に従って同定されたペプチドの配列を含むペプチドを含む細胞を投与することを含む方法が本明細書で提供される。対象における疾患または障害を処置する方法であって、対象に、本明細書に記載の方法に従って同定されたペプチドの配列を含むペプチドをコードする配列を含むポリ核酸を含む細胞を投与することを含む方法が本明細書で提供される。一部の実施形態では、疾患または障害は、がんである。一部の実施形態では、方法は、免疫チェックポイント阻害剤を対象に投与することをさらに含む。
一部の実施形態では、それを必要とする個体に対する免疫治療薬を、HLA-ペプチド複合体を特徴付けることによって開発する方法であって、a)それを必要とする個体に由来する細胞の集団を準備するステップであって、細胞の集団のうちの1つまたは複数の細胞が、親和性アクセプターでタグ付けされたHLAクラスIまたはHLAクラスII対立遺伝子をコードする配列を含むポリ核酸を含み、親和性アクセプターでタグ付けされたHLAをコードする配列が、i)組換えHLAクラスIまたはHLAクラスII対立遺伝子をコードする配列と、それと作動可能に連結したii)親和性アクセプターペプチドをコードする配列とを含む、ステップと、b)細胞の集団の1つまたは複数の細胞のうちの少なくとも1つの細胞において、親和性アクセプターでタグ付けされたHLAを発現させ、それにより、少なくとも1つの細胞において親和性アクセプターでタグ付けされたHLA-ペプチド複合体を形成するステップと、c)親和性アクセプターでタグ付けされたHLA-ペプチド複合体を富化するステップと、それを必要とする個体に特異的なHLA-ペプチド複合体を特徴付けるステップと、d)それを必要とする個体に特異的なHLA-ペプチド複合体に基づく免疫治療薬を開発するステップとを含み、個体が、疾患または状態を有する、方法が本明細書に開示される。
一部の実施形態では、免疫治療薬は、核酸またはペプチド治療薬である。
一部の実施形態では、方法は、1つまたは複数のペプチドを細胞の集団に導入することを含む。一部の実施形態では、方法は、細胞の集団に1つもしくは複数のペプチドを接触させることまたは細胞の集団において1つもしくは複数のペプチドを発現させることを含む。一部の実施形態では、方法は、細胞の集団に1つまたは複数のペプチドをコードする1つまたは複数の核酸を接触させることを含む。
一部の実施形態では、方法は、患者特異的HLAに関連して同定されたペプチドに基づく免疫治療薬を開発することを含む。一部の実施形態では、細胞の集団は、それを必要とする個体に由来するものである。
一部の実施形態では、方法は、細胞の集団においてペプチドのライブラリーを発現させることを含む。一部の実施形態では、方法は、親和性アクセプターでタグ付けされたHLA-ペプチド複合体のライブラリーを発現させることを含む。一部の実施形態では、ライブラリーは、疾患または状態に関連するペプチドのライブラリーを含む。一部の実施形態では、疾患または状態は、がんまたは感染因子による感染症または自己免疫疾患である。一部の実施形態では、方法は、細胞の集団のうちの1つまたは複数の細胞に感染因子またはその一部を導入することを含む。一部の実施形態では、方法は、それを必要とする個体に特異的なHLA-ペプチド複合体由来の1つまたは複数のペプチドを特徴付けることを含み、必要に応じて、ペプチドは、感染因子または自己免疫疾患の1つまたは複数の標的タンパク質に由来するものである。一部の実施形態では、方法は、感染因子または自己免疫疾患の1つまたは複数の標的タンパク質由来のペプチドの1つまたは複数の領域を特徴付けることを含む。一部の実施形態では、方法は、感染因子または自己免疫疾患に由来するHLA-ペプチド複合体由来のペプチドを同定することを含む。
一部の実施形態では、感染因子は、病原体である。一部の実施形態では、病原体は、ウイルス、細菌、または寄生生物である。
一部の実施形態では、ウイルスは、BKウイルス(BKV)、デングウイルス(DENV-1、DENV-2、DENV-3、DENV-4、DENV-5)、サイトメガロウイルス(CMV)、B型肝炎ウイルス(HBV)、C型肝炎ウイルス(HCV)、エプスタイン・バーウイルス(EBV)、アデノウイルス、ヒト免疫不全ウイルス(HIV)、ヒトT細胞リンパ増殖性ウイルス(HTLV-1)、インフルエンザウイルス、RSV、HPV、狂犬病、流行性耳下腺炎風疹ウイルス、ポリオウイルス、黄熱病、A型肝炎、B型肝炎、ロタウイルス、水痘ウイルス、ヒトパピローマウイルス(HPV)、天然痘、帯状疱疹、およびこれらの組合せからなる群から選択される。
一部の実施形態では、細菌は、Klebsiella spp.、Tropheryma whipplei、Mycobacterium leprae、Mycobacterium lepromatosis、およびMycobacterium tuberculosisからなる群から選択される。一部の実施形態では、細菌は、腸チフス、肺炎球菌、髄膜炎菌、ヘモフィルスB、炭疽、破傷風トキソイド、血清群B髄膜炎菌、bcg、コレラ、およびこれらの組合せからなる群から選択される。
一部の実施形態では、寄生生物は、蠕虫または原生動物である。一部の実施形態では、寄生生物は、Leishmania spp.(例えば、L.major、L.infantum、L.braziliensis、L.donovani、L.chagasi、L.mexicana)、Plasmodium spp.(例えば、P.falciparum、P.vivax、P.ovale、P.malariae)、Trypanosoma cruzi、Ascaris lumbricoides、Trichuris trichiura、Necator americanus、およびSchistosoma spp.(S.mansoni、S.haematobium、S.japonicum)からなる群から選択される。
一部の実施形態では、免疫治療薬は、工学的に作製された受容体である。一部の実施形態では、工学的に作製された受容体は、キメラ抗原受容体(CAR)、T細胞受容体(TCR)、またはB細胞受容体(BCR)、養子T細胞治療(ACT)、またはそれらの誘導体である。他の態様では、工学的に作製された受容体は、キメラ抗原受容体(CAR)である。一部の態様では、CARは、第1世代CARである。他の態様では、CARは、第2世代CARである。さらに他の態様では、CARは、第3の世代CARである。
一部の態様では、CARは、細胞外部分、膜貫通部分、および細胞内部分を含む。一部の態様では、細胞内部分は、少なくとも1つのT細胞共刺激ドメインを含む。一部の態様では、T細胞共刺激ドメインは、CD27、CD28、TNFRS9(4-1BB)、TNFRSF4(OX40)、TNFRSF8(CD30)、CD40LG(CD40L)、ICOS、ITGB2(LFA-1)、CD2、CD7、KLRC2(NKG2C)、TNFRS18(GITR)、TNFRSF14(HVEM)、またはこれらの任意の組合せからなる群から選択される。
一部の態様では、工学的に作製された受容体は、標的に結合する。一部の態様では、結合は、疾患または状態に罹患している個体に特異的なHLA-ペプチド複合体を特徴付ける方法で同定されたペプチドに特異的なものである。
一部の態様では、免疫治療薬は、本明細書に詳細に記載されている細胞である。一部の態様では、免疫治療薬は、疾患または状態に罹患している個体に特異的なHLA-ペプチド複合体を特徴付ける方法で同定されたペプチドに特異的に結合する受容体を含む細胞である。一部の態様では、免疫治療薬は、本発明のペプチド/核酸と組み合わせて使用される細胞である。一部の実施形態では、細胞は、患者の細胞である。一部の実施形態では、細胞は、T細胞である。一部の実施形態では、細胞は、腫瘍浸潤性リンパ球である。
一部の態様では、状態または疾患を有する対象を、対象のT細胞受容体レパートリーに基づいて処置する。一部の実施形態では、抗原ワクチンを対象のT細胞受容体レパートリーに基づいて選択する。一部の実施形態では、対象を、本明細書に記載の方法を使用して同定された抗原またはペプチドに特異的なTCRを発現するT細胞を用いて処置する。一部の実施形態では、対象を、TCR、例えば対象特異的TCRに特異的な、本明細書に記載の方法を使用して同定された抗原またはペプチドを用いて処置する。一部の実施形態では、対象を、TCR、例えば対象特異的TCRを発現するT細胞に特異的な、本明細書に記載の方法を使用して同定された抗原またはペプチドを用いて処置する。一部の実施形態では、対象を、対象特異的TCRに特異的な、本明細書に記載の方法を使用して同定された抗原またはペプチドを用いて処置する。
一部の実施形態では、免疫原性抗原組成物またはワクチンを、対象において同定されたTCRに基づいて選択する。一実施形態では、T細胞レパートリーを同定することおよびそれを機能アッセイにおいて試験することを使用して、状態または疾患を有する対象に投与する免疫原性組成物またはワクチンを決定する。一部の実施形態では、免疫原性組成物は、抗原ワクチンである。一部の実施形態では、抗原ワクチンは、対象特異的抗原ペプチドを含む。一部の実施形態では、抗原ワクチンに含める抗原ペプチドを、抗原に結合する対象特異的TCRの数量化に基づいて選択する。一部の実施形態では、抗原ペプチドを、ペプチドのTCRに対する結合親和性に基づいて選択する。一部の実施形態では、選択は、数量および結合親和性の組合せに基づく。例えば、機能アッセイでは抗原に強力に結合するが、TCRレパートリーに高度には表されないTCRは、TCRを発現するT細胞は有利に増幅されるので、抗原ワクチンの良好な候補でありうる。
一部の実施形態では、抗原を、TCRへの結合に基づいて、対象への投与のために選択する。一部の実施形態では、疾患または状態を有する対象由来のT細胞などのT細胞を増大させることができる。本明細書に記載の方法を使用して同定された免疫原性抗原ペプチドに特異的なTCRを発現する増大したT細胞を対象に投与し戻すことができる。一部の実施形態では、適切な細胞、例えば、PBMCに、本明細書に記載の方法を使用して同定された免疫原性抗原ペプチドに特異的なTCRを発現させるためのポリヌクレオチドを形質導入またはトランスフェクトし、それを対象に投与する。本明細書に記載の方法を使用して同定された免疫原性抗原ペプチドに特異的なTCRを発現するT細胞を増大させ、対象に投与し戻すことができる。一部の実施形態では、自己患部組織と一緒にインキュベートした場合に細胞溶解活性をもたらす、本明細書に記載の方法を使用して同定された免疫原性抗原ペプチドに特異的なTCRを発現するT細胞を増大させ、対象に投与することができる。一部の実施形態では、本明細書に記載の方法を使用して同定された免疫原性抗原ペプチドへの結合をもたらす、機能アッセイに使用されるT細胞を増大させ、対象に投与することができる。一部の実施形態では、本明細書に記載の方法を使用して同定された対象特異的免疫原性抗原ペプチドに結合することが決定されたTCRをT細胞において発現させ、対象に投与することができる。
本明細書に記載の方法は、腫瘍または病原体に関連する抗原などの選択された抗原に特異的なT細胞などの免疫系細胞の養子移入を伴い得る。例えば、本明細書に記載の方法を使用して同定された免疫原性抗原ペプチドに対する特異性を有する新しいTCR αおよびβ鎖を導入することによってT細胞受容体(TCR)の特異性を変更することによりT細胞を遺伝子改変するために種々の戦略を使用することができる(例えば、米国特許第8,697,854号;PCT特許公報第WO2003020763号、同第WO2004033685号、同第WO2004044004号、同第WO2005114215号、同第WO2006000830号、同第WO2008038002号、同第WO2008039818号、同第WO2004074322号、同第WO2005113595号、同第WO2006125962号、同第WO2013166321号、同第WO2013039889号、同第WO2014018863号、同第WO2014083173号;米国特許第8,088,379号を参照されたい)。
キメラ抗原受容体(CAR)を使用して、多種多様な受容体キメラ構築物を有する、本明細書に記載の方法を使用して同定された免疫原性抗原ペプチドのような選択された標的に特異的なT細胞などの免疫応答性細胞を生成することができる(例えば、米国特許第5,843,728号;同第5,851,828号;同第5,912、170号;同第6,004,811号;同第6,284,240号;同第6,392,013号;同第6,410,014号;同第6,753,162号;同第8,211,422号;および、PCT公開第W09215322号を参照されたい)。代替CAR構築物を次に続く世代に属するものとして特徴付けることができる。第1世代CARは、一般には、抗原に特異的な抗体の単鎖可変断片からなり、例えば、柔軟なリンカーによって、例えばCD8aヒンジドメインおよびCD8a膜貫通ドメインによって、CD3ζまたはFcRyまたはscFv-FcRyのいずれかの膜貫通および細胞内シグナル伝達ドメインに連結した、特異的な抗体のVHと連結したVLを含む(例えば、米国特許第7,741,465号;米国特許第5,912,172号;米国特許第5,906,936号を参照されたい)。第2世代CARでは、CD28、OX40(CD134)、または4-1BB(CD137)などの1つまたは複数の共刺激分子の細胞内ドメインをエンドドメイン内に組み入れる。例えば、scFv-CD28/OX40/4-lBB-CD3(例えば、米国特許第8,911,993号;同第8,916,381号;同第8,975,071号;同第9,101,584号;同第9,102,760号;同第9,102,761号を参照されたい)。第3世代CARは、共刺激エンドドメイン、例えばCD3C鎖、CD97、GDI la-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB、またはCD28シグナル伝達ドメイン、例えば、scFv-CD28-4-lBB-CD3CまたはscFv-CD28-OX40-CD3Qの組合せを含む(例えば、米国特許第8,906,682号;米国特許第8,399,645号;米国特許第5,686,281号;PCT公開第WO2014134165号;PCT公開第WO2012079000号を参照されたい)。一部の実施形態では、共刺激を、例えば、プロフェッショナル抗原提示細胞上の抗原との相互作用後に、共刺激で活性化され、増大するように選択された抗原特異的T細胞においてCARを発現させることによって調和させることができる。例えば、T細胞攻撃の標的化を改善するため、および/または副作用を最小限にするために、追加的な工学的に作製された受容体を免疫応答性細胞に提供することができる。
プロトプラスト融合、リポフェクション、トランスフェクションまたは電気穿孔などの代替技法を使用して、標的免疫応答性細胞を形質転換することができる。例えば、CD3ζおよびCD28またはCD137のいずれかを通じた第2世代抗原特異的CARシグナル伝達を使用してCARを導入するために、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター、プラスミドまたはSleeping Beautyトランスポゾンなどのトランスポゾンなどの多種多様なベクターを使用することができる(米国特許第6,489,458号;同第7,148,203号;同第7,160,682号;同第7,985,739号;同第8,227,432号を参照されたい)。ウイルスベクターとしては、例えば、HIV、SV40、EBV、HSVまたはBPVに基づくベクターを挙げることができる。
形質転換の標的とされる細胞としては、例えば、T細胞、ナチュラルキラー(NK)細胞、細胞傷害性Tリンパ球(CTL)、調節性T細胞、ヒト胚性幹細胞、腫瘍浸潤リンパ球(TIL)またはリンパ系細胞が分化し得る多能性幹細胞を挙げることができる。所望のCARを発現するT細胞は、例えば、がん抗原と共刺激分子を同時発現するγ線照射した活性化および増殖細胞(APC)と共培養することによって選択することができる。工学的に操作されたCAR T細胞を、例えば、IL-2およびIL-21などの可溶性因子の存在下でAPCと共培養することによって増大させることができる。増大は、例えば、メモリーCAR T細胞がもたらされるように行うことができる(例えば、非酵素的デジタルアレイおよび/またはマルチパネルフローサイトメトリーによってアッセイすることができる)。このように、抗原を有する腫瘍に対する特定の細胞傷害活性を有するCAR T細胞をもたらすことができる(必要に応じてインターフェロン-γなどの所望のケモカインの産生と併せて)。この種類のCAR T細胞は、例えば、動物モデルにおいて、例えば、腫瘍異種移植片に脅威を与えるために使用することができる。
前述のものなどの手法を適合させて、例えば、選択された抗原に結合する受容体を認識する抗原を含む免疫応答性細胞を有効量で投与することによって新形成または病原性感染症などの疾患を有する対象を処置し、かつ/またはその生存を増大させる方法であって、結合により、免疫応答性細胞が活性化され、それにより、疾患(例えば、新形成、病原体感染症、自己免疫障害、または同種移植反応など)が処置または防止される、方法をもたらすことができる。CAR T細胞治療における投薬は、例えば、1kg当たり106個から109個までの細胞を、例えばシクロホスファミドを用いたリンパ球枯渇の過程を伴ってまたは伴わずに投与することを伴い得る。
可能性のある有害反応から守るために、工学的に操作された免疫応答性細胞に、トランスジェニック安全スイッチを、細胞を特定のシグナルへの曝露を受けやすくする導入遺伝子の形態で備えることができる。例えば、単純ヘルペスウイルスチミジンキナーゼ(TK)遺伝子を、例えば、幹細胞移植後のドナーリンパ球輸注として使用される同種異系のTリンパ球に導入することにより、このように使用することができる。そのような細胞では、ガンシクロビルまたはアシクロビルなどのヌクレオシドプロドラッグの投与により、細胞死が引き起こされる。代替安全スイッチ構築物としては、例えば2つの非機能性icasp9分子と一緒にして活性な酵素を形成する小分子二量体形成剤の投与によって誘発される誘導性カスパーゼ9が挙げられる。細胞増殖制御をインプリメントするための多種多様な代替手法が記載されている(例えば、米国特許出願公開第20130071414号;PCT特許公報第WO2011146862号;PCT特許公報第WO201401 1987号;PCT特許公報第WO2013040371号を参照されたい)。養子治療のさらなる精密化では、代替インプリメンテーション、例えば、編集されたCAR T細胞の提供のために、ゲノム編集を使用して免疫応答性細胞を調整することができる。
細胞治療法は、T細胞のex vivoにおける活性化および増大も伴い得る。一部の実施形態では、T細胞を、それを必要とする対象に投与する前に活性化することができる。これらの型の処置の例としては、腫瘍浸潤性リンパ球(TIL)細胞(米国特許第5,126,132号を参照されたい)、細胞傷害性T細胞(米国特許第6,255,073号;および米国特許第5,846,827号を参照されたい)、増大させた腫瘍流入領域リンパ節細胞(米国特許第6,251,385号を参照されたい)、および種々の他のリンパ球調製物(米国特許第6,194,207号;米国特許第5,443,983号;米国特許第6,040,177号;および米国特許第5,766,920号を参照されたい)の使用が挙げられる。
ex vivo活性化T細胞集団は、がん、感染性疾患、または他の病的状態、例えば、自己免疫疾患の状態に対する免疫応答を最大限に調整する状態にあり得る。活性化のためには、少なくとも2つのシグナルがT細胞に送達され得る。第1のシグナルは、通常、T細胞表面上のT細胞受容体(TCR)を通じて送達される。TCRによる第1のシグナルは、通常、TCRが抗原提示細胞(APC)の表面上にMHC複合体と併せて発現されたペプチド抗原と相互作用すると誘発される。第2のシグナルは、通常、T細胞の表面上の共刺激受容体を通じて送達される。共刺激受容体は、一般に、APCの表面上に発現される対応するリガンドまたはサイトカインによって誘発される。
本明細書に記載の方法を使用して同定された免疫原性抗原ペプチドに特異的なT細胞を得、疾患を処置または防止する方法に使用することができることが意図されている。この点について、本開示は、対象における疾患または状態を処置または防止する方法であって、対象に、本明細書に記載の方法を使用して同定された免疫原性抗原ペプチドに特異的な細胞を含む細胞集団を、対象における疾患を処置または防止するために有効な量で投与することを含む方法を提供する。一部の実施形態では、対象における疾患を処置または防止する方法は、疾患反応性T細胞を富化させた細胞集団を対象に、哺乳動物におけるがんを処置または防止するために有効な量で投与することを含む。細胞は、対象にとって同種異系または自己の細胞であり得る。
本開示は、対象に抗原性ペプチドまたはワクチンを投与することにより、対象における疾患特異的免疫応答を誘導する、疾患に対するワクチン接種を行う、対象における疾患の症状を処置および/または緩和する方法をさらに提供する。
本開示のペプチドまたは組成物は、CTL応答を誘導するために十分な量で投与することができる。抗原性ペプチドまたはワクチン組成物を、単独で、または他の治療剤と組み合わせて投与することができる。例示的な治療剤としては、これだけに限定されないが、化学療法薬または生物学的治療薬作用物質、放射線、または免疫治療が挙げられる。特定の疾患に対する任意の適切な治療的処置を施行することができる。化学療法薬および生物学的治療剤の例としては、これだけに限定されないが、アルデスロイキン、アルトレタミン、アミホスチン、アスパラギナーゼ、ブレオマイシン、カペシタビン、カルボプラチン、カルムスチン、クラドリビン、シサプリド、シスプラチン、シクロホスファミド、シタラビン、ダカルバジン(DTIC)、ダクチノマイシン、ドセタキセル、ドキソルビシン、ドロナビノール、エポエチンアルファ、エトポシド、フィルグラスチム、フルダラビン、フルオロウラシル、ゲムシタビン、グラニセトロン、ヒドロキシウレア、イダルビシン、イホスファミド、インターフェロンアルファ、イリノテカン、ランソプラゾール、レバミソール、ロイコボリン、メゲストロール、メスナ、メトトレキサート、メトクロプラミド、マイトマイシン、ミトタン、ミトキサントロン、オメプラゾール、オンダンセトロン、パクリタキセル(Taxol(登録商標))、ピロカルピン、プロクロルペラジン、リツキシマブ、タモキシフェン、タキソール、トポテカン塩酸塩、トラスツズマブ、ビンブラスチン、ビンクリスチンおよび酒石酸ビノレルビンが挙げられる。さらに、対象に、抗免疫抑制性剤または免疫賦活性剤をさらに投与することができる。例えば、対象に、抗CTLA抗体または抗PD-1または抗PD-L1をさらに投与することができる。
ワクチン組成物に含められる各ペプチドの量および投薬レジメンは、当業者が決定することができる。例えば、ペプチドまたはそのバリアントを静脈内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹腔内(i.p.)注射、筋肉内(i.m.)注射用に調製することができる。ペプチド注射の典型的な方法としては、s.c、i.d.、i.p.、i.m.、およびi.v.が挙げられる。DNA注射の典型的な方法としては、i.d.、i.m.、s.c、i.p.およびi.v.が挙げられる。ワクチン組成物の他の投与方法は当業者に公知である。
医薬組成物を、組成物中に存在するペプチドの選択、数および/または量が疾患および/または患者特異的になるようにコンパイルすることができる。例えば、ペプチドの正確な選択を、副作用を回避するために、所与の組織における親タンパク質の発現パターンによってガイドすることができる。選択は、疾患の特定の型、疾患の状態、以前の処置レジメン、患者の免疫の状態、および患者のHLA-ハプロタイプに依存的なものであり得る。さらに、本開示によるワクチンは、特定の患者の個人的な必要性に応じて個別化された構成成分を含有し得る。例としては、特定の患者における関連する抗原の発現に応じて変動するペプチドの量、個人的なアレルギーまたは他の処置に起因する望ましくない副作用、および処置の第1のラウンドまたはスキームの後の二次的処置のための調整が挙げられる。
コンピュータ制御システム
本開示は、本開示の方法をインプリメントするようにプログラムされたコンピュータ制御システムを提供する。図10は、機械学習HLA-ペプチド提示モデルの訓練を行うようにプログラムされたまたは他のやり方で構成されたコンピュータシステム(1001)を示す。コンピュータシステム(1001)により、例えば、アミノ酸位置情報を入力すること、帰属情報をデータセットに移行すること、およびデータセットを用いて訓練されたアルゴリズムを生成することなどの本開示の種々の態様を調節することができる。コンピュータシステム(1001)は、ユーザー電子デバイスまたは遠隔コンピュータシステムであり得る。電子デバイスは、モバイル電子デバイスであり得る。
コンピュータシステム(1001)は、中央処理装置(CPU、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも)(1005)を含み、これは、逐次的処理または並行処理のいずれかによるシングルコアプロセッサまたはマルチコアプロセッサであり得る。コンピュータシステム(1001)はまた、メモリユニットまたはデバイス(1010)(例えば、ランダムアクセスメモリー、リードオンリーメモリー、フラッシュメモリ)、ストレージユニット(1015)(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース(1020)(例えば、ネットワークアダプター)、ならびに、プリンター、モニター、USBドライブおよび/またはCD-ROMドライブなどの、外付けまたは内蔵のいずれかまたはその両方の周辺機器(1025)も含む。メモリ(1010)、ストレージユニット(1015)、インターフェース(1020)および周辺機器(1025)は、CPU(1005)と、マザーボードなどの通信バス(実線)を通じて通信する。ストレージユニット(1015)は、データを記憶させるためのデータストレージユニット(またはデータリポジトリ)であり得る。コンピュータシステム(1001)は、コンピュータネットワーク(「ネットワーク」)(1030)に通信インターフェース(1020)を活用して作動可能にカップリングすることができる。ネットワーク(1030)は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信したイントラネットおよび/もしくはエクストラネットであり得る。ネットワーク(1030)は、一部の場合では、電気通信および/またはデータネットワークである。ネットワーク(1030)は、分散コンピューティングを支持するピアツーピアネットワークを可能にすることができる1つまたは複数のコンピュータサーバーを含み得る。ネットワーク(1030)は、一部の場合では、コンピュータシステム(1001)を活用して、コンピュータシステム(1001)とカップリングしたデバイスをクライアントまたはサーバーとして動作させることを可能にすることができるクライアント-サーバー構造をインプリメントすることができる。
CPU(1005)は、プログラムまたはソフトウェアに具体化することができる一連の機械可読指示を実行することができるものである。指示は、メモリ(1010)に記憶させることができる。指示をCPU(1005)に方向付けることができ、その後、それにより、CPU(1005)を、本開示の方法をインプリメントするようにプログラムするまたは他のやり方で構成することができる。CPU(1005)によって実施される操作の例としては、フェッチ、復号、実行およびライトバックを挙げることができる。
CPU(1005)は、集積回路などの回路の一部であり得る。システム(1001)の1つまたは複数の他の構成成分を回路に含めることができる。一部の場合では、回路は、特定用途向け集積回路(ASIC)でる。
ストレージユニット(1015)は、ドライバー、ライブラリーおよび保存プログラムなどの、ファイルを記憶することができるものである。ストレージユニット(1015)は、ユーザーデータ、例えば、ユーザー選択およびユーザープログラムを記憶することができるものである。コンピュータシステム(1001)は、例えば、一部の場合では、コンピュータシステム(1001)とイントラネットまたはインターネットを通じて通信する遠隔サーバー上に位置するものなどの、コンピュータシステム(1001)の外部の1つまたは複数の追加的なデータストレージユニットを含み得る。
コンピュータシステム(1001)は、1つまたは複数の遠隔コンピュータシステムとネットワーク(1030)を通じて通信し得る。例えば、コンピュータシステム(1001)は、遠隔コンピュータシステムまたはユーザーと通信し得る。遠隔コンピュータシステムの例としては、パーソナルコンピュータ(例えば、携帯型PC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話機、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android対応デバイス、Blackberry(登録商標))、または携帯情報端末が挙げられる。ユーザーは、コンピュータシステム(1001)にネットワーク(1030)を介してアクセスすることができる。
本明細書に記載の方法は、例えばメモリ(1010)またはデータストレージユニット(1015)などのコンピュータシステム(1001)の電子ストレージ位置に記憶された機械(例えば、コンピュータプロセッサ)により実行可能なコードによってインプリメントすることができる。機械により実行可能なまたは機械可読コードは、ソフトウェアの形態で提供することができる。使用中、コードは、プロセッサ(1005)によって実行することができる。一部の場合では、プロセッサ(1005)によりすぐにアクセスすることができるように、コードをストレージユニット(1015)から取り出し、メモリ(1010)に記憶させることができる。一部の状況では、ストレージユニット(1015)を除外することができ、機械により実行可能な命令をメモリ(1010)に記憶させる。
コードを、コードを実行するように適合させたプロセッサを有する機械での使用のためにプリコンパイルし、構成することができる、または、コードを実行時間の間にコンパイルすることができる。コードは、コードがプリコンパイル様式でまたは都度コンパイル様式で実行されることが可能になるように選択することができるプログラミング言語で供給することができる。
コンピュータシステム(1001)などの、本明細書で提供されるシステムおよび方法の態様は、プログラミングに具体化することができる。当該技術の種々の態様は、一般には、機械可読媒体の一種に保持されるまたはそれに具体化される機械(またはプロセッサ)により実行可能なコードおよび/または関連データの形態の「製品」または「製造品」と考えられ得る。機械により実行可能なコードは、ハードディスクなどのストレージユニットに、またはメモリ(例えば、リードオンリーメモリー、ランダムアクセスメモリー、フラッシュメモリ)に記憶させることができる。「ストレージ」型媒体は、コンピュータの有形メモリ、プロセッサなど、またはその関連モジュール、例えば、ソフトウェアプログラミングのために任意の時点で非一時的ストレージを提供することができる種々の半導体メモリ、テープドライブ、ディスクドライブなど、のいずれかまたは全てを含み得る。ソフトウェアの全てまたは一部は、時々、インターネットまたは種々の他の電気通信ネットワークを通じて通信することができる。そのような通信により、例えば、1つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサへの、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへのソフトウェアのローディングが可能になる。したがって、ソフトウェア要素を担持することができる別の型の媒体としては、有線および光通信線ネットワークを通じて、ならびに種々のエアリンクによって、ローカルデバイス間の物理的インターフェースを渡って使用されるものなどの光波、電波および電磁波が挙げられる。そのような波を運ぶ物理的要素、例えば、有線または無線リンク、光リンクなども、ソフトウェアを担持する媒体とみなすことができる。本明細書で使用される場合、非一時的な有形「記憶」媒体に制限される場合を除き、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行の指示を提供することに関与する任意の媒体を指す。
したがって、コンピュータで実行可能なコードなどの機械可読媒体は、これだけに限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含めた多くの形態を取り得る。非揮発性記憶媒体としては、光学ディスクまたは磁気ディスク、例えば、任意のコンピュータ(複数可)におけるストレージデバイスのいずれかなど、例えば、図に示されているデータベースなどをインプリメントするために使用することができるものなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝達媒体としては、同軸ケーブル;コンピュータシステム内のバスを構成する電線を含めた銅線および光ファイバーが挙げられる。搬送波伝送媒体は、電気もしくは電磁気シグナル、または、高周波(RF)および赤外(IR)データ通信の間に生じるものなどの音波もしくは光波の形態を取り得る。したがって、コンピュータ可読媒体の一般形態としては、例えば、フロッピー(登録商標)ディスク、フレシキブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH(登録商標)-EPROM、任意の他のメモリチップもしくはカートリッジ、搬送波伝達データもしくは指示、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータによりプログラミングコードおよび/もしくはデータを読み取ることができる任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、1つまたは複数の指示の1つまたは複数のシーケンスを実行のためにプロセッサに運ぶことに関与し得る。
コンピュータシステム(1001)は、例えば、対象のがん細胞のクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により、同定されたペプチド配列のうちの所与の配列が提示される確率を提供するためのユーザーインタフェース(UI)(1040)を含む電子ディスプレイ(1035)を含み得るまたはそれと通信し得る。UIの例としては、限定することなく、グラフィカルユーザーインターフェース(GUI)およびウェブに基づくユーザーインタフェースが挙げられる。
本開示の方法およびシステムは、1つまたは複数のアルゴリズムによってインプリメントすることができる。アルゴリズムは、中央処理装置(1005)によって実行された際に、ソフトウェアによってインプリメントすることができる。アルゴリズムは、例えば、アミノ酸位置情報を入力し、帰属情報をデータセットに移行し、データセットを用いて訓練されたアルゴリズムを生成することができるものである。
以下に提示する実施例は、単に例示する目的のものであり、本明細書に提示される特許請求の範囲を限定しない。
(実施例1)
HLA Class II結合予測器の性能
本実施例では、ヒットペプチドをランダムにシャッフリングすることによって1:19(ヒット:デコイ)の比で生成された観察された質量分析ペプチドおよびデコイペプチドを含む検証用データセットを使用して、neonmhc2(NEON)およびNetMHCIIpanの結合予測器を解析した(図4)。NEON結合予測器に関しては、示されている各MHC II対立遺伝子について別々のモデルを築いた。棒の高さは陽性適中率(PPV)を示す。対立遺伝子は、その対立遺伝子について予測した場合のモデルの性能によってソートされている。NEON結合予測器では、NetMHCIIpanと比較した場合、全ての対立遺伝子にわたってより高いPPVが示された。
本実施例では、結合予測器の検証に対するSPI閾値の影響も試験した(図5)。種々のスコア化ピーク強度(SPI)カットオフを有するペプチドのセットで訓練/検証を行った場合のHLAクラスII結合予測器の性能を示した。異なるSPIカットオフ条件を使用した:70 SPIよりも大きいまたはそれと等しい観察されたMSヒットペプチドを使用してデータセットに対して訓練および評価を行う、50 SPIよりも大きいまたはそれと等しいペプチドで訓練を行い、70 SPIよりも大きいまたはそれと等しいペプチドで検証を行う、ならびに、50 SPIよりも大きいまたはそれと等しいペプチドで訓練および検証を行う。
本実施例では、HLA-DR(USA対立遺伝子頻度)について>95%の集団カバレッジを有する35種のHLA-DR対立遺伝子についてのデータを収集して、LC-MS/MSによる対立遺伝子プロファイリングによって観察された、70スコア化ピーク強度(SPI)カットオフよりも大きいまたはそれと等しいペプチドの数を示した(図6)。
1つの例示的なセットアップでは、モデルPPV解析を、Neonmhc2プログラムについてこれまでのところ生成された各クラスII対立遺伝子についての試験区分データに適用した。試験区分データは、MSにより観察されたクラスII結合体である陽性例(例えば、ヒットサンプルペプチド)と陽性例のスクランブルバージョンである陰性例(例えば、デコイサンプルペプチド)で構成されるものであった。ヒット:デコイ比を1:19に保った、例えば、各陽性サンプルに対して、19の陰性サンプルを含め(すなわち、5%陽性サンプル)、検証のために試験区分を実施した。試験区分内のペプチドの最良スコア化5%を選択し、どの程度の分率が陽性であるかを問い合わせることによってPPVスコアを生成した。結果を図7Aに示す。
収集されたHLA-DR対立遺伝子に関して、訓練セットのサイズを増大させるとPPVの値が増加することが観察された(図7B)。
本実施例では、プロセシングに関連する変数により、予測がさらに改善された(図8)。訓練用データ区分に対して、ロジスティック回帰を当てはめて、結合強度(NetMHCIIpanまたはNeonの予測器)およびプロセシング特色(RNA-Seq発現および派生遺伝子レベルの偏り項)を使用してHLAクラスII提示を予測した。別々の評価区分に対して、MSにより観察されたMHC IIペプチド(「ヒット」)と重複するエクソンの位置をMSで観察されなかったランダムなエクソンの位置と比べてスコア化した(1:499の比)。一般に、プロセシングに関連する変数を用いたNeonでは、NetMHCIIpan、Neonの予測器、およびプロセシングに関連する変数を用いたNetMHCIIpanよりも高いPPVが示された。
(実施例2)
ニューラルネットワークアーキテクチャ
本実施例では、ニューラルネットワークを使用して、訓練用アルゴリズムを得る(図9)。入力ペプチドは20merで表され、それよりも短いペプチドは「欠損」文字が記入される。各ペプチドは31次元の埋め込みを有し、したがって、ニューラルネットワークへの入力は20×31行列であった。ニューラルネットワークによって処理する前に、20×31行列に対する特色の正規化を訓練セットにおける特色値の平均および標準偏差に基づいて実施した。第1の畳み込み層は、ReLU活性化関数を用いる9アミノ酸および50フィルター(チャネルとも称される)のカーネルを有した。この後にバッチ正規化、次いで空間ドロップアウトをドロップアウト率20%で行った。この後に、カーネル3および20フィルターおよびReLU活性化関数を用いた別の畳み込み層、次いで、再度バッチ正規化およびドロップアウト率20%での空間ドロップアウトを行った。次いで、20フィルターの各々において最大限に活性化されたニューロンを取ってグローバル最大プーリングを適用し、次いで、これらの20個の値を、シグモイド活性化関数を使用し、単一のニューロンを有する全結合(dense)層に渡した。この出力を結合/非結合予測として扱った。L2正則化をそれぞれ0.05、0.1、および0.01の重みを有する第1の畳み込み層、第2の畳み込み層、および高密度層の重みに適用した。
(実施例3)
単一対立遺伝子MHCクラスIIリガンドプロファイリングのためのスケーラブルプロトコール
MHCクラスII結合性モチーフに関する現在の知見は、2つのin vitro結合アッセイに基づくものであり得、2つのアッセイの一方は、細胞MHCを使用してEC50を算出するものであり、他方は、精製されたMHCを使用してIC50を算出するものである。主要なHLAクラスII予測アルゴリズムであるNetMHCIIpanは、これらのデータに排他的に基づいて訓練される。
限られた数のヒトHLAクラスII対立遺伝子が、ほぼ全てが15merである確認された結合性ペプチドの200より多くの例(親和性<100nM)(図12E)によって現在支持されている。これらの実験は最も一般的なコーカサス人HLA-DR対立遺伝子のみにわたり、非コーカサス人集団に特異的な対立遺伝子(例えば、HLA-DRB115:02)に関してはカバレッジが限定されており、一般的なHLA-DPおよびHLA-DQ対立遺伝子に関してはカバレッジがほぼない。現行のHLAクラスII予測性能は、一般的なコーカサス人対立遺伝子に対するものであっても、MHCクラスIの正確度に後れをとっており、ROC曲線はランダムと比べるとわずかに良好なものである。
これらの限定を考慮して、本明細書では、MSに基づく同定のために単一の対立遺伝子によってコードされるMHCタンパク質に結合するHLAクラスII結合性ペプチドの効率的な単離を可能にする、Mono-Allelic Capture by Tagged Allele capture(MAPTAC(商標))と称する新規のバイオテクノロジーを開発した(図11Aおよび11B);この手法は、HLAクラスIにも同様に機能する。HLAクラスIIに適用する場合、選択された対立遺伝子のアルファ鎖およびベータ鎖が遺伝子構築物にコードされ、ビオチン-アクセプターペプチド(BAP)配列がベータ鎖のC末端に配置されている。次いで、これらの細胞を溶解させ、BirA酵素と一緒にインキュベートして、捕捉用対立遺伝子のベータ鎖のC末端をビオチン化する。NeutrAvidinプルダウンによりMHCと結合したペプチドの集団を精製し、それを分子ふるいによってさらに単離し、ベストインクラスLC-MS/MSプロトコールを用いて配列決定を行う。
一部の実施形態では、高磁場非対称波形イオン移動度分光分析(FAIMS)を使用してLC-MS/MS分析を評価する。一部の実施形態では、ペプチドを、nLC-MS/MSによる分析の前に、酸性逆相(aRP)および塩基性逆相(bRP)オフライン分画の両方に供する。
2日間のトランスフェクションが構築物の頑強な発現を実現するために十分であり(図12B)、4種の異なる対立遺伝子について3種の別個の細胞株(expi293、A375、およびB721)における妥当な細胞表面局在が伴った(図12C)。
HLA-DRAは機能的にインバリアントであるので、この手法では、捕捉用ベータ鎖が内因性アルファ鎖と対形成したとしても、単一対立遺伝子分解能が実現される。これは、この手法を、所与の細胞株における既存のHLA遺伝子型および発現レベルにかかわらず、HLA-DR対立遺伝子をプロファイルするために使用することができることを意味する。
HLA-DPおよびHLA-DQに関しては、アルファ鎖およびベータ鎖はどちらも変動し、どちらもペプチド結合に寄与し、したがって、単一対立遺伝子分解能は、ネイティブなアルファ鎖が発現されない場合またはネイティブな対立遺伝子がホモ接合性であり、捕捉用対立遺伝子とマッチする場合のみに予測される。あるいは、ネイティブなアルファ鎖に対応するペプチドのバックグラウンドを確立するために、ベータ鎖のみの捕捉を使用することができる。
プロファイリングされた対立遺伝子には、5種のHLA-DR対立遺伝子(DRB103:01、DRB109:01、DRB111:01、DRB301:01、およびDRB302:02)ならびに1種のHLA-DP対立遺伝子(DPB101:01/DPA101:03)、1種のHLA-DQ対立遺伝子(DQB106:02/DQA101:02)、および2種のクラスI対立遺伝子(表1)が含まれた。全ての場合において、2~3回の反復実験が少なくとも1500種の独特のペプチドを観察するのに十分であった(図11B)。プロファイリングされた対立遺伝子の中で、ほんの小さなパーセンテージのヒットが既知の夾雑物または完全なトリプシン消化物に対応した;他方では、ニセトランスフェクションにより比較的少数のペプチドが返され、それらは既知の夾雑物または完全なトリプシン消化物として大部分が同定可能であった(図11B)。
表1は、例示的な実験に使用したサンプルの要約を示す。
Figure 2022518355000002
MHC II結合性ペプチドの末端がMHC結合性溝内にフィットする必要はないので、多数の別個のペプチド種が同じコア結合性配列を共有すれば、それらは同等に良好に結合し得る。重複する配列を有するペプチドを「入れ子セット」内にプールしたところ、HLAクラスII対立遺伝子当たり500~700種の独特の入れ子セットが観察され、これらは、一般には500~600種の独特の遺伝子に由来するものであった。HLAクラスIおよびHLAクラスII結合性ペプチドの長さ分布は抗体に基づくプルダウンを使用した以前のMS試験において観察されたものとマッチする(図11C)。
推定上のMHC結合性ペプチドの中で、大多数のアミノ酸がそれらの供給源プロテオーム頻度と一致するレベルで表された。例外にはシステイン、メチオニン、およびトリプトファンが含まれ、これらは、MHC IIペプチドに関する以前のMSに基づく試験と一致して枯渇した。IEDBからの対立遺伝子を釣り合わせた高親和性ペプチド(<50nM)ではシステイン、メチオニン、およびトリプトファンの枯渇は観察されなかった;しかし、IEDBペプチドでは、プロテオームに関して、ロイシンおよびメチオニンの富化ならびにプロリン、アスパラギン酸、およびグルタミン酸の枯渇が示された。
(実施例4)
MAPTAC(商標)プロトコールにより既知のおよび新規のMHC II結合性モチーフが明らかになる
クラスIIペプチドのMHC結合性部分配列はN末端またはC末端に対して固定された位置にないので、正確なクラスIIモチーフの発見では、各結合体ペプチドについて異なる結合レジスターの可能性を動的に検討しなければならない。Gibb’s Clusterツールでは、期待値最大化(EM)アルゴリズムによってこの難題に対処する。畳み込みニューラルネットワーク(CNN)を使用した新規モチーフ発見手法の使用を探求した。CNNは、コンピュータビジョンの分野では成功しており、同様に、翻訳不変パターン認識を実現しようとしている。CNNを、MHC結合性ペプチドとそれらのスクランブルバージョンを区別するように訓練し、次いで、最後から2番目のネットワーク層において最大のノード活性化を実現した部分配列に従って陽性例をアラインメントした。単一対立遺伝子MSデータに適用する場合、この手法では、ギブスクラスタリングと一致したモチーフが得られ、また、総体的な1位、4位、6位、および9位にアンカーが示された(図13)。これらのモチーフは、IEDBからの高親和性結合体(親和性<50nM;図13)について観察されたCNN由来のモチーフと高度に一致した。DRB111:01に関しては、モチーフが細胞株にわたって安定であり、以前に汎DR抗体を用いてプロファイリングされたDRB111:01ホモ接合性細胞株と一致することをさらに検証した。同様に、MHCクラスI対立遺伝子に関して導き出されたモチーフは、親和性に基づく方法および以前のMSに基づく試験によるものと一致した(図14A)。
MHCクラスII対立遺伝子の全てが識別可能なモチーフを示したが、アンカー位置のエントロピーはMHCクラスI対立遺伝子について観察されたものよりも顕著に高かった。したがって、各MHCクラスII対立遺伝子について各アンカー位置の好ましいアミノ酸を定義し、ペプチドの10~20%だけが4つのアンカー位置全てにおいて理想的な残基を示し、60%もの多くが2つまたはそれよりも少ない予測されたアンカーを示すことが観察された(図14Bおよび図30C)。13~17merを結合潜在性についてNetMHCIIpanを使用してスコア化し、一方、MSにより観察されたペプチドは全ての場合において予測された結合潜在性に関して富化され、スコアに、長さを釣り合わせたランダムなペプチドとの有意な重複が存在した(図14C、および図36A)。
(実施例5)
単一対立遺伝子MHC II MSデータに対して訓練されたアルゴリズムにより免疫原性が予測される
次に、単一対立遺伝子MSプラットフォームからのデータにより改善されたMHCクラスII結合予測器を生成することができるかどうかを検討した。CNN手法を足場として、フィルターサイズ、スキップ接続、および総受容野を有する多層ネットワークを創出した(図31A)。neonmhc2と称されるこのディープラーニングモデルを訓練し、評価するために、プロテオームを遺伝子の75%、12.5%、および12.5%を表す3つの区分に区分した。第1の区分はCNNを確率的勾配降下法によって訓練するために使用し、第2の区分はアーキテクチャおよびハイパーパラメータ最適化のために使用した。第3の区分は、解析の最後に1回だけ、性能を評価するために使用した。評価の完全性を確実にするために、パラロガスな遺伝子群内の全ての遺伝子が同じ区分に入るように注意を払った。
MSでは特にシステインに対してある程度の残基の偏りが示されるので(図12D)、この問題は、陽性例の配列をランダムに並べ替えることによって生成した陰性訓練例(デコイと称される)を使用することによって軽減される。この手法には、天然のタンパク質の配列特性を学習するというリスクがあるので、それにより予測性能が人為的に膨張する可能性がある、モデル評価では、デコイをペプチド供給源遺伝子の観察されていない部分配列からランダムにサンプリングする別個のデコイ生成戦略を使用する。ヒット対デコイ比1:19での陽性適中率(PPV)の算出により、評価区分におけるMSペプチドの予測に関してneonmhc2がNetMHCIIpanと比べて改善されたPPVを有することが示された(図4および図31B)。neonmhc2の訓練用データセットのサイズを人為的にダウンサンプリングする実験により、その性能がデータにより限定され、より深いカバレッジのデータを用いることで改善されることが示唆される(図16)。
NetMHCIIpanを訓練したデータ型である結合親和性を予測するためにneonmhc2の能力を探求した。NetMHCpanから同じペプチド測定値に対して訓練および評価を行う利点を取り除くために、IEDBに寄託されたわずかに古いバージョンのNetMHCIIpanによりスコア化されたペプチドを使用して評価を実行した。ケンドールのタウ統計値を使用して予測の正確度を評価すると、全ての場合において、NetMHCIIpanスコアはMSに基づく予測器と同様であったかまたはわずかに良好であった(図15B)。興味深いことに、性能は、実施した親和性アッセイの型に依存した。neonmhc2は、Setteおよび共同研究者からの親和性測定値に関して予測した場合にはNetMHCIIpanにわずかに後れをとったが、Buusおよび共同研究者からの測定値に関して予測した場合にはNetMHCIIpanにより大きな後れをとった。これらの結果をまとめて考慮して、これらのプラットフォーム間に内在性差異が存在すると思われたが、いずれの手法がより間違いのないものであるかはすぐには明らかにならなかった。
明瞭さの改善を実現するために、天然のCD4 T細胞応答を予測する能力を評価した。IEDBからのデータは、一般に、応答の対立遺伝子制限が大抵未定義であるかまたは帰属かいずれかであるので、この目的のためには不適当であった。したがって、四量体によりガイドされるエピトープマッピング(TGEM)データの大きなデータセットをアセンブルした。これらの試験の全てで、予測への優先順位付けではなく、包括的な重複ペプチドスクリーニングを使用し、それにより、NetMHCIIpanに有利な観察の偏りが取り除かれた。一方で、対立遺伝子制限は明白である。評価のために十分なデータが存在した全ての対立遺伝子に関しては、neonmhc2は、ランダムよりもほんのわずかだけ性能が良かったNetMHCpanよりも実質的に優れた。したがって、MAPTAC(商標)プラットフォームは、免疫原性MHCクラスIIエピトープを同定するモデルを訓練するためのベストインクラスであり得る。
(実施例6)
複対立遺伝子MSデータに対して訓練されたアルゴリズムは劣る
標準の汎DRおよび汎II抗体精製に基づく多数の複対立遺伝子クラスIIデータベースがパブリックドメインに存在することを考慮して、適切な予測器を複対立遺伝子データのみを使用して訓練することができるかどうかを試験した。いくつかのグループがMHCクラスI対立遺伝子モチーフの複対立遺伝子クラスIデータからの逆畳み込みに関して成功を示しているが、これらの試みはまだ公的に入手可能な予測器には変換されていない。クラスIIモチーフの逆畳み込みは、各ペプチドの結合レジスターとクラスターメンバーシップの両方を同時に分解する必要性によってさらに複雑になる。クラスII逆畳み込みの可能性を探究するためにギブスクラスターツールが使用されているが、この手法の忠実度は広範囲には検証されていない。
クラスII逆畳み込みの正確度を評価するために、遺伝子型が公知である公的に入手可能な汎DRデータセットを選択した。各データセットについて、我々の単一対立遺伝子データのうち20ペプチドをドナーの遺伝子型の各対立遺伝子に対してスパイクインした(ハプロタイプおよび接合性に応じて1~2のDR1対立遺伝子プラス0~2のDR3/4/5対立遺伝子)。ギブスクラスタリングツールを各データセットに対して実行し、スパイクインペプチドが適正に共クラスター化されたかどうかをそれらの既知の対立遺伝子起源に従って観察した。この解析の初期バージョンでは、対立遺伝子数に対するクラスター数を固定したか、またはギブスクラスターにより最適なクラスターの数を自動的に決定されるようにした。しかし、いずれの手法でもペプチドが正確には逆畳み込みされなかったと思われる)。アルゴリズムを補助するために、スパイクインペプチドの真の供給源対立遺伝子とそれらが割り当てられたクラスターの間の調整された相互情報を算出することによって最適なクラスター計数を選択した。それにもかかわらず、全てではないが一部の場合に、ペプチドが、それらの供給源対立遺伝子を考慮せずに多様なクラスターにわたって分布した(図17A)。これらの結果により、現行の逆畳み込みプロトコールがMHCクラスIIに対しては確実に正確なものではない可能性があることが示唆される。
この解析に対する警告の1つは、一部のペプチドは1つよりも多くの対立遺伝子に結合することができることである。これに沿って、次の疑問は、それにもかかわらず複対立遺伝子データに由来する結合性モチーフが単一対立遺伝子データから観察されたものと合理的にマッチし得るかどうかである。これを評価するために、単一の対立遺伝子の各々のペプチドを捕捉するために最良の対応を有するクラスターを選択し、これらの集団に基づいたモチーフを築いた(例えば、図17Bを参照されたい)。既知のアンカーのいくつかは多くのモチーフにより明白に実証されたが、他の位置は単一対立遺伝子のモチーフとは不調和である、または供給源データセット間で不調和である。さらに、偽性アンカーが現れた明らかな場合があった。最後に、逆畳み込みされたデータを、ペプチドを我々の単一対立遺伝子データセットの評価区分に予測することができたCNNを訓練するために使用することができるかどうかを評価した。逆畳み込みされた複対立遺伝子データに対して訓練されたモデルは、全ての場合においてMAPTAC(商標)訓練モデルに達しなかった(図17C)。
(実施例7)
供給源タンパク質の特色が提示可能性に影響を及ぼす
MHCクラスIに関しては、提示されるエピトープのレパートリーの決定、したがって、タンパク質からペプチドへのプロセシングが特徴付けられたクラスIIレパートリーをどのように形づくるかにおいてプロテアソームが重要な役割を果たす。
まず、いくつかの組織に基づくペプチドプロファイリングデータセットにおいて観察されたMHCクラスIIペプチドのN末端およびC末端の正確な位置に焦点を当てた。位置に基づくアミノ酸頻度をデコイペプチドに対して比較することにより、有意な富化および枯渇を観察した。このパターンは、最近の観察と一致する。興味深いことに、全体的なパターンは、最良の特徴付けられたクラスIIプロセシング酵素であるカテプシンSの既知の切断優先性([RPI][FMLW][KQTR][ALS])とマッチしない。
このモチーフの予測潜在性を決定するために、N末端およびC末端に対するNNに基づく予測器を築き、2つの切断変数を予測された結合潜在性(MS訓練CNN毎)と一緒に使用したロジスティック回帰を当てはめて、同じ供給源遺伝子からサンプリングした真のMSペプチドと長さを釣り合わせたデコイペプチドとを区別した。
この予測器では、結合潜在性を単独で考慮するモデルに対してペプチド予測のわずかな改善がもたらされたが、MHCクラスII結合性エピトープ(互換的にクラスIIエピトープと称される)の免疫原性はペプチド切断の正確な位置には依存しない可能性があるので、疑問は、切断の正確な部位が未知の場合に、それでもこのモデルに価値が付加されるかどうかである。したがって、ヒットおよびデコイの正確な切断位置を差し控え、その代わりに帰属結合性コアの付近(+/-15AA)のタンパク質位置にわたる複合切断性スコアをスコア化して、二度目予測スキームを実行した。興味深いことに、結合性のみの予測器に対して性能に改善は認められなかった。これらの結果は、クラスII切断予測の追加により、MSにより観察されたリガンドの予測を改善することはできるが、おそらく正確なペプチド末端に依存しないT細胞認識は改善することができないことが示された以前の研究と一致する。
MHC IIペプチドの有意な分率がMHCとの結合後にそれらのN末端およびC末端から「チュードバック」されるモデルが提唱された。このモデルの下では、プロリンによりエキソペプチダーゼの進行が遮断されるので、最後から2番目のプロリンシグネチャーが生じる。このシナリオでは、MHCリガンド末端の直接解析に由来するモチーフは、ペプチド断片生成の最初のステップではなく下流の編集を反映するので、潜在的に誤った方向に導くものである。したがって、クラスIIペプチドの付近の、それらの生成を説明することができる可能性がある他の配列特色を決定した。まず、規準のカテプシンSシグネチャーを検索したが、MSにより観察されたクラスIIペプチド付近で、ペプチド供給源遺伝子からサンプリングした長さを釣り合わせたデコイペプチドに対してカテプシンS部位の富化は認められなかった。このプロセシングシグネチャーは酵素の複雑なアンサンブルを反映する可能性があるので、新規のCNNを、観察されたペプチドおよびデコイの周囲の上流および下流のタンパク質コンテキスト(+-25AA)に基づいて訓練した。
ペプチド利用可能性を、タンパク質の一次配列ではなく、フォールディングされたまたはセミアンフォールディングされた状態によって決定する第3のモデルを検討した。相同性に基づくACCPROを使用して二次構造および溶媒がアクセス可能な領域を予測し、予測器のアンサンブルを使用して内因的に不規則なドメインを同定した。
プロセシング優先領域を本質的に予測することが難しい場合、以前に公開された複対立遺伝子クラスII MSデータの大きな集合内の少なくとも1つのペプチドが及ぶタンパク質領域全ての一覧表を単に築き、重複を予測特色として使用することが可能であり得る。明らかに、以前に公開されたデータで表される対立遺伝子は同じまたは同様の結合性モチーフを有する可能性があるので、重複特色は結合情報により夾雑される。それにもかかわらず、この特色であっても、提示されるペプチドの予測がわずかに改善され、これにより、MHCクラスIIペプチドが強力なプロセシングホットスポットに供されない可能性があることが示唆される。
次の疑問は、どの遺伝子がクラスII結合性ペプチドレパートリーに最も大きく寄与するかであった。MHCクラスIリガンドを予測する場合、発現レベルなどの遺伝子レベル特色により、大きなブーストがもたらされることがすでに分かっている。以前に公開された、ヒト組織のクラスII結合レパートリーをプロファイリングするMSデータセットを活用し、MSにより観察されたペプチドが、ランダムなデコイペプチド(プロテオームからサンプリングしたもの)よりも1桁高度に発現されることが観察された(図18A)。それにもかかわらず、遺伝子にマッピングされたクラスIIペプチドの約5%が、代表的なRNA-Seqデータによると表面上は発現されないことが認められた。このパターンに基づいて、各遺伝子がクラスIIペプチドレパートリーにおいて過剰にまたは過少に表される程度を、各遺伝子の観察の数がその長さと発現レベルの積に比例するはずであるというベースライン予想を提唱することによって数量化しようと試みた(図18B)。過剰に表された遺伝子の中で、ヒト組織血清において発現される、多くのクラスII結合性ペプチドを産生するが、ネイティブな組織では表面上は発現されないタンパク質の明らかな富化が認められた。これは、細胞外環境から試料採取された抗原の提示におけるMHCクラスIIの公知の役割と一致する。
オートファジーは、別の十分に確立されたクラスIIプロセシング経路であるので、各遺伝子(観察されたペプチドが5つよりも少なく、予測されたペプチドが5つよりも少ないあらゆる遺伝子を除外する)についての観察されたペプチド対予測されたペプチドの比を決定し、公知のオートファジー遺伝子またはマウスにおけるAtg5ノックアウトによって安定化される遺伝子の物理的パートナーに対して富化が認められるかどうかを決定した(図18C)。クラスIIデータにおけるいずれの遺伝子セットも富化されないと思われた。実際、オートファジー遺伝子の物理的パートナーは適度に過少に表されると思われた。
全ての細胞内局在を見渡すと(図18Dおよび図18E)、少数の区画が決定的に過剰にまたは過少に表された。2つの最も富化された区画は細胞膜およびリソソームであり、各々からおよそ2倍のクラスIIペプチドの予測数が生じた。膜タンパク質の富化が、オートファゴソームへの膜再利用または膜タンパク質の直接オートファジー経路へのゴルジ経路設定に関するかどうかは明らかでない。リソソームタンパク質の富化と以前に観察されたオートファジー遺伝子の枯渇との間の見かけの矛盾により、これらの傾向が、検討されているオートファジー関連遺伝子の特異的なサブセットに対して高度に感受性であることが示された。図18Fは、2つの異なる遺伝子発現プロファイル、バルク腫瘍およびプロフェッショナル抗原提示細胞に関するペプチド観察の相対的一致を示す。
(実施例8)
正確なMHC II予測にはエンドサトーシス経路を理解することが必要である
クラスII遺伝子の供給源経路を理解することに加えて、どの細胞型が大多数のクラスII提示を担うかを理解することが極めて重要であり得る。がんの場合では、線維芽細胞を含めた非プロフェッショナルAPCおよび腫瘍自体が、炎症を起こした腫瘍微小環境(TME)内でクラスIIを提示すると考えられている。さらなる洞察を得るために、肺がん、頭頸部がん、および黒色腫をプロファイリングしたものである3つの最近公開された単一細胞RNA-SeqデータセットにおいてHLA-DRB1発現を解析した。細胞にわたって患者-細胞型レベルを平均することにより、規準のAPC(マクロファージ、樹状細胞、およびB細胞)が、腫瘍および他の間質細胞型よりもはるかに高レベルのクラスIIを提示し、この傾向が多数の患者および腫瘍型にわたって一致することが明らかになった。
免疫治療によりこの傾向が乱されるかどうかを探索するために、チェックポイント遮断応答性腫瘍型からの追加的な単一細胞RNA-Seqを解析し、処置の前後のHLA-DRB1発現を評価した。1つの確認された応答者を含んだ黒色腫コホートでは、治療前生検材料および治療後生検材料のどちらにおいても腫瘍細胞による一様に低いHLA-DRB1発現が示された(図19C)。抗PD-1治療に対して55%臨床応答率を示した基底細胞癌コホートは、同様に、時点にかかわらず、腫瘍細胞由来HLA-DRB1の低発現を示した(図19C)。
これらの結果により、大多数の腫瘍内HLAクラスII提示が主にプロフェッショナルAPCによって駆動され、「ホット」TME条件では一般的なパターンとの相違が保証されないことが示唆された。
腫瘍細胞は腫瘍微小環境ではAPCに数で勝るので、それにもかかわらずMHCクラスII発現のレベルが低いことには、免疫学的関連性がある可能性がある。いかほどの全体的なクラスII発現が腫瘍細胞によってもたらされるか、対していかほどが間質によってもたらされるかを評価するために、クラスII特異的遺伝子に変異を有するTCGA患者(CIITA、CD74、およびCTSSに焦点を当てる)を同定し、体細胞(腫瘍特異的)バリアントを示したRNA-Seqリードの画分を決定した。この情報を使用して、HLA-DRB1発現のどの画分が腫瘍に由来するか、対してどの画分が間質に由来するかを帰属させた(図19B)。17種の別個の腫瘍型を表す153名の患者において同定された変異に基づいて、大多数のクラスII発現が非腫瘍細胞から生じると思われる優性パターンが観察された。最高レベルのT細胞浸潤を有する患者だけに焦点を当て(上位10%、以前に公開された18遺伝子シグネチャー(Ayers et al., 2017)を使用して同定されたもの)腫瘍のHLA-DR低発現がそれでも正常だと思われ、16名の患者のうち3名のみが>1000TPM(腫瘍増悪および転移)を発現した。
免疫治療によりこの傾向が乱されるかどうかを探索するために、チェックポイント遮断応答性腫瘍型からの追加的な単一細胞RNA-Seqを解析し、処置の前後のHLA-DRB1発現を評価した。1つの確認された応答者を含んだ黒色腫コホートでは、治療前生検材料および治療後生検材料のどちらにおいても腫瘍細胞による一様に低いHLA-DRB1発現が示された(図19C)。抗PD-1治療に対して55%臨床応答率を示した基底細胞癌コホートは、同様に、時点にかかわらず、腫瘍細胞由来HLA-DRB1の低発現を示した(図19C)。
これらの結果により、大多数の腫瘍内HLAクラスII提示が主にプロフェッショナルAPCによって駆動され、「ホット」TME条件では一般的なパターンとの相違が保証されないことが示唆された。
(実施例9)
新しい予測概念により、免疫原性新抗原のより正確な同定が可能になる
neonmhc2および関連するプロセシング規則の有用性を探求するために、いくつかの予測シナリオにおける性能を検討した。まず、MSにより同定されたペプチドを予測する能力を、汎DR抗体を用いてプロファイリングされた、7名の健康なドナー由来のPMBCにおいて評価した。この解析により、MAPTAC(商標)システムまたは我々の産生細胞株に固有のあらゆる系統的な偏りを制御することができる。ヒットとデコイを1:499の比で使用し、タンパク質をコードするエクソームからデコイをランダムにサンプリングして、neonmhc2およびNetMHCIIpanベースのモデルならびに追加的なプロセシング特色が組み入れられたモデルの陽性適中率を評価した(図18Bによる、発現、遺伝子レベルの偏り、および以前のMHC IIペプチドとの重複)。これらのモデルにより、結合予測およびプロセシング予測のどちらに関しても実質的な改善が確認された(図20)。
図21Aは、示されているさらなるプロセシングパラメータまたは特色を用いたNetMHCIIpanとneonmhc2の比較を示す。HLA-DR抗体によってプロファイリングされた8つのMS試料についての予測性能(実施例6において分析されたものと同じ試料、図17A)。予測器は、HLA結合予測(NetMHCIIpanまたはneonmhc2のいずれか)を最小に使用し、必要に応じて追加的なプロセシング関連変数:遺伝子発現、遺伝子の偏り(例えば、図18B、図18C、図19Bによる)、および以前に観察されたHLA-DQペプチドとの重複を使用する。本実施例では、デコイを、入手可能なデコイ配列をほぼ飽和させるヒット対デコイの比1:499が実現されるようにプロテオームからランダムにサンプリングした(MSにより観察されたペプチドを決して産生しない遺伝子を含む)。図4と類似した様式で陽性適中率を算出した。例えば、ペプチドの上位0.2%を陽性としてコールし、PPVは、真のMSにより観察されたペプチドである陽性の分率である。各試料中の各候補ペプチドについて、結合スコアを、試料遺伝子型に存在するHLA-DR対立遺伝子にわたる最大値として算出した。2つの方法によって見いだされたペプチドの傾向にはかなりの相関があるが、本明細書に記載のモデルではより頑強な転帰が示される。図21B(図33Bも参照されたい)は、図21Aにおけるものと同じヒット:デコイ比および性能メトリクスを使用した、樹状細胞(溶解物)によって提示される腫瘍由来ペプチドについての予測性能を表す。プロセシング特色の使用を伴うまたは伴わないNetMHCIIpanおよび本明細書に記載のモデルについての性能が示されている。図21Cは、重く標識されたペプチド各々についての発現レベルおよび遺伝子の偏りのスコアを示す。図21Dは、溶解物およびUV処理実験による重く標識されたペプチド供給源遺伝子の重複を表す図である。
(実施例10)
細胞株におけるクラスII HLAペプチドの発現およびMHC-IIと結合したペプチドの単離
構築物の設計、細胞培養およびHLA-ペプチド免疫沈降
本例示的試験では、単一の親和性タグ付けされたHLA構築物を細胞株(A375、HEK293T、Expi293、HeLa)にトランスフェクトし、親和性タグ付けされたHLA-ペプチド複合体を免疫沈降させることによって単一対立遺伝子細胞株を生成した。図12Aおよび12Eでは、MHCクラスII対立遺伝子頻度は、特に断りのない限り、allelefrequencies.net/から得られた対立遺伝子頻度である。米国集団に関する対立遺伝子頻度は、62.3%ヨーロッパ人、13.3%アフリカ人、6.8%アジア人、および17.6%ヒスパニックの混合を仮定することによって帰属させた。
図12Aおよび図12Eに関しては、mhc_ligand_full.csvデータセットを2018年9月21日にIEDBデータからダウンロードした。「細胞MHC/競合/蛍光」、「細胞MHC/競合/放射活性」、「細胞MHC/直接/蛍光」、「精製されたMHC/競合/蛍光」、「精製されたMHC/競合/放射活性」、または「精製されたMHC/直接/蛍光」と同等の「方法/技法」および「解離定数KD」、「解離定数KD(およそのEC50)」、「解離定数KD(およそのIC50)」、「最大半量の有効濃度(EC50)」、または「最大半数阻害濃度(IC50)」と同等の「アッセイ群」を有するためには有効な親和性測定が必要であった。「著者」欄に列「Buus」が表示されている場合、測定値はSoren Buusグループ(University of Copenhagen、Denmark)によるものであった。他の場合では、著者欄に列「Sette」または「Sidney」が含まれる場合、測定値はAlessandro Sette group(La Jolla Institute for Immunology、U.S.A)によるものであった。他の全ての測定値は「他」と標識した。強力な結合体を数え上げるために、測定された親和性が50nMよりも強力なペプチドのみを計数した(図12A)。図12Eはtools.iedb.org/main/datasets/からの追加的なデータを含み、親和性が<100nMである強力な結合体を数え上げる。
DNA構築物の設計
HLAクラスIおよびHLAクラスII対立遺伝子の遺伝子配列をIPD-IMGT/HLAウェブページ(ebi.ac.uk/ipd/imgt/hla)によって同定し、組換え発現構築物の設計に使用した。HLAクラスIに関しては、α鎖をC末端GSGGSGGSAGGリンカーと融合し、その後にビオチン-アクセプター-ペプチド(BAP)タグ配列GLNDIFEAQKIEWHE、終止コドン、および変動するDNAバーコードを続け、pSF Lentiベクター(Oxford Genetics、Oxford、UK)にNcoIおよびXbaI制限部位を介してクローニングした。HLAクラスII構築物は、同様にpSF LentiにNcoIおよびXbaI制限部位を介してクローニングし、C末端においてクラスI構築物由来のリンカー-BAP配列(SGGSGGSAGGGLNDIFEAQKIEWHE)、その後、別の短いGSGリンカー、F2Aリボソームスキッピング配列(VKQTLNFDLLKLAGDVESNPGP)、α鎖の配列、HAタグ(GSYPYDVPDYA)、終止コドン、および変動するDNAバーコードと融合したβ鎖配列からなるものであった。全てのDNA配列の同一性をサンガーシーケンシングによって検証した。
細胞培養および一過性トランスフェクション
Expi293細胞(Thermo Scientific)を、Expi293培地(Thermo Scientific)中、8%CO、37℃、125rpmで振とうしながら成長させた。Expi293細胞を、定期的な隔週での継代を伴って、0.5×10個/mLから6×10個/mLの間の細胞密度で維持した。Expi293細胞懸濁液30mLを、およそ3×10個/mLの細胞密度および>90%生存能力での一過性トランスフェクションのために使用した。簡単に述べると、DNA30μg(細胞懸濁液1mL当たり1μg/mLのDNA)を1つのチューブ中、Opti-MEM培地(Thermo Scientific)1.5mLに希釈し、一方、ExpiFectamine(商標)293トランスフェクション試薬(Thermo Scientific)80μLをOpti-MEM、1.5mLを含有する第2のチューブ中に希釈した。これらの2つのチューブを室温で5分間インキュベートし、組み合わせ、穏やかに混合し、室温で30分間インキュベートした。DNAとExpiFectamineの混合物をExpi293細胞に添加し、37℃、8%CO、80%相対湿度でインキュベートした。48時間後、トランスフェクトされた細胞を4回の技術的反復実験においてチューブ当たり細胞50×10個で回収し、遠心分離し、1×Gibco DPBS(Thermo Scientific)で1回洗浄し、質量分析のために液体窒素で急速冷凍した。細胞1×10個の一定分量を各トランスフェクションバッチから収集し、抗BAP(Rockland Immunochemicals Inc.、Limerick、PA)または抗HA(Bio-Rad、Hercules、CA)ウエスタンブロットによって分析して、親和性タグ付けされたHLAタンパク質発現を検証した。
A375細胞(ATCC)を、10%FBSを伴うDMEM中で成長させ、定期的な継代を伴って、80%以下の集密での培養で維持した。質量分析実験のために、A375細胞を、500cmのプレートにおいて、70%集密の細胞数から算出された通り、100mL中、細胞18.5×10個/mLの播種密度で培養した。24時間後、総培養体積に関して調整したTransITシステムプロトコールに従って細胞にTransIT-X2(Mirus Bio、Madison、WI)をトランスフェクトした。48時間後、細胞培地を吸引し、細胞を1×Gibco DPBS(Thermo Scientific)で洗浄した。回収のために、A375細胞を非酵素的細胞解離溶液(Sigma-Aldrich)30mLと一緒に37℃で10分間インキュベートし、遠心分離し、1×DPBSで洗浄し、試料当たり50×10個の細胞で分注した。293T細胞およびHeLa細胞をATCCから購入し、それぞれDMEM、10%FBS、2mMのL-グルタミンまたはDMEM+10%FBS中、37℃、5%COで培養した。両方の細胞株に、HLA構築物をTransIT LT1試薬(Mirus Bio、Madison、WI)を使用して製造者の指示に従ってトランスフェクトし、トランスフェクションの48時間後に、A375細胞について記載されているものと同様に処理した。全ての試料から、細胞1×10個の一定分量を各トランスフェクションで収集し、抗BAP(Rockland Immunochemicals Inc.、Limerick、PA)または抗HA(Bio-Rad、Hercules、CA)ウエスタンブロットによって分析して、親和性タグ付けされたHLAタンパク質発現を検証した。
BirAタンパク質の発現および精製
C末端ヘキサ-ヒスチジンタグと融合したE.coli BirAをコードするpET19ベクターを使用した。化学的コンピテントE.coli BL21(DE3)細胞(New England Biolabs)を、BirA発現プラスミドで形質転換し、LBブロスプラス100μg/mlのアンピシリン中、37℃でOD600が0.6~0.8になるまで成長させ、30℃まで冷却した後、0.4mMのイソプロピル-β-D-チオガラクトピラノシドを添加することによって発現を誘導した。E.coli細胞の成長を30℃で4時間継続した。4℃、8000×gで30分間遠心分離することによってE.coli細胞を回収し、使用するまで-80℃で保存した。組換えBirAを発現する凍結細胞ペレットを、5mMのイミダゾールを伴うIMAC緩衝剤(50mMのNaHPO、pH8.0、300mMのNaCl)に再懸濁し、1mg/mlのリゾチームと一緒に氷上で20分間インキュベートし、超音波処理によって溶解させた。4℃、16,000×gで30分間遠心分離することによって細胞デブリおよび不溶性材料を除去した。清澄化した上清をその後、AKTA pure chromatography system(GE Healthcare)を使用してHisTrap HP 5mLカラムにローディングし、IMAC緩衝剤プラス25mMおよび50mMのイミダゾールで洗浄した後、500mMのイミダゾールを用いて溶出させた。BirAを含有する画分をプールし、20mMのTris-HCl、pH8.0に対して25mMのNaClを用いて透析し、HiTrap Q HP 5mLカラム(GE Healthcare)にローディングし、25mMのNaClから600mMのNaClまでの直線勾配を適用することによって溶出した。高度に純粋なBirAを含有する画分をプールし、緩衝剤を保存緩衝剤(20mMのTris-HCl、pH8.0、100mMのNaCl、5%グリセロール)に交換し、およそ5~10mg/mLに濃縮し、分注し、-80℃での保存のために液体窒素で急速冷凍した。BirAタンパク質濃度を、UV分光法により、算出された吸光係数ε=47,440M-1cm-1を使用してOD280nmにおいて決定した。
ウエスタンブロッティングプロトコール
試料をXT Sample BufferおよびXT Reducing Agent(Bio-Rad、Hercules、CA)に添加し、95℃で5分間加熱し、次いで、約100,000個の細胞に対応する体積を10%Criterion XT Bis-Trisゲル(Bio-Rad)にローディングし、PowerPac Basic Power Supply(Bio-Rad、Hercules、CA)を使用し、XT MES Running Buffer(Bio-Rad、Hercules、CA)を用いて200Vで35分間電気泳動した。ゲルを水で簡単にすすぎ、次いで、タンパク質を、Invitrogen iBlot2 Gel Transfer Device(Thermo Scientific)で設定P3を使用してInvitrogen iBlot Transfer Stacks(Thermo Fisher Scientific)内のPVDF膜に移した。Precision Plus Protein All Blue Standard(Bio-Rad、Hercules、CA)を使用して分子量をモニタリングした。次に、膜をPierce TBS Tween20(TBST)緩衝剤(25mMのTris、0.15mMのNaCl、0.05%(v/v)Tween20、pH7.5)で3×5分間洗浄し、TBST-M(5%(w/v)無脂肪インスタントドライミルクを含有するTBST)中、室温で1時間ブロッキングし、次いで、TBST-B(5%(w/v)Bovine Serum Albumin(Sigma Aldrich)を含有するTBST)ならびにウサギ抗ベータチューブリン抗体(カタログ番号ab6046、Abcam)およびウサギ抗ビオチンリガーゼエピトープタグ抗体(カタログ番号100-401-B21、Rockland Immunochemicals)の両方の1:5,000希釈物中、4℃で終夜インキュベートした。次に、膜をTBSTで3×5分間洗浄し、ヤギ抗ウサギIgG(H+L-西洋ワサビペルオキシダーゼとコンジュゲートした抗体(カタログ番号170-6515、Bio-Rad、Hercules、CA)の1:10,000希釈物を含有するTBST-M中、室温で1時間インキュベートし、次いで、TBSTを用いて室温で3×5分間洗浄した。最後に、膜をPierce ECL Western Blotting Substrate(Thermo Fisher Scientific、Rockford、IL)に浸し、ChemiDoc XRS+Imager(Bio-Rad)を使用して展開し、Image Lab software(Bio-Rad)を使用して可視化した。
親和性タグ付けされたHLA-ペプチド複合体の単離
BAPタグが付されたHLA対立遺伝子を発現する細胞およびBAPタグを伴わない内因性HLA-ペプチド複合体のみを発現する陰性対照細胞株からの親和性タグ付けされたHLA-ペプチド複合体の単離を実施した。NeutrAvidinビーズを付したアガロース樹脂を低温PBS 1mLで3回洗浄した後、HLA-ペプチドアフィニティー精製に使用した。BAPタグが付されたHLAペプチドを発現する細胞50×10個を含有する凍結ペレットを氷上で20分間にわたって解凍し、低温溶解緩衝剤[20mMのTris-Cl、pH8、100mMのNaCl、6mMのMgCl、1.5%(v/v)Triton X-100、60mMのオクチルグルコシド、0.2mMの2-ヨードアセトアミド、1mMのEDTA、pH8、1mMのPMSF、1×完全EDTAフリープロテアーゼ阻害剤カクテル(Roche、Basel、Switzerland)]1.2mL中に手動でピペッティングすることによって穏やかに溶解させた。溶解物を、≧250単位のベンゾナーゼヌクレアーゼ(Sigma-Aldrich)と一緒に4℃で15分間、回転させながらインキュベートしてDNA/RNAを分解し、4℃、15,000×gで20分間遠心分離して細胞デブリおよび不溶性材料を除去した。清澄化した上清を新しいチューブに移し、0.56μMのビオチン、1mMのATP、および3μMのBirAを伴う1.5mLチューブ中、室温で10分間、回転させながらインキュベートすることにより、BAPタグが付されたHLAペプチドをビオチン化した。上清を、200μLのPierce high-capacity NeutrAvidin beaded agarose resin(Thermo Scientific)スラリーに対応する体積で、4℃で30分間、回転させながらインキュベートして、ビオチン化HLA-ペプチド複合体を親和性富化した。最後に、HLAが結合した樹脂を低温洗浄緩衝剤(20mMのTris-Cl、pH8、100mMのNaCl、60mMのオクチルグルコシド、0.2mMの2-ヨードアセトアミド、1mMのEDTA、pH8)1mLで4回洗浄し、次いで、低温の10mMのTris-Cl、pH8、1mLで4回洗浄した。洗浄間に、HLAが結合した樹脂を手動で穏やかに混合し、次いで、4℃、1,500×gで1分間遠心分離することによってペレット化した。洗浄済みのHLAが結合した樹脂を-80℃で保存したかまたはすぐにHLA-ペプチドの溶出および脱塩に供した。
抗体に基づくHLA-ペプチド複合体の単離
HLAクラスII DR-ペプチド複合体を健康なドナー末梢血単核細胞(PBMC)から単離した。GammaBind Plus Sepharose樹脂75μLに対応する体積を低温PBS 1mLで3回洗浄し、抗体10μgと一緒に4℃で終夜、回転させながらインキュベートし、次いで、低温PBS1mLで3回洗浄した後、HLA-ペプチド免疫沈降に使用した。細胞50×10個を含有する凍結PBMCペレットを氷上で20分間にわたって解凍し、低温溶解緩衝剤[20mMのTris-Cl、pH8、100mMのNaCl、6mMのMgCl2、1.5%(v/v)Triton X-100、60mMのオクチルグルコシド、0.2mMの2-ヨードアセトアミド、1mMのEDTA、pH8、1mMのPMSF、1×完全EDTAフリープロテアーゼ阻害剤カクテル(Roche、Basel、Switzerland)]1.2mL中にピペッティングすることによって穏やかに溶解させた。溶解物を、>250単位のベンゾナーゼヌクレアーゼ(Sigma-Aldrich)と一緒に4℃で15分間、回転させながらインキュベートしてDNA/RNAを分解し、4℃、15,000×gで20分間遠心分離して細胞デブリおよび不溶性材料を除去した。次いで、上清を、GammaBind Plus Sepharose樹脂(GE Life Sciences)に結合させた抗HLA DR抗体(TAL 1B5、製品番号sc-53319;Santa Cruz Biotechnology、Dallas、TX)と一緒に4℃で3時間、回転させながらインキュベートして、HLA DR-ペプチド複合体を免疫沈降させた。最後に、HLAが結合した樹脂を低温洗浄緩衝剤(20mMのTris-Cl、pH8、100mMのNaCl、60mMのオクチルグルコシド、0.2mMの2-ヨードアセトアミド、1mMのEDTA、pH8)1mLで4回洗浄し、次いで、低温の10mMのTris-Cl、pH8、1mLで4回洗浄した。洗浄間に、HLAが結合した樹脂を穏やかに混合し、次いで、4℃、1,500×gで1分間遠心分離することによってペレット化した。洗浄済みのHLAが結合した樹脂を-80℃で保存したかまたはすぐにHLA-ペプチドの溶出および脱塩に供した。
HLA-ペプチドの溶出および脱塩
HLA-ペプチドを親和性タグ付けされた内因性HLA複合体から溶出させ、同時に、Sep-Pak(Waters、Milford、MA)固相抽出系を使用して脱塩した。簡単に述べると、Sep-Pak Vac 1cc(50mg)37~55μm粒子サイズtC18カートリッジを24位置抽出マニホールド(Restek)に付着させ、MeOH、200μL、その後、50%(v/v)ACN/1%(v/v)FA、100μLを用いて2回活性化し、その後、1%(v/v)FA、500μLで4回洗浄した。HLA-ペプチドを親和性タグ付けされたHLAペプチドから解離させ、tC18固相へのペプチド結合を容易にするために、3%(v/v)ACN/5%(v/v)FA、400μLをHLAが結合したビーズが付されたアガロース樹脂を含有するチューブに添加した。ピペッティングすることによってスラリーを混合し、次いで、Sep-Pakカートリッジに移した。チューブおよびピペットチップを1%(v/v)FA(2×200μL)ですすぎ、すすぎ液をカートリッジに移した。ローディング対照としてPierce Peptide Retention Time Calibration(PRTC)混合物(Thermo Scientific)100fmolをカートリッジに添加した。ビーズが付されたアガロース樹脂を、10%(v/v)AcOH、200μLと一緒に2回、5分間にわたってインキュベートして、HLA-ペプチドを親和性タグ付けされたHLAペプチドからさらに解離し、次いで、1%(v/v)FA、500μLで4回洗浄した。HLA-ペプチドを、15%(v/v)ACN/1%(v/v)FA、250μL、その後、30%(v/v)ACN/1%(v/v)FA、2×250μLを用いたステップ分画によってtC18から溶出させて新しい1.5mLマイクロチューブ(Sarstedt)に入れた。活性化、試料ローディング、洗浄、および溶出に使用した溶液は重力によって流出させたが、残りの溶出液をカートリッジから取り出すために真空(≦-2.5 PSI)を使用した。HLA-ペプチドを含有する溶出液を凍結させ、真空遠心分離によって乾燥させ、-80℃で保存した後、第2の脱塩ワークフローに供した。
以前に記載されている通りEmpore C18固相抽出ディスク(3M、St.Paul、MN)の16ゲージの穿孔を2つ使用して充填した社内で築いたStageTipsを用いてHLA-ペプチド試料の二次脱塩を実施した。StageTipsを、MeOH、100μLを用い、その後、50%(v/v)ACN/0.1%(v/v)FA、50μLを用いて、2回活性化し、次いで、1%(v/v)FA、100μLで3回洗浄した。乾燥HLA-ペプチドを、3%(v/v)ACN/5%(v/v)200μLを添加し、次いで、StageTipsにローディングすることによって可溶化した。チューブおよびピペットチップを1%(v/v)FA(2×100μL)ですすぎ、すすぎ体積をStageTipsに移し、次いで、StageTipsを1%(v/v)FA、100μLで5回洗浄した。ペプチドを、15%(v/v)ACN/0.1%(v/v)FA、20μL、その後、30%(v/v)ACN/0.1%(v/v)FAの2つの20μLのカットの段階的勾配を使用して溶出させた。試料ローディング、洗浄、および溶出は、卓上遠心分離機において1,500~3,000×gの最大スピードで実施した。溶出液を凍結させ、真空遠心分離によって乾燥させ、-80℃で保存した。
タンデム質量分析によるHLA-ペプチド配列決定
全てのnanoLC-ESI-MS/MS分析に同じ下記のLC分離条件を使用した。試料を、PicoFrit(New Objective,Inc.、Woburn、MA)にフィットさせたProxeon Easy NanoLC 1200(Thermo Scientific、San Jose、CA)を使用してクロマトグラフィーにより分離した。10μmのエミッターを有する75μm内径キャピラリーに、1.9μm粒子サイズ/200Å孔径のC18 Reprosilビーズを用い、1000psiの圧力でHeを約30~40cmまで充填し、分離の間、60℃で加熱した。カラムを、10×ベッド体積の緩衝剤A(0.1%(v/v)FAおよび3%(v/v)ACN)を用いて平衡化し、試料を3%(v/v)ACN/5%(v/v)FA、4μLにローディングし、7~30%の緩衝剤B(0.1%(v/v)FAおよび80%(v/v)ACN)を82分間、30~90%緩衝剤Bを6分間の直線勾配を用いてペプチドを溶出させ、次いで、90%緩衝剤Bで15分間保持してカラムを洗浄した。試料のサブセットを、6~40%緩衝剤Bを84分間、40~60%緩衝剤Bを9分間の直線勾配を用いて溶出させ、次いで、90%緩衝剤Bを5分間および50%緩衝剤Bで9分間保持してカラムを洗浄した。試料溶出のための直線勾配は毎分200nLの速度で流し、約13秒のピーク幅中央値がもたらされた。
データ依存性取得の間、溶出したペプチドを、Nanospray Flex Ion source(Thermo Scientific)を備えたOrbitrap Fusion Lumos mass spectrometer(Thermo Scientific)に2.2~2.5kVで導入した。フルスキャンMSを分解能60,000、300m/zから1,700m/zまで(AGC標的4e5、50ms max IT)で取得した。各フルスキャンの後に、2秒間のサイクル時間、または、単離幅1.0m/z、衝突エネルギー34(HLAクラスIデータ)および38(HLAクラスIIデータ)、ACG標的5e4、および最大充填時間250ms最大イオン時間を使用した分解能15,000でのデータ依存性MS2スキャンの上位10を続けた。単離幅1.0m/zを使用した理由は、HLAクラスIIペプチドはより長い傾向があり(>40アミノ酸のペプチドのサブセットを用いた中央値16アミノ酸)、したがって、モノアイソトピックピークが常に同位体クラスターにおいて最も高いピークであるわけではなく、質量分析計取得ソフトウェアにより、指定のオフセットの非存在下で最も高い同位体ピークが単離ウインドウの中央に置かれる。したがって、1.0m/z単離ウインドウにより、同位体クラスターにおける最も高いピークではない場合であっても、クラスIIペプチドの電荷の状態は多くの場合+2またはそれよりも高いので、モノアイソトピックピークの共単離が可能になる。選択された前駆体当たり約3PSMを可能にするための繰り返し回数1および排除持続時間5秒間で動的排除が可能になった。HLA-ペプチド同定はPSM品質に依拠し、したがって、電荷の状態が異なる多数のPSMによりペプチド同定の信頼度がさらに増大するので、前駆体当たり単一の電荷の状態に対する依存的スキャンが無効の間は同位元素を排除した。HLAクラスIIデータ収集のための電荷の状態のスクリーニングを、電荷の状態が1である(塩基性アンカー残基を有する対立遺伝子についてのみ)、>7である、または割り当てられていない前駆イオンに対するMS/MSの誘発を防止するためのPeptide Modeを使用したモノアイソトピック前駆体選択(MIPS)と一緒に可能にした。HLAクラスIに関してはデータ収集、電荷の状態が1である前駆イオン(質量範囲800~1700m/z)および2~4である前駆イオンを選択し、一方、電荷の状態が>4である前駆イオンおよび割り当てられていない前駆イオンは排除した。
高磁場非対称波形イオン移動度分光分析(FAIMS)を使用したペプチドの検出を、以下のプロトコールを使用して評価した。A375細胞により内因性にプロセシングされ、提示されたHLAクラスIおよびHLAクラスIIペプチドを酸性逆相(aRP)および塩基性逆相(bRP)オフライン分画の両方に供した後、FAIMSインターフェースを備えていないまたは備えたorbitrap fusion lumos tribid質量分析計を使用してnLC-MS/MSによる分析を行った。図42Aはワークフローを実証する。図42Bは、少量のトリプシン試料ジャーカット細胞、HeLa細胞を用いたFAIMSのベンチマーキングを示す。HLAクラスI結合性ペプチドおよびHLAクラスII結合性ペプチドの両方をFAIMSを使用して解析した(それぞれ図43Aおよび図43B;ならびに図44Aおよび図44B)。それぞれの場合において、ペプチド検出のわずかな改善、特にbRP分画ペプチド。図45および図46は交差サイズを示す。
LC-MS/MSデータの解釈
この節は、例えば、図29に関連する。質量スペクトルを、Spectrum Mill software package v6.0 pre-Release(Agilent Technologies、Santa Clara、CA)を使用して解釈した。MS/MSスペクトルの前駆体MH+が600~2000(クラスI)/600~4000(クラスII)の範囲内に入らない、前駆体電荷が>5(クラスI)/>7(クラスII)である、または検出ピークが最低<5である場合にはそのMS/MSスペクトルを検索から除外した。同じクロマトグラフィーピークで取得された同じ前駆体m/zを有する同様のスペクトルのマージは無効にした。MS/MSスペクトルを、264種の一般的な夾雑物と組み合わせた、ゲノムのhg19アノテーションおよびそのタンパク質コード転写物を伴う全てのUCSC Genome Browser遺伝子を含有するデータベース(63,691種のエントリー;10,917,867種の独特の9merのペプチド)に対して検索した。データベース検索の前に、全てのMS/MSを、配列タグの長さが>2である、例えば、最小で3つの質量がアミノ酸の鎖内質量から分離されるスペクトル品質フィルターを通過させなければならなかった。最小の骨格切断スコア(BCS)を5に設定し、ESI QExactive HLAv2スコア化スキームを使用した。還元もアルキル化もされていないネイティブなHLA-ペプチド試料からのスペクトルの全てを、酵素特異性なし、システイニル化として固定されたシステインの修飾を使用し、以下の可変の修飾:酸化メチオニン(m)、ピログルタミン酸(N末端q)、カルバミドメチル化(c)を用いて検索した。還元およびアルキル化されたHLA-ペプチド試料を、酵素特異性なし、カルバミドメチル化として固定されたシステインの修飾を使用し、以下の可変の修飾:酸化メチオニン(m)、ピログルタミン酸(N末端q)、システイニル化(c)を用いて検索した。ネイティブなHLA-ペプチドデータセットならびに還元およびアルキル化されたHLA-ペプチドデータセットの両方に対して前駆体質量許容誤差±10ppm、生成物質量許容誤差±10ppm、および最小のマッチしたピーク強度30%を使用した。個々のスペクトルについてのペプチドスペクトルマッチ(PSM)を、Spectrum Mill自動検証モジュールを使用して標的-デコイのPSM順位でのFDR推定に基づいた利用に確信的に割り当てられたものと自動的に指定して、スコア化閾値基準を設定した。HLA対立遺伝子に対して最小の配列長7、自動可変範囲前駆体質量フィルタリング、ならびに全てのLC-MS/MS実行にわたって最適化されたスコアおよびデルタ順位1-順位2スコア閾値を使用した自動閾値戦略により、各前駆体電荷の状態についてPSM FDR推定値<1.0%がもたらされた。
PSM FDR推定値<1.0%を通過した同定されたペプチドを、参照データベース内の264種の一般的な夾雑物タンパク質に割り当てられた全てのペプチドを除去することによって、および陰性対照MAPTAC(商標)親和性プルダウンにおいて同定されたペプチドを除去することによって、夾雑物に対してさらにフィルタリングした。さらに、参照データベースのin silicoトリプシン消化物にマッピングされたペプチドはuPLCカラムの試料キャリーオーバーからのトリプシン夾雑物として除外することができないので、これらのペプチド同定の全てを除去した。
MAPTAC(商標)プロトコールを使用したHLA-DR、HLA-DQ、HLA-DPヘテロ二量体の単一対立遺伝子割り当て
LC-MS/MSにより同定されたペプチドへの単一対立遺伝子HLAの割り当ては、2つの手法に従った。HLA-DRA1の対立遺伝子バリエーションは限られており、ペプチド結合に影響を及ぼすとは考えられないので、DR実験(DRB1、3、4および5のプロファイリング)からの全てのデータを、単一対立遺伝子性である、つまり、ペプチドが捕捉用アルファ鎖と対形成した捕捉用ベータ鎖を含むHLAクラスIIヘテロ二量体に結合する可能性が最も高いとみなした。しかし、一部のペプチドが、別個の内因性に発現されたアルファ鎖と対形成したノックインベータ鎖を含むHLA IIヘテロ二量体に結合し得る可能性が残る。
逆に、HLA-DPおよびHLA-DQ遺伝子座に関しては、アルファ鎖は、重要な対立遺伝子バリアントを示し、したがって、ノックインおよび内因性アルファ鎖対立遺伝子の両方が存在することにより、多数のヘテロ二量体の潜在性が生じる。例えば、別個のHLA-DPおよびHLA-DQヘテロ二量体をコードするノックインアルファ鎖およびベータ鎖は、それぞれ内因性に発現されたアルファ鎖およびベータ鎖と対形成し得、それにより、各HLA-DPおよびHLA-DQ MAPTAC(商標)構築物について4つの独特のヘテロ二量体が作り上げられる。したがって、精製されたMAPTAC(商標)ペプチド集団の中での結合特異性は単一対立遺伝子性ではない。この内因性対形成の問題を軽減するために、アルファ鎖およびMAPTAC(商標)ベータ鎖を内因性に含むHLAヘテロ二量体に結合する可能性が高いペプチドの集団を同定することを可能にした、アルファ鎖を欠く構築物を使用した(sans-アルファノックイン)。これらのペプチドを対応するアルファ+ベータ鎖MAPTAC(商標)実験からコンピュータにより差し引いて、単一対立遺伝子MAPTAC(商標)アルファ+ベータ組合せに対する特異的なペプチドの集団を見積もった。
各ペプチドを、UCSC hg19遺伝子アノテーション内の1つまたは複数のタンパク質をコードする転写物に割り当てた。多くのペプチド同定は他と重複し、したがって、大部分が重複する情報を構成するので、図11Cに示されている通り、ペプチドを、各々が約1つの独特の結合事象に対応することが意図されている「入れ子セット」に群分けした。例えば、ペプチドGKAPILIATDVASRGLDV、GKAPILIATDVASRGLD、およびKAPILIATDVASRGLDVは全て、保存された配列KAPILIATDVASRGLDを含有し、おそらく全てが同じレジスター内のMHCに結合する。所与のデータセットのペプチドを入れ子状にするために、各ノードが独特のペプチドに対応するグラフを築き、少なくとも1つの9merを共有し、少なくとも1つの共通の転写物にマッピング可能なペプチドの任意の対間にエッジを創出した。Rパッケージigraph内のクラスターコマンドを使用して、接続したノードのクラスターを同定し、各クラスターを入れ子セットと定義した。この手順により、エッジ基準(共通の9merが1つ以上、共通の転写物が1つ以上)を満たす任意の2つのペプチドが同じ入れ子セット内に入ることが保証される。
以前に公開されたMSデータの解析
以下の節は、少なくとも図12A~12F、図35、図36A~36B、図38D、図39A~39C、図40A~40Bに関する。.rawファイルで提供された公開されたLC-MS/MSデータセットを、Spectrum Mill software package v6.0 pre-Release(Agilent Technologies、Santa Clara、CA)を使用して再処理した。HCD断片化ならびにオービトラップ(高分解能)へのMSおよびMS/MSデータ収集を利用したThermo Orbitrap機器(例えば、Velos、QExactive、Fusion、Lumos)に収集されたデータセットを、上記の節「LC-MS/MSデータの解釈」に記載されているパラメータを使用して解析した。CID断片化を利用したMSおよびMS/MS高分解能データセットに対して、ESIオービトラップスコア化スキームを用い、上記と同じパラメータを使用した。オービトラップへのMSデータ収集およびイオントラップへのMS/MSデータ収集を用いたデータセットに対しても同様に上記と同じ以下のパラメータを使用し、以下の偏差を用いた。HCDデータに対してはESI QExactive HLAv2スコア化スキームを使用し、一方CIDデータに対してはESIオービトラップスコア化スキームを使用した。前駆体質量許容誤差±10ppm、生成物質量許容誤差±0.5Daを使用した。高分解能MS/MSデータセットおよび低分解能MS/MSデータセットの両方に対して、個々のスペクトルについてのペプチドスペクトルマッチ(PSM)を、Spectrum Mill自動検証モジュールを使用して標的-デコイのPSM順位でのFDR推定に基づいた利用に確信的に割り当てられたものと自動的に指定して、スコア化閾値基準を設定した。HLA対立遺伝子に対して最小の配列長7、自動可変範囲前駆体質量フィルタリング、ならびに全てのLC-MS/MS実行にわたって最適化されたスコアおよびデルタ順位1-順位2スコア閾値を使用した自動閾値戦略により、各前駆体電荷の状態についてPSM FDR推定値<1.0%がもたらされた。
図11Dに示されている通り、ヒトプロテオームにおけるアミノ酸頻度を、UCSC hg19アノテーション内のタンパク質をコードする遺伝子全ての配列に基づいて算出した(多数の転写物アイソフォームによって表される遺伝子に対して1つの転写物をランダムに選択する)。IEDB頻度を、≦50nMの親和性が少なくとも1回観察されたペプチドの独特のセットを同定することによって決定した(C末端に六価ポリヒスチジンを有する一部のペプチドは除外する)。MAPTAC(商標)頻度をまず、入れ子セット当たりただ1つのペプチド(最長のもの)を使用し、5種のDRB1対立遺伝子(DRB101:01、DRB103:01、DRB109:01、およびDRB111:01)にわたる標準の順相プロトコールに関して検討した。さらに、いくつかの対立遺伝子にわたってMAPTAC(商標)頻度を塩基性逆相プロトコールについて別々に算出した。外部データセットからのMSデータを、潜在的対立遺伝子起源を考慮せずに、同様に入れ子セット当たり最長ペプチドを使用して解析した。
クラスI(HLAクラスI結合性ペプチド)配列ロゴを築くこと
各クラスI対立遺伝子(図14Aに示されている)について、対応するペプチドの最初の5つの位置(ロゴ位置1~5にマッピングされる)および最後の4つの位置(ロゴ位置6~9にマッピングされる)におけるアミノ酸頻度をプロファイリングすることによって長さ9の配列ロゴを創出した。このように、ペプチドは、長さにかかわらず配列ロゴに寄与した。クラスIIロゴと同様に、文字の高さは各位置における各アミノ酸の頻度に比例し、また、エントロピーが低い位置に色分けを使用する。
MSにより観察されたペプチドの予測される親和性
この節は、少なくとも図14Cに関連する。各クラスII対立遺伝子について、14から17までの独特のペプチド長を全て同定し、結合潜在性についてNetMHCIIpanを使用してスコア化した。比較のために、ランダムな長さを釣り合わせたペプチドをヒトプロテオームからサンプリングした。密度分布(図14Cに示されている)を対数変換された値に基づいて決定した。一部の対立遺伝子は、NetMHCIIpanにより予測が支持されなかったので、解析から除外された。
MSにより観察されたペプチドについての測定された親和性
ペプチドを、予測されるNetMHCIIpan結合親和性が不十分なものである場合(DRB101:01については>100nMまたはDRB109:01およびDRB111:01については>500nM)または以前に公開された生化学的MHC-ペプチド親和性アッセイにおいて試験されるヒューリスティックに定義されたアンカーが≦2である場合、親和性測定値について選択した。
プロテオーム区分の訓練、チューニング、および試験の確立
この節は、少なくとも図15Aに関連する(図31Aも参照されたい)。各ノードがタンパク質をコードする転写物を表し、少なくとも5つの独特の9merのアミノ配列内容を共有する転写物の全ての対の間にエッジが存在する(UCSC hg19遺伝子アノテーション)グラフを創出した。Rパッケージigraph内のクラスターコマンド(cran.r-project.org/web/packages/igraph/citation.html)を使用して、接続したノードのクラスターを同定し、各クラスターを「転写物群」と定義した。このように、2つの転写物がエッジを共有する場合(共有される9merが5つ以上)、同じ転写物群に入ることが保証された。転写物群をランダムにサンプリングし、75%を訓練区分に入れ、12.5%をチューニング区分に入れ、12.5%を試験区分に入れた。全ての解析において、MSにより観察されたペプチド(および観察されていないデコイペプチド)をそれらの供給源転写物の区分に従って区分(訓練、チューニング、または試験)に入れた。供給源転写物が多数の異なる区分にマッピングされる非常に稀な場合には、割り当て優先順序を訓練し(優先性が最も高い)、チューニングし、次いで、試験した(優先性が最も低い)。プロテオームの同じ区分化を区分に基づく分析の全てに使用した。プロテオームの区分化のグラフに基づく手法を使用して、訓練および評価中に同様のペプチド配列が現れ、それにより予測性能が人為的に膨張し得る可能性を最小限にした。
CNNに基づくクラスII結合予測器のアーキテクチャおよび訓練
少なくとも図15Aとの関連で、アミノ酸は「ワンホット」符号化によって表すことができるが、他方ではPMBEC行列およびBLOSUM行列を使用してアミノ酸を符号化する選択をし、その場合、同様のアミノ酸は同様の特色プロファイルを有する。我々のペプチド特色付けの目的のために、解かれたタンパク質構造においてアミノ酸近接性に基づいた独特の行列を生成した。この手法の概念は、アミノ酸の典型的な近隣アミノ酸に化学的特性が反映されるはずであるというものである。約100,000種のDSSPタンパク質構造の各アミノ酸について(cdn.rcsb.org/etl/kabschSander/ss.txt.gz,)、3D空間では最も近いが、一次配列では少なくとも10アミノ酸離れている残基を決定した。このデータを使用して、アラニンの最も近くの近隣アミノ酸がアラニンである回数、アラニンの最も近くの近隣アミノ酸がシステインなどである回数を決定して、近接計数の20×20行列を創出した。行列の各要素をその対応する列および行の合計の積で割り、行列全体を対数変換した。最後に、行列全体の平均値を各要素から引いた。3つの追加的な物理的特色である疎水性、電荷、およびサイズを追加的な列として加え、したがって、各アミノ酸を23の入力特色によって表した。
MAPTAC(商標)により観察されたペプチドに関する予測性能のベンチマーキング、図21A~Bに関連する
所与の対立遺伝子についての予測性能を評価するために、観察することができたが(プロテオームに存在することが理由で)、MSデータでは観察されなかったペプチドのセットを定義することが必要であった。これらの陰性例を「天然のデコイ」と称した(上記の「スクランブルデコイ」とは対照的に)。指導原理の通り、以下を決定した:
1.天然のデコイの長さ分布はMSにより観察されたヒットの長さ分布とマッチすべきである。
2.天然のデコイは、他の天然のデコイと重複する配列を含有すべきではない。
3.天然のデコイはヒットと重複するべきではない。
4.天然のデコイは、少なくとも1つのヒットから生じた遺伝子に由来すべきである。
以下の疑似コードは、これらの原理を満たす評価を創出したプロセスを表す:
Figure 2022518355000003
このセットに対する性能を評価するために、n個のヒットペプチド全てを、19n個のデコイのセット(デコイの完全なセットから、元に戻さずにランダムにサンプリングしたもの)と一緒に予測器(neonmhc2またはNetMHCIIpan)によって評価し、スコア化した。組み合わせたセット内のペプチドの上位5%を陽性コールと標識し、陽性適中率(PPV)を、ヒットであった陽性コールの分率として算出した。陽性の数はヒットの数と等しくなるように制約されるので、この評価シナリオでは再現率がPPVと等しいことに留意されたい。対立遺伝子にわたって一貫した1:19の比を適用することは、そうでなければ各対立遺伝子について観察されるヒットの数の影響を高度に受ける性能値の安定化に役立つ。ヒットの数が対立遺伝子の内在性特性よりも実験条件および反復実験数に大きく関連することが仮定されたので、これは妥当であると思われた。1:19の比は、ダウンサンプリングがインプリメントされなかった場合に使用されるものとさほど離れていない。
IEDB親和性測定値に関する予測性能のベンチマーキング
図15Bに関する通り、NetMHCIIpanをIEDB親和性データに対して訓練したので、そのサンプル外性能をわずかに旧式のバージョンおよびIEDB測定値を使用して評価した。予測された親和性と測定された親和性の対応をケンドールのタウ係数によって決定した。同じ統計値を使用して、同じ測定値のセットに対するneonmhc2の性能を評価した。評価は、対立遺伝子によって、および公開群(SetteまたはBuus)によって別々に行った。
天然のCD4+ T細胞応答の予測性能のベンチマーキング
IEDBにおいて実証されたCD4+ T細胞応答の大部分は未知のまたはコンピュータにより帰属されたクラスII対立遺伝子制限を有するので、クラスII四量体によって実験的に確認された記録のサブセットに焦点を当てた。ほぼ全てのそのような記録はWilliam Kwok Laboratory(Benaroya Research Institute、Seattle、WA)によって寄託されており、免疫反応性個体の血液を使用して、多様な病原体およびアレルゲンの四量体によりガイドされるエピトープマッピング(TGEM)を実施している。陰性ペプチドは一部の試験に関してはポストされているが、他の試験に関してはポストされていないので、供給源である刊行物を精査して、陽性および陰性ペプチド反応性の完全なセットを再構築した。20merのペプチド全てをneonmhc2によって、およびNetMHCIIpanによってスコア化した。対立遺伝子にわたる陽性適中率(PPV)を同等のやり方で対立遺伝子にわたって算出するために、各対立遺伝子についての陰性例を陽性対陰性の比が1:19になるまでランダムにダウンサンプリングした。PPVを、ペプチドの上位のスコア化された5%にわたって実験的に確認された陽性の分率として算出した。性能を受信者操作者曲線によっても評価した。
MHC IIペプチドの逆畳み込みの性能の評価
GibbsCluster(v2.0)ツールの、複対立遺伝子MHCクラスIIペプチドデータを対立遺伝子起源によってクラスター化する能力を評価するために、DR遺伝子型が分かっている対象に対する公開されたDR特異的実験の多様なセットからのペプチド(表2)をまずキュレートした。一部の場合では、元の刊行物ではHLA-DRB1タイピングは提示されているが、HLA-DRB3/4/5についてのタイピングは省略されている。これらの場合に対処するために、IMGTにより提供されたDR1:DR3/4/5連結を仮定し、それが4桁タイピングを分解するのに不十分な場合は、集団「USASanFranciscoCaucasian」において観察された連結(allelefrequencies.net,、集団ID 3098:表2を使用した。
Figure 2022518355000004
各(帰属)遺伝子型に存在する各DRB1/3/4/5対立遺伝子について、我々の単一対立遺伝子MAPTAC(商標)データからの20個のペプチドをスパイクインした。次いで、これらの強化されたデータセットをGibbsCluster-v2.0にサブミットした。
MHC IIペプチドの観察された切断部位の特徴付け
免疫精製を使用してヒト組織をプロファイリングしたいくつかの試験にわたるペプチド同定をマージすることによる、天然にプロセシングされ、提示されるMHC IIペプチドの大きなデータセットが本明細書に開示される(表2)。多くのペプチドが同じN末端(例えば、GKAPILIATDVASRGLDVおよびGKAPILIATDVASRGLD)または同じC末端(例えば、GKAPILIATDVASRGLDおよびKAPILIATDVASRGLD)を共有するので、N末端について1つ、およびC末端について1つの、2セットの重複していないカット部分をキュレートした。次いで、同等数の独特の観察されていないN末端およびC末端カット部分を少なくとも1つのMHC IIペプチドを産生した遺伝子のセットからランダムにサンプリングした。これらの4つのデータセットをN末端ヒット、C末端ヒット、N末端デコイ、およびC末端デコイと称した。さらに、図41に示されている、ペプチドの上流、ペプチド内部、およびペプチドの下流の位置を指すための命名システムを使用した。
N末端ヒットについてU10位からN3位までの各アミノ酸の頻度を決定し、これらの頻度をN末端デコイについて観察されたものと比較した。所与のアミノ酸が所与の位置にある率にヒットとデコイで有意差があるかどうかを決定するために、2×2表(例えば、U1がリシンであるヒットの計数、U1がリシンであるデコイの計数;U1がリシンでないヒットの計数、およびU1がリシンでないデコイの計数)を創出し、カイ二乗検定によってスコア化した。C末端ヒットおよびデコイのC3位からD10位までのアミノ酸頻度を解析するために類似の手法を使用した。
第2の解析では、切断事象の直前の残基と切断事象の後の残基の統計学的結び付きを検討した。まず、U1:N1対(A:A、A:C、A:D、…、Y:V、Y:W、Y:Y)の計数はN末端ヒットとN末端デコイを比較し、各対についての富化/枯渇の有意性を、2×2分割表のカイ二乗検定によって決定した(例えば、P:Kを有するヒットの計数、P:Kを有するデコイの計数;P:Kを有さないヒットの計数、P:Kを有さないデコイの計数)。C末端ヒットおよびデコイのC1:D1対の頻度を解析するために類似の手法を使用した。
種々のクラスII切断予測器の性能のベンチマーキング
健康なドナー由来の末梢血をDR結合性ペプチドについてプロファイリングした。これらの試料を使用して、切断関連変数/予測器の、提示されるクラスIIエピトープの同定を増強する能力をベンチマークした。
結合潜在性および切断潜在性の両方を使用してペプチドの提示を予測する統合予測器を築くために、まず、データセットを、図4に関して記載されているものと同じ手法を使用するが、「試験」区分ではなく「チューニング」区分を使用して構築した。手短に言えば、これは、ヒットとデコイを1:20の比で使用することを意味し、ここで、デコイは、ヒットと長さを釣り合わせたものであり、少なくとも1つのヒットが生成された遺伝子のセットからランダムにサンプリングされたものである。neonmhc2を使用して結合潜在性を算出し、これらの試料は複対立遺伝子であったので、各ペプチド候補ペプチドについての結合スコアを、各ドナーの遺伝子型によって示される1~4種のDR対立遺伝子の平均になるように取得した。この当てはめプロセスにより、前方予測において結合および切断変数に乗せられる相対的な重みが決定された。
前方予測の性能を決定するために、ヒットおよびデコイ(1:19の比)の評価を、ちょうど記載したものと同じプロトコールを使用して「試験」区分から得た。PPVを図4についてと同じ様式で算出した。いくつかの異なる切断予測器を表3に示されている通り評価した。
Figure 2022518355000005
Figure 2022518355000006
MHCクラスII提示と発現の関係
ヒト卵巣組織のHLA-DRリガンドームがプロファイリングされた以前に公開されたMS実験にわたってペプチドをプールした。RNA-Seqデータが入手可能な各試料について、生のfastqをSRAからダウンロードし、bowtie2を使用してUCSC hg19トランスクリプトームにアラインメントした。RSEMによって算出される百万当たりの転写物数(TPM)を使用して転写レベルでの遺伝子数量化を実施した。発現推定値を、遺伝子レベルを合計すること、非コード遺伝子を外すこと、および総TPMが合計1000000になるように再正規化すること(ncRNA存在量のライブラリー間の変動の原因となるタンパク質をコードする遺伝子にわたって再正規化すること)によってさらに処理した。
各組織試料中の各遺伝子に関して、試料中の発現レベルおよび試料中で少なくとも1つのペプチドを産生するかどうかを検討した。全てのMS実験にわたって、これらの知見を発現レベルおよびペプチド生成の状態に従ってビンに入れた(図18Aを参照されたい)。
過剰に表された遺伝子および過少に表された遺伝子の同定
MHC IIリガンドームにおいて過剰に表された遺伝子および過少に表された遺伝子を同定するために、卵巣組織、結腸直腸組織、ならびに皮膚黒色腫、肺がんおよび頭頸部がんがプロファイリングされた5つの以前の試験からのデータをコンパイルした。各遺伝子について、我々のベースライン仮定は、ペプチドがその長さにその発現レベルを掛けた割合でもたらされるはずであるというものであった。各遺伝子の長さを決定するために、全ての転写物アイソフォームにわたる独特の9merを数え上げた。転写物アイソフォームにわたって合計することによって遺伝子レベル発現を得た。観察された、各遺伝子にマッピングされるペプチドの数を入れ子セットレベルで決定した(例えば、ペプチド GKAPILIATDVASRGLDV、GKAPILIATDVASRGLD、およびKAPILIATDVASRGLDVを単一の観察として計数した)。
卵巣試験からの多くの試料には対応するRNA-Seqデータがあったが、一部にはなかった。これらの場合には、RNA-Seqデータが入手可能な試料にわたって平均することによって発現を推定した。結腸直腸試験および黒色腫試験に関しては、いずれの試料についても対応するRNA-Seqが存在せず、したがって、GTExおよびTCGAからのデータを使用して代理試料にわたって平均を算出した。全ての場合において、生のfastqを得、それらを、卵巣試験のRNA-Seqに関して上に記載されているものと同じプロトコールに従ってアラインメントし、数量化した。
それぞれEおよびOと称される予測される計数および観察された計数を表す2つの行列を創出し、行は遺伝子に対応し、列は試料に対応する。まず、各試料中の各遺伝子の長さにその発現を掛けることによって行列Eをポピュレートし、次いで、Eの列を再尺度化して、Eの列の合計とOの列の合計がマッチするようにした。最後に、Eの行の合計とOの行の合計を比較することによって遺伝子レベル解析を行った。遺伝子をヒト血漿中のそれらの存在および濃度に従って強調表示した。
オートファジーに関連する遺伝子の解析
2つのオートファジー関連遺伝子セットを定義した。第1のセットは、公知のオートファジー関連遺伝子の物理的相互作用パートナーとして実験的に同定されたタンパク質を含むものであった。オートファジー相互作用ネットワークデータベース(besra.hms.harvard.edu/ipmsmsdbs/cgi-bin/downloads.cgiからアクセスされる)に寄託されている、IP-MS実験においてベイトとして使用された規準のオートファジー関連遺伝子各々(genenames.org/cgi-bin/genefamilies/set/1022)について、「WD」信頼度スコア(besra.hms.harvard.edu/ipmsmsdbs/cgi-bin/tutorial.cgi)に従った上位100種のタンパク質同定を同定した。22の実験にわたってプーリングを行い、少なくとも1つの規準のオートファジー関連遺伝子に確信的に関連付けられる1004種の独特の遺伝子のセットを得た(図18C)。
オートファジー関連遺伝子の第2のセットを、仔マウス腎臓上皮(iBMK)細胞におけるATG5ノックアウト前後の汎プロテオームタンパク質存在量をSILAC(sciencedirect.com/science/article/pii/S1097276514006121)を使用して測定した試験を使用して同定した。t-統計値が>5である遺伝子を、ATG5ノックアウトによって安定化されるものと分類した(事前飢餓条件;補足的データファイルmmc2.xlsの変数「Intercept_t」)。各マウスUniprot IDをhg19 UCSC IDにマッピングするために、マウスUniprot配列と大多数の9merを共有するヒトUCSC タンパク質配列を決定した(図18C)。
図18Bに基づいて、遺伝子当たりの観察されたペプチド対予測されたペプチドの比Rを算出し、分子および分母の一方または両方に疑似カウントを足した。例えば、R=(O+1)/(E+1)。これらの遺伝子についての相対的富化/枯渇を数量化するためには情報が不十分であると感じられた各遺伝子の相対的富化(Log(R)>0)または枯渇(Log(R)<0)を表すためにLog(R)を取った。有効なLog(R)算出を有する遺伝子の間で、Log(R)分布を、IP-MSデータセット内のもの、SILACデータセット内のもの、およびいずれのデータセットにもないものについてプロットした(図18C)。
供給源遺伝子の局在の解析、図18Dに関連する
上記と同じlog(R)スコアを使用して、各供給源遺伝子の局在に従った分布をプロットした(図18D)。供給源遺伝子の局在を、Uniprot(uniprot_sprot.dat)を使用して決定した。
単一細胞RNA-SeqデータにおけるクラスII発現データの解析、図19Aに関連する
単一細胞RNA-Seqデータを、3つの、ヒト腫瘍試料がプロファイリングされた以前に公開されたデータセットから得た。
第1の試験には皮膚黒色腫からのデータを含めた。ファイル「GSE72056_melanoma_single_cell_revised_v2.txt」をGene Expression Omnibus(ncbi.nlm.nih.gov/geo/;accession:GSE72056)からダウンロードした。腫瘍の状態フラグ「2」を有する細胞を腫瘍細胞として扱い、腫瘍の状態フラグ「1」、および「1」から「6」までと等しい免疫細胞型フラグで標識された細胞をそれぞれT細胞、B細胞、マクロファージ、内皮、線維芽細胞、およびNKとして扱った。他の細胞は全て外した。データをlog2(TPM/10+1)の単位でネイティブなまま示し、したがって、TPM尺度に数学的に変換した。TPM尺度になったら、各細胞についてのデータを、タンパク質をコードするUCSC遺伝子の符号のセットにわたって再正規化して、1,000,000まで合計した(発現行列に現れないタンパク質をコードする遺伝子は暗黙のうちにゼロ発現を有するものとして扱った)。最後に、同じ細胞型および同じ供給源の生検材料に対応する単一細胞観察を平均して患者-細胞型レベルの発現推定値を生じさせた。
第2の試験には、頭頸部腫瘍からのデータを含めた。ファイル「GSE103322_HNSCC_all_data.txt」をGene Expression Omnibus(ncbi.nlm.nih.gov/geo/;accession:GSE103322)からダウンロードした。表中のデータは、log2(TPM/10+1)単位である;したがって、値をTPM単位に数学的に変換した。黒色腫試験と同様に、各細胞についてのデータを、タンパク質をコードするUCSC遺伝子の符号のセットにわたって再正規化して、1,000,000まで合計し、同じ細胞型および同じ供給源の生検材料に対応する単一細胞観察を平均した。リンパ節生検材料に対応するデータを除外した。
第3の試験には、無処置の非小細胞肺からのデータを含めた。ファイル「RawDataLung.table.rds」および「metadata.xlsx」をArrayExpress(ebi.ac.uk/arrayexpress/;accessions:E-MTAB-6149およびE-MTAB-6653)からダウンロードした。データ(すでにTPM)単位を、以前に記載されているタンパク質をコードする遺伝子のセットにわたって再尺度化して、1,000,000まで合計した。最後に、同じ細胞型および同じ供給源の生検材料に対応する単一細胞観察を平均して患者-細胞型レベルの発現推定値を生じさせた。結腸直腸がんおよび卵巣がんにおける同様の試験を実施した。結果を図19Aに示す。
簡単にするために、表4に、細胞型をマージしてネイティブなまま報告されたものよりも粒度を粗くした。
Figure 2022518355000007
5つの試験におけるHLA-DRB1の発現レベルを図19Aにプロットした。
腫瘍由来クラスII発現と間質由来クラスII発現の特徴付け
腫瘍に起因するMHCクラスII結合性ペプチド発現と間質に起因するMHCクラスII結合性ペプチド発現の相対量を決定するために、TCGA患者におけるクラスII経路遺伝子の変異を同定し(DNAに基づいてコールされる)、クラスII変異を有する各患者について、遺伝子の変異したコピーおよび変異していないコピーの相対的な発現量を対応するRNA-Seqで数量化した。さらに、以下を仮定した:
1.変異リードは腫瘍から生じる
2.非変異リードは間質または腫瘍における野生型対立遺伝子について生じる
3.腫瘍は変異コピーとほぼ等しい発現を有する野生型コピーを保持する
これに基づいて、観察された変異体対立遺伝子分率fに関して、腫瘍に起因するクラスII発現の分率はおよそ2fであり、100%以下であることが決定された。3種の遺伝子、つまりCIITA、CD74、およびCTSSを中核クラスII経路遺伝子として選択し、TCGAで変異について評価した(同義変異およびUTR変異を除外しない)(データをTumorPortal(tumorportal.org/):BRCA、CRC、HNSC、DLBCL、MM、LUAD;TCGAバルクダウンロード(tcga-data.nci.nih.gov):CESC、LIHC、PAAD、PRAD、KIRP、TGCT、UCS;Synapse(synapse.org/#!Synapse:syn1729383):GBM、KIRC、LAML、UCEC、LUSC、OV、SKCM;または元のTCGA公開(cancergenome.nih.gov/publications):BLCA、KICH、STAD、およびTHCAからダウンロードした)。これらの遺伝子をクラスII発現におけるそれらの公知の役割、および8500のGTExサンプルのコホートにわたるそれらのHLA-DRB1との密接な相関に基づいて選択した。HLA-DRB1(HLA-DRA1、HLA-DPA1、HLA-DQA1、HLA-DQB1、およびHLA-DPB1)と等価相関を有する他の遺伝子は、それらの多型的性質により偽陽性変異コールが起こりやすくなるので除外した。天然に、患者のごく一部のみがCIITA、CD74、またはCTSSに変異を有し、また、一部の腫瘍型に関しては、解析に利用可能な患者が存在しなかった。
Binary Sequence Alignment/Map(BAM)フォーマットの元の全エクソーム配列決定(WES)の配列を視覚的に評価して(IGVツール)、変異が腫瘍試料には存在するが正常な試料には存在しないことを確認した。変異体リード計数と野生型リード計数とを対応するRNA-Seqからpysamを使用して得た。全体的なHLA-DRB1発現をGenomic Data Commons(gdc.cancer.gov)からダウンロードした発現データに基づいて決定し、それを、タンパク質をコードする遺伝子のセットにわたって再正規化して、1,000,000まで合計した。腫瘍に起因するHLA-DRB1発現の分率(図19B)をmin(1,2f)として推定し、ここで、fは、変異を示すCIITA、CD74、またはCTSSにおけるRNA-Seqリードの分率である。
天然のドナー組織に対する予測の全体的な性能の評価
7体の健康なドナー由来の末梢血を、上の節「抗体に基づくHLA-ペプチド複合体の単離」に記載されている通り、DR特異的抗体を用いてプロファイリングした。これらの結果に基づいて、2つのデータセットを定義した:一方は多変量ロジスティック回帰を当てはめるためのものであり、他方は回帰の予測性能を評価するものであった。
第1のデータセットを、図4との関連で前に記載されているヒットおよびデコイ選択アルゴリズムを使用することによって築いた。手短に言えば、これは、各入れ子セットを1つのヒットペプチド(入れ子セット内で最も短いペプチド)で表すことおよび遺伝子にわたって長さを釣り合わせたデコイをタイリングすることを意味し、したがって、ヒットと最小に重複し、互いに最小に重複する。しかし、2つの重要な詳細が図4に関して概説したアルゴリズムとは異なる。第1に、ヒットおよびデコイは、「チューニング」区分内の遺伝子(「試験」区分ではなく)から選択され、第2に、デコイを、ゼロヒットを示した遺伝子にマッピングさせた。MHC結合スコア(NetMHCIIpanまたはneonmhc2に由来するもの)ならびに他の入力特色(発現、遺伝子の偏りなど)を用いたロジスティック回帰モデルをこのデータセットに対して訓練した。
第2のデータセット(評価のために使用する)を、「試験」区分から引き出されたヒットおよびデコイを使用した以外は同一の様式で築いた。表5に示す通り、結合スコアに加えて以下の変数を回帰のサブセットに使用した。
Figure 2022518355000008
性能評価の目的で、n個のヒットペプチド全てを、499n個のデコイ(デコイの完全なセットから、元に戻さずにランダムにサンプリングしたもの)のセットと一緒に所与のロジスティック回帰によって評価し、スコア化した。組み合わせたセットのペプチドの上位0.2%を陽性コールと標識し、陽性適中率(PPV)を、ヒットであった陽性コールの分率として算出した。この評価シナリオでは、陽性の数はヒットの数と等しくなるように制約されるので、再現率はPPVと正確に等しいことに留意されたい。対立遺伝子にわたって一貫した1:499の比を適用することは、そうでなければ各ドナーについて観察されるヒットの数の影響を高度に受ける性能値の安定化に役立つ。ヒットの数が、ドナー細胞の内在性特性よりも実験条件に大きく関連すると仮定されるので、これは妥当であると思われた。1:499の比は、ダウンサンプリングがインプリメントされなかった場合に使用されるものとそう遠くなかった。
本発明の好ましい実施形態が本明細書において示され、記載されているが、そのような実施形態は単に例として提供されていることは当業者には明白であろう。本発明は、本明細書の中で提供される特定の実施例によって限定されるものではない。本発明が上記の明細書に関連して記載されているが、本明細書の実施形態の説明および図表は、限定の意味で解釈されることを意図していない。当業者は、本発明から逸脱することなく多数の変形、変化および置換をすぐに思いつくであろう。さらに、本発明の全ての態様は、本明細書に記載の特定の描写、構成または種々の条件および変化するものに依存する相対的な割合に限定されないことが理解されるべきである。本明細書に記載の発明の実施形態に対する種々の代替を本発明の実施に使用することができることが理解されるべきである。したがって、本発明は、任意のそのような代替物、改変、変形形態または等価物も包含することが意図されている。以下の特許請求の範囲により本発明の範囲が定義されること、および、それにより、これらの特許請求の範囲内に入る方法および構造ならびにそれらの等価物も包含されることが意図されている。
(実施例11)
HLAクラスII対立遺伝子結合性エピトープのハイスループットな同定および検証
本実施例では、新規のMHC-II対立遺伝子結合性ペプチドを同定および検証するための、時間分解蛍光エネルギー移動(TR-FRET)を使用した代表的な信頼できるハイスループット方法を記載する。アッセイには以下のいくつかの部分がある。(1)細胞に、FRETアッセイ用の蛍光タグを有するMHC-IIα鎖およびβ鎖の発現および分泌に適したベクター構築物をトランスフェクトすること、(2)分泌されたMHC-II構築物のタンパク質産物を精製すること、(3)ペプチド交換アッセイを実施すること(図22A)。図22Bおよび図23に設計および手順をさらに例証する。本明細書に記載のアッセイでは、安定な細胞株を必要としなくてよく、また、単純な単離戦略を包含するので、高速かつ効率的な検出および検証プロトコールが促進される。さらに、四量体または多量体を使用して、例えばneonmhc2により予測されたエピトープをin vivoで投与した後に抗原特異的CD4細胞を検出することができ、その後に生じた免疫応答を使用してCD4+ T細胞応答を検証する。
高親和性MHCクラスII結合性ペプチドを同定するためのCLIP-TR-FRETアッセイ
単一の構築物におけるCMVプロモーターによって駆動されるHLAクラスIIα鎖およびβ鎖の発現のための例示的なベクター、適当にフォールディングされたα鎖およびβ鎖対がもたらされるタンパク質産物が本明細書で提示される。適当にフォールディングされたα鎖およびβ鎖の形態では、α1サブユニットおよびβ1サブユニットは二量体の形態であり、α1サブユニットおよびβ1サブユニットは、生理的立体配置が似ているペプチドを受容することができる開いた受容末端を形成する。このアッセイの目的に関しては、これらのベクターにより発現された、適当にフォールディングされたα鎖およびβ鎖の形態を有するHLAタンパク質産物は、HLA単量体と称される。発現構築物は、リンカー、1つまたは複数のペプチド切断部位、分泌シグナル、二量体形成因子、例えば、c-FosおよびJun、これらと連結したビオチン化モチーフ(BAP)および10×-Hisタグを含む。単量体を安定化し、分泌を補助するためにプレースホルダーペプチドを使用する。プレースホルダーペプチドは、CMVペプチドであり得る。プレースホルダーペプチドは、CLIPペプチドであり得る。プレースホルダーペプチドは、対立遺伝子についてのMSに基づくリガンドームによって同定されたペプチドであり得る。プレースホルダーペプチドは、開いたα1-β1ペプチド受容末端においてHLAペプチドと共有結合により結合したものであり得る。
本明細書で使用される例示的な構築物は、図23(上のパネル)に示されている通り、CLIPとβ鎖の間にトロンビン切断部分が配置されたCLIPプレースホルダーペプチドをコードする。トランスフェクションを行い、トランスフェクトされた細胞を最適な成長に到達するまで培養したら、分泌型タンパク質(単量体)を含む細胞培養上清(培地)を収集し、精製のためにニッケル(Ni2+)カラムを通過させた(図24)。発現レベルおよび精製をクーマシー染色によって調査した。28merのCLIPペプチドはβ鎖と会合したままであり、これはトロンビンによる処理によって切断され(図24)、その後、試験(例えば、候補)HLA-クラスII結合性ペプチドと競合させることによって取り除くことができる。CLIPペプチドを首尾よく取り除く試験ペプチドは、IC50によって測定される、CLIPペプチドに置き換わる能力に基づいて、説明可能に、構築物のMHC-IIヘテロ二量体への結合に関して同類ペプチドである。新規の試験ペプチドを上記の競合置換え反応に使用することができ、次いで、質量分析(MS)によって同定することができる。
CLIPプレースホルダーペプチドを用いてHLA-DRヘテロ二量体構築物の大きな集合を作出し、それらは首尾よく分泌され、ペプチド交換アッセイを実施した。
CD74に由来するペプチドプレースホルダーCLIPがHLAクラスII単量体の分泌に対して有意な効果を有することが観察された。CD74配列PVSKMRMATPLLMQAを有する編集された規準のCLIPペプチド(図25A~25CではCLIP0と称される)が一般にプレースホルダー配列として使用された。しかし、一部のHLA-DRペプチド、例えば、DRB112:01およびDRB113:02は規準のペプチドを用いると収量が低いことが認められた(表6)。ある特定のHLA DRB対立遺伝子二量体が、配列:LPKPPKPVSKMRMATPLLMQALPM(CLIP1)のアミノ酸の全部または一部を包含する配列よりも長い結合性配列を有することが観察された(図25A)。実際に、DRB112:01およびDRB113:02の場合、CLIP0配列の代わりにCLIP1配列を使用することにより、HLA二量体の分泌収量が改善された(図25B~25C)。
Figure 2022518355000009
STII-TR-FRETを使用した上首尾のペプチド交換アッセイによるペプチドの新規のスクリーニング
ペプチドを、上記のHLA-単量体タンパク質をExpi293細胞などの細胞株において発現させ、上清から収集および精製し、ペプチド交換アッセイに供することを伴うアッセイを使用して新規にスクリーニングすることができる。予測アルゴリズムによって予測されたHLAクラスII結合性ペプチドを、ペプチド交換アッセイを使用して試験することができた。ペプチド交換アッセイは、蛍光偏光を伴う方法を使用して実施することができる。例えば、プレースホルダーペプチドを標識するため、または試験ペプチドを標識するため、または2つの異なるフルオロフォアを使用してその両方を標識するために任意のフルオロフォアを使用することができる。置換え反応を定量的に評価するために、フルオロフォアで予め標識されていたプレースホルダーペプチドの結合の喪失によるか、または、そうでなければHLAと結合した形態では生化学的反応によってクエンチされる、遊離したフルオロフォアの蛍光発光による蛍光の変化を記録することができる。あるいは、非蛍光プレースホルダーペプチドが標識された蛍光ペプチドに置き換わったことを記録して、置換え反応を定量的に決定することができる。例示的なアッセイでは、FITCで標識されたプレースホルダーCLIPペプチドを使用して、CMVペプチドなどの既存の共有結合したペプチドを置き換える。FITCで標識されたペプチドは、HLAと結合している場合、高い極性化を誘導する。試験ペプチドを用いてFITC-プレースホルダーペプチドの力価測定を行った場合、試験ペプチドによりFITC-CLIPが置き換えられ、それにより、蛍光の低減が導かれる。
本明細書に記載の蛍光偏光の代わりに時間分解FRET(TR-FRET)技術を使用してペプチド交換アッセイを実施することもできる。本明細書に記載の例示的なTR-FRETアッセイでは、細胞に、Streptag II(STII)部分を含むプレースホルダーペプチドを有するHLA単量体構築物をトランスフェクトした。STIIに対するAlexa-647タグが付された抗体によってSTII部分を検出した。同時に、本実施例において前に記載した単量体構築物のJun末端に付着した、HLAペプチドのα2-β2末端の付近に存在するHisタグを抗His抗体とカップリングしたユウロピウムIII(Eu)化合物によって検出した(図26A)。プレースホルダーペプチドがHLA単量体と結合したままの場合、FRET反応においてEu複合体はエネルギー供与体として作用し、一方、Alexa647は受容体として作用する。試験ペプチドによりSTII-CLIPプレースホルダーが置き換えられると、Alexa-647-αSTIIペプチドは遊離するが、もはや蛍光によって検出されない。TR-FRETアッセイは蛍光偏光よりも信頼できることが見いだされた。さらに、当該アッセイでは、バックグラウンドシグナルがはるかに低減した(蛍光読み取りデータが図26B~26Eに示されている)。当該アッセイにより、HLA-ペプチド対に対するハイスループットな同定プラットフォームがもたらされる。以下の表7に示されている通り、試験ペプチド(または候補ペプチド)P-156~P-191は広範囲の置換え能力、および、各実行で算出されたIC50によって決定された結合親和性を示した。IC50が低いほど、高い置換え能力、および高い結合親和性が実証される。
Figure 2022518355000010
示差走査蛍光光度法(DSF)を使用したペプチド交換検証
この方法では、特定のHLA対立遺伝子に結合し得るペプチドをスクリーニングするためのハイスループットアッセイ、およびまた、HLA二量体とのペプチド結合の強度を決定する(図26F)。このアッセイでは、熱の適用によって対立遺伝子が互いに解離した場合にのみタンパク質の疎水性残基に結合し、したがって、MHC対立遺伝子に結合し得る蛍光プローブを使用する。MHCクラスII二量体が同類ペプチドに結合すると、二量体はその二量体形態で一緒に保持される。結合した形態のMHC二量体-ペプチドに熱を適用すると、弱く結合しているペプチドはより速くMHCクラスIIタンパク質二量体から解離し、それにより、フルオロフォアが解離したMHCアルファ鎖およびベータ鎖に結合することが可能になり、高い蛍光が生じる。蛍光を温度に応じて記録する。代表的な融解曲線を図26Fに示す。融解曲線を比較して、強力な結合体(より高い温度で蛍光が検出される)と弱い結合体(より低い温度で蛍光が検出される)とを決定することができる。
可溶性HLA-DM(HLA-sDM)の、MHCクラスIIペプチド交換の触媒としての使用:HLA-DMは、天然のシャペロンであり、また、HLA-DR、HLA-DP、およびHLA-DQ分子のペプチド交換触媒である。HLA-DMは内在性膜タンパク質であり、アルファポリペプチド鎖とベータポリペプチド鎖のヘテロ二量体として存在する(DMAおよびDMB)。この節に記載されているペプチド交換は、可溶性形態のHLA-DM(例えば、HLA-sDMタンパク質)をHLA-DR、HLA-DP、およびHLA-DQ交換のシャペロンとして使用して実施する。図26Gに示されている通り、HLA-sDMタンパク質はExpi-CHO細胞における一過性トランスフェクションによって産生される。簡単に述べると、図26Gの上半分に図表で示されている通り、組換えHLA-sDM構築物を設計する。組換えHLA-sDM構築物は、リーダー配列の上流にあり、プロモーターに作動可能に(operably)連結したCMV構成的プロモーターを含む。リーダー配列は、産物の分泌を補助する(分泌シグナル)。リーダー配列の3’末端に、HLA-DMベータ鎖外部ドメインをコードする(および膜貫通ドメインを欠く)配列を導入する。ビオチン化モチーフ(BAP)をコードする配列を、ベータ鎖をコードする配列の3’にライゲーションする。HLA-DMアルファ鎖外部ドメインをコードする(および膜貫通ドメインを欠く)配列を分泌配列(リーダー)と共に5’末端に配置し、BAP配列とは、リボソームスキッピング配列を介在させることによって分離する。HLA-DMアルファ鎖配列を3’末端において10×Hisタグとライゲーションする。ヘテロ二量体HLA-sDMが形成されたら、細胞の外部に分泌される。この構築物をExpi-CHO細胞において発現させると、HLA-sDMタンパク質が培養培地中に分泌される。
Expi-CHO細胞に、HLA-sDM構築物を発現するプラスミドベクターをトランスフェクトし、約14日間の期間にわたって培養した。培養期間にわたってタンパク質を培養培地中に分泌させた。HLA-sDMタンパク質を培養物からMHC-IIタンパク質の精製と非常に類似したプロセスで精製した。MHC-IIペプチド交換は、酸およびHLA-sDMを用いて、または酸を用いずに、およびオクチルグルコシドを用いて効率的に実施することができる。分子ふるいクロマトグラフィーを実施して、ペプチド交換を評価した。結果が図26Hに示されている。ペプチド交換アッセイは全て、HLA-sDMまたはオクチル-グルコシドを触媒として使用して実施した。
HLA-クラスII四量体(または多量体)レパートリー
エピトープ:HLA結合および解離カイネティクスを生化学的アッセイにおいて試験するために、HLAクラスII四量体の大きなレパートリーを生成した。したがって、これらの生成されたクラスII四量体を、ペプチド結合および提示をアッセイするために使用する。例えば、四量体をペプチド交換アッセイに使用した。図27Aに示されている通り、12種の四量体を生成し、6種の四量体を15mg/mlよりも高い濃度で保存し、4種の四量体を<5mg/mlで保存した。HLA四量体をフローサイトメトリーに使用して、ネオ抗原反応性CD4+ T細胞を同定する。インフルエンザウイルスエピトープ(HA)およびHIVエピトープを、存在する場合にはT細胞認識についてHLA四量体によって試験した(図27E)。
図27B~27Dは、生成および精製されたHLAクラスII四量体の種々のサブセットを示す。図27Bに示されている通り、DRB1ヘテロ二量体四量体の大きなレパートリーを構築し、15mg/Lよりも高い濃度で精製した。図27Cおよび27Dは、蛍光に基づくペプチド結合アッセイのために作製され、検証されたヒトMHCクラスII対立遺伝子構築物のカバレッジを要約するものである。表8A、表8Bおよび表8Cには、製造された対立遺伝子の四量体の一覧が、精製された産物の対応する分泌収量濃度と共に提示されている。
Figure 2022518355000011

Figure 2022518355000012

Figure 2022518355000013
MHC-II四量体産物パイプラインは、DRB3、DRB4、およびDRB5対立遺伝子、ならびにDPおよびDQ対立遺伝子をさらに含む。
蛍光偏光(FP)を使用したペプチド交換検証
MHCクラスIIタンパク質に結合したペプチドと遊離のペプチドを区別するためのアッセイに蛍光偏光顕微鏡を使用した。蛍光タグが付されたプレースホルダーペプチドは、MHCクラスII二量体と結合すると、その遊離形態、フルオロフォアタグ付けされていない競合エピトープペプチドがプレースホルダーペプチドに置き換わることによってMHCクラスII二量体に結合したままの場合と比較して、蛍光偏光(FP)顕微鏡による高度に極性化した光をもたらす。図28Aは原理をグラフ表示によって示す。簡単に述べると、アッセイを以下の一般化された方法で実施し、変形形態がそれぞれの説明に示されているか、または当業者に容易に理解される。
表9(以下)に記載されている試薬を反応チューブ(例えば、1.5mlのEppendorfチューブ)中でアセンブルし、十分に混合し、37℃で2時間インキュベートする。インキュベーション時間の最後に10×PBS、25mlを混合物に添加してペプチド交換反応を中和する。
Figure 2022518355000014
交換されたペプチドを、例えば染色によって検出する;または後で評価するために液体窒素でスナップ凍結させることによって-80℃で保管する。
図28Bおよび28Cは、HLA DRB101:01についてのFPを使用したアッセイ展開、および使用した種々の条件の概要を提示する。一部の実施例では、アッセイに対するpHの影響を決定した。手短に言えば、全長対立遺伝子および可溶性対立遺伝子の両方を細胞において発現させる。膜に結合した全長対立遺伝子の形態は膜を透過処理することによって回収し、一方、分泌形態は細胞の上清から回収する。回収されたHLAクラスIIタンパク質を、ニッケル(Ni2+)カラムを通過させることによって精製する。一部の実施例では、全長MHCII対立遺伝子を回収するための膜透過処理における界面活性剤(1%オクチルグルコシド対1.6%NP40)の影響を評価した。一部の実施例では、温度、または使用するプローブ、または精製方法もしくは標的フォーマットの影響を個別に評価した(図28B)。
コンフォメーション特異的抗体L243またはHisタグ精製のいずれかを使用した精製方法の影響を評価した。結果を図28Dに示す。各データポイントが表の左側に示されており、右側のグラフに単一のドットとして表されている。グラフのドットは大まかにどちら軸にも45度の角度に沿って整列しており、r値は0.9621であり、これは、どちらの精製方法によるIC50値も互いにと一致することを示す。これはまた、ペプチド効力の順位が精製方法間で変わらないことも示す。
可溶性形態のHLAクラスIIタンパク質(sDR1)か全長形態のHLAクラスIIタンパク質(fDR1)の選択の影響を評価し、図28Eは、標的フォーマットの選択がペプチド効力に影響を及ぼさないことを示す。左側にはsDR1形態またはfDR1を使用した実験からの平均IC50値が示されている。これらのデータをプロットして右側のグラフを得る。各々が単一のドットによって示されているデータ点は、どちらの軸にも大まかに45度の角度に沿って整列しており、r値は0.9365であり、これは、使用した形態のどちらによるIC50値も互いに十分に相関することを示す。これはまた、ペプチド効力の順位が精製方法間で変わらないことも示す。
図28Fは、neonmhc2およびNetMHCIIpanにより予測されたペプチドの結合アッセイにおける例示的な評価方法および不調和のペプチドの同定の図解を示す。Neonmhc2およびNetMHCIIpanにより予測されたペプチドを実際のペプチド結合アッセイにおいて評価するために蛍光偏光アッセイを使用した。アッセイのために、60nMのトロンビンにより消化された可溶性HLA-DRB115:01をFITCタグが付された超結合体プローブペプチド(PVVHFFK(FITC)NIVTPRTPPY)(アッセイ当たり10nM)およびアッセイペプチドと一緒にアッセイ緩衝剤(pH5.2)中、37℃で5時間インキュベートした。蛍光偏光を調査し、それから%プローブ置換えを算出した。図28Gに示されている通り、超結合体蛍光ペプチドの阻害は予測されたペプチドの濃度に比例し、これにより、アッセイの特異度が良好であることが示される。Neonmhc2によるペプチドの予測とNetMHCIIpanによるペプチドの予測の性能に著しい差異が見られる。Neonmhc2によるペプチドの予測では、より多くのペプチドが陽性に結合し、阻害の程度がより高かったが、一方、NetMHCIIpanによるペプチドの予測はNeonmhc2ペプチドと比較して全体的に不十分であった。図28Hは、Neonmhc2により予測されたペプチドの結合アッセイにおける評価を要約する。円グラフによって示されている通り、ダブルネガティブペプチド(NetMHCIIpanとNeonmhc2のいずれによっても予測されなかったペプチド)のうち、結合体であることが判明したのは5%だけであり、95%が非結合体であった。NetMHCIIにより予測されたペプチドのうち、40%がプローブ置換えアッセイの蛍光偏光検出により結合体であり、Neonmhc2により結合体であると予測されたペプチドのうち、100%が真の結合体であることがプローブ置換えアッセイによって見いだされた。
Setteらによって特定の対立遺伝子に結合することが示された以前に公開されたペプチドを精査することにより、FITC標識されたプローブを調製した。次いで、これらのペプチド配列を、予測されたクラスII結合性コアを使用して解析して、ペプチドおよびアンカー残基の最小の9merのコアを同定した。次いで、この情報を、リシン置換およびFITC標識のための残基位置を選択する際に考慮した。例えば、下記の表(表10)には、Sette et al.(Sidney J, Southwood S, Moore C, et al. Measurement of MHC/peptide interactions by gel filtration or monoclonal antibody capture. Curr Protoc Immunol. 2013;Chapter 18:Unit-18.3. doi:10.1002/0471142735.im1803s100)(以下「Sette配列」))に記載されている配列が列挙されている。特定の対立遺伝子に関して、各ペプチドについての予測されたクラスII結合性コアに下線が引かれている。太字は、エピトープ改善の結果として同定されたアンカー位置を示す。一部の場合では、異なる対立遺伝子に対して同じペプチド配列を使用することができる。
Figure 2022518355000015
上記の配置に基づいて、青色でない結合性コア内の位置(下線が引かれている)に焦点を当てることによってFITCコンジュゲーションのための内部リシンを選択した-赤色で強調表示されているのがこれらの位置であり、必要に応じてFITCコンジュゲーションのための位置である。FITCコンジュゲーションのための内部リシンを有さない配列に関しては、対立遺伝子の結合性モチーフとペプチド配列の比較を実施し、DRB109:01およびDRB103:01ペプチドについての内部リシン置換のための位置を選択する手動による手法を行った(上記の表を参照されたい)。より詳細には、FITCコンジュゲーションを可能にするために、DRB109:01についてはロイシン残基、およびDRB103:01についてはアルギニン残基をリシンで置換した。コンジュゲートしたフルオロフォアは結合した時に極性化した光を放出する可能性がより高い(すなわち、フルオロフォアの運動がより大きく制限される)ので、この置換戦略は、位置の手動での同定が強力なアミノ酸優先性を伴わない(neonmhc2により予測された9merのコアの中間にも存在する)MAPTAC由来のモチーフに基づくものであった。
(実施例12)
治療的に標的化可能ながん抗原を同定するためのHLAクラスII結合およびプロセシング規則
増加しているエビデンスにより、CD4+ T細胞はがん特異的抗原を認識し、腫瘍成長を制御することができることが示されている。しかし、依然としてヒト白血球抗原クラスII分子(HLAクラスII)によって提示される抗原を予測することは難しく、それにより、それらの抗原を治療的に最適に標的化する試みが妨害されている。障害には、不正確なペプチド結合予測およびHLAクラスII経路の未解決の複雑さが含まれる。本実施例では、HLAクラスII結合性モチーフを発見するための改善された技術を記載する。さらに、腫瘍微小環境(TME)における関連性のあるプロセシング規則を学習するために行う腫瘍-リガンドームの包括的な解析が本明細書に記載されている。
40種のHLAクラスII対立遺伝子をプロファイリングし、結合性モチーフがペプチドローディングシャペロンであるHLA-DMに対して高い感受性を持つことが示された。がん細胞ではなくプロフェッショナル抗原提示細胞(APC)による腫瘍内HLAクラスII提示が優位を占めることが明らかになった。これらの知見を統合して、ファゴサイトーシスされたがん細胞由来のペプチドを含めたAPCリガンドームを正確に予測する本明細書に記載のアルゴリズムを開発した。これらのツールおよび生物学的洞察により、HLAクラスIIを対象とするがん治療を増強することができる。
有望な新しいクラスの治療は、がん抗原および新抗原と称される体細胞変異した配列に対するT細胞応答を誘導することによってがんを処置しようとするものである。現在のところ、これらの試みでは、HLAクラスI(HLAクラスI)により提示されるリガンドに対するCD8+ T細胞応答を引き出すことに主に焦点が当てられている。しかし、いくつかの最近の試験により、CD4+ T細胞がHLAクラスIIにより提示されたリガンドを認識し、腫瘍の制御に寄与することができることも示されている。がんワクチンおよび他の免疫治療はCD4+ T細胞応答を方向付けることを利用することが理想的であるが、現行の試みでは、現行の予測ツールの正確度が不十分なことから、HLAクラスII抗原予測が完全に無視されている。
HLAクラスIIがん抗原の正確な同定を妨げる重要な因子は、ペプチド結合の規則を学習するために必要な包括的な高品質データの利用可能性である。各対立遺伝子バリアントが別個のペプチド結合優先性を示す3種の高度に多型的な規準のHLAクラスII遺伝子座、HLA-DR、HLA-DP、およびHLA-DQに関してデータが必要である。ペプチド結合性モチーフを定義するために広く使用されている方法は、HLA-DMなどの生理的シャペロンの非存在下で単一のペプチドの親和性を測定する生化学的アッセイである。測定される親和性データカバレッジは一般的なコーカサス人HLA-DR対立遺伝子に限定され、これらの対立遺伝子についてさえ、予測の正確度はHLAクラスIの予測に著しく後れをとっている。原理上は、質量分析(MS)に基づくリガンドミクスにより、スケーラビリティおよび内因性ペプチドローディング条件がもたらされることによって予測の改善が可能になるはずである。それにもかかわらず、天然のリガンドームは複対立遺伝子であり、それにより、正確な訓練用データを得るために必要なペプチドと対立遺伝子間のマッピング情報が隠れる。HLAクラスIに関してはこの問題を解決する進歩があり、そこでは、逆畳み込みと、ロースループットトランスジェニックマウスモデルHLAクラスII欠損細胞株、またはホモ接合性HLA-DR対立遺伝子を有する細胞株を使用して生成された単一対立遺伝子HLAクラスII細胞株単一対立遺伝子HLAクラスIIリガンドームデータセットの両方が使用される。
別の難題は、腫瘍抗原が入る可能性が最も高いHLAクラスII提示経路の不明確性である。最近のMSに基づく試験により、腫瘍試料のHLAクラスIIリガンドームが調査されたが、プロフェッショナルAPCまたはがん細胞が治療的に関連性のあるHLAクラスII抗原を提示するかどうかについては対処されていない。さらに、HLAクラスIIによる腫瘍抗原のプロセシングが主にファゴサイトーシスに依存するのかオートファジーに依存するのかは現在のところ分かっていない。関連性のある細胞型において優位を占める経路に応じて、HLAクラスIIペプチドリガンドの供給源としていずれのタンパク質が好ましいかに関して強烈な差異が存在し得る。問題を複合すると、一般的な理論によりタンパク質配列特色がHLAクラスIIプロセシングの潜在性に影響を及ぼすはずであることが保持されるにもかかわらず、タンパク質内のいずれの領域がHLAクラスIIリガンドを産生する可能性が最も高いかを決定するための系統的な手法は存在しない。
治療的に標的化可能なHLAクラスII抗原のプロセシングおよび提示規則を調査するために、i)ペプチド結合予測を改善すること、およびii)TMEにおいてHLAクラスIIリガンドがどのようにプロセシングされ、提示されるかを決定することの2方向からの手法に従った。対立遺伝子特異的ペプチド結合規則を学習するために、MAPTAC(商標)(Mono-Allelic Purification with Tagged Allele Constructs)と称される、内因性に提示されるHLAクラスIIリガンドの配列決定を行うためにMSを利用するスケーラブルな単一対立遺伝子HLAリガンドームプロファイリングワークフローを開発した。MAPTAC(商標)により、ペプチド結合性モチーフを40種のHLAクラスII対立遺伝子に明白に分解し、免疫原性ウイルスエピトープおよび新抗原を正確に同定することができる結合予測アルゴリズムを訓練することが可能になる。HLAクラスIIプロセシング予測を改善するために、腫瘍試料を解析し、それにより、プロフェッショナルAPCを腫瘍内HLAクラスII発現の主要な供給源として確立し、これらの細胞によって優先的にプロセシングされる遺伝子のセットおよび遺伝子領域を定義した。次いで、結合特色およびプロセシング特色を組み込むアルゴリズムにより、天然のAPCリガンドーム、およびより重要なことに、エンドサイトーシスによって取り込まれたがん細胞に由来するHLAクラスIIリガンドのサブセットを予測することができることを実証した。治療的に関連性のあるHLAクラスII抗原のプロセシングおよび提示規則の理解におけるこれらの進歩により、CD4+ T細胞応答を利用することを目的とする治療が可能になる。
実験手順
MAPTAC(商標)構築物の設計および細胞培養
HLAクラスIに関しては、α鎖を、C末端GSGリンカー、その後、ビオチン-アクセプター-ペプチド(BAP)配列、終止コドン、および変動するDNAバーコードと融合し、pSF Lentiベクター(Oxford Genetics)にクローニングした。HLAクラスII構築物をpSF Lentiに同様にクローニングし、これは、C末端において融合した同じリンカー-BAP配列を有し、その後に別の短いGSGリンカー、F2Aリボソームスキッピング配列、C末端HAタグを有するα鎖の配列、終止コドン、および変動するDNAバーコードが続くβ鎖配列からなった。MAPTAC(商標)構築物をExpi293細胞、HEK293T細胞、A375細胞、HeLa細胞、KG-1細胞、K562細胞およびB721.221細胞にトランスフェクトまたは形質導入した。
HLA-ペプチド単離プロトコール
BAPタグが付されたHLAを発現する細胞50×10個を含有する急速冷凍した細胞ペレットを氷上で20分間にわたって解凍し、低温溶解緩衝剤1.2mL中に手動でピペッティングすることによって穏やかに溶解させた。DNA、RNA、および細胞デブリを一掃した後、上清を新しい1.5mLチューブに移し、0.56μMのビオチン、1mMのATP、および3μMのBirAと一緒に室温で10分間インキュベートすることにより、BAPタグが付されたHLAをビオチン化した。ビオチン化溶解物を、NeutrAvidin樹脂200μLと一緒に4℃で30分間インキュベートして、ビオチン化HLA-ペプチド複合体を親和性富化させた。洗浄後、HLAが結合した樹脂を4℃、1,500×gで1分間遠心分離することによってペレット化し、-80℃で保存した、またはSep-Pak固相抽出を使用してすぐにHLA-ペプチドの溶出および脱塩に供した。健康なドナー材料の内因性HLAクラスIIリガンドームをプロファイリングするために、社内で生成した抗HLA-DR抗体L243を使用して、または市販のTAL 1B5抗体を用いてHLA-ペプチド複合体を単離した。
タンデム質量分析によるHLA-ペプチド配列決定
全てのnanoLC-ESI-MS/MS分析に同じLC分離条件、機器パラメータ、およびデータ分析法を使用した。簡単に述べると、試料を、社内でC18 Reprosilビーズを充填し、60℃で加熱したPicoFritカラムに合わせたProxeon Easy NanoLC 1200を使用してクロマトグラフィーにより分離した。データ依存性取得の間、溶出したペプチドを、Nanospray Flex Ion sourceを備えたOrbitrap Fusion Lumos質量分析計に導入した。Spectrum Mill software package v6.0 pre-Releaseを使用して質量スペクトルを解釈した。PSM FDR推定値<1%を通過した同定されたペプチドを、参照データベース内の264種の一般的な夾雑物タンパク質に割り当てられた全てのペプチドを除去することによって、および陰性対照MAPTAC(商標)親和性プルダウンにおいて同定されたペプチドを除去することによって夾雑物についてフィルタリングした。さらに、参照データベースのin silicoトリプシン消化物にマッピングされた全てのペプチドを除去してトリプシン試料キャリーオーバーを説明した。生の質量分析データセットをMassIVEに受け入れられ次第寄託する(massive.ucsd.edu)。
結合性モチーフおよび結合予測のための機械学習手法
各対立遺伝子について、畳み込みニューラルネットワークのアンサンブルを、MAPTAC(商標)ペプチドとスクランブルデコイを区別するように訓練した。各ネットワークは、ReLU活性化畳み込み層を2つ含み、各々が50の6ワイドフィルターを有する。層当たりフィルター当たりの最大活性化および平均活性化を経由してシグモイド活性化を用いる最終的な高密度層に送る。L2-norm、各畳み込み層後の20%空間ドロップアウト、および早期停止によって正則化を実現し、対立遺伝子毎に重複していないペプチド(約12.5%)のホールドアウト区分に従ってチューニングした。性能ベンチマーキングでは、NetMHCIIpan-v3.1による予測を各クエリペプチド内の最大スコア化15merとして算出し、これは、ネイティブなNetMHCIIpan-v3.1による予測よりも良好に一様に実施される手法である。
CD4+ T細胞誘導アッセイ
PBMCを、1:10の比で合計3回の刺激にわたってペプチドをパルスしたmDCと共培養した。次いで、誘導されたT細胞を、以前に記載されている一意的な2色バーコードで標識し、ペプチドをパルスし、成熟させた自己mDCと1:10の比で終夜培養した。その後、細胞を、ペプチドに応答したIFN-γの産生についてフローサイトメトリーによって評価した。ペプチドに対して正に応答した誘導試料は、IFN-γ産生をペプチドなし対照よりも3%高く誘導した試料であった。
SILACで標識された腫瘍細胞のAPCによるエンドサイトーシス
K562細胞(ATCC、Manassas、VA)を、重同位元素アミノ酸、L-リシン2HCl13 15(Life Technologies)およびL-ロイシン13(Life Technologies)を含有するSILAC用RPMI培地(ThermoFisher)中で5倍加に成長させた。単球由来樹状細胞(mDC)を、UV処理したK562細胞と一緒に終夜、またはHOCl処理後に生成された溶解物と一緒に5時間にわたって、1:3の比で共培養した。プロテオミクス解析のために、細胞を回収し、ペレット化し、液体窒素で急速冷凍した。
結果
MAPTAC(商標):単一対立遺伝子HLAクラスIIリガンドプロファイリングのためのスケーラブルなプラットフォーム
HLAクラスII結合性モチーフに関する現行の知見は、主に2種の生化学的結合アッセイを使用して生成されたデータに基づく。そのような以前の手法の1つでは、アッセイペプチドおよび放射性標識した競合ペプチドを細胞質由来のHLA抽出物と共インキュベートしてIC50を決定する。別の手法では、EC50を決定するために、コンフォメーション的に特異的な抗体によりアッセイペプチドと結合したHLAの割合を測定する。これらのアッセイからのデータを免疫エピトープデータベース(IEDB)にコンパイルし、NetMHCIIpanなどのHLAクラスII予測アルゴリズムを訓練するために使用する。5種の最も一般的なコーカサス人HLA-DRB1対立遺伝子はIEDBでは十分に支持されるが(各々3326~8967ペプチド)、強力な結合体(親和性<100nM)であるのはたった約29%であり、IEDBペプチド全体の85%はきっかり15merである(図12B、図12E)。HLA-DPおよびHLA-DQ対立遺伝子および非コーカサス人HLA-DR対立遺伝子(例えば、HLA-DRB115:02)は相当少ないデータによって支持される。
多様な患者集団を支持する対立遺伝子幅を有する高品質データセットを創出するために、MSに基づく同定のための単一の対立遺伝子に結合するHLAクラスIIペプチドの効率的な単離を可能にする技術であるMAPTAC(商標)を開発した(図11A)。選択されたHLAクラスIIヘテロ二量体のアルファ鎖およびベータ鎖は、ビオチン-アクセプターペプチド(BAP)配列がベータ鎖のC末端に配置された遺伝子構築物によってコードされる。HLA-DRAは機能的にインバリアントであるので、MAPTAC(商標)では、外因性ベータ鎖と内因性アルファ鎖の潜在的な対形成にかかわらず単一対立遺伝子HLA-DR結果がもたらされる。機能的なアルファ鎖バリアントの限定されたセットを示すHLA-DPおよびHLA-DQに関しては、細胞株を、マッチするまたは発現されないアルファ鎖対立遺伝子を有するように選択する。重要なことに、この手法は、BAPタグをHLAクラスI重鎖に付加すればHLAクラスIに対しても機能する。
48時間のトランスフェクションにより、MAPTAC(商標)構築物の頑強な発現が実現され(図12C)、細胞表面提示は正常レベルであった(図34Aおよび34B)。これは、7種の別個の細胞株(expi293、A375、KG-1、K562、HeLa、HEK293、およびB72.221)において、および40種のHLAクラスII対立遺伝子について実証され、3種の規準のHLAクラスII遺伝子座:HLA-DR、HLA-DP、およびHLA-DQの全てについてのデータがもたらされた。品質管理フィルターを通過した反復実験(細胞約5000万個)当たりの独特のペプチド同定の平均数は対立遺伝子にわたって236種から2580種までにわたり(図29)、中央値は1319ペプチドであった。HLA-DM過剰発現、ならびにペプチドの還元およびアルキル化を含めたいくつかのプロセス変形形態を使用してデータの深さを増大させた。ほんの小さなパーセンテージのMSヒットが既知の夾雑物であるトリプシンペプチド、およびニセトランスフェクション(空のプラスミド)に対応した(図11Bおよび図29)。MAPTAC(商標)HLAクラスIおよびHLAクラスIIペプチドの長さ分布は抗体に基づくプルダウンを利用した以前のMS試験で観察されたものとマッチした(図11C)。
MAPTAC(商標)HLAクラスIIペプチドの中で、大多数のアミノ酸が供給源プロテオーム頻度と一致するレベルで表された(図12Dおよび図12F)。例外にはC、M、およびWが含まれ、これらはそれぞれ85%、34%、および42%枯渇し、これはHLAクラスIIペプチドの以前のMSに基づく試験と一致した。HLAクラスIIペプチドの還元およびアルキル化は、Cの頻度のほぼ3倍であったが、それでもプロテオームに関しては過少に表された(図12F)。IEDBからの対立遺伝子を釣り合わせた高親和性ペプチド(<100nM)ではC、M、およびWの枯渇は観察されなかった。逆に、IEDB結合体は、IEDB非結合体(>5000nM)と比較してDの枯渇(-39%)およびEの枯渇(-37%)ならびにMの富化(+65%)を示した。したがって、MAPTAC(商標)は、他の技術を用いて観察されたものと一致する定義された偏りを示す。
MAPTAC(商標)によりHLAクラスIIペプチド結合性モチーフが分解される
MAPTAC(商標)を使用して、対立遺伝子特異的HLAクラスII結合性モチーフを分解した。40種のHLAクラスII対立遺伝子をプロファイリングし、そのうち15種は、非コーカサス人集団において一般的な対立遺伝子(DRB112:02、DRB115:03、およびDRB104:07)を含め、以前に特徴付けられていないものであった(IEDBにおいて100nM未満の親和性を有する30種未満のペプチド)。HLAクラスIIペプチドは結合溝の残基数より長い可能性があるので、各ペプチドのいずれの部分がHLAと相互作用するかはすぐには明らかにならない(「コア」)とそれに対して突出;しかし、結合性コアの分解は結合性モチーフの特徴付けに極めて重要である。結合性コアを同定するために、各ペプチドに対して結合レジスターを繰り返し指名し、結合性モチーフをペプチドにわたって再学習するために期待値最大化アルゴリズムを使用するツールGibbsCluster-2.0を使用してコンセンサス結合性コアに対するペプチドをアラインメントした。若干の例外を除いて、一般的なHLA-DR対立遺伝子に対する結合性コアモチーフはIEDBに基づくモチーフとの強力な一致を示した(図35)。MAPTAC(商標)により観察されたペプチドは一般的な対立遺伝子に対して必ずしも強力なNetMHCIIpanスコアを示さなかったが(図36A)、それでも、NetMHCIIpanによって不十分に予測された、観察された結合体は、非常に強力な測定された親和性を有することが示され(図36B)、これにより、これらの知見が偽陽性である可能性が低いことが示される。とりわけ、MAPTAC(商標)モチーフは多数の細胞株にわたって常に安定していた(図36C)。
一般には、MAPTAC(商標)とIEDBは、アンカー位置(約4つの最も高度に保存された位置)における最も高頻度のアミノ酸については一致したが、MAPTAC(商標)モチーフは、一般に、より低いエントロピーを示した(配列ロゴの文字の高さが高いことによって顕在化する)。興味深いことに、細胞にMAPTAC(商標)構築物およびHLA-DMを同時トランスフェクトした場合、アンカー位置のエントロピーは大多数の対立遺伝子についてさらにはるかに低下した(図30Aおよび図37A)。これは12種のHLA-DR対立遺伝子にわたって一貫して観察され、それにより、レパートリー「編集者」としてのHLA-DMの行き渡っている効果が示され、HLA-DMおよび他のローディングシャペロンを欠く親和性アッセイに基づくモデルではin vivoには当てはまらない結合規則を学習することができることが示唆される。HLA-DMの効果はCLIPペプチドの存在に関しても明らかであった。HLA-DM同時トランスフェクションを伴わない場合、CD74由来ペプチドが10種のHLA-DR対立遺伝子において観察され、公知のCLIPバリアントとマッチした(図37C)。一方、我々のHLA-DM同時トランスフェクション実験のいずれにおいてもCLIPペプチドは観察されなかった。
HLA-DMの効果は解析したHLA-DP対立遺伝子については明らかでなかった(図30Aおよび図37A)。これは、以前には報告されていない普通でない正に荷電したP1アンカーの存在に関係する可能性がある。HLA-DMは結合したペプチドのN末端側に主に作用すると考えられており、したがって、疎水性P1アンカーを有するHLA-DPモチーフもHLA-DMの存在によって変更されなかったので、普通でないP1アンカーはHLA-DM非感受性のマーカーではなかった(図37A)。他方では、HLA-DQB106:04/A101:02はHLA-DMによって大いに影響を受けた(図30A)。HLA-DM同時トランスフェクションを伴わない場合、この対立遺伝子の結合性モチーフは識別可能ではなく、それにより、一部のHLA-DQ対立遺伝子へのシャペロンを伴わないローディングにより非生理的結合体の大部分がもたらされることが示される。
公開された複対立遺伝子HLAクラスIIデータセットの利用可能性を考慮して、我々の対立遺伝子特異的ペプチドが有効に同定されたかどうかを、in silico逆畳み込み法を使用して調査した。いくつかのグループが複対立遺伝子HLAクラスIデータからのHLAクラスI対立遺伝子モチーフの逆畳み込みにおいて成功を示しているが、HLAクラスIIモチーフの逆畳み込みは、各ペプチドの結合性コアおよび対立遺伝子割り当ての両方を同時に分解する必要性によって複雑になる。HLAクラスII逆畳み込みの正確度を評価するために、汎DR抗体によってプロファイリングされた8つの試料(PBMCおよび公開された細胞株)からHLA-DRリガンドームを解析した。各データセットについて、試料の遺伝子型の各対立遺伝子とマッチする単一対立遺伝子データのうちの20ペプチドをスパイクインした(1~2種のDR1対立遺伝子プラス0~2種のDR3/4/5対立遺伝子、ハプロタイプおよび接合性に応じて)。GibbsClusterツール(逆畳み込みに使用することもできる)を使用して、ペプチドを群に区分化し、スパイクインペプチドがそれらの既知の対立遺伝子起源に従って適正に共クラスター化されたかどうかを観察した。全ての場合において、ペプチドは多様なクラスターにわたって分布し、正しい供給源対立遺伝子との関連はわずかしか示されず(図30B)、逆畳み込みに基づくHLAクラスII訓練用データは大きな誤差を有する可能性が高いことが示される。
逆畳み込みの不十分な性能を理解するために、単一対立遺伝子MAPTAC(商標)データを精査して、GibbsClusterのガイドポストとしての役割を果たし得る「明白な」アンカーの頻度を決定した。したがって、各HLAクラスII対立遺伝子について各アンカー位置(エントロピーが最も低い4つの位置)における明白なアミノ酸(頻度が>10%)を定義した。ペプチドのたった10~20%が4つのアンカー位置全てにおいて理想的な残基を示し、50%もの多くが2つまたはそれよりも少ない明白なアンカーを示した(図30C)。予測されたアンカーの大部分を示すペプチドの頻度が低いことを考慮すると、ペプチドの大部分が、純粋にコンピュータ計算に基づいて分類することが困難であることは驚くべきことではない。したがって、MAPTAC(商標)では、in silico方法で解決することが重要な不明確性の主要な供給源に対処する。
MAPTAC(商標)を使用してHLAクラスI対立遺伝子のモチーフを定義することもできる。これには、結合プロファイルが以前に定義されていない対立遺伝子(例えば、B52:01、日本で一般的)が含まれた。以前に特徴付けられた対立遺伝子に関しては、親和性に基づく方法で導き出されたモチーフと以前の単一対立遺伝子MS試験に良好な対応があることが認められた。それにもかかわらず、モチーフを定義するために逆畳み込み法を使用する複対立遺伝子のMSに基づく試験に関してはいくらかの不一致が存在することが認められた(図37B)。
MAPTAC(商標)データに対して訓練されたアルゴリズムにより免疫原性が予測される
MAPTAC(商標)データにより正確度が改善されたHLAクラスII結合予測器を生成することができるかどうかを検討した。HLAクラスIIペプチドのHLA結合性部分配列はN末端またはC末端に対して固定された位置にないので、学習アルゴリズムでは、各ペプチドについて異なる結合性コアの可能性を動的に検討しなければならない。この制約に対処するために、翻訳不変パターン認識に関して熟練していることからコンピュータビジョンの分野で成功している畳み込みニューラルネットワーク(CNN)を使用した。各対立遺伝子について、CNNのアンサンブルを訓練し(図31A)、全体的な予測器を「neonmhc2」と名付けた。
MSでは特にCに対してある程度のアミノ酸残基の偏りが示されるという事実を説明するために、観察された結合体(ヒットと称される)の配列をランダムに並び替えることによって陰性訓練例(デコイと称される)を生成した。この手法には天然のタンパク質の配列特性を学習するというリスクがあるので、デコイをHLAクラスIIリガンドのペプチド供給源遺伝子の観察されていない部分配列からランダムにサンプリングした。各対立遺伝子についての陽性適中率(PPV)を算出するために、n個のMSにより観察されたペプチドを、供給源遺伝子の同じセットからサンプリングした19n個の長さを釣り合わせたデコイと併せてスコア化し、各予測器のn個の上位に順位付けされたペプチド(すなわち、上位5%)を陽性とコールした。偽陽性の数と偽陰性の数が等しいので、この場合のPPVは再現率と同一である。ヒット対デコイ比1:19での陽性適中率(PPV)の算出により、neonmhc2ではNetMHCIIpanと比較して、MAPTAC(商標)により観察されたペプチドの予測に関するPPVが改善されたことが示された(図31B;表11)。
Figure 2022518355000016
Figure 2022518355000017
訓練用データセットのサイズを種々の程度までダウンサンプリングする飽和実験により、neonmhc2の性能がデータにより限定されており、より多くのデータで改善されることが示唆される(図38Ai)。
図30Bにおける低忠実度のHLAクラスII逆畳み込みの観察の解析により、同等の予測性能が単一対立遺伝子データなしでは実現することができていないことが示唆される。これを試験するために、逆畳み込みを使用して対立遺伝子特異的結合予測器を複対立遺伝子MSデータに対して訓練する、最近公開されたコンピュータによるワークフロー(Barra et al., 2018)に従った。GibbsClusterロゴを11種の複対立遺伝子試料(図30Bと同じ試料)について検査することにより、多くのクラスター(13/32)が試料中に存在することが分かっている対立遺伝子といかなる類似点も有さない(図38Aii)ことが観察された。モチーフがどのように見えるはずであるかに関する既存の知見を使用して、合法的なクラスターのみ(図38Aiiにおいて印づけられている)を選択し、同じCNNアーキテクチャを有する予測器を築いた。次いで、これらのモデルをneonmhc2と並行して真正な単一対立遺伝子データ(訓練に使用しなかったMAPTAC(商標)データのホールドアウト区分)に対して評価した。逆畳み込みされた複対立遺伝子データに対して訓練されたモデルは通常NetMHCIIpanにまさるが、MAPTAC(商標)で訓練されたneonmhc2には劣る(図31E)。単一対立遺伝子データの優位性は、それぞれの訓練用データセットのサイズが同一になるようにMAPTAC(商標)データセットをダウンサンプリングした場合であっても維持された。
明らかな予測改善が非MSデータに対して評価した場合にも保持されることを確実にするために、四量体によりガイドされるエピトープマッピング(TGEM)によって検出された対立遺伝子特異的CD4+メモリーT細胞応答の大きなデータセットをキュレートした。とりわけ、これらの四量体データは、シャペロンを伴わないペプチド交換に依拠し、したがって、従来の親和性アッセイと同じ偏りを受けやすい(Archila and Kwok, 2017)。それにもかかわらず、neonmhc2は、評価のために十分なデータ(少なくとも20の陽性例)を有する全ての対立遺伝子についてNetMHCIIpanよりも優れた(図31C)。NetMHCIIpanの性能(PPVによって測定される)は変動し、DRB115:01については5%の低さまで降下し(対照的に、neonmhc2の性能は30%PPVを下回ることはなかった)、neonmhc2の性能に近づいたのは、十分に試験されているHLA-DRB101:01を含めたたった2種の対立遺伝子だけであった。他方では、neonmhc2では、2種の最も一般的なコーカサス人HLA-DR対立遺伝子(DRB107:01およびDRB115:01)を含めた他の全ての評価した対立遺伝子に関して確かな改善が示された。これらの結果から、neonmhc2のNetMHCIIpanに対する予測改善をMSに基づくものではないベンチマークにおいて確証することができ、大多数の対立遺伝子にわたって拡大することができることが示される。
neonmhc2の治療的関連性を評価するために、neonmhc2により、ex vivo誘導アッセイ(方法を参照されたい)においてCD4+ T細胞応答を引き出すことができる新抗原を同定することができるかどうかを決定した。IEDBにおける多くの親和性アッセイにより確認された結合体を有する一般的な対立遺伝子(DRB101:01およびDRB107:01によってのみ超えられる;図12E)であるDRB111:01に焦点を当て、Cancer Genome Atlas(TCGA)により観察された新抗原配列のセットをスコア化し、neonmhc2では優先された(予測の上位1%)がNetMHCIIpanによっては選択されなかった(予測の下位90%)サブセットを選択した。このセットを、誘導材料中に存在する他のHLA-DR対立遺伝子に結合し得るペプチドを除去することによってさらに精緻化した。大多数のneonmhc2により選択されたペプチド(8/12)により、ペプチドの再現率に応答して、IFNγ発現によって測定されるCD4+ T細胞応答がもたらされた(図31D、図38Bおよび図38C)。これらの結果から、MAPTAC(商標)により訓練された予測器により、NetMHCIIpanによって同定されない免疫原性HLAクラスII新抗原配列を同定することができることが実証される。
プロフェッショナルAPCは腫瘍微小環境に存在する優性HLAクラスIIである
HLAクラスII対立遺伝子特異的ペプチド結合優先性の特徴付けおよび予測の両方を可能にする技術を開発したので、HLAクラスIIがん抗原を生じる可能性が最も高いタンパク質配列の優先順位付けに極めて重要である抗原プロセシングに関するさらなる洞察を用いて結合予測改善を補完しようと試みた。TMEの状況でこれらの疑問に対処するために、腫瘍におけるHLAクラスIIリガンドームを調査した単一細胞RNA-Seqおよび公開されたMSに基づく試験を含めた非MAPTAC(商標)データセットを解析した。微小環境においていずれの細胞型が治療的に標的化可能ながん抗原を提示する最も可能性が高いかを検討した。現在、がん抗原が、エンドサイトーシスによって取り込まれた腫瘍タンパク質を有するプロフェッショナルAPCによって提示されるのか、または腫瘍細胞自体によって提示されるのかに関しては意見が一致していない。そのために、肺がん、頭頸部がん、結腸直腸がん、卵巣がん、および黒色腫をプロファイリングし、規準のAPC(マクロファージ、樹状細胞、およびB細胞)がTME内の腫瘍細胞および他の間質細胞型よりもはるかに高いレベルのHLAクラスIIを発現することが見いだされた5つの公開された単一細胞RNA-SeqデータセットにおいてHLA-DRB1発現を解析した。この観察は、多数の患者および腫瘍型にわたって一貫している(図19A)。腫瘍細胞はTME内ではAPCに数で勝り得るので、腫瘍細胞によるHLAクラスII発現のレベルがより低いことには、それにもかかわらず、免疫学的関連性がある可能性がある。いかほどの全体的なHLAクラスII発現が腫瘍細胞によってもたらされるか、対していかほどの全体的なHLAクラスII発現が間質によってもたらされるかを評価するために、HLAクラスII特異的遺伝子に変異を有するTCGA患者(CIITA、CD74、およびCTSS)を同定し、HLA-DRB1発現のどの画分が腫瘍に由来するか、対してどの画分が間質に由来するかを帰属させるために、体細胞バリアントを示したRNA-Seqリードの画分を決定した(図19B、方法を参照されたい)。17種の別個の腫瘍型を表す153名の患者において同定された変異に基づいて、大多数のHLAクラスII発現が非腫瘍細胞から生じると思われた。実際、患者の45%パーセントでゼロの腫瘍由来HLAクラスII発現が示された。最高レベルのT細胞浸潤を有する患者に焦点を当て(上位10%、以前に公開された18遺伝子シグネチャー(Ayers et al., 2017)を使用して同定されたもの)、腫瘍のHLA-DR低発現はそれでも正常であると思われ、16名の患者のうち3名のみが>1000TPMを発現した。免疫治療によりこの傾向が乱されるかどうかを探索するために、チェックポイント遮断応答性腫瘍型からの追加的な単一細胞RNA-Seqを解析し、処置の前後のHLA-DRB1発現を評価した。1つの確認された応答者を含んだ黒色腫コホートでは、治療前生検材料および治療後生検材料のどちらにおいても腫瘍細胞による一様に低いHLA-DRB1発現が示された(図19C)。抗PD1治療に対して55%臨床応答率を示した基底細胞癌コホートは、同様に、時点にかかわらず、腫瘍細胞由来HLA-DRB1の低発現を示した(図19C)。これらの結果により、大多数の腫瘍内HLAクラスII提示が主にプロフェッショナルAPCによって駆動され、「ホット」TME条件ではこの一般的なパターンとの相違が保証されないことが示唆される。
特定の遺伝子はHLAクラスII提示経路へのアクセス特権を有する
腫瘍に存在するAPCによって優先的に提示されるエピトープの供給源遺伝子、およびそれらが、オートファジーから生じるのかまたはエンドサイトーシスから生じるのかを決定するために、腫瘍組織を使用して実施された3つの公開されたHLAクラスIIリガンドーム試験を解析した。
まず、各遺伝子の観察の数がその長さと発現レベルの積に比例するはずであると仮定して、各遺伝子が腫瘍HLAクラスIIリガンドームにおいて表される程度を数量化した(図18B)。ネイティブな組織では発現されないにもかかわらず、ヒト血漿において発現されるタンパク質、特にアルブミン、フィブリノーゲン、補体因子、アポリポタンパク質、およびトランスフェリンの明らかな富化が観察された。これらの同定がHLAリガンドームにおける非特異的結合を表すことを懸念して、neonmhc2結合スコアを、4つのPBMC HLA-DRリガンドーム(図39A)における血漿由来ペプチドについて評価した;ペプチドは強力な結合スコアを示し、これにより、それらがHLAと結合したことが示唆される。腫瘍HLAクラスIリガンドームデータでは血漿由来タンパク質は有意には富化されなかった(図39B)。HLAクラスIIリガンドームにおける血漿遺伝子の富化は、APCが組織血清由来の細胞外タンパク質を微飲作用によって「すすること」と一致する。ITGAM(11×富化)、LCP1(8×)、ITGAV(6×)、およびICAM1(6×)などの白血球細胞接着に関与する遺伝子の追加的な富化も観察され、これにより、APCがそれら自体の膜を積極的に再利用することが示唆される。卵巣がんHLAクラスIリガンドームにおいて富化されることが最近報告されたMUC16は過剰には表されなかった。
HLAクラスII抗原提示経路における遺伝子の偏りをさらに調べるために細胞内局在も考慮した。遺伝子を局在によって群分けした場合、分泌型遺伝子および膜遺伝子は遺伝子発現に基づいて予想されたよりも2倍多く表され、これにより、HLAクラスIIリガンドームを形づくることにおけるマクロピノサイトーシスの重要な役割が強調される。それにもかかわらず、HLAクラスIIペプチドの半分よりも多くは核および細胞質などのマクロピノサイトーシスと一致しない区画から生じる。これらの遺伝子の多くがオートファジーを介して提示される場合、プロテアソームによって取り除かれることが分かっている遺伝子の対応する欠乏が存在するはずであることは理にかなっていた。実際に、ユビキチン部位を含有することが分かっているタンパク質からそれらの長さおよび発現に基づいて予測されたペプチドが生成される頻度は低かった(図32C)。プロテアソームが阻害されるとレベルが上昇することが分かっているタンパク質の枯渇も観察された。これらは、オートファジーに関しては予測されるが、ファゴサイトーシスに関しては必ずしも予測されないというパターンであり、これにより、APCペプチドリガンドームがそれら自体の細胞内プロテオームを部分的に表すことが示唆される。
TMEにおいてAPCによって提示されるHLAクラスII抗原の起源に対処するために、核および細胞質基質ペプチド同定がAPC特異的またはバルク腫瘍遺伝子発現プロファイルとより大きく一致するかどうかを決定することによって供給源遺伝子の起源の直接逆畳み込みを行うことが可能であり得るかどうかを検討した(図39C)。推定値に著しい不確実性が存在したが(回帰に基づくモデルおよびブートストラップリサンプリングによって評価した;補足的方法)、HLAクラスIIリガンドームは腫瘍およびAPC遺伝子発現プロファイルの両方の混合物によって最良に説明された。総合すると、プロテアソームにより取り除かれるタンパク質の枯渇が観察され、この結果により、腫瘍内APCが外因性タンパク質および内因性タンパク質の両方の混合物を提示することが示唆される。
一部の遺伝子領域は優先的にプロセシングされるが、明らかな切断モチーフを欠く
いずれの配列が抗原プロセシングのために好ましいかに関する理論が多数存在する(図32D)。1つのモデルによると、HLAクラスIの場合と同様に、供給源タンパク質はHLAクラスIIに結合する前に酵素により切断される(Sercarz and Maverakis, 2003)。第2のモデルでは、まずペプチド結合が起こり、その後、結合したペプチドがエキソペプチダーゼ酵素により、HLAクラスIIによって立体的に妨げられるまでトリミングされることが提起される。第3のモデルでは、ペプチド切断事象はHLA結合の前後どちらでも起こる。HLAクラスIIペプチドがどのように生成されるかに関する競合モデルが存在するので、予測のための3つの異なるフレームワークを生成した(図32D)。第1のモデルでは、エンドペプチダーゼが優位を占めると仮定する(「まず切断」);第2のモデルでは、HLAクラスIIが全長タンパク質とかみ合い、それがその後、エキソペプチダーゼによって内向きにトリミングされると仮定する(「まず結合」);および第3のモデルでは、酵素的消化がHLA結合の前後の両方で起こると提起する(「ハイブリッド」)。各モデルは異なるアルゴリズム手法を必要とする。具体的には、まず切断展望によって動機づけられるアルゴリズムは、MSにより観察されたリガンドの端のアミノ酸モチーフに焦点を当てるべきであるが、まず結合展望によって動機づけられるアルゴリズムでは、これらのモチーフを無視し、HLA結合接近可能性を規定する局所的なタンパク質構造特性に焦点を当てる方がよい。ハイブリッドモデルにより呼び起こされるアルゴリズムは、観察されたHLAクラスIIペプチドの上流および下流を候補前駆体カット部分として調べるべきである。
検討した3つの手法のうち、ベースラインモデルに対する測定可能な改善がもたらされたのはまず切断アルゴリズムだけであった(図32Eおよび図40B)。しかし、この手法では、クエリペプチドの正確なカット部分が遮蔽されている場合には値を加えることができないので、陽性例ペプチドに存在するエキソペプチダーゼトリミングの特質(例えば、最後から2番目のプロリンシグネチャー(Barra et al., 2018))が学習される(STAR法)と思われる。
純粋に経験的な手法を軸にして、公開されたHLA-DQリガンドームにおいて観察されたタンパク質領域(Bergseng et al., 2015)を分類整理し、重複を使用してHLA-DRリガンドを予測した。重複変数により予測性能のわずかな改善がもたらされた(neonmhc2単独に対してPPVの平均で3.1%の増大)(図32E)。HLA-DQ対立遺伝子とHLA-DR対立遺伝子が、同じHLA-IIプロセシング環境を共有するが結合性モチーフは共有しないと仮定して、この結果から、ある特定の遺伝子領域が実際にプロセシングに関して優先されるが、切断モチーフまたはコンフォメーション特性に明白には関係付けられないことが示される。
MSにより観察されたペプチドの観察された末端を使用して、「まず切断」モデルを仮定する手法であるプロセシングアルゴリズムを訓練することの陽性の結果が複数のグループにより報告されている。しかし、多数の別個の細胞株および組織型におけるペプチド末端に隣接するアミノ酸富化の精査において(図40A)、結合後トリミングとより大きく一致すると思われるパターンが観察された。これらには、HLAクラスIIプロセシング酵素、カテプシンSの既知のモチーフとの対応の欠如、およびPによりトリミング酵素の進行が遮断された場合に生じうるモチーフである、最後から2番目のペプチド位における不十分に切断可能なPの富化が含まれた。「まず切断」仮定が正しいかどうかを試験するために、ニューラルネットワークモデルをペプチド末端に対して訓練し、それらを2つの異なるやり方で評価した:i)各ペプチドの正確なN末端およびC末端における切断性をスコア化する、またはii)各ペプチドの予測された結合性コアから±15AAの範囲内の最良の部位をスコア化する(補足的方法)。どちらの手法でも、まず切断モデルが正しい場合には予測値が足されるはずであることが仮定されたが、それがなされたのは第1の手法のみであった(図32Eおよび図40B)。したがって、ニューラルネットワークでは、リガンドの曝露特色(例えば、最後から2番目のP)に基づいてHLAクラスIIをデコイと見分けることができるが、カット部分が先験的に分かっていない場合には、一次タンパク質配列から免疫原性ペプチドを予測する場合にはいつもそうである通り、見当違いになる。このわずかな違いには当該分野における錯乱を引き起こす潜在性がある。
「まず結合」理論を用いると、MSにより観察されたデコイペプチドを溶媒露出度について、ならびに内因的に不規則なドメインについてスコア化した。タンパク質構造によりHLA結合への利用可能性が規定される場合には溶媒露出性または不規則なドメインがHLAクラスIIリガンドにおいて富化される可能性がある。しかし、これらの特色はまた、予測的ではないことも証明された(図32E)。次いで、ペプチド結合の前に酵素によりタンパク質が部分的に消化され、その後、追加的なトリミングが起こるハイブリッドモデルを検討した。このモデルでは、MSリガンドの観察された末端のさらに上流および下流に前駆体切断部位が存在する。したがって、CNNを、拡張されたタンパク質コンテキスト(±30AA)に基づいて訓練して、前駆体カットに対応する遠位シグナルを検出した。このモデルでは、いずれの予測値も示されなかった(図32E)。最後に、プロセシング優先領域は一次配列に基づいて予測することが難しいことが証明されているので、公開されたHLA-DQリガンドームにおける観察されたタンパク質領域を分類整理し、重複を使用してHLA-DRリガンドを予測した。重複変数により予測性能のわずかな改善がもたらされた(neonmhc2単独に対してPPVの平均で3.1%の増大)(図32E)。HLA-DQとHLA-DR対立遺伝子が、同じHLAクラスIIプロセシング環境を共有するが、ペプチド結合性モチーフは共有しないと仮定して、この結果から、ある特定の遺伝子領域が実際にプロセシングに関して優先されるが、明白な切断モチーフまたは特別なコンフォメーション特性は示さないことが示される。
提示規則を組み込むことによりHLA-DRリガンドーム予測が著しく増強される
結合規則がプロセシング関連特色とどのように協同するかを数量化するために、HLAクラスIIを提示する細胞株、樹状細胞、および健康なドナー末梢血単核細胞(PBMC)のHLA-DRリガンドームを予測するための多変量モデルを創出した。提示されるペプチドは変異していないが、予測シナリオでは、ランダムにサンプリングされたゲノムの遺伝子座をそれらのHLAクラスIIペプチドを産生する能力に関して評価しなければならない新抗原予測を模倣する。ヒットとデコイを1:499の比で使用し、タンパク質をコードするエクソームからデコイをランダムにサンプリングして、neonmhc2に基づくモデルの性能およびNetMHCIIpanに基づくモデル、ならびに、RNA-Seq由来発現、遺伝子レベルの偏り(図32Aに従って、関連する図39Bを参照されたい)、および以前に観察されたHLA-DQペプチドとの重複を含めた追加的なプロセシング特色が組み入れられたモデルの性能を評価した。変異腫瘍エピトープ標的の、がんの処置に関する優先順位付けのされ方と一致するモデルを作出するために、遺伝子レベルの偏り特色を、新抗原の供給源に関連しない血漿遺伝子の優先性が中和されるように改変した。
これらの統合的アルゴリズムにより、結合予測およびプロセシング予測のどちらに関しても実質的な改善が確認された(図21A)。具体的には、完全モデルでは、評価されるデータセットに応じて、NetMHCIIpan結合予測を単独で使用したモデルに対して7.4×~61×の変化倍率の改善が示された。発現および遺伝子の偏りのどちらによっても予測の正確度に対する実質的な独立した寄与がもたらされた。DQ重複特色による寄与はより小さかったが、一貫して正の改善がもたらされた。重要なことに、親和性に基づくモデルの正確度は、プロセシング関連予測変数の十分な利益がもたらされた場合であっても、MAPTAC(商標)に基づくモデルの半分であった。
プロフェッショナルAPCによって提示される腫瘍由来HLAクラスIIペプチドを使用した予測の正確度のベンチマーキング
HLAクラスIIリガンドームの予測における我々の正確度を評価したので、プロフェッショナルAPCによりエンドサイトーシスによって取り込まれた腫瘍由来のリガンドを予測することができるかどうかを試験することに注意をシフトした。TMEにおける大多数のHLAクラスII発現がプロフェッショナルAPCに由来するという我々の知見により、このプロセシング経路が腫瘍抗原提示に関して最も関連性がある経路の可能性が高いことが示される。残念ながら、腫瘍組織の従来のMSに基づくリガンドームでは、いずれのペプチドがエンドサイトーシスによって取り込まれた腫瘍タンパク質を起源とするものであるかは同定されない。したがって、SILACで標識された腫瘍細胞を「フィーディング」した樹状細胞(DC)のHLA-DRリガンドームをプロファイリングする実験を考案した(図33A)。
腫瘍由来タンパク質を標識するために、HLAクラスII欠損がん細胞株(K562)を同位体で標識されたLおよびKを含有する培地中で成長させ、95%を超える標識効率を実現した。DCに、溶解させた腫瘍細胞(腫瘍デブリのマクロピノサイトーシスを模倣するため)またはUV処理した全腫瘍細胞(全細胞のファゴサイトーシスを模倣するため)のいずれかをフィーディングした。MSを使用してHLA-DR結合性ペプチドをプロファイリングして、重標識または軽標識されたアミノ酸を有するペプチドを同定した。この実験では29種の重標識されたペプチドがもたらされ、細胞全体実験では、溶解物実験およびUV実験についてそれぞれ56種の重標識されたペプチドがもたらされた(表10(データS1B))。1つよりも多くのLまたはKを有するペプチドは2つの場合を除く全てにおいて完全な標識を示し、これにより、重標識されたペプチドが腫瘍細胞を起源とし、不調和標識を示す新しく翻訳されたDCタンパク質を起源とするものではないことが示される。無処理のDC、および溶解物と一緒に10分間インキュベートした後に回収したDCのどちらによっても重標識されたペプチドはもたらされなかった。
本明細書に開示される統合された予測アルゴリズムを使用して、腫瘍由来ペプチドを予測する能力を評価した。天然のHLAクラスIIリガンドームの予測に関する我々の以前の結果と一致して、neonmhc2に基づくモデルではNetMHCIIpanに基づくモデルよりもはるかに高い予測の正確度が実現された(図33D)。
遺伝子発現とは異なり、遺伝子の偏りおよびDQ重複特色によりエンドサイトーシスによって取り込まれた抗原の予測は改善されず、これにより、バルク組織リガンドームから学習されたパターンがこのクラスのエピトープとは関連しないことが示唆される。重標識されたペプチドの供給源遺伝子を解析することにより、リガンドーム実験において見られた分泌型タンパク質および膜タンパク質の優性とは対照的に、RNA結合性タンパク質(RBP)、DNA結合性タンパク質(DBP)、熱ショックタンパク質(HSP)およびミトコンドリアタンパク質(図21D)が認められた(図32A)。これが別個のプロセシング優先性を表すものであるかどうかは不明であった。実際に、供給源タンパク質はK562において一般には高度に発現され(発現中央値430TPM、これと比較して、標識されていないペプチドでは130TPM)、これにより、観察される遺伝子優先性が検出限界により駆動される可能性が示唆される。
明確にするために、ロジスティック回帰モデルを築いて、遺伝子の局在および機能的カテゴリーにより、遺伝子発現がすでに考慮されているモデルを超えてペプチド予測を改善することができるかどうかを試験した。結合および発現を考慮に入れた場合には、RBP、DBPおよびHSPはもはや有意ではなかったが、ミトコンドリアタンパク質は有意なままであった(p=2.6e-4:図33E)。とりわけ、富化のパターンは軽標識されたペプチドにおいて観察されたものとは完全に別個のものであった。
ミトコンドリア富化により予測を改善することができるかどうかを決定するために、データを、より深いカバレッジを目的として、細胞入力を増加させること、UV処理プロトコールのみに焦点を当てること、および終夜時点に加えて24時間のインキュベーション時点を追加することによって、新しいドナーから収集した。この実験では、終夜時点および24時間時点についてそれぞれ77種および59種の重標識されたペプチドがもたらされ、共同で、78種の独特の供給源遺伝子が同定された。ミトコンドリア優先性を考慮に入れたロジスティック回帰モデルを使用して(元のSILACデータに対して訓練した)、結合および発現のみを含むモデルに対して8~12%の正味の上昇でPPVを改善することができた(図33G)。これらの改善は有意であった(16hおよび24hについて、それぞれp=1.1e-9およびp=1.5e=-8)。これらの優先性はバルクリガンドームから学習することはできておらず、より正確なエピトープ予測を可能にするために使用することができる。
TMEにおけるHLAクラスII提示の存在は、がん免疫治療を用いた処置を受けた患者における正の転帰に関連付けられている。残念ながら、HLAクラスIIリガンド予測の不正確性およびTMEにおいて腫瘍抗原がどのように提示されるかの不明確性さにより、HLAクラスII抗原を標的とする治療の開発が遅れている。したがって、MAPTAC(商標)と称される単一対立遺伝子プロファイリング技術を本明細書に記載の通り開発し、腫瘍リガンドームを包括的に解析してHLAクラスIIリガンドプロセシング規則を定義した。MAPTAC(商標)により、米国の患者の95%を網羅する35種のHLA-DRB1対立遺伝子を含めた40種のHLAクラスII対立遺伝子の迅速なプロファイリングが可能になった。さらに、MAPTAC(商標)データに対して訓練された我々の結合予測アルゴリズムであるneonmhc2は、メモリーCD4+ T細胞応答の予測に関して、NetMHCIIpan訓練に利用可能な大多数の既存の親和性測定値を有する対立遺伝子に関してであっても、NetMHCIIpanよりも優れた。neonmhc2はTGEM検証用データセットにおけるメモリーCD4 T細胞応答の同定に関してNetMHCIIpanよりも性能が優れることが観察された。さらに、本明細書に開示されるアルゴリズムはex vivoで誘導される新抗原に対するCD4 T細胞応答の予測に関してもまさり、NetMHCIIpanによって優先順位が付けられていなかった免疫原性ネオエピトープが首尾よく同定された。一方、単一細胞RNA-Seq腫瘍データの解析により、最も関連性がある腫瘍抗原が、腫瘍細胞をファゴサイトーシスする浸潤性APCによって優勢に発現される可能性が高いことが明らかになった。したがって、いずれの遺伝子および遺伝子領域がTMEにおいて優先的に提示されるかを調査し、HLA-DRリガンドームおよびファゴサイトーシス性APCによって提示される腫瘍由来のリガンドを正確に予測する多変量のモデルを創出した。これらのモデルはNetMHCIIpanの陽性適中率を著しく超えた。
内因性にプロセシングされ、提示されたHLAクラスIIリガンドを従来のペプチド結合アッセイとは対照的にMAPTAC(商標)を使用して直接プロファイリングすることの利点は、HLA-DMなどのペプチドローディングシャペロンが存在することである。HLA-DMは、APCのHLAクラスIIペプチドレパートリーの編集において役割を果たすことが公知であり、そのことが、HLA-DMの示差的な発現のHLAクラスIIリガンドームに対する影響を試験する動機づけになった。HLA-DR MAPTAC(商標)実験においてHLA-DMを過剰発現させたところ、結合性モチーフが、HLA-DM過剰発現を伴わない実験よりも明白に分解された。驚いたことに、HLA-DMはHLA-DQB106:04/A101:02に対して極めて大きな影響を及ぼし、これにより、一部のHLA-DQ対立遺伝子に関して正確なペプチド結合規則を学習することには、このペプチドローディングシャペロンの存在が必要になり得ることが実証される。逆に、2種のHLA-DP対立遺伝子では影響は示されず(Yin et al., 2015)、これにより、HLA-DM感受性とP1アンカー優先性の関係がこれらの2種のHLA-DP対立遺伝子に対しては普通でないことが示唆される。HLA-DMを超えて、MAPTAC(商標)プラットフォームにより、他の重要なシャペロン、およびCD74またはHLA-DOなどのHLAクラスII経路に関与するタンパク質がHLAクラスII対立遺伝子のペプチド結合レパートリーにどのように影響を及ぼし得るかを迅速に学習するやり方がもたらされる。
腫瘍生物学に関して、我々の大多数の結果として起こる観察は、APCが、評価された腫瘍型に関してTMEにおける優性HLAクラスII発現を担うというものであった。これにより、治療的に関連性のある腫瘍抗原の提示がアポトーシス性腫瘍細胞のファゴサイトーシスまたは分泌された腫瘍タンパク質のマクロピノサイトーシスに依存する可能性が高いことが示唆される。直接CD4 T細胞死滅の報告も存在するが、もたらされたデータから、CD4 T細胞がより一般にはTMEにおいて支持的役割を果たし、主に、浸潤性白血球上に提示される腫瘍抗原を認識することが示唆される。したがって、CD4 T細胞の抗腫瘍効果は、おそらく大部分が、直接細胞溶解機能を有するものを含めた他の免疫細胞の輸送および活性化を調節するケモカインおよびサイトカインの分泌によって媒介される。これは機構的により複雑になるので、利点の1つは、腫瘍が、HLAクラスII抗原が提示されるかどうかに関しての制御性が低いことであり、これにより、腫瘍がHLAクラスI提示を回避する一般的な機構である機能喪失型変異を介した免疫エスケープがHLAクラスIIではそれほど頻繁ではないことが示唆される。いずれのAPC集団がエンドサイトーシスによって取り込まれた腫瘍抗原の提示を担うか、およびこれらの食細胞の動員をTMEに増強するやり方が存在するかどうかを慎重に定義する今後の試験が当該分野において有益になる。さらに、低酸素、化学療法、および放射線などの腫瘍細胞死滅の種々の方式により、これらのAPCによる腫瘍抗原捕捉の種々のレベルがどのようにもたらされるかを理解することが有用になり、それにより、HLAクラスII標的化治療との最適な治療的組合せが導かれ得る。
最後に、HLAクラスIIリガンドームの包括的な解析により、特定の遺伝子がそれらの転写物発現レベルにより予測されるよりも高頻度で提示されると思われるという観察が導かれた。腫瘍細胞由来の遺伝子レベルの偏りを学習することにより、APC HLAクラスIIリガンドームの予測の改善が容易になったが、これらのシグナルのうちの一部は新抗原予測について関連性が低い可能性がある。例えば、外因性抗原の取り込みではなくAPCにおけるオートファジーおよび膜再利用に関すると思われる富化が検出された。興味深いことに、in vitroにおいて腫瘍細胞が樹状細胞に「フィーディング」された場合、その代わりに、供給源遺伝子の同定によりRNA結合性タンパク質の富化が示された。そのような機構により、病原体エピトープの提示が促進され、全身性エリテマトーデスおよび他の自己免疫性状態において観察されるRNA結合性タンパク質に対する反応性が潜在的に説明されるので、RNA結合性タンパク質が優先的に提示されると推測したくなる。いずれの場合でも、我々のSILACに基づくHLAリガンドミクスワークフローは、感染性疾患および自己免疫に関与する抗原の試験にも適用することができるので、その有用性は腫瘍抗原に限定されないことに留意することが重要である。
要約すると、HLAクラスIIプロセシングおよび提示の規則は、HLAクラスIよりも著しく複雑である。このような理由で、CD4+ T細胞応答を駆動する抗原は多くの場合に未定義のままになっている。HLAクラスII結合およびプロセシング規則を定義することに関する我々の進歩により、より有効な治療に変換することができる標的化可能ながん抗原および他の疾患関連エピトープを同定することが可能になる。
(実施例13)
補足情報
関連するメタデータを用いた実験およびデータ供給源の要約
MAPTAC(商標)データ、非MAPTAC(商標)原稿データ、および以前に公開されたデータを含めたデータセットの網羅的な一覧。適切な場合には、試料遺伝子型などの関連性のある付随する特色が提供される。B)実験的MAPTAC(商標)反復実験、PBMCドナー、細胞株、およびSILACフィーディング実験にわたってマージした独特のペプチド同定。夾雑物および完全なトリプシンペプチドを除去する。例えば、少なくとも、とりわけ図12E~12F、34A~34Bを参照されたい。
逆畳み込み解析のためのスパイクインペプチド
スパイクイン解析において対立遺伝子毎に使用した20種のペプチド例の例示的な一覧。ペプチドを、最小SPI、70、長さ12アミノ酸から20アミノ酸の間を要求することによって、および他のMAPTAC(商標)によりプロファイリングされたDR対立遺伝子について観察されたあらゆる結合体との9merの重複を許容しないことによって選択した。さらに、所与の対立遺伝子について、9merを共有する2つのスパイクインペプチドは存在しない。例えば、少なくとも、とりわけ図35、36A~36Cを参照されたい。
選択された対立遺伝子の補足実験手順のための照合されたTGEMデータセット
多様な病原体およびアレルゲンペプチドに関するDRB101:01、DRB103:01、DRB104:01、DRB107:01、DRB111:01、およびDRB115:01についてのHLAクラスII四量体の結果ならびにそれらの対応するNetMHCIIpan予測およびneonmhc2予測。データをKwokおよび共同研究者によって公開された論文からキュレートした。とりわけ、図38A~38Cを参照されたい。
補足的方法
HLAクラスII対立遺伝子頻度および親和性データ統計値、図12Aおよび12Eに関連する
対立遺伝子頻度を、リソース、bioinformatics.bethematchclinical.org/hla-resources/haplotype-frequencies/high-resolution-hla-alleles-and-haplotypes-in-the-us-populationから得た。mhc_ligand_full.csvデータセットを2018年9月21日にIEDBデータ(iedb.org/databse_export_v3.php)からダウンロードした。「細胞MHC/競合/蛍光」、「細胞MHC/競合/放射活性」、「細胞MHC/直接/蛍光」、「精製されたMHC/競合/蛍光」、「精製されたMHC/競合/放射活性」、または「精製されたMHC/直接/蛍光」と同等の「方法/技法」および「解離定数KD」、「解離定数KD(およそのEC50)」、「解離定数KD(およそのIC50)」、「最大半量の有効濃度(EC50)」、または「最大半数阻害濃度(IC50)」と同等の「アッセイ群」を有するためには有効な親和性測定が必要であった。「著者」欄に列「Buus」が表示されている場合、測定はSoren Buusグループ(University of Copenhagen、Denmark)によるものである。他の場合では、著者欄に列「Sette」または「Sidney」が含まれる場合、測定はAlessandro Sette group(La Jolla Institute for Immunology、U.S.A)によるものである。他の全ての測定は「他」と標識した。強力な結合体を数え上げるために、測定された親和性が100nMよりも強力であるペプチドのみを計数した。
MAPTAC(商標)プロトコールの概要、図2に関連する:DNA構築物の設計
HLAクラスIおよびHLAクラスII対立遺伝子の遺伝子配列をIPD-IMGT/HLAウェブページ(ebi.ac.uk/ipd/imgt/hla)によって同定し、組換え発現構築物の設計に使用した。HLAクラスIに関しては、α鎖をC末端GSGGSGGSAGGリンカーと融合し、その後にビオチン-アクセプター-ペプチド(BAP)タグ配列GLNDIFEAQKIEWHE、終止コドン、および変動するDNAバーコードを続け、pSF Lentiベクター(Oxford Genetics、Oxford、UK)にNcoIおよびXbaI制限部位を介してクローニングした。HLAクラスII構築物(DR、DPおよびDQ)を同様にpSF LentiにNcoIおよびXbaI制限部位を介してクローニングし、これは、C末端においてHLAクラスI構築物由来のリンカー-BAP配列(SGGSGGSAGGGLNDIFEAQKIEWHE)、その後、別の短いGSGリンカー、F2Aリボソームスキッピング配列(VKQTLNFDLLKLAGDVESNPGP)、α鎖の配列、HAタグ(GSYPYDVPDYA)、終止コドン、および変動するDNAバーコードと融合したβ鎖配列からなるものであった。全てのDR対立遺伝子について、ベータ鎖をDRA01:01と対形成させた。HLA-DM構築物を、BAP配列およびHAタグを欠いた以外は同様にHLAクラスII構築物にクローニングした。HLA-DMをHLAクラスII実験のサブセットに加えた。全てのDNA配列の同一性をサンガーシーケンシングによって検証した。
細胞培養および一過性トランスフェクション
Expi293細胞(Thermo Scientific)を、Expi293培地(Thermo Scientific)中、8%CO、37℃、オービタルシェーカーにおいて125rpmで成長させた。Expi293細胞を、定期的な隔週での継代を伴って、0.5×10個/mLから6×10個/mLの間の細胞密度で維持した。Expi293細胞懸濁液30mLを、およそ3×10個/mLの細胞密度および>90%生存能力での一過性トランスフェクションのために使用した。簡単に述べると、DNA30μg(細胞懸濁液1mL当たりDNA 1μg)を1つのチューブ中、Opti-MEM培地(Thermo Scientific)1.5mLに希釈し、一方、ExpiFectamine(商標)293トランスフェクション試薬(Thermo Scientific)80μLをOpti-MEM、1.5mLを含有する第2のチューブ中に希釈した。これらの2つのチューブを室温で5分間インキュベートし、組み合わせ、穏やかに混合し、室温で30分間インキュベートした。DNAとExpiFectamineの混合物をExpi293細胞に添加し、37℃、8%CO、80%相対湿度でインキュベートした。48時間後、トランスフェクトされた細胞を4回の技術的反復実験においてチューブ当たり細胞50×10個で回収し、遠心分離し、1×Gibco DPBS(Thermo Scientific)で1回洗浄し、質量分析のために液体窒素で急速冷凍した。細胞1×10個の一定分量を各トランスフェクションバッチから収集し、ウエスタンブロット分析を使用して抗BAP(Rockland Immunochemicals Inc.、Limerick、PA)または抗HA(Bio-Rad、Hercules、CA)によって解析して、親和性タグ付けされたHLAタンパク質発現を検証した。Expi293の内因性HLAクラスII遺伝子型はDRB115:01、DRB101:01、DPB104:02、DPA101:03、DQB106:02、DQA101:02であることが決定された(Laboratory Corporation of America、Burlington、NC)。一部の実験では、HLAクラスII対立遺伝子にHLA-DMを同時トランスフェクトし、その場合、両方のプラスミドに使用するDNA濃度を細胞懸濁液1mL当たりDNA 0.5μgまで低下させた。
A375細胞(ATCC)を、10%FBSを伴うDMEM中で成長させ、定期的な継代を伴って、80%以下の集密での培養で維持した。質量分析実験のために、A375細胞を500cmのプレートにおいて、70%集密の細胞数から算出された通り、100mL中、細胞18.5×10個/mLの播種密度で培養した。24時間後、細胞に、TransIT-X2(Mirus Bio)を総培養体積に関して調整したTransITシステムプロトコールに従ってトランスフェクトした。48時間後、細胞培地を吸引し、細胞を1×Gibco DPBS(Thermo Scientific)で洗浄した。回収のために、A375細胞を非酵素的細胞解離溶液(Sigma-Aldrich)30mLと一緒に37℃で10分間インキュベートし、遠心分離し、1×DPBSで洗浄し、試料当たり50×10個の細胞で分注した。293T細胞およびHeLa細胞をATCCから購入し、それぞれDMEM、10%FBS、2mMのL-グルタミン中、またはDMEM+10%FBS中、37℃、5%CO2で培養した。両方の細胞株にHLA構築物を、TransIT LT1試薬(Mirus Bio)を使用して製造者の指示に従ってトランスフェクトし、トランスフェクションの48時間後に、A375細胞について記載されているのと同様に処理した。全ての試料から、細胞1×10個の一定分量を各トランスフェクションで収集し、抗BAP(Rockland Immunochemicals Inc.、Limerick、PA)または抗HA(Bio-Rad、Hercules、CA)ウエスタンブロットによって解析して、親和性タグ付けされたHLAタンパク質発現を検証した。B721.221細胞をFred Hutchison Cancer Center(Seattle、WA)から得、10%熱失活ウシ胎仔血清プラス1%ペニシリン/ストレプトマイシン(どちらもThermo Fisher Scientific)を伴うRPMI-1640プラスglutamax(Thermo Fisher Scientific)中で培養した。細胞を週2回培養し、25回の継代後に廃棄した。K562細胞およびKG-1細胞(ATCC、Manassas、VA)を、IMDM(Thermo Fisher Scientific)培地プラス10%熱失活FBS、1%ペニシリン/ストレプトマイシン、1%ピルビン酸ナトリウム、および1%MEM-NEAA中で成長させた。細胞を週2回培養し、25回の継代後に廃棄した。
B721.221細胞、KG-1細胞、およびK562細胞への形質導入のためのレンチウイルスを、80%集密度まで成長させたHEK293T細胞において産生させた。HLAクラスIまたはHLAクラスIIをコードするゲノムベクターpsFLenti(前の節に記載されている)6マイクログラムをレンチウイルスパッケージングベクターpsPAX2 5.3μgおよびエンベロープベクターpMD.2 1.81μgと混合した。DNAをOpti-MEM(Thermo Fisher Scientific)およびトランスフェクション試薬Fugene HD(Promega、Madison、WI)と混合し、混合物を室温で15分間インキュベートした。次いで、混合物をHEK293T細胞のディッシュに液滴で添加し、72時間インキュベートした。次いで、上清を回収し、Lenti-X GoStix(Takara Bio Inc.、Japan)を使用してレンチウイルス力価を試験した。形質導入のために、細胞を12ウェル平底プレート(Corning Inc.、Corning、NY)に播種し、6μg/mlのポリブレン(Sigma-Aldrich)を伴うレンチウイルス上清と混合した。レンチウイルスと混合した細胞を32℃、800×gで90分間高速回転させた。細胞を温暖な培地中に再懸濁させ、37℃のインキュベーター中、5%COで72時間インキュベートした。次いで、細胞を、1μg/mlのピューロマイシンを2週間使用して選択した。選択後、少なくとも5000万個の細胞を回収し、遠心分離し、1×Gibco DPBS(Thermo Scientific)で1回洗浄し、質量分析のために液体窒素で急速冷凍した。
BirAタンパク質の発現および精製
C末端ヘキサ-ヒスチジンタグと融合したE.coli BirAをコードするpET19ベクターを使用した。化学的コンピテントE.coli BL21(DE3)細胞(New England Biolabs)を、BirA発現プラスミド(C末端ヘキサ-ヒスチジンと融合したE.coli BirAをコードするpET19ベクター)で形質転換し、LBブロスプラス100μg/mlのアンピシリン中、37℃で、OD600が0.6~0.8になるまで成長させ、30℃まで冷却した後、0.4mMのイソプロピル-β-D-チオガラクトピラノシドを添加することによって発現を誘導した。E.coli細胞の成長を30℃で4時間継続した。E.coli細胞を4℃、8000×gで30分間遠心分離することによってE.coli細胞を回収し、使用するまで-80℃で保存した。組換えBirAを発現する凍結細胞ペレットを、5mMのイミダゾールを伴うIMAC緩衝剤(50mMのNaHPO、pH8.0、300mMのNaCl)に再懸濁し、1mg/mlのリゾチームと一緒に氷上で20分間インキュベートし、超音波処理によって溶解させた。4℃、16,000×gで30分間遠心分離することによって細胞デブリおよび不溶性材料を除去した。清澄化した上清をその後、AKTA pure chromatography system(GE Healthcare)を使用してHisTrap HP 5mLカラムにローディングし、IMAC緩衝剤プラス25mMおよび50mMのイミダゾールで洗浄した後、500mMのイミダゾールを用いて溶出させた。BirAを含有する画分をプールし、20mMのTris-HCl、pH8.0に対して25mMのNaClを用いて透析しHiTrap Q HP 5mLカラム(GE Healthcare、Chicago、IL)にローディングし、25mMのNaClから600mMのNaClまでの直線勾配を適用することによって溶出した。高度に純粋なBirAを含有する画分をプールし、緩衝剤を保存緩衝剤(20mMのTris-HCl、pH8.0、100mMのNaCl、5%グリセロール)に交換し、およそ5~10mg/mLに濃縮し、分注し、-80℃での保存のために液体窒素で急速冷凍した。BirAタンパク質濃度を、UV分光法により、算出された吸光係数ε=47,440M-1cm-1を使用してOD280nmにおいて決定した。
ウエスタンブロッティングプロトコール
試料をXT Sample BufferおよびXT Reducing Agent(Bio-Rad、Hercules、CA)に添加し、95℃で5分間加熱し、次いで、約100,000個の細胞に対応する体積を10%Criterion XT Bis-Trisゲル(Bio-Rad、Hercules、CA)にローディングし、PowerPac Basic Power Supply(Bio-Rad、Hercules、CA)を使用し、XT MES Running Buffer(Bio-Rad、Hercules、CA)を用いて200Vで35分間電気泳動した。ゲルを水で簡単にすすぎ、次いで、タンパク質を、Invitrogen iBlot2 Gel Transfer Device(Thermo Scientific)で設定P3を使用してInvitrogen iBlot Transfer Stacks(Thermo Fisher Scientific)内のPVDF膜に移した。Precision Plus Protein All Blue Standard(Bio-Rad、Hercules、CA)を使用して分子量をモニタリングした。次に、膜を、Pierce TBS Tween20緩衝剤[(TBST)25mMのTris、0.15mMのNaCl、0.05%(v/v)Tween20、pH7.5、Thermo Fisher Scientific)]を用いて3×5分間洗浄し、TBST-M[5%(w/v)無脂肪インスタントドライミルクを含有するTBST]中、室温で1時間ブロッキングし、次いで、TBST-B[5%(w/v)Bovine Serum Albumin(Sigma Aldrich)を含有するTBST]ならびにウサギ抗ベータチューブリン抗体(カタログ番号ab6046、Abcam、Cambridge、MA)およびウサギ抗ビオチンリガーゼエピトープタグ抗体(カタログ番号100-401-B21、Rockland Immunochemicals、Limerick、PA)の1:5,000希釈物中、4℃で終夜インキュベートした。次に、膜をTBSTで3×5分間洗浄し、ヤギ抗ウサギIgG(H+L-西洋ワサビペルオキシダーゼとコンジュゲートした抗体(カタログ番号170-6515、Bio-Rad)の1:10,000希釈物を含有するTBST-M中、室温で1時間インキュベートし、次いで、TBSTを用いて室温で3×5分間洗浄した。最後に、膜をPierce ECL Western Blotting Substrate(Thermo Fisher Scientific)に浸し、ChemiDoc XRS+Imager(Bio-Rad)を使用して展開し、Image Lab software(Bio-Rad)を使用して可視化した。
親和性タグ付けされたHLA-ペプチド複合体の単離
BAPタグが付されたHLA対立遺伝子を発現する細胞およびBAPタグを伴わない内因性HLA-ペプチド複合体のみを発現する陰性対照細胞株からの親和性タグ付けされたHLA-ペプチド複合体の単離を実施した。NeutrAvidinビーズを付したアガロース樹脂を低温PBS 1mLで3回洗浄した後、HLA-ペプチドアフィニティー精製に使用した。BAPタグが付されたHLA分子を発現する細胞50×10個を含有する凍結ペレットを氷上で20分間にわたって解凍し、低温溶解緩衝剤[20mMのTris-Cl、pH8、100mMのNaCl、6mMのMgCl、1.5%(v/v)Triton X-100、60mMのオクチルグルコシド、0.2mMの2-ヨードアセトアミド、1mMのEDTA、pH8、1mMのPMSF、1×完全EDTAフリープロテアーゼ阻害剤カクテル(Roche)1.2mL中に手動でピペッティングすることによって穏やかに溶解させた。溶解物を、≧250単位のベンゾナーゼヌクレアーゼ(Sigma-Aldrich)と一緒に4℃で15分間、回転させながらインキュベートして、DNA/RNAを分解し、4℃、15,000×gで20分間遠心分離して細胞デブリおよび不溶性材料を除去した。清澄化した上清を新しいチューブに移し、0.56μMのビオチン、1mMのATP、および3μMのBirAを伴う1.5mLチューブ中、室温で10分間、回転させながらインキュベートすることにより、BAPタグが付されたHLA分子をビオチン化した。上清を、200μLに対応する体積のPierce high-capacity NeutrAvidin beaded agarose resin(Thermo Scientific)スラリーと一緒に4℃で30分間、回転させながらインキュベートして、ビオチン化HLA-ペプチド複合体を親和性富化した。最後に、HLAが結合した樹脂を低温洗浄緩衝剤(20mMのTris-Cl、pH8、100mMのNaCl、60mMのオクチルグルコシド、0.2mMの2-ヨードアセトアミド、1mMのEDTA、pH8)1mLで4回洗浄し、次いで、低温の10mMのTris-Cl、pH8、1mLで4回洗浄した。洗浄間に、HLAが結合した樹脂を手動で穏やかに混合し、次いで、4℃、1,500×gで1分間遠心分離することによってペレット化した。洗浄済みのHLAが結合した樹脂を-80℃で保存したかまたはすぐにHLA-ペプチドの溶出および脱塩に供した。
抗体に基づくHLA-ペプチド複合体の単離
HLA DR-ペプチド複合体を健康なドナー末梢血単核細胞(PBMC)から単離した。75μLに対応する体積のGammaBind Plus Sepharose樹脂を低温PBS 1mLで3回洗浄し、抗体10μgと一緒に4℃で終夜、回転させながらインキュベートし、次いで、低温PBS1mLで3回洗浄した後、HLA-ペプチド免疫沈降に使用した。細胞50×10個を含有する凍結PBMCペレットを氷上で20分間にわたって解凍し、低温溶解緩衝剤[20mMのTris-Cl、pH8、100mMのNaCl、6mMのMgCl2、1.5%(v/v)Triton X-100、60mMのオクチルグルコシド、0.2mMの2-ヨードアセトアミド、1mMのEDTA、pH8、1mMのPMSF、1×完全EDTAフリープロテアーゼ阻害剤カクテル(Roche)1.2mL中にピペッティングすることによって穏やかに溶解させた。溶解物を、≧250単位のベンゾナーゼヌクレアーゼ(Sigma-Aldrich)と一緒に4℃で15分間、回転させながらインキュベートして、DNA/RNAを分解し、4℃、15,000×gで20分間遠心分離して細胞デブリおよび不溶性材料を除去した。次いで、上清を、GammaBind Plus Sepharose樹脂(GE Life Sciences)に結合させた抗HLA DR抗体(TAL 1B5、製品番号sc-53319;Santa Cruz Biotechnology、Dallas、TX)と一緒に4℃で3時間、回転させながらインキュベートしてHLA DR-ペプチド複合体を免疫沈降させた。最後に、HLAが結合した樹脂を低温洗浄緩衝剤(20mMのTris-Cl、pH8、100mMのNaCl、60mMのオクチルグルコシド、0.2mMの2-ヨードアセトアミド、1mMのEDTA、pH8)1mLで4回洗浄し、次いで、低温の10mMのTris-Cl、pH8、1mLで4回洗浄した。洗浄間に、HLAが結合した樹脂を穏やかに混合し、次いで、4℃、1,500×gで1分間遠心分離することによってペレット化した。洗浄済みのHLAが結合した樹脂を-80℃で保存したかまたはすぐにHLA-ペプチドの溶出および脱塩に供した。
HLA-ペプチドの溶出および脱塩
HLA-ペプチドを親和性タグ付けされた内因性HLA複合体から溶出させ、同時にSep-Pak(Waters)固相抽出系を使用して脱塩した。簡単に述べると、Sep-Pak Vac 1cc(50mg)37~55μm粒子サイズtC18カートリッジを24位置抽出マニホールド(Restek)に付着させ、MeOH、200μLで2回活性化し、その後、50%(v/v)ACN/1%(v/v)FA、100μL、次いで、1%(v/v)FA、500μLで4回洗浄した。HLA-ペプチドを親和性タグ付けされたHLA分子から解離させ、tC18固相へのペプチド結合を容易にするために、3%(v/v)ACN/5%(v/v)FA、400μLをHLAが結合したビーズが付されたアガロース樹脂を含有するチューブに添加した。ピペッティングすることによってスラリーを混合し、次いで、Sep-Pakカートリッジに移した。チューブおよびピペットチップを1%(v/v)FA(2×200μL)ですすぎ、すすぎ液をカートリッジに移した。Pierce Peptide Retention Time Calibration(PRTC)mixture(Thermo Scientific)100fmolをローディング対照としてカートリッジに添加した。ビーズが付されたアガロース樹脂を10%(v/v)AcOH、200μLと一緒に2回、5分間にわたってインキュベートして、HLA-ペプチドを親和性タグ付けされたHLA分子からさらに解離させ、次いで、1%(v/v)FA、500μLで4回洗浄した。HLA-ペプチドをtC18から溶出させて新しい1.5mLマイクロチューブ(Sarstedt)に15%(v/v)ACN/1%(v/v)FA、250μL、その後、30%(v/v)ACN/1%(v/v)FA、2×250μLを用いたステップ分画によって入れた。活性化、試料ローディング、洗浄、および溶出に使用した溶液は重力によって流出させたが、残りの溶出液をカートリッジから取り出すために真空(≦-2.5 PSI)を使用した。HLA-ペプチドを含有する溶出液を凍結させ、真空遠心分離によって乾燥させ、-80℃で保存した後、第2の脱塩ワークフローに供した。以前に記載されている通りEmpore C18固相抽出ディスク(3M、St.Paul、MN)の16ゲージの穿孔を2つ使用して充填した社内で築いたStageTipsを用いてHLA-ペプチド試料の二次脱塩を実施した。StageTipsを、MeOH、100μLを用い、その後、50%(v/v)ACN/0.1%(v/v)FA、50μLを用いて、2回活性化し、次いで、1%(v/v)FA、100μLで3回洗浄した。乾燥HLA-ペプチドを、3%(v/v)ACN/5%(v/v)200μLを添加し、次いで、StageTipsにローディングすることによって可溶化した。チューブおよびピペットチップを1%(v/v)FA(2×100μL)ですすぎ、すすぎ体積をStageTipsに移し、次いで、StageTipsを1%(v/v)FA、100μLで5回洗浄した。ペプチドを、15%(v/v)ACN/1%(v/v)FA、20μL、その後、30%(v/v)ACN/1%(v/v)FAの2つの20μLのカットの段階的勾配を使用して溶出させた。試料ローディング、洗浄、および溶出は、卓上遠心分離機において1,500~3,000×gの最大スピードで実施した。溶出液を凍結させ、真空遠心分離によって乾燥させ、-80℃で保存した。
タンデム質量分析によるHLA-ペプチド配列決定
全てのnanoLC-ESI-MS/MS分析に同じ下記のLC分離条件を使用した。試料を、PicoFrit(New Objective,Inc.、Woburn、MA)75μm内径キャピラリーにフィットさせたProxeon Easy NanoLC 1200(Thermo Scientific、San Jose、CA)を使用してクロマトグラフィーにより分離した。10μmのエミッターに、1.9μm粒子サイズ/200Å孔径のC18 Reprosilビーズを用い、1000psiの圧力でHeを約30~40cmまで充填し(Dr.Maisch GmbH、Ammerbuch、Germany)、分離の間、60℃で加熱した。カラムを10×ベッド体積の緩衝剤A[0.1%(v/v)FAおよび3%(v/v)ACN]で平衡化し、試料を3%(v/v)ACN/5%(v/v)FA、4μLにローディングし、7~30%の緩衝剤B[0.1%(v/v)FAおよび80%(v/v)ACN]を82分間、30~90%の緩衝剤Bを6分間の直線勾配を用いてペプチドを溶出させ、次いで、90%緩衝剤Bで15分間保持してカラムを洗浄した。試料のサブセットを、6~40%の緩衝剤Bを84分間、40~60%の緩衝剤Bを9分間の直線勾配を用いて溶出させ、次いで、90%緩衝剤Bで5分間および50%緩衝剤Bで9分間保持してカラムを洗浄した。試料溶出のための直線勾配は毎分250nLの速度で流し、約13秒のピーク幅中央値がもたらされた。
データ依存性取得の間、溶出したペプチドを、Nanospray Flex Ion source(Thermo Scientific、San Jose、CA)を備えたOrbitrap Fusion Lumos質量分析計(Thermo Scientific、San Jose、CA)に2.2-2.5kVで導入した。フルスキャンMSを分解能60,000、300m/zから1,700m/zまで(AGC標的4e5、50ms max IT)で取得した。各フルスキャンの後に、2秒間のサイクル時間、または、単離幅1.0m/z、衝突エネルギー34(HLAクラスIデータ)および38(HLAクラスIIデータ)、ACG標的5e4、および最大充填時間250ms最大イオン時間を使用した分解能15,000でのデータ依存性MS2スキャンの上位10を続けた。単離幅1.0m/zを使用した理由は、HLAクラスIIペプチドはより長い傾向があり(>40アミノ酸のペプチドのサブセットを用いた中央値16アミノ酸)、したがって、モノアイソトピックピークが常に同位体クラスターにおいて最も高いピークであり、質量分析計取得ソフトウェアにより、指定のオフセットの非存在下で最も高い同位体ピークが単離ウインドウの中央に置かれるとは限らないからである。したがって、1.0m/z単離ウインドウにより、同位体クラスターにおける最も高いピークではない場合であっても、HLAクラスIIペプチドの電荷の状態は多くの場合+2またはそれよりも高いので、モノアイソトピックピークの共単離が可能になる。選択された前駆体当たり約3PSMを可能にするための繰り返し回数1および排除持続時間5秒間で動的排除が可能になった。HLA-ペプチド同定はPSM品質に依拠し、したがって、電荷の状態が異なる多数のPSMによりペプチド同定の信頼度がさらに増大するので、前駆体当たり単一の電荷の状態に対する依存的スキャンが無効の間は同位体を排除した。HLAクラスIIデータ収集のための電荷の状態のスクリーニングを、電荷の状態が1である(塩基性アンカー残基を有する対立遺伝子についてのみ)、>7である、または割り当てられていない前駆イオンに対するMS/MSの誘発を防止するためのPeptide Modeを使用したモノアイソトピック前駆体選択(MIPS)と一緒に可能にした。HLAクラスIに関してはデータ収集、電荷の状態が1である前駆イオン(質量範囲800~1700m/z)および2~4である前駆イオンを選択し、一方、電荷の状態が>4である前駆イオンおよび割り当てられていない前駆イオンは除外した。
LC-MS/MSデータの解釈、図29に関連する
質量スペクトルを、Spectrum Mill software package v6.0 pre-Release(Agilent Technologies、Santa Clara、CA)を使用して解釈した。MS/MSスペクトルの前駆体MH+が600~2000(HLAクラスI)/600~4000(HLAクラスII)の範囲内に入らない、前駆体電荷が>5(HLAクラスI)/>7(HLAクラスII)である、または検出ピークが最低<5である場合にはそのMS/MSスペクトルを検索から除外した。同じクロマトグラフィーピークで取得された同じ前駆体m/zを有する同様のスペクトルのマージは無効にした。MS/MSスペクトルを、264種の一般的な夾雑物と組み合わせた、ゲノムのhg19アノテーションおよびそのタンパク質コード転写物を伴う全てのUCSC Genome Browser遺伝子を含有するデータベース(63,691種のエントリー;10,917,867種の独特の9merのペプチド)に対して検索した。データベース検索の前に、全てのMS/MSを、配列タグの長さが>2である、例えば、最小で3つの質量がアミノ酸の鎖内質量から分離されるスペクトル品質フィルターを通過させなければならなかった。最小の骨格切断スコア(BCS)を5に設定し、ESI QExactive HLAv2スコア化スキームを使用した。還元もアルキル化もされていないネイティブなHLA-ペプチド試料からのスペクトルの全てを、酵素特異性なし、システイニル化として固定されたシステインの修飾を使用し、以下の可変の修飾:酸化メチオニン(m)、ピログルタミン酸(N末端q)、カルバミドメチル化(c)を用いて検索した。還元およびアルキル化されたHLA-ペプチド試料を、酵素特異性なし、カルバミドメチル化として固定されたシステインの修飾を使用し、以下の可変の修飾:酸化メチオニン(m)、ピログルタミン酸(N末端q)、システイニル化(c)を用いて検索した。前駆体質量許容誤差±10ppm、生成物質量許容誤差±10ppm、および最小のスコア化ピーク強度30%をネイティブなHLA-ペプチドデータセットならびに還元およびアルキル化されたHLA-ペプチドデータセットの両方に対して使用した。個々のスペクトルについてのペプチドスペクトルマッチ(PSM)を、Spectrum Mill自動検証モジュールを使用して標的-デコイのPSM順位でのFDR推定に基づいた利用に確信的に割り当てられたものと自動的に指定して、スコア化閾値基準を設定した。HLA対立遺伝子に対して最小の配列長7、自動可変範囲前駆体質量フィルタリング、ならびに全てのLC-MS/MS実行にわたって最適化されたスコアおよびデルタ順位1-順位2スコア閾値を使用した自動閾値戦略により、各前駆体電荷の状態についてPSM FDR推定値<1%がもたらされた。
PSM FDR推定値<1.0%を通過した同定されたペプチドを参照データベース内の264種の一般的な夾雑物タンパク質に割り当てられた全てのペプチドを除去することによって、および陰性対照MAPTAC(商標)親和性プルダウンにおいて同定されたペプチドを除去することによって、夾雑物に対してさらにフィルタリングした。さらに、参照データベースのin silicoトリプシン消化物にマッピングされたペプチドはuPLCカラムの試料キャリーオーバーからのトリプシン夾雑物として除外することができないので、これらのペプチド同定の全てを除去した。
潜在的な偽陽性PSM同定をSILAC DCフィーディング実験から除去するために、上記の方法を使用して同定されたPSMに追加的な品質フィルターを適用した。高品質PSMのために、以下の閾値を使用してFDR<1%を有する全てのペプチドをフィルタリングした:i)スコア化ピーク強度>60%ii)骨格切断スコア≧8およびiii)同じLC-MS/MS反復実験における全てのPSM同定にわたって観察された中央値ppmからのppm質量許容誤差±1ppm。
MAPTAC(商標)プロトコールを使用したHLA-DR、HLA-DQ、HLA-DPヘテロ二量体の単一対立遺伝子割り当て
MAPTAC(商標)プロトコールではHLAクラスIIのベータ鎖のみにグ付けするので、ペプチド-MHC複合体がノックインまたは内因性アルファ鎖を含有するかどうかにかかわらず、ペプチド-MHC複合体をプルダウンステップにより単離する。HLA-DRの場合では、アルファ鎖の対立遺伝子バリエーションはペプチド結合に影響すると考えられない;したがって、内因性アルファ対形成を伴う対形成の相対的な程度はデータ解釈には関連しない、つまり、データは有効に単一対立遺伝子性である。しかし、HLA-DPおよびHLA-DQ遺伝子座に関しては、アルファ鎖は、重要な対立遺伝子バリアントを示し、したがって、ノックインおよび内因性アルファ鎖対立遺伝子の両方が存在することにより、1~3種の別個の特異性の潜在性が生じる(細胞株が1つまたは2つのアルファ鎖対立遺伝子を有するかどうか、およびいずれかがノックイン対立遺伝子とマッチするかどうかに応じて)。この問題は、原理上は、ノックインアルファ鎖を用いて、および用いずにプロトコールを実行し、アルファを用いた実験に特異的なペプチドのセットを同定することによって軽減することができる。本明細書ではノックインアルファ対立遺伝子とマッチする単一のアルファ対立遺伝子を発現する細胞株を使用する手法をとった。
以前に公開されたMSデータの解析、図12A~12F、図30A~30C、図31A~31D、図21A、図39A~39B、および図40A~Bに関連する
.rawファイルをもたらした、公開されたLC-MS/MSデータセットを、Spectrum Mill software package v6.0 pre-Release(Agilent Technologies、Santa Clara、CA)を使用して再処理した。HCD断片化ならびにオービトラップ(高分解能)へのMSおよびMS/MSデータ収集を利用したThermo Orbitrap機器(例えば、Velos、QExactive、Fusion、Lumos)に収集されたデータセットを、上記の節「LC-MS/MSデータの解釈」に記載されているパラメータを使用して解析した。CID断片化を利用したMSおよびMS/MS高分解能データセットに対して、ESIオービトラップスコア化スキームを用い、上記と同じパラメータを使用した。オービトラップへのMSデータ収集およびイオントラップへのMS/MSデータ収集を用いたデータセットに対しても同様に上記と同じ以下のパラメータを使用し、以下の偏差を用いた。HCDデータに対してはESI QExactive HLAv2スコア化スキームを使用し、一方CIDデータに対してはESIオービトラップスコア化スキームを使用した。前駆体質量許容誤差±10ppm、生成物質量許容誤差±0.5Daを使用した。高分解能MS/MSデータセットおよび低分解能MS/MSデータセットの両方に対して、個々のスペクトルについてのペプチドスペクトルマッチ(PSM)を、Spectrum Mill自動検証モジュールを使用して標的-デコイのPSM順位でのFDR推定に基づいた利用に確信的に割り当てられたものと自動的に指定して、スコア化閾値基準を設定した。HLA対立遺伝子に対して最小の配列長7、自動可変範囲前駆体質量フィルタリング、ならびに全てのLC-MS/MS実行にわたって最適化されたスコアおよびデルタ順位1-順位2スコア閾値を使用した自動閾値戦略により、各前駆体電荷の状態についてPSM FDR推定値<1.0%がもたらされた。いくつかの以前に公開されたデータからのペプチド同定の解析により、高い率の9mer(>10%)が明らかになった。これらは潜在的に夾雑したHLAクラスIリガンドを表し得るので、短いペプチド(長さ<12)を全ての外部データセットから外した。
ペプチドの遺伝子および「入れ子セット」へのマッピング、図30A~30C、図31A~31D、および図32A~32Eに関連する
各ペプチドを、UCSC hg19遺伝子アノテーション内の1つまたは複数のタンパク質をコードする転写物に割り当てた(genome.ucsc.edu/cgi-bin/hgTables)。多くのペプチド同定は他と重複し、したがって、大部分が重複する情報を構成するので、ペプチドを、各々が約1つの独特の結合事象に対応することが意図されている「入れ子セット」に群分けした。例えば、ペプチドGKAPILIATDVASRGLDV、GKAPILIATDVASRGLD、およびKAPILIATDVASRGLDVは全て、保存された配列KAPILIATDVASRGLDを含有し、おそらく全てが同じレジスター内のMHCに結合する。所与のデータセットのペプチドを入れ子状にするために、各ノードが独特のペプチドに対応するグラフを築き、少なくとも1つの9merを共有し、少なくとも1つの共通の転写物にマッピング可能なペプチドの任意の対間にエッジを創出した。Rパッケージigraph内のクラスターコマンド(Team, 2014)(cran.r-project.org/web/packages/igraph/citation.html)を使用して、接続したノードのクラスターを同定し、各クラスターを入れ子セットと定義した。この手順により、エッジ基準(共通の9merが1つ以上、共通の転写物が1つ以上)を満たす任意の2つのペプチドが同じ入れ子セット内に入ることが保証される。入れ子を配列ロゴ生成のために使用した(各入れ子セット内の最も短いペプチドを使用してロゴを生成した;図30A~30C、機械学習(合計1になる、入れ子セット内のペプチドにわたる重要性の重み付け;図31A~31D)、および遺伝子の偏り解析(各入れ子セットを個々のペプチドではなく1つの観察として計数した;図32A~32E)。
アミノ酸頻度の解析、図12Fに関連する
ヒトプロテオームにおけるアミノ酸頻度を、UCSC hg19アノテーション内のタンパク質をコードする遺伝子全ての配列に基づいて算出した(多数の転写物アイソフォームによって表される遺伝子に対して1つの転写物をランダムに選択する)。IEDB頻度を、少なくとも1つの親和性観察≦100nMを有するペプチドの独特のセットを同定することによって決定した(C末端に六価ポリヒスチジンを有するペプチドは除外する)。MAPTAC(商標)頻度をまず、入れ子セット当たりただ1つのペプチド(最長のもの)を使用し、5種のDRB1対立遺伝子(DRB101:01、DRB103:01、DRB109:01、およびDRB111:01)にわたって標準の順相プロトコールに関して検討した。さらに、還元およびアルキル化プロトコールによってプロセシングされた試料のサブセットについてMAPTAC(商標)頻度を別々に算出した。外部データセットからのMSデータを、潜在的対立遺伝子起源を考慮せずに、同様に入れ子セット当たり最長ペプチドを使用して解析した。
HLAクラスI配列ロゴを築くこと、図37Bに関連する
各HLAクラスI対立遺伝子について、対応するペプチドの最初の5つの位置(ロゴ位置1~5にマッピングされる)および最後の4つの位置(ロゴ位置6~9にマッピングされる)におけるアミノ酸頻度をプロファイリングすることによって長さ9の配列ロゴを創出した。このように、ペプチドは、長さにかかわらず配列ロゴに寄与した。HLAクラスIIロゴの場合と同様に、文字の高さは各位置における各アミノ酸の頻度に比例し、頻度が≧10%のアミノ酸について色分けを使用した。
HLAクラスIIペプチドの逆畳み込みの性能の評価、図30Bに関連する
GibbsCluster(v2.0)ツールの、複対立遺伝子HLAクラスIIペプチドデータを対立遺伝子起源毎にクラスター化する能力を評価するために、PBMC試料4つ、黒色腫細胞株(A375)1つ、および以前に公開されたリンパ芽球様細胞株3つを含む8つの試料に対するその性能を解析した。各試料遺伝子型に存在する各DRB1/3/4/5対立遺伝子について、我々の単一対立遺伝子MAPTAC(商標)データからの20種のペプチドをスパイクインした。スパイクされたペプチドはSPI≧70の12~20merに制限し、他のHLA-DR対立遺伝子についてのMAPTAC(商標)データ内のいずれのペプチドとも9merを共有しなかった、または目的の対立遺伝子についてのスパイクされたペプチドのいずれとも9merを共有しなかった。次いで、これらの強化されたデータセットをGibbsCluster-v2.0に、逆畳み込みのために、その他は以前から有しているのと同様に1位における疎水性優先性を強制した以外はデフォルトHLAクラスII設定を使用してサブミットした。各試料について、溶液中のクラスターの数を手動で指定し、遺伝子型に存在するHLA-DR対立遺伝子の数と等しくなるように設定した。
好ましいアンカー残基を有するペプチドの分率の算出、図30Cに関連する
アンカー位置を、最も低いエントロピーを有する4つの位置と定義し、それらの位置内の「優先される」アミノ酸には、≧10%の頻度を有するアミノ酸全てが含まれた。n位に優先されるアミノ酸を有するペプチドの分率を算出する場合、入れ子セット当たりただ1つのペプチドを使用した(最も短いもの)。
MSにより観察されたペプチドの予測される親和性、図36Aに関連する
各HLAクラスII対立遺伝子について、14から17までの独特のペプチド長を全て同定し、結合潜在性についてNetMHCIIpan-v3.1を使用してスコア化した。比較のために、50,000種のランダムな長さを釣り合わせたペプチドをヒトプロテオームからサンプリングした。密度分間布を対数変換された値に基づいて決定した。
MSにより観察されたペプチドについての測定された親和性、図36Bに関連する
ペプチドを、予測されるNetMHCIIpan-v3.1結合親和性が不十分なものである場合(DRB101:01については>100nMまたはDRB111:01については>500nM)、または≦2のヒューリスティックに定義されたアンカーを示す場合、親和性測定値について選択した。
交差検証区分の確立、図31Aに関連する
各ノードがタンパク質をコードする転写物を表し、少なくとも5つの独特の9merのアミノ配列内容を共有する転写物の全ての対の間にエッジが存在する(UCSC hg19遺伝子アノテーション)グラフを創出した。Rパッケージigraph内のクラスターコマンド(Team, 2014)(cran.r-project.org/web/packages/igraph/citation.html)を使用して、接続したノードのクラスターを同定し、各クラスターを「転写物群」と定義した。このように、2つの転写物がエッジを共有する場合(共有される9merが5つ以上)、同じ転写物群に入ることが保証された。転写物群をランダムにサンプリングし、プロテオームを8つの大まかに同等のサイズにした区分に分割した。MSにより観察されたペプチド(および観察されていないデコイペプチド)をそれらの供給源転写物の区分に従って区分に入れ、これらの区分を交差検証およびハイパーパラメータチューニングのために使用した。プロテオームの区分化のグラフに基づく手法を使用して、訓練および評価中に同様のペプチド配列が現れ、それにより予測性能が人為的に膨張し得る可能性を最小限にした。
CNNに基づくHLAクラスII結合予測器、neonmhc2のアーキテクチャおよび訓練、図31Aに関連する
訓練のために陰性例(デコイ)をヒットペプチドの配列をランダムにシャッフリングすることによって生成した。一般的なアミノ酸優先性をもたらす可能性があるMSの偏りを排除するために、プロテオームから観察されていない領域を選択するのではなく、このデコイ生成方法を選択した。このように、我々の結合予測器では、例えば、システインの相対的枯渇を知らない(図12F)。同様に、これにより、我々のモデルが、全体的な疎水性などのペプチドの全体的特性に関連するMSの偏りを学習することが防止される。この方法は、図31Aに示されている結果に関連する。
モデルを2つの適用シナリオについて訓練した:内部MAPTAC(商標)データに対する検証(図31B)および外部データに対する検証(図31C、図21A、および図21B)。モデルを前者について訓練した場合、6つのデータの区分(訓練区分)を使用してネットワーク重み最適化を学習し、第7の区分(チューニング区分)を使用してハイパーパラメータ最適化および早期停止を実施し、モデル設計を完成させた後に第8の区分(評価区分)に対して最終的な検証を実施する、単純な訓練手順を採用した。外部検証の場合では、交差検証を使用し、データの各区分について、ハイパーパラメータチューニングおよび早期停止のためにその区分をホールドアウトし、残りの7区分をネットワーク重み最適化に使用する、モデルのアンサンブルを築く。さらに、非MSデータをスコア化する場合(図31Cおよび図31D)、標的ペプチドの12~20merの部分列の各々をスコア化し、最も高いスコアを保持した。
我々のモデルを訓練する場合、損失関数における各ヒットおよびデコイについて、その供給源入れ子セットのサイズによって重みを減らし、したがって、各入れ子セットが全体として同等の重みを有した。モデルをハイパーパラメータチューニングについて評価する場合、各入れ子セットからの最も短いペプチドを関連性のある区分に陽性例として使用し、これらのヒットのスクランブルバージョンをデコイとして使用した。さらに、全体的な重み付け因子を、訓練時のヒットの合計された重みがデコイの合計された重みと等しくなるように適用した。モデルの最終的な評価のために、図31Bに示されている通り、各入れ子セットから最も短いペプチドを再度選択して評価区分(区分8)に入れたが、デコイはペプチド供給源遺伝子の観察されていない部分配列からランダムにサンプリングした(「天然のデコイ」、後の節に記載されている)。このように、単に天然の配列とスクランブル配列を区別するためにモデルによって学習された偏りはいずれも評価区分に対する我々の性能を膨張させるものではなかった。
モデルを、Adam最適化器を使用し、最初の学習率0.003、ベータ_1値0.9、ベータ_2値0.999および減衰なし(学習率以外はデフォルトKerasパラメータ)で訓練し、バイナリ交差エントロピー損失関数を使用した。最初のモデルの重みを、He初期化を使用して設定した。5エポックの訓練毎に、チューニング区分に対する陽性適中率(PPV、後の節に記載されている)を測定し、最大値を追跡した。各エポック後に、訓練損失が減少していない場合には、学習率に1/3を掛けた。同様に、毎回PPVをチューニング区分に対して測定し、PPVが最大実行と比較して増加していない場合、学習率に1/3を掛けた。訓練損失を3回の連続したエポックにわたって減少できなかった場合、またはチューニングPPVを3回の連続したチェックにわたって最大実行よりも上に増加できなかった場合には訓練を停止する、早期停止スキームをインプリメントした。モデルを訓練した際、固定されたヒット対デコイ比1:39を訓練セットに使用し、および1:19をチューニング区分に使用した。
特色付け:アミノ酸は「ワンホット」符号によって表すことができるが、他方ではPMBEC行列およびBLOSUM行列を使用してアミノ酸を符号化する選択をし(Henikoff and Henikoff, 1992)、その場合、同様のアミノ酸は同様の特色プロファイルを有する。我々のペプチド特色付けの目的のために、解析されたタンパク質構造においてアミノ酸近接性に基づく新規の行列を生成した。この手法の概念は、アミノ酸の典型的な近隣アミノ酸に化学的特性が反映されるはずであるというものである。約100,000種のDSSPタンパク質構造の各々の各アミノ酸について(cdn.rcsb.org/etl/kabschSander/ss.txt.gz)、3D空間では最も近いが、一次配列では少なくとも10アミノ酸離れている残基を決定した。このデータを使用して、アラニンの最も近くの近隣アミノ酸がアラニンである回数、アラニンの最も近くの近隣アミノ酸がシステインなどである回数を決定して、近接計数の20×20行列を創出した。行列の各要素をその対応する列および行の合計の積で割り、行列全体を対数変換した。最後に、行列全体の平均値を各要素から引いた。
各アミノ酸をまた、酸性であるか(N、Q)、脂肪族であるか(I、L、V)、芳香族であるか(H、F、W、Y)、塩基性であるか(H、K、R)、荷電しているか(D、E、H、K、R)、疎水性であるか(A、C、F、H、I、K、L、M、T、V、W、Y)、ヒドロキシルであるか(S、T)、極性であるか(C、S、N、Q、T、D、E、H、K、R、Y、W)、小さいか(V、P、A、G、C、S、T、N、D)、非常に小さいか(A、G、C、S)、または硫黄を含有するか(M、C)などの、アミノ酸の特性を記述する11種のバイナリ特色を用いて符号化した。各アミノ酸の位置を記述するために2つの特色を使用した。一方はペプチドにわたって単調に増加し、一方はペプチドの中心から絶対的距離を示し、どちらも単位は位置である(物理的距離ではない)。最後に、短いペプチドの端を越えて起こり得る、アミノ酸のその位置からの「欠損」が生じているかどうかを示すために単一のバイナリ特色を含めた。結果は、各アミノ酸が20のアミノ酸近接特色、11のアミノ酸文字特色、2の位置特色、および1の欠損文字特色の合計34の特色によって符号化されるというものである。全てのペプチドを20merとして符号化し、より長いペプチドについて中心的な20アミノ酸を使用し、20アミノ酸よりも短いペプチドの端に欠損文字値を対称的に加えた。
例をニューラルネットワークに入力する際、訓練および評価の両方について、34の特色の各々を、それらの平均を引き算し、それらの標準偏差で割ることによって正規化する。平均および標準偏差は訓練セットのみに基づいて算出し、ペプチド内部の位置は考慮に入れない。
結合を予測するために、各対立遺伝子について畳み込みニューラルネットワークのアンサンブルを訓練した。モデルアーキテクチャの略図が図31Aに示されており、各々カーネルサイズが6でありフィルターが50である2つの畳み込み層が示されている。各層の後、グローバル最大および平均プーリングを適用し、得られた値を、シグモイド活性化を用いる最終的な出力ニューロンに入力した。ReLU活性化、バッチ正規化(Ioffe and Szegedy, 2015)、および20%空間ドロップアウトを各畳み込み層の直後に適用したことが含まれるが示していない。
モデルのアンサンブルを各対立遺伝子について訓練する際、アーキテクチャは固定したが、L2正則化の量は変動させた。基本のL2正則化の重み0.05を第1の畳み込み層に使用し、および第2の畳み込み層には0.1を使用した。L2正則化の量を変動させるために、これらの値に0.1、0.5、および1を掛けた。アンサンブルにおける各反復について、正則化レベル当たり1つのモデルを訓練し、チューニング区分に対する性能に基づいて最良のモデルを保持した。
MAPTAC(商標)により観察されたペプチドに関する予測性能のベンチマーキング、図7Aに関連する
HLA対立遺伝子によってコードされる所与のペプチドまたはタンパク質についての予測性能値の一部の例示的な評価では、「スクランブルデコイ」を含む方法を使用することができる。スクランブルデコイは、例えば質量分析データに基づいて所与のHLAペプチドまたはタンパク質と結合することが分かっているペプチドと同じペプチド長およびアミノ酸を有するが、アミノ酸の配列がスクランブルされているペプチドである。図7Aに示されている通り、質量分析によって同定されたすべての単一のペプチドについて、そのようなスクランブルペプチドデコイを19使用した(ヒット:デコイ1:19)。提示予測モデルを試験し、PPVを、試験区分におけるペプチドの最良スコア化5%を解析し、どの画分が陽性であるかを調べることによって決定した。このように生成されたPPVが図7Aおよび以下の表12に示されている。
Figure 2022518355000018
Figure 2022518355000019
Figure 2022518355000020
MAPTAC(商標)により観察されたペプチドに関する予測性能のベンチマーキング、図31Bに関連する
所与の対立遺伝子についての予測性能を評価するために、観察することができたが(プロテオームに存在することが理由で)、MSデータでは観察されなかったペプチドのセットを定義することが必要であった。これらの陰性例は訓練された「天然のデコイ」であった(上記の「スクランブルデコイ」とは対照的に)。指導原理の通り、以下を決定した:天然のデコイの長さ分布はMSにより観察されたヒットの長さ分布とマッチすべきである、天然のデコイは、他の天然のデコイと重複する配列を含有すべきではない、天然のデコイは重複ヒットであるべきではない、および/または天然のデコイは、少なくとも1つのヒットを生じた遺伝子に由来すべきである。
以下の疑似コードは、これらの原理を満たす評価を創出するためにインプリメントしたプロセスを表す:
ヒットの空リスト2つ、HminimalおよびHexhaustiveを初期化する
MSにより観察されたペプチドの各入れ子セットSについて:
S内に訓練またはチューニング区分内の転写物にマッピングすることができるペプチドがない場合:
S内の最も短いペプチドをHminimalに加える
S内の全てのペプチドをHexhaustiveに加える
デコイペプチドの空リスト、Dを初期化する
試験区分内の各タンパク質をコードする転写物(最長が最初、最短が最後)について:
exhaustive内に転写物にマップされるペプチドがない場合:
飛ばして次の転写物に進む
転写物のタンパク質配列に重複ペプチドPのセットをかぶせる。ペプチド長はHminimalの長さ分布からランダムにサンプリングする。重複は8アミノ酸である(P内の最後のペプチドが一般にはタンパク質の終わりからぶら下がる)。
P内の最後のペプチドがまだぶら下がっている間に:
P内の最長ペプチドの長さから1アミノ酸を差し引く
P内の各ペプチドについて:
exhaustive内のペプチドと9merを共有せず、D内のペプチドのいずれかに観察される9merのいずれも有さない場合:
当該ペプチドをDに加える
他の場合には:
当該ペプチドをはねる
minimalおよびDは評価データセットを構成する
このセットに対する性能を評価するために、n個のヒットペプチド全てを、19n個のデコイのセット(デコイの完全なセットから、元に戻さずにランダムにサンプリングしたもの)と一緒に予測器(neonmhc2またはNetMHCIIpan)によって評価し、スコア化した。組み合わせたセット内のペプチドの上位5%を陽性コールと標識し、陽性適中率(PPV)を、ヒットであった陽性コールの分率として算出した。陽性の数はヒットの数と等しくなるように制約されるので、この評価シナリオでは、再現率はPPVと正確に等しいことに留意されたい。対立遺伝子にわたって一貫した1:19の比を適用することは、そうでなければ各対立遺伝子について観察されるヒットの数の影響を受ける性能値の安定化に役立つ。ヒットの数が対立遺伝子の内在性特性よりも実験条件および反復実験数に大きく関連することが仮定されたので、これは妥当であると思われた。
非15merに対するNetMHCIIpan親和性の算出、図31A~D、図40A~B、および33A~Dに関連する
初期の解析では、非15merに対するNetMHCIIpan-v3.1親和性およびパーセント順位予測はベンチマークに対して不十分に実施された。しかし、以下の手法により性能が著しく改善された:ペプチドが15アミノ酸よりも長い場合、全ての構成物を15merとスコア化し、最も強い予測を全体的なペプチドスコアとして選択した;ペプチドが15アミノ酸より短い場合、N末端にGを当ててペプチドの長さを15にし、得られた伸長したペプチドをスコア化した。
訓練セットのサイズに応じた性能、図38Aに関連する
我々のモデルの性能が我々のデータセットのサイズによってどのように限定されるかを理解するために、飽和解析を実施した。これは、使用する訓練用データの画分を変動させることがホールドアウト区分に対する性能にどのように影響を及ぼすかを理解するために、使用する訓練用データの画分を変動させながらモデルのアンサンブルを再訓練することを伴うものであった。図38Aは、訓練セットに使用したヒットペプチドの数に応じた評価区分(区分8)PPVを示す。各データポイントは、10モデルの集合にわたる平均PPVを示し、エラーバーは標準偏差を示す。
天然のCD4+ T細胞応答の予測性能のベンチマーキング、図31Cに関連する
IEDBにおいて実証されたCD4+ T細胞応答の大部分(tcell_full_v3.zip at iedb.org/database_export_v3.php)は未知のまたはコンピュータにより帰属されたHLAクラスII対立遺伝子制限を有するので、HLAクラスII四量体によって実験的に確認された記録のサブセットに焦点を当てた。そのような記録はほぼ全てがWilliam Kwok Laboratory(Benaroya Research Institute、Seattle、WA)により寄託されたものであり、免疫反応性個体の血液を使用して、多様な病原体およびアレルゲンの四量体によりガイドされるエピトープマッピング(TGEM)を実施している。陰性ペプチドは一部の試験に関してはポストされているが、他の試験に関してはポストされていないので、ソース刊行物を精査して、陽性および陰性ペプチド反応性の完全なセットを再構築した。一部の場合では、陰性ペプチドはソース刊行物に明確に列挙されている。他の場合では、陰性を刊行物の方法で指定されているタイリング手順に従って帰属させ、それにより、ペプチド境界が既知の陽性例と一致することを確認する。図31Cに示されているこのアッセイでは、インフルエンザウイルスおよびライノウイルスのウイルス遺伝子からウイルスエピトープをマッピングし、エピトープを含むペプチド配列を使用して、各エピトープに対するHLAクラスIIタンパク質結合体を予測した。この場合、ペプチドに対するCD4+メモリーT細胞応答についてのPPVをそれぞれのHLA-DRB1タンパク質について予測した。PPVを、陽性結合体に関して、上位に順位付けられるエピトープのいずれの画分が真のヒットであったかを問うことによって決定した。HLAクラスIIタンパク質分子とペプチドの陽性対形成、およびそれぞれのウイルスを感染させた対象においてHLA分子が存在する場所を考慮して、対象においてCD4応答が生じる。Neonmhc2と公的に入手可能な予測器(NetMHCIIpan)の予測効率(PPV、言い換えれば、真のヒット数の予測)の比較が図31Cにこの例示的試験において試験した各DRB1タンパク質毎に示されている。試験した6種の対立遺伝子の各々についてneonmhc2の方がNetMHCIIpanよりも優れていた。
20merのペプチド全てをneonmhc2によって、およびNetMHCIIpan-v3.1によってスコア化した。PPVを、上位にスコア化されたペプチドn個の間で実験的に確認された陽性の分率として算出し、ここで、実験的に確認されたペプチドが合計n個存在した(図31C)。
T細胞誘導プロトコールおよび免疫原性読み取り、図31Dに関連する
単球由来樹状細胞(mDC)を生成するために、CD14+単球を、HLA-DRB111:01+健康ドナー末梢血単球(PBMC)から、ヒトCD14マイクロビーズを製造者のプロトコール(Miltenyi Biotec)の通り使用し、磁気分離によって単離した。単離されたCD14+細胞を、800U/mlのrhGM-CSFおよび400U/mlのrhIL-4を補充したCellgenix GMP DC培地(Cellgenix)中で5日間にわたって分化させた。5日目に、mDCを回収し、0.4μMのペプチドを37摂氏温度で1時間にわたってパルスし、その後、10ng/mlのTNF-α、10ng/mlのIL-1β、10ng/mlのIL-6(Cellgenix)、および0.5μg/mlのPGE1(Cayman Pharma)を使用して成熟化させた。48時間後、mDCを、AIMV/RPMI(ThermoFisher)、10%ヒト血清(Sigma-Aldrich)、1%Pen/Strep(ThermoFisher)を含有し、5ng/mlのIL7およびIL15(Cellgenix)を補充した培地中、自己PBMCと1:10の比で共培養した。12日目に、T細胞を回収し、0.4μMのペプチドをパルスした成熟DCで7日間、2回の追加的な刺激で合計3回の刺激にわたって再刺激した。
誘導されたT細胞を以前に記載されている一意的な2色バーコード標識系で標識し、ペプチドをパルスし、上記の通りCD14+単球に由来する成熟させた自己mDCと1:10の比で終夜培養した。翌朝、細胞をペプチドに応答したIFN-γの産生についてフローサイトメトリーによって評価した。細胞をGolgi Plug/Golgi Stop(BD Biosciences)を用いて37℃で4時間にわたって処理した。次いで、細胞を、CD19、CD16、CD14、CD3、CD4、CD8に対する表面マーカー抗体(BD Biosciences、San Jose、CA)、ならびにLive/Dead Fixable Dead Cell stain(ThermoFisher)で染色した;以下の表13を参照されたい。次いで、試料を透過処理し、BD Cytofix/Cytoperm kit(BD Biosciences)を用い、製造者のプロトコールに従って固定し、IFN-γ(BD Biosciences)に対する細胞内抗体を用いて染色した。試料を、BD Fortessa X-20フローサイトメーターに流し、FlowJoソフトウェア(Treestar)を使用して解析した。ペプチドに対して正に応答した誘導試料は、IFN-ガンマ産生をペプチドなし対照よりも3%高く誘導する試料であった。
Figure 2022518355000021
単一細胞RNA-SeqでのHLAクラスII発現データの解析、図19Aに関連する
単一細胞RNA-Seqデータを、3つの、ヒト腫瘍試料がプロファイリングされた以前に公開されたデータセットから得た。第1の試験には皮膚黒色腫からのデータを含めた。ファイル「GSE72056_melanoma_single_cell_revised_v2.txt」をGene Expression Omnibus(ncbi.nlm.nih.gov/geo/;accession:GSE72056)からダウンロードした。腫瘍の状態フラグ「2」を有する細胞を腫瘍細胞として扱い、腫瘍の状態フラグ「1」、および「1」から「6」までと等しい免疫細胞型フラグで標識された細胞をそれぞれT細胞、B細胞、マクロファージ、内皮、線維芽細胞、およびNKとして扱った。他の細胞は全て外した。データをlog2(TPM/10+1)の単位でネイティブなまま示し、したがって、TPM尺度に数学的に変換した。TPM尺度になったら、各細胞についてのデータを、タンパク質をコードするUCSC遺伝子の符号のセットにわたって再正規化して、1,000,000まで合計した(発現行列に現れないタンパク質をコードする遺伝子は暗黙のうちにゼロ発現を有するものとして扱った)。最後に、同じ細胞型および同じ供給源の生検材料に対応する単一細胞観察を平均して患者-細胞型レベルの発現推定値を生じさせた。
第2の試験には、頭頸部腫瘍からのデータを含めた。ファイル「GSE103322_HNSCC_all_data.txt」をGene Expression Omnibus(ncbi.nlm.nih.gov/geo/;accession:GSE103322)からダウンロードした。Itay Tirosh(August 22, 2018)との個人の対応に従って、この表中のデータはまた、log2の単位(TPM/10+1)であった。したがって、値をTPM単位に数学的に変換した。黒色腫試験と同様に、各細胞についてのデータを、タンパク質をコードするUCSC遺伝子の符号のセットにわたって再正規化して、1,000,000まで合計し、同じ細胞型および同じ供給源の生検材料に対応する単一細胞観察を平均した。リンパ節生検材料に対応するデータを除外した。
第3の試験には、無処置の非小細胞肺からのデータを含めた。ファイル「RawDataLung.table.rds」および「metadata.xlsx」をArrayExpress(ebi.ac.uk/arrayexpress/;accessions:E-MTAB-6149およびE-MTAB-6653)からダウンロードした。データ(すでにTPM)単位を、以前に記載されているタンパク質をコードする遺伝子のセットにわたって再尺度化して、1,000,000まで合計した。最後に、同じ細胞型および同じ供給源の生検材料に対応する単一細胞観察を平均して患者-細胞型レベルの発現推定値を生じさせた。簡単にするために、以下の表14に、細胞型をマージしてネイティブなまま報告されたものよりも粒度を粗くした。
Figure 2022518355000022
第4の試験には、結腸直腸腫瘍からのデータを含めた。ファイル「GSE81861_CRC_tumor_all_cells_FPKM.csv」をGene Expression Omnibus(ncbi.nlm.nih.gov/geo/;accession:GSE81861)からダウンロードした。データ(すでにTPM)単位を、以前に記載されているタンパク質をコードする遺伝子のセットにわたって再尺度化して、1,000,000まで合計した。最後に、同じ細胞型および同じ供給源の生検材料に対応する単一細胞観察を平均して患者-細胞型レベルの発現推定値を生じさせた。この試験に関しては、「上皮」と標識された細胞は腫瘍細胞と正常な上皮の混合物を表すと推定される。
第5の試験には、漿液性卵巣がん腫瘍からのデータを含めた。悪性度が低い漿液性卵巣がん患者2例(LG1、LG2)および悪性度が高い漿液性卵巣がん患者4例(HG1、HG2F、HG3、HG4)の6例の卵巣上皮がんに関する単一細胞RNA配列決定データを他の箇所から得た。品質フィルタリング、クラスタリングおよび解析はShih et al., 2018に概説されているステップに従った。簡単に述べると、Seurat解析ツールを使用して、品質フィルタリングを通過する細胞をクラスター化した(最小200種の発現された遺伝子、各遺伝子は少なくとも3つの異なる細胞において検出されなければならない;全部で2258の細胞)。細胞周期および独特の転写物計数の影響を取り除いた。細胞を主成分分析に従ってクラスター化し、クラスターを元の刊行物からの遺伝子シグネチャーの発現に基づいて細胞型に割り当てた。各患者の各細胞型について、HLA-DRB1遺伝子についてのTPMを、タンパク質コード遺伝子の正規化された独特の転写物計数から算出した。
4つの試験におけるHLA-DRB1の発現レベルを図19Aにプロットした。
腫瘍由来HLAクラスII発現と間質由来HLAクラスII発現との特徴付け、図19Bに関連する
腫瘍に起因するHLAクラスII発現と間質に起因するHLAクラスII発現の相対量を決定するために、TCGA患者におけるHLAクラスII経路遺伝子のDNA配列決定からコールされた変異を同定し、HLAクラスII変異を有する各患者について、遺伝子の変異したコピーおよび変異していないコピーの相対的な発現量を対応するRNA-Seqで数量化した。さらに、変異リードが腫瘍から生じ、変異していないリードが間質または腫瘍における野生型対立遺伝子について生じ、および腫瘍が変異コピーとほぼ等しい発現を有する野生型コピーを保持することが仮定された。
これに基づいて、観察された変異体対立遺伝子分率fに関して、腫瘍に起因するHLAクラスII発現の分率がおよそ2fであり、100%以下であったことが決定された。3つの遺伝子、つまりCIITA、CD74、およびCTSSを、コアHLAクラスII経路遺伝子として選択し、TCGAの変異について評価した(同義のおよびUTR変異を除外せず)(データをTumorPortal(tumorportal.org/):BRCA、CRC、HNSC、DLBCL、MM、LUAD;TCGAバルクダウンロード(tcga-data.nci.nih.gov):CESC、LIHC、PAAD、PRAD、KIRP、TGCT、UCS;シナプス(synapse.org/#!Synapse:syn1729383):GBM、KIRC、LAML、UCEC、LUSC、OV、SKCM;または元のTCGA公開(cancergenome.nih.gov/publications):BLCA、KICH、STAD、およびTHCAからダウンロードした)。これらの遺伝子を、HLAクラスII発現におけるそれらの公知の役割、および8500GTEx試料のコホートにわたるそれらのHLA-DRB1との密接な相関に基づいて選択した。HLA-DRB1(HLA-DRA1、HLA-DPA1、HLA-DQA1、HLA-DQB1、およびHLA-DPB1)と等価相関を有する他の遺伝子は、それらの多型的性質により偽陽性変異コールが起こりやすくなるので除外した。天然に、患者のごく一部のみがCIITA、CD74、またはCTSSに変異を有し、また、一部の腫瘍型に関しては、解析に利用可能な患者が存在しなかった。
元の全エクソーム配列決定(WES)BAMを視覚的に評価して(IGV)、変異が腫瘍試料には存在するが正常な試料には存在しないことを確認した。変異体リード計数と野生型リード計数とを対応するRNA-Seqからpysamを使用して得た。全体的なHLA-DRB1発現をGenomic Data Commons(gdc.cancer.gov/)からダウンロードされた発現データに基づいて決定し、それを、タンパク質をコードする遺伝子のセットにわたって再正規化して、1,000,000まで合計した。腫瘍に起因するHLA-DRB1発現の分率(図19B)をmin(1,2f)として推定し、ここで、fは、変異を示すCIITA、CD74、またはCTSSにおけるRNA-Seqリードの分率である。
過剰に表された遺伝子および過少に表された遺伝子の同定、図32Aおよび図39Bに関連する
卵巣がん、結腸直腸がん、および黒色腫のMHC-IIリガンドームがプロファイリングされた以前に公開されたMS実験からの試料を解析した。卵巣がんデータセットからの多くの試料はRNA-Seqが利用可能なものであり、これらの試料のデータをSRA(NCBI BioProject PRJNA398141)からダウンロードし、STARアライナーを使用してUCSC hg19トランスクリプトームとアラインメントした。RNA-Seqが利用可能でなかった卵巣試料については、RNA-Seqが利用可能であった試料にわたって平均することによって発現を推定した。結腸直腸試験および黒色腫試験に関しては、いずれの試料についても対応するRNA-Seqが存在せず、したがって、TCGA(The Cancer Genome Atlas Network)からのデータを使用して代理試料にわたって平均を算出した。RSEMバージョン-1.2.31によって算出される百万当たりの転写物数(TPM)を使用して転写レベルでの遺伝子数量化を実施した。発現推定値を、遺伝子レベルを合計すること、非コード遺伝子を外すこと、および総TPMが合計1000000になるように再正規化すること(ncRNA存在量のライブラリー間の変動の原因となるタンパク質をコードする遺伝子にわたって再正規化すること)によってさらに処理した。
HLAクラスIIリガンドームにおいて過剰に表された遺伝子および過少に表された遺伝子を同定するために、発現解析に使用したものと同じ3つのデータセットを解析した。各遺伝子について、我々のベースライン仮定は、ペプチドがその長さにその発現レベルを掛けた割合でもたらされるはずであるというものであった。各遺伝子の長さを決定するために、全ての転写物アイソフォームにわたる独特の9merを数え上げた。転写物アイソフォームにわたって合計することによって遺伝子レベル発現を得た。観察された、各遺伝子にマッピングされるペプチドの数を入れ子セットレベルで決定した(例えば、ペプチドGKAPILIATDVASRGLDV、GKAPILIATDVASRGLD、およびKAPILIATDVASRGLDVを単一の観察として計数した)。
それぞれEおよびOと称される、予測される計数および観察された計数を表す2つの行列を創出し、ここで、行は遺伝子に対応し、列は試料に対応する。O内の値は、入れ子セットレベルで試料当たりのペプチド数を計数することによって決定した。まず、各試料中の各遺伝子の長さにその発現を掛けることによって行列Eをポピュレートし、次いで、Eの列を再尺度化して、Eの列の合計とOの列の合計がマッチするようにした。最後に、Eの行の合計とOの行の合計を比較することによって遺伝子レベル解析を行った(図32A)。遺伝子をヒト血漿中のそれらの存在および濃度に従って強調表示した。同じ試験のセットからの黒色腫、結腸直腸がん、および卵巣がんデータを使用してHLAクラスIデータにおける過剰に表された遺伝子および過少に表された遺伝子を同定するために同一の手法を使用した。HLAクラスI解析に関しては、入れ子を適用せず、独特のペプチドのみを計数した。
過剰に表された遺伝子の結合スコアの評価、図39Aに関連する
過剰に表された遺伝子の多くが血漿遺伝子であることが観察された。血清遺伝子の包括的な一覧を得、血漿遺伝子に由来するHLA DR結合ペプチドについて、非血清遺伝子に由来するHLA-DR結合ペプチドと、ならびに、免疫ペプチドームにおいて表された遺伝子からサンプリングした長さを釣り合わせた非結合性(例えば、MSでは観察されていない)ペプチドとneonmhc2結合スコアを比較した。汎DR抗体を用いてプロファイリングされたHLAクラスIIペプチドを有する、遺伝子型決定された複対立遺伝子データセットについて(図30Bにおける解析と同じ試料)、neonmhc2で各DR対立遺伝子について試料が発現されたペプチドをスコア化した。発現された対立遺伝子全てにわたるneonmhc2による最良のスコア出力を各ペプチドの代表的なスコアとした。データを全ての使用可能なデータセットにわたってプールし、ペプチドの各カテゴリーについてスコアの分布を箱ひげ図で可視化した。
タンパク質ターンオーバーに関連する遺伝子の解析、図32Cに関連する
ターンオーバーがプロテアソームによって調節されるタンパク質を表すことが意図された2つの遺伝子セットを同定した。第1の遺伝子セットは、細胞株KG1、Jurkat、またはMM1Sにおける少なくとも1つの観察されたユビキチン化部位を有する遺伝子を含むものであった。第2のセットは、p値フィルター0.01を適用し、上向きの変化倍率が最も大きな300種の遺伝子を選択して、公開された論文のプロテアソーム阻害剤ボルテゾミブ(BTZ)を適用するとレベルが上昇する遺伝子を含むものであった。
バルク腫瘍と抗原提示細胞遺伝子発現の説明力の比較、図39Cに関連する
4つの遺伝子発現プロファイルを創出した。第1の遺伝子発現プロファイルは、APCを表すことが意図され、上記の単一細胞RNA-Seq実験からの細胞型特異的プロファイルを平均することによって推定されたものである。平均には「マクロファージ」(頭頸部試験、肺試験、および黒色腫試験からのもの)、「CLEC9A DC」(肺試験からのもの)、および「monoDC」(肺試験からのもの)を含めた。他の3つの発現プロファイルは卵巣がん、結腸直腸がん、および黒色腫からのバルク腫瘍プロファイルに対応するものである(データ、図19A)。卵巣プロファイルはSchusterらによって公開された試料の平均であり、他のプロファイルは、腫瘍型毎の、「絶対的」アルゴリズムを使用して以前に推定された最も高い腫瘍細胞充実性を有する5つのTCGA試料に由来するものである。各腫瘍型について、遺伝子当たりのペプチドの数(入れ子セットレベルで)を計数し、遺伝子の長さ、APC特異的遺伝子発現、および腫瘍特異的遺伝子発現に応じた各遺伝子のペプチド計数を線形回帰を使用してモデル化した。出力変数および全ての入力変数をlog(x+1)によって転換した。モデルのパラメータ推定値を使用し、腫瘍の寄与をβ腫瘍/(β腫瘍+βAPC)として算出し、APCの寄与をβAPC/(β腫瘍+βAPC)として算出した。各試料について、遺伝子レベルでのブートストラップリサンプリング(M=100)を使用して、説明的割合についての信頼区間を算出した。
HLAクラスIIペプチドの観察された切断部位の特徴付け、図40Aに関連する
天然にプロセシングされ、提示されるHLAクラスIIペプチドを6つのデータセット:PBMCドロー、DC様MUTZ3細胞株、結腸直腸がん組織、黒色腫、卵巣がん、およびexpi293細胞株から解析した。多くのペプチドが同じN末端(例えば、GKAPILIATDVASRGLDVおよびGKAPILIATDVASRGLD)または同じC末端(例えば、GKAPILIATDVASRGLDおよびKAPILIATDVASRGLD)を共有するので、N末端にについて1つ、およびC末端について1つの、2セットの重複していないカット部分をキュレートした。図41に示されている命名システムを使用してペプチドの上流、ペプチド内部、およびペプチドの下流の位置を指す。上流および下流の頻度(...U1およびD1...)、をプロテオームアミノ酸頻度と比較し、有意な偏差をカイ二乗検定によってスコア化した。ペプチド位(N1...C1)をMSペプチドにおいて観察された頻度と比較した。
種々のHLAクラスII切断予測器の性能のベンチマーキング、図40Bに関連する
4つのPBMC試料および公開されたデータセットを使用して、切断関連変数/予測器の、提示されたHLAクラスIIエピトープの同定を増強する能力をベンチマークした。
結合潜在性および切断潜在性の両方を使用してペプチドの提示を予測する統合予測器を築くために、まず、図31Bに関して記載されているものと同じ手法を使用してデータセットを構築した。これは、ヒット対デコイの比1:19を使用することを意味し、デコイは、ヒットと長さを釣り合わせたものであり、少なくとも1つのヒットが生成された遺伝子のセットからランダムにサンプリングされたものである。3つの異なる目的のために異なるデータセットをこのように築いた:
1.溶媒露出度に基づく切断予測器および障害に基づく切断予測器に関しては、ヒト腫瘍組織からのHLAクラスIIリガンドームデータを使用してロジスティックモデルを当てはめた。リガンドーム実験において観察されたペプチドについては、首尾よくプロセシングされたに違いないことが推定された(ニューラルネットワークおよびCNNに基づく切断予測器に関しては、訓練用データを、下記の表において説明されている通り、同じデータセットを使用し、別個の様式で生成した)。
2.所与の切断予測器では結合単独に対して性能がブーストされるかどうかを評価するために、B721細胞およびKG1細胞を用いて生成した単一対立遺伝子MAPTAC(商標)データを使用してモデルを当てはめ、大多数の機能的にAPC様の細胞株を調べた。neonmhc2を使用して結合潜在性を算出し、ロジスティック回帰により前方予測において結合および切断変数に乗せられる相対的な重みを決定した。
3.前方予測の性能を評価するために、PBMC試料についてのデータセットおよび公開されたデータセットを前と同じ様式で構築した。しかし、これらの試料は複対立遺伝子であったので、各ペプチド候補ペプチドについての結合スコアを、各ドナーの遺伝子型によって示される1~4種のDR対立遺伝子の最大のスコア化のために取った。PPVを図31Bについて記載されている通り算出した。
いくつかの異なる切断予測器を評価した。
まず切断モデル、カット部分既知(ニューラルネットワーク)
MSにより観察されたカット部分からの切断シグナルを学習するために、腫瘍組織由来HLAクラスIIリガンドームにおけるU3からN3まで、およびC3からD3まで(「HLAクラスIIペプチドの観察された切断部位の特徴付け、図40Aに関連する」の節で導入された命名法を使用)の独特の6merのアミノ酸配列の全てを、それぞれN末端カットおよびC末端カットをモデル化する2つの別個のニューラルネットワークを訓練するための陽性例として使用した。前と同様に、同等数の独特の観察されていないN末端およびC末端カット部分(陰性例)を、そのコンテキストについてのプロテオームのアミノ酸頻度から、およびペプチドについてMSにより観察されたリガンドームから合成により生成した。アミノ酸配列を、neonmhc2に使用したものと同じ特色のサブセット、具体的には、タンパク質構造に基づくアミノ酸近接性、およびアミノ酸特性(例えば、酸性、脂肪族など)で符号化した。N末端およびC末端で観察されたカット部分モデルの各々について(lr=0.0005、Adam最適化器、損失関数としてバイナリ交差エントロピー)、次いで、全結合ニューラルネットワークを、ReLu活性化を用いた2つの隠れ層(1つの層に20個のニューロン、その後、次の層に10個のニューロン)を用いて訓練し、その後、最終的なシグモイド層を用いて訓練した。正則化のために、ドロップアウト率20%、L2ノルム0.001(C末端モデルについてのみ)、および最大ノルム制約4を使用した。
候補ペプチドをスコア化するために、N末端モデルをペプチドに対して6mer配列U3~N3に適用し、C末端モデルをC3~D3に適用した。N末端モデルおよびC末端モデルの両方を候補ペプチドにわたって6mer配列タイリングにも適用して、ペプチド自体内の配列の切断傾向を評価した。neonmhc2結合スコア、ならびに、N末端、C末端ならびにペプチド内のN末端およびC末端モデルの最大スコア化カット部分に対応する4つのニューラルネットワーク出力を使用してロジスティック回帰をMAPTAC(商標)データに対して訓練した。
まず切断モデル、カット部分未知(+/-15AA)(ニューラルネットワーク)
ペプチドの厳密な末端が分かっていない場合に、観察されたカット部分から学習した切断モデルが予測的であるかどうかを決定するために、上で学習した同じニューラルネットワークを、ペプチド末端を15アミノ酸越えて、拡張されたコンテキストに適用した。この場合の候補ペプチドをスコア化するために、3つの領域:N末端モデルを用いてスコア化した、ペプチドの15アミノ酸上流(真のN末端切断部位の位置にかかわらず)、N末端モデルおよびC末端モデルの両方を用いてスコア化したペプチド配列、およびC末端モデルを用いてスコア化した、ペプチドの15アミノ酸下流にわたって最大のスコアを算出した。neonmhc2結合スコアならびに4つの領域特異的スコア(ペプチド自体がN末端およびC末端モデルからの値の2つのセットに寄与するので)を使用してロジスティック回帰をMAPTAC(商標)データに対して訓練した。
まず結合モデル、溶媒露出度
SCRATCH suite内で、ACCpro20ツールを使用して、総体的な溶媒露出度を予測した。次いで、ペプチドの平均溶媒露出度スコアを考慮してペプチドがプロセシングされる可能性を、腫瘍組織データを使用してロジスティック回帰に当てはめた。最後に、neonmhc2結合スコアおよび腫瘍組織により訓練された予測器からの出力を使用してロジスティック回帰を単一対立遺伝子データに対して訓練した。
まず結合モデル、障害
配列障害の残基毎のスコアをプロテオーム全体にわたって決定し、当該位置を不規則と標識した予測エンジンの数に従って0~5の尺度でスコア化した(使用したサーバー:anchor、espritz-d、espritz-n、espritz-x、iupred-l、およびiupred-s)。各候補ペプチドにわたって平均障害スコアを算出し、6つの障害予測器の出力を合計した。溶媒露出度と同様に、まず、ロジスティックモデルを、この全体的な障害スコアを使用して腫瘍組織データに当てはめた。この後に、neonmhc2結合スコアおよび腫瘍組織により訓練された予測器からの出力を使用してロジスティック回帰の単一対立遺伝子データに対する訓練を行った。
ハイブリッドモデル、前駆体カットスキャン(+/-30AA)(CNN)
ヒットに対する訓練用データを、「まず切断、カット部分既知」切断予測器について記載されている通り、独特の6mer配列U3からN3まで、およびC3からD3までを使用する代わりに、ペプチドにフランキングする30アミノ酸(U30~U1、およびD1~D30)をモデル入力としたことを例外として生成した。さらに、30merの配列がN末端フランクに由来するのかC末端側フランクから由来するのかは区別せず、その代わりに、観察されたペプチドの両側に存在し得ると仮定された前駆体カットシグナルを学習させるために、データをプールして単一のモデルを訓練した。この状況では、合成デコイを使用する代わりに、同じ供給源遺伝子から引き出された観察されていないペプチド由来のフランキング配列を陰性例として使用した。配列を前と同様に、タンパク質構造に基づくアミノ酸近接性、およびアミノ酸特性(例えば、酸性の、脂肪族のなど)を使用して符号化した。CNNのアーキテクチャは、2つの畳み込み層、カーネルサイズが2であり、フィルターを48個有する第1の層と、その後の、カーネルサイズが3であり、フィルターを40個有する層とからなった。これらの層はReLu活性化を有した。畳み込み層の後にグローバル最大プーリング層が続き、その後、シグモイド活性化を用いる最終的な高密度層が続いた。CNNを学習率0.001で、Adam最適化およびバイナリ交差エントロピーを損失関数として用いて訓練した。
候補ペプチドをスコア化するために、CNNをペプチドの30アミノ酸上流および30アミノ酸下流に適用し、N末端フランキングスコアおよびC末端フランキングスコアを生じさせた。neonmhc2結合スコアおよび2つのCNNスコアを使用してロジスティック回帰をMAPTAC(商標)データに対して訓練した。
DQ重複
MSに基づくペプチド同定をBergseng et al., 2015からのHLA-DQリガンドームにわたってプールした。新しい候補ペプチドが前に観察されたペプチドのうちの1つと重複するかどうかを表す新しい特色を創出した。具体的には、以前に観察されたHLA-DQリガンドのセット内の任意のペプチドと少なくとも1つの9merを共有する場合には特色を1に設定し、他の場合には特色を0に設定した。neonmhc2結合スコアおよび重複特色を使用してロジスティック回帰を単一対立遺伝子データに対して訓練した。
統合された結合および切断モデルついても全てに図40Bにおけるものの代わりにNetMHCIIpanを結合予測器として使用して当てはめおよび評価を行った。
天然のドナー組織に対する予測の全体的な性能の評価、図21A~21Bに関連する
7体の健康なドナー由来の末梢血を、上の節「抗体に基づくHLA-ペプチド複合体の単離」に記載されている通り、DR特異的抗体を用いてプロファイリングした。訓練データセットおよび評価データセットを、図31Bとの関連で前に記載されているヒットおよびデコイ選択アルゴリズムを使用して構築した。手短に言えば、これは、各入れ子セットを1つのヒットペプチド(入れ子セット内で最も短いペプチド)で表すことおよび遺伝子にわたって長さを釣り合わせたデコイをタイリングすることを意味し、したがって、ヒットと最小に重複し、互いに最小に重複する。この状況では、デコイ選択はMSにより観察された遺伝子に制約されず、その代わりに、デコイを、プロテオーム全体から、元に戻すことなくランダムにサンプリングした。プロテオームにおけるHLA-DRにより提示されたペプチドの大まかな推定頻度を反映する、ヒットとデコイの率1:499を利用した。MHC結合スコア(NetMHCIIpanまたはneonmhc2からのもの)ならびに他の入力特色(発現、遺伝子の偏り、およびDQ重複)を用いたロジスティック回帰モデルをKG1細胞株およびB721細胞株からのMAPTAC(商標)データに対して訓練した。
以下の表15中の変数を回帰のサブセットに使用した。
Figure 2022518355000023
次いで、これらのモデルの天然のドナー組織(PBMC試料など)由来のHLA-DRリガンドームに対する性能を評価した。デコイを、入手可能なデコイ配列をほぼ飽和させるヒット対デコイの比1:499が実現されるように、プロテオームからランダムにサンプリングした(MSにより観察されたペプチドを決して産生しない遺伝子を含む)。ヒットとデコイの率1:499を評価(ならびに訓練)のために使用した。評価されたデータセット内のスコア化されたペプチドの上位0.2%を陽性コールとして標識し、PPVをヒットであった陽性コールの分率として算出した(例えば、図21Aおよび表15を参照されたい)。この評価シナリオでは、陽性の数はヒットの数と等しくなるように制約されるので、再現率はPPVと正確に等しいことに留意されたい。対立遺伝子にわたって一貫した1:499の比を適用することは、そうでなければ各ドナーについて観察されるヒットの数の影響を高度に受ける性能値の安定化に役立つ。ヒットの数はドナー細胞の内在性特性よりも実験条件に大きく関連すると仮定されたので、これは妥当であると思われた。
Figure 2022518355000024
DCにより提示された腫瘍ペプチドのSILACに基づく同定、図33Aに関連する
単球由来樹状細胞(mDC)を生成するために、CD14+単球を、健康ドナー末梢血単球(PBMC)から、ヒトCD14マイクロビーズを製造者のプロトコール(Miltenyi Biotec)の通り使用し、磁気分離によって単離した。単離された細胞を、800U/mlのrhGM-CSFおよび400U/mlのrhIL-4(CellGenix、Germany)を補充したCellGenix GMP DC培地中で6日間にわたって分化させた。K562細胞(ATCC、Manassas、VA)を、細胞培養物中、アミノ酸を伴う安定な同位元素標識を使用して同位体標識した(SILAC)。細胞を、重同位元素アミノ酸、L-リシン2HCl13C615N2(Life Technologies、Carlsbad、CA)およびL-ロイシン13C6(Life Technologies、Carlsbad、CA)を15%の熱失活透析ウシ胎仔血清(ThermoFisher)と共に含有するSILAC(ThermoFisher)についてRPMI 1640培地の存在下で5倍に成長させた。SILAC標識されたK562細胞を、60μMの次亜塩素酸(HOCl)を使用して以前に記載されている通り溶解させた、または室温で3時間にわたってUV処理してアポトーシスを誘導し、終夜静置した。7500万個のmDCをUV処理したSILAC標識K562細胞と1:3の比で、37℃で14時間共培養したか、またはHOClを用いて溶解させたK562と1:3の比で、37℃で10分間または5時間培養した。共培養後、プロテオミクス解析のために、細胞を回収し、ペレット化し、液体窒素で急速冷凍した。
DCにより提示された腫瘍ペプチドの予測および発現解析、図33Bおよび図21Cに関連する
重標識された(腫瘍由来)ペプチドの予測についてのPPVを算出するために、図33Bにおいて使用されているものと同じモデルおよび評価手法を使用した。K562細胞株についての発現を、ENCODE(encodeproject.org/experiments/ENCSR545DKY/;ライブラリーENCLB075GEKおよびENCLB365AUY;(ENCODE Project Consortium、2012))からのデータに基づいて決定した。樹状細胞についての発現をGSE116412(受託GSM3231102、GSM3231111、GSM3231121、GSM3231133、GSM3231145の平均)に基づいて決定した。
(実施例14)
トリプシンペプチドを用いたFAIMSのベンチマーキング
本実施例では、高磁場非対称波形イオン移動度分光分析(FAIMS)の使用のための標準のHLA-ペプチドームワークフローを記載する。A375細胞により内因性にプロセシングされ、提示されたHLAクラスIおよびHLAクラスIIペプチドを特徴付けた。ペプチドを酸性逆相(aRP)および塩基性逆相(bRP)オフライン分画の両方に供した後、FAIMS Proインターフェースを備えていない(-)および備えた(+)Thermo Scientific Orbitrap Fusion Lumos Tribrid質量分析計を使用してnLC-MS/MSによる分析を行った。図42Aに示されている図にワークフローが示されている。図42Bは、FAIMSによりトリプシン試料におけるペプチド検出が10ngの低さまで改善されることを示す結果を示す。FAIMSにより、MS1強度が低いにもかかわらずHLA-1およびHLAクラスIIペプチド検出がLC勾配全体を通して増大する(図43Aおよび図44A、それぞれHLA-1およびHLAクラスIIペプチドについてのデータ)。著しいことに、FAIMS評価を用いて、酸性および塩基性逆相試料において独特のペプチド検出の増大が観察される(図43B、および図44B、それぞれHLA-1およびHLAクラスIIペプチドについてのデータ)。この試験により、FAIMSを用いるとMS1強度が低いにもかかわらずHLAクラスIおよびHLAクラスIIペプチドの検出がLC勾配全体を通して増大することが示された。図45および図46(それぞれHLA-1およびHLAクラスIIペプチド)に示されている通り、オフライン分画とFAIMSを組み合わせることにより、HLAペプチドレパートリーの解析の深さが増大する。
(実施例15)
示差走査蛍光光度法(DSF)ペプチド交換アッセイ
ペプチド交換アッセイを以下の通り実施した:以下の試薬(表17)を組み合わせ、37℃で18時間にわたって混合した。
Figure 2022518355000025
次いで、PD minitrap G-25脱塩カラムを使用して緩衝剤を交換した。Syproオレンジ色色素(Fisher S6651)を100%DMSO中に1000×まで希釈した。100×のSyproオレンジ色色素のワーキングストック50μLを脱塩緩衝剤中に調製した。100×syproオレンジ色色素2μLおよび脱塩ペプチド交換試料18μLを384白色PCRマイクロプレートのウェルに移し、混合した。次いで、プレートを透明なプレートシーラーで覆い、プレートをRoche lightcycler 480において以下のプログラムに供した:(1)25℃まで加熱、10秒間保持する;(2)温度を99℃まで上昇させ、プレートを1℃当たり20回読み取る(3)温度を25℃まで下げ、10秒間保持する。次いで、融解温度を算出した。例示的な結果を以下の表18に示す。
Figure 2022518355000026

Claims (61)

  1. (a)複数の提示予測を生成するために、機械学習HLAペプチド提示予測モデルを使用して複数の候補ペプチド配列のアミノ酸情報を処理するステップであって、前記複数の候補ペプチド配列の各候補ペプチド配列が、対象のゲノムもしくはエクソーム、または前記対象における病原体もしくはウイルスによってコードされ、前記複数の提示予測が、前記複数の候補ペプチド配列の各々についてのHLA提示予測を含み、各HLA提示予測により、前記対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質により前記複数の候補ペプチド配列のうちの所与の候補ペプチド配列が提示され得る可能性が示され、
    前記機械学習HLAペプチド提示予測モデルが、訓練用細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された訓練用ペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、
    (b)少なくとも前記複数の提示予測に基づいて、前記複数のペプチド配列のうち、前記対象の細胞のクラスII HLA対立遺伝子によってコードされる前記1つまたは複数のタンパク質のうちの少なくとも1つによって提示されるペプチド配列を同定するステップと、
    を含み、前記機械学習HLAペプチド提示予測モデルの陽性適中率(PPV)が、提示PPV決定法に従うと少なくとも0.07である、方法。
  2. (a)複数の結合予測を生成するために、機械学習HLAペプチド結合予測モデルを使用して対象のゲノムまたはエクソームによってコードされる複数のペプチド配列のアミノ酸情報を処理するステップであって、前記複数の結合予測が、複数の候補ペプチド配列の各々についてのHLA結合予測を含み、各結合予測により、前記対象の細胞のクラスII HLA対立遺伝子によってコードされる1つまたは複数のタンパク質が前記複数の候補ペプチド配列のうちの所与の候補ペプチド配列に結合する可能性が示され、
    前記機械学習HLAペプチド結合予測モデルが、HLAクラスIIタンパク質またはHLAクラスIIタンパク質類似体に結合することが同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、
    (b)少なくとも前記複数の結合予測に基づいて、前記複数のペプチド配列のうち、前記対象の細胞のクラスII HLA対立遺伝子によってコードされる前記1つまたは複数のタンパク質のうちの少なくとも1つとの結合に関する閾値結合予測確率値よりも大きな確率を有するペプチド配列を同定するステップと
    を含み、
    前記機械学習HLAペプチド結合予測モデルの陽性適中率(PPV)が、結合PPV決定法に従うと少なくとも0.1である、方法。
  3. 前記機械学習HLAペプチド提示予測モデルが、訓練用細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された訓練用ペプチドの配列の配列情報を含む訓練用データを使用して訓練される、請求項2に記載の方法。
  4. 前記提示予測に基づいて、前記対象の細胞のクラスII HLA対立遺伝子によってコードされる前記1つまたは複数のタンパク質のうちの少なくとも1つによって提示されることが同定された少なくとも2つのペプチドに順位を付けることを含む、前記請求項のいずれか一項に記載の方法。
  5. 前記2つまたはそれよりも多くの順位付けされたペプチドのうちの1つまたは複数のペプチドを選択することを含む、前記請求項のいずれか一項に記載の方法。
  6. 前記対象の細胞のクラスII HLA対立遺伝子によってコードされる前記1つまたは複数のタンパク質のうちの少なくとも1つによって提示されることが同定された前記複数のうちの1つまたは複数のペプチドを選択することを含む、前記請求項のいずれか一項に記載の方法。
  7. 前記提示予測に基づいて順位付けされた2つまたはそれよりも多くのペプチドのうちの1つまたは複数のペプチドを選択することを含む、前記請求項のいずれか一項に記載の方法。
  8. 複数の試験ペプチド配列のアミノ酸情報を処理して、複数の試験提示予測を生成し、各試験提示予測により、前記対象の細胞のクラスII HLA対立遺伝子によってコードされる前記1つまたは複数のタンパク質により前記複数の試験ペプチド配列のうちの所与の試験ペプチド配列が提示され得る可能性が示される場合に、前記機械学習HLAペプチド提示予測モデルの陽性適中率(PPV)が少なくとも0.07であり、前記複数の試験ペプチド配列が、(i)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された少なくとも1つのヒットペプチド配列と、(ii)生物体のゲノムによってコードされるタンパク質内に含有される少なくとも499のデコイペプチド配列とを含む少なくとも500の試験ペプチド配列を含み、前記生物体と前記対象が同じ種であり、前記複数の試験ペプチド配列が、前記少なくとも1つのヒットペプチド配列と前記少なくとも499のデコイペプチド配列を1:499の比で含み、前記機械学習HLAペプチド提示予測モデルにより、前記複数の試験ペプチド配列の上位パーセンテージが、細胞において発現される前記HLAタンパク質によって提示されることが予測される、前記請求項のいずれか一項に記載の方法。
  9. 複数の試験ペプチド配列のアミノ酸情報を処理して、複数の試験結合予測を生成し、各試験結合予測により、前記対象の細胞のクラスII HLA対立遺伝子によってコードされる前記1つまたは複数のタンパク質が前記複数の試験ペプチド配列のうちの所与の試験ペプチド配列に結合する可能性が示される場合に、前記機械学習HLAペプチド提示予測モデルの陽性適中率(PPV)が少なくとも0.1であり、前記複数の試験ペプチド配列が、(i)細胞において発現されるHLAタンパク質によって提示されることが質量分析によって同定された少なくとも1つのヒットペプチド配列と、(ii)細胞において発現されるHLAタンパク質、例えば、細胞において発現される単一HLAタンパク質(例えば、単一対立遺伝子細胞)によって提示されることが質量分析によって同定された少なくとも1つのペプチド配列を含むタンパク質内に含有される少なくとも19のデコイペプチド配列とを含む少なくとも20の試験ペプチド配列を含み、前記複数の試験ペプチド配列が、前記少なくとも1つのヒットペプチド配列と前記少なくとも19のデコイペプチド配列を1:19の比で含み、前記機械学習HLAペプチド提示予測モデルにより、前記複数の試験ペプチド配列の上位パーセンテージが細胞において発現される前記HLAタンパク質に結合することが予測される、前記請求項のいずれか一項に記載の方法。
  10. 前記少なくとも1つのヒットペプチド配列と前記デコイペプチド配列の間にアミノ酸配列の重複が存在しない、前記請求項のいずれか一項に記載の方法。
  11. 前記機械学習HLAペプチド提示予測モデルの陽性適中率(PPV)が、少なくとも0.08、0.09、0.1、0.11、0.12、0.13、0.14、0.15、0.16、0.17、0.18、0.19、0.2、0.21、0.22、0.23、0.24、0.25、0.26、0.27、0.28、0.29、0.3、0.31、0.32、0.33、0.34、0.35、0.36、0.37、0.38、0.39、0.4、0.41、0.42、0.43、0.44、0.45、0.46、0.47、0.48、0.49、0.5、0.51、0.52、0.53、0.54、0.55、0.56、0.57、0.58、0.59、0.6、0.61、0.62、0.63、0.64、0.65、0.66、0.67、0.68、0.69、0.7、0.71、0.72、0.73、0.74、0.75、0.76、0.77、0.78、0.79、0.8、0.81、0.82、0.83、0.84、0.85、0.86、0.87、0.88、0.89、0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98または0.99である、請求項1から10のいずれか一項に記載の方法。
  12. 前記少なくとも1つのヒットペプチド配列が、少なくとも5、10、20、50または100のヒットペプチド配列を含む、請求項1および請求項3から11のいずれか一項に記載の方法。
  13. 前記少なくとも499のデコイペプチド配列が、少なくとも2500、5000、10000、25000、50000または100000のデコイペプチド配列を含む、請求項1および請求項3から12のいずれか一項に記載の方法。
  14. 前記少なくとも500の試験ペプチド配列が、少なくとも2500、5000、10000、25000、50000または100000の試験ペプチド配列を含む、請求項1および請求項3から13のいずれか一項に記載の方法。
  15. 前記上位パーセンテージが、上位0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.00%または2.00%である、請求項1および請求項3から14のいずれか一項に記載の方法。
  16. 前記少なくとも1つのヒットペプチド配列が、少なくとも5、10、20、50または100のヒットペプチド配列を含む、請求項2から11のいずれか一項に記載の方法。
  17. 前記少なくとも19のデコイペプチド配列が、少なくとも500、1000、2000、5000または10000のデコイペプチド配列を含む、請求項2から11および16のいずれか一項に記載の方法。
  18. 前記少なくとも20の試験ペプチド配列が、少なくともを含み、前記少なくとも500の試験ペプチド配列が、少なくとも500、1000、2000、5000または10000の試験ペプチド配列試験ペプチド配列を含む、請求項2から11、16および17のいずれか一項に記載の方法。
  19. 前記上位パーセンテージが、上位5%、6%、7%、8%、9%、10%、15%、または20%である、請求項2から11および16から18のいずれか一項に記載の方法。
  20. 前記PPVが、表11の対応するHLA対立遺伝子によってコードされるタンパク質についての表11の2列目のPPVよりも大きい、前記請求項のいずれか一項に記載の方法。
  21. 前記PPVが、HLAクラスII対立遺伝子によってコードされるタンパク質についての表16の2列目のPPVよりも大きい、前記請求項のいずれか一項に記載の方法。
  22. 前記対象が、単一の対象である、前記請求項のいずれか一項に記載の方法。
  23. 前記細胞が、前記対象の細胞のクラスII HLA対立遺伝子によってコードされる単一のタンパク質を発現する細胞である、前記請求項のいずれか一項に記載の方法。
  24. 前記細胞が、単一対立遺伝子HLA細胞またはアフィニティータグを有するHLA対立遺伝子を発現する細胞である、請求項1から23のいずれか一項に記載の方法。
  25. 前記複数のペプチド配列の各ペプチド配列が、がんに関連付けられる、前記請求項のいずれか一項に記載の方法。
  26. 前記複数のペプチド配列のうちの少なくとも1つのペプチド配列が、前記対象のがん細胞によって過剰発現される、前記請求項のいずれか一項に記載の方法。
  27. 前記複数のペプチド配列の各ペプチド配列が、前記対象のがん細胞によって過剰発現される、前記請求項のいずれか一項に記載の方法。
  28. 前記複数のペプチド配列のうちの少なくとも1つのペプチド配列が、がん細胞特異的ペプチドである、前記請求項のいずれか一項に記載の方法。
  29. 前記複数のペプチド配列の各ペプチド配列が、がん細胞特異的ペプチドである、前記請求項のいずれか一項に記載の方法。
  30. 前記複数のペプチド配列の各ペプチド配列が、前記対象のがん細胞によって発現される、前記請求項のいずれか一項に記載の方法。
  31. 前記複数のペプチド配列のうちの少なくとも1つのペプチド配列が、前記対象の非がん細胞によってコードされない、前記請求項のいずれか一項に記載の方法。
  32. 前記複数のペプチド配列の各ペプチド配列が、前記対象の非がん細胞によってコードされない、前記請求項のいずれか一項に記載の方法。
  33. 前記複数のペプチド配列のうちの少なくとも1つのペプチド配列が、前記対象の非がん細胞では発現されない、前記請求項のいずれか一項に記載の方法。
  34. 前記複数のペプチド配列の各ペプチド配列が、前記対象の非がん細胞では発現されない、前記請求項のいずれか一項に記載の方法。
  35. 前記対象の前記複数のペプチド配列を得ることを含む、前記請求項のいずれか一項に記載の方法。
  36. 前記対象の複数のポリヌクレオチド配列を得ることを含む、前記請求項のいずれか一項に記載の方法。
  37. 対象のゲノムまたはエクソームによってコードされる複数のペプチド配列をコードする前記対象の複数のポリヌクレオチド配列を得ることを含む、前記請求項のいずれか一項に記載の方法。
  38. 対象のゲノムまたはエクソームによってコードされる複数のペプチド配列をコードする前記対象の複数のポリヌクレオチド配列をコンピュータプロセッサによって得ることを含む、前記請求項のいずれか一項に記載の方法。
  39. 前記対象の複数のポリヌクレオチド配列をゲノム配列決定またはエクソーム配列決定によって得ることを含む、前記請求項のいずれか一項に記載の方法。
  40. 前記対象の複数のポリヌクレオチド配列を全ゲノム配列決定または全エクソーム配列決定によって得ることを含む、前記請求項のいずれか一項に記載の方法。
  41. 前記対象に、ペプチド配列の選択されたサブセットの1つまたは複数を含む組成物を投与するステップをさらに含む、前記請求項のいずれか一項に記載の方法。
  42. 前記HLAクラスIIタンパク質が、HLA-DRタンパク質、HLA-DQタンパク質、またはHLA-DPタンパク質を含む、前記請求項のいずれか一項に記載の方法。
  43. 前記HLAクラスIIタンパク質が、HLA-DPB101:01/HLA-DPA101:03、HLA-DPB102:01/HLA-DPA101:03、HLA-DPB103:01/HLA-DPA101:03、HLA-DPB104:01/HLA-DPA101:03、HLA-DPB104:02/HLA-DPA101:03、HLA-DPB106:01/HLA-DPA101:03、HLA-DQB102:01/HLA-DQA105:01、HLA-DQB102:02/HLA-DQA102:01、HLA-DQB106:02/HLA-DQA101:02、HLA-DQB106:04/HLA-DQA101:02、HLA-DRB101:01、HLA-DRB101:02、HLA-DRB103:01、HLA-DRB103:02、HLA-DRB104:01、HLA-DRB104:02、HLA-DRB104:03、HLA-DRB104:04、HLA-DRB104:05、HLA-DRB104:07、HLA-DRB107:01、HLA-DRB108:01、HLA-DRB108:02、HLA-DRB108:03、HLA-DRB108:04、HLA-DRB109:01、HLA-DRB110:01、HLA-DRB111:01、HLA-DRB111:02、HLA-DRB111:04、HLA-DRB112:01、HLA-DRB112:02、HLA-DRB113:01、HLA-DRB113:02、HLA-DRB113:03、HLA-DRB114:01、HLA-DRB115:01、HLA-DRB115:02、HLA-DRB115:03、HLA-DRB116:01、HLA-DRB301:01、HLA-DRB302:02、HLA-DRB303:01、HLA-DRB401:01およびHLA-DRB501:01;DPA01:03/DPB04:01、DRB101:01、DRB101:02、DRB103:01、DRB104:01、DRB104:02、DRB104:04、DRB104:05、DRB107:01、DRB108:01、DRB108:02、DRB108:03、DRB109:01、DRB111:01、DRB111:02、DRB111:04、DRB112:01、DRB113:01、DRB113:02、DRB113:03、DRB114:01、DRB115:01、DRB115:02、DRB115:03、DRB116:02、DRB301:01、DRB302:01、DRB302:02、DRB303:01、DRB401:01、DRB401:03およびDRB501:01からなる群から選択されるHLA-DRタンパク質;DPB101:01、DPB102:01、DPB102:02、DPB103:01、DPB104:01、DPB104:02、DPB105:01、DPB106:01、DPB111:01、DPB113:01、DPB117:01からなる群から選択されるHLA-DPタンパク質;またはA101:01+B105:01、A101:02+B106:02、A101:02+B106:04、A101:03+B106:03、A102:01+B102:02、A102:01+B103:03、A103:01+B103:02、A103:03+B103:01、A105:01+B102:01およびA105:05+B103:01からなる群から選択されるHLA-DQタンパク質複合体、
    からなる群から選択される、前記請求項のいずれか一項に記載の方法。
  44. 前記HLAタンパク質によって提示されるペプチドの長さが、15~40アミノ酸である、前記請求項のいずれか一項に記載の方法。
  45. 個別化がん治療が、アジュバントをさらに含む、前記請求項のいずれか一項に記載の方法。
  46. 前記個別化がん治療が、免疫チェックポイント阻害剤をさらに含む、前記請求項のいずれか一項に記載の方法。
  47. 対象に対する免疫治療のためのHLAクラスII特異的ペプチドを同定する方法であって、
    (a)コンピュータプロセッサにより、エピトープを含む候補ペプチド、およびそれぞれが前記エピトープを含む複数のペプチド配列を得るステップと、
    (b)免疫細胞に対する前記複数のペプチド配列の各々についての提示予測を生成するために、コンピュータプロセッサにより、機械学習HLA-ペプチド提示予測モデルを使用して前記複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、HLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質により前記複数のペプチド配列のうちの所与のペプチド配列が提示され得る可能性が示され、前記機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練される、ステップと、
    (c)前記対象の細胞の前記HLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質から、前記候補ペプチドに結合することが前記機械学習HLA-ペプチド提示予測モデルによって予測されたタンパク質を選択するステップであって、前記タンパク質が、免疫細胞に対する前記候補ペプチドの提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、
    (d)前記候補ペプチドを前記選択されたタンパク質と接触させ、したがって、前記候補ペプチドを、前記選択されたタンパク質と会合したプレースホルダーペプチドと競合させるステップと、
    (e)前記候補ペプチドが前記プレースホルダーペプチドに置き換わるかどうかに基づいて、前記候補ペプチドを前記選択されたタンパク質に特異的な免疫治療のためのペプチドとして同定するステップと
    を含む方法。
  48. MHCクラスII結合性ペプチドの免疫原性をアッセイするための方法であって、
    (a)前記MHCクラスII結合性ペプチドに結合することが機械学習HLA-ペプチド提示予測モデルによって予測された、HLAクラスII対立遺伝子によってコードされるタンパク質を選択するステップであって、前記機械学習HLA-ペプチド提示予測モデルが、所与のペプチド配列についての提示予測を生成するように構成されており、前記提示予測により、前記HLAクラスII対立遺伝子によってコードされる1つまたは複数のタンパク質により前記所与のペプチド配列が提示され得る可能性が示され、前記タンパク質が、前記MHCクラスII結合性ペプチドの提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、
    (b)前記ペプチドを前記選択されたタンパク質と接触させ、したがって、前記ペプチドを、前記選択されたタンパク質と会合したプレースホルダーペプチドと競合させ、前記プレースホルダーペプチドを置き換え、それにより、前記HLAクラスIIタンパク質と前記MHCクラスII結合性ペプチドとを含む複合体を形成するステップと、
    (c)前記複合体をCD4+ T細胞と接触させるステップと、
    (d)サイトカインの誘導、ケモカインの誘導、および細胞表面マーカーの発現からなる群から選択されるCD4+ T細胞の活性化パラメータの1つまたは複数についてアッセイするステップと
    を含む方法。
  49. がん免疫治療のために対象におけるCD4+ T細胞活性化を誘導するための方法であって、
    (a)がんに関連付けられ、がん変異を含むペプチド配列を同定するステップであって、前記ペプチド配列の同定が、前記対象のがん細胞由来のDNA、RNA、またはタンパク質配列を前記対象の正常細胞由来のDNA、RNA、またはタンパク質配列と比較することを含む、ステップと、
    (b)前記対象の細胞によって通常発現され、前記ペプチドに結合することが機械学習HLA-ペプチド提示予測モデルによって予測された、HLAクラスII対立遺伝子によってコードされるタンパク質を選択するステップであって、前記予測モデルの陽性適中率が、少なくとも0.1%、0.1%~50%または最大で50%の再現率で少なくとも0.1であり、前記タンパク質が、前記同定されたペプチド配列の提示についての提示予測確率値の閾値よりも大きな確率を有する、ステップと、
    (c)前記同定されたペプチドを、前記選択された、前記HLAクラスII対立遺伝子によってコードされるタンパク質と接触させて、前記同定されたペプチドが、500nM未満のIC50値で、前記選択された、前記HLAクラスII対立遺伝子によってコードされるタンパク質と会合したプレースホルダーペプチドと競合して前記プレースホルダーペプチドに置き換わるかどうかを検証するステップと、
    (d)必要に応じて、前記同定されたペプチドを精製するステップと、
    (e)前記同定されたペプチドの配列を含むポリペプチドまたは前記ポリペプチドをコードするポリヌクレオチドを前記対象に有効量で投与するステップと
    を含む方法。
  50. ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、
    (a)コンピュータプロセッサにより、前記ポリペプチド配列の複数のペプチド配列を得るステップと、
    (b)前記複数のペプチド配列の各々についての提示予測を生成するために、コンピュータプロセッサにより、機械学習HLA-ペプチド提示予測モデルを使用して前記複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、前記対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により前記複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、前記機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質に関連する配列情報を含む訓練用データを使用して訓練される、ステップと、
    (c)前記複数の提示予測に基づいて、前記ポリペプチド配列の前記複数のペプチド配列の各々が前記対象に対して免疫原性ではないことを決定または予測するステップと、
    (d)前記対象に、前記薬物を含む組成物を投与するステップと
    を含む方法。
  51. 4つの個々のHLAタンパク質アルファ1およびベータ1ヘテロ二量体をコンジュゲートすることによってHLAクラスII四量体を製造するための方法であって、
    (a)真核細胞において、HLAタンパク質のアルファ鎖およびベータ鎖をコードする核酸配列、分泌シグナル、ビオチン化モチーフおよび同定用または精製用の少なくとも1つのタグを含むベクターを発現させ、したがって、各HLAタンパク質アルファ1およびベータ1ヘテロ二量体を、二量体を形成した状態で分泌させるステップであって、前記ヘテロ二量体が、プレースホルダーペプチドと会合している、ステップと、
    (b)前記分泌されたヘテロ二量体を細胞培地から精製するステップと、
    (c)ペプチド交換アッセイを使用して前記ペプチド結合活性を検証するステップと、
    (d)ストレプトアビジンを添加し、それにより、ヘテロ二量体をコンジュゲートして四量体にするステップと、
    (e)前記四量体を精製し、1mg/Lを超える収量を得るステップと
    を含む方法。
  52. HLA-DRヘテロ二量体、またはHLA-DPヘテロ二量体、またはHLA-DQヘテロ二量体のいずれかを含むHLAクラスII四量体または多量体であって、各ヘテロ二量体がアルファ鎖とベータ鎖とを含み、前記ヘテロ二量体が精製されており、1mg/Lを超える濃度で存在する、HLAクラスII四量体または多量体。
  53. HLAタンパク質が、HLA-DPB101:01/HLA-DPA101:03、HLA-DPB102:01/HLA-DPA101:03、HLA-DPB103:01/HLA-DPA101:03、HLA-DPB104:01/HLA-DPA101:03、HLA-DPB104:02/HLA-DPA101:03、HLA-DPB106:01/HLA-DPA101:03、HLA-DQB102:01/HLA-DQA105:01、HLA-DQB102:02/HLA-DQA102:01、HLA-DQB106:02/HLA-DQA101:02、HLA-DQB106:04/HLA-DQA101:02、HLA-DRB101:01、HLA-DRB101:02、HLA-DRB103:01、HLA-DRB103:02、HLA-DRB104:01、HLA-DRB104:02、HLA-DRB104:03、HLA-DRB104:04、HLA-DRB104:05、HLA-DRB104:07、HLA-DRB107:01、HLA-DRB108:01、HLA-DRB108:02、HLA-DRB108:03、HLA-DRB108:04、HLA-DRB109:01、HLA-DRB110:01、HLA-DRB111:01、HLA-DRB111:02、HLA-DRB111:04、HLA-DRB112:01、HLA-DRB112:02、HLA-DRB113:01、HLA-DRB113:02、HLA-DRB113:03、HLA-DRB114:01、HLA-DRB115:01、HLA-DRB115:02、HLA-DRB115:03、HLA-DRB116:01、HLA-DRB301:01、HLA-DRB302:02、HLA-DRB303:01、HLA-DRB401:01およびHLA-DRB501:01からなる群から選択されるHLAクラスIIタンパク質である、請求項52に記載のHLAクラスII四量体または多量体。
  54. 前記請求項のいずれか一項のHLAタンパク質のアルファ鎖およびベータ鎖をコードする核酸配列、分泌シグナル、ビオチン化モチーフおよび同定用または精製用の少なくとも1つのタグを含み、したがって、各HLAタンパク質アルファ1およびベータ1ヘテロ二量体を、二量体を形成した状態で分泌させるベクターであって、必要に応じて、前記分泌されるヘテロ二量体が、プレースホルダーペプチドと会合している、ベクター。
  55. 請求項54に記載のベクターを含む細胞。
  56. ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、
    (a)コンピュータプロセッサにより、前記ポリペプチド配列の複数のペプチド配列を得るステップと、
    (b)前記複数のペプチド配列の各々についての提示予測を生成するために、コンピュータプロセッサにより、機械学習HLA-ペプチド提示予測モデルを使用して前記複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、前記対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により前記複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、前記機械学習HLA-ペプチド提示予測モデルが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報を含む訓練用データを使用して訓練されるステップと、
    (c)前記複数の提示予測に基づいて、前記ポリペプチド配列の複数のペプチド配列のうちの少なくとも1つが前記対象に対して免疫原性であることを決定または予測するステップと
    を含む方法。
  57. ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、
    (a)コンピュータプロセッサを使用して前記ポリペプチド配列のペプチド配列のアミノ酸情報を機械学習HLA-ペプチド提示予測モデルに入力して、前記ペプチド配列についての提示予測のセットを生成するステップであって、各提示予測により、前記対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により所与のペプチド配列のエピトープ配列が提示される確率が示され、前記機械学習HLA-ペプチド提示予測モデルが、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、前記訓練用データが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;アミノ酸位置情報を含む訓練用ペプチド配列情報であって、前記細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られた前記アミノ酸位置情報と前記アミノ酸位置情報および前記予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む、ステップと、
    (b)前記提示予測のセットに基づいて、前記ポリペプチド配列のペプチド配列の各々が前記対象に対して免疫原性ではないことを決定または予測するステップと、
    (c)前記対象に、前記薬物を含む組成物を投与するステップと
    を含む方法。
  58. ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、
    (a)コンピュータプロセッサを使用して前記ポリペプチド配列のペプチド配列のアミノ酸情報を機械学習HLA-ペプチド提示予測モデルに入力して、前記ペプチド配列についての提示予測のセットを生成するステップであって、各提示予測により、前記対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により所与のペプチド配列のエピトープ配列が提示される確率が示され、前記機械学習HLA-ペプチド提示予測モデルが、少なくとも訓練用データに基づいて同定された複数の予測変数を含み、前記訓練用データが、細胞において発現されるHLAタンパク質によって提示され、質量分析によって同定されたペプチドの配列の配列情報;アミノ酸位置情報を含む訓練用ペプチド配列情報であって、前記細胞において発現されるHLAタンパク質に関連付けられる、訓練用ペプチド配列情報;ならびに、入力として受け取られた前記アミノ酸位置情報と前記アミノ酸位置情報および前記予測変数に基づいて出力として生成された提示可能性との関係を表す関数を含む、ステップと、
    (b)前記提示予測のセットに基づいて、前記ポリペプチド配列のペプチド配列のうちの少なくとも1つが前記対象に対して免疫原性であることを決定または予測するステップと
    を含む方法。
  59. ポリペプチド配列を含む薬物を対象における免疫原性についてスクリーニングする方法であって、
    (a)コンピュータプロセッサにより、前記ポリペプチド配列の複数のペプチド配列を得るステップと、
    (b)前記複数のペプチド配列の各々についての提示予測を生成するために、コンピュータプロセッサにより、機械学習HLA-ペプチド提示予測モデルを使用して前記複数のペプチド配列のアミノ酸情報を処理するステップであって、各提示予測により、前記対象の細胞のクラスIまたはクラスII MHC対立遺伝子によってコードされる1つまたは複数のタンパク質により前記複数のペプチド配列のうちの所与のペプチド配列のエピトープ配列が提示され得る可能性が示され、前記機械学習HLA-ペプチド提示予測モデルが、前記細胞において発現されるHLAタンパク質に関連する配列情報を含む訓練用データを使用して訓練されるステップと、
    (c)前記複数の提示予測に基づいて、前記ポリペプチド配列の前記複数のペプチド配列の各々が前記対象に対して免疫原性ではないことを決定または予測するステップと、
    (d)前記対象に、前記薬物を含む組成物を投与するステップと
    を含む方法。
  60. 自己免疫疾患または状態を有する対象を処置する方法であって、
    (a)前記対象の細胞のクラスIまたはクラスII MHCによって提示される発現されたタンパク質のエピトープを同定または予測するステップであって、前記同定または予測されたエピトープと前記クラスIまたはクラスII MHCとを含む複合体が、前記対象のCD8 T細胞またはCD4 T細胞の標的とされる、ステップと、
    (b)前記複合体に結合するT細胞受容体(TCR)を同定するステップと、
    (c)前記TCRを前記対象由来の調節性T細胞または同種異系の調節性T細胞において発現させるステップと、
    (d)前記TCRを発現する前記調節性T細胞を前記対象に投与するステップと
    を含む方法。
  61. 自己免疫疾患または状態を有する対象を処置する方法であって、前記対象に、(i)前記対象の細胞のクラスIまたはクラスII MHCによって提示されることが同定または予測された発現されたタンパク質のエピトープと(ii)前記クラスIまたはクラスII MHCとを含む複合体であって、前記対象のCD8T細胞またはCD4 T細胞の標的とされる、複合体に結合するT細胞受容体(TCR)を発現する調節性T細胞を投与するステップを含む方法。
JP2021536205A 2018-12-21 2019-12-20 Hlaクラスii特異的エピトープの予測およびcd4+ t細胞の特徴付けのための方法およびシステム Active JP7236543B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023028268A JP7531009B2 (ja) 2018-12-21 2023-02-27 Hlaクラスii特異的エピトープの予測およびcd4+ t細胞の特徴付けのための方法およびシステム

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201862783914P 2018-12-21 2018-12-21
US62/783,914 2018-12-21
US201962826827P 2019-03-29 2019-03-29
US62/826,827 2019-03-29
US201962855379P 2019-05-31 2019-05-31
US62/855,379 2019-05-31
US201962891101P 2019-08-23 2019-08-23
US62/891,101 2019-08-23
PCT/US2019/068084 WO2020132586A1 (en) 2018-12-21 2019-12-20 Method and systems for prediction of hla class ii-specific epitopes and characterization of cd4+ t cells

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023028268A Division JP7531009B2 (ja) 2018-12-21 2023-02-27 Hlaクラスii特異的エピトープの予測およびcd4+ t細胞の特徴付けのための方法およびシステム

Publications (3)

Publication Number Publication Date
JP2022518355A true JP2022518355A (ja) 2022-03-15
JPWO2020132586A5 JPWO2020132586A5 (ja) 2022-12-28
JP7236543B2 JP7236543B2 (ja) 2023-03-09

Family

ID=71101917

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021536205A Active JP7236543B2 (ja) 2018-12-21 2019-12-20 Hlaクラスii特異的エピトープの予測およびcd4+ t細胞の特徴付けのための方法およびシステム
JP2023028268A Active JP7531009B2 (ja) 2018-12-21 2023-02-27 Hlaクラスii特異的エピトープの予測およびcd4+ t細胞の特徴付けのための方法およびシステム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023028268A Active JP7531009B2 (ja) 2018-12-21 2023-02-27 Hlaクラスii特異的エピトープの予測およびcd4+ t細胞の特徴付けのための方法およびシステム

Country Status (12)

Country Link
US (2) US11183272B2 (ja)
EP (1) EP3899954A4 (ja)
JP (2) JP7236543B2 (ja)
KR (2) KR20240091046A (ja)
CN (1) CN113474840A (ja)
AU (1) AU2019404547A1 (ja)
BR (1) BR112021012278A2 (ja)
CA (1) CA3124457A1 (ja)
IL (1) IL284195A (ja)
MX (1) MX2021007556A (ja)
SG (1) SG11202106678PA (ja)
WO (1) WO2020132586A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3053133A1 (en) * 2017-02-12 2018-08-16 Neon Therapeutics, Inc. Hla-based methods and compositions and uses thereof
US11176429B2 (en) * 2019-05-13 2021-11-16 International Business Machines Corporation Counter rare training date for artificial intelligence
WO2020242765A1 (en) 2019-05-31 2020-12-03 Rubryc Therapeutics, Inc. Meso-scale engineered peptides and methods of selecting
AU2021283380A1 (en) * 2020-06-03 2023-01-05 Alexis Bio, Inc. Selection and monitoring methods for xenotransplantation
WO2021257879A1 (en) * 2020-06-18 2021-12-23 Personalis Inc. Machine-learning techniques for predicting surface-presenting peptides
WO2022043881A1 (en) * 2020-08-28 2022-03-03 Immunitybio, Inc. Computerized tool for prediction of proteasomal cleavage
US11403316B2 (en) 2020-11-23 2022-08-02 Peptilogics, Inc. Generating enhanced graphical user interfaces for presentation of anti-infective design spaces for selecting drug candidates
US20240096443A1 (en) * 2020-12-01 2024-03-21 Ibio, Inc. Generalized Scaffolds for Polypeptide Display and Uses Thereof
WO2022121973A1 (zh) * 2020-12-09 2022-06-16 江苏恒瑞医药股份有限公司 基于机器学习的肽免疫原性预测、鉴别系统及方法
EP4315338A1 (en) * 2021-03-25 2024-02-07 Genentech, Inc. Using neural networks to predict peptide immunogenicity
US11512345B1 (en) 2021-05-07 2022-11-29 Peptilogics, Inc. Methods and apparatuses for generating peptides by synthesizing a portion of a design space to identify peptides having non-canonical amino acids
CN113724787B (zh) * 2021-07-28 2024-05-03 扬州大学 一种基于核心-附件结构的蛋白质复合物识别方法
CN113807468B (zh) * 2021-10-15 2022-05-27 南京澄实生物科技有限公司 基于多模态深度编码的hla抗原呈递预测方法和系统
CN113936748B (zh) * 2021-11-17 2024-08-20 西安电子科技大学 基于集成学习的分子识别特征功能预测方法
CN114446385B (zh) * 2022-01-29 2024-08-13 杭州纽安津生物科技有限公司 Hla ii型分子与多肽的亲和力预测模型的获取方法及装置
WO2023164425A1 (en) * 2022-02-22 2023-08-31 The Children's Hospital Of Philadelphia Systems and methods for generating chimeric major histocompatibility complex (mhc) molecules with desired peptide-binding specificities
AU2023245692A1 (en) * 2022-03-29 2024-10-17 Ahead Intelligence Ltd. Methods and devices of processing cytometric data
WO2023225207A2 (en) * 2022-05-19 2023-11-23 Biontech Us Inc. Method and systems for prediction of hla class ii-specific epitopes and characterization of cd4+ t cells
WO2024015892A1 (en) * 2022-07-13 2024-01-18 The Broad Institute, Inc. Hla-ii immunopeptidome methods and systems for antigen discovery
CN114913939B (zh) * 2022-07-19 2022-11-15 北京科技大学 高通量平台和机器学习优化的药物组合设计方法及装置
CN115331728B (zh) * 2022-08-12 2023-06-30 杭州力文所生物科技有限公司 一种稳定折叠的富含二硫键的多肽设计方法及其电子设备
WO2024036308A1 (en) * 2022-08-12 2024-02-15 Biontech Us Inc. Methods and systems for prediction of hla epitopes
CN115333735B (zh) * 2022-10-11 2023-03-14 浙江御安信息技术有限公司 一种数据的安全传输方法
WO2024115638A1 (en) 2022-12-01 2024-06-06 Immunewatch Bv Method to evaluate the conspicuousness of an epitope towards the repertoire of t-cell receptors
WO2024192143A1 (en) * 2023-03-13 2024-09-19 Gritstone Bio, Inc. Epitope prediction via a learned genotype network across class ii mhc alleles
WO2024194208A1 (en) * 2023-03-17 2024-09-26 Achilles Therapeutics Uk Limited Prediction of immunogenicity
CN116469457B (zh) * 2023-06-14 2023-10-13 普瑞基准科技(北京)有限公司 Mhc与抗原多肽结合、呈递及免疫原性的预测模型训练方法和装置
CN118248214A (zh) * 2024-02-01 2024-06-25 南方海洋科学与工程广东省实验室(珠海) 一种高置信的肠道菌群单氨基酸突变鉴定方法及其应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090130134A1 (en) * 2005-02-07 2009-05-21 Veronique Pancre T CD4+ Epitopes of Type I and II Latency Antigens of the Epstein-Barr Virus, Which Can Be Recognized by the majority of individuals in the caucasian populations and applications thereof
WO2016128060A1 (en) * 2015-02-12 2016-08-18 Biontech Ag Predicting t cell epitopes useful for vaccination
JP2017018129A (ja) * 2011-05-24 2017-01-26 バイオンテック アーゲー 癌の個別化ワクチン
US20170212984A1 (en) * 2015-12-16 2017-07-27 Gritstone Oncology, Inc. Neoantigen Identification, Manufacture, and Use
WO2017184590A1 (en) * 2016-04-18 2017-10-26 The Broad Institute Inc. Improved hla epitope prediction
JP2020518083A (ja) * 2017-03-31 2020-06-18 ヤン、ペイ−ジア 免疫原性がん特異的エピトープのためのランク付けシステム

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5833975A (en) 1989-03-08 1998-11-10 Virogenetics Corporation Canarypox virus expressing cytokine and/or tumor-associated antigen DNA sequence
US5766920A (en) 1982-08-11 1998-06-16 Cellcor, Inc. Ex vivo activation of immune cells
US4588585A (en) 1982-10-19 1986-05-13 Cetus Corporation Human recombinant cysteine depleted interferon-β muteins
US4703004A (en) 1984-01-24 1987-10-27 Immunex Corporation Synthesis of protein with an identification peptide
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
AU7873187A (en) 1986-08-08 1988-02-24 University Of Minnesota Method of culturing leukocytes
US4851341A (en) 1986-12-19 1989-07-25 Immunex Corporation Immunoaffinity purification system
CA1341245C (en) 1988-01-12 2001-06-05 F. Hoffmann-La Roche Ag Recombinant vaccinia virus mva
US5906936A (en) 1988-05-04 1999-05-25 Yeda Research And Development Co. Ltd. Endowing lymphocytes with antibody specificity
US6780407B1 (en) 1989-03-08 2004-08-24 Aventis Pasteur Pox virus comprising DNA sequences encoding CEA and B7 antigen
US5126132A (en) 1989-08-21 1992-06-30 The United States Of America As Represented By The Department Of Health And Human Services Tumor infiltrating lymphocytes as a treatment modality for human cancer
US5728388A (en) 1989-10-03 1998-03-17 Terman; David S. Method of cancer treatment
US6309647B1 (en) 1999-07-15 2001-10-30 Aventis Pasteur Poxvirus—canine dispemper virus (CDV) or measles virus recombinants and compositions and methods employing the recombinants
US6277558B1 (en) 1990-11-30 2001-08-21 Kansas University Medical Center α-3 chain type IV collagen polynucleotides
US6753162B1 (en) 1991-03-07 2004-06-22 The General Hospital Corporation Targeted cytolysis of HIV-infected cells by chimeric CD4 receptor-bearing cells
US5851828A (en) 1991-03-07 1998-12-22 The General Hospital Corporation Targeted cytolysis of HIV-infected cells by chimeric CD4 receptor-bearing cells
US5912170A (en) 1991-03-07 1999-06-15 The General Hospital Corporation Redirection of cellular immunity by protein-tyrosine kinase chimeras
US6004811A (en) 1991-03-07 1999-12-21 The Massachussetts General Hospital Redirection of cellular immunity by protein tyrosine kinase chimeras
US5843728A (en) 1991-03-07 1998-12-01 The General Hospital Corporation Redirection of cellular immunity by receptor chimeras
JP3029135B2 (ja) 1991-04-23 2000-04-04 キヤノン株式会社 文字処理装置及び方法
IL104570A0 (en) 1992-03-18 1993-05-13 Yeda Res & Dev Chimeric genes and cells transformed therewith
US8211422B2 (en) 1992-03-18 2012-07-03 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Chimeric receptor genes and cells transformed therewith
DE4237113B4 (de) 1992-11-03 2006-10-12 "Iba Gmbh" Peptide und deren Fusionsproteine, Expressionsvektor und Verfahren zur Herstellung eines Fusionsproteins
US6991797B2 (en) 1993-07-02 2006-01-31 Statens Serum Institut M. tuberculosis antigens
DE69434520T3 (de) 1993-07-30 2009-10-15 Affymax, Inc., Palo Alto Biotinylierung von proteinen
AU7478394A (en) 1993-08-06 1995-02-28 Cytel Corporation Methods for (ex vivo) therapy using peptide-loaded antigen presenting cells for the activation of ctl
US5658785A (en) 1994-06-06 1997-08-19 Children's Hospital, Inc. Adeno-associated virus materials and methods
US6924128B2 (en) 1994-12-06 2005-08-02 Targeted Genetics Corporation Packaging cell lines for generation of high titers of recombinant AAV vectors
US5712149A (en) 1995-02-03 1998-01-27 Cell Genesys, Inc. Chimeric receptor molecules for delivery of co-stimulatory signals
US5635363A (en) 1995-02-28 1997-06-03 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for the detection, quantitation and purification of antigen-specific T cells
EP0814838B1 (en) 1995-03-08 2003-05-14 The Scripps Research Institute Antigen presenting system and activation of t-cells
US6013516A (en) 1995-10-06 2000-01-11 The Salk Institute For Biological Studies Vector and method of use for nucleic acid delivery to non-dividing cells
DE19781652T1 (de) 1996-03-13 1999-05-12 Analogic Corp Selbsteichendes Ringunterdrückungsfilter für die Computertomographie
US6156567A (en) 1996-07-03 2000-12-05 Merial Truncated transcriptionally active cytomegalovirus promoters
US6090393A (en) 1996-07-03 2000-07-18 Merial Recombinant canine adenoviruses, method for making and uses thereof
US7198784B2 (en) 1996-10-17 2007-04-03 Oxford Biomedica (Uk) Limited Retroviral vectors
CN1195863C (zh) 1996-10-17 2005-04-06 牛津生物医学(英国)有限公司 逆转录病毒载体
US7255862B1 (en) 1996-11-14 2007-08-14 Connaught Technology Corporation ALVAC/FIV constructs
US6194207B1 (en) 1997-01-31 2001-02-27 Hemosol Inc. Methods for the selective expansion of lymphocytes by in vitro cultivation
AU745049B2 (en) 1997-03-11 2002-03-07 Regents Of The University Of Minnesota DNA-based transposon system for the introduction of nucleic acid into DNA of a cell
CA2303768C (en) 1997-09-19 2009-11-24 The Trustees Of The University Of Pennsylvania Methods and vector constructs useful for production of recombinant aav
AU9397098A (en) 1997-09-19 1999-04-12 Trustees Of The University Of Pennsylvania, The Methods and cell line useful for production of recombinant adeno-associated viruses
GB9720465D0 (en) 1997-09-25 1997-11-26 Oxford Biomedica Ltd Dual-virus vectors
US6346415B1 (en) 1997-10-21 2002-02-12 Targeted Genetics Corporation Transcriptionally-activated AAV inverted terminal repeats (ITRS) for use with recombinant AAV vectors
US5994136A (en) 1997-12-12 1999-11-30 Cell Genesys, Inc. Method and means for producing high titer, safe, recombinant lentivirus vectors
US6953690B1 (en) 1998-03-20 2005-10-11 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
ES2340230T3 (es) 1998-11-10 2010-05-31 University Of North Carolina At Chapel Hill Vectores viricos y sus procedimientos de preparacion y administracion.
US7160682B2 (en) 1998-11-13 2007-01-09 Regents Of The University Of Minnesota Nucleic acid transfer vector for the introduction of nucleic acid into the DNA of a cell
US6258595B1 (en) 1999-03-18 2001-07-10 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
US6893865B1 (en) 1999-04-28 2005-05-17 Targeted Genetics Corporation Methods, compositions, and cells for encapsidating recombinant vectors in AAV particles
US6913922B1 (en) 1999-05-18 2005-07-05 Crucell Holland B.V. Serotype of adenovirus and uses thereof
US6492169B1 (en) 1999-05-18 2002-12-10 Crucell Holland, B.V. Complementing cell lines
US6793926B1 (en) 1999-05-27 2004-09-21 Genovo, Inc. Methods for production of a recombinant adeno-associated virus
DK1180159T3 (da) 1999-05-28 2008-11-17 Targeted Genetics Corp Fremgangsmåder og sammensætninger til at sænke niveauet af Tumor-Nekrose-Faktor (TNF) i TNF-associerede lidelser
US6955808B2 (en) 1999-09-24 2005-10-18 Uab Research Foundation Capsid-modified recombinant adenovirus and methods of use
US7115391B1 (en) 1999-10-01 2006-10-03 Genovo, Inc. Production of recombinant AAV using adenovirus comprising AAV rep/cap genes
AU785493B2 (en) 2000-03-27 2008-01-03 Technion Research & Development Foundation Ltd. Single chain class I major histo-compatibility complexes, constructs encoding same and methods of generating same
GB0024550D0 (ja) 2000-10-06 2000-11-22 Oxford Biomedica Ltd
CA2432172C (en) 2000-12-15 2009-01-20 Balwinder Singh Aulakh An in vivo method for producing female offsprings in mammals
GB0202334D0 (en) 2001-04-05 2002-03-20 Nextgen Sciences Ltd Protein analysis
CA2457652C (en) 2001-08-31 2012-08-07 Avidex Limited Soluble t cell receptor
WO2003089618A2 (en) 2002-04-22 2003-10-30 Regents Of The University Of Minnesota Transposon system and methods of use
JP4436319B2 (ja) 2002-10-09 2010-03-24 メディジーン リミテッド 単鎖組換えt細胞レセプター
EP2048159B1 (en) 2002-11-09 2014-01-01 Immunocore Ltd. T cell receptor display
GB0304068D0 (en) 2003-02-22 2003-03-26 Avidex Ltd Substances
US7985739B2 (en) 2003-06-04 2011-07-26 The Board Of Trustees Of The Leland Stanford Junior University Enhanced sleeping beauty transposon system and methods for using the same
NZ549731A (en) * 2004-03-01 2009-11-27 Peptimmune Inc Methods and compositions for treatment of autoimmune diseases
AR048035A1 (es) 2004-03-11 2006-03-22 Fresenius Kabi De Gmbh Conjugados de almidon de hidroxialquilo y una proteina, preparados por aminacion reductora
NZ550810A (en) 2004-05-19 2009-05-31 Immunocore Ltd High affinity NY-ESO T cell receptor
AU2005246073B2 (en) 2004-05-19 2010-10-28 Adaptimmune Limited Method of improving T cell receptors
WO2006000830A2 (en) 2004-06-29 2006-01-05 Avidex Ltd Cells expressing a modified t cell receptor
EP1858332A4 (en) 2005-02-16 2011-06-22 Lentigen Corp LENTIVIRUS VECTORS AND ITS USE
AR052741A1 (es) 2005-04-08 2007-03-28 Noxxon Pharma Ag Acidos nucleicos de union a ghrelin
WO2006125962A2 (en) 2005-05-25 2006-11-30 Medigene Limited T cell receptors which specifically bind to vygfvracl-hla-a24
GB2442048B (en) 2006-07-25 2009-09-30 Proimmune Ltd Biotinylated MHC complexes and their uses
US8088379B2 (en) 2006-09-26 2012-01-03 The United States Of America As Represented By The Department Of Health And Human Services Modified T cell receptors and related materials and methods
EP2087000A2 (en) 2006-09-29 2009-08-12 Immunocore Ltd. T cell therapies
CA2776241A1 (en) 2009-10-30 2011-05-05 Novozymes Biopharma Dk A/S Albumin variants
WO2011091319A2 (en) 2010-01-22 2011-07-28 Baylor Research Institute Dendritic cell vaccines
EP2575894B1 (en) 2010-05-28 2015-02-25 Oxford Biomedica (UK) Ltd Delivery of lentiviral vectors to the brain
SG190997A1 (en) 2010-12-09 2013-07-31 Univ Pennsylvania Use of chimeric antigen receptor-modified t cells to treat cancer
US8999937B2 (en) 2011-02-28 2015-04-07 Indiana University Research And Technology Corporation Glucocorticoid induced leucine zipper mimetics as therapeutic agents in multiple sclerosis
US20130071414A1 (en) 2011-04-27 2013-03-21 Gianpietro Dotti Engineered cd19-specific t lymphocytes that coexpress il-15 and an inducible caspase-9 based suicide gene for the treatment of b-cell malignancies
AU2012257377B2 (en) 2011-05-17 2017-09-07 Hadasit Medical Research Services And Development Ltd. Allogeneic tumor cell vaccination
US20120295960A1 (en) 2011-05-20 2012-11-22 Oxford Biomedica (Uk) Ltd. Treatment regimen for parkinson's disease
WO2012159643A1 (en) 2011-05-24 2012-11-29 Biontech Ag Individualized vaccines for cancer
PT2755997T (pt) 2011-09-15 2018-10-30 Us Health Recetores de célula t que reconhecem mage restrito a hlaa1 ou hla-cw7
US9751928B2 (en) 2012-05-03 2017-09-05 Fred Hutchinson Cancer Research Center Enhanced affinity T cell receptors and methods for making the same
RU2020108070A (ru) 2012-07-27 2020-03-16 Дзе Борд Оф Трастиз Оф Дзе Юниверсити Оф Иллинойс Конструирование t-клеточных рецепторов
GB2508414A (en) 2012-11-30 2014-06-04 Max Delbrueck Centrum Tumour specific T cell receptors (TCRs)
RS60759B1 (sr) 2013-02-26 2020-10-30 Memorial Sloan Kettering Cancer Center Sastavi i postupci za imunoterapiju
US11725237B2 (en) 2013-12-05 2023-08-15 The Broad Institute Inc. Polymorphic gene typing and somatic change detection using sequencing data
US20200182884A1 (en) 2016-06-27 2020-06-11 Juno Therapeutics, Inc. Method of identifying peptide epitopes, molecules that bind such epitopes and related uses
CA3053133A1 (en) * 2017-02-12 2018-08-16 Neon Therapeutics, Inc. Hla-based methods and compositions and uses thereof
CA3101310A1 (en) * 2018-03-12 2019-09-19 The Children's Hospital Of Philadelphia Methods and compositions for use of tumor self-antigens in adoptive immunotherapy

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090130134A1 (en) * 2005-02-07 2009-05-21 Veronique Pancre T CD4+ Epitopes of Type I and II Latency Antigens of the Epstein-Barr Virus, Which Can Be Recognized by the majority of individuals in the caucasian populations and applications thereof
JP2017018129A (ja) * 2011-05-24 2017-01-26 バイオンテック アーゲー 癌の個別化ワクチン
WO2016128060A1 (en) * 2015-02-12 2016-08-18 Biontech Ag Predicting t cell epitopes useful for vaccination
US20170212984A1 (en) * 2015-12-16 2017-07-27 Gritstone Oncology, Inc. Neoantigen Identification, Manufacture, and Use
WO2017184590A1 (en) * 2016-04-18 2017-10-26 The Broad Institute Inc. Improved hla epitope prediction
JP2020518083A (ja) * 2017-03-31 2020-06-18 ヤン、ペイ−ジア 免疫原性がん特異的エピトープのためのランク付けシステム

Also Published As

Publication number Publication date
CN113474840A (zh) 2021-10-01
WO2020132586A1 (en) 2020-06-25
MX2021007556A (es) 2021-09-10
JP7236543B2 (ja) 2023-03-09
JP2023071806A (ja) 2023-05-23
US20220199198A1 (en) 2022-06-23
JP7531009B2 (ja) 2024-08-08
KR20240091046A (ko) 2024-06-21
CA3124457A1 (en) 2020-06-25
SG11202106678PA (en) 2021-07-29
KR102670790B1 (ko) 2024-05-29
US11183272B2 (en) 2021-11-23
EP3899954A1 (en) 2021-10-27
EP3899954A4 (en) 2022-09-14
IL284195A (en) 2021-08-31
KR20210130705A (ko) 2021-11-01
US20200279616A1 (en) 2020-09-03
AU2019404547A1 (en) 2021-07-22
BR112021012278A2 (pt) 2021-12-14

Similar Documents

Publication Publication Date Title
JP7236543B2 (ja) Hlaクラスii特異的エピトープの予測およびcd4+ t細胞の特徴付けのための方法およびシステム
Joglekar et al. T cell antigen discovery via signaling and antigen-presenting bifunctional receptors
Bear et al. Biochemical and functional characterization of mutant KRAS epitopes validates this oncoprotein for immunological targeting
US20230041030A1 (en) Antigen-binding proteins targeting shared neoantigens
Pritchard et al. Exome sequencing to predict neoantigens in melanoma
Choi et al. Systematic discovery and validation of T cell targets directed against oncogenic KRAS mutations
Geng et al. Empty conformers of HLA-B preferentially bind CD8 and regulate CD8+ T cell function
TW201725265A (zh) 改善的組合物及用於新表位之病毒遞送的方法及其應用
Giannakopoulou et al. AT cell receptor targeting a recurrent driver mutation in FLT3 mediates elimination of primary human acute myeloid leukemia in vivo
DeVette et al. A pipeline for identification and validation of tumor-specific antigens in a mouse model of metastatic breast cancer
Lorente et al. Natural spleen cell ligandome in transporter antigen processing-deficient mice
RU2826261C2 (ru) Способ и системы для прогнозирования специфических для hla класса ii эпитопов и охарактеризации cd4+ t-клеток
Chandran et al. Immunogenicity of a public neoantigen derived from mutated PIK3CA
WO2023225207A2 (en) Method and systems for prediction of hla class ii-specific epitopes and characterization of cd4+ t cells
US20240277770A1 (en) Systems and methods to identify mhc-associated antigens for therapeutic intervention
WO2024036308A1 (en) Methods and systems for prediction of hla epitopes
US20240024439A1 (en) Administration of anti-tumor vaccines
US20240197878A1 (en) Personalized allogeneic immunotherapy
CN118318036A (zh) 识别mhc相关抗原以进行治疗干预的系统和方法
WO2024215872A1 (en) Human t cell receptors targeting tumor-enhanced splicing epitopes on hla-a*02:01 for small cell carcinoma
Khan et al. Identification and validation of targets for cancer immunotherapy: from the bench-to-bedside
CN118679522A (zh) 与mhc-肽靶标结合的抗原识别分子的脱靶预测方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221220

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230227

R150 Certificate of patent or registration of utility model

Ref document number: 7236543

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150