JP2024514757A - T細胞選択を再構成するための方法およびその使用 - Google Patents

T細胞選択を再構成するための方法およびその使用 Download PDF

Info

Publication number
JP2024514757A
JP2024514757A JP2023555495A JP2023555495A JP2024514757A JP 2024514757 A JP2024514757 A JP 2024514757A JP 2023555495 A JP2023555495 A JP 2023555495A JP 2023555495 A JP2023555495 A JP 2023555495A JP 2024514757 A JP2024514757 A JP 2024514757A
Authority
JP
Japan
Prior art keywords
gene
tcrβ
productive
recipient
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023555495A
Other languages
English (en)
Inventor
クリストリー,スコット
グリーンバーグ,ベンジャミン
コーウェル,リンゼイ
オストメイヤー,ジャレッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Texas System
Original Assignee
University of Texas System
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Texas System filed Critical University of Texas System
Publication of JP2024514757A publication Critical patent/JP2024514757A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Toxicology (AREA)
  • Zoology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本明細書では、T細胞選択およびB細胞選択を再構成する機械学習モデル、およびその使用法が提示される。本明細書で提示される方法は、自己免疫疾患または自己免疫障害を発症する危険性、臓器移植または細胞移植に由来する同種免疫を発症する危険性、臓器移植または細胞移植に由来する移植片対宿主病(GvHD)を発症する危険性、養子T細胞療法に由来する同種免疫を発症する危険性、キメラ抗原受容体(CAR)-T細胞療法に由来する同種免疫を発症する危険性を予測する方法および、対象における抗体薬の安全性を予測する方法を含む。本明細書ではまた、T細胞受容体p(TCRp)遺伝子を分類する方法、およびその使用法も提示される。提示される方法は、臓器ドナー/臓器レシピエント間の適合性を決定する方法、レシピエントにおける移植片対宿主病(GvHD)、急性GvHD(aGvHD)、慢性GvHD(cGvHD)、および対象におけるがんの再発を予測する方法を含む。【選択図】 図1A

Description

関連出願の相互参照
本出願は、35U.S.C.§119(e)の下における、2021年3月12日に出願された、米国仮出願第63/160,299号、および2021年11月1日に出願された、同第63/274,263号の優先権の利益を主張する。先行出願の開示は、本出願の開示の一部であると考えられ、本出願の開示における参照によりそれらの全体において本明細書に組み込まれる。
配列表の組込み
付属の配列表中の素材は、本出願における参照により本明細書に組み込まれる。ファイル名を、426871-000252_SL_ST25.txtとする、付属の配列表のテキストファイルは、2022年3月9日に作成され、17kbである。ファイルは、Windows OSを使用するコンピュータ上で、Microsoft Wordを使用して評価されうる。
T細胞は、ヒト免疫系のうちで、最も重要な細胞の1つであり、体内の適応免疫応答において、中心的な役割を果たす。T細胞受容体(TCR)は、T細胞が、どの抗原に結合し、それと相互作用しうるのかを定める、T細胞の表面上に見出されるタンパク質配列である。TCR遺伝子は、TCRが、どの抗原に結合しうるのかにかかわらずに創出され、したがって、発生期T細胞が、免疫寛容を構築するために、T細胞選択を経ることが不可欠である。例えば、T細胞選択時に、健常組織を攻撃しうるT細胞の発生を防止するように、一部のTCRが間引かれることは、重要である。ヒトは、天然で、T細胞の発生時における、TCR遺伝子の突然変異を介して、多種多様なTCRをもたらす。TCR遺伝子内の、この多様性は、体内の免疫系が、様々な異なる抗原に応答しうることを確実にする、健常免疫系にとって重要な因子である。しかし、T細胞発生時に産生される、大量のTCR遺伝子は、従来のツールを使用して、T細胞選択をシミュレートすることを困難とする。T細胞選択についての、より正確で、個体化されたモデルを作出するために、TCRが、T細胞選択後に存続するのか、存続しないのかを予測しうる機械学習システムを開発することが所望される。機械学習システムを使用して、他の細胞選択過程(例えば、B細胞選択)を予測し、予測を、様々な臨床適用において使用することもまた所望される。
免疫細胞受容体の配列は、免疫細胞が、免疫細胞選択(例えば、T細胞選択、B細胞選択など)に合格するのか、失格するのかを定める。免疫細胞が、免疫細胞選択に合格するのか、失格するのかを予測する方法に対する必要が満たされていない。例えば、機械学習システムにより実施される、このような方法には、免疫学の分野一般において、特に、自己免疫、同種免疫、および腫瘍免疫学の分野において、かなりの応用があるであろう。
ある実施形態は、免疫受容体鎖遺伝子を分類する方法であって、a)複数の遺伝子セグメントおよび体細胞変異を含む免疫受容体鎖遺伝子配列を得るステップ、b)複数の遺伝子セグメントまたは体細胞変異のうちの少なくとも1つを、アミノ酸配列へと翻訳するステップ、c)抗原認識が可能であるアミノ酸配列をコードする免疫受容体鎖遺伝子を、生産的免疫受容体鎖として同定するステップ、d)抗原認識が可能であるアミノ酸配列を伴わない免疫受容体鎖遺伝子を、非生産的免疫受容体鎖遺伝子として同定するステップ、e)非生産的として同定された免疫受容体鎖遺伝子を修復して、抗原認識が可能であるアミノ酸配列を有する修復免疫受容体鎖遺伝子を作出するステップ、およびf)免疫受容体鎖遺伝子を、生産的免疫受容体鎖遺伝子、または修復免疫受容体鎖遺伝子として分類し、これにより、免疫受容体鎖遺伝子を分類するステップを含む方法を提供する。
遺伝子セグメントは、バリアブル(variable)(V)遺伝子セグメント、ダイバーシティ(diversity)(D)遺伝子セグメント、ジョイニング(joining)(J)遺伝子セグメント、およびこれらの組合せからなる群から選択されうる。免疫受容体鎖遺伝子は、T細胞受容体(TCR)、TCRアルファ鎖(TCRα)、TCRベータ鎖(TCRβ)、TCRデルタ鎖(TCRδ)、TCRガンマ鎖(TCRγ)、B細胞受容体(BCR)、BCR軽鎖(BCRL)、BCR重鎖(BCRH)、免疫グロブリン軽鎖(IgL)、免疫グロブリン重鎖(IgH)、免疫グロブリンカッパ鎖(Igκ)、および免疫グロブリンラムダ鎖(Igλ)からなる群から選択されうる。例えば、免疫受容体鎖遺伝子は、TCRβ遺伝子でありうる。非生産的TCRβ遺伝子は、アウトオブフレームの遺伝子セグメントを伴うTCRβ遺伝子、または遺伝子セグメント間の体細胞接合部内の終止コドンを伴うTCRβ遺伝子でありうる。非生産的TCRβ遺伝子を修復するステップは、遺伝子セグメント間の体細胞接合部において、1つもしくは複数のヌクレオチドを付加もしくは除去して、遺伝子セグメントを、同じリーディングフレーム内に組み込み、かつ/または遺伝子セグメント間の体細胞領域内のヌクレオチドを突然変異させて、終止コドンを、アミノ酸へと転換することを含みうる。TCRβ遺伝子配列は、TCRβ遺伝子の相補性決定領域1(CDR1)配列、TCRβ遺伝子のCDR2配列、TCRβ遺伝子のCDR3配列、これらの組合せ、または完全TCRβ遺伝子の配列を含みうる。例えば、TCRβ遺伝子配列は、TCRβ遺伝子のCDR3配列でありうる。さらに、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸は、TCRβ遺伝子配列から除去されうる。TCRβ遺伝子配列を得るステップは、対象に由来する血液試料中のTCRβ遺伝子をシーケンシングすることを含みうる。血液試料は、末梢血単核細胞試料でありうる。TCRβ遺伝子配列を得るステップは、試料から、T細胞を単離することをさらに含みうる。T細胞を単離することは、細胞分取および/またはRNA発現を介しうる。T細胞は、非制御性T細胞でありうる。対象は、ヒトでありうる。
別の実施形態は、臓器ドナー/臓器レシピエント間の適合性を決定する方法であって、a)本明細書で記載される方法を使用して、臓器ドナーのT細胞受容体β(TCRβ)遺伝子、および臓器レシピエントのTCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ、b)ドナーにおける、生産的TCRβ遺伝子および修復TCRβ遺伝子の数を、レシピエントにおける、生産的TCRβ遺伝子の数と比較するステップ、およびc)臓器ドナーと適合性である、臓器レシピエントに由来するTCRβの割合を定量し、これにより、臓器ドナー/臓器レシピエント間の適合性を決定するステップを含む方法を提供する。
定量するステップは、ポスト・セレクション・フラクション(post selection fraction)PSFスコアの計算を含みうる。PSFスコアは、臓器レシピエントに由来する、適合性TCRβ遺伝子の数と、TCRβ遺伝子の総数との比でありうる。PSFスコアは、0~1の範囲でありうる。PSFスコアは、PSFレシピエントスコアである場合があり、この場合、PSFレシピエントスコアは、F生産的と、F総数との比であり、F総数は、F修復+F生産的であり、F生産的は、臓器レシピエントおよび臓器ドナーのいずれにおいても、生産的TCRβ遺伝子として同定されたTCRβ遺伝子の数であり、F修復は、臓器ドナーにおいて、修復TCRβ遺伝子として同定され、臓器レシピエントにおいて、生産的TCRβ遺伝子として同定された、TCRβ遺伝子の数である。PSFレシピエントが、ゼロであることは、臓器レシピエントにおいてシーケンシングされた、いかなるTCRβ遺伝子も、臓器ドナーと適合性でないことを指し示しうる。PSFレシピエントスコアが、1であることは、臓器レシピエントにおいてシーケンシングされた、全てのTCRβ遺伝子が、臓器ドナーと適合性であることを指し示しうる。PSFレシピエントスコアが、好適でない場合、臓器移植は、進むことができない。PSFレシピエントスコアが、好適である場合、臓器ドナーの臓器は、レシピエントへと移植されうる。TCRβ遺伝子配列は、TCRβ遺伝子のCDR3配列を含みうる。TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸は、除去されうる。
さらなる実施形態は、レシピエントにおける移植片対宿主病(GvHD)を予測する方法であって、a)本明細書で記載される方法を使用して、ドナーのT細胞受容体β(TCRβ)遺伝子、およびレシピエントのTCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ、b)レシピエントにおける、生産的TCRβ遺伝子および修復TCRβ遺伝子の数を、ドナーにおける、生産的TCRβ遺伝子の数と比較するステップ、およびc)レシピエントと適合性であるドナーに由来するTCRβの割合を定量し、これにより、レシピエントにおけるGvHDを予測するステップを含む方法を提供する。
GvHDは、急性GvHD(aGvHD)でありうる。臓器または細胞は、骨髄または造血幹細胞移植細胞でありうる。aGvHDを予測するステップは、レシピエントと適合性であるドナーに由来する生産的TCRβ遺伝子の数を定量することを含みうる。定量するステップは、ポスト・セレクション・フラクションPSFドナー-生産的スコアを計算することを含む場合があり、この場合、PSFドナー-生産的スコアは、F生産的と、F総数との比であり、F総数は、F修復+F生産的であり、F生産的は、ドナーおよびレシピエントのいずれにおいても、生産的TCRβ遺伝子として同定されたTCRβ遺伝子の数であり、F修復は、レシピエントにおいて、修復TCRβ遺伝子として同定され、ドナーにおいて、生産的TCRβ遺伝子として同定された、TCRβ遺伝子の数である。PSFドナー-生産的は、0~1の範囲でありうる。PSFドナー-生産的が、ゼロであることは、ドナーにおいてシーケンシングされた、いかなるTCRβ遺伝子も、レシピエントと適合性でないことを指し示しうる。PSFドナー-生産的スコアが、1であることは、ドナーにおいてシーケンシングされた、全てのTCRβ遺伝子が、レシピエントと適合性であることを指し示しうる。PSFドナー-生産的スコアが、好適でない場合、臓器移植または細胞移植は、進むことができない。PSFドナー-生産的スコアが、好適である場合、ドナーの臓器または細胞は、レシピエントへと移植されうる。TCRβ遺伝子配列は、TCRβ遺伝子のCDR3配列を含みうる。TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸は、除去されうる。
GvHDは、慢性GvHD(cGvHD)でありうる。臓器または細胞は、骨髄または造血幹細胞移植細胞でありうる。cGvHDを予測するステップは、レシピエントと適合性であるドナーに由来する修復TCRβ遺伝子の数を定量することを含みうる。定量するステップは、ポスト・セレクション・フラクションPSFドナー-修復スコアを計算することを含む場合があり、この場合、PSFドナー-修復スコアは、F生産的と、F総数との比であり、F総数は、F修復+F生産的であり、F生産的は、レシピエントにおいて、生産的TCRβ遺伝子として同定され、ドナーにおいて、修復として同定されたTCRβ遺伝子の数であり、F修復は、レシピエントおよびドナーのいずれにおいても、修復TCRβ遺伝子として同定されたTCRβ遺伝子の数である。PSFドナー-修復は、0~1の範囲でありうる。PSFドナー-修復が、ゼロであることは、ドナーにおいてシーケンシングされた、いかなるTCRβ遺伝子も、レシピエントと適合性でないことを指し示しうる。PSFドナー-修復スコアが、1であることはドナーにおいてシーケンシングされた、全てのTCRβ遺伝子が、レシピエントと適合性であることを指し示しうる。PSFドナー-修復スコアが、好適でない場合、臓器移植または細胞移植は、進むことができない。PSFドナー-修復スコアが、好適である場合、ドナーの臓器または細胞は、レシピエントへと移植されうる。TCRβ遺伝子配列は、TCRβ遺伝子のCDR3配列を含みうる。TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸は、除去されうる。
ある実施形態は、造血幹細胞レシピエントにおけるがんの再発を予測する方法であって、a)本明細書で記載される方法を使用して、造血幹細胞ドナーのT細胞受容体β(TCRβ)遺伝子、および造血幹細胞レシピエントのTCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ、b)造血幹細胞ドナー、および造血幹細胞レシピエントの両方における、修復TCRβ遺伝子の数を比較するステップ、およびc)造血幹細胞ドナーにおいて、造血幹細胞レシピエントにおいて見出されない、修復TCRβ遺伝子の数を定量し、これにより、造血幹細胞レシピエントにおけるがんの再発を予測するステップを含む方法を提供する。
造血幹細胞レシピエントは、がんを有する対象でありうる。造血幹細胞ドナーに由来し、造血幹細胞レシピエントにおいて存在しない修復TCRβ遺伝子は、造血幹細胞レシピエントにおけるがん細胞を認識するT細胞受容体(TCR)をもたらす可能性が高い場合がある。定量するステップは、造血幹細胞レシピエントと、造血幹細胞ドナーとの間で共通である修復TCRβ遺伝子の数を除外して、造血幹細胞ドナーにおいて、修復TCRβ遺伝子として同定されるTCRβ遺伝子の総数の割合であるf新規スコアを計算することを含みうる。造血幹細胞レシピエントと、造血幹細胞ドナーとの間のf新規スコアが小さいほど、がん再発の危険性は大きくなりうる。造血幹細胞レシピエントと、造血幹細胞ドナーとの間のf新規スコアが大きいほど、がん再発が生じない可能性は大きくなりうる。f新規スコアが、好適でない場合、臓器移植または細胞移植は、進むことができない。f新規スコアが、好適である場合、ドナーの臓器または細胞は、レシピエントへと移植されうる。TCRβ遺伝子配列は、TCRβ遺伝子のCDR3配列を含みうる。TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸は、除去されうる。がんは、白血病、リンパ腫、および血液悪性腫瘍からなる群から選択されうる。
ある実施形態は、免疫細胞が、免疫細胞受容体鎖(TCR)についての免疫細胞選択に合格するのか、失格するのかを予測する方法であって、複数の遺伝子セグメントを含む被験免疫細胞受容体鎖遺伝子を得るステップ;複数の遺伝子セグメントの各々について、被験免疫細胞受容体鎖遺伝子を、免疫細胞受容体のタンパク質配列へと翻訳するステップ;1つの遺伝子セグメントを数値的に表す遺伝子特徴を決定するステップ;免疫細胞受容体のタンパク質配列内に含まれる各アミノ酸について、1つのアミノ酸を数値的に表す特徴ベクトルを決定するステップ;ならびに複数の遺伝子セグメントの各々についての遺伝子特徴、免疫細胞受容体鎖のタンパク質配列内の、アミノ酸の各々についての特徴ベクトル、および機械学習システムの、1つまたは複数のモデルに含まれるトレーニング重みの数に基づき、免疫細胞受容体鎖についての選択予測を、機械学習システムにより決定するステップを含む方法を提供する。
免疫受容体鎖遺伝子は、T細胞受容体(TCR)、TCRアルファ鎖(TCRα)、TCRベータ鎖(TCRβ)、TCRデルタ鎖(TCRδ)、TCRガンマ鎖(TCRγ)、B細胞受容体(BCR)、BCR軽鎖(BCRL)、BCR重鎖(BCRH)、免疫グロブリン軽鎖(IgL)、免疫グロブリン重鎖(IgH)、免疫グロブリンカッパ鎖(Igκ)、および免疫グロブリンラムダ鎖(Igλ)からなる群から選択されうる。例えば、免疫受容体鎖遺伝子は、TCRβ遺伝子でありうる。遺伝子セグメントは、バリアブル(V)遺伝子セグメント、ダイバーシティ(D)遺伝子セグメント、ジョイニング(J)遺伝子セグメント、およびこれらの組合せからなる群から選択されうる。選択予測は、生産的TCRβ遺伝子のTCRβタンパク質配列を、修復TCRβ遺伝子のTCRβタンパク質配列から識別しうる。機械学習システムは、複数のモデルのアンサンブルを含む場合があり、複数のモデルのアンサンブルに含まれる各モデルは、アウトプットを生成することが可能であり、各モデルからのアウトプットは、選択予測を決定するように組み合わされうる。複数のモデルのアンサンブルに含まれるモデルは、2つを超える連続決定の階層的配置を含む、ニューラル決定木(neural decision tree)アーキテクチャーに配置されうる。2つを超える連続決定の階層的配置は、階層的配置内の、最初の位置における基点決定、および階層的配置内の、最後の位置における終端決定を含むことが可能であり;ニューラル決定木アーキテクチャーは、算術平均値を使用して、単一の決定へと一体に統合された決定のコミッティーから構成される決定を含む場合があり、この場合、各コミッティー内の決定の数が、ニューラル決定木内の終端決定から、ニューラル決定木上の基点決定へと増大し、本明細書ではまた、ニューラル・コミッティー・ツリー(neural committee tree)とも称される。方法は、TCRβ遺伝子、およびTCRβ遺伝子のTCRβタンパク質配列のライブラリーを含むトレーニングデータセットを得るステップ;ならびに最適化過程を使用して、各モデルに含まれるトレーニング重みを当てはめることにより、トレーニングデータセットを使用して、機械学習システムに含まれる1つまたは複数のモデルをトレーニングするステップをさらに含みうる。TCRβ遺伝子のライブラリーは、複数の生産的遺伝子、および複数の非生産的遺伝子を含みうる。非生産的TCRβ遺伝子は、アウトオブフレームの遺伝子セグメントを伴うTCRβ遺伝子、または遺伝子セグメント間の体細胞接合部内の終止コドンを伴うTCRβ遺伝子でありうる。抗原認識が可能であるアミノ酸配列をコードするTCRβ遺伝子は、生産的TCRβ遺伝子として同定される場合があり、抗原認識が可能であるアミノ酸配列を伴わないTCRβ遺伝子は、非生産的TCRβ遺伝子として同定されうる。方法は、複数の非生産的遺伝子の各々を修復するステップ;および修復された非生産的遺伝子の各々を、TCRβタンパク質配列へと翻訳するステップをさらに含みうる。非生産的TCRβ遺伝子を修復するステップは、遺伝子セグメント間の体細胞接合部において、1つもしくは複数のヌクレオチドを付加もしくは除去して、遺伝子セグメントを、同じリーディングフレーム内に組み込み、かつ/または遺伝子セグメント間の体細胞領域内のヌクレオチドを突然変異させて、終止コドンを、アミノ酸へと転換することを含みうる。非生産的として同定されたTCRβ遺伝子を修復するステップは、修復TCRβ遺伝子を作出することを含みうる。TCRβ遺伝子配列、およびTCRβタンパク質配列のライブラリーは、HLAマッチ健常ドナーにより提供される試料から得られうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。特徴ベクトルは、アミノ酸の特性と関連するデータの断片を含むことが可能であり、特性は、極性、1つもしくは複数の二次構造の会合、分子体積、コドン多様性、または帯電のうちの少なくとも1つでありうる。特定のT細胞サブセットから単離されたT細胞が使用されうる。T細胞は、細胞分取により単離されうる。T細胞は、RNA発現により単離されうる。対象は、ヒトでありうる。特定の修復された非生産的遺伝子を作出するのに使用された修復が、対象の非生産的遺伝子において、天然で現れる確率に従い、修復された非生産的遺伝子の各々は、重み付けされうる。TCRβ遺伝子は、非制御性T細胞に由来しうる。
別の実施形態は、対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測する方法であって、a)本明細書で記載される機械学習システムを使用して、各T細胞受容体(TCRβ)遺伝子を、生産的TCRβ遺伝子、または修復TCRβとして分類することにより、マッチ健常ドナーにおけるT細胞選択を再構成するステップ、b)健常ドナーから再構成されたT細胞選択を、対象に由来するT細胞へと適用するステップ、およびc)健常ドナーにおけるT細胞選択に失格する、対象における逃避T細胞の数を査定するステップであって、閾値を超える逃避T細胞の数が、自己免疫疾患または自己免疫障害を有するか、または発症する危険性を指し示す、ステップを含む方法を提供する。
健常ドナーにおけるT細胞選択を再構成するステップは、マッチ健常ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、本明細書で記載される機械学習システムを使用して、各T細胞受容体(TCRβ)遺伝子を、生産的TCRβ遺伝子、または修復TCRβとして分類することを含みうる。健常ドナーから再構成されたT細胞選択を、対象に由来するT細胞へと適用するステップは、対象に由来する試料中のTCRβ遺伝子をシーケンシングし、対象の各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。健常ドナーは、HLAマッチ健常ドナーでありうる。HLAマッチ健常ドナーは、対象の遺伝学的血縁者でありうる。マッチ健常ドナーに由来する試料は、疾患の任意の症状の発生の前に回収された、対象に由来する生物学的検体でありうる。生物学的検体は、保存血でありうる。生物学的検体は、免疫チェックポイント阻害剤療法の前に回収されうる。
さらなる実施形態は、対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測する方法であって、a)本明細書で記載される機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβとして分類することにより、複数の健常ドナーにおけるT細胞選択を再構成するステップ、b)健常ドナーから再構成されたT細胞選択を、対象に由来するT細胞へと適用するステップ、およびc)健常ドナーにおけるT細胞選択に失格する、対象における逃避T細胞の数を査定するステップであって、閾値を超える逃避T細胞の数が、自己免疫疾患または自己免疫障害を有するか、または発症する危険性を指し示す、ステップを含む方法を提供する。
複数の健常ドナーにおけるT細胞選択を再構成するステップは、a)各ドナーに由来する試料中のTCRβ遺伝子をシーケンシングすること、b)各ドナーのHLA型を決定すること、または各ドナーについて、MHC遺伝子をシーケンシングすること、c)ドナーのHLA型により、各TCRβ遺伝子にタグ付けすること、およびd)HLAタグを、各TCRβ遺伝子についての、さらなる特徴として使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。健常ドナーから再構成されたT細胞選択を、対象へと適用するステップは、a)対象に由来する試料中のTCRβ遺伝子をシーケンシングすること、b)対象のHLA型を決定すること、または対象のMHC遺伝子をシーケンシングすること、c)対象のHLA型により、各TCRβ遺伝子にタグ付けすること、およびd)対象の各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。逃避T細胞は、生産的TCRβ遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞でありうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。
ある実施形態は、臓器レシピエントにおける、臓器移植に由来する同種免疫を発症する危険性を予測する方法であって、a)本明細書で記載される機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、臓器ドナーにおけるT細胞選択を再構成するステップ、b)ドナーから再構成されたT細胞選択を、臓器レシピエントへと適用するステップ、およびc)臓器ドナー組織に対して非寛容である臓器レシピエントに由来するT細胞の数を決定するステップであって、臓器レシピエントにおける、閾値を超える、非寛容T細胞の数が、臓器移植に由来する同種免疫を有するか、または発症する危険性を指し示す、ステップを含む方法を提供する。
臓器ドナーにおけるT細胞選択を再構成するステップは、本明細書で記載される機械学習システムを使用して、臓器ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。臓器ドナーから再構成されたT細胞選択を、臓器レシピエントへと適用するステップは、臓器レシピエントに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。非寛容T細胞は、生産的TCRβ遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞でありうる。非寛容T細胞は、臓器ドナーにおけるT細胞選択に失格することが予測される、臓器レシピエントに由来するT細胞でありうる。非寛容T細胞は、臓器移植拒絶を駆動する可能性が高い、臓器レシピエントに由来するT細胞でありうる。
別の実施形態は、レシピエントにおける、移植片または細胞に由来する移植片対宿主病(GvHD)を発症する危険性を予測する方法であって、a)本明細書で記載される機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、レシピエントにおけるT細胞選択を再構成するステップ、b)レシピエントから再構成されたT細胞選択を、ドナーへと適用するステップ、およびc)レシピエントに対して非寛容であるドナーに由来するT細胞の数を決定するステップであって、ドナーにおける、閾値を超える、非寛容T細胞の数が、臓器移植または細胞移植に由来するGvHDを有するか、または発症する危険性を指し示す、ステップを含む方法を提供する。
レシピエントにおけるT細胞選択を再構成するステップは、本明細書で記載される機械学習システムを使用することにより、レシピエントに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。レシピエントから再構成されたT細胞選択を、ドナーへと適用するステップは、ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。非寛容T細胞は、生産的TCRβ遺伝子が、修復TCR遺伝子として誤分類されたT細胞でありうる。非寛容T細胞は、レシピエントにおけるT細胞選択に失格することが予測される、ドナーに由来するT細胞でありうる。非寛容T細胞は、GvHDを駆動する可能性が高い、ドナーに由来するT細胞でありうる。ドナーに由来する試料は、移植に由来する試料でありうる。レシピエントに由来する試料は、末梢血試料の場合もあり、組織試料の場合もある。
さらなる実施形態は、レシピエントにおける、養子T細胞療法に由来する同種免疫を発症する危険性を予測する方法であって、a)本明細書で記載される機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、レシピエントにおけるT細胞選択を再構成するステップ、b)レシピエントから再構成されたT細胞選択を、ドナーT細胞へと適用するステップ、およびc)レシピエントに対して非寛容であるドナーから提供されるT細胞の数を決定するステップであって、ドナーにおける、閾値を超える、非寛容T細胞の数が、養子T細胞療法に由来する同種免疫を有するか、または発症する危険性を指し示す、ステップを含む方法を提供する。
レシピエントにおけるT細胞選択を再構成するステップは、本明細書で記載される機械学習システムを使用して、ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。レシピエントから再構成されたT細胞選択を、ドナーT細胞へと適用するステップは、ドナーから提供されたT細胞試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。非寛容T細胞は、生産的TCRβ遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞でありうる。非寛容T細胞は、レシピエントにおけるT細胞選択に失格することが予測される、ドナーに由来するT細胞でありうる。非寛容T細胞は、レシピエントにおける同種免疫を駆動する可能性が高い、ドナーに由来するT細胞でありうる。養子T細胞療法に由来する同種免疫は、レシピエントの細胞および組織に対する、ドナーT細胞からの、所望されない免疫攻撃を含みうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。養子T細胞療法における養子T細胞は、同種CAR T細胞でありうる。養子T細胞療法における養子T細胞は、操作TCRを伴う、同種T細胞でありうる。
別の実施形態は、レシピエントにおける、操作T細胞受容体(TCRβ)療法の適合性を予測する方法であって、a)本明細書で記載される機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、レシピエントにおけるT細胞選択を再構成するステップ、b)レシピエントから再構成されたT細胞選択を、操作TCRβへと適用するステップ、およびc)操作TCRβが、レシピエントに対して非寛容であるのかどうかを決定し、これにより、操作TCRβ療法との適合性を予測するステップを含む方法を提供する。
レシピエントにおけるT細胞選択を再構成するステップは、レシピエントに由来する試料中のT細胞受容体(TCRβ)遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。レシピエントに由来するT細胞選択を、操作TCRへと適用するステップは、操作TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。非寛容操作TCRβ遺伝子は、修復TCRβ遺伝子として誤分類された生産的TCRβ遺伝子でありうる。非寛容操作TCRβは、レシピエントにおけるT細胞選択に失格することが予測される。非寛容操作TCRβは、レシピエントにおいて、同種免疫を駆動する可能性が高い。操作TCRβ治療に由来する同種免疫は、レシピエントの細胞および組織に対する、操作TCRβを伴うT細胞からの、所望されない免疫攻撃を含みうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。
ある実施形態は、対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測する方法であって、a)本明細書で記載される機械学習システムを使用して、各B細胞受容体(BCR)遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することにより、健常対象におけるB細胞選択を再構成するステップであって、免疫受容体鎖遺伝子が、BCR遺伝子である、ステップ、b)健常ドナーから再構成されたB細胞選択を、対象に由来するB細胞へと適用するステップ、およびc)健常ドナーにおけるB細胞選択に失格する、対象における逃避B細胞の数を査定するステップであって、閾値を超える逃避B細胞の数が、自己免疫疾患または自己免疫障害を有するか、または発症する危険性を指し示す、ステップを含む方法を提供する。
遺伝子セグメントは、バリアブル(V)遺伝子セグメント、ダイバーシティ(D)遺伝子セグメント、ジョイニング(J)遺伝子セグメント、およびこれらの組合せからなる群から選択されうる。選択予測は、BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として同定しうる。機械学習システムは、複数の予測モデルのアンサンブルを含む場合があり、複数の予測モデルのアンサンブルに含まれる各予測モデルは、モデル予測を生成することが可能であり、各予測モデルに由来するモデル予測は、選択予測を決定するように組み合わされうる。2つを超える連続決定の階層的配置を含む改変型ニューラル決定木アーキテクチャーは、モデル予測を、選択予測へと統合するのに使用されうる。ニューラル決定木アーキテクチャーは、算術平均値を使用して、単一の決定へと一体に統合された決定のコミッティーから構成される決定を含む場合があり、この場合、各コミッティー内の決定の数が、ニューラル決定木内の終端決定から、ニューラル決定木上の基点決定へと増大し、本明細書ではまた、ニューラル・コミッティー・ツリーとも称される。方法は、BCR遺伝子、およびBCR遺伝子のBCRタンパク質配列のライブラリーを含むトレーニングデータセットを得るステップ;ならびに最適化過程を使用して、各予測モデルに含まれる重み値を決定することにより、トレーニングデータセットを使用して、機械学習システムに含まれる1つまたは複数の予測モデルをトレーニングするステップをさらに含みうる。BCR遺伝子のライブラリーは、複数の生産的遺伝子、および複数の非生産的遺伝子を含みうる。非生産的BCR遺伝子は、アウトオブフレームの遺伝子セグメントを伴うBCR遺伝子、または遺伝子セグメント間の体細胞接合部内の終止コドンを伴うBCR遺伝子でありうる。方法は、複数の非生産的遺伝子の各々を修復するステップ;および修復された非生産的遺伝子の各々を、BCRタンパク質配列へと翻訳するステップをさらに含みうる。非生産的BCR遺伝子を修復するステップは、遺伝子セグメント間の体細胞接合部において、1つもしくは複数のヌクレオチドを付加もしくは除去して、遺伝子セグメントを、同じリーディングフレーム内に組み込み、かつ/または遺伝子セグメント間の体細胞領域内のヌクレオチドを突然変異させて、終止コドンを、アミノ酸へと転換することを含みうる。非生産的遺伝子として同定されたBCR遺伝子を修復するステップは、修復BCR遺伝子を作出することを含みうる。BCR遺伝子配列、およびBCRタンパク質配列のライブラリーは、HLAマッチ健常ドナーにより提供される試料から得られうる。タンパク質特徴は、アミノ酸の特性と関連するデータの断片を含むことが可能であり、特性は、極性、1つもしくは複数の二次構造の会合、分子体積、コドン多様性、または帯電のうちの少なくとも1つでありうる。特定の修復された非生産的遺伝子を作出するのに使用された修復が、対象の非生産的遺伝子において、天然で現れる確率に従い、修復された非生産的遺伝子の各々は、重み付けされうる。健常対象におけるB細胞選択を再構成するステップは、健常対象に由来する試料中のB細胞受容体(BCR)遺伝子をシーケンシングし、健常対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含みうる。健常ドナーから再構成されたB細胞選択を、対象に由来するB細胞へと適用するステップは、対象に由来する試料中のBCR遺伝子をシーケンシングし、各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含みうる。逃避B細胞は、生産的BCR遺伝子が、修復BCR遺伝子として誤分類されたB細胞でありうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。
ある実施形態は、対象における抗体薬の安全性を予測する方法であって、a)本明細書で記載される機械学習システムを使用して、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することにより、対象におけるB細胞選択を再構成するステップであって、免疫受容体鎖遺伝子が、BCR遺伝子である、ステップ、およびb)抗体薬をコードするBCR遺伝子が、対象の自己抗原に対して寛容であるのかどうかを決定するステップであって、抗体薬をコードする寛容BCR遺伝子が、生産的BCR遺伝子として、適正に分類されたBCR遺伝子である、ステップを含む方法を提供する。
遺伝子セグメントは、バリアブル(V)遺伝子セグメント、ダイバーシティ(D)遺伝子セグメント、ジョイニング(J)遺伝子セグメント、およびこれらの組合せからなる群から選択されうる。選択予測は、BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として同定しうる。対象におけるB細胞選択を再構成するステップは、本明細書で記載される機械学習システムを使用して、対象に由来する試料中のBCR遺伝子をシーケンシングし、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含みうる。抗体薬をコードする非寛容BCR遺伝子は、修復BCR遺伝子として誤分類されたBCR遺伝子でありうる。抗体薬をコードする非寛容BCR遺伝子は、対象におけるB細胞選択に失格することが予測されるBCR遺伝子でありうる。抗体薬をコードする非寛容BCR遺伝子は、対象における自己抗原に結合する可能性が高い抗体薬をコードしうる。自己抗原に結合する可能性が高い抗体薬として分類される抗体薬は、対象における抗体薬の使用の安全性の欠如を指し示しうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。
別の実施形態は、対象におけるキメラ抗原受容体(CAR)-T細胞療法から、同種免疫を発症する危険性を予測する方法であって、CARの抗原結合性ドメインが、対象の自己抗原に対して寛容であるのかどうかを決定するステップを含み、CARの抗原結合性ドメインが、対象の自己抗原に対して寛容であるのかどうかを決定するステップが、a)本明細書で記載される機械学習システムを使用して、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することにより、対象におけるB細胞選択を再構成することであって、免疫受容体鎖遺伝子が、BCR遺伝子であること、およびb)CARの抗原結合性ドメインをコードするBCR遺伝子が、対象の自己抗原に対して寛容であるのかどうかを決定することであって、CARの抗原結合性ドメインをコードする寛容BCR遺伝子が、生産的BCR遺伝子として、適正に分類されたBCR遺伝子であることを含む方法を提供する。
対象におけるB細胞選択を再構成するステップは、対象に由来する試料中のBCR遺伝子をシーケンシングし、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含みうる。CARの抗原結合性ドメインをコードする非寛容BCR遺伝子は、修復BCR遺伝子として誤分類されたBCR遺伝子でありうる。CARの抗原結合性ドメインをコードする非寛容BCR遺伝子は、対象におけるB細胞選択に失格することが予測されるBCR遺伝子でありうる。抗体薬をコードする非寛容BCR遺伝子は、対象における自己抗原に結合する可能性が高い抗体薬をコードしうる。自己抗原に結合する可能性が高いBCR遺伝子として分類されるBCR遺伝子は、対象におけるCAR-T細胞療法の使用の安全性の欠如を指し示しうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。
したがって、本明細書では、臓器ドナー/臓器レシピエント間の適合性、細胞ドナー/細胞レシピエント間の適合性を決定する、非従来型の方法、および、とりわけ、非生産的免疫受容体鎖遺伝子へと、1つまたは複数の修復を施すことに依拠する、免疫受容体鎖遺伝子を分類する、非従来型のステップを使用する、他の予測法が提示される。固有の方法は、例えば、臓器ドナー/臓器レシピエント間の適合性、細胞ドナー/細胞レシピエント間の適合性を決定する方法、自己免疫疾患を発症する危険性を予測する方法、レシピエントにおける、臓器移植または細胞移植に由来する同種免疫を発症する危険性を予測する方法、レシピエントにおける、臓器移植または細胞移植に由来する移植片対宿主病(GvHD)を発症する危険性を予測する方法、造血幹細胞レシピエントにおけるがんの再発を予測する方法、レシピエントにおける、養子T細胞療法に由来する同種免疫を発症する危険性を予測する方法、レシピエントにおける、操作T細胞受容体(TCR)療法の適合性を予測する方法、対象における抗体薬の安全性を予測する方法、およびT細胞選択の再構成に依拠する機械学習システムを使用して、対象におけるキメラ抗原受容体(CAR)-T細胞療法から、同種免疫を発症する危険性を予測する方法において使用されうる。これらの方法の使用は、臓器/細胞ドナーとレシピエントとの間の適合性の決定、および、とりわけ、天然に存在しない修復免疫受容体鎖遺伝子の、非生産的免疫受容体鎖遺伝子、または非機能的免疫受容体鎖遺伝子からの作出を含む、固有の技術的ステップを使用する、他の予測における、精度の増大をもたらす。これらの種類の方法における使用のための、天然に存在しない修復免疫受容体鎖遺伝子の作出は、現在のところ、常套的でも、当技術分野で公知でもない。
付属の図面は、本開示の方法および組成物についての、さらなる理解をもたらすために含めたものであり、本明細書に組み込まれ、本明細書の一部を構成する。図面は、本開示の、1つまたは複数の実施形態を例示し、記載と併せて、本開示の概念および運用を説明するのに用いられる。
TCRの組換え過程、およびTCRの選択過程を例示する図である。図1Aは、複数の、ゲノムV遺伝子セグメント、ゲノムD遺伝子セグメント、およびゲノムJ遺伝子セグメントを例示する。V(D)J組換え時に、ゲノムは、個別のV遺伝子セグメント、D(β鎖だけ)遺伝子セグメント、およびJ遺伝子セグメントを対合させるように、切断され、ライゲーションされる。欠失および挿入は、遺伝子セグメント間の接合部に、ランダムヌクレオチドを導入する。TCR遺伝子は、T細胞の表面上で、タンパク質として発現する。図1Bは、免疫寛容を確立するTCRの発現に基づく、陽性選択および陰性選択により、どのようにして、T細胞が間引かれるのかを例示する。図1Cは、Vセグメントと、Jセグメントとが、異なるオープンリーディングフレーム内にあるために(上)、または終止コドン(中)のために、非生産的TCR遺伝子が、どのようにして発現しないのかを例示する。代替的染色体上の、V(D)J組換えは、受容体を発現しうる、第2のTCR遺伝子を結果としてもたらし、これにより、T細胞が、T細胞選択後に存続することを可能としうる。 TCRの組換え過程、およびTCRの選択過程を例示する図である。図1Aは、複数の、ゲノムV遺伝子セグメント、ゲノムD遺伝子セグメント、およびゲノムJ遺伝子セグメントを例示する。V(D)J組換え時に、ゲノムは、個別のV遺伝子セグメント、D(β鎖だけ)遺伝子セグメント、およびJ遺伝子セグメントを対合させるように、切断され、ライゲーションされる。欠失および挿入は、遺伝子セグメント間の接合部に、ランダムヌクレオチドを導入する。TCR遺伝子は、T細胞の表面上で、タンパク質として発現する。図1Bは、免疫寛容を確立するTCRの発現に基づく、陽性選択および陰性選択により、どのようにして、T細胞が間引かれるのかを例示する。図1Cは、Vセグメントと、Jセグメントとが、異なるオープンリーディングフレーム内にあるために(上)、または終止コドン(中)のために、非生産的TCR遺伝子が、どのようにして発現しないのかを例示する。代替的染色体上の、V(D)J組換えは、受容体を発現しうる、第2のTCR遺伝子を結果としてもたらし、これにより、T細胞が、T細胞選択後に存続することを可能としうる。 TCRの組換え過程、およびTCRの選択過程を例示する図である。図1Aは、複数の、ゲノムV遺伝子セグメント、ゲノムD遺伝子セグメント、およびゲノムJ遺伝子セグメントを例示する。V(D)J組換え時に、ゲノムは、個別のV遺伝子セグメント、D(β鎖だけ)遺伝子セグメント、およびJ遺伝子セグメントを対合させるように、切断され、ライゲーションされる。欠失および挿入は、遺伝子セグメント間の接合部に、ランダムヌクレオチドを導入する。TCR遺伝子は、T細胞の表面上で、タンパク質として発現する。図1Bは、免疫寛容を確立するTCRの発現に基づく、陽性選択および陰性選択により、どのようにして、T細胞が間引かれるのかを例示する。図1Cは、Vセグメントと、Jセグメントとが、異なるオープンリーディングフレーム内にあるために(上)、または終止コドン(中)のために、非生産的TCR遺伝子が、どのようにして発現しないのかを例示する。代替的染色体上の、V(D)J組換えは、受容体を発現しうる、第2のTCR遺伝子を結果としてもたらし、これにより、T細胞が、T細胞選択後に存続することを可能としうる。 T細胞選択の転帰を予測する、例示的方法を例示する図である。 非生産的TCR遺伝子を修復するのに施された、例示的変更を例示する図である。 非生産的TCR遺伝子を修復するのに施された、例示的変更を例示する図である。 T細胞選択の転帰を予測するための、例示的機械学習システムを例示する図である。 例示的なニューラル・コミッティー・ツリーアーキテクチャーを例示する図である。 例示的なニューラル・コミッティー・ツリーアーキテクチャーを例示する図である。 図4の機械学習システムに含まれる予測モデルについての、さらなる詳細を例示する図である。 単一のマウス対象に由来するTCR遺伝子を使用して実施された、例示的なT細胞選択のシミュレーション解析による結果を例示する図である。 単一のマウス対象に由来するTCR遺伝子を使用して実施された、例示的なT細胞選択のシミュレーション解析による結果を例示する図である。 単一のマウス対象に由来するTCR遺伝子を使用して実施された、例示的なT細胞選択のシミュレーション解析による結果を例示する図である。 成熟T細胞に由来するTCR遺伝子を使用して実施された、例示的なT細胞選択のシミュレーションによる結果を例示する図である。 ナイーブB細胞に由来するBCR遺伝子を使用して実施された、例示的なB細胞選択のシミュレーションによる結果を例示する図である。 ナイーブB細胞に由来するBCR遺伝子を使用して実施された、例示的なB細胞選択のシミュレーションによる結果を例示する図である。 ナイーブB細胞に由来するBCR遺伝子を使用して実施された、例示的なB細胞選択のシミュレーションによる結果を例示する図である。 ドナー-レシピエント間の適合性を決定するのに使用されるT細胞選択の前におけるT細胞と、T細胞選択の後におけるT細胞との比較を例示する図である。 T細胞選択の前におけるTCRβ、およびT細胞選択の後におけるTCRβを模倣するのに、シーケンシングされたTCRβ遺伝子が、どのようにして使用されるのかを例示する図である。 PSFドナー-生産的が、どのようにして計算されるのかを例示するベン図である。 aGvHD症例および対照についての、PSFドナー-生産的を例示するグラフである。各欄は、異なる移植である。 カットオフを、図12Bから移動させることが、真陽性率および偽陽性率を変化させることを例示するROC曲線である。 PSFドナー-修復が、どのようにして計算されるのかを例示するベン図である。 cGvHD症例および対照についての、PSFドナー-修復を例示するグラフである。各欄は、異なる移植である。 カットオフを、図13Bから移動させることが、真陽性率および偽陽性率を変化させることを例示するROC曲線である。 ドナーとレシピエントとの間で共有される、TCRβの数を明らかにするベン図である。ヌクレオチド配列の、タンパク質配列への翻訳は、同一のTCRβをコードする、異なるTCRβ遺伝子を明らかにする。各CDR3タンパク質配列に由来する、最初の3つのアミノ酸残基、および最後の3つのアミノ酸残基は、抗原に接触しないため、トリミングされる。トリミングされたCDR3タンパク質配列が、同一である場合、TCRβは、同等であると考えられる。 TCRβ遺伝子配列が、生殖細胞系列によりコードされる、V遺伝子セグメント、D遺伝子セグメント、J遺伝子セグメントのほか、V(D)J組換え時に生じる体細胞変異を明らかにすることを例示する図である。図15Aは、末梢血中に見出される生産的TCRβ遺伝子が、アミノ酸配列へと翻訳されうることを示す。図15Bは、アウトオブフレームのV遺伝子セグメントおよびJ遺伝子セグメントを伴う末梢血中に見出されるTCRβ遺伝子が、T細胞選択のための、機能的受容体を発現しないことを示す。非生産的TCRβ遺伝子についての、この例は、体細胞ヌクレオチドを欠失させることにより修復されうる。図15Cは、体細胞接合部内の終止コドンをコードする、末梢血中に見出されるTCRβ遺伝子がまた、T細胞選択のための、機能的受容体も発現しないことを示す。非生産的TCRβ遺伝子についての、この例は、体細胞ヌクレオチドを修飾することにより修復されうる。 TCRβ遺伝子配列が、生殖細胞系列によりコードされる、V遺伝子セグメント、D遺伝子セグメント、J遺伝子セグメントのほか、V(D)J組換え時に生じる体細胞変異を明らかにすることを例示する図である。図15Aは、末梢血中に見出される生産的TCRβ遺伝子が、アミノ酸配列へと翻訳されうることを示す。図15Bは、アウトオブフレームのV遺伝子セグメントおよびJ遺伝子セグメントを伴う末梢血中に見出されるTCRβ遺伝子が、T細胞選択のための、機能的受容体を発現しないことを示す。非生産的TCRβ遺伝子についての、この例は、体細胞ヌクレオチドを欠失させることにより修復されうる。図15Cは、体細胞接合部内の終止コドンをコードする、末梢血中に見出されるTCRβ遺伝子がまた、T細胞選択のための、機能的受容体も発現しないことを示す。非生産的TCRβ遺伝子についての、この例は、体細胞ヌクレオチドを修飾することにより修復されうる。 TCRβ遺伝子配列が、生殖細胞系列によりコードされる、V遺伝子セグメント、D遺伝子セグメント、J遺伝子セグメントのほか、V(D)J組換え時に生じる体細胞変異を明らかにすることを例示する図である。図15Aは、末梢血中に見出される生産的TCRβ遺伝子が、アミノ酸配列へと翻訳されうることを示す。図15Bは、アウトオブフレームのV遺伝子セグメントおよびJ遺伝子セグメントを伴う末梢血中に見出されるTCRβ遺伝子が、T細胞選択のための、機能的受容体を発現しないことを示す。非生産的TCRβ遺伝子についての、この例は、体細胞ヌクレオチドを欠失させることにより修復されうる。図15Cは、体細胞接合部内の終止コドンをコードする、末梢血中に見出されるTCRβ遺伝子がまた、T細胞選択のための、機能的受容体も発現しないことを示す。非生産的TCRβ遺伝子についての、この例は、体細胞ヌクレオチドを修飾することにより修復されうる。 PSF自家が、どのようにして計算されるのかを例示するベン図である。 自家皮膚試料(四角、三角)、自家PBMC試料(丸)、および自家胸腺試料(菱形)についての、PSF自家を例示するグラフである。各欄は、異なる患者である。T細胞選択前における、発生期T細胞を含有する胸腺についてのPSF自家値は、T細胞選択後の成熟T細胞を含有する、皮膚およびPBMCより低値である。カットオフ(破線)は、T細胞選択の前におけるTCRβ集団と、T細胞選択の後におけるTCRβ集団とを識別し、aGvHD症例と、対照とを識別するのに使用されるカットオフとほぼ同一である。 新規として表示される、レシピエントにおいて欠けている、ドナーTCRβを例示するベン図である。 がんの再発例および対照についての、f新規を例示するグラフである。各欄は、異なるレシピエントを表す。 カットオフを、図17Bから移動させることが、真陽性率および偽陽性率を変化させることを例示するROC曲線である。 再発についての予測に対してプロットされた、aGvHDについての予測を例示するグラフである。カットオフは、aGvHDおよび再発のいずれも回避する、7例中3例≒43%のレシピエントを適正に同定する。カットオフを伴わない場合、17例中6例≒35%のレシピエントが、aGvHDおよび再発のいずれも回避する。 がんの再発についての予測に対してプロットされた、cGvHDについての予測を例示するグラフである。カットオフは、cGvHDおよび再発のいずれも回避する、5/5=100%のレシピエントを適正に同定する。カットオフを伴わない場合、17例中8例≒47%のレシピエントが、cGvHDおよび再発のいずれも回避する。 最良のドナーのための候補者をスクリーニングするのに、aGvHD、cGvHD、およびがんの再発についての予測が、どのようにして使用されうるのかを例示する概略図である。
本開示は、T細胞が、機械学習システムにおいて実施される、T細胞受容体(TCR)についてのT細胞選択に合格するのか、失格するのかを予測する方法、およびその使用法をもたらす。使用法は、対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測する方法、臓器レシピエントにおける、臓器移植に由来する同種免疫を発症する危険性を予測する方法、レシピエントにおける、臓器移植または細胞移植に由来する移植片対宿主病(GvHD)を発症する危険性を予測する方法、レシピエントにおける、養子T細胞療法に由来する同種免疫を発症する危険性を予測する方法、対象における抗体薬の安全性を予測する方法、および対象におけるキメラ抗原受容体(CAR)-T細胞療法から、同種免疫を発症する危険性を予測する方法を含む。
概観
V(D)J組換えとして公知の過程により、発生期T細胞は、デノボのTCR遺伝子をアセンブルするように、それらのDNAを編集する。TCR遺伝子は、数十に及ぶ、バリアブル(V)遺伝子セグメント、ダイバーシティ(D)遺伝子セグメント、およびジョイニング(J)遺伝子セグメントから、個別のVセグメント、Dセグメント、およびJセグメントを完全遺伝子へとカップリングするように、ゲノムを直接編集することにより形成される(図1A)。セグメントが、一体にライゲーションされる場合、連続欠失および連続挿入は、セグメント間の接合部に、ランダムヌクレオチドを導入し、TCR遺伝子内の、さらなる変更を創出する。こうして、各TCR遺伝子は、連続体細胞変異が、これらのセグメント間の接合部を形成する、体細胞内で再配列された生殖細胞系列セグメントを含有する。潜在的に固有のTCR遺伝子をもたらすことにより、各T細胞は、潜在的に、顕著に異なるTCRを発現しうる。新たな抗原と対面した場合、T細胞の大規模集団は、偶然により、この抗原に結合しうるTCRを含有するであろう。
TCR遺伝子は、TCRが、どの抗原に結合しうるのかにかかわらずに創出され、したがって、発生期T細胞が、T細胞選択を経ることは不可欠である。T細胞選択の、2つの主要な段階は、陽性選択および陰性選択であり、これらは、胸腺内で、この順に生じる(図1B)。陽性選択時に、MHCに結合する発生期T細胞は、生存シグナルを受け取り、これは、存続するT細胞が、MHCにより提示される抗原との機能的な相互作用が可能であることを確実にする。陽性選択は、T細胞が抗原を監視する指定帯域としてのMHCを確立する。陰性選択時に、自己抗原に強く結合するTCRを発現する発生期T細胞は、細胞死をもたらすアポトーシスシグナルを受け取り、これは、存続するT細胞が自己抗原を認識しないことを確実にする。陰性選択は、健常細胞および健常組織に対する、自己免疫攻撃を駆動する、発生期T細胞を間引く。各T細胞受容体(TCR)遺伝子は、受容体が、どの物質(抗原)を認識しうるのかにかかわらずに創出される。T細胞選択は、それらのTCRが、(i)抗原提示プラットフォームとして作用する主要組織適合性複合体(MHC)を認識できないか、または(ii)健常細胞および健常組織に由来する自己抗原を高アフィニティーで認識する場合に、発生期T細胞を間引く。陽性選択および陰性選択のいずれも、転帰の保証を伴わない、確率論的過程であり、TCRが同一である発生期T細胞は、T細胞選択時に、反対の転帰をたどる場合がある。選択過程を完了したT細胞は、成熟T細胞として、胸腺から、脾臓など、他の臓器部位へと遊走する。
TCR遺伝子をシーケンシングしようとする初期の試みは、非生産的TCR遺伝子を伴う成熟T細胞が、(i)Vセグメントと、Jセグメントとが、異なるオープンリーディングフレーム内にあるか、または(ii)終止コドンが、遺伝子セグメント間の接合部内に見出される(図1C)ために、機能的TCRを発現することができないことを明らかにした。機能的TCRを伴わなければ、これらのT細胞は、成熟に到達せずに、T細胞選択により間引かれるので、成熟T細胞内における、非生産的TCR遺伝子の出現は、なぞのように見えるであろう。しかし、代替的染色体上で生じるV(D)J組換えは、T細胞が、T細胞選択後に存続することを可能とする機能的TCRを発現するパートナーTCR遺伝子を結果としてもたらしうる。選択過程におけるT細胞の運命は、パートナーTCR遺伝子だけに依存するため、非生産的TCR遺伝子は、依然として、T細胞選択に依存せず、T細胞選択の非存在下で出現するTCRの種類を表す。したがって、生産的TCR遺伝子の、非生産的TCR遺伝子との比較は、T細胞選択により間引かれるTCR遺伝子についての情報を明らかにする。既往の研究は、T細胞選択が、TCR遺伝子を、配列の長さおよびV(D)J再配列により限定することを見出している。
本明細書では、ハイスループットTCRシーケンシングと、TCR遺伝子を使用して、どのT細胞が間引かれるのかを予測する、機械学習システムとに基づく方法が記載される。このシステムを使用して、T細胞選択は、コンピュータにより、任意の個体について再構成されうる。コンピュータ法は、T細胞が間引かれるのかどうかに影響を与える、TCRタンパク質配列内のパターンを明らかにするのに使用されうる。
同種造血幹細胞移植(allo-HSCT)は、多様な種類の白血病、リンパ腫、および他の血液悪性腫瘍のための、重要な処置選択肢である。しかし、その使用は、著明な罹患率および死亡率と関連し、allo-HSCTレシピエントの9~15%が移植片対宿主病(GvHD)で死亡し、さらに23%が、がんの再発で死亡する。allo-HSCTにおける罹患率および死亡率の低減は、(i)新たながん免疫療法は、allo-HSCTに対する必要を低減し、遅延させつつあるが、これを消失させることはなく、(ii)シクロホスファミドの広範な使用は、GvHDを低減しているが、これを消失させてはいないため、重要である。allo-HSCTの難題、および代替処置の出現にもかかわらず、年間のallo-HSCT件数が、過去20年間にわたり増大していることは、allo-HSCTが、将来も、しばらくにわたり、依然として、血液悪性腫瘍のために、不可欠の処置であることを示唆する。
allo-HSCTの目標ではないが、造血幹細胞(HSC)と共に常在するT細胞もまた、レシピエントへと移植され、その後、レシピエントにおいて、ドナーHSCから発生する。ドナーT細胞は、場合によって、レシピエントのがんを認識し、これにより、がんの再発に対して防御するため、T細胞は移植の重要な部分である。しかし、不適合性のドナーT細胞は、レシピエントに対する免疫攻撃を引き起こし、これにより、移植片対宿主病(GvHD)をもたらすため、ドナーと、レシピエントとをマッチさせることが極めて重要である。
allo-HSCTについて、ドナー-レシピエント間のマッチを同定する、現行の手法は、T細胞の適合性を部分的に決定するにとどまる。例えば、HLAタイピングは、T細胞選択の第1段階において、ドナーと、レシピエントとが、同じ主要組織適合性複合体(MHC)を共有するのかどうかを決定するが、これでは、T細胞選択の第2の段階を、タイピングされないままであり、完全にマッチングされた近縁ドナーのうちの40%が、なぜGvHDを発症させるのかを、潜在的に説明する。副次的組織適合性抗原(mHA)についてのタイピングは、ドナーと、レシピエントとが、同じ自己抗原を発現するのかどうかを決定することにより、このギャップを近づけようと試みるが、mHAタイピングが、GvHDを引き起こしうる数百万種類もある自己抗原のうちの数百種類だけをマッチさせることは、mHAタイピングが、なぜGvHDを予測できないのかを、潜在的に説明する。最後に、混合リンパ球反応(MLR)は、ドナーT細胞が、レシピエントリンパ球と、有害な形で相互作用するのかどうかを決定するが、有害反応が、被験組織以外の組織内で生じる場合があることは、MLRがGvHDを予測できない失敗の背後の理由を、潜在的に説明する。
ドナー-レシピエント間の適合性を決定するために、ドナーT細胞およびレシピエントT細胞は、T細胞選択(また、胸腺選択としても公知である)が、T細胞の適合性を決定する免疫学的過程であるため、この前後に比較されうる。図10に例示される通り、骨髄中の造血幹細胞(HSC)は、胸腺内のT細胞選択を経る発生期T細胞をもたらす。T細胞選択は、MHC拘束性ではないか、または自己抗原を強く認識する発生期T細胞を除去する。存続するT細胞は、宿主と適合性である、成熟T細胞として、末梢血へと遊走する。
適合性ドナーは、T細胞選択時に、レシピエントと同じ種類のT細胞を欠失させ、ドナーT細胞が、既に、レシピエントと適合性であることを確実にする。T細胞選択時に、不適合性T細胞は、それらのTCRの発現に基づき、除去される。したがって、TCRは、適合性について点検するのに使用されうる。本明細書では、それらのTCRにより予測される、適合性ドナーT細胞の定量が、GvHDを予測するためのマーカーとして利用されうることの裏付けが記載される。この情報は、ドナー、または具体的なGvHD予防戦略を選択するのに使用されうる。
免疫細胞受容体の分類、および非生産的受容体の修復
図1Aは、免疫細胞の表面における、多様な可能な免疫受容体の発現をもたらす(ランダムヌクレオチドの組換えおよび付加/欠失に起因して)VDJ組換え過程を例示する。作出される、大量の、可能な免疫受容体のうち、一部は、それらのタンパク質配列内に、受容体の発現を妨げるアウトオブフレーム事象(例えば、ヌクレオチド数が、3の倍数ではない)を含む場合もあり、一部は、これもまた、受容体の発現を妨げる、未成熟終止コドンを提示する場合もある。このような事象が存在しなければ、受容体は、免疫細胞の表面において発現されうる(図1Cを参照されたい)。図10は、T細胞選択を例として使用して、免疫細胞選択過程を例示する。骨髄中では、発生期T細胞は存在するが、選択は生じていない。成熟T細胞(T細胞選択の後で残存するT細胞)を得、MHC拘束性でないT細胞は除去され(それらの表面において、免疫受容体を発現しない細胞など)、および自己抗原反応性T細胞は、除去される。
本開示は、免疫受容体の遺伝子配列は、試料から得られる場合があり、遺伝子配列は、タンパク質配列へと翻訳される場合もあり、その試みがなされる場合もあり、タンパク質配列についての解析は、生産的免疫受容体遺伝子、または生産的免疫受容体鎖遺伝子に対応する、抗原認識が可能であるアミノ酸配列をコードする免疫受容体鎖遺伝子を同定し、非生産的免疫受容体遺伝子、または非生産的免疫受容体鎖遺伝子に対応する、抗原認識が可能でないアミノ酸配列を伴わない免疫受容体遺伝子、または免疫受容体鎖遺伝子を同定するのに使用されうることの発見に依拠する(図10および11を参照されたい)。次いで、方法は、非生産的免疫受容体鎖遺伝子として同定された免疫受容体鎖遺伝子の配列を修復して、修復免疫受容体鎖遺伝子を作出することに依拠する。
機能的TCRなど、機能的免疫受容体は、TCRを、抗原認識可能とするアミノ酸を有するTCRである。本明細書で使用される抗原認識とは、例えば、MHCなどの抗原提示複合体により提示された場合に、抗原と機能的に相互作用する、免疫受容体の能力を指す。本明細書で使用される、生産的TCRとは、意味の差違を伴わずに、機能的TCR(すなわち、TCRを、抗原認識可能とするアミノ酸配列を有するTCR)、またはアウトオブフレームのVDJ組換えも、終止コドンも提示しないアミノ酸配列を有するTCRを指す場合がある。
免疫受容体鎖遺伝子配列は、複数の遺伝子セグメント、例えば、バリアブル(V)遺伝子セグメント、ダイバーシティ(D)遺伝子セグメント、ジョイニング(J)遺伝子セグメント、およびこれらの組合せを含みうる。
全ての免疫受容体遺伝子が、D遺伝子セグメントを含有するわけではない。例えば、TCRアルファ、TCRデルタ、BCRL、IgL、およびIgκは、D遺伝子を含有しない。場合によって、体細胞変異もまた、D遺伝子を、TCRベータ遺伝子、TCRガンマ遺伝子、BCRH遺伝子、およびIgH遺伝子から、完全に除去しうる。したがって、本明細書で記載される免疫受容体鎖は、組換えおよび体細胞変異に応じて、V遺伝子セグメント、D遺伝子セグメント、およびJ遺伝子セグメント、またはこれらの組合せを含む、複数の遺伝子セグメントを含みうる。
免疫受容体は、2つの免疫受容体遺伝子鎖によりコードされる。本明細書で記載される方法は、一般に、一度に1つの免疫受容体遺伝子鎖を指し、任意の免疫受容体遺伝子鎖に適用されうる。本明細書で提示される方法のいずれも限定することを望まずに述べると、本明細書で記載される方法を、各単鎖に使用して、完全な免疫受容体を反映するために、本明細書で記載される方法が、免疫受容体の各鎖へと適用されうることが理解されるものとする。本明細書で使用される、免疫受容体鎖遺伝子の修復は、完全免疫受容体の修復を含みうる。免疫受容体鎖遺伝子は、T細胞受容体(TCR)、TCRアルファ鎖(TCRα)、TCRベータ鎖(TCRβ)、TCRデルタ鎖(TCRδ)、TCRガンマ鎖(TCRγ)、B細胞受容体(BCR)、BCR軽鎖(BCRL)、BCR重鎖(BCRH)、免疫グロブリン軽鎖(IgL)、免疫グロブリン重鎖(IgH)、免疫グロブリンカッパ鎖(Igκ)、および免疫グロブリンラムダ鎖(Igλ)からなる群から選択される、免疫細胞受容体を含むがこれらに限定されない、任意の免疫細胞受容体でありうる。例えば、免疫受容体鎖遺伝子は、TCRβでありうる。
本明細書で記載される方法は、非生産的免疫受容体遺伝子の修復をもたらす。すなわち、方法は、免疫細胞選択過程において選択されないため、対象の免疫細胞の表面において発現されない、免疫受容体遺伝子の同定をもたらす。非生産的免疫受容体遺伝子の修復は、本明細書で記載される、複数の適用がなされ、例えば、マッチング対象において、免疫細胞受容体選択過程を比較する、例えば、免疫細胞と関連する有害事象(例えば、臓器拒絶、移植片対宿主病、がんの再発など)を予測するのに使用されうる。非生産的免疫細胞受容体鎖遺伝子、例えば、TCRβ遺伝子の修復は、前記TCRβ遺伝子のヌクレオチド配列を修飾して、他の点では、生産的配列として分類される配列を得ることを含みうる。非生産的TCRβ遺伝子は、アウトオブフレームの遺伝子セグメントを伴うTCRβ遺伝子、または遺伝子セグメント間の体細胞接合部内の終止コドンおよび体細胞変異を伴うTCRβ遺伝子でありうる。したがって、非生産的TCRβ遺伝子を修復するステップは、遺伝子セグメント間の体細胞接合部において、1つまたは複数のヌクレオチドを付加または除去して、遺伝子セグメントを、同じリーディングフレーム内に組み込むか、または遺伝子セグメント間の体細胞領域内のヌクレオチドを突然変異させて、終止コドンを、アミノ酸へと転換することを含みうる。
非生産的TCRβ遺伝子は、抗原認識が可能なTCRβを発現しないTCRβ遺伝子を含みうる。本明細書で記載されるTCRβ遺伝子の修復(例えば、免疫受容体配列の修飾)は、抗原認識が可能であるアミノ酸配列を有する免疫受容体の作出を結果としてもたらしうる。非生産的TCRβ遺伝子を修復するステップは、Dセグメントのリーディングフレームを、同じリーディングフレーム内に組み込まずに、VセグメントおよびJセグメントを、同じリーディングフレーム内に組み込むことを含みうる。本明細書で使用される、「遺伝子断片を、同じリーディングフレーム内に組み込む」は、遺伝子セグメント間の体細胞接合部において、1つまたは複数のヌクレオチドを付加または除去して、遺伝子セグメントを、同じリーディングフレーム内に組み込むことを含みうる。1つまたは複数のヌクレオチドは、リーディングフレームが回復されるように、付加される場合もあり、除去される場合もある、1つまたは2つのヌクレオチドを含みうる。
本明細書で記載される方法は、一般に、免疫受容体鎖遺伝子を修復するのに、最小数の配列修飾の使用に依拠することが理解されるものとする。すなわち、方法は、一般に、遺伝子断片を、同じリーディングフレーム内に組み込む、1つもしくは2つのヌクレオチドの付加もしくは欠失、またはアミノ酸配列から、終止コドンを除去する、1つのアミノ酸の突然変異に依拠する。しかし、一部の場合に、初期修飾は、抗原認識が可能な受容体鎖をコードするアミノ酸配列を得るのに、第2の(または第3の、または第4の)修飾を要求しうる、二次事象(または三次事象、または四次事象)を誘導する場合がある。例えば、2つの遺伝子断片を、同じリーディングフレーム内に組み込むための、1つまたは2つのヌクレオチドの付加または欠失は、アミノ酸配列内における、終止コドンの作出をもたらし、アミノ酸認識が可能な免疫受容体の作出を妨げる場合がある。第2の修復では、終止コドンが除去されるであろう。1つを超える修復を使用して、免疫受容体遺伝子を修復することも可能であるが、配列へと導入される修飾が多くなるほど、受容体は初期配列に対して、より人工的、かつ、外来的となることが理解されるものとする。これは、本明細書で記載される方法を使用してなされうる予測の品質の劣化と関連する場合がある。
通例、複数の体細胞変異が存在するため、非生産的免疫受容体遺伝子を修復する方式も、複数存在する(図3を参照されたい)。遺伝子を修復する、全ての異なる方式が妥当である。各修復は、単一の是正(すなわち、1つのヌクレオチドの除去、2つのヌクレオチドの除去、ヌクレオチドの付加、第1のヌクレオチドおよび第2のヌクレオチドの付加、またはヌクレオチドの突然変異)だけを要求する場合がある。ある実施形態では、1つの修復は、遺伝子セグメントを、同じリーディングフレーム内に組み込むか、または終止コドンを、アミノ酸のためのコドンへと変化させるように、1つのヌクレオチドの除去、2つのヌクレオチドの除去、ヌクレオチドの付加、またはヌクレオチドの突然変異を含む。本明細書で記載される方法では、1つを超える修飾が、修復されることを要求する受容体は、免疫受容体についての解析において検討されない。ある実施形態では、2つを超えるか、または3つを超えるか、または4つを超える修飾が、修復されることを要求する受容体は、免疫受容体についての解析において検討されない。本明細書で記載される方法では、免疫受容体の修復は、VDJ組換え事象の後における、免疫受容体鎖遺伝子配列(例えば、核酸配列またはアミノ酸配列)の修復を含む場合があるので、修復遺伝子または生殖細胞系列遺伝子では、免疫受容体鎖遺伝子配列の修復は指向されない。
TCRβ遺伝子配列は、TCRβ遺伝子の相補性決定領域1(CDR1)配列、TCRβ遺伝子のCDR2配列、TCRβ遺伝子のCDR3配列、これらの組合せ、または完全TCRβ遺伝子の配列を含みうる。例えば、TCRβ遺伝子配列は、TCRβ遺伝子のCDR3配列でありうる。
本明細書で記載される分類法のための、TCRβ遺伝子配列の使用は、TCRβ遺伝子配列の全体の使用の場合もあり、この任意の断片の使用の場合もある。例えば、TCRβ遺伝子配列は、TCRβ遺伝子配列から除去されうる、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸を除いた、TCRβ遺伝子配列の全体を含みうる。
TCRβ遺伝子配列を得るステップは、対象に由来する、任意の試料中のTCRβ遺伝子をシーケンシングすることを含みうる。例えば、試料は、免疫細胞、例えば、T細胞を含有する生物学的試料でありうる。試料は、対象に由来する血液試料でありうる。血液試料は、末梢血単核細胞試料でありうる。
免疫細胞は、免疫細胞受容体遺伝子をシーケンシングする前に、試料から分離されうる。例えば、T細胞は、試料から単離されうる。T細胞を単離することは、細胞分取および/またはRNA発現を介しうる。
T細胞は、従来型の適応T細胞(ヘルパーCD4+T細胞、細胞傷害性CD8+T細胞、メモリーT細胞、および制御性CD4+T細胞を含む)または自然様T細胞(ナチュラルキラーT細胞および粘膜会合不変T細胞を含む)を含むがこれらに限定されない、任意のT細胞でありうる。例えば、T細胞は、非制御性T細胞でありうる。
対象は、ヒトなどの哺乳動物でありうる。
使用法
本明細書で記載される免疫細胞受容体の分類は、臓器ドナー/臓器レシピエント間の適合性を決定する適用、レシピエントにおける移植片対宿主病(GvHD)を予測する適応、および対象におけるがんの再発を予測する適応(図20を参照されたい)を含むがこれらに限定されない、様々な適用において使用されうる。
臓器ドナー/臓器レシピエント間の適合性を決定する方法が提供される。
方法は、本明細書で記載される方法を使用して、臓器ドナーのTCRβ遺伝子、および臓器レシピエントのTCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ;ドナーにおける、生産的TCRβ遺伝子および修復TCRβ遺伝子の数を、レシピエントにおける、生産的TCRβ遺伝子の数と比較するステップ;ならびに臓器ドナーと適合性である、臓器レシピエントに由来するTCRβ遺伝子の割合を定量し、これにより、臓器ドナー/臓器レシピエント間の適合性を決定するステップを含みうる。
比較するステップは、PSFレシピエントと表記される、ポスト・セレクション・フラクションスコアを計算することを含む場合があり、この場合、PSFレシピエントスコアは、F生産的と、F総数との比であり、F総数は、F修復+F生産的であり、F生産的は、臓器レシピエントおよび臓器ドナーのいずれにおいても、生産的TCRβ遺伝子として同定されたTCRβ遺伝子の数であり、F修復は、臓器ドナーにおいて、修復TCRβ遺伝子として同定され、臓器レシピエントにおいて、生産的TCRβ遺伝子として同定された、TCRβ遺伝子の数である。PSFレシピエントは、0~1の範囲でありうる。PSFレシピエントが、ゼロであることは、臓器レシピエントにおいてシーケンシングされた、いかなるTCRβ遺伝子も、臓器ドナーと適合性でないことを指し示しうる。PSFレシピエントスコアが、1であることは、臓器ドナーにおいてシーケンシングされた、全てのTCRβ遺伝子が、臓器レシピエントと適合性であることを指し示しうる。TCRβ遺伝子配列は、TCRβ遺伝子のCDR3配列を含みうる。TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸は、除去されうる。
0.81以上のPSFレシピエントスコアは、臓器ドナーと、臓器レシピエントとの間の適合性を指し示しうる。代替的に、0.81未満のPSFレシピエントスコアは、臓器ドナーと、臓器レシピエントとの間の不適合性を指し示しうる。
好適なスコアは、臓器レシピエントと、臓器ドナーとの適合性について評価することに責任を負う、医師、または別の医療従事者により、ドナーから、レシピエントへの臓器の移植に好適であると解釈されるスコアとして規定されうる。不適なスコアは、ドナーから、レシピエントへの臓器の移植に好適でないと解釈されるスコアとして規定されうる。本明細書で記載される方法は、臓器ドナーから、臓器レシピエントへの臓器の移植を一般に含む、臓器レシピエントの処置をさらに含みうる。本明細書で記載される通り、処置は、本明細書で記載される方法により決定されるスコアが、好適である場合に、臓器レシピエントへと投与されるものとする。
レシピエントにおける移植片対宿主病(GvHD)を予測する方法
レシピエントにおける移植片対宿主病(GvHD)を予測する方法が提供される。
方法は、本明細書で記載される方法を使用して、ドナーのT細胞受容体β(TCRβ)遺伝子、およびレシピエントのTCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ;レシピエントにおける、生産的TCRβ遺伝子および修復TCRβ遺伝子の数を、ドナーにおける、生産的TCRβ遺伝子の数と比較するステップ;ならびにレシピエントと適合性であるドナーに由来するTCRβの割合を定量し、これにより、レシピエントにおけるGvHDを予測するステップを含みうる。
GvHDは、急性GvHD(aGvHD)、または慢性GvHD(cGvHD)でありうる。
臓器または細胞は、骨髄または造血幹細胞移植細胞でありうる。
TCRβ遺伝子配列は、TCRβ遺伝子のCDR3配列を含みうる。TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸は、除去されうる。
aGvHDを予測するステップは、レシピエントと適合性であるドナーに由来する生産的TCRβ遺伝子の数を定量することを含みうる。レシピエントと適合性であるドナーに由来する生産的TCRβ遺伝子の数を定量するステップは、PSFドナー-生産的と表記される、ポスト・セレクション・フラクションスコアを計算することを含む場合があり、この場合、PSFドナー-生産的スコアは、F生産的と、F総数との比であり、F総数は、F修復+F生産的であり、F生産的は、ドナーおよびレシピエントのいずれにおいても、生産的TCRβ遺伝子として同定されたTCRβ遺伝子の数であり、F修復は、レシピエントにおいて、修復TCRβ遺伝子として同定され、ドナーにおいて、生産的TCRβ遺伝子として同定された、TCRβ遺伝子の数である。(図12Aを参照されたい)
0.81以上のPSFドナー-生産的スコアは、ドナーと、レシピエントとの間の適合性を指し示しうる。代替的に、0.81未満のPSFドナー-生産的スコアは、ドナーと、レシピエントとの間の不適合性、およびレシピエントが、aGvHDを発症する可能性を指し示しうる。例えば、約0.8~0.83の範囲未満のPSFドナー-生産的スコアは、aGvHDを予測するのに使用されうる。
cGvHDを予測するステップは、レシピエントと適合性であるドナーに由来する修復TCRβ遺伝子の数を定量することを含みうる。レシピエントと適合性であるドナーに由来する修復TCRβ遺伝子の数を定量するステップは、PSFドナー-修復と表記される、ポスト・セレクション・フラクションスコアを計算することを含む場合があり、この場合、PSFドナー-修復スコアは、F生産的と、F総数との比であり、F総数は、F修復+F生産的であり、F生産的は、レシピエントにおいて、生産的TCRβ遺伝子として同定され、ドナーにおいて、修復として同定されたTCRβ遺伝子の数であり、F修復は、レシピエントおよびドナーのいずれにおいても、修復TCRβ遺伝子として同定されたTCRβ遺伝子の数である。
0.69以上のPSFドナー-修復スコアは、ドナーと、レシピエントとの間の適合性を指し示しうる。代替的に、0.69未満のPSFドナー-修復スコアは、ドナーと、レシピエントとの間の不適合性、およびレシピエントが、cGvHDを発症する可能性を指し示しうる。例えば、約0.69~0.3の範囲未満のPSFドナー-修復スコアは、cGvHDを予測するのに使用されうる。(図13Aを参照されたい)
好適なスコアは、レシピエントにおけるGvHDを発症する危険性について評価することに責任を負う、医師、または別の医療従事者により、ドナーから、レシピエントへの、骨髄または造血幹細胞移植細胞の移植に好適であると解釈されるスコアとして規定されうる。不適なスコアは、ドナーから、レシピエントへの、骨髄または造血幹細胞移植細胞の移植に好適でないと解釈されるスコアとして規定されうる。本明細書で記載される方法は、ドナーから、レシピエントへの、骨髄または造血幹細胞移植細胞の移植を一般に含む、レシピエントの処置をさらに含みうる。本明細書で記載される通り、処置は、本明細書で記載される方法により決定されるスコアが、好適である場合に、レシピエントへと投与されるものとする。
対象におけるがんの再発を予測する方法
GvHDは、抗がん応答と関連するため、GvHDの危険性を低減するための、いかなる新たなスクリーニング法も、がん再発の危険性を不用意に増大させうるであろう。しかし、GvHDおよびがん再発のいずれもが回避されうることは、がん再発についてのスクリーニングを伴う、GvHDについてのスクリーニングが、いずれの転帰についての危険性を最小化するのにも使用されうることを示唆する。あらゆる抗原に対して特異性を有するTCRレパートリーは存在しないため、レシピエントのがんは、レシピエントのTCR特異性における、任意のギャップを利用することが仮定される。この仮定に従えば、レシピエントと異なる、多数のTCRを伴うドナーは、レシピエントと同じTCRを伴うドナーより、これらのギャップを埋める可能性が高いであろう。本明細書では、レシピエントに存在しないドナーTCRの定量が、GvHDを予測するための、本発明者らのマーカーとは別である、がんの再発を予測するためのマーカーとして利用されうることが裏付けられた。
対象におけるがんの再発を予測する方法が提供される。
方法は、本明細書で記載される方法を使用して、造血幹細胞ドナーのTCRβ遺伝子、および造血幹細胞レシピエントのTCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ;造血幹細胞ドナー、および造血幹細胞レシピエントの両方における、修復TCRβ遺伝子の数を比較するステップ;ならびに造血幹細胞ドナーにおいて、造血幹細胞レシピエントにおいて見出されない、修復TCRβ遺伝子の数を定量し、これにより、がんの再発を予測するステップを含みうる。
造血幹細胞レシピエントは、がんを有する対象でありうる。造血幹細胞ドナーに由来し、造血幹細胞レシピエントにおいて存在しない修復TCRβ遺伝子は、造血幹細胞レシピエントにおけるがん細胞を認識するT細胞受容体(TCR)をもたらす可能性が高い場合がある。
定量するステップは、造血幹細胞レシピエントと、造血幹細胞ドナーとの間で共通である、修復TCRβ遺伝子の数を除外して、造血幹細胞ドナーにおいて、修復TCRβ遺伝子として同定されるTCRβ遺伝子の総数の割合であるf新規スコアを計算することを含みうる。
造血幹細胞レシピエントと、造血幹細胞ドナーとの間のf新規スコアが小さいほど、がん再発の危険性は大きくなりうる。
造血幹細胞レシピエントと、造血幹細胞ドナーとの間のf新規スコアが大きいほど、がん再発が生じない可能性は大きくなりうる。TCRβ遺伝子配列は、TCRβ遺伝子のCDR3配列を含みうる。TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸は、除去されうる。
0.994以上のf新規スコアは、ドナーに由来するTCRβ遺伝子が、がん細胞を認識するTCRβをもたらす可能性、およびレシピエントが、がんの再発を発症しない可能性を指し示す。代替的に、0.994未満のf新規スコアは、ドナーに由来するTCRβ遺伝子が、がん細胞を認識するTCRβをもたらす可能性の非存在、およびレシピエントが、がんの再発を発症する可能性を指し示す。
がんは、白血病、リンパ腫、および血液悪性腫瘍からなる群から選択されうる。
好適なスコアは、造血幹細胞レシピエントにおける、がん再発の危険性について評価することに責任を負う、医師、または別の医療従事者により、ドナーから、レシピエントへの、骨髄または造血幹細胞移植細胞の移植に好適であると解釈されるスコアとして規定されうる。不適なスコアは、ドナーから、レシピエントへの、骨髄または造血幹細胞移植細胞の移植に好適でないと解釈されるスコアとして規定されうる。本明細書で記載される方法は、ドナーから、がんを有するレシピエントへの、骨髄または造血幹細胞移植細胞の移植を一般に含む、レシピエントの処置をさらに含みうる。本明細書で記載される通り、処置は、本明細書で記載される方法により決定されるスコアが、好適である場合に、レシピエントへと投与されるものとする。
機械学習システム
本明細書で記載される機械学習システムは、任意の免疫細胞受容体へと適用されうる。例えば、免疫受容体鎖遺伝子は、T細胞受容体(TCR)、TCRアルファ鎖(TCRα)、TCRベータ鎖(TCRβ)、TCRデルタ鎖(TCRδ)、TCRガンマ鎖(TCRγ)、B細胞受容体(BCR)、BCR軽鎖(BCRL)、BCR重鎖(BCRH)、免疫グロブリン軽鎖(IgL)、免疫グロブリン重鎖(IgH)、免疫グロブリンカッパ鎖(Igκ)、および免疫グロブリンラムダ鎖(Igλ)からなる群から選択されうる。本明細書では、TCRβ遺伝子を、免疫受容体鎖遺伝子として使用する、機械学習システムが例示される。遺伝子セグメントは、バリアブル(V)遺伝子セグメント、ダイバーシティ(D)遺伝子セグメント、ジョイニング(J)遺伝子セグメント、およびこれらの組合せからなる群から選択されうる。
図2は、T細胞選択を予測するための例示的過程100を例示する。ステップ102では、被験TCRβ遺伝子のセットが、組織試料から得られる。例えば、T細胞選択を経ていないTCRβ遺伝子を得るように、被験TCRβ遺伝子のセットは、胸腺に由来する組織内に含まれる発生期T細胞からシーケンシングされうる。被験TCRβ遺伝子のセットはまた、他の末梢組織(例えば、脾臓、結腸、皮膚などに由来する)内に含まれる、成熟T細胞からも得られうる。被験TCRβ遺伝子のセットは、成熟T細胞内に含まれる、機能的TCRβを発現する生産的TCRβ遺伝子を含みうる。被験TCRβ遺伝子のセットはまた、機能的TCRを発現することができない非生産的TCRβ遺伝子も含みうる。ステップ104では、被験TCRβ遺伝子のセットは、TCRβタンパク質配列へと翻訳される。非生産的TCRβ遺伝子の配列を、タンパク質配列へと翻訳するために、非生産的TCRβ遺伝子を、生産的TCRβ遺伝子へと転換する、1つまたは複数のアルゴリズムを使用して、非生産的TCRβ遺伝子が修復されうる。
天然TCRβ遺伝子組換えの、入り組んだ、複雑なバイアスを含有する、元の生物学的配列を最大限に保存するために、コンピュータアルゴリズムは、生産的コピーを得るのに要求される、最少の変更を使用して、各非生産的TCRβ遺伝子を修復する。修復TCRβ遺伝子は、天然で生じる遺伝子変更を、より緊密に模倣する。したがって、切り貼りにより修復されたTCRβ遺伝子の解析は、T細胞選択を再構成するための方法の確度および精度を、組換え遺伝子セグメント(例えば、Vセグメント、Dセグメント、およびJセグメント)をシミュレートして、TCRβ遺伝子のシミュレーションの創出に依拠する方法を含む、他の技法を超えて改善する。
各修復は、対象の非生産的遺伝子において、天然で出現する修復の確率に従い重み付けされうる。各修復について、重み(すなわち、修復が天然で生じる確率)を決定するために、TCRβ遺伝子の部分配列を、修復の近傍において単離し、対象の非生産的TCRβ遺伝子内で、この部分配列を観察する確率を、修復の重みを決定するのに使用することができる。対象の非生産的TCRβ遺伝子内の修復の近傍における、部分配列の発生に基づき、修復に重み付けするために、修復の近傍半径(すなわち、2ヌクレオチド)を規定し、部分配列内の、この半径以内にある、あらゆるヌクレオチドを含むことにより、修復の近傍において、部分配列を単離することができる。ヌクレオチドについての、遺伝子セグメント(すなわち、V(D)J)によるアノテーションを指し示す、各ヌクレオチドと対にされた、さらなる記号もまた、含めうる。例えば、ヌクレオチドが、Vセグメントに由来することを指し示すように、ヌクレオチドは、Vと対にされる場合もあり、ヌクレオチドが、Dセグメントに由来することを指し示すように、Dと対にされる場合もあり、ヌクレオチドが、Jセグメントに由来することを指し示すように、Jと対にされる場合もあり、ヌクレオチドが、体細胞変異に由来することを指し示すように、Sと対にされる場合もあるであろう。次いで、あらゆる部分配列を、対象の、あらゆる非生産的TCRβ遺伝子から単離することができる。前出と同じ半径を使用して、体細胞接合部内の、あらゆる位置の近傍半径を規定し、この半径以内にある、あらゆるヌクレオチドを、部分配列内に含めることができる。この運用は、あらゆる非生産的TCRβ遺伝子について、対象の、全ての関連する部分配列を単離するように、体細胞接合部内の、あらゆる位置について実施することができる。次いで、非生産的TCRβ遺伝子の中で、部分配列が単離される回数を、対象の非生産的TCRβ遺伝子の全ての中で、単離される部分配列の数で除することにより、修復の近傍において、部分配列を観察する確率を計算することができる。次いで、この値を、修復の重みを決定するための確率として使用することができる。
図3は、非生産的TCRβ遺伝子を修復するのになされる、例示的変更を例示する。V遺伝子セグメントと、J遺伝子セグメントとが、異なるオープンリーディングフレーム内にある例についての、図3の上方のセクション「a」において示される通り、アルゴリズムは、遺伝子セグメントを、同じオープンリーディングフレーム内に組み込むように、最小数のヌクレオチドを、体細胞接合部から除去するための、あらゆる順列をウォークスルーする。リーディングフレームに応じて、アルゴリズムは、1つまたは2つのヌクレオチドだけを除去する。終止コドンがある例についての、図3の下方のセクション「b」において示される通り、アルゴリズムは、終止コドンを、アミノ酸残基へと転換する、体細胞接合部内の、あらゆる可能なヌクレオチド突然変異をウォークスルーする。終止コドンを除去するために、アルゴリズムは、1つのヌクレオチドだけを突然変異させる。非生産的TCRβ遺伝子を修復するための、多くの方式が存在するので、単一の非生産的コピーから、複数の修復TCRβ遺伝子が作出される。非生産的TCRβ遺伝子を修復するステップは、遺伝子セグメント間の体細胞接合部において、ヌクレオチドを除去して、遺伝子セグメントを、同じリーディングフレーム内に組み込むか、または遺伝子セグメント間の体細胞領域内のヌクレオチドを突然変異させて、終止コドンを、アミノ酸へと転換することを含みうる。非生産的として同定されたTCRβ遺伝子を修復するステップは、修復TCRβ遺伝子を作出することを含みうる。
T細胞選択後に存続したTCRβのタンパク質配列は、生産的TCRβ遺伝子を翻訳することにより得られうる。TCRβについての全選択前ライブラリーを近似するために、修復TCR遺伝子を翻訳することにより、T細胞選択にかけられなかった、TCRβのタンパク質配列を得ることができる。いずれの種類のTCRβ遺伝子も、単一の試行から、10を超える、顕著に異なるTCRβ遺伝子をもたらしうる、バルクTCRβシーケンシングにより、同時に捕捉することができ、TCR遺伝子のうちの、少なくとも80%は、典型的に、生産的である(β鎖であるとする)。
ステップ106では、TCRβ遺伝子について、遺伝子特徴が決定される。遺伝子特徴は、機械学習システムにより解釈されうる、コンピュータで読取り可能なフォーマットにおいて、TCRβ遺伝子を表す。遺伝子特徴を生成するために、各TCRβ遺伝子内に含まれる遺伝子セグメントを、各遺伝子セグメントの遺伝子コード内に含まれた意味を、定量的フォーマット(例えば、多次元ベクトル空間内の位置について記載する数)へと変換する、1つまたは複数の遺伝子特徴をアウトプットする、コードレイヤーへとインプットすることができる。ステップ108では、TCRβタンパク質配列について、特徴ベクトルが決定される。特徴ベクトルは、機械学習システムにより解釈されうる、コンピュータで読取り可能なフォーマットにおいて、TCRβタンパク質配列を表す。特徴ベクトルを生成するために、各TCRβタンパク質のアミノ酸配列内に含まれた意味を、定量的フォーマット(例えば、多次元ベクトル空間内の位置について記載する数)へと変換する、1つまたは複数のタンパク質特徴をアウトプットするコードレイヤーへと、TCRβタンパク質配列をインプットすることができる。
ステップ110では、機械学習システムは、遺伝子特徴およびタンパク質特徴に基づき、TCRβ遺伝子のセット内に含まれる各TCRについて、選択予測を決定する。機械学習システムは、TCRβが、生産的TCRβ遺伝子、または非生産的修復TCRβ遺伝子に由来する確率を決定することにより、選択予測を生成しうる。非生産的TCRβ遺伝子は、アウトオブフレームの遺伝子セグメントを伴うTCRβ遺伝子、または遺伝子セグメント間の体細胞接合部内の終止コドンを伴うTCRβ遺伝子でありうる。抗原認識に関与するアミノ酸配列をコードするTCRβ遺伝子は、生産的TCRβ遺伝子として同定することができ、抗原認識に関与しないアミノ酸配列を伴うTCRβ遺伝子は、非生産的TCRβ遺伝子として同定することができる。生産的TCRβ遺伝子に由来する確率が、非生産的修復TCRβ遺伝子に由来する確率を超えるTCRβは、T細胞選択後に存続することが予測されうる。生産的TCRβ遺伝子に由来する確率が、非生産的修復TCRβ遺伝子に由来する確率未満であるTCRβは、T細胞選択時に間引かれることが予測されうる。ステップ112では、TCRβについてのT細胞選択予測を、下記で記載される、1つまたは複数の適用において使用することができる。
図4は、例示的機械学習システム220を例示する。機械学習システム220は、免疫細胞選択過程(例えば、T細胞選択、B細胞選択など)をシミュレートすることができる。機械学習システムは、インプットされた免疫細胞選択データ202を受信し、免疫細胞選択予測280を、アウトプットとして生成することにより、免疫細胞選択をシミュレートすることができる。免疫細胞選択データ202は、細胞についての、1つまたは複数の表示を含みうる。例えば、T細胞選択をシミュレートするために、免疫細胞選択データ202は、T細胞受容体ベータ鎖(TCRβ)を表すTCRデータを含みうる。TCRβについての表示は、TCRβ鎖の、遺伝子セグメント、および他の遺伝子情報(例えば、遺伝子セグメントA 204A、・・・、遺伝子セグメントN 204N)、ならびに他の側面(例えば、相補性決定領域)を表しうる、タンパク質配列206を含みうる。例えば、遺伝子セグメントA 204Aは、TCRβのV遺伝子セグメントの場合があり、遺伝子セグメントN 204Nは、TCRβのJ遺伝子セグメントの場合があり、タンパク質配列206は、TCRβをコードするTCR遺伝子の、相補性決定領域3(CDR3)(すなわち、体細胞接合部およびD遺伝子セグメントを捕捉する、TCRβ遺伝子の領域)を表すアミノ酸配列でありうる。これらの3つの構成要素は、併せて、完全なTCRβ鎖を表す。
機械学習システム220に含まれる1つまたは複数のコードレイヤー230は、免疫細胞選択データ202中に含まれる、遺伝子情報およびタンパク質配列を、機械学習システム220により理解されうる、コンピュータで読取り可能なフォーマットへと転換するのに使用されうる。例えば、コードレイヤー230は、遺伝子セグメント204A、・・・、204Nを、遺伝子特徴232へと転換し、タンパク質配列206を、タンパク質特徴234へと転換しうる。コードレイヤー230は、One-Hotエンコーディング、またはカテゴリー変数を、機械学習モデルへと提示されうるベクトル表示へとマッピングする、他の技法を使用して、遺伝子特徴232を決定しうる。例えば、コードレイヤー230は、TCRβをコードするTCR遺伝子のV遺伝子セグメント、28の二値ベクトル、または他の遺伝子特徴232へと転換しうる。コードレイヤー230は、TCRβ遺伝子をコードするTCR遺伝子のJ遺伝子セグメントを、14の二値ベクトル、または他の遺伝子特徴232へと転換しうる。
タンパク質配列206についての、タンパク質特徴234を決定するために、コードレイヤー230は、アチュレー数(すなわち、各アミノ酸の特性と関連する1つのデータ)を使用して、タンパク質配列206内に含まれる各アミノ酸を表しうる。例えば、アチュレー数は、各アミノ酸の化学的特性および/または物理的特性に、緩やかに対応する値を含みうる。アチュレー数により表されるアミノ酸特性は、極性、1つまたは複数の二次構造の会合、分子の体積、コドンの多様性、および/または電荷を含みうる。例えば、コードレイヤー230は、タンパク質配列206内に含まれる各アミノ酸について、5つのアチュレー数を含有するベクトルを決定することが可能であり、アミノ酸を、適切なアチュレーベクトルで置きかえうる。したがって、コードレイヤー230により提示される、タンパク質特徴234は、タンパク質配列206の各々の中に含まれる各アミノ酸についてのアチュレーベクトルに対応する数値ベクトルの配列でありうる。タンパク質配列206内に含まれるアミノ酸の数は、可変的であるので、各タンパク質配列206についてのタンパク質特徴234は、8つ~20の間のベクトルを含みうる。
B細胞選択の予測のために、機械学習システム220は、ナイーブB細胞からシーケンシングされるBCR重鎖(BCRH)をコードするBCR遺伝子についてのB細胞受容体(BCR)データを含む、B細胞選択データ202を受信しうる。発生期B細胞は、デノボのB細胞受容体(BCR)遺伝子をアセンブルするように、V遺伝子セグメントCDR3遺伝子セグメントおよびJ遺伝子セグメントの組換えにより、それらのDNAを編集する。したがって、BCR遺伝子についての、遺伝子セグメント204A、・・・、204N、およびタンパク質配列206の長さは、TCRβについての表示と同じでありうる。したがって、コードレイヤー230は、B細胞選択を予測する場合にも、T細胞選択を予測する場合に生成される、同じ数および種類の遺伝子特徴232およびタンパク質特徴234を生成しうる。
免疫細胞区画をシミュレートするために、コードレイヤー230により決定される、遺伝子特徴232およびタンパク質特徴234を、1つまたは複数の予測モデル240へとインプットする。予測モデル240は、1つまたは複数のトレーニングレイヤー(例えば、トレーニングレイヤーセットA 242A、・・・、トレーニングレイヤーセットN 242N)を含む。遺伝子特徴232およびタンパク質特徴234に、トレーニングレイヤーセット242A、・・・242N内に含まれる重み値を乗じて、セット予測244A、・・・、244Nを生成する。各特徴へと割り当てられる重み値は、選択転帰が既知である、予測特異的遺伝子についてのトレーニングデータセットに基づき導出することができる。例えば、TCR選択予測は、TCR遺伝子を含むトレーニングデータセットから導出された重み値を使用して決定されうる。BCR選択予測は、BCR遺伝子を含むトレーニングデータセットから導出された重み値を使用して決定されうる。各特徴に固有の重み値は、各トレーニングレイヤーについて、方形246A、・・・、246N内に含まれる異なる網掛けにより表される。トレーニングレイヤーセット242A、・・・242N内に含まれる方形246A、・・・、246Nの各々は、免疫細胞選択データ202のトレーニングセット内に含まれる遺伝子特徴232および/またはタンパク質特徴234のうちの1つまたは複数に対応する。各特徴へと割り当てるための、最適の重み値は、下記の図5に記載される、トレーニング過程を使用して決定される。
遺伝子特徴232に乗じるのに使用される、トレーニングレイヤーセット242A、・・・242N内に含まれる重み値の数が、一定となりうるように、遺伝子セグメント204A、・・・、204Nの各々についての遺伝子特徴232の数を、固定することができる。例えば、TCRβをコードするTCR遺伝子のV遺伝子セグメント、またはBCRHをコードするBCR遺伝子について、28の遺伝子特徴232を決定することができ、TCRβのJ遺伝子セグメント、またはBCRH遺伝子について、14の遺伝子特徴232を決定することができる。したがって、遺伝子特徴232を操作するのに使用される、トレーニングレイヤーセット242A、・・・、242Nは、重み値の数が固定された、デンスレイヤーでありうる。短いタンパク質配列ほど、各アミノ酸についてのアチュレー数を表す、少数のベクトルにより表しうるため、タンパク質配列206の各々について、タンパク質特徴234の数は、可変的でありうる。各タンパク質配列についての、可変数のアチュレー数ベクトルを操作するのに、ダイナミック・カーネル・マッチング(dynamic kernel matching)(また、(ダイナミック・タイム-アライメント・カーネル(dynamic time-alignment kernel)とも称される)、または可変数の特徴を、あらかじめ固定された数の重み値へと割り当てるための他の技法を使用することができる。例えば、ダイナミック・カーネル・マッチング過程は、特徴(すなわち、タンパク質特徴234、または可変数を有する、他の特徴)と、類似性スコアとしての重みとの内積の計算を要求する場合がある。次いで、アライメントアルゴリズムは、特徴と、重みとをマッチさせて、アライメントスコア(すなわち、特徴と、重みとの間の、類似性スコアの合計についての最大値)を決定することができる。次いで、アライメントスコアを使用して、可変数のタンパク質特徴234を、トレーニングレイヤー内の、固定数の重みとマッチさせることができる。次いで、各タンパク質特徴234に、そのマッチング重みを乗じて、予測を生成する。
次いで、セット予測244A、・・・、244Nに含まれる値の各々について期待される大きさが同じであることを確保するように、正規化レイヤー250を使用して、各トレーニングレイヤーセット242A、・・・、242Nにより生成されたセット予測244A、・・・、244Nをスケーリングする。例えば、正規化レイヤー250は、V遺伝子セグメント、J遺伝子セグメント、およびCDR3についての、セット予測244A、・・・、244Nに期待される大きさが、同じとなるように、トレーニングレイヤーセット242A、・・・、242Nにより生成された値(すなわち、各遺伝子特徴232および/またはタンパク質特徴234と、その対応する重み値との積の合計)をスケーリングしうる。セット予測244A、・・・、244Nに含まれる値のスケーリングは、遺伝子セグメント204A、・・・、204Nの各々、およびタンパク質配列206について生成された値が組み合わされて、完全なTCRβまたはBCRHについてのモデル予測260を生成することを可能とする。モデル予測260は、予測モデルの各々により生成されたモデル予測260に含まれる値が、同じ大きさであり、組み合わされうるように、正規化レイヤー250によりリスケーリングすることができる。
予測モデル240のアンサンブルは、免疫細胞選択予測280を生成するのに使用されうる。例えば、32の、異なる、個別トレーニングモデル240は、免疫細胞選択予測280を生成するのに使用されうる。ニューラル・コミッティー・ツリー270は、機械学習モデル240の各々に由来するモデル予測260を統合して、各TCRβをコードする、各TCR遺伝子についての、1つのTCR選択予測、および/または各BCRHをコードする、各BCR遺伝子についての、1つのBCR選択予測を生成するのに使用されうる。ニューラル・コミッティー・ツリー270は、改変型ニューラル決定木アーキテクチャーを含みうる。改変型ニューラル決定木アーキテクチャーは、モデル予測260を統合して、免疫細胞選択予測280を生成するのに使用される、2つを超える連続決定の階層的配置を含みうる。例えば、改変型ニューラル決定木アーキテクチャーは、決定が、各ブランチと関連する、ブランチの階層的配置を含みうる。階層的配置の上位に位置するブランチでなされる決定は、決定木を通るパス、および決定木の終端に到達した終端決定を決定する。図5の下図は、ニューラル・コミッティー・ツリー内に含まれる簡略改変型ニューラル・コミッティー・ツリーアーキテクチャーを例示する。
免疫細胞選択予測280を生成するために、モデル予測260は、ニューラル・コミッティー・ツリー270内に含まれるニューラル決定木において決定を下すのに使用されうる。ニューラル決定木において決定を下すために、モデル予測260に含まれる値の各々は、二分決定を表す確率を生成するように、シグモイド関数または他の数学的関数へと渡されうる。確率に対応する二分決定は、ニューラル決定木内のブランチ上で、軟判定を下すのに使用されうる。この過程は、ニューラル決定木における、全ての決定がなされ、インプットされたモデル予測260についての予測が決定されるまで繰り返される。次いで、全ての予測モデル240により生成される、モデル予測260の各々から決定された選択予測を統合して、TCRβおよび/またはBCRHについての、免疫細胞選択予測280を生成する。例えば、32の予測モデル240により生成される、32のモデル予測260の各々について、ニューラル・コミッティー・ツリー270により決定された選択予測を平均して、免疫細胞選択予測280を生成することができる。
免疫細胞選択予測280の精度を増強するために、ニューラル・コミッティー・ツリー270は、改変型ニューラル決定木アーキテクチャーを含むことができる。ニューラル・コミッティー・ツリー270構造は、ニューラル決定木の基部における重みの寄与の除外を希釈して、ニューラル決定木上の終端ブランチにおける重みの寄与の除外をマッチさせるように、ニューラル決定木の基部に、より多くの重みを含むことができる。ニューラル決定木の基部に、より多くの重みを付加するために、ニューラル決定木の基部の近傍における各シグモイドを、コミッティー内の各シグモイド関数が、顕著に異なるアウトプットを受信する、シグモイド関数のコミッティーで置きかえることができる。より多くのシグモイド関数の付加は、各シグモイド関数により要求される、さらなるアウトプットを生成するのに要求される、重みの数を増大させる。決定には、シグモイド関数のコミッティーを介して、コミッティー内に含まれる各シグモイド関数のアウトプットを平均することにより到達することができる。
例えば、図5は、例示的なニューラル・コミッティー・ツリーアーキテクチャーを、従来型のニューラル決定木と比較して例示する。図の左側におけるセクション「a」は、ニューラル決定木を例示する。ニューラル決定木では、各決定dは、シグモイド関数σにより下される。ニューラル決定木は、各ブランチと関連する重みに基づき、可能な転帰の範囲を包含した、軟判定を下す。ニューラル決定木の右側のブランチは、重みをσとして使用され、左側のブランチは、重みを1-σとして使用される。ブランチが走査される場合、このブランチと関連する重みに、先行するブランチに由来する重みが乗じられる。終端決定に由来するアウトプットは、確率に対応する。右側のブランチ上の確率の合計は、転帰が、1となる確率を表す。左側のブランチ上の確率の合計は、転帰が、0となる確率を表す。上位ブランチと関連する重みは、各終端決定に対応する確率を決定するのに繰り返し使用されるため、この構造は、ニューラル決定木の上位ブランチ上の重みにバイアスをかける。例えば、例示された木の左側における上方ブランチと関連する重み(1-σ)は、木の左側の終端決定の4つ全てについての確率(すなわち、π、π、π、およびπ)を計算するのに使用される。逆に、木の左端における終端決定と関連する重み(すなわち、π)は、πに対応する確率を計算するのに、1回だけ使用される。機械学習システム220により生成される予測の精度を増大させるために、改変型ニューラル・コミッティー・ツリー270アーキテクチャーは、木の基部における決定が、終端決定を超えて寄与しないように、各決定の寄与を秤量する。例えば、図5右側のセクション「b」に示されるニューラル・コミッティー・ツリー270は、4つの終端決定を有する。ニューラル・コミッティー・ツリー270の基部(すなわち、上部)は、この決定の数が、木の深さにわたり、同一を維持することを確保するように、4つの決定を併せて平均する。この改変は、学習速度を、木のレベルにわたり平滑化することにより、2つを超える連続決定を有する木について観察される、予測性能の増大を停止させる勾配消失問題を解消する。木の基部における学習速度の緩徐化は、木の基部における決定が、終端部における決定より速く学習されないことを確保する。これは、終端決定における学習が、木の基部における決定に影響を与えることを可能とし、この逆も成り立つ。
コミッティーサイズの、ニューラル決定木内の、各レベルにおけるシグモイド関数の数とのマッチングは、モデルの性能をさらに増大させうる。例えば、木が、32のシグモイド関数を伴う、32の終端ブランチ(各終端ブランチについて、1つのシグモイド関数)を有する場合、ニューラル決定木の基部におけるコミッティーサイズは、32となるように選び取られる。ニューラル決定木内の各レベルにおける、同じ数のシグモイド関数の使用は、各重みが、最終的な予測に、同等に寄与しうることを確保する。上記で記載されたニューラル・コミッティー・ツリー270アーキテクチャーの使用は、モデルの性能の、従来型のニューラル決定木と比べた、5%の増大をもたらした。加えて、ニューラル・コミッティー・ツリーアーキテクチャーは、モデルの性能が、連続決定の数を増大させながら、持続的に増大することを可能とした。したがって、ニューラル・コミッティー・ツリー270内において使用される、ニューラル決定木のサイズは、モデル内の重みの数が、ラベル付けされたデータ点の数と、ほぼ等しくなるまで増大させられた。これは、従来型の決定木を上回る、性能の著明な増大をもたらし、これは、わずか5回の連続決定の後に、最大の性能を達成することが観察された。
図6は、トレーニングレイヤーセット242A、・・・、242N内に含まれる重み値を決定するのに使用された、例示的トレーニング過程を例示する。重み値を決定するために、トレーニングデータ302は、最適化関数を使用して、トレーニングされていないレイヤーセット310A、・・・、310Nをフィッティングするのに使用されうる。トレーニングデータ302は、機械学習システム220により生成された、免疫細胞選択予測280の種類に特異的でありうる。例えば、T細胞選択予測のためのトレーニングデータ302は、選択転帰が既知であるTCRβをコードするTCR遺伝子についてのTCRデータを含みうる。B細胞選択予測のためのトレーニングデータ302は、選択転帰が既知であるBCRHをコードするBCR遺伝子についてのBCRデータを含みうる。トレーニングされていないレイヤーセット310A、・・・、310Nをフィッティングするために、トレーニングされていないレイヤー内に含まれる重み値を、ランダムに初期化する。次いで、勾配最適化関数または他の最適化関数320を使用して、トレーニングデータ302内に含まれる各特徴についての重み値の最適のセットを決定する。例えば、勾配最適化関数は、損失関数に照らした、終端間勾配の最適化をもたらしうる。最適の重み値を決定するように、最適化関数320に、トレーニングデータ302中を、何回かにわたり(例えば、128回にわたり)ランスルーさせることができる。トレーニングデータ302中をランスルーするたびに、重み値を微調整することができ、検証データ304(例えば、T細胞予測のためのTCRデータおよび既知のTCR選択転帰、B細胞予測のためのBCRデータおよび既知のBCR選択転帰などを含むトレーニングデータ302と別個であるデータ標本)を使用して、モデルの性能を調べることができる。
モデルの性能について調べるために、検証データ304内に含まれるTCRβおよびBCRHについての免疫細胞選択予測280(すなわち、生産的遺伝子に由来するTCRβ鎖またはBCRH鎖について、1であり、非生産的遺伝子および/または修復遺伝子に由来するTCRβ鎖またはBCRH鎖について、0である)を、既知の選択転帰と比較することができる。損失関数340(例えば、交差エントロピー損失関数)は、検証セット内に含まれるTCRβ遺伝子およびBCRH遺伝子(すなわち、それぞれ、TCRβをコードするTCR遺伝子、およびBCRHをコードするBCR遺伝子)についての、モデルにより生成される選択予測と、既知の選択転帰との間の誤差を測定しうる。次いで、モデルの性能に基づき、予測モデル240についての、1つまたは複数の態様を変更することができる。例えば、モデルが、それについての選択を正確に予測できなかった、TCRβ遺伝子内またはBCRH遺伝子内に含まれる遺伝子特徴および/またはタンパク質特徴についての重み値を、微調整することができる。トレーニング時間、学習速度、使用される予測モデルの数、遺伝子特徴の数、および他のハイパーパラメータもまた、モデルの性能を増大させるように変化させることができる。重み値および/またはハイパーパラメータは、検証データ304について、損失関数340により決定される、最少の誤差が達成されるまで、微調整され、調べられる。
次いで、テストデータ306(すなわち、トレーニングデータ302および検証データ340と別個であるデータ標本)を使用して、トレーニングされた予測モデル240の性能を査定する。テストデータ306は、実行時に、機械学習システム220へとインプットされているが、予測モデル240により未見である、免疫細胞選択データ(すなわち、トレーニングおよび/または検証のために使用されていない)を含みうる。予測モデル240は、トレーニングレイヤーセット242A、・・・242N内に含まれるトレーニング重み値を使用して、テストデータ306内に含まれるTCRβ遺伝子および/またはBCRH遺伝子についての、免疫細胞選択予測280を生成しうる。次いで、テストデータ306内に含まれるTCRβ遺伝子および/またはBCRH遺伝子についての、免疫細胞選択予測280を、TCRβ遺伝子またはBCRH遺伝子についての、既知の選択予測と比較して、モデルの性能を決定することができる。
使用法
本明細書で記載される機械学習システムは、自己免疫疾患または自己免疫障害を発症する危険性、臓器移植に由来する同種免疫を発症する危険性、臓器移植または細胞移植に由来する移植片対宿主病(GvHD)を発症する危険性、養子T細胞療法に由来する同種免疫を発症する危険性、キメラ抗原受容体(CAR)-T細胞療法に由来する同種免疫を発症する危険性を予測し、対象における抗体薬の安全性を予測するのに使用されうる。
本明細書で使用される、「対象」は、対象の方法が実施される、任意の個体または患者でありうる。一般に、対象は、当業者により理解される通り、ヒトであるが、対象は、動物でありうる。したがって、齧歯動物(マウス、ラット、ハムスター、およびモルモットを含む)、ネコ、イヌ、ウサギ、ウシ、ウマ、ヤギ、ヒツジ、ブタ、ニワトリなどを含む農場動物、および霊長動物(サル、チンパンジー、オランウータン、およびゴリラを含む)などの脊椎動物を含む、他の動物も、対象の定義の中に含まれる。
本明細書で使用される、疾患または状態「を発症する危険性を予測すること」という用語は、本明細書で記載される方法が、閾値に基づき、過誤についての危険性を最小限として、対象が、健常対象と比較して、例えば、疾患または状態を有するか、またはこれらを発症する可能性が高いのかどうかを指し示す能力を指す。
自己免疫疾患または自己免疫障害を発症する危険性を予測する方法
対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測する方法が提供される。
方法は、本明細書で記載される機械学習システムを使用して、T細胞受容体(TCRβ)遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、マッチ健常ドナーまたは複数の健常ドナーにおけるT細胞選択を再構成するステップ;ドナーから再構成されたT細胞選択を、対象へと適用するステップ;および健常ドナーにおけるT細胞選択に失格する、対象における逃避T細胞の数を査定するステップであって、閾値を超える逃避T細胞の数が、自己免疫疾患または自己免疫障害を有するか、または発症する危険性を指し示す、ステップを含みうる。
対象における、自己免疫疾患を発症する危険性を予測するステップは、対象から回収された試料、および健常ドナーから回収された試料を使用して、対象において再構成されたT細胞を、健常ドナーにおいて再構成されたT細胞と比較することを含みうる。
本明細書で使用される、「試料」または「生体試料」は、対象からの回収が可能であり、試料の供給源の含有物または組成を表し、その全体において検討され、対象におけるT細胞選択を再構成するのに使用されうる、任意の「生物学的検体」を指すことが意図される。試料は、回収され、解析のために、直接加工される場合もあり、または解析が完了するまで、試料の品質を維持するのに、適正である、保管条件下で保管される場合もある。保管試料は、新規回収検体と同等を維持することが理想的である。試料の供給源は、内臓の場合もあり、静脈の場合もあり、動脈の場合もあり、なおまたは体液の場合もある。試料の非限定例は、血液、血漿、尿、唾液、汗、臓器生検、および脳脊髄液(CSF)を含む。ある特定の実施形態では、試料は、末梢血試料または組織試料である。
本明細書で使用される、「健常ドナー」という用語は、対象の遺伝学的血縁者などのHLAマッチ健常ドナー;対象本人、または複数の非HLAマッチ健常ドナーを含みうる。同じ個体は、対象であり、かつ健常であるドナー、例えば、個体が、自己免疫疾患であることが疑われる疾患または状態の、任意の症状を経る前の時点において、個体から回収された試料であることが可能であり、試料は、健常HLAマッチドナーに由来する試料として使用され、回収された試料が、対象に由来する試料として使用されうる時点である、個体が、症状を経験し始めた後の時点において、個体において回収された試料と比較されうる。例えば、試料は、保存血など、疾患の任意の症状の発生の前に回収された、対象に由来する生物学的検体でありうる。生物学的検体はまた、免疫チェックポイント阻害剤療法の前に回収される場合もある。
HLAマッチ健常ドナーの非存在下では、試料は、HLAがマッチしない、複数の健常ドナーから回収される場合があり、T細胞選択についての解析は、各健常ドナーのHLA状態を考慮に入れることによりなされうる。
単一の健常ドナーから再構成されたT細胞選択を、対象へと適用する場合、健常ドナーは、HLAマッチ健常ドナーでありうる。このような場合に、健常ドナーから再構成されたT細胞選択を、対象へと適用するステップは、健常ドナーに由来する試料中のT細胞受容体(TCRβ)遺伝子をシーケンシングすること、対象に由来する試料中のTCRβ遺伝子をシーケンシングすること、および各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。
代替的に、利用可能なHLAマッチドナーの非存在下で、対象におけるT細胞選択を再構成する場合、複数の健常ドナーが使用される場合があり、複数の健常ドナーは、非HLAマッチ健常ドナーでありうる。このような場合に、複数の健常ドナーにおけるT細胞選択を再構成し、これを、対象へと適用するステップは、a)各ドナーに由来する試料中のTCRβ遺伝子、および対象に由来する試料中のTCRβ遺伝子をシーケンシングすること、b)各ドナーおよび対象のHLA型を決定すること、または各ドナーおよび対象について、MHC遺伝子をシーケンシングすること、c)ドナーまたは対象のHLA型により、各TCRβ遺伝子にタグ付けすること、およびd)HLAタグを、各TCRβ遺伝子についての、さらなる特徴として使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。
本明細書で記載される機械学習システムを使用して、ドナーにおけるT細胞選択を再構成し、これを、対象へと適用するステップは、生産的TCRβ遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞である、逃避T細胞を同定するのに使用されうる。すなわち、システムは、健常ドナーにおけるT細胞選択に失格するが、対象におけるT細胞選択に合格する、対象におけるT細胞(すなわち、対象におけるTCRβを同定することにより)を同定しうる。T細胞選択に失格することになるT細胞は、自己抗原に強く結合するので、対象において、自己免疫反応を誘導する可能性が高く、ある特定の閾値を上回る、T細胞選択に失格することになる(が、消失させられない)T細胞の数は、対象が、自己免疫反応を誘導する可能性が高い、多くのT細胞を有し、したがって、自己免疫疾患または自己免疫状態を有するか、または発症する危険性があることを指し示しうる。
自己免疫疾患および自己免疫障害
免疫系とは、疾患に対して防御する、生物内の、生物学的構造および生物学的過程のシステムである。このシステムは、身体を、病原体、および他の外来的物質から防御し、感染細胞および悪性細胞を破壊し、細胞破砕物を除去する、相互作用性の細胞、細胞産物、および細胞形成組織による、散在性の、複雑なネットワークである:システムは、胸腺、脾臓、リンパ節およびリンパ組織、幹細胞、白血球、抗体、ならびにリンホカインを含む。B細胞またはBリンパ球は、適応免疫系のうちの、体液性免疫におけるリンパ球の種類であり、免疫監視のために重要である。T細胞またはTリンパ球は、細胞媒介性免疫において、中心的な役割を果たすリンパ球の種類である。T細胞の、2つの主要な亜型:キラーT細胞およびヘルパーT細胞が存在する。加えて、免疫応答のモジュレーティングにおいて役割を有するサプレッサーT細胞が存在する。キラーT細胞が、クラスI MHC分子へとカップリングされた抗原だけを認識するのに対し、ヘルパーT細胞は、クラスII MHC分子へとカップリングされた抗原だけを認識する。これらの2つの抗原提示の機構は、T細胞の2つの種類の、異なる役割を反映する。第3の副次的亜型は、MHC受容体に結合していない無傷抗原を認識するガンマ/デルタT細胞(γδ T細胞)である。γδ T細胞は、それらの表面上に、顕著に異なるT細胞受容体(TCR)を有するT細胞である。TCRが、α(アルファ)TCR鎖およびβ(ベータ)TCR鎖と呼ばれる、2つの糖タンパク質鎖から構成された、αβ(アルファ/ベータ)T細胞である、大半のT細胞と異なり、γδ T細胞は、TCRが、1つのγ(ガンマ)鎖と、1つのδ(デルタ)鎖とから構成されている。γδ T細胞は、通例、αβ T細胞ほど一般的ではないが、腸粘膜内の、上皮内リンパ球(IEL)として公知のリンパ球集団内では、それらの存在度は最高度となる。γδ T細胞を活性化させる抗原分子は、大部分が未知であり、抗原プロセシング、および主要組織適合性複合体(MHC)による、ペプチドエピトープの提示を要求しないと考えられるが、一部のγδ T細胞は、MHCクラスIb分子を認識する。γδ T細胞は、脂質抗原の認識において、顕著な役割を果たすと考えられる。これに対し、B細胞抗原特異的受容体は、B細胞表面上の抗体分子であり、抗原プロセシングを必要とせずに、全病原体を認識する。B細胞の各系統は、異なる抗体を発現するので、B細胞抗原受容体の完全なセットは、身体が産生しうる、全ての抗体を表す。
「免疫応答」という用語は、抗原に対する統合的身体応答を指し、細胞性免疫応答を指す場合もあり、細胞性免疫応答ならびに体液性免疫応答を指す場合もある。免疫応答は、防御的/防止的/予防的な場合もあり、かつ/または治療的な場合もある。
「細胞性免疫応答」、「細胞応答」、「抗原に対する細胞応答」、または同様の用語は、クラスI MHCまたはクラスII MHCによる抗原の提示により特徴づけられる細胞へと方向付けられた細胞応答を含むことが意図される。細胞応答は、「ヘルパー」または「キラー」として作用する、T細胞またはTリンパ球と呼ばれる細胞に関する。ヘルパーT細胞(CD4+T細胞ともまた称する)は、免疫応答を調節することにより、中心的な役割を果たし、キラー細胞(細胞傷害性T細胞、細胞溶解性T細胞、CD8+T細胞、またはCTLともまた称する)は、がん細胞などの罹患細胞を死滅させ、さらなる罹患細胞の産生を防止する。
本発明の文脈における、「免疫反応性細胞」、「免疫細胞」、または「免疫エフェクター細胞」という用語は、免疫反応時に、エフェクター機能を及ぼす細胞に関する。「免疫反応性細胞」は、抗原または抗原の提示により特徴づけられる細胞、または抗原に由来する抗原ペプチドに結合し、免疫応答を媒介することが可能でありうる。例えば、このような細胞は、サイトカインおよび/またはケモカインを分泌し、抗体を分泌し、がん性細胞を認識し、任意選択で、このような細胞を消失させる。例えば、免疫反応性細胞は、T細胞(細胞傷害性T細胞、ヘルパーT細胞、腫瘍浸潤性T細胞)、B細胞、ナチュラルキラー細胞、好中球、マクロファージ、および樹状細胞を含む。
本明細書で使用される、「自己免疫障害」または「自己免疫疾患」は、免疫系の機能不全により特徴づけられる、任意の医学的状態を指す場合がある。自己免疫疾患は、体内で正常に存在する物質および組織に対して反応性(自己免疫性)であることが可能な、自己反応性T細胞および自己反応性B細胞の、異常な活性化および増殖により特徴づけられる。自己抗原反応性は、組織に対する損傷または組織の破壊を誘導する場合もあり、臓器増殖の変更を誘導する場合もあり、かつ/または臓器機能の変更を誘導する場合もある。これらの障害は、いくつかの異なる方式で特徴づけられうる:罹患した免疫系の構成要素により特徴づけられる場合があり;免疫系が、過剰反応性であるのか、過小反応性であるのかにより特徴づけられる場合があり;状態が、先天性であるのか、後天性であるのかにより特徴づけられる場合がある。自己免疫疾患の根底的病態生理についての主要な理解は、自己免疫疾患にわたる、顕著な程度の遺伝子共有を同定した、ゲノムワイド関連スキャンの適用による。
自己免疫障害は、急性播種性脳脊髄炎(ADEM)、アジソン病、無ガンマグロブリン血症、円形脱毛症、筋委縮性側索硬化症(別称:ルー・ゲーリック病)、強直性脊椎炎、抗リン脂質症候群、抗合成酵素症候群、アトピー性アレルギー、アトピー性皮膚炎、自己免疫性再生不良性貧血、自己免疫性心筋症、自己免疫性腸症、自己免疫性溶血性貧血、自己免疫性肝炎、自己免疫性内耳疾患、自己免疫性リンパ増殖性症候群、自己免疫性膵炎、自己免疫性末梢神経障害、自己免疫性多内分泌腺症候群、自己免疫性プロゲステロン皮膚炎、自己免疫性血小板減少性紫斑病、自己免疫性蕁麻疹、自己免疫性ブドウ膜炎、バロー病/バロー同心性硬化症、ベーチェット病、バージャー病、ビッカースタッフ脳炎、ブラウ症候群、水疱性類天疱瘡、がん、キャッスルマン病、セリアック病、シャーガス病、慢性炎症性脱髄性多発性神経障害、慢性炎症性脱髄性多発性神経障害、慢性閉塞性肺疾患、慢性再発性多発性骨髄炎、チャーグ-ストラウス症候群、瘢痕性類天疱瘡、コーガン症候群、寒冷凝集素症、補体第2成分欠損症、接触性皮膚炎、頭蓋動脈炎、CREST症候群、クローン病、クッシング症候群、皮膚白血球破砕性血管炎、デゴス病、デルカム病、疱疹状皮膚炎、皮膚筋炎、1型糖尿病、びまん皮膚硬化型全身性強皮症、円板状エリテマトーデス、ドレスラー症候群、薬物誘導性ループス、湿疹、子宮内膜症、好酸球性筋膜炎、好酸球性胃腸炎、好酸球性肺炎、後天性表皮水疱症、結節性紅斑、胎児赤芽球症、本態性混合型寒冷グロブリン血症、エバンズ症候群、進行性骨化性線維異形成症、線維化性肺胞炎(または特発性肺線維症)、胃炎、消化器類天疱瘡、糸球体腎炎、グッドパスチャー症候群、移植片対宿主病、グレーブス病、ギラン-バレー症候群、橋本脳症、橋本甲状腺炎、ヘノッホ-シェーンライン紫斑病、妊娠性疱疹、別称:妊娠性類天疱瘡、汗腺膿瘍、Hughes-Stovin症候群、低ガンマグロブリン血症、特発性炎症性脱髄性疾患、特発性肺線維症、特発性血小板減少性紫斑病、IgA腎症、封入体筋炎、間質性膀胱炎、若年性特発性関節炎、別称:若年性関節リウマチ、川崎病、ランバート-イートン筋無力症候群、白血球破砕性血管炎、扁平苔癬、硬化性苔癬、線状IgA病、ルポイド肝炎、別称:自己免疫性肝炎、エリテマトーデス、マジード症候群、顕微鏡的大腸炎、顕微鏡的多発血管炎、ミラー-フィッシャー症候群、混合性結合組織疾患、限局性強皮症、ムッカ-ハーベルマン病、別称:急性痘瘡状苔癬状粃糠疹、多発性硬化症、重症筋無力症、筋炎、メニエール病、ナルコレプシー、視神経脊髄炎、神経性筋強直、眼類天疱瘡、オプソクローヌス・ミオクローヌス症候群、オード甲状腺炎、回帰性リウマチ、PANDAS(小児自己免疫性溶連菌関連精神神経障害)、傍腫瘍性小脳変性症、発作性夜間ヘモグロビン尿症(PNH)、パリー-ロンバーグ症候群、扁平部炎、パーソネージ-ターナー症候群、尋常性天疱瘡、静脈周囲性脳脊髄炎、悪性貧血、POEMS症候群、結節性多発動脈炎、リウマチ性多発筋痛、多発筋炎、原発性胆汁性肝硬変、原発性硬化性胆管炎、進行性炎症性神経障害、乾癬、乾癬性関節炎、赤芽球癆、壊疽性膿皮症、ラスムッセン脳炎、レイノー現象、ライター症候群、再発性多発性軟骨炎、レストレスレッグス症候群、後腹膜線維症、リウマチ熱、関節リウマチ、サルコイドーシス、統合失調症、シュミット症候群、シュニッツラー症候群、強膜炎、強皮症、血清病、シェーグレン症候群、脊椎関節症、スティッフパーソン症候群、スティル病、亜急性細菌性心内膜炎(SBE)、スザック症候群、スイート症候群、シデナム舞踏病、交感性眼炎、全身性エリテマトーデス、高安動脈炎、側頭動脈炎、血小板減少症、トロサ-ハント症候群、横断性脊髄炎、潰瘍性大腸炎、未分化脊椎関節症、蕁麻疹様血管炎、血管炎、白斑、ウェゲナー肉芽腫症、ミオパシー、ざ瘡(PAPA)、インターロイキン1受容体アンタゴニスト欠損症(DIRA)、アレルギー反応、クローン病、および痛風を含むがこれらに限定されない。
ある特定の態様では、免疫障害は、関節リウマチ、全身性エリテマトーデス、セリアック病、クローン病、炎症性腸疾患、シェーグレン症候群、リウマチ性多発筋痛、乾癬、多発性硬化症、強直性脊椎炎、1型糖尿病、円形脱毛症、血管炎、側頭動脈炎、グレーブス病、または橋本甲状腺炎である。
本明細書で記載される方法は、対象における自己免疫疾患または自己免疫障害の同定を可能としうる。方法は、このような対象同定の後における、自己免疫疾患または自己免疫障害のための処置の投与をさらに含みうる。
自己免疫障害および自己免疫疾患の処置は、免疫抑制性および/または抗炎症性である、薬剤または薬物を含みうる。薬剤は、例えば、ムロモナブ(muromab)、バシリキシマブ、およびダクリズマブを含む抗体、またはこれらの抗体のうちの1つをコードする核酸でありうる。活性剤として使用されうる、免疫抑制性薬および抗炎症性薬の例は、コルチコステロイド、ロリプラム、カルフォスチン、CSAID;インターロイキン10、グルココルチコイド、サリチル酸、一酸化窒素;デオキシスパガリン(DSG)などの核転座阻害剤;イブプロフェン、セレコキシブ、およびロフェコキシブなどの非ステロイド系抗炎症性薬物(NSAID);プレドニゾンまたはデキサメタゾンなどのステロイド;アバカビルなどの抗ウイルス剤;メトトレキサート、レフルノミド、FK506(タクロリムス)などの抗増殖剤;アザチオプリンおよびシクロホスファミドなどの細胞傷害薬;テニダップなどのTNF-α阻害剤、抗TNF抗体、もしくは可溶性TNF受容体、およびラパマイシン(シロリムス)、またはこれらの誘導体を含む。疾患が、胸腺のがんである場合、活性剤は、化学療法薬の場合もあり、他の種類の抗がん治療剤の場合もある。
臓器移植に由来する同種免疫を発症する危険性を予測する方法
臓器レシピエントにおける、臓器移植に由来する同種免疫を発症する危険性を予測する方法が提供される。
本明細書で使用される、「同種免疫」(alloimmunityまたはisoimmunity)という用語は、同じ種のメンバーに由来する非自己抗原(すなわち、同種抗原(alloantigenまたはisoantigen))に対する免疫応答を指す場合がある。同種抗原の、2つの主要な種類は、血液型抗原および組織適合性抗原である。同種免疫では、身体は、同種抗原に対する抗体(同種抗体)を創出し、輸血された血液、同種移植組織、および、場合によって、胎児でさえも攻撃する。同種免疫(alloimmune(isoimmune))応答は、例えば、移植片機能の劣化、または完全な喪失として提示されうる移植片拒絶を結果としてもたらしうる。同種免疫化(alloimmunization(isoimmunization))とは、同種免疫性となる過程、すなわち、初めて、関連する抗体を発生させる過程である。同種免疫は、ドナーの、主に、主要組織適合性複合体遺伝子である、高度に多型性である遺伝子の産生と、移植片レシピエントの同遺伝子の産生との間の差違により引き起こされうる。これらの産生は、移植片に浸潤し、これを損傷する、Tリンパ球、および他の単核白血球により認識される。
臓器移植時に、臓器は、ドナーの体内から取り出され、損傷臓器または逸失臓器を置きかえるように、臓器レシピエントの体内へと植え込まれる。移植に成功した臓器は、心臓、腎臓、肝臓、肺、膵臓、腸、胸腺、および子宮を含む。組織は、骨、腱(いずれも、筋骨格移植片と称される)、角膜、皮膚、心弁、神経、および静脈を含む。臓器移植は、臓器レシピエントの身体が、移植された臓器に対する免疫応答を誘導する場合があり、おそらく、移植の失敗をもたらすので、レシピエントに由来する臓器を、速やかに除去する必要がある、移植拒絶などの問題を回避または管理するための、具体的な医学的管理を要求する、困難、かつ、複雑な手順である。可能な場合、移植拒絶は、最も適切なドナー-レシピエントマッチを決定する血清型分析を介して、かつ、免疫抑制薬の使用を介して低減されうる。
本明細書で記載される方法は、臓器レシピエントが、移植片に対する免疫応答(同種免疫応答)を発症する危険性を予測するために使用されうる。方法は、本明細書で記載される機械学習システムを使用して、各T細胞受容体(TCRβ)遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、臓器ドナーにおけるT細胞選択を再構成するステップ;ドナーから再構成されたT細胞選択を、臓器レシピエントへと適用するステップ;および臓器ドナー組織に対して非寛容である臓器レシピエントに由来するT細胞の数を決定するステップであって、臓器レシピエントにおける、閾値を超える、非寛容T細胞の数が、例えば、臓器移植に由来する同種免疫を有するか、または発症する危険性を指し示す、ステップを含みうる。
臓器ドナーにおけるT細胞選択を再構成するステップは、本明細書で記載される機械学習システムを使用して、臓器ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。臓器ドナーから回収された試料は、移植に由来する試料でありうる。代替的に、試料は、末梢血の場合もあり、移植片ではない、別の組織に由来する試料の場合もある。
臓器ドナーから再構成されたT細胞選択を、臓器レシピエントへと適用するステップは、臓器レシピエントに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。臓器レシピエントに由来する試料は、末梢血試料の場合もあり、組織試料の場合もある。
本明細書で記載される機械学習システムを使用して、ドナーにおけるT細胞選択を再構成し、これを、レシピエントへと適用するステップは、生産的TCRβ遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞である、逃避T細胞を同定するのに使用されうる。すなわち、システムは、臓器ドナーにおけるT細胞選択に失格する(すなわち、非寛容T細胞)が、臓器レシピエントにおけるT細胞選択に合格することが予測される、臓器レシピエントにおけるT細胞(すなわち、臓器レシピエントにおけるTCRβを同定することにより)を同定しうる。臓器レシピエントにおけるT細胞選択に失格することになる、非寛容T細胞は、対象において、同種免疫反応を誘導する可能性が高く、ある特定の閾値を上回る、T細胞選択に失格することになる(が、消失させられない)T細胞の数は、対象が、同種免疫反応を誘導する可能性が高い、極めて多くのT細胞を有し、したがって、移植臓器の拒絶を有するか、または発症する危険性があることを指し示しうる。すなわち、臓器レシピエントに由来する非寛容T細胞は、臓器移植片拒絶を駆動する可能性が高い。
本明細書で記載される方法は、臓器移植の後で、同種免疫応答を発症する危険性がある臓器レシピエントの同定を可能としうる。方法は、このような対象の同定の後における、臓器拒絶またはその危険性のための処置の投与をさらに含みうる。
超急性拒絶(移植から数分間以内に生じる)のための処置は存在せず、選択肢は、組織の除去に限られる。慢性拒絶は、不可逆性であると考えられ、再移植が、患者のための、最良の適応であることが多い。急性拒絶は、1つまたは複数の薬剤で処置されうる。
コルチコステロイド(プレドニゾロンまたはヒドロコルチゾン(hypercortisone)など);カルシニューリン(calcineutine)阻害剤(シクロスポリンまたはタクロリムスなど);抗増殖剤(アザチオプリンまたはミコフェノール酸など);mTOR阻害剤(シロリムスまたはエベロリムスなど)の投与を含みうる、免疫抑制性療法の使用にもかかわらず、抗体ベースの処置が投与される場合がある。免疫抑制療法へと追加されうる、選り抜きの免疫構成要素に特異的な抗体は、抗IL-2Rα受容体モノクローナル抗体(バシリキシマブまたはダクリズマブなど);抗T細胞ポリクローナル抗体(抗胸腺細胞グロブリン(ATG)、または抗リンパ球グロブリン(ALG)など);抗CD20モノクローナル抗体(リツキシマブなど)を含みうる。代替的に、移植組織に対して特異的な抗体分子を除去する、免疫抑制療法または抗体療法に対して不応性である症例では、血液移植が適応でありうる。骨髄移植はまた、レシピエントが、拒絶を伴わずに、新たな臓器を受容しうるように、移植レシピエントの免疫系を、ドナーの免疫系で置きかえるのにも使用されうる。
臓器移植または細胞移植に由来する移植片対宿主病(GvHD)を発症する危険性を予測する方法
レシピエントにおける、臓器移植または細胞移植に由来する移植片対宿主病(GvHD)を発症する危険性を予測する方法が提供される。
移植片対宿主病(GvHD)とは、上皮細胞のアポトーシスおよび腺窩の脱落に特異的な、異なる臓器内の炎症により特徴づけられる症候群である。GvHDは、一般に、骨髄移植および幹細胞移植と関連する。GvHDはまた、固形臓器移植など、移植組織の他の形態にも当てはまる。提供された組織(移植片)内に残存しうる、ドナー免疫系の白血球は、レシピエント(宿主)を、外来(非自己)であると認識しうる。次いで、移植された組織内に存在する白血球は、レシピエントの体内の細胞を攻撃し、これが、GvHDをもたらす。
本明細書で記載される方法は、レシピエントが、臓器移植または細胞移植に由来するGvHDを発症する危険性を予測するために使用されうる。方法は、本明細書で記載される機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、レシピエントにおけるT細胞選択を再構成するステップ;レシピエントから再構成されたT細胞選択を、ドナーへと適用するステップ;およびレシピエントに対して非寛容であるドナーに由来するT細胞の数を決定するステップであって、ドナーにおける、閾値を超える、非寛容T細胞の数が、臓器移植または細胞移植に由来するGvHDを有するか、または発症する危険性を指し示す、ステップを含みうる。
レシピエントにおけるT細胞選択を再構成するステップは、本明細書で記載される機械学習システムを使用して、レシピエントに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。レシピエントから回収された試料は、移植に由来する試料でありうる。代替的に、試料は、末梢血の場合もあり、移植片ではない、別の組織に由来する試料の場合もある。
T細胞選択を、ドナーへと適用するステップは、本明細書で記載される機械学習システムを使用して、ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。レシピエントに由来する試料は、末梢血試料の場合もあり、組織試料の場合もある。
本明細書で記載される機械学習システムを使用して、レシピエントにおけるT細胞選択を再構成し、これを、ドナーへと適用するステップは、生産的TCRβ遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞である、不適合性T細胞を同定するのに使用されうる。すなわち、システムは、レシピエントにおけるT細胞選択に失格するが、ドナーにおけるT細胞選択に合格する(すなわち、非寛容T細胞)ことが予測される、ドナーにおけるT細胞(すなわち、ドナーにおけるTCRβを同定することにより)を同定しうる。レシピエントにおけるT細胞選択に失格することになる、非寛容T細胞は、レシピエントにおいて、同種免疫反応を誘導する可能性が高く、ある特定の閾値を上回る、T細胞選択に失格することになる(が、消失させられない)T細胞の数は、移植片が、同種免疫反応を誘導する可能性が高い、極めて多くのT細胞を含む可能性が高く、したがって、レシピエントは、GvHDを有するか、または発症する危険性があることを指し示しうる。すなわち、ドナーに由来する非寛容T細胞は、GvHDを駆動する可能性が高い。
本明細書で記載される方法は、臓器移植または細胞移植の後で、GvHDを発症する危険性があるレシピエントの同定を可能としうる。方法は、このような対象同定の後における、GvHDのための処置の投与をさらに含みうる。
GvHDの処置は、宿主組織に対する、T細胞媒介性免疫攻撃を抑制する、プレドニゾンなど、静脈内投与されるグルココルチコイドを含みうる。GvHDを処置または予防するための、他の物質は、例えば、メトトレキサートを伴うシクロスポリン、シロリムス、ペントスタチン、エタネルセプト、イブルチニブ、およびアレムツズマブを含みうる。
養子T細胞療法に由来する同種免疫を発症する危険性を予測する方法
レシピエントにおける、養子T細胞療法に由来する同種免疫を発症する危険性を予測する方法が提供される。
本明細書で使用される、「養子T細胞療法」、「操作TCR療法」、「TCR T細胞療法」などの用語は、がん細胞を消失させる、対象の免疫系またはドナーの免疫系の細胞の使用に依拠する、細胞性免疫療法を指す場合がある。養子T細胞療法は、患者の免疫系に、がん細胞を攻撃し、死滅させうるT細胞を介して、残存する腫瘍を圧倒する能力を与えようとする試みにおいて、腫瘍特異的T細胞の分離、およびT細胞数の増大を達成する、ex vivoにおける拡大、ならびにがんを伴う患者への注入を伴う。がん処置のために使用され、腫瘍浸潤リンパ球またはTILを培養し、1つの特定のT細胞またはクローンを単離および増大し、腫瘍を強力に認識および攻撃するように操作されたT細胞を使用する、養子T細胞療法の多くの形態が存在する。養子T細胞療法は、同種CAR T細胞療法の場合もあり、さらなるTCRにより操作された、同種T細胞を伴う場合もある。
「がん」という用語は、1つの部位(原発部位)において始まり、他の部位(続発部位、転移)へと、浸潤および拡散する、潜在的可能性を伴い、がん(悪性腫瘍)を、良性腫瘍から差別化する、異常かつコントロール不能の細胞増殖により特徴づけられる疾患群を指す。事実上全ての臓器に罹患する可能性があり、ヒトに罹患しうる、100種類を超えるがんをもたらす。がんは、遺伝的素因、ウイルス感染、イオン化放射線への曝露、環境汚染物質への曝露、煙草および/またはアルコールの使用、肥満、栄養失調、身体活動の欠如、またはこれらの任意の組合せを含む、多くの原因から生じうる。本明細書で使用される、それらの文法的変化形を含む、「新生物」または「腫瘍」は、良性の場合もあり、がん性の場合もある、新規かつ異常な組織の増殖を意味する。関連する態様では、新生物は、多様ながんを含むがこれらに限定されない、新生物性疾患または新生物性障害を指し示す。例えば、このようながんは、前立腺がん、胆管がん、結腸がん、直腸がん、肝がん、腎がん、肺がん、精巣がん、乳がん、卵巣がん、膵がん、脳がん、および頭頸部がん、黒色腫、肉腫、多発性骨髄腫、白血病、リンパ腫などを含みうる。
骨髄または免疫系細胞などの造血組織内で発症するがんは、血液がん(hematologic cancerまたはblood cancer)と称される。血液がんは、血液細胞の産生および機能に影響を及ぼし、3つの主要な種類:白血病、リンパ腫、および多発性骨髄腫に分類される。
本明細書で使用される、「白血病」とは、異常な白血球の、急速な産生により引き起こされる血液を指す。白血病の例は、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ性白血病、慢性骨髄性白血病、および有毛細胞白血病を含む。本明細書で使用される、「リンパ腫」とは、リンパ系に影響を及ぼす、血液がんの種類を指す。リンパ腫の例は、AIDS関連リンパ腫、皮膚T細胞リンパ腫、ホジキンリンパ腫、ホジキンリンパ腫、菌状息肉腫、非ホジキンリンパ腫、原発性中枢神経系リンパ腫、セザリー症候群、皮膚T細胞リンパ腫、およびワルデンシュトレームマクログロブリン血症を含む。本明細書で使用される、「骨髄腫」とは、形質細胞のがんである。骨髄腫の例は、慢性骨髄増殖性新生物、ランゲルハンス細胞組織球症、多発性骨髄腫、形質細胞新生物、骨髄異形成症候群、および骨髄異形成性/骨髄増殖性新生物を含む。
本明細書で記載される方法は、レシピエントにおける、養子T細胞療法に由来する同種免疫を発症する危険性を予測するために使用されうる。方法は、本明細書で記載される機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、レシピエントにおけるT細胞選択を再構成するステップ;レシピエントにおいて再構成されたT細胞選択を、ドナーT細胞へと適用するステップ;およびレシピエントに対して非寛容であるドナーに由来するT細胞の数を決定するステップであって、ドナーにおける、閾値を超える、非寛容T細胞の数が、養子T細胞療法に由来する同種免疫を有するか、または発症する危険性を指し示す、ステップを含みうる。ドナーは、レシピエントと同一人物の場合もあり、異なる人物の場合もある。
レシピエントにおけるT細胞選択を再構成するステップは、本明細書で記載される機械学習システムを使用して、ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。試料は、例えば、ex vivoにおいて、細胞を拡大する前に回収された、末梢血試料または組織試料でありうる。
T細胞選択を、ドナーへと適用するステップは、本明細書で記載される機械学習システムを使用して、ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。試料は、末梢血または組織でありうる。
非寛容T細胞は、生産的TCRβ遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞でありうる。非寛容T細胞は、レシピエントにおけるT細胞選択に失格することが予測される、ドナーに由来するT細胞でありうる。非寛容T細胞は、レシピエントにおける同種免疫を駆動する可能性が高い、ドナーに由来するT細胞でありうる。養子T細胞療法に由来する同種免疫は、レシピエントの細胞および組織に対する、ドナーT細胞からの、所望されない免疫攻撃を含みうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。
本明細書で記載される方法は、養子T細胞療法に由来する同種免疫を発症する危険性があるレシピエントの同定を可能としうる。方法は、このような対象同定の後における、抗がん処置の投与をさらに含みうる。
本明細書で使用される、「抗がん治療」または「抗がん処置」という用語は、手術、放射線治療、化学療法、免疫療法、およびチェックポイント阻害剤療法など、がんを処置するのに使用されうる、任意の処置を指すことが意図される。
化学療法の例は、(i)ビンカアルカロイド(ビンブラスチン、ビンクリスチン、ビンフルニン、ビンデシン、およびビノレルビン)、タキサン(カバジタキセル、ドセタキセル、ラロタキセル、オルタタキセル、パクリタキセル、およびテセタキセル)、エポチロン(イキサベピロン)、およびポドフィロトキシン(エトポシドおよびテニポシド)を含む、抗微小管剤、(ii)葉酸拮抗剤(アミノプテリン、メトトレキサート、ペメトレキセド、プララトレキセート、およびラルチトレキセド)、およびデオキシヌクレオシド類似体(アザシチジン、カペシタビン、カルモフール、クラドリビン、クロファラビン、シタラビン、デシタビン、ドキシフルリジン、フロクスウリジン、フルダラビン、フルオロウラシル、ゲムシタビン、ヒドロキシカルバミド、メルカプトプリン、ネララビン、ペントスタチン、テガフール、およびチオグアニン)を含む、代謝拮抗剤、(iii)トポイソメラーゼI阻害剤(ベロテカン、カンプトテシン、コシテカン、ギマテカン、エキサテカン、イリノテカン、ルルトテカン、シラテカン、トポテカン、およびルビテカン)、およびトポイソメラーゼII阻害剤(アクラルビシン、アムルビシン、ダウノルビシン、ドキソルビシン、エピルビシン、エトポシド、イダルビシン、メルバロン、ミトキサントロン、ノボビオシン、ピラルビシン、テニポシド、バルルビシン、およびゾルビシン)を含む、トポイソメラーゼ阻害剤、(iv)窒素マスタード(ベンダムスチン、ブスルファン、クロランブシル、シクロホスファミド、エストラムスチンリン酸塩、イフォサミド、メクロレタミン、メルファラン、プレドニムスチン、トロホスファミド、およびウラムスチン)、ニトロソウレア(カルムスチン(BCNU)、ホテムスチン、ロムスチン(CCNU)、N-ニトロソ-N-メチルウレア(MNU)、ニムスチン、ラニムスチンセムスチン(MeCCNU)、およびストレプトゾトシン)、白金ベースアルキル化剤(シスプラチン、カルボプラチン、ジシクロプラチン、ネダプラチン、オキサリプラチン、およびサトラプラチン)、アジリジン(カルボコン、チオテパ、マイトマイシン、ジアジコン(AZQ)、トリアジコン、およびトリエチレンメラミン)、スルホン酸アルキル(ブスルファン、マンノスルファン、およびトレオスルファン)、非古典的アルキル化剤(ヒドラジン、プロカルバジン、トリアゼン、ヘキサメチルメラミン、アルトレタミン、ミトブロニトール、およびピポブロマン)、テトラジン(ダカルバジン、ミトゾロミド、およびテモゾロミド)を含む、アルキル化剤、(v)ドキソルビシンおよびダウノルビシン(これらの化合物の誘導体は、エピルビシンおよびイダルビシンを含む);ピラルビシン、アクラルビシン、およびミトキサントロン、ブレオマイシン、マイトマイシンC、ミトキサントロン、およびアクチノマイシンを含む、アントラサイクリン剤、(vi)FI阻害剤(チピファルニブ)、CDK阻害剤(アベマシクリブ、アルボシジブ、パルボシクリブ、リボシクリブ、およびセリシクリブ)、PrI阻害剤(ボルテゾミブ、カルフィルゾミブ、およびイキサゾミブ)、PhI阻害剤(アナグレリド)、IMPDI阻害剤(ジアゾフリン)、LI阻害剤(マソプロコール)、PARP阻害剤(ニラパリブ、オラパリブ、ルカパリブ)、HDAC阻害剤(ベリノスタット、パノビノスタット、ロミデプシン、ボリノスタット)、およびPIKI阻害剤(イデラリシブ)を含む、酵素阻害剤、(vii)ERA受容体アンタゴニスト(アトラセンタン)、レチノイドX受容体アンタゴニスト(ベキサロテン)、性ステロイド受容体アンタゴニスト(テストラクトン)を含む、受容体アンタゴニスト剤、(viii)アムサクリン、トラベクテジン、レチノイド(アリトレチノイン、トレチノイン)、三酸化ヒ素、アスパラギン枯渇剤(アスパラギナーゼ/ペグアスパラガーゼ)、セレコキシブ、デメコルシン、エレスクロモール、エルサミトルシン、エトグルシド、ロニダミン、ルカントン、ミトグアゾン、ミトタン、オブリメルセン、オマセタキシン、メペスクシネート、およびエリブリンを含む、未分類薬剤を含むがこれに限定されない、化学療法剤、細胞傷害性、または抗新生物剤による処置を含む。
レシピエントにおける、操作T細胞受容体(TCR)療法の適合性を予測する方法
レシピエントにおける、操作T細胞受容体(TCR)療法の適合性を予測する方法が提供される。
方法は、本明細書で記載される機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、レシピエントにおけるT細胞選択を再構成するステップ;レシピエントから再構成されたT細胞選択を、操作TCRβ遺伝子へと適用するステップ;および操作TCRβが、レシピエントに対して非寛容であるのかどうかを決定するステップを含みうる。
レシピエントにおけるT細胞選択を再構成するステップは、レシピエントに由来する試料中のT細胞受容体(TCRβ)遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。レシピエントに由来するT細胞選択を、操作TCRβへと適用するステップは、操作TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含みうる。非寛容操作TCRβ遺伝子は、修復TCRβ遺伝子として誤分類された生産的TCR遺伝子でありうる。非寛容操作TCRβは、レシピエントにおけるT細胞選択に失格することが予測される。非寛容操作TCRは、レシピエントにおいて、同種免疫を駆動する可能性が高い。操作TCR療法に由来する同種免疫は、レシピエントの細胞および組織に対する、ドナーT細胞からの、所望されない免疫攻撃を含みうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。
自己免疫疾患または自己免疫障害を発症する危険性を予測する方法
対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測する方法が提供される。
方法は、本明細書で記載される機械学習システムを使用して、各B細胞受容体(BCR)遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することにより、ドナーにおけるB細胞選択を再構成するステップ;および対象における逃避B細胞の数を査定するステップであって、閾値を超える逃避B細胞の数が、自己免疫疾患または自己免疫障害を有するか、または発症する危険性を指し示す、ステップを含みうる。
ドナーにおけるB細胞選択を再構成するステップは、ドナーに由来する試料中のB細胞受容体(BCR)遺伝子をシーケンシングすることを含みうる。ドナーから再構成されたB細胞選択を、対象へと適用するステップは、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含みうる。逃避B細胞は、生産的BCR遺伝子が、修復BCR遺伝子として誤分類されたB細胞でありうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。
抗体薬の安全性を予測する方法
対象における抗体薬の安全性を予測する方法が提供される。
本明細書で使用される、「抗体薬の安全性」という用語は、抗体を含む薬物の毒性またはその欠如を指す場合がある。「抗体」(Ab)および「免疫グロブリン」(Ig)は、同じ構造特徴を有する糖タンパク質である。抗体が、特異的抗原に対する結合特異性を呈するのに対し、免疫グロブリンは、抗体、および抗原特異性を欠く、他の抗体様分子の両方を含む。自己抗原と、余りに強く反応する抗体が、除去されうることを確保するように、対象における抗体産生を調節する、天然経路が存在する。しかし、所与の対象において、自己抗原に結合する抗体薬を予測し、予期する手段は存在しない。
本明細書で使用される、「抗体」は、供給源、種の由来、産生法、および特徴にかかわらず、抗原結合性部位を含む、任意のポリペプチドを包含する。抗体は、ポリクローナル抗体、モノクローナル抗体、多特異性抗体、ヒト抗体、ヒト化抗体、またはキメラ抗体、単鎖抗体、および抗体断片を含むがこれに限定されない、天然抗体または人工抗体、一価抗体または多価抗体を含む。「抗体断片」は、無傷抗体の抗原結合性領域または可変領域など、無傷抗体の部分を含む。抗体断片の例は、Fab断片、Fab’断片、およびF(ab’)2断片、Fc断片またはFc融合生成物、単鎖Fv(scFv)、ジスルフィド連結Fv(sdfv)、およびVLドメインまたはVHドメインを含む断片;ダイアボディー、トリボディーなど(Zapataら、Protein Eng.、8(10):1057~1062[1995])を含む。
本明細書で使用される、「抗体」という用語は、免疫グロブリン分子、および免疫グロブリン分子の免疫活性部分、すなわち、抗原に免疫特異的に結合する抗原結合性部位を含有する分子を指す。「天然抗体」および「無傷免疫グロブリン」などは、通例、2つの同一な軽(L)鎖と、2つの同一な重(H)鎖とから構成される、約150,000ダルトンの、ヘテロ四量体の糖タンパク質である。任意の脊椎動物種に由来する軽鎖は、それらの定常ドメインのアミノ酸配列に基づき、カッパ(κ)およびラムダ(λ)と呼ばれる、2つの顕著に異なる種類のうちの1つへと割り当てられうる。それらの重鎖の定常ドメインのアミノ酸配列に応じて、免疫グロブリンは、異なるクラスへと割り当てられうる。免疫グロブリンの5つの主要なクラス:IgA、IgD、IgE、IgG、およびIgMが存在し、これらのクラスのうちのいくつかは、サブクラス(アイソタイプ)、例えば、IgG1、IgG2、IgG3、IgG4、IgA、およびIgA2へとさらに分けられうる。免疫グロブリンの異なるクラスに対応する、重鎖定常ドメインは、それぞれ、α、δ、ε、γ、およびμと呼ばれる。免疫グロブリンの異なるクラスの、サブユニット構造および三次元構成については周知である。
無傷抗体は、抗体のFc領域(天然配列によるFc領域、もしくはアミノ酸配列変異体によるFc領域、または他の任意の改変Fc領域)に帰せられる生体活性を指す、1つまたは複数の「エフェクター機能」を有しうる。抗体エフェクター機能の例は、C1qへの結合;補体依存性細胞傷害作用;Fc受容体への結合;抗体依存性細胞媒介性細胞傷害作用(ADCC);食作用;細胞表面受容体(例えば、B細胞受容体(BCR))の下方調節;および抗原提示細胞または樹状細胞による、抗原の交差提示を含む。
各軽鎖は、1つの共有結合的ジスルフィド結合により、重鎖へと連結されるが、ジスルフィド結合の数は、異なる免疫グロブリンアイソタイプの重鎖間で変動する。各重鎖および各軽鎖はまた、規則的に隔てられた、鎖内ジスルフィド架橋も有する。各重鎖は、一方の末端において、可変ドメイン(VH)に続いて、多数の定常ドメインを有する。各軽鎖は、一方の末端において、可変ドメイン(VL)を有し、他方の末端において、定常ドメインを有し;軽鎖の定常ドメインは、重鎖の第1の定常ドメインと連携させられ、軽鎖可変ドメインは、重鎖の可変ドメインと連携させられる。特定のアミノ酸残基は、軽鎖可変ドメインと、重鎖可変ドメインとの接触面を形成すると考えられる。各可変領域は、相補性決定領域(CDR)または超可変領域と呼ばれる、3つのセグメントを含み、可変ドメインのうちの、より高度に保存的な部分は、フレームワーク領域(FR)と呼ばれる。重鎖および軽鎖の可変ドメインは、各々、βシート構造を接続し、場合によって、βシート構造の一部を形成する、ループを形成する、3つのCDRにより接続された、βシートの立体構造を取ることが大半である、4つのFR領域を含む。各鎖内のCDRは、FR領域により、他の鎖に由来するCDRと、近接して、一体に保持され、抗体の抗原結合部位の形成に寄与する(Kabatら、NIH刊行物番号第91-3242号、I巻、647~669頁[1991]を参照されたい)。定常ドメインは、抗体の、抗原への結合に、直接は関与せず、抗体の、抗体依存性細胞性細胞傷害作用への参与など、多様なエフェクター機能を呈する。
「抗原」は、免疫応答を誘発する、任意の物質でありうる。特に、「抗原」は、抗体またはTリンパ球(T細胞)と特異的に反応する、ペプチドまたはタンパク質など、任意の物質に関する。「抗原」という用語は、少なくとも1つのエピトープを含む、任意の分子を含みうる。本開示の文脈における抗原は、任意選択で、プロセシングの後に、免疫反応を誘導する分子である。免疫反応のための候補物質である、任意の適切な抗原を使用することができ、この場合、免疫反応は、細胞性免疫反応でありうる。ある特定の実施形態の文脈では、抗原は、MHC分子の文脈では、罹患細胞、特に、がん細胞を含む、抗原提示細胞により提示され、これは、抗原に対する免疫反応を結果としてもたらす。抗原は、天然に存在する抗原に対応する生成物の場合もあり、これに由来する生成物の場合もある。このような天然に存在する抗原は、腫瘍抗原を含む。
「結合アフィニティー」という用語は、一般に、分子(例えば、抗体)の、単一の結合性部位と、その結合性パートナーとの間の、非共有結合的相互作用全体の合計強度を指す。当技術分野では、結合アフィニティーまたは結合活性を測定する、様々な方法が公知であり、これらのいずれもが、本方法の目的で使用されうる。例示的な具体的実施形態は、以下に記載される。
本明細書で使用される、「特異的結合」とは、所定の抗原に結合する抗体を指す。典型的に、抗体は、約10-8Mまたはこれ未満のKDに対応するアフィニティーで結合し、所定の抗原に、所定の抗原または近縁の抗原以外の非特異的抗原(例えば、BSA、カゼイン)への結合についての、そのアフィニティーの、少なくとも10分の1未満であり、少なくとも100分の1未満でありうるアフィニティー(KDにより表される)で結合する。代替的に、抗体は、約10-1、もしくは約10-1、もしくは約10-1、もしくは10-1またはこれらを超えるKAに対応するアフィニティーで結合することが可能であり、所定の抗原に、所定の抗原または近縁の抗原以外の非特異的抗原(例えば、BSA、カゼイン)への結合についての、そのアフィニティーの、少なくとも10倍超、または、少なくとも100倍超であるアフィニティー(KAにより表される)で結合する。
本明細書で使用される、「kd」(秒-1)という用語は、特定の抗体-抗原相互作用についての解離速度定数を指すことが意図される。この値はまた、オフ値とも称される。本明細書で使用される、「KD」(M-1)という用語は、特定の抗体-抗原相互作用についての解離平衡定数を指すことが意図される。
本明細書で使用される、「ka」(M-1-1)という用語は、特定の抗体-抗原相互作用についての会合速度定数を指すことが意図される。本明細書で使用される、「KA」(M)という用語は、特定の抗体-抗原相互作用についての会合平衡定数を指すことが意図される。
方法は、本明細書で記載される機械学習システムを使用して、対象の各B細胞受容体(BCR)遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することにより、対象におけるB細胞選択を再構成するステップ;および抗体薬をコードするBCR遺伝子が、対象の自己抗原に対して寛容であるのかどうかを決定するステップであって、抗体薬をコードする寛容BCR遺伝子が、生産的BCR遺伝子として、適正に分類されたBCR遺伝子である、ステップを含みうる。
B細胞と、T細胞との類似性のために、B細胞選択は、T細胞を再構成するための方法を使用して、コンピュータにより再構成されうる。B細胞と、T細胞との、関連の差違は、
・発生期B細胞は、それらのDNAを、V(D)J組換えにより編集して、デノボのB細胞受容体(BCR)遺伝子をアセンブルする(T細胞が、TCR遺伝子をアセンブルするのと同様である)こと、
・B細胞選択は、骨髄中で生じ、B細胞が、成熟に到達する前に、脾臓内で生じる、さらなるステップを要求する。これに対し、T細胞は、胸腺内で、T細胞選択を経ること、
・B細胞は、B細胞選択時に、MHC分子を認識するように要求されないため、B細胞は、MHC分子と独立に、抗原に結合する。これに対し、T細胞は、T細胞選択時に、MHC分子を認識するように要求されること、
・自己抗原に対するアフィニティーが過大であり、陰性選択に失格する、発生期B細胞は、(i)欠失させられるか、(ii)それらのBCR遺伝子を再編集することを可能とされるか、または(iii)アネルギー状態に置かれる。B細胞選択は、健常細胞上および健常組織上の自己抗原に対する免疫攻撃を駆動しうる、B細胞を除去し、抑制し、残存B細胞が、自己免疫疾患を駆動しないことを確保する一助となること、
・抗原を認識する、成熟B細胞は、場合によって、それらのBCR遺伝子のDNAをさらに編集することが可能とされ、体細胞超突然変異(SHM)として公知である、さらなる遺伝子変更を蓄積する。SHMは、自己抗原に対するアフィニティーがより大きな、新たなBCRを結果としてもたらしうること、
・コンピュータにより、B細胞選択を再構成する場合、ナイーブB細胞は、抗原により認識されておらず、したがって、SHMを蓄積していないため、ナイーブB細胞が使用されうる。これは、SHMを考慮に入れる必要なしに、B細胞選択に焦点を当てる(例えば、対象に由来する試料中のB細胞受容体(BCR)遺伝子をシーケンシングし、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類すること)を可能とする。代替的に、ナイーブB細胞を使用せずに、全てのB細胞が使用される場合もあり、SHMSを含有する、全てのBCR配列が除去されうること、
・機械学習は、C57BL/6マウスに由来する、ナイーブB細胞からシーケンシングされた、修復BCR重鎖(BCRH)を、生産的BCRHから弁別するのに使用される。本発明者らのテストセットを表す、固有のホールドアウトBCRHに対して、モデルは、83.3%のバランスがとれた分類精度を達成する。生産的BCRHについての感度は、91.2%であり、特異度は、75.3%である。本発明者らのモデルの多様な分類閾値についての真陽性率を、偽陽性率と対比した、受信者動作特性(ROC)曲線として公知のプロットは、曲線下面積(AUC)が、0.91である、
・B細胞選択を経ておらず、修復BCR遺伝子と同様に分類され、本方法が、B細胞選択の一部の態様を再構成しうることを確認するプレB細胞、
・B細胞は、形質細胞へと分化させられ、本質的に、細胞から解離し、独立に作用しうる、BCRである抗体を産生しうる。形質細胞は、B細胞に由来するため、形質細胞は、形質細胞となる前に、B細胞選択を経る。B細胞選択のモデルは、抗体が、B細胞選択に合格するのかどうかを決定するのに使用されうる。まず、患者から回収された末梢血試料または組織試料は、BCRについてシーケンシングされうる。次いで、BCRは、機械学習モデルをフィッティングして、レシピエントに由来する、修復BCR遺伝子と、生産的BCR遺伝子とを弁別することにより、レシピエントにおけるB細胞選択を再構成するのに使用されうる。次に、抗体をコードするBCRを、フィッティングされた機械学習モデルに渡して、予測を生成することができる。修復受容体と同様に分類された抗体であれば、おそらく、B細胞選択に失格し、自己抗原に結合しうること
を含みうる。
対象におけるB細胞選択を再構成するステップは、本明細書で記載される機械学習システムを使用することにより、対象に由来する試料中のBCR遺伝子をシーケンシングし、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含みうる。
抗体薬をコードする非寛容BCR遺伝子は、修復BCR遺伝子として誤分類されたBCR遺伝子でありうる。抗体薬をコードする非寛容BCR遺伝子は、対象におけるB細胞選択に失格することが予測されるBCR遺伝子でありうる。抗体薬をコードする非寛容BCR遺伝子は、対象における自己抗原に結合する可能性が高い抗体薬をコードしうる。自己抗原に結合する可能性が高い抗体薬として分類される抗体薬は、対象における抗体薬の使用の安全性の欠如を指し示しうる。試料は、末梢血試料の場合もあり、組織試料の場合もある。
キメラ抗原受容体(CAR)-T細胞療法に由来する同種免疫を発症する危険性を予測する方法
対象におけるキメラ抗原受容体(CAR)-T細胞療法から、同種免疫を発症する危険性を予測する方法が提供される。
本明細書で使用される、「CAR-T細胞療法」は、人工的T細胞受容体を産生するように遺伝子操作されており、がんを処置する免疫療法として使用されうる、キメラ抗原受容体T細胞(CAR T細胞としてもまた公知である)を指す場合がある。キメラ抗原受容体(キメラ免疫受容体、キメラT細胞受容体、または人工的T細胞受容体としてもまた公知であるCAR)は、T細胞に、特異的タンパク質をターゲティングする、新たな能力を与えるように操作された、受容体タンパク質である。受容体は、抗原結合性およびT細胞活性化機能の両方を、単一の受容体へと組み合わせるため、キメラである。CAR-T細胞療法は、がん治療のために、CARで操作されたT細胞を使用する。CAR-T免疫療法の前提は、がん細胞を、より効果的にターゲティングし、破壊するために、それらを認識するように、T細胞を改変することである。T細胞は、対象またはドナーから採取され、遺伝子改変され、それらの腫瘍を攻撃するように、患者へと注入されうる。CAR-T細胞は、患者自身の血液のT細胞に由来する(自家)場合もあり、別の健常ドナーのT細胞に由来する(同種)場合もある。対象から単離されると、これらのT細胞は、腫瘍の表面上に存在する抗原をターゲティングするように、それらをプログラムする、特異的CARを発現するように遺伝子操作される。安全性のために、CAR-T細胞は、腫瘍上で発現されるが、健常細胞上で発現されない抗原に特異的となるように操作される。CAR-T細胞は、患者へと注入された後、がん細胞に対する「生薬」として作用する。CAR-T細胞は、細胞上における、それらの標的抗原と接触すると、これに結合し、活性化され、次いで、増殖し始め、細胞傷害性となる。CAR-T細胞は、広範な細胞増殖の刺激、他の生細胞に対して毒性である程度の増大(細胞傷害作用)、およびサイトカイン、インターロイキン、および増殖因子など、他の細胞に影響を及ぼしうる因子の分泌の増大を含む、いくつかの機構を介して、細胞を破壊しうる。
方法は、CARの抗原結合性ドメインが、対象の自己抗原に対して寛容であるのかどうかを決定するステップを含む場合があり、この場合、CARの抗原結合性ドメインが、対象の自己抗原に対して寛容であるのかどうかを決定するステップは、本明細書で記載される機械学習システムをフィッティングすることにより、対象におけるB細胞選択を再構成し、CARの抗原結合性ドメインをコードするBCR遺伝子が、対象の自己抗原に対して寛容であるのかどうかを決定することであって、CARの抗原結合性ドメインをコードする寛容BCR遺伝子が、生産的BCR遺伝子として、適正に分類されたBCR遺伝子であることを含む。
対象におけるB細胞選択を再構成するステップは、本明細書で記載される機械学習システムを使用することにより、対象に由来する試料中のBCR遺伝子をシーケンシングし、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含みうる。
CARの抗原結合性ドメインをコードする非寛容BCR遺伝子は、修復BCR遺伝子として誤分類されたBCR遺伝子でありうる。CARの抗原結合性ドメインをコードする非寛容BCR遺伝子は、対象におけるB細胞選択に失格することが予測されるBCR遺伝子でありうる。
抗体薬をコードする非寛容BCR遺伝子は、対象における自己抗原に結合する可能性が高い抗体薬をコードしうる。
自己抗原に結合する可能性が高いBCR遺伝子として分類されるBCR遺伝子は、対象におけるCAR-T細胞療法の使用の安全性の欠如を指し示しうる。
試料は、末梢血試料の場合もあり、組織試料の場合もある。
組成物および方法については、下記で、より詳細に記載され、本明細書で明示される実施例は、その中における、多数の改変および変動が、当業者に明らかであるので、例示的な例としてだけ意図される。本明細書で使用される用語は、一般に、当技術分野における、それらの通常の意味、本明細書で記載される組成物および方法の文脈の内部における、それらの通常の意味、および各用語が使用される、具体的文脈における、それらの通常の意味を有する。本明細書では、組成物および方法の記載に関して、実施者に、さらなる指針をもたらすように、一部の用語が、より具体的に規定されている。
本明細書で使用される、「および/または」という用語は、列挙された関連項目のうちの1つまたは複数の、任意の組合せ、および全ての組合せを含む。文脈により、そうでないことが明確に指示されない限りにおいて、本明細書の記載において使用され、後続の特許請求の範囲を通して使用される、「a(ある)」、「an(ある)」、および「その」の意味は、複数の指示対象ならびに単数の指示対象を含む。数値と関連する「約」という用語は、値が、±5%変動することを意味する。例えば、約100の値は、95~105(または95~105の間の任意の値)を意味する。
本明細書の任意の箇所で言及される、全ての特許、特許出願、および他の科学的著作または技術的著作は、参照によりそれらの全体において本明細書に組み込まれる。本明細書で、例示的に記載される実施形態は、本明細書で具体的に開示されているか、または具体的に開示されていない、1つまたは複数の要素、1つまたは複数の限定の非存在下において、適切に実施されうる。したがって、例えば、本明細書の各場合において、「~を含むこと」、「~から本質的になること」、および「~からなること」という用語のいずれも、それらの通常の意味を保持しながら、他の2つの用語のいずれかで置きかえられうる。加えて、用いられる用語および表現は、限定する用語ではなく、記載する用語として使用されており、このような用語および表現の使用において、示され、記載された特色を有する均等物、またはこれらの部分を除外する意図は存在せず、特許請求される開示の範囲内において、多様な改変が可能であることが認識される。したがって、本方法および本組成物は、実施形態および任意選択の特色により具体的に開示されたが、本明細書で開示される概念の改変および変動も、当業者により用いられる場合があり、このような改変および変動も、本記載および付属の特許請求の範囲により規定される組成物および方法の範囲内にあると考えられることを理解されたい。
本明細書で記載される、いかなる単一の用語、単一の要素、単一の語句、用語の群、語句の群、または要素の群も、各々、特許請求の範囲から、具体的に除外される場合がある。
明細書で、範囲が与えられる場合は常に、例えば、温度範囲、時間範囲、組成物または濃度の範囲、全ての中間値範囲、および部分範囲のほか、所与の範囲内に含まれる、全ての個別の値は、本開示に含まれることが意図される。いかなる部分範囲、または本明細書における記載に含まれる範囲もしくは部分範囲内の、いかなる個別の値も、本明細書における態様から除外されうることが理解されるであろう。本明細書における記載に含まれる、いかなる要素またはステップも、特許請求される組成物または方法から除外されうることが理解されるであろう。
加えて、本組成物および本方法の特色または態様が、マーカッシュ群または代替法による他の群分けとの関係で記載される場合、当業者は、本組成物および本方法がまた、これにより、マーカッシュ群もしくは他の群の任意の個別のメンバー、またはマーカッシュ群もしくは他の群のメンバーの亜群との関係でも記載されることを認識するであろう。
以下は、例示だけを目的として提示され、上記の広範な関係で記載された、実施形態の範囲を限定することは意図されない。
実施例
モデルの性能について査定するために、TCR選択を、単一のBALB/cマウスについてシミュレートした。図7は、TCR選択シミュレーションの結果を例示する。図7の右上隅のセクション「a」は、モデルをフィッティングし、査定するのに使用されたデータを例示する。セクション「a」に示される通り、単一のBALB/cマウスの脾臓からシーケンシングされた、TCRβ鎖(TCRB)遺伝子を使用して、本発明者らの機械学習モデルをフィッティングする。TCRB遺伝子についてのこの試料は、生産的TCR遺伝子および非生産的修復TCR遺伝子の両方を含む。この解析の目標は、固有のホールドアウトテストセット内に含まれるTCRBの由来を同定することである。ホールドアウトTCRBは、胸腺から単離された、修復TCR遺伝子および生産的TCR遺伝子の両方を含む。CD4+T細胞およびCD8+T細胞のホールドアウトを含むテストセットもまた使用して、性能が、CD4+T細胞と、CD8+T細胞との間で異なるのかどうかを見るために、モデルについて査定した。
モデルは、査定されたテストセット上で、73.2%の分類精度を達成した。生産的遺伝子に由来するTCRBについての感度は、85.2%であり、修復遺伝子に由来するTCRBについての特異度は、61.1%であった。図7の右上のセクション「b」は、本発明者らのモデルの多様な分類閾値についての真陽性率を、偽陽性率と対比したプロットを例示する。プロットに示される、真陽性率と、偽陽性率との間の関係は、受信者動作特性(ROC)曲線として公知であり、0.8の曲線下面積(AUC)を有する。査定されたテストセット内の、修復遺伝子に由来するTCRBについての特異度が比較的低度であることは、修復遺伝子が、一部は、T細胞選択後に存続するが、一部は、T細胞選択後に存続しない、未選択TCRBミックスを表すという事実に帰せられうる。これは、図7の下のセクション「c」に示された、本発明者らのテストセット内の、各固有のホールドアウトTCRBについての、モデル予測のヒストグラムに反映される。
ヒストグラムは、モデルによる、異なるTCRB集団についての予測の分布を明らかにする。モデル予測についてのヒストグラムは、生産的遺伝子に由来するTCRBについての一峰性分布、および修復遺伝子に由来するTCRBについての二峰性分布を明らかにする。修復遺伝子と関連する第2モードは、生産的遺伝子と関連する単一モードに対応することから、T細胞選択後に存続する、修復遺伝子に由来するTCRBを表すと考えられる。脾臓に由来する、生産的遺伝子に由来するTCRBについて、単一モードは、0.74を中心として観察される(二重線)。ヒストグラムはまた、T細胞(例えば、CD4+細胞およびCD8+細胞)の、特定のサブセットについての結果も提示する。これらの結果は、機械学習システムが、特定のT細胞サブセットから分離されたT細胞についてのT細胞選択を再構成するのに使用されうることを裏付ける。例えば、機械学習システムは、細胞分取により単離されたT細胞、および/またはRNA発現により単離されたT細胞の特異的集団についてのT細胞選択結果を予測するのに使用されうる。
T細胞は、CD3と名付けられた、表面分化抗原群(cluster of differentiation)(CD)分子の特異的発現により同定することができ、2つの主要な群:CD4集団およびCD8集団について区別されうる。CD4細胞は、他の細胞集団に対して、ヘルパー活性を提示し、各々が、産生サイトカインの特徴的プロファイルを伴う、少なくとも、Th1群、Th2群、Th9群、Th17群、および制御性T(Treg)群へと細分される。CD8 T細胞傷害性集団は、標的細胞の殺滅において機能する、Tリンパ球の、第2の主要な群であり;Th1およびTh2細胞と同様の、サイトカインプロファイルを伴う、Tc1亜集団およびTc2亜集団から構成される。
特異的サイトカインは、T細胞系の、2つのサブセット:CD4+ヘルパーT(Th)リンパ球、およびCD8+細胞傷害性Tリンパ球(CTL)を形作ることに関与する。すなわち、それらの表面における、特異的CD分子(CD4またはCD8)の発現とは別に、T細胞は、それらが産生するサイトカインにより分化させられうる。例えば、Tc1 CD8+T細胞は、それらによる、TNF-βおよびIFN-γの産生により特徴づけられ;Tc2 CD8+T細胞は、それらによる、IL-4およびIL-10の産生により特徴づけられ;Th1 CD4+T細胞は、それらによる、TNF-βおよびIFN-γの産生により特徴づけられ;Th2 CD4+T細胞は、それらによる、IL-4、IL-5、IL6、IL-10、およびIL-13の産生により特徴づけられ;Th3 CD4+T細胞は、それらによる、TGF-βの産生により特徴づけられ;Th17 CD4+T細胞は、それらによる、IL-17、IL-21、およびIL-22の産生により特徴づけられ;Treg CD4+T細胞は、それらによる、IL-10の産生により特徴づけられる。
例えば、それらの表面に発現されたタンパク質に基づき、細胞を差別化および分離する、フローサイトメトリーを使用して、これらの特異的表面タンパク質の発現に基づき、異なるサブセットに由来するT細胞を分取することができる。単離されたサブセットに由来するTCR遺伝子を使用して、単離された、このサブセットだけについての、T細胞選択を再構成することができる。代替的に、個別のT細胞からのRNA発現を使用して、混合されたT細胞サブセットの集団の中で、特異的T細胞サブセットに属するT細胞を同定することもできる。例えば、サイトカインをコードする遺伝子の発現を使用して、細胞内タンパク質発現に基づき、T細胞サブセットを単離することができる。TCR遺伝子を、各個別のT細胞のRNA発現と組み合わせることにより、特異的T細胞サブセットに属するTCR遺伝子を単離し、このT細胞サブセットだけについての、T細胞選択を再構成するのに使用することができる。
CD4+T細胞およびCD8+T細胞のサブセットについて、CD4+T細胞およびCD8+T細胞のいずれも、脾臓に由来する生産的TCRB遺伝子と同様に分類される(点線および破線)。CD4+T細胞およびCD8+T細胞についての一峰性分布は、バルクシーケンシングにより回収されたTCRBに由来する生産的遺伝子についての一峰性分布と合致する。したがって、モデルは、T細胞が、CD4+であるのか、CD8+であるのかにかかわらず、T細胞の分類に成功する。修復遺伝子に由来するTCRBについて、0.0および0.66(#を伴う実線)を中心として観察される二峰性分布は、第1モードが、T細胞選択により間引かれるTCRBを潜在的に表し、第2モードが、T細胞選択後に存続するTCRBを潜在的に表す。胸腺に由来するTCRBは、修復遺伝子に由来するTCRBと同様に、二峰性分布(実線)を示す。胸腺TCRBについての分布は、一部の発生期T細胞が、選択過程を部分的に完了している可能性があるか、胸腺内の成熟T細胞が、発生期T細胞の集団を希釈しつつあるため、修復遺伝子と関連する分布から、わずかにシフトする。ヒストグラムに示される通り、胸腺細胞に由来するTCRBの大半は、修復遺伝子に由来するTCRBと同様に分類される。
本明細書で記載される機械学習システムを使用して、非制御性T細胞に由来する各TCR遺伝子を、生産的TCR遺伝子または修復TCR遺伝子として分類することにより、非調節性(サプレッサー)T細胞を使用してもまた、T細胞選択を再構成することができる。再構成されたT細胞選択の適用は、非制御性T細胞に由来するTCR遺伝子を、生産的TCR遺伝子、または修復TCR遺伝子として分類することからなる。制御性T細胞の除去は、制御性T細胞への転換により、陰性選択を逃避する、T細胞が、T細胞選択を再構成するか、または再構成されたT細胞選択を適用するのに使用されないことを確保する。
モデルの性能が、他の臓器内のT細胞へと拡張可能であるのかどうかを決定するように、発生期T細胞を含有しない、結腸および皮膚を含む、2例のマウス個体の他の臓器からシーケンシングされたTCRBについてもまた査定した。図8は、血液(実線)、結腸(×を伴う実線)、十二指腸(四角を伴う実線)、肝臓(破線)、腸間膜リンパ節(mLN、二重線)、皮膚(点線)、脾臓(二重破線)、および胸腺(実線)からシーケンシングされた、生産的TCRB遺伝子についての予測ヒストグラムを例示する。上パネルのための予測は、図8に示されたBALB/cマウス1についてのモデルに由来する。下パネルのための予測は、第2のマウス個体(BALB/cマウス2)に由来する。これらのTCRBについての予測ヒストグラムは、脾臓に由来する、生産的遺伝子に由来するTCRBについての一峰性分布とほぼ識別不可能である一峰性分布を明らかにする。こうして、成熟T細胞からシーケンシングされたTCRBは、複数の末梢組織供給源にわたり、同じ方式で分類される。
機械学習システムが、B細胞選択を予測する能力について査定するために、脾臓に由来する生産的遺伝子に由来するBCRHと、修復遺伝子に由来するBCRHとを識別するように、予測モデルをフィッティングした。図9は、例示的なB細胞選択のシミュレーションの結果を例示する。B細胞選択予測を生成するのに使用された予測モデルを、図9の左上のセクション「a」に示す。示される通り、脾臓から得られたBCRHの一部は、モデルをフィッティングするのに使用されたトレーニングデータセットから抜き出した。抜き出されたBCRH標本を使用して、モデルの予測精度を決定した。テストデータのうちの、抜き出された標本について、モデルは、83.3%の重み付け分類精度を達成する。生産的BCRHについての感度は、91.2%であり、特異度は、75.3%である。図9の右上のセクション「b」におけるROC曲線は、ホールドアウトデータにわたる、異なる分類閾値についての、真陽性率および偽陽性率を示す。抜き出された標本に対する予測についてのROC曲線下面積(AUC)は、0.91であった。図9の下のセクション「b」に示されたヒストグラムは、異なるBCRH集団についてのモデル予測の分布を明らかにする。脾臓に由来する生産的遺伝子に由来するBCRHについて、単一モードは、0.9を中心として観察される(二重線)。修復遺伝子に由来するBCRHについて、モードは、左端へとシフトする(#を伴う実線)。プレB細胞に由来する生産的BCRHが、脾臓に由来する生産的BCR遺伝子から、修復BCR遺伝子へのシフトを示すことは、モデルが、BCR遺伝子から、少なくとも一部のプレB細胞を同定しうることを指し示す(実線)。
GvHDおよびがん再発を予後診断するための、移植前T細胞受容体配列の使用:手法
末梢血からシーケンシングされたTCRβ遺伝子は、それぞれ、T細胞選択の前および後において見出されるTCRβの種類を表す、生産的TCRβ遺伝子および非生産的TCRβ遺伝子を明らかにする。T細胞選択のための受容体を決して発現しないため、非生産的TCRβ遺伝子が、T細胞選択の前に見出されるTCRβの種類を表すのに対し、T細胞選択後に存続した受容体を発現するため、生産的TCRβ遺伝子は、T細胞選択の後で見出されるTCRβの例である。末梢血に由来する非生産的TCRβ遺伝子は、T細胞選択により除去されたTCRβについての情報を明らかにする。しかし、これらの比較は、抗原認識に重要である、CDR3をコードするTCRβ遺伝子の非生産的領域を無視した。CDR3を、比較に含めるために、非生産的TCRβ遺伝子を、コンピュータにより修復するコンピュータアルゴリズムを開発および使用し、T細胞選択の前におけるCDR3と、この後におけるCDR3とを比較することを可能とした(図11)。略述すると、末梢血を、TCRβ遺伝子についてシーケンシングすると、非生産的TCRβ遺伝子が、T細胞選択のための受容体鎖を発現しないのに対し、生産的TCRβ遺伝子は、T細胞選択後に存続する受容体鎖を発現する。したがって、非生産的修復TCRβ遺伝子(修復過程を、実施例5に記載する)は、T細胞選択の前におけるTCRβの種類を表し、生産的TCRβ遺伝子は、T細胞選択の後におけるTCRβを表す。
レシピエントに由来する、生産的TCRβおよび修復TCRβは、ドナーT細胞が、レシピエントと適合性となるのかどうかを推定するのに使用される。例えば、レシピエントに由来する、生産的TCRβは、レシピエントにおけるT細胞選択後に存続していなければならない。したがって、同じTCRβを伴うドナーT細胞もまた、レシピエントにおけるT細胞選択後に存続しうることは、ドナーT細胞が、レシピエントと適合性となることを指し示す。ベン図では、これは、ドナーTCRβの、レシピエントの生産的TCRβとの重複により例示され、f生産的と表記される(図12Aおよび13Aを参照されたい)。これに対し、レシピエントに由来する、修復TCRβは、レシピエントにおけるT細胞選択により除去されうるであろう。したがって、同じTCRβを伴うドナーT細胞もまた、レシピエントにおけるT細胞選択により除去されうることは、ドナーT細胞が、レシピエントと適合性でありうることを示唆する。ベン図では、これは、ドナーTCRβの、レシピエントの修復TCRβとの重複により例示され、f修復と表記される(図12Aおよび13Aを参照されたい)。レシピエントと適合性である、ドナーT細胞の割合を定量するために、PSFと表記される、ポスト・セレクション・フラクションを開発した[表記中、xは、2つのベン図の中央部にある標本を表示する](図12Aおよび13Aを参照されたい)。
PSFについての値は、上ベン図の重複を、両方のベン図による重複の合計と比較することにより、測定中のTCRβの数で除された、適合性であるドナーTCRβの数を計算する。1であるPSF値が、全てのドナーTCRβが、レシピエントと適合性であることを予測するのに対し、0であるPSF値は、ドナーTCRβのうちのいずれもが、レシピエントと適合性でないことを予測する。
ドナーに由来する生産的TCRβおよび修復TCRβのいずれも、レシピエントとの適合性についてスクリーニングされうる。生産的TCRβは、レシピエントへと移植された、HSCと常在するT細胞と同様に、T細胞選択の後におけるT細胞を表す。したがって、ドナーに由来する生産的TCRβをスクリーニングして、任意の移植T細胞の適合性を決定することができる。移植T細胞の適合性は、aGvHDと関連するため、本発明者らは、ドナーに由来する生産的TCRβが、急性GvHD(aGvHD)についてのマーカーを含有するのかどうかを決定する。修復TCRβは、ドナーHSCから発生するT細胞と同様に、T細胞選択前のT細胞を表す。したがって、ドナーに由来する修復TCRβをスクリーニングして、レシピエントにおけるドナーHSCから発生するT細胞の適合性を決定することができる。ドナーHSCから発生するT細胞の適合性は、cGvHDと関連するため、本発明者らは、ドナーに由来する修復TCRβが、慢性GvHD(cGvHD)についてのマーカーを含有するのかどうかを決定する。
T細胞は、がんのコントロールに関与するため、TCRβは、がんの再発についてのマーカーを含有しうる。ドナーに由来する生産的TCRβは、一過性である移植T細胞を表すので、移植T細胞は、長期に近い期間にわたり、がんの再発を防止することが期待されない。代替的に、ドナーに由来する修復TCRβは、HSCから持続的に発生して、旧来のT細胞を置きかえるT細胞を表すので、これらのT細胞は、がんの再発を、潜在的に防止しうるT細胞集団を、長期にわたり表す。したがって、本発明者らは、長期にわたる、がん再発の寛解についてのマーカーのために、修復TCRβについて査定する。
GvHDおよびがん再発を予後診断するための、移植前T細胞受容体配列の使用:材料および方法
ベン図の創成:各TCRβの、相補性決定領域3(CDR3)は、抗原認識に関与するため、全てのベン図は、このTCRβ領域から構築した。さらに、抗原と接触したTCRβについての、三次元X線結晶構造の解析が、CDR3のうち、最初の3つのアミノ酸残基、および最後の3つのアミノ酸残基は、抗原と直接接触しないことを明らかにしたため、各CDR3に由来する、最初の3つのアミノ酸残基、および最後の3つのアミノ酸残基を除去した。この知見に基づき、トリミングされたCDR3アミノ酸配列が、同じであり、これらのTCRβが、ベン図の重複領域内に位置した場合は、ドナーのTCRβと、レシピエントのTCRβとは、同一であると考えた(図14を参照されたい)。
非生産的TCRβ遺伝子を修復するステップ:V(D)J組換えに由来する、入り組んだ、複雑なバイアスを含有する、元の生物学的配列を最大限に保存するために、生産的コピーを得るのに要求される、最少の変更を使用して、各非生産的TCRβ遺伝子を、切り貼りにより修復する、コンピュータアルゴリズムを使用した(図15を参照されたい)。V遺伝子セグメントと、J遺伝子セグメントとは、アウトオブフレームであると表記される、異なるオープンリーディングフレーム内にあるため、TCRβ遺伝子は、非生産的でありうる。Jセグメントのオープンリーディングフレームが、Vセグメントのオープンリーディングフレームの、1つ前方の位置にある場合、体細胞接合部において、任意の単一のヌクレオチドを除去して、セグメントを、同じオープンリーディングフレーム内に組み込んだ。Jセグメントのオープンリーディングフレームが、Vセグメントのオープンリーディングフレームの、2つ前方の位置にある場合、体細胞接合部において、任意の2つのヌクレオチドを除去して、セグメントを、同じオープンリーディングフレーム内に組み込んだ。TCRβ遺伝子は、体細胞接合部内の終止コドンのために、非生産的でありうる。これらの非生産的例は、終止コドンが、体細胞接合部によりコードされる領域内に存在するのかどうかを決定するように、TCRβ遺伝子を翻訳することにより同定されうる。終止コドンを同定したら、この終止コドンをコードする、体細胞接合部内の、任意のヌクレオチドを突然変異させて、これを、アミノ酸残基へと転換しようと試みることにより、非生産的TCRβ遺伝子を修復した。
生殖細胞系列内でコードされるセグメントは、V(D)J組換えから保存されるため、全ての修復は、体細胞内でコードされる接合部内で行った。D遺伝子セグメントのうちの大半または全ては、欠失させられるため、事例によって、D遺伝子セグメントは、V(D)J組換えの後で同定できなかった。この理由で、D遺伝子セグメントを見出すことができなかった事例は除外し、V遺伝子セグメントと、J遺伝子セグメントとの間のヌクレオチドは、単一の体細胞接合部として処理した。多くの事例で、修復により、新たな終止コドンが、TCRβ遺伝子へと導入されるため、修復TCRβ遺伝子は、生産的となれないであろう。複数の修復が、有意味であるために、元の生物学的配列から隔たりすぎたTCRβ遺伝子を結果としてもたらすことを懸念して、これらのTCRβ遺伝子に対して、さらなる修復を行おうとは試みず、これらの事例は棄却した。最後に、修復アルゴリズムは、修復が、リピートにわたりなされる場合に、これらの生物学的パターンを潜在的に破壊する、回文リピートを無視した。しかし、回文リピートの存在が、TCRβ遺伝子のうちの2%未満であることは、これらの低頻度の事象を、一次近似として無視することを可能とする。
鋳型カウント:鋳型カウントは、T細胞クローンのサイズを反映しうる、各シーケンシングTCRB遺伝子についての重要な数である。しかし、鋳型カウントは、非生産的TCRβは、発現することができず、したがって、クローン的拡大に影響を与えることが期待されないため、非生産的TCRβ遺伝子については、無意味である。鋳型カウントは無視し、あらゆる生産的TCRβ遺伝子、および修復TCRβ遺伝子を、シングルトンとして、効果的に処理した。
シーケンシングエラー:重複カウントが大きなTCRβ遺伝子は、多数回にわたりシーケンシングされる。これらの重複配列のうちの少数は、シーケンシングエラーを、不可避的に含有するであろう。こうして、十分に豊富なTCRβ遺伝子は、シーケンシングエラーを伴うコピーを含有するであろう。シーケンシングエラーは、生産的コピーから、非生産的TCRβ偽遺伝子をもたらしうるため、これは問題となる。シーケンシングエラーの2つの種類は、挿入/欠失および突然変異である。挿入/欠失または終止コドンは、体細胞接合部内だけで現れるはずであることを理由として、これらの変更が、生殖細胞系列によりコードされるセグメント内で生じる配列は棄却した。生産的コピーのシーケンシングエラーが、非生産的コピーを結果としてもたらしている場合があることを理由として、生産的TCRβ遺伝子からの編集距離が1である、全ての非生産的TCRβ遺伝子もまた、棄却した。
統計学:P値は、事例が、少なくとも、対照と同程度であるとする帰無仮説を仮定する、片側マン-ホイットニーU検定を使用して計算した。相関係数は、ピアソンによる相関係数を使用して計算した。
GvHDおよびがん再発を予後診断するための、移植前T細胞受容体配列の使用:結果
表1に示される通り、2つの公表研究に由来する、19例のallo-HSCTのドナーおよびレシピエントからシーケンシングされた移植前TCRβ鎖(TCRβ)遺伝子を利用した。ドナーのうちの32パーセントが、ハプロタイプ(例えば、親または母体)であるのに対し、残る68%は、適合ドナー(matched related donor)(MRD)であった。レシピエントのうちの63パーセントが、急性骨髄性白血病を有するのに対し、残りのレシピエントは、他の種類のがんを有した。いずれの研究におけるレシピエントも、≧365日間にわたり、または死亡まで、aGvHD、cGvHD、およびがんの再発についてモニタリングした。レシピエントのうちの42パーセントが、GvHDを発症し、47%のレシピエントが、cGvHDを発症し、28%のレシピエントが再発した。
ドナーに由来する生産的TCRβを、aGvHDについてのマーカーとして査定するために、PSFドナー-生産的と表記される、ドナーに由来する生産的TCRβについてのポスト・セレクション・フラクションを計算して、レシピエントと適合性であるTCRβの割合を見出した(図12A)。aGvHD症例および対照についてのプロットは、予期された通り、PSFドナー-生産的が、aGvHD症例について低値である傾向があることを明らかにする(図12B)。PSFドナー-生産的がaGvHD症例で対照より低値であったことに関するp値は、0.087である。aGvHD症例8例中5例について、0.81のカットオフを下回るPSFドナー-生産的が観察され、対照11例中9例について、このカットオフを上回るPSFドナー-生産的が観察された。自家試料が、T細胞選択の前に、またはこの後で、TCRβを含有するのかどうかの予測について、0.82のカットオフが観察されたこと(図16)は、このカットオフを決定するために、本質的に同じ結果を達成する、第2の方法をもたらす。PSFドナー-生産的についてのカットオフの変動は、受信者動作特性(ROC)曲線にプロットされる、異なる真陽性率および偽陽性率をもたらす(図12C)。達成可能な予後診断精度(感度および特異度の平均)は、82%であった。その急性の性格、および疾患を隠蔽する、予防的処置の変動のために、aGvHDについては、診断の不確実性に対して、低度の予後診断精度が帰せられた。
ドナーに由来する修復TCRβを、cGvHDについてのマーカーとして査定するために、PSFドナー-生産的と表記される、ドナーに由来する修復TCRβについてのポスト・セレクション・フラクションを計算して、レシピエントと適合性であるTCRβの割合を見出した(図13A)。cGvHD症例および対照についてのプロットは、予期された通り、PSFドナー-修復が、cGvHD症例について低値である傾向があることを明らかにする(図13B)。PSFドナー-修復がcGvHD症例で対照より低値であったことに関するp値は、0.019である。PSFドナー-修復は、cGvHD症例8例中8例について、0.69のカットオフを下回り、対照9例中7例について、このカットオフを上回った。cGvHDと関連するT細胞が、T細胞選択の機能障害を経るのに対し、aGvHDと関連するT細胞は、T細胞選択を経ないため、cGvHDについてのカットオフは、aGvHDについてのカットオフより低値であった。達成可能な予後診断精度は、ROC曲線上に示される通り、89%であった(図13C)。
修復TCRβを、がんの再発についてのマーカーとして査定するために、f新規と表記される、ドナーに由来するが、レシピエントに由来しない修復TCRβの割合を計算して、レシピエントが認識できなかった、任意のがん抗原を含む抗原を認識する、ドナーに由来するTCRβの割合を見出した(図17A)。がんの再発例および対照についてのプロットは、仮定された通り、f新規が、がんの再発例について低値である傾向があることを明らかにした(図17B)。f新規ががんの再発例で対照より低値であったことに関するp値は、0.057であった。f新規は、がんの再発例5例中4例について、0.994のカットオフを下回り、対照13例中10例について、このカットオフを上回った。達成可能な予後診断精度は、ROC曲線上に示される通り、78%であった(図17C)。
GvHDは、抗がん応答と関連するため、PSFおよびf新規を、GvHDおよびがん再発の両方を回避しうるのかどうかを決定する、ジョイントマーカーとして査定した。cGvHDについての結果は、aGvHDについての結果より良好であったため、cGvHDについてのマーカーを、がんの再発についてのマーカーと組み合わせることを優先した(図16および18)。17例のレシピエントについて、PSFドナー-修復を、f新規に対してプロットした(図19)。PSFドナー-修復と、f新規とについての相関係数が、r=-0.21であったことは、相関が、ほぼ存在しなかったことを指し示す。既に決定された通り、0.69のカットオフを使用して、cGvHDについて予後診断し、0.994のカットオフを使用して、がんの再発について予後診断した。いずれのカットオフも上回るレシピエントは、いずれの否定的転帰も回避すると予測された。カットオフは、cGvHDおよびがん再発のいずれも回避する、レシピエント5例中5例を適正に同定する。カットオフを伴わない場合、レシピエント17例中8例が、cGvHDおよびがん再発のいずれも回避した。
初期に、TCRβ遺伝子を確認するのに回収された試料は、T細胞選択の前における試料と、この後における試料とに識別されうる。8例のヒト対象に由来する末梢血からシーケンシングされたTCRβ遺伝子を、表2に示す。これらの対象のうちの4例は、T細胞選択前のT細胞でエンリッチされた、自家胸腺組織からシーケンシングされたTCRβ遺伝子を有する。他の4例の対象は、T細胞選択の後におけるT細胞を含有する、1年後に回収されたPBMC、または皮膚からシーケンシングされた、TCRβ遺伝子を有する。
各末梢血試料について、機能的TCRβを発現しなかった、非生産的TCRβ遺伝子を修復し、機能的TCRβを発現しうる、生産的TCRβ遺伝子から分離した。自家試料については、生産的TCRβ遺伝子だけを使用した。
カットオフは、T細胞選択の前におけるTCRβ、およびこの後におけるTCRβを識別する:PSF自家は、自家試料が、末梢血に由来する、生産的TCRβまたは修復TCRβに合致するTCRβを含有するのかどうかを測定する(図16)。自家胸腺的試料は、患者のT細胞選択前のT細胞でエンリッチされることが公知であり、胸腺試料についてのPSF自家は低値であるのは、このためである。T細胞選択の1年後に回収されたPBMC、または皮膚は、T細胞選択の後におけるT細胞を含有し、このために、これらの試料についてのPSF自家は高値である。T細胞選択の前におけるT細胞集団またはこの後におけるT細胞集団を識別するのに最適のカットオフは、0.82であった。このカットオフは、aGvHD症例についての結果および対照を解釈する一助となった。
aGvHDについてのカットオフと、がん再発についてのカットオフとの組合せ:17例のレシピエントについて、PSFドナー-生産的を、f新規に対してプロットし(図18)、PSFドナー-生産的と、f新規とについての相関係数が、r=0.33であったことは、相関が、ほぼ存在せず、方向が誤っていることを指し示す。既に決定された通り、0.81のカットオフを使用して、aGvHDについて予後診断し、0.994のカットオフを使用して、がんの再発について予後診断した。いずれのカットオフも上回るレシピエントは、いずれの否定的転帰も回避すると予測された。カットオフは、aGvHDおよび再発のいずれも回避する、7例中3例≒43%の移植を適正に同定する。カットオフを伴わない場合、17例中6例≒35%のレシピエントが、aGvHDおよび再発のいずれも回避する。
GvHDおよびがん再発を予後診断するための、移植前T細胞受容体配列の使用:考察
allo-HSCTと関連する、著明な罹患率および死亡率を低減するのに使用されうる、aGvHD、cGvHD、およびがんの再発についての予後診断マーカーを同定した。例えば、本発明者らのマーカーが、GvHDまたはがんの再発を予測する場合、代替的ドナー、または特異的GvHD予防処置を選択することができる(図20)。代替的ドナーまたは処置が、常に存在することを仮定すると、各マーカーの感度を計算することにより、疾患発生率の、達成可能な低減を推定することができる。観察された結果から、発生率の低減:
aGvHDについて、8例中5例=62.5%、
cGvHDについて、8例中8例=100%、および
がんの再発について、5例中4例=100%
を推定した。
こうして、予後診断マーカーは、allo-HSCT罹患率を、潜在的に低減し、おそらく、その後における死亡率さえも低減しうる。
複数の因子が、GvHDマーカーによる予測を妨げる。例えば、疾患と関連する、高度に可変性である臨床症状は、診断的不確実性をもたらしうるため、カットオフを選択するのに使用される、一部のGvHD診断は、不正確でありうる。将来的な研究に由来する、さらなる試料は、この限界を軽減する一助となるであろう。マーカーはまた、T細胞にも基づくが、GvHDは、場合によって、B細胞および免疫系の他の構成要素により媒介される。B細胞マーカーを開発するための、他の手法の適用は、T細胞マーカーに関して残存する、任意の性能ギャップを、潜在的に閉止しうる。最後に、GvHDは、それらがなければ生じなかったGvHDを誘発しうる、移植後感染など、外的因子の影響を受ける。こうして、移植前に予測されうることには、限界が存在する。
移植前TCR配列から、GvHDおよびがん再発について予後診断することにより、候補者ドナーは、レシピエントにおける、これらの転帰についてスクリーニングされうる。T細胞だけを比較する予測は、ことによると、これらの転帰と関連する、特異的T細胞を同定するのに使用されうる。GvHDおよびがん再発を予測するのに、異なる種類の比較が使用されるため、本発明者らは、GvHDを引き起こす、同種反応性副作用を伴わずに、抗がん応答を誘発するT細胞を、潜在的に同定しうる。したがって、この研究は、HSCTのために重要であるだけではなく、がん処置選択肢として探索される、操作T細胞移入療法のためにもまた、重要である。
上記の実施例において、本発明は、そのある特定の実施形態の具体的詳細について記載されたが、改変および変動が、本発明の精神および範囲の範囲内に包含されることが理解されるであろう。したがって、方法および組成物は、以下の特許請求の範囲だけによりを限定される。
参考文献

Claims (151)

  1. 免疫受容体鎖遺伝子を分類する方法であって、
    a)複数の遺伝子セグメントおよび体細胞変異を含む免疫受容体鎖遺伝子配列を得るステップ、
    b)複数の遺伝子セグメントまたは体細胞変異のうちの少なくとも1つを、アミノ酸配列へと翻訳するステップ、
    c)抗原認識が可能であるアミノ酸配列をコードする免疫受容体鎖遺伝子を、生産的免疫受容体鎖遺伝子として同定するステップ、
    d)抗原認識が可能であるアミノ酸配列を伴わない免疫受容体鎖遺伝子を、非生産的免疫受容体鎖遺伝子として同定するステップ、
    e)非生産的として同定された免疫受容体鎖遺伝子のアミノ酸配列を修復して、抗原認識が可能である修復免疫受容体鎖遺伝子を作出するステップと、
    f)免疫受容体鎖遺伝子を、生産的免疫受容体鎖遺伝子、または修復免疫受容体鎖遺伝子として分類し、
    これにより、免疫受容体鎖遺伝子を分類するステップ
    を含む方法。
  2. 遺伝子セグメントが、バリアブル(variable)(V)遺伝子セグメント、ダイバーシティ(diversity)(D)遺伝子セグメント、ジョイニング(joining)(J)遺伝子セグメント、およびこれらの組合せからなる群から選択される、請求項1に記載の方法。
  3. 免疫受容体鎖遺伝子が、T細胞受容体(TCR)、TCRアルファ鎖(TCRα)、TCRベータ鎖(TCRβ)、TCRデルタ鎖(TCRδ)、TCRガンマ鎖(TCRγ)、B細胞受容体(BCR)、BCR軽鎖(BCRL)、BCR重鎖(BCRH)、免疫グロブリン軽鎖(IgL)、免疫グロブリン重鎖(IgH)、免疫グロブリンカッパ鎖(Igκ)、および免疫グロブリンラムダ鎖(Igλ)からなる群から選択される、請求項1に記載の方法。
  4. 免疫受容体鎖遺伝子が、TCRβ遺伝子である、請求項3に記載の方法。
  5. 非生産的TCRβ遺伝子が、アウトオブフレームの遺伝子セグメントを伴うTCRβ遺伝子、または遺伝子セグメント間の体細胞接合部内の終止コドンを伴うTCRβ遺伝子である、請求項3に記載の方法。
  6. 非生産的TCRβ遺伝子を修復するステップが、遺伝子セグメント間の体細胞接合部において、1つもしくは複数のヌクレオチドを付加もしくは除去して、遺伝子セグメントを、同じリーディングフレーム内に組み込み、かつ/または遺伝子セグメント間の体細胞領域内のヌクレオチドを突然変異させて、終止コドンを、アミノ酸へと転換することを含む、請求項3に記載の方法。
  7. TCRβ遺伝子配列が、TCRβ遺伝子の相補性決定領域1(CDR1)配列、TCRβ遺伝子のCDR2配列、TCRβ遺伝子のCDR3配列、これらの組合せ、または完全TCRβ遺伝子の配列を含む、請求項3に記載の方法。
  8. TCRβ遺伝子配列が、TCRβ遺伝子のCDR3配列を含む、請求項3に記載の方法。
  9. CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸を、TCRβ遺伝子配列から除去するステップをさらに含む、請求項8に記載の方法。
  10. TCRβ遺伝子配列を得るステップが、対象に由来する血液試料中のTCRβ遺伝子をシーケンシングすることを含む、請求項3に記載の方法。
  11. 血液試料が、末梢血単核細胞試料である、請求項10に記載の方法。
  12. TCRβ遺伝子配列を得るステップが、試料から、T細胞を単離するステップをさらに含む、請求項3に記載の方法。
  13. T細胞を分離するステップが、細胞分取および/またはRNA発現を介するステップである、請求項12に記載の方法。
  14. T細胞が、非制御性T細胞である、請求項12に記載の方法。
  15. 対象が、ヒトである、請求項1に記載の方法。
  16. 臓器ドナー/臓器レシピエント間の適合性を決定する方法であって、
    a)請求項4から15のいずれか一項に記載の方法を使用して、臓器ドナーのT細胞受容体β(TCRβ)遺伝子、および臓器レシピエントのTCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ、
    b)ドナーにおける、生産的TCRβ遺伝子および修復TCRβ遺伝子の数を、レシピエントにおける、生産的TCRβ遺伝子の数と比較するステップ、ならびに
    c)臓器ドナーと適合性である、臓器レシピエントに由来するTCRβの割合を定量し、
    これにより、臓器ドナー/臓器レシピエント間の適合性を決定するステップ
    を含む方法。
  17. 定量するステップが、ポスト・セレクション・フラクション(post selection fraction)PSFスコアの計算である、請求項16に記載の方法。
  18. PSFスコアが、臓器レシピエントに由来する、適合性TCRβ遺伝子の数と、TCRβ遺伝子の総数との比である、請求項17に記載の方法。
  19. PSFが、0~1の範囲である、請求項18に記載の方法。
  20. PSFスコアが、PSFレシピエントスコアであり、PSFレシピエントスコアが、F生産的と、F総数との比であり、F総数が、F修復+F生産的であり、F生産的が、臓器ドナーおよび臓器レシピエントのいずれにおいても、生産的TCRβ遺伝子として同定されたTCRβ遺伝子の数であり、F修復が、臓器ドナーにおいて、修復TCRβ遺伝子として同定され、臓器レシピエントにおいて、生産的TCRβ遺伝子として同定された、TCRβ遺伝子の数である、請求項17に記載の方法。
  21. PSFレシピエントが、ゼロであることが、臓器レシピエントにおいてシーケンシングされた、いかなるTCRβ遺伝子も、臓器ドナーと適合性でないことを指し示す、請求項19に記載の方法。
  22. PSFレシピエントが、1であることが、臓器レシピエントにおいてシーケンシングされた、全てのTCRβ遺伝子が、臓器ドナーと適合性であることを指し示す、請求項19に記載の方法。
  23. TCRβ遺伝子配列が、TCRβ遺伝子のCDR3配列を含む、請求項16に記載の方法。
  24. TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸が、除去される、請求項23に記載の方法。
  25. 臓器レシピエントまたは細胞レシピエントにおける移植片対宿主病(GvHD)を予測する方法であって、
    a)請求項4から15のいずれか一項に記載の方法を使用して、ドナーのT細胞受容体β(TCRβ)遺伝子、およびレシピエントのTCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ、
    b)レシピエントにおける、生産的TCRβ遺伝子および修復TCRβ遺伝子の数を、ドナーにおける、生産的TCRβ遺伝子の数と比較するステップ、ならびに
    c)レシピエントと適合性であるドナーに由来するTCRβの割合を定量し、
    これにより、レシピエントにおけるGvHDを予測するステップ
    を含む方法。
  26. GvHDが、急性GvHD(aGvHD)である、請求項25に記載の方法。
  27. 臓器または細胞が、骨髄または造血幹細胞移植細胞である、請求項25に記載の方法。
  28. aGvHDを予測するステップが、レシピエントと適合性であるドナーに由来する生産的TCRβ遺伝子の数を定量することを含む、請求項26に記載の方法。
  29. 定量することが、ポスト・セレクション・フラクションPSFドナー-生産的スコアを計算することを含み、PSFドナー-生産的スコアが、F生産的と、F総数との比であり、F総数が、F修復+F生産的であり、F生産的が、ドナーおよびレシピエントのいずれにおいても、生産的TCRβ遺伝子として同定されたTCRβ遺伝子の数であり、F修復が、レシピエントにおいて、修復TCRβ遺伝子として同定され、ドナーにおいて、生産的TCRβ遺伝子として同定された、TCRβ遺伝子の数である、請求項28に記載の方法。
  30. PSFドナー-生産的が、ゼロであることが、ドナーにおいてシーケンシングされた、いかなるTCRβ遺伝子も、レシピエントと適合性でないことを指し示す、請求項29に記載の方法。
  31. PSFドナー-生産的が、1であることが、ドナーにおいてシーケンシングされた、全てのTCRβ遺伝子が、レシピエントと適合性であることを指し示す、請求項29に記載の方法。
  32. GvHDが、慢性GvHD(cGvHD)である、請求項25に記載の方法。
  33. cGvHDを予測するステップが、レシピエントと適合性であるドナーに由来する修復TCRβ遺伝子の数を定量することを含む、請求項32に記載の方法。
  34. 定量することが、PSFドナー-修復と表記される、ポスト・セレクション・フラクションスコアを計算することを含み、PSFドナー-修復スコアが、F生産的と、F総数との比であり、F総数が、F修復+F生産的であり、F生産的が、レシピエントにおいて、生産的TCRβ遺伝子として同定され、ドナーにおいて、修復として同定されたTCRβ遺伝子の数であり、F修復が、レシピエントおよびドナーのいずれにおいても、修復TCRβ遺伝子として同定されたTCRβ遺伝子の数である、請求項33に記載の方法。
  35. PSFドナー-修復が、ゼロであることが、ドナーにおいてシーケンシングされた、いかなるTCRβ遺伝子も、レシピエントと適合性でないことを指し示す、請求項34に記載の方法。
  36. PSFドナー-修復が、1であることが、ドナーにおいてシーケンシングされた、全てのTCRβ遺伝子が、レシピエントと適合性であることを指し示す、請求項34に記載の方法。
  37. TCRβ遺伝子配列が、TCRβ遺伝子のCDR3配列を含む、請求項25に記載の方法。
  38. TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸が、除去される、請求項37に記載の方法。
  39. 造血幹細胞レシピエントにおけるがんの再発を予測する方法であって、
    a)請求項4から15のいずれか一項に記載の方法を使用して、造血幹細胞ドナーのT細胞受容体β(TCRβ)遺伝子、および造血幹細胞レシピエントのTCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ、
    b)造血幹細胞ドナー、および造血幹細胞レシピエントの両方における、修復TCRβ遺伝子の数を比較するステップ、ならびに
    c)造血幹細胞ドナーにおいて、造血幹細胞レシピエントにおいて見出されない、修復TCRβ遺伝子の数を定量し、
    これにより、造血幹細胞レシピエントにおけるがんの再発を予測するステップ
    を含む方法。
  40. 造血幹細胞レシピエントが、がんを有する対象である、請求項39に記載の方法。
  41. 造血幹細胞ドナーに由来し、造血幹細胞レシピエントにおいて存在しない修復TCRβ遺伝子が、造血幹細胞レシピエントにおけるがん細胞を認識するT細胞受容体(TCR)をもたらす可能性が高い、請求項39に記載の方法。
  42. 定量するステップが、
    造血幹細胞レシピエントと、造血幹細胞ドナーとの間で共通である修復TCRβ遺伝子の数を除外して、造血幹細胞ドナーにおいて、修復TCRβ遺伝子として同定されるTCRβ遺伝子の総数の割合であるf新規スコア
    を計算すること
    を含む、請求項39に記載の方法。
  43. 造血幹細胞レシピエントと、造血幹細胞ドナーとの間のf新規スコアが小さいほど、がん再発の危険性が大きい、請求項42に記載の方法。
  44. 造血幹細胞レシピエントと、造血幹細胞ドナーとの間のf新規スコアが大きいほど、がん再発が生じない可能性が大きい、請求項42に記載の方法。
  45. TCRβ遺伝子配列が、TCRβ遺伝子のCDR3配列を含む、請求項39に記載の方法。
  46. TCRβ遺伝子配列に由来する、CDR3配列の、最初の3つのアミノ酸および最後の3つのアミノ酸が、除去される、請求項45に記載の方法。
  47. がんが、白血病、リンパ腫、および血液悪性腫瘍からなる群から選択される、請求項39に記載の方法。
  48. 免疫細胞受容体鎖遺伝子についての免疫細胞選択を予測する方法であって、
    複数の遺伝子セグメントを含む被験免疫細胞受容体鎖遺伝子を得るステップ、
    複数の遺伝子セグメントのうちの少なくとも1つを、免疫細胞受容体鎖のタンパク質配列へと翻訳するステップ、
    複数の遺伝子セグメントのうちの、少なくとも2つについて、遺伝子セグメントを数値的に表す遺伝子特徴を決定するステップ、
    免疫細胞受容体鎖のタンパク質配列内に含まれる各アミノ酸について、1つのアミノ酸を数値的に表すタンパク質特徴を決定するステップ、ならびに
    複数の遺伝子セグメントの各々についての遺伝子特徴、免疫細胞受容体鎖のタンパク質配列内の、アミノ酸の各々についてのタンパク質特徴、および機械学習システムの、1つまたは複数のモデルに含まれる重み値の数に基づき、被験免疫細胞受容体鎖遺伝子についての選択予測を、機械学習システムにより決定するステップ
    を含む方法。
  49. 免疫受容体鎖遺伝子が、T細胞受容体(TCR)、TCRアルファ鎖(TCRα)、TCRベータ鎖(TCRβ)、TCRデルタ鎖(TCRδ)、TCRガンマ鎖(TCRγ)、B細胞受容体(BCR)、BCR軽鎖(BCRL)、BCR重鎖(BCRH)、免疫グロブリン軽鎖(IgL)、免疫グロブリン重鎖(IgH)、免疫グロブリンカッパ鎖(Igκ)、および免疫グロブリンラムダ鎖(Igλ)からなる群から選択される、請求項48に記載の方法。
  50. 免疫受容体鎖遺伝子が、TCRβ遺伝子である、請求項49に記載の方法。
  51. 遺伝子セグメントが、バリアブル(V)遺伝子セグメント、ダイバーシティ(D)遺伝子セグメント、ジョイニング(J)遺伝子セグメント、およびこれらの組合せからなる群から選択される、請求項48に記載の方法。
  52. 選択予測が、TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として同定する、請求項51に記載の方法。
  53. 機械学習システムが、複数の予測モデルのアンサンブルを含み、複数の予測モデルのアンサンブルに含まれる各予測モデルが、モデル予測を生成し、各予測モデルに由来するモデル予測が、選択予測を決定するように組み合わされる、請求項51に記載の方法。
  54. 2つを超える連続決定の階層的配置を含む改変型ニューラル決定木(neural decision tree)アーキテクチャーが、モデル予測を、選択予測へと統合するのに使用される、請求項53に記載の方法。
  55. ニューラル決定木のアーキテクチャーが、関数のコミッティーを含み、関数のコミッティーに含まれる関数の数が、ニューラル決定木内の終端決定から、ニューラル決定木上の基点決定へと増大する、請求項54に記載の方法。
  56. TCRβ遺伝子、およびTCRβ遺伝子のTCRβタンパク質配列のライブラリーを含むトレーニングデータセットを得るステップ、ならびに
    最適化過程を使用して、各予測モデルに含まれる重み値を決定することにより、トレーニングデータセットを使用して、機械学習システムに含まれる1つまたは複数の予測モデルをトレーニングするステップ
    をさらに含む、請求項51に記載の方法。
  57. TCRβ遺伝子のライブラリーが、複数の生産的遺伝子、および複数の非生産的遺伝子を含む、請求項56に記載の方法。
  58. 非生産的TCRβ遺伝子が、アウトオブフレームの遺伝子セグメントを伴うTCRβ遺伝子、または遺伝子セグメント間の体細胞接合部内の終止コドンを伴うTCRβ遺伝子である、請求項57に記載の方法。
  59. 抗原認識が可能であるアミノ酸配列をコードするTCRβ遺伝子が、生産的TCRβ遺伝子として同定され、抗原認識が可能であるアミノ酸配列を伴わないTCRβ遺伝子が、非生産的TCRβ遺伝子として同定される、請求項57に記載の方法。
  60. 複数の非生産的遺伝子の各々を修復するステップ;および修復された非生産的遺伝子の各々を、TCRβタンパク質配列へと翻訳するステップをさらに含む、請求項57に記載の方法。
  61. 非生産的TCRβ遺伝子を修復するステップが、遺伝子セグメント間の体細胞接合部において、1つもしくは複数のヌクレオチドを付加もしくは除去して、遺伝子セグメントを、同じリーディングフレーム内に組み込み、かつ/または遺伝子セグメント間の体細胞領域内のヌクレオチドを突然変異させて、終止コドンを、アミノ酸へと転換することを含む、請求項60に記載の方法。
  62. 非生産的として同定されたTCRβ遺伝子を修復するステップが、修復TCRβ遺伝子を作出することを含む、請求項60に記載の方法。
  63. TCRβ遺伝子、およびTCRβタンパク質配列のライブラリーが、HLAマッチ健常ドナーにより提供される試料から得られる、請求項56に記載の方法。
  64. 試料が、末梢血試料または組織試料である、請求項63に記載の方法。
  65. タンパク質特徴が、アミノ酸の特性と関連するデータの断片を含み、特性が、極性、1つもしくは複数の二次構造の会合、分子体積、コドン多様性、または帯電のうちの少なくとも1つである、請求項48に記載の方法。
  66. 特定のT細胞サブセットから単離されたT細胞だけが使用される、請求項48に記載の方法。
  67. T細胞が、細胞分取により単離される、請求項66に記載の方法。
  68. T細胞が、RNA発現により単離される、請求項66に記載の方法。
  69. 対象が、ヒトである、請求項48に記載の方法。
  70. 特定の修復された非生産的遺伝子を作出するのに使用された修復が、対象の非生産的遺伝子において、天然で現れる確率に従い、修復された非生産的遺伝子の各々が、重み付けされる、請求項60に記載の方法。
  71. TCRβ遺伝子が、非制御性T細胞に由来する、請求項50に記載の方法。
  72. 対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測する方法であって、
    a)請求項45から66のいずれか一項に記載の機械学習システムを使用して、各T細胞受容体(TCRβ)遺伝子を、生産的TCRβ遺伝子、または修復TCRβとして分類することにより、マッチ健常ドナーにおけるT細胞選択を再構成するステップ、
    b)健常ドナーから再構成されたT細胞選択を、対象に由来するT細胞へと適用するステップ、および
    c)健常ドナーにおけるT細胞選択に失格する、対象における逃避T細胞の数を査定するステップであって、
    閾値を超える逃避T細胞の数が、自己免疫疾患または自己免疫障害を有するか、または発症する危険性を指し示し、
    これにより、対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測するステップ
    を含む方法。
  73. 健常ドナーにおけるT細胞選択を再構成するステップが、マッチ健常ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含む、請求項72に記載の方法。
  74. 対象において、T細胞選択を適用するステップが、対象に由来する試料中のTCR遺伝子をシーケンシングし、対象の各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含む、請求項73に記載の方法。
  75. 健常ドナーが、HLAマッチ健常ドナーである、請求項72に記載の方法。
  76. HLAマッチ健常ドナーが、対象の遺伝学的血縁者である、請求項75に記載の方法。
  77. 対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測する方法であって、
    a)請求項45から66のいずれか一項に記載の機械学習システムを使用して、各T細胞受容体(TCRβ)遺伝子を、生産的TCRβ遺伝子、または修復TCRβとして分類することにより、複数の健常ドナーにおけるT細胞選択を再構成するステップ、
    b)健常ドナーから再構成されたT細胞選択を、対象に由来するT細胞へと適用するステップ、および
    c)健常ドナーにおけるT細胞選択に失格する、対象における逃避T細胞の数を査定するステップであって、
    閾値を超える逃避T細胞の数が、自己免疫疾患または自己免疫障害を有するか、または発症する危険性を指し示し、
    これにより、対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測するステップ
    を含む方法。
  78. 複数の健常ドナーにおけるT細胞選択を再構成するステップが、
    a)各ドナーに由来する試料中のT細胞受容体(TCRβ)遺伝子をシーケンシングすること、
    b)各ドナーのHLA型を決定するか、または各ドナーについて、MHC遺伝子をシーケンシングすること、
    c)ドナーのHLA型により、各TCRβ遺伝子にタグ付けすること、
    d)HLAタグを、各TCRβ遺伝子についての、さらなる特徴として使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類すること
    を含む、請求項72に記載の方法。
  79. 対象において、健常ドナーから再構成されたT細胞選択を適用するステップが、
    a)対象に由来する試料中のTCRβ遺伝子をシーケンシングすること、
    b)対象のHLA型を決定するか、または対象のMHC遺伝子をシーケンシングすること、
    c)対象のHLA型により、各TCRβ遺伝子にタグ付けすること、
    d)対象の各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類するステップ
    を含む、請求項72に記載の方法。
  80. 逃避T細胞が、生産的TCR遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞である、請求項67または72に記載の方法。
  81. レシピエントにおける、臓器移植または細胞移植に由来する同種免疫を発症する危険性を予測する方法であって、
    a)請求項45から66のいずれか一項に記載の機械学習システムを使用して、T細胞受容体(TCRβ)遺伝子を、生産的TCRβ遺伝子、または修復TCRβとして分類することにより、ドナーにおけるT細胞選択を再構成するステップ、
    b)ドナーから再構成されたT細胞選択を、レシピエントへと適用するステップ、および
    c)ドナー組織に対して非寛容であるレシピエントに由来するT細胞の数を決定するステップであって、
    レシピエントにおける、閾値を超える、非寛容T細胞の数が、臓器移植または細胞移植に由来する同種免疫を有するか、または発症する危険性を指し示し、
    これにより、レシピエントにおける、臓器移植または細胞移植に由来する同種免疫を発症する危険性を予測するステップ
    を含む方法。
  82. ドナーにおけるT細胞選択を再構成するステップが、ドナーに由来する試料中のT細胞受容体(TCRβ)遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含む、請求項81に記載の方法。
  83. T細胞選択を、レシピエントへと適用するステップが、レシピエントに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCR遺伝子、または修復TCRβ遺伝子として分類することを含む、請求項81に記載の方法。
  84. 非寛容T細胞が、生産的TCR遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞である、請求項81に記載の方法。
  85. 非寛容T細胞が、ドナーにおけるT細胞選択に失格することが予測される、レシピエントに由来するT細胞である、請求項84に記載の方法。
  86. 非寛容T細胞が、臓器移植拒絶または細胞移植拒絶を駆動する可能性が高い、レシピエントに由来するT細胞である、請求項84に記載の方法。
  87. 試料が、末梢血試料または組織試料である、請求項73、74、79、82、または83に記載の方法。
  88. レシピエントにおける、臓器移植または細胞移植に由来する移植片対宿主病(GvHD)を発症する危険性を予測する方法であって、
    a)請求項45から66のいずれか一項に記載の機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、レシピエントにおけるT細胞選択を再構成するステップ、
    b)レシピエントから再構成されたT細胞選択を、ドナーへと適用するステップ、および
    c)レシピエントに対して非寛容である臓器または細胞に由来するT細胞の数を決定するステップであって、
    ドナーにおける、閾値を超える、非寛容T細胞の数が、臓器移植または細胞移植に由来するGvHDを有するか、または発症する危険性を指し示し、
    これにより、レシピエントにおける、臓器移植または細胞移植に由来するGvHDを発症する危険性を予測するステップ
    を含む方法。
  89. レシピエントにおけるT細胞選択を再構成するステップが、レシピエントに由来する試料中のT細胞受容体(TCRβ)遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含む、請求項88に記載の方法。
  90. T細胞選択を、ドナーへと適用するステップが、ドナーに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含む、請求項88に記載の方法。
  91. 非寛容T細胞が、生産的TCR遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞である、請求項88に記載の方法。
  92. 非寛容T細胞が、レシピエントにおけるT細胞選択に失格することが予測される、ドナーに由来するT細胞である、請求項91に記載の方法。
  93. 非寛容T細胞が、GvHDを駆動する可能性が高い、ドナーに由来するT細胞である、請求項91に記載の方法。
  94. レシピエントに由来する試料が、末梢血試料または組織試料である、請求項89に記載の方法。
  95. ドナーに由来する試料が、移植に由来する試料である、請求項90に記載の方法。
  96. レシピエントにおける、養子T細胞療法に由来する同種免疫を発症する危険性を予測する方法であって、
    a)請求項45から66のいずれか一項に記載の機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、レシピエントにおけるT細胞選択を再構成するステップ、
    b)レシピエントから再構成されたT細胞選択を、ドナーT細胞へと適用するステップ、および
    c)レシピエントに対して非寛容であるドナーから提供されるT細胞の数を決定するステップであって、
    ドナーにおける、閾値を超える、非寛容T細胞の数が、養子T細胞療法に由来する同種免疫を有するか、または発症する危険性を指し示し、
    これにより、レシピエントにおける、養子T細胞療法に由来する同種免疫を発症する危険性を予測するステップ
    を含む方法。
  97. レシピエントにおけるT細胞選択を再構成するステップが、レシピエントに由来する試料中のT細胞受容体(TCRβ)遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCR遺伝子、または修復TCRβ遺伝子として分類することを含む、請求項96に記載の方法。
  98. レシピエントに由来するT細胞選択を、ドナーT細胞へと適用するステップが、レシピエントに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含む、請求項96に記載の方法。
  99. 非寛容T細胞が、生産的TCR遺伝子が、修復TCRβ遺伝子として誤分類されたT細胞である、請求項96に記載の方法。
  100. 非寛容T細胞が、レシピエントにおけるT細胞選択に失格することが予測される、ドナーに由来するT細胞である、請求項99に記載の方法。
  101. 非寛容T細胞が、レシピエントにおける同種免疫を駆動する可能性が高い、ドナーに由来するT細胞である、請求項99に記載の方法。
  102. 養子T細胞療法に由来する同種免疫が、レシピエントの細胞および組織に対する、ドナーT細胞からの、所望されない免疫攻撃を含む、請求項96に記載の方法。
  103. 試料が、末梢血試料または組織試料である、請求項97または98に記載の方法。
  104. 養子T細胞療法における養子T細胞が、同種CAR T細胞である、請求項91に記載の方法。
  105. 養子T細胞療法における養子T細胞が、操作TCRを伴う、同種T細胞である、請求項91に記載の方法。
  106. レシピエントにおける、操作T細胞受容体(TCR)療法の適合性を予測する方法であって、
    a)請求項45から66のいずれか一項に記載の機械学習システムを使用して、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することにより、レシピエントにおけるT細胞選択を再構成するステップ、
    b)レシピエントから再構成されたT細胞選択を、操作TCRへと適用するステップ、および
    c)操作TCRが、レシピエントに対して非寛容であるのかどうかを決定し、
    これにより、操作TCR療法との適合性を予測するステップ
    を含む方法。
  107. レシピエントにおけるT細胞選択を再構成するステップが、レシピエントに由来する試料中のT細胞受容体(TCRβ)遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCRβ遺伝子として分類することを含む、請求項106に記載の方法。
  108. レシピエントに由来するT細胞選択を、操作TCRへと適用するステップが、レシピエントに由来する試料中のTCRβ遺伝子をシーケンシングし、各TCRβ遺伝子を、生産的TCRβ遺伝子、または修復TCR遺伝子として分類することを含む、請求項106に記載の方法。
  109. 非寛容TCRが、修復TCRβ遺伝子として誤分類された操作TCRβ遺伝子である、請求項106に記載の方法。
  110. 非寛容TCRが、レシピエントにおけるT細胞選択に失格することが予測される操作TCRである、請求項106に記載の方法。
  111. 非寛容TCRが、レシピエントにおける同種免疫を駆動する可能性が高い操作TCRである、請求項110に記載の方法。
  112. 養子T細胞療法に由来する同種免疫が、レシピエントの細胞および組織に対する、操作TCRからの、所望されない免疫攻撃を含む、請求項106に記載の方法。
  113. 試料が、末梢血試料または組織試料である、請求項107または108に記載の方法。
  114. 対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測する方法であって、
    a)請求項42に記載の機械学習システムを使用して、各B細胞受容体(BCR)遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することにより、健常対象におけるB細胞選択を再構成するステップであって、免疫受容体鎖遺伝子が、BCR遺伝子であるステップ、
    b)健常ドナーから再構成されたB細胞選択を、対象に由来するB細胞へと適用するステップ、および
    c)健常ドナーにおけるB細胞選択に失格する、対象における逃避B細胞の数を査定するステップであって、
    閾値を超える逃避B細胞の数が、自己免疫疾患または自己免疫障害を有するか、または発症する危険性を指し示し、
    これにより、対象における、自己免疫疾患または自己免疫障害を発症する危険性を予測するステップ
    を含む方法。
  115. 遺伝子セグメントが、バリアブル(V)遺伝子セグメント、ダイバーシティ(D)遺伝子セグメント、ジョイニング(J)遺伝子セグメント、およびこれらの任意の組合せからなる群から選択される、請求項114に記載の方法。
  116. 選択予測が、BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として同定する、請求項114に記載の方法。
  117. 機械学習システムが、複数の予測モデルのアンサンブルを含み、複数の予測モデルのアンサンブルに含まれる各予測モデルが、モデル予測を生成し、各予測モデルに由来するモデル予測が、選択予測を決定するように組み合わされる、請求項114に記載の方法。
  118. 2つを超える連続決定の階層的配置を含む改変型ニューラル決定木アーキテクチャーが、モデル予測を、選択予測へと統合するのに使用される、請求項114に記載の方法。
  119. ニューラル決定木のアーキテクチャーが、関数のコミッティーを含み、関数のコミッティーに含まれる関数の数が、ニューラル決定木内の終端決定から、ニューラル決定木上の基点決定へと増大する、請求項118に記載の方法。
  120. BCR遺伝子、およびBCR遺伝子のBCRタンパク質配列のライブラリーを含むトレーニングデータセットを得るステップ、および
    最適化過程を使用して、各予測モデルに含まれる重み値を決定することにより、トレーニングデータセットを使用して、機械学習システムに含まれる1つまたは複数の予測モデルをトレーニングするステップ
    をさらに含む、請求項114に記載の方法。
  121. BCR遺伝子のライブラリーが、複数の生産的遺伝子、および複数の非生産的遺伝子を含む、請求項114に記載の方法。
  122. 非生産的BCR遺伝子が、アウトオブフレームの遺伝子セグメントを伴うBCR遺伝子、または遺伝子セグメント間の体細胞接合部内の終止コドンを伴うBCR遺伝子である、請求項121に記載の方法。
  123. 複数の非生産的遺伝子の各々を修復するステップ;および修復された非生産的遺伝子の各々を、BCRタンパク質配列へと翻訳するステップをさらに含む、請求項122に記載の方法。
  124. 非生産的BCR遺伝子を修復するステップが、遺伝子セグメント間の体細胞接合部において、1つもしくは複数のヌクレオチドを付加もしくは除去して、遺伝子セグメントを、同じリーディングフレーム内に組み込み、かつ/または遺伝子セグメント間の体細胞領域内のヌクレオチドを突然変異させて、終止コドンを、アミノ酸へと転換することを含む、請求項123に記載の方法。
  125. 非生産的として同定されたBCR遺伝子を修復するステップが、修復BCR遺伝子を作出することを含む、請求項123に記載の方法。
  126. BCR遺伝子、およびBCRタンパク質配列のライブラリーが、HLAマッチ健常ドナーにより提供される試料から得られる、請求項114に記載の方法。
  127. 試料が、末梢血試料または組織試料である、請求項126に記載の方法。
  128. タンパク質特徴が、アミノ酸の特性と関連するデータの断片を含み、特性が、極性、1つもしくは複数の二次構造の会合、分子体積、コドン多様性、または帯電のうちの少なくとも1つである、請求項114に記載の方法。
  129. 特定の修復された非生産的遺伝子を作出するのに使用された修復が、対象の非生産的遺伝子において、天然で現れる確率に従い、修復された非生産的遺伝子の各々が、重み付けされる、請求項114に記載の方法。
  130. 健常対象におけるB細胞選択を再構成するステップが、健常対象に由来する試料中のB細胞受容体(BCR)遺伝子をシーケンシングし、健常対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含む、請求項114に記載の方法。
  131. B細胞選択を適用するステップが、対象に由来する試料中のBCR遺伝子をシーケンシングし、各TCR遺伝子を、生産的TCR遺伝子、または修復TCR遺伝子として分類することを含む、請求項114に記載の方法。
  132. 逃避B細胞が、生産的BCR遺伝子が、修復BCR遺伝子として誤分類されたB細胞である、請求項114に記載の方法。
  133. 対象における抗体薬の安全性を予測する方法であって、
    a)請求項42に記載の機械学習システムを使用して、対象の各B細胞受容体(BCR)遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することにより、対象におけるB細胞選択を再構成するステップであって、免疫受容体鎖遺伝子が、BCR遺伝子であるステップ、および
    b)抗体薬をコードするBCR遺伝子が、対象の自己抗原に対して寛容であるのかどうかを決定するステップであって、
    抗体薬をコードする寛容BCR遺伝子が、生産的BCR遺伝子として、適正に分類されたBCR遺伝子であり、
    これにより、対象における抗体薬の安全性を予測するステップ
    を含む方法。
  134. 遺伝子セグメントが、バリアブル(V)遺伝子セグメント、ダイバーシティ(D)遺伝子セグメント、ジョイニング(J)遺伝子セグメント、およびこれらの組合せからなる群から選択される、請求項133に記載の方法。
  135. 選択予測が、BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として同定する、請求項133に記載の方法。
  136. 対象におけるB細胞選択を再構成するステップが、対象に由来する試料中のBCR遺伝子をシーケンシングし、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含む、請求項133に記載の方法。
  137. 抗体薬をコードする非寛容BCR遺伝子が、修復BCR遺伝子として誤分類されたBCR遺伝子である、請求項133に記載の方法。
  138. 抗体薬をコードする非寛容BCR遺伝子が、対象におけるB細胞選択に失格することが予測されるBCR遺伝子である、請求項137に記載の方法。
  139. 抗体薬をコードする非寛容BCR遺伝子が、対象における自己抗原に結合する可能性が高い抗体薬をコードする、請求項138に記載の方法。
  140. 自己抗原に結合する可能性が高い抗体薬として分類される抗体薬が、対象における抗体薬の使用の安全性の欠如を指し示す、請求項139に記載の方法。
  141. 試料が、末梢血試料または組織試料である、請求項133に記載の方法。
  142. 対象におけるキメラ抗原受容体(CAR)-T細胞療法から、同種免疫を発症する危険性を予測する方法であって、CARの抗原結合性ドメインが、対象の自己抗原に対して寛容であるのかどうかを決定するステップを含み、
    CARの抗原結合性ドメインが、対象の自己抗原に対して寛容であるのかどうかを決定するステップが、
    a)請求項42に記載の機械学習システムを使用して、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することにより、対象におけるB細胞選択を再構成することであって、免疫受容体鎖遺伝子が、BCR遺伝子であること、および
    b)CARの抗原結合性ドメインをコードするB細胞受容体(BCR)遺伝子が、対象の自己抗原に対して寛容であるのかどうかを決定することであって、
    CARの抗原結合性ドメインをコードする寛容BCR遺伝子が、生産的BCR遺伝子として、適正に分類されたBCR遺伝子であり、
    これにより、対象におけるキメラ抗原受容体(CAR)-T細胞療法から、同種免疫を発症する危険性を予測すること
    を含む方法。
  143. 対象におけるB細胞選択を再構成するステップが、対象に由来する試料中のBCR遺伝子をシーケンシングし、対象の各BCR遺伝子を、生産的BCR遺伝子、または修復BCR遺伝子として分類することを含む、請求項142に記載の方法。
  144. CARの抗原結合性ドメインをコードする非寛容BCR遺伝子が、修復BCR遺伝子として誤分類されたBCR遺伝子である、請求項142に記載の方法。
  145. CARの抗原結合性ドメインをコードする非寛容BCR遺伝子が、対象におけるB細胞選択に失格することが予測されるBCR遺伝子である、請求項142に記載の方法。
  146. 抗体薬をコードする非寛容BCR遺伝子が、対象における自己抗原に結合する可能性が高い抗体薬をコードする、請求項145に記載の方法。
  147. 自己抗原に結合する可能性が高いBCR遺伝子として分類されるBCR遺伝子が、対象におけるCAR-T細胞療法の使用の安全性の欠如を指し示す、請求項146に記載の方法。
  148. 試料が、末梢血試料または組織試料である、請求項142に記載の方法。
  149. 試料マッチ健常ドナーが、疾患の任意の症状の発生の前に回収された、対象に由来する生物学的検体である、請求項73に記載の方法。
  150. 生物学的検体が、保存血である、請求項149に記載の方法。
  151. 生物学的検体が、免疫チェックポイント阻害剤療法の前に回収される、請求項149に記載の方法。
JP2023555495A 2021-03-12 2022-03-11 T細胞選択を再構成するための方法およびその使用 Pending JP2024514757A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163160299P 2021-03-12 2021-03-12
US63/160,299 2021-03-12
US202163274263P 2021-11-01 2021-11-01
US63/274,263 2021-11-01
PCT/US2022/019992 WO2022192699A1 (en) 2021-03-12 2022-03-11 Methods for reconstituting t cell selection and uses thereof

Publications (1)

Publication Number Publication Date
JP2024514757A true JP2024514757A (ja) 2024-04-03

Family

ID=83228368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023555495A Pending JP2024514757A (ja) 2021-03-12 2022-03-11 T細胞選択を再構成するための方法およびその使用

Country Status (4)

Country Link
US (1) US20240161874A1 (ja)
EP (1) EP4305202A1 (ja)
JP (1) JP2024514757A (ja)
WO (1) WO2022192699A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240112750A1 (en) * 2022-10-04 2024-04-04 BioCurie Inc. Data-driven process development and manufacturing of biopharmaceuticals
WO2024097878A1 (en) * 2022-11-03 2024-05-10 The Board Of Regents Of The University Of Texas System Use of t cell tolerant fraction as a predictor of immune-related adverse events
CN116055108B (zh) * 2022-12-13 2024-02-20 四川大学 未知网络威胁的风险控制方法、装置、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2017371498B2 (en) * 2016-12-09 2020-10-01 Regeneron Pharmaceuticals, Inc. Systems and methods for sequencing T cell receptors and uses thereof
WO2019182465A1 (en) * 2018-03-19 2019-09-26 Milaboratory, Limited Liability Company Methods of identification condition-associated t cell receptor or b cell receptor

Also Published As

Publication number Publication date
WO2022192699A1 (en) 2022-09-15
US20240161874A1 (en) 2024-05-16
WO2022192699A9 (en) 2022-10-20
EP4305202A1 (en) 2024-01-17

Similar Documents

Publication Publication Date Title
JP2024514757A (ja) T細胞選択を再構成するための方法およびその使用
US20210293812A1 (en) High throughput process for t cell receptor target identification of natively-paired t cell receptor sequences
Townsend et al. Significant differences in physicochemical properties of human immunoglobulin kappa and lambda CDR3 regions
Heidt et al. The 25th anniversary of the Eurotransplant Acceptable Mismatch program for highly sensitized patients
Herlands et al. T cell-independent and toll-like receptor-dependent antigen-driven activation of autoreactive B cells
Panigrahi et al. Post transplant development of MICA and anti-HLA antibodies is associated with acute rejection episodes and renal allograft loss
Duquesnoy HLA epitope based matching for transplantation
Kosmoliaptsis et al. Impact of donor mismatches at individual HLA-A,-B,-C,-DR, and-DQ loci on the development of HLA-specific antibodies in patients listed for repeat renal transplantation
Zuber et al. Macrochimerism in intestinal transplantation: association with lower rejection rates and multivisceral transplants, without GVHD
EP3463482B1 (en) Methods relating to t peripheral helper cells in autoantibody-associated conditions
JP2021501156A (ja) T細胞疲弊を予防および逆転するためのエピジェネティック標的および転写標的の同定
Hassan et al. Shared alloimmune responses against blood and transplant donors result in adverse clinical outcomes following blood transfusion post–renal transplantation
Taylor et al. Back to the future: application of contemporary technology to long-standing questions about the clinical relevance of human leukocyte antigen-specific alloantibodies in renal transplantation
CN108034006A (zh) 双抗原诱导的双功能互补作用
Roth‐Walter et al. Immune modulation via T regulatory cell enhancement: Disease‐modifying therapies for autoimmunity and their potential for chronic allergic and inflammatory diseases—An EAACI position paper of the Task Force on Immunopharmacology (TIPCO)
Chung et al. Gut and liver b cells of common clonal origin in primary sclerosing cholangitis–inflammatory bowel disease
WO2018071796A2 (en) Compositions and methods for identifying functional anti-tumor t cell responses
Messina et al. Relationship among C1q-fixing de novo donor specific antibodies, C4d deposition and renal outcome in transplant glomerulopathy
Ali et al. Analysis of the capability of IgG antibodies and receptors with their relationships to food tolerance and autoimmune disorders
CN117295823A (zh) 用于重构t细胞选择的方法及其用途
CN104379600A (zh) 抗hla单克隆嵌合免疫球蛋白,使用这种单克隆嵌合免疫球蛋白的方法和试剂盒
US11754552B2 (en) Use of immune repertoire diversity for predicting transplant rejection
JP6952295B2 (ja) ヒト抗hlaモノクローナル抗体の作製方法
US20140170169A1 (en) Blocking antibody for transplantation
WO2024094097A1 (en) Machine learning for antibody discovery and uses thereof