CN116981357A - 包含具有改善的tcrb组库多样性的人源化细胞免疫系统组分的基因修饰的小鼠 - Google Patents
包含具有改善的tcrb组库多样性的人源化细胞免疫系统组分的基因修饰的小鼠 Download PDFInfo
- Publication number
- CN116981357A CN116981357A CN202280021736.XA CN202280021736A CN116981357A CN 116981357 A CN116981357 A CN 116981357A CN 202280021736 A CN202280021736 A CN 202280021736A CN 116981357 A CN116981357 A CN 116981357A
- Authority
- CN
- China
- Prior art keywords
- human
- mouse
- endogenous
- segment
- gene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- BSDCIRGNJKZPFV-GWOFURMSSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(2,5,6-trichlorobenzimidazol-1-yl)oxolane-3,4-diol Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=CC(Cl)=C(Cl)C=C2N=C1Cl BSDCIRGNJKZPFV-GWOFURMSSA-N 0.000 title claims description 87
- 101000763322 Homo sapiens M1-specific T cell receptor beta chain Proteins 0.000 title claims description 83
- 101000763321 Homo sapiens T cell receptor beta chain MC.7.G5 Proteins 0.000 title claims description 83
- 241000699670 Mus sp. Species 0.000 title abstract description 112
- 102100026964 M1-specific T cell receptor beta chain Human genes 0.000 title description 43
- 230000001413 cellular effect Effects 0.000 title description 7
- 210000000987 immune system Anatomy 0.000 title description 7
- 230000001976 improved effect Effects 0.000 title description 2
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 457
- 210000001744 T-lymphocyte Anatomy 0.000 claims abstract description 419
- 108091008874 T cell receptors Proteins 0.000 claims abstract description 298
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims abstract description 295
- 210000004027 cell Anatomy 0.000 claims abstract description 133
- 108020003175 receptors Proteins 0.000 claims abstract description 85
- 238000000034 method Methods 0.000 claims abstract description 45
- 108010081355 beta 2-Microglobulin Proteins 0.000 claims abstract description 32
- 102000015736 beta 2-Microglobulin Human genes 0.000 claims abstract 10
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 513
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 492
- 229920001184 polypeptide Polymers 0.000 claims description 483
- 239000002773 nucleotide Substances 0.000 claims description 177
- 125000003729 nucleotide group Chemical group 0.000 claims description 177
- 108091026890 Coding region Proteins 0.000 claims description 172
- 102100036011 T-cell surface glycoprotein CD4 Human genes 0.000 claims description 168
- 150000007523 nucleic acids Chemical group 0.000 claims description 123
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 107
- 230000001086 cytosolic effect Effects 0.000 claims description 100
- 101100005713 Homo sapiens CD4 gene Proteins 0.000 claims description 82
- 102100034922 T-cell surface glycoprotein CD8 alpha chain Human genes 0.000 claims description 63
- 239000000427 antigen Substances 0.000 claims description 55
- 108091007433 antigens Proteins 0.000 claims description 54
- 102000036639 antigens Human genes 0.000 claims description 54
- 238000006467 substitution reaction Methods 0.000 claims description 54
- 230000001105 regulatory effect Effects 0.000 claims description 42
- 238000012217 deletion Methods 0.000 claims description 37
- 230000037430 deletion Effects 0.000 claims description 37
- 101100096028 Mus musculus Smok1 gene Proteins 0.000 claims description 30
- 108020004707 nucleic acids Proteins 0.000 claims description 23
- 102000039446 nucleic acids Human genes 0.000 claims description 23
- 101000666668 Homo sapiens T cell receptor beta diversity 1 Proteins 0.000 claims description 20
- 101150046643 TRBJ1-2 gene Proteins 0.000 claims description 17
- 101150110855 TRBJ1-3 gene Proteins 0.000 claims description 17
- 101150048704 TRBJ1-4 gene Proteins 0.000 claims description 17
- 101150008676 TRBJ1-5 gene Proteins 0.000 claims description 17
- 101150018578 TRBJ2-2 gene Proteins 0.000 claims description 17
- 101150080743 TRBJ2-3 gene Proteins 0.000 claims description 17
- 101150020327 TRBJ2-4 gene Proteins 0.000 claims description 17
- 101150082538 TRBJ2-5 gene Proteins 0.000 claims description 17
- 101150029384 TRBJ2-6 gene Proteins 0.000 claims description 17
- 230000008685 targeting Effects 0.000 claims description 16
- 101000937544 Homo sapiens Beta-2-microglobulin Proteins 0.000 claims description 15
- 102100038401 T cell receptor beta diversity 1 Human genes 0.000 claims description 15
- 101150116205 TRBJ1-1 gene Proteins 0.000 claims description 15
- 101150041821 TRBJ2-1 gene Proteins 0.000 claims description 15
- 101100263837 Bovine ephemeral fever virus (strain BB7721) beta gene Proteins 0.000 claims description 14
- 101100316840 Enterobacteria phage P4 Beta gene Proteins 0.000 claims description 14
- 108010058597 HLA-DR Antigens Proteins 0.000 claims description 13
- 102000006354 HLA-DR Antigens Human genes 0.000 claims description 13
- 101000645350 Homo sapiens T cell receptor beta joining 2-1 Proteins 0.000 claims description 13
- 102100026271 T cell receptor beta joining 2-1 Human genes 0.000 claims description 13
- 101150072817 TRBJ1-6 gene Proteins 0.000 claims description 13
- 101000634835 Homo sapiens M1-specific T cell receptor alpha chain Proteins 0.000 claims description 12
- 101000634836 Homo sapiens T cell receptor alpha chain MC.7.G5 Proteins 0.000 claims description 12
- 101000645337 Homo sapiens T cell receptor beta joining 1-1 Proteins 0.000 claims description 12
- 101000645351 Homo sapiens T cell receptor beta joining 2-2 Proteins 0.000 claims description 12
- 102100026269 T cell receptor beta joining 1-1 Human genes 0.000 claims description 12
- 102100025769 T cell receptor beta joining 2-2 Human genes 0.000 claims description 12
- 101150062075 TRBJ2-7 gene Proteins 0.000 claims description 12
- 150000001413 amino acids Chemical group 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 108091054437 MHC class I family Proteins 0.000 claims description 11
- 102000043131 MHC class II family Human genes 0.000 claims description 11
- 108091054438 MHC class II family Proteins 0.000 claims description 11
- 101000645339 Homo sapiens T cell receptor beta joining 1-2 Proteins 0.000 claims description 10
- 101000658404 Homo sapiens T cell receptor beta variable 29-1 Proteins 0.000 claims description 10
- 102100026266 T cell receptor beta joining 1-2 Human genes 0.000 claims description 10
- 102100034879 T cell receptor beta variable 29-1 Human genes 0.000 claims description 10
- 210000004602 germ cell Anatomy 0.000 claims description 10
- 101000772137 Homo sapiens T cell receptor alpha variable 1-1 Proteins 0.000 claims description 9
- 101000794418 Homo sapiens T cell receptor alpha variable 41 Proteins 0.000 claims description 9
- 101000645352 Homo sapiens T cell receptor beta joining 2-3 Proteins 0.000 claims description 9
- 101000763986 Homo sapiens T cell receptor beta joining 2-7 Proteins 0.000 claims description 9
- 102000043129 MHC class I family Human genes 0.000 claims description 9
- 206010028980 Neoplasm Diseases 0.000 claims description 9
- 102100029309 T cell receptor alpha variable 1-1 Human genes 0.000 claims description 9
- 102100030198 T cell receptor alpha variable 41 Human genes 0.000 claims description 9
- 102100025770 T cell receptor beta joining 2-3 Human genes 0.000 claims description 9
- 101150087698 alpha gene Proteins 0.000 claims description 9
- 101000645341 Homo sapiens T cell receptor beta joining 1-3 Proteins 0.000 claims description 8
- 101000645343 Homo sapiens T cell receptor beta joining 1-4 Proteins 0.000 claims description 8
- 101000645345 Homo sapiens T cell receptor beta joining 1-5 Proteins 0.000 claims description 8
- 101000645349 Homo sapiens T cell receptor beta joining 1-6 Proteins 0.000 claims description 8
- 101000645354 Homo sapiens T cell receptor beta joining 2-4 Proteins 0.000 claims description 8
- 101000763896 Homo sapiens T cell receptor beta joining 2-5 Proteins 0.000 claims description 8
- 101000763894 Homo sapiens T cell receptor beta joining 2-6 Proteins 0.000 claims description 8
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 claims description 8
- 102100026267 T cell receptor beta joining 1-3 Human genes 0.000 claims description 8
- 102100026272 T cell receptor beta joining 1-4 Human genes 0.000 claims description 8
- 102100026273 T cell receptor beta joining 1-5 Human genes 0.000 claims description 8
- 102100026270 T cell receptor beta joining 1-6 Human genes 0.000 claims description 8
- 102100025767 T cell receptor beta joining 2-4 Human genes 0.000 claims description 8
- 102100026807 T cell receptor beta joining 2-5 Human genes 0.000 claims description 8
- 102100026806 T cell receptor beta joining 2-6 Human genes 0.000 claims description 8
- 102100026919 T cell receptor beta joining 2-7 Human genes 0.000 claims description 8
- 102000047279 human B2M Human genes 0.000 claims description 8
- 230000003612 virological effect Effects 0.000 claims description 8
- 108010051539 HLA-DR2 Antigen Proteins 0.000 claims description 7
- 210000000349 chromosome Anatomy 0.000 claims description 7
- 238000002744 homologous recombination Methods 0.000 claims description 7
- 230000006801 homologous recombination Effects 0.000 claims description 7
- 239000013604 expression vector Substances 0.000 claims description 6
- 101150084750 1 gene Proteins 0.000 claims description 5
- 101150028074 2 gene Proteins 0.000 claims description 5
- 108010010378 HLA-DP Antigens Proteins 0.000 claims description 5
- 102000015789 HLA-DP Antigens Human genes 0.000 claims description 5
- 108010062347 HLA-DQ Antigens Proteins 0.000 claims description 5
- 101000986084 Homo sapiens HLA class I histocompatibility antigen, C alpha chain Proteins 0.000 claims description 3
- 108700031361 Brachyury Proteins 0.000 claims description 2
- 230000001580 bacterial effect Effects 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims description 2
- 210000004408 hybridoma Anatomy 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 102100026967 T cell receptor beta chain MC.7.G5 Human genes 0.000 claims 40
- GTJASUYQSYEAFD-NPRBSQQLSA-N 102643-50-5 Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](C)N)[C@@H](C)O)C1=CC=CC=C1 GTJASUYQSYEAFD-NPRBSQQLSA-N 0.000 claims 6
- 230000008707 rearrangement Effects 0.000 claims 6
- 108010050138 synthetic joining segment peptide Proteins 0.000 claims 6
- 101000937526 Mus musculus Beta-2-microglobulin Proteins 0.000 claims 5
- 210000001671 embryonic stem cell Anatomy 0.000 claims 5
- 230000009258 tissue cross reactivity Effects 0.000 claims 4
- 108700005092 MHC Class II Genes Proteins 0.000 claims 2
- 108700026220 vif Genes Proteins 0.000 claims 2
- 241000965476 Darksidea beta Species 0.000 claims 1
- 102000025850 HLA-A2 Antigen Human genes 0.000 claims 1
- 108010074032 HLA-A2 Antigen Proteins 0.000 claims 1
- 108091033319 polynucleotide Proteins 0.000 claims 1
- 102000040430 polynucleotide Human genes 0.000 claims 1
- 239000002157 polynucleotide Substances 0.000 claims 1
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 abstract description 258
- 108700018351 Major Histocompatibility Complex Proteins 0.000 abstract description 257
- 241001465754 Metazoa Species 0.000 abstract description 40
- 241000283984 Rodentia Species 0.000 abstract description 17
- 230000028993 immune response Effects 0.000 abstract description 10
- 241000700159 Rattus Species 0.000 abstract description 7
- 210000001519 tissue Anatomy 0.000 abstract description 7
- 239000003814 drug Substances 0.000 abstract description 4
- 210000002257 embryonic structure Anatomy 0.000 abstract description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 274
- 101000716102 Homo sapiens T-cell surface glycoprotein CD4 Proteins 0.000 description 144
- 102000005962 receptors Human genes 0.000 description 78
- 102000004169 proteins and genes Human genes 0.000 description 37
- 235000018102 proteins Nutrition 0.000 description 36
- 230000014509 gene expression Effects 0.000 description 29
- 102100027314 Beta-2-microglobulin Human genes 0.000 description 23
- 235000001014 amino acid Nutrition 0.000 description 22
- 125000003275 alpha amino acid group Chemical group 0.000 description 20
- 108700024394 Exon Proteins 0.000 description 19
- 210000000612 antigen-presenting cell Anatomy 0.000 description 18
- 210000000952 spleen Anatomy 0.000 description 13
- 241001529936 Murinae Species 0.000 description 12
- 108010076504 Protein Sorting Signals Proteins 0.000 description 12
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 12
- 208000015181 infectious disease Diseases 0.000 description 12
- 229940024606 amino acid Drugs 0.000 description 11
- 230000003993 interaction Effects 0.000 description 10
- 230000006269 (delayed) early viral mRNA transcription Effects 0.000 description 9
- 108060003951 Immunoglobulin Proteins 0.000 description 9
- 102100029454 T cell receptor alpha chain MC.7.G5 Human genes 0.000 description 9
- 238000011161 development Methods 0.000 description 9
- 230000018109 developmental process Effects 0.000 description 9
- 102000018358 immunoglobulin Human genes 0.000 description 9
- 210000003719 b-lymphocyte Anatomy 0.000 description 8
- 238000000684 flow cytometry Methods 0.000 description 8
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 7
- 102100025570 Cancer/testis antigen 1 Human genes 0.000 description 7
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 description 7
- 108010075704 HLA-A Antigens Proteins 0.000 description 7
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 7
- 101000856237 Homo sapiens Cancer/testis antigen 1 Proteins 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 101150075764 CD4 gene Proteins 0.000 description 6
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 6
- 102000008949 Histocompatibility Antigens Class I Human genes 0.000 description 6
- 102000018690 Trypsinogen Human genes 0.000 description 6
- 108010027252 Trypsinogen Proteins 0.000 description 6
- 230000011712 cell development Effects 0.000 description 6
- 210000005220 cytoplasmic tail Anatomy 0.000 description 6
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 210000001541 thymus gland Anatomy 0.000 description 6
- 102000016844 Immunoglobulin-like domains Human genes 0.000 description 5
- 108050006430 Immunoglobulin-like domains Proteins 0.000 description 5
- 241000699660 Mus musculus Species 0.000 description 5
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 5
- 230000006044 T cell activation Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000012239 gene modification Methods 0.000 description 5
- 230000005017 genetic modification Effects 0.000 description 5
- 235000013617 genetically modified food Nutrition 0.000 description 5
- 238000011830 transgenic mouse model Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 101710164994 50S ribosomal protein L13, chloroplastic Proteins 0.000 description 4
- 108010088652 Histocompatibility Antigens Class I Proteins 0.000 description 4
- 101001115699 Homo sapiens Myelin-oligodendrocyte glycoprotein Proteins 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- 241000703392 Tribec virus Species 0.000 description 4
- 230000001154 acute effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000006907 apoptotic process Effects 0.000 description 4
- 210000002798 bone marrow cell Anatomy 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 210000002443 helper t lymphocyte Anatomy 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 239000004005 microsphere Substances 0.000 description 4
- 238000004321 preservation Methods 0.000 description 4
- 230000003584 silencer Effects 0.000 description 4
- 210000004988 splenocyte Anatomy 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 3
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 3
- 108010025815 Kanamycin Kinase Proteins 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- 101100438957 Mus musculus Cd8a gene Proteins 0.000 description 3
- 230000005867 T cell response Effects 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000009395 breeding Methods 0.000 description 3
- 230000001488 breeding effect Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 230000036755 cellular response Effects 0.000 description 3
- 230000001684 chronic effect Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 210000003317 double-positive, alpha-beta immature T lymphocyte Anatomy 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 210000000265 leukocyte Anatomy 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 210000004989 spleen cell Anatomy 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 230000009385 viral infection Effects 0.000 description 3
- SSOORFWOBGFTHL-OTEJMHTDSA-N (4S)-5-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[2-[(2S)-2-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S,3S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-1-[[(2S)-5-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-6-amino-1-[[(2S)-6-amino-1-[[(2S)-1-[[(2S)-1-[[(2S)-5-amino-1-[[(2S)-5-carbamimidamido-1-[[(2S)-5-carbamimidamido-1-[[(1S)-4-carbamimidamido-1-carboxybutyl]amino]-1-oxopentan-2-yl]amino]-1-oxopentan-2-yl]amino]-1,5-dioxopentan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]amino]-1-oxohexan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1,5-dioxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-1-oxopropan-2-yl]amino]-1-oxohexan-2-yl]amino]-3-hydroxy-1-oxopropan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-methyl-1-oxopentan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxopropan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]carbamoyl]pyrrolidin-1-yl]-2-oxoethyl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-1-oxohexan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-carbamimidamido-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-imidazol-4-yl)-1-oxopropan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-4-[[(2S)-2-[[(2S)-2-[[(2S)-2,6-diaminohexanoyl]amino]-3-methylbutanoyl]amino]propanoyl]amino]-5-oxopentanoic acid Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(C)C)C(C)C)C(C)C)C(C)C)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SSOORFWOBGFTHL-OTEJMHTDSA-N 0.000 description 2
- 101710117290 Aldo-keto reductase family 1 member C4 Proteins 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 108010041397 CD4 Antigens Proteins 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000986087 Homo sapiens HLA class I histocompatibility antigen, B alpha chain Proteins 0.000 description 2
- 101001057504 Homo sapiens Interferon-stimulated gene 20 kDa protein Proteins 0.000 description 2
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 2
- 101000582254 Homo sapiens Nuclear receptor corepressor 2 Proteins 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 241000701806 Human papillomavirus Species 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 2
- 102100037850 Interferon gamma Human genes 0.000 description 2
- 108010074328 Interferon-gamma Proteins 0.000 description 2
- 102100026878 Interleukin-2 receptor subunit alpha Human genes 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical group OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 239000005089 Luciferase Substances 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 101100489858 Mus musculus Aatf gene Proteins 0.000 description 2
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 2
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 2
- 201000002491 encephalomyelitis Diseases 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Chemical group OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 102000048974 human HLA-B Human genes 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000006303 immediate early viral mRNA transcription Effects 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000004068 intracellular signaling Effects 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 210000000822 natural killer cell Anatomy 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 230000004614 tumor growth Effects 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 238000011714 129 mouse Methods 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 102100026882 Alpha-synuclein Human genes 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 101150028326 CD gene Proteins 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 101150086544 CD4B gene Proteins 0.000 description 1
- 101150105048 CD8B gene Proteins 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 101150087313 Cd8a gene Proteins 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 101150114125 D1 gene Proteins 0.000 description 1
- 101150037021 D2 gene Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 238000011510 Elispot assay Methods 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010053491 HLA-DR beta-Chains Proteins 0.000 description 1
- 108010046732 HLA-DR4 Antigen Proteins 0.000 description 1
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 1
- 102000018713 Histocompatibility Antigens Class II Human genes 0.000 description 1
- 108010027412 Histocompatibility Antigens Class II Proteins 0.000 description 1
- 101000834898 Homo sapiens Alpha-synuclein Proteins 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000986086 Homo sapiens HLA class I histocompatibility antigen, A alpha chain Proteins 0.000 description 1
- 101001068133 Homo sapiens Hepatitis A virus cellular receptor 2 Proteins 0.000 description 1
- 101000599940 Homo sapiens Interferon gamma Proteins 0.000 description 1
- 101001018097 Homo sapiens L-selectin Proteins 0.000 description 1
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 1
- 101000611936 Homo sapiens Programmed cell death protein 1 Proteins 0.000 description 1
- 101000652359 Homo sapiens Spermatogenesis-associated protein 2 Proteins 0.000 description 1
- 101000662909 Homo sapiens T cell receptor beta constant 1 Proteins 0.000 description 1
- 101000946833 Homo sapiens T-cell surface glycoprotein CD8 beta chain Proteins 0.000 description 1
- 101000914484 Homo sapiens T-lymphocyte activation antigen CD80 Proteins 0.000 description 1
- 101000946850 Homo sapiens T-lymphocyte activation antigen CD86 Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 102000013691 Interleukin-17 Human genes 0.000 description 1
- 108050003558 Interleukin-17 Proteins 0.000 description 1
- 101150008942 J gene Proteins 0.000 description 1
- 101150006978 J1 gene Proteins 0.000 description 1
- 101150061944 J2 gene Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical group OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 102100033467 L-selectin Human genes 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 102000017578 LAG3 Human genes 0.000 description 1
- 102000036243 Lymphocyte Specific Protein Tyrosine Kinase p56(lck) Human genes 0.000 description 1
- 108010002481 Lymphocyte Specific Protein Tyrosine Kinase p56(lck) Proteins 0.000 description 1
- 108090000143 Mouse Proteins Proteins 0.000 description 1
- 108010058846 Ovalbumin Proteins 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 241000277284 Salvelinus fontinalis Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 102100037272 T cell receptor beta constant 1 Human genes 0.000 description 1
- 108010083312 T-Cell Antigen Receptor-CD3 Complex Proteins 0.000 description 1
- 102100034928 T-cell surface glycoprotein CD8 beta chain Human genes 0.000 description 1
- 238000009171 T-cell vaccination Methods 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 238000010162 Tukey test Methods 0.000 description 1
- 101150117115 V gene Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 238000012867 alanine scanning Methods 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000005784 autoimmunity Effects 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- BQRGNLJZBFXNCZ-UHFFFAOYSA-N calcein am Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC(CN(CC(=O)OCOC(C)=O)CC(=O)OCOC(C)=O)=C(OC(C)=O)C=C1OC1=C2C=C(CN(CC(=O)OCOC(C)=O)CC(=O)OCOC(=O)C)C(OC(C)=O)=C1 BQRGNLJZBFXNCZ-UHFFFAOYSA-N 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000005859 cell recognition Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- -1 expression vectors) Chemical class 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 102000054189 human CD80 Human genes 0.000 description 1
- 102000049849 human CD86 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000001965 increasing effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 230000021633 leukocyte mediated immunity Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 210000003071 memory t lymphocyte Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 108700043516 mouse H-2Kb Proteins 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229940092253 ovalbumin Drugs 0.000 description 1
- 210000004681 ovum Anatomy 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 108010011903 peptide receptors Proteins 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000002516 postimmunization Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 102000009076 src-Family Kinases Human genes 0.000 description 1
- 108010087686 src-Family Kinases Proteins 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000002992 thymic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 244000052613 viral pathogen Species 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0278—Knock-in vertebrates, e.g. humanised vertebrates
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70503—Immunoglobulin superfamily
- C07K14/7051—T-cell receptor (TcR)-CD3 complex
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70503—Immunoglobulin superfamily
- C07K14/70514—CD4
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70503—Immunoglobulin superfamily
- C07K14/70517—CD8
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70503—Immunoglobulin superfamily
- C07K14/70539—MHC-molecules, e.g. HLA-molecules
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0603—Embryonic cells ; Embryoid bodies
- C12N5/0606—Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/15—Humanized animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/072—Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/15—Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
- A01K2267/0325—Animal model for autoimmune diseases
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0337—Animal models for infectious diseases
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
- A01K2267/0387—Animal model for diseases of the immune system
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Environmental Sciences (AREA)
- Biomedical Technology (AREA)
- Developmental Biology & Embryology (AREA)
- Gynecology & Obstetrics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Reproductive Health (AREA)
- Wood Science & Technology (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本文公开了非人动物(例如啮齿动物,例如小鼠或大鼠),所述非人动物经基因工程改造以表达人源化T细胞辅助受体(例如,人源化CD4和/或CD8(例如,CD8α和/或CD8β))、包含由至少一个人T细胞受体(TCR)可变区基因区段编码的可变结构域的人或人源化TCR和/或结合所述人源化T细胞辅助受体的人或人源化主要组织相容性复合物(例如,分别为人或人源化MHC II(例如,MHC IIα链和/或MHC IIβ链)和/或MHC I(例如,MHC Iα),以及任选地人或人源化β2微球蛋白)。还提供了表达它们的胚胎、组织和细胞。还提供了产生基因工程改造的动物的方法,所述基因工程改造的动物表达至少一种人源化T细胞辅助受体(例如,人源化CD4和/或CD8)、至少一种与所述人源化T细胞辅助受体缔合的人源化MHC(例如,分别为人源化MHC II和/或MHC I)和/或人源化TCR。还提供了使用所述基因工程改造的动物用于开发人类治疗剂的方法,所述基因工程改造的动物产生基本上人源化的T细胞免疫应答。
Description
相关申请的交叉引用
本申请根据35 U.S.C.§119(e)要求2021年3月31日提交的美国临时专利申请序列号63/168,774的优先权,该临时专利的公开内容通过引用整体并入。
序列表
序列表的正式副本作为ASCII格式的序列表经由EFS-Web以电子方式提交,序列表的文件名为10948WO01_ST25.txt,创建于2022年3月29日且大小为59千字节,并与说明书同时提交。该ASCII格式的文件中所含的序列表是说明书的一部分并通过引用整体并入本文。
技术领域
本发明涉及非人动物(例如啮齿动物,例如小鼠或大鼠),所述非人动物能够产生基本上人(人源化)的T细胞介导的免疫应答并且能够表达(i)一种或多种人(人源化)T细胞辅助受体(例如,CD4和/或CD8(例如,CD8α和/或CD8β)),(ii)与所述一种或多种人(人源化)T细胞辅助受体缔合的一种或多种人(人源化)主要组织相容性复合物(例如,MHC II(例如,MHCα和/或MHC IIβ)和/或MHC I(例如,MHC Iα和/或β2微球蛋白)),和/或(iii)人(人源化)T细胞受体(TCR)(例如,TCRα和/或TCRβ);本发明涉及从所述非人动物分离的胚胎、组织、细胞和/或核酸;产生所述非人动物的方法;和使用所述非人动物用于开发人类治疗剂的方法。
背景技术
在适应性免疫应答中,外来抗原被B淋巴细胞(例如免疫球蛋白)和T淋巴细胞(例如,T细胞受体,也称为TCR)上的受体分子识别。这些外来抗原被特化蛋白以肽片段的形式在细胞表面呈递,这些特化蛋白一般称为主要组织相容性复合物(MHC)分子并且在人类中特别地称为人白细胞抗原(HLA)。在T细胞介导的应答期间,MHC分子呈递的抗原被T细胞受体识别。然而,有效的免疫应答不仅仅需要T细胞受体识别MHC-抗原复合物。还需要T细胞辅助受体分子(例如,CD4或CD8)与MHC的不变部分结合。
T细胞有几种类型,包括辅助性T细胞和细胞毒性T细胞。辅助性T细胞通常表达辅助受体CD4并识别与MHC II分子结合的抗原。CD4+T细胞激活免疫系统中的其他效应细胞,例如,激活表达MHC II的B细胞以产生抗体,激活表达MHC II的巨噬细胞以破坏病原体等。CD4和T细胞受体与相同的MHC II呈递的外来抗原的结合使得T细胞对该抗原显著更敏感。
相反,细胞毒性T细胞(CTL)通常表达辅助受体CD8并识别与MHC I分子结合的外来抗原。CTL经特化以杀伤任何带有被其自身膜结合的TCR识别的MHC I结合肽的细胞。当细胞展示源自通常不存在的细胞蛋白质(例如,病毒、肿瘤或其他非自身来源的细胞蛋白质)的肽时,此类肽被CTL识别,CTL被激活并杀伤展示该肽的细胞。与CD4类似,CD8的接合使CTL对MHC I呈递的抗原更敏感。
由于耐受机制,并非所有抗原都会引发T细胞激活。然而,在一些疾病(例如,癌症、自身免疫疾病)中,源自自身蛋白的肽成为免疫系统细胞组分的靶标,这导致呈递此类肽的细胞的破坏。在识别临床上有意义的抗原(例如,与各种类型的癌症相关的抗原)和/或结合临床上有意义的抗原的TCR序列方面已经有了显著进展。然而,为了改进将在人T细胞中引发合适应答的临床上有意义的肽和/或能够结合临床上有意义的抗原的TCR的鉴定和选择(例如,用于癌症的过继免疫疗法、用于自身免疫的T细胞疫苗接种等),仍然需要模拟人类免疫系统方面的体内和体外系统。因此,需要能够展示人类免疫系统组分,特别是T细胞免疫应答组分的生物系统(例如,基因修饰的非人动物和细胞)。
发明内容
如本文所公开的,包含基本上人源化的T细胞免疫系统的基因修饰的非人动物的胸腺具有与对照动物相似的胸腺细胞和CD3+T细胞绝对数目。另外,这些细胞显示出与对照动物相当的向单一阳性T细胞的发育,并且能够产生针对抗原(例如,病毒抗原)的稳健的人类细胞应答。非人动物的人类细胞应答通常包括表达人或人源化T细胞受体(TCR)可变结构域的活化非人T细胞,所述可变结构域识别由人白细胞抗原(HLA)胞外结构域形成的肽结合裂缝中呈递的抗原,所述肽结合裂缝可在非人抗原呈递细胞的表面上表达。在一些实施方案中,基本上人源化的T细胞免疫系统包含
(A)非人T细胞,该非人T细胞表达
(i)包含人T细胞辅助受体的一部分或整个胞外部分的T细胞辅助受体多肽,例如包含一个或多个人T细胞辅助受体胞外结构域的T细胞辅助受体多肽,使得T细胞辅助受体多肽能够缔合和/或缔合
(a)人或人源化HLA分子的一个或多个胞外结构域(例如,作为T细胞辅助受体多肽的结合位点的第一人HLA胞外结构域和/或与第三人HLA胞外结构域形成肽结合裂缝的第二人HLA胞外结构域),
(b)人或人源化TCR可变结构域(例如,分别由至少一个人TCRα和/或TCRβ可变区基因区段编码的人或人源化TCRα可变结构域和/或人或人源化TCRβ可变结构域)的胞外结构域,和/或
(c)人TCR恒定结构域的胞外结构域,以及
(ii)至少包含人TCR可变结构域的T细胞受体(TCR);并且任选地
(B)在人HLA背景下呈递抗原的非人抗原呈递细胞,例如在其细胞表面表达至少一种MHC分子的非人抗原呈递细胞,该MHC分子包含由两个人HLA胞外结构域形成的肽结合裂缝,并且能够激活和/或激活非人T细胞。
在一个方面,非人T细胞和非人抗原呈递细胞发现于同一非人动物或分离自同一非人动物。
因此,本文提供了非人动物(例如啮齿动物,例如小鼠或大鼠),这些非人动物经基因工程改造以表达:
(A)人或人源化T细胞辅助受体(例如,人或人源化CD4和/或人或人源化CD8(例如,人或人源化CD8α和/或人或人源化CD8β)),
(B)与人或人源化T细胞辅助受体缔合的人或人源化主要组织相容性复合物(例如,结合人或人源化CD4的人或人源化MHC II(例如,人或人源化MHC IIα和/或人或人源化MHC IIβ)和/或结合人或人源化CD8的人或人源化MHC I(例如,人或人源化MHC Iα和任选地人或人源化β2微球蛋白)),和/或
(C)人或人源化T细胞受体(TCR);
以及本文提供了表达上述各项的胚胎、组织和细胞,及编码上述各项的核酸。还提供了产生和使用所公开的非人动物的方法。
在一个方面,提供了一种基因修饰的非人类动物,该基因修饰的非人类动物包括
(A)人源化CD4辅助受体和/或包含人源化CD8α多肽和人源化CD8β多肽的人源化CD8辅助受体(例如,非人动物例如在其种系基因组中包含编码嵌合人/非人CD4多肽的第一核苷酸序列,和/或编码嵌合人/非人CD8α多肽的第二核苷酸序列和编码嵌合人/非人CD8β多肽的第三核苷酸序列),
其中每个人源化T细胞辅助受体多肽至少包含非人T细胞辅助受体的跨膜结构域和胞质结构域,例如,其中人源化CD4辅助受体至少包含非人CD4辅助受体的跨膜结构域和胞质结构域,和/或人源化CD8辅助受体至少包含非人CD8α和非人CD8β多肽的跨膜结构域和胞质结构域,
其中每个嵌合T细胞辅助受体多肽包含人T细胞辅助受体的一部分或整个胞外部分,例如人T细胞辅助受体的一个或多个胞外结构域,例如至少包含与HLA分子缔合的人T细胞辅助受体的胞外结构域,例如其中人源化CD4辅助受体包含负责与MHC II相互作用的人CD4胞外部分(或其部分,例如胞外结构域)、T细胞受体可变结构域、T细胞受体恒定结构域或它们的组合,和/或例如,其中人源化CD8辅助受体包含负责与MHC I相互作用的人CD8α和人CD8β胞外部分(或其部分,例如胞外结构域)、T细胞受体可变结构域、T细胞受体恒定结构域或它们的组合;
(B)人(人源化)TCR(例如,非人动物例如在其种系基因组中包含:可操作地连接至非人TCRα恒定基因序列的未重排的T细胞受体(TCR)α可变基因的基因座,该基因座包含至少一个人Vα区段和至少一个人Jα区段,和/或可操作地连接至非人TCRβ恒定基因序列的未重排的TCRβ可变基因的基因座,该基因座包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段);以及任选地,
(C)与人源化CD4辅助受体缔合的人(人源化)MHC II复合物和/或与人源化CD8辅助受体缔合的人(人源化)MHC I复合物(例如,非人动物例如在其种系基因组中包含编码嵌合人/非人MHC IIα多肽的第一核酸序列和编码嵌合人/非人MHC IIβ多肽的第二核酸序列,和/或编码嵌合人/非人MHC I多肽的第三核酸序列),
其中每个嵌合MHC多肽至少包含人MHC多肽(例如,HLA多肽)的胞外部分(或其一部分),该人MHC多肽单独(例如,MHC I)或当与另一种嵌合MHC多肽(例如,MHC IIα和MHC IIβ)复合时,分别能够与人(人源化)CD8辅助受体或人(人源化)CD4辅助受体缔合并且在HLA背景下呈递肽,例如,其中人源化MHC II复合物包含(i)包含人HLA II类α多肽的α1和α2结构域以及非人HLA II类α多肽的跨膜结构域和胞质结构域的嵌合人/非人MHC IIα多肽,和(ii)嵌合人/非人MHC IIβ多肽,包含人HLA II类β多肽的β1和β2结构域以及非人HLA II类β多肽的跨膜结构域和胞质结构域,和/或其中人源化MHC I复合物包含人MHC I多肽的α1、α2和α3结构域,以及任选地人(人源化)β2微球蛋白。
在一些实施方案中,非人动物包括
(A)人源化CD4辅助受体和包含人源化CD8α多肽和人源化CD8β多肽的人源化CD8辅助受体(例如,非人动物例如在其种系基因组中包含编码嵌合人/非人CD4多肽的第一核苷酸序列,编码嵌合人/非人CD8α多肽的第二核苷酸序列和编码嵌合人/非人CD8β多肽的第三核苷酸序列),
其中每个人源化T细胞辅助受体多肽至少包含非人T细胞辅助受体的跨膜结构域和胞质结构域,例如,其中人源化CD4辅助受体至少包含非人CD4辅助受体的跨膜结构域和胞质结构域,并且人源化CD8辅助受体至少包含非人CD8α和非人CD8β多肽的跨膜结构域和胞质结构域,
其中每个嵌合T细胞辅助受体多肽包含人T细胞辅助受体的一部分或整个胞外部分,例如人T细胞辅助受体的一个或多个胞外结构域,例如至少包含与HLA分子缔合的人T细胞辅助受体的胞外结构域,例如其中人源化CD4辅助受体包含负责与MHC II相互作用的人CD4胞外部分(或其部分,例如胞外结构域)、T细胞受体可变结构域、T细胞受体恒定结构域或它们的组合,和/或例如,其中人源化CD8辅助受体包含负责与MHC I相互作用的人CD8α和人CD8β胞外部分(或其部分,例如胞外结构域)、T细胞受体可变结构域、T细胞受体恒定结构域或它们的组合;
(B)人源化TCR(例如,非人动物例如在其种系基因组中包含:可操作地连接至非人TCRα恒定基因序列的未重排的T细胞受体(TCR)α可变基因的基因座,该基因座包含至少一个人Vα区段和至少一个人Jα区段,和/或可操作地连接至非人TCRβ恒定基因序列的未重排的TCRβ可变基因的基因座,该基因座包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段);以及
(C)与人源化CD4辅助受体缔合的人源化MHC II复合物和与人源化CD8辅助受体缔合的人源化MHC I复合物(例如,非人动物例如在其种系基因组中包含编码嵌合人/非人MHCIIα多肽的第一核酸序列,编码嵌合人/非人MHC IIβ多肽的第二核酸序列,和编码嵌合人/非人MHC I多肽的第三核酸序列),
其中每个嵌合MHC多肽至少包含人MHC多肽(例如,HLA多肽)的胞外部分(或其一部分),该人MHC多肽单独(例如,MHC I)或当与另一种嵌合MHC多肽(例如,MHC IIα和MHC IIβ)复合时,分别能够与人源化CD8辅助受体或人源化CD4辅助受体缔合并且在HLA背景下呈递肽,例如,其中人源化MHC II复合物包含(i)包含人HLA II类α多肽的α1和α2结构域以及非人HLA II类α多肽的跨膜结构域和胞质结构域的嵌合人/非人MHC IIα多肽,和(ii)嵌合人/非人MHC IIβ多肽,包含人HLA II类β多肽的β1和β2结构域以及非人HLA II类β多肽的跨膜结构域和胞质结构域,以及(iii)人源化MHC I复合物包含人MHC I多肽的α1、α2和α3结构域,以及任选地人(人源化)β2微球蛋白(例如,非人动物还包含编码包含人β2微球蛋白氨基酸序列或其一部分的多肽的β2微球蛋白基因座)。
在一些实施方案中,编码嵌合T细胞CD4辅助受体多肽的第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处,和/或编码嵌合T细胞CD8α辅助受体多肽的第二核苷酸序列存在于内源CD8αT细胞辅助受体基因座处,并且编码嵌合T细胞CD8β辅助受体多肽的第三核苷酸序列存在于内源CD8βT细胞辅助受体基因座处。另外的实施方案包括由图5A所示的基因编码的嵌合人/非人CD4多肽(例如,其中所得到的嵌合人/非人CD4 T细胞辅助受体多肽的人部分至少包含人Ig1结构域、人Ig2结构域和人Ig3结构域,否则分别称为D1结构域、D2结构域和D3结构域)和/或由图5B所示的基因编码的嵌合CD8辅助受体(例如,其中嵌合CD8辅助受体的人部分包含人CD8多肽(例如,CD8α和/或CD8β)的整个或基本上整个胞外部分,包括人免疫球蛋白V(IgV)样α和β结构域。在一些实施方案中,嵌合CD4 T细胞辅助受体多肽的人部分包含人CD4多肽的一个或多个胞外结构域(例如,D1、D2、D3、D4或它们的任何组合),并且嵌合CD4 T细胞辅助受体多肽的非人部分包含非人CD4 T细胞辅助受体的跨膜结构域和胞质结构域,嵌合CD8α多肽的人部分包含人CD8α多肽的胞外结构域(例如,IgV样结构域)并且嵌合CD8α多肽的非人部分包含非人CD8α多肽的跨膜结构域和胞质结构域,和/或CD8β多肽的人部分包含人CD8β多肽的胞外结构域(例如IgV样结构域)并且嵌合CD8βT细胞辅助受体多肽的非人部分包含非人CD8β多肽跨膜结构域和胞质结构域。
在一些实施方案中,编码人(人源化化)MHC IIα的第一核酸序列存在于内源非人MHC IIα基因座处,编码人(人源化)MHC IIβ的第二核酸序列存在于内源非人MHC IIβ基因座处,和/或编码人(人源化)MHC I的第三核酸序列存在于内源非人MHC I基因座处。在一个方面,人(人源化)MHC IIα多肽包含人MHC IIα多肽(例如,HLA II类α多肽)的胞外部分(或其一部分),人(人源化)MHC IIβ多肽包含人MHC IIβ多肽(例如,HLA I类β多肽)的胞外部分(或其一部分),和/或人(人源化)MHC I多肽包含人MHC I多肽(例如,HLA I类多肽)的胞外部分(或其一部分)。在一些实施方案中,人源化MHC IIα多肽包含人MHC IIα1和α2结构域,人源化MHC IIβ多肽包含人MHC IIβ1和β2结构域,和/或人源化MHC I多肽包含人MHC Iα1、α2和α3结构域。在一些实施方案中,编码嵌合人/非人MHC IIα多肽的第一核酸序列可操作地连接至内源非人MHC IIα启动子和调控元件和/或在它们的调控下表达,编码嵌合人/非人MHC IIβ多肽的第二核酸序列例如可操作地连接至内源非人MHC IIβ启动子和调控元件和/或在它们的调控下表达,和/或编码嵌合人/非人MHC I多肽的第三核酸序列可操作地连接至内源非人MHC I启动子和调控元件和/或在它们的调控下表达。在另外的实施方案中,嵌合人/非人MHC IIα多肽的非人部分包含内源非人MHC IIα多肽的跨膜结构域和胞质结构域,嵌合人/非人MHC IIβ多肽的非人部分包含内源非人MHC IIβ多肽的跨膜结构域和胞质结构域,和/或嵌合人/非人MHC I多肽的非人部分包含内源非人MHC I多肽的跨膜结构域和胞质结构域。实施方案包括非人动物,其中嵌合人/非人MHC II复合物的蛋白质的人部分源自选自由HLA-DR、HLA-DQ和HLA-DP组成的组的相应人HLA II类蛋白质,和/或其中嵌合人/非人MHC I多肽的人部分源自人HLA-A、人HLA-B或人HLA-C。作为非限制性实例,在一些实施方案中,嵌合MHC IIα多肽包含HLA-DRα蛋白、HLA-DQα蛋白或HLA-DPα蛋白的胞外部分或其一部分,嵌合MHC IIβ多肽包含HLA-DRβ蛋白、HLA-DQβ蛋白或HLA-DPβ蛋白的胞外部分或其一部分,和/或嵌合MHC I多肽包含人HLA-A蛋白、人HLA-B蛋白或人HLA-C蛋白的胞外部分或其一部分。还提供了非人动物,其中嵌合人/非人MHC II蛋白的人部分源自相应的人HLA-DR蛋白,例如,人/非人MHC IIα多肽的人部分包含HLA-DR2的α链的α1和α2结构域,并且人/非人MHC IIβ多肽的人部分包含HLA-DR2的β链的β1和β2结构域和/或其中MHC I多肽的人部分源自人HLA-A多肽,例如,人/非人MHC I多肽的人部分包含人HLA-A2多肽的α1、α2和α3结构域,例如,人HLA-A2.1多肽的α1、α2和α3结构域。还提供了非人动物,其中MHC II复合物的非人部分源自鼠H-2E编码序列,和/或其中MHC I多肽的非人部分源自鼠H-2K编码序列。例如,嵌合MHC IIα多肽包含鼠H-2Eα多肽的跨膜结构域和胞质结构域,嵌合MHC IIβ多肽包含鼠H-2Eβ多肽的跨膜结构域和胞质结构域,并且嵌合MHC I多肽包含鼠H-2K多肽的跨膜结构域和胞质结构域。
在一些实施方案中,未重排的TCRα可变基因的基因座存在于内源TCRα可变基因的基因座处,和/或未重排的TCRβ可变基因的基因座存在于内源TCRβ可变基因的基因座处。在一些实施方案中,未重排的TCRα可变基因的基因座存在于动物种系中的内源TCRα可变基因的基因座处,和/或未重排的TCRβ可变基因的基因座存在于动物种系中的内源TCRβ可变基因的基因座处。在一些实施方案中,未重排的TCRα可变区序列包含小鼠TCRA非编码序列,和/或未重排的TCRβ可变区序列包含小鼠TCRB非编码序列。在一些方面,未重排的TCRα可变区序列包含至少一个未重排的人T细胞可变区Vα区段和至少一个未重排的人T细胞可变区Jα区段,例如可操作地连接至小鼠TCRα恒定基因序列和/或未重排的TCRβ可变区序列包含至少一个未重排的人T细胞可变区Vβ区段、至少一个未重排的人T细胞可变区Dβ区段和至少一个未重排的人T细胞可变区Jβ区段,可操作地连接至小鼠TCRβ恒定基因序列,任选地连接到内源小鼠TCRβ可变基因的基因座处。在一些方面,该至少一个未重排的人T细胞可变区Vα区段构成组库,例如完整的未重排的人Vα基因区段组库,并且该至少一个未重排的人T细胞可变区Jα区段构成组库,例如完整的未重排的人Jα基因区段组库,和/或至少一个未重排的人T细胞可变区Vβ区段构成组库,例如完整的未重排的人Vβ基因区段组库,至少一个未重排的人T细胞可变区Dβ区段构成组库,例如完整的未重排的人Dβ基因区段组库,并且至少一个未重排的人T细胞可变区Jβ区段构成组库,例如完整的未重排的人Jβ基因区段组库。
在一些实施方案中,未重排的TCRβ可变基因的基因座包含人Vβ区段、未重排的人T细胞可变区Dβ1区段和未重排的人T细胞可变区Dβ2区段,以及至少一个未重排的人T细胞可变区Jβ1区段和至少一个未重排的人T细胞可变区Jβ2区段的的组库,其中小鼠TCRB非编码序列包含介于该至少一个未重排的人T细胞可变区Dβ1区段和该至少一个未重排的人T细胞可变区Jβ1区段之间的小鼠TCRBD1-TCRBJ1非编码核酸序列,以及介于该至少一个未重排的人T细胞可变区Dβ2区段和该至少一个未重排的人T细胞可变区Jβ2区段之间的小鼠TCRBD2-TCRBJ2非编码核酸序列。在一些实施方案中,未重排的TCRβ可变基因的基因座包含:
(a)人TCRBV区段组库,任选地其中该人TRBV区段组库置换相应的内源TCRBV区段组库,
(b)(i)包含未重排的人TCRBD1区段的人源化TCRBDJ1簇,和(ii)未重排的人TRBJ1-1区段、未重排的人TRBJ1-2区段、未重排的人TCRBJ1-3区段、未重排的人TCRBJ1-4区段、未重排的人TCRBJ1-5区段和未重排的人TCRBJ1-6区段的任何组合,
其中人源化TCRBDJ1簇包含介于未重排的人TCRBD1区段和任何未重排的人TCRBJ1区段之间的小鼠TCRBDJ1非编码序列,以及介于任何两个连续的未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列,任选地其中未重排的人TCRBD1和TCRBJ1基因区段位于相同的小鼠TCRBDJ1非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段,以及
(c)(i)包含未重排的人TCRBD2区段的人源化TCRBDJ2簇,和(ii)未重排的人TRBJ2-1区段、未重排的人TRBJ2-2区段、未重排的人TCRBJ2-3区段、未重排的人TCRBJ2-4区段、未重排的人TCRBJ2-5区段、未重排的人TCRBJ2-6区段和未重排的人TCRBJ2-7区段的任何组合,
其中所述人源化TCRBDJ2簇包含介于所述未重排的人TCRBD2区段和任何未重排的人TCRBJ2区段之间的小鼠TCRBDJ2非编码序列,以及介于任何两个连续的未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列,任选地其中所述未重排的人TCRBD2和TCRBJ2基因区段位于相同的小鼠TCRBDJ2非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj2基因区段。在一些实施方案中,
(I)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vα基因区段的缺失,
(b)所有内源TCR Jα基因区段的缺失,和
(c)它们的组合;或者
(II)所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有邻接的内源TCR Vβ基因区段(例如,5’胰蛋白酶原簇和3’胰蛋白酶原簇之间的所有内源TCR Vβ基因区段)的缺失,或所有内源TCR Vβ基因区段的缺失,
(b)所有内源TCR Dβ基因区段的缺失,
(c)所有内源TCR Jβ基因区段的缺失,和
(d)它们的组合;或者
(III)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vα基因区段的缺失,
(b)所有内源TCR Jα基因区段的缺失,和
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vβ基因区段的缺失,
(b)所有内源TCR Dβ基因区段的缺失,
(c)所有内源TCR Jβ基因区段的缺失,和
(d)它们的组合。
在一些实施方案中,
(I)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,
(b)至少一个内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,和
(c)它们的组合;或者
(II)所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,
(b)至少一个内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ区段置换,
(c)至少一个内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,和
(d)它们的组合;或者
(III)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,
(b)至少一个内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,和
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,
(b)至少一个内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ区段置换,
(c)至少一个内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,和
(d)它们的组合。
在一些实施方案中,
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vα基因区段包括从TRAV1-1至TRAV41的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jα区段包括从TRAJ1至TRAJ61的多个或所有未重排的人T细胞可变区基因区段,或
(c)它们的组合;
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vβ基因区段包括从TRBV1至TRBV29-1的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Dβ基因区段包含未重排的人T细胞可变区Dβ1基因区段和/或未重排的人T细胞可变区Dβ2基因区段,
(c)所有内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jβ区段包括从TRBJ1-1至TRBJ1-6的多个或所有未重排的人Jβ区段,或从TRBJ2-1至TRBJ2-7的多个或所有未重排的人Jβ区段,或
(d)它们的组合;或者
(III)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vα基因区段包括从TRAV1-1至TRAV41的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Jα基因区段被至少未重排的人T细胞可变区Jα区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jα区段包括从TRAJ1至TRAJ61的多个或所有未重排的人T细胞可变区基因区段,或
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vβ基因区段包括从TRBV1至TRBV29-1的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Dβ基因区段包含未重排的人T细胞可变区Dβ1基因区段和/或未重排的人T细胞可变区Dβ2基因区段,
(c)所有内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jβ区段包括从TRBJ1-1至TRBJ1-6的多个或所有未重排的人Jβ区段,或从TRBJ2-1至TRBJ2-7的多个或所有未重排的人Jβ区段,或
(d)它们的组合。
在一些实施方案中,
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区基因区段置换,
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区基因区段置换,或
(c)它们的组合;
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区基因区段置换,
(b)内源T细胞可变区Dβ1基因区段被未重排的人T细胞可变区Dβ1基因区段置换,并且内源T细胞可变区Dβ2基因区段被未重排的人T细胞可变区Dβ2基因区段置换,
(c)以下置换:
内源TRBJ1-1基因区段被未重排的人TRBJ1-1基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBD1区段和小鼠TRBJ1-1区段之间发现的小鼠非编码序列,
内源TRBJ1-2基因区段被未重排的人TRBJ1-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-1区段和小鼠TRBJ1-2区段之间发现的小鼠非编码序列,
内源TRBJ1-3基因区段被未重排的人TRBJ1-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-2区段和小鼠TRBJ1-3区段之间发现的小鼠非编码序列,
内源TRBJ1-4基因区段被未重排的人TRBJ1-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-3区段和小鼠TRBJ1-4区段之间发现的小鼠非编码序列,
内源TRBJ1-5基因区段被未重排的人TRBJ1-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-4区段和小鼠TRBJ1-5区段之间发现的小鼠非编码序列,
内源TRBJ1-6基因区段被未重排的人TRBJ1-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-5区段和小鼠TRBJ1-6区段之间发现的小鼠非编码序列,
内源TRBJ2-1基因区段被未重排的人TRBJ2-1基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBD2区段和小鼠TRB2-1区段之间发现的小鼠非编码序列,
内源TRBJ2-2基因区段被未重排的人TRBJ2-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-1区段和小鼠TRBJ2-2区段之间发现的小鼠非编码序列,
内源TRBJ2-3基因区段被未重排的人TRBJ2-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-2区段和小鼠TRBJ2-3区段之间发现的小鼠非编码序列,
内源TRBJ2-4基因区段被未重排的人TRBJ2-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-3区段和小鼠TRBJ2-4区段之间发现的小鼠非编码序列,
内源TRBJ2-5基因区段被未重排的人TRBJ2-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-4区段和小鼠TRBJ2-5区段之间发现的小鼠非编码序列,
内源TRBJ2-6基因区段被未重排的人TRBJ2-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-5区段和小鼠TRBJ2-6区段之间发现的小鼠非编码序列,以及
内源TRBJ2-7基因区段被未重排的人TRBJ2-7基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-6区段和小鼠TRBJ2-7区段之间发现的小鼠非编码序列,或
(d)它们的组合;或者
(III)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区基因区段置换,
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区基因区段置换,或
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区基因区段置换,
(b)内源T细胞可变区Dβ1基因区段被未重排的人T细胞可变区Dβ1基因区段置换,并且内源T细胞可变区Dβ2基因区段被未重排的人T细胞可变区Dβ2基因区段置换,
(c)以下置换:
内源TRBJ1-1基因区段被未重排的人TRBJ1-1基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBD1区段和小鼠TRBJ1-1区段之间发现的小鼠非编码序列,
内源TRBJ1-2基因区段被未重排的人TRBJ1-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-1区段和小鼠TRBJ1-2区段之间发现的小鼠非编码序列,
内源TRBJ1-3基因区段被未重排的人TRBJ1-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-2区段和小鼠TRBJ1-3区段之间发现的小鼠非编码序列,
内源TRBJ1-4基因区段被未重排的人TRBJ1-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-3区段和小鼠TRBJ1-4区段之间发现的小鼠非编码序列,
内源TRBJ1-5基因区段被未重排的人TRBJ1-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-4区段和小鼠TRBJ1-5区段之间发现的小鼠非编码序列,
内源TRBJ1-6基因区段被未重排的人TRBJ1-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-5区段和小鼠TRBJ1-6区段之间发现的小鼠非编码序列,
内源TRBJ2-1基因区段被未重排的人TRBJ2-1基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBD2区段和小鼠TRBJ2-1区段之间发现的小鼠非编码序列,
内源TRBJ2-2基因区段被未重排的人TRBJ2-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-1区段和小鼠TRBJ2-2区段之间发现的小鼠非编码序列,
内源TRBJ2-3基因区段被未重排的人TRBJ2-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-2区段和小鼠TRBJ2-3区段之间发现的小鼠非编码序列,
内源TRBJ2-4基因区段被未重排的人TRBJ2-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-3区段和小鼠TRBJ2-4区段之间发现的小鼠非编码序列,
内源TRBJ2-5基因区段被未重排的人TRBJ2-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-4区段和小鼠TRBJ2-5区段之间发现的小鼠非编码序列,
内源TRBJ2-6基因区段被未重排的人TRBJ2-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-5区段和小鼠TRBJ2-6区段之间发现的小鼠非编码序列,以及
内源TRBJ2-7基因区段被未重排的人TRBJ2-7基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-6区段和小鼠TRBJ2-7区段之间发现的小鼠非编码序列;或者
(d)它们的组合。
在一些实施方案中,
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TCRAV1-1至TCRAV41的所有未重排的人T细胞可变区基因区段置换,以及
(b)所有内源T细胞可变区Jα基因区段被TCRAJ1至TCRAJ61的所有未重排的人T细胞可变区基因区段置换,或(c)它们的组合;以及
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接的内源T细胞可变区Vβ基因区段,例如第一5’胰蛋白酶原簇和第二3’胰蛋白酶原簇之间所有邻接的内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区基因区段置换,
(b)(i)内源tcrbdj1簇被包含未重排的人TCRBD1区段的人源化TCRBDJ1簇置换,和(ii)未重排的人TCRBJ1-1区段、未重排的人TCRBJ1-2区段、未重排的人TCRBJ1-3区段、未重排的人TCRBJ1-4区段、未重排的人TCRBJ1-5区段和未重排的人TCRBJ1-6区段中的每一个,
其中所述人源化TCRBDJ1簇包含介于所述未重排的人TCRBD1区段和所述未重排的人TCRBJ1-1区段之间的小鼠TCRBDJ1非编码序列,以及介于任何两个连续的未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列,任选地其中所述未重排的人TCRBD1和TCRBJ1基因区段位于相同的小鼠TCRBDJ1非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段,并且
(c)(i)内源tcrbdj2簇被包含未重排的人TCRBD2区段的人源化TCRBDJ2簇置换,和(ii)未重排的人TRBJ2-1区段、未重排的人TRBJ2-2区段、未重排的人TCRBJ2-3区段、未重排的人TCRBJ2-4区段、未重排的人TCRBJ2-5区段、未重排的人TCRBJ2-6区段和未重排的人TCRBJ2-7区段中的每一个,
其中所述人源化TCRBDJ2簇包含介于所述未重排的人TCRBD2区段和任何未重排的人TCRBJ2区段之间的小鼠TCRBDJ2非编码序列,以及介于任何两个连续的未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列,任选地其中所述未重排的人TCRBD2和TCRBJ2基因区段位于相同的小鼠TCRBDJ2非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj2基因区段。
在一些实施方案中(例如,其中内源TCRβ可变基因的基因座,例如内源TCRβ小鼠可变基因的基因座,包含一个或所有邻接的内源T细胞可变区Vβ基因区段,例如第一5’胰蛋白酶原簇和第二3’胰蛋白酶原簇之间的一个或所有邻接的内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的一个或所有未重排的人T细胞可变区基因区段置换),内源TCRβ可变基因的基因座可包含一个或多个非邻接的内源Vβ基因区段(例如,内源小鼠TCRBV31基因区段)被人TCRBV基因区段置换(例如,小鼠TCRBV31基因区段被直系同源的人TCRBV30基因区段置换)。
在一些实施方案中,未重排的人Vα和Jα基因区段重排形成重排的人Vα/Jα序列和/或未重排的人Vβ、Dβ和Jβ基因区段重排形成重排的人Vβ/Dβ/Jβ序列,任选地其中TCRβ由重排的Vβ/Dβ2/Jβ2序列(例如,源自TCRBJD2簇的重排的Vβ/Dβ2/Jβ2序列)编码。在一些实施方案中,本文公开的非人动物在T细胞表面上表达包含人TCRα可变区和/或人TCRβ可变区的T细胞受体。在一些实施方案中,内源非人Vα和Jα区段不能重排形成重排的Vα/Jα序列,和/或内源非人Vβ、Dβ和Jβ区段不能重排形成重排的Vβ/Dβ/Jβ序列,例如该动物可能缺乏功能性内源非人TCRα可变基因座和/或该动物可能缺乏功能性内源非人TCRβ可变基因座,例如,该动物包含(a)所有或基本上所有功能性内源Vα基因区段的缺失,(b)所有或基本上所有功能性内源Jα基因区段的缺失,(c)所有或基本上所有功能性内源Vβ基因区段的缺失,(d)所有或基本上所有功能性内源Dβ基因区段的缺失,(e)所有或基本上所有功能性内源Jβ基因区段的缺失,和/或(f)它们的组合。在一些实施方案中,内源非人TCRα可变基因座缺乏所有或基本上所有功能性内源Vα基因区段和/或缺乏所有或基本上所有功能性内源Jα基因区段;和/或内源非人TCRβ可变基因座(a)缺乏所有或基本上所有功能性内源Vβ基因区段,(b)缺乏所有或基本上所有功能性内源Dβ基因区段,(c)缺乏所有或基本上所有功能性内源Jβ基因区段,或(d)(a)、(b)和(c)的任何组合。
在一些实施方案中,其中所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ1簇的基因区段,并且所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ2簇的基因区段。
在一些实施方案中,分别编码嵌合T细胞CD4、CD8α和/或CD8β辅助受体多肽的第一核苷酸序列、第二核苷酸序列和/或第三核苷酸序列存在于内源T细胞辅助受体基因座处,例如分别存在于内源CD4、CD8α和/或CD8β辅助受体基因座处;未重排的TCRα可变基因的基因座存在于内源TCRα可变基因的基因座处;未重排的TCRβ可变基因的基因座存在于内源TCRβ可变基因的基因座处;和/或分别编码嵌合MHC IIα、MHC IIβ和/或MHC I多肽的第一核酸序列、第二核酸序列和/或第三核酸序列存在于内源MHC基因座处;例如,存在于MHC IIα、MHC IIβ和/或MHC I基因座处。在一些实施方案中,编码嵌合T细胞辅助受体的核苷酸序列、未重排的TCRα可变基因的基因座、未重排的TCRβ可变基因的基因座和/或编码嵌合MHC分子的核酸序列可以可操作地连接至非人启动子和/或调控序列。例如,第一核苷酸序列可以可操作地连接至内源非人CD4启动子和调控元件和/或在它们的调控下表达,第二核苷酸序列可以可操作地连接至内源非人CD8α启动子和调控元件和/或在它们的调控下表达,和/或第三核苷酸序列可以可操作地连接至内源非人CD8β启动子和调控元件和/或在它们的调控下表达;未重排的TCRα可变基因的基因座可以可操作地连接至内源TCRα调控元件和/或启动子元件和/或在它们的调控下表达并且未重排的TCRβ可变基因的基因座可以可操作地连接至内源TCRβ调控元件和/或启动子元件和/或在它们的调控下表达;第一核酸序列可以可操作地连接至内源非人MHC IIα启动子和调控元件和/或在它们的调控下表达,第二核酸序列可以可操作地连接至内源非人MHC IIβ启动子和调控元件和/或在它们的调控下表达,并且第三核酸序列可以可操作地连接至内源非人MHC I启动子和调控元件和/或在它们的调控下表达。
在一些实施方案中,编码人CD4多肽的胞外部分(或其部分,例如D1、D2、D3和/或D4)的核苷酸序列置换编码内源非人(小鼠)CD4辅助受体多肽的胞外部分(或其部分,例如D1、D2、D3和/或D4)的序列,并且可以可操作地连接至内源非人(小鼠)CD4辅助受体基因座处的内源非人(小鼠)CD4跨膜结构域和胞质结构域编码序列;编码人CD8α多肽的整个或一部分胞外部分的核苷酸序列置换编码内源非人(小鼠)T细胞CD8α多肽的整个或一部分胞外部分的序列,并且可以可操作地连接至内源非人(小鼠)CD8α基因座处的内源非人(小鼠)CD8α跨膜结构域和胞质结构域编码序列;编码人CD8β多肽的整个或一部分胞外结构域的核苷酸序列置换编码内源非人(小鼠)T细胞CD8β多肽的整个或一部分胞外结构域的序列,并且可以可操作地连接至内源CD8β基因座处的内源非人CD8β跨膜结构域和胞质结构域编码序列;未重排的TCRα可变基因的基因座在内源非人(小鼠)TCRα可变基因的基因座处置换一个或多个内源Vα和/或Jα基因区段;未重排的TCRβ可变基因的基因座在内源非人(小鼠)TCRβ可变基因的基因座处置换一个或多个内源Vβ、Dβ和/或Jα基因区段;编码人MHC IIα多肽的胞外部分(或其部分,例如.,α1和α2结构域)的核酸序列置换编码内源非人(小鼠)MHC IIα多肽的胞外部分(或其部分,例如.,α1和α2结构域)的序列,并且可以可操作地连接至内源非人(小鼠)MHC IIα基因座处的内源非人(小鼠)MHC IIα跨膜结构域和胞质结构域编码序列;编码人MHC IIβ多肽的胞外部分(或其部分,例如.,β1和β2结构域)的核酸序列置换编码内源非人(小鼠)MHC IIβ多肽的胞外部分(或其部分,例如.,β1和β2结构域)的序列,并且可以可操作地连接至内源非人(小鼠)MHC IIβ基因座处的内源非人(小鼠)MHC IIβ跨膜结构域和胞质结构域编码序列;和/或编码人MHC I多肽的胞外部分(或其部分,例如.,α1、α2和/或α3结构域)的核酸序列置换编码内源非人(小鼠)MHC I多肽的胞外部分(或其部分,例如.,α1、α2和/或α3结构域)的序列,并且可以可操作地连接至内源非人(小鼠)MHC I基因座处的内源非人(小鼠)MHC I跨膜结构域和胞质结构域编码序列。
在一些实施方案中,本文公开的基因修饰的非人动物不从其内源基因座表达功能性内源非人T细胞CD4辅助受体,不从其内源CD8基因座表达功能性内源非人T细胞CD8辅助受体,不从内源TCRα可变基因座表达功能性TCRα可变结构域,不从内源TCRβ可变基因座表达功能性TCRβ可变结构域,不从内源MHC II基因座表达内源MHC II复合物的胞外结构域(例如,在细胞表面上)和/或不从内源MHC I基因座表达内源MHC I多肽的胞外结构域(例如,在细胞表面上)。
本文公开的任何非人动物还可包含编码包含人或人源化β2微球蛋白氨基酸序列的多肽的β2微球蛋白基因座,其中非人动物表达人或人源化β2微球蛋白多肽。在一些实施方案中,非人动物不从内源非人β2微球蛋白基因座表达功能性内源非人动物β2微球蛋白多肽。在一些实施方案中,β2微球蛋白基因座可操作地连接至内源非人β2微球蛋白调控元件。在一个实施方案中,β2微球蛋白基因座包含人β2微球蛋白基因的外显子2、外显子3和外显子4(例如,外显子2至外显子4)中所示的核苷酸序列,并且任选地,β2微球蛋白基因座还包含非人(例如啮齿动物)β2微球蛋白基因的外显子1中所示的核苷酸序列。
本文提供的非人动物可以是啮齿动物,例如小鼠或大鼠。
本文还提供了一种小鼠,该小鼠表达:嵌合人/鼠T细胞CD4、CD8α和CD8β辅助受体多肽,这些辅助受体多肽各自分别包含鼠CD4、CD8α和CD8β跨膜结构域和胞质结构域;T细胞受体,该T细胞受体包含T细胞表面上的人TCRα可变区和人TCRβ可变区;嵌合人/鼠MHC IIα、MHC IIβ和MHC I多肽,这些多肽各自分别包含人MHC IIα(例如,人HLA II类α1结构域和α2结构域)、MHC IIβ(人HLA II类β1结构域和β2结构域)及MHC I多肽(例如,人HLA I类α1、α2和α3结构域)的胞外结构域;以及任选地人或人源化β2微球蛋白多肽。在一个实施方案中,本文提供了非人动物,例如小鼠,其中第一核酸序列编码嵌合人/鼠HLA-DR/H-2E多肽的α链,第二核苷酸序列编码嵌合HLA-DR/H-2E多肽的β链,并且第三核酸序列编码嵌合人/鼠HLA-A/H-2K多肽,并且其中所述小鼠表达HLA-A/H-2K和HLA-DR/H-2E蛋白。在一些实施方案中,所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ1簇的基因区段,并且所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ2簇的基因区段。
本文还提供了一种包含基本上人源化的T细胞免疫系统的非人动物,例如,其中基本上人源化的T细胞免疫系统产生针对抗原的基本上人源化的T细胞免疫应答。在一些实施方案中,基本上人源化的T细胞免疫应答包括激活的T细胞表达识别在人白细胞抗原(HLA)胞外结构域的背景下呈递的抗原的人T细胞受体(TCR)可变结构域,和/或抗原呈递细胞在HLA胞外结构域的背景下呈递抗原。在一些实施方案中,基本上人源化的T细胞免疫系统包含:(a)非人T细胞,该非人T细胞表达:包含与人HLA分子结合的人T细胞辅助受体结构域的T细胞辅助受体多肽,和/或包含由至少一个人TCR可变区基因区段编码的TCR可变结构域的T细胞受体(TCR);和(b)非人抗原呈递细胞,该非人抗原呈递细胞在人HLA的背景下呈递抗原并激活非人T细胞。
还提供了产生和使用本文公开的非人动物的方法。通常,产生本文公开的基因修饰的非人动物的方法包括(a)将编码嵌合人/非人T细胞辅助受体多肽(例如,嵌合CD4多肽)的第一核苷酸序列,和/或编码第二嵌合人/非人T细胞辅助受体多肽(例如,嵌合CD8α多肽)的第二核苷酸序列和编码第三嵌合人/非人T细胞辅助受体多肽(例如,CD8β多肽)的第三核苷酸序列引入非人动物的基因组中,其中每个嵌合T细胞辅助受体多肽的非人部分至少包含非人T细胞辅助受体的跨膜结构域和胞质结构域,并且其中每个嵌合多肽的人部分包含人T细胞辅助受体的胞外部分(或其一部分,例如一个或多个结构域);(b)向非人动物的基因组中插入可操作地连接至非人TCRα恒定基因序列的包含至少一个人Vα区段和至少一个人Jα区段的未重排的T细胞受体(TCR)α可变基因的基因座(任选地其中未重排的TCRα可变区包含小鼠TCRA非编码序列)和/或可操作地连接至非人TCRβ恒定基因序列的包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段的未重排的TCRβ可变基因的基因座(任选地其中未重排的TCRα可变区包含小鼠TCRA非编码序列);以及任选地(c)将编码第一嵌合人/非人MHC多肽(例如,嵌合MHC IIα多肽)的第一核酸序列、编码第二嵌合人/非人MHC多肽(例如,嵌合MHC IIβ多肽)的第二核酸序列和/或编码第三嵌合人/非人MHC多肽(例如,嵌合MHC I多肽)的第三核酸序列放置在基因组中,和/或(d)向非人动物的基因组中添加编码人或人源化β2微球蛋白多肽的β2微球蛋白基因座。在一些实施方案中,第一核苷酸序列编码人CD4的胞外部分或其一部分,该胞外部分或其一部分可操作地连接至非人CD4辅助受体的至少跨膜结构域和胞质结构域,第二核苷酸序列编码人CD8α的胞外部分或其一部分及至少非人CD8α,的跨膜结构域和胞质结构域,第三核苷酸序列编码人CD8β的胞外部分或其一部分及至少非人CD8β的跨膜结构域和胞质结构域,第一核酸序列编码人HLA II类α多肽的胞外部分(或其一部分)及至少非人MHC IIα多肽的跨膜结构域和胞质结构域,第二核酸序列编码人HLA II类β多肽的胞外部分(或其一部分)及至少非人MHC IIβ多肽的跨膜结构域和胞质结构域,第三核酸序列编码人HLA I类多肽的胞外部分(或其一部分)及非人MHC I多肽的跨膜结构域和胞质结构域,并且β2微球蛋白基因座包含人β2微球蛋白基因的外显子2至4中所示的核苷酸序列,例如,人β2微球蛋白基因的外显子2、3和4中所示的核苷酸序列。
一些产生非人动物的方法包括下述实施方案,这些实施方案包括用包含所述至少一个未重排的人T细胞可变区Dβ区段、小鼠TCRBD-TCRBJ非编码核酸序列和所述至少一个未重排的人T细胞可变区Jβ区段的核酸序列置换包含小鼠TCRBD基因区段和小鼠TCRBJ基因区段的邻接小鼠TCRB序列,使得所述至少一个未重排的人T细胞可变区Dβ区段、所述小鼠TCRBD-TCRBJ非编码核酸序列和所述至少一个未重排的人T细胞可变区Jβ区段可操作地连接至所述小鼠TCRβ恒定基因序列。在一些实施方案中,邻接小鼠TCRB序列包含(a)小鼠TCRBD1基因区段和小鼠TCRBJ1-6基因区段和/或(b)小鼠TCRBD2基因区段和小鼠TCRBJ2-7基因区段,并且其中所述核酸包含:
(c)人源化TCRBDJ1簇,所述人源化TCRBDJ1簇包含未重排的人TCRBD1基因区段、未重排的人TCRBJ1基因区段和小鼠TCRBDJ1非编码序列,其中所述人源化TCRBDJ1簇包含:
未重排的人TRBJ1-1基因区段以及介于所述未重排的人TRBD1基因区段和所述未重排的人TRBJ1-1基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-1基因区段、未重排的人TRBJ1-2基因区段,以及介于所述未重排的人TRBJ1-1基因区段和所述未重排的人TRBJ1-2基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-2基因区段、未重排的人TRBJ1-3基因区段,以及介于所述未重排的人TRBJ1-2基因区段和所述未重排的人TRBJ1-3基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-3基因区段、未重排的人TRBJ1-4基因区段,以及介于所述未重排的人TRBJ1-3基因区段和所述未重排的人TRBJ1-4基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-4基因区段、未重排的人TRBJ1-5基因区段,以及介于所述未重排的人TRBJ1-4基因区段和所述未重排的人TRBJ1-5基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-5基因区段、未重排的人TRBJ1-6基因区段,以及
介于所述未重排的人TRBJ1-5基因区段和所述未重排的人TRBJ1-6基因区段之间的小鼠TCRB非编码序列,或
它们的任何组合(例如,其中人源化TCRBDJ1簇包含(i)未重排的人TCRBD1区段和(ii)未重排的人TRBJ1-1区段、未重排的人TRBJ1-2区段、未重排的人TCRBJ1-3区段、未重排的人TCRBJ1-4区段、未重排的人TCRBJ1-5区段和未重排的人TCRBJ1-6区段的任何组合;并且其中所述人源化TCRBDJ1簇包含介于未重排的人TCRBD1区段和任何未重排的人TCRBJ1区段之间的小鼠TCRBDJ1非编码序列以及介于任何两个连续的未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列,任选地其中所述未重排的人TCRBD1和TCRBJ1基因区段位于相同的小鼠TCRBDJ1非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段);和/或
(d)人源化TCRBDJ2簇,所述人源化TCRBDJ2簇包含未重排的人TCRBD2基因区段、未重排的人TCRBJ2基因区段和小鼠TCRBDJ2非编码序列,其中所述人源化TCRBDJ2簇包含:
未重排的人TRBJ2-1基因区段以及介于所述未重排的人TRBD2基因区段和所述未重排的人TRBJ2-1基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-1基因区段、未重排的人TRBJ2-2基因区段,以及
介于所述未重排的人TRBJ2-1基因区段和所述未重排的人TRBJ2-2基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-2基因区段、未重排的人TRBJ2-3基因区段,以及
介于所述未重排的人TRBJ2-2基因区段和所述未重排的人TRBJ2-3基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-3基因区段、未重排的人TRBJ2-4基因区段,以及介于所述未重排的人TRBJ2-3基因区段和所述未重排的人TRBJ2-4基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-4基因区段、未重排的人TRBJ2-5基因区段,以及
介于所述未重排的人TRBJ2-4基因区段和所述未重排的人TRBJ2-5基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-5基因区段、未重排的人TRBJ2-6基因区段,以及
介于所述未重排的人TRBJ2-5基因区段和所述未重排的人TRBJ2-6基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-6基因区段、未重排的人TRBJ2-7基因区段,以及介于所述未重排的人TRBJ2-6基因区段和所述未重排的人TRBJ2-7基因区段之间的小鼠TCRB非编码序列,或
它们的任何组合(例如,其中人源化TCRBDJ1簇包含(i)未重排的人TCRBD2区段和(ii)未重排的人TRBJ2-1区段、未重排的人TRBJ2-2区段、未重排的人TRBJ2-3区段、未重排的人TCRBJ2-4区段、未重排的人TCRBJ2-5区段、未重排的人TCRBJ2-6区段和未重排的人TCRBJ2-7区段的任何组合;并且其中所述人源化TCRBDJ2簇包含介于未重排的人TCRBD2区段和任何未重排的人TCRBJ2区段之间的小鼠TCRBDJ2非编码序列以及介于任何两个连续的未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列,任选地其中所述未重排的人TCRBD2和TCRBJ2基因区段位于相同的小鼠TCRBDJ2非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj2基因区段)。
产生非人动物的方法包括下述实施方案,其中(a)将编码嵌合T细胞辅助受体多肽的第一核苷酸序列、第二核苷酸序列和/或第三核苷酸序列引入非人动物的基因组中包括在内源CD4基因座处用编码嵌合人/非人CD4多肽的核苷酸序列置换编码内源非人CD4多肽的核苷酸序列,和/或在内源CD8α基因座处用编码嵌合人/非人CD8α多肽的核苷酸序列置换编码内源非人CD8α多肽的核苷酸序列,并且在内源CD8β基因座处用编码嵌合人/非人CD8β多肽的核苷酸序列置换编码内源非人CD8β多肽的核苷酸序列;(b)将未重排的TCRα基因座和/或未重排的TCRβ基因座插入动物基因组中包括用包含至少一个人Vα区段和至少一个人Jα区段的未重排的人源化TCRα可变基因的基因座置换内源非人TCRα可变基因的基因座,以生成人源化TCRα可变基因的基因座,其中所述人源化TCRα可变基因的基因座可操作地连接至内源非人TCRα恒定区,和/或用包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段的未重排的人源化TCRβ可变基因的基因座置换内源非人TCRβ可变基因的基因座,以生成人源化TCRβ可变基因的基因座,其中所述人源化TCRβ可变基因的基因座可操作地连接至内源非人TCRβ恒定区;(c)将编码嵌合MHC多肽的第一核酸序列、第二核酸序列和/或第三核酸序列放置在非人动物的基因组中包括在内源非人MHC II基因座处用编码嵌合人/非人MHC II复合物的核苷酸序列置换编码非人MHC II复合物的核苷酸序列并且在内源非人MHCI基因座处用编码嵌合人/非人MHC I多肽的核苷酸序列置换编码非人MHC I多肽的核苷酸序列,和/或(d)向非人动物的基因组中添加编码人或人源化β2微球蛋白多肽的β2微球蛋白基因座,包括在内源非人β2微球蛋白基因座处用编码人或人源化β2微球蛋白多肽的核苷酸序列置换编码非人β2微球蛋白多肽的核苷酸序列。
在一些实施方案中,(a)将第一核苷酸序列、第二核苷酸序列和/或第三核苷酸序列分别引入非人动物的基因组中包括(i)在内源CD4基因座处用编码人CD4多肽胞外部分(或其一部分)的核苷酸序列置换编码内源非人CD4多肽胞外部分(或其一部分)的核苷酸序列,该编码人CD4多肽胞外部分(或其一部分)的核苷酸序列与编码内源非人CD4跨膜结构域和胞质结构域的序列可操作连接,(ii)在内源CD8α基因座处用编码人CD8α多肽的胞外部分(或其一部分)的核苷酸序列置换编码内源非人CD8α多肽的胞外部分(或其一部分)的核苷酸序列,该编码人CD8多肽的胞外部分(或其一部分)的核苷酸序列与编码内源非人CD8α跨膜结构域和胞质结构域的序列可操作连接,和/或(iii)在内源CD8β基因座处用编码人CD8β多肽的胞外部分(或其一部分)的核苷酸序列置换编码内源非人CD8β多肽的胞外部分(或其一部分)的核苷酸序列,该编码人CD8多肽的胞外部分(或其一部分)的核苷酸序列与编码内源非人CD8β跨膜结构域和胞质结构域的序列可操作连接;(b)将未重排的TCRα基因座和/或未重排的TCRβ基因座插入动物基因组中分别包括(i)用包含至少一个人Vα区段和至少一个人Jα区段的未重排的人源化TCRα可变基因的基因座置换内源非人TCRα可变基因的基因座,以生成人源化TCRα可变基因的基因座,其中所述人源化TCRα可变基因的基因座可操作地连接至内源非人TCRα恒定区,和/或用包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段的未重排的人源化TCRβ可变基因的基因座置换内源非人TCRβ可变基因的基因座,以生成人源化TCRβ可变基因的基因座,其中所述人源化TCRβ可变基因的基因座可操作地连接至内源非人TCRβ恒定区;(c)将第一核酸序列、第二核酸序列和/或第三核酸序列放置在非人动物的基因组中分别包括(i)在内源非人MHC IIα基因座处用编码人HLA II类α多肽胞外部分(或其一部分)的核苷酸序列置换编码非人MHC IIα多肽胞外部分(或其一部分)的核苷酸序列,该编码人HLA II类多肽胞外部分(或其一部分)的核苷酸序列与编码内源非人MHC IIα跨膜结构域和胞质结构域的序列可操作连接,(ii)在内源非人MHC IIβ基因座处用编码人HLA II类β多肽的胞外部分(或其一部分)的核苷酸序列置换编码非人MHC IIβ多肽的胞外部分(或其一部分)的核苷酸序列,该编码人HLA II类多肽的胞外部分(或其一部分)的核苷酸序列与编码内源非人MHC IIβ跨膜结构域和胞质结构域的序列可操作连接,和/或(iii)在内源非人MHC I基因座处用编码人HLA I类多肽的胞外部分(或其一部分)的核苷酸序列置换编码非人MHC I多肽的胞外部分(或其一部分)的核苷酸序列,该编码人HLA I类多肽的胞外部分(或其一部分)的核苷酸序列与编码内源非人MHC I跨膜结构域和胞质结构域的序列可操作连接;和/或在内源β2微球蛋白基因座处用包含人β2微球蛋白基因的外显子2、3和4的核苷酸序列置换外显子2-外显子4中所示的核苷酸序列。
在一个实施方案中,引入步骤包括在第一非人动物中的内源CD4基因座处用编码嵌合人/非人CD4多肽的核苷酸序列置换编码内源非人CD4多肽的核苷酸序列,在第二非人动物中的内源CD8α基因座处用编码嵌合人/非人CD8α多肽的核苷酸序列置换编码内源非人CD8α多肽的核苷酸序列,并且在内源CD8β基因座处用编码嵌合人/非人CD8β多肽的核苷酸序列置换编码内源非人CD8β多肽的核苷酸序列。在一些实施方案中,引入步骤包括在第一非人动物的内源CD4基因座处用编码人CD4多肽胞外部分(或其一部分)的核苷酸序列置换编码内源非人CD4多肽胞外部分(或其一部分)的核苷酸序列,该编码人CD4多肽胞外部分(或其一部分)的核苷酸序列与编码内源非人CD4跨膜结构域和胞质结构域的序列可操作连接,在第二非人动物的内源CD8α基因座处用编码人CD8α多肽的胞外部分(或其一部分)的核苷酸序列置换编码内源非人CD8α多肽的胞外部分(或其一部分)的核苷酸序列,该编码人CD8多肽的胞外部分(或其一部分)的核苷酸序列与编码内源非人CD8α跨膜结构域和胞质结构域的序列可操作连接,和/或在内源CD8β基因座处用编码人CD8β多肽的胞外部分(或其一部分)的核苷酸序列置换编码内源非人CD8β多肽的胞外部分(或其一部分)的核苷酸序列,该编码人CD8多肽的胞外部分(或其一部分)的核苷酸序列与编码内源非人CD8β跨膜结构域和胞质结构域的序列可操作连接。在一些实施方案中,置换步骤同时进行或以任何顺序进行。
在一些实施方案中,插入步骤包括在第三非人动物中用包含至少一个人Vα区段和至少一个人Jα区段的未重排的人源化TCRα可变基因的基因座置换内源非人TCRα可变基因的基因座,以生成人源化TCRα可变基因的基因座,其中人源化TCRα可变基因的基因座可操作地连接至内源非人TCRα恒定区;在第四非人动物中用包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段的未重排的人源化TCRβ可变基因的基因座置换内源非人TCRβ可变基因的基因座,以生成人源化TCRβ可变基因的基因座,其中人源化TCRβ可变基因的基因座可操作地连接至内源非人TCRβ恒定区。在一些实施方案中,置换步骤同时进行或以任何顺序进行。
在一些实施方案中,放置步骤包括,不按特定顺序,在第五非人动物中的内源非人MHC II基因座处,用一个或多个编码嵌合人/非人MHC II复合物的核苷酸序列置换一个或多个编码非人MHC II复合物的核苷酸序列;以及在第五非人动物的内源非人MHC I基因座处,用编码嵌合人/非人MHC I多肽的核苷酸序列置换编码非人MHC I多肽的核苷酸序列。在一些实施方案中,放置步骤包括在第五非人动物中的内源非人MHC IIα基因座处,用编码人MHC IIα多肽胞外部分(或其一部分)的核苷酸序列置换编码非人MHC IIα多肽胞外部分(或其一部分)的核苷酸序列,该编码人MHC II多肽胞外部分(或其一部分)的核苷酸序列与编码内源非人MHC IIα跨膜结构域和胞质结构域的序列可操作连接,并且在内源非人MHC IIβ基因座处用编码人MHC IIβ多肽胞外部分(或其一部分)的核苷酸序列置换编码非人MHC IIβ多肽胞外部分(或其一部分)的核苷酸序列,该编码人MHC II多肽胞外部分(或其一部分)的核苷酸序列与编码内源非人MHC IIβ跨膜结构域和胞质结构域的序列可操作连接;以及在第五非人动物的内源非人MHC I基因座处,用编码人MHC I多肽胞外部分(或其一部分)的核苷酸序列置换编码非人MHC I多肽胞外部分(或其一部分)的核苷酸序列,该编码人MHC I多肽胞外部分(或其一部分)的核苷酸序列与编码内源非人MHC I跨膜结构域和胞质结构域的序列可操作连接。在一些实施方案中,置换步骤同时进行或以任何顺序进行。
在一些实施方案中,添加步骤包括在第六非人动物的内源非人β2微球蛋白基因座处,用编码人或人源化β2微球蛋白多肽的核苷酸序列置换编码非人β2微球蛋白多肽的核苷酸序列。在一些实施方案中,人或人源化β2微球蛋白多肽由人β2微球蛋白基因的外显子2、外显子3和外显子4中所示的核苷酸序列编码。
本文公开的方法包括下述实施方案,其中引入编码嵌合T细胞辅助受体多肽的第一核苷酸序列、第二核苷酸序列和/或第三核苷酸序列;插入TCRα基因座和/或未重排的TCRβ基因座;放置编码嵌合MHC多肽的第一核酸序列、第二核酸序列和/或第三核酸序列;和/或添加β2微球蛋白基因座,这些是通过将包含一种或多种本文所述的基因修饰的非人动物与包含其余基因修饰的相同物种的另一种(或多种)非人动物进行繁殖进行的。非限制性实施方案包括以任何顺序使如上所述的第一非人动物、第二非人动物、第三非人动物、第四非人动物、第五非人动物和第六非人动物繁殖。
本文公开的方法可以包括在非人胚胎干(ES)细胞中进行同源重组。本文公开的方法可用于产生本文公开的小鼠。表达嵌合人/非人CD4、CD8α和/或CD8βT细胞辅助受体多肽、人(人源化)TCRα/β蛋白以及嵌合MHC II复合物和MHC I(具有人或人源化β2微球蛋白)的非人动物可通过以下方式产生:(a)首先在单独ES细胞中分别通过同源重组引入每个单独的人(人源化)基因并从此类ES细胞产生每个单独的非人动物,并且随后以任何顺序繁殖产生的每个非人动物,(b)在单个ES细胞中通过依次同源重组引入所有人(人源化)基因,然后从此类ES细胞产生非人动物,或(c)在ES细胞中的一些基因座处依次同源重组和繁殖的组合。本文公开的动物也可以通过视情况将初始繁殖的后代与其他动物繁殖来产生。繁殖和/或同源重组可以以任何优选顺序完成。
本文还描述了例如在所述方法中使用的靶向载体。在一些实施方案中,靶向载体可包含用于靶向小鼠TCRBDJ区、未重排的人TCRBD区段、未重排的人TCRBJ区段和小鼠TRCBDJ非编码序列的5’同源臂和3’同源臂。在一些实施方案中,(A)未重排的人TCRBD区段包含在7号染色体(GRCh38组件)上的下列人类基因组坐标所示的序列:142,786,213-142,786,224,和/或142,796,365-142,796,414;(B)所述未重排的人TCRBJ区段包含在7号染色体(GRCh38组件)上的下列人类基因组坐标所示的序列:142,786,880-142,786,927;142,787,017-142,787,064;142,787,630-142,787,679;142,788,225-142,788,275;142,788,498-142,788,547;142,788,988-142,789,040;142,795,686-142,795,740;142,796,560-142,796,610;142,796,847-142,796,895;142,796,998-142,797,047;142,797,119-142,797,166;142,797,239-142,797,291和/或142,797,456-142,797,502;和(C)小鼠TCRBDJ非编码序列包含在与(A)的人TCRBD基因区段直系同源的小鼠TCRBD基因区段和与(B)的人TCRBJ基因区段直系同源的TCRBJ基因区段之间发现的小鼠TCRBDJ非编码序列。
还描述了包含本文所述的靶向载体的小鼠基因组或小鼠细胞(例如,ES细胞、生殖细胞等)。
还提供了从非人动物中分离对抗原具有特异性的人TCR可变结构域的方法,这些方法包括从本文提供的或根据本文公开的方法产生的非人动物中分离与该抗原结合的T细胞或TCR蛋白。在一些实施方案中,这些方法还可包括鉴定编码与抗原结合的TCRα和/或TCRβ可变结构域的第一核酸和/或第二核酸,和/或在足以表达载体的条件下培养包含一种或多种载体的细胞,其中载体包含分别与第一核酸和/或第二核酸相同或基本上相同的第三核酸和/或第四核酸,并且其中第三核酸和/或第四核酸分别与例如人TCR恒定区基因,例如TCRα恒定区基因和/或TCRβ恒定区基因在框内克隆。还提供了包含本文公开的基因修饰的组织和细胞(基因修饰可包括重排的人TCRα和/或TCRβ可变区基因),以及编码由分离自如本文所述那样修饰的非人动物的此类组织或细胞表达的此类人TCR可变区的核酸。还包括(1)重组核酸(例如表达载体),其包含编码本文公开的人TCR可变结构域的核酸序列,例如重排的人TCRα或重排的人TCRβ可变区基因,分别在框内克隆到适当的人TCR恒定区基因,例如TCRα恒定区基因或TCRβ恒定区基因,(2)包含此类核酸(例如表达载体)的宿主细胞和(3)宿主细胞表达的TCR。在一些实施方案中,本文提供的重组核酸包含重排的人TCRδ可变区基因或TCRγ可变区基因,例如,源自如本文公开那样基因修饰的非人动物或从其分离的组织,分别与人TCRδ恒定区基因或TCRγ恒定区基因在框内克隆。
还提供了一种在非人动物中产生人源化T细胞应答的方法,该方法通常包括用抗原,例如人抗原,例如人肿瘤抗原、人细菌病原体、人病毒病原体等使非人动物免疫,该非人动物是如本文所述那样基因修饰的或具有基本上人源化的T细胞免疫系统的非人动物。在一些实施方案中,经免疫的非人动物表达所有功能性人TCRVα基因区段的至少50%和/或所有功能性人TCRVβ基因区段的至少50%和/或包含所有或基本上所有功能性人TCRVα基因区段和/或所有或基本上所有功能性人TCRVβ基因区段。
还提供了分离对抗原具有特异性的人TCR的体外方法,该体外方法通常包括在(a)与非人动物的第二细胞接触后和(b)与抗原温育后检测非人动物的第一细胞的激活;其中第一细胞表达嵌合人/非人T细胞辅助受体以及(i)嵌合人/非人TCRα链和(ii)嵌合人/非人TCRβ链中的任一者或两者,并且其中第二细胞表达嵌合人/非人MHC多肽。这些方法还可包括从第一细胞中分离TCR,或编码TCR的核酸。
在本文公开的体外方法中,抗原可以是肿瘤抗原、病毒抗原、自身抗原或细菌抗原。在一些实施方案中,非人动物是啮齿动物,例如大鼠或小鼠。本文还提供了分离自经基因修饰的或具有本文所述的基本上人源化的T细胞免疫系统的非人动物的组织、T细胞、TCR(例如,可溶性TCR)或编码整个或一部分TCR的核酸,源自此类T细胞的杂交瘤或四价体瘤。
还提供了组合物,例如,包含非人动物的第一细胞和第二细胞;其中第一细胞表达嵌合人/非人T细胞辅助受体以及任选地,(i)嵌合人/非人TCRα链和(ii)嵌合人/非人TCRβ链中的任一者或两者,并且其中第二细胞表达与嵌合人/非人T细胞辅助受体缔合的嵌合人/非人MHC多肽。在一些实施方案中,第一细胞是非人T细胞。在其他实施方案中,第二细胞是非人抗原呈递细胞。
附图说明
图1是包含人源化TCRα和β蛋白、与人源化β2微球蛋白复合的人源化MHC I类和人源化CD8异二聚体的人源化T细胞受体复合物的示意图(未按比例)(左图);以及包含人源化TCRα和β蛋白、人源化MHC II类异二聚体和人源化CD4的T细胞受体复合物(右图)。人源化MHC呈递的抗原以圆圈描绘。小鼠区域描绘为填充形状,而人类区域描绘为条纹形状。
图2A-图2C提供了示例性嵌合MHC I和MHC II基因座,例如嵌合HLA-A2/H-2K基因座(图2A)、嵌合HLA-DR2/H-2E基因座(图2B)和人源化β2M基因座(图2C)的示意图(未按比例)。除非另有说明,人类序列描绘为空心形状,而小鼠序列描绘为填充形状。条纹形状表示源自不同于内源基因座的小鼠品系的H-2E的外显子1(参见实施例1.3和图3B)。用相应标记的箭头描绘flox化的新霉素磷酸转移酶盒。
图3A-图3C描绘了产生包含人源化MHC I和MHC II基因的人源化MHC基因座的策略。在图3A中描绘的特定实施方案中,产生的小鼠的MHC基因座包含嵌合HLA-A2/H-2K和HLA-DR2/H-2E序列(H2-K+/1666MHC-II+/6112)并且缺乏H2-D序列(H2-D+/缺失)和H-2A序列(基因工程改造方案也引起H-2A的缺失,参见实施例1.2)。箭头右侧描绘了在人源化的每个阶段引入ES细胞的大靶向载体(LTVEC)或Cre重组酶构建体。MAID或4位数是指经修饰的等位基因ID号。图3B是示例性HLA-DR2/H-2E大靶向载体的示意图(未按比例)。除非另有说明,人类序列描绘为空心形状,而小鼠序列描绘为填充形状。条纹形状表示源自不同于内源基因座的小鼠品系的H-2E的外显子1(参见实施例1.3)。flox化的潮霉素盒描绘为相应标记的箭头。图3C是嵌合人/小鼠MHC基因座的示例性基因型的示意图(未按比例)(**表示并非所有小鼠品系中都存在,例如,在C57BL/6或129小鼠品系中不存在的的H-2L基因),其中内源小鼠H-2K和H-2E基因座分别被嵌合人/小鼠HLA-A2/H-2K和HLA-DR2/H-2E基因座(条纹形状)置换,H-2A和H-2D基因座缺失(虚线轮廓的空心形状),并且其余基因座是内源小鼠基因(实线轮廓的实心形状)。
图4A描绘了(未按比例)小鼠TCRα基因座人源化的渐进式策略,其中TCRα可变区基因区段在缺失小鼠基因座(MAID1540)初始人源化的上游依次添加。小鼠序列以填充形状指示;人类序列以空心形状指示。MAID是指经修饰的等位基因ID号。TRAV=TCR Vα区段,TRAJ=TCR Jα区段(hTRAJ=人TRAJ),TRAC=TCR Cα结构域,TCRD=TCRδ。尽管在该图中没有描绘,但是每个人TRAV和每个人TRAJ之间的每个非编码序列都是人的。图4B描绘了(未按比例)小鼠TCRβ基因座人源化的渐进式策略,其中TCRβ可变区基因区段依次添加到缺失的小鼠TCRβ可变基因座。小鼠序列以填充形状指示;人类序列以空心形状指示。MAID是指经修饰的等位基因ID号。TRBV或TCRBV=TCRβV区段。尽管在该图中没有描绘,但是每个人TRBV之间、人D1和最近的人J之间、人D2和每个人J之间以及每个J之间的每个非编码序列都是人的。图4C描绘了以下的示意图(未按比例):(a)TRBDJ1簇,其中D1和J1基因区段是人的并且它们之间的非编码序列(包括RSS和其他基因间序列)是小鼠的,(b)小鼠TRB C1恒定基因,(c)TRBDJ2簇,其中D2和J2基因区段是人的并且它们之间的非编码序列(包括RSS和其他基因间序列)是小鼠的,以及(d)小鼠TRB C2恒定基因。小鼠序列以填充形状指示;人类序列以空心形状指示。如该图中描绘的,每个人TRBD区段和每个人TRBJ区段之间以及每个TRBJ区段之间的每个非编码序列是小鼠的。flox序列描绘为相应标记的箭头
图5A描绘了嵌合CD4基因座的示意图(未按比例)。人编码外显子用条纹形状呈现,小鼠编码外显子用填充形状呈现,并且非编码外显子用空心形状呈现。指示了免疫球蛋白样结构域(Ig)、跨膜区(TM)、胞质(CYT)和信号肽(Signal)编码外显子以及3’非翻译区(UTR)。用相应标记的箭头描绘flox化(loxP)新霉素磷酸转移酶(Pgk-neo)盒。图5B描绘了嵌合CD8a和CD8b基因座的示意图(未按比例)。人编码外显子用条纹形状呈现,小鼠编码外显子用填充形状呈现,并且非编码外显子用空心形状呈现。指示了免疫球蛋白样结构域(IgV)、跨膜区(TM)、胞质(CYT)和信号肽(Signal)编码外显子以及3’非翻译区(UTR)。用相应标记的箭头描绘flox化(loxP)潮霉素(Hyg)和新霉素磷酸转移酶(Pgk-neo)盒。
图6A-图6C是从对照小鼠或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β以及β2M(TM I/II B C4/8)基因座的小鼠中分离的胸腺细胞的FACS等高线图,这些胸腺细胞单线门控并用以下染色:(图6A)抗小鼠CD19和抗小鼠CD3抗体、(图6B)抗小鼠CD19和抗小鼠F4/80抗体或(图6C)抗小鼠CD8α和抗小鼠CD4抗体(左图)或抗人CD8α和抗人CD4抗体(右图)。在该图中,TM I/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图7A-图7G是从对照小鼠或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β以及β2M(TM I/II B C4/8)基因座的小鼠中分离的胸腺细胞的FACS等高线图,这些胸腺细胞门控于CD19+细胞、F4/80+细胞或CD3+细胞,并用以下染色:(图7A、图7B)抗人B2M或抗小鼠H-2D抗体;(图7C、图7D)抗HLA-A2或抗HLA-DR抗体;(图7E、图7F)抗H-2D和抗IAIE抗体;或(图7G)抗小鼠CD4和抗人CD4抗体(上)、抗小鼠CD8α和抗人CD8α抗体(中),以及抗小鼠CD8β和抗人CD8β抗体(下)。在该图中,TM I/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图8提供了从对照小鼠或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β以及β2M(TM I/II B C4/8)的小鼠中分离的胸腺细胞的FACS等高线图,这些胸腺细胞门控于CD3+CD4+细胞,并用抗小鼠FoxP3和抗小鼠CD25抗体染色。在该图中,TM I/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图9A-图9E是从对照小鼠或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β以及β2M(TM I/II B C4/8)基因座的小鼠中分离的脾细胞的FACS等高线图,这些脾细胞单线门控、门控于CD3+细胞、CD4+T细胞或CD8+T细胞并用以下染色:(图9A)抗小鼠CD19和抗小鼠CD3、(图9B)抗小鼠CD19和抗小鼠F4/80抗体、(图9C)抗小鼠CD4和抗小鼠CD8α抗体(左图)或抗人CD4和抗人CD8α抗体(右图),或(图9D、图9E)抗小鼠CD44和抗小鼠CD62L抗体。在该图中,TM I/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图10A-图10G是从对照小鼠或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β以及β2M(TM I/II B C4/8)基因座的小鼠分离的脾细胞的FACS等高线图,这些脾细胞门控于CD19+细胞、F4/80+细胞或CD3+细胞并用以下染色:(图10A、图10B)抗人B2M或抗小鼠H-2D抗体、(图10C、图10D)抗HLA-A2或抗HLA-DR抗体、(图10E、图10F)抗H-2D和抗IAIE抗体或(图10G)抗小鼠CD4和抗人CD4抗体(上)、抗小鼠CD8α和抗人CD8α抗体(中)及抗小鼠CD8β和抗人CD8β抗体(下)。在该图中,TM I/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图11提供了从对照小鼠或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β以及β2M(TM I/II B C4/8)的小鼠中分离的脾细胞的FACS等高线图,这些脾细胞门控于CD3+CD4+细胞,并用抗小鼠FoxP3和抗小鼠CD25抗体染色。在该图中,TM I/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图12A提供了在从对照小鼠或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β以及β2M(TM I/II B C4/8)基因座的小鼠中分离并在不存在肽的情况下(仅200k个细胞;x轴)或在10μg/ml或1μg/ml的MAGE-A3肽的存在下(x轴)温育之后,在酶联免疫吸附斑点测定中产生IFN-γ的脾细胞的数目(每孔的点数(平均值+SD));y轴)。在图12B-图12C中,分别用HLA-A2限制性NY-ESO-1157-165或MAGE-A3271-279肽免疫WT小鼠和TM I/II B C4/8小鼠。免疫后第14天,在抗原肽(10mg/ml)的存在下或无肽存在下培养的混合脾和淋巴结(LN)细胞中,通过IFN-γElispot定量抗原特异性T细胞的存在。在图12B中,对每种基因型的一只原初小鼠(未免疫)和两只免疫小鼠进行分析。在图12C中,对每种基因型的两只原初小鼠和四只免疫小鼠进行分析。图12D提供了说明性的基于Jurkat的报告系统,该报告系统开发用于测试响应于肽脉冲的工程化抗原呈递细胞(APC)的TCR介导的信号传导,所述APC由表达人CD80和CD86的293T细胞组成。用编码克隆的TM I/II B C4/8来源的TCR的慢病毒上清液转导缺乏表面TCR的亲本报告细胞(JRT3/hCD8/hCD28/AP1.荧光素酶)以产生报告JRT3报告细胞系。在图12E中,通过流式细胞术测量转导系和亲本JRT3系上的表面TCR表达。在图12F中,将表达所指示的TCR的报告系(亲本JRT3、#001、#050、#063、#188、#229)与用或未用NY-ESO-1157-165肽脉冲的APC共培养。将5x 104个JRT3细胞与不同数目的APC一起温育(以3x 105个APC开始,2倍连续系列;x轴)。4小时后,测量AP1驱动的荧光素酶活性。为NY-ESO-1肽脉冲培养物标绘相对发光单位(RLU;y轴)。信噪(S/N)比的值按照NY-ESO-1肽共培养物与无肽培养物的比率(未标绘),使用测试的最高APC浓度的RLU值计算(效应细胞:靶细胞[E:T]比为1:6)。在图12G中,使用经NY-ESO-1157-165或预测的脱靶肽脉冲的293T APC进行基于JRT3的TCR报告基因测定。图12H-图12I提供了与通过靶向人TRAC基因座从TM I/II B C4/8小鼠中分离的TCR的表达相关的图示。图12H提供了有效重排的人TRAC基因座的示意图,具有用于插入定制TCRa/b链的sgRNA切割位点和AAV载体。表达依赖于第一TRAC外显子内的框内盒插入,转录由上游内源Vα启动子驱动。TRAC结构域由其第一外显子编码的部分(条纹区)包含在右侧同源臂(HA-R)内,并且其余TRAC结构域由内源下游外显子编码。TRAC*和TRBC1*指示已经重新编码以消除sgRNA结合同时保留氨基酸序列的恒定结构域序列。在图12I中,用含有TRAC/TRBC sgRNA的混合物或含有非靶向sgRNA的Cas9 RNP核转染原代人T细胞,接着用编码同源定向修复(HDR)模板的AAV转导以插入NY-ESO-1特异性TCR050。转导后7天,通过流式细胞术分析总表面TCR(经由CD3e)和TCR050(经由pMHC四聚体)的表达。图12J和图12K示出了从TM I/II B C4/8小鼠分离的TCR的抗肿瘤活性。图12J提供了TCR050的表达和分析方案。图12K提供了与不相关的对照TCR(HPV)和未转导的细胞相比,在TRAC靶向T细胞中通过NY-ESO-1157-165四聚体(上图)和Vβ特异性抗体(下图)测量的NY-ESO特异性TCR050的表达。在下图中,对TCR050和HPV TCR的同源Vβ链进行染色。对未转导细胞的Vβ13.6进行染色,以确定在PBMC供体中的基本用法。图12L提供了在2小时钙黄绿素-AM释放测定中测量的针对A375细胞的细胞毒活性。在图12M中,NSG小鼠(n=5)植入A375肿瘤细胞并在同一天施用T细胞。随时间测量肿瘤生长,值表示平均(±SEM)肿瘤体积。在图12N中,示出了来自图12M的单个小鼠的肿瘤生长曲线。在图12O中,在T细胞施用后3天收获小鼠的血清并分析人IFNγ。值表示IFNγ的平均(±SEM)浓度。通过双因素方差分析与Tukey检验进行多重比较,****,p<0.0001。在该图中,TM I/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图13A描绘了在对照或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β以及β2M(TM I/II B C4/8)基因座的小鼠中急性Armstrong毒株病毒感染的进展;在图的顶部描绘了实验的时间线,并且在底部图中描绘了两个小鼠品系在感染后不同天数的病毒滴度测量值。图13B描绘了在对照或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β以及β2M(TM I/II B C4/8)基因座的小鼠中慢性克隆13毒株病毒感染的进展;在图的顶部描绘了实验的时间线,并且在底部图中描绘了两个小鼠品系在感染后第21天的病毒滴度测量值。来自未感染或慢性感染的TM I/II BC4/8或对照B6小鼠的T细胞用抗PD1、抗Lag3和抗Tim3抗体染色(图13C;x轴);该图提供了染色阳性的细胞的定量(%阳性细胞;y轴)。在该图中,TMI/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图14描绘了在先前急性Armstrong毒株感染后,对照或TM I/II BC4/8小鼠中慢性克隆13毒株病毒感染的进展;在图的顶部描绘了实验的时间线,并且在底部图中描绘了在感染后第31天的病毒滴度测量值。模拟感染小鼠作为附加对照包括在实验中。在该图中,TMI/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图15A-图15B描绘了响应于HLA-A2限制性(GPC10-18;N69-77;Z49-58)、H2Db限制性(GP33-41)的LCMV肽、卵白蛋白或单独温育产生IFN-γ并从对照动物(图15A)或包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β及β2M(TM I/II B C4/8)基因座(图15B)的小鼠中分离的CD8+细胞的数目(y轴;IFN-γ阳性细胞),每个细胞接受模拟感染(模拟;每组n=1)或急性Armstrong毒株感染(Arm;每组n=3)。在图15C和图15D中分别示出了在包含人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β及β2M(TM I/II B C4/8)基因座的小鼠或对照B6动物中在感染的时间过程中(感染后的天数;x轴),用指示的肽(OVA、GP33、NP69、GPC10、GPC447或Z49)刺激后的IFNγ+CD8+淋巴细胞的%(y轴)。在该图中,TM I/II B C4/8小鼠包含全人TCRBDJ1簇和TCRBJ2簇。
图16A提供了代表性流式细胞术分析的等高线图,并且图16B提供了TM I/II BC4/8(VelociT)和WT小鼠(n=4)脾脏中的mCD19+B细胞、mCD3+T细胞、hCD4+T细胞和hCD8+T细胞的细胞百分比。图16C提供了代表性流式细胞术分析的等高线图,并且图16D提供了VelociT和WT小鼠(n=4)中DN、DP、CD4 SP、CD8 SP细胞,以及发育的DN1、DN2、DN3和DN4胸腺细胞的细胞数目和比例。在该图中,VelociT=包含含有小鼠TCRBDJ1和TCRBDJ2非编码序列以及人TCRBDJ1和TCRBDJ2编码序列人源化TCRBDJ1和TCRBDJ2簇的TM I/II B C4/8小鼠;WT=野生型对照小鼠。
图17A-图17C提供了TM I/II B C4/8小鼠的中央区室和外周区室中的淋巴细胞分布和表型分析。图17A提供了VelociT小鼠和WT小鼠脾脏中的泛CD3+T细胞、辅助CD4+T细胞、细胞毒性CD8+T细胞和CD19+B细胞的总数(n=4,平均值+/-SD)。图17B提供了VelociT小鼠和WT小鼠的血清IgG和IgM水平。图17C提供了脾脏中CD3+CD4+和CD3+CD8+原初、中央记忆和效应记忆T细胞亚群的代表性流式细胞术等高线图和百分比(n=4)。在该图中,VelociT=包含含有小鼠TCRBDJ1和TCRBDJ2非编码序列以及人TCRBDJ1和TCRBDJ2编码序列人源化TCRBDJ1和TCRBDJ2簇的TM I/II B C4/8小鼠;WT=野生型对照小鼠。
图18A-图18B提供了显示TM I/II B C4/8小鼠发展出Treg的数据。图18A描绘了CD3+CD4+FoxP3+Treg的代表性流式细胞术分析,并且图18B描绘了VelociT小鼠和WT小鼠的脾脏(上图)和胸腺(下图)中的Treg百分比(n=4)。在该图中,VelociT=包含含有小鼠TCRBDJ1和TCRBDJ2非编码序列以及人TCRBDJ1和TCRBDJ2编码序列的人源化TCRBDJ1和TCRBDJ2簇的TM I/II B C4/8小鼠;WT=野生型对照小鼠。
图19A-图19B提供了显示在TM I/II B C4/8小鼠中存在NK细胞的数据。图19A提供了用于检测VelociT小鼠和WT小鼠脾脏中NK(CD19-CD3-NKp46+)和NKT(CD19-CD3+NKp46+)群体的流式细胞术门控策略,并且图19B提供了所有VelociT小鼠或WT小鼠的百分比和总计数(n=4)。在该图中,VelociT=包含含有小鼠TCRBDJ1和TCRBDJ2非编码序列以及人TCRBDJ1和TCRBDJ2编码序列人源化TCRBDJ1和TCRBDJ2簇的TM I/II B C4/8小鼠;WT=野生型对照小鼠。
图20A-图20D(i-ii)提供了显示TM I/II B C4/8小鼠中的正常骨髓细胞和抗原呈递细胞的数据。图20A提供了VelociT小鼠和WT小鼠(n=4)脾脏中指示的骨髓细胞群总量的百分比和数目。图20B提供了CD19+B细胞上的人MHC I和II分子的表面表达。图20C提供了肾上皮细胞(KEC)-/+小鼠IFN-γ处理中的人MHC I表达。图20D说明了保存的骨髓细胞区室并且提供了限定(图20Di)WT小鼠或(图20Dii)VelociT小鼠脾脏中的骨髓细胞群体的门控策略。在该图中,VelociT=包含含有小鼠TCRBDJ1和TCRBDJ2非编码序列以及人TCRBDJ1和TCRBDJ2编码序列人源化TCRBDJ1和TCRBDJ2簇的TM I/II B C4/8小鼠;WT=野生型对照小鼠。
图21A-图21D提供了包含小鼠TCRBDJ1和TCRBDJ2非编码序列及人TCRBDJ1和TCRBDJ2编码序列的TM I/II B C4/8小鼠(N=3)中原初CD4+脾脏T细胞的TCRβ(图21A、图21B)和TCRα(图21C、图21D)中的V和J基因使用频率。基因区段根据其在人类染色体上相对于其恒定区从远端到近端的位置在x轴上从左到右排列。误差条表示单个样品的SEM。
图22A-图22D提供了对急性和慢性LCMV感染的TM I/II B C4/8CD8应答。在图22A中,用LCMV Armstrong(2e5 FFU,IP)感染TM I/II B C4/8和B6小鼠,在指示的时间点处死,并通过荧光聚焦测定(FFA)分析脾脏的LCMV病毒滴度。在图22B中,在TM I/II B C4/8和B6小鼠中通过用LCMV CL13(5e6 FFU,IV)感染建立慢性感染。感染后第21天处死小鼠,并通过FFA分析脾脏的LCMV病毒滴度。在图22C中,通过流式细胞术分析来自d21 CL13感染的和原初的TM I/II B C4/8小鼠的CD8+T细胞的耗竭标志物PD1、LAG3和TIM3。在图22D中,LCMV免疫小鼠(LCMV Armstrong 2e5 FFU,IP)在初次感染后17天用高剂量的LCMV CL13(5e6 FFU,IV)再次攻击。在CL13攻击后第14天,通过FFA分析脾脏的LCMV滴度。在该图中,TM I/II BC4/8小鼠包含含有小鼠TCRBDJ1和TCRBDJ2非编码序列以及人TCRBDJ1和TCRBDJ2编码序列人源化TCRBDJ1和TCRBDJ2簇;
图23A-图23B显示TM I/II B C4/8小鼠对LCMV产生CD8 T细胞应答。在图23A中,通过IFN-γICS分析来自LCMV Armstrong感染的VelociT和B6 WT对照的CD8+T细胞对对照和LCMV特异性CD8肽的反应性。显示了分别用LCMV HLA-A2 Z49或H2Db GP33肽刺激的d14LCMV感染的VelociT小鼠(上)或B6小鼠(下)的脾细胞的代表性流式细胞IFNγICS分析。图23B提供了来自VelociT小鼠(上)和B6小鼠(下)的CD8+T细胞在指示的时间点(n=3-5只小鼠/天)对H2Kb ova257、H2Db LCMV GP33、HLA-A2 LCMV NP69、HLA-A2 GPC10、HLA-A2 GPC447和HLA-A2 Z49的肽反应性的汇总。在该图中,VelociT=包含含有小鼠TCRBDJ1和TCRBDJ2非编码序列以及人TCRBDJ1和TCRBDJ2编码序列人源化TCRBDJ1和TCRBDJ2簇的TM I/II B C4/8小鼠;WT=野生型对照小鼠。
图24A-图24C显示TM I/II B C4/8小鼠响应于MOG35-55肽免疫发展出EAE。图24A提供了用在CFA中乳化的MOG35-55肽免疫的C57Bl/6小鼠和VelociT小鼠的临床EAE评分。图24B和图24C分别提供了来自在10μg/ml的MOG35-55肽或媒介物DMSO的存在下培养24小时(图24B)或48小时(图24C)的MOG35-55免疫小鼠的脾细胞的IFN-γ和IL-17A ELISspot测定的数据。数据呈现为来自单个小鼠脾细胞的斑点形成细胞的平均值±S.E.M(A)和平均值±S.D,从三份培养物(B-C)中获得。对于所有图,n=6-7只小鼠分别来自C57Bl/6小鼠和VelociT小鼠的一个实验。在该图中,VelociT=包含含有小鼠TCRBDJ1和TCRBDJ2非编码序列以及人TCRBDJ1和TCRBDJ2编码序列人源化TCRBDJ1和TCRBDJ2簇的TM I/II B C4/8小鼠。
具体实施方式
本文公开了非人动物(例如啮齿动物,例如小鼠或大鼠),这些非人动物经基因工程改造以表达人源化T细胞辅助受体(例如,人源化CD4和/或CD8(例如,CD8α和/或CD8β))、结合人源化T细胞辅助受体的人或人源化主要组织相容性复合物(MHC)(例如,人或人源化MHC II(例如,MHC IIα和/或MHC IIβ链)和/或MHC I(例如,MHC Iα)和任选地人或人源化β2微球蛋白)和/或人或人源化T细胞受体(TCR),以及公开了表达它们的胚胎、组织和细胞。本文公开的非人动物的免疫系统的细胞臂的发育与对照动物相当,例如,胸腺和脾脏包含相似绝对数目的胸腺细胞和CD3+细胞。这与修饰为包含人TCR(α和β)和嵌合人/小鼠MHC I分子的其他非人动物形成鲜明对比,参见,例如,Li(2010)Nature Medicine 16:1029-1035和补充材料。不仅与野生型对照动物相比,而且与仅用人TCR修饰的动物和仅用嵌合人/小鼠MHC I分子修饰的动物相比,此类动物都显示出T细胞群的减少,同上。因此,本文提供了经工程改造以共表达人源化CD4辅助受体和人源化MHC II和/或人源化CD8辅助受体和人源化MHC I以及任选地人源化TCR的非人动物。还提供了产生基因工程改造的动物的方法,该基因工程改造的动物表达至少一种人源化T细胞辅助受体(例如,人源化CD4和/或CD8)、至少一种与人源化T细胞辅助受体缔合的人源化MHC(例如,分别与人源化CD4和/或CD8缔合的人源化MHC II和/或MHC I)和/或人源化TCR。还提供了使用所述基因工程改造的动物用于开发人类治疗剂的方法,所述基因工程改造的动物产生基本上人源化的T细胞免疫应答。
基本上人源化的T细胞免疫应答
本文公开了经基因修饰以产生基本上人源化的T细胞免疫应答的非人动物。本文公开的小鼠表达至少一种人或人源化T细胞辅助受体、至少一种能够与该至少一种人或人源化T细胞辅助受体缔合的人或人源化主要组织相容性复合物(MHC)和/或人或人源化T细胞受体(TCR),该人或人源化T细胞受体优选能够识别在与人或人源化T细胞辅助受体缔合的人或人源化MHC的背景下呈递的抗原并且向非人细胞,例如表达人或人源化TCR的非人T细胞提供激活信号。人或人源化T细胞辅助受体、人或人源化TCR和/或人或人源化MHC可由非人动物的基因组编码。在优选的实施方案中,在用抗原免疫后,非人动物向源自人TCR基因区段,例如人TCRαV区段、人TCRαJ区段、人TCRβV区段、人TCRβD区段和/或人TCRβJ区段的TCR呈递抗原的HLA限制性表位。
因此,本发明涵盖基因修饰的非人动物,其基因组包含(例如,在内源基因座处)编码人源化T细胞辅助受体多肽(例如,CD4或CD8多肽)的核苷酸序列,其中嵌合T细胞辅助受体多肽包含本文所述的氨基酸序列的保守性氨基酸取代和/或编码与人源化T细胞辅助受体多肽缔合的人源化MHC多肽的核酸序列,其中人源化MHC多肽包含本文所述的氨基酸序列的保守性氨基酸取代。
保守性氨基酸取代包括氨基酸残基被具有相似化学特性(例如,电荷或疏水性)的侧链R基团的另一氨基酸残基取代。保守性氨基酸取代可以通过修饰核苷酸序列以便引入将会编码保守性取代的核苷酸变化来实现。一般而言,保守性氨基酸取代不会显著改变蛋白质的目标功能特性,例如,CD4或CD8分别与MHC II或MHC I缔合(例如结合)的能力,并且可以例如增加TCR对MHC呈递的抗原的敏感性。具有相似化学特性的侧链的氨基酸组的实例包括脂族侧链,诸如甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;脂族羟基侧链,诸如丝氨酸和苏氨酸;含酰胺的侧链,诸如天冬酰胺和谷氨酰胺;芳族侧链,诸如苯丙氨酸、酪氨酸和色氨酸;碱性侧链,诸如赖氨酸、精氨酸和组氨酸;酸性侧链,诸如天冬氨酸和谷氨酸;以及含硫侧链,诸如半胱氨酸和甲硫氨酸。保守性氨基酸取代基团包括例如缬氨酸/亮氨酸/异亮氨酸、苯丙氨酸/酪氨酸、赖氨酸/精氨酸、丙氨酸/缬氨酸、谷氨酸/天冬氨酸和天冬酰胺/谷氨酰胺。在一些实施方案中,保守性氨基酸取代可以是蛋白质中的任何天然残基被丙氨酸取代,例如丙氨酸扫描诱变中所用。在一些实施方案中,进行保守性取代,其在特此通过引用并入的Gonnet等人((1992)Exhaustive Matching of the Entire Protein SequenceDatabase,Science 256:1443-45)公开的PAM250对数似然矩阵中具有正值。在一些实施方案中,取代是适度保守性取代,其中取代在PAM250对数似然矩阵中具有非负值。
本领域技术人员将理解,除了编码本文所述的人源化T细胞辅助受体多肽、人源化MHC多肽和/或TCR可变区的核酸残基以外,由于遗传密码的简并性,其他核酸也可以编码本发明的多肽。因此,除了在其基因组中包含编码人源化T细胞辅助受体多肽(例如,CD4或CD8多肽)的核苷酸序列、包含未重排的人基因区段的未重排的T细胞受体可变基因的基因座(例如,TCRα和/或TCRβ)和/或编码能够与具有保守性氨基酸取代的人源化T细胞辅助受体多肽缔合的人源化MHC多肽的核酸序列的基因修饰的非人动物以外,还提供了一种非人动物,其基因组由于遗传密码的简并性还包含不同于本文所述的编码人源化T细胞辅助受体多肽(例如,CD4或CD8多肽)的核苷酸序列、包含未重排的人基因区段的未重排的T细胞受体可变基因的基因座(例如,TCRα和/或TCRβ),和/或编码能够与人源化T细胞辅助受体多肽缔合的人源化MHC多肽的核酸序列。
序列的同一性可以通过本领域已知的可用于测量核苷酸和/或氨基酸序列同一性的多种不同算法来确定。在本文所述的一些实施方案中,使用ClustalW v.1.83(慢)比对来确定同一性,该比对采用10.0的开放空位罚分、0.1的延伸空位罚分,并使用Gonnet相似性矩阵(MacVectorTM10.0.2,MacVector Inc.,2008)。相对于序列同一性而言,序列的长度将取决于特定的序列。在各种实施方案中,通过比较成熟蛋白从其N端到其C端的序列来确定同一性。在各种实施方案中,将嵌合人/非人序列与人序列进行比较时,嵌合人/非人序列的人部分(而不是非人部分)用于进行比较,以确定人序列与嵌合人/非人序列的人部分之间的同一性水平(例如,将嵌合人/小鼠蛋白的人胞外域与人蛋白的人胞外域进行比较)。
关于序列(例如,核苷酸序列或氨基酸序列)的术语“同源性”或“同源的”意指两条序列,在最佳比对和比较后,它们在例如至少约75%的核苷酸或氨基酸,例如至少约80%的核苷酸或氨基酸,例如至少约90-95%的核苷酸或氨基酸,例如大于97%的核苷酸或氨基酸中是相同的。本领域技术人员将理解,为了最佳基因靶向,靶向构建体应含有与内源DNA序列同源的臂(即,“同源臂”);因此,可以在靶向构建体和靶向内源序列之间发生同源重组。
术语“可操作地连接”是指并置,其中这样描述的组分处于溶于它们以其预期方式发挥功能的关系。因此,编码蛋白质的核酸序列可以可操作地连接至调控序列(例如,启动子、增强子、沉默子序列等)以便保持正确的转录调控。另外,本发明的嵌合或人源化蛋白质的不同部分可以可操作地连接,以保持细胞中蛋白质的正确折叠、加工、靶向、表达和其他功能特性。除非另有说明,否则本发明的嵌合或人源化蛋白质的各种结构域彼此可操作地连接。
关于基因置换的术语“置换”是指将外源遗传物质放置在内源基因的基因座处,从而用直系同源或同源核酸序列置换整个或一部分内源基因。如以下实施例所示,在一个实施方案中,编码小鼠CD4或CD8(CD8α和/或CD8β)多肽的部分的内源基因座的核酸序列分别被编码人CD4或CD8(CD8α和/或CD8β)多肽的部分的核苷酸序列置换。
如本文所用的“功能性”,例如关于功能性多肽,是指保持至少一种通常与天然蛋白质相关的生物活性的多肽。例如,在本发明的一些实施方案中,内源基因座的置换(例如,内源非人CD4或CD8基因座的置换)产生不能表达功能性内源多肽的基因座。
人源化T细胞辅助受体
本文公开了表达至少一种人或人源化T细胞辅助受体,例如CD4、CD8α和/或CD8β的非人动物。因此,本文公开的非人动物包含第一核苷酸序列、第二核苷酸序列和/或第三核苷酸序列中的至少一种,每一种核苷酸序列编码不同的人或嵌合人/非人T细胞辅助受体多肽,所述多肽选自人或人源化CD4多肽、人或人源化CD8α多肽和人或人源化CD8β多肽。本文第一名称、第二名称、第三名称的使用不应解释为将本文公开的非人动物限制为需要所有三种核苷酸序列或存在任何顺序的任何辅助受体核苷酸序列。因此,如本文公开的非人动物可包含编码人或人源化CD4和/或人或人源化CD8(例如,人或人源化CD8α和/或CD8β)多肽的一种或多种核酸序列。
在一个实施方案中,如本文公开的非人动物包含编码人或人源化CD4多肽的第一核苷酸序列。在另一个实施方案中,如本文公开的非人动物包含编码人或人源化CD8α多肽的第一核苷酸序列和编码人或人源化CD8β多肽的第二核苷酸序列。在另一个实施方案中,如本文公开的非人动物包含编码人或人源化CD8α和CD8β多肽的第一核苷酸序列和第二核苷酸序列并且还包含编码人或人源化CD4多肽的第三核苷酸序列。
人或人源化CD4
在各种实施方案中,本发明总体上提供了基因修饰的非人动物,在其基因组中,例如在内源CD4基因座处,包含编码人或人源化CD4多肽的核苷酸序列;因此,动物表达人或人源化CD4多肽。
人CD4基因位于第12号染色体并且被认为含有10个外显子。CD4基因编码具有由该基因的外显子2和3编码的氨基端疏水信号序列的蛋白质。该蛋白质包含四个胞外免疫球蛋白样结构域,Ig1-Ig4,通常也分别称为D1-D4结构域。Maddon等人(1987)Structure andexpression of the human and mouse T4 genes,Proc.Natl.Acad.Sci.USA 84:9155-59。据信D1结构域由外显子3(信号肽下游的序列)和外显子4编码,而D2、D3和D4分别由独立的外显子--各自分别为外显子5、6和7编码(参见图5A:D1、D2、D3和D4结构域分别由命名为Ig1、Ig2、Ig3和Ig4的序列编码)。Littman(1987)The Structure of the CD4 and CD8Genes,Ann.Rev.Immunol.5:561-84;Hanna等人(1994)Specific Expression of theHuman CD4 Gene in Mature CD4+CD8-and Immature CD4+CD8+T cells and inMacrophages of Transgenic Mice,Mol.Cell.Biol.14(2):1084-94;Maddon等人,见上文。在高蛋白质浓度的区域,诸如T细胞和抗原呈递细胞之间的接触区域,分子倾向于通过相对的D4结构域之间的相互作用而同源二聚化。Zamoyska(1998)CD4 and CD8:modulators ofT cell receptor recognition of antigen and of immune responses?Curr.Opin.Immunol.10:82-87;Wu等人(1997)Dimeric association and segmentalvariability in the structure of human CD4,Nature 387:527;Moldovan等人(2002)CD4 Dimers Constitute the Functional Component Required for T CellActivation,J.Immunol.169:6261-68。
CD4的D1结构域类似于免疫球蛋白可变(V)结构域,并且与D2结构域的一部分一起,被认为与MHC II结合(缔合),例如在MHC II辅助受体结合位点。Huang等人(1997)Analysis of the contact sites on the CD4Molecule with Class II MHC Molecule,J.Immunol.158:216-25。反过来,MHC II在MHC IIα2和β2结构域之间连接处的疏水裂隙处与T细胞辅助受体CD4相互作用。Wang和Reinherz(2002)Structural Basis of T CellRecognition of Peptides Bound to MHC Molecules,Molecular Immunology,38:1039-49。
据信CD4辅助受体的结构域D3和D4与TCR-CD3复合物相互作用,因为这两个结构域的取代消除了CD4与TCR结合的能力。Vignali等人(1996)The Two Membrane ProximalDomains of CD4 Interact with the T Cell Receptor,J.Exp.Med.183:2097-2107。CD4分子作为二聚体存在,并且据信该分子的D4结构域中的残基负责CD4二聚化。Moldovan等人(2002)CD4 Dimers Constitute the Functional Components Required for T CellActivation,J.Immunol.169:6261-68。
CD4基因的外显子8编码跨膜结构域,而基因的其余部分编码胞质结构域。CD4胞质结构域具有许多不同的功能。例如,CD4的胞质结构域募集酪氨酸激酶Lck。Lck是一种Src家族激酶,它与CD4和CD8胞质结构域缔合并且辅助受体和TCR与相同的MHC同时结合导致TCR复合物的CD3和ζ链的酪氨酸磷酸化增加,进而导致在T细胞激活中起作用的其他因子的募集。Itano和同事已经提出,通过设计和测试包含CD8胞外结构域和CD4胞质尾的杂交蛋白在转基因小鼠中的表达,CD4的胞质尾也促进CD4+CD8+T细胞分化为CD4+谱系。Itano等人(1996)The Cytoplasmic Domain of CD4 Promotes the Development of CD4 Lineage TCells,J.Exp.Med.183:731-41。杂交蛋白的表达导致MHC I特异性CD4谱系T细胞的发育。同上。
CD4辅助受体似乎是HIV病毒的主要受体,CD4+T细胞的消耗是疾病进展的指标。在HIV诱导的凋亡中,CD4的胞质尾似乎是向CD4+T细胞传递凋亡信号所必需的。具体来说,经证实CD4和Lck的相互作用会加强这些细胞中HIV诱导的凋亡。Corbeil等人(1996)HIV-induced Apoptosis Requires the CD4 Receptor Cytoplasmic Tail and IsAccelerated by Interaction of CD4 with p56lck,J.Exp.Med.183:39-48。
T细胞在胸腺中发育,从不成熟的CD4-/CD8-(双阴性或DN)胸腺细胞进展为CD4+/CD8+(双阳性或DP)胸腺细胞,最终经历阳性选择成为CD4+或CD8+(单阳性或SP)T细胞。通过MHC I限制性TCR接收信号的DP胸腺细胞分化成CD8+T细胞,而通过MHC II限制性TCR接收信号的DP胸腺细胞分化成CD4+T细胞。DP细胞接收的导致其分化成CD4+或CD8+T细胞的暗示已经成为许多研究的主题。已经提出了CD4/CD8谱系选择的各种模型,并在Singer等人(2008)Lineage fate and intense debate:myths,models and mechanisms of CD4-versusCD8-lineage choice,Nat.Rev.Immunol.8:788-801中进行了综述。
由于阳性选择引起的特定T细胞辅助受体的失活是转录调控的产物。对于CD4,已经证实位于CD4外显子1上游13kb的增强子上调CD4+和CD8+T细胞中的CD4表达。Killeen等人(1993)Regulated expression of human CD4 rescues helper T cell developmentin mice lacking expression of endogenous CD4,EMBO J.12:1547-53。位于鼠CD4基因第一内含子内的顺式作用转录沉默子起到使CD4+T细胞以外的细胞中的CD4表达沉默的作用。Siu等人(1994)A transcriptional silencer control the developmentalexpression of the CD4 gene,EMBO J.13:3570-3579。
因为控制CD4谱系选择的重要转录调控因子(诸如启动子、增强子、沉默子等)在先前开发的表达人CD4的转基因小鼠的几个品系中缺失,这些小鼠不能再现正常的T细胞谱系发育,并产生除表达CD4的CD4+T细胞之外的免疫细胞。参见,例如,Law等人(1994)HumanCD4 Restores Normal T Cell Development and Function in Mice Deficient in CD4,J.Exp.Med.179:1233-42(CD4 expression in CD8+T cells and B cells);Fugger等人(1994)Expression of HLA-DR4 and human CD4 transgenes in mice determines thevariable regionβ-chain T-cell repertoire and mediates an HLA-D-restrictedimmune response,Proc.Natl.Acad.Sci.USA,91:6151-55(CD4 expressed on all CD3+thymocytes and B cells)。因此,在一个实施方案中,开发保留内源小鼠启动子和/或其他调控元件的基因修饰的动物可能是有益的,以便动物产生能够经历T细胞发育和谱系选择的T细胞。
因此,在各种实施方案中,本发明提供了一种基因修饰的非人动物,例如在其内源T细胞辅助受体基因座(例如CD4基因座)处包含编码嵌合人/非人T细胞辅助受体多肽的核苷酸序列。在一个实施方案中,嵌合多肽的人部分包含人T细胞辅助受体的整个或基本上整个胞外部分(或其一部分,例如一个或多个胞外结构域,例如至少两个连续的胞外结构域)。在一个实施方案中,嵌合多肽的非人部分包含非人T细胞辅助受体的跨膜结构域和胞质结构域。在一个实施方案中,非人动物表达功能性嵌合T细胞辅助受体多肽。因此,在一个方面,本发明提供了一种基因修饰的非人动物,在其内源CD4基因座处包含编码嵌合人/非人CD4多肽的核苷酸序列,其中该嵌合多肽的人部分包含人CD4的整个或基本上整个胞外部分,其中非人部分至少包含非人CD4的跨膜结构域和胞质结构域,并且其中该动物表达功能性嵌合CD4多肽。在一个方面,该非人动物仅表达人源化CD4多肽,即嵌合人/非人CD4多肽,并且不会从其内源CD4基因座表达功能性内源非人CD4蛋白。
在一个实施方案中,嵌合人/非人CD4多肽的人部分包含人CD4多肽的整个或基本上整个胞外部分。在另一个实施方案中,嵌合人/非人CD4多肽的人部分至少包含人CD4多肽的整个或基本上整个MHC II结合结构域(例如,人D1和D2结构域的相当大的部分);在一个实施方案中,嵌合人/非人CD4多肽的人部分包含人CD4多肽的D1结构域、D2结构域和D3结构域中的全部或基本上全部;在另一个实施方案中,嵌合人/非人CD4多肽的人部分包含CD4的免疫球蛋白样结构域(例如称为D1、D2、D3和D4的结构域)中的全部或基本上全部。在另一个实施方案中,嵌合人/非人CD4多肽的人部分在其人部分中包含负责与MHC II和/或T细胞受体的胞外部分相互作用的整个或基本上整个人CD4序列。在另一个实施方案中,嵌合人/非人CD4多肽的人部分包含负责与MHC II和/或T细胞受体的可变结构域相互作用的人CD4的整个或基本上整个胞外部分。因此,在一个实施方案中,编码嵌合CD4多肽的人部分的核苷酸序列包含人CD4的D1-D2结构域的整个或基本上整个编码序列(例如,人CD4基因的外显子3和外显子4-5的一部分);在另一个实施方案中,它包含人CD4的D1-D3的整个或基本上整个编码序列(例如,人CD4的外显子3和外显子4-6的一部分)。因此,在一个实施方案中,编码嵌合人/非人CD4的核苷酸序列包含编码人CD4的所有或基本上所有D1-D3结构域的核苷酸序列。在另一个实施方案中,编码嵌合CD4多肽的人部分的核苷酸序列包含人CD4基因的D1-D4结构域的编码序列。在另一个实施方案中,该核苷酸序列可以包含编码小鼠CD4信号肽的核苷酸序列,例如由小鼠基因的外显子2-3的部分编码的区域。在另一个实施方案中,核苷酸序列可以包含编码人CD4信号肽的核苷酸序列。在一个实施方案中,嵌合人/非人CD4多肽包含SEQ ID NO:78中所示的氨基酸序列,并且嵌合多肽的人部分跨越SEQ ID NO:78的大约氨基酸27-319(在SEQ ID NO:79中单独示出)。
在一个实施方案中,该非人动物表达嵌合人/非人CD4多肽序列。在一个实施方案中,嵌合CD4序列的人部分包含一个或多个保守性或非保守性修饰。
在一个方面,提供了一种表达人CD4序列的非人动物,其中该人CD4序列与人CD4序列至少约85%、90%、95%、96%、97%、98%或99%相同。在一个具体实施方案中,该人CD4序列与实施例中描述的人CD4序列至少约90%、95%、96%、97%、98%或99%相同。在一个实施方案中,人CD4序列包含一个或多个保守性取代。在一个实施方案中,人CD4序列包含一个或多个非保守性取代。
在一些实施方案中,嵌合CD4的一部分(例如,人部分),可以包含基本上整个本文所示序列(例如,基本上整个本文所示的蛋白质结构域)。基本上整个序列通常包括85%、90%、95%、96%、97%、98%或99%的被认为表示蛋白质特定部分(例如,特定功能结构域等)的氨基酸。本领域技术人员将理解,功能性结构域的边界可以根据所使用的比对和结构域预测方法而略有不同。
在一个方面,嵌合人/非人CD4多肽的非人部分至少包含非人CD4多肽的跨膜结构域和胞质结构域。由于CD4胞质结构域提供的重要功能,在基因工程改造的动物中保留内源非人(例如,小鼠)序列确保了辅助受体的正确胞内信号传导和其他功能的保存。在一个实施方案中,非人动物是小鼠,并且非人CD4多肽是小鼠CD4多肽。尽管在实施例中描述了特定的小鼠CD4序列,但是任何源自其中的合适序列,例如包含保守性/非保守性氨基酸取代的序列,都涵盖在本文中。在一个实施方案中,嵌合CD4辅助受体的非人部分包含内源CD4的尚未人源化的任何序列。
本文所述的非人动物可在其内源基因座处包含编码嵌合人/非人CD4多肽的核苷酸序列。在一个方面,这导致内源CD4基因的一部分被编码人CD4多肽的一部分的核苷酸序列置换。在一个实施方案中,此类置换是编码例如非人CD4的整个或基本上整个胞外结构域的内源核苷酸序列,例如至少编码非人CD4的整个或基本上整个第一免疫球蛋白样结构域(即D1)的序列(例如,编码非人CD4的D1-D2结构域中的全部或基本上全部的序列,例如编码非人CD4的D1-D3结构域中的全部或基本上全部的序列,例如编码非人CD4的D1-D4结构域中的全部或基本上全部的序列)被编码整个或基本上整个胞外结构域的人核苷酸序列置换。在一个实施方案中,置换产生包含人CD4序列的嵌合蛋白,该序列负责与MHC II和/或T细胞受体的胞外部分相互作用。在另一个实施方案中,置换产生包含人CD4序列的嵌合蛋白,该序列负责与MHC II和/或T细胞受体的可变结构域相互作用。在一个实施方案中,置换不包括至少编码非人CD4多肽的跨膜结构域和胞质结构域的CD4序列的置换。因此,在一个方面,非人动物从内源非人CD4基因座表达嵌合的人/非人CD4多肽。在另一个实施方案中,置换产生包含SEQ ID NO:78所示的多肽序列的蛋白质。
在一个实施方案中,提供了本文所述的嵌合人/非人CD4基因座(例如,嵌合人/啮齿动物CD4基因座,例如,嵌合人/小鼠CD4基因座)的核苷酸序列。在一个方面,因为嵌合人/非人(例如人/啮齿动物,例如人/小鼠)CD4序列位于内源非人(例如啮齿动物,例如小鼠)CD4基因座处,所以它保留了位于第一CD4外显子上游的CD4增强子元件。在一个实施方案中,内源非人(例如啮齿动物,例如小鼠)CD4基因座处的置换包括置换例如编码D1的外显子3的一部分,以及编码CD4多肽的D1和D2-D3的其余部分的外显子4-6;因此,在一个方面,嵌合CD4基因座保留位于非人(例如,小鼠)CD4基因内含子1中的顺式作用沉默子。因此,在一个实施方案中,嵌合基因座保留内源非人(例如啮齿动物,例如小鼠)CD4启动子和调控元件。在另一个实施方案中,嵌合基因座可以含有人类启动子和调控元件,其程度允许正确的CD4表达、CD4+T细胞发育、CD4谱系选择和辅助受体功能。因此,在一些方面,本发明的动物包含不改变T细胞的正确谱系选择和发育的基因修饰。在一个方面,除了正常表达CD4的细胞之外,本发明的动物(例如啮齿动物,例如小鼠)不会在免疫细胞上表达嵌合CD4多肽。在一个方面,动物不会在B细胞或成熟CD8+T细胞上表达CD4。在一个实施方案中,置换导致保留允许空间和时间上正确调控CD4表达的元件。
在各种实施方案中,从本文所述的嵌合CD4基因座表达功能性嵌合CD4蛋白的非人动物(例如啮齿动物,例如小鼠或大鼠)在细胞表面,例如T细胞表面展示嵌合蛋白。在一个实施方案中,非人动物在细胞表面上以与在人类中观察到的相同的细胞分布表达嵌合CD4蛋白。在一个方面,本发明的CD4蛋白能够与第二细胞,例如抗原呈递细胞(APC)表面上表达的MHC II蛋白相互作用。
人或人源化CD8
在各种实施方案中,本发明总体上提供了基因修饰的非人动物,在其基因组中,例如在内源CD8基因座处,包含编码人或人源化CD8多肽的核苷酸序列;因此,动物表达人或人源化CD8多肽。在各种实施方案中,本发明提供了非人动物,在其基因组中,例如在内源CD8基因座处,包含编码人或人源化CD8α多肽的核苷酸序列和/或编码人或人源化CD8β多肽的核苷酸序列。因此,本发明的基因修饰的非人动物表达人或人源化CD8α和/或人或人源化CD8β多肽。
人CD8蛋白通常在细胞表面表达为两种多肽CD8α和CD8β的异二聚体,但是还已经检测到二硫键连接的同源二聚体和同源多聚体(例如,在NK细胞和肠γδT细胞中,它们表达CD8αα)。编码人CD8α和CD8β的基因彼此非常靠近地位于2号染色体上。Nakayama等人(1992)Recent Duplication of the Two Human CD8β-chain genes,J.Immunol.148:1919-27。CD8α蛋白包含前导肽、免疫球蛋白V样区、铰链区、跨膜结构域和细胞质尾。Norment等人(1989)Alternatively Spliced mRNA Encodes a Secreted Form ofHuman CD8α.Characterization of the Human CD8αgene,J.Immunol.142:3312-19。CD8α基因的外显子/内含子在图5B中示意性地描绘。
人CD8β基因位于2号染色体上CD8α基因的上游。已经报告了通过CD8β基因的选择性剪接产生的多种同种型,预计其中一种同种型缺乏跨膜结构域并产生分泌蛋白。Norment等人(1988)A second subunit of CD8 is expressed in human T cells,EMBO J.7:3433-39。CD8β基因的外显子/内含子在图5B中也示意性地描绘。
膜结合的CD8β蛋白含有N端信号序列,接着是免疫球蛋白V样结构域、短的胞外铰链区、跨膜结构域和胞质尾。参见,Litman(1987)The structure of the CD4 and CD8genes,Ann Rev.Immunol.5:561-84。铰链区是广泛糖基化的位点,认为该位点维持其构象并保护蛋白质免受蛋白酶裂解。Leahy(1995)A structural view of CD4 and CD8,FASEBJ.9:17-25。
CD8蛋白通常在细胞毒性T细胞上表达,并与MHC I分子相互作用。该相互作用是通过CD8与MHC I的α3结构域的结合介导的。尽管MHC I类与CD8的结合是TCR与MHC I类的结合的1/100,但是CD8结合增强TCR结合的亲和力。Wooldridge等人(2010)MHC Class IMolecules with Superenhanced CD8 Binding Properties Bypass the Requirementfor Cognate TCR Recognition and Nonspecifically Activate CTLs,J.Immunol.184:3357-3366。
CD8与MHC I类分子的结合是物种特异性的;经证实CD8的小鼠同源物Lyt-2结合H-2Dd分子的α3结构域,但它不结合HLA-A分子。Connolly等人(1988)The Lyt-2 MoleculeRecognizes Residues in the Class Iα3Domain in Allogeneic Cytotoxic T CellResponses,J.Exp.Med.168:325-341。差异性结合可能是由于在人和小鼠之间不保守的CD8上的CDR样决定簇(CDR1样和CDR2样决定簇)。Sanders等人(1991)Mutations in CD8thatAffect Interactions with HLA Class I and Monoclonal Anti-CD8Antibodies,J.Exp.Med.174:371-379;Vitiello等人(1991)Analysis of the HLA-restrictedInfluenza-specific Cytotoxic T Lymphocyte Response in Transgenic MiceCarrying a Chimeric Human-Mouse Class I Major Histocompatibility Complex,J.Exp.Med.173:1007-1015;以及Gao等人(1997)Crystal structure of the complexbetween human CD8ααand HLA-A2,Nature 387:630-634。已有报道称,CD8结合HLA-A2的α3结构域的保守性区域(在位置223-229处)。HLA-A中的单取代(V245A)减少CD8与HLA-A的结合,T细胞介导的裂解伴随大幅减少。Salter等人(1989),Polymorphismin theα3domain ofHLA-A molecules affects binding to CD8,Nature 338:345-348。一般来说,HLA-A分子的α3结构域的多态性也影响与CD8的结合。同上。在小鼠中,H-2Dd中残基227处的氨基酸取代影响小鼠Lyt-2与H-2Dd的结合,并且用突变H-2Dd转染的细胞不被CD8+T细胞裂解。Potter等人(1989)Substitution at residue 227of H-2class Imolecules abrogatesrecognition by CD8-dependent,but not CD8-independent,cytotoxic T lymphocytes,Nature 337:73-75。因此,人或人源化CD8的表达可能有益于研究T细胞对人或人源化MHC I呈递的抗原的应答。
与CD4类似,CD8的胞质结构域与酪氨酸激酶Lck相互作用,转而导致T细胞激活。尽管Lck好像与CD8α胞质结构域相互作用,但似乎这种相互作用受CD8β胞质结构域存在的调控,因为CD8β胞质结构域的突变或缺失导致CD8α相关Lck活性降低。Irie等人(1998)Thecytoplasmic domain of CD8βRegulates Lck Kinase Activation and CD8 T cellDevelopment,J.Immunol.161:183-91。Lck活性的降低与T细胞发育受损相关。同上。
CD8在适当细胞(例如细胞毒性T细胞)上的表达受到位于整个CD8基因座的多种增强子元件的严密调控。例如,已经在CD8基因座处鉴定了至少4个DNA酶I超敏区,这些区域通常与调控因子结合相关。Hosert等人(1997)A CD8 genomic fragment that directssubset-specific expression of CD8 in transgenic mice,J.Immunol.158:4270-81。自从在CD8基因座处发现这些DNA酶I超敏区以来,已经鉴定了至少5种增强子元件,遍布于CD8基因座,这些增强子元件调控各种谱系的T细胞中CD8α和/或β的表达,这些谱系包括DP、CD8SP T细胞或表达γδTCR的细胞。参见,例如,Kioussis等人(2002)Chromatin and CD4,CD8A,and CD8B gene expression during thymic differentiation,Nature Rev.2:909-919and Online Erratum;Ellmeier等人(1998)Multiple Development Stage-SpecificEnhancers Regulate CD8 Expression in Developing Thymocytes and in Thymus-Independent T cells,Immunity 9:485-96。
因此,类似于人或人源化CD4基因修饰动物源于保留内源CD4启动子和调控元件的益处,在一些实施方案中,在开发保留内源小鼠启动子和将会控制人或人源化CD8表达的调控元件的基因修饰的非人动物中可能是有益的。如本文所述,在产生包含用编码人或人源化CD8α和/或β蛋白质的序列置换编码CD8α和/或β蛋白质的内源非人序列的基因修饰的动物中可能有特别的益处。
在各种实施方案中,本发明提供了一种基因修饰的非人动物,在其基因组中,例如在其内源CD8基因座处,包含至少一个编码嵌合人/非人CD8多肽(例如CD8α和/或β多肽)的核苷酸序列,其中该多肽的人部分包含人CD8多肽(例如CD8α和/或β多肽)的整个或基本上整个胞外部分(或其一部分,例如胞外结构域),其中非人部分至少包含非人CD8(例如,CD8α和/或β)的跨膜结构域和胞质结构域,并且其中该动物表达嵌合CD8多肽(例如,CD8α和/或β多肽)。因此,在一个实施方案中,本发明提供了一种基因修饰的非人动物,在其内源非人CD8基因座处包含编码嵌合人/非人CD8α多肽的第一核苷酸序列和编码嵌合人/非人CD8β多肽的第二核苷酸序列,其中该第一核苷酸序列包含编码人CD8α多肽的整个或基本上整个胞外部分以及非人CD8α多肽的至少跨膜结构域和胞质结构域的序列,并且其中该第二核苷酸序列包含编码人CD8β多肽的整个或基本上整个胞外部分以及非人CDβ多肽的至少跨膜结构域和胞质结构域的序列,其中该动物表达功能性嵌合人/非人CD8蛋白。在一个方面,该非人动物仅表达人源化CD8多肽(例如,嵌合人/非人CD8α和/或β多肽),并且不会从内源CD8基因座表达相应的功能性非人CD8多肽。
在一个实施方案中,嵌合人/非人CD8α多肽在其人部分中包含人CD8α多肽的整个或基本上整个胞外部分。在一个实施方案中,嵌合CD8α多肽的人部分至少包含人CD8α多肽的MHC I结合结构域。在一个实施方案中,嵌合CD8α多肽的人部分包含人CD8α的至少整个或基本上整个免疫球蛋白V样结构域的序列。在一个实施方案中,编码嵌合CD8α多肽的人部分的核苷酸序列至少包含编码人CD8α多肽的胞外部分的外显子。在一个实施方案中,该核苷酸序列至少包含编码Ig V样结构域的外显子。在一个实施方案中,人CD8α多肽的胞外部分是涵盖非跨膜结构域或胞质结构域的多肽部分的区域。在一个实施方案中,编码嵌合人/非人CD8α多肽的核苷酸序列包含编码非人(例如啮齿动物,例如小鼠)CD8α信号肽的序列。可替代地,该核苷酸序列可以包含编码人CD8α信号序列的序列。在一个实施方案中,嵌合人/非人CD8α多肽包含SEQ ID NO:88中所示的氨基酸序列,并且嵌合多肽的人部分示于SEQ IDNO:88的氨基酸28-179(在SEQ ID NO:89中单独表示)。
类似地,在一个实施方案中,嵌合人/非人CD8β多肽在其人部分中包含人CD8β多肽的整个或基本上整个胞外部分。在一个实施方案中,嵌合CD8β多肽的人部分包含人CD8β的整个或基本上整个免疫球蛋白V样结构域的序列。在一个实施方案中,编码嵌合CD8β多肽的人部分的核苷酸序列至少包含编码人CD8β多肽的胞外部分的外显子。在一个实施方案中,编码嵌合人/非人CD8β多肽的人部分的核苷酸序列至少包含编码人CD8β的IgG V样结构域的外显子。在一个实施方案中,编码嵌合人/非人CD8β多肽的核苷酸序列包含编码非人(例如啮齿动物,例如小鼠)CD8β信号肽的序列。可替代地,该核苷酸序列可以包含编码人CD8β信号序列的序列。在一个实施方案中,嵌合人/非人CD8β多肽包含SEQ ID NO:83中所示的氨基酸序列,并且嵌合多肽的人部分示于SEQ ID NO:83的氨基酸15-165(在SEQ ID NO:84中单独表示)。
在一个实施方案中,该非人动物表达嵌合人/非人CD8α和/或CD8β多肽。在一些实施方案中,嵌合人/非人CD8α和/或β多肽的人部分包含一个或多个保守性或非保守性修饰。
在一个方面,提供了表达人CD8α和/或β多肽序列的非人动物,其中人CD8α和/或β多肽序列分别与人CD8α和/或β多肽序列至少约85%、90%、95%、96%、97%、98%或99%相同。在一个具体实施方案中,人CD8α和/或β多肽序列与实施例中描述的相应人CD8α和/或β多肽序列至少约90%、95%、96%、97%、98%或99%相同。在一个实施方案中,人CD8α和/或β多肽序列包含一个或多个保守性取代。在一个实施方案中,人CD8α和/或β多肽序列包含一个或多个非保守性取代。
在一些实施方案中,嵌合CD8的一部分(例如,人部分),可以包含基本上整个本文所示序列(例如,基本上整个本文所示的蛋白质结构域)。基本上整个序列通常包括85%、90%、95%、96%、97%、98%或99%的被认为表示蛋白质特定部分(例如,特定功能结构域等)的氨基酸。本领域技术人员将理解,功能性结构域的边界可以根据所使用的比对和结构域预测方法而略有不同。
在一个方面,嵌合人/非人CD8α和/或β多肽的非人部分至少分别包含非人CD8α和/或β多肽的跨膜结构域和/或胞质结构域。由于CD8胞质结构域提供的重要功能,在基因工程改造的动物中保留内源非人(例如,小鼠)序列确保了辅助受体的正确胞内信号传导和其他功能的保存。在一个实施方案中,非人动物是小鼠,并且非人CD8α和/或β多肽分别是小鼠CD8α和/或β多肽。尽管在实施例中描述了特定的小鼠CD8α和β序列,但是任何源自其中的合适序列,例如包含保守性/非保守性氨基酸取代的序列,都涵盖在本文中。在一个实施方案中,非人动物(例如啮齿动物,例如小鼠)保留任何尚未人源化的内源序列。
本文所述的非人动物可在其内源基因座处包含编码嵌合人/非人CD8α和/或β多肽的核苷酸序列。在一个方面,这导致内源CD8α基因的一部分被编码人CD8α多肽的一部分的核苷酸序列置换,和/或内源CD8β基因的一部分被编码人CD8β多肽的一部分的核苷酸序列置换。在一个实施方案中,此类置换是编码非人CD8α和/或β的整个或基本上整个胞外部分的内源核苷酸序列被具有编码整个或基本上整个胞外部分的人核苷酸序列的人类核苷酸置换。在一个实施方案中,此类置换是编码非人CD8α和/或β的至少整个或基本上整个免疫球蛋白V样结构域的序列被编码至少整个或基本上整个免疫球蛋白V样结构域的人核苷酸序列置换。在一个实施方案中,置换不包括编码非人CD8α和/或β多肽的跨膜结构域和胞质结构域的CD8α和/或β序列的置换。因此,非人动物从内源非人CD8基因座表达嵌合人/非人CD8α和/或β多肽。在另一个实施方案中,置换产生分别包含SEQ ID NO:88和/或84中所示的多肽序列的CD8α和/或β蛋白。
在一个实施方案中,提供了嵌合人/非人CD8基因座(例如,嵌合啮齿动物CD8基因座,例如,嵌合小鼠CD8基因座)的核苷酸序列。在一个方面,因为嵌合人/非人(例如人/啮齿动物,例如人/小鼠)CD8α和/或β序列位于相应的内源非人(例如啮齿动物,例如小鼠)CD8α和/或β基因座处,它保留了内源CD8α和/或β启动子和调控元件。在另一个实施方案中,嵌合基因座可以含有人CD8α和/或β启动子和调控元件,其程度允许CD8α和/或β正确表达(正确的空间和时间蛋白质表达)、CD8+T细胞发育、CD8谱系选择和辅助受体功能。因此,在一个方面,本发明的动物包含不改变T细胞的正确谱系选择和发育的基因修饰。在一个方面,本发明的动物(例如啮齿动物,例如小鼠)不会在除了正常表达CD8的细胞以外的免疫细胞上表达嵌合CD8蛋白,例如,动物不会在B细胞或成熟CD4+T细胞上表达CD8。在一个实施方案中,置换导致保留允许空间和时间上正确调控CD8α和/或β表达的元件。
在各种实施方案中,从本文所述的嵌合CD8基因座表达功能性嵌合CD8蛋白(例如,CD8αβ或CD8αα)的非人动物(例如啮齿动物,例如小鼠或大鼠)在细胞表面展示嵌合蛋白。在一个实施方案中,非人动物在细胞表面上以与在人类中观察到的相同的细胞分布表达嵌合CD8蛋白。在一个方面,本发明的CD8蛋白能够与第二细胞表面表达的MHC I蛋白相互作用。
人或人源化T细胞受体
本文公开了包含基本上人源化的T细胞免疫系统的基因修饰的非人动物。在一些实施方案中,如本文公开的非人动物,例如在其基因组中,包含(a)编码嵌合人/非人T细胞辅助受体的核苷酸序列,其中嵌合T细胞辅助受体多肽的人部分由编码人T细胞辅助受体胞外结构域的序列编码,并且其中编码人T细胞辅助受体胞外结构域的序列可操作地连接至包含编码非人T细胞辅助受体跨膜结构域和/或胞质结构域的序列的核苷酸;(b)未重排的T细胞受体(TCR)可变基因区,该可变基因区包含至少一个人V区段、任选地至少一个人D区段和至少一个人J区段,其中TCR可变区基因的未重排的V区段、任选D区段和J区段可以重组形成可操作地连接至非人TCR恒定基因序列的重排基因;和(c)编码嵌合人/非人MHC多肽的核酸序列,其中嵌合MHC多肽的人部分包含与嵌合T细胞辅助受体多肽的人部分缔合的人MHC多肽的胞外结构域。任选地,非人动物还包含人或人源化β2微球蛋白多肽。
因此,在各种实施方案中,本发明通常提供基因修饰的非人动物,其中非人动物在基因组中包含未重排的人源化TCR可变基因的基因座,例如,未重排的人TCR可变基因区,该可变基因区包含能够重组形成重排的TCR可变基因序列的人TCR可变区段。如本文所用,TCR基因座或TCR基因的基因座(例如,TCRα基因座或TCRβ基因座)是指包含TCR编码区的基因组DNA,该TCR编码区包括整个TCR编码区,包括未重排的V(D)J序列、增强子序列、恒定序列及任何上游或下游(UTR、调控区等)或插入DNA序列(内含子等)。TCR可变基因座、TCR可变区或TCR可变基因的基因座(例如,TCRα可变基因的基因座或TCRβ可变基因的基因座),是指包括TCR可变区区段(V(D)J区)但不包括TCR恒定序列,并且在各种实施方案中,不包括增强子序列的基因组DNA。出于遗传操纵的目的,TCR可变基因的基因座中可包括其他序列(例如,选择盒、限制性位点等),并且这些都在本文中涵盖。
T细胞结合抗原呈递细胞表面的小抗原决定簇上的表位,这些抗原呈递细胞与主要组织相容性复合物(MHC;在小鼠中)或人白细胞抗原(HLA;在人类中)缔合。T细胞通过T细胞表面的T细胞受体(TCR)复合物结合这些表位。T细胞受体是由两种类型的链组成的异二聚体结构:α(alpha)链和β(beta)链,或γ(gamma)链和δ(delta)链。α链由位于α基因座内(在人或小鼠14号染色体上)的核酸序列编码,该核酸序列也涵盖整个δ基因座,并且β链由位于β基因座内(在小鼠6号染色体或人7号染色体上)的核酸序列编码。大多数T细胞具有αβTCR;而少数T细胞带有γδTCR。TCR与MHC I类(呈递至CD8+T细胞)和MHC II类(呈递至CD4+T细胞)分子的相互作用示于图1(闭合符号表示非人序列;条纹符号表示人序列,显示了本发明TCR蛋白的一个特定实施方案)。
T细胞受体α和β多肽(以及类似地γ和δ多肽)经由二硫键相互连接。构成TCR的两种多肽中的每一种都含有包含恒定区和可变区的胞外结构域、跨膜结构域和胞质尾(跨膜结构域和胞质尾也是恒定区的一部分)。TCR的可变区决定其抗原特异性,并且与免疫球蛋白相似,包含三个互补决定区(CDR)。也与免疫球蛋白基因相似,T细胞受体可变基因的基因座(例如,TCRα和TCRβ基因座)包含许多未重排的V(D)J区段(可变(V)区段、连接(J)区段以及在TCRβ和δ中,包含多样性(D)区段)。在胸腺中的T细胞发育期间,TCRα可变基因的基因座经历重排,使得所产生的TCRα链由VJ区段(Vα/Jα序列)的特定组合编码;并且TCRβ可变基因的基因座经历重排,使得所产生的TCRβ链由VDJ区段(Vβ/Dβ/Jβ序列)的特定组合编码。
与胸腺基质的相互作用触发胸腺细胞经历几个发育阶段,其特征在于表达各种细胞表面标志物。表1中呈现了胸腺中不同发育阶段的特征性细胞表面标志物的汇总。TCRβ可变基因的基因座处的重排在DN2阶段开始并且在DN4阶段期间结束,而TCRα可变基因的基因座的重排发生在DP阶段。TCRβ基因座重排完成后,细胞在细胞表面表达TCRβ链以及替代α链pTα。参见,Janeway的Immunobiology,第7章,第7版Ed,Murphy等人编辑,Garland Science,2008。
表1:胸腺中T细胞的发育阶段
原初CD4+和CD8+T细胞离开胸腺并进入外周淋巴器官(例如,脾脏),在那里它们暴露于抗原并且被激活以克隆性扩增并分化成许多效应T细胞(Teff),例如细胞毒性T细胞、TREG细胞、TH17细胞、TH1细胞、TH2细胞等。感染后,许多T细胞作为记忆T细胞存在,并且分类为中央记忆T细胞(Tcm)或效应记忆T细胞(Tem)。Sallusto等人(1999)Two subsets ofmemory T lymphocytes with distinct homing potentials and effector functions,Nature 401:708-12and Commentary by Mackay(1999)Dual personality of memory Tcells,Nature 401:659-60。Sallusto和同事提出,在初始感染后,Tem细胞代表在外周组织中具有效应子功能的容易获得的抗原致敏的记忆T细胞库,而Tcm细胞代表外周淋巴器官中在二次攻击后可以变成新的效应T细胞的抗原致敏的记忆T细胞。虽然所有记忆T细胞都表达CD45的CD45RO同种型(原初T细胞表达CD45RA同种型),但Tcm的特征在于表达L-选择素(也称为CD62L)和CCR7+,这两者对于与外周淋巴器官和淋巴结的结合并在其中进行信号传导很重要。同上。因此,在外周淋巴器官中发现的所有T细胞(例如,原初T细胞、Tcm细胞等)表达CD62L。除了CD45RO以外,已知所有记忆T细胞还表达许多不同的细胞表面标志物,例如CD44。关于T细胞上各种细胞表面标志物的汇总,参见Janeway的Immunobiology,第10章,见上文。
虽然TCR可变结构域主要在抗原识别中起作用,但是TCR恒定结构域的胞外部分以及TCR的跨膜结构域和胞质结构域也起重要作用。完整的TCR受体复合物需要的不仅仅是α和β或γ和δ多肽;所需的附加分子包括CD3γ、CD3δ和CD3ε,以及ζ链同源二聚体(ζζ)。在TCRβ重排完成时,当细胞表达TCRβ/pTα时,该前TCR复合物与CD3一起存在于细胞表面。细胞表面的TCRα(或pTα)在其跨膜结构域中具有两个碱性残基,其中一个碱性残基募集CD3γε异二聚体,另一个经由它们各自的酸性残基募集ζζ。TCRβ在其跨膜结构域中具有附加碱性残基,据信该碱性残基募集CD3δε异二聚体。例如,参见Kuhns等人(2006)Deconstructing theForm and Function of the TCR/CD3 Complex,Immunity 24:133-39;Wucherpfennig等人(2009)Structural Biology of the T-cell Receptor:Insights into ReceptorAssembly,Ligand Recognition,and Initiation of Signaling,Cold SpringHarb.Perspect.Biol.2:a005140。包含TCRαβ异二聚体、CD3γε、CD3δε和ζζ组成的组装复合物在T细胞表面表达。已经提出跨膜结构域中的极性残基会充当离开内质网的质量控制;已经证明,在CD3亚基不存在的情况下,TCR链保留在ER中并被靶向降解。参见,例如,Call和Wucherpfennig(2005)The T Cell Receptor:Critical Role of the MembraneEnvironment in Receptor Assembly and Function,Annu.Rev.Immunol.23:101-25。
由于TCRαβ异二聚体(或TCRγδ异二聚体)本身缺乏信号转导活性,组装复合物的CD3和ζ链提供TCR信号传导的组分。CD3链各具有一个基于免疫受体酪氨酸的激活基序(ITAM),而ζ链包含三个串联的ITAM。ITAM含有能够被相关激酶磷酸化的酪氨酸残基。因此,组装的TCR-CD3复合物含有10个ITAM基序。参见,例如,Love和Hayes(2010)ITAM-MediatedSignaling by the T-Cell Antigen Receptor,Cold Spring Harb.Perspect.Biol.2:e002485。TCR接合后,ITAM基序被Src家族酪氨酸激酶Lck和Fyn磷酸化,这些酪氨酸激酶发起信号传导级联,引起Ras激活、钙动员、肌动蛋白细胞骨架重排和转录因子激活,所有这些最终导致T细胞分化、增殖和效应子作用。同上,还参见,Janeway的Immunobiology,见上文;两者通过引用并入本文。
另外,认为TCRβ跨膜结构域和胞质结构域在线粒体靶向和凋亡诱导中有作用;事实上,天然存在的N端截短的TCRβ分子存在于胸腺细胞中。Shani等人(2009)Incomplete T-cell receptor--βpeptides target the mitochondrion and induce apoptosis,Blood113:3530-41。因此,TCR恒定区(在各种实施方案中,其包含胞外结构域以及跨膜结构域和胞质结构域的一部分)提供了几种重要的功能;并且在各种实施方案中,当设计人源化TCR或表达人源化TCR的基因修饰的非人类动物时,应该考虑该区域的结构。
重排的T细胞受体序列的转基因小鼠是本领域已知的。本发明涉及基因修饰的非人动物(例如啮齿动物,例如大鼠、小鼠),这些基因修饰的非人动物包含未重排的人或人源化T细胞可变基因的基因座,这些基因座能够重排形成编码人T细胞受体可变结构域的核酸序列,这些基因修饰的非人动物包括包含含有重排的人可变结构域和非人(例如,小鼠或大鼠)恒定区的T细胞的动物。本发明还提供了能够产生人T细胞受体可变区序列的多样化组库的非人动物(例如啮齿动物,例如大鼠、小鼠);因此,本发明提供了响应于目标抗原表达具有全人可变结构域的TCR,并且结合目标抗原的表位的非人动物。在一些实施方案中,提供了产生能够与各种抗原反应的多样化T细胞受体组库的非人动物,所述抗原包括但不限于由APC呈递的抗原。
在一个实施方案中,本发明提供了基因修饰的非人动物(例如啮齿动物,例如大鼠、小鼠),在其基因组中包含未重排的人TCR可变区区段(V(D)J区段),其中未重排的人TCR可变区区段在内源非人(例如,啮齿动物)TCR可变基因的基因座(例如,TCRα、β、δ和/或γ可变基因的基因座)处置换内源非人TCR可变区区段。在一个实施方案中,未重排的人TCR可变基因的基因座置换内源非人TCR可变基因的基因座。
在另一个实施方案中,本发明提供了基因修饰的非人动物(例如啮齿动物,例如大鼠、小鼠),在其基因组中包含未重排的人TCR可变区区段(V(D)J区段),其中未重排的人TCR可变区区段可操作地连接至非人TCR恒定区基因序列,产生人源化TCR基因座,其中人源化TCR基因座处于基因组中除内源非人TCR基因座以外的位点。因此,在一个实施方案中,还提供了一种包含转基因的非人动物(例如啮齿动物,例如小鼠、大鼠),该转基因包含可操作地连接至非人TCR恒定区基因序列的未重排的人TCR可变区区段。
在一个方面,本发明的基因修饰的非人动物在其基因组中包含人TCR可变区区段,同时保留编码TCR恒定结构域的非人(例如啮齿动物,例如小鼠、大鼠)TCR恒定基因序列。在各种实施方案中,TCR恒定结构域包括TCR的跨膜结构域和胞质尾。因此,在本发明的各种实施方案中,基因修饰的非人动物保留内源非人TCR跨膜结构域和胞质尾。在其他实施方案中,非人动物包含例如编码非人非内源TCR跨膜结构域和胞质尾的非人非内源TCR恒定基因序列。如上所述,TCR的恒定结构域参与抗原致敏的T细胞激活期间发起的信号传导级联;因此,内源TCR恒定结构域与T细胞中的多种非人锚蛋白和信号传导蛋白相互作用。因此,在一个方面,本发明的基因修饰的非人动物表达人源化T细胞受体,这些人源化T细胞受体保留募集多种内源非人锚分子或信号传导分子,例如CD3分子(例如,CD3γ、CD3δ、CD3ε)、ζ链、Lck、Fyn、ZAP-70等的能力。募集到TCR复合物的分子的非限制性列表在Janeway的Immunobiology中有描述,见上文。据信,非人动物中T细胞发育和T细胞分化过程能够进行并允许稳健的免疫应答,至少部分是由于在内源小鼠基因座放置了可变区并维持了小鼠恒定结构域。
在一些实施方案中,提供了一种非人动物,在其基因组中包含未重排的人TCRα可变区区段,其中未重排的人TCRα可变区区段可操作地连接至非人TCRα恒定区基因序列,产生人源化TCRα基因座。在一个实施方案中,人源化TCRα基因座处于基因组中除内源非人TCRα基因座以外的位点。在另一个实施方案中,未重排的人TCRα可变区区段置换内源非人TCRα可变区区段,同时保留了内源非人TCRα恒定区基因序列。在一个实施方案中,未重排的人TCRα可变基因的基因座置换内源非人TCRα可变基因的基因座。在一些实施方案中,内源非人TCRα可变区基因的基因座被未重排的人TCRα可变基因的基因座置换包括TCRδ可变基因的基因座的缺失或失活。在其他实施方案中,内源非人TCRα可变区基因被未重排的人TCRα基因的基因座置换包括内源TCRδ可变基因的基因座被未重排的人TCRδ可变区区段置换。在一些实施方案中,动物保留内源非人TCRβ可变区和恒定区基因序列。因此,动物表达包含嵌合人/非人(即人源化)TCRα链和非人TCRβ链的TCR。
在一些实施方案中,提供了一种非人动物,在其基因组中包含未重排的人TCRδ可变区区段,其中未重排的人TCRδ可变区区段可操作地连接至非人TCRδ恒定区基因序列,产生人源化TCRδ基因座。在一个实施方案中,人源化TCRδ基因座处于基因组中除内源非人TCRδ基因座以外的位点。在另一个实施方案中,未重排的人TCRδ可变区区段置换内源非人TCRδ可变区区段,同时保留了内源非人TCRδ恒定区基因序列。在一个实施方案中,未重排的人TCRδ可变基因的基因座置换内源非人TCRδ可变基因的基因座。
在其他实施方案中,提供了一种非人动物,在其基因组中包含未重排的人TCRβ可变区区段,其中未重排的人TCRβ可变区区段可操作地连接至非人TCRβ恒定区基因序列,产生人源化TCRβ基因座。在一个实施方案中,人源化TCRβ基因座处于基因组中除内源非人TCRβ基因座以外的位点。在另一个实施方案中,未重排的人TCRβ可变区区段置换内源非人TCRβ可变区区段,同时保留了内源非人TCRβ恒定区基因序列。在一个实施方案中,未重排的人TCRβ可变基因的基因座置换内源非人TCRβ可变基因的基因座。在一些实施方案中,动物保留内源非人TCRα可变区和恒定区基因序列。因此,动物表达包含嵌合人/非人(即人源化)TCRβ链和非人TCRα链的TCR。
在一些具体实施方案中,本发明提供了一种基因修饰的非人动物(例如啮齿动物,例如小鼠或大鼠),在其基因组中包含(a)可操作地连接至内源非人(例如啮齿动物,例如小鼠或大鼠)TCRα恒定基因序列的包含至少一个人Vα区段和至少一个人Jα区段的未重排的T细胞受体(TCR)α可变基因的基因座,(b)可操作地连接至内源非人(例如啮齿动物,例如小鼠或大鼠)TCRβ恒定区基因序列的包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段的未重排的TCRβ可变基因的基因座,和/或(c)可操作地连接至内源非人(例如啮齿动物,例如小鼠或大鼠)TCRδ恒定区基因序列的包含至少一个人Vδ区段、至少一个人Dδ和至少一个人Jδ区段的未重排的TCRδ可变基因的基因座。在一些实施方案中,如本文所述的非人动物在其基因组中包含(a)可操作地连接至内源非人(例如啮齿动物,例如小鼠或大鼠)TCRα恒定基因序列的包含至少一个人Vα区段和至少一个人Jα区段的未重排的T细胞受体(TCR)α可变基因的基因座,(b)可操作地连接至内源非人(例如啮齿动物,例如小鼠或大鼠)TCRβ恒定基因序列的包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段的未重排的TCRβ可变基因的基因座,(c)可操作地连接至内源非人(例如啮齿动物,例如小鼠或大鼠)TCRδ恒定区基因序列的包含至少一个人Vδ区段、至少一个人Dδ和至少一个人Jδ区段的未重排的TCRδ可变基因的基因座,和/或(d)可操作地连接至内源非人(例如啮齿动物,例如小鼠或大鼠)TCRγ恒定区基因序列的包含至少一个人Vγ区段和至少一个人Jγ区段的未重排的TCRγ可变基因的基因座。
在本发明的各种实施方案中,未重排的人或人源化TCR可变基因的基因座(例如,TCRα、TCRβ和/或TCRδ可变基因的基因座)包含在非人动物(例如,啮齿动物,例如小鼠或大鼠)的种系中。在各种实施方案中,TCR V(D)J区段被未重排的人TCR V(D)J区段(例如,Vα和Jα;Vβ和Dβ和Jβ;Vδ和Dδ和Jδ;Vγ和Jγ区段)置换处于一个内源非人TCR可变基因座(或多个基因座)处,其中未重排的人V和J区段和/或V和D和J区段可操作地连接至非人TCR恒定区基因序列。
在本发明的一些实施方案中,非人动物包含两个拷贝的未重排的人或人源化TCRα可变基因的基因座、两个拷贝的未重排的人或人源化TCRβ可变基因的基因座和/或两个拷贝的未重排的人或人源化TCRδ可变基因的基因座。因此,非人动物对于一个或多个未重排的人或人源化TCRα、TCRβ和/或TCRδ可变基因的基因座而言是纯合的。在本发明的一些实施方案中,非人动物包含一个拷贝的未重排的人或人源化TCRα可变基因的基因座、一个拷贝的未重排的人或人源化TCRβ可变基因的基因座和/或一个拷贝的未重排的人或人源化TCRδ可变基因的基因座。因此,非人动物对于未重排的人或人源化TCRα、TCRβ和/或TCRδ可变基因的基因座而言是杂合的。在其他实施方案中,非人动物对于未重排人或人源化TCRγ可变基因的基因座而言是杂合的或纯合的。
在一个实施方案中,包含人可变区区段(例如,人Vα和Jα区段)的未重排的TCRα可变基因的基因座位于非人类基因组中,使得人可变区区段置换相应的非人可变区区段。在一个实施方案中,包含人可变区区段的未重排的TCRα可变基因的基因座置换内源TCRα可变基因的基因座。在一个方面,内源非人Vα区段和Jα区段不能重排形成重排的Vα/Jα序列。因此,在一个方面,未重排的TCRα可变基因的基因座中的人Vα和Jα区段能够重排形成重排的人Vα/Jα序列。
类似地,在一个实施方案中,包含人可变区区段(例如,人Vβ、Dβ和Jβ区段)的未重排的TCRβ可变基因的基因座位于非人类基因组中,使得人可变区区段置换相应的非人可变区区段。在一个实施方案中,包含人可变区区段的未重排的TCRβ可变基因的基因座置换内源TCRβ可变基因的基因座。在一个方面,内源非人Vβ、Dβ和Jβ区段不能重排形成重排的Vβ/Dβ/Jβ序列。因此,在一个方面,未重排的TCRβ可变基因的基因座中的人Vβ、Dβ和Jβ区段能够重排形成重排的人Vβ/Dβ/Jβ序列。
在一个实施方案中,包含人可变区区段(例如,人Vδ、Dδ和Jδ区段)的未重排的TCRδ可变基因的基因座位于非人类基因组中,使得人可变区区段置换相应的非人可变区区段。在一个实施方案中,包含人可变区区段的未重排的TCRδ可变基因的基因座置换内源TCRδ可变基因的基因座。在一个方面,内源非人Vδ、Dδ和Jδ区段不能重排形成重排的Vδ/Dδ/Jδ序列。因此,在一个方面,未重排的TCRδ可变基因的基因座中的人Vδ、Dδ和Jδ区段能够重排形成重排的人Vδ/Dδ/Jδ序列。
在一个实施方案中,包含人可变区区段(例如,人Vγ和Jγ区段)的未重排的TCRγ可变基因的基因座位于非人类基因组中,使得人可变区区段置换相应的非人可变区区段。在一个实施方案中,包含人可变区区段的未重排的TCRγ可变基因的基因座置换内源TCRγ可变基因的基因座。在一个方面,内源非人Vα区段和Jα区段不能重排形成重排的Vγ/Jγ序列。因此,在一个方面,未重排的TCRγ可变基因的基因座中的人Vγ和Jγ区段能够重排形成重排的人Vγ/Jγ序列。
在另一个实施方案中,包含人可变区区段的未重排的TCRα、β、δ和/或γ可变基因的基因座置换相应的内源TCRα、β、δ和γ可变基因的基因座。在一个方面,内源非人Vα和Jα区段不能重排形成重排的Vα/Jα序列,内源非人Vβ、Dβ和Jβ区段不能重排形成重排的Vβ/Dβ/Jβ序列,内源Vδ、Dδ和Jδ区段不能重排形成重排的Vδ/Dδ/Jδ序列和/或内源非人Vγ和Jγ区段不能重排形成重排的Vγ/Jγ序列。因此,在一个方面,未重排的TCRα可变基因的基因座中的人Vα和Jα区段能够重排形成重排的人Vα/Jα序列,未重排的TCRβ可变基因的基因座中的人Vβ、Dβ和Jβ区段能够重排形成重排的人Vβ/Dβ/Jβ序列,未重排的TCRδ可变基因的基因座中的人Vδ、Dδ和Jδ区段能够重排形成重排的人Vδ/Dδ/Jδ序列,和/或未重排的TCRγ可变基因的基因座中的人Vγ和Jγ区段能够重排形成重排的人Vγ/Jγ序列。
在本发明的一些方面,包含人源化TCRα、TCRβ和/或TCRδ基因的基因座(包含未重排的人TCRα、TCRβ和/或TCRδ可变基因的基因座)的非人动物保留内源非人TCRα、TCRβ和/或TCRδ可变基因的基因座。在一个实施方案中,内源非人TCRα、TCRβ和/或TCRδ可变基因的基因座是非功能性基因座。在一个实施方案中,非功能性基因座是失活基因座,例如倒置基因座(例如,可变基因的基因座的编码核酸序列相对于恒定区序列处于倒置方向,使得利用倒置基因座的可变区区段不可能成功重排)。在一个实施方案中,人源化TCRα、TCRβ和/或TCRδ可变基因的基因座分别位于内源非人TCRα、TCRβ和/或TCRδ可变基因的基因座与内源非人TCRα、TCRβ和/或TCRδ恒定基因的基因座之间。可以进行类似的染色体排列以将人或人源化TCRγ放置在非人动物的基因组中,例如放置在TCRγ基因座处。
人和小鼠TCR基因座的V和J和/或V、D和J区段的数目、命名、位置以及其他方面可以使用IMGT数据库来确定,该数据库可在国际免疫遗传学信息系统(IMGT)的网站上获得。小鼠TCRα可变基因座为大约1.5兆碱基,包含总共110个Vα区段和60个Jα区段。人TCRα可变基因座为大约1兆碱基,包含总共54个Vα区段和61个Jα区段,其中据信45个Vα区段和50个Jα区段是功能性的。除非另有说明,否则说明书全篇提到的人V(D)J区段的数目是指V(D)J区段的总数。在本发明的一个实施方案中,基因修饰的非人动物(例如啮齿动物,例如小鼠或大鼠)包含至少一个人Vα区段和至少一个人Jα区段。在一个实施方案中,非人动物包含人源化TCRα基因座,该基因座包含1、2、3、4、5、6、7、8、9、10、15、20、23、25、30、35、40、45、48、50或多达54个人Vα区段。在一些实施方案中,人源化TCRα基因座包含2、8、23、35、48或54个人Vα区段。因此,在一些实施方案中,非人动物中的人源化TCRα基因座可以包含5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的人Vα;在一些实施方案中,它可以包含约2%、约3%、约15%、约65%、约90%或100%的人Vα。
在一个实施方案中,非人动物包含人源化TCRα基因座,该基因座包含含有人Vα40至Vα41的连续人序列的DNA片段(Vα区段也称为“TRAV”或“TCRAV”)和含有61个人Jα区段的连续人序列的DNA片段(Jα区段也被称为“TRAJ”或“TCRAJ”)。TCRA非编码序列是指包含非编码重组信号序列(RSS)和其他非编码基因间序列的连续非编码序列,非编码基因间序列发现于任何两个连续的未重排的TRAV区段之间、任何未重排的TRAV区段和未重排的TRAJ区段之间以及任何两个连续的未重排的TRAJ区段之间。在一个实施方案中,非人动物包含人源化TCRα基因座,该基因座包含含有人TRAV35至TRAV41的连续人序列的DNA片段和含有61个人TRAJ的连续人序列的DNA片段。在一个实施方案中,非人动物包含人源化TCRα基因座,该基因座包含含有人TRAV22至TRAV41的连续人序列的DNA片段和含有61个人TRAJ的连续人序列的DNA片段。在一个实施方案中,非人动物包含人源化TCRα基因座,该基因座包含含有人TRAV13-2至TRAV41的连续人序列的DNA片段和含有61个人TRAJ的连续人序列的DNA片段。在一个实施方案中,非人动物包含人源化TCRα基因座,该基因座包含含有人TRAV6至TRAV41和61个人TRAJ的连续人序列的DNA片段。在一个实施方案中,非人动物包含人源化TCRα基因座,该基因座包含含有人TRAV1-1至TRAV41和61个人TRAJ的连续人序列的DNA片段。在各种实施方案中,包含人TCRα可变区区段的连续人序列的DNA片段还包含限制性酶位点、选择盒、核酸内切酶位点或在基因座人源化过程中为促进克隆和选择而插入的其他位点。在各种实施方案中,这些附加位点不干扰在TCRα基因座处的各种基因的正确功能(例如,重排、剪接等)。
在一个实施方案中,人源化TCRα基因座包含61个人Jα区段,或100%的人Jα区段。在一个特定实施方案中,人源化TCRα基因座包含8个人Vα区段和61个人Jα区段;在另一个特定实施方案中,人源化TCRα基因座包含23个人Vα区段和61个人Jα区段。在另一个特定实施方案中,人源化TCRα基因座包含完整的人Vα和Jα区段组库,即由α基因座编码的所有人可变α区基因区段,或54个人Vα区段和61个人Jα区段。在各种实施方案中,非人动物在TCRα基因座处不包含任何内源非人Vα或Jα区段。
小鼠TCRβ可变基因座为大约0.6兆碱基,包含总共33个Vβ区段、2个Dβ区段和14个Jβ区段。人TCRβ可变基因座为大约0.6兆碱基,包含总共67个Vβ区段、2个Dβ区段和14个Jβ区段。在本发明的一个实施方案中,基因修饰的非人动物(例如啮齿动物,例如小鼠或大鼠)包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jα区段。
在一个实施方案中,非人动物包含人源化TCRβ基因座,该基因座包含1、2、3、4、5、6、7、8、9、10、15、20、23、25、30、35、40、45、48、50、55、60个或多达67个人Vβ区段。在一些实施方案中,人源化TCRβ基因座包含8、14、40、66个或67个人Vβ区段。因此,在一些实施方案中,非人动物中的人源化TCRβ基因座可以包含5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的人Vβ;在一些实施方案中,它可以包含约20%、约60%、约15%、约98%或100%的人Vβ。
在一些实施方案中,内源TCRβ可变基因的基因座,例如内源TCRβ小鼠可变基因的基因座,包含:
邻接的内源T细胞可变区Vβ基因区段中的一个或全部,例如第一5’胰蛋白酶原簇和第二3’胰蛋白酶原簇之间邻接的内源T细胞可变区Vβ基因区段中的一个或全部被TRBV1至TRBV29-1的一个或全部未重排的人T细胞可变区基因区段置换,和/或
一个或多个不连续的内源Vβ基因区段(例如,内源小鼠TCRBV31基因区段)被人TCRBV基因区段置换(例如,小鼠TCRBV31基因区段被直系同源人TCRBV30基因区段置换)。
在一个实施方案中,非人动物包含人源化TCRβ基因座,该基因座包含含有人Vβ18至Vβ29-1的连续人序列的DNA片段(Vβ区段也称为“TRBV”或“TCRBV”)。在一个实施方案中,非人动物包含人源化TCRβ基因座,该基因座包含含有人TRBV18至TRBV29-1的连续人序列的DNA片段、包含含有人Dβ1-Jβ1(即,人Dβ1-Jβ1-1-Jβ1-6区段)的连续人TCRBDJ1序列的单独DNA片段,和包含含有人Dβ2-Jβ2(即,人Dβ2-Jβ2-1-Jβ2-7区段)的连续人TCRBDJ2序列的单独DNA片段。未重排的TCRBDJ1序列(也可以称为未重排的TCRBJD1簇)包含未重排的TCRBD1区段、一个至所有未重排的TCRBJ1区段(例如,Jβ1-1、Jβ1-2、Jβ1-3、Jβ1-4、Jβ1-5和Jβ1-6区段),以及介于未重排的TCRBD1区段和未重排的TCRBJ1区段之间以及介于任何两个连续的未重排的TCRBJ1基因区段之间的TCRBDJ1非编码序列。TCRB非编码序列是指包含非编码重组信号序列(RSS)和在任何两个连续的未重排的TRBV区段之间发现的其他非编码基因间序列的连续非编码序列,并且可以包括TCRBDJ1非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD1区段和TRBJ1区段之间以及在任何两个连续的未重排的TRBJ1区段之间发现的其他非编码基因间序列的连续非编码序列,或者包括TCRBDJ2非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD2区段和TRBJ2区段之间以及在任何两个连续的未重排的TRBJ2区段之间发现的其他非编码基因间序列的连续非编码序列。未重排的TCRBDJ1序列可以可操作地连接至多个未重排的TRBV区段和TCRBC1恒定区序列(也可以称为TRBC1区序列)。未重排的TCRBDJ2序列(也可以称为未重排的TCRBJD2簇)包含未重排的TCRBD2区段、一个至所有未重排的TCRBJ2区段(例如,Jβ2-1、Jβ2-2、Jβ2-3、Jβ2-4、Jβ2-5、Jβ2-6区段和Jβ2-7区段),以及介于未重排的TCRBD2区段和未重排的TCRBJ2区段之间以及介于任何两个连续的未重排的TCRBJ2基因区段之间的TCRBDJ2非编码序列。未重排的TCRBDJ2序列可以可操作地连接至多个未重排的TRBV区段和TCRBC2恒定区序列(也可以称为TRBC2区序列)。在一个实施方案中,非人动物包含人源化TCRβ基因座,该基因座包含以下的一者或两者:(i)TCRBDJ1簇,其中Dβ1-Jβ1区段至少全部或至少一个(即,Dβ1、Jβ1-1、Jβ1-2、Jβ1-3、Jβ1-4、Jβ1-5和Jβ1-6区段)是人的并且其中介于Dβ1-Jβ1区段之间的非编码序列,包括RSS和其他基因间序列,是非人的,例如是小鼠的,任选地其中Dβ1和Jβ1-1至JβJ1-6区段位于相同的小鼠TCR非编码序列的侧翼,正如通常侧翼是小鼠Trbd1和小鼠Trbj1-1至Trbj1-6区段,和/或(ii)TCRBDJ2簇,其中Dβ2-Jβ2区段中的至少一个或全部(即,Dβ2、Jβ2-1、Jβ2-2、Jβ2-3、Jβ2-3、Jβ2-4、Jβ2-5、Jβ2-6和Jβ2-7区段)是人的,并且其中介于Dβ2-Jβ2区段之间的非编码序列,包括RSS和其他基因间序列,是非人的,例如是小鼠的,任选地其中Dβ2和JβJ2-1至Jβ2-7基因区段位于相同的小鼠TCR非编码序列的侧翼,正如通常侧翼是小鼠Trbd2和小鼠Trbj2-1至Trbj2-7区段。在一个实施方案中,非人动物包含人源化TCRβ基因座,该基因座包含含有人TRBV6-5至TRBV29-1的连续人序列的DNA片段、含有人Dβ1-Jβ1(即,人Dβ1-Jβ1-1-Jβ1-6区段)的连续人序列的单独DNA片段和含有人Dβ2-Jβ2(即,人Dβ2-Jβ2-1-Jβ2-7区段)的连续人序列的单独DNA片段。在一个实施方案中,非人动物包含人源化TCRβ基因座,该基因座包含含有人TRBV1至TRBV29-1的连续人序列的DNA片段、含有人Dβ1-Jβ1的连续人序列的单独DNA片段和含有人Dβ2-Jβ2的连续人序列的单独DNA片段。在一个实施方案中,非人动物包含人源化TCRβ基因座,该基因座包含含有人TRBV1至TRBV29-1的连续人序列的DNA片段、含有人Dβ1-Jβ1的连续人序列的单独DNA片段、含有人Dβ2-Jβ2的连续人序列的单独DNA片段和含有人TRBV30序列的单独DNA片段。在各种实施方案中,包含人TCRβ可变区区段的连续人序列的DNA片段还包含限制性酶位点、选择盒、核酸内切酶位点或在基因座人源化过程中为促进克隆和选择而插入的其他位点。在各种实施方案中,这些附加位点不干扰在TCRβ基因座处的各种基因的正确功能(例如,重排、剪接等)。
在一个实施方案中,人源化TCRβ基因座包含14个人Jβ区段,或100%的人Jβ区段,和2个人Dβ区段或100%的人Dβ区段。在另一个实施方案中,人源化TCRβ基因座包含至少一个人Vβ区段,例如14个人Vβ区段,以及所有小鼠Dβ和Jβ区段。在一个特定实施方案中,人源化TCRβ基因座包含14个人Vβ区段、2个人Dβ区段和14个人Jβ区段。在另一个特定实施方案中,人源化TCRβ基因座包含完整的人Vβ、Dβ和Jβ区段组库,即由β基因座编码的所有人可变β区基因区段,或67个人Vβ区段、2个人Dβ区段和14个人Jβ区段。在一个实施方案中,非人动物在人源化TCRβ基因座处包含一个(例如,5’)非人Vβ区段。在各种实施方案中,非人动物在TCRβ基因座处不包含任何内源非人Vβ区段、Dβ区段或Jβ区段。
在一个实施方案中,人源化TCRβ基因座包含13个人Jβ区段,或100%的功能性人Jβ区段,和2个人Dβ区段或100%的功能性人Jβ区段。在另一个实施方案中,人源化TCRβ基因座包含至少一个人Vβ区段,例如14个人Vβ区段,以及所有功能性小鼠Dβ和Jβ区段。在一个特定实施方案中,人源化TCRβ基因座包含14个人Vβ区段、2个人Dβ区段和13个功能性人Jβ区段。在另一个特定实施方案中,人源化TCRβ基因座包含完整的人Vβ、Dβ和Jβ区段组库,即由β基因座编码的所有人可变β区基因区段,或67个人Vβ区段、2个人Dβ区段和13个功能性人Jβ区段。在一个实施方案中,非人动物在人源化TCRβ基因座处包含一个(例如,5’)非人Vβ区段。在各种实施方案中,非人动物在TCRβ基因座处不包含任何内源非人Vβ区段、Dβ区段或Jβ区段。
在各种实施方案中,其中非人动物(例如,啮齿动物)包含人TCRα和TCRβ(以及任选地人TCRδ和TCRγ)可变区区段组库(例如完整的可变区区段组库),动物利用各种区段的组库(例如,各种区段的完整组库)来产生针对各种抗原的TCR分子的多样化组库。
在各个方面,非人动物包含人类基因组TCR可变基因座的连续部分,连续部分包含如同在未重排的人类基因组可变基因座中排列的V、D和J区段,或D和J区段,或V和J区段,或V区段,例如,包含如同在人类基因组TCR可变基因座中排列的启动子序列、前导序列、基因间序列、调控序列等。关于TCRA和/或TCRB序列的连续人序列通常也可以指全人序列,例如,其中TCR编码序列(例如,TCR基因区段)和TCR非编码序列(例如,分隔TCR基因区段并且侧翼是TCR基因区段的非编码DNA,诸如非编码重组信号序列(RSS)和其他非编码基因间序列)都是人的,并且优选地,其中TCR基因区段和TCR非编码序列处于它们在人类种系中可以发现的相同顺序。作为一个非限制性实例,连续的人TCRAV序列包含全人序列,例如,其中(a)TCRAV编码序列(例如,TCRAV基因区段)和(b)TCRAV非编码序列(例如,分隔TCRAV基因区段并且侧翼是TCRAV基因区段的非编码DNA,诸如非编码重组信号序列(RSS)和其他非编码基因间序列)都是人的,并且优选地,其中TCRAV基因区段和TCRAV非编码序列处于它们在人类种系中可以发现的相同顺序。在另一个非限制性实例中,连续的人TCRAJ序列包含全人序列,例如,其中(a)TCRAJ编码序列(例如,TCRAJ基因区段)和(b)TCRAJ非编码序列(例如,分隔TCRAJ基因区段并且侧翼是TCRAJ基因区段的非编码DNA,诸如非编码重组信号序列(RSS)和其他非编码基因间序列)都是人的,并且优选地,其中TCRAJ基因区段和TCRAJ非编码序列处于它们在人类种系中可以发现的相同顺序。作为另一个非限制性实例,Vβ区段的连续人序列包含全人序列,例如,其中TCRBV编码序列(例如,TCRBV基因区段)和TCRBV非编码序列(例如,分隔TCRBV基因区段并且侧翼是TCRBV基因区段的非编码DNA,诸如非编码重组信号序列(RSS)和其他非编码基因间序列)都是人的,并且优选地,其中TCRBV基因区段和TCRAV非编码序列处于它们在人类种系中可以发现的相同顺序。在一些实施方案中,Dβ1-Jβ1的连续人序列包含全人序列,例如,其中
(a)TCRBD1编码序列(即,TCRBDβ1或Dβ1区段),
(b)TCRBJ1(即,Jβ1)编码序列(即,TCRBJ1-1区段、TCRBJ1-2区段、TCRBJ1-3区段、TCRBJ1-4区段、TCRBJ1-5区段、TCRBJ1-6区段及它们的任何组合),和
(c)TCRBDJ1非编码序列(例如,分隔TCRBD1基因区段和/或TCRBJ1基因区段并且侧翼是TCRBD1基因区段和/或TCRBJ1基因区段的非编码DNA,诸如非编码重组信号序列(RSS)和其他非编码基因间序列,例如,TCRBD1-TCRBJ1非编码序列、TCRBJ1-1-TCRBJ1-2非编码序列等)
是人的,并且优选地,其中TCRBD1基因区段、TCRBJ1基因区段和TCRBDJ1非编码序列处于它们在人类种系中可以发现的相同顺序。作为另一个非限制性实例,Dβ2-Jβ2的连续人序列包含全人序列,例如,其中
(a)TCRBD2编码序列(即,TCRBDβ2或Dβ2区段),
(b)TCRBJ2(即,Jβ2)编码序列(即,TCRBJ2-1区段、TCRBJ2-2区段、TCRBJ2-3区段、TCRBJ2-4区段、TCRBJ2-5区段、TCRBJ2-6区段、TCRBJ2-7区段及它们的任何组合),和
(c)TCRBDJ2非编码序列(例如,分隔TCRBD2基因区段和/或TCRBJ2基因区段并且侧翼是TCRBD2基因区段和/或TCRBJ2基因区段的非编码DNA,诸如非编码重组信号序列(RSS)和其他非编码基因间序列,例如,TCRBD2-TCRBJ2非编码序列、TCRBJ2-1-TCRBJ2-2非编码序列等)
是人的,并且优选地,其中TCRBD2基因区段、TCRBJ2基因区段和TCRBDJ2非编码序列处于它们在人类种系中可以发现的相同顺序。
在人源化TCRα、β、δ和/或γ基因座的各种实施方案中,人源化基因座可包含人编码序列(例如,TCR基因区段)和非人(例如,鼠)TCR非编码序列,例如,分隔TCR基因区段并且侧翼是TCR基因区段的非编码DNA,诸如但不限于,非编码重组信号序列(RSS)和其他非编码基因间序列(例如,TCRAV非编码序列、TCRAJ非编码序列、TCRBV非编码序列、TCRBD1-TCRBJ1非编码序列、TCRBJ1非编码序列(例如,TCRBJ1-1-TCRBJ1-2非编码序列,例如TCRBJ1-2-TCRBJ1-3非编码序列等)、TCRBD2-TCRBJ2非编码序列、TCRBJ2非编码序列(例如,TCRBJ2-1-TCRBJ2-2非编码序列、TCRBJ2-2-TCRBJ2-3非编码序列等))。在一些实施方案中,人TCR基因区段置换直系同源的非人(例如,小鼠)TCR基因区段,使得人TCR基因区段位于与侧翼是被置换的直系同源的非人(例如,小鼠)TCR基因区段的那些相同的非人(例如,小鼠)TCR非编码序列的侧翼,例如,使得人TCR基因区段和非人(例如,小鼠)TCR非编码序列的顺序与在非人(例如,小鼠)种系中发现的顺序相同,但对于直系同源(例如,非人)TCR基因区段的置换不是。参见,例如图4C。
在其他方面,各种区段排列与未重排的非人类基因组TCR可变基因座中一样。在人源化TCRα、β、δ和/或γ基因座的各种实施方案中,人源化基因座可包含两个或更多个在人类基因组中不并置出现的人类基因组区段,例如,位于人类基因组中靠近恒定区的人可变基因座V区段的片段,与位于人类基因组中的人可变基因座上游末端的人可变基因座V区段的片段并列。
在小鼠和人两者中,TCRδ基因区段与TCRα基因座一起定位(参见图4A,顶部,带方框的TCRD区)。TCRδJ和D区段位于Vα和Jα区段之间,而TCRδV区段散布在整个TCRα基因座中,大多数位于各Vα区段之间。各TCRδ区段的数目和位置可以从IMGT数据库中确定。由于TCRα基因座内TCRδ基因区段的基因组排列,在TCRα基因座处的成功重排可以使TCRδ基因区段缺失或失活。
在本发明的一些实施方案中,包含未重排的人TCRα可变基因的基因座的非人动物还包含至少一个人Vδ区段,例如,多达完整的人Vδ区段组库。因此,在一些实施方案中,置换内源TCRα可变基因的基因座导致至少一个非人Vδ区段被人Vδ区段置换。在其他实施方案中,本发明的非人动物在未重排的人源化TCRα基因座处包含人Vδ、Dδ和Jδ片段的完整组库;在其他实施方案中,非人动物在未重排的人源化TCRα基因座(即,包括人可变区区段以及人增强子和恒定区的TCRδ基因座)处包含完整的未重排的人TCRδ基因座。美国专利第9,113,616号中描述了用于构建包含完整的未重排的TCRδ基因座的未重排的人源化TCRα基因座的示例性实施方案,该专利通过引用并入本文。
在另一个实施方案中,本发明的非人动物还包含未重排的人源化TCRγ基因座,例如,包含至少一个人Vγ和至少一个人Jγ区段的TCRγ基因座(例如,人Vγ和人Jγ可变区区段的完整组库)。人TCRγ基因座处于人7号染色体上,而小鼠TCRγ基因座处于小鼠13号染色体上。关于TCRγ基因座的更多细节参见IMGT数据库。
在一个方面,本文所述的包含人源化TCRα和β可变基因的基因座(以及任选地人源化TCRδ/γ可变基因的基因座)的非人动物(例如啮齿动物,例如小鼠或大鼠)在T细胞表面上表达包含人可变区和非人(例如啮齿动物,例如小鼠或大鼠)恒定区的人源化T细胞受体。在一些方面,非人动物能够表达识别多种呈递抗原的多样化人源化T细胞受体组库。
在一个方面,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞,其中由脾细胞群表达的TCR的至少10%源自TCRBDJ1簇的基因区段,并且由脾细胞群表达的TCR的至少10%源自TCRBDJ2簇的基因区段。在一些实施方案中,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞,其中由脾细胞群表达的TCR的至少15%源自TCRBDJ1簇的基因区段,并且由脾细胞群表达的TCR的至少15%源自TCRBDJ2簇的基因区段。在一些实施方案中,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞,其中由脾细胞群表达的TCR的至少20%源自TCRBDJ1簇的基因区段,并且由脾细胞群表达的TCR的至少20%源自TCRBDJ2簇的基因区段。在一些实施方案中,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞,其中由脾细胞群表达的TCR的至少30%源自TCRBDJ1簇的基因区段,并且由脾细胞群表达的TCR的至少30%源自TCRBDJ2簇的基因区段。在一些实施方案中,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞,其中由脾细胞群表达的TCR的至少40%源自TCRBDJ2簇的基因区段。在一些实施方案中,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞,其中由脾细胞群表达的TCR的至少50%源自TCRBDJ2簇的基因区段。在一些实施方案中,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞,其中由脾细胞群表达的TCR的至少60%源自TCRBDJ2簇的基因区段。在一些实施方案中,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞,其中由脾细胞群表达的TCR的至少70%源自TCRBDJ2簇的基因区段。在一些实施方案中,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞群,该细胞群表达源自TCRBDJ1簇的基因区段的TCR和源自TCRBDJ2簇的基因区段的TCR,比率为1:3、3:7、1:2、2:3或1:1。在一些实施方案中,如本文所述包含含有非人动物(例如啮齿动物,例如小鼠或大鼠)TCRB非编码序列的人源化TCRβ可变基因的基因座的非人动物(例如啮齿动物,例如小鼠或大鼠)包含脾细胞群,例如CD4+和/或CD8+T细胞群,该细胞群表达源自TCRBDJ2簇的基因区段的TCR和源自TCRBDJ1簇的基因区段的TCR,比率为1:3、3:7、1:2或2:3。
在本发明的各种实施方案中,本文所述的人源化T细胞受体多肽包含人前导序列。在替代实施方案中,人源化TCR受体核酸序列经工程改造,使得人源化TCR多肽包含非人前导序列。
本文所述的人源化TCR多肽可以在内源非人调控元件(例如,啮齿动物调控元件),例如启动子、沉默子、增强子等的控制下表达。可替代地,本文所述的人源化TCR多肽可以在人调控元件的控制下表达。在各种实施方案中,本文所述的非人动物还包含通常在人类基因组中原位发现的所有调节序列和其他序列。
在各种实施方案中,人源化TCR蛋白的人可变区能够与同一细胞或另一细胞表面上的各种蛋白质相互作用。在一个实施方案中,人源化TCR的人可变区与在第二细胞(例如,抗原呈递细胞(APC))表面呈递抗原的MHC蛋白(例如,MHC I类或II类蛋白)相互作用。在一些实施方案中,MHC I或II蛋白是非人(例如啮齿动物,例如小鼠或大鼠)蛋白。在其他实施方案中,MHC I或II蛋白是人(人源化)蛋白。在一个方面,第二细胞,例如APC,是表达人或人源化MHC分子的内源非人细胞。在不同的实施方案中,第二细胞是表达人MHC分子的人细胞。
在一个方面,非人动物表达在T细胞表面具有非人恒定区的人源化T细胞受体,其中该受体能够与非人分子相互作用,这些非人分子例如在T细胞中表达的锚或信号传导分子(例如,CD3分子、ζ链或通过CD3分子或ζ链锚定于TCR的其他蛋白质)。因此,在一个方面,提供了一种细胞复合物,该细胞复合物包含(a)非人T细胞,该非人T细胞表达(i)包含如本文所述的人源化TCRα链和如本文所述的人源化TCRβ链的TCR,和(ii)如本文所述的嵌合辅助受体,和(b)非人抗原呈递细胞,该非人抗原呈递细胞包含与如本文所述的嵌合MHC I和/或嵌合MHC II结合的抗原。在一个实施方案中,非人恒定TCRα和TCRβ链与非人ζ(ζ)链同源二聚体和CD3异二聚体复合。在一个实施方案中,细胞复合物是体内细胞复合物。在一个实施方案中,细胞复合物是体外细胞复合物。
在各种实施方案中,本文所述的非人动物(例如啮齿动物,例如小鼠或大鼠)产生能够经历胸腺发育的T细胞,从DN1进展到DN2到DN3到DN4到DP以及到CD4或CD8 SP T细胞。本发明的非人动物的此类T细胞表达通常由T细胞在胸腺发育的特定阶段产生的细胞表面分子(例如,CD25、CD44、Kit、CD3、pTα等)。因此,在一个实施方案中,本文所述的非人动物可以在胸腺发育的DN3阶段表达与TCRβ复合的pTα。本文所述的非人动物表达能够经历胸腺发育以产生CD4+和CD8+T细胞的T细胞。
在各种实施方案中,本文所述的非人动物产生能够在外周经历T细胞分化的T细胞。在一些实施方案中,本文所述的非人动物能够产生效应T细胞组库,例如CTL(细胞毒性T淋巴细胞)、TH1、TH2、TREG、TH17等。因此,在这些实施方案中,本文所述的非人动物产生实现特定T细胞类型的不同典型功能,例如识别、结合外来抗原和对外来抗原应答的效应T细胞。在各种实施方案中,本文所述的非人动物产生效应T细胞,这些效应T细胞杀伤展示在MHC I分子的背景下表达的细胞溶质病原体的肽片段;识别源自在胞内囊泡中降解并由巨噬细胞表面的MHC II分子呈递的抗原的肽,并诱导巨噬细胞杀伤微生物;产生驱动B细胞分化的细胞因子;激活B细胞产生调理抗体;诱导上皮细胞产生将中性粒细胞募集到感染部位的趋化因子;等等。
在另外的实施方案中,本文所述的非人动物在外周,例如在脾脏中包含CD3+T细胞。在其他方面,本文所述的非人动物能够响应于目标抗原产生记忆T细胞群。例如,非人动物产生针对抗原的中心记忆T细胞(Tcm)和效应记忆T细胞(Tem),该抗原例如目标抗原(例如正在测试用于疫苗开发的抗原等)。
没有接收到足够信号(例如,Notch信号)的DN1细胞和DN2细胞可以发育成B细胞、骨髓细胞(例如,树突细胞)、肥大细胞和NK细胞。例如,参见Yashiro-Ohtani等人(2010)Notch regulation of early thymocyte development,Seminars in Immunology 22:261-69。在一些实施方案中,本文所述的非人动物发育B细胞、骨髓细胞(例如,树突细胞)、肥大细胞和NK细胞。在一些实施方案中,本文所述的非人动物在胸腺中发育树突细胞群。
在T细胞表面表达的T细胞受体的主要类型是TCRα/β,少数细胞表达TCRδ/γ。在本发明的一些实施方案中,包含人源化TCRα和/或β基因座的非人动物的T细胞表现出对TCRα/β和TCRδ/γ基因座的利用,例如,对类似于野生型动物的TCRα/β和TCRδ/γ基因座的利用(例如,本文所述的非人动物的T细胞以与野生型动物所表达的同等比例表达TCRα/β和TCRδ/γ)。因此,在一些实施方案中,包含人源化TCRα/β和内源非人TCRδ/γ基因座的非人动物表现出对所有基因座的利用。
人或人源化MHC分子
在各种实施方案中,本文提供了共表达至少一种人源化T细胞辅助受体、至少一种与人源化T细胞辅助受体缔合的人源化MHC和任选地人源化TCR的基因修饰的非人动物,该人源化TCR在识别并结合由人源化MHC呈递的肽后,连同人源化辅助受体一起,向表达人源化TCR和嵌合T细胞辅助受体多肽的细胞提供激活信号。因此,本文公开的非人动物包含第一核酸序列、第二核酸序列和/或第三核酸序列中的至少一种,其中每一种核酸序列编码不同的人或人源化MHC多肽,该多肽选自由人或人源化MHC IIα多肽、人或人源化MHC IIβ多肽和人或人源化MHC Iα多肽组成的组;非人动物还任选地包含人或人源化β2微球蛋白。本文第一名称、第二名称和第三名称的使用不应解释为将本文公开的非人动物限制为需要所有三种核酸序列或存在任何特定顺序的任何人或人源化MHC多肽。
因此,在一些实施方案中,本文公开的非人动物可包含例如编码例如人或嵌合CD8α多肽和人或嵌合CD8β多肽的第一核苷酸序列和第二核苷酸序列,可操作地连接到非人TCRα恒定基因序列的包含至少一个人Vα区段和至少一个人Jα区段的未重排的T细胞受体(TCR)α可变基因的基因座和/或可操作地连接至非人TCRβ恒定基因序列的包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段的未重排的TCRβ可变基因座,以及任选地编码例如人或人源化MHC Iα多肽和人或人源化β2-微球蛋白多肽的第一核酸序列和第二核酸序列。在其他实施方案中,本文公开的非人动物可包含例如编码例如嵌合CD4多肽的第一核苷酸序列;可操作地连接至非人TCRα恒定基因序列的未重排的T细胞受体(TCR)α可变基因的基因座,该基因座包含至少一个人Vα区段和至少一个人Jα区段,和/或可操作地连接至非人TCRβ恒定基因序列的未重排的TCRβ可变基因的基因座,该基因座包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段;以及任选地编码例如人或人源化MHC IIα多肽和人或人源化MHC IIβ多肽的第一核酸序列和第二核酸序列。在一些实施方案中,本文公开的非人动物可包含例如编码例如嵌合CD4多肽、嵌合CD8α多肽和嵌合CD8β多肽的第一核苷酸序列、第二核苷酸序列和第三核苷酸序列;可操作地连接至非人TCRα恒定基因序列的未重排的T细胞受体(TCR)α可变基因的基因座,该基因座包含至少一个人Vα区段和至少一个人Jα区段,和/或可操作地连接至非人TCRβ恒定基因序列的未重排的TCRβ可变基因的基因座,该基因座包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段;以及任选地编码例如人或人源化MHC IIα多肽、人或人源化MHC IIβ多肽、人或人源化MHC Iα多肽和人或人源化β2-微球蛋白多肽的第一核酸序列、第二核酸序列、第三核酸序列和第四核酸序列。
在各种实施方案中,本文提供了一种基因修饰的非人动物,例如啮齿动物(例如,小鼠或大鼠),在其基因组中包含编码人或人源化MHC I多肽的核酸序列和/或编码人或人源化MHC II蛋白的核酸序列。MHC I核酸序列可编码部分是人的并且部分是非人的MHC I多肽,例如嵌合人/非人MHC I多肽,并且MHC II核酸序列可编码部分是人的并且部分是非人的MHC II蛋白,例如嵌合人/非人MHC II蛋白(例如,包含嵌合人/非人MHC IIα和β多肽)。在一些方面,动物在细胞表面不表达内源MHC I多肽和/或内源MHC II多肽,例如功能性内源MHC I多肽和/或MHC II多肽。在一些实施方案中,在动物细胞表面表达的仅有的MHC I和/或MHC II分子是嵌合MHC I和/或MHC II分子。
在美国专利公开第20130111617号和第20130185819号中公开了一种基因修饰的非人动物,在其基因组中,例如在内源基因座处包含编码嵌合人/非人MHC I多肽的核酸序列,这些公开通过引用整体并入本文。美国专利第8,847,005号和美国专利公开第20130185820号中公开了一种基因修饰的非人动物,在其基因组中,例如在内源基因座处包含编码人源化(例如嵌合)人/非人MHC II多肽的核酸序列,每个专利通过引用整体并入本文。在美国专利公开第20140245467号中公开了一种基因修饰的非人动物,在其基因组中,例如在内源基因座处包含编码嵌合人/非人MHC I多肽的核酸序列,并且在其基因组中,例如在内源基因座处包含编码人源化(例如嵌合)人/非人MHC II多肽的核酸序列,该专利通过引用整体并入本文。
在各种实施方案中,本文提供了一种基因修饰的非人动物,在其基因组中,例如在一个或多个内源MHC基因座处,包含编码嵌合人/非人MHC I多肽的第一核酸序列,其中嵌合MHC I多肽的人部分包含人MHC I多肽的胞外部分(或其一部分,例如一个或多个胞外结构域);编码嵌合人/非人MHC IIα多肽的第二核酸序列,其中嵌合MHC IIα多肽的人部分包含人MHC IIα多肽的胞外部分(或其一部分,例如一个或多个胞外结构域);和/或编码嵌合人/非人MHC IIβ多肽的第三核酸序列,其中嵌合MHC IIβ多肽的人部分包含人MHC IIβ多肽的胞外部分(或其一部分,例如一个或多个胞外结构域);其中非人动物从其内源非人MHC基因座表达功能性嵌合人/非人MHC I和MHC II蛋白。在一个实施方案中,第一核酸序列、第二核酸序列和/或第三核酸序列分别位于内源非人MHC I、MHC IIα和MHC IIβ基因座处。在一个实施方案中,其中非人动物是小鼠,第一核酸序列、第二核酸序列和/或第三核酸序列位于小鼠17号染色体上的内源小鼠MHC基因座处。在一个实施方案中,第一核酸序列位于内源非人MHC I基因座处。在一个实施方案中,第二核酸序列位于内源非人MHC IIα基因座处。在一个实施方案中,第三核酸序列位于内源非人MHC IIβ基因座处。
在一个实施方案中,非人动物仅表达嵌合人/非人MHC I、MHC IIα和/或MHCβII多肽,并且不从内源非人MHC基因座表达内源非人MHC多肽(例如,功能性内源MHC I、IIα和/或IIβ多肽)。在一个实施方案中,本文所述的动物在其细胞(例如抗原呈递细胞等)的表面表达功能性嵌合MHC I和功能性嵌合MHC II。在一个实施方案中,动物在细胞表面表达的仅有的MHC I和MHC II是嵌合MHC I和嵌合MHC II,并且动物在细胞表面不表达任何内源MHC I和MHC II。
在一个实施方案中,嵌合人/非人MHC I多肽在其人部分包含肽结合裂缝,例如人MHC I多肽的肽结合裂缝。在一个方面,嵌合多肽的人部分包含人MHC I的胞外部分。在该实施方案中,嵌合多肽的人部分包含人MHC I的α链的胞外结构域。在一个实施方案中,嵌合多肽的人部分包含人MHC I的α1和α2结构域。在另一个实施方案中,嵌合多肽的人部分包含人MHC I的α1、α2和α3结构域。
在一个方面,嵌合MHC IIα多肽的人部分和/或嵌合MHC IIβ多肽的人部分分别包含人MHC IIα多肽和/或人MHC IIβ多肽的肽结合结构域。在一个方面,嵌合MHC IIα和/或β多肽的人部分分别包含人MHC IIα和/或β多肽的胞外部分。在一个实施方案中,嵌合MHC IIα多肽的人部分包含人MHC IIα多肽的α1结构域;在另一个实施方案中,嵌合MHC IIα多肽的人部分包含人MHC IIα多肽的α1和α2结构域。在另一个实施方案中,嵌合MHC IIβ多肽的人部分包含人MHC IIβ多肽的β1结构域;在另一个实施方案中,嵌合MHC IIβ多肽的人部分包含人MHC IIβ多肽的β1和β2结构域。
在一些实施方案中,人或人源化MHC I多肽可源自由HLA-A、HLA-B、HLA-C、HLA-E、HLA-F或HLA-G基因座中的任一者编码的功能性人HLA分子。人或人源化MHC II多肽可源自由HLA-DP、HLA-DQ和HLA-DR基因座编码的功能性人HLA分子。常用的HLA抗原和等位基因的列表在Shankarkumar等人((2004)The Human Leukocyte Antigen(HLA)System,Int.J.Hum.Genet.4(2):91-103)中有描述,该文献通过引用并入本文。Shankarkumar等人还呈现了本领域中使用的HLA命名法的简要解释。关于HLA命名法和各种HLA等位基因的其他信息可以在Holdsworth等人(2009)The HLA dictionary 2008:a summary ofHLA-A,-B,-C,-DRB1/3/4/5,and DQB1 alleles and their association with serologicallydefined HLA-A,-B,-C,-DR,and–DQ antigens,Tissue Antigens 73:95-170,以及Marsh等人的最近更新(2010)Nomenclature for factors of the HLA system,2010,TissueAntigens 75:291-455中有描述,两者通过引用并入本文。在一些实施方案中,MHC I或MHCII多肽可源自任何功能性人HLA-A、B、C、DR或DQ分子。因此,人或人源化MHC I和/或II多肽可源自本文所述的任何功能性人HLA分子。在一些实施方案中,在细胞表面上表达的所有MHC I和MHC II多肽包含源自人HLA分子的部分。
特别感兴趣的是人HLA分子,即特异性多态性HLA等位基因,已知其与许多人类疾病,例如人类自身免疫疾病相关。事实上,已经鉴定出HLA基因座的特定多态性,与类风湿性关节炎、I型糖尿病、桥本氏甲状腺炎、多发性硬化、重症肌无力、格雷夫斯病、系统性红斑狼疮、乳糜泻、克罗恩病、溃疡性结肠炎和其他自身免疫病症的发展相关。参见例如,Wong andWen(2004)What can the HLA transgenic mouse tell us about autoimmunediabetes?,Diabetologia 47:1476-87;Taneja and David(1998)HLA Transgenic Miceas Humanized Mouse Models of Disease and Immunity,J.Clin.Invest.101:921-26;Bakker等人(2006),A high-resolution HLA and SNP haplotype map for diseaseassociation studies in the extended human MHC,Nature Genetics 38:1166-72andSupplementary Information;以及International MHC and Autoimmunity GeneticsNetwork(2009)Mapping of multiple susceptibility variants within the MHCregion for 7immune-mediated diseases,Proc.Natl.Acad.Sci.USA 106:18680-85。因此,人或人源化MHC I和/或II多肽可以源自已知与特定疾病例如自身免疫性疾病相关的人HLA分子。
在一个具体方面,人或人源化MHC I多肽源自人HLA-A。在一个具体实施方案中,HLA-A多肽是HLA-A2多肽(例如,和HLA-A2.1多肽)。在一个实施方案中,HLA-A多肽是由HLA-A*0201等位基因,例如HLA-A*02:01:01:01等位基因编码的多肽。HLA-A*0201等位基因在北美人群中常用。尽管本发明实施例描述了这种特定的HLA序列,但是本文涵盖任何合适的HLA-A序列,例如人类群体中表现出的HLA-A2的多态性变体、具有一个或多个保守或非保守氨基酸修饰的序列、由于遗传密码的简并性而不同于本文所述序列的核酸序列等。
在另一个具体方面,嵌合MHC I多肽的人部分源自选自HLA-B和HLA-C的人MHC I。在一个方面,它源自HLA-B,例如HLA-B27。在另一个方面,它源自HLA-A3、-B7、-Cw6等。
在一个具体方面,本文所述的人源化MHC IIα和β多肽的人部分源自人HLA-DR,例如HLA-DR2。通常,HLA-DRα链是单态的,例如,HLA-DR复合物的α链由HLA-DRA基因(例如,HLA-DRα*01基因)编码。另一方面,HLA-DRβ链是多态的。因此,HLA-DR2包含由HLA-DRA基因编码的α链和由HLA-DR1β*1501基因编码的β链。尽管本发明实施例描述了这些特定的HLA序列;但是本文涵盖任何合适的HLA-DR序列,例如人类群体中表现出的多态性变体、具有一个或多个保守或非保守氨基酸修饰的序列、由于遗传密码的简并性而不同于本文所述序列的核酸序列等。
嵌合MHC IIα和/或β多肽的人部分可由已知与常见人类疾病相关的HLA等位基因的核酸序列编码。此类HLA等位基因包括但不限于HLA-DRB1*0401、-DRB1*0301、-DQA1*0501、-DQB1*0201、DRB1*1501、-DRB1*1502、-DQB1*0602、-DQA1*0102、-DQA1*0201、-DQB1*0202、-DQA1*0501以及它们的组合。关于HLA等位基因/疾病关联的总结,参见Bakker等人(2006),见上文,通过引用并入本文。
在一个方面,嵌合人/非人MHC I、MHC IIα和/或MHC IIβ多肽的非人部分分别包含内源非人(例如啮齿动物,例如小鼠、大鼠等)MHC I、MHC IIα和/或MHC IIβ多肽的跨膜结构域和/或胞质结构域。因此,嵌合人/非人MHC I多肽的非人部分可以包含内源非人MHC I多肽的跨膜结构域和/或胞质结构域。嵌合MHC IIα多肽的非人部分可以包含内源非人MHC IIα多肽的跨膜结构域和/或胞质结构域。嵌合人/非人MHC IIβ多肽的非人部分可以包含内源非人MHC IIβ多肽的跨膜结构域和/或胞质结构域。在一个方面,非人动物是小鼠,并且嵌合MHC I多肽的非人部分源自小鼠H-2K蛋白。在一个方面,动物是小鼠,并且嵌合MHC IIα和β多肽的非人部分源自小鼠H-2E蛋白。因此,嵌合MHC I多肽的非人部分可以包含源自小鼠H-2K的跨膜结构域和胞质结构域,并且嵌合MHC IIα和β多肽的非人部分可以包含源自小鼠H-2E蛋白的跨膜结构域和胞质结构域。尽管在实施例中考虑了特定的H-2K和H-2E序列,但是本文涵盖任何合适的序列,例如多态性变体、保守/非保守性氨基酸取代等。在一个方面,非人动物是小鼠,并且该小鼠不从其H-2D基因座表达功能性内源MHC多肽。在一些实施方案中,该小鼠经工程改造为缺乏内源H-2D基因座的全部或一部分。在其他方面,该小鼠在细胞表面不表达任何功能性内源小鼠MHC I和MHC II。
嵌合人/非人多肽可以是这样的,使其包含人或非人前导(信号)序列。在一个实施方案中,嵌合MHC I多肽包含内源MHC I多肽的非人前导序列。在一个实施方案中,嵌合MHCIIα多肽包含内源MHC IIα多肽的非人前导序列。在一个实施方案中,嵌合MHC IIβ多肽包含内源MHC IIβ多肽的非人前导序列。在另一个实施方案中,嵌合MHC I、MHC IIα和/或MHC IIβ多肽包含分别来自另一非人动物,例如另一啮齿动物或另一小鼠品系的MHC I、MHC IIα和/或MHC IIβ多肽的非人前导序列。因此,编码嵌合MHC I、MHC IIα和/或MHC IIβ多肽的核酸序列可以分别可操作地连接至编码非人MHC I、MHC IIα和/或MHC IIβ前导序列的核酸序列。在另一个实施方案中,嵌合MHC I、MHC IIα和/或MHC IIβ多肽分别包含人MHC I、人MHCIIα和/或人MHC IIβ多肽的人前导序列(例如,分别为人HLA-A2、人HLA-DRα和/或人HLA-DRβ1*1501的前导序列)。
嵌合人/非人MHC I、MHC IIα和/或MHC IIβ多肽在其人部分中可以分别包含人MHCI、人MHC IIα和/或人MHC IIβ多肽的完整的或基本上完整的胞外结构域。因此,人部分可包含编码人MHC I、人MHC IIα和/或人MHC IIβ多肽(例如,人HLA-A2、人HLA-DRα和/或人HLA-DRβ1*1501)的胞外结构域的至少80%、优选至少85%、更优选至少90%、例如95%或更多的氨基酸。在一个实例中,人MHC I、人MHC IIα和/或人MHC IIβ多肽的基本上完整的胞外结构域缺少人前导序列。在另一个实例中,嵌合人/非人MHC I、嵌合人/非人MHC IIα和/或嵌合人/非人MHC IIβ多肽包含人前导序列。
而且,嵌合MHC I、MHC IIα和/或MHC IIβ多肽可以分别可操作地连接至内源非人启动子和调控元件,例如,小鼠MHC I、MHC IIα和/或MHC IIβ调控元件(例如,在内源非人启动子和调控元件的调控下表达)。此类排列将有利于嵌合MHC I和/或MHC II多肽在非人动物中的正确表达,例如在非人动物的免疫应答期间。
在另一个实施方案中,本发明的非人动物,例如啮齿动物,例如小鼠,包含(例如,在内源β2微球蛋白基因座处)编码人或人源化β2微球蛋白的核酸序列。β2微球蛋白或MHC I类复合物的轻链(也缩写为“β2M”)是一种小的(12kDa)非糖基化蛋白,其主要功能是稳定MHC Iα链。人或人源化β2微球蛋白动物的产生在美国专利公开第20130111617号中有详细描述,并且通过引用并入本文。
编码人或人源化β2微球蛋白多肽的核苷酸序列可包含对应于整个人β2微球蛋白基因的核酸残基。可替代地,核苷酸序列可包含编码人β2微球蛋白的氨基酸21-119中所示的氨基酸序列(即,对应于成熟人β2微球蛋白的氨基酸残基)的核酸残基。在一个替代实施方案中,核苷酸序列可包含编码人β2微球蛋白蛋白质的氨基酸23-115中所示的氨基酸序列(例如,人β2微球蛋白蛋白质的氨基酸23-119中所示的氨基酸序列)的核酸残基。人β2微球蛋白的核酸序列和氨基酸序列在通过引用并入本文的Gussow等人中有所描述,见上文。
因此,人或人源化β2微球蛋白多肽可包含人β2微球蛋白多肽的氨基酸23-115中所示的氨基酸序列,例如人β2微球蛋白多肽的氨基酸23-119中所示的氨基酸序列,例如人β2微球蛋白多肽的氨基酸21-119中所示的氨基酸序列。可替代地,人β2微球蛋白可包含人β2微球蛋白多肽的氨基酸1-119。
在一些实施方案中,编码人或人源化β2微球蛋白的核苷酸序列包含人β2微球蛋白基因的外显子2至外显子4中所示的核苷酸序列。可替代地,核苷酸序列包含人β2微球蛋白基因的外显子2、3和4中所示的核苷酸序列。在该实施方案中,外显子2、3和4中所示的核苷酸序列可操作地连接,以允许基因的正常转录和翻译。因此,在一个实施方案中,人序列包含对应于人β2微球蛋白基因的外显子2至外显子4的核苷酸序列。在一个具体实施方案中,人序列包含对应于人β2微球蛋白基因的外显子2至外显子4后约267bp的核苷酸序列。在一个具体实施方案中,人序列包含约2.8kb的人β2微球蛋白基因。
因此,人或人源化β2微球蛋白多肽可由包含人β2微球蛋白外显子2至外显子4中所示的核苷酸序列的核苷酸序列,例如,对应于人β2微球蛋白基因的外显子2至外显子4的核苷酸序列编码。可替代地,多肽可由包含人β2微球蛋白基因的外显子2、3和4中所示的核苷酸序列的核苷酸序列编码。在一个具体实施方案中,人或人源化β2微球蛋白多肽由对应于人β2微球蛋白基因的外显子2至外显子4后约267bp的核苷酸序列编码。在另一个具体实施方案中,人或人源化多肽由包含约2.8kb的人β2微球蛋白基因的核苷酸序列编码。由于β2微球蛋白基因的外显子4含有5’非翻译区,人或人源化多肽可以由包含β2微球蛋白基因的外显子2和3的核苷酸序列编码。
本领域的普通技术人员应当理解,尽管本文描述了产生基因工程改造的动物的特定核酸和氨基酸序列,但是也提供了一个或多个保守或非保守性氨基酸取代的序列,或者由于遗传密码的简并性而不同于本文所述那些序列的序列。
因此,提供了一种表达人β2微球蛋白序列的非人动物,其中β2微球蛋白序列与人β2微球蛋白序列至少约85%、90%、95%、96%、97%、98%或99%相同。在一个具体实施方案中,β2微球蛋白序列与本文所述的人β2微球蛋白序列至少约90%、95%、96%、97%、98%或99%相同。在一个实施方案中,人β2微球蛋白序列包含一个或多个保守性取代。在一个实施方案中,人β2微球蛋白序列包含一个或多个非保守性取代。
另外,提供了非人动物,其中编码人或人源化β2微球蛋白蛋白质的核苷酸序列还包含非人β2微球蛋白基因的外显子1中所示的核苷酸序列。因此,在一个具体实施方案中,非人动物在其基因组中包含编码人或人源化β2微球蛋白的核苷酸序列,其中该核苷酸序列包含非人β2微球蛋白的外显子1和人β2微球蛋白基因的外显子2、3和4。因此,人或人源化β2微球蛋白多肽由非人β2微球蛋白基因的外显子1和人β2微球蛋白基因的外显子2、3和4(例如,人β2微球蛋白基因的外显子2和3)编码。
在一个实施方案中,本发明的非人动物(例如啮齿动物,例如小鼠)除了编码嵌合CD8蛋白的核苷酸序列之外,还包含编码人或人源化MHC I蛋白的核酸序列,使得在动物T细胞表面表达的嵌合CD8蛋白能够与在第二细胞(例如,抗原呈递细胞)表面表达的人或人源化MHC I缔合、结合和/或相互作用。在一个实施方案中,MHC I蛋白包含人MHC I多肽的胞外结构域。在一个实施方案中,该动物还包含人或人源化β2微球蛋白多肽。表达人或人源化MHC I多肽和/或β2微球蛋白多肽的示例性基因修饰动物在美国专利公开第20130111617号和第20130185819号中有描述,两个专利通过引用整体并入本文。因此,在一个实施方案中,包含本文所述的嵌合CD8蛋白的动物还可包含人源化MHC I复合物,其中该人源化MHC I复合物包含:(1)人源化MHC I多肽,例如,其中该人源化MHC I多肽包含人MHC I胞外结构域及内源(例如,小鼠)MHC I的跨膜结构域和胞质结构域,例如,其中该人源化MHC I包含人MHCI多肽的α1、α2和α3结构域,以及(2)人或人源化β2微球蛋白多肽(例如,该动物在其基因组中包含人β2微球蛋白的外显子2、3和4中所示的核苷酸序列)。在一个方面,人源化MHC I和人或人源化β2微球蛋白多肽两者分别由位于内源MHC I和β2微球蛋白基因座的核苷酸序列编码;在一个方面,动物不表达功能性内源MHC I和β2微球蛋白多肽。因此,由动物表达的MHC I可以是嵌合人/非人,例如人/啮齿动物(例如人/小鼠)MHC I多肽。嵌合MHC I多肽的人部分可以源自选自由HLA-A、HLA-B和HLA-C组成的组的人HLA I类蛋白,例如HLA-A2、HLA-B27、HLA-B7、HLA-Cw6或人类群体中存在的任何其他HLA I类分子。在其中动物是小鼠的实施方案中,嵌合MHC I多肽的非人(即小鼠)部分可以源自选自H-2D、H-2K和H-2L的小鼠MHCI蛋白。
在一个实施方案中,本发明的非人动物(例如啮齿动物,例如小鼠)还包含编码人或人源化MHC II蛋白的核苷酸序列,使得在动物T细胞表面表达的嵌合CD4蛋白能够与在第二细胞(例如,抗原呈递细胞)表面表达的人或人源化MHC II相互作用。在一个实施方案中,MHC II蛋白包含人MHC IIα多肽的胞外结构域和人MHC IIβ多肽的胞外结构域。表达人或人源化MHC II多肽的示例性基因修饰动物在2014年9月30日发布的美国专利第8,847,005号和美国专利公开第20130185820号中有描述,两个专利通过引用整体并入本文。因此,在一个实施方案中,包含本文所述的嵌合CD4蛋白的动物还可包含人源化MHC II蛋白,其中该人源化MHC II蛋白包含:(1)人源化MHC IIα多肽,该人源化MHC II多肽包含人MHC IIα胞外结构域及内源(例如小鼠)MHC II的胞外结构域和跨膜结构域,其中人MHC IIα胞外结构域包含人MHC IIα的α1和α2结构域,以及(2)人源化MHC IIβ多肽,该人源化MHC II多肽包含人MHC IIβ胞外结构域及内源(例如小鼠)MHC II的跨膜结构域和胞质结构域,其中人MHC IIβ胞外结构域包含人MHC IIβ的β1和β2结构域。在一个方面,人源化MHC IIα和β多肽两者分别由位于内源MHC IIα和β基因座处的核酸序列编码;在一个方面,动物不表达功能性内源MHCIIα和β多肽。因此,由动物表达的MHC II可以是嵌合人/非人,例如人/啮齿动物(例如人/小鼠)MHC II多肽。嵌合MHC II蛋白的人部分可以源自选自由HLA-DR、HLA-DQ和HLA-DP组成的组的人HLA II类蛋白,例如HLA-DR4、HLA-DR2、HLA-DQ2.5、HLA-DQ8或人类群体中存在的任何其他HLA II类分子。在其中动物是小鼠的实施方案中,嵌合MHC II多肽的非人(即小鼠)部分可以源自选自H-2E和H-2A的小鼠MHC II蛋白。
基因修饰的非人动物(例如啮齿动物,例如大鼠或小鼠)的各种其他实施方案对本领域技术人员来说从本公开内容以及通过引用并入的美国专利公开第20130111617号、第20130185819号和第20130185820号以及美国专利第8,847,005号的公开内容显而易见。
在各种实施方案中,本文所述的基因修饰的非人动物产生细胞,例如APC,这些细胞在细胞表面具有人或人源化MHC I和II,因此以类似人的方式呈递肽作为T细胞的表位,因为该复合物的基本上所有组分都是人或人源化的。本发明的基因修饰的非人动物可用于研究人源化动物中人类免疫系统的功能;用于鉴定引发免疫应答的抗原和抗原表位(例如T细胞表位,例如独特的人类癌症表位),例如用于疫苗开发;用于评价疫苗候选物和其他疫苗策略;用于研究人类自身免疫;用于研究人类传染性疾病;以及以其他方式用于设计基于人MHC表达的更佳治疗策略。
非人动物、组织和细胞
本发明的基因修饰的非人动物可选自小鼠、大鼠、兔、猪、牛(例如母牛、公牛、水牛)、鹿、绵羊、山羊、鸡、猫、狗、雪貂、灵长类动物(例如,狨猴、恒河猴)。对于不容易获得合适的可基因修饰的ES细胞的非人动物,采用其他方法来产生包含基因修饰的非人动物。此类方法包括,例如,修饰非ES细胞基因组(例如,成纤维细胞或诱导多能细胞)并采用核转移将经过修饰的基因组转移至合适的细胞(例如,卵母细胞),并在合适的条件下在非人动物中孕育经过修饰的细胞(例如,经过修饰的卵母细胞)以形成胚胎。
在一个方面,非人动物是哺乳动物。在一个方面,非人动物是小型哺乳动物,例如,跳鼠总科(Dipodoidea)或鼠总科(Muroidea)的小型哺乳动物。在一个实施方案中,基因修饰的动物是啮齿动物。在一个实施方案中,该啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方案中,该啮齿动物选自鼠总科。在一个实施方案中,基因修饰的动物来自选自以下的科:丽仓鼠科(Calomyscidae)(例如,小鼠样仓鼠)、仓鼠科(Cricetidae)(例如,仓鼠、新世界大鼠和小鼠、田鼠)、鼠科(Muridae)(真小鼠和大鼠、沙鼠、多刺小鼠、有冠毛的大鼠)、马岛鼠科(Nesomyidae)(攀鼠、岩鼠、白尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(Platacanthomyidae)(例如,多刺睡鼠)和鼹形鼠科(Spalacidae)(例如,鼹鼠、竹鼠和鼢鼠)。在一个具体实施方案中,基因修饰的啮齿动物选自真小鼠或大鼠(鼠科)、沙鼠、多刺小鼠和有冠毛的大鼠。在一个实施方案中,基因修饰的小鼠来自鼠科成员。在一个实施方案中,动物是啮齿动物。在一个具体实施方案中,啮齿动物选自小鼠和大鼠。在一个实施方案中,非人动物是小鼠。
在一个具体实施方案中,非人动物是啮齿动物,即选自C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL品系的小鼠。在另一个实施方案中,小鼠是选自由以下品系组成的组的129品系:129P1、129P2、129P3、129X1、129S1(例如,129S1/SV、129S1/SvIm)、129S2、129S4、129S5、129S9/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1、129T2(参见,例如,Festing等人(1999)Revised nomenclature for strain 129mice,MammalianGenome 10:836,还参见,Auerbach等人(2000)Establishment and Chimera Analysis of129/SvEv-and C57BL/6-Derived Mouse Embryonic Stem Cell Lines)。在一个实施方案中,基因修饰的小鼠是前述129品系和前述C57BL/6品系的混合。在另一个具体实施方案中,小鼠是前述129品系的混合,或前述BL/6品系的混合。在一个具体实施方案中,该混合的129品系是129S6(129/SvEvTac)品系。在另一个实施方案中,小鼠是BALB品系,例如BALB/c品系。在另一个实施方案中,小鼠是BALB品系和另一前述品系的混合。如本文提供的非人动物可以是源自前述品系的任何组合的小鼠。
在一个实施方案中,非人动物是大鼠。在一个实施方案中,大鼠选自Wistar大鼠、LEA品系、Sprague Dawley品系、Fischer品系、F344、F6和Dark Agouti。在一个实施方案中,大鼠品系是选自由Wistar、LEA、Sprague Dawley、Fischer、F344、F6和Dark Agouti组成的组的两种或多种品系的混合。
因此,在本发明的一个实施方案中,提供了一种基因修饰的小鼠,其中该小鼠例如在其基因组中,例如在其种系基因组中,包含(a)编码第一嵌合人/鼠T细胞辅助受体多肽(例如,CD4)的第一核苷酸序列,编码第二嵌合人/鼠T细胞辅助受体多肽(例如,CD8α)的第二核苷酸序列,和/或编码第三嵌合人/鼠T细胞辅助受体多肽(例如,CD8β)的第三核苷酸序列,其中每种嵌合T细胞辅助受体多肽的鼠部分至少包含鼠T细胞辅助受体的跨膜结构域和胞质结构域,其中每种嵌合多肽的人部分包含人T细胞辅助受体的胞外部分(或其一部分,例如一个或多个胞外结构域),并且其中该小鼠表达第一、第二和/或第三嵌合T细胞辅助受体多肽;(b)可操作地连接至鼠TCRα恒定基因序列的未重排的T细胞受体(TCR)α可变基因的基因座,该基因座包含至少一个人Vα区段和至少一个人Jα区段,和/或可操作地连接至鼠TCRβ恒定基因序列的未重排的TCRβ可变基因的基因座,该基因座包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段;和任选地,(c)编码第一嵌合人/鼠MHC多肽(例如,MHC IIα)的第一核酸序列,编码第二嵌合人/鼠MHC多肽(例如,MHC IIβ)的第二核酸序列和/或编码第三嵌合人/鼠MHC多肽(例如,MHC I)的第三核酸序列和编码人或人源化β2微球蛋白的β2微球蛋白基因座,其中每个嵌合MHC多肽的人部分包含与第一、第二和/或第三嵌合T细胞辅助受体多肽缔合的人MHC多肽的胞外结构域(例如,其中嵌合MHC II复合物(例如,人源化MHC IIα和β多肽)的人部分与嵌合CD4多肽缔合和/或嵌合MHC I多肽(或MHC I复合物,例如,人源化MHC Iα和人(人源化)β2微球蛋白与嵌合CD8辅助受体(例如,人源化CD8α和β多肽)缔合。
本文提供了一种基因修饰的小鼠,在其基因组中,例如在其内源CD4基因座处,包含编码嵌合人/小鼠CD4多肽的核苷酸序列,其中嵌合多肽的小鼠部分至少包含小鼠CD4多肽的跨膜结构域和胞质结构域,并且其中该小鼠表达嵌合人/小鼠CD4。在一个实施方案中,嵌合多肽的人部分包含人CD4多肽的至少整个或基本上整个胞外结构域。在一个实施方案中,嵌合多肽的人部分包含人CD4蛋白的至少整个或基本上整个D1结构域。在一个实施方案中,嵌合多肽的人部分包含人CD4蛋白的D1-D2结构域中的至少全部或基本上全部,例如人CD4蛋白的D1-D3结构域中的至少全部或基本上全部,例如人CD4蛋白的D1-D4结构域中的全部或基本上全部。因此,在一个实施方案中,小鼠在内源CD4基因座处包含核苷酸序列,该核苷酸序列包含人CD4基因的外显子4、外显子5和外显子6中的至少全部或基本上全部,例如编码人CD4的D1结构域的一部分的人CD4基因外显子3的序列和人CD4基因的外显子4-6。在一个实施方案中,小鼠在内源CD4基因座处包含嵌合人/小鼠CD4,其包含负责与MHC II和/或T细胞受体的胞外部分相互作用的人CD4序列。在另一个实施方案中,小鼠在内源CD4基因座处包含嵌合人/小鼠CD4,其包含负责与MHC II和/或T细胞受体可变区相互作用的人CD4序列。在一个实施方案中,核苷酸序列包含编码小鼠CD4信号肽的序列。在一个实施方案中,小鼠包含编码小鼠CD4胞外结构域的核苷酸序列被编码人CD4胞外结构域的核苷酸序列置换。在另一个实施方案中,小鼠包含编码至少整个或基本上整个小鼠CD4 D1结构域的核苷酸序列,例如编码小鼠CD4 D1-D2结构域中的至少全部或基本上全部的核苷酸序列,例如编码小鼠CD4D1-D3结构域中的至少全部或基本上全部的核苷酸序列被编码这些结构域的人核苷酸序列置换。在一个实施方案中,嵌合CD4多肽的结构域由图5A中示意性表示的核苷酸序列编码。
在一个实施方案中,小鼠不从其内源小鼠CD4基因座表达功能性内源小鼠CD4。在一个实施方案中,本文所述的小鼠在小鼠的种系中包含嵌合人/小鼠CD4核苷酸序列。
在一个实施方案中,小鼠保留任何尚未人源化的内源序列,例如,在其中小鼠包含编码D1-D3结构域中的全部或基本上全部的核苷酸序列的置换的实施方案中,小鼠保留编码小鼠CD4 D4结构域的内源核苷酸序列以及编码小鼠CD4的跨膜结构域和胞质结构域的核苷酸序列。
在一个方面,表达嵌合人/小鼠CD4蛋白的小鼠保留小鼠CD4启动子和调控序列,例如,小鼠中编码嵌合人/小鼠CD4的核苷酸序列可操作地连接至内源小鼠CD4启动子和调控序列。在一个方面,保留在本发明的基因工程改造的动物中的这些小鼠调控序列包括在T细胞发育的适当阶段调控嵌合蛋白的表达的序列。因此,在一个方面,小鼠不在B细胞或成熟CD8+T细胞上表达嵌合CD4。在一个方面,小鼠在通常不表达内源CD4的任何细胞类型,例如任何免疫细胞类型上也不表达嵌合CD4。
本文公开的基因修饰的小鼠可在其基因组中,例如在其内源CD8基因座处,包含编码嵌合人/小鼠CD8α多肽的第一核苷酸序列和编码嵌合人/小鼠CD8β多肽的第二核苷酸序列。在一个实施方案中,第一核苷酸序列包含编码人CD8α多肽的整个或基本上整个胞外部分和小鼠CD8α多肽的至少跨膜结构域和胞质结构域的序列,并且第二核苷酸序列包含编码人CD8β多肽的整个或基本上整个胞外部分和小鼠CD8β多肽的至少跨膜结构域和胞质结构域的序列,并且其中小鼠表达功能性嵌合人/小鼠CD8蛋白。在一个实施方案中,第一核苷酸序列包含至少编码人CD8α多肽的免疫球蛋白V样结构域和小鼠CD8α多肽的剩余序列的序列,并且第二核苷酸序列包含至少编码人CD8β多肽的免疫球蛋白V样结构域和小鼠CD8β多肽的剩余序列的序列。在一个实施方案中,第一核苷酸序列至少包含人CD8α多肽的MHC I结合结构域。在一个实施方案中,第一核苷酸序列和第二核苷酸序列至少分别包含编码人CD8α多肽和/或CD8β多肽的胞外部分的外显子。在一个实施方案中,人CD8α多肽和/或CD8β多肽的胞外部分是涵盖人CD8α多肽和/或CD8β多肽的非跨膜结构域或胞质结构域的部分的区域。在一个实施方案中,嵌合CD8α多肽的结构域由图5B中示意性表示的核苷酸序列编码。在一个实施方案中,嵌合CD8β多肽的结构域由图5B中示意性表示的核苷酸序列编码。在一个实施方案中,编码嵌合人/小鼠CD8α多肽和/或CD8β多肽的核苷酸序列分别包含编码小鼠CD8α和/或CD8β信号肽的序列。可替代地,核苷酸序列可以包含编码人CD8α和/或CD8β信号序列的序列。在一个实施方案中,小鼠包含编码整个或基本上整个小鼠CD8α和/或CD8β胞外结构域的核苷酸序列分别被编码整个或基本上整个人CD8α和/或CD8β胞外结构域的核苷酸序列置换。
在一个实施方案中,小鼠不从其内源CD8基因座表达功能性内源小鼠CD8α和/或CD8β多肽。在一个实施方案中,如本文所述的小鼠在其种系中包含嵌合人/小鼠CD8序列。
在一个方面,表达嵌合人/小鼠CD8α和/或CD8β多肽的小鼠保留小鼠CD8α和/或CD8β启动子和调控序列,例如,小鼠中编码嵌合人/小鼠CD8的核苷酸序列可操作地连接至内源小鼠CD8启动子和调控序列。在一个方面,保留在小鼠中的这些调控序列包括在T细胞发育的适当阶段调控CD8蛋白表达的序列。在一个方面,基因修饰的小鼠在B细胞或成熟CD4+T细胞或通常不表达内源CD8的任何细胞(例如,免疫细胞)上不表达嵌合CD8。
本发明还提供了一种基因修饰的小鼠,在其基因组中包含未重排的人或人源化的TCR可变基因的基因座,例如TCRα、TCRβ、TCRδ和/或TCRγ可变基因的基因座。在一些实施方案中,未重排的人或人源化TCR可变基因的基因座置换内源小鼠TCR可变基因的基因座。在其他实施方案中,未重排的人或人源化TCR可变基因的基因座处于基因组中除相应的内源小鼠TCR基因座以外的位点。在一些实施方案中,人或人源化的未重排的TCR可变基因的基因座可操作地连接至小鼠TCR恒定区。
在一个实施方案中,提供了一种基因修饰的小鼠,其中该小鼠在其基因组中包含可操作地连接至小鼠TCRα恒定基因序列的未重排的T细胞受体(TCR)α可变基因的基因座,该基因座包含至少一个人Vα区段和至少一个人Jα区段,和可操作地连接至小鼠TCRβ恒定基因序列的未重排的TCRβ可变基因的基因座,该基因座包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段。在一个具体实施方案中,该小鼠在其基因组中包含可操作地连接至小鼠TCRα恒定基因序列的未重排的TCRα可变基因的基因座,该基因座包含完整的人Vα区段组库和完整的人Jα区段组库;和可操作地连接至小鼠TCRβ恒定基因序列的未重排的TCRβ可变基因的基因座,该基因座包含完整的人Vβ区段组库、完整的人Dβ区段组库和完整的人Jβ区段组库。
在一些实施方案中,包含人TCRα可变区区段的未重排的TCRα可变基因的基因座置换内源小鼠TCRα可变基因的基因座,并且包含人TCRβ可变区区段的未重排的TCRβ可变基因的基因座置换内源小鼠TCRβ可变基因的基因座。在一些实施方案中,内源小鼠Vα和Jα区段不能重排形成重排的Vα/Jα序列,并且内源小鼠Vβ、Dβ和Jβ区段不能重排形成重排的Vβ/Dβ/Jβ序列。在一些实施方案中,人Vα和Jα区段重排形成重排的人Vα/Jα序列,并且人Vβ、Dβ和Jβ区段重排形成重排的人Vβ/Dβ/Jβ序列。
本发明还涉及一种基因修饰的小鼠,在其基因组中包含编码嵌合MHC多肽的核酸序列,其中嵌合MHC多肽的人部分与本文公开的嵌合T细胞辅助受体的人胞外结构域缔合。本文公开的基因修饰的小鼠可包含编码嵌合人/小鼠MHC I的第一核酸序列,编码嵌合人/小鼠MHC IIα的第二核酸序列,和/或编码嵌合人/小鼠MHC IIβ多肽的第三核酸序列。嵌合MHC I、MHC IIα,和/或MHC IIβ的人部分可以分别包含人MHC I、MHC IIα和MHC IIβ的胞外结构域。在一个实施方案中,小鼠从其内源小鼠MHC基因座表达功能性嵌合人/小鼠MHC I、MHC IIα和MHC IIβ多肽。在一个实施方案中,小鼠不从其内源小鼠MHC基因座表达功能性小鼠MHC多肽,例如功能性小鼠MHC I、MHC IIα和MHC IIβ多肽。在其他实施方案中,小鼠在细胞表面表达的仅有的MHC I和MHC II是嵌合MHC I和II。
在一个实施方案中,嵌合人/小鼠MHC I多肽的人部分包含人MHC I的肽结合结构域或胞外结构域(例如,人HLA-A,例如,人HLA-A2,例如,人HLA-A2.1)。在一些实施方案中,小鼠不从其内源小鼠MHC I基因座表达内源小鼠MHC I多肽的肽结合结构域或胞外结构域。人MHC I的肽结合结构域可以包含α1和α2结构域。可替代地,人MHC I的肽结合结构域可以包含α1、α2和α3结构域。在一个方面,人MHC I的胞外结构域包含人MHC Iα链的胞外结构域。在一个实施方案中,内源小鼠MHC I基因座是H-2K(例如,H-2Kb)基因座,并且嵌合MHC I多肽的小鼠部分包含小鼠H-2K(例如,H-2Kb)多肽的跨膜结构域和胞质结构域。因此,在一个实施方案中,本发明的小鼠在其内源小鼠MHC I基因座处包含编码嵌合人/小鼠MHC I的核酸序列,其中嵌合多肽的人部分包含人HLA-A2(例如,HLA-A2.1)多肽的胞外结构域,并且小鼠部分包含小鼠H-2K(例如,H-2Kb)多肽的跨膜结构域和胞质结构域,并且小鼠表达嵌合人/小鼠HLA-A2/H-2K蛋白。在其他实施方案中,嵌合MHC I多肽的小鼠部分可源自其他小鼠MHC I,例如H-2D、H-2L等;并且嵌合MHC I多肽的人部分可源自其他人MHC I,例如HLA-B、HLA-C等。在一个方面,小鼠不从其内源小鼠H-2K基因座表达功能性内源H-2K多肽。在一个实施方案中,小鼠不从其H-2D基因座表达功能性内源MHC多肽。在一些实施方案中,该小鼠经工程改造为缺乏内源H-2D基因座的全部或一部分。在其他实施方案中,小鼠在细胞表面表达的仅有的MHC I多肽是嵌合人/小鼠MHC I多肽。
在一个实施方案中,嵌合人/小鼠MHC IIα多肽的人部分包含人MHC IIα肽结合结构域或胞外结构域,并且嵌合人/小鼠MHC IIβ多肽的人部分包含人MHC IIβ肽结合结构域或胞外结构域。在一些实施方案中,小鼠不从内源小鼠基因座(例如,H-2A和/或H-2E基因座)表达内源小鼠α和/或β多肽的肽结合结构域或胞外结构域。在一些实施方案中,小鼠包含缺乏编码包含H-2Ab1、H-2Aa、H-2Eb1、H-2Eb2、H-2Ea及它们的组合的功能性MHC II类分子的基因的基因组。在一些实施方案中,小鼠在细胞表面表达的仅有的MHC II多肽是嵌合人/小鼠MHC II多肽。人MHC IIα多肽的肽结合结构域可包含α1结构域,并且人MHC IIβ多肽的肽结合结构域可包含β1结构域;因此,嵌合MHC II复合物的肽结合结构域可以包含人α1和β1结构域。人MHC IIα多肽的胞外结构域可包含α1和α2结构域,并且人MHC IIβ多肽的胞外结构域可包含β1和β2结构域;因此,嵌合MHC II复合物的胞外结构域可包含人α1、α2、β1和β2结构域。在一个实施方案中,嵌合MHC II复合物的小鼠部分包含小鼠MHC II,例如小鼠H-2E的跨膜结构域和细胞溶质结构域(例如,小鼠H-2Eα和β链的跨膜结构域和细胞溶质结构域)。因此,在一个实施方案中,本发明的小鼠在其内源小鼠MHC II基因座处包含编码嵌合人/小鼠MHC IIα的核酸序列,其中嵌合MHC IIα多肽的人部分包含源自人MHC IIα链(例如,HLA-DR2的α链)的胞外结构域,并且小鼠部分包含源自小鼠MHC II(例如,H-2E)的α链的跨膜结构域和胞质结构域;并且小鼠在其内源小鼠MHC II基因座处包含编码嵌合人/小鼠MHC IIβ的核酸序列,其中嵌合MHC IIβ多肽的人部分包含源自人MHC IIβ链(例如,HLA-DR2的β链)的胞外结构域,并且小鼠部分包含源自小鼠MHC II(例如,H-2E)的β链的跨膜结构域和胞质结构域;例如,其中小鼠表达嵌合人/小鼠HLA-DR2/H-2E蛋白。在其他实施方案中,嵌合MHC I蛋白的小鼠部分可源自其他小鼠MHC II,例如H-2A等;并且嵌合MHC II多肽的人部分可源自其他人MHC II,例如HLA-DQ等。在一个方面,小鼠不从其内源小鼠基因座表达功能性内源H-2A和H-2E多肽(例如,小鼠不表达H-2Ab1、H-2Aa、H-2Eb1、H-2Eb2和H-2Ea多肽)。在一些实施方案中,小鼠在细胞表面缺乏任何内源MHC I或MHC II分子的表达。
除了至少一种人源化T细胞辅助受体、至少一种与人源化T细胞辅助受体缔合的人源化MHC和任选地人源化TCR之外,本文所述的基因修饰的非人动物也可以表达人或人源化β2微球蛋白。在各个方面,由基因修饰的非人动物或源自非人动物的细胞、胚胎或组织表达的人或人源化β2微球蛋白保持内源和/或人β2微球蛋白的所有功能方面。例如,优选人或人源化β2微球蛋白结合MHC I多肽(例如,内源非人或人MHC I多肽)的α链。人或人源化β2微球蛋白多肽可结合、募集或以其他方式缔合任何其他分子,例如与内源非人和/或人β2微球蛋白(例如,HFE等)缔合的受体、锚或信号传导分子。
除了基因修饰的动物(例如啮齿动物,例如小鼠或大鼠)之外,还提供了一种组织或细胞,其中该组织或细胞源自本文所述的非人动物,并且包含异源β2微球蛋白基因或β2微球蛋白序列,即核苷酸和/或氨基酸序列。在一个实施方案中,异源β2微球蛋白基因或β2微球蛋白序列是人或人源化的β2微球蛋白基因或人或人源化的β2微球蛋白序列。优选地,该细胞是有核细胞。该细胞可以是已知表达MHC I复合物的任何细胞,例如抗原呈递细胞。由所述细胞表达的人或人源化β2微球蛋白多肽可与内源非人MHC I(例如啮齿动物MHC I)相互作用,以形成功能性MHC I复合物。所得MHC I复合物可能能够与T细胞,例如细胞毒性T细胞相互作用。因此,还提供了来自如本文所述的非人动物的细胞和T细胞的体外复合物。
还提供了非人细胞,这些非人细胞包含人或人源化β2微球蛋白基因或序列,以及另外的人或人源化序列,例如目前公开的嵌合MHC I多肽。在此类情况下,人或人源化β2微球蛋白多肽可以与例如嵌合人/非人MHC I多肽相互作用,并且可以形成功能性MHC I复合物。在一些方面,此类复合物能够与T细胞,例如人或非人T细胞上的TCR相互作用。因此,还提供了来自如本文所述的非人动物的细胞和人或非人T细胞的体外复合物。
本公开的另一方面是包含如本文所述的异源β2微球蛋白基因或β2微球蛋白序列的啮齿动物胚胎(例如,小鼠或大鼠胚胎)。在一个实施方案中,该胚胎包含ES供体细胞和宿主胚胎细胞,该ES供体细胞包含异源β2微球蛋白基因或β2微球蛋白序列。异源β2微球蛋白基因或β2微球蛋白序列是人或人源化β2微球蛋白基因或β2微球蛋白序列。
本发明还涵盖包含如本文所述的非人动物的染色体或其片段的非人细胞(例如,其中该染色体或其片段包含编码人或人源化β2微球蛋白多肽的核苷酸序列)。非人细胞可以包含如本文所述的非人动物的细胞核。在一个实施方案中,非人细胞由于核移植而包含该染色体或其片段。
在一个方面,提供了一种包含异源β2微球蛋白基因或β2微球蛋白序列的非人诱导多能细胞。在一个实施方案中,诱导多能细胞源自如本文所述的非人动物。在一个实施方案中,异源β2微球蛋白基因或β2微球蛋白序列是人或人源化基因或序列。
在本发明的一些实施方案中,本文所述的小鼠仅在小鼠的专职性抗原呈递细胞,例如B细胞、单核细胞/巨噬细胞和/或树突细胞上表达嵌合人/小鼠MHC II。在一些实施方案中,本文所述的小鼠引发针对一种或多种人类抗原的免疫应答,例如细胞免疫应答。在一些实施方案中,本文所述的小鼠引发针对一种或多种人类抗原的人源化T细胞应答。
除了基因工程改造的非人动物之外,还提供了一种非人胚胎(例如啮齿动物胚胎,例如小鼠或大鼠胚胎),其中该胚胎包含源自如本文所述的非人动物(例如啮齿动物,例如小鼠或大鼠)的供体ES细胞。在一个方面,该胚胎包含ES供体细胞和宿主胚胎细胞,该ES供体细胞包含嵌合CD4基因、嵌合CD8(例如,CD8α和/或CD8β)基因、人源化MHC I(例如,MHC Iα)核酸序列、人源化MHC II(例如,MHC IIα和/或MHC IIβ)核酸序列、未重排的人源化TCR(例如,TCRα和/或TCRβ或TCRδ和/或TCRγ)基因座和/或人或人源化β2微球蛋白基因序列。
还提供了一种组织,其中该组织源自如本文所述的非人动物(例如啮齿动物,例如小鼠或大鼠),并且表达嵌合CD4蛋白、嵌合CD8蛋白(例如,嵌合CD8α和/或CD8β蛋白)、人源化TCR多肽(例如,TCRα和/或TCRβ或TCRδ和/或γTCR多肽)、人源化MHC I多肽(例如,MHC Iα)、人源化MHC II多肽(例如,MHC IIα和/或MHC IIβ多肽)和/或人或人源化β2微球蛋白。
在一个方面,提供了一种制备嵌合人/非人CD4分子的方法,该方法包括在单细胞中从如本文所述的核苷酸构建体表达嵌合CD4蛋白。在一个实施方案中,该核苷酸构建体是病毒载体;在一个具体实施方案中,该病毒载体是慢病毒载体。在一个实施方案中,该细胞选自CHO、COS、293、HeLa和表达病毒核酸序列的视网膜细胞(例如,PERC.6TM细胞)。
在一个方面,提供了一种表达嵌合CD4蛋白的细胞。在一个实施方案中,该细胞包含含有如本文所述的嵌合CD4序列的表达载体。在一个实施方案中,该细胞选自CHO、COS、293、HeLa和表达病毒核酸序列的视网膜细胞(例如,PERC.6TM细胞)。
还提供了一种由如本文所述的非人动物制备的嵌合CD4分子,其中,在一个实施方案中,嵌合CD4分子包含人CD4蛋白的整个或基本上整个胞外结构域的氨基酸序列,以及来自非人CD4蛋白,例如小鼠CD4蛋白的至少跨膜结构域和胞质结构域。在另一个实施方案中,提供了一种由如本文所述的非人动物制备的嵌合CD4分子,其中该嵌合CD4分子包含人CD4的至少整个或基本整个D1结构域的氨基酸序列,例如人CD4的D1-D2结构域中的至少全部或基本上全部,例如人CD4的D1-D3结构域中的至少全部或基本上全部的氨基酸序列,例如负责结合MHC II和/或TCR胞外结构域的人CD4的氨基酸序列,例如负责结合MHC II和/或TCR可变结构域的人CD4的氨基酸序列;并且其中该蛋白质的剩余部分(例如,跨膜结构域、胞质结构域、尚未人源化的胞外区的任何部分)源自内源非人蛋白质序列。示例性的嵌合人/非人CD4多肽包含SEQ ID NO:78中所示的氨基酸序列,并且嵌合多肽的人部分跨越SEQ IDNO:78的大约氨基酸27-319(在SEQ ID NO:79中单独示出)。
在一个方面,提供了一种制备嵌合人/非人CD8分子(例如,CD8α和/或CD8β)的方法,该方法包括在单细胞中从如本文所述的核苷酸构建体表达嵌合CD8多肽。在一个实施方案中,该核苷酸构建体是病毒载体;在一个具体实施方案中,该病毒载体是慢病毒载体。在一个实施方案中,该细胞选自CHO、COS、293、HeLa和表达病毒核酸序列的视网膜细胞(例如,PERC.6TM细胞)。
在一个方面,提供了一种表达嵌合CD8蛋白的细胞。在一个实施方案中,该细胞包含含有如本文所述的嵌合CD8序列的表达载体。在一个实施方案中,该细胞选自CHO、COS、293、HeLa和表达病毒核酸序列的视网膜细胞(例如,PERC.6TM细胞)。
还提供了一种由如本文所述的非人动物制备的嵌合CD8分子,其中嵌合CD8分子包含来自人CD8蛋白(例如,CD8α和/或CD8β)的整个或基本上整个胞外结构域,以及来自非人CD8蛋白(例如,小鼠CD8蛋白)的至少跨膜结构域和胞质结构域。示例性嵌合CD8α多肽在SEQID NO:88中示出,并且示例性嵌合CD8β蛋白在SEQ ID NO:83中示出。
还提供了一种由如本文所述的非人动物(例如啮齿动物,例如小鼠或大鼠)制备的人源化TCR蛋白,其中人源化TCR蛋白包含人可变区和非人恒定区。因此,人源化TCR蛋白在其可变结构域中包含人互补决定区(即,人CDR1、2和3)并且包含非人恒定区。还提供了编码本文所述的非人动物产生的人TCR可变结构域的核酸。
另外,提供了一种从如本文所述的非人动物分离的非人细胞。在一个实施方案中,该细胞是ES细胞。在一个实施方案中,该细胞是T细胞,例如CD4+T细胞。在一个实施方案中,该细胞是辅助T细胞(TH细胞)。在一个实施方案中,TH细胞是效应TH细胞,例如TH1细胞或TH2细胞。在一个实施方案中,该细胞是CD8+T细胞。在一个实施方案中,该细胞是细胞毒性T细胞。还提供了一种表达包含人可变区和非人恒定区的TCR蛋白的非人细胞。TCR蛋白可包含TCRα、TCRβ或它们的组合。在一个实施方案中,该细胞是T细胞,例如CD4+或CD8+T细胞。另外,如本文提供的非人T细胞可在其细胞表面表达(a)嵌合人/非人T细胞辅助受体,例如嵌合CD4多肽或嵌合CD8多肽,其包含可操作地连接至非人T细胞辅助受体跨膜结构域和/或胞内结构域的人T细胞辅助受体胞外结构域;和(b)包含人可变区和非人恒定区的TCR蛋白。
在另一个实施方案中,该细胞是抗原呈递细胞。在一个实施方案中,抗原呈递细胞在人源化MHC I分子上呈递抗原。在另一个实施方案中,抗原呈递细胞是专职性抗原呈递细胞,例如B细胞、树突细胞和巨噬细胞。在另一个实施方案中,抗原呈递细胞在人源化MHC I分子和/或人源化MHC II分子上呈递抗原。
在一个方面,提供了一种表达嵌合人/非人MHC I和MHC II蛋白(例如,HLA-A2/H-2K和HLA-DR2/H-2E蛋白)的细胞。在一个方面,该细胞是不会从其H-2D基因座表达功能性内源MHC多肽的小鼠细胞。在一些实施方案中,该细胞是经工程改造为缺乏内源H-2D基因座的全部或一部分的小鼠细胞。在一些实施方案中,该细胞是在其表面不表达任何功能性内源MHC I和MHC II多肽的小鼠细胞。在一个实施方案中,该细胞包含表达载体,该表达载体包含如本文所述的嵌合MHC I类序列和嵌合MHC II类序列。在一个实施方案中,该细胞选自CHO、COS、293、HeLa和表达病毒核酸序列的视网膜细胞(例如,PERC.6TM细胞)。
可以通过抗HLA-DR抗体检测包含本文所述的HLA-DR2胞外结构域的嵌合MHC II复合物。因此,可以使用抗HLA-DR抗体检测和/或选择展示嵌合人/非人MHC II多肽的细胞。可以使用抗HLA-A,例如抗HLA-A2抗体来检测包含本文所述的HLA-A2胞外结构域的嵌合MHC I复合物。因此,可以使用抗HLA-A抗体检测和/或选择展示嵌合人/非人MHC I多肽的细胞。识别其他HLA等位基因的抗体可以商购获得或者可以产生,并且可以用于检测/选择。
尽管下面的实施例描述了一种基因工程改造的动物,其基因组包含编码小鼠H-2K及H-2A和H-2E蛋白的核酸序列分别被编码嵌合人/小鼠HLA-A2/H-2K和HLA-DR2/H-2E蛋白的核酸序列置换,但是本领域的技术人员应该理解,可以使用类似策略引入包含其他人MHCI和II基因(其他HLA-A、HLA-B和HLA-C;以及其他HLA-DR、HLA-DP和HLA-DQ基因)的嵌合体。还提供了在内源MHC基因座处包含多个嵌合人/非人(例如,人/啮齿动物,例如,人/小鼠)MHC I和MHC II基因的此类动物。此类嵌合MHC I和MHC II蛋白的实例在美国公开第20130111617号、第20130185819号、第20130185820号和第20140245467号以及美国专利第8,847,005号中有描述,这些专利中的每一个均通过引用并入本文。
还提供了一种包含如本文所述的非人动物的染色体或其片段的非人细胞。在一个实施方案中,该非人细胞包含如本文所述的非人动物的细胞核。在一个实施方案中,非人细胞由于核移植而包含该染色体或其片段。
在一个方面,提供了一种非人诱导多能细胞,其包含编码嵌合CD4多肽的基因、编码嵌合CD8多肽(例如,CD8α和/或CD8β多肽)的基因、编码人源化MHC I多肽(例如,MHC Iα和/或β2微球蛋白)的基因、编码人源化MHC II多肽(例如,MHC IIα和/或MHC IIβ)的基因和/或编码如本文所述的人源化TCRα和/或TCRβ多肽的未重排的人源化TCR基因座。在一个实施方案中,诱导多能细胞源自如本文所述的非人动物。
在一个方面,提供了一种源自如本文所述的非人动物的细胞的杂交瘤或四价体瘤。在一个实施方案中,非人动物是小鼠或大鼠。
制备产生基本上人源化的T细胞免疫应答的基因修饰的非人动物
还提供了一种制备本文所述的基因工程改造的非人动物(例如,基因工程改造的啮齿动物,例如小鼠或大鼠)的方法。通常,该方法包括(a)将编码嵌合人/非人T细胞辅助受体多肽的第一核苷酸序列,编码第二嵌合人/非人T细胞辅助受体多肽的第二核苷酸序列,和/或编码第三嵌合人/非人T细胞辅助受体多肽的第三核苷酸序列引入非人动物的基因组中,其中每个嵌合T细胞辅助受体多肽的非人部分至少包含非人T细胞辅助受体的跨膜结构域和胞质结构域,并且其中每个嵌合多肽的人部分包含人T细胞辅助受体的胞外部分(或其一部分);(b)向非人动物的基因组中插入可操作地连接至非人TCRα恒定基因序列的未重排的T细胞受体(TCR)α可变基因的基因座,该基因座包含至少一个人Vα区段和至少一个人Jα区段,和/或可操作地连接至非人TCRβ恒定基因序列的未重排的TCRβ可变基因的基因座,该基因座包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段;以及任选地(c)将编码第一嵌合人/非人MHC多肽的第一核酸序列、编码第二嵌合人/非人MHC多肽的第二核酸序列和/或编码第三嵌合人/非人MHC多肽的第三核酸序列放置在基因组中,和/或(d)向非人动物的基因组中添加编码人或人源化β2微球蛋白多肽的β2微球蛋白基因座。在一些实施方案中,引入、插入和/或放置的步骤包括靶向编码T细胞辅助受体的胞外结构域、TCR的可变结构域、MHC多肽的胞外结构域或β2微球蛋白的一部分的序列,并将它们分别用编码人T细胞辅助受体胞外结构域、人TCR可变结构域、人MHC胞外结构域和/或β2微球蛋白的人部分的序列置换。
在其他实施方案中,引入、插入、放置和/或添加可以包括同一物种的动物的繁殖,例如交配。在其他实施方案中,引入、插入、放置和/或添加包括在ES细胞中的依次同源重组。在一些实施方案中,ES细胞源自非人动物,这些非人动物经基因修饰为包含一种或多种但非所有的期望基因修饰,并且在此类ES细胞中的同源重组完成基因修饰。在其他实施方案中,引入、插入、放置和/或添加可包括在ES细胞中繁殖和同源重组的组合,例如,将一只动物与同一物种的另一只(或多只)动物繁殖,其中一些或所有动物可由经单一同源重组或依次同源重组事件基因修饰的ES细胞产生,并且其中一些ES细胞可从包含本文公开的基因修饰中的一种或多种基因修饰的非人动物中分离。
在一些实施方案中,如实施例中所述,该方法利用使用技术制备的靶向构建体,将该构建体引入ES细胞,并且使用技术将靶向的ES细胞克隆引入小鼠胚胎中。靶向构建体可包含靶向待置换的内源序列的5’和/或3’同源臂、插入序列(置换内源序列)和一个或多个选择盒。选择盒是插入到靶向构建体中以利于选择已经整合了目标构建体的细胞(例如,ES细胞)的核苷酸序列。许多合适的选择盒是本领域已知的。通常,选择盒使得能够在特定抗生素(例如,Neo、Hyg、Pur、CM、SPEC等)的存在下进行阳性选择。另外,选择盒的侧翼可以是重组位点,这允许选择盒在用重组酶处理时缺失。常用的重组位点是分别被Cre和Flp酶识别的loxP和Frt,但本领域已知其他位点。选择盒可以位于构建体中编码区外的任何地方。在一个实施方案中,选择盒位于人DNA片段的5’末端。在另一个实施方案中,选择盒位于人DNA片段的3’末端。在另一个实施方案中,选择盒位于人DNA片段内。在另一个实施方案中,选择盒位于人DNA片段的内含子内。在另一个实施方案中,选择盒位于人和小鼠DNA片段的连接处。
在一个实施方案中,制备基因工程改造的非人动物的方法产生在内源CD4基因座处包含编码嵌合人/非人CD4多肽的核苷酸序列的动物。在一个实施方案中,本发明包括修饰非人动物CD4基因座以表达本文所述的嵌合人/非人CD4多肽的方法。在一个实施方案中,本发明提供了一种修饰小鼠CD4基因座以表达嵌合人/小鼠CD4多肽的方法,该方法包括在非人动物例如小鼠的内源CD4基因座处引入编码嵌合人/小鼠CD4多肽的核苷酸序列,例如用编码嵌合人/小鼠CD4多肽的核苷酸序列置换编码内源非人CD4多肽的核苷酸序列。在该方法的一个方面,嵌合人/小鼠CD4多肽包含人CD4多肽的整个或基本上整个胞外结构域和内源小鼠CD4多肽的至少跨膜结构域和胞质结构域。在该方法的另一个方面,嵌合人/小鼠CD4多肽包含人CD4多肽的D1-D2结构域中的全部或基本上全部。在另一个实施方案中,嵌合人/小鼠CD4多肽包含人CD4多肽的D1-D3结构域中的全部或基本上全部。在另一个实施方案中,嵌合人/小鼠CD4多肽包含负责与MHC II和/或T细胞受体胞外结构域相互作用的人CD4的整个或基本上整个氨基酸序列。在另一个实施方案中,嵌合人/小鼠CD4多肽包含负责与MHC II和/或T细胞受体可变结构域相互作用的人CD4的整个或基本上整个氨基酸序列。
因此,提供了一种用于产生包含嵌合人/非人CD4的基因修饰的动物的核苷酸构建体。在一个方面,核苷酸序列包含5’和3’同源臂、包含人CD4基因序列的DNA片段(例如,人CD4胞外结构域基因序列,例如,人CD4的D1-D2结构域中的全部或基本上全部的基因序列,例如,人CD4的D1-D3结构域和/或D2-D3结构域中的全部或基本上全部的基因序列,例如,人CD4的D1-D4结构域中的全部或基本上全部的基因序列)以及侧翼为重组位点的选择盒。在一个实施方案中,人CD4基因序列是包含人CD4内含子和外显子的基因组序列。在一个实施方案中,同源臂与非人(例如,小鼠)CD4基因组序列同源。图5A中描绘了本发明的示例性构建体。
在一些实施方案中,该方法产生在内源CD8基因座处包含编码嵌合人/非人CD8α和/或CD8β多肽的核苷酸序列的动物。在一个实施方案中,本发明提供了一种修饰非人动物CD8基因座以表达本文所述的嵌合人/非人CD8多肽的方法。在一个方面中,提供了一种修饰小鼠CD8基因座以表达嵌合人/小鼠CD8多肽的方法,该方法包括在非人动物例如小鼠的内源CD8基因座处引入编码嵌合人/小鼠CD8多肽的核苷酸序列,例如用编码嵌合人/小鼠CD8多肽的核苷酸序列置换编码内源非人CD8多肽的核苷酸序列。CD8多肽可选自CD8α、CD8β及它们的组合。在一个方面,嵌合多肽包含人CD8多肽的整个或基本上整个胞外结构域和内源小鼠CD8多肽的至少跨膜结构域和胞质结构域。
因此,还提供了一种用于产生包含人/非人CD8的基因修饰的动物的核苷酸构建体。在一个方面,该核苷酸构建体的序列包含5’和3’同源臂、包含人CD8α或CD8β序列的DNA片段,以及侧翼为重组位点的选择盒。在一些实施方案中,人序列包含人CD8α或CD8β的内含子和外显子,例如,分别编码人CD8α或CD8β胞外结构域的外显子。在一个实施方案中,同源臂与非人CD8α或CD8β序列同源。在图5B中描绘了CD8α和CD8β的示例性构建体。
因为编码CD8α和CD8β的基因的紧密染色体定位,所以这两种基因的依次靶向增加了成功人源化的机会。在一个实施方案中,靶向策略包括将本文所述的嵌合CD8β构建体引入ES细胞中,从靶向的ES细胞产生小鼠,从所述小鼠得到基因修饰的ES细胞,并将本文所述的嵌合CD8α构建体引入所述基因修饰的ES细胞中。在另一个实施方案中,靶向策略包括将本文所述的嵌合CD8β构建体引入ES细胞中,选择已经整合了嵌合CD8β构建体的细胞,将本文所述的嵌合CD8α构建体引入已经整合并且正携带嵌合CD8β构建体的ES细胞,并且选择已经整合了嵌合CD8β和CD8α两者的细胞。在该实施方案的一个方面,利用不同的选择标志物进行选择步骤。在替代实施方案中,可以首先完成CD8α人源化。基因靶向完成后,可筛选基因修饰的非人类动物的ES细胞,以通过本领域已知的多种方法(例如,Valenzuela等人(2003)High-throughput engineering of the mouse genome coupled with high-resolution expression analysis,Nature Biotech.21(6):652-659中描述的等位基因修饰测定)来确认目标外源核苷酸序列的成功掺入或外源多肽的表达。
在一些实施方案中,用于制备基因修饰的非人动物的方法产生其基因组包含人源化的未重排的TCR基因座(例如,人源化的未重排的TCRα、TCRβ、TCRδ和/或TCRγ基因座)的动物。在一个实施方案中,提供了一种制备表达T细胞受体的基因修饰的非人动物(例如啮齿动物,例如小鼠或大鼠)的方法,该T细胞受体包含T细胞表面上的人可变区和非人(例如啮齿动物,例如小鼠或大鼠)恒定区,其中该方法包括在第一非人动物中插入包含至少一个人Vα区段和至少一个人Jα区段的未重排的人源化TCRα可变基因的基因座,例如用未重排的人源化TCR可变基因的基因座置换内源非人TCRα可变基因的基因座,其中人源化TCRα可变基因的基因座可操作地连接至内源TCRα恒定区;在第二非人动物中插入包含至少一个人Vβ区段、一个人Dβ区段和一个人Jβ区段的未重排的人源化TCRβ可变基因的基因座,例如用未重排的人源化TCR可变基因的基因座置换内源非人TCRβ可变基因的基因座,其中人源化TCRβ可变基因的基因座可操作地连接至内源TCRβ恒定区;并且使第一非人动物和第二非人动物繁殖以获得表达包含人可变区和非人恒定区的T细胞受体的非人动物。在其他实施方案中,本发明提供了制备基因组包含人源化的未重排的TCRα基因座的基因修饰的非人动物,或基因组包含人源化的未重排的TCRβ基因座的非人动物的方法。在各种实施方案中,在内源基因座处进行置换。在各种实施方案中,该方法包括渐进式人源化策略,其中在人源化的每个后续步骤中将包含另外的可变区区段的构建体引入ES细胞中,最终产生包含完整的人可变区区段组库和全人TCRBDJ1和TCRBDJ2簇的小鼠(参见,例如图4A和图4B)。本文所述的一些方法实施方案包括(1)用包含人TRBD1和人TRBJ1-1至TRBJ1-6基因区段以及非人(例如,小鼠)tcrbdj1非编码序列(包括非编码重组信号序列(RSS)和其他非基因间序列)的核酸序列置换内源非人(例如,小鼠)tcrbdj1序列,其中人TRBD1和人TRBJ1-1至TRBJ1-6基因区段位于相同的非人(例如,小鼠)tcrbdj1 TCR非编码序列的侧翼,正如通常侧翼是非人(例如,小鼠)Trbd1和非人(例如,小鼠)Trbj1-1至Trbj1-6基因区段和/或(2)用包含人TRBD2和人TRBJ2-1至TRBJ2-7基因区段以及小鼠tcrbdj2非编码序列的核酸序列置换内源非人(例如,小鼠)tcrbdj2序列,其中人TRBD2和人TRBJ2-1至TRBJ2-7基因区段位于相同的小鼠Tcrbdj2非编码序列的侧翼,正如通常侧翼是小鼠Trbd2和小鼠Trbj2-1至Trbj2-7基因区段。在一些实施方案中,此类置换分别导致包含人TRBD1和人TRBJ1-1至TRBJ1-6基因区段和非人(例如,小鼠)tcrbdj1非编码序列(包括非编码重组信号序列(RSS)和其他非基因间序列)的核酸序列与非人(例如,小鼠)tcrbc1恒定区序列的可操作连接和/或包含人TRBD2和人TRBJ2-1至TRBJ2-7基因区段和小鼠TCRBDJ2非编码序列(包括非编码重组信号序列(RSS)和其他非基因间序列)的序列与非人(例如,小鼠)tcrbc2恒定区序列的可操作连接(参见,图4C)。在此类实施方案中,所得到的小鼠可包含可操作地连接至TCRBDJ1和TCRBDJ2簇的人TCRB可变区区段的一个至完整组库,其中可保留将基因区段分隔开的内源TCRA和/或TCRB非编码序列,例如非编码DNA(例如,非编码重组信号序列(RSS)和其他非编码基因间序列)。
本公开还提供了一种修饰非人动物的TCR可变基因的基因座(例如,TCRα、TCRβ、TCRδ和/或TCRγ基因的基因座)以表达本文所述的人源化TCR蛋白的方法。在一个实施方案中,本发明提供了一种修饰TCR可变基因的基因座以在T细胞表面表达人源化TCR蛋白的方法,其中该方法包括在非人动物中插入未重排的人源化TCR可变基因的基因座,例如用未重排的人源化TCR可变基因的基因座置换内源非人TCR可变基因的基因座。在一个实施方案中,其中TCR可变基因的基因座是TCRα可变基因的基因座,未重排的人源化TCR可变基因的基因座包含至少一个人Vα区段和至少一个人Jα区段。在一个实施方案中,其中TCR可变基因的基因座是TCRβ可变基因的基因座,未重排的人源化TCR可变基因的基因座包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段。在各个方面,未重排的人源化TCR可变基因的基因座可操作地连接至相应的内源非人TCR恒定区。
因此,还提供了用于产生包含人源化TCR可变区基因的基因修饰的动物的核苷酸构建体。在一个方面,核苷酸构建体包含:5’和3’同源臂、包含人TCR可变区基因区段的人DNA片段,以及侧翼为重组位点的选择盒。在一个实施方案中,人DNA片段是TCRα基因片段,并且它包含至少一个人TCRα可变区区段。在另一个实施方案中,人DNA片段是TCRβ片段,并且它包含至少一个人TCRβ可变区基因区段。在一个方面,至少一个同源臂是非人同源臂,并且它与非人TCR基因座(例如,非人TCRα或TCRβ基因座)同源。在另一个实施方案中,人DNA片段是TCRβ片段,并且它包含至少一个人TCRβ可变区基因区段。在一个实施方案中,人DNA片段是TCRα基因片段,并且它包含至少一个人TCRα可变区区段。
在一些实施方案中,核苷酸构建体包含:
(i)5’和3’同源臂,
(ii)包含人TRBD1及人TRBJ1-1至TRBJ1-6基因区段和非人(例如,小鼠)tcrbdj1非编码序列(包括非编码重组信号序列(RSS)和其他非基因间序列)的组合的核酸序列,其中人TRBD1和人TRBJ1-1至TRBJ1-6基因区段位于相同的非人(例如,小鼠)tcrbdj1 TCR非编码序列的侧翼,正如通常侧翼是非人(例如,小鼠)Trbd1和非人(例如,小鼠)Trbj1-1至Trbj1-6基因区段,和/或
(iii)包含人TRBD2及人TRBJ2-1至TRBJ2-7基因区段和小鼠tcrbdj2非编码序列的核酸序列,其中人TRBD2和人TRBJ2-1至TRBJ2-7基因区段位于相同的小鼠Tcrbdj2非编码序列的侧翼,正如通常侧翼是小鼠Trbd2和小鼠Trbj2-1至Trbj2-7基因区段,以及
任选地,
(iv)介于以下两者之间的非人(例如,小鼠)trbc1基因序列:(ii)包含人TRBD1及人TRBJ1-1至TRBJ1-6基因区段和非人(例如,小鼠)tcrbdj1非编码序列(包括非编码重组信号序列(RSS)和其他非基因间序列)的组合的核酸序列,和(iii)包含人TRBD2及人TRBJ2-1至TRBJ2-7基因区段和小鼠tcrbdj2非编码序列(包括非编码重组信号序列(RSS)和其他非基因间序列)的核酸序列,和/或
(v)侧翼为重组位点的选择盒。
在一个方面,至少一个同源臂是非人同源臂,并且它与非人TCR基因座(例如,非人TCRα或TCRβ基因座)同源。
在本发明的各个方面,编码嵌合人/非人MHC I和MHC II多肽的序列位于内源非人MHC基因座(例如,小鼠H-2K和/或H-2E基因座)处。在一个实施方案中,这导致编码人或人源化MHC I多肽的核酸序列的放置,例如编码人或人源化MHC I多肽的核酸序列置换内源MHC基因或其一部分。由于编码MHC I、MHC IIα和MHC IIβ多肽的核酸序列彼此靠近地位于染色体上,为了在一只动物中获得MHC I和MHC II两者人源化的最大成功,应该依次靶向MHC I基因座和MHC II基因座。因此,本文还提供了产生基因修饰的非人动物的方法,该基因修饰的非人动物包含编码如本文所述的嵌合人/非人MHC I、MHC IIα和MHC IIβ多肽的核酸序列。
因此,提供了一种用于产生包含嵌合人/非人MHC的基因修饰的动物的核苷酸构建体。在一个方面,该核酸构建体包含:5’和3’非人同源臂、包含人类MHC基因序列(例如,人HLA-A2或人HLA-DR基因序列)的人DNA片段,以及侧翼为重组位点的选择盒。在一个实施方案中,人DNA片段是包含人MHC基因(例如,人HLA-A2或HLA-DR2基因)的内含子和外显子两者的基因组片段。在一个实施方案中,非人同源臂与非人MHC基因座(例如,MHC I基因座或MHCII基因座)同源。
在一个实施方案中,5’和3’非人同源臂分别包含内源非人(例如,鼠)MHC I类或II类基因的基因座的5’和3’位置(例如,小鼠MHC I基因的第一前导序列的5’和α3外显子的3’,或小鼠H-2Ab1基因的上游和小鼠H-2Ea基因的下游)的基因组序列。在一个实施方案中,内源MHC I类基因座选自小鼠H-2K、H-2D和H-2L。在一个具体实施方案中,内源MHC I类基因座是小鼠H-2K。在一个实施方案中,内源MHC II基因座选自小鼠H-2E和H-2A。在一个实施方案中,工程改造的MHC II构建体允许置换小鼠H-2E和H-2A基因两者。在一个实施方案中,小鼠不从其H-2D基因座表达功能性内源MHC多肽。在一些实施方案中,该小鼠经工程改造为缺乏内源H-2D基因座的全部或一部分。在另一个实施方案中,小鼠在细胞表面不表达任何功能性内源MHC I和MHC II多肽。在一个实施方案中,小鼠在细胞表面表达的仅有的MHC I和MHC II是嵌合人/小鼠MHC I和MHC II。
本公开还提供了制备基因工程改造的非人动物(例如,基因工程改造的啮齿动物,例如小鼠或大鼠)的方法,基因工程改造的非人动物的基因组包含编码人或人源化β2微球蛋白多肽的β2微球蛋白基因座。在一个方面,这些方法产生基因工程改造的啮齿动物,例如小鼠,它们的基因组在内源β2微球蛋白基因座处包含编码人或人源化β2微球蛋白多肽的核苷酸序列。在一些情况下,小鼠不从内源小鼠β2微球蛋白基因座表达功能性小鼠β2微球蛋白。在一些方面,如本文所述,这些方法利用例如使用技术制备的靶向构建体,将该构建体引入ES细胞,并且例如使用技术将靶向的ES细胞克隆引入小鼠胚胎中。
还提供了一种用于产生基因工程改造的非人动物的核苷酸构建体。该核苷酸构建体可包含:5’和3’非人同源臂、包含人β2微球蛋白序列的人DNA片段,以及侧翼为重组位点的选择盒。在一个实施方案中,人DNA片段是包含人β2微球蛋白基因的内含子和外显子两者的基因组片段。在一个实施方案中,非人同源臂与非人β2微球蛋白基因座同源。该基因组片段可包含人β2微球蛋白基因的外显子2、3和4。在一个示例中,该基因组片段从5’到3’包含:外显子2、内含子、外显子3、内含子和外显子4,整个人β2微球蛋白序列。选择盒可以位于构建体中β2微球蛋白编码区外的任何地方,例如,它可以位于人β2微球蛋白外显子4的3’。5’和3’非人同源臂可分别包含内源非人β2微球蛋白基因5’和3’的基因组序列。在另一个实施方案中,5’和3’非人同源臂分别包含内源非人基因外显子2的5’和外显子4的3’的基因组序列。
本发明的另一方面涉及一种修饰非人动物(例如啮齿动物,例如小鼠或大鼠)的β2微球蛋白基因座以表达本文所述的人或人源化β2微球蛋白多肽的方法。一种修饰非人动物(例如,小鼠)的β2微球蛋白基因座以表达人或人源化β2微球蛋白多肽的方法,包括在内源β2微球蛋白基因座处用编码人或人源化β2微球蛋白多肽的核苷酸序列置换编码小鼠β2微球蛋白的核苷酸序列。在此类方法的一个实施方案中,非人动物(例如,小鼠)不从内源非人(例如,小鼠)β2微球蛋白基因座表达功能性β2微球蛋白多肽。在一些具体实施方案中,编码人或人源化β2微球蛋白多肽的核苷酸序列包含人β2微球蛋白基因的外显子2至外显子4中所示的核苷酸序列。在其他实施方案中,编码人或人源化β2微球蛋白多肽的核苷酸序列包含人β2微球蛋白基因的外显子2、3和4中所示的核苷酸序列。
本文所述的人源化基因座的各种示例性实施方案在附图中呈现并在实施例中有描述。
基因靶向完成后,筛选ES细胞或基因修饰的非人动物,以确认目标外源核苷酸序列的成功掺入或外源多肽的表达。许多技术是本领域技术人员已知的,包括(但不限于)Southern印迹、长PCR、定量PCR(例如,使用的实时PCR)、荧光原位杂交、Northern印迹、流式细胞术、Western分析、免疫细胞化学、免疫组织化学等。在一个实例中,带有目标基因修饰的非人动物(例如,小鼠)可以通过使用Valenzuela等人(2003)High-throughput engineering of the mouse genome coupled with high-resolutionexpression analysis,Nature Biotech.21(6):652-659中描述的等位基因修饰测定法来筛选小鼠等位基因的丢失和/或人等位基因的获得来鉴定。本领域技术人员已知鉴定基因修饰的动物中的特定核苷酸或氨基酸序列的其他测定法。
在一些实施方案中,本文通过繁殖产生动物。
在一个非限制性方面,例如,包含本文所述的嵌合人/非人CD8和人源化MHC I和/或β2微球蛋白的非人动物可通过使包含本文所述的嵌合CD8基因座(例如,嵌合CD8α和/或β基因座)的动物与包含人源化MHC I和/或β2微球蛋白基因座的动物繁殖来产生。该动物还可以通过向包含人源化MHC I和/或β2微球蛋白基因座的动物的ES细胞中引入编码嵌合CD8(例如,嵌合CD8α和/或β),的核苷酸序列,例如,用于在内源CD8基因座处进行置换(例如,嵌合CD8α和/或β基因座);或向包含嵌合CD8基因座(例如,嵌合CD8α和/或β基因座)的动物的ES细胞中引入编码人源化MHC I和/或β2微球蛋白的核苷酸序列。
在一些实施方案中,包含嵌合CD8基因座的动物可以首先与包含人源化TCR可变基因的基因座的动物繁殖,以产生包含人源化CD8和TCR可变区基因座的动物,然后该动物可以与包含人源化MHC I和/或β2微球蛋白基因座的动物繁殖,以产生包含人源化MHC I、TCR可变基因和/或β2微球蛋白基因座的动物。可替代地,包含人源化MHC I和/或β2微球蛋白基因座的动物可以首先与包含人源化TCR可变基因的基因座的动物繁殖,以产生包含人源化MHC I和TCR可变区基因座的动物,然后该动物可以与包含嵌合CD8基因座的动物繁殖,产生分别包含人源化MHC I、TCR可变基因和/或β2微球蛋白基因座的动物。
在一个方面,包含嵌合人/非人CD4和人源化MHC II的非人动物可以通过使包含如本文所述的嵌合CD4基因座的动物与包含人源化MHC II基因座的动物繁殖来产生。该动物也可以通过以下方式产生:向包含人源化MHC II基因座的动物的ES细胞中引入编码嵌合CD4的核苷酸序列,例如,用于在内源CD4基因座处进行置换;或向包含嵌合CD4基因座的动物的ES细胞中引入编码人源化MHC II的核苷酸序列。
在一些实施方案中,包含嵌合CD4基因座的动物可以首先与包含人源化TCR可变基因的基因座的动物繁殖,以产生包含人源化CD4和TCR可变区基因座的动物,然后该动物可以与包含人源化MHC II基因座的动物繁殖,以产生包含人源化CD4、MHC II和TCR可变基因的基因座的动物。可替代地,包含人源化MHC II基因座的动物可以首先与包含人源化TCR可变基因的基因座的动物繁殖,以产生包含人源化MHC II和TCR可变区基因座的动物,然后该动物可以与包含嵌合CD4基因座的动物繁殖,产生分别包含人源化MHC II、TCR可变基因和/或β2微球蛋白基因座的动物。
在一些实施方案中,将包含本文所述的嵌合人/非人CD8和人源化MHC I和/或β2微球蛋白的非人动物与包含本文所述的嵌合CD4基因座的动物和包含人源化MHC II基因座的动物繁殖,以产生包含嵌合CD4和CD8多肽及人源化MHC I(和/或β2微球蛋白)和MHC II分子的非人动物。在一些实施方案中,将包含嵌合人/非人CD4和CD8多肽以及人源化MHC I和MHCII分子的动物与包含人源化TCR可变结构域的动物繁殖,以产生包含基本上人源化的T细胞免疫系统,例如嵌合人/非人CD4和CD8多肽、人源化MHC I(和/或β2微球蛋白)和MHC II分子以及人源化TCR可变结构域的动物。
本文所述的任何基因修饰的非人动物(例如,小鼠)可包含编码嵌合人/非人CD8的基因(例如,CD8α和/或CD8β)的一个或两个拷贝;嵌合人/非人CD4;人或人源化MHC I;人或人源化β2微球蛋白;人或人源化MHC II(例如,MHC IIα和/或MHC IIβ);和人或人源化TCR(例如,TCRα和/或TCRβ)。因此,对于任何或所有这些基因而言,动物可以是杂合的或纯合的。
使用产生基本上人源化的T细胞免疫应答的基因修饰的非人动物
包含人源化CD4和MHC II或人源化CD8和MHC I(和β2微球蛋白)或两者的基因修饰的非人动物(例如啮齿动物,例如小鼠或大鼠),以类似人的方式向T细胞(分别为CD4+或CD8+T细胞)呈递肽,因为该复合物的基本上所有组分都是人的或人源化的。本发明的基因修饰的非人动物可用于研究人源化动物中人类免疫系统的功能;用于鉴定引发免疫应答的抗原和抗原表位(例如T细胞表位,例如独特的人类癌症表位),例如用于疫苗开发;用于鉴定对人病原体或癌症抗原的高亲和力T细胞(即,在人MHC I复合物的背景下以高亲和力与抗原结合的T细胞),例如在适应性T细胞疗法中使用;用于评价疫苗候选物和其他疫苗策略;用于研究人类自身免疫;用于研究人类传染性疾病;以及以其他方式用于设计基于人MHC和CD4/CD8表达的更佳治疗策略。
因此,在各种实施方案中,本发明的基因工程改造的动物尤其可用于评价抗原在人体内发起免疫应答的能力,以及用于产生多种抗原和鉴定可用于人类疫苗开发的特异性抗原。
在一个方面,提供了一种用于确定肽是否会在人体内激发细胞免疫应答的方法,该方法包括将如本文所述的基因修饰的非人动物暴露于该肽,使该非人动物产生免疫应答,并且在该非人动物中检测结合如本文所述的嵌合人/非人MHC I或II分子呈递的肽序列的细胞(例如,分别包含人CD8或CD4的CD8+或CD4+T细胞)。在一个实施方案中,暴露后的非人动物包含结合肽的MHC I类限制性CD8+细胞毒性T淋巴细胞(CTL)。在另一个实施方案中,暴露后的非人动物包含结合该肽的MHC II限制性CD4+T细胞。
在一个方面,提供了一种用于鉴定人T细胞表位的方法,该方法包括将如本文所述的非人动物暴露于包含推定的T细胞表位的抗原,使非人动物产生免疫应答,从非人动物中分离出结合该表位的MHC I类或MHC II类限制性T细胞,并鉴定被所述T细胞结合的表位。
在一个方面,提供了一种用于鉴定在人体中产生T细胞应答的抗原的方法,该方法包括将推定抗原暴露于如本文所述的小鼠,使该小鼠产生免疫应答,并鉴定被HLA I类或II类限制性分子结合的抗原。
在一个方面,提供了一种用于确定推定抗原是否包含在暴露于人类免疫系统时会产生HLA I类或II类限制性免疫应答的表位的方法,该方法包括将如本文所述的小鼠暴露于推定抗原,并测量小鼠中的抗原特异性HLA I类或HLA II类限制性免疫应答。
另外,本文所述的基因工程改造的非人动物可用于鉴定识别目标抗原,例如肿瘤或另一种疾病抗原的T细胞受体,例如高亲合力T细胞受体。该方法可以包括:将本文所述的非人动物暴露于抗原,使非人动物对抗原产生免疫应答,从非人动物中分离出包含T细胞受体的T细胞,该T细胞受体结合由人或人源化MHC I或MHC II呈递的抗原,并确定所述T细胞受体的序列。
表达功能性人TCR V(D)J基因区段的多样化组库的非人动物可用于人类疾病的研究。因此,在一个实施方案中,本文所述的基因工程改造的非人动物可以表达与在人类中表达的TCR组库基本上相似的TCR组库,例如,本文公开的非人动物的TCR组库可以源自全部功能性人TCRα、TCRβ,TCRγ和/或TCRδ基因区段的至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%或至少约99%。在一些实施方案中,所公开的非人动物表达源自以下的TCR组库:
(i)全部功能性人TCR Vα基因区段的至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%或至少约99%;
(ii)全部功能性人TCR Jα基因区段的至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%或至少约99%;
(iii)全部功能性人TCR Vβ基因区段的至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%或至少约99%;
(iv)全部功能性人TCR Dβ基因区段的至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%或至少约99%;和/或
(v)全部功能性人TCR Jβ基因区段的至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%或至少约99%。
在一个实施方案中,小鼠产生包含全部或基本上全部功能性人TCR Vα基因区段,并且包含全部或基本上全部功能性人TCR Vβ基因区段的T细胞组库。在一个实施方案中,本文提供的小鼠利用人TCR Vα和/或Vβ基因,其频率分别类似于人类中人T细胞利用的人TCRVα和/或Vβ基因的频率。检测非人动物TCR组库中表达的基因区段的方法包括,例如,流式细胞术和/或测序方法(例如,实时PCR、下一代测序等)。
在一个实施方案中,提供了一种用于通过推定的人类治疗剂确定T细胞激活的方法,该方法包括将如本文所述的基因修饰的动物暴露于推定的人类治疗剂(或例如,将此类动物的表达人或人源化MHC II或MHC I的细胞暴露于推定治疗剂的肽序列),将展示人或人源化MHC/肽复合物的基因修饰的动物的细胞暴露于包含能够结合基因修饰的动物的细胞的嵌合人/非人(例如,人/小鼠)CD4或CD8的T细胞,并测量由基因修饰的动物的肽展示细胞诱导的T细胞激活。
除了从人类病原体或赘生物中鉴定抗原和抗原表位的能力之外,本发明的基因修饰的动物可用于鉴定与人自身免疫疾病,例如I型糖尿病、多发性硬化等相关的自身抗原。此外,本发明的基因修饰的动物可用于研究人自身免疫疾病的各个方面,并且可用作自身免疫疾病模型。
在各种实施方案中,本发明的基因修饰的非人动物产生在其表面具有人源化TCR分子的T细胞,并且因此,将以类似人的方式识别由MHC复合物呈递给它们的肽。本文描述的基因修饰的非人动物可用于研究人T细胞的发育和功能以及免疫耐受过程;测试人类疫苗候选物;产生用于TCR基因疗法的具有某些特异性的TCR;产生针对疾病相关抗原(例如,肿瘤相关抗原(TAA))的TCR文库;等等。
由于可以引导T细胞(例如,细胞毒性T细胞)攻击并导致目标抗原(例如,病毒抗原、细菌抗原、肿瘤抗原等)或呈递目标抗原的细胞的破坏,因此本领域对T细胞疗法的兴趣日益增加。癌症T细胞疗法的初步研究旨在从肿瘤细胞块中分离肿瘤浸润性淋巴细胞(TIL;肿块中可能包含对肿瘤抗原有反应性的T细胞的淋巴细胞群),使用T细胞生长因子在体外扩增肿瘤浸润性淋巴细胞,并在称为过继T细胞转移的过程中将它们转移回患者体内。参见,例如,Restifo等人(2012)Adoptive immunotherapy for cancer:harnessing the Tcell response,Nature Reviews 12:269-81;Linnermann等人(2011)T-Cell ReceptorGene Therapy:Critical Parameters for Clinical Success,J.Invest.Dermatol.131:1806-16。然而,这些疗法的成功迄今仅限于黑素瘤和肾细胞癌;并且TIL过继转移不是专门针对限定的肿瘤相关抗原(TAA)。Linnermann等人,见上文。
已经尝试发起TCR基因疗法,其中T细胞被选择或编程为靶向目标抗原,例如TAA。当前的TCR基因疗法依赖于针对特定抗原(例如,肿瘤相关抗原)的TCR序列的鉴定。例如,Rosenberg和同事已经公布了几项研究,其中他们转导源自黑素瘤患者的外周血淋巴细胞,该淋巴细胞具有编码对黑素瘤相关抗原MART-1表位具有特异性的TCRα和β链的基因,并使用所得到的扩增淋巴细胞进行过继T细胞疗法。Johnson等人(2009)Gene therapy withhuman and mouse T-cell receptors mediates cancer regression and targetsnormal tissues expressing cognate antigen,Blood114:535-46;Morgan等人(2006)Cancer Regression in Patients After Transfer of Genetically EngineeredLymphocytes,Science 314:126-29。MART-1特异性TCR分离自在TIL疗法后经历肿瘤消退的患者。然而,此类TCR,特别是高亲合力TCR(最有可能在治疗上有用)的鉴定因下述事实变得复杂:大多数肿瘤抗原是自身抗原,并且靶向这些抗原的TCR往往缺失或具有次优亲合力,这主要由于免疫耐受。
在各种实施方案中,本发明通过提供在其基因组中包含未重排的人TCR可变基因的基因座的基因工程改造的非人动物来解决这个问题。本文所述的非人动物能够产生具有人源化T细胞受体的多样化组库的T细胞。因此,本文所述的非人动物可以是人源化T细胞受体的多样化组库,例如用于过继T细胞转移的高亲合力人源化T细胞受体的来源。
因此,在一个实施方案中,本发明提供了一种产生针对人抗原的T细胞受体的方法,该方法包括用目标抗原免疫本文所述的非人动物(例如啮齿动物,例如小鼠或大鼠),使该动物产生免疫应答,从该动物中分离对目标抗原具有特异性的激活T细胞,并确定由抗原特异性T细胞表达的T细胞受体的核酸序列。
在一个实施方案中,本发明提供了一种产生对目标抗原(例如,疾病相关抗原)具有特异性的人T细胞受体的方法,该方法包括用目标抗原免疫本文所述的非人动物;使该动物产生免疫应答;从该动物中分离对目标抗原有反应性的T细胞;确定由T细胞表达的人TCR可变区的核酸序列;将人TCR可变区克隆到包含人TCR恒定区的核酸序列的核苷酸构建体中,使得人TCR可变区可操作地连接至人TCR恒定区;并且从该构建体表达对目标抗原具有特异性的人T细胞受体。在一个实施方案中,分离T细胞、确定该T细胞表达的人TCR可变区的核酸序列、将人TCR可变区克隆到包含人TCR恒定区的核酸序列的核苷酸构建体中并且表达人T细胞受体的步骤是使用本领域技术人员已知的标准技术进行的。
在一个实施方案中,编码对目标抗原具有特异性的T细胞受体的核苷酸序列在细胞中表达。在一个实施方案中,表达TCR的细胞选自CHO、COS、293、HeLa、PERC.6TM细胞等。
目标抗原可以是已知会引起疾病或病状或与疾病或病状相关的任何抗原,例如肿瘤相关抗原;病毒、细菌或其他病原来源的抗原;等等。许多肿瘤相关抗原是本领域已知的。肿瘤相关抗原的选择呈现于Cancer Immunity(A Journal of the Cancer ResearchInstitute)Peptide Database(archive.cancerimmunity.org/peptidedatabase/Tcellepitopes.htm)。在本发明的一些实施方案中,目标抗原是人抗原,例如人肿瘤相关抗原。在一些实施方案中,抗原是细胞类型特异性细胞内抗原,并且T细胞受体用于杀伤表达抗原的细胞。
在一个实施方案中,本文提供了一种鉴定对目标抗原(例如,肿瘤相关抗原)具有特异性的T细胞的方法,该方法包括用目标抗原免疫本文所述的非人动物,使动物产生免疫应答,并从该非人动物中分离对抗原具有特异性的T细胞。
本发明提供了过继T细胞疗法的新方法。因此,本文提供了一种治疗或改善受试者(例如,哺乳动物受试者,例如,人类受试者)的疾病或病状(例如,癌症)的方法,该方法包括用与疾病或病状相关的抗原免疫本文所述的非人动物,使该动物产生免疫应答,从该动物中分离抗原特异性T细胞群,并将分离的抗原特异性T细胞输注到受试者体内。在一个实施方案中,本发明提供了一种治疗或改善人类受试者的疾病或病状的方法,该方法包括用目标抗原(例如,疾病或病状相关抗原,例如,肿瘤相关抗原)免疫本文所述的非人动物,使该动物产生免疫应答,从该动物中分离抗原特异性T细胞群,确定T细胞受体的核酸序列(例如,编码重排的人TCRα和/或重排的人TCRβ可变区基因的第一和/或第二核酸序列);编码由抗原特异性T细胞表达的重排的人TCRδ可变区基因或TCRγ可变区基因的第三和/或第四核酸序列,将T细胞受体的核酸序列,例如,分别编码重排的人TCRα可变区基因,、重排的人TCRβ可变区基因,、TCRδ可变区基因或TCRγ可变区基因的第一、第二、第三和/或第四核酸序列克隆到表达载体(例如,逆转录病毒载体)中,例如,任选地其中分别编码重排的人TCRα可变区基因,、重排的人TCRβ可变区基因、TCR可变区基因,、TCRδ可变区基因或TCRγ可变区基因的第一、第二、第三和/或第四核酸序列分别与人TCRα恒定基因,、人TCRβ恒定基因、,TCRδ恒定基因或TCRγ恒定基因框内克隆,将载体引入源自受试者的T细胞中,使得T细胞表达抗原特异性T细胞受体,并将T细胞输注到受试者体内。在一个实施方案中,T细胞受体核酸序列在引入源自受试者的T细胞中之前被进一步人源化,例如,编码非人恒定区的序列经修饰以进一步类似人TCR恒定区(例如,非人恒定区被人恒定区置换)。在一些实施方案中,该疾病或病状是癌症。在一些实施方案中,抗原特异性T细胞群在输注到受试者体内之前扩增。在一些实施方案中,在输注抗原特异性T细胞之前,对受试者的免疫细胞群进行免疫消耗。在一些实施方案中,抗原特异性TCR是高亲合力TCR,例如,对肿瘤相关抗原的高亲合力TCR。在一些实施方案中,T细胞是细胞毒性T细胞。在其他实施方案中,该疾病或病状由病毒或细菌引起。
在另一个实施方案中,疾病或病状是自身免疫性疾病。TREG细胞是保持对自身抗原的耐受性并防止病理性自身反应的T细胞亚群。因此,本文还提供了治疗自身免疫性疾病的方法,该方法依赖于在本文所述的本发明的非人动物中产生抗原特异性TREG细胞。
本文还提供了一种治疗或改善受试者的疾病或病状(例如,癌症)的方法,该方法包括将来自受试者的受该疾病或病状影响的细胞(例如,癌细胞)引入非人动物中,使动物对细胞产生免疫应答,从动物中分离对细胞有反应性的T细胞群,确定T细胞表达的T细胞受体可变区的核酸序列,将编码T细胞受体可变结构域的序列克隆到载体中(例如,在框内并且可操作地连接至人TCR恒定基因),将该载体引入来自受试者的T细胞中,并将受试者的携带T细胞受体的T细胞输注到受试者体内。
本文还提供了如本文所述的非人动物用于制备编码人TCR可变结构域(例如,TCRα和/或β可变结构域)的核酸序列的用途。在一个实施方案中,提供了一种用于制备编码人TCR可变结构域的核酸序列的方法,该方法包括用目标抗原免疫如本文所述的非人动物,使该非人动物对目标抗原产生免疫应答,并从中获得编码结合目标抗原的人TCR可变结构域的核酸序列。在一个实施方案中,该方法还包括制备编码任选可操作地连接至非人TCR恒定区的人TCR可变结构域的核酸序列,包括从本文所述的非人动物中分离T细胞并从中获得编码任选连接至非人恒定区TCR恒定区的TCR可变结构域的核酸序列,并将编码TCR可变结构域的核酸序列(例如,分别编码重排的人TCRα可变区基因,、重排的人TCRβ可变区基因,、TCRδ可变区基因或TCRγ可变区基因的第一、第二、第三个或第四核酸序列)与适当的人恒定区(例如,人TCRα恒定区基因,、TCRβ恒定区基因,、TCRδ恒定区基因或TCRγ可变区基因)在框内克隆。
因此,本文提供了TCR可变区核酸序列,诸如重排的TCR可变核酸序列,例如重排的TCRα和/或TCRβ可变区核酸序列,这些核酸序列是在本文所述的非人动物中产生的并且分别由例如重排的人Vα/Jα基因序列和重排的人VβDβJβ基因序列编码。同样,提供了由此类重排的TCR可变区核酸序列编码的TCR可变区氨基酸序列。在本文所述的非人动物中获得的此类重排的TCR可变区核酸序列(TCRα和/或TCRβ可变区核酸序列)可以与人TCR恒定区(TCRα和/或TCRβ恒定区)可操作地连接克隆,并用于本文所述的各种用途,例如在人类中作为人类治疗剂。
本文还提供了如本文所述的非人动物用于制备人类治疗剂的用途,包括用目标抗原(例如,肿瘤相关抗原)免疫非人动物,使该非人动物产生免疫应答,从该动物中获得对目标抗原有反应性的T细胞,从T细胞中获得编码结合目标抗原的人源化TCR蛋白或人TCR可变结构域的核酸序列,并且在人类治疗剂中采用编码人源化TCR蛋白或人TCR可变结构域的核酸序列。
因此,还提供了一种用于制备人类治疗剂的方法,该方法包括用目标抗原免疫如本文所述的非人动物,使该非人动物产生免疫应答,从该动物中获得对目标抗原有反应性的T细胞,从T细胞中获得编码结合目标抗原的人源化T细胞受体的核酸序列,并且在人类治疗剂中采用人源化(或全人)T细胞受体。
在一个实施方案中,人类治疗剂是T细胞(例如人T细胞,例如源自人类受试者的T细胞),该T细胞携带目标核酸序列(例如,用目标核酸转染或转导或以其他方式引入了目标核酸),使得该T细胞表达对目标抗原具有亲合力的人源化TCR蛋白。在一个方面,采用该治疗剂的受试者需要针对特定疾病或病状的疗法,并且该抗原与该疾病或病状相关。在一个方面,该T细胞是细胞毒性T细胞,该抗原是肿瘤相关抗原,并且该疾病或病状是癌症。在一个方面,该T细胞源自受试者。
在另一个实施方案中,该人类治疗剂是T细胞受体。在一个实施方案中,该治疗受体是可溶性T细胞受体。已经进行了许多努力来产生可溶性T细胞受体或TCR可变区,以在治疗剂中使用。可溶性T细胞受体的产生取决于获得重排的TCR可变区。一种方法是设计包含TCRα和TCRβ的单链TCR,并且与scFv免疫球蛋白格式相似,经由接头将它们融合在一起(参见,例如,国际申请号WO 2011/044186)。如果与scFv类似,所得到的scTv将提供TCRα/β结合蛋白的热稳定且可溶的形式。替代方法包括设计具有TCRβ恒定结构域的可溶性TCR(参见,例如Chung等人,(1994)Functional three-domain single-chain T-cell receptors,Proc.Natl.Acad.Sci.USA.91:12654-58);以及将非天然二硫键工程改造到TCR恒定结构域之间的界面中(综述于Boulter和Jakobsen(2005)Stable,soluble,high-affinity,engineered T cell receptors:novel antibody-like proteins for specifictargeting of peptide antigens,Clinical and Experimental Immunology 142:454-60;也参见美国专利第7,569,664号)。可溶性T细胞受体的其他格式已有描述。本文所述的非人动物可用于确定与目标抗原以高亲合力结合的T细胞受体的序列,并随后基于该序列设计可溶性T细胞受体。
源自非人动物表达的TCR受体序列的可溶性T细胞受体可用于阻断目标蛋白的功能,该目标蛋白例如病毒蛋白、细菌蛋白或肿瘤相关蛋白。可替代地,可溶性T细胞受体可以融合至可以杀伤受感染的细胞或癌细胞的部分,例如细胞毒性分子(例如,化疗剂)、毒素、放射性核素、前药、抗体等。可溶性T细胞受体也可以融合至免疫调节分子,例如细胞因子、趋化因子等。可溶性T细胞受体也可以融合至免疫抑制分子,例如,抑制T细胞杀伤携带被T细胞识别的抗原的其他细胞的分子。此类融合至免疫抑制分子的可溶性T细胞受体可用于例如阻断自身免疫。通过引用并入本文的Ravetch和Lanier(2000)Immune InhibitoryReceptors,Science 290:84-89中综述了可以融合至可溶性T细胞受体的各种示例性免疫抑制分子。
本发明还提供了用于在人TCR的背景下研究免疫应答的方法,这些方法包括人TCR重排、T细胞发育、T细胞激活、免疫耐受等。
还提供了测试疫苗候选物的方法。在一个实施方案中,本文提供了一种确定疫苗是否会激活免疫应答(例如,T细胞增殖、细胞因子释放等),并引起效应细胞以及记忆T细胞(例如,中央和效应记忆T细胞)的产生的方法。
在一个方面,提供了一种体外制剂,该体外制剂包含在其表面带有嵌合CD8蛋白的T细胞和结合嵌合CD8的第二细胞。在一个实施方案中,第二细胞是表达MHC I多肽,例如嵌合人/非人MHC I蛋白的细胞。在一个实施方案中,第一细胞表面上的嵌合CD8与第二细胞表面上的嵌合MHC I相互作用。在一个实施方案中,嵌合CD8蛋白保留与内源细胞溶质分子,例如,内源细胞溶质信号传导分子(例如,内源Lck等)的相互作用。
在一个方面,提供了一种体外制剂,该体外制剂包含在其表面带有嵌合CD4蛋白的T细胞和结合嵌合CD4的第二细胞。在一个实施方案中,第二细胞是表达MHC II多肽,例如嵌合人/非人MHC II蛋白的细胞(例如,APC)。在一个实施方案中,第一细胞表面上的嵌合CD4与第二细胞表面上的嵌合MHC II相互作用。在一个实施方案中,嵌合CD4蛋白保留与内源细胞溶质分子,例如,内源细胞溶质信号传导分子(例如,内源Lck等)的相互作用。
下面提供了非限制性和示例性的实施方案。
实施方案1.一种小鼠或一种分离的小鼠细胞,所述小鼠或所述分离的小鼠细胞包含:
(A)未重排的T细胞受体(TCR)α可变区序列,所述未重排的TCRα可变区序列包含至少一个未重排的人T细胞可变区Vα区段和至少一个未重排的人T细胞可变区Jα区段,所述未重排的TCRα可变区序列可操作地连接至小鼠TCRα恒定基因序列,任选地连接到内源小鼠TCRα可变基因的基因座处,其中所述未重排的TCRα可变区序列包含小鼠TCRA非编码序列,或
(B)未重排的TCRβ可变区序列,所述未重排的TCRβ可变区序列包含至少一个未重排的人T细胞可变区Vβ区段、至少一个未重排的人T细胞可变区Dβ区段和至少一个未重排的人T细胞可变区Jβ区段,所述未重排的TCRβ可变区序列可操作地连接至小鼠TCRβ恒定基因序列,任选地连接到内源小鼠TCRβ可变基因的基因座处,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列,或
(C)(i)未重排的T细胞受体(TCR)α可变区序列,所述未重排的TCRα可变区序列包含至少一个未重排的人T细胞可变区Vα区段和至少一个未重排的人T细胞可变区Jα区段,所述未重排的TCRα可变区序列可操作地连接至小鼠TCRα恒定基因序列,任选地连接到内源小鼠TCRα可变基因的基因座处,其中所述未重排的TCRα可变区序列包含小鼠TCRA非编码序列,以及
(ii)未重排的TCRβ可变区序列,所述未重排的TCRβ可变区序列包含至少一个未重排的人T细胞可变区Vβ区段、至少一个未重排的人T细胞可变区Dβ区段和至少一个未重排的人T细胞可变区Jβ区段,所述未重排的TCRβ可变区序列可操作地连接至小鼠TCRβ恒定基因序列,任选地连接到内源小鼠TCRβ可变基因的基因座处,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列,
其中所述未重排的人T细胞可变区区段能够在T细胞中重排以形成编码特异性结合目标抗原的人T细胞受体可变结构域的基因。
实施方案2.如实施方案1所述的小鼠或分离的小鼠细胞,其中:
(A)所述至少一个未重排的人T细胞可变区Vα区段构成未重排的人T细胞可变区Vα区段组库,并且所述至少一个未重排的人T细胞可变区Jα区段构成未重排的人T细胞可变区Jα基因区段组库,或
(B)所述至少一个未重排的人T细胞可变区Vβ区段构成未重排的人Vβ区段组库,所述至少一个未重排的人T细胞可变区Dβ区段构成未重排的人Dβ区段组库,并且所述至少一个未重排的人T细胞可变区Jβ区段构成未重排的人Jβ基因区段组库,或
(C)(i)所述至少一个未重排的人T细胞可变区Vα区段构成未重排的人T细胞可变区Vα区段组库,所述至少一个未重排的人T细胞可变区Jα区段构成未重排的人T细胞可变区Jα基因区段组库,
(ii)所述至少一个未重排的人T细胞可变区Vβ区段构成未重排的人Vβ区段组库,所述至少一个未重排的人T细胞可变区Dβ区段包括未重排的人T细胞可变区Dβ1区段和未重排的人T细胞可变区Dβ2区段,并且所述至少一个未重排的人T细胞可变区Jβ区段包括至少一个未重排的人T细胞可变区Jβ1区段和至少一个未重排的人T细胞可变区Jβ2区段,
其中所述小鼠TCRB非编码序列包含(i)介于所述至少一个未重排的人T细胞可变区Dβ1区段和所述至少一个未重排的人T细胞可变区Jβ1区段之间的小鼠TCRBD1-TCRBJ1非编码核酸序列,和(ii)介于所述至少一个未重排的人T细胞可变区Dβ2区段和所述至少一个未重排的人T细胞可变区Jβ2区段之间的小鼠TCRBD2-TCRBJ2非编码核酸序列。
实施方案3.如实施方案1或实施方案2所述的小鼠或分离的小鼠细胞,其中:
(I)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vα基因区段的缺失,
(b)所有内源TCR Jα基因区段的缺失,和
(c)它们的组合,或
(II)所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vβ基因区段的缺失,
(b)所有内源TCR Dβ基因区段的缺失,
(c)所有内源TCR Jβ基因区段的缺失,和
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vα基因区段的缺失,
(b)所有内源TCR Jα基因区段的缺失,和
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vβ基因区段的缺失,
(b)所有内源TCR Dβ基因区段的缺失,
(c)所有内源TCR Jβ基因区段的缺失,和
(d)它们的组合。
实施方案4.如实施方案1-3中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,
(b)至少一个内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,和
(c)它们的组合,或
(II)所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,
(b)至少一个内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ区段置换,
(c)至少一个内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,和
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,
(b)至少一个内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,和
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,
(b)至少一个内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ区段置换,
(c)至少一个内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,和
(d)它们的组合。
实施方案5.根据实施方案1-4中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vα基因区段包括从TRAV1-1至TRAV41的多个或所有未重排的人T细胞可变区Vα基因区段,
(b)所有内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jα区段包括从TRAJ1至TRAJ61的多个或所有未重排的人T细胞可变区Jα基因区段,或
(c)它们的组合,
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vβ基因区段包括从TRBV1至TRBV29-1的多个或所有未重排的人T细胞可变区Vβ基因区段,
(b)所有内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Dβ基因区段包含未重排的人T细胞可变区Dβ1基因区段和/或未重排的人T细胞可变区Dβ2基因区段,
(c)所有内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jβ区段包括从TRBJ1-1至TRBJ1-6的多个或所有未重排的人Jβ区段,或从TRBJ2-1至TRBJ2-7的多个或所有未重排的人Jβ区段,或
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vα基因区段包括从TRAV1-1至TRAV41的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jα区段包括从TRAJ1至TRAJ61的多个或所有未重排的人T细胞可变区基因区段,或
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vβ基因区段包括从TRBV1至TRBV29-1的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Dβ基因区段包含未重排的人T细胞可变区Dβ1基因区段和/或未重排的人T细胞可变区Dβ2基因区段,
(c)所有内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jβ区段包括从TRBJ1-1至TRBJ1-6的多个或所有未重排的人Jβ区段,或从TRBJ2-1至TRBJ2-7的多个或所有未重排的人Jβ区段,或
(d)它们的组合。
实施方案6.根据实施方案1-5中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区Vα基因区段置换,
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区Jα基因区段置换,或
(c)它们的组合,
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区Vβ基因区段置换,
(b)内源T细胞可变区Dβ1基因区段被未重排的人T细胞可变区Dβ1基因区段置换,并且内源T细胞可变区Dβ2基因区段被未重排的人T细胞可变区Dβ2基因区段置换,
(c)以下置换:
内源TRBJ1-1基因区段被未重排的人TRBJ1-1基因区段置换,
内源TRBJ1-2基因区段被未重排的人TRBJ1-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-1区段和小鼠TRBJ1-2区段之间发现的小鼠非编码序列,
内源TRBJ1-3基因区段被未重排的人TRBJ1-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-2区段和小鼠TRBJ1-3区段之间发现的小鼠非编码序列,
内源TRBJ1-4基因区段被未重排的人TRBJ1-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-3区段和小鼠TRBJ1-4区段之间发现的小鼠非编码序列,
内源TRBJ1-5基因区段被未重排的人TRBJ1-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-4区段和小鼠TRBJ1-5区段之间发现的小鼠非编码序列,
内源TRBJ1-6基因区段被未重排的人TRBJ1-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-5区段和小鼠TRBJ1-6区段之间发现的小鼠非编码序列,
内源TRBJ2-1基因区段被未重排的人TRBJ2-1基因区段置换,
内源TRBJ2-2基因区段被未重排的人TRBJ2-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-1区段和小鼠TRBJ2-2区段之间发现的小鼠非编码序列,
内源TRBJ2-3基因区段被未重排的人TRBJ2-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-2区段和小鼠TRBJ2-3区段之间发现的小鼠非编码序列,
内源TRBJ2-4基因区段被未重排的人TRBJ2-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-3区段和小鼠TRBJ2-4区段之间发现的小鼠非编码序列,
内源TRBJ2-5基因区段被未重排的人TRBJ2-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-4区段和小鼠TRBJ2-5区段之间发现的小鼠非编码序列,
内源TRBJ2-6基因区段被未重排的人TRBJ2-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-5区段和小鼠TRBJ2-6区段之间发现的小鼠非编码序列,以及
内源TRBJ2-7基因区段被未重排的人TRBJ2-7基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-6区段和小鼠TRBJ2-7区段之间发现的小鼠非编码序列,或
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区Vα基因区段置换,
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区Jα基因区段置换,或
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区Vβ基因区段置换,
(b)内源T细胞可变区Dβ1基因区段被未重排的人T细胞可变区Dβ1基因区段置换,并且内源T细胞可变区Dβ2基因区段被未重排的人T细胞可变区Dβ2基因区段置换,
(c)以下置换:
内源TRBJ1-1基因区段被未重排的人TRBJ1-1基因区段置换,
内源TRBJ1-2基因区段被未重排的人TRBJ1-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-1区段和小鼠TRBJ1-2区段之间发现的小鼠非编码序列,
内源TRBJ1-3基因区段被未重排的人TRBJ1-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-2区段和小鼠TRBJ1-3区段之间发现的小鼠非编码序列,
内源TRBJ1-4基因区段被未重排的人TRBJ1-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-3区段和小鼠TRBJ1-4区段之间发现的小鼠非编码序列,
内源TRBJ1-5基因区段被未重排的人TRBJ1-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-4区段和小鼠TRBJ1-5区段之间发现的小鼠非编码序列,
内源TRBJ1-6基因区段被未重排的人TRBJ1-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-5区段和小鼠TRBJ1-6区段之间发现的小鼠非编码序列,
内源TRBJ2-1基因区段被未重排的人TRBJ2-1基因区段置换,
内源TRBJ2-2基因区段被未重排的人TRBJ2-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-1区段和小鼠TRBJ2-2区段之间发现的小鼠非编码序列,
内源TRBJ2-3基因区段被未重排的人TRBJ2-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-2区段和小鼠TRBJ2-3区段之间发现的小鼠非编码序列,
内源TRBJ2-4基因区段被未重排的人TRBJ2-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-3区段和小鼠TRBJ2-4区段之间发现的小鼠非编码序列,
内源TRBJ2-5基因区段被未重排的人TRBJ2-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-4区段和小鼠TRBJ2-5区段之间发现的小鼠非编码序列,
内源TRBJ2-6基因区段被未重排的人TRBJ2-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-5区段和小鼠TRBJ2-6区段之间发现的小鼠非编码序列,以及
内源TRBJ2-7基因区段被未重排的人TRBJ2-7基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-6区段和小鼠TRBJ2-7区段之间发现的小鼠非编码序列,或
(d)它们的组合。
实施方案7.根据前述实施方案中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区Vα基因区段置换,以及
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区Jα基因区段置换;以及
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区Vβ基因区段置换,
(b)(i)内源tcrbdj1簇被包含未重排的人TCRBD1区段的人源化TCRBDJ1簇置换,和(ii)未重排的人TCRBJ1-1区段、未重排的人TCRBJ1-2区段、未重排的人TCRBJ1-3区段、未重排的人TCRBJ1-4区段、未重排的人TCRBJ1-5区段和未重排的人TCRBJ1-6区段中的每一个,
其中所述人源化TCRBDJ1簇包含介于所述未重排的人TCRBD1区段和所述未重排的人TCRBJ1-1区段之间的小鼠TCRBDJ1非编码序列,以及介于任何两个连续的未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列,任选地其中所述未重排的人TCRBD1和TCRBJ1基因区段位于相同的小鼠TCRBDJ1非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段,并且
(c)(i)内源tcrbdj2簇被包含未重排的人TCRBD2区段的人源化TCRBDJ2簇置换,和(ii)未重排的人TRBJ2-1区段、未重排的人TRBJ2-2区段、未重排的人TCRBJ2-3区段、未重排的人TCRBJ2-4区段、未重排的人TCRBJ2-5区段、未重排的人TCRBJ2-6区段和未重排的人TCRBJ2-7区段中的每一个,
其中所述人源化TCRBDJ2簇包含介于所述未重排的人TCRBD2区段和任何未重排的人TCRBJ2区段之间的小鼠TCRBDJ2非编码序列,以及介于任何两个连续的未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列,任选地其中所述未重排的人TCRBD2和TCRBJ2基因区段位于相同的小鼠TCRBDJ2非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj2基因区段。
实施方案8.根据前述实施方案中任一项所述的小鼠或分离的小鼠细胞,其中所述未重排的TCRα可变区序列处于种系基因组中,和/或所述未重排的TCRβ可变区序列处于所述种系基因组中。
实施方案9.根据前述实施方案中任一项所述的小鼠或分离的小鼠细胞,其中所述未重排的TCRα可变区序列在内源TCRα调控元件的调控下表达(例如,可操作地连接至内源TCR调控元件),和/或所述未重排的TCRβ可变区序列在内源TCRβ调控元件的调控下表达(例如,可操作地连接至内源TCRβ调控元件)。
实施方案10.根据前述实施方案中任一项所述的小鼠或分离的小鼠细胞,其中所述小鼠或分离的小鼠细胞在T细胞表面表达T细胞受体,所述T细胞受体包含人源化TCRα链和人源化TCRβ链,
其中所述人源化TCRα链由可操作地连接至所述小鼠TCRα恒定区序列的重排的人Vα/Jα序列编码,其中所述重排的人Vα/Jα序列通过所述至少一个人T细胞可变区Vα区段和至少一个人T细胞可变区Jα区段的重排形成,
其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ/Jβ序列编码,其中所述重排的人Vβ/Dβ/Jβ序列通过所述至少一个人T细胞可变区Vβ区段、至少一个T细胞可变区Dβ区段和至少一个人T细胞可变区Jβ区段的重排形成,任选地其中所述TCRβ链由重排的Vβ/Dβ2/Jβ2序列编码。
实施方案11.根据前述实施方案中任一项所述的小鼠或分离的小鼠细胞,其中所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ1簇的基因区段,并且所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ2簇的基因区段。
实施方案12.一种小鼠或分离的小鼠细胞,所述小鼠或分离的小鼠细胞在其基因组中包含:
(a)编码嵌合人/小鼠CD4辅助受体的第一核苷酸序列,所述辅助受体包含人CD4多肽的D1、D2和D3结构域以及小鼠CD4多肽的跨膜结构域和胞质结构域;
(b)编码嵌合人/小鼠CD8α多肽的第二核苷酸序列和编码嵌合人/小鼠CD8β多肽,的第三核苷酸序列,
其中所述嵌合人/小鼠CD8α多肽包含人CD8α多肽的IgV样结构域和小鼠CD8α多肽的跨膜结构域和胞质结构域,
其中所述嵌合人/小鼠CD8β多肽包含人CD8β多肽的IgV样结构域和小鼠CD8β多肽的跨膜结构域和胞质结构域;
(c)编码嵌合人/小鼠MHC IIα多肽的第一核酸序列和编码嵌合人/小鼠MHC IIβ多肽的第二核酸序列,
其中所述嵌合人/小鼠MHC IIα多肽包含人HLA II类α多肽的α1和α2结构域以及小鼠MHC IIα多肽的跨膜结构域和胞质结构域,
其中所述嵌合人/小鼠MHC IIβ多肽包含人HLA II类β多肽的β1和β2结构域以及小鼠MHC IIβ多肽的跨膜结构域和胞质结构域;
(d)编码嵌合人/小鼠MHC I多肽的第三核酸序列,
其中所述嵌合MHC I多肽包含人HLA I类多肽的α1结构域、α2结构域和α3结构域以及小鼠MHC I多肽的跨膜结构域和胞质结构域;以及
(e)未重排的人TCRα可变区序列,所述未重排的人TCR可变区序列包含至少一个人Vα区段和至少一个人Jα区段,所述未重排的人TCR
可变区序列可操作地连接至小鼠TCRα恒定区序列;和未重排的TCRβ可变区序列,所述未重排的TCR可变区序列包含所述至少一个人Vβ区段、所述至少一个人Dβ区段和所述至少一个人Jβ区段,所述未重排的TCR可变区序列可操作地连接至小鼠TCRβ恒定区序列,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列,
任选地其中所述小鼠表达:
(A)所述嵌合人/小鼠CD4辅助受体,
(B)包含所述嵌合人/小鼠CD8α多肽和所述嵌合人/小鼠CD8β多肽的嵌合CD8辅助受体,
(C)嵌合MHC II复合物,所述嵌合MHC II复合物包含所述嵌合人/小鼠MHC IIα多肽和所述嵌合人/小鼠MHC IIβ多肽,其中所述嵌合MHC II复合物能够结合所述嵌合人/小鼠CD4辅助受体,和
(D)所述嵌合人/小鼠MHC I多肽,其中所述嵌合MHC I多肽能够结合所述嵌合CD8辅助受体,和
(E)T细胞表面上的T细胞受体,所述T细胞受体包含人源化TCRα链和人源化TCRβ链,
其中所述人源化TCRα链由可操作地连接至所述小鼠TCRα恒定区序列的重排的人Vα/Jα序列编码,其中所述重排的人Vα/Jα序列通过包含至少一个人Vα区段和至少一个人Jα区段的所述未重排的人TCRα可变区序列的重排形成,
其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ/Jβ序列编码,其中所述重排的人Vβ/Dβ/Jβ序列通过包含至少一个人Vβ区段、至少一个Dβ区段和至少一个人Jβ区段的所述未重排的TCRβ可变区序列的重排形成。
实施方案13.如实施方案12所述的小鼠或分离的小鼠细胞,所述小鼠或分离的小鼠细胞在其种系基因组中包含:
(a)编码所述嵌合人/小鼠CD4辅助受体的所述第一核苷酸序列;
(b)编码所述嵌合人/小鼠CD8α多肽的所述第二核苷酸序列和编码所述嵌合人/小鼠CD8β多肽的所述第三核苷酸序列;
(c)编码所述嵌合人/小鼠MHC IIα多肽的所述第一核酸序列和编码所述嵌合人/小鼠MHC IIβ多肽的所述第二核酸序列;
(d)编码所述嵌合人/小鼠MHC I多肽的所述第三核酸序列;以及
(e)可操作地连接至小鼠TCRα恒定区序列的所述未重排的人TCRα可变区序列和可操作地连接至小鼠TCRβ恒定区序列的所述未重排的TCRβ可变区序列。
实施方案14.如实施方案12或实施方案13所述的小鼠或分离的小鼠细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处;
(b)所述第二核苷酸序列存在于内源CD8αT细胞辅助受体基因座处并且所述第三核苷酸序列存在于内源CD8βT细胞辅助受体基因座处;
(c)所述第一核酸序列存在于内源MHC IIα基因座处并且所述第二核酸序列存在于内源MHC IIβ基因座处;
(d)所述第三核酸序列存在于内源MHC I基因座处;或者
(e)所述未重排的人TCRα可变区序列存在于内源TCRα可变区基因座处并且所述未重排的TCRβ可变区序列存在于内源TCRβ可变区基因座处,或
(f)(a)-(e)的任何组合。
实施方案15.如实施方案12-14中任一项所述的小鼠或分离的小鼠细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处并且在内源CD4辅助受体启动子和调控元件的调控下表达(例如,可操作地连接至内源CD4辅助受体启动子和调控元件);
(b)所述第二核苷酸序列存在于内源CD8αT细胞辅助受体基因座处并且在内源CD8α多肽启动子和调控元件的调控下表达(例如,可操作地连接至内源CD8多肽启动子和调控元件),并且所述第三核苷酸序列存在于内源CD8βT细胞辅助受体基因座处并且在内源CD8β多肽启动子和调控元件的调控下表达(例如,可操作地连接至内源CD8多肽启动子和调控元件);
(c)所述第一核酸序列存在于内源MHC IIα基因座处并且在内源MHC IIα启动子和调控元件的调控下表达(例如,可操作地连接至内源MHC II
启动子和调控元件),并且所述第二核酸序列存在于内源MHC IIβ基因座处并且在内源MHC IIβ启动子和调控元件的调控下表达(例如,可操作地连接至内源MHC II启动子和调控元件);
(d)所述第三核酸序列存在于内源MHC I基因座处并且在内源MHC I启动子和调控元件的调控下表达(例如,可操作地连接至内源MHC I启动子和调控元件);
(e)所述未重排的人TCRα可变区序列存在于内源TCRα可变区基因座处并且在内源TCRα调控元件的调控下表达(例如,可操作地连接至内源TCR调控元件),并且所述未重排的TCRβ可变区序列存在于内源TCRβ可变区基因座处并且在内源TCRβ调控元件的调控下表达(例如,可操作地连接至内源TCR调控元件);或者
(f)(a)-(e)的任何组合。
实施方案16.如实施方案12-15中任一项所述的小鼠或分离的小鼠细胞,其中
(a)所述嵌合人/小鼠CD4辅助受体包含可操作地连接至D4的所述人CD4多肽的D1结构域、D2结构域和D3结构域,内源CD4多肽的跨膜结构域和胞质结构域,
(b)所述嵌合人/小鼠CD8α多肽包含可操作地连接至内源CD8α多肽的跨膜结构域和胞质结构域的所述人CD8α多肽的所述IgV样结构域,并且所述嵌合CD8β多肽包含可操作地连接至内源CD8β多肽的跨膜结构域和胞质结构域的所述人CD8β多肽的所述IgV样结构域;
(c)所述嵌合人/小鼠MHC IIα多肽包含可操作地连接至内源MHC IIα多肽的跨膜结构域和胞质结构域的人HLA II类α1和α2结构域,并且所述嵌合MHC IIβ多肽包含可操作地连接至内源MHC IIβ多肽的跨膜结构域和胞质结构域的人HLA II类β1和β2结构域;
(d)所述嵌合人/小鼠MHC I多肽包含可操作地连接至内源MHC I多肽的跨膜结构域和胞质结构域的人HLA I类α1、α2和α3结构域,或
(e)(a)-(d)的任何组合。
实施方案17.如实施方案12-16中任一项所述的小鼠或分离的小鼠细胞,其中
(a)所述人HLA II类α多肽的所述α1和α2结构域由选自由HLA-DR、HLA-DQ和HLA-DP的任何α链基因组成的组的HLA II类基因编码;
(b)所述人HLA II类β多肽的所述β1和β2结构域由选自由HLA-DR、HLA-DQ和HLA-DP的任何β链基因组成的组的HLA II类基因编码;
(c)所述人HLA I类多肽的所述α1结构域、α2结构域和α3结构域由人HLA-A基因、人HLA-B基因或人HLA-C基因编码;或者
(d)(a)-(c)的任何组合。
实施方案18.如实施方案12-17中任一项所述的小鼠或分离的小鼠细胞,其中所述人HLA II类α多肽的所述α1结构域和α2结构域由HLA-DR的所述α链基因编码,并且所述人HLA II类β多肽的所述β1结构域和β2结构域由HLA-DR的所述β链基因编码,并且
其中所述人HLA I类多肽的所述α1结构域、α2结构域和α3结构域由人HLA-A基因编码。
实施方案19.如实施方案12-18中任一项所述的小鼠或分离的小鼠细胞,其中所述嵌合MHC II复合物包含人HLA-DR2蛋白的α1、α2、β1,和β2结构域。
实施方案20.如实施方案12-19中任一项所述的小鼠或分离的小鼠细胞,其中所述嵌合人/小鼠MHC I多肽包含人HLA-A2蛋白的α1、α2和α3结构域。
实施方案21.如实施方案12-20中任一项所述的小鼠或分离的小鼠细胞,其中
(a)所述未重排的人TCRα可变区序列包含完整的人Vα基因区段组库和完整的人Jα基因区段组库,
(b)所述未重排的TCRβ可变区序列包含完整的人Vβ基因区段组库、完整的人Dβ基因区段组库和完整的人Jβ基因区段组库,或
(c)所述未重排的人TCRα可变区序列包含完整的人Vα基因区段组库和完整的人Jα基因区段组库,并且所述未重排的TCRβ可变区序列包含完整的人Vβ基因区段组库、完整的人Dβ基因区段组库和完整的人Jβ基因区段组库。
实施方案22.如实施方案12-21中任一项所述的小鼠或分离的小鼠细胞,其中:
(i)内源TCRα可变基因座(a)缺乏所有或基本上所有功能性内源Vα基因区段,(b)缺乏所有或基本上所有功能性内源Jα基因区段,或(c)缺乏所有或基本上所有功能性内源Vα基因区段并且缺乏所有或基本上所有功能性内源Jα基因区段;
(ii)内源TCRβ可变基因座(a)缺乏所有或基本上所有功能性内源Vβ基因区段,(b)缺乏所有或基本上所有功能性内源Dβ基因区段,(c)缺乏所有或基本上所有功能性内源Jβ基因区段,或(d)(a)、(b)和(c)的任何组合;或者
(iii)(i)和(ii)两者。
实施方案23.如实施方案12-22中任一项所述的小鼠或分离的小鼠细胞,其中
(a)所述第一核苷酸序列包含编码所述人CD4多肽的所述D1、D2和D3结构域的序列,所述序列在内源小鼠CD4基因座处,(i)置换编码内源CD4辅助受体多肽的所述D1、D2和D3结构域的序列,并且(ii)可操作地连接至编码内源CD4 D4结构域、跨膜结构域和胞质结构域的序列;
(b)所述第二核苷酸序列包含编码所述人CD8α多肽的所述IgV样结构域的序列,所述序列在内源CD8α基因座处,(i)置换编码所述内源CD8α多肽的IgV样结构域的序列,并且(ii)可操作地连接至编码内源CD8α跨膜结构域和胞质结构域的序列,并且
所述第三核苷酸序列包含编码所述人CD8β多肽的IgV样结构域的序列,所述序列在内源CD8β基因座处,(i)置换编码内源CD8β多肽的IgV样结构域的序列,并且(ii)可操作地连接至编码内源CD8β跨膜结构域和胞质结构域的序列;
(c)所述第一核酸序列包含编码所述人HLA II类α多肽的所述α1和α2结构域的序列,所述序列在内源MHC IIα基因座处,(i)置换编码内源MHC IIα多肽的α1和α2结构域的序列并且(ii)可操作地连接至编码内源MHC IIα多肽跨膜结构域和胞质结构域的序列,并且
所述第二核酸包含编码所述人HLA II类β多肽的所述β1和β2结构域的序列,所述序列在内源MHC IIβ基因座处,(i)置换编码内源MHC IIβ多肽的β1和β2结构域的序列并且(ii)可操作地连接至编码内源MHC IIβ多肽跨膜结构域和胞质结构域的序列;
(d)所述第三核酸序列包含编码所述人HLA I类多肽的所述α1、α2和α3结构域的序列,所述序列在内源MHC I基因座处,(i)置换编码内源MHC I多肽的α1、α2和α3结构域的序列,并且(ii)可操作地连接至编码内源MHC I多肽跨膜结构域和胞质结构域的序列;
(e)所述未重排的人TCRα可变区序列置换内源TCRα可变区基因座处的一个或多个内源Vα和/或Jα基因区段,并且所述未重排的TCRβ可变区序列置换内源TCRβ可变区基因座处的一个或多个内源Vβ、Dβ和/或Jβ基因区段;或者
(f)(a)-(e)的任何组合。
实施方案24.如实施方案12-23中任一项所述的小鼠或分离的小鼠细胞,其中所述小鼠或小鼠细胞:
(a)不从内源CD4辅助受体基因座表达功能性内源CD4辅助受体;
(b)不从内源CD8辅助受体基因座表达功能性内源CD8辅助受体;
(c)不从内源TCRα基因座表达内源TCRα可变结构域;
(d)不从内源TCRβ基因座表达内源TCRβ可变结构域;
(e)不在细胞表面上,从内源MHC I基因座表达内源经典MHC I类多肽的胞外结构域;
(f)不在细胞表面上,从内源MHC II基因座表达内源经典MHC II类多肽的胞外结构域;或者
(e)(a)-(f)的任何组合。
实施方案25.如实施方案12-24中任一项所述的小鼠或分离的小鼠细胞,所述小鼠或所述分离的小鼠细胞还包含β2微球蛋白基因座,所述基因座包含编码包含人β2微球蛋白氨基酸序列的多肽的序列,其中所述小鼠或小鼠细胞表达人或人源化β2微球蛋白多肽。
实施方案26.如实施方案25所述的小鼠或分离的小鼠细胞,其中所述小鼠或小鼠细胞不从内源小鼠β2微球蛋白基因座表达功能性内源小鼠β2微球蛋白多肽。
实施方案27.如实施方案25或实施方案26所述的小鼠或分离的小鼠细胞,其中编码包含人β2微球蛋白多肽的多肽的所述序列可操作地连接至内源小鼠β2微球蛋白调控元件。
实施方案28.如实施方案25-27中任一项所述的小鼠或分离的小鼠细胞,其中所述β2微球蛋白基因座包含人β2微球蛋白基因的外显子2、外显子3和外显子4中所示的核苷酸序列。
实施方案29.如实施方案28所述的小鼠或分离的小鼠细胞,其中所述β2微球蛋白基因座还包含小鼠β2微球蛋白基因的外显子1中所示的核苷酸序列。
实施方案30.一种基因修饰的小鼠或分离的小鼠细胞,所述基因修饰的小鼠或分离的小鼠细胞在其基因组中包含:
(a)编码嵌合人/小鼠CD4辅助受体的第一核苷酸序列,所述辅助受体包含人CD4多肽的D1、D2和D3结构域,可操作地连接至小鼠CD4多肽的D4结构域、跨膜结构域和胞质结构域;
(b)编码嵌合人/小鼠CD8α多肽的第二核苷酸序列和编码嵌合人/小鼠CD8β多肽的第三核苷酸序列,
其中所述嵌合人/小鼠CD8α多肽包含可操作地连接至内源小鼠CD8α多肽的跨膜结构域和胞质结构域的人CD8α多肽的IgV样结构域,并且其中所述嵌合人/小鼠CD8β多肽包含可操作地连接至内源小鼠CD8β多肽的跨膜结构域和胞质结构域的人CD8β多肽的IgV样结构域;
(c)编码嵌合人/小鼠MHC IIα多肽的第一核酸序列和编码嵌合人/小鼠MHC IIβ多肽的第二核酸序列,
其中所述嵌合人/小鼠MHC IIα多肽包含可操作地连接至内源小鼠MHC IIα多肽的跨膜结构域和胞质结构域的人HLA II类α多肽的α1和α2结构域,并且其中所述嵌合人/小鼠MHC IIβ多肽包含可操作地连接至内源小鼠MHC IIβ多肽的跨膜结构域和胞质结构域的人HLA II类β多肽的β1和β2结构域;
(d)编码嵌合人/小鼠MHC I多肽的第三核酸序列,所述多肽包含可操作地连接至内源小鼠MHC I类多肽的跨膜结构域和胞质结构域的人HLA I类多肽的α1、α2和α3结构域;
(e)未重排的人T细胞受体(TCR)α可变区序列,所述未重排的人TCR可变区序列包含至少一个人Vα区段和至少一个人Jα区段,所述未重排的人TCR可变区序列可操作地连接至小鼠TCRα恒定区序列;和未重排的TCRβ可变区序列,所述未重排的TCR可变区序列包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段,所述未重排的TCR可变区序列可操作地连接至小鼠TCRβ恒定区序列,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码核酸序列;以及
(f)编码人或人源化β2微球蛋白多肽并且包含核苷酸序列的多核苷酸,所述核苷酸序列包含内源小鼠β2微球蛋白基因的外显子1中所示的核苷酸序列,可操作地连接至人β2微球蛋白基因的外显子2、外显子3和外显子4中所示的核苷酸序列,
任选地其中所述小鼠表达:
(A)所述嵌合人/小鼠CD4辅助受体,
(B)包含所述嵌合人/小鼠CD8α多肽和所述嵌合人/小鼠CD8β多肽的嵌合CD8辅助受体,
(C)嵌合MHC II复合物,所述嵌合MHC II复合物包含所述嵌合人/小鼠MHC IIα多肽和所述嵌合人/小鼠MHC IIβ多肽,其中所述嵌合MHC II复合物能够结合所述嵌合人/小鼠CD4辅助受体,
(D)所述嵌合人/小鼠MHC I多肽,其中所述嵌合MHC I多肽能够结合所述嵌合CD8辅助受体,
(E)T细胞表面上,包含人源化TCRα链和人源化TCRβ链的嵌合人/小鼠T细胞受体,
其中所述人源化TCRα链由可操作地连接至所述小鼠TCRα恒定区序列的重排的人Vα/Jα序列编码,其中所述重排的人Vα/Jα序列通过包含所述至少一个人Vα区段和所述至少一个人Jα区段的所述未重排的人TCRα可变区序列的重排形成,
其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ/Jβ序列编码,其中所述重排的人Vβ/Dβ/Jβ序列通过包含所述至少一个人Vβ区段、至少一个Dβ区段和至少一个人Jβ区段的所述未重排的人TCRβ可变区的重排形成,任选地其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ2/Jβ2序列编码,以及
(F)所述人或人源化β2微球蛋白多肽。
实施方案31.如实施方案12-30中任一项所述的小鼠,其中所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ1簇的基因区段,并且所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ2簇的基因区段。
实施方案32.如实施方案12-31中任一项所述的小鼠或小鼠细胞,其中所述嵌合人/小鼠MHC IIα多肽是嵌合HLA-DR/H-2Eα多肽,所述嵌合人/小鼠MHC IIβ多肽是嵌合人/小鼠HLA-DR/H-2Eβ多肽,并且所述嵌合人/小鼠MHC I多肽是嵌合人/小鼠HLA-A/H-2K多肽,并且其中所述小鼠表达HLA-A/H-2K和HLA-DR/H-2E。
实施方案33.一种制备如实施方案1-32中任一项所述的小鼠或小鼠细胞的方法,所述方法包括将所述小鼠或小鼠细胞的基因组修饰为包含
(a)所述未重排的T细胞受体(TCR)α可变区序列,所述未重排的TCRα可变区序列包含至少一个未重排的人T细胞可变区Vα区段和至少一个未重排的人T细胞可变区Jα区段,所述未重排的TCRα可变区序列可操作地连接至小鼠TCRα恒定基因序列,任选地连接到内源小鼠TCRα可变基因的基因座处,其中所述未重排的TCRα可变区序列包含小鼠TCRA非编码序列,
(ii)所述未重排的TCRβ可变区序列,所述未重排的TCRβ可变区序列包含至少一个未重排的人T细胞可变区Vβ区段、至少一个未重排的人T细胞可变区Dβ区段和至少一个未重排的人T细胞可变区Jβ区段,所述未重排的TCRβ可变区序列可操作地连接至小鼠TCRβ恒定基因序列,任选地连接到内源小鼠TCRβ可变基因的基因座处,
其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列,或
(c)所述未重排的TCRα可变区序列和所述未重排的TCRβ可变区序列两者。
实施方案34.如实施方案33所述的方法,其中所述方法包括用包含所述至少一个未重排的人T细胞可变区Dβ区段、小鼠TCRBD-TCRBJ非编码核酸序列和所述至少一个未重排的人T细胞可变区Jβ区段的核酸序列置换包含小鼠TCRBD基因区段和小鼠TCRBJ基因区段的邻接小鼠TCRB序列,使得所述至少一个未重排的人T细胞可变区Dβ区段、所述小鼠TCRBD-TCRBJ非编码核酸序列和所述至少一个未重排的人T细胞可变区Jβ区段可操作地连接至所述小鼠TCRβ恒定基因序列。
实施方案35.如实施方案34所述的方法,其中所述邻接小鼠TCRB序列包含(a)小鼠TCRBD1基因区段和小鼠TCRBJ1-6基因区段和/或(b)小鼠TCRBD2基因区段和小鼠TCRBJ2-7基因区段,并且
其中所述核酸包含:
(A)人源化TCRBDJ1簇,所述人源化TCRBDJ1簇包含未重排的人TCRBD1基因区段、未重排的人TCRBJ1基因区段和小鼠TCRBDJ1非编码序列,其中所述人源化TCRBDJ1簇包含:
未重排的人TRBJ1-1基因区段、未重排的人TRBJ1-2基因区段,以及介于所述未重排的人TRBJ1-1基因区段和所述未重排的人TRBJ1-2基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-2基因区段、未重排的人TRBJ1-3基因区段,以及介于所述未重排的人TRBJ1-2基因区段和所述未重排的人TRBJ1-3基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-3基因区段、未重排的人TRBJ1-4基因区段,以及介于所述未重排的人TRBJ1-3基因区段和所述未重排的人TRBJ1-4基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-4基因区段、未重排的人TRBJ1-5基因区段,以及介于所述未重排的人TRBJ1-4基因区段和所述未重排的人TRBJ1-5基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-5基因区段、未重排的人TRBJ1-6基因区段,以及
介于所述未重排的人TRBJ1-5基因区段和所述未重排的人TRBJ1-6基因区段之间的小鼠TCRB非编码序列,或
未重排的人TRBJ1-1基因区段、未重排的人TRBJ1-2基因区段、未重排的人TRBJ1-3基因区段、未重排的人TRBJ1-4基因区段、未重排的人TRBJ1-5基因区段和未重排的人TRBJ1-6基因区段的任何组合,其中所述人源化TCRBDJ1簇包含介于所述未重排的人TCRBD1基因区段和任何未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列以及介于任何两个连续的未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列,任选地其中所述未重排的人TCRBD1和TCRBJ1基因区段位于相同的小鼠TCRBDJ1非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段;和/或
(B)人源化TCRBDJ2簇,所述人源化TCRBDJ2簇包含未重排的人TCRBD2基因区段、未重排的人TCRBJ2基因区段和小鼠TCRBDJ2非编码序列,其中所述人源化TCRBDJ2簇包含:
未重排的人TRBJ2-1基因区段、未重排的人TRBJ2-2基因区段,以及
介于所述未重排的人TRBJ2-1基因区段和所述
未重排的人TRBJ2-2基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-2基因区段、未重排的人TRBJ2-3基因区段,以及
介于所述未重排的人TRBJ2-2基因区段和所述未重排的人TRBJ2-3基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-3基因区段、未重排的人TRBJ2-4基因区段,以及介于所述未重排的人TRBJ2-3基因区段和所述未重排的人TRBJ2-4基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-4基因区段、未重排的人TRBJ2-5基因区段,以及
介于所述未重排的人TRBJ2-4基因区段和所述未重排的人TRBJ2-5基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-5基因区段、未重排的人TRBJ2-6基因区段,以及
介于所述未重排的人TRBJ2-5基因区段和所述未重排的人TRBJ2-6基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-6基因区段、未重排的人TRBJ2-7基因区段,以及介于所述未重排的人TRBJ2-6基因区段和所述未重排的人TRBJ27基因区段之间的小鼠TCRB非编码序列,或
未重排的人TRBJ2-1基因区段、未重排的人TRBJ2-2基因区段、未重排的人TRBJ2-3基因区段、未重排的人TRBJ2-4基因区段、未重排的人TRBJ2-5基因区段、未重排的人TRBJ2-6基因区段和未重排的人TRBJ2-7基因区段的任何组合,其中所述人源化TCRBDJ2簇包含介于所述未重排的人TCRBD2基因区段和任何未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列以及介于任何两个连续的未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列,任选地其中所述未重排的人TCRBD2和TCRBJ2基因区段位于相同的小鼠TCRBDJ2非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段。
实施方案36.如实施方案33-35中任一项所述的方法,所述方法还包括将所述小鼠或所述小鼠细胞的基因组修饰为包含:
(a)编码所述嵌合CD4辅助受体的所述第一核苷酸序列;
(b)编码所述嵌合CD8α多肽的所述第二核苷酸序列和编码所述嵌合CD8β多肽的所述第三核苷酸序列;
(c)编码所述嵌合MHC IIα多肽的所述第一核酸序列和编码所述嵌合MHC IIβ多肽的所述第二核酸序列;
(d)编码所述嵌合MHC I多肽的所述第三核酸序列;以及
(e)任选地,编码人或人源化β2微球蛋白多肽的β2微球蛋白基因座。
实施方案37.如实施方案36所述的方法,其中所述修饰基因组包括在一个或多个小鼠ES细胞中进行同源重组,使得所述第一核苷酸序列、第二核苷酸序列和第三核苷酸序列;所述未重排的人TCRα可变区序列和未重排的TCRβ可变区序列;所述第一核酸序列、第二核酸序列和第三核酸序列;和任选地β2微球蛋白基因座;以任何顺序添加到所述一个或多个小鼠ES细胞的基因组中。
实施方案38.如实施方案37所述的方法,所述方法还包括从所述一个或多个小鼠ES细胞产生小鼠。
实施方案39.一种获得以下任一种的方法:(1)对抗原具有特异性并且包含人TCR可变结构域的TCR蛋白,(2)所述人TCR可变结构域和(3)编码所述人TCR可变结构域的核酸序列,
所述方法包括
从根据实施方案1-32中任一项所述的小鼠中分离以下任一种:
(1)表达TCR蛋白的T细胞,所述TCR蛋白对抗原具有特异性并且包含人TCRα可变结构域和人TCRβ可变结构域,
(2)(i)所述人TCRα可变结构域和(ii)所述人TCRβ可变结构域中的任一者或两者,以及
(3)(i)编码所述人TCRα可变结构域的核酸序列和(ii)编码所述人TCRβ可变结构域的核酸序列中的任一者或两者。
实施方案40.如实施方案39所述的方法,其中所述方法包括从所述小鼠中分离编码所述人TCRα可变结构域的所述核酸序列和编码所述人TCRβ可变结构域的所述核酸序列,所述方法还包括
在足以表达以下核酸序列的条件下培养宿主细胞:(i)编码与人TCRα恒定区可操作连接的所述人TCRα可变结构域的所述核酸序列,(ii)编码与人TCRβ恒定区可操作连接的所述人TCRβ可变结构域的所述核酸序列,
其中编码所述人TCRα可变结构域和所述人TCRβ可变结构域的所述核酸序列处于相同或不同的表达载体上。
实施方案41.如实施方案39或实施方案40所述的方法,其中所述抗原是肿瘤抗原、病毒抗原或细菌抗原。
实施方案42.一种表达TCR蛋白的T细胞,所述TCR蛋白包含如实施方案39-41中任一项所述的方法获得的对抗原具有特异性的人TCR可变结构域。
实施方案43.一种由表达TCR蛋白的所述T细胞产生的杂交瘤,所述TCR蛋白包含如实施方案39-42中任一项所述的方法获得的对抗原具有特异性的人TCR可变结构域。
实施方案44.一种根据如实施方案39-43中任一项所述的方法获得的人T细胞受体可变结构域。
实施方案45.一种核酸,所述核酸包含根据如实施方案39-44中任一项所述的方法分离的(i)编码所述人TCRα可变结构域的所述核酸序列和(ii)编码所述人TCRβ可变结构域的所述核酸序列中的任一者或两者。
实施方案46.一种宿主细胞,所述宿主细胞包含如实施方案45所述的核酸。
实施方案47.一种表达载体,所述表达载体包含如实施方案45所述的核酸。
实施方案48.如实施方案47所述的表达载体,其中所述表达载体包含以下的至少一种:(a)可操作地连接至编码人TCRα恒定区的序列的编码人TCRα可变结构域的所述核酸序列,和(b)可操作地连接至编码人TCRβ恒定区的序列的编码所述人TCRβ可变结构域的所述核酸序列。
实施方案49.如实施方案1-32中任一项所述的小鼠细胞,其中所述小鼠细胞是胚胎干细胞。
实施方案50.如实施方案49所述的基因修饰的小鼠胚胎干细胞,所述基因修饰的小鼠胚胎干细胞在其基因组中包含:
(a)编码嵌合CD4辅助受体的第一核苷酸序列,所述辅助受体包含人CD4多肽的D1、D2和D3结构域以及小鼠CD4多肽的跨膜结构域和胞质结构域,
(b)分别编码嵌合CD8α多肽和嵌合CD8β多肽,的第二核苷酸序列和第三核苷酸序列,
其中所述嵌合CD8α多肽包含人CD8α多肽的IgV样结构域和小鼠CD8α多肽的跨膜结构域和胞质结构域,
其中所述嵌合CD8β多肽包含人CD8β多肽的IgV样结构域和小鼠CD8β多肽,的跨膜结构域和胞质结构域,以及
(c)分别编码嵌合MHC IIα多肽和嵌合MHC IIβ多肽的第一核酸序列和第二核酸序列,
其中所述嵌合MHC IIα多肽包含人HLA II类α多肽的α1和α2结构域以及非人MHCIIα多肽的跨膜结构域和胞质结构域,
其中所述嵌合MHC IIβ多肽包含人HLA II类β多肽的β1和β2结构域以及小鼠MHCIIβ多肽的跨膜结构域和胞质结构域,
(d)编码嵌合MHC I多肽的第三核酸序列;
其中所述嵌合MHC I多肽包含人HLA I类多肽的α1结构域、α2结构域和α3结构域以及小鼠MHC I多肽的跨膜结构域和胞质结构域,以及
(e)未重排的人T细胞受体(TCR)α可变区序列,所述未重排的人TCR可变区序列包含至少一个人Vα区段和至少一个人Jα区段,所述未重排的人TCR可变区序列可操作地连接至小鼠TCRα恒定区序列;和未重排的TCRβ可变区序列,所述未重排的TCR可变区序列包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段,所述未重排的TCR可变区序列可操作地连接至小鼠TCRβ恒定区序列,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列。
实施方案51.如实施方案50所述的基因修饰的小鼠胚胎干细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处;
(b)所述第二核苷酸序列存在于内源CD8αT细胞辅助受体基因座处并且所述第三核苷酸序列存在于内源CD8βT细胞辅助受体基因座处;
(c)所述第一核酸序列存在于内源MHC IIα基因座处并且所述第二核酸序列存在于内源MHC IIβ基因座处;
(d)所述第三核酸序列存在于内源MHC I基因座处;和/或
(e)所述未重排的人TCRα可变区序列存在于内源TCRα可变区基因座处并且所述未重排的TCRβ可变区序列存在于内源TCRβ可变区基因座处。
实施方案52.如实施方案50或实施方案51所述的基因修饰的小鼠胚胎干细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处并且可操作地连接至内源CD4辅助受体启动子和调控元件;
(b)所述第二核苷酸序列存在于内源CD8αT细胞辅助受体基因座处并且可操作地连接至内源CD8α多肽启动子和调控元件,并且所述第三核苷酸序列存在于内源CD8β基因座处可操作地连接至内源CD8β多肽启动子和调控元件;
(c)所述第一核酸序列存在于内源MHC IIα基因座处可操作地连接至内源MHC IIα启动子和调控元件,并且所述第二核酸序列存在于内源MHC IIβ基因座处并且可操作地连接至内源非人MHC IIβ启动子和调控元件;
(d)所述第三核酸序列存在于内源MHC I基因座处可操作地连接至内源MHC I启动子和调控元件;和/或
(e)所述未重排的TCRα可变区序列可操作地连接至内源TCRα调控元件并且所述未重排的TCRβ可变区序列可操作地连接至内源TCRβ调控元件。
实施方案53.如实施方案50-52中任一项所述的基因修饰的小鼠胚胎干细胞,其中所述第一核苷酸序列编码所述嵌合CD4辅助受体,所述嵌合CD4辅助受体包含所述人CD4多肽的D1、D2和D3结构域,可操作地连接至内源CD4多肽的D4结构域、跨膜结构域和胞质结构域,
(b)所述第二核苷酸序列编码所述嵌合CD8α多肽,所述嵌合CD8多肽包含可操作地连接至内源CD8α多肽的跨膜结构域和胞质结构域的所述人CD8α多肽的所述IgV样结构域,并且所述第三核苷酸序列编码所述嵌合CD8β多肽,所述嵌合CD8多肽包含可操作地连接至内源CD8β多肽的跨膜结构域和胞质结构域的所述人CD8β多肽的所述IgV样结构域;
(c)所述第一核酸序列编码所述嵌合MHC IIα多肽,所述嵌合MHC II
多肽包含可操作地连接至内源MHC IIα多肽的跨膜结构域和胞质结构域的人HLAII类α1和α2结构域,并且所述第二核酸序列编码所述嵌合MHC IIβ多肽,所述嵌合MHC II多肽包含可操作地连接至内源MHC IIβ多肽的跨膜结构域和胞质结构域的人HLA II类β1和β2结构域;和/或
(d)所述第三核酸序列编码所述嵌合MHC I多肽,所述嵌合MHC I多肽包含可操作地连接至内源MHC I多肽的跨膜结构域和胞质结构域的人HLA I类α1、α2和α3结构域。
实施方案54.一种通过如实施方案33-38中任一项所述的方法制备的小鼠胚胎干(ES)细胞。
实施方案55.一种靶向载体,所述靶向载体包含用于靶向小鼠TCRBDJ区、未重排的人TCRBD区段、未重排的人TCRBJ区段和小鼠TRCBDJ非编码序列的5’同源臂和3’同源臂,
其中靶向载体包含介于所述未重排的人TCRBD区段和任何未重排的人TCRBJ基因区段之间以及介于任何两个连续的未重排的人TCRBJ基因区段之间的小鼠TCRBDJ非编码序列,任选地其中所述未重排的人TCRBD和TCRBJ基因区段位于相同的小鼠TCRBDJ非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj基因区段。
实施方案56.如实施方案55所述的靶向载体,其中
(A)所述未重排的人TCRBD区段包含在7号染色体(GRCh38组件)上的下列人类基因组坐标所示的序列:
142,786,213-142,786,224和/或
142,796,365-142,796,414;
(B)所述未重排的人TCRBJ区段包含在7号染色体(GRCh38组件)上的下列人类基因组坐标所示的序列:
142,786,880-142,786,927,
142,787,017-142,787,064,
142,787,630-142,787,679,
142,788,225-142,788,275,
142,788,498-142,788,547,
142,788,988-142,789,040,
142,795,686-142,795,740,
142,796,560-142,796,610,
142,796,847-142,796,895,
142,796,998-142,797,047,
142,797,119-142,797,166,
142,797,239-142,797,291和/或
142,797,456-142,797,502。
实施方案57.一种小鼠基因组或小鼠细胞,所述小鼠基因组或小鼠细胞包含如实施方案55或实施方案56所述的靶向载体。
本文所述的基因修饰的动物,即包含人或人源化T细胞辅助受体(例如,嵌合人/非人CD4或CD8),任选地进一步包含人或人源化MHC II或I蛋白的动物的其他用途,将从本公开内容中显而易见。
实施例
提供以下实施例是为了向本领域普通技术人员描述如何制备和使用本发明的方法和组合物,而不是旨在限制发明人认为是他们的发明的范围。已经努力确保所用数字(例如,量、温度等)的准确性,但是应该考虑一些实验误差和偏差。实施例不包括本领域普通技术人员熟知的常规方法(分子克隆技术等)的详细描述)。除非另有说明,否则份是重量份,分子量是平均分子量,温度以摄氏度指示,并且压力为大气压或接近大气压。
实施例1:人源化MHC小鼠的产生
在图3A中描绘了在工程改造小鼠中牵涉的各个步骤,该小鼠包含人源化MHC I和MHC II基因座,有相应的和附加的内源MHC I和MHC II基因座缺失(HLA-A2/H-2K、HLA-DR2/H-2E、H-2A-del、H-2D-del)。这些步骤的详细描述如下。
实施例1.1:人源化MHC I小鼠的产生和表征
先前在通过引用并入本文的美国专利公开第20130111617号中已经描述了人源化MHC I小鼠的产生。简言之,在单个步骤中通过使用技术从人和小鼠细菌人工染色体(BAC)DNA构建独特的靶向载体,使小鼠H-2K基因人源化(参见,例如,美国专利第6,586,251号和Valenzuela等人(2003)High-throughput engineering of the mousegenome coupled with high-resolution expression analysis.Nat.Biotech.21(6):652-659)。通过同源重组修饰来自小鼠BAC克隆RP23-173k21(Invitrogen)的DNA,以用编码人HLA-A基因的α1、α2和α3亚基的人类基因组DNA置换编码小鼠H-2K基因的α1、α2和α3结构域的基因组DNA(图2A)。
具体地说,在使用靶向载体的单个靶向事件中编码小鼠H-2K基因的α1、α2和α3亚基的基因组序列被编码HLA-A*0201基因的α1、α2和α3结构域的人类基因组DNA置换,靶向载体包含侧翼是loxP位点的潮霉素盒,具有含有小鼠H-2K基因座5’的序列(包括5’非翻译区(UTR))的5’小鼠同源臂和含有小鼠H-2Kα3编码序列3’的基因组序列的3’小鼠同源臂。
用于靶向内源H-2K基因的基因座的最终构建体从5’至3’包括(1)含有内源H-2K基因5’的~200bp小鼠基因组序列(包括5’UTR)的5’同源臂,(2)~1339bp的人类基因组序列,包括HLA-A*0201前导序列、HLA-A*0201前导序列/α1内含子、HLA-A*0201α1外显子、HLA-A*0201α1-α2内含子、HLA-A*0201α2外显子、α2-α3内含子的5’末端的~316bp,(3)5’loxP位点,(4)潮霉素盒,(5)3’loxP位点,(6)~580bp的人类基因组序列,包括α2-α3内含子的3’末端的~304bp、HLA-A*0201α3外显子,和(7)含有~200bp的小鼠基因组序列的3’同源臂,包括介于小鼠H-2Kα3和跨膜编码序列之间的内含子。在SEQ ID NO:90中示出了靶向载体5’处小鼠/人序列连接处的149个核苷酸的序列,并且在SEQ ID NO:91中示出了靶向载体3’处人/小鼠序列连接处的159个核苷酸的序列。与该靶向载体的同源重组产生经修饰的小鼠H-2K基因座,该基因座含有编码HLA-A*0201基因的α1、α2和α3结构域的人类基因组DNA,其可操作地连接至内源小鼠H-2K跨膜结构域和胞质结构域编码序列,翻译后导致嵌合人/小鼠MHC I类蛋白的形成。存在于靶向构建体中的选择盒可以稍后使用本领域已知的各种方法去除。
靶向的BAC DNA用于对小鼠F1H4 ES细胞进行电穿孔以产生经修饰的ES细胞,以产生在有核细胞(例如,T淋巴细胞和B淋巴细胞、巨噬细胞、嗜中性粒细胞)的表面表达嵌合MHC I类蛋白的小鼠(参见,例如,图3A中描绘的方案的步骤1)。通过定量TAQMANTM测定(Valenzuela等人(2003),见上文)鉴定含有人HLA序列插入的ES细胞。
为了产生表达嵌合MHC I的小鼠,将本文所述的靶向ES细胞用作供体ES细胞,并通过方法引入8细胞期小鼠胚胎中(参见,例如美国专利第7,294,754号和Poueymirou等人(2007)F0 generation mice that are essentially fully derivedfrom the donor gene-targeted ES cells allowing immediate phenotypic analysesNature Biotech.25(1):91-99)。通过使用检测独特的人HLA-A*0201基因序列的存在的等位基因修饰测定法(Valenzuela等人,见上文)进行基因分型,鉴定独立带有嵌合MHC I类基因的(完全源自供体ES细胞的F0小鼠)。通过这种方法产生的杂合小鼠经繁殖成纯合。嵌合HLA-A2/H-2K的表达使用对HLA-A和H-2K具有特异性的抗体通过流式细胞术进行确认。
将包含嵌合HLA-A2/H-2K的上述靶向ES细胞用于实施例1.2-1.3中描述的进一步基因工程步骤中,以产生包含人源化MHC I和MHC II基因座两者且缺乏内源MHC I和MHC II基因座的小鼠(参见图3A)。
实施例1.2:包含MHC I和MHC II基因座缺失的小鼠ES细胞的产生
内源MHC II基因座的缺失在通过引用并入本文的美国专利申请第20130111616号中有描述。简言之,使用基因工程技术制备用于引入内源MHC II类H-2Ab1、H-2Aa、H-2Eb1、H-2Eb2和H-2Ea基因缺失的靶向载体(参见,例如美国专利第6,586,251号和Valenzuela等人,见上文)。修饰细菌人工染色体(BAC)RP23-458i22(Invitrogen)DNA以使内源MHC II类基因H-2Ab1、H-2Aa、H-2Eb1、H-2Eb2和H-2Ea缺失。
具体地说,上游和下游同源臂是通过小鼠BAC DNA分别从H-2Ab1基因的5’位置和H-2Ea基因的3’位置进行PCR得到的。通过细菌同源重组(BHR),使用这些同源臂制备缺失~79kb包含MHC II类基因座的基因H-2Ab1、H-2Aa、H-2Eb1、H-2Eb2和H-2Ea的RP23-458i22的盒。该区域被侧翼为lox2372位点的新霉素盒置换。最终靶向载体从5’到3’包括:包含内源MHC II类基因座的H-2Ab1基因5’的小鼠基因组序列的26kb同源臂、5’lox2372位点、新霉素盒、3’lox2372位点和包含内源MHC II类基因座的H-2Ea基因3’的小鼠基因组序列的63kb同源臂。
BAC DNA靶向载体(如上所述)用于对包含人源化MHC I基因座的小鼠ES细胞(来自以上实施例1.1;参见,例如图3A中的步骤2)进行电穿孔以产生包含内源MHC II类基因座缺失(H-2A和H-2E均缺失)的经修饰的ES细胞。使用TAQMANTM探针通过定量PCR测定法鉴定含有缺失的内源MHC II类基因座的阳性ES细胞(Lie和Petropoulos(1998)Curr.Opin.Biotechnology 9:43-48)。使用引物5111U F(CAGAACGCCAGGCTGTAAC;SEQ IDNO:1)和5111U R(GGAGAGCAGGGTCAGTCAAC;SEQ ID NO:2)及探针5111U P(CACCGCCACTCACAGCTCCTTACA;SEQ ID NO:3)通过PCR确认缺失的基因座的上游区域,而缺失的基因座的下游区域使用引物5111D F(GTGGGCACCATCTTCATCATTC;SEQ ID NO:4)和5111DR(CTTCCTTTCCAGGGTGTGACTC;SEQ ID NO:5)及探针5111DP(AGGCCTGCGATCAGGTGGCACCT;SEQ ID NO:6)进行确认。使用引物NEOF(GGTGGAGAGGCTATTCGGC;SEQ ID NO:7)和NEOR(GAACACGGCGGCATCAG;SEQ ID NO:8)及探针NEOP(TGGGCACAACAGACAATCGGCTG;SEQ ID NO:9)确认来自靶向载体的新霉素盒的存在。跨越上游缺失点的核苷酸序列(SEQ ID NO:10)包括以下序列,其指示与缺失点处存在的盒序列连续连接的缺失点上游的内源小鼠序列(包含在下面的括号内):(TTTGTAAACAAAGTCTACCCAGAGACAGAT GACAGACTTC AGCTCCAATG CTGATTGGTTCCTCACTTGG GACCAACCCT)ACCGGTATAA CTTCGTATAAGGTATCCTAT ACGAAGTTAT ATGCATGGCC TCCGCGCCGG。跨越下游缺失点的核苷酸序列(SEQ ID NO:11)包括以下序列,其指示与缺失点下游的内源小鼠序列(包含在下面的括号内)邻接的盒序列:CGACCTGCAGCCGGCGCGCC ATAACTTCGT ATAAGGTATCCTATACGAAGTTATCTCGAG(CACAGGCATT TGGGTGGGCA GGGATGGACGGTGACTGGGA CAATCGGGATGGAAGAGCAT AGAATGGGAGTTAGGGAAGA)。
在产生包含上述MHC I人源化和内源MHC II缺失的ES细胞之后,使用CRE去除lox化新霉素盒(参见,例如图3A中的步骤3)。具体地说,将编码Cre重组酶的质粒电穿孔到ES细胞中以去除新霉素盒。也可以使用本领域已知的其他方法去除新霉素盒。
为了使小鼠H-2D基因座缺失,使用BHR修饰小鼠BAC克隆bMQ-218H21(SangerInstitute),用6,085bp的盒置换H2-D基因的3756bp(从ATG起始密码子到TGA终止密码子下游的3bp,小鼠H-2D的外显子1-8),该盒从5’到3’含有:与5’loxp在框内的LacZ基因、UbC启动子、新霉素基因和3’loxp位点。
BAC DNA靶向载体(如上所述)用于对包含人源化MHC I基因座和小鼠MHC II缺失的小鼠ES细胞进行电穿孔,如上所述(参见,例如图3A中的步骤4)。如上所述,通过定量PCR测定鉴定含有缺失的内源H-2D基因座的阳性ES细胞。表2含有用于定量PCR测定的引物和探针。
表2:用于检测缺失的H-2D基因座的TAQMANTM等位基因丢失测定引物和探针
实施例1.3:嵌合人/小鼠MHC II基因座的引入
为了产生包含人源化HLA-DR2/H-2E的载体,首先,根据通过引用并入本文的2014年9月30日发布的美国专利第8,847,005号中的描述修饰小鼠H-2Ea基因,以产生包含编码嵌合H-2Ea/HLA-DRA1*01蛋白的序列的载体。
对于小鼠H-2Eb基因,使用合成的人HLA-DR2β链(DRB1*1501)来产生包含DRβ1*02(1501)外显子和内含子的载体,并使用细菌同源重组交换到包含嵌合H-2Ea/HLA-DRA1*01蛋白的载体中。H-2Eb1基因基本上如美国专利公开第20130185820号和美国专利第8,847,005号中所述那样进行修饰,每个专利均通过引用并入本文。使用潮霉素选择盒。
所得HLA-DR2/H-2E大靶向载体(LTVEC)在图2B和图3B中有描绘。所得LTVEC的各种核苷酸序列连接处(例如,小鼠/人序列连接处、人/小鼠序列连接处,或小鼠序列或人序列与选择盒的连接处)汇总于下面表3中并列于序列表中;它们的位置在图3B的示意图中有指示。在下面的表3中,除了标有星号(*,参见表的图例)的序列外,小鼠序列为常规字体;人序列在括号中;Lox序列为斜体;以及克隆步骤期间引入的限制性位点和其他基于载体的序列(例如,多克隆位点等)加粗。
表3:嵌合HLA-DR2/H-2E基因座的核苷酸序列连接处
标有星号的序列是C57BL/6-BALB/c连接序列,其中C57BL/6序列在括号中。在嵌合H-2Ea基因的克隆期间,H-2Ea的C57BL/6等位基因的外显子1及内含子1的剩余部分被来自H-2Ea的BALB/c等位基因的等效2616bp区域置换。这样做是因为H-2Ea的C57BL/6等位基因的外显子1含有致使基因无功能的缺失,而H-2Ea的BALB/c等位基因的外显子1是有功能的。关于更详细的描述,参见美国专利第8,847,005号,其通过引用并入本文。
使用上述靶向的BAC DNA对包含人源化MHC I(HLA-A2)以及MHC II和H-2D缺失的小鼠ES细胞进行电穿孔,以产生经修饰的ES细胞,以产生表达嵌合MHC I和MHC II基因且缺乏功能性内源小鼠H-2E、H-2A、H-2K和H-2D基因座的小鼠(参见,例如图3A中的步骤5)。使用表4中的引物和探针,通过定量PCR(TAQMANTM)测定鉴定含有人HLA序列插入的ES细胞。
表4:用于检测MHC I和MHC II基因座人源化的TAQMANTM引物和探针序列
1除这一个之外的所有序列都用于等位基因获得测定中。
可以通过技术人员已知的方法去除选择盒。例如,可以用表达Cre的构建体转染带有嵌合人/小鼠MHC I类基因座的ES细胞,以便去除通过插入靶向构建体而引入的“lox化”选择盒(参见,例如图3A中的步骤6)。选择盒可以任选地通过与表达Cre重组酶的小鼠繁殖来去除。任选地,选择盒保留在小鼠中。
使用上述定量测定,使用本文针对个体修饰描述的引物/探针集合,验证含有本文所述的所有修饰(图3A的HLA-A2/H-2K、HLA-DR2/H-2E、H-2A-del、H-2D-del)的靶向ES细胞。使用另外的引物/探针集合来确定在盒缺失步骤期间,由于lox位点以相反方向存在,没有产生反向克隆。
将上述靶向ES细胞用作供体ES细胞并通过方法引入8细胞期小鼠胚胎中(参见,例如美国专利第7,294,754号和Poueymirou等人(2007),见上文)。通过使用检测独特的人基因序列的存在的等位基因修饰测定法(Valenzuela等人,见上文)进行基因分型,鉴定独立带有嵌合MHC I类和MHC II基因的(完全源自供体ES细胞的F0小鼠)。图3C中描绘了所得小鼠中MHC基因座的基因型的示意图(**表示并非所有小鼠品系中都存在的H-2L基因)。使用对人HLA-DR2和HLA-A2具有特异性的抗体确认嵌合人/小鼠MHC I和MHC II蛋白的表达。杂合子小鼠经繁殖成纯合。
实施例1.4:人源化β2微球蛋白小鼠的产生
β2微球蛋白小鼠的产生在通过引用并入本文的美国专利申请公开第20130111617号中有描述。简言之,小鼠β2微球蛋白(β2m)基因在单个步骤中通过使用技术从人和小鼠细菌人工染色体(BAC)DNA构建独特的靶向载体而被人源化(参见,例如美国专利第6,586,251号和Valenzuela等人,见上文)。
具体地,通过细菌同源重组产生靶向载体,该靶向载体含有来自RPCI-23文库(Invitrogen)的BAC克隆89C24的小鼠β2m上游同源臂和下游同源臂。小鼠同源臂经工程改造成处于2.8kb人β2m DNA片段的侧翼,该片段从外显子2延伸至非编码外显子4下游的约267个核苷酸处(图2C)。将侧翼是重组酶识别位点(例如,loxP位点)的药物选择盒(新霉素)工程改造到靶向载体中,以允许后续选择。将最终靶向载体线性化并电穿孔到F1H4小鼠ES细胞系中(Valenzuela等人,见上文)。
通过方法将去除了药物盒(通过引入Cre重组酶)的靶向ES细胞克隆引入8细胞期小鼠胚胎中(参见,例如美国专利第7,294,754号和Poueymirou等人,见上文)。通过使用等位基因修饰测定法来筛选小鼠等位基因的丢失和人类等位基因的获得来鉴定带有人源化β2m基因的(完全源自供体ES细胞的F0小鼠)(Valenzuela等人,见上文)。杂合子小鼠经繁殖成纯合。使用对人β2微球蛋白具有特异性的抗体,通过流式细胞术确认人β2微球蛋白的表达。
实施例2:人源化T细胞受体小鼠的产生
使用基因工程技术制备包含内源TCR(α或β)可变基因座缺失和内源V和J区段或V、D和J区段置换的小鼠(参见,例如美国专利第6,586,251号和Valenzuela,D.M.等人(2003),见上文),其中使用细菌同源重组从BAC文库得到的人序列用于制备大的靶向载体(LTVEC),该靶向载体包含人TCR可变基因座的基因组片段,侧翼是靶向臂,以将LTVEC靶向至小鼠ES细胞中的内源小鼠TCR可变基因座。TCRα和β基因座人源化的详细描述在通过引用并入本文的美国专利第9,113,616号中有描述。根据Valenzuela等人,将LTVEC线性化并电穿孔到小鼠ES细胞系中。选择ES细胞的潮霉素或新霉素抗性,并筛选小鼠等位基因的丢失或人类等位基因的获得。
通过方法(Poueymirou,W.T.等人(2007,见上文),将靶向的ES细胞克隆引入8细胞期(或更早期)的小鼠胚胎中。通过使用等位基因修饰测定法来筛选内源TCR可变等位基因的丢失和人等位基因的获得来鉴定带有人源化TCR基因座的(完全源自供体ES细胞的F0小鼠)(Valenzuela等人,见上文)。对F0幼鼠进行基因分型并且经繁殖成纯合。如本文所述,制备人源化TCRα和/或TCRβ可变基因座纯合的小鼠。
实施例2.1:TCRα基因座的人源化
使用图4A中汇总的和美国专利第9,113,616号中描述的渐进式人源化策略,将小鼠TCRα基因座处对应于110V和60J小鼠区段的1.5兆碱基DNA用对应于人TCRα的54V和61J区段的1兆碱基DNA置换。用于TCRα基因座渐进式人源化策略的各种靶向载体的连接核酸序列汇总在表5中,并且包括在序列表中。
表5:各种TCRα基因座靶向载体的连接核酸序列
人TCRα可变区区段与IMGT数据库中编号相同。序列表中包括每个连接处至少100bp(每个末端约50bp)。
首先,来自小鼠BAC克隆RP23-6A14(Invitrogen)的DNA通过同源重组进行修饰并用作靶向载体,用后面是loxP位点的Ub-潮霉素盒置换内源小鼠TCRα基因座的TCRAJ1-TCRAJ28区。来自小鼠BAC克隆RP23-117i19(Invitrogen)的DNA通过同源重组进行修饰并用作靶向载体,用后面是loxP位点的PGK-新霉素盒置换内源小鼠TCRα和δ基因座的TCRAV1周围(且包括TCRAV1)的~15kb区。通过本领域已知的核型分析和筛选方法(例如,TAQMANTM)确认带有双靶向染色体(即,用这两种靶向载体靶向的单个内源小鼠TCRα基因座)的ES细胞。用CRE重组酶处理经修饰的ES细胞,从而介导两个loxP位点之间区域(即,由从TCRAV1到TCRAJ1的内源小鼠TCRα基因座组成的区域)的缺失并且仅留下单个loxP位点、新霉素盒及小鼠恒定区和增强子区。这种策略导致产生缺失的小鼠TCRα/δ基因座(MAID 1540,图4A,第二个图)。
用于TCRα的第一人靶向载体具有来自CTD2216p1和CTD2285m07BAC克隆(Invitrogen)的191,660bp的人DNA,含有前两个连续的人TCRαV基因区段(TRAV40&41)和61个TCRαJ(50个功能性)基因区段。通过同源重组修饰该BAC,使其在TCRαJ1基因区段下游(3’)403bp处含有Not1位点用于连接3’小鼠同源臂,并且含有5’ASI位点用于连接5’小鼠同源臂。两个不同的同源臂用于连接到这个人区段:3’同源臂含有来自RP23-6A14 BAC克隆的内源小鼠TCRα序列,并且5’同源臂含有来自小鼠BAC克隆RP23-117i19的小鼠TCRαV的5’的内源TCRα序列。将该小鼠-人嵌合BAC用作靶向载体(MAID 1626),用于在小鼠TCRα基因座处进行人TCRα基因区段加上上游loxp-ub-潮霉素-loxp盒的初始插入。MAID 1626靶向载体的连接核酸序列(SEQ ID NO:46-48)在表5中有描述。
随后,制备一系列人靶向载体,这些载体利用相同的小鼠5’臂,该臂含有来自小鼠BAC克隆RP23-117i19的小鼠TCRαV的5’的内源TCRα序列,具有交替的loxP-新霉素-loxP和loxP-潮霉素-loxP(或对于MAID 1979而言,是frt-潮霉素-frt)选择盒。特定的构建体在美国专利第9,113,616号,以及在图4A中有描述,每个插入片段的连接序列包括在表5和序列表中。最终TCRα基因座含有5’loxp-ub-新霉素-loxP盒加上总共54个人TCRαV(45个功能性)基因区段和61个人TCRαJ基因区段,这些基因区段可操作地连接至小鼠TCRα恒定基因和增强子。MAID 1771靶向载体的连接核酸序列(SEQ ID NO:57和58)在表5中有描述。
在任何渐进式人源化步骤中,通过用Cre或Flp重组酶缺失来去除选择盒。另外,人TCRδ基因座可以重新引入TCRα序列。
实施例2.2:TCRβ可变基因座的人源化
TRB基因座的构成更加复杂。在小鼠和人类中,大多数V基因区段位于两个大的胰蛋白酶原(Try)基因簇之间,并且两个D、J、C基因簇位于第二Try簇和3’增强子之间。除了最远端的Trbv1基因以外,所有小鼠Trbv、Trbd和Trbj基因在九个步骤中被人源化(图4B)。小鼠Trbv1基因不是人源化的,因为它的使用频率非常低并且没有人直系同源物。为了使Trbd和Trbj基因人源化,创造两只不同的动物。在一只动物中,小鼠TCRBDJ1和TCRBDJ2区域完全人源化,例如包含连续的人TCRBDJ1和TCRBDJ2序列,例如包含人TCRBDJ1和TCRBDJ2非编码序列(2个功能性人TCRBD区段和14个(13个功能性)人TCRBJ区段)。在另一只动物中,TCRBDJ1和TCRBDJ2区域经修饰,使得小鼠编码序列被等效的人编码区精确置换,所有非编码序列仍是小鼠的。最后,在两只动物中,3’增强子下游的倒置小鼠Trbv31基因被等效的人TRBV30基因置换。
更具体地说,使用图4B中汇总的和美国专利第9,113,616号中详细描述的渐进式人源化策略,将小鼠TCRβ基因座处对应于33V、2D和14J小鼠区段的0.6兆碱基DNA用对应于人TCRβ的67V、2D和14J区段的0.6兆碱基DNA置换。用于TCRβ基因座渐进式人源化策略的各种靶向载体的连接核酸序列汇总在表6中,并且包括在序列表中。
表6:各种TCRβ基因座靶向载体的连接核酸序列
人TCRβ可变区区段与IMGT数据库中编号相同。序列表中包括每个连接处至少100bp(每个末端约50bp)。
具体地说,来自小鼠BAC克隆RP23-153p19(Invitrogen)的DNA通过同源重组进行修饰并用作靶向载体,以用后面是loxP位点的PGK-新霉素盒置换内源小鼠TCRβ基因座中正好在3’胰蛋白酶原(TRY)基因簇上游的17kb区域(包括TCRBV30)。来自小鼠BAC克隆RP23-461h15(Invitrogen)的DNA通过同源重组进行修饰并用作靶向载体,用后面是loxP位点的Ub-潮霉素盒置换内源小鼠TCRβ基因座中5’胰蛋白酶原(TRY)基因簇下游的8355bp区域(包括TCRBV2和TCRBV3)。通过本领域已知的核型分析和筛选方法(例如,TAQMANTM)确认带有双靶向染色体(即,用两种靶向载体靶向的单个内源小鼠TCRβ基因座)的ES细胞。用CRE重组酶处理经修饰的ES细胞,从而介导5’和3’loxP位点之间区域(即由从TCRBV2到TCRBV30的内源小鼠TCRβ基因座组成)的缺失并且仅留下单个loxP位点、新霉素盒及小鼠TCRBD、TCRBJ、恒定序列和增强子序列。一个小鼠TCRVβ留在胰蛋白酶原基因5’簇的上游,一个小鼠TCRVβ留在小鼠Eβ的下游,如图4B中所示。
用于TCRβ的第一人靶向载体具有来自CTD2559j2 BAC克隆(Invitrogen)的125,781bp的人DNA,含有前14个连续的人TCRβV基因区段(TRBV18-TRBV29-1);MAID 1625靶向载体的连接核酸序列(SEQ ID NO:59-61)在表6中有描述。
为了用人TCRβD和J区段置换小鼠TCRβD和J区段,将来自小鼠BAC克隆RP23-302p18(Invitrogen)和来自人BAC克隆RP11-701D14(Invitrogen)的DNA通过同源重组进行修饰并用作靶向载体(MAID 1715)进入含有上述TCRβV基因座(即,MAID 1625)的ES细胞。这种修饰用含有人TCRBD1-J1、loxP Ub-潮霉素-loxP盒、小鼠恒定序列1、人TCRBD2-J2的~25425bp序列置换内源小鼠TCRβ基因座中~18540bp的连续区域(从3’胰蛋白酶原基因的聚A下游的100bp到D2簇中J区段下游的100bp,该D2簇包括小鼠TCRBD1-J1、小鼠恒定序列1和小鼠TCRBD2-J2)。通过本领域已知的核型分析和筛选方法(例如,TAQMANTM)确认带有双靶向染色体(即,用两种靶向载体靶向的单个内源小鼠TCRβ基因座)的ES细胞。用CRE重组酶处理经修饰的ES细胞,从而介导潮霉素盒的缺失,仅留下D1J簇中人J区段下游的单个loxP位点。MAID1715靶向载体的连接核酸序列(SEQ ID NO:62-66)在表6中有描述。
随后,制备一系列利用相同的小鼠5’臂的人靶向载体,该臂含有在来自小鼠BAC克隆RP23-461h15的上游小鼠胰蛋白酶原基因周围的内源TCRβ序列,并具有交替选择盒。特定的构建体在美国专利第9,113,616号,以及在图4B中有描述,每个插入片段的连接序列包括在表6和序列表中。
最后,产生可操作地连接至小鼠TCRβ恒定基因和增强子的含有总共66个人TCRβV(47个功能性)区段和人TCRβD和J区段(MAID 1792)的人TCRβ基因座。MAID 1792靶向载体的连接核酸序列(SEQ ID NO:69和70)在表6中有描述。
小鼠TCRBV31位于TCRBC2(第二TCRB恒定区序列)3’的~9.4kb处,并且与其他TCRBV区段方向相反。等效的人V区段是TCRBV30,位于人TCRB基因座的相似位置。为了使TCRBV31人源化,通过细菌同源重组修饰含有小鼠TCRBV31的小鼠BAC克隆,以制备LTVECMAID 6192。TCRBV31从外显子1中的起始密码子开始的整个编码区、内含子、3’UTR和重组信号序列(RSS)被同源人TCRBV30序列置换。图4B描绘了位于hTCRBV30基因的外显子1和外显子2之间的内含子中的选择盒。
MAID 6192靶向载体的连接核酸序列(SEQ ID NO:71和72)在表6中有描述。将MAID6192DNA电穿孔到MAID1792 ES细胞中,并筛选细胞中小鼠TCRB31等位基因的丢失和人TCRB30等位基因的获得。
内源小鼠TCRβ基因座中~18540bp的连续区域(从3’胰蛋白酶原基因的聚A下游的100bp到D2簇中J区段下游的100bp)用~25425bp的序列(该序列含有:包含人TCRBD1-J1基因区段、loxP Ub-潮霉素-loxP盒、小鼠恒定序列1的连续人序列,和包含如本文所述的人TCRBD2-J2基因区段的连续人序列)置换产生包含全人TCRBDJ1和TCRBJ2簇的小鼠。将具有全人TCRBDJ1和TCRBJ2簇的小鼠与经修饰以组合表达其他人或人源化组分(例如,MHC I、MHC IIα和β、TCRα、CD4、CD8α和β以及β2M)的小鼠进行繁殖,产生了表达相对正常的B细胞和T细胞标志物物和群体,具有正常T细胞功能完整记忆T细胞应答,能够加工LCMV表达蛋白的小鼠(参见,例如实施例6-7)。包含全人TCRBDJ1和TCRBDJ2簇的小鼠展示出TCRBDJ1簇而非TCRDJ2簇的显著基因使用(数据未示出)。为了解决这个问题,可以制备在TCRDJ1和/或TCRDJ2簇包含TCRB非编码序列的小鼠。
具体地,小鼠Trbd1、Trbj1-1至1-6基因区段编码区(坐标chr6:41,533,201-41,535,606,+链;GRCm38组件,NCBI登录号NC_000072.6)被人TRBD1、TRBJ1-1至1-6基因区段编码区(坐标chr7:142,786,213-142,789,040,+链,GRCh38组件,NCBI登录号NC_000007.14)置换;并且小鼠Trbd2、Trbj2-1至2-7基因区段编码区(坐标chr6:41,542,163-41,543,856,GRCm38组件,NCBI登录号NC_000072.6)被人TRBD2和TRBJ2-1至2-7基因区段编码区(坐标chr7:142,795,686-142,797,502,+链,GRCh38组件,NCBI登录号NC_000007.14)置换。具体置换的编码序列及其坐标在下表7中示出。
表7.用人TRB D和J基因区段置换小鼠Trb D和J基因区段
通过Blue Heron Biotechnology重新合成两个构建体,一个构建体包含嵌合TRBDJ1区,另一个构建体包含嵌合TRBDJ2区。在这些构建体中,只有上面表7中列出的特定D区和J区段是人的,它们之间的非编码序列,包括RSS和其他基因间序列,是小鼠的。用5’和3’小鼠同源臂合成Blue Heron构建体,小鼠同源臂也用作PCR引物,用于扩增嵌合区和用于细菌同源重组(BHR)的各种后续步骤(参见表8;“同源框”)。向每个构建体中添加选择盒以帮助克隆选择。
表8:用于引入嵌合TRBDJ序列的小鼠同源框(BHR)
详细地说,在第一个BHR步骤中,使用表8的Trbdj1同源框,插入壮观霉素抗性盒代替小鼠BAC RP23-302p18中的小鼠Trbdj1基因区段区域。所得到的构建体从5’到3’包含氯霉素抗性盒、5’臂、壮观霉素抗性盒和3’臂。将该构建体用作骨架,在第二个BHR步骤中向该骨架中插入包含(1)来自第一Blue Heron构建体的嵌合TRBD1、TRBJ1-1至1-6的~2.7kb区域和(2)潮霉素抗性盒(代替壮观霉素抗性盒)的核苷酸序列。第三个BHR步骤包括使用表8的Trbdj2同源框,在包含上述嵌合Trbdj1基因区段的构建体中插入另一个大观霉素抗性盒来代替小鼠Trbd2基因区段区域。最后,经由BHR插入包含(1)嵌合TRBD2的~2kb区域和来自第二Blue Heron构建体的TRBJ2-1至2-7和(2)新霉素抗性盒的核苷酸序列,代替第二壮观霉素抗性盒。可以在不同步骤使用本领域已知的各种方法(例如,引入Cre重组酶、限制性消化等)去除选择盒。
最终靶向载体从5’到3’含有:氯霉素抗性盒、~2.7kb的TRBDJ1嵌合人序列的、loxp-Ub-hyg-lox盒、小鼠Trbc1恒定基因(GRCm38坐标chr6:41,538,218-41,539,347)、~2kb的TRBDJ2嵌合人类基因组序列和小鼠Trbc2恒定基因(GRCm38坐标chr6:41,546,730-41,548,352)。基于氯霉素/潮霉素抗性选择最终靶向载体克隆。
在重组酶介导的图4B底部示意图中所示的基因座(MAID 6192)中潮霉素和新霉素抗性盒的缺失之后,将该最终靶向载体电穿孔到包含该基因座的小鼠胚胎干细胞(ES)中。靶向同源重组导致
(1)~22.8kb的序列的缺失,该序列包含
人TRBDJ1区(GRCm38坐标chr7:142,775,154-142,789,107),
小鼠恒定Trbc1基因,和
人TRBDJ2区的~4.6kb(GRCm38坐标chr7:142,793,139-142,797,737),以及
(2)~19.1kb的序列的插入,该序列包含:
~TRBDJ1簇,其包含2.7kb的序列,该序列包含人TRBD1及人TRBJ1-1至TRBJ1-6基因区段和小鼠TCR非编码序列,其中人TRBD1和人TRBJ1-1至TRBJ1-6基因区段位于相同的小鼠TCR非编码序列的侧翼,正如通常侧翼是小鼠Trbd1和小鼠Trbj1-1至Trbj1-6基因区段,
小鼠恒定Trbc1基因,和
~TRBDJ2簇,其包含2kb的序列,该序列包含人TRBD2及人TRBJ2-1至TRBJ2-7基因区段和小鼠TCR非编码序列,其中人TRBD2和人TRBJ2-1至TRBJ2-7基因区段位于相同的小鼠TCR非编码序列的侧翼,正如通常侧翼是小鼠Trbd2和小鼠Trbj2-1至Trbj2-7基因区段(图4C)。
通过等位基因修饰(MOA)测定法(如例如Valenzuela等人,见上文),使用插入序列或缺失序列的引物和探针来确认成功整合。
将阳性靶向的ES细胞用作供体ES细胞,并通过方法(参见,例如,US 7,576,259、US 7,659,442、US 7,294,754和US2008-0078000A1,全部通过引用并入本文)显微注射到前桑椹胚(8-细胞)期小鼠胚胎中。包含供体ES细胞的小鼠胚胎在体外温育,然后植入代孕母体中以产生完全源自供体ES细胞的F0小鼠。带有人源化TCRB基因座(具有包含鼠TCRB非编码序列的TRBDJ1区和TRBDJ2区)的小鼠通过使用MOA测定法进行基因分型来鉴定。人源化TCRB基因座(具有包含鼠TCRB非编码序列的TRBDJ1区和TRBDJ2区)杂合的小鼠经繁殖成纯合。
在TRBDJ1和TRBDJ2中包含鼠TCR非编码序列的最终人源化TCRβ基因座小鼠包含人TCRB V区(67个TRBV基因区段)、两个TCRBDJ区(总共2个功能性TRBD和13个功能性TRBJ区段,在TRBDJ1和TRBDJ2区各自具有鼠TCRB非编码序列)、小鼠恒定Trbc1和Trbc2基因及小鼠增强子。
使用与上述策略类似的工程策略来任选地使剩余的5’小鼠TCRβV区段缺失。
在任何上述步骤中,通过用Cre或Flp重组酶以及本领域已知的其他方法使其缺失来去除选择盒。
人源化TCRα可变基因座纯合的小鼠与人源化TCRβ可变基因座纯合的小鼠繁殖以形成包含人源化TCRα和TCRβ可变基因座的后代。将后代繁殖成就人源化TCRα和人源化TCRβ基因座而言纯合。
包含人源化TCRα和TCRβ可变基因座的小鼠经证实经历了正常的T细胞发育,并且包含表达源自多种可变基因区段的可变结构域的T细胞受体。
实施例3:T细胞辅助受体基因座的人源化
CD4基因座和CD8基因座(CD8α和CD8β基因座两者)的人源化在美国专利申请公开第20140245466号中有详细描述,该专利申请通过引用整体并入本文。
实施例3.1:CD4基因座的人源化
具体地说,小鼠CD4基因座在单个步骤中通过使用技术从人和小鼠细菌人工染色体(BAC)DNA构建独特的靶向载体而被人源化(参见,例如美国专利第6,586,251号和Valenzuela等人(2003),见上文)。为了产生靶向载体,使用细菌人工染色体(BAC)DNA进行一系列细菌同源重组(BHR),以及如美国专利申请公开20140245466号中详细描述那样进行其他工程步骤。
人CD4靶向载体用NotI线性化并电穿孔到F1H4小鼠ES细胞。通过使用检测新霉素盒和人CD4基因以及小鼠CD4基因的一个拷贝的存在的等位基因修饰测定法(Valenzuela等人)进行基因分型来鉴定带有人源化CD4基因座的靶向ES细胞。
图5A中描绘了将人源化CD4靶向载体成功掺入ES细胞中得到的最终人源化CD4基因座。跨越人内含子3-lox-新霉素盒连接处(盒的5’末端)的序列在SEQ ID NO:75中示出,并且跨越lox-新霉素盒-人内含子3连接处(盒的3’末端)的序列在SEQ ID NO:76中示出;两个序列也在表9中列出。人源化CD4碎片的完整核酸序列,包括图5A中描述的pgk-新霉素盒,在SEQ ID NO:77中示出。pgk-新霉素盒跨越SEQ ID NO:77的残基307-2176,两个lox位点位于残基267-300和残基2182-2215处,而人序列跨越残基1-234和残基2222-18263。完整人源化CD4蛋白的氨基酸序列在SEQ ID NO:78中示出,人序列跨越氨基酸27-319(在SEQ ID NO:79中示出)。
表9.嵌合CD4靶向载体的连接序列
人序列在括号中并且含有限制性酶位点(PI-Sce I)的序列为粗体。选择盒序列为斜体。
通过将表达Cre重组酶的质粒电穿孔到含有人源化CD4基因座的ES细胞中,去除flox化的新霉素抗性盒。
通过检测新霉素盒不存在、人CD4基因的一个拷贝和小鼠CD4基因的一个拷贝的存在来进行基因分型,鉴定带有人源化CD4基因座而没有抗性标志物的靶向ES细胞。
将上述靶向ES细胞用作供体ES细胞并通过方法引入8细胞期小鼠胚胎中(参见,例如美国专利第7,294,754号和Poueymirou等人(2007,见上文)。独立带有嵌合CD4基因的(完全源自供体ES细胞的F0小鼠)通过使用检测独特的人CD4基因序列的存在的等位基因修饰测定法(Valenzuela等人,见上文)进行基因分型来鉴定。使用抗人CD4抗体检测T细胞表面人源化CD4蛋白的表达。本文所述人源化CD4蛋白杂合的小鼠经繁殖成纯合。
实施例3.2:CD8基因座的人源化
CD8α和CD8β基因在基因组中共同定位,例如共同定位在小鼠6号染色体上,它们彼此相距约37kb定位。由于紧密连接,通过首先引入一个基因,例如CD8β,接着引入第二基因,例如CD8α,进行依次靶向。人源化的具体详细步骤在通过引用并入本文的美国专利申请公开第20140245466号中有描述。
简言之,在单个步骤中通过使用技术从小鼠细菌人工染色体(BAC)DNA构建独特的靶向载体使小鼠CD8β基因座人源化。通过BHR修饰来自BAC RP23-431M6的DNA以产生大的靶向载体(LTVEC)即MAID 1737,以含有编码CD8胞外结构域的小鼠外显子2-3(从内含子1的5’连接处到内含子3的3’连接处)被同源人序列置换(图5B)。将loxp-Ub-Hyg盒插入内含子3的3’连接处。所得载体的各种连接处的核苷酸序列列于表10并在序列表中示出。人源化CD8β蛋白的完整氨基酸序列在SEQ ID NO:83中示出;人序列跨越氨基酸15-165(在SEQ ID NO:84中示出)。
表10.嵌合CD8β靶向载体的连接序列
人序列在括号中,lox位点为斜体,并且限制性酶位点、多克隆位点和载体来源的序列为粗体。
将靶向载体电穿孔到F1H4小鼠ES细胞中。通过使用检测人CD8β基因的存在的等位基因修饰测定法(Valenzuela等人)进行基因分型来鉴定带有人源化CD8β基因座的靶向ES细胞。
也在单个步骤中通过使用技术从小鼠细菌人工染色体(BAC)DNA构建独特的靶向载体使小鼠CD8α基因座人源化。通过BHR修饰来自BAC RP23-431M6的DNA以产生大的靶向载体(LTVEC)即MAID 1738,以含有编码CD8a胞外结构域的小鼠外显子1-2(从小鼠外显子1中Ala密码子27处的5’连接处到小鼠内含子2中的3’连接处)被同源人序列(从人外显子2中的5’连接处到内含子3中的3’连接处(图5A))置换。这保留了外显子1开头的小鼠前导序列。将lox2372-Ub-Neo盒插入人/小鼠序列的3’连接处。所得载体的各种连接处的核苷酸序列列于表11并在序列表中示出。人源化CD8α多肽的完整氨基酸序列在SEQ ID NO:88中示出,人序列跨越氨基酸28-179(在SEQ ID NO:89中示出)。
表11.嵌合CD8α靶向载体的连接序列
人序列在括号中,lox位点为斜体,并且限制性酶位点、多克隆位点和载体来源的序列为粗体。
将上述人源化CD8α靶向载体电穿孔到含有人源化CD8基因座的小鼠ES细胞中,以产生包含人源化CD8b基因座和CD8a基因座的经修饰的ES细胞(图5B)。带有人源化CD8a基因座和CD8b基因座的靶向ES细胞通过使用等位基因修饰测定法进行基因分型来鉴定(Valenzuela等人)。
将上述靶向ES细胞用作供体ES细胞并通过方法引入8细胞期小鼠胚胎中(参见,例如美国专利第7,294,754号和Poueymirou等人,见上文)。通过使用检测独特的人CD8b和CD8a基因序列的存在的等位基因修饰测定法(Valenzuela等人,见上文)进行基因分型,鉴定带有嵌合CD8b基因和嵌合CD8a基因的(完全源自供体ES细胞的F0小鼠)。
CD8α和CD8β基因座中的选择盒可以通过技术人员已知的方法去除。如本文所述,人源化CD8α和CD8β基因座杂合的小鼠经繁殖成纯合。使用抗人CD8抗体检测T细胞表面上人源化CD8α和CD8β的表达。
实施例4:包含人源化细胞免疫系统组分的小鼠的产生
为了产生包含人源化细胞免疫系统组分的小鼠,对于各种组分例如MHC I、MHC IIα和β、TCRα和β(例如,包含全人TCRBDJ1和TCRBDJ2簇中任一者的人源化TCRβ基因座纯合的小鼠,或例如,包含人源化TCRBDJ1和TCRBDJ2簇的人源化TCRβ基因座纯合且具有鼠TCRB非编码序列和人编码序列的小鼠)、CD4、CD8α和β及β2M的人源化而言纯合的小鼠可以任何组合一起繁殖,以产生T细胞免疫应答的不同组分人源化的小鼠。例如,包含人源化MHC I的小鼠可以与包含人源化β2M的小鼠繁殖,以产生表达人源化MHC I/β2M的小鼠。使用本领域已知的方法,将对于各种组分(例如MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β及β2M)的人源化而言纯合的小鼠一起繁殖,以获得包含所有九种人源化的小鼠(“TM I/II B C4/8”小鼠,在本文中也可称为“VelociT”小鼠)。使用本领域已知的方法将小鼠繁殖至纯合。可替代地,包含每种人源化基因的靶向载体可经由依次靶向引入同一ES细胞中,以获得包含所有九种人源化的ES细胞,并通过以上实施例1-3中描述的方法将所得ES细胞引入8细胞期小鼠胚胎中。TM I/II B C4/8小鼠可包含全人类TCRBDJ1和TCRBDJ2簇(参见,例如实施例5-7和相关附图)或者可包含人源化TCRBDJ1和TCRBDJ2簇,所述簇包含鼠TCRBDJ1和TCRBDJ2非编码序列及人TCRBDJ1和TCRBDJ2编码序列(参见,例如实施例8和相关附图)。
实施例5:包含人源化细胞免疫系统组分的小鼠的表征
表征人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β及人源化β2M纯合的小鼠。具体地说,从小鼠收获脾脏和胸腺,并获得单细胞悬浮液。将悬浮液在4℃下以1200rpm离心5分钟以使细胞沉淀,并用4mL ACK裂解缓冲液(GIBCO)裂解来自每个组织的细胞以裂解红细胞。通过细胞过滤器过滤细胞,离心沉淀,重悬于培养基中并计数。
图6A-图6C和图9A-图9C中描绘的CD19、CD3、CD4和CD8α的细胞表面表达通过FACS使用荧光染料缀合的抗体进行分析:抗小鼠CD3(17A2,BD)、抗小鼠CD19(1D3,BD)、抗小鼠F4/80(BM8,Biolegend)、抗小鼠CD8α(53-6.7,BD)、抗小鼠CD4(RM4-5,eBioscience)、抗人CD8α(SK1,BD)和抗人CD4(RPA-T4,BD)。图7A-图7F和图10A-图10F中的小鼠H2Db、人HLA分子(HLA-A2、B2m和HLA-DR)和小鼠MHC IAIE分子的细胞表面表达通过FACS使用荧光染料缀合的抗体进行分析:抗小鼠CD19(6D5,Biolegend)、抗小鼠F4/80(BM8,Biolegend)、抗小鼠H2Db(KH95,Biolegend)、抗人HLA-A2(BB7.2,BD)、抗人HLA-DR(G46-6,BD)、抗人B2-微球蛋白(2M2,Biolegend)和抗小鼠IAIE(M5/114.15.2,eBioscience)。图7G和图10G中小鼠和人CD4和CD8的细胞表面表达通过FACS使用荧光染料缀合的抗体进行分析:抗小鼠CD3(17A2,Biolegend)、抗小鼠CD4(GK1.5,eBiosciences)、抗小鼠CD8α(53-6.7,BD 2)、抗小鼠CD8β(H35-17.2,eBioscience)、抗人CD4(OKT4,eBioscience)、抗人CD8α(RPA-T8,BD 6)、抗人CD8β(2ST8.5H7,BD)。图8或图11中所示的FoxP3和CD25的细胞表面表达通过FACS抗-FoxP3(FJK-16s,eBioscience)和抗-CD25(PC61,Biolegend)进行分析。图9D-9E中所示的CD44和CD62L的细胞表面表达使用抗CD44(IM7,BD)和抗CD62L(MEL-14,Biolegend)进行分析。
所有流式细胞术均使用BD Fortessa进行。使用FlowJo分析数据。
在图6A-图6C、图7A-图7G和图8中描绘了胸腺中的表达。在对照小鼠和人源化TMI/II B C4/8小鼠中,胸腺细胞和CD3+细胞的绝对数目以及胸腺T细胞的总体发育是同等的(数据未示出)。图6A显示具有人源化细胞免疫系统(TM I/II B C4/8)的小鼠胸腺中B细胞和T细胞的比例与对照小鼠中发现的比例相似。将TM I/II B C4/8小鼠胸腺中F4/80细胞的频率和数目与对照小鼠进行比较(图6B且数据未示出)。同样,人源化CD4和CD8在针对所有九个细胞免疫基因(TM I/II B C4/8)人源化的小鼠胸腺细胞上表达,类似于非人源化对照小鼠中小鼠CD4和CD8的表达(图6C)。人源化β2M在人源化TM I/II B C4/8小鼠的B细胞和巨噬细胞表面表达,而在对照小鼠的B细胞和巨噬细胞中不存在其表达(图7A和图7B)。类似地,人源化MHC I和II存在于人源化TM I/II B C4/8小鼠的B细胞和巨噬细胞两者的表面上(图7C和图7D),而小鼠MHC I类和II类分子是检测不到的(图7E和图7F)。人源化CD4、CD8α和CD8β在从人源化TM I/II BC4/8小鼠获得的CD3+胸腺细胞的表面上表达,而在对照小鼠的CD3+胸腺细胞中不存在(图7G)。人源化TM I/II B CD4/8表达调控性T细胞(Treg)(图8)、NK细胞(CD335+CD3-)和单核细胞(CD11b+)(数据未示出)。
在图9A-图9D和图10A-图10G中描绘了脾脏中的表达。针对细胞免疫系统组分人源化的小鼠(TM I/II B CD4/8)脾脏包含同等绝对数目的CD3+细胞,以及接近正常比例的B细胞和T细胞(图9A且数据未示出)。将TM I/II B C4/8小鼠脾脏中F4/80细胞的频率和数目与对照小鼠进行比较(图9B且数据未示出)。针对细胞免疫系统组分人源化的小鼠(TM I/IIBCD4/8)在CD3+脾细胞上表达人源化CD4和CD8α(图9C)。人源化TM I/II/B CD4/8小鼠包含记忆效应(CD44+CD62L-)CD4+和CD8+T细胞以及中央记忆(CD44+CD62L+)CD8+T细胞(图9D和图9E)。
如图10A和图10B所描绘,人源化β2M在人源化TM I/II B C4/B小鼠脾脏中的B细胞和巨噬细胞的表面表达,而其表达和小鼠MHC分子的表达在对照小鼠脾脏中的B细胞和巨噬细胞中不存在。类似地,人源化MHC I和II存在于人源化TM I/II B C4/B小鼠脾脏中的B细胞和巨噬细胞两者的表面上(图10C和图10D),而小鼠MHC I类和II类分子是检测不到的(图10E和图10F)。人源化CD4、CD8α和CD8β在从人源化TM I/II BC4/8小鼠获得的CD3+脾细胞的表面上表达,而在对照小鼠的CD3+脾细胞中不存在(图10G)。与对照小鼠相比,TM I/II BC4/8小鼠具有接近正常的脾调控性T细胞表达(图11),并且表达脾NK细胞(CD335+CD3-)和单核细胞(CD11b+)。
实施例6:对T细胞呈递人肽和人肽对T细胞的激活的评估
为了确定包含人源化细胞免疫系统组分的小鼠是否表现出人源化T细胞免疫应答,测试了来自针对细胞免疫系统组分人源化的小鼠(TM I/II BCD4/8)的脾细胞呈递MAGE-A3(一种由人HLA-A2特异性呈递的肽)并对其应答的能力。
合成MAGE-A3,一种由人HLA-A2特异性呈递的肽(Celtek Biosciences),在PBS中稀释,并与完全弗氏佐剂(CFA;Chondrex,Inc.)等体积混合,使得200μl乳液中含有200μg的MAGE-A3。将50μl乳液注射到每只动物的4个点。对于人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β及β2M纯合的小鼠(TM I/II B CD4/8)或表达内源MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β及β2M的对照小鼠,两个点各在后胁和2个点各在每个肩部附近。
获得并解离来自免疫小鼠的脾悬浮液。将红细胞在ACK裂解缓冲液(LifeTechnologies)中裂解,并将脾细胞悬浮在RPMI完全培养基中。在ELISPOT测定中,在不存在或存在10μg/mL或1μg/mL稀释的MAGE-A3肽的情况下,在涂有5μg/mL小鼠IFN-γ捕获抗体(BD Biosciences)的PVDF板(Millipore)的每个孔中对2x105分离的脾细胞进行测试。在与肽一起温育16-20小时后,将板洗涤并与生物素化的检测抗体(BD Biosciences)一起温育,洗涤,用链霉亲和素-HRP(MabTech)处理,洗涤并用TMB底物(MabTech)显影,并通过AIDElispot读数仪进行计数。
虽然每种基因型仅示出了一只小鼠,但是每种基因型的几只小鼠都进行了测试,并且所有样品都三次重复允许,标准偏差用误差线示出。如图12A所示,只有来自于针对人源化MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β及β2M中的每一者均纯合的小鼠(TM I/II BCD4/8)的样品在用HLA-A2特异性肽MAGE-A3处理后通过分泌IFN-γ作出应答,指示来自这些小鼠的T细胞在人源化HLA-A2呈递MAGE-A3之后被激活。
为了测试从TM I/II B C4/8小鼠中分离具有治疗价值的人TCR的可行性,用人肿瘤相关抗原(TAA)免疫小鼠。源自癌症睾丸抗原NY-ESO-1和黑素瘤相关抗原(MAGE)-A3的HLA-A2限制性肽引发可通过来自离体的、经肽脉冲处理的脾细胞的IFN-γ产生检测的稳健抗原特异性应答(图12B-图12C)。分选来自经免疫的TM I/II B C4/8小鼠的单个NY-ESO-1157-165HLA-A2四聚体阳性T细胞,并对其TCRα和β可变区进行测序。将TRA和TRB可变cDNA序列克隆到具有全人TCR恒定结构域的慢病毒载体中,并用于转导基于Jurkat的报告细胞系,该细胞系开发用于测试I类限制性抗原(图12D)。TM I/II B C4/8来源的TCR在Jurkat细胞中有效表达(图12E),并响应于负载NY-ESO-1157-165肽的APC介导稳健激活(图12F)。这种应答是抗原特异性的,因为经过转导的Jurkat细胞对源自人转录组的对照肽没有显示出应答,这些对照肽经鉴定为潜在脱靶抗原(图12G)。
为了测试从TM I/II B C4/8小鼠中分离的TCR是否可以介导功能性抗肿瘤应答,通过Crispr介导敲入内源TRAC基因座,将原代人T细胞工程改造为表达候选TCR,这是一种避开TCR链错配的实验验证的稳健策略(图12H-图12I)。表达NY-ESO-1特异性TCR050的T细胞显示出对A375细胞的剂量依赖性体外杀伤,A375细胞是表达NY-ESO-1的HLA-A2+黑素瘤系,而表达多克隆内源TCR的未转导的T细胞未显示出杀伤(图12J-图12L)。用针对人乳头瘤病毒(HPV)来源的抗原的无关TCR工程改造的细胞对A375显示出一定杀伤活性,指示对A375细胞中的未知抗原有潜在反应性。然而,当将这些工程化细胞施用于带有异种移植的A375肿瘤的免疫缺陷(NSG)小鼠时,只有TCR050延迟肿瘤生长(与对照TCR处理的动物相比第26天p<0.0001;图12M-图12O)。此外,TCR050在处理后超过40天持续抑制肿瘤生长,5只动物中有2只在第60天保持无肿瘤,这表明工程化效应T细胞能够在体内持续存在。作为抗原特异性效应T细胞活性的相关,测量T细胞施用后3天人IFN-γ的血清水平(图12O)。在每只经过处理的小鼠中,只有TCR050 T细胞释放显著的IFN-γ,指示抗原特异性T细胞激活和可能的效应子功能。总之,这些数据证明了TM I/II B C4/8技术产生针对肿瘤特异性抗原的有效治疗性TCR的能力。
实施例6.2:材料和方法
实施例6.2.1:肽免疫和抗原特异性TCR的分离
用源自人肿瘤抗原的HLA-A2限制性肽NY-ESO-157-165(SLLMWITQC;SEQ ID NO:96)和MAGE-A3271-279(FLWGPRALV;SEQ ID NO:97)免疫TM I/II B C4/8小鼠。皮下注射200μl CFA乳化肽(1mg/ml),背部四个部位各注射50ml。在注射后第14天,通过在10μg/ml肽的存在下或在没有肽的情况下培养合并的脾细胞和淋巴结,并通过ELISpot(BD 551881)定量产生IFN-γ的细胞,测试抗原特异性T细胞的存在。
为了分离NY-ESO-1特异性TCR,在免疫后14天分离脾细胞并用流式抗体和pMHC四聚体(MBL)染色。将单个四聚体阳性T细胞分选到孔中,并且分别使用对前导序列具有特异性的5’简并引物混合物和小鼠TRAC或TRBC1/2区域内的3’引物,通过RT-PCR扩增TCRA序列和TCRB序列。将扩增子克隆到框内具有相应α和β恒定序列的表达载体中。
实施例6.2.2:JRT3-T3.5细胞中的TCR激活测定法
在JRT3-T3.5细胞(ATCC TIB-153)中进行TCR激活报告测定,JRT3-T3.5细胞是一种Jurkat亚系,其在随机诱变后选择内源TCR表面表达的丢失(44)。通过慢病毒转导人CD8A、CD8B和CD28构建体以及AP1应答元件(AP1-RE)驱动的荧光素酶报告基因(Qiagen#CLS-011L)建立了用于TCR激活测定的亲本JRT3系。然后通过慢病毒转导引入TCRA序列和TCRB序列,并对表面TCR+CD8+CD28+细胞进行FACS分选。
对于激活测定,用100μM NY-ESO-157-165(SLLMWITQC;SEQ ID NO:96)或对照肽在37℃下对滴定数目的抗原呈递细胞(表达人CD80和CD86的293T细胞)进行脉冲处理2小时,接着添加5e4个TCR转导的或亲本JRT3细胞。共培养4小时后,使用OneGlo试剂(PromegaE6110)和SpectraMax读板仪(Molecular Devices)测量荧光素酶输出。
实施例6.2.3:慢病毒载体和JRT3细胞的转导
慢病毒构建体在pLVX.EF1α.IRES.puro载体(Takara 631988),或具有不同抗生素选择标志物的相关载体中产生。通过使用Lipofectamine LTX试剂(Life Technologies15338100)将pLVX载体构建体连同用于Gag/Pol和VSV-G包膜表达的构建体共同转染到HEK-293T细胞(ATCC CRL-3216)中来产生慢病毒。转染后48小时收获上清液,并使用Lenti-X试剂(Takara631232)浓缩慢病毒。通过向圆底96孔板中200μl总培养基体积的2x 105个细胞中添加20μl浓缩病毒上清液,并在室温下以2500rpm将板旋转90分钟来转导JRT3细胞通过抗生素选择富集经过转导的细胞,然后基于表面标志物表达进行FACS分选。
实施例6.2.4:潜在脱靶肽的预测
潜在脱靶肽定义为对HLA-A2具有预测亲和力并且与同源靶肽具有高度序列同源性的肽。为鉴定NY-ESO-157-165(SLLMWITQC;SEQ ID NO:96)的潜在脱靶,提取UniProtKB数据库中每个标准人蛋白质序列的9聚体并计算与HLA-A2的预测结合亲和力,鉴定338,452个预测亲和力<500nM的肽。对肽进行过滤,以确定在5个或更多个氨基酸位置与靶肽的同源性,以及在必需的正常组织中表达的证据,缩小到26个潜在脱靶肽。选择四种肽(1种肽在6个位置具有序列同源性,并且25种肽中有3种在5个位置具有同源性)来测试对分离的NY-ESO-1特异性TCR的交叉反应性。
实施例6.2.5:TCR敲入人原代T细胞中的TRAC基因座
通过阴性选择(Stem Cell Technologies#17951)从取自健康人供体的白细胞中分离总T细胞。在含有4mM谷氨酰胺、10mg/ml庆大霉素、100U/ml hIL-2(Miltenyi 130-097-748)和10ng/ml hIL-15(Miltenyi 130-095-765)的补充CTS OpTmizer(LifeTechnologies A1048501)培养基中,用CD3/CD28 Dynabeads(Life Technologies 11132d)以1:1的珠粒:细胞比率激活T细胞。
激活后几天,取出珠粒并用由Cas9蛋白(Life Tech A36499)与在其第一外显子中靶向TRAC(GCUGGUACACGGCAGGGUCA;SEQ ID NO:98)和TRBC1/2(UGGGAAGGAGGUGCACAGUG;SEQID NO:99)基因的经修饰的合成向导RNA(sgRNA,IDT)的混合物复合组成的Crispr RNP对细胞进行核转染。对于每次核转染,将5e6个T细胞重新悬浮在含有30μg总Cas9蛋白与各150pmol的sgRNA复合的100ml核转染缓冲液(Lonza VPA-1002)中,并在LonzaNucleofector IIb装置上用预先安装的T-020脉冲程序进行电穿孔。核转染后立即将细胞转移到平衡的培养基中,并用编码同源定向修复(HDR)模板的腺相关病毒(AAV,2e5个病毒基因组/细胞)载体转导,同源定向修复模板促进单链TCRb-F2A-TCRa敲入内源TRAC基因座(图12H)。每2-3天检查一次T细胞的生长和活力,并将细胞在含有新鲜细胞因子的培养基中稀释到0.5-1e6个细胞/ml。用肽MHC四聚体(HLA-A*0201/NY-ESO-1157-165,MBL TB-M011-2)和Vβ特异性抗体通过流式分析评估TCR敲入。
实施例6.2.6:钙黄绿素释放细胞毒性测定法
在补充的T细胞培养基中,用8mM钙黄绿素-AM染料(Life Technologies C1430)在37℃下标记A375(ATCC CRL-1619)靶细胞30分钟,然后在培养基中洗涤两次。每个孔中平板接种1e4个靶细胞,并在一定范围的稀释度内添加T细胞。包括具有标记的靶细胞但没有T细胞的孔,以测量染料的自发释放(SR)。为了测量染料的最大释放(MR),将0.5%Triton-X-100添加到含有标记的靶细胞的孔中。温育2.5小时后,将测定板以1000rpm旋转5分钟,并将100ml上清液转移至黑色透明底96孔板。在SpectraMax读板仪上读取荧光(480em/530ex)。按照((钙黄绿素信号–SR)/(MR-SR))*100计算细胞毒性百分比。
实施例6.2.7:体内肿瘤实验
NSG小鼠(Jackson Laboratory 005557,7至9周龄)在右胁皮下植入5e6个A375肿瘤细胞。在肿瘤植入的同一天,经由尾静脉静脉施用T细胞。使用卡尺每周测量两次肿瘤体积,并通过以下公式计算:体积=(长度×宽度2)/2。通过颌下放血收集血液。按照制造商的方案,使用V-Plex人促炎试剂盒(MesoScale Discovery K15409D)对血清人IFNγ水平进行定量。
实施例7:使用LCMV感染模型评估T细胞功能
为了确定包含人源化细胞免疫系统组分的小鼠是否表现出对感染的正常应答,测试了人源化小鼠清除淋巴细胞性脑膜脊髓炎病毒(LCMV)的能力。LCMV是一种小鼠嗜性病毒,其中感染的命运取决于病毒株。暴露于Armstrong毒株会导致急性感染,其中小鼠可以迅速产生针对病毒的T细胞应答并在约一周内清除感染。另一个方面,克隆13病毒不能被清除,并且T细胞变得“耗竭”(表达与T细胞耗竭相关的标志物,例如PD1、Lag3、Tim3)并建立慢性感染。已经证实,用Armstrong毒株感染CD8消耗的或MHC I类缺陷小鼠导致高病毒滴度的维持(J.Virol.68:8056-63(1994))。因此,由于病毒感染依赖于T细胞活性,所以LCMV是测试T细胞功能的理想模型。
为了确定包含人源化细胞免疫系统组分,例如MHC I、MHC IIα和β、TCRα和β、CD4、CD8α和β及β2M的小鼠,是否表现出正常的T细胞功能,在第0天对照和人源化(TM I/II BC4/8)小鼠用2x105 ffu Armstrong病毒株经腹膜内感染。在第3、6、9和12天,收获器官并测量病毒滴度。如图13A所示,对照小鼠和人源化小鼠都能够清除Armstrong感染。
对照小鼠和人源化小鼠也在第0天用4.5x105 ffu的克隆13病毒静脉感染,并且在第21天收获器官并测量病毒滴度。如图13B所描绘,两个小鼠品系都能够建立慢性LCMV感染。还测量了人源化小鼠表达PD1、Lag3和Tim3(T细胞耗竭的标志物)的能力。在感染后3周从未感染的小鼠和感染的人源化小鼠中采血,并使用流式细胞术用PE-Cy7缀合的抗-PD1抗体(BIOLEGEND)、PerCpCy5.5缀合的Lag3抗体(BIOLEGEND)和PE缀合的Tim3抗体(R&D系统)进行染色。图13C中的数据是对所示受体染色阳性的细胞的定量。在用慢性LCMV克隆13毒株感染3周后,人源化(TM I/II B C4/8)小鼠和对照B6小鼠都表达T细胞耗竭的所有三种标志物。
为了评估针对细胞免疫系统组分人源化的小鼠中的记忆T细胞应答,用2x105 ffu的Armstrong毒株感染5只对照小鼠和4只人源化小鼠,并在第17天用4.5x105 ffu克隆13毒株进行超级感染(人源化小鼠和对照小鼠各2只作为附加对照进行模拟感染)。在初始感染后的第31天,收获器官并分析病毒滴度。如图14中所描绘,已经遭遇急性LCMV感染的5/5对照小鼠和3/4人源化小鼠,随后受到保护免于慢性LCMV感染,证明这些动物中有完好的记忆T细胞应答。
为了分析细胞应答的性质,在第0天用2x105 ffu的Armstrong病毒株感染对照小鼠和人源化小鼠。在第10天(图15A-图15B)或在感染后的指定时间点(图15C-图15D),使用已知会激活人CD8+T细胞的三种HLA-A2限制性肽(GPC10-18、N69-77或Z49-58),参见Botten等人(2007)J.Virol.81:2307-17或gp33(一种在H-2Db背景下被小鼠识别的免疫优势LCMV肽)分析细胞应答的特异性。具体地,从收获的脾脏中分离CD8+T细胞,并用肽进行脉冲处理。通过ELISpot(图15A-图15B)或通过细胞内IFNγ染色(图15C-图15D)来测量产生干扰素-γ(IFNγ)的CD8+细胞。
从对照动物分离的CD8+T细胞受gp33肽特异性激活(图15A),而从人源化动物分离的CD8+T细胞受HLA-A2限制性肽激活(图15B)。用肽刺激时通过它们表达IFNγ的能力来监测的CD8+T细胞激活的时程显示,在对照小鼠和人源化小鼠中,CD8+T细胞在感染后的前两周期间扩增,并且在病毒被清除后检测不到(图15C-图15D)。尽管在对照动物中对gp33肽的应答似乎更强,但应该注意的是gp33是已知的免疫优势LCMV表位,而免疫优势HLA-A2限制性LCMV表位尚未被鉴定。总之,包含人源化或基本上人源化的T细胞免疫系统的动物能够加工LCMV表达的蛋白质,将它们呈递到人源化MHC分子上并经由人源化T细胞受体激活T细胞。
实施例8:包含含有鼠TCRBDJ1和TCRBDJ2非编码序列及人TCRBDJ1和TCRBDJ2编码序列的人源化TCRBDJ1和TCRBDJ2簇的I/II B C4/8小鼠的评估
在这个实施例8和相关附图全篇,TM I/II B C4/8小鼠也可以称为VelociT小鼠。此类TM I/II B C4/8 9(“VelociT”小鼠)在七个染色体基因座处带有九个人化基因,包括在TCRBDJ1和TCRBDJ2簇处的TCRB鼠非编码序列。
实施例8.1:正常适应性免疫细胞发育
为了确保这种广泛的工程改造不会干扰正常的免疫系统发育,我们对原初TM I/II B C4/8小鼠进行全面的免疫表型分析,与具有同等品系背景的野生型(WT)对照进行比较。流式细胞术分析显示,在TM I/II B C4/8小鼠和WT小鼠的脾脏中,总T细胞、CD4+辅助细胞和CD8+细胞毒性T细胞的数目和比例相当(图16A-图16B、图17A)。TM I/II B C4/8小鼠的脾B细胞比例和总数(图16A和图17A)以及血清IgG和IgM(图17B)与WT对照相当,指示正常的B细胞区室。脾T细胞显示出很大程度上正常的表型原初和记忆亚群,但是与WT小鼠相比,在TM I/II B C4/8小鼠中CD62L-hi CD44-lo原初CD4+和CD8+细胞的比例适度降低(图17C)。
TM I/II B C4/8小鼠中的T细胞发育正常,显示出与WT小鼠相似的双阴性(DN)、双阳性(DP)和单阳性(SP)CD4+和CD8+分期胸腺细胞的总数和分布(图16C-图16D)。通过CD44和CD25表达描绘的已建立的DN亚群在TM I/II B C4/8小鼠中以类似于WT的水平存在,进一步指示在TM I/II B C4/8小鼠中正常的T细胞发育,对人源化MHC-I和MHC-II具有完好的阳性和阴性选择。Foxp3+调控性T细胞(Treg)存在于TM I/II B C4/8胸腺和脾脏中,相对于WT小鼠比例适度升高(图18A和图18B)。总的来说,这些结果指示,在原初TM I/II B C4/8小鼠中淋巴细胞区室很大程度上正常,人源化TRA、TRB、CD4和CD8基因正确表达和调控,并且在人MHC的胸腺选择期间,常规和调控性T细胞亚群发育。
实施例8.2:TM I/II B C4/8小鼠中的正常先天性免疫细胞发育
还分析了TM I/II B C4/8小鼠负责先天免疫和抗原呈递的免疫细胞。自然杀伤(NK)细胞和NK T细胞以与WT小鼠相当的数目存在(图19A和图19B)。此外,包括常规DC1和DC2亚群在内的中性粒细胞、单核细胞、巨噬细胞和树突细胞以正常的比例和总数存在于脾脏中(图20A和图20D)。确认专职性APC上MHC I类和II类分子的人源化和正确表达(图20B)。此外,确认分离自肾脏的非造血上皮细胞上人MHC I类的表达,并且在用干扰素-γ处理时显示出预期的上调(IFN-γ图20C)。这些数据指示在TM I/II B C4/8小鼠中骨髓谱系的正常发育及人源化MHC基因座的正确表达和调控。
实施例8.3:TM I/II B C4/8小鼠中的多样化TCR组库
胸腺中T细胞正常发育的证据,以及外周预期表型亚群的存在,指示TM I/II BC4/8小鼠中TCR基因的正确重组和表达。为了对这直接检查,对来自脾原初CD4+T细胞的TCRcDNA文库进行高通量组库测序。TM I/II B C4/8小鼠利用多样化TRBV和TRBJ基因,包括DJC1和DJC2基因簇,除了J2-6外,对这些基因而言小鼠对应物是假基因(图21A-图21B)。TRBV20-1、V28和V5-1是三个最常用的基因,与先前公开的关于人类组库偏好的报告相对应。检测到几个远端TRAV基因,但水平低,这与在人PBMC中的一些研究一致(图21C-图21D)。在TRB转录物的V-D连接处和D-J连接处观察到非模板编码的核苷酸添加,指示具有人区段的小鼠末端脱氧核苷酸基转移酶(TdT)在TM I/II B C4/8小鼠中的正确功能。这些结果表明在TMI/II B C4/8小鼠中存在高度多样化的人源化TCR组库。
实施例8.4:在TM I/II B C4/8小鼠中的抗病毒CD8 T细胞应答
为了检查TM I/II B C4/8小鼠的T细胞应答,用淋巴细胞性脑膜脊髓炎病毒(LCMV)感染模型对它们进行测试。用LCMV的Armstrong毒株(Arm)感染C57BL/6小鼠引起急性感染,引发稳健的CD8+细胞毒性T淋巴细胞(CTL)应答。用LCMV Arm(2x 105FFU,IP)攻击的TM I/II B C4/8小鼠展示出类似于对照C57BL/6小鼠的急性感染的消退,尽管有略微延迟的动力学(感染后[p.i.]第12-19天对比对照中的第8-10天)(图22A)。与LCMV Arm毒株相反,用LCMV克隆13(CL13)毒株(5x 106FFU,IV)感染小鼠建立慢性病毒感染,在感染后数月具有持续的高病毒滴度。TM I/II BC4/8小鼠的CL13感染导致持续感染,在感染后3周具有与对照相似的高病毒滴度(图22B)。WT小鼠中的慢性LCMV感染与效应T细胞功能丧失(耗竭)相关,导致病毒控制不足。慢性感染的TM I/II B C4/8小鼠显示出CD8+T细胞上抑制性细胞表面分子PD-1、LAG-3和Tim-3的类似上调,与持续抗原刺激后的T细胞功能障碍一致(图22C)。总的来说,TM I/II BC4/8小鼠以与WT小鼠相似的方式对急性和慢性LCMV病毒感染作出应答。适应性免疫的重要特性是能够对以前遇到的病原体产生记忆应答,该记忆应答防止再次感染。使急性LCMV感染消退的小鼠对病毒产生记忆性CD8+T细胞应答,该应答可以防止二次攻击。为了测试记忆T细胞应答,用LCMV Arm攻击TM I/II B C4/8小鼠,允许使感染消退,然后用CL13攻击。五只LCMV免疫的TM I/II B C4/8小鼠中有三只小鼠在再次攻击后显示出对慢性感染的完全保护,第四只小鼠显示出部分保护,而没有(0/5)原初TM I/II BC4/8小鼠有免疫力。因此,TM I/II B C4/8小鼠响应于原发性LCMV感染产生T细胞,这些T细胞能够防御二次攻击(图22D)。
TM I/II B C4/8小鼠利用限制在人HLA上的人源化TCR对LCMV攻击作出有效应答。为了检查这些应答是否反映限定的人T细胞对LCMV的应答,研究对已知HLA-A*02:01限制性表位具有特异性的T细胞的存在。在测试的四种HLA-A*02:01限制性LCMV肽中(NP69、GPC10、GPC447、Z49),TM I/II B C4/8小鼠对来自LCMV Z蛋白的Z49作出强烈应答,而对其他肽显示出减弱的应答(图23A-图23B)。这些T细胞应答证明了在TM I/II B C4/8小鼠中人HLA限制性LCMV肽表位的加工和呈递,以及相应的CTL应答。应该注意的是,TM I/II B C4/8CD8+T细胞应答分布在多个表位上,并且不如在C57BL/6小鼠中观察到的对GP33的优势应答那么强。这种应答模式可能在一些TM I/II B C4/8小鼠中有助于急性感染后延迟的清除动力学(图22A)和对继发感染的不完全保护(图22D)。总的来说,急性和慢性LCMV感染数据验证TM I/II B C4/8是研究体内人TCR-HLA驱动的T细胞激活和耗竭的功能平台。
实施例8.5:在TM I/II B C4/8小鼠中对自身免疫建模
在TM I/II B C4/8小鼠中CD4和MHC-II的人源化为研究CD4+T细胞应答、开发CD4+T细胞依赖性疗法以及潜在地改善在小鼠中对人类自身免疫性疾病建模呈现了新型系统。例如,工程改造到TM I/II B C4/8小鼠中的HLA-DR2单体型与人类多发性硬化症(MS)的易感性增加相关,但对特异性T细胞应答的了解仍然有限。为了测试CD4+T细胞应答并确立在TM I/II B C4/8小鼠中对自身免疫性疾病建模的可行性,尝试诱导实验性自身免疫性脑脊髓炎(EAE),这是一种广泛使用的MS模型。
人和小鼠MOG35-55肽仅单个残基不同,并且已经证实小鼠MOG35-55会结合HLA-DR2并在HLA-DR2-人源化小鼠中诱导实验性自身免疫性脑脊髓炎(EAE)。与这些先前的研究一致,用小鼠MOG35-55肽免疫TM I/II BC4/8小鼠诱导了EAE,平均疾病发作在第10天并且出现慢性进行性疾病而没有恢复,但是在大多数情况下,该疾病不是致命的(图24A)。TM I/II B C4/8小鼠中的EAE病程与并行分析的C57BL6/J小鼠非常相似,表明MOG35-55肽类似地由人(HLA-DR2)和小鼠(I-AB)MHC II类分子呈递并且诱导类似的MOG特异性CD4+T细胞应答。因此,当用MOG35-55肽离体进行脉冲处理时,从患有EAE的TM I/II B C4/8和C57BL/6小鼠收获的脾细胞显示出相似数目的产生IFN-g和IL-17A的细胞(图24B-图24C)。在TM I/II B C4/8小鼠中观察到的疾病动力学和表现,以及EAE疾病中保留的Th17组分,指示利用限于人MHC的人TCR忠实地复制了EAE。总的来说,这些数据指示,TM I/II B C4/8小鼠可以对II类限制性抗原产生有效的CD4+T细胞应答,并且可以充当自身免疫性疾病的模型。
实施例8.6:讨论
从小鼠中表达和分离人抗原受体的能力为治疗发现提供了强大的平台。先前描述了小鼠,该小鼠带有人对应物对小鼠Ig可变基因组区域的精确兆碱基置换。这种产生在使小鼠B细胞发育中经历自然调控和选择的人抗体的方法,已经在临床开发中产生了许多单克隆抗体,包括几种批准用于人类的抗体。TM I/II B C4/8小鼠代表发现治疗性人TCR的相似机会。
T细胞抗原识别发生在免疫突触处,其中TCR和专用辅助受体接合APC表面的肽-MHC。为了在小鼠中实现同源人类相互作用的有效再现,人源化所有这些成分,在7个不同的染色体基因座处总计9个蛋白质编码基因。人源化策略置换这些表面分子的胞外结构域,而保留小鼠跨膜结构域和胞内结构域。这种设计意在促进鼠T细胞中与下游信号传导途径的生理相互作用。因此,TM I/II B C4/8小鼠显示出胸腺T细胞发育和外周T细胞群,在总数、造血细胞比例和表型标志物的表达方面与WT小鼠相似。此外,在TM I/II B C4/8小鼠中,B细胞、NK细胞和骨髓谱系是正常的,具有预期的嵌合MHC-I和-II分子表达模式。最后,对原初TM I/II B C4/8小鼠中的TCR组库的高通量测序确认利用V(D)J区段的多样化组库,人源化TCR基因的忠实重组和表达。总的来说,这些结果确认人源化基因座的成功表达和调控,并且指示正常的适应性和先天免疫区室的发育。
TM I/II B C4/8小鼠的功能研究确认有效的CD4和CD8 T细胞应答。在LCMV感染模型中,TM I/II B C4/8小鼠使急性感染消退,并且大多数小鼠受到保护免于LCMV CL13的二次攻击,指示有效的完好T细胞记忆。CL13慢性感染的TM I/II B C4/8小鼠表现出与WT小鼠相当的T细胞耗竭迹象,PD-1、LAG-3和Tim-3上调(图22A-图22D)。有趣的是,TM I/II BC4/8小鼠中的LCMV应答牵涉多个表位,包括对Z49的主要应答,但也包括对多个肽(NP69、GPC10、GPC447;图23A-图23B)的更广泛的应答。在有慢性病毒感染的人中,限制性免疫优势T细胞组库可以掩盖更有效的亚优势T细胞亚群。因此在TM I/II B C4/8小鼠中系统地询问全人TCR组库的能力可以揭示具有期望功能的逃避性亚优势表位,例如靶向突变病毒中的保守区域的表位。
在TM I/II B C4/8小鼠中诱导EAE证明了功能性MHC II类抗原呈递和CD4+T细胞应答。先前的研究报告称,具有内源TCR基因座但表达转基因HLA-DR2且无小鼠MHC II的小鼠响应于小鼠MOG33-55免疫发展出EAE。本文的数据确认致脑炎抗原的HLA-DR2呈递,并进一步显示人TCR可在TM I/II B C4/8小鼠中驱动CD4+显性自身免疫性疾病。对来自EAE小鼠的经过肽脉冲处理的脾细胞的分析检测到显著的IL-17产生,并因此检测到Th17偏移,概括了小鼠EAE和人MS的这一关键病理学特征。数据还指示,TM I/II B C4/8小鼠可用于对人TCR和抗原MHC驱动的自身免疫进行建模。
正常免疫细胞群(多样化T细胞组库)的开发,以及在感染模型和自身免疫模型中的有效CD8+和CD4+T细胞应答,指出了一个强大的新系统来研究T细胞介导的疾病。由于在一个小鼠模型中CD4和CD8区室两者均人源化,TM I/II B C4/8小鼠比先前努力使小鼠中的T细胞免疫人源化具有显著进步。已描述先前产生的转基因小鼠在小鼠TCR-/-MHC-I-/-背景下具有随机整合的人TRA和TRB基因座和转基因HLA-A*0201。当免疫时,这些小鼠产生针对HLA-A2限制性人TAA的全人单克隆TCR。然而,与WT小鼠相比,这些小鼠血液和胸腺中T细胞的比例显著降低,CD8 SP胸腺细胞的缺陷尤其明显。这些小鼠的二次迭代在小鼠MHC-II-/-背景表达人MHC-II HLA-DR4(但保留小鼠MHC I)。在这种情况下,与WT对照相比,小鼠表现出胸腺和外周CD4 T细胞显著减少,而外周DN CD4-CD8-CD3+T细胞比例升高。这些小鼠未带有人源化辅助受体,因此观察到的缺陷可能反映次优的胸腺选择,牵涉人HLA和TCR与小鼠CD4和CD8的相互作用。相比之下,TM I/II B C4/8小鼠带有MHC-I和MHC-II系统两者的人源化,并显示出与WT小鼠相当的生理平衡的胸腺和外周T细胞亚群。尽管没有报告TCR转基因小鼠的更详细的表型分析,但TM I/II B C4/8小鼠在所有检查的免疫亚群中显示出很大程度上正常的比例、细胞数目和表型特征。结合在CD4和CD8驱动的疾病模型中的表现,这指示用于T细胞生物学和疾病研究的有效免疫活性模型。
TM I/II B C4/8小鼠的主要应用将是作为治疗性TCR发现的平台。作为概念验证,TM I/II B C4/8小鼠引发对原型肿瘤相关抗原免疫的稳健的抗原特异性T细胞应答(参见,例如图12B-图12C)。进一步验证通过来自免疫小鼠的pMHC-四聚体反应性T细胞的单细胞分选鉴定的一组克隆的NY-ESO-1特异性TCR的抗原反应性。作为特异性的初步测试,确认NY-ESO-1TCR亚群不会与一组源自人转录组的潜在交叉反应肽交叉反应,预测交叉反应肽会结合HLA-A2并与同源NY-ESO-1157-165肽具有同源性。经过验证的TCR在人细胞中高效靶向至内源TRAC基因座,并在体外介导杀伤HLA-A2*01NY-ESO-1+A375黑素瘤细胞。这些细胞在异种移植物模型中进一步表现出体内肿瘤控制,指示稳健的效应子功能。总的来说,这些实验验证TM I/II B C4/8小鼠用于从头发现具有抗肿瘤活性的有效且特异性的TCR。在这些动物中已经证实了对多种肿瘤和病毒抗原的稳健和多样化的抗原特异性应答,指示TM I/II BC4/8是用于发现TCR的转化平台(数据未示出)。
这里报告的TM I/II B C4/8小鼠是进一步发现的跳跃点,可以扩大T细胞疗法的影响和可用性。例如,TM I/II B C4/8原则上可以用任何一个集合的人HLA分子定制,用于发现抗原和开发同源TCR。已经证明后者在患者中令人畏惧,但将通过TM I/II B C4/8平台得到极大增强,该平台具有可定制的HLA单体型,当发现新抗原时易于用新抗原进行免疫,新抗原包括从基因组测序数据中潜在挖掘的大量新抗原。总之,TM I/II BC4/8小鼠为在多种疾病模型中研究人CD4+和CD8+T细胞介导的免疫提供了有价值的创新平台,并且可用于产生针对病毒和人肿瘤相关抗原的有效治疗性TCR。
实施例8.7:材料和方法
实施例8.7.1:研究设计
设计研究以开发一个综合系统,以在小鼠中利用人TCR和抗原研究T细胞功能和病理学。第二个目标是实现候选治疗性TCR的快速发现,这目前是受限的。因此,将T细胞免疫的关键组分—编码TCR、MHC和辅助受体识别结构域的基因座—用相应的人序列置换,独立验证,然后组合到单个小鼠模型中,该模型复制了驱动人类中T细胞发育和应答的分子相互作用。进行免疫表型分析以确认T细胞和其他免疫区室的存在和功能。进行病毒感染和自身免疫模型的研究以证实利用人TCR和人HLA限制性抗原,CD8-和CD4-驱动的免疫应答在TMI/II B C4/8中是有功能的。最后,用人肿瘤抗原进行免疫并分离抗原特异性TCR,以证明TMI/II BC4/8小鼠是用于治疗发现的工具。
所有研究都重复至少两次,结果相似。所有小鼠研究都设计了足够的样品量,以确保结论具有统计学意义,如通过先前的研究所得知。根据美国国立卫生研究院的实验动物护理和使用指南进行动物研究,并且所有程序均由再生元制药机构动物护理和使用委员会(IACUC)批准。
实施例8.7.2:小鼠中的基因人源化
BAC克隆获自Thermo Fisher Scientific,并如前所述使用技术通过细菌同源重组(BHR)和连接进行修饰。使用如前所述的方法进行ES细胞(F1H4)的靶向。通过胚泡或八细胞桑椹胚注射从经修饰的ES细胞衍生小鼠如先前实施例1-4中所述。
实施例8.7.3:小鼠的免疫表型分析
从解剖的淋巴器官中分离免疫细胞,通过低渗裂解清除红细胞,并过滤。对于流式细胞术分析,将106个细胞悬浮在含有0.25μg Fc阻断(BD 553142)的25μl缓冲液(1X PBS,含2% FBS和0.09%叠氮化钠)中,并在4℃下温育10分钟。然后将稀释于缓冲液中的流式细胞术抗体添加到孔中,最终染色体积为100μl,并在4℃下再温育30分钟。将细胞在FACS缓冲液中洗涤两次,然后再悬浮在200μl固定溶液(1X PBS,含2%多聚甲醛)中20分钟。将细胞沉淀并重新悬浮在FACS缓冲液中,并在48小时内在BD LSRFortessa上进行分析。
实施例8.7.4:TM I/II B C4/8小鼠中T细胞组库的测序和分析
通过阴性选择从脾脏中富集CD4+T细胞,并用CD44微珠(Miltenyi Biotech)进一步富集原初细胞。使用RNeasy Plus试剂盒(Qiagen)分离总RNA。用Superscript II(LifeTechnologies)使用杂交通用5’引物和寡聚(dT)产生cDNA。通过用与小鼠TRAC(5′-TCAAAGTCGGTGAACAGGCAGAG-3′;SEQ ID NO:100)或TRBC1/2(5′-GACCTTGGGTGGAGTCACATTTCTC-3′;SEQ ID NO:101)区域内的反向引物配对的5′衔接子引物扩增,产生TCRA或TCRB文库。用带索引的衔接子引物进一步扩增文库,并在Illumina Miseq上测序(2x300个循环)。
基于质量、长度和与相应恒定区引物的完美匹配,对原始测序读段进行解复用和过滤。使用IgBLAST(NCBI,v2.2.25+)的本地安装合并和分析重叠的成对末端读段,以将重排的TCR链序列与人种系V和J基因数据库进行比对,并描绘生产性和非生产性连接。使用国际免疫遗传学信息系统(IMGT)边界提取CDR3序列。
实施例8.7.5:LCMV研究
使LCMV Armstrong和CL13病毒株在BHK-1细胞上生长,并在Vero细胞上通过标准荧光聚焦测定法(FFA)进行滴定。对于原代感染病毒清除研究,小鼠以LCMV Armstrong(2E5FFU,IP)给药,在指定的时间点处死,并且收获脾脏并冷冻,用于随后使用FFA进行病毒定量。在指定的时间点,通过对来自受感染的小鼠的脾细胞进行IFN-γ细胞内细胞因子染色(ICS)来评估小鼠中的LCMV特异性CD8+T细胞应答。测试的I类LCMV肽是H2Db特异性GP33-41和HLA-A2特异性NP69-77、GPC10-18、GPC447-455和Z49-58。HLA-A2 CMV PP65495-503、H2Kb OVA255-264和H2Db HPV16E749-57的肽用作阴性对照。
当急性感染已经清除时,在17天前感染LCMV Armstrong(2E5 FFU,IP)的小鼠中评估对LCMV的保护性记忆应答。然后,这些LCMV免疫小鼠和原初对照用已知剂量的LCMV毒株CL13感染,以在原初小鼠中建立慢性感染(5E6 FFU,IV)。LCMV CL13感染后十四天,收获脾脏,冷冻,并经由FFA评估病毒。
实施例8.7.6:小鼠实验性自身免疫性脑脊髓炎(EAE)
用Hooke实验室提供(目录编号EK-2110)的以1mg/ml乳化在完全弗氏佐剂(CFA)中的小鼠MOG33-55肽(MEVGWYRSPFSRVVHLYRNGK;SEQ ID NO:102)在TM I/II B C4/8或对照C57BL/6小鼠中诱导EAE。皮下注射总共200μl乳液,背部四个部位(右上、右下、左上、左下)各50μl。在肽注射后2小时和24小时,腹膜内注射100ng悬浮在100μl 1X PBS中的百日咳毒素。在注射肽后监测小鼠28天,并如下分配临床EAE评分:0-无症状;1-尾部无力;2-后腿部分麻痹;3-后腿完全麻痹;4-后腿完全麻痹和前腿部分麻痹;5-濒死。在注射后第28天,通过在10μg/ml MOG33-55或单独的媒介物的存在下培养合并的脾细胞和淋巴结,并根据制造商的方案通过ELISpot定量产生IFN-γ(BD 551881)和IL17A(R&D Systems EL421)的细胞,测试MOG33-55特异性T细胞的存在。
等效方案
本领域技术人员将认识到或能够仅使用常规实验来确定本文描述的本发明的具体实施例的许多等效方案。此类等效方案旨在被以下权利要求所涵盖。
本申请全篇引用的所有非专利文件、专利申请和专利的全部内容通过引用整体并入本文。
序列表
<110> 瑞泽恩制药公司(Regeneron Pharmaceuticals, Inc.)
郭春光
涂纳新
A·J·莫菲
<120> 包含具有改善的TCRB组库多样性的人源化细胞免疫系统组分的基因修饰的小鼠
<130> 009108.948WO1/10948WO01
<150> 63/168,774
<151> 2021-03-31
<160> 107
<170> PatentIn版本3.5
<210> 1
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 1
cagaacgcca ggctgtaac 19
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 2
ggagagcagg gtcagtcaac 20
<210> 3
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 3
caccgccact cacagctcct taca 24
<210> 4
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 4
gtgggcacca tcttcatcat tc 22
<210> 5
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 5
cttcctttcc agggtgtgac tc 22
<210> 6
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 6
aggcctgcga tcaggtggca cct 23
<210> 7
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 7
ggtggagagg ctattcggc 19
<210> 8
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 8
gaacacggcg gcatcag 17
<210> 9
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 9
tgggcacaac agacaatcgg ctg 23
<210> 10
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 10
tttgtaaaca aagtctaccc agagacagat gacagacttc agctccaatg ctgattggtt 60
cctcacttgg gaccaaccct accggtataa cttcgtataa ggtatcctat acgaagttat 120
atgcatggcc tccgcgccgg 140
<210> 11
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 11
cgacctgcag ccggcgcgcc ataacttcgt ataaggtatc ctatacgaag ttatctcgag 60
cacaggcatt tgggtgggca gggatggacg gtgactggga caatcgggat ggaagagcat 120
agaatgggag ttagggaaga 140
<210> 12
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 12
cgaggagccc cggtaca 17
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 13
aagcgcacga actccttgtt 20
<210> 14
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 14
ctctgtcggc tatgtgg 17
<210> 15
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 15
ggactcccag aatctcctga ga 22
<210> 16
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 16
gagtcatgaa ccatcactgt gaaga 25
<210> 17
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 17
tggtgggttg ctggaa 16
<210> 18
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 18
ctgtttcttc cctaactccc attctatgct cttccatccc gaccgcggcc caatctctct 60
ccactacttc ctgcctacat gtatgtaggt 90
<210> 19
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 19
caaggtttcc tcctatgatg cttgtgtgaa actcggggcc ggccagcatt taacagtaca 60
gggatgggag cacagctcac 80
<210> 20
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 20
gaaagcagtc ttcccagcct tcacactcag aggtacaaat ccccattttc atattagcga 60
ttttaattta ttctagcctc 80
<210> 21
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 21
tcttccctaa ctcccattct atgctcttcc atcccgaccg cggcccaatc tctctccact 60
acttcctgcc tacatgtatg 80
<210> 22
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 22
gagttcctcc atcacttcac tgggtagcac agctgtaact gtccagcctg tcctgggctg 60
caggtggtgg gcgttgcggg tggggccggt taaggttcca 100
<210> 23
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 23
tcccacatcc tattttaatt tgctccatgt tctcatctcc atcagcacag ctcgagataa 60
cttcgtataa tgtatgctat acgaagttat atgcatggcc 100
<210> 24
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 24
atacgaagtt atgctagtaa ctataacggt cctaaggtag cgagtggctt acaggtaggt 60
gcgtgaagct tctacaagca cagttgcccc ctgggaagca 100
<210> 25
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 25
tgcggccgat cttagcc 17
<210> 26
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 26
ttgaccgatt ccttgcgg 18
<210> 27
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 27
acgagcgggt tcggcccatt c 21
<210> 28
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 28
ccccacagca cgtttcct 18
<210> 29
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 29
cgtcccattg aagaaatgac act 23
<210> 30
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 30
tggcagccta agagg 15
<210> 31
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 31
ccccacagca cgtttcct 18
<210> 32
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 32
acccgctccg tcccatt 17
<210> 33
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 33
agcctaagag ggagtgtc 18
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 34
agaccctggt gatgctggaa 20
<210> 35
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 35
cgcttgggtg ctccactt 18
<210> 36
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 36
tcgaagtgga gaggttta 18
<210> 37
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 37
tggaatggag tgagcagctt t 21
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 38
gcacggtccc cttcttagtg 20
<210> 39
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 39
tgacttccta aatttctc 18
<210> 40
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 40
ctggcggctt gaagaatttg g 21
<210> 41
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 41
catgatttcc aggttggctt tgtc 24
<210> 42
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 42
cgatttgcca gctttgaggc tcaagg 26
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 43
cctcacttgg gaccaaccct a 21
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 44
ttgtcccagt caccgtccat 20
<210> 45
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 45
tgcatctcga gcacaggcat ttgg 24
<210> 46
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 46
atggagtagt cagaacacac tcttcagaag ggactcctga tttcaaaggg ggtaccgggc 60
cccccctcga ggtcgacata acttcgtata gcatacatta 100
<210> 47
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 47
ggccatgcat ataacttcgt atagcataca ttatacgaag ttataccggt gcgatcgcgc 60
gcttccctct tctaaccact aattcaaaaa ggattgtaag taatgttt 108
<210> 48
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 48
agacagaccc ctaaacacct ccaaattaaa agcggcaaag agataaggtt ggagctccac 60
cgcggtggcg gccgccaccg cggtggagct cgaggtttcc ggtacttaac aacagagcac 120
agatttagtg gtgagggact ctctc 145
<210> 49
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 49
atggagtagt cagaacacac tcttcagaag ggactcctga tttcaaaggg ggtaccgggc 60
cccccctcga ggtcgacata acttcgtata gcatacatta 100
<210> 50
<211> 109
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 50
ggccatgcat ataacttcgt atagcataca ttatacgaag ttataccggt gcgatcgctc 60
aagcatgcaa gggtaacata tgttatgaga ttatattttc tttatctca 109
<210> 51
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 51
atggagtagt cagaacacac tcttcagaag ggactcctga tttcaaaggg gggtaccggg 60
ccccccctcg agaagttcct attccgaagt tcctattctc 100
<210> 52
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 52
gttcctattc cgaagttcct attctctaga aagtatagga acttcctagg gcgatcgctc 60
ctctccaggc tcgaattagt attacagttg aggcacgttg tcctcccg 108
<210> 53
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 53
atggagtagt cagaacacac tcttcagaag ggactcctga tttcaaaggg ggtaccgggc 60
cccccctcga ggtcgacata acttcgtata gcatacatta 100
<210> 54
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 54
ggccatgcat ataacttcgt atagcataca ttatacgaag ttataccggt gcgatcgccg 60
cctccatttc cttcatagga aacatgaagt gaatggggct gtgtgtgt 108
<210> 55
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 55
atggagtagt cagaacacac tcttcagaag ggactcctga tttcaaaggg ggtaccgggc 60
cccccctcga ggtcgacata acttcgtata gcatacatta 100
<210> 56
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 56
ggccatgcat ataacttcgt atagcataca ttatacgaag ttataccggt gcgatcgctg 60
ggagcacgtt ccattattat aacaactttc tgaacacaag agggcagt 108
<210> 57
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 57
atggagtagt cagaacacac tcttcagaag ggactcctga tttcaaaggg ggtaccgggc 60
cccccctcga ggtcgacata acttcgtata gcatacatta 100
<210> 58
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 58
ggccatgcat ataacttcgt atagcataca ttatacgaag ttataccggt gcgatcgctt 60
taaggtgagg aggcaggcaa taccccctct ccaccgcatt ctcaatcc 108
<210> 59
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 59
gggggggtgg ggtggaggag gagggtacag catctcctct ccttcctctc tggtaccgaa 60
gttcctattc cgaagttcct attctctaga aagtatagga 100
<210> 60
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 60
gaagttccta ttctctagaa agtataggaa cttcctaggg tttcaccggt gcgatcgcgt 60
gaatatacta aaaaccactt aattatatat ttgaaagggt ggatgtta 108
<210> 61
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 61
ctctctccta cccagctcct ctcacacgag cctgaaggcc ctgccaaggt ggcgcgcctt 60
tcaaattgtt gttgagttca aagtgggcaa cagaaaaggg ggtgtgag 108
<210> 62
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 62
aataaatagt aaatttctgt agaatcataa tgaggtctag acccccgggc tcgataacta 60
taacggtcct aaggtagcga aatggcgcgt aatcaagccc agctcttcat gctgcatttt 120
tatcttcttt 130
<210> 63
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 63
ttgactcggg ggtgcctggg tttgactgca atgatcagtt gctgggaagg accggtataa 60
cttcgtataa tgtatgctat acgaagttat atgcatggcc 100
<210> 64
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 64
ccggcgcgcc ataacttcgt ataatgtatg ctatacgaag ttatgtcgac ataaggtaag 60
acagagtcgt cccttcccat ctggaaccct ctacctttct 100
<210> 65
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 65
gttgatgaat cataaaagaa gagatattca agaaaaggat ggccacactg cggccgcaga 60
ggtattcaag gaaaatgcag actcttcacg taagagggat gaggggc 107
<210> 66
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 66
tccccggagt cggagggtgg accggagctg gaggagctgc cgcggtggcg gccgatgcca 60
tttcattacc tctttctccg cacccgacat agataaagct 100
<210> 67
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 67
gggggggtgg ggtggaggag gagggtacag catctcctct ccttcctctc tggtaccgaa 60
gttcctattc cgaagttcct attctctaga aagtatagga 100
<210> 68
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 68
gaagttccta ttctctagaa agtataggaa cttcctaggg tttcaccggt gcgatcgcga 60
agcaattaac tgcccctggt ccagttgcct cctctgataa tgcattgt 108
<210> 69
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 69
gggggggtgg ggtggaggag gagggtacag catctcctct ccttcctctc tggtaccgaa 60
gttcctattc cgaagttcct attctctaga aagtatagga 100
<210> 70
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 70
gaagttccta ttctctagaa agtataggaa cttcctaggg tttcaccggt gcgatcgcgt 60
tatctagtag acttaattaa ggatcgatcc ggcgcgccaa tagtcatg 108
<210> 71
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 71
gttttccaga cttcaacttg actatcagcc agaaattcag tggcaaaccc ccacccagtc 60
cctaagtgaa ggcccctggg gagtatggtt agggctcagg 100
<210> 72
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 72
cacccaccaa agaaagtgcc caggagaagg gcaaggagag agcagagcat agttcaagat 60
ggtctttgtc taggcttgtc tactctgcac ttgtacttcc 100
<210> 73
<211> 202
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 73
aggggaaacc cgcaaaggat gggacatagg gagacagctg ttaacatctg aaacatgacc 60
ttcttttctg tgcagcacaa ctcctagctg tcactcaagg gaagaaagtg gtgctgggca 120
aaaaagggga tacagtggaa ctgacctgta cagcttccca gaagaagagc atacaattcc 180
actggaaaaa ctccaaccag at 202
<210> 74
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 74
ctggtcacct ggatgaagtg agggagggcc ctctgggttt ggggctggtt ttgaactgag 60
acatccatga gccagcctgg ggctggcttc actgaagatc atctatgtcg ggtgcggaga 120
aagaggtaat gaaatggcac atgctatgta caaactctat tgctgagcag cacccagtcc 180
tgagctggct ctgaattgag ggtgaaattc acacattctc ccccaacatc tataatctgg 240
<210> 75
<211> 151
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 75
tatggagtga aagcctttgg tgtctgagat ctggtcttag ttaaactctg ggatcggcgc 60
gccgaattcc tgcagcccgg gctcgagata acttcgtata atgtatgcta tacgaagtta 120
tatgcatccg ggtaggggag gcgcttttcc c 151
<210> 76
<211> 151
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 76
agtattgttt tgccaagttc taattccatc agacctcgac ctgcagccct agataacttc 60
gtataatgta tgctatacga agttatccta ggccagaggg cttgggttga cagaaactca 120
gtggcattct tatccagagt ttctctacac c 151
<210> 77
<211> 18263
<212> DNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (2957)..(2957)
<223> n = A、T、C或G
<220>
<221> misc_feature
<222> (3193)..(3193)
<223> n = A、T、C或G
<400> 77
aagaaagtgg tgctgggcaa aaaaggggat acagtggaac tgacctgtac agcttcccag 60
aagaagagca tacaattcca ctggaaaaac tccaaccaga taaagattct gggaaatcag 120
ggctccttct taactaaagg tagggttgcc tggctcccca tccagggagg aaaacacact 180
atggagtgaa agcctttggt gtctgagatc tggtcttagt taaactctgg gatcggcgcg 240
ccgaattcct gcagcccggg ctcgagataa cttcgtataa tgtatgctat acgaagttat 300
atgcatccgg gtaggggagg cgcttttccc aaggcagtct ggagcatgcg ctttagcagc 360
cccgctgggc acttggcgct acacaagtgg cctctggcct cgcacacatt ccacatccac 420
cggtaggcgc caaccggctc cgttctttgg tggccccttc gcgccacctt ctactcctcc 480
cctagtcagg aagttccccc ccgccccgca gctcgcgtcg tgcaggacgt gacaaatgga 540
agtagcacgt ctcactagtc tcgtgcagat ggacagcacc gctgagcaat ggaagcgggt 600
aggcctttgg ggcagcggcc aatagcagct ttgctccttc gctttctggg ctcagaggct 660
gggaaggggt gggtccgggg gcgggctcag gggcgggctc aggggcgggg cgggcgcccg 720
aaggtcctcc ggaggcccgg cattctgcac gcttcaaaag cgcacgtctg ccgcgctgtt 780
ctcctcttcc tcatctccgg gcctttcgac ctgcagccaa ttgttgacaa ttaatcatcg 840
gcatagtata tcggcatagt ataatacgac aaggtgagga actaaaccat gggatcggcc 900
attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag gctattcggc 960
tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg 1020
caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag 1080
gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc agctgtgctc 1140
gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc ggggcaggat 1200
ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga tgcaatgcgg 1260
cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa acatcgcatc 1320
gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct ggacgaagag 1380
catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat gcccgacggc 1440
gatgatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt ggaaaatggc 1500
cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata 1560
gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga ccgcttcctc 1620
gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg ccttcttgac 1680
gagttcttct gaggggatcc gctgtaagtc tgcagaaatt gatgatctat taaacaataa 1740
agatgtccac taaaatggaa gtttttcctg tcatactttg ttaagaaggg tgagaacaga 1800
gtacctacat tttgaatgga aggattggag ctacgggggt gggggtgggg tgggattaga 1860
taaatgcctg ctctttactg aaggctcttt actattgctt tatgataatg tttcatagtt 1920
ggatatcata atttaaacaa gcaaaaccaa attaagggcc agctcattcc tcccactcat 1980
gatctataga tctatagatc tctcgtggga tcattgtttt tctcttgatt cccactttgt 2040
ggttctaagt actgtggttt ccaaatgtgt cagtttcata gcctgaagaa cgagatcagc 2100
agcctctgtt ccacatacac ttcattctca gtattgtttt gccaagttct aattccatca 2160
gacctcgacc tgcagcccta gataacttcg tataatgtat gctatacgaa gttatcctag 2220
gccagagggc ttgggttgac agaaactcag tggcattctt atccagagtt tctctacacc 2280
aactgctggt ggcccaggga aaggtggtat gtgaatttca atattttaat atttaatatt 2340
catgaactta ttttagtgag ttttagaaca atcactatca cttaaaaccc gtgatttctt 2400
gagtattgtt gctacagacc tatgtagata atactttgca cagtgactca tatgtataat 2460
cctagcactg tgggaggctg aggccggagg attgcttgag tccaggagtt caagaccagc 2520
ctgaacaaca tagtgagact ctgtctctat gaaaaaaaat atatatatat tttttttgga 2580
gacaaggtct agttctatca cccaggctcc agtgcagtgg tgtgatctcg gctcactgca 2640
atctccacct cccaggctca agtcatcatc ccacctcagc ctcccaagta gctgggacta 2700
caggcatgca ccaccatgcc aggctaattt ttgtattttt tatagagaca gggtttcacc 2760
atgttggcca ggctggtctc gaactcatga gctcaagtga tccactcacc ttggcctctc 2820
agagtgctgg aattacaggt gtgtgtcact atgcctagcc aaaaaaaatt tttttaatta 2880
aaaaaaaaaa ggccggctgt agtggctcac acctgtaatc cagaactttg ggagtttgag 2940
gtgggcagat caccggnggt caggagttca agaccagtct ggccaacatg gtgaaacccg 3000
gtctctacta aaaatacaaa aattagccag gtgtgggggt gcagtcctgt acttccagct 3060
actcaggagg ctgaggcagg agactcgctt gaacctggga ggcaaaggct gcagtgagct 3120
gagattgcac cactgcactc cagcctgggt gacagagcaa gacttcatct caaaaaaaaa 3180
aaaaaagctg canatttatt attattatta ttagtttatt tatttatttt tttgagacag 3240
agtctcgttc tgtcgcccag gctggagtgc ggtggcgtga tcttggctca ttgcaacctc 3300
cacctcccgg gttcaagtga ttctcctgcc tcagcctccc gagtagctgg gactacaggc 3360
gtatgccacc atgcctggct aattttttgt acttttagta gagacagagt ttcacggtgt 3420
tagccaggct ggtcttgatc tcctgacctc gtgatttacc ctccttggcc tcccaaagtg 3480
ctgggattac aggcgtgagt cactgtgccc ggcccagaat catttttttc tacttttttt 3540
tttttgaggc aaactctcga tctgttgccc aggctggagt gcagtgggca tgatcttggc 3600
tcactgcaag ctctgcctcc caggttcaag caattctcct gcctcagcct cctgagtagc 3660
tgggactaca ggcgtgtgcc accatgcccg gctaatttgc gtatttttag tagagaccgg 3720
ttttcatcat attggccagg ctggtcttga actcctgacc tcaagtgatt ctcccacctt 3780
agcctcccaa agtgctggga ttacaggcat gagctactgc acttggcctt ttctcctggt 3840
tttaaaacta ttatatgctc attacaaaat atttggtcaa tgaagaaaag aatatggaag 3900
aaaatcaaat gcatgcatac ttctatcact cagagatatc ctctgctaac attttgattg 3960
attttcttcc aatctttttt tttttttttc tttttgagac agggtctcac tctgctgccc 4020
aggctggagt acagtggcat gaccacaaca catcacagcc tcaagtgatc ttcccacttc 4080
agccttccca gtagctggga ctacaggtgc acgccaccat gttcacctaa ttttttactt 4140
tttgtagaga tgagacttca ccatgttgct caggctggtc ttgaattcct aggctcaagt 4200
gatcttcccg ctttggcctc ccaaagtgct gggattatag gtatgagcca ctgcatgtgg 4260
cctattttct tccactgttg ttcggcgtgg agaatattat atacataatt acgtaaatga 4320
tatcatactg tatatacctt ttttcctact ccttccttaa gttatatcat aatgagacta 4380
ccaattatta gacttttttt cttttttttg agacggagtc tcggtctgtc acctaggctg 4440
gagtgcaatg gcgcgatctc agctcgctgc aacctctgcc tcccaggttc aagcaattct 4500
gcctcagcct cccgagtagc tgggactaca gacacgtgcc accatgccca gctaactttt 4560
ttattttttt attagagaca gggttccacc atgctagcag gatggtctca atctctcgac 4620
ttcgtgatca gcccggcttg gcctcccaaa gtgctgggag tacaggtgtg agccaccgca 4680
ctcggcctag actaactatt taaagtaatc tggcaatgtt taacgaatac aaaactctaa 4740
aacccttgga cctaataata gctattttgg aaagtctact tgacagaaat aaaattgtga 4800
atattctttt ttgttgtttt tttgagacag agtctcattt ggacgcctag gctggagtgc 4860
agtggcatga tctcggctaa ctgcaacctc cacctcctgg gttcaagtga ttctcctgcc 4920
tcagcctcct gagcagctgg gattacaggt gtgcaccacc atgtctggct aatttttgca 4980
tttttagtag atggggtttc accatgttga ccagggtggt ctggaacttc taccctcaag 5040
tgatctaccc accttggcct cccaaagtgc tgggattaca ggtgtgagcc accacgcctg 5100
accagtgaac acttaataat atctatggaa aggtgttatt ataagaattg cttgtggggc 5160
cgggcgtggt ggctcacgcc tgtaatccca gcactttggg aggctgtggc aggcggatca 5220
cgaggtcagg agatcaagat catcctggct aacacggtga aaccccgtct ctactaaaaa 5280
taccaaaaaa ttagccaggc gtggtggcgg gcacttgtaa tcccagctat ccaggaggct 5340
gaggcaggag aattgcgtga acccaggagg cggaggtcgc agtgagctga gaccgtgcca 5400
ttgcactcca gcctgagtga cagagtgaga ctccatcaca aaaaataaat aaataaataa 5460
ataaaatata aataagtaaa taaaggtcag gagtggtggc tcacgcctgt aatcccagca 5520
ctttgggagg ccgaggtgga cagatcatga ggtcatgaga tcaagaccat cctggctaac 5580
acagtgaaac cctgcctcta ctaaaaatac aaaaagtcat ccaggtgtgg tggcacacac 5640
ctatagtccc agctacttgg gaggctgagg caggagaatc acttgaaccc aggaggcaga 5700
ggttgcagtg agctgagatc gcgccactac actccagcct aggcgacaga gcaagactct 5760
gtctcaaaat aaataaataa ataaataaat aaataaataa ataaataaaa taaaaagcac 5820
acacacacac acacacacac acacacaatg caaaagaccc accctactac aactaacatt 5880
atatttaatg gtgaaaaact gaattctttc tccctaagtg caggaataag acaaagatgt 5940
ctgctcttac tactcttatt caacataata ctgcaatccc ttgccagtgc aataaggcaa 6000
gaaaaatgaa ataaaaggaa aactgatcag aaagaaagaa ataaaactgt tcctatttgt 6060
ggatgacatg attacataga aaatctcaaa gaatctgtaa gaaacttctt agaattaata 6120
aatgaattca tcaaggttgc agaatataag ataaacataa aaaatctatt gtatttctat 6180
atattagcaa ggaacatgtg tacacagaaa ttaaaactac aataccattt ataattgctc 6240
aaaaaggcca ggcatggtgg ctcacacctg taattcctgc actttgggag gccaaggtgg 6300
gaagattgct taagcccagg agttcaagac cagcccgggc aacatagtga gaccttgtct 6360
ctacaaaaag taaaaaatta gctgagcatg gccgggtgca gtggctcact cctgtaaccc 6420
caacactttg ggaggctgag gcgggcggat catgaggtca ggagatcgag accatcctgg 6480
ctaacacggt gaaaccctgt ctctactaaa aacacaaaaa attagctgga tgtggtggca 6540
ggcgcctgta gacccagcta ctcgggaagc tgaggcagga gaatggcgtg aacctgggag 6600
gcggagcttg cagtgagctg agattgtgcc actgcactcc agcctgggtg acacagtgag 6660
actacgtctc aaaaaaaaaa aaaaaaaaat tagctgagca ttatggtgta tgcctgtagt 6720
cccagctact ggggaggctg aggtgggagg attgcttgag ccctaggagg gcaaggctgc 6780
agtgagccat gatcacacca ctgctttcca gcctcggtag gagagcaaga ccctatctca 6840
aaaaaaaaaa aaaaaaaaaa agaaaagaaa agaaaagaaa agaaaaagaa agagagaaag 6900
aaatacttag gtgtaaatct aaaaaacatg cgtagggcca ggtgcagtgg ctcatgcctg 6960
taatcccagc actttgggaa gttgaggctg gcggatcact tgaagtcggg agtttgagac 7020
cagcctggcc aacatggtga aaccccgtct ctactaaaaa tgcaaaaatt aggcaggtgt 7080
tgtggcgcat gcctgatccc agctactttg gaggctgagg caggagaatt gcttcaaccc 7140
gggaggcaga ggttgcagtg agccaagact gttccactgc actccagcct gggcaacaga 7200
gtaagagtct gtctcccgaa aaaaaaaaaa agaaaaaaga aagcattgaa ttgtatgcta 7260
aaaactacac gatgctgatt aaagaagtca aagaagatct aaatatatgg agagacatgc 7320
tgtactcatg gattgatgga ttggaagact caacataaga cagatatcaa ttttccccaa 7380
attaatatac aagtttaatc caattcctat aaaaatacca gcaagatttt ttgtagatat 7440
aaacaagttg gccaggtgta gtggcttaca cctgtaatcc tagcactttg ggaggctgag 7500
gtgggaagat cgcttgagcc caggtgttca cgactgcagt gagctatgat tgtgtcactg 7560
cattccagct ggcactccag cctaagtgac aaagggagac cctgtctcaa aaacaaaaac 7620
aaaaccaaaa taattttgct ctgcaaaatc cctattaaga agaagaaaag aggctgggca 7680
cagtggctca ccgctgtaat cccagcacgt tgggaggctg aggcaggctg atcacttcag 7740
cccagaagtt tgagatcagc ctgggcaaca tgaggaaacc ccgtctctac caaaaaaaaa 7800
aaaaggtaca tacacacaca cacacacaca cacacacata cacaagtata tacacatata 7860
tatacacata caggtgaata gatgtatata catctattta ttgtgaatat acatctatac 7920
acacacgtgt gtgtacacat atatttaaaa tttattttta tttatttatt tatttttgag 7980
acagagtctt gctctgtcac ccaggctggg tgcacctgta ttcccaacga cacaggaggc 8040
tgaggtggga gaatcactga gccagggagg cagaggttgc agtgagccaa gatgttgcct 8100
ggttgcctgg gcaacagagc gagaccctat atcaaaaaag aagaataata agaaaagaca 8160
gtttacagaa tataagaaaa tatattcaca atccacatac ttagcaaagg actggtatct 8220
agaatatgat aaacaactct caaaactcaa aaccaaaaaa atgaacaatt caattagaaa 8280
acaggccgaa aaggacatac agttggcaaa taagcacatg aaaagttgtt caacatcatt 8340
aatcattagg gatatgtaca ttaaaaccac aataggctat cactaaacct atcagaatgg 8400
ctaaatacaa aattggaaca ccaccaaatg ctgatgagga tgtggagaaa ctgggtcatt 8460
cttccaatat tggtgggagg ctaaaatggc aaagccactc tggaaaacag tttgatagtt 8520
tcttataaaa caaaacatgc ggccgggcgc ggtagctcac gcctgtaatc ccagcacttt 8580
gggaggccga ggcgggtgga tcacgaggtc aggagatcga gaccatcctg gctaacacgg 8640
tgaaaccctg tctctactaa aaatacaaaa aattagccgg gcgtggtggc gggcgcctgt 8700
agtcccagct actcgggagg ctgaggcagg agaatggtgt gaacccggga ggcggagctt 8760
gcagtgagcc gagatcgcgc cattgcactc caacctggga gacggaggga gactccgtct 8820
caaaaaaaca aaaacaaaca aacaaaaaac atgcaacaat ccagcaatat tgcaccccta 8880
ggcatttatc ctagagcaat gaagacttat gcccacacaa aaagctgcac acaaatgttc 8940
atagcagctt tattcatggt agccaacaat tagaaacaat ctagatgtcc ttcaactggt 9000
gaatgattac atccatacca cgaaatactt ttcagcaata aaaaggatga atcatagtac 9060
acaccacaac ctggatgaat ctccagggaa ttatgctgag tgaaaaaaag ccaatctcaa 9120
aaggtaatat actgtattaa tccatttata taacattctt aaaataacta attatagaaa 9180
tggagaacag atgagtgatt gccaggggtt aaggggctca gggatgggga ggggaagggg 9240
tatggctaca aaaagcaaca accttatggc gccggaaatg ttctgtattc tgattgtgtc 9300
aatgtgagca tactggttga gatatagtgc tacagttttg caagttatta ccatcagagt 9360
aaactggata gagggcacat aggatttctc tgtattactt cttacaactg caagtgaatc 9420
tacaattatc tcaaaataat aagtttagtt taatgctagg cgtggtggct cacatctgta 9480
atctcagctc tttgggaggc tgagacgggt ggatggcttg agtccaggag ttcgagacca 9540
gcctggccaa catggcaaaa ccggtctcta ctaaaaatac aaaaattagc tgggcgtggt 9600
ggcaagtgcc tgtagtccca gctactcggg aggctgaggc aggagaattg cttgaacccg 9660
ggaggtggag gttgcagtga gccgagatca cgccactaca ctgtagcttg ggcgacagag 9720
tgaggctctt tctcaaaaaa aaaaaaaaaa aaaaaaaagc aggcaggcag ggccaggaaa 9780
gcgtataatt tttgtagttc aaatgactaa cctaaaaagt gaagattggc caggcgcagt 9840
ggctcacgcc tgtaatccca gcactttggg aggccaaggc gggtggatca cgaggtcagg 9900
agattgagcc actctggcta acacagtgaa accccgtctc tactaaaata caaaaaatta 9960
gctgggcgtg gtggcacccg cctgtagttg cagctacttg ggaggctgag gcaggagaat 10020
cacttgaacc caggaggcga agttgcagcg agccgagatc acactactgc actccagcct 10080
gggtgacaaa gtgagattct gtctcaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagtg 10140
aagtttacct ttttttttaa atttttcttc ttttccttcc ctactttgtg agataatttt 10200
cttcttttta aaaagccaag agcttacttc tgtaagtaaa gattatctta agacaactta 10260
gaaatgtata ttattagtat tttctatttc attgtaagtt atttgtaaat attggttttg 10320
gtgctaacct agaattccat caaattaatt gtcccctaat atatggccat tatcattttg 10380
tctaacattg tatcctatta acaatgctgt aagtattatt tttgtagcta aattatggtt 10440
tgcattttaa aattattgtt ttaaggataa agttccagaa atgaaattaa ggatatgaac 10500
tttttgagca catcttgtca gcactgagta gtattattta aaacttttgg ggggggcaat 10560
tttataattg aaaaatatat cattgtttta atttgcattt ctttcactgc ctatgagatt 10620
aaaacaatgc actactttcc aaaaattctt aagtcttttg tgttgatgct tttgttctgt 10680
ttctatggat ctcatcttcc ttcagaacag ctccccttcc caacttcctg atttctaaca 10740
ataacagtat caccctcctt gttctcccaa tttctgaaac acagagtcat gtttttttct 10800
ctgcttcaat ccctggtttc ctatcgtcat caattatgac ctttccttgc tttgaaagtg 10860
ttttgggccg ggcatgatgt ctgccaccta ttgtaatcct agcactttgg gaggctgagg 10920
cggctggatg acttgacctg aggatttcga gaccagcctg ggcaacaggg cgaaacctcg 10980
tctctacaaa aaatacaaaa gttagtcggg agtggtggca catgcttgta gtcccagtta 11040
cttggggggc tgaggtggca ggatctcttg agcccacgag gtagatgttg cagtgagccg 11100
tgattgcgcc actgcacccc agcctaggtg acagagtgag accctgtctc aaaaaaaaaa 11160
aaatgttcta gtttcttcct cttctttgtt cccatgggaa tgccaccatc accagccaag 11220
gctcacatac ctcccacctg gattacagtg agcttccagg taatttggtc tgctactagt 11280
ctcgcctact tggatttccc ttccccctgc tgcagcattg ccttccaaag ccatgctttg 11340
cacatgccac atcctagccc attagactaa gcctagaagc ctctgcagga cgttcaccct 11400
ctcagcgcca ctgctcagtt tcccagtgga aacctctgca cccaggaggt ttccccacag 11460
cttgcctgtg ctgcctctct ggagcttttc tcccttcctg taatgtcctt gctgctcccc 11520
gtctctagtc cattgcctat acctcttttt tttttttttt ttgagatgga gtctctctct 11580
ctcatccagg ctggagtgca gtggcgcgat ctcggctcac tgcaaccttt gtctcctggg 11640
ttcaagggat tctcctgcct cagcctcccg agtaactggg attacaggcg tgcaccacca 11700
ttcctggcta atttttgtat ttttagtaaa gactgggttt caccatgttg gccaggctgg 11760
tcttgaactc ctgccctcag gtgatccacc tgcctcggcc tcccagagtg ctgggattac 11820
aggcgtgagc caccgcacct gccacaggcc catacctctt ttaagtcttc attcaatacc 11880
agttgtccca tgaatttgtc ccagactcac tcatatgctt agacctttca tattatcttg 11940
ccatagcttt ttcaaagtat gggacagcat ggacaagcag gccatggttt tcttttgaag 12000
agaagcaagg aggcagagtt attttaggag gagggttata catttcattt tgaaccaatt 12060
gcgtttgggg tgatggcagg atattaacat aaacttattt cttggaccat tggaaatgtg 12120
tgcctagaac tgaggagaga ggtcagggct ggcagtaaca acttggccac aatctgcaga 12180
gctgactggg gatgaggtgg aatttagaat gtctgtagaa acggggaaga gaaccaaaga 12240
cagagtctgg gacaacacct aaatgtagat gtcagagcaa gagttcaaga cgaagaaaaa 12300
cgaatcatac ttagaaatgg aggggaggaa caaaagaggc ggagcaaagt ggggcagaac 12360
cagagtaggc cacgctttta agaagtttgg taaaggaact gtgaaaggaa tgtagttgaa 12420
tttcagggta agctggggaa ttaaagcagt gtgtagatcc agggcaaaca gcaagtaggg 12480
caggaaccac tgaaggaaca aataaagggg gaggttgggt ccaggttgtc ttgagtaggg 12540
aagttttttt aaaaagtgtg aaactgaagg tgtggggtgg attgggtgcc tgccgtgctc 12600
tgaggaagct tggggcaact gtgtgctgag gctgtgaggt tgtctggaag gggctcctgg 12660
acagtaagag ctgagcagtg gggaagagga ctgtgtggtc tggaagagga gagaaaggag 12720
agtgagtgac tgaactggta tccaggctcc cacaccaagg cagaaagagg gagaggacct 12780
gggcatctca gggaggcaga ggcagtacca agcagggtga gaggctttag tcttagccac 12840
ctttgcccca ttcctccaaa tatacattct aagtaaaaac aaaacaaaac agaactgttt 12900
gctatgtaaa tttagcttct aaagccctgt tctacagaga ttttggagct tccactgcac 12960
ccagaaaatg cacagctaaa gagaaaactt cccttggtga tggttattag attttacaag 13020
aagaggccaa aggagacaca tacttatgcc agaagaactt tccagagata gcattgcata 13080
gcgaaatagc ctgaattatt tttatttttt aaaacatttt ttcttttctt ttttcttttc 13140
tttttctttt tttttttttt tttttgagac agagtctcac tctgtcaccc aggctggagt 13200
gcagtggcgt gatcttggct cactgcaatc tccacctccc gggttcaagc cattctcctc 13260
cctcagcctc ccaagtagct gggattacag gcatgcgtca ctatgctctg gctaattttt 13320
tttttctttt tttttttggt atttttagta gagatggggt ttcaccatgt tggccaggct 13380
ggtcttgaac tcctgacctc aagtgatcca ccgccttggc ctcccaaagt gctgggattt 13440
caggcgtgag ccaccgcacc cggccaaaaa tttcttttct ttaagatgag gcctcactct 13500
gttgcccagg ctggagtgca gtgttacaat catagctcac tgtaactttg aactcctggg 13560
ctcaagtgat cctcctgctt cagcctctca agtagctggg attacaggca tgtgccacca 13620
cacccagcta atttttttta aaataatttt ttttagagac gagggtctcg attggctgcc 13680
taggttggtc ccagactcct gacgggctgc attttaatcc tagctccacc acttacggga 13740
gtcaaaattc aaaagataga aaagggcata taggctgggt gcagtggctc acacctgcaa 13800
tcccagcaat ttgggaggct gaggtgggcg ggttgcttga ggtcaggagt tcgagatcag 13860
cctgggcaac atggcaaaac ttgtatctac taaaaataca aaaattagcc agatgtggtg 13920
gtgtacacct gtaatcccag ctactccgaa ggctgaggca agagaatccc ttgaactcag 13980
gaggcagagg ttacaatgag cagagatcga acactcgact ccataaaaac aaacaaacaa 14040
aaaaagaaag caggctgggt gtggtggctc acgcctgtaa ccccagcact tcgggaggcc 14100
aaggcgagcg gatcacctga ggttgggcat tcgagaccag cctgaccaac aaggagaaac 14160
cctgtctcta ctgaaaatac aaaattagcc gggcttggtt gcgcatgcct gtaatctcag 14220
ctactcggga ggcagaggca agataattgc ttgaacccgg gaggcggagg ttgcggtgag 14280
ccaagatcat gccattgcac tccaacctgg gcaacaatag cgaaactcca tctcaaaaaa 14340
aaaaaagcaa agggcatata gtgaaaagct ttcttcctac acatgagtat tcacttcctc 14400
ttcctagagg caaccaaggt tatttttgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 14460
tgttttggga cagtctcact ctctcaccaa ggctggaatg cagtggtgcg atctcactgc 14520
aaactctgcc tcccagtctc aagcgatctt gtgcctcagc ctcccagttt ttttttcttt 14580
taaatggggt ctcattctgt cgcccagggt ggagtgcagt ggcatgatca tagctcactg 14640
cagcctcgac ctcctgggtc aggttatcct cccacctcag cctccggcat agctggggct 14700
actggcatgc accaccacac tcagttaatt ttttttcttt tttgagacag agtctcactc 14760
tgtcacctag actggagtgc agtggtgcca tctcatttgt ttcactgcaa cctttgactt 14820
ctgggctcaa gtgattctcc cacctcagcc tcccaaggcg gctaattaaa aaaaattttt 14880
tttttttttt ttttagagat ggggtttcgc catgttgccc aggctgatct cgaactcctg 14940
ggcacaaaca atctttccac ctcgatcttt caaagagctg ggatgagaga tttccaccat 15000
gcctggcctc attttctttt ttaatttttt tttagacatt atagctcttt ttaatggcct 15060
cattttctta tgtttaattc gagaattatt cttttcatat acaaagaata tattttctcc 15120
acctttaaaa acaaatagta gactgtttaa catctcgctt tattcagtta gtgatgtttc 15180
ttagatacgg gtccaaatta gtacacaaag cacttcctca ttcctctctt acggctgcat 15240
agcagtccac tgaatgggtg agctatgatc tatttaacct attctttatt gatggacatt 15300
tggttttgta tatacatttg taattctgta tagattacaa atcaccatcc aaagaaattg 15360
tactggttta ttctcctaca atgtgtgaga gttgggtaat tacttaatct caatatgtga 15420
gagtttaggc agttacctaa tctctctgag tctcagtttc tctatctgca aaataaacaa 15480
aacagtgttg acagtatcta tttctcggaa ttattgtgga gattactgag atgatgcctg 15540
taaagtattt ggcatgtagg agttggtgct ctccaaataa ggatatgatt ttatttgtat 15600
ttgtgagcta ctgtcccagc caggtaaatg gatatgatga gacctccttg ccagaccggg 15660
tttctctgat tagaacgagg agcagatgtt gcaggaaatt agcaactgat atcagaagag 15720
ccgtgggcat tctcttgcca gaggtgccct gtctccaggg cgcctcagtc cccccccata 15780
tgtcttctgc tcccaggtcc atccaagctg aatgatcgcg ctgactcaag aagaagcctt 15840
tgggaccaag gaaactttcc cctgatcatc aagaatctta agatagaaga ctcagatact 15900
tacatctgtg aagtggagga ccagaaggag gaggtgcaat tgctagtgtt cggatgtgag 15960
tggggcaggt ggggatgagg atacctcctg cctggttccc ttccccacta ctcccacccc 16020
tgcaccaaat ccagcctgag ctggtgatac cgcagcagcc ccaagaggac caggctgtca 16080
aactggcctc caaatgtctt aaaacccttc ttgatcaggt gagggatgct ggtgggcgga 16140
ggagggaaga ggccttggga aaaggaaaga aaagggaagg aggcaaggga aggagggaga 16200
gagactgggg aagagaggat gaggggagag gaggaaagaa gagagagagg aggggagagg 16260
gaaaccctat cttggctggg ggtgcgcagc tgggtgctgg gaggaaggag atgttgggac 16320
ggcgataatg gagagatgtt gttggtttcc tgttgtctgc ccttctcctt ggggatggta 16380
tgtgtgtgac acagctggcc tttccctcca cagtgactgc caactctgac acccacctgc 16440
ttcaggggca gagcctgacc ctgaccttgg agagcccccc tggtagtagc ccctcagtgc 16500
aatgtaggag tccaaggggt aaaaacatac agggggggaa gaccctctcc gtgtctcagc 16560
tggagctcca ggatagtggc acctggacat gcactgtctt gcagaaccag aagaaggtgg 16620
agttcaaaat agacatcgtg gtgctaggta agggaagccc ctcttcgcgc agtctcctcc 16680
ctgccccagg ggctgacagc ccctccctct gctctgactg ccctgtttct ggttctggtg 16740
ctgggaggtc aggagtggag aagactaggt cccctagagc tgaggcctgt cttgaaggac 16800
tcactggggc cctcatcctc agggggctga ttggcagcca cccctcagtg tggtggacat 16860
ggagaaagga aaggctgggg aaggtaagga tgctagaggc ccgagtctcc tttggaggcc 16920
ccaaaggagg aatgtcaggg agcttacttt ctttgttgcc tcagctccac acccctacca 16980
agttggcaaa tccacttact cagggacact aacaccagta agccaaccct gatgatgttc 17040
tatgttgtac ctctggacct ctaagccagg ccactgtggg gagaccaagg tcctacccca 17100
gatcctgtcc cctgggtgct tatgtgactt aaggtagaca taaggtagtg tgccagttta 17160
gtgcatgtac gctgattgaa atcctggttc tgccacaacc atgtgacctt gggtgagtta 17220
ctaaacctct ctgcaccttg gtttcagcct ctgtgaaatg gggatgatgt taactgccat 17280
agtgactacc tcgtattaag ttgaggactg atatacgtaa ggcactgaaa atggtgcctg 17340
gcacagagta agccctagtt aagtgttcgc tgttattttg tgaagggtga tgaatacgcc 17400
tctaaggagt ggaggccaaa tggcttctgt ggtccaggaa tcctaaggac agcaaggatc 17460
ccctgtggct gggctgctct gtgatggctt ccgggaggag ggaggtggcc tgctgtagga 17520
aaatgctggg tggaagaagg gagagaaggc tggagaggta ggaaggaact gaagtatctg 17580
aagtgacaag gtgggtgtct ggactcgtcg ggtccccttc catctccctg ctgcctccac 17640
atgccaaccc cactcgtgca ccctcatctt cctatctcct cacccagggt ctctcccttc 17700
ccacctccag ctttccagaa ggcctccagc atagtctata agaaagaggg ggaacaggtg 17760
gagttctcct tcccactcgc ctttacagtt gaaaagctga cgggcagtgg cgagctgtgg 17820
tggcaggcgg agagggcttc ctcctccaag tcttggatca cctttgacct gaagaacaag 17880
gaagtgtctg taaaacgggt tacccaggac cctaagctcc agatgggcaa gaagctcccg 17940
ctccacctca ccctgcccca ggccttgcct cagtatgctg gctctggaaa cctcaccctg 18000
gcccttgaag cgaaaacagg aaagttgcat caggaagtga acctggtggt gatgagaggt 18060
gaggggccag gccagggagg ggtgggcagg ggaaggagtt ggaggggcct ggcccagggc 18120
tccctctgag gcaagccagg ccccaagagg ggatgcctag gccctggtca cctggatgaa 18180
gtgagggagg gccctctggg tttggggctg gttttgaact gagacatcca tgagccagcc 18240
tggggctggc ttcactgaag atc 18263
<210> 78
<211> 458
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 78
Met Cys Arg Ala Ile Ser Leu Arg Arg Leu Leu Leu Leu Leu Leu Gln
1 5 10 15
Leu Ser Gln Leu Leu Ala Val Thr Gln Gly Lys Lys Val Val Leu Gly
20 25 30
Lys Lys Gly Asp Thr Val Glu Leu Thr Cys Thr Ala Ser Gln Lys Lys
35 40 45
Ser Ile Gln Phe His Trp Lys Asn Ser Asn Gln Ile Lys Ile Leu Gly
50 55 60
Asn Gln Gly Ser Phe Leu Thr Lys Gly Pro Ser Lys Leu Asn Asp Arg
65 70 75 80
Ala Asp Ser Arg Arg Ser Leu Trp Asp Gln Gly Asn Phe Pro Leu Ile
85 90 95
Ile Lys Asn Leu Lys Ile Glu Asp Ser Asp Thr Tyr Ile Cys Glu Val
100 105 110
Glu Asp Gln Lys Glu Glu Val Gln Leu Leu Val Phe Gly Leu Thr Ala
115 120 125
Asn Ser Asp Thr His Leu Leu Gln Gly Gln Ser Leu Thr Leu Thr Leu
130 135 140
Glu Ser Pro Pro Gly Ser Ser Pro Ser Val Gln Cys Arg Ser Pro Arg
145 150 155 160
Gly Lys Asn Ile Gln Gly Gly Lys Thr Leu Ser Val Ser Gln Leu Glu
165 170 175
Leu Gln Asp Ser Gly Thr Trp Thr Cys Thr Val Leu Gln Asn Gln Lys
180 185 190
Lys Val Glu Phe Lys Ile Asp Ile Val Val Leu Ala Phe Gln Lys Ala
195 200 205
Ser Ser Ile Val Tyr Lys Lys Glu Gly Glu Gln Val Glu Phe Ser Phe
210 215 220
Pro Leu Ala Phe Thr Val Glu Lys Leu Thr Gly Ser Gly Glu Leu Trp
225 230 235 240
Trp Gln Ala Glu Arg Ala Ser Ser Ser Lys Ser Trp Ile Thr Phe Asp
245 250 255
Leu Lys Asn Lys Glu Val Ser Val Lys Arg Val Thr Gln Asp Pro Lys
260 265 270
Leu Gln Met Gly Lys Lys Leu Pro Leu His Leu Thr Leu Pro Gln Ala
275 280 285
Leu Pro Gln Tyr Ala Gly Ser Gly Asn Leu Thr Leu Ala Leu Glu Ala
290 295 300
Lys Thr Gly Lys Leu His Gln Glu Val Asn Leu Val Val Met Arg Val
305 310 315 320
Ala Gln Leu Asn Asn Thr Leu Thr Cys Glu Val Met Gly Pro Thr Ser
325 330 335
Pro Lys Met Arg Leu Thr Leu Lys Gln Glu Asn Gln Glu Ala Arg Val
340 345 350
Ser Glu Glu Gln Lys Val Val Gln Val Val Ala Pro Glu Thr Gly Leu
355 360 365
Trp Gln Cys Leu Leu Ser Glu Gly Asp Lys Val Lys Met Asp Ser Arg
370 375 380
Ile Gln Val Leu Ser Arg Gly Val Asn Gln Thr Val Phe Leu Ala Cys
385 390 395 400
Val Leu Gly Gly Ser Phe Gly Phe Leu Gly Phe Leu Gly Leu Cys Ile
405 410 415
Leu Cys Cys Val Arg Cys Arg His Gln Gln Arg Gln Ala Ala Arg Met
420 425 430
Ser Gln Ile Lys Arg Leu Leu Ser Glu Lys Lys Thr Cys Gln Cys Pro
435 440 445
His Arg Met Gln Lys Ser His Asn Leu Ile
450 455
<210> 79
<211> 293
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 79
Lys Lys Val Val Leu Gly Lys Lys Gly Asp Thr Val Glu Leu Thr Cys
1 5 10 15
Thr Ala Ser Gln Lys Lys Ser Ile Gln Phe His Trp Lys Asn Ser Asn
20 25 30
Gln Ile Lys Ile Leu Gly Asn Gln Gly Ser Phe Leu Thr Lys Gly Pro
35 40 45
Ser Lys Leu Asn Asp Arg Ala Asp Ser Arg Arg Ser Leu Trp Asp Gln
50 55 60
Gly Asn Phe Pro Leu Ile Ile Lys Asn Leu Lys Ile Glu Asp Ser Asp
65 70 75 80
Thr Tyr Ile Cys Glu Val Glu Asp Gln Lys Glu Glu Val Gln Leu Leu
85 90 95
Val Phe Gly Leu Thr Ala Asn Ser Asp Thr His Leu Leu Gln Gly Gln
100 105 110
Ser Leu Thr Leu Thr Leu Glu Ser Pro Pro Gly Ser Ser Pro Ser Val
115 120 125
Gln Cys Arg Ser Pro Arg Gly Lys Asn Ile Gln Gly Gly Lys Thr Leu
130 135 140
Ser Val Ser Gln Leu Glu Leu Gln Asp Ser Gly Thr Trp Thr Cys Thr
145 150 155 160
Val Leu Gln Asn Gln Lys Lys Val Glu Phe Lys Ile Asp Ile Val Val
165 170 175
Leu Ala Phe Gln Lys Ala Ser Ser Ile Val Tyr Lys Lys Glu Gly Glu
180 185 190
Gln Val Glu Phe Ser Phe Pro Leu Ala Phe Thr Val Glu Lys Leu Thr
195 200 205
Gly Ser Gly Glu Leu Trp Trp Gln Ala Glu Arg Ala Ser Ser Ser Lys
210 215 220
Ser Trp Ile Thr Phe Asp Leu Lys Asn Lys Glu Val Ser Val Lys Arg
225 230 235 240
Val Thr Gln Asp Pro Lys Leu Gln Met Gly Lys Lys Leu Pro Leu His
245 250 255
Leu Thr Leu Pro Gln Ala Leu Pro Gln Tyr Ala Gly Ser Gly Asn Leu
260 265 270
Thr Leu Ala Leu Glu Ala Lys Thr Gly Lys Leu His Gln Glu Val Asn
275 280 285
Leu Val Val Met Arg
290
<210> 80
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 80
tgtttgcctg tgacatgaac tcattgtgac acaaaccact gtgctagggg ggatccacta 60
gtaacggccg ccagtgtgct ggaattcgcc ctcgcaaggg ccaggcatat aagtacacaa 120
taaacaaatg gcagctctct cc 142
<210> 81
<211> 99
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 81
cccctccttc cttccccagg cactttccaa gtgtcaactc tagagcctat cgcggccgca 60
ccggtataac ttcgtataat gtatgctata cgaagttat 99
<210> 82
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 82
ataacttcgt ataatgtatg ctatacgaag ttatgtcgac gtagcctatt tctctagatc 60
caaaatgatg acaacaaaag gtaccttgtg 90
<210> 83
<211> 210
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 83
Met Gln Pro Trp Leu Trp Leu Val Phe Ser Met Lys Leu Ala Val Leu
1 5 10 15
His Gly Asn Ser Val Leu Gln Gln Thr Pro Ala Tyr Ile Lys Val Gln
20 25 30
Thr Asn Lys Met Val Met Leu Ser Cys Glu Ala Lys Ile Ser Leu Ser
35 40 45
Asn Met Arg Ile Tyr Trp Leu Arg Gln Arg Gln Ala Pro Ser Ser Asp
50 55 60
Ser His His Glu Phe Leu Ala Leu Trp Asp Ser Ala Lys Gly Thr Ile
65 70 75 80
His Gly Glu Glu Val Glu Gln Glu Lys Ile Ala Val Phe Arg Asp Ala
85 90 95
Ser Arg Phe Ile Leu Asn Leu Thr Ser Val Lys Pro Glu Asp Ser Gly
100 105 110
Ile Tyr Phe Cys Met Ile Val Gly Ser Pro Glu Leu Thr Phe Gly Lys
115 120 125
Gly Thr Gln Leu Ser Val Val Asp Phe Leu Pro Thr Thr Ala Gln Pro
130 135 140
Thr Lys Lys Ser Thr Leu Lys Lys Arg Val Cys Arg Leu Pro Arg Pro
145 150 155 160
Glu Thr Gln Lys Gly Leu Thr Cys Ser Leu Thr Thr Leu Ser Leu Leu
165 170 175
Val Val Cys Ile Leu Leu Leu Leu Ala Phe Leu Gly Val Ala Val Tyr
180 185 190
Phe Tyr Cys Val Arg Arg Arg Ala Arg Ile His Phe Met Lys Gln Phe
195 200 205
His Lys
210
<210> 84
<211> 151
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 84
Val Leu His Gly Asn Ser Val Leu Gln Gln Thr Pro Ala Tyr Ile Lys
1 5 10 15
Val Gln Thr Asn Lys Met Val Met Leu Ser Cys Glu Ala Lys Ile Ser
20 25 30
Leu Ser Asn Met Arg Ile Tyr Trp Leu Arg Gln Arg Gln Ala Pro Ser
35 40 45
Ser Asp Ser His His Glu Phe Leu Ala Leu Trp Asp Ser Ala Lys Gly
50 55 60
Thr Ile His Gly Glu Glu Val Glu Gln Glu Lys Ile Ala Val Phe Arg
65 70 75 80
Asp Ala Ser Arg Phe Ile Leu Asn Leu Thr Ser Val Lys Pro Glu Asp
85 90 95
Ser Gly Ile Tyr Phe Cys Met Ile Val Gly Ser Pro Glu Leu Thr Phe
100 105 110
Gly Lys Gly Thr Gln Leu Ser Val Val Asp Phe Leu Pro Thr Thr Ala
115 120 125
Gln Pro Thr Lys Lys Ser Thr Leu Lys Lys Arg Val Cys Arg Leu Pro
130 135 140
Arg Pro Glu Thr Gln Lys Gly
145 150
<210> 85
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 85
tgaacctgct gctgctgggt gagtcgatta tcctggggag tggagaagct aggccgagcc 60
agttccgggt gtcgccgctg gatcggacct ggaacctggg 100
<210> 86
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 86
atgccaggga cagccctgat actgtaggta gagtcaaggg ctgtccaagt accggtataa 60
cttcgtataa ggtatcctat acgaagttat 90
<210> 87
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 87
ataacttcgt ataaggtatc ctatacgaag ttatctcgac ctgatcttgg agggagacct 60
ggaccgggag acgtgctggg ggcagggtt 89
<210> 88
<211> 243
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 88
Met Ala Ser Pro Leu Thr Arg Phe Leu Ser Leu Asn Leu Leu Leu Leu
1 5 10 15
Gly Glu Ser Ile Ile Leu Gly Ser Gly Glu Ala Arg Pro Ser Gln Phe
20 25 30
Arg Val Ser Pro Leu Asp Arg Thr Trp Asn Leu Gly Glu Thr Val Glu
35 40 45
Leu Lys Cys Gln Val Leu Leu Ser Asn Pro Thr Ser Gly Cys Ser Trp
50 55 60
Leu Phe Gln Pro Arg Gly Ala Ala Ala Ser Pro Thr Phe Leu Leu Tyr
65 70 75 80
Leu Ser Gln Asn Lys Pro Lys Ala Ala Glu Gly Leu Asp Thr Gln Arg
85 90 95
Phe Ser Gly Lys Arg Leu Gly Asp Thr Phe Val Leu Thr Leu Ser Asp
100 105 110
Phe Arg Arg Glu Asn Glu Gly Tyr Tyr Phe Cys Ser Ala Leu Ser Asn
115 120 125
Ser Ile Met Tyr Phe Ser His Phe Val Pro Val Phe Leu Pro Ala Lys
130 135 140
Pro Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile
145 150 155 160
Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala
165 170 175
Gly Gly Ala Val Lys Gly Thr Gly Leu Asp Phe Ala Cys Asp Ile Tyr
180 185 190
Ile Trp Ala Pro Leu Ala Gly Ile Cys Val Ala Leu Leu Leu Ser Leu
195 200 205
Ile Ile Thr Leu Ile Cys Tyr His Arg Ser Arg Lys Arg Val Cys Lys
210 215 220
Cys Pro Arg Pro Leu Val Arg Gln Glu Gly Lys Pro Arg Pro Ser Glu
225 230 235 240
Lys Ile Val
<210> 89
<211> 152
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 89
Arg Pro Ser Gln Phe Arg Val Ser Pro Leu Asp Arg Thr Trp Asn Leu
1 5 10 15
Gly Glu Thr Val Glu Leu Lys Cys Gln Val Leu Leu Ser Asn Pro Thr
20 25 30
Ser Gly Cys Ser Trp Leu Phe Gln Pro Arg Gly Ala Ala Ala Ser Pro
35 40 45
Thr Phe Leu Leu Tyr Leu Ser Gln Asn Lys Pro Lys Ala Ala Glu Gly
50 55 60
Leu Asp Thr Gln Arg Phe Ser Gly Lys Arg Leu Gly Asp Thr Phe Val
65 70 75 80
Leu Thr Leu Ser Asp Phe Arg Arg Glu Asn Glu Gly Tyr Tyr Phe Cys
85 90 95
Ser Ala Leu Ser Asn Ser Ile Met Tyr Phe Ser His Phe Val Pro Val
100 105 110
Phe Leu Pro Ala Lys Pro Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr
115 120 125
Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala
130 135 140
Cys Arg Pro Ala Ala Gly Gly Ala
145 150
<210> 90
<211> 149
<212> DNA
<213> 人工序列
<220>
<223> 在人/小鼠序列的5'连接处的
嵌合人/小鼠MHC I基因座的序列
<400> 90
agtgtcgccg cggacgctgg atataaagtc cacgcagccc gcagaactca gaagtcgcga 60
atcgccgaca ggtgcgatgg ccgtcatggc gccccgaacc ctcgtcctgc tactctcggg 120
ggctctggcc ctgacccaga cctgggcgg 149
<210> 91
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 在人/小鼠序列的3'连接处的
嵌合人/小鼠MHC I基因座的序列
<400> 91
ggtggtgcct tctggacagg agcagagata cacctgccat gtgcagcatg agggtttgcc 60
caagcccctc accctgagat ggggtaagga gagtgtgggt gcagagctgg ggtcagggaa 120
agctggagct ttctgcagac cctgagctgc tcagggctg 159
<210> 92
<211> 120
<212> DNA
<213> 小家鼠
<400> 92
aactcccccc cagaggagca gcttatctgg tggtttcttc cagccctcaa ggggtagacc 60
tatgggaggg tccttttttg tataaagctg taacattgtg gaaaccttgc gctcgttcgc 120
<210> 93
<211> 120
<212> DNA
<213> 小家鼠
<400> 93
actgaagaca gtagcccaaa gaatagtaaa aagaagagca agaagactca aagccctgaa 60
gaaaggcatt ctgtgtccag aacacgaaaa caaacccaga attatttgcc gactaccttg 120
<210> 94
<211> 120
<212> DNA
<213> 小家鼠
<400> 94
agacaaacct ctctgccacc tggtctccct gcccctgccc aggctctggg gtaggcacct 60
gtggggaaga aacttttttg tatcacgatg taacattgtg gaaaccttgc gctcgttcgc 120
<210> 95
<211> 120
<212> DNA
<213> 小家鼠
<400> 95
aacctacctt gtcctggctt gcgagagagc gaacaacgtt tggcacccaa tcccttttca 60
tcccgctccc ccagaaaggg tgaagttgag agctgtctcc attatttgcc gactaccttg 120
<210> 96
<211> 9
<212> PRT
<213> 智人
<400> 96
Ser Leu Leu Met Trp Ile Thr Gln Cys
1 5
<210> 97
<211> 9
<212> PRT
<213> 智人
<400> 97
Phe Leu Trp Gly Pro Arg Ala Leu Val
1 5
<210> 98
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> TRAC sgRNA
<400> 98
gcugguacac ggcaggguca 20
<210> 99
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> TRBC1/2 sgRNA
<400> 99
ugggaaggag gugcacagug 20
<210> 100
<211> 23
<212> DNA
<213> 小家鼠
<400> 100
tcaaagtcgg tgaacaggca gag 23
<210> 101
<211> 25
<212> DNA
<213> 小家鼠
<400> 101
gaccttgggt ggagtcacat ttctc 25
<210> 102
<211> 21
<212> PRT
<213> 小家鼠
<400> 102
Met Glu Val Gly Trp Tyr Arg Ser Pro Phe Ser Arg Val Val His Leu
1 5 10 15
Tyr Arg Asn Gly Lys
20
<210> 103
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成 EARS:306-313肽
<400> 103
Ser Leu Leu Asp Ile Ile Thr Asn Cys
1 5
<210> 104
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成 MAGEH1:90-98肽
<400> 104
Ser Leu Leu Met Ser Ile Leu Ala Leu
1 5
<210> 105
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成 FBXL22:4-12肽
<400> 105
Leu Leu Thr Met His Ile Thr Gln Leu
1 5
<210> 106
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成 URB1:1853-1861肽
<400> 106
Ser Leu Leu Thr Trp Ile Leu His Ile
1 5
<210> 107
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成 LV9-5, 粘蛋白肽
<400> 107
Leu Leu Leu Thr Val Leu Thr Val Val
1 5
权利要求书(按照条约第19条的修改)
1.一种小鼠或一种分离的小鼠细胞,所述小鼠或所述分离的小鼠细胞包含:
(i)未重排的T细胞受体(TCR)可变区序列,所述未重排的TCRα可变区序列包含至少一个未重排的人T细胞可变区Vα区段和至少一个未重排的人T细胞可变区Jα区段,所述未重排的TCRα可变区序列可操作地连接至小鼠TCRα恒定基因序列,任选地连接到内源小鼠TCRα可变基因的基因座处,以及
(ii)未重排的TCR可变区序列,所述未重排的TCRβ可变区序列包含至少一个未重排的人T细胞可变区Vβ区段、至少一个未重排的人T细胞可变区Dβ区段和至少一个未重排的人T细胞可变区Jβ区段,所述未重排的TCRβ可变区序列可操作地连接至小鼠TCRβ恒定基因序列,任选地连接到内源小鼠TCRβ可变基因的基因座处,其中所述未重排的TCR可变区序列包含小鼠TCRB非编码序列,所述小鼠TCRB非编码序列包含:
TCRBDJ1非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD1区段和TRBJ1区段之间和/或在任何两个连续的未重排的TRBJ1区段之间发现的其他非编码基因间序列的连续非编码序列,和/或
TCRBDJ2非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD2区段和TRBJ2区段之间和/或在任何两个连续的未重排的TRBJ2区段之间发现的其他非编码基因间序列的连续非编码序列,
其中所述未重排的人T细胞可变区区段能够在T细胞中重排以形成编码特异性结合目标抗原的人T细胞受体可变结构域的基因。
2.如权利要求1所述的小鼠或分离的小鼠细胞,其中:
(i)所述至少一个未重排的人T细胞可变区Vα区段构成未重排的人T细胞可变区Vα区段库,所述至少一个未重排的人T细胞可变区Jα区段构成未重排的人T细胞可变区Jα基因区段库,并且
(ii)所述至少一个未重排的人T细胞可变区Vβ区段构成未重排的人Vβ区段库,所述至少一个未重排的人T细胞可变区Dβ区段包括未重排的人T细胞可变区Dβ1区段和未重排的人T细胞可变区Dβ2区段,并且所述至少一个未重排的人T细胞可变区Jβ区段包括至少一个未重排的人T细胞可变区Jβ1区段和至少一个未重排的人T细胞可变区Jβ2区段,
其中所述小鼠TCRB非编码序列包含(i)介于所述至少一个未重排的人T细胞可变区Dβ1区段和所述至少一个未重排的人T细胞可变区Jβ1区段之间的小鼠TCRBD1-TCRBJ1非编码核酸序列,和(ii)介于所述至少一个未重排的人T细胞可变区Dβ2区段和所述至少一个未重排的人T细胞可变区Jβ2区段之间的小鼠TCRBD2-TCRBJ2非编码核酸序列。
3.如权利要求1或权利要求2所述的小鼠或分离的小鼠细胞,其中:
(I)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vα基因区段的缺失,
(b)所有内源TCR Jα基因区段的缺失,和
(c)它们的组合,或
(II)所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vβ基因区段的缺失,
(b)所有内源TCR Dβ基因区段的缺失,
(c)所有内源TCR Jβ基因区段的缺失,和
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vα基因区段的缺失,
(b)所有内源TCR Jα基因区段的缺失,和
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vβ基因区段的缺失,
(b)所有内源TCR Dβ基因区段的缺失,
(c)所有内源TCR Jβ基因区段的缺失,和
(d)它们的组合。
4.如权利要求1-3中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,
(b)至少一个内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,和
(c)它们的组合,或
(II)所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,
(b)至少一个内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ区段置换,
(c)至少一个内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,和
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,
(b)至少一个内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,和
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,
(b)至少一个内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ区段置换,
(c)至少一个内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,和
(d)它们的组合。
5.如权利要求1-4中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vα基因区段包括从TRAV1-1至TRAV41的多个或所有未重排的人T细胞可变区Vα基因区段,
(b)所有内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jα区段包括从TRAJ1至TRAJ61的多个或所有未重排的人T细胞可变区Jα基因区段,或
(c)它们的组合,
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vβ基因区段包括从TRBV1至TRBV29-1的多个或所有未重排的人T细胞可变区Vβ基因区段,
(b)所有内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Dβ基因区段包含未重排的人T细胞可变区Dβ1基因区段和/或未重排的人T细胞可变区Dβ2基因区段,
(c)所有内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jβ区段包括从TRBJ1-1至TRBJ1-6的多个或所有未重排的人Jβ区段,或从TRBJ2-1至TRBJ2-7的多个或所有未重排的人Jβ区段,或
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vα基因区段包括从TRAV1-1至TRAV41的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jα区段包括从TRAJ1至TRAJ61的多个或所有未重排的人T细胞可变区基因区段,或
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vβ基因区段包括从TRBV1至TRBV29-1的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Dβ基因区段包含未重排的人T细胞可变区Dβ1基因区段和/或未重排的人T细胞可变区Dβ2基因区段,
(c)所有内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jβ区段包括从TRBJ1-1至TRBJ1-6的多个或所有未重排的人Jβ区段,或从TRBJ2-1至TRBJ2-7的多个或所有未重排的人Jβ区段,或
(d)它们的组合。
6.如权利要求1-5中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区Vα基因区段置换,
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区Jα基因区段置换,或
(c)它们的组合,
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区Vβ基因区段置换,
(b)内源T细胞可变区Dβ1基因区段被未重排的人T细胞可变区Dβ1基因区段置换,并且内源T细胞可变区Dβ2基因区段被未重排的人T细胞可变区Dβ2基因区段置换,
(c)以下置换:
内源TRBJ1-1基因区段被未重排的人TRBJ1-1基因区段置换,
内源TRBJ1-2基因区段被未重排的人TRBJ1-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-1区段和小鼠TRBJ1-2区段之间发现的小鼠非编码序列,
内源TRBJ1-3基因区段被未重排的人TRBJ1-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-2区段和小鼠TRBJ1-3区段之间发现的小鼠非编码序列,
内源TRBJ1-4基因区段被未重排的人TRBJ1-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-3区段和小鼠TRBJ1-4区段之间发现的小鼠非编码序列,
内源TRBJ1-5基因区段被未重排的人TRBJ1-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-4区段和小鼠TRBJ1-5区段之间发现的小鼠非编码序列,
内源TRBJ1-6基因区段被未重排的人TRBJ1-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-5区段和小鼠TRBJ1-6区段之间发现的小鼠非编码序列,
内源TRBJ2-1基因区段被未重排的人TRBJ2-1基因区段置换,
内源TRBJ2-2基因区段被未重排的人TRBJ2-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-1区段和小鼠TRBJ2-2区段之间发现的小鼠非编码序列,
内源TRBJ2-3基因区段被未重排的人TRBJ2-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-2区段和小鼠TRBJ2-3区段之间发现的小鼠非编码序列,
内源TRBJ2-4基因区段被未重排的人TRBJ2-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-3区段和小鼠TRBJ2-4区段之间发现的小鼠非编码序列,
内源TRBJ2-5基因区段被未重排的人TRBJ2-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-4区段和小鼠TRBJ2-5区段之间发现的小鼠非编码序列,
内源TRBJ2-6基因区段被未重排的人TRBJ2-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-5区段和小鼠TRBJ2-6区段之间发现的小鼠非编码序列,以及
内源TRBJ2-7基因区段被未重排的人TRBJ2-7基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-6区段和小鼠TRBJ2-7区段之间发现的小鼠非编码序列,或
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区Vα基因区段置换,
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区Jα基因区段置换,或
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区Vβ基因区段置换,
(b)内源T细胞可变区Dβ1基因区段被未重排的人T细胞可变区Dβ1基因区段置换,并且内源T细胞可变区Dβ2基因区段被未重排的人T细胞可变区Dβ2基因区段置换,
(c)以下置换:
内源TRBJ1-1基因区段被未重排的人TRBJ1-1基因区段置换,
内源TRBJ1-2基因区段被未重排的人TRBJ1-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-1区段和小鼠TRBJ1-2区段之间发现的小鼠非编码序列,
内源TRBJ1-3基因区段被未重排的人TRBJ1-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-2区段和小鼠TRBJ1-3区段之间发现的小鼠非编码序列,
内源TRBJ1-4基因区段被未重排的人TRBJ1-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-3区段和小鼠TRBJ1-4区段之间发现的小鼠非编码序列,
内源TRBJ1-5基因区段被未重排的人TRBJ1-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-4区段和小鼠TRBJ1-5区段之间发现的小鼠非编码序列,
内源TRBJ1-6基因区段被未重排的人TRBJ1-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-5区段和小鼠TRBJ1-6区段之间发现的小鼠非编码序列,
内源TRBJ2-1基因区段被未重排的人TRBJ2-1基因区段置换,
内源TRBJ2-2基因区段被未重排的人TRBJ2-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-1区段和小鼠TRBJ2-2区段之间发现的小鼠非编码序列,
内源TRBJ2-3基因区段被未重排的人TRBJ2-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-2区段和小鼠TRBJ2-3区段之间发现的小鼠非编码序列,
内源TRBJ2-4基因区段被未重排的人TRBJ2-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-3区段和小鼠TRBJ2-4区段之间发现的小鼠非编码序列,
内源TRBJ2-5基因区段被未重排的人TRBJ2-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-4区段和小鼠TRBJ2-5区段之间发现的小鼠非编码序列,
内源TRBJ2-6基因区段被未重排的人TRBJ2-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-5区段和小鼠TRBJ2-6区段之间发现的小鼠非编码序列,以及
内源TRBJ2-7基因区段被未重排的人TRBJ2-7基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-6区段和小鼠TRBJ2-7区段之间发现的小鼠非编码序列,或
(d)它们的组合。
7.根据前述权利要求中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区Vα基因区段置换,以及
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区Jα基因区段置换;并且
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区Vβ基因区段置换,
(b)(i)内源tcrbdj1簇被包含未重排的人TCRBD1区段的人源化TCRBDJ1簇置换,和(ii)未重排的人TCRBJ1-1区段、未重排的人TCRBJ1-2区段、未重排的人TCCRBJ1-3区段、未重排的人TCRBJ1-4区段、未重排的人TCRBJ1-5区段和未重排的人TCRBJ1-6区段中的每一个,
其中所述人源化TCRBDJ1簇包含介于所述未重排的人TCRBD1区段和所述未重排的人TCRBJ1-1区段之间的小鼠TCRBDJ1非编码序列,以及介于任何两个连续的未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列,任选地其中所述未重排的人TCRBD1和TCRBJ1基因区段位于相同的小鼠TCRBDJ1非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段,并且
(c)(i)内源tcrbdj2簇被包含未重排的人TCRBD2区段的人源化TCRBDJ2簇置换,和(ii)未重排的人TRBJ2-1区段、未重排的人TRBJ2-2区段、未重排的人TCRBJ2-3区段、未重排的人TCRBJ2-4区段、未重排的人TCRBJ2-5区段、未重排的人TCRBJ2-6区段和未重排的人TCRBJ2-7区段中的每一个,
其中所述人源化TCRBDJ2簇包含介于所述未重排的人TCRBD2区段和任何未重排的人TCRBJ2区段之间的小鼠TCRBDJ2非编码序列,以及介于任何两个连续的未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列,任选地其中所述未重排的人TCRBD2和TCRBJ2基因区段位于相同的小鼠TCRBDJ2非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj2基因区段。
8.根据前述权利要求中任一项所述的小鼠,其中所述未重排的TCR可变区序列处于种系基因组中,和/或所述未重排的TCRβ可变区序列处于所述种系基因组中。
9.如前述权利要求中任一项所述的小鼠或如权利要求1-7中任一项所述的小鼠细胞,其中所述TCR可变区序列可操作地连接至内源TCR调控元件,和/或所述TCRβ可变区序列可操作地连接至内源TCR调控元件。
10.根据前述权利要求中任一项所述的小鼠,其中所述小鼠在T细胞表面表达T细胞受体,所述T细胞受体包含人源化TCR链和人源化TCR链,
其中所述人源化TCRα链由可操作地连接至所述小鼠TCRα恒定区序列的重排的人Vα/Jα序列编码,其中所述重排的人Vα/Jα序列通过所述至少一个人T细胞可变区Vα区段和至少一个人T细胞可变区Jα区段的重排形成,
其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ/Jβ序列编码,其中所述重排的人Vβ/Dβ/Jβ序列通过所述至少一个人T细胞可变区Vβ区段、至少一个T细胞可变区Dβ区段和至少一个人T细胞可变区Jβ区段的重排形成,任选地其中所述TCRβ链由重排的Vβ/Dβ2/Jβ2序列编码。
11.根据前述权利要求中任一项所述的小鼠,其中所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ1簇的基因区段,并且所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ2簇的基因区段。
12.一种小鼠或分离的小鼠细胞,所述小鼠或分离的小鼠细胞在其基因组中包含:
(a)编码嵌合人/小鼠CD4辅助受体的第一核苷酸序列,所述辅助受体包含人CD4多肽的D1、D2和D3结构域以及小鼠CD4多肽的跨膜结构域和胞质结构域;
(b)编码嵌合人/小鼠CD8α多肽的第二核苷酸序列和编码嵌合人/小鼠CD8多肽的第三核苷酸序列,
其中所述嵌合人/小鼠CD8多肽包含人CD8多肽的IgV样结构域和小鼠CD8多肽的跨膜结构域和胞质结构域,
其中所述嵌合人/小鼠CD8多肽包含人CD8多肽的IgV样结构域和小鼠CD8多肽的跨膜结构域和胞质结构域;
(c)编码嵌合人/小鼠MHC IIα多肽的第一核酸序列和编码嵌合人/小鼠MHC II多肽的第二核酸序列,
其中所述嵌合人/小鼠MHC II多肽包含人HLA II类多肽的α1和α2结构域以及小鼠MHCII多肽的跨膜结构域和胞质结构域,
其中所述嵌合人/小鼠MHC II多肽包含人HLA II类多肽的β1和β2结构域以及小鼠MHCII多肽的跨膜结构域和胞质结构域;
(d)编码嵌合人/小鼠MHC I多肽的第三核酸序列,
其中所述嵌合MHC I多肽包含人HLA I类多肽的α1、α2和α3结构域以及小鼠MHC I多肽的跨膜结构域和胞质结构域;以及
(e)未重排的人TCR可变区序列,所述未重排的人TCR可变区序列包含至少一个人V区段和至少一个人J区段,所述未重排的人TCR可变区序列可操作地连接至小鼠TCR恒定区序列;和未重排的TCR可变区序列,所述未重排的TCR可变区序列包含所述至少一个人V区段、所述至少一个人D区段和所述至少一个人J区段,所述未重排的TCR可变区序列可操作地连接至小鼠TCR恒定区序列,其中所述未重排的TCR可变区序列包含小鼠TCRB非编码序列,所述小鼠TCRB非编码序列包含:
TCRBDJ1非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD1区段和TRBJ1区段之间和/或在任何两个连续的未重排的TRBJ1区段之间发现的其他非编码基因间序列的连续非编码序列,和/或
TCRBDJ2非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD2区段和TRBJ2区段之间和/或在任何两个连续的未重排的TRBJ2区段之间发现的其他非编码基因间序列的连续非编码序列,
任选地其中所述小鼠表达:
(A)所述嵌合人/小鼠CD4辅助受体,
(B)包含所述嵌合人/小鼠CD8多肽和所述嵌合人/小鼠CD8多肽的嵌合CD8辅助受体,
(C)嵌合MHC II复合物,所述嵌合MHC II复合物包含所述嵌合人/小鼠MHC II多肽和所述嵌合人/小鼠MHC II多肽,其中所述嵌合MHC II复合物能够结合所述嵌合人/小鼠CD4辅助受体,和
(D)所述嵌合人/小鼠MHC I多肽,其中所述嵌合MHC I多肽能够结合所述嵌合CD8辅助受体,和
(E)T细胞表面上的T细胞受体,所述T细胞受体包含人源化TCR链和人源化TCR链,
其中所述人源化TCRα链由可操作地连接至所述小鼠TCRα恒定区序列的重排的人Vα/Jα序列编码,其中所述重排的人Vα/Jα序列通过包含至少一个人Vα区段和至少一个人Jα区段的所述未重排的人TCR可变区序列的重排形成,
其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ/Jβ序列编码,其中所述重排的人Vβ/Dβ/Jβ序列通过包含至少一个人Vβ区段、至少一个Dβ区段和至少一个人Jβ区段的所述未重排的TCRβ可变区序列的重排形成。
13.如权利要求12所述的小鼠,所述小鼠在其种系基因组中包含:
(a)编码所述嵌合人/小鼠CD4辅助受体的所述第一核苷酸序列;
(b)编码所述嵌合人/小鼠CD8α多肽的所述第二核苷酸序列和编码所述嵌合人/小鼠CD8β多肽的所述第三核苷酸序列;
(c)编码所述嵌合人/小鼠MHC IIα多肽的所述第一核酸序列和编码所述嵌合人/小鼠MHC IIβ多肽的所述第二核酸序列;
(d)编码所述嵌合人/小鼠MHC I多肽的所述第三核酸序列;以及
(e)可操作地连接至小鼠TCR恒定区序列的所述未重排的人TCR可变区序列和可操作地连接至小鼠TCR恒定区序列的所述未重排的TCR可变区序列。
14.如权利要求12或权利要求13所述的小鼠,或如权利要求12所述的小鼠细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处;
(b)所述第二核苷酸序列存在于内源CD8 T细胞辅助受体基因座处并且所述第三核苷酸序列存在于内源CD8 T细胞辅助受体基因座处;
(c)所述第一核酸序列存在于内源MHC II基因座处并且所述第二核酸序列存在于内源MHC II基因座处;
(d)所述第三核酸序列存在于内源MHC I基因座处;或者
(e)所述未重排的人TCR可变区序列存在于内源TCR可变区基因座处并且所述未重排的TCR可变区序列存在于内源TCR可变区基因座处,或
(f)(a)-(e)的任何组合。
15.如权利要求12-14中任一项所述的小鼠或如权利要求12或权利要求14所述的分离的小鼠细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处并且可操作地连接至内源CD4辅助受体启动子和调控元件;
(b)所述第二核苷酸序列存在于内源CD8 T细胞辅助受体基因座处并且可操作地连接至内源CD8多肽启动子和调控元件,并且所述第三核苷酸序列存在于内源CD8 T细胞辅助受体基因座处并且可操作地连接至内源CD8多肽启动子和调控元件;
(c)所述第一核酸序列存在于内源MHC II基因座处并且可操作地连接至内源MHC II启动子和调控元件,并且所述第二核酸序列存在于内源MHC II基因座处并且可操作地连接至内源MHC II启动子和调控元件;
(d)所述第三核酸序列存在于内源MHC I基因座处并且可操作地连接至内源MHC I启动子和调控元件;
(e)所述未重排的人TCR可变区序列存在于内源TCR可变区基因座处并且可操作地连接至内源TCR调控元件,并且所述未重排的TCR可变区序列可操作地连接至内源TCR调控元件;或者
(f)(a)-(e)的任何组合。
16.如权利要求12-15中任一项所述的小鼠或如权利要求12、14-15中任一项所述的分离的小鼠细胞,其中
(a)所述嵌合人/小鼠CD4辅助受体包含所述人CD4多肽的D1、D2和D3结构域,可操作地连接至内源CD4多肽的D4结构域、跨膜结构域和胞质结构域,
(b)所述嵌合人/小鼠CD8多肽包含可操作地连接至内源CD8多肽的跨膜结构域和胞质结构域的所述人CD8多肽的所述IgV样结构域,并且所述嵌合CD8多肽包含可操作地连接至内源CD8多肽的跨膜结构域和胞质结构域的所述人CD8多肽的所述IgV样结构域;
(c)所述嵌合人/小鼠MHC II多肽包含可操作地连接至内源MHC II多肽的跨膜结构域和胞质结构域的人HLA II类1和2结构域,并且所述嵌合MHC II多肽包含可操作地连接至内源MHC II多肽的跨膜结构域和胞质结构域的人HLA II类1和2结构域;
(d)所述嵌合人/小鼠MHC I多肽包含可操作地连接至内源MHC I多肽的跨膜结构域和胞质结构域的人HLA I类1、2和3结构域,或
(e)(a)-(d)的任何组合。
17.如权利要求12-16中任一项所述的小鼠或如权利要求12和14-16中任一项所述的分离的小鼠细胞,其中
(a)所述人HLA II类多肽的所述α1和α2结构域由选自由HLA-DR、HLA-DQ和HLA-DP的任何链基因组成的组的HLA II类基因编码;
(b)所述人HLA II类多肽的所述β1和β2结构域由选自由HLA-DR、HLA-DQ和HLA-DP的任何β链基因组成的组的HLA II类基因编码;
(c)所述人HLA I类多肽的所述α1结构域、α2结构域和α3结构域由人HLA-A基因、人HLA-B基因或人HLA-C基因编码;或者
(d)(a)-(c)的任何组合。
18.如权利要求12-17中任一项所述的小鼠或如权利要求12和14-17中任一项所述的分离的小鼠细胞,其中所述人HLA II类多肽的所述α1和α2结构域由HLA-DR的所述α链基因编码,并且所述人HLAII类多肽的所述β1和β2结构域由HLA-DR的所述链基因编码,并且
其中所述人HLA I类多肽的所述α1结构域、α2结构域和α3结构域由人HLA-A基因编码。
19.如权利要求12-18中任一项所述的小鼠或如权利要求12和14-18中任一项所述的分离的小鼠细胞,其中所述嵌合MHC II复合物包含人HLA-DR2蛋白的1、2、和结构域。
20.如权利要求12-19中任一项所述的小鼠或如权利要求12和14-19中任一项所述的分离的小鼠细胞,其中所述嵌合人/小鼠MHC I多肽包含人HLA-A2蛋白的1、2和3结构域。
21.如权利要求12-20中任一项所述的小鼠或如权利要求12和14-20中任一项所述的分离的小鼠细胞,其中
(a)所述未重排的人TCR可变区序列包含完整的人V基因区段组库和完整的人J基因区段组库,
(b)所述未重排的TCR可变区序列包含完整的人V基因区段组库、完整的人D基因区段组库和完整的人J基因区段组库,或
(c)所述未重排的人TCR可变区序列包含完整的人V基因区段组库和完整的人J基因区段组库,并且所述未重排的TCR可变区序列包含完整的人V基因区段组库、完整的人D基因区段组库和完整的人J基因区段组库。
22.如权利要求12-21中任一项所述的小鼠或如权利要求12和14-21中任一项所述的分离的小鼠细胞,其中:
(i)内源TCR可变基因座(a)缺乏所有或基本上所有功能性内源V基因区段,(b)缺乏所有或基本上所有功能性内源J基因区段,或(c)缺乏所有或基本上所有功能性内源V基因区段并且缺乏所有或基本上所有功能性内源J基因区段;
(ii)内源TCR可变基因座(a)缺乏所有或基本上所有功能性内源V基因区段,(b)缺乏所有或基本上所有功能性内源D基因区段,(c)缺乏所有或基本上所有功能性内源J基因区段,或(d)(a)、(b)和(c)的任何组合;或者
(iii)(i)和(ii)两者。
23.如权利要求12-22中任一项所述的小鼠或如权利要求12和14-22中任一项所述的分离的小鼠细胞,其中
(a)所述第一核苷酸序列包含编码所述人CD4多肽的所述D1、D2和D3结构域的序列,所述序列在内源小鼠CD4基因座处,(i)置换编码内源CD4辅助受体多肽的所述D1、D2和D3结构域的序列,并且(ii)可操作地连接至编码内源CD4 D4结构域、跨膜结构域和胞质结构域的序列;
(b)所述第二核苷酸序列包含编码所述人CD8多肽的所述IgV样结构域的序列,所述序列在内源CD8α基因座处,(i)置换编码所述内源CD8多肽的IgV样结构域的序列,并且(ii)可操作地连接至编码内源CD8跨膜结构域和胞质结构域的序列,并且
所述第三核苷酸序列包含编码所述人CD8多肽的IgV样结构域的序列,所述序列在内源CD8β基因座处,(i)置换编码内源CD8多肽的IgV样结构域的序列,并且(ii)可操作地连接至编码内源CD8跨膜结构域和胞质结构域的序列;
(c)所述第一核酸序列包含编码所述人HLA II类多肽的所述α1和α2结构域的序列,所述序列在内源MHC IIα基因座处,(i)置换编码内源MHC II多肽的α1和α2结构域的序列并且(ii)可操作地连接至编码内源MHC II多肽跨膜结构域和胞质结构域的序列,并且
所述第二核酸包含编码所述人HLA II类多肽的所述β1和β2结构域的序列,所述序列在内源MHC IIβ基因座处,(i)置换编码内源MHC II多肽的β1和β2结构域的序列并且(ii)可操作地连接至编码内源MHC II多肽跨膜结构域和胞质结构域的序列;
(d)所述第三核酸序列包含编码所述人HLAI类多肽的所述α1、α2和α3结构域的序列,所述序列在内源MHC I基因座处,(i)置换编码内源MHC I多肽的α1、α2和α3结构域的序列,并且(ii)可操作地连接至编码内源MHC I多肽跨膜结构域和胞质结构域的序列;
(e)所述未重排的人TCR可变区序列置换内源TCR可变区基因座处的一个或多个内源V和/或J基因区段,并且所述未重排的TCR可变区序列置换内源TCR可变区基因座处的一个或多个内源V、D和/或J基因区段;或者
(f)(a)-(e)的任何组合。
24.如权利要求12-23中任一项所述的小鼠,其中所述小鼠:
(a)不从内源CD4辅助受体基因座表达功能性内源CD4辅助受体;
(b)不从内源CD8辅助受体基因座表达功能性内源CD8辅助受体;
(c)不从内源TCR基因座表达内源TCR可变结构域;
(d)不从内源TCR基因座表达内源TCR可变结构域;
(e)不在细胞表面上,从内源MHCI基因座表达内源经典MHC I类多肽的胞外结构域;
(f)不在细胞表面上,从内源MHC II基因座表达内源经典MHC II类多肽的胞外结构域;或者
(e)(a)-(f)的任何组合。
25.如权利要求12-24中任一项所述的小鼠或如权利要求12、14-23中任一项所述的分离的小鼠细胞,所述小鼠或所述分离的小鼠细胞还包含2微球蛋白基因座,所述基因座包含编码包含人2微球蛋白氨基酸序列的多肽的序列,任选地其中所述小鼠表达人或人源化2微球蛋白多肽。
26.如权利要求25所述的小鼠,其中所述小鼠不从内源小鼠2微球蛋白基因座表达功能性内源小鼠2微球蛋白多肽。
27.如权利要求25或权利要求26所述的小鼠,或如权利要求25所述的小鼠细胞,其中编码包含人2微球蛋白多肽的多肽的所述序列可操作地连接至内源小鼠2微球蛋白调控元件。
28.如权利要求25-27中任一项所述的小鼠或如权利要求25或权利要求27所述的分离的小鼠细胞,其中所述2微球蛋白基因座包含人2微球蛋白基因的外显子2、外显子3和外显子4中所示的核苷酸序列。
29.如权利要求28所述的小鼠或分离的小鼠细胞,其中所述2微球蛋白基因座还包含小鼠2微球蛋白基因的外显子1中所示的核苷酸序列。
30.一种基因修饰的小鼠或分离的小鼠细胞,所述基因修饰的小鼠或分离的小鼠细胞在其基因组中包含:
(a)编码嵌合人/小鼠CD4辅助受体的第一核苷酸序列,所述辅助受体包含人CD4多肽的D1、D2和D3结构域,可操作地连接至小鼠CD4多肽的D4结构域、跨膜结构域和胞质结构域;
(b)编码嵌合人/小鼠CD8多肽的第二核苷酸序列和编码嵌合人/小鼠CD8β多肽的第三核苷酸序列,
其中所述嵌合人/小鼠CD8α多肽包含可操作地连接至内源小鼠CD8α多肽的跨膜结构域和胞质结构域的人CD8多肽的IgV样结构域,并且其中所述嵌合人/小鼠CD8多肽包含可操作地连接至内源小鼠CD8β多肽的跨膜结构域和胞质结构域的人CD8多肽的IgV样结构域;
(c)编码嵌合人/小鼠MHC II多肽的第一核酸序列和编码嵌合人/小鼠MHC II多肽的第二核酸序列,
其中所述嵌合人/小鼠MHC II多肽包含可操作地连接至内源小鼠MHCII多肽的跨膜结构域和胞质结构域的人HLAII类多肽的1和2结构域,并且其中所述嵌合人/小鼠MHCII多肽包含可操作地连接至内源小鼠MHC II多肽的跨膜结构域和胞质结构域的人HLA II类β多肽的1和2结构域;
(d)编码嵌合人/小鼠MHC I多肽的第三核酸序列,所述多肽包含可操作地连接至内源小鼠MHC I类多肽的跨膜结构域和胞质结构域的人HLA I类多肽的α1、α2和α3结构域;
(e)未重排的人T细胞受体(TCR)可变区序列,所述未重排的人TCR可变区序列包含至少一个人V区段和至少一个人J区段,所述未重排的人TCR可变区序列可操作地连接至小鼠TCR恒定区序列;和未重排的TCR可变区序列,所述未重排的TCR可变区序列包含至少一个人V区段、至少一个人D区段和至少一个人J区段,所述未重排的TCR可变区序列可操作地连接至小鼠TCR恒定区序列,其中所述未重排的TCR可变区序列包含小鼠TCRB非编码核酸序列,所述小鼠TCRB非编码核酸序列包含:
TCRBDJ1非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD1区段和TRBJ1区段之间和/或在任何两个连续的未重排的TRBJ1区段之间发现的其他非编码基因间序列的连续非编码序列,和/或
TCRBDJ2非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD2区段和TRBJ2区段之间和/或在任何两个连续的未重排的TRBJ2区段之间发现的其他非编码基因间序列的连续非编码序列;以及
(f)编码人或人源化2微球蛋白多肽并且包含核苷酸序列的多核苷酸,所述核苷酸序列包含内源小鼠2微球蛋白基因的外显子1中所示的核苷酸序列,可操作地连接至人2微球蛋白基因的外显子2、外显子3和外显子4中所示的核苷酸序列,
任选地其中所述小鼠表达:
(A)所述嵌合人/小鼠CD4辅助受体,
(B)包含所述嵌合人/小鼠CD8α多肽和所述嵌合人/小鼠CD8β多肽的嵌合CD8辅助受体,
(C)嵌合MHC II复合物,所述嵌合MHC II复合物包含所述嵌合人/小鼠MHC IIα多肽和所述嵌合人/小鼠MHC IIβ多肽,其中所述嵌合MHC II复合物能够结合所述嵌合人/小鼠CD4辅助受体,
(D)所述嵌合人/小鼠MHCI多肽,其中所述嵌合MHC I多肽能够结合所述嵌合CD8辅助受体,
(E)T细胞表面上,包含人源化TCR链和人源化TCR链的嵌合人/小鼠T细胞受体,
其中所述人源化TCRα链由可操作地连接至所述小鼠TCRα恒定区序列的重排的人Vα/Jα序列编码,其中所述重排的人Vα/Jα序列通过包含所述至少一个人Vα区段和所述至少一个人Jα区段的所述未重排的人TCR可变区序列的重排形成,
其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ/Jβ序列编码,其中所述重排的人Vβ/Dβ/Jβ序列通过包含所述至少一个人Vβ区段、至少一个Dβ区段和至少一个人Jβ区段的所述未重排的人TCRβ可变区的重排形成,任选地其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ2/Jβ2序列编码,以及
(F)所述人或人源化β2微球蛋白多肽。
31.如权利要求12-30中任一项所述的小鼠,其中所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ1簇的基因区段,并且所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ2簇的基因区段。
32.如权利要求12-31中任一项所述的小鼠或如权利要求12、14-23、25和27-30中任一项所述的小鼠细胞,其中所述嵌合人/小鼠MHCII多肽是嵌合HLA-DR/H-2E多肽,所述嵌合人/小鼠MHC II多肽是嵌合人/小鼠HLA-DR/H-2E多肽,并且所述嵌合人/小鼠MHC I多肽是嵌合人/小鼠HLA-A/H-2K多肽,并且其中所述小鼠表达HLA-A/H-2K和HLA-DR/H-2E。
33.一种制备如权利要求1-32中任一项所述的小鼠或如权利要求1-7、9、12、14-23、25和27-30中任一项所述的小鼠细胞的方法,所述方法包括将所述小鼠或小鼠细胞的基因组修饰为包含
所述未重排的TCR可变区序列和所述未重排的TCR可变区序列两者。
34.如权利要求33所述的方法,其中所述方法包括用包含所述至少一个未重排的人T细胞可变区Dβ区段、小鼠TCRBD-TCRBJ非编码核酸序列和所述至少一个未重排的人T细胞可变区Jβ区段的核酸序列置换包含小鼠TCRBD基因区段和小鼠TCRBJ基因区段的邻接小鼠TCRB序列,使得所述至少一个未重排的人T细胞可变区Dβ区段、所述小鼠TCRBD-TCRBJ非编码核酸序列和所述至少一个未重排的人T细胞可变区Jβ区段可操作地连接至所述小鼠TCRβ恒定基因序列。
35.如权利要求34所述的方法,其中所述邻接小鼠TCRB序列包含(a)小鼠TCRBD1基因区段和小鼠TCRBJ1-6基因区段和/或(b)小鼠TCRBD2基因区段和小鼠TCRBJ2-7基因区段,并且
其中所述核酸包含:
(C)人源化TCRBDJ1簇,所述人源化TCRBDJ1簇包含未重排的人TCRBD1基因区段、未重排的人TCRBJ1基因区段和小鼠TCRBDJ1非编码序列,其中所述人源化TCRBDJ1簇包含:
未重排的人TRBJ1-1基因区段、未重排的人TRBJ1-2基因区段,以及介于所述未重排的人TRBJ1-1基因区段和所述未重排的人TRBJ1-2基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-2基因区段、未重排的人TRBJ1-3基因区段,以及介于所述未重排的人TRBJ1-2基因区段和所述未重排的人TRBJ1-3基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-3基因区段、未重排的人TRBJ1-4基因区段,以及介于所述未重排的人TRBJ1-3基因区段和所述未重排的人TRBJ1-4基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-4基因区段、未重排的人TRBJ1-5基因区段,以及介于所述未重排的人TRBJ1-4基因区段和所述未重排的人TRBJ1-5基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-5基因区段、未重排的人TRBJ1-6基因区段,以及介于所述未重排的人TRBJ1-5基因区段和所述未重排的人TRBJ1-6基因区段之间的小鼠TCRB非编码序列,或
未重排的人TRBJ1-1基因区段、未重排的人TRBJ1-2基因区段、未重排的人TRBJ1-3基因区段、未重排的人TRBJ1-4基因区段、未重排的人TRBJ1-5基因区段和未重排的人TRBJ1-6基因区段的任何组合,其中所述人源化TCRBDJ1簇包含介于所述未重排的人TCRBD1基因区段和任何未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列以及介于任何两个连续的未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列,任选地其中所述未重排的人TCRBD1和TCRBJ1基因区段位于相同的小鼠TCRBDJ1非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段;和/或
(D)人源化TCRBDJ2簇,所述人源化TCRBDJ2簇包含未重排的人TCRBD2基因区段、未重排的人TCRBJ2基因区段和小鼠TCRBDJ2非编码序列,其中所述人源化TCRBDJ2簇包含:
未重排的人TRBJ2-1基因区段、未重排的人TRBJ2-2基因区段,以及介于所述未重排的人TRBJ2-1基因区段和所述
未重排的人TRBJ2-2基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-2基因区段、未重排的人TRBJ2-3基因区段,以及介于所述未重排的人TRBJ2-2基因区段和所述未重排的人TRBJ2-3基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-3基因区段、未重排的人TRBJ2-4基因区段,以及介于所述未重排的人TRBJ2-3基因区段和所述未重排的人TRBJ2-4基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-4基因区段、未重排的人TRBJ2-5基因区段,以及介于所述未重排的人TRBJ2-4基因区段和所述未重排的人TRBJ2-5基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-5基因区段、未重排的人TRBJ2-6基因区段,以及介于所述未重排的人TRBJ2-5基因区段和所述未重排的人TRBJ2-6基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-6基因区段、未重排的人TRBJ2-7基因区段,以及介于所述未重排的人TRBJ2-6基因区段和所述未重排的人TRBJ27基因区段之间的小鼠TCRB非编码序列,或
未重排的人TRBJ2-1基因区段、未重排的人TRBJ2-2基因区段、未重排的人TRBJ2-3基因区段、未重排的人TRBJ2-4基因区段、未重排的人TRBJ2-5基因区段、未重排的人TRBJ2-6基因区段和未重排的人TRBJ2-7基因区段的任何组合,其中所述人源化TCRBDJ2簇包含介于所述未重排的人TCRBD2基因区段和任何未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列以及介于任何两个连续的未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列,任选地其中所述未重排的人TCRBD2和TCRBJ2基因区段位于相同的小鼠TCRBDJ2非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段。
36.如权利要求33-35中任一项所述的方法,所述方法还包括将所述小鼠或所述小鼠细胞的基因组修饰为包含:
(a)编码所述嵌合CD4辅助受体的所述第一核苷酸序列;
(b)编码所述嵌合CD8α多肽的所述第二核苷酸序列和编码所述嵌合CD8β多肽的所述第三核苷酸序列;
(c)编码所述嵌合MHC IIα多肽的所述第一核酸序列和编码所述嵌合MHC IIβ多肽的所述第二核酸序列;
(d)编码所述嵌合MHC I多肽的所述第三核酸序列;以及
(e)任选地,编码人或人源化2微球蛋白多肽的2微球蛋白基因座。
37.如权利要求36所述的方法,其中所述修饰基因组包括在一个或多个小鼠ES细胞中进行同源重组,使得所述第一核苷酸序列、第二核苷酸序列和第三核苷酸序列;所述未重排的人TCR可变区序列和未重排的TCR可变区序列;所述第一核酸序列、第二核酸序列和第三核酸序列;和任选地微球蛋白基因座;以任何顺序添加到所述一个或多个小鼠ES细胞的基因组中。
38.如权利要求37所述的方法,所述方法还包括从所述一个或多个小鼠ES细胞产生小鼠。
39.一种获得以下任一种的方法:(1)对抗原具有特异性并且包含人TCR可变结构域的TCR蛋白,(2)所述人TCR可变结构域和(3)编码所述人TCR可变结构域的核酸序列,
所述方法包括
从根据权利要求1-32中任一项所述的小鼠中分离以下任一种:
(1)表达TCR蛋白的T细胞,所述TCR蛋白对抗原具有特异性并且包含人TCRα可变结构域和人TCRβ可变结构域,
(2)(i)所述人TCRα可变结构域和(ii)所述人TCRβ可变结构域中的任一者或两者,以及
(3)(i)编码所述人TCR可变结构域的核酸序列和(ii)编码所述人TCR可变结构域的核酸序列中的任一者或两者。
40.如权利要求39所述的方法,其中所述方法包括从所述小鼠中分离编码所述人TCR可变结构域的所述核酸序列和编码所述人TCR可变结构域的所述核酸序列,所述方法还包括
在足以表达以下核酸序列的条件下培养宿主细胞:(i)编码与人TCR 恒定区可操作连接的所述人TCR可变结构域的所述核酸序列,(ii)编码与人TCR恒定区可操作连接的所述人TCR可变结构域的所述核酸序列,
其中编码所述人TCR可变结构域和所述人TCR可变结构域的所述核酸序列处于相同或不同的表达载体上。
41.如权利要求39或权利要求40所述的方法,其中所述抗原是肿瘤抗原、病毒抗原或细菌抗原。
42.一种表达TCR蛋白的T细胞,所述TCR蛋白包含如权利要求39-41中任一项所述的方法获得的对抗原具有特异性的人TCR可变结构域。
43.一种由表达TCR蛋白的所述T细胞产生的杂交瘤,所述TCR蛋白包含如权利要求39-42中任一项所述的方法获得的对抗原具有特异性的人TCR可变结构域。
44.一种根据如权利要求39-43中任一项所述的方法获得的人T细胞受体可变结构域。
45.一种核酸,所述核酸包含根据如权利要求39-44中任一项所述的方法分离的(i)编码所述人TCRα可变结构域的所述核酸序列和(ii)编码所述人TCR可变结构域的所述核酸序列中的任一者或两者。
46.一种宿主细胞,所述宿主细胞包含如权利要求45所述的核酸。
47.一种表达载体,所述表达载体包含如权利要求45所述的核酸。
48.如权利要求47所述的表达载体,其中所述表达载体包含以下的至少一种:(a)可操作地连接至编码人TCR恒定区的序列的编码人TCR可变结构域的所述核酸序列,和(b)可操作地连接至编码人TCR恒定区的序列的编码所述人TCR可变结构域的所述核酸序列。
49.如权利要求1-7、9、12、14-23、25和27-30及32中任一项所述的小鼠细胞,其中所述小鼠细胞是胚胎干细胞。
50.如权利要求49所述的基因修饰的小鼠胚胎干细胞,所述基因修饰的小鼠胚胎干细胞在其基因组中包含:
(a)编码嵌合CD4辅助受体的第一核苷酸序列,所述辅助受体包含人CD4多肽的D1、D2和D3结构域以及小鼠CD4多肽的跨膜结构域和胞质结构域,
(b)分别编码嵌合CD8多肽和嵌合CD8多肽的第二核苷酸序列和第三核苷酸序列,
其中所述嵌合CD8多肽包含人CD8多肽的IgV样结构域和小鼠CD8多肽的跨膜结构域和胞质结构域,
其中所述嵌合CD8多肽包含人CD8多肽的IgV样结构域和小鼠CD8多肽的跨膜结构域和胞质结构域,以及
(c)分别编码嵌合MHC II多肽和嵌合MHC II多肽的第一核酸序列和第二核酸序列,
其中所述嵌合MHC II多肽包含人HLA II类多肽的α1和α2结构域以及非人MHC II多肽的跨膜结构域和胞质结构域,
其中所述嵌合MHCII多肽包含人HLAII类多肽的β1和β2结构域以及小鼠MHC II多肽的跨膜结构域和胞质结构域,
(d)编码嵌合MHC I多肽的第三核酸序列;
其中所述嵌合MHC I多肽包含人HLA I类多肽的α1、α2和α3结构域以及小鼠MHC I多肽的跨膜结构域和胞质结构域,以及
(e)未重排的人T细胞受体(TCR)可变区序列,所述未重排的人TCR可变区序列包含至少一个人V区段和至少一个人J区段,所述未重排的人TCR可变区序列可操作地连接至小鼠TCR恒定区序列;和未重排的TCR可变区序列,所述未重排的TCR可变区序列包含至少一个人V区段、至少一个人D区段和至少一个人J区段,所述未重排的TCR可变区序列可操作地连接至小鼠TCR恒定区序列,其中所述未重排的TCR可变区序列包含小鼠TCRB非编码序列,所述小鼠TCRB非编码序列包含:
TCRBDJ1非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD1区段和TRBJ1区段之间和/或在任何两个连续的未重排的TRBJ1区段之间发现的其他非编码基因间序列的连续非编码序列,和/或
TCRBDJ2非编码序列,例如包含非编码重组信号序列(RSS)和在未重排的TRBD2区段和TRBJ2区段之间和/或在任何两个连续的未重排的TRBJ2区段之间发现的其他非编码基因间序列的连续非编码序列。
51.如权利要求50所述的基因修饰的小鼠胚胎干细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处;
(b)所述第二核苷酸序列存在于内源CD8 T细胞辅助受体基因座处并且所述第三核苷酸序列存在于内源CD8 T细胞辅助受体基因座处;
(c)所述第一核酸序列存在于内源MHC II基因座处并且所述第二核酸序列存在于内源MHC II基因座处;
(d)所述第三核酸序列存在于内源MHC I基因座处;和/或
(e)所述未重排的人TCR可变区序列存在于内源TCR可变区基因座处并且所述未重排的TCR可变区序列存在于内源TCR可变区基因座处。
52.如权利要求50或权利要求51所述的基因修饰的小鼠胚胎干细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处并且可操作地连接至内源CD4辅助受体启动子和调控元件;
(b)所述第二核苷酸序列存在于内源CD8 T细胞辅助受体基因座处并且可操作地连接至内源CD8多肽启动子和调控元件,并且所述第三核苷酸序列存在于内源CD8β基因座处可操作地连接至内源CD8多肽启动子和调控元件;
(c)所述第一核酸序列存在于内源MHC II基因座处可操作地连接至内源MHCII启动子和调控元件,并且所述第二核酸序列存在于内源MHC IIβ基因座处并且可操作地连接至内源非人MHC II启动子和调控元件;
(d)所述第三核酸序列存在于内源MHC I基因座处可操作地连接至内源MHC I启动子和调控元件;和/或
(e)所述未重排的TCR可变区序列可操作地连接至内源TCR调控元件并且所述未重排的TCR可变区序列可操作地连接至内源TCR调控元件。
53.如权利要求50-52中任一项所述的基因修饰的小鼠胚胎干细胞,其中所述第一核苷酸序列编码所述嵌合CD4辅助受体,所述嵌合CD4辅助受体包含所述人CD4多肽的D1、D2和D3结构域,可操作地连接至内源CD4多肽的D4结构域、跨膜结构域和胞质结构域,
(b)所述第二核苷酸序列编码所述嵌合CD8多肽,所述嵌合CD8多肽包含可操作地连接至内源CD8多肽的跨膜结构域和胞质结构域的所述人CD8多肽的所述IgV样结构域,并且所述第三核苷酸序列编码所述嵌合CD8多肽,所述嵌合CD8多肽包含可操作地连接至内源CD8多肽的跨膜结构域和胞质结构域的所述人CD8多肽的所述IgV样结构域;
(c)所述第一核酸序列编码所述嵌合MHC II多肽,所述嵌合MHC II多肽包含可操作地连接至内源MHC II多肽的跨膜结构域和胞质结构域的人HLA II类1和2结构域,并且所述第二核酸序列编码所述嵌合MHC II多肽,所述嵌合MHC II多肽包含可操作地连接至内源MHCII多肽的跨膜结构域和胞质结构域的人HLA II类1和2结构域;和/或
(d)所述第三核酸序列编码所述嵌合MHC I多肽,所述嵌合MHC I多肽包含可操作地连接至内源MHC I多肽的跨膜结构域和胞质结构域的人HLA I类1、2和3结构域。
54.一种通过如权利要求33-38中任一项所述的方法制备的小鼠胚胎干(ES)细胞。
55.一种靶向载体,所述靶向载体包含用于靶向小鼠TCRBDJ区、未重排的人TCRBD区段、未重排的人TCRBJ区段和小鼠TRCBDJ非编码序列的5’同源臂和3’同源臂,
其中靶向载体包含介于所述未重排的人TCRBD区段和任何未重排的人TCRBJ基因区段之间以及介于任何两个连续的未重排的人TCRBJ基因区段之间的小鼠TCRBDJ非编码序列,任选地其中所述未重排的人TCRBD和TCRBJ基因区段位于相同的小鼠TCRBDJ非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj基因区段。
56.如权利要求55所述的靶向载体,其中
(A)所述未重排的人TCRBD区段包含在7号染色体(GRCh38组件)上的下列人类基因组坐标所示的序列:
142,786,213-142,786,224和/或
142,796,365-142,796,414;
(B)所述未重排的人TCRBJ区段包含在7号染色体(GRCh38组件)上的下列人类基因组坐标所示的序列:
142,786,880-142,786,927,
142,787,017-142,787,064,
142,787,630-142,787,679,
142,788,225-142,788,275,
142,788,498-142,788,547,
142,788,988-142,789,040,
142,795,686-142,795,740,
142,796,560-142,796,610,
142,796,847-142,796,895,
142,796,998-142,797,047,
142,797,119-142,797,166,
142,797,239-142,797,291和/或
142,797,456-142,797,502。
57.一种小鼠基因组或小鼠细胞,所述小鼠基因组或小鼠细胞包含如权利要求55或权利要求56所述的靶向载体。
Claims (57)
1.一种小鼠或一种分离的小鼠细胞,所述小鼠或所述分离的小鼠细胞包含:
(A)未重排的T细胞受体(TCR)α可变区序列,所述未重排的TCRα可变区序列包含至少一个未重排的人T细胞可变区Vα区段和至少一个未重排的人T细胞可变区Jα区段,所述未重排的TCRα可变区序列可操作地连接至小鼠TCRα恒定基因序列,任选地连接到内源小鼠TCRα可变基因的基因座处,其中所述未重排的TCRα可变区序列包含小鼠TCRA非编码序列,或
(B)未重排的TCRβ可变区序列,所述未重排的TCRβ可变区序列包含至少一个未重排的人T细胞可变区Vβ区段、至少一个未重排的人T细胞可变区Dβ区段和至少一个未重排的人T细胞可变区Jβ区段,所述未重排的TCRβ可变区序列可操作地连接至小鼠TCRβ恒定基因序列,任选地连接到内源小鼠TCRβ可变基因的基因座处,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列,或
(C)(i)未重排的T细胞受体(TCR)α可变区序列,所述未重排的TCRα可变区序列包含至少一个未重排的人T细胞可变区Vα区段和至少一个未重排的人T细胞可变区Jα区段,所述未重排的TCRα可变区序列可操作地连接至小鼠TCRα恒定基因序列,任选地连接到内源小鼠TCRα可变基因的基因座处,其中所述未重排的TCRα可变区序列包含小鼠TCRA非编码序列,以及
(ii)未重排的TCRβ可变区序列,所述未重排的TCRβ可变区序列包含至少一个未重排的人T细胞可变区Vβ区段、至少一个未重排的人T细胞可变区Dβ区段和至少一个未重排的人T细胞可变区Jβ区段,所述未重排的TCRβ可变区序列可操作地连接至小鼠TCRβ恒定基因序列,任选地连接到内源小鼠TCRβ可变基因的基因座处,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列,
其中所述未重排的人T细胞可变区区段能够在T细胞中重排以形成编码特异性结合目标抗原的人T细胞受体可变结构域的基因。
2.如权利要求1所述的小鼠或分离的小鼠细胞,其中:
(A)所述至少一个未重排的人T细胞可变区Vα区段构成未重排的人T细胞可变区Vα区段组库,并且所述至少一个未重排的人T细胞可变区Jα区段构成未重排的人T细胞可变区Jα基因区段组库,或
(B)所述至少一个未重排的人T细胞可变区Vβ区段构成未重排的人Vβ区段组库,所述至少一个未重排的人T细胞可变区Dβ区段构成未重排的人Dβ区段组库,并且所述至少一个未重排的人T细胞可变区Jβ区段构成未重排的人Jβ基因区段组库,或
(C)(i)所述至少一个未重排的人T细胞可变区Vα区段构成未重排的人T细胞可变区Vα区段组库,所述至少一个未重排的人T细胞可变区Jα区段构成未重排的人T细胞可变区Jα基因区段组库,
(ii)所述至少一个未重排的人T细胞可变区Vβ区段构成未重排的人Vβ区段组库,所述至少一个未重排的人T细胞可变区Dβ区段包括未重排的人T细胞可变区Dβ1区段和未重排的人T细胞可变区Dβ2区段,并且所述至少一个未重排的人T细胞可变区Jβ区段包括至少一个未重排的人T细胞可变区Jβ1区段和至少一个未重排的人T细胞可变区Jβ2区段,
其中所述小鼠TCRB非编码序列包含(i)介于所述至少一个未重排的人T细胞可变区Dβ1区段和所述至少一个未重排的人T细胞可变区Jβ1区段之间的小鼠TCRBD1-TCRBJ1非编码核酸序列,和(ii)介于所述至少一个未重排的人T细胞可变区Dβ2区段和所述至少一个未重排的人T细胞可变区Jβ2区段之间的小鼠TCRBD2-TCRBJ2非编码核酸序列。
3.如权利要求1或权利要求2所述的小鼠或分离的小鼠细胞,其中:
(I)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vα基因区段的缺失,
(b)所有内源TCR Jα基因区段的缺失,和
(c)它们的组合,或
(II)所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vβ基因区段的缺失,
(b)所有内源TCR Dβ基因区段的缺失,
(c)所有内源TCR Jβ基因区段的缺失,和
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vα基因区段的缺失,
(b)所有内源TCR Jα基因区段的缺失,和
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的缺失:
(a)所有内源TCR Vβ基因区段的缺失,
(b)所有内源TCR Dβ基因区段的缺失,
(c)所有内源TCR Jβ基因区段的缺失,和
(d)它们的组合。
4.如权利要求1-3中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,
(b)至少一个内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,和
(c)它们的组合,或
(II)所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,
(b)至少一个内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ区段置换,
(c)至少一个内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,和
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,
(b)至少一个内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,和
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含选自由以下项组成的组的置换:
(a)至少一个内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,
(b)至少一个内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ区段置换,
(c)至少一个内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,和
(d)它们的组合。
5.如权利要求1-4中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vα基因区段包括从TRAV1-1至TRAV41的多个或所有未重排的人T细胞可变区Vα基因区段,
(b)所有内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jα区段包括从TRAJ1至TRAJ61的多个或所有未重排的人T细胞可变区Jα基因区段,或
(c)它们的组合,
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vβ基因区段包括从TRBV1至TRBV29-1的多个或所有未重排的人T细胞可变区Vβ基因区段,
(b)所有内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Dβ基因区段包含未重排的人T细胞可变区Dβ1基因区段和/或未重排的人T细胞可变区Dβ2基因区段,
(c)所有内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jβ区段包括从TRBJ1-1至TRBJ1-6的多个或所有未重排的人Jβ区段,或从TRBJ2-1至TRBJ2-7的多个或所有未重排的人Jβ区段,或
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被所述至少一个未重排的人T细胞可变区Vα基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vα基因区段包括从TRAV1-1至TRAV41的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Jα基因区段被所述至少一个未重排的人T细胞可变区Jα区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jα区段包括从TRAJ1至TRAJ61的多个或所有未重排的人T细胞可变区基因区段,或
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被所述至少一个未重排的人T细胞可变区Vβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Vβ基因区段包括从TRBV1至TRBV29-1的多个或所有未重排的人T细胞可变区基因区段,
(b)所有内源T细胞可变区Dβ基因区段被所述至少一个未重排的人T细胞可变区Dβ基因区段置换,任选地其中所述至少一个未重排的人T细胞可变区Dβ基因区段包含未重排的人T细胞可变区Dβ1基因区段和/或未重排的人T细胞可变区Dβ2基因区段,
(c)所有内源T细胞可变区Jβ基因区段被所述至少一个未重排的人T细胞可变区Jβ区段置换,任选地其中所述至少一个未重排的人T细胞可变区Jβ区段包括从TRBJ1-1至TRBJ1-6的多个或所有未重排的人Jβ区段,或从TRBJ2-1至TRBJ2-7的多个或所有未重排的人Jβ区段,或
(d)它们的组合。
6.如权利要求1-5中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区Vα基因区段置换,
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区Jα基因区段置换,或
(c)它们的组合,
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区Vβ基因区段置换,
(b)内源T细胞可变区Dβ1基因区段被未重排的人T细胞可变区Dβ1基因区段置换,并且内源T细胞可变区Dβ2基因区段被未重排的人T细胞可变区Dβ2基因区段置换,
(c)以下置换:
内源TRBJ1-1基因区段被未重排的人TRBJ1-1基因区段置换,
内源TRBJ1-2基因区段被未重排的人TRBJ1-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-1区段和小鼠TRBJ1-2区段之间发现的小鼠非编码序列,
内源TRBJ1-3基因区段被未重排的人TRBJ1-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-2区段和小鼠TRBJ1-3区段之间发现的小鼠非编码序列,
内源TRBJ1-4基因区段被未重排的人TRBJ1-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-3区段和小鼠TRBJ1-4区段之间发现的小鼠非编码序列,
内源TRBJ1-5基因区段被未重排的人TRBJ1-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-4区段和小鼠TRBJ1-5区段之间发现的小鼠非编码序列,
内源TRBJ1-6基因区段被未重排的人TRBJ1-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-5区段和小鼠TRBJ1-6区段之间发现的小鼠非编码序列,
内源TRBJ2-1基因区段被未重排的人TRBJ2-1基因区段置换,
内源TRBJ2-2基因区段被未重排的人TRBJ2-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-1区段和小鼠TRBJ2-2区段之间发现的小鼠非编码序列,
内源TRBJ2-3基因区段被未重排的人TRBJ2-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-2区段和小鼠TRBJ2-3区段之间发现的小鼠非编码序列,
内源TRBJ2-4基因区段被未重排的人TRBJ2-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-3区段和小鼠TRBJ2-4区段之间发现的小鼠非编码序列,
内源TRBJ2-5基因区段被未重排的人TRBJ2-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-4区段和小鼠TRBJ2-5区段之间发现的小鼠非编码序列,
内源TRBJ2-6基因区段被未重排的人TRBJ2-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-5区段和小鼠TRBJ2-6区段之间发现的小鼠非编码序列,以及
内源TRBJ2-7基因区段被未重排的人TRBJ2-7基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-6区段和小鼠TRBJ2-7区段之间发现的小鼠非编码序列,或
(d)它们的结合,或
(III)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区Vα基因区段置换,
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区Jα基因区段置换,或
(c)它们的组合,以及
所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区Vβ基因区段置换,
(b)内源T细胞可变区Dβ1基因区段被未重排的人T细胞可变区Dβ1基因区段置换,并且内源T细胞可变区Dβ2基因区段被未重排的人T细胞可变区Dβ2基因区段置换,
(c)以下置换:
内源TRBJ1-1基因区段被未重排的人TRBJ1-1基因区段置换,
内源TRBJ1-2基因区段被未重排的人TRBJ1-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-1区段和小鼠TRBJ1-2区段之间发现的小鼠非编码序列,
内源TRBJ1-3基因区段被未重排的人TRBJ1-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-2区段和小鼠TRBJ1-3区段之间发现的小鼠非编码序列,
内源TRBJ1-4基因区段被未重排的人TRBJ1-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-3区段和小鼠TRBJ1-4区段之间发现的小鼠非编码序列,
内源TRBJ1-5基因区段被未重排的人TRBJ1-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-4区段和小鼠TRBJ1-5区段之间发现的小鼠非编码序列,
内源TRBJ1-6基因区段被未重排的人TRBJ1-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ1-5区段和小鼠TRBJ1-6区段之间发现的小鼠非编码序列,
内源TRBJ2-1基因区段被未重排的人TRBJ2-1基因区段置换,
内源TRBJ2-2基因区段被未重排的人TRBJ2-2基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-1区段和小鼠TRBJ2-2区段之间发现的小鼠非编码序列,
内源TRBJ2-3基因区段被未重排的人TRBJ2-3基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-2区段和小鼠TRBJ2-3区段之间发现的小鼠非编码序列,
内源TRBJ2-4基因区段被未重排的人TRBJ2-4基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-3区段和小鼠TRBJ2-4区段之间发现的小鼠非编码序列,
内源TRBJ2-5基因区段被未重排的人TRBJ2-5基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-4区段和小鼠TRBJ2-5区段之间发现的小鼠非编码序列,
内源TRBJ2-6基因区段被未重排的人TRBJ2-6基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-5区段和小鼠TRBJ2-6区段之间发现的小鼠非编码序列,以及
内源TRBJ2-7基因区段被未重排的人TRBJ2-7基因区段置换,任选地其中所述小鼠TCRB非编码序列包含在小鼠TRBJ2-6区段和小鼠TRBJ2-7区段之间发现的小鼠非编码序列,或
(d)它们的组合。
7.根据前述权利要求中任一项所述的小鼠或分离的小鼠细胞,其中
(I)所述内源小鼠TCRα可变基因的基因座包含:
(a)所有内源T细胞可变区Vα基因区段被TRAV1-1至TRAV41的所有未重排的人T细胞可变区Vα基因区段置换,以及
(b)所有内源T细胞可变区Jα基因区段被TRAJ1至TRAJ61的所有未重排的人T细胞可变区Jα基因区段置换;并且
(II)所述内源小鼠TCRβ可变基因的基因座包含:
(a)所有邻接内源T细胞可变区Vβ基因区段被TRBV1至TRBV29-1的所有未重排的人T细胞可变区Vβ基因区段置换,
(b)(i)内源tcrbdj1簇被包含未重排的人TCRBD1区段的人源化TCRBDJ1簇置换,和(ii)未重排的人TCRBJ1-1区段、未重排的人TCRBJ1-2区段、未重排的人TCCRBJ1-3区段、未重排的人TCRBJ1-4区段、未重排的人TCRBJ1-5区段和未重排的人TCRBJ1-6区段中的每一个,
其中所述人源化TCRBDJ1簇包含介于所述未重排的人TCRBD1区段和所述未重排的人TCRBJ1-1区段之间的小鼠TCRBDJ1非编码序列,以及介于任何两个连续的未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列,任选地其中所述未重排的人TCRBD1和TCRBJ1基因区段位于相同的小鼠TCRBDJ1非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段,并且
(c)(i)内源tcrbdj2簇被包含未重排的人TCRBD2区段的人源化TCRBDJ2簇置换,和(ii)未重排的人TRBJ2-1区段、未重排的人TRBJ2-2区段、未重排的人TCRBJ2-3区段、未重排的人TCRBJ2-4区段、未重排的人TCRBJ2-5区段、未重排的人TCRBJ2-6区段和未重排的人TCRBJ2-7区段中的每一个,
其中所述人源化TCRBDJ2簇包含介于所述未重排的人TCRBD2区段和任何未重排的人TCRBJ2区段之间的小鼠TCRBDJ2非编码序列,以及介于任何两个连续的未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列,任选地其中所述未重排的人TCRBD2和TCRBJ2基因区段位于相同的小鼠TCRBDJ2非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj2基因区段。
8.根据前述权利要求中任一项所述的小鼠,其中所述未重排的TCRα可变区序列处于种系基因组中,和/或所述未重排的TCRβ可变区序列处于所述种系基因组中。
9.如前述权利要求中任一项所述的小鼠或如权利要求1-7中任一项所述的小鼠细胞,其中所述TCRα可变区序列可操作地连接至内源TCRα调控元件,和/或所述TCRβ可变区序列可操作地连接至内源TCRβ调控元件。
10.根据前述权利要求中任一项所述的小鼠,其中所述小鼠在T细胞表面表达T细胞受体,所述T细胞受体包含人源化TCRα链和人源化TCRβ链,
其中所述人源化TCRα链由可操作地连接至所述小鼠TCRα恒定区序列的重排的人Vα/Jα序列编码,其中所述重排的人Vα/Jα序列通过所述至少一个人T细胞可变区Vα区段和至少一个人T细胞可变区Jα区段的重排形成,
其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ/Jβ序列编码,其中所述重排的人Vβ/Dβ/Jβ序列通过所述至少一个人T细胞可变区Vβ区段、至少一个T细胞可变区Dβ区段和至少一个人T细胞可变区Jβ区段的重排形成,任选地其中所述TCRβ链由重排的Vβ/Dβ2/Jβ2序列编码。
11.根据前述权利要求中任一项所述的小鼠,其中所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ1簇的基因区段,并且所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ2簇的基因区段。
12.一种小鼠或分离的小鼠细胞,所述小鼠或分离的小鼠细胞在其基因组中包含:
(a)编码嵌合人/小鼠CD4辅助受体的第一核苷酸序列,所述辅助受体包含人CD4多肽的D1、D2和D3结构域以及小鼠CD4多肽的跨膜结构域和胞质结构域;
(b)编码嵌合人/小鼠CD8α多肽的第二核苷酸序列和编码嵌合人/小鼠CD8β多肽,的第三核苷酸序列,
其中所述嵌合人/小鼠CD8α多肽包含人CD8α多肽的IgV样结构域和小鼠CD8α多肽的跨膜结构域和胞质结构域,
其中所述嵌合人/小鼠CD8β多肽包含人CD8β多肽的IgV样结构域和小鼠CD8β多肽的跨膜结构域和胞质结构域;
(c)编码嵌合人/小鼠MHC IIα多肽的第一核酸序列和编码嵌合人/小鼠MHC IIβ多肽的第二核酸序列,
其中所述嵌合人/小鼠MHC IIα多肽包含人HLA II类α多肽的α1和α2结构域以及小鼠MHC IIα多肽的跨膜结构域和胞质结构域,
其中所述嵌合人/小鼠MHC IIβ多肽包含人HLA II类β多肽的β1和β2结构域以及小鼠MHC IIβ多肽的跨膜结构域和胞质结构域;
(d)编码嵌合人/小鼠MHC I多肽的第三核酸序列,
其中所述嵌合MHC I多肽包含人HLA I类多肽的α1结构域、α2结构域和α3结构域以及小鼠MHC I多肽的跨膜结构域和胞质结构域;以及
(e)未重排的人TCRα可变区序列,所述未重排的人TCR可变区序列包含至少一个人Vα区段和至少一个人Jα区段,所述未重排的人TCR可变区序列可操作地连接至小鼠TCRα恒定区序列;和未重排的TCRβ可变区序列,所述未重排的TCR可变区序列包含所述至少一个人Vβ区段、所述至少一个人Dβ区段和所述至少一个人Jβ区段,所述未重排的TCR可变区序列可操作地连接至小鼠TCRβ恒定区序列,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列,
任选地其中所述小鼠表达:
(A)所述嵌合人/小鼠CD4辅助受体,
(B)包含所述嵌合人/小鼠CD8α多肽和所述嵌合人/小鼠CD8β多肽的嵌合CD8辅助受体,
(C)嵌合MHC II复合物,所述嵌合MHC II复合物包含所述嵌合人/小鼠MHC IIα多肽和所述嵌合人/小鼠MHC IIβ多肽,其中所述嵌合MHC II复合物能够结合所述嵌合人/小鼠CD4辅助受体,和
(D)所述嵌合人/小鼠MHC I多肽,其中所述嵌合MHC I多肽能够结合所述嵌合CD8辅助受体,和
(E)T细胞表面上的T细胞受体,所述T细胞受体包含人源化TCRα链和人源化TCRβ链,
其中所述人源化TCRα链由可操作地连接至所述小鼠TCRα恒定区序列的重排的人Vα/Jα序列编码,其中所述重排的人Vα/Jα序列通过包含至少一个人Vα区段和至少一个人Jα区段的所述未重排的人TCRα可变区序列的重排形成,
其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ/Jβ序列编码,其中所述重排的人Vβ/Dβ/Jβ序列通过包含至少一个人Vβ区段、至少一个Dβ区段和至少一个人Jβ区段的所述未重排的TCRβ可变区序列的重排形成。
13.如权利要求12所述的小鼠,所述小鼠在其种系基因组中包含:
(a)编码所述嵌合人/小鼠CD4辅助受体的所述第一核苷酸序列;
(b)编码所述嵌合人/小鼠CD8α多肽的所述第二核苷酸序列和编码所述嵌合人/小鼠CD8β多肽的所述第三核苷酸序列;
(c)编码所述嵌合人/小鼠MHC IIα多肽的所述第一核酸序列和编码所述嵌合人/小鼠MHC IIβ多肽的所述第二核酸序列;
(d)编码所述嵌合人/小鼠MHC I多肽的所述第三核酸序列;以及
(e)可操作地连接至小鼠TCRα恒定区序列的所述未重排的人TCRα可变区序列和可操作地连接至小鼠TCRβ恒定区序列的所述未重排的TCRβ可变区序列。
14.如权利要求12或权利要求13所述的小鼠,或如权利要求12所述的小鼠细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处;
(b)所述第二核苷酸序列存在于内源CD8αT细胞辅助受体基因座处并且所述第三核苷酸序列存在于内源CD8βT细胞辅助受体基因座处;
(c)所述第一核酸序列存在于内源MHC IIα基因座处并且所述第二核酸序列存在于内源MHC IIβ基因座处;
(d)所述第三核酸序列存在于内源MHC I基因座处;或者
(e)所述未重排的人TCRα可变区序列存在于内源TCRα可变区基因座处并且所述未重排的TCRβ可变区序列存在于内源TCRβ可变区基因座处,或
(f)(a)-(e)的任何组合。
15.如权利要求12-14中任一项所述的小鼠或如权利要求12或权利要求14所述的分离的小鼠细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处并且可操作地连接至内源CD4辅助受体启动子和调控元件;
(b)所述第二核苷酸序列存在于内源CD8αT细胞辅助受体基因座处并且可操作地连接至内源CD8α多肽启动子和调控元件,并且所述第三核苷酸序列存在于内源CD8βT细胞辅助受体基因座处并且可操作地连接至内源CD8β多肽启动子和调控元件;
(c)所述第一核酸序列存在于内源MHC IIα基因座处并且可操作地连接至内源MHC IIα启动子和调控元件,并且所述第二核酸序列存在于内源MHC IIβ基因座处并且可操作地连接至内源MHC IIβ启动子和调控元件;
(d)所述第三核酸序列存在于内源MHC I基因座处并且可操作地连接至内源MHC I启动子和调控元件;
(e)所述未重排的人TCRα可变区序列存在于内源TCRα可变区基因座处并且可操作地连接至内源TCRα调控元件,并且所述未重排的TCRβ可变区序列可操作地连接至内源TCRβ调控元件;或者
(f)(a)-(e)的任何组合。
16.如权利要求12-15中任一项所述的小鼠或如权利要求12、14-15中任一项所述的分离的小鼠细胞,其中
(a)所述嵌合人/小鼠CD4辅助受体包含所述人CD4多肽的D1、D2和D3结构域,可操作地连接至内源CD4多肽的D4结构域、跨膜结构域和胞质结构域,
(b)所述嵌合人/小鼠CD8α多肽包含可操作地连接至内源CD8α多肽的跨膜结构域和胞质结构域的所述人CD8α多肽的所述IgV样结构域,并且所述嵌合CD8β多肽包含可操作地连接至内源CD8β多肽的跨膜结构域和胞质结构域的所述人CD8β多肽的所述IgV样结构域;
(c)所述嵌合人/小鼠MHC IIα多肽包含可操作地连接至内源MHC IIα多肽的跨膜结构域和胞质结构域的人HLA II类α1和α2结构域,并且所述嵌合MHC IIβ多肽包含可操作地连接至内源MHC IIβ多肽的跨膜结构域和胞质结构域的人HLA II类β1和β2结构域;
(d)所述嵌合人/小鼠MHC I多肽包含可操作地连接至内源MHC I多肽的跨膜结构域和胞质结构域的人HLA I类α1、α2和α3结构域,或
(e)(a)-(d)的任何组合。
17.如权利要求12-16中任一项所述的小鼠或如权利要求12和14-16中任一项所述的分离的小鼠细胞,其中
(a)所述人HLA II类α多肽的所述α1和α2结构域由选自由HLA-DR、HLA-DQ和HLA-DP的任何α链基因组成的组的HLA II类基因编码;
(b)所述人HLA II类β多肽的所述β1和β2结构域由选自由HLA-DR、HLA-DQ和HLA-DP的任何β链基因组成的组的HLA II类基因编码;
(c)所述人HLA I类多肽的所述α1结构域、α2结构域和α3结构域由人HLA-A基因、人HLA-B基因或人HLA-C基因编码;或者
(d)(a)-(c)的任何组合。
18.如权利要求12-17中任一项所述的小鼠或如权利要求12和14-17中任一项所述的分离的小鼠细胞,其中所述人HLA II类α多肽的所述α1和α2结构域由HLA-DR的所述α链基因编码,并且所述人HLA II类β多肽的所述β1和β2结构域由HLA-DR的所述β链基因编码,并且
其中所述人HLA I类多肽的所述α1结构域、α2结构域和α3结构域由人HLA-A基因编码。
19.如权利要求12-18中任一项所述的小鼠或如权利要求12和14-18中任一项所述的分离的小鼠细胞,其中所述嵌合MHC II复合物包含人HLA-DR2蛋白的α1、α2、β1,和β2结构域。
20.如权利要求12-19中任一项所述的小鼠或如权利要求12和14-19中任一项所述的分离的小鼠细胞,其中所述嵌合人/小鼠MHC I多肽包含人HLA-A2蛋白的α1、α2和α3结构域。
21.如权利要求12-20中任一项所述的小鼠或如权利要求12和14-20中任一项所述的分离的小鼠细胞,其中
(a)所述未重排的人TCRα可变区序列包含完整的人Vα基因区段组库和完整的人Jα基因区段组库,
(b)所述未重排的TCRβ可变区序列包含完整的人Vβ基因区段组库、完整的人Dβ基因区段组库和完整的人Jβ基因区段组库,或
(c)所述未重排的人TCRα可变区序列包含完整的人Vα基因区段组库和完整的人Jα基因区段组库,并且所述未重排的TCRβ可变区序列包含完整的人Vβ基因区段组库、完整的人Dβ基因区段组库和完整的人Jβ基因区段组库。
22.如权利要求12-21中任一项所述的小鼠或如权利要求12和14-21中任一项所述的分离的小鼠细胞,其中:
(i)内源TCRα可变基因座(a)缺乏所有或基本上所有功能性内源Vα基因区段,(b)缺乏所有或基本上所有功能性内源Jα基因区段,或(c)缺乏所有或基本上所有功能性内源Vα基因区段并且缺乏所有或基本上所有功能性内源Jα基因区段;
(ii)内源TCRβ可变基因座(a)缺乏所有或基本上所有功能性内源Vβ基因区段,(b)缺乏所有或基本上所有功能性内源Dβ基因区段,(c)缺乏所有或基本上所有功能性内源Jβ基因区段,或(d)(a)、(b)和(c)的任何组合;或者
(iii)(i)和(ii)两者。
23.如权利要求12-22中任一项所述的小鼠或如权利要求12和14-22中任一项所述的分离的小鼠细胞,其中
(a)所述第一核苷酸序列包含编码所述人CD4多肽的所述D1、D2和D3结构域的序列,所述序列在内源小鼠CD4基因座处,(i)置换编码内源CD4辅助受体多肽的所述D1、D2和D3结构域的序列,并且(ii)可操作地连接至编码内源CD4 D4结构域、跨膜结构域和胞质结构域的序列;
(b)所述第二核苷酸序列包含编码所述人CD8α多肽的所述IgV样结构域的序列,所述序列在内源CD8α基因座处,(i)置换编码所述内源CD8α多肽的IgV样结构域的序列,并且(ii)可操作地连接至编码内源CD8α跨膜结构域和胞质结构域的序列,并且
所述第三核苷酸序列包含编码所述人CD8β多肽的IgV样结构域的序列,所述序列在内源CD8β基因座处,(i)置换编码内源CD8β多肽的IgV样结构域的序列,并且(ii)可操作地连接至编码内源CD8β跨膜结构域和胞质结构域的序列;
(c)所述第一核酸序列包含编码所述人HLA II类α多肽的所述α1和α2结构域的序列,所述序列在内源MHC IIα基因座处,(i)置换编码内源MHC IIα多肽的α1和α2结构域的序列并且(ii)可操作地连接至编码内源MHC IIα多肽跨膜结构域和胞质结构域的序列,并且
所述第二核酸包含编码所述人HLA II类β多肽的所述β1和β2结构域的序列,所述序列在内源MHC IIβ基因座处,(i)置换编码内源MHC IIβ多肽的β1和β2结构域的序列并且(ii)可操作地连接至编码内源MHC IIβ多肽跨膜结构域和胞质结构域的序列;
(d)所述第三核酸序列包含编码所述人HLA I类多肽的所述α1、α2和α3结构域的序列,所述序列在内源MHC I基因座处,(i)置换编码内源MHC I多肽的α1、α2和α3结构域的序列,并且(ii)可操作地连接至编码内源MHC I多肽跨膜结构域和胞质结构域的序列;
(e)所述未重排的人TCRα可变区序列置换内源TCRα可变区基因座处的一个或多个内源Vα和/或Jα基因区段,并且所述未重排的TCRβ可变区序列置换内源TCRβ可变区基因座处的一个或多个内源Vβ、Dβ和/或Jβ基因区段;或者
(f)(a)-(e)的任何组合。
24.如权利要求12-23中任一项所述的小鼠,其中所述小鼠:
(a)不从内源CD4辅助受体基因座表达功能性内源CD4辅助受体;
(b)不从内源CD8辅助受体基因座表达功能性内源CD8辅助受体;
(c)不从内源TCRα基因座表达内源TCRα可变结构域;
(d)不从内源TCRβ基因座表达内源TCRβ可变结构域;
(e)不在细胞表面上,从内源MHC I基因座表达内源经典MHC I类多肽的胞外结构域;
(f)不在细胞表面上,从内源MHC II基因座表达内源经典MHC II类多肽的胞外结构域;或者
(e)(a)-(f)的任何组合。
25.如权利要求12-24中任一项所述的小鼠或如权利要求12、14-23中任一项所述的分离的小鼠细胞,所述小鼠或所述分离的小鼠细胞还包含β2微球蛋白基因座,所述基因座包含编码包含人β2微球蛋白氨基酸序列的多肽的序列,任选地其中所述小鼠表达人或人源化β2微球蛋白多肽。
26.如权利要求25所述的小鼠,其中所述小鼠不从内源小鼠β2微球蛋白基因座表达功能性内源小鼠β2微球蛋白多肽。
27.如权利要求25或权利要求26所述的小鼠,或如权利要求25所述的小鼠细胞,其中编码包含人β2微球蛋白多肽的多肽的所述序列可操作地连接至内源小鼠β2微球蛋白调控元件。
28.如权利要求25-27中任一项所述的小鼠或如权利要求25或权利要求27所述的分离的小鼠细胞,其中所述β2微球蛋白基因座包含人β2微球蛋白基因的外显子2、外显子3和外显子4中所示的核苷酸序列。
29.如权利要求28所述的小鼠或分离的小鼠细胞,其中所述β2微球蛋白基因座还包含小鼠β2微球蛋白基因的外显子1中所示的核苷酸序列。
30.一种基因修饰的小鼠或分离的小鼠细胞,所述基因修饰的小鼠或分离的小鼠细胞在其基因组中包含:
(a)编码嵌合人/小鼠CD4辅助受体的第一核苷酸序列,所述辅助受体包含人CD4多肽的D1、D2和D3结构域,可操作地连接至小鼠CD4多肽的D4结构域、跨膜结构域和胞质结构域;
(b)编码嵌合人/小鼠CD8α多肽的第二核苷酸序列和编码嵌合人/小鼠CD8β多肽的第三核苷酸序列,
其中所述嵌合人/小鼠CD8α多肽包含可操作地连接至内源小鼠CD8α多肽的跨膜结构域和胞质结构域的人CD8α多肽的IgV样结构域,并且其中所述嵌合人/小鼠CD8β多肽包含可操作地连接至内源小鼠CD8β多肽的跨膜结构域和胞质结构域的人CD8β多肽的IgV样结构域;
(c)编码嵌合人/小鼠MHC IIα多肽的第一核酸序列和编码嵌合人/小鼠MHC IIβ多肽的第二核酸序列,
其中所述嵌合人/小鼠MHC IIα多肽包含可操作地连接至内源小鼠MHC IIα多肽的跨膜结构域和胞质结构域的人HLA II类α多肽的α1和α2结构域,并且其中所述嵌合人/小鼠MHCIIβ多肽包含可操作地连接至内源小鼠MHC IIβ多肽的跨膜结构域和胞质结构域的人HLAII类β多肽的β1和β2结构域;
(d)编码嵌合人/小鼠MHC I多肽的第三核酸序列,所述多肽包含可操作地连接至内源小鼠MHC I类多肽的跨膜结构域和胞质结构域的人HLA I类多肽的α1、α2和α3结构域;
(e)未重排的人T细胞受体(TCR)α可变区序列,所述未重排的人TCR可变区序列包含至少一个人Vα区段和至少一个人Jα区段,所述未重排的人TCR可变区序列可操作地连接至小鼠TCRα恒定区序列;和未重排的TCRβ可变区序列,所述未重排的TCR可变区序列包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段,所述未重排的TCR可变区序列可操作地连接至小鼠TCRβ恒定区序列,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码核酸序列;以及
(f)编码人或人源化β2微球蛋白多肽并且包含核苷酸序列的多核苷酸,所述核苷酸序列包含内源小鼠β2微球蛋白基因的外显子1中所示的核苷酸序列,可操作地连接至人β2微球蛋白基因的外显子2、外显子3和外显子4中所示的核苷酸序列,
任选地其中所述小鼠表达:
(A)所述嵌合人/小鼠CD4辅助受体,
(B)包含所述嵌合人/小鼠CD8α多肽和所述嵌合人/小鼠CD8β多肽的嵌合CD8辅助受体,
(C)嵌合MHC II复合物,所述嵌合MHC II复合物包含所述嵌合人/小鼠MHC IIα多肽和所述嵌合人/小鼠MHC IIβ多肽,其中所述嵌合MHC II复合物能够结合所述嵌合人/小鼠CD4辅助受体,
(D)所述嵌合人/小鼠MHC I多肽,其中所述嵌合MHC I多肽能够结合所述嵌合CD8辅助受体,
(E)T细胞表面上,包含人源化TCRα链和人源化TCRβ链的嵌合人/小鼠T细胞受体,
其中所述人源化TCRα链由可操作地连接至所述小鼠TCRα恒定区序列的重排的人Vα/Jα序列编码,其中所述重排的人Vα/Jα序列通过包含所述至少一个人Vα区段和所述至少一个人Jα区段的所述未重排的人TCRα可变区序列的重排形成,
其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ/Jβ序列编码,其中所述重排的人Vβ/Dβ/Jβ序列通过包含所述至少一个人Vβ区段、至少一个Dβ区段和至少一个人Jβ区段的所述未重排的人TCRβ可变区的重排形成,任选地其中所述人源化TCRβ链由可操作地连接至所述小鼠TCRβ恒定区序列的重排的人Vβ/Dβ2/Jβ2序列编码,以及
(F)所述人或人源化β2微球蛋白多肽。
31.如权利要求12-30中任一项所述的小鼠,其中所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ1簇的基因区段,并且所述小鼠表达的所述TCR的至少10%源自所述TCRBDJ2簇的基因区段。
32.如权利要求12-31中任一项所述的小鼠或如权利要求12、14-23、25和27-30中任一项所述的小鼠细胞,其中所述嵌合人/小鼠MHC IIα多肽是嵌合HLA-DR/H-2Eα多肽,所述嵌合人/小鼠MHC IIβ多肽是嵌合人/小鼠HLA-DR/H-2Eβ多肽,并且所述嵌合人/小鼠MHC I多肽是嵌合人/小鼠HLA-A/H-2K多肽,并且其中所述小鼠表达HLA-A/H-2K和HLA-DR/H-2E。
33.一种制备如权利要求1-32中任一项所述的小鼠或如权利要求1-7、9、12、14-23、25和27-30中任一项所述的小鼠细胞的方法,所述方法包括将所述小鼠或小鼠细胞的基因组修饰为包含
(a)所述未重排的T细胞受体(TCR)α可变区序列,所述未重排的TCRα可变区序列包含至少一个未重排的人T细胞可变区Vα区段和至少一个未重排的人T细胞可变区Jα区段,所述未重排的TCRα可变区序列可操作地连接至小鼠TCRα恒定基因序列,任选地连接到内源小鼠TCRα可变基因的基因座处,其中所述未重排的TCRα可变区序列包含小鼠TCRA非编码序列,
(ii)所述未重排的TCRβ可变区序列,所述未重排的TCRβ可变区序列包含至少一个未重排的人T细胞可变区Vβ区段、至少一个未重排的人T细胞可变区Dβ区段和至少一个未重排的人T细胞可变区Jβ区段,所述未重排的TCRβ可变区序列可操作地连接至小鼠TCRβ恒定基因序列,任选地连接到内源小鼠TCRβ可变基因的基因座处,
其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列,或
(c)所述未重排的TCRα可变区序列和所述未重排的TCRβ可变区序列两者。
34.如权利要求33所述的方法,其中所述方法包括用包含所述至少一个未重排的人T细胞可变区Dβ区段、小鼠TCRBD-TCRBJ非编码核酸序列和所述至少一个未重排的人T细胞可变区Jβ区段的核酸序列置换包含小鼠TCRBD基因区段和小鼠TCRBJ基因区段的邻接小鼠TCRB序列,使得所述至少一个未重排的人T细胞可变区Dβ区段、所述小鼠TCRBD-TCRBJ非编码核酸序列和所述至少一个未重排的人T细胞可变区Jβ区段可操作地连接至所述小鼠TCRβ恒定基因序列。
35.如权利要求34所述的方法,其中所述邻接小鼠TCRB序列包含(a)小鼠TCRBD1基因区段和小鼠TCRBJ1-6基因区段和/或(b)小鼠TCRBD2基因区段和小鼠TCRBJ2-7基因区段,并且
其中所述核酸包含:
(C)人源化TCRBDJ1簇,所述人源化TCRBDJ1簇包含未重排的人TCRBD1基因区段、未重排的人TCRBJ1基因区段和小鼠TCRBDJ1非编码序列,其中所述人源化TCRBDJ1簇包含:
未重排的人TRBJ1-1基因区段、未重排的人TRBJ1-2基因区段,以及介于所述未重排的人TRBJ1-1基因区段和所述未重排的人TRBJ1-2基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-2基因区段、未重排的人TRBJ1-3基因区段,以及介于所述未重排的人TRBJ1-2基因区段和所述未重排的人TRBJ1-3基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-3基因区段、未重排的人TRBJ1-4基因区段,以及介于所述未重排的人TRBJ1-3基因区段和所述未重排的人TRBJ1-4基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-4基因区段、未重排的人TRBJ1-5基因区段,以及介于所述未重排的人TRBJ1-4基因区段和所述未重排的人TRBJ1-5基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ1-5基因区段、未重排的人TRBJ1-6基因区段,以及介于所述未重排的人TRBJ1-5基因区段和所述未重排的人TRBJ1-6基因区段之间的小鼠TCRB非编码序列,或
未重排的人TRBJ1-1基因区段、未重排的人TRBJ1-2基因区段、未重排的人TRBJ1-3基因区段、未重排的人TRBJ1-4基因区段、未重排的人TRBJ1-5基因区段和未重排的人TRBJ1-6基因区段的任何组合,其中所述人源化TCRBDJ1簇包含介于所述未重排的人TCRBD1基因区段和任何未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列以及介于任何两个连续的未重排的人TCRBJ1基因区段之间的小鼠TCRBDJ1非编码序列,任选地其中所述未重排的人TCRBD1和TCRBJ1基因区段位于相同的小鼠TCRBDJ1非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段;和/或
(D)人源化TCRBDJ2簇,所述人源化TCRBDJ2簇包含未重排的人TCRBD2基因区段、未重排的人TCRBJ2基因区段和小鼠TCRBDJ2非编码序列,其中所述人源化TCRBDJ2簇包含:
未重排的人TRBJ2-1基因区段、未重排的人TRBJ2-2基因区段,以及介于所述未重排的人TRBJ2-1基因区段和所述
未重排的人TRBJ2-2基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-2基因区段、未重排的人TRBJ2-3基因区段,以及介于所述未重排的人TRBJ2-2基因区段和所述未重排的人TRBJ2-3基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-3基因区段、未重排的人TRBJ2-4基因区段,以及介于所述未重排的人TRBJ2-3基因区段和所述未重排的人TRBJ2-4基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-4基因区段、未重排的人TRBJ2-5基因区段,以及介于所述未重排的人TRBJ2-4基因区段和所述未重排的人TRBJ2-5基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-5基因区段、未重排的人TRBJ2-6基因区段,以及介于所述未重排的人TRBJ2-5基因区段和所述未重排的人TRBJ2-6基因区段之间的小鼠TCRB非编码序列,
未重排的人TRBJ2-6基因区段、未重排的人TRBJ2-7基因区段,以及介于所述未重排的人TRBJ2-6基因区段和所述未重排的人TRBJ27基因区段之间的小鼠TCRB非编码序列,或
未重排的人TRBJ2-1基因区段、未重排的人TRBJ2-2基因区段、未重排的人TRBJ2-3基因区段、未重排的人TRBJ2-4基因区段、未重排的人TRBJ2-5基因区段、未重排的人TRBJ2-6基因区段和未重排的人TRBJ2-7基因区段的任何组合,其中所述人源化TCRBDJ2簇包含介于所述未重排的人TCRBD2基因区段和任何未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列以及介于任何两个连续的未重排的人TCRBJ2基因区段之间的小鼠TCRBDJ2非编码序列,任选地其中所述未重排的人TCRBD2和TCRBJ2基因区段位于相同的小鼠TCRBDJ2非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj1基因区段。
36.如权利要求33-35中任一项所述的方法,所述方法还包括将所述小鼠或所述小鼠细胞的基因组修饰为包含:
(a)编码所述嵌合CD4辅助受体的所述第一核苷酸序列;
(b)编码所述嵌合CD8α多肽的所述第二核苷酸序列和编码所述嵌合CD8β多肽的所述第三核苷酸序列;
(c)编码所述嵌合MHC IIα多肽的所述第一核酸序列和编码所述嵌合MHC IIβ多肽的所述第二核酸序列;
(d)编码所述嵌合MHC I多肽的所述第三核酸序列;以及
(e)任选地,编码人或人源化β2微球蛋白多肽的β2微球蛋白基因座。
37.如权利要求36所述的方法,其中所述修饰基因组包括在一个或多个小鼠ES细胞中进行同源重组,使得所述第一核苷酸序列、第二核苷酸序列和第三核苷酸序列;所述未重排的人TCRα可变区序列和未重排的TCRβ可变区序列;所述第一核酸序列、第二核酸序列和第三核酸序列;和任选地β2微球蛋白基因座;以任何顺序添加到所述一个或多个小鼠ES细胞的基因组中。
38.如权利要求37所述的方法,所述方法还包括从所述一个或多个小鼠ES细胞产生小鼠。
39.一种获得以下任一种的方法:(1)对抗原具有特异性并且包含人TCR可变结构域的TCR蛋白,(2)所述人TCR可变结构域和(3)编码所述人TCR可变结构域的核酸序列,
所述方法包括
从根据权利要求1-32中任一项所述的小鼠中分离以下任一种:
(1)表达TCR蛋白的T细胞,所述TCR蛋白对抗原具有特异性并且包含人TCRα可变结构域和人TCRβ可变结构域,
(2)(i)所述人TCRα可变结构域和(ii)所述人TCRβ可变结构域中的任一者或两者,以及
(3)(i)编码所述人TCRα可变结构域的核酸序列和(ii)编码所述人TCRβ可变结构域的核酸序列中的任一者或两者。
40.如权利要求39所述的方法,其中所述方法包括从所述小鼠中分离编码所述人TCRα可变结构域的所述核酸序列和编码所述人TCRβ可变结构域的所述核酸序列,所述方法还包括
在足以表达以下核酸序列的条件下培养宿主细胞:(i)编码与人TCRα恒定区可操作连接的所述人TCRα可变结构域的所述核酸序列,(ii)编码与人TCRβ恒定区可操作连接的所述人TCRβ可变结构域的所述核酸序列,
其中编码所述人TCRα可变结构域和所述人TCRβ可变结构域的所述核酸序列处于相同或不同的表达载体上。
41.如权利要求39或权利要求40所述的方法,其中所述抗原是肿瘤抗原、病毒抗原或细菌抗原。
42.一种表达TCR蛋白的T细胞,所述TCR蛋白包含如权利要求39-41中任一项所述的方法获得的对抗原具有特异性的人TCR可变结构域。
43.一种由表达TCR蛋白的所述T细胞产生的杂交瘤,所述TCR蛋白包含如权利要求39-42中任一项所述的方法获得的对抗原具有特异性的人TCR可变结构域。
44.一种根据如权利要求39-43中任一项所述的方法获得的人T细胞受体可变结构域。
45.一种核酸,所述核酸包含根据如权利要求39-44中任一项所述的方法分离的(i)编码所述人TCRα可变结构域的所述核酸序列和(ii)编码所述人TCRβ可变结构域的所述核酸序列中的任一者或两者。
46.一种宿主细胞,所述宿主细胞包含如权利要求45所述的核酸。
47.一种表达载体,所述表达载体包含如权利要求45所述的核酸。
48.如权利要求47所述的表达载体,其中所述表达载体包含以下的至少一种:(a)可操作地连接至编码人TCRα恒定区的序列的编码人TCRα可变结构域的所述核酸序列,和(b)可操作地连接至编码人TCRβ恒定区的序列的编码所述人TCRβ可变结构域的所述核酸序列。
49.如权利要求1-7、9、12、14-23、25和27-30及32中任一项所述的小鼠细胞,其中所述小鼠细胞是胚胎干细胞。
50.如权利要求49所述的基因修饰的小鼠胚胎干细胞,所述基因修饰的小鼠胚胎干细胞在其基因组中包含:
(a)编码嵌合CD4辅助受体的第一核苷酸序列,所述辅助受体包含人CD4多肽的D1、D2和D3结构域以及小鼠CD4多肽的跨膜结构域和胞质结构域,
(b)分别编码嵌合CD8α多肽和嵌合CD8β多肽,的第二核苷酸序列和第三核苷酸序列,
其中所述嵌合CD8α多肽包含人CD8α多肽的IgV样结构域和小鼠CD8α多肽的跨膜结构域和胞质结构域,
其中所述嵌合CD8β多肽包含人CD8β多肽的IgV样结构域和小鼠CD8β多肽,的跨膜结构域和胞质结构域,以及
(c)分别编码嵌合MHC IIα多肽和嵌合MHC IIβ多肽的第一核酸序列和第二核酸序列,
其中所述嵌合MHC IIα多肽包含人HLA II类α多肽的α1和α2结构域以及非人MHC IIα多肽的跨膜结构域和胞质结构域,
其中所述嵌合MHC IIβ多肽包含人HLA II类β多肽的β1和β2结构域以及小鼠MHC IIβ多肽的跨膜结构域和胞质结构域,
(d)编码嵌合MHC I多肽的第三核酸序列;
其中所述嵌合MHC I多肽包含人HLA I类多肽的α1结构域、α2结构域和α3结构域以及小鼠MHC I多肽的跨膜结构域和胞质结构域,以及
(e)未重排的人T细胞受体(TCR)α可变区序列,所述未重排的人TCR可变区序列包含至少一个人Vα区段和至少一个人Jα区段,所述未重排的人TCR可变区序列可操作地连接至小鼠TCRα恒定区序列;和未重排的TCRβ可变区序列,所述未重排的TCR可变区序列包含至少一个人Vβ区段、至少一个人Dβ区段和至少一个人Jβ区段,所述未重排的TCR可变区序列可操作地连接至小鼠TCRβ恒定区序列,其中所述未重排的TCRβ可变区序列包含小鼠TCRB非编码序列。
51.如权利要求50所述的基因修饰的小鼠胚胎干细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处;
(b)所述第二核苷酸序列存在于内源CD8αT细胞辅助受体基因座处并且所述第三核苷酸序列存在于内源CD8βT细胞辅助受体基因座处;
(c)所述第一核酸序列存在于内源MHC IIα基因座处并且所述第二核酸序列存在于内源MHC IIβ基因座处;
(d)所述第三核酸序列存在于内源MHC I基因座处;和/或
(e)所述未重排的人TCRα可变区序列存在于内源TCRα可变区基因座处并且所述未重排的TCRβ可变区序列存在于内源TCRβ可变区基因座处。
52.如权利要求50或权利要求51所述的基因修饰的小鼠胚胎干细胞,其中
(a)所述第一核苷酸序列存在于内源CD4 T细胞辅助受体基因座处并且可操作地连接至内源CD4辅助受体启动子和调控元件;
(b)所述第二核苷酸序列存在于内源CD8αT细胞辅助受体基因座处并且可操作地连接至内源CD8α多肽启动子和调控元件,并且所述第三核苷酸序列存在于内源CD8β基因座处可操作地连接至内源CD8β多肽启动子和调控元件;
(c)所述第一核酸序列存在于内源MHC IIα基因座处可操作地连接至内源MHC IIα启动子和调控元件,并且所述第二核酸序列存在于内源MHC IIβ基因座处并且可操作地连接至内源非人MHC IIβ启动子和调控元件;
(d)所述第三核酸序列存在于内源MHC I基因座处可操作地连接至内源MHC I启动子和调控元件;和/或
(e)所述未重排的TCRα可变区序列可操作地连接至内源TCRα调控元件并且所述未重排的TCRβ可变区序列可操作地连接至内源TCRβ调控元件。
53.如权利要求50-52中任一项所述的基因修饰的小鼠胚胎干细胞,其中所述第一核苷酸序列编码所述嵌合CD4辅助受体,所述嵌合CD4辅助受体包含所述人CD4多肽的D1、D2和D3结构域,可操作地连接至内源CD4多肽的D4结构域、跨膜结构域和胞质结构域,
(b)所述第二核苷酸序列编码所述嵌合CD8α多肽,所述嵌合CD8多肽包含可操作地连接至内源CD8α多肽的跨膜结构域和胞质结构域的所述人CD8α多肽的所述IgV样结构域,并且所述第三核苷酸序列编码所述嵌合CD8β多肽,所述嵌合CD8多肽包含可操作地连接至内源CD8β多肽的跨膜结构域和胞质结构域的所述人CD8β多肽的所述IgV样结构域;
(c)所述第一核酸序列编码所述嵌合MHC IIα多肽,所述嵌合MHC II多肽包含可操作地连接至内源MHC IIα多肽的跨膜结构域和胞质结构域的人HLA II类α1和α2结构域,并且所述第二核酸序列编码所述嵌合MHC IIβ多肽,所述嵌合MHC II多肽包含可操作地连接至内源MHC IIβ多肽的跨膜结构域和胞质结构域的人HLA II类β1和β2结构域;和/或
(d)所述第三核酸序列编码所述嵌合MHC I多肽,所述嵌合MHC I多肽包含可操作地连接至内源MHC I多肽的跨膜结构域和胞质结构域的人HLA I类α1、α2和α3结构域。
54.一种通过如权利要求33-38中任一项所述的方法制备的小鼠胚胎干(ES)细胞。
55.一种靶向载体,所述靶向载体包含用于靶向小鼠TCRBDJ区、未重排的人TCRBD区段、未重排的人TCRBJ区段和小鼠TRCBDJ非编码序列的5’同源臂和3’同源臂,
其中靶向载体包含介于所述未重排的人TCRBD区段和任何未重排的人TCRBJ基因区段之间以及介于任何两个连续的未重排的人TCRBJ基因区段之间的小鼠TCRBDJ非编码序列,任选地其中所述未重排的人TCRBD和TCRBJ基因区段位于相同的小鼠TCRBDJ非编码序列的侧翼,正如通常侧翼是相应的小鼠tcrbdj基因区段。
56.如权利要求55所述的靶向载体,其中
(A)所述未重排的人TCRBD区段包含在7号染色体(GRCh38组件)上的下列人类基因组坐标所示的序列:
142,786,213-142,786,224和/或
142,796,365-142,796,414;
(B)所述未重排的人TCRBJ区段包含在7号染色体(GRCh38组件)上的下列人类基因组坐标所示的序列:
142,786,880-142,786,927,
142,787,017-142,787,064,
142,787,630-142,787,679,
142,788,225-142,788,275,
142,788,498-142,788,547,
142,788,988-142,789,040,
142,795,686-142,795,740,
142,796,560-142,796,610,
142,796,847-142,796,895,
142,796,998-142,797,047,
142,797,119-142,797,166,
142,797,239-142,797,291和/或
142,797,456-142,797,502。
57.一种小鼠基因组或小鼠细胞,所述小鼠基因组或小鼠细胞包含如权利要求55或权利要求56所述的靶向载体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410379293.2A CN118511853A (zh) | 2021-03-31 | 2022-03-30 | 包含具有改善的tcrb组库多样性的人源化细胞免疫系统组分的基因修饰的小鼠 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163168774P | 2021-03-31 | 2021-03-31 | |
US63/168,774 | 2021-03-31 | ||
PCT/US2022/022653 WO2022212582A1 (en) | 2021-03-31 | 2022-03-30 | Genetically modified mice comprising humanized cellular immune system components with improved diversity of tcrβ repertoire |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410379293.2A Division CN118511853A (zh) | 2021-03-31 | 2022-03-30 | 包含具有改善的tcrb组库多样性的人源化细胞免疫系统组分的基因修饰的小鼠 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116981357A true CN116981357A (zh) | 2023-10-31 |
Family
ID=81345957
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410379293.2A Pending CN118511853A (zh) | 2021-03-31 | 2022-03-30 | 包含具有改善的tcrb组库多样性的人源化细胞免疫系统组分的基因修饰的小鼠 |
CN202280021736.XA Pending CN116981357A (zh) | 2021-03-31 | 2022-03-30 | 包含具有改善的tcrb组库多样性的人源化细胞免疫系统组分的基因修饰的小鼠 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410379293.2A Pending CN118511853A (zh) | 2021-03-31 | 2022-03-30 | 包含具有改善的tcrb组库多样性的人源化细胞免疫系统组分的基因修饰的小鼠 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20220322648A1 (zh) |
EP (1) | EP4171216A1 (zh) |
JP (1) | JP2024512702A (zh) |
KR (1) | KR20230164150A (zh) |
CN (2) | CN118511853A (zh) |
AU (1) | AU2022249328A1 (zh) |
BR (1) | BR112023018874A2 (zh) |
CA (1) | CA3213460A1 (zh) |
IL (1) | IL307238A (zh) |
MX (1) | MX2023010796A (zh) |
WO (1) | WO2022212582A1 (zh) |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6586251B2 (en) | 2000-10-31 | 2003-07-01 | Regeneron Pharmaceuticals, Inc. | Methods of modifying eukaryotic cells |
EP1549748B1 (en) | 2002-10-09 | 2014-10-01 | Immunocore Ltd. | Single chain recombinant t cell receptors |
EP1802193B1 (en) | 2004-10-19 | 2014-04-30 | Regeneron Pharmaceuticals, Inc. | Method for generating a mouse homozygous for a genetic modification |
US10464987B2 (en) | 2009-10-06 | 2019-11-05 | Abbvie Inc. | Human single-chain T cell receptors |
RS56656B1 (sr) | 2011-10-28 | 2018-03-30 | Regeneron Pharma | Miševi sa genetski modifikovanim glavnim kompleksom gena tkivne podudarnosti |
US9591835B2 (en) | 2011-10-28 | 2017-03-14 | Regeneron Pharmaceuticals, Inc. | Genetically modified major histocompatibility complex animals |
ES2914374T3 (es) | 2011-10-28 | 2022-06-10 | Regeneron Pharma | Ratones modificados genéticamente que expresan moléculas quiméricas del complejo de histocompatibilidad mayor (MHC) de clase II |
US9043996B2 (en) | 2011-10-28 | 2015-06-02 | Regeneron Pharmaceuticals, Inc. | Genetically modified major histocompatibility complex animals |
PL2771357T3 (pl) | 2011-10-28 | 2018-12-31 | Regeneron Pharmaceuticals, Inc. | Myszy ze zmodyfikowanym genetycznie receptorem komórek T |
KR102579405B1 (ko) | 2013-02-20 | 2023-09-18 | 리제너론 파아마슈티컬스, 인크. | 사람화된 t-세포 보조-수용체를 발현하는 마우스 |
JP6444321B2 (ja) | 2013-02-22 | 2018-12-26 | リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. | ヒト化主要組織適合性遺伝子複合体を発現するマウス |
PL3280257T3 (pl) * | 2015-04-06 | 2023-10-23 | Regeneron Pharmaceuticals, Inc. | Odpowiedzi odpornościowe za pośrednictwem humanizowanych komórek t u zwierząt innych niż człowiek |
LT3462853T (lt) * | 2016-06-03 | 2023-03-27 | Regeneron Pharmaceuticals, Inc. | Graužikai, vykdantys egzogeninės terminalinės deoksinukleotidiltransferazės raišką |
RS63772B1 (sr) * | 2017-12-05 | 2022-12-30 | Regeneron Pharma | Miševi koji imaju modifikovani lambda laki lanac imunoglobulina i njihove upotrebe |
-
2022
- 2022-03-30 MX MX2023010796A patent/MX2023010796A/es unknown
- 2022-03-30 KR KR1020237037502A patent/KR20230164150A/ko unknown
- 2022-03-30 CN CN202410379293.2A patent/CN118511853A/zh active Pending
- 2022-03-30 AU AU2022249328A patent/AU2022249328A1/en active Pending
- 2022-03-30 WO PCT/US2022/022653 patent/WO2022212582A1/en active Application Filing
- 2022-03-30 CA CA3213460A patent/CA3213460A1/en active Pending
- 2022-03-30 CN CN202280021736.XA patent/CN116981357A/zh active Pending
- 2022-03-30 IL IL307238A patent/IL307238A/en unknown
- 2022-03-30 JP JP2023560486A patent/JP2024512702A/ja active Pending
- 2022-03-30 BR BR112023018874A patent/BR112023018874A2/pt unknown
- 2022-03-30 EP EP22718006.4A patent/EP4171216A1/en active Pending
- 2022-03-30 US US17/709,150 patent/US20220322648A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20230164150A (ko) | 2023-12-01 |
US20220322648A1 (en) | 2022-10-13 |
WO2022212582A1 (en) | 2022-10-06 |
MX2023010796A (es) | 2023-09-27 |
IL307238A (en) | 2023-11-01 |
AU2022249328A1 (en) | 2023-09-21 |
EP4171216A1 (en) | 2023-05-03 |
CN118511853A (zh) | 2024-08-20 |
BR112023018874A2 (pt) | 2023-10-03 |
JP2024512702A (ja) | 2024-03-19 |
AU2022249328A9 (en) | 2023-10-12 |
CA3213460A1 (en) | 2022-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102699643B1 (ko) | 비인간 동물에서의 인간화 t 세포 매개 면역반응 | |
CN111484999B (zh) | 人源化的t细胞共受体的小鼠 | |
EP2770821B1 (en) | Genetically modified major histocompatibility complex mice | |
CN116981357A (zh) | 包含具有改善的tcrb组库多样性的人源化细胞免疫系统组分的基因修饰的小鼠 | |
NZ623456B2 (en) | Genetically modified major histocompatibility complex mice |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |