EA046546B1 - Библиотеки модульных полипептидов и способы их получения и применения - Google Patents
Библиотеки модульных полипептидов и способы их получения и применения Download PDFInfo
- Publication number
- EA046546B1 EA046546B1 EA202292015 EA046546B1 EA 046546 B1 EA046546 B1 EA 046546B1 EA 202292015 EA202292015 EA 202292015 EA 046546 B1 EA046546 B1 EA 046546B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- library
- nucleic acid
- domain
- sequence
- barcode
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims description 407
- 229920001184 polypeptide Polymers 0.000 title claims description 401
- 102000004196 processed proteins & peptides Human genes 0.000 title claims description 401
- 238000000034 method Methods 0.000 title claims description 145
- 238000002360 preparation method Methods 0.000 title description 3
- 150000007523 nucleic acids Chemical class 0.000 claims description 415
- 210000004027 cell Anatomy 0.000 claims description 270
- 102000039446 nucleic acids Human genes 0.000 claims description 243
- 108020004707 nucleic acids Proteins 0.000 claims description 243
- 108090000623 proteins and genes Proteins 0.000 claims description 154
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 147
- 230000027455 binding Effects 0.000 claims description 141
- 102000004169 proteins and genes Human genes 0.000 claims description 129
- 108091026890 Coding region Proteins 0.000 claims description 120
- 239000000427 antigen Substances 0.000 claims description 112
- 108091007433 antigens Proteins 0.000 claims description 112
- 102000036639 antigens Human genes 0.000 claims description 112
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 107
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 96
- 102000040430 polynucleotide Human genes 0.000 claims description 86
- 108091033319 polynucleotide Proteins 0.000 claims description 86
- 239000002157 polynucleotide Substances 0.000 claims description 86
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 63
- 239000002773 nucleotide Substances 0.000 claims description 56
- 125000003729 nucleotide group Chemical group 0.000 claims description 56
- 230000004068 intracellular signaling Effects 0.000 claims description 48
- 102000005962 receptors Human genes 0.000 claims description 32
- 108020003175 receptors Proteins 0.000 claims description 32
- 238000012163 sequencing technique Methods 0.000 claims description 32
- 108700026244 Open Reading Frames Proteins 0.000 claims description 31
- 230000002441 reversible effect Effects 0.000 claims description 31
- 230000001413 cellular effect Effects 0.000 claims description 30
- 238000000338 in vitro Methods 0.000 claims description 26
- 230000009870 specific binding Effects 0.000 claims description 18
- 230000003834 intracellular effect Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 13
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 claims description 11
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 claims description 11
- 230000002401 inhibitory effect Effects 0.000 claims description 9
- 108010022394 Threonine synthase Proteins 0.000 claims description 8
- 102000004419 dihydrofolate reductase Human genes 0.000 claims description 8
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 claims description 7
- 101150078024 CRY2 gene Proteins 0.000 claims description 5
- 101000623857 Homo sapiens Serine/threonine-protein kinase mTOR Proteins 0.000 claims description 5
- 230000003213 activating effect Effects 0.000 claims description 5
- 230000003197 catalytic effect Effects 0.000 claims description 5
- 238000006471 dimerization reaction Methods 0.000 claims description 5
- 230000004936 stimulating effect Effects 0.000 claims description 5
- 108010042955 Calcineurin Proteins 0.000 claims description 4
- 102000004631 Calcineurin Human genes 0.000 claims description 4
- 101100282746 Oryza sativa subsp. japonica GID1 gene Proteins 0.000 claims description 4
- 101100156295 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VID30 gene Proteins 0.000 claims description 4
- 108010068682 Cyclophilins Proteins 0.000 claims description 3
- 102000001493 Cyclophilins Human genes 0.000 claims description 3
- 101710088083 Glomulin Proteins 0.000 claims description 3
- 102100032216 Calcium and integrin-binding protein 1 Human genes 0.000 claims description 2
- 101000943475 Homo sapiens Calcium and integrin-binding protein 1 Proteins 0.000 claims description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 2
- 230000002494 anti-cea effect Effects 0.000 claims 1
- 108091008146 restriction endonucleases Proteins 0.000 description 139
- 235000018102 proteins Nutrition 0.000 description 122
- 239000013598 vector Substances 0.000 description 77
- 238000012216 screening Methods 0.000 description 69
- 230000014509 gene expression Effects 0.000 description 59
- 235000001014 amino acid Nutrition 0.000 description 58
- 150000001413 amino acids Chemical class 0.000 description 55
- 230000000694 effects Effects 0.000 description 50
- 238000003776 cleavage reaction Methods 0.000 description 45
- 230000007017 scission Effects 0.000 description 45
- 108020001580 protein domains Proteins 0.000 description 42
- 210000001519 tissue Anatomy 0.000 description 38
- 238000010367 cloning Methods 0.000 description 36
- 206010028980 Neoplasm Diseases 0.000 description 34
- 230000006870 function Effects 0.000 description 33
- 230000000875 corresponding effect Effects 0.000 description 29
- 238000001727 in vivo Methods 0.000 description 28
- 239000000758 substrate Substances 0.000 description 28
- 239000012634 fragment Substances 0.000 description 26
- 239000000539 dimer Substances 0.000 description 25
- 102000040945 Transcription factor Human genes 0.000 description 24
- 108091023040 Transcription factor Proteins 0.000 description 24
- 201000010099 disease Diseases 0.000 description 24
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 24
- 150000002632 lipids Chemical class 0.000 description 24
- 230000011664 signaling Effects 0.000 description 22
- 210000000056 organ Anatomy 0.000 description 21
- 239000000523 sample Substances 0.000 description 21
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 20
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 20
- 230000029087 digestion Effects 0.000 description 19
- 230000000670 limiting effect Effects 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 18
- 238000000684 flow cytometry Methods 0.000 description 18
- 239000003446 ligand Substances 0.000 description 18
- 239000000047 product Substances 0.000 description 18
- 230000019491 signal transduction Effects 0.000 description 18
- 102000005650 Notch Receptors Human genes 0.000 description 17
- 108010070047 Notch Receptors Proteins 0.000 description 17
- 201000011510 cancer Diseases 0.000 description 17
- 238000004519 manufacturing process Methods 0.000 description 17
- 102000001253 Protein Kinase Human genes 0.000 description 16
- 108060006633 protein kinase Proteins 0.000 description 16
- 102000027426 receptor tyrosine kinases Human genes 0.000 description 16
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 16
- 101710163270 Nuclease Proteins 0.000 description 15
- 108010091086 Recombinases Proteins 0.000 description 15
- 102000018120 Recombinases Human genes 0.000 description 15
- 230000003321 amplification Effects 0.000 description 15
- 238000003199 nucleic acid amplification method Methods 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 14
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 13
- 230000004568 DNA-binding Effects 0.000 description 13
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 13
- 101710204410 Scaffold protein Proteins 0.000 description 13
- 238000010276 construction Methods 0.000 description 13
- 108091000080 Phosphotransferase Proteins 0.000 description 12
- 108090000848 Ubiquitin Proteins 0.000 description 12
- 102000044159 Ubiquitin Human genes 0.000 description 12
- 238000010171 animal model Methods 0.000 description 12
- -1 but not limited to Proteins 0.000 description 12
- 229940088598 enzyme Drugs 0.000 description 12
- 239000003550 marker Substances 0.000 description 12
- 102000020233 phosphotransferase Human genes 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 11
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 10
- 239000003795 chemical substances by application Substances 0.000 description 10
- 238000012207 quantitative assay Methods 0.000 description 10
- 230000006798 recombination Effects 0.000 description 10
- 238000005215 recombination Methods 0.000 description 10
- 102100024222 B-lymphocyte antigen CD19 Human genes 0.000 description 9
- 101000980825 Homo sapiens B-lymphocyte antigen CD19 Proteins 0.000 description 9
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 9
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 9
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 9
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 9
- 108020002494 acetyltransferase Proteins 0.000 description 9
- 102000005421 acetyltransferase Human genes 0.000 description 9
- 210000003527 eukaryotic cell Anatomy 0.000 description 9
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 108700028369 Alleles Proteins 0.000 description 8
- 108060002716 Exonuclease Proteins 0.000 description 8
- 102100035348 Serine/threonine-protein phosphatase 2B catalytic subunit alpha isoform Human genes 0.000 description 8
- 230000004913 activation Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 230000000139 costimulatory effect Effects 0.000 description 8
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 8
- 230000001973 epigenetic effect Effects 0.000 description 8
- 102000013165 exonuclease Human genes 0.000 description 8
- 210000002865 immune cell Anatomy 0.000 description 8
- 230000001939 inductive effect Effects 0.000 description 8
- 238000010606 normalization Methods 0.000 description 8
- 229920000642 polymer Polymers 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 102000004127 Cytokines Human genes 0.000 description 7
- 108090000695 Cytokines Proteins 0.000 description 7
- 101000597662 Homo sapiens Serine/threonine-protein phosphatase 2B catalytic subunit alpha isoform Proteins 0.000 description 7
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 7
- 102000016397 Methyltransferase Human genes 0.000 description 7
- 108060004795 Methyltransferase Proteins 0.000 description 7
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 7
- 102100038717 TYRO protein tyrosine kinase-binding protein Human genes 0.000 description 7
- 239000012472 biological sample Substances 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 238000001976 enzyme digestion Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 210000000130 stem cell Anatomy 0.000 description 7
- 102100027205 B-cell antigen receptor complex-associated protein alpha chain Human genes 0.000 description 6
- 101000809875 Homo sapiens TYRO protein tyrosine kinase-binding protein Proteins 0.000 description 6
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 6
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 6
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 108010029485 Protein Isoforms Proteins 0.000 description 6
- 102000001708 Protein Isoforms Human genes 0.000 description 6
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 6
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 6
- 210000005260 human cell Anatomy 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000009261 transgenic effect Effects 0.000 description 6
- 102100022132 High affinity immunoglobulin epsilon receptor subunit gamma Human genes 0.000 description 5
- 108060003951 Immunoglobulin Proteins 0.000 description 5
- 102000043136 MAP kinase family Human genes 0.000 description 5
- 108091054455 MAP kinase family Proteins 0.000 description 5
- 102000012515 Protein kinase domains Human genes 0.000 description 5
- 108050002122 Protein kinase domains Proteins 0.000 description 5
- 102100037906 T-cell surface glycoprotein CD3 zeta chain Human genes 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 102000018358 immunoglobulin Human genes 0.000 description 5
- 238000012750 in vivo screening Methods 0.000 description 5
- 230000005764 inhibitory process Effects 0.000 description 5
- 230000002427 irreversible effect Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000007481 next generation sequencing Methods 0.000 description 5
- 230000001575 pathological effect Effects 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 230000004850 protein–protein interaction Effects 0.000 description 5
- 239000011541 reaction mixture Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 210000004881 tumor cell Anatomy 0.000 description 5
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 4
- 108010013043 Acetylesterase Proteins 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 102100025137 Early activation antigen CD69 Human genes 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- 101000934374 Homo sapiens Early activation antigen CD69 Proteins 0.000 description 4
- 101000851376 Homo sapiens Tumor necrosis factor receptor superfamily member 8 Proteins 0.000 description 4
- 108010073816 IgE Receptors Proteins 0.000 description 4
- 102000009438 IgE Receptors Human genes 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 102000003735 Mesothelin Human genes 0.000 description 4
- 108090000015 Mesothelin Proteins 0.000 description 4
- 108700040121 Protein Methyltransferases Proteins 0.000 description 4
- 102000055027 Protein Methyltransferases Human genes 0.000 description 4
- 241000700159 Rattus Species 0.000 description 4
- 241000283984 Rodentia Species 0.000 description 4
- 230000006052 T cell proliferation Effects 0.000 description 4
- 102100036857 Tumor necrosis factor receptor superfamily member 8 Human genes 0.000 description 4
- 108091008605 VEGF receptors Proteins 0.000 description 4
- 102000009484 Vascular Endothelial Growth Factor Receptors Human genes 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000030609 dephosphorylation Effects 0.000 description 4
- 238000006209 dephosphorylation reaction Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 231100000673 dose–response relationship Toxicity 0.000 description 4
- 108091006047 fluorescent proteins Proteins 0.000 description 4
- 102000034287 fluorescent proteins Human genes 0.000 description 4
- 102000034356 gene-regulatory proteins Human genes 0.000 description 4
- 108091006104 gene-regulatory proteins Proteins 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000002715 modification method Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 210000004986 primary T-cell Anatomy 0.000 description 4
- 230000004952 protein activity Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 231100000241 scar Toxicity 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000000638 stimulation Effects 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 102000035160 transmembrane proteins Human genes 0.000 description 4
- 108091005703 transmembrane proteins Proteins 0.000 description 4
- 230000034512 ubiquitination Effects 0.000 description 4
- 230000035899 viability Effects 0.000 description 4
- 241000219195 Arabidopsis thaliana Species 0.000 description 3
- 101100300102 Arabidopsis thaliana PYL8 gene Proteins 0.000 description 3
- 101000983254 Arabidopsis thaliana Protein phosphatase 2C 77 Proteins 0.000 description 3
- 101710095183 B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 3
- 102100027207 CD27 antigen Human genes 0.000 description 3
- 102000001301 EGF receptor Human genes 0.000 description 3
- 108060006698 EGF receptor Proteins 0.000 description 3
- 102100031780 Endonuclease Human genes 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 101000914489 Homo sapiens B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 3
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 3
- 101000824104 Homo sapiens High affinity immunoglobulin epsilon receptor subunit gamma Proteins 0.000 description 3
- 101000946860 Homo sapiens T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 description 3
- 101000738335 Homo sapiens T-cell surface glycoprotein CD3 zeta chain Proteins 0.000 description 3
- 108010055717 JNK Mitogen-Activated Protein Kinases Proteins 0.000 description 3
- 102100037808 Mitogen-activated protein kinase 8 Human genes 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 101100300096 Oryza sativa subsp. japonica PYL3 gene Proteins 0.000 description 3
- 108091008874 T cell receptors Proteins 0.000 description 3
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 3
- 102100035794 T-cell surface glycoprotein CD3 epsilon chain Human genes 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 3
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 3
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 230000024245 cell differentiation Effects 0.000 description 3
- 230000004663 cell proliferation Effects 0.000 description 3
- 239000002458 cell surface marker Substances 0.000 description 3
- 230000036755 cellular response Effects 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 108010082025 cyan fluorescent protein Proteins 0.000 description 3
- 210000004443 dendritic cell Anatomy 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 108010021843 fluorescent protein 583 Proteins 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 238000007901 in situ hybridization Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 238000007912 intraperitoneal administration Methods 0.000 description 3
- 230000007762 localization of cell Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000003071 memory t lymphocyte Anatomy 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 210000003289 regulatory T cell Anatomy 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 108091006024 signal transducing proteins Proteins 0.000 description 3
- 102000034285 signal transducing proteins Human genes 0.000 description 3
- 230000010741 sumoylation Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108010011122 A Kinase Anchor Proteins Proteins 0.000 description 2
- 102000014022 A Kinase Anchor Proteins Human genes 0.000 description 2
- 102100028247 Abl interactor 1 Human genes 0.000 description 2
- 102100028221 Abl interactor 2 Human genes 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 108010037365 Arabidopsis Proteins Proteins 0.000 description 2
- 101100300093 Arabidopsis thaliana PYL1 gene Proteins 0.000 description 2
- 101100300090 Arabidopsis thaliana PYL11 gene Proteins 0.000 description 2
- 101100300091 Arabidopsis thaliana PYL12 gene Proteins 0.000 description 2
- 101100300092 Arabidopsis thaliana PYL13 gene Proteins 0.000 description 2
- 101100300094 Arabidopsis thaliana PYL2 gene Proteins 0.000 description 2
- 101100300097 Arabidopsis thaliana PYL4 gene Proteins 0.000 description 2
- 101100300100 Arabidopsis thaliana PYL6 gene Proteins 0.000 description 2
- 101100300101 Arabidopsis thaliana PYL7 gene Proteins 0.000 description 2
- 101000609521 Arabidopsis thaliana Protein phosphatase 2C 56 Proteins 0.000 description 2
- 102000016904 Armadillo Domain Proteins Human genes 0.000 description 2
- 108010014223 Armadillo Domain Proteins Proteins 0.000 description 2
- 102100029822 B- and T-lymphocyte attenuator Human genes 0.000 description 2
- 208000003950 B-cell lymphoma Diseases 0.000 description 2
- 208000028564 B-cell non-Hodgkin lymphoma Diseases 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- 108010001445 CD79 Antigens Proteins 0.000 description 2
- 102000000796 CD79 Antigens Human genes 0.000 description 2
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 102000021350 Caspase recruitment domains Human genes 0.000 description 2
- 108091011189 Caspase recruitment domains Proteins 0.000 description 2
- 208000032544 Cicatrix Diseases 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108010051219 Cre recombinase Proteins 0.000 description 2
- 102000008130 Cyclic AMP-Dependent Protein Kinases Human genes 0.000 description 2
- 108010049894 Cyclic AMP-Dependent Protein Kinases Proteins 0.000 description 2
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 2
- 108010054814 DNA Gyrase Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 102000010170 Death domains Human genes 0.000 description 2
- 108050001718 Death domains Proteins 0.000 description 2
- 102000036292 Death effector domains Human genes 0.000 description 2
- 108091010866 Death effector domains Proteins 0.000 description 2
- 241000255925 Diptera Species 0.000 description 2
- 108010043648 Discoidin Domain Receptors Proteins 0.000 description 2
- 102000002706 Discoidin Domain Receptors Human genes 0.000 description 2
- 102100034128 Dual specificity phosphatase 28 Human genes 0.000 description 2
- 102100037573 Dual specificity protein phosphatase 12 Human genes 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 101150029707 ERBB2 gene Proteins 0.000 description 2
- 108091008794 FGF receptors Proteins 0.000 description 2
- 108010046276 FLP recombinase Proteins 0.000 description 2
- 241000282324 Felis Species 0.000 description 2
- 102000044168 Fibroblast Growth Factor Receptor Human genes 0.000 description 2
- 102100041003 Glutamate carboxypeptidase 2 Human genes 0.000 description 2
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 2
- 102100029360 Hematopoietic cell signal transducer Human genes 0.000 description 2
- 108091010847 High affinity immunoglobulin epsilon receptor subunit gamma Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000724225 Homo sapiens Abl interactor 1 Proteins 0.000 description 2
- 101000864344 Homo sapiens B- and T-lymphocyte attenuator Proteins 0.000 description 2
- 101100112778 Homo sapiens CD247 gene Proteins 0.000 description 2
- 101001017423 Homo sapiens Dual specificity phosphatase 28 Proteins 0.000 description 2
- 101000881110 Homo sapiens Dual specificity protein phosphatase 12 Proteins 0.000 description 2
- 101000892862 Homo sapiens Glutamate carboxypeptidase 2 Proteins 0.000 description 2
- 101000990188 Homo sapiens Hematopoietic cell signal transducer Proteins 0.000 description 2
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 description 2
- 101000589307 Homo sapiens Natural cytotoxicity triggering receptor 3 Proteins 0.000 description 2
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 2
- 101000946863 Homo sapiens T-cell surface glycoprotein CD3 delta chain Proteins 0.000 description 2
- 101000801234 Homo sapiens Tumor necrosis factor receptor superfamily member 18 Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 2
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 2
- 108090000176 Interleukin-13 Proteins 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 102100028047 Large proline-rich protein BAG6 Human genes 0.000 description 2
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 2
- 240000006240 Linum usitatissimum Species 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 108010075654 MAP Kinase Kinase Kinase 1 Proteins 0.000 description 2
- 108010061593 Member 14 Tumor Necrosis Factor Receptors Proteins 0.000 description 2
- 206010027406 Mesothelioma Diseases 0.000 description 2
- 102100033115 Mitogen-activated protein kinase kinase kinase 1 Human genes 0.000 description 2
- 102100034256 Mucin-1 Human genes 0.000 description 2
- 230000006051 NK cell activation Effects 0.000 description 2
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 description 2
- 102100032852 Natural cytotoxicity triggering receptor 3 Human genes 0.000 description 2
- 102400000058 Neuregulin-1 Human genes 0.000 description 2
- 108090000556 Neuregulin-1 Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 101100300089 Oryza sativa subsp. japonica PYL10 gene Proteins 0.000 description 2
- 101100300099 Oryza sativa subsp. japonica PYL5 gene Proteins 0.000 description 2
- 101100300104 Oryza sativa subsp. japonica PYL9 gene Proteins 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 101150040958 PYL10 gene Proteins 0.000 description 2
- 101150007360 PYL3 gene Proteins 0.000 description 2
- 101150002064 PYL5 gene Proteins 0.000 description 2
- 101150021031 PYL9 gene Proteins 0.000 description 2
- 102100034539 Peptidyl-prolyl cis-trans isomerase A Human genes 0.000 description 2
- 102000054291 Phox homology Human genes 0.000 description 2
- 108700035387 Phox homology Proteins 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 101710184528 Scaffolding protein Proteins 0.000 description 2
- 206010041067 Small cell lung cancer Diseases 0.000 description 2
- 102000049867 Steroidogenic acute regulatory protein Human genes 0.000 description 2
- 108010018411 Steroidogenic acute regulatory protein Proteins 0.000 description 2
- 230000006044 T cell activation Effects 0.000 description 2
- 230000020385 T cell costimulation Effects 0.000 description 2
- 102100035891 T-cell surface glycoprotein CD3 delta chain Human genes 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 102100040247 Tumor necrosis factor Human genes 0.000 description 2
- 102100028785 Tumor necrosis factor receptor superfamily member 14 Human genes 0.000 description 2
- 102100033728 Tumor necrosis factor receptor superfamily member 18 Human genes 0.000 description 2
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 2
- 108010053099 Vascular Endothelial Growth Factor Receptor-2 Proteins 0.000 description 2
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 2
- 102000035181 adaptor proteins Human genes 0.000 description 2
- 108091005764 adaptor proteins Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 210000000612 antigen-presenting cell Anatomy 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 238000002306 biochemical method Methods 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 230000020411 cell activation Effects 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 230000005754 cellular signaling Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 231100000433 cytotoxic Toxicity 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000447 dimerizing effect Effects 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 108010087914 epidermal growth factor receptor VIII Proteins 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 102000011778 gamma-delta T-Cell Antigen Receptors Human genes 0.000 description 2
- 108010062214 gamma-delta T-Cell Antigen Receptors Proteins 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 238000002649 immunization Methods 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 108010074108 interleukin-21 Proteins 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 210000004901 leucine-rich repeat Anatomy 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 230000022760 lipid localization Effects 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 238000001668 nucleic acid synthesis Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 108060006184 phycobiliprotein Proteins 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 238000010833 quantitative mass spectrometry Methods 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000003202 restriction enzyme-based method Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 230000037387 scars Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 208000000587 small cell lung carcinoma Diseases 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 102000027257 transmembrane receptors Human genes 0.000 description 2
- 108091008578 transmembrane receptors Proteins 0.000 description 2
- 238000010798 ubiquitination Methods 0.000 description 2
- 229940124676 vascular endothelial growth factor receptor Drugs 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical compound Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 description 1
- KUHSEZKIEJYEHN-BXRBKJIMSA-N (2s)-2-amino-3-hydroxypropanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.OC[C@H](N)C(O)=O KUHSEZKIEJYEHN-BXRBKJIMSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- FNQJDLTXOVEEFB-UHFFFAOYSA-N 1,2,3-benzothiadiazole Chemical compound C1=CC=C2SN=NC2=C1 FNQJDLTXOVEEFB-UHFFFAOYSA-N 0.000 description 1
- WKBPZYKAUNRMKP-UHFFFAOYSA-N 1-[2-(2,4-dichlorophenyl)pentyl]1,2,4-triazole Chemical compound C=1C=C(Cl)C=C(Cl)C=1C(CCC)CN1C=NC=N1 WKBPZYKAUNRMKP-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- AQQSXKSWTNWXKR-UHFFFAOYSA-N 2-(2-phenylphenanthro[9,10-d]imidazol-3-yl)acetic acid Chemical compound C1(=CC=CC=C1)C1=NC2=C(N1CC(=O)O)C1=CC=CC=C1C=1C=CC=CC=12 AQQSXKSWTNWXKR-UHFFFAOYSA-N 0.000 description 1
- BGFTWECWAICPDG-UHFFFAOYSA-N 2-[bis(4-chlorophenyl)methyl]-4-n-[3-[bis(4-chlorophenyl)methyl]-4-(dimethylamino)phenyl]-1-n,1-n-dimethylbenzene-1,4-diamine Chemical compound C1=C(C(C=2C=CC(Cl)=CC=2)C=2C=CC(Cl)=CC=2)C(N(C)C)=CC=C1NC(C=1)=CC=C(N(C)C)C=1C(C=1C=CC(Cl)=CC=1)C1=CC=C(Cl)C=C1 BGFTWECWAICPDG-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- OTCOJVJTFONHDE-QXGOIDDHSA-N 2-aminoacetic acid;(2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-amino-3-phenylpropanoic acid Chemical compound NCC(O)=O.OC(=O)[C@@H](N)CC1=CC=CC=C1.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OTCOJVJTFONHDE-QXGOIDDHSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102100031126 6-phosphogluconolactonase Human genes 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 108091005721 ABA receptors Proteins 0.000 description 1
- 108050003506 ABL interactor 2 Proteins 0.000 description 1
- 102100031585 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Human genes 0.000 description 1
- 239000005964 Acibenzolar-S-methyl Substances 0.000 description 1
- 241000580482 Acidobacteria Species 0.000 description 1
- 241001156739 Actinobacteria <phylum> Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 241001136782 Alca Species 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 241000399940 Anguina tritici Species 0.000 description 1
- 241000242757 Anthozoa Species 0.000 description 1
- 102100021569 Apoptosis regulator Bcl-2 Human genes 0.000 description 1
- 241001142141 Aquificae <phylum> Species 0.000 description 1
- 101100490659 Arabidopsis thaliana AGP17 gene Proteins 0.000 description 1
- 101100111458 Arabidopsis thaliana BHLH63 gene Proteins 0.000 description 1
- 101100391743 Arabidopsis thaliana GAI gene Proteins 0.000 description 1
- 101100282745 Arabidopsis thaliana GID1C gene Proteins 0.000 description 1
- 101100300103 Arabidopsis thaliana PYL9 gene Proteins 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- 241000384062 Armadillo Species 0.000 description 1
- 108010074515 Arylalkylamine N-Acetyltransferase Proteins 0.000 description 1
- 102000008095 Arylalkylamine N-Acetyltransferase Human genes 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 230000020955 B cell costimulation Effects 0.000 description 1
- 108091008875 B cell receptors Proteins 0.000 description 1
- 108010012919 B-Cell Antigen Receptors Proteins 0.000 description 1
- 102000019260 B-Cell Antigen Receptors Human genes 0.000 description 1
- 102000006942 B-Cell Maturation Antigen Human genes 0.000 description 1
- 108010008014 B-Cell Maturation Antigen Proteins 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 102100038080 B-cell receptor CD22 Human genes 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102000001421 BRCT domains Human genes 0.000 description 1
- 108050009608 BRCT domains Proteins 0.000 description 1
- 241000605059 Bacteroidetes Species 0.000 description 1
- 241000218495 Bactrocera correcta Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102000001805 Bromodomains Human genes 0.000 description 1
- 108050009021 Bromodomains Proteins 0.000 description 1
- 102100036301 C-C chemokine receptor type 7 Human genes 0.000 description 1
- 102100036848 C-C motif chemokine 20 Human genes 0.000 description 1
- 102000002110 C2 domains Human genes 0.000 description 1
- 108050009459 C2 domains Proteins 0.000 description 1
- 102100038077 CD226 antigen Human genes 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 102100025221 CD70 antigen Human genes 0.000 description 1
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 1
- 229940045513 CTLA4 antagonist Drugs 0.000 description 1
- 101100011364 Caenorhabditis elegans egl-10 gene Proteins 0.000 description 1
- 101100512899 Caenorhabditis elegans mes-3 gene Proteins 0.000 description 1
- 241000949049 Caldiserica Species 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000269333 Caudata Species 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 241001185363 Chlamydiae Species 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 241000191368 Chlorobi Species 0.000 description 1
- 241001142109 Chloroflexi Species 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 108010058699 Choline O-acetyltransferase Proteins 0.000 description 1
- 102100023460 Choline O-acetyltransferase Human genes 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 102000017589 Chromo domains Human genes 0.000 description 1
- 108050005811 Chromo domains Proteins 0.000 description 1
- 241001143290 Chrysiogenetes <phylum> Species 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 102100036444 Clathrin interactor 1 Human genes 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 102100026280 Cryptochrome-2 Human genes 0.000 description 1
- 101710119767 Cryptochrome-2 Proteins 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 102100025191 Cyclin-A2 Human genes 0.000 description 1
- 108010072220 Cyclophilin A Proteins 0.000 description 1
- 241001044073 Cypa Species 0.000 description 1
- 108010019961 Cysteine-Rich Protein 61 Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102100027816 Cytotoxic and regulatory T-cell molecule Human genes 0.000 description 1
- 108091070972 DELLA family Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000289632 Dasypodidae Species 0.000 description 1
- 241001143296 Deferribacteres <phylum> Species 0.000 description 1
- 241000192095 Deinococcus-Thermus Species 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102100030012 Deoxyribonuclease-1 Human genes 0.000 description 1
- 241000970811 Dictyoglomi Species 0.000 description 1
- 101100030375 Dictyostelium discoideum pho2a gene Proteins 0.000 description 1
- 101100421450 Drosophila melanogaster Shark gene Proteins 0.000 description 1
- 102100028981 Dual specificity phosphatase 29 Human genes 0.000 description 1
- 101710117072 Dual specificity protein phosphatase Proteins 0.000 description 1
- 102100037569 Dual specificity protein phosphatase 10 Human genes 0.000 description 1
- 102100028944 Dual specificity protein phosphatase 13 isoform B Human genes 0.000 description 1
- 102100037567 Dual specificity protein phosphatase 14 Human genes 0.000 description 1
- 102100037568 Dual specificity protein phosphatase 15 Human genes 0.000 description 1
- 102100037570 Dual specificity protein phosphatase 16 Human genes 0.000 description 1
- 102100037574 Dual specificity protein phosphatase 18 Human genes 0.000 description 1
- 102100034430 Dual specificity protein phosphatase 19 Human genes 0.000 description 1
- 102100028987 Dual specificity protein phosphatase 2 Human genes 0.000 description 1
- 102100034427 Dual specificity protein phosphatase 21 Human genes 0.000 description 1
- 102100033992 Dual specificity protein phosphatase 22 Human genes 0.000 description 1
- 102100034133 Dual specificity protein phosphatase 23 Human genes 0.000 description 1
- 102100024673 Dual specificity protein phosphatase 3 Human genes 0.000 description 1
- 102100027085 Dual specificity protein phosphatase 4 Human genes 0.000 description 1
- 102100027088 Dual specificity protein phosphatase 5 Human genes 0.000 description 1
- 102100027274 Dual specificity protein phosphatase 6 Human genes 0.000 description 1
- 102100027275 Dual specificity protein phosphatase 7 Human genes 0.000 description 1
- 102100027272 Dual specificity protein phosphatase 8 Human genes 0.000 description 1
- 102100021160 Dual specificity protein phosphatase 9 Human genes 0.000 description 1
- 102100025734 Dual specificity protein phosphatase CDC14A Human genes 0.000 description 1
- 102100025699 Dual specificity protein phosphatase CDC14B Human genes 0.000 description 1
- 102100025736 Dual specificity protein phosphatase CDC14C Human genes 0.000 description 1
- 102000012804 EPCAM Human genes 0.000 description 1
- 101150084967 EPCAM gene Proteins 0.000 description 1
- 102100023078 Early endosome antigen 1 Human genes 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 241000257465 Echinoidea Species 0.000 description 1
- 101710088786 Elongation factor 3 Proteins 0.000 description 1
- 241001260322 Elusimicrobia <phylum> Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 102100030013 Endoribonuclease Human genes 0.000 description 1
- 101710199605 Endoribonuclease Proteins 0.000 description 1
- 108010055196 EphA2 Receptor Proteins 0.000 description 1
- 102100030340 Ephrin type-A receptor 2 Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102100020903 Ezrin Human genes 0.000 description 1
- 102000018700 F-Box Proteins Human genes 0.000 description 1
- 108010066805 F-Box Proteins Proteins 0.000 description 1
- 102000000302 FF domains Human genes 0.000 description 1
- 108050008754 FF domains Proteins 0.000 description 1
- 108010008177 Fd immunoglobulins Proteins 0.000 description 1
- 241000923108 Fibrobacteres Species 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 102000008892 Forkhead-associated (FHA) domains Human genes 0.000 description 1
- 108050000846 Forkhead-associated (FHA) domains Proteins 0.000 description 1
- 241001251094 Formica Species 0.000 description 1
- 241001453172 Fusobacteria Species 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000053717 GAT domains Human genes 0.000 description 1
- 108700036072 GAT domains Proteins 0.000 description 1
- 102000012324 GRAM domains Human genes 0.000 description 1
- 108050002831 GRAM domains Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 102000004878 Gelsolin Human genes 0.000 description 1
- 108090001064 Gelsolin Proteins 0.000 description 1
- 241001265526 Gemmatimonadetes <phylum> Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 239000005980 Gibberellic acid Substances 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 102100025894 Glomulin Human genes 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010018962 Glucosephosphate Dehydrogenase Proteins 0.000 description 1
- 102000000340 Glucosyltransferases Human genes 0.000 description 1
- 108010055629 Glucosyltransferases Proteins 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 102100032530 Glypican-3 Human genes 0.000 description 1
- 102000009465 Growth Factor Receptors Human genes 0.000 description 1
- 108010009202 Growth Factor Receptors Proteins 0.000 description 1
- 102100032510 Heat shock protein HSP 90-beta Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 1
- 101710083479 Hepatitis A virus cellular receptor 2 homolog Proteins 0.000 description 1
- 102100022557 Hepatocyte growth factor-regulated tyrosine kinase substrate Human genes 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 108010056307 Hin recombinase Proteins 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 108010077223 Homer Scaffolding Proteins Proteins 0.000 description 1
- 102000010029 Homer Scaffolding Proteins Human genes 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101000777636 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Proteins 0.000 description 1
- 101000724231 Homo sapiens Abl interactor 2 Proteins 0.000 description 1
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 description 1
- 101000884305 Homo sapiens B-cell receptor CD22 Proteins 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 101000716065 Homo sapiens C-C chemokine receptor type 7 Proteins 0.000 description 1
- 101000713099 Homo sapiens C-C motif chemokine 20 Proteins 0.000 description 1
- 101000884298 Homo sapiens CD226 antigen Proteins 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 101000934356 Homo sapiens CD70 antigen Proteins 0.000 description 1
- 101000851951 Homo sapiens Clathrin interactor 1 Proteins 0.000 description 1
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 1
- 101000838329 Homo sapiens Dual specificity phosphatase 29 Proteins 0.000 description 1
- 101000924017 Homo sapiens Dual specificity protein phosphatase 1 Proteins 0.000 description 1
- 101000881127 Homo sapiens Dual specificity protein phosphatase 10 Proteins 0.000 description 1
- 101000838551 Homo sapiens Dual specificity protein phosphatase 13 isoform A Proteins 0.000 description 1
- 101000838549 Homo sapiens Dual specificity protein phosphatase 13 isoform B Proteins 0.000 description 1
- 101000881116 Homo sapiens Dual specificity protein phosphatase 14 Proteins 0.000 description 1
- 101000881114 Homo sapiens Dual specificity protein phosphatase 15 Proteins 0.000 description 1
- 101000881117 Homo sapiens Dual specificity protein phosphatase 16 Proteins 0.000 description 1
- 101000881099 Homo sapiens Dual specificity protein phosphatase 18 Proteins 0.000 description 1
- 101000924027 Homo sapiens Dual specificity protein phosphatase 19 Proteins 0.000 description 1
- 101000838335 Homo sapiens Dual specificity protein phosphatase 2 Proteins 0.000 description 1
- 101000924011 Homo sapiens Dual specificity protein phosphatase 21 Proteins 0.000 description 1
- 101001017467 Homo sapiens Dual specificity protein phosphatase 22 Proteins 0.000 description 1
- 101001017408 Homo sapiens Dual specificity protein phosphatase 23 Proteins 0.000 description 1
- 101001017415 Homo sapiens Dual specificity protein phosphatase 26 Proteins 0.000 description 1
- 101000908482 Homo sapiens Dual specificity protein phosphatase 3 Proteins 0.000 description 1
- 101001057621 Homo sapiens Dual specificity protein phosphatase 4 Proteins 0.000 description 1
- 101001057612 Homo sapiens Dual specificity protein phosphatase 5 Proteins 0.000 description 1
- 101001057587 Homo sapiens Dual specificity protein phosphatase 6 Proteins 0.000 description 1
- 101001057603 Homo sapiens Dual specificity protein phosphatase 7 Proteins 0.000 description 1
- 101001057604 Homo sapiens Dual specificity protein phosphatase 8 Proteins 0.000 description 1
- 101000968556 Homo sapiens Dual specificity protein phosphatase 9 Proteins 0.000 description 1
- 101000932600 Homo sapiens Dual specificity protein phosphatase CDC14A Proteins 0.000 description 1
- 101000932592 Homo sapiens Dual specificity protein phosphatase CDC14B Proteins 0.000 description 1
- 101000932594 Homo sapiens Dual specificity protein phosphatase CDC14C Proteins 0.000 description 1
- 101001050162 Homo sapiens Early endosome antigen 1 Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101001014668 Homo sapiens Glypican-3 Proteins 0.000 description 1
- 101001016856 Homo sapiens Heat shock protein HSP 90-beta Proteins 0.000 description 1
- 101001045469 Homo sapiens Hepatocyte growth factor-regulated tyrosine kinase substrate Proteins 0.000 description 1
- 101001103039 Homo sapiens Inactive tyrosine-protein kinase transmembrane receptor ROR1 Proteins 0.000 description 1
- 101001053263 Homo sapiens Insulin gene enhancer protein ISL-1 Proteins 0.000 description 1
- 101000998151 Homo sapiens Interleukin-17F Proteins 0.000 description 1
- 101000853000 Homo sapiens Interleukin-26 Proteins 0.000 description 1
- 101000697493 Homo sapiens Large proline-rich protein BAG6 Proteins 0.000 description 1
- 101001138062 Homo sapiens Leukocyte-associated immunoglobulin-like receptor 1 Proteins 0.000 description 1
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 1
- 101001023379 Homo sapiens Lysosome-associated membrane glycoprotein 1 Proteins 0.000 description 1
- 101000991061 Homo sapiens MHC class I polypeptide-related sequence B Proteins 0.000 description 1
- 101001133056 Homo sapiens Mucin-1 Proteins 0.000 description 1
- 101000623901 Homo sapiens Mucin-16 Proteins 0.000 description 1
- 101000934338 Homo sapiens Myeloid cell surface antigen CD33 Proteins 0.000 description 1
- 101000978766 Homo sapiens Neurogenic locus notch homolog protein 1 Proteins 0.000 description 1
- 101000577199 Homo sapiens Neurogenic locus notch homolog protein 2 Proteins 0.000 description 1
- 101000577202 Homo sapiens Neurogenic locus notch homolog protein 3 Proteins 0.000 description 1
- 101000577163 Homo sapiens Neurogenic locus notch homolog protein 4 Proteins 0.000 description 1
- 101001024605 Homo sapiens Next to BRCA1 gene 1 protein Proteins 0.000 description 1
- 101001103036 Homo sapiens Nuclear receptor ROR-alpha Proteins 0.000 description 1
- 101001067833 Homo sapiens Peptidyl-prolyl cis-trans isomerase A Proteins 0.000 description 1
- 101000741800 Homo sapiens Peptidyl-prolyl cis-trans isomerase H Proteins 0.000 description 1
- 101000738757 Homo sapiens Phosphatidylglycerophosphatase and protein-tyrosine phosphatase 1 Proteins 0.000 description 1
- 101001136592 Homo sapiens Prostate stem cell antigen Proteins 0.000 description 1
- 101000643424 Homo sapiens Protein phosphatase Slingshot homolog 1 Proteins 0.000 description 1
- 101000643431 Homo sapiens Protein phosphatase Slingshot homolog 2 Proteins 0.000 description 1
- 101000704457 Homo sapiens Protein phosphatase Slingshot homolog 3 Proteins 0.000 description 1
- 101000881131 Homo sapiens RNA/RNP complex-1-interacting phosphatase Proteins 0.000 description 1
- 101001068027 Homo sapiens Serine/threonine-protein phosphatase 2A catalytic subunit alpha isoform Proteins 0.000 description 1
- 101001068019 Homo sapiens Serine/threonine-protein phosphatase 2A catalytic subunit beta isoform Proteins 0.000 description 1
- 101000611254 Homo sapiens Serine/threonine-protein phosphatase 2B catalytic subunit beta isoform Proteins 0.000 description 1
- 101000611251 Homo sapiens Serine/threonine-protein phosphatase 2B catalytic subunit gamma isoform Proteins 0.000 description 1
- 101001068219 Homo sapiens Serine/threonine-protein phosphatase 4 catalytic subunit Proteins 0.000 description 1
- 101000620653 Homo sapiens Serine/threonine-protein phosphatase 5 Proteins 0.000 description 1
- 101000620662 Homo sapiens Serine/threonine-protein phosphatase 6 catalytic subunit Proteins 0.000 description 1
- 101000595252 Homo sapiens Serine/threonine-protein phosphatase PP1-alpha catalytic subunit Proteins 0.000 description 1
- 101001095320 Homo sapiens Serine/threonine-protein phosphatase PP1-beta catalytic subunit Proteins 0.000 description 1
- 101001095368 Homo sapiens Serine/threonine-protein phosphatase PP1-gamma catalytic subunit Proteins 0.000 description 1
- 101000661463 Homo sapiens Serine/threonine/tyrosine-interacting-like protein 2 Proteins 0.000 description 1
- 101000831007 Homo sapiens T-cell immunoreceptor with Ig and ITIM domains Proteins 0.000 description 1
- 101000914484 Homo sapiens T-lymphocyte activation antigen CD80 Proteins 0.000 description 1
- 101000797332 Homo sapiens Trem-like transcript 2 protein Proteins 0.000 description 1
- 101000818543 Homo sapiens Tyrosine-protein kinase ZAP-70 Proteins 0.000 description 1
- 101000772888 Homo sapiens Ubiquitin-protein ligase E3A Proteins 0.000 description 1
- 101000621529 Homo sapiens Vacuolar protein-sorting-associated protein 36 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 101100273566 Humulus lupulus CCL10 gene Proteins 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 102100039615 Inactive tyrosine-protein kinase transmembrane receptor ROR1 Human genes 0.000 description 1
- 102100024392 Insulin gene enhancer protein ISL-1 Human genes 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 102000004559 Interleukin-13 Receptors Human genes 0.000 description 1
- 108010017511 Interleukin-13 Receptors Proteins 0.000 description 1
- 102100020793 Interleukin-13 receptor subunit alpha-2 Human genes 0.000 description 1
- 102000013691 Interleukin-17 Human genes 0.000 description 1
- 108050003558 Interleukin-17 Proteins 0.000 description 1
- 102100033454 Interleukin-17F Human genes 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000010789 Interleukin-2 Receptors Human genes 0.000 description 1
- 108010038453 Interleukin-2 Receptors Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 108010029660 Intrinsically Disordered Proteins Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 102000017578 LAG3 Human genes 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 101710196180 Large proline-rich protein BAG6 Proteins 0.000 description 1
- 101000839464 Leishmania braziliensis Heat shock 70 kDa protein Proteins 0.000 description 1
- 101000988090 Leishmania donovani Heat shock protein 83 Proteins 0.000 description 1
- 241001387859 Lentisphaerae Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102100020943 Leukocyte-associated immunoglobulin-like receptor 1 Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 102100026238 Lymphotoxin-alpha Human genes 0.000 description 1
- 108090000542 Lymphotoxin-alpha Proteins 0.000 description 1
- 102100035133 Lysosome-associated membrane glycoprotein 1 Human genes 0.000 description 1
- 102000019149 MAP kinase activity proteins Human genes 0.000 description 1
- 108040008097 MAP kinase activity proteins Proteins 0.000 description 1
- 102100030300 MHC class I polypeptide-related sequence B Human genes 0.000 description 1
- 208000000172 Medulloblastoma Diseases 0.000 description 1
- 102000000440 Melanoma-associated antigen Human genes 0.000 description 1
- 108050008953 Melanoma-associated antigen Proteins 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102100027869 Moesin Human genes 0.000 description 1
- 101150097381 Mtor gene Proteins 0.000 description 1
- 108010008707 Mucin-1 Proteins 0.000 description 1
- 102100023123 Mucin-16 Human genes 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100381525 Mus musculus Bcl6 gene Proteins 0.000 description 1
- 101100013967 Mus musculus Gata3 gene Proteins 0.000 description 1
- 101000969137 Mus musculus Metallothionein-1 Proteins 0.000 description 1
- 102100025243 Myeloid cell surface antigen CD33 Human genes 0.000 description 1
- 102000004390 N-Ethylmaleimide-Sensitive Proteins Human genes 0.000 description 1
- 108010081735 N-Ethylmaleimide-Sensitive Proteins Proteins 0.000 description 1
- 101150088133 NPLOC4 gene Proteins 0.000 description 1
- 208000021320 Nasu-Hakola disease Diseases 0.000 description 1
- 241001602876 Nata Species 0.000 description 1
- 102100034437 Neurabin-2 Human genes 0.000 description 1
- 108091014434 Neurabin-2 Proteins 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 101100049938 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) exr-1 gene Proteins 0.000 description 1
- 241000121237 Nitrospirae Species 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 108010027206 Nucleopolyhedrovirus inhibitor of apoptosis Proteins 0.000 description 1
- 101000615348 Oryza sativa subsp. indica DELLA protein SLR1 Proteins 0.000 description 1
- 101710160107 Outer membrane protein A Proteins 0.000 description 1
- 102000002131 PAS domains Human genes 0.000 description 1
- 108050009469 PAS domains Proteins 0.000 description 1
- 102000000470 PDZ domains Human genes 0.000 description 1
- 108050008994 PDZ domains Proteins 0.000 description 1
- 102000014434 POLO box domains Human genes 0.000 description 1
- 108050003399 POLO box domains Proteins 0.000 description 1
- 102000025443 POZ domain binding proteins Human genes 0.000 description 1
- 108091014659 POZ domain binding proteins Proteins 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000009353 PWWP domains Human genes 0.000 description 1
- 108050000223 PWWP domains Proteins 0.000 description 1
- 101150023830 PYR1 gene Proteins 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 101710111747 Peptidyl-prolyl cis-trans isomerase FKBP12 Proteins 0.000 description 1
- 102100038827 Peptidyl-prolyl cis-trans isomerase H Human genes 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 102100032543 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Human genes 0.000 description 1
- 102000017343 Phosphatidylinositol kinases Human genes 0.000 description 1
- 108050005377 Phosphatidylinositol kinases Proteins 0.000 description 1
- 241001180199 Planctomycetes Species 0.000 description 1
- 102100030264 Pleckstrin Human genes 0.000 description 1
- 102000010995 Pleckstrin homology domains Human genes 0.000 description 1
- 108050001185 Pleckstrin homology domains Proteins 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 1
- 102100036735 Prostate stem cell antigen Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100031952 Protein 4.1 Human genes 0.000 description 1
- 101710196266 Protein 4.1 Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102000002727 Protein Tyrosine Phosphatase Human genes 0.000 description 1
- 101710155415 Protein phosphatase 2C 56 Proteins 0.000 description 1
- 101710155286 Protein phosphatase 2C 77 Proteins 0.000 description 1
- 101710204571 Protein phosphatase PP2A regulatory subunit A Proteins 0.000 description 1
- 241000192142 Proteobacteria Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102100039233 Pyrin Human genes 0.000 description 1
- 108010059278 Pyrin Proteins 0.000 description 1
- 108091008551 RET receptors Proteins 0.000 description 1
- 102000011287 RGS domains Human genes 0.000 description 1
- 108050001541 RGS domains Proteins 0.000 description 1
- 102100037566 RNA/RNP complex-1-interacting phosphatase Human genes 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 102100022127 Radixin Human genes 0.000 description 1
- 101001023863 Rattus norvegicus Glucocorticoid receptor Proteins 0.000 description 1
- 241000242739 Renilla Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 102000000886 SPRY domains Human genes 0.000 description 1
- 108050007917 SPRY domains Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100138728 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PUF4 gene Proteins 0.000 description 1
- 241000269622 Salamandridae Species 0.000 description 1
- 101710113029 Serine/threonine-protein kinase Proteins 0.000 description 1
- 102100034464 Serine/threonine-protein phosphatase 2A catalytic subunit alpha isoform Human genes 0.000 description 1
- 102100034470 Serine/threonine-protein phosphatase 2A catalytic subunit beta isoform Human genes 0.000 description 1
- 101710123826 Serine/threonine-protein phosphatase 2B catalytic subunit alpha isoform Proteins 0.000 description 1
- 102100040321 Serine/threonine-protein phosphatase 2B catalytic subunit beta isoform Human genes 0.000 description 1
- 101710159636 Serine/threonine-protein phosphatase 2B catalytic subunit beta isoform Proteins 0.000 description 1
- 102100040320 Serine/threonine-protein phosphatase 2B catalytic subunit gamma isoform Human genes 0.000 description 1
- 101710158561 Serine/threonine-protein phosphatase 2B catalytic subunit gamma isoform Proteins 0.000 description 1
- 102100034492 Serine/threonine-protein phosphatase 4 catalytic subunit Human genes 0.000 description 1
- 102100022346 Serine/threonine-protein phosphatase 5 Human genes 0.000 description 1
- 102100022345 Serine/threonine-protein phosphatase 6 catalytic subunit Human genes 0.000 description 1
- 102100036033 Serine/threonine-protein phosphatase PP1-alpha catalytic subunit Human genes 0.000 description 1
- 102100037764 Serine/threonine-protein phosphatase PP1-beta catalytic subunit Human genes 0.000 description 1
- 102100037761 Serine/threonine-protein phosphatase PP1-gamma catalytic subunit Human genes 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 108050002485 Sirtuin Proteins 0.000 description 1
- 102000011990 Sirtuin Human genes 0.000 description 1
- 241001180364 Spirochaetes Species 0.000 description 1
- 241000713896 Spleen necrosis virus Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000390529 Synergistetes Species 0.000 description 1
- 230000005867 T cell response Effects 0.000 description 1
- 108700042075 T-Cell Receptor Genes Proteins 0.000 description 1
- 229940126547 T-cell immunoglobulin mucin-3 Drugs 0.000 description 1
- 102100024834 T-cell immunoreceptor with Ig and ITIM domains Human genes 0.000 description 1
- 102100027222 T-lymphocyte activation antigen CD80 Human genes 0.000 description 1
- 101150057140 TACSTD1 gene Proteins 0.000 description 1
- 108010065917 TOR Serine-Threonine Kinases Proteins 0.000 description 1
- 101710187864 TYRO protein tyrosine kinase-binding protein Proteins 0.000 description 1
- 241000131694 Tenericutes Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241001143138 Thermodesulfobacteria <phylum> Species 0.000 description 1
- 241001143310 Thermotogae <phylum> Species 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108010064672 Tre-Recombinase Proteins 0.000 description 1
- 102100032990 Trem-like transcript 2 protein Human genes 0.000 description 1
- 102000009322 Tudor domains Human genes 0.000 description 1
- 108050000178 Tudor domains Proteins 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- 108010064978 Type II Site-Specific Deoxyribonucleases Proteins 0.000 description 1
- 102100021125 Tyrosine-protein kinase ZAP-70 Human genes 0.000 description 1
- 102100030434 Ubiquitin-protein ligase E3A Human genes 0.000 description 1
- 102100022960 Vacuolar protein-sorting-associated protein 36 Human genes 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241001261005 Verrucomicrobia Species 0.000 description 1
- 108010031770 Vesicular Transport Adaptor Proteins Proteins 0.000 description 1
- 102000005456 Vesicular Transport Adaptor Proteins Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 102100033220 Xanthine oxidase Human genes 0.000 description 1
- 108010093894 Xanthine oxidase Proteins 0.000 description 1
- 241000760364 Xenopus mellotropicalis Species 0.000 description 1
- 102000044820 Zonula Occludens-1 Human genes 0.000 description 1
- 108700007340 Zonula Occludens-1 Proteins 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010004469 allophycocyanin Proteins 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 102000004111 amphiphysin Human genes 0.000 description 1
- 108090000686 amphiphysin Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000012292 cell migration Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 108010072917 class-I restricted T cell-associated molecule Proteins 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 238000001553 co-assembly Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000016396 cytokine production Effects 0.000 description 1
- 102000003675 cytokine receptors Human genes 0.000 description 1
- 108010057085 cytokine receptors Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000007402 cytotoxic response Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000009504 deubiquitination Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 108010002591 epsilon receptor Proteins 0.000 description 1
- 102000007336 epsin Human genes 0.000 description 1
- 108010032643 epsin Proteins 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 108010055671 ezrin Proteins 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 1
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 108700026078 glutathione trisulfide Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000003811 gtp phosphohydrolase activator Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 238000005734 heterodimerization reaction Methods 0.000 description 1
- VKYKSIONXSXAKP-UHFFFAOYSA-N hexamethylenetetramine Chemical compound C1N(C2)CN3CN1CN2C3 VKYKSIONXSXAKP-UHFFFAOYSA-N 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 102000045609 human NOTCH1 Human genes 0.000 description 1
- 102000046883 human NOTCH2 Human genes 0.000 description 1
- 102000045550 human NOTCH3 Human genes 0.000 description 1
- 102000047120 human NOTCH4 Human genes 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000005931 immune cell recruitment Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 210000005007 innate immune system Anatomy 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108040003607 interleukin-13 receptor activity proteins Proteins 0.000 description 1
- 108010074109 interleukin-22 Proteins 0.000 description 1
- 230000031146 intracellular signal transduction Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 210000002510 keratinocyte Anatomy 0.000 description 1
- 101150109249 lacI gene Proteins 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 230000000503 lectinlike effect Effects 0.000 description 1
- 238000002898 library design Methods 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000005226 mechanical processes and functions Effects 0.000 description 1
- 210000002752 melanocyte Anatomy 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 210000002783 mesonephros Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- VKHAHZOOUSRJNA-GCNJZUOMSA-N mifepristone Chemical compound C1([C@@H]2C3=C4CCC(=O)C=C4CC[C@H]3[C@@H]3CC[C@@]([C@]3(C2)C)(O)C#CC)=CC=C(N(C)C)C=C1 VKHAHZOOUSRJNA-GCNJZUOMSA-N 0.000 description 1
- 229960003248 mifepristone Drugs 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 108010071525 moesin Proteins 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000002894 multi-fate stem cell Anatomy 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 102000042628 natural cytotoxicity receptor (NCR) family Human genes 0.000 description 1
- 108091053394 natural cytotoxicity receptor (NCR) family Proteins 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000005580 one pot reaction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 108091053402 pellino family Proteins 0.000 description 1
- 102000042635 pellino family Human genes 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 108010026735 platelet protein P47 Proteins 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 208000031334 polycystic lipomembranous osteodysplasia with sclerosing leukoencephaly Diseases 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 210000003538 post-synaptic density Anatomy 0.000 description 1
- 108010092804 postsynaptic density proteins Proteins 0.000 description 1
- 210000000229 preadipocyte Anatomy 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- LFULEKSKNZEWOE-UHFFFAOYSA-N propanil Chemical compound CCC(=O)NC1=CC=C(Cl)C(Cl)=C1 LFULEKSKNZEWOE-UHFFFAOYSA-N 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 230000009993 protective function Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000009822 protein phosphorylation Effects 0.000 description 1
- 108020000494 protein-tyrosine phosphatase Proteins 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 108010048484 radixin Proteins 0.000 description 1
- 102000016914 ras Proteins Human genes 0.000 description 1
- 238000011552 rat model Methods 0.000 description 1
- 101150101384 rat1 gene Proteins 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 150000004492 retinoid derivatives Chemical class 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000011808 rodent model Methods 0.000 description 1
- 108091008601 sVEGFR Proteins 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229910052594 sapphire Inorganic materials 0.000 description 1
- 239000010980 sapphire Substances 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 108010035597 sphingosine kinase Proteins 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 101150065190 term gene Proteins 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 239000011031 topaz Substances 0.000 description 1
- 229910052853 topaz Inorganic materials 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 102000003390 tumor necrosis factor Human genes 0.000 description 1
- 150000003668 tyrosines Chemical class 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
Description
Перекрестная ссылка
Изобретение испрашивает приоритет согласно предварительной заявке на патент США №62/212999, поданной 1 сентября 2015 года, содержание которой полностью включено в изобретение посредством ссылки.
Заявление об исследованиях, финансируемых из федерального бюджета.
Настоящее изобретение было выполнено при государственной поддержке в рамках грантов EY016546, Р50 GM081879, R01 СА196277, F32 GM006499 и R01 GM055040, присужденных Национальными институтами здравоохранения (США). Правительство США обладает определенными правами на настоящее изобретение.
Включение перечня последовательностей, предоставленного в виде текстового файла, посредством ссылки.
Перечень последовательностей предоставлен в настоящем изобретении в виде текстового файла UCSF-518WO SeqList_ST25.txt, созданного 29 августа 2016 года и имеющего размер 145 килобайт. Содержимое текстового файла полностью включено в изобретение посредством ссылки.
Введение
Многие эукариотические белки осуществляют свои функции с помощью модульных доменов или мотивов, которые контролируют или облегчают входные и выходные функции белка в целом. В настоящее время существуют способы перегруппировки и рекомбинации модульных доменов эукариотических белков, позволяющие создавать новые белки с измененными соотношениями входных/выходных функций и совершенно новыми общими функциями. Успешное конструирование отдельных модульных белков путем простой рекомбинации доменов, опосредующих входные и выходные функции, послужило доказательством принципа упомянутого модульного подхода к разработке новых белков.
Конструирование новых синтетических белков, например, для применения в терапевтических клетках, до настоящего времени осуществляли на основании подхода последовательного создания конструкций. Аналогичным образом, трансфекцию и скрининг таких синтетических белков также выполняли с использованием низкопроизводительного подхода, используя отдельные конструкции, которые подвергали скринингу на индивидуальной основе, или, в некоторых случаях, небольшое количество отдельных конструкций подвергали одновременному скринингу. Одновременный скрининг, несмотря на то, что он является более эффективным, чем скрининг отдельных конструкций на индивидуальной основе, имеет ограниченную масштабируемость вследствие требования, заключающегося в том, что отдельные конструкции должны оставаться физически раздельными, чтобы облегчить окончательную идентификацию эффективных конструкций. Индивидуальный скрининг большого количества новых белков является обременительным при проведении количественного исследования в условиях in vitro, но становится еще более неприемлемо затруднительным и дорогостоящим при переходе испытаний к стадии количественных исследований, проводимых в моделях в условиях in vivo. Упомянутое индивидуальное получение и индивидуальный скрининг значительно ограничивают скорость разработки новых синтетических белков.
Краткое описание изобретения
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследования в условиях in vitro и в условиях in vivo.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает: а) введение в клетки-хозяева библиотеки, содержащей нуклеиновые кислоты-штрихкоды, с получением гетерогенной популяции генетически модифицированных клеток-хозяев, причем указанная библиотека нуклеиновых кислот-штрихкодов содержит множество элементов, при этом каждый из множества элементов содержит нуклеотидную последовательность, кодирующую отличающийся синтетический модульный полипептид; и b) идентификацию генетически модифицированной клетки-хозяина в гетерогенной популяции, которая проявляет выбранный фенотип в ответ на стимул.
В настоящем изобретении также предложен способ, в котором синтетический модульный полипептид представляет собой полипептид химерного антигенного рецептора (CAR) и в котором стимул представляет собой антигенпрезентирующую клетку, которая экспрессирует на своей поверхности антиген, который связан с CAR.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный стимул вступает в контакт с костимулирующей молекулой.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный
- 1 046546 полипептид представляет собой модульный рецепторный полипептид.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный модульный рецепторный полипептид представляет собой химерный полипептид рецептора Notch.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный стимул представляет собой лиганд химерного полипептида рецептора Notch.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный каркасный белок.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный белок протеинкиназы или протеинфосфатазы.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный транскрипционный регуляторный белок.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный эпигенетический регуляторный белок.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный белок рекомбиназы или нуклеазы.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный выбранный фенотип имеет отличительную черту фенотипа, включающую два или более фенотипов.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий секвенирование нуклеиновой последовательности-штрихкода из идентифицированной генетически модифицированной клетки-хозяина для идентификации синтетического модульного полипептида, связанного с фенотипом.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий количественное определение синтетического модульного полипептида, связанного с фенотипом.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий количественное определение отдельного модуля синтетических модульных полипептидов из библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая связана с фенотипом.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем каждая нуклеотидная последовательность, кодирующая отличающийся синтетический модульный полипептид, содержит последовательность, кодирующую детектируемый репортер, который функционально соединен с нуклеотидной последовательностью, кодирующей синтетический модульный полипептид, причем указанный способ дополнительно включает разделение гетерогенной популяции генетически модифицированных клеток-хозяев на основании экспрессируемого детектируемого репортера.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем идентификацию выполняют в условиях in vitro или в условиях ex vivo.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный фенотип представляет собой один или более из: а) пролиферации; b) выработки цитокинов; с) экспрессии маркера клеточной поверхности; d) экспрессии репортерного белка.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит 100 или более уникальных элементов, и идентификация включает скрининг 100 или более уникальных элементов библиотеки для выбранного фенотипа.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержащую множество элементов, при этом каждый из множества элементов содержит нуклеотидную последовательность, кодирующую синтетический модульный полипептид, содержащий модульный домен, выбранный из группы, состоящей из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутри- 2 046546 клеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка SUМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.
В настоящем изобретении предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, причем указанная библиотека содержит: множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, при этом каждый уникальный полинуклеотид содержит: i) кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, ii) область нуклеиновой последовательности-штрихкода, содержащую первую нуклеиновую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и при этом секвенирование каждой области нуклеиновой последовательности-штрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой указанная первая и вторая кодирующие последовательности непосредственно соединены без каких-либо промежуточных некодирующих нуклеотидов.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой множество уникальных полинуклеотидов содержит по меньшей мере 1000 уникальных полинуклеотидов.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой область нуклеиновой последовательностиштрихкода расположена в направлении 5'-конца относительно кодирующей области.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой кодирующая область расположена в направлении 5'-конца относительно области нуклеиновой последовательности-штрихкода.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанный уникальный синтетический модульный полипептид содержит костимулирующий домен.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, который содержит первый и второй модули, причем указанный первый и второй модули содержат различные костимулирующие домены.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая включает множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид дополнительно содержит промоторную последовательность, функционально соединенную с кодирующей областью и репортерной последовательностью, кодирующей детектируемый полипептид, причем указанный детектируемый полипептид представляет собой детектируемый оптическими способами полипептид, содержащий, например, детектируемый оптическими способами флуоресцентный полипептид.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, причем указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и область нуклеиновой последовательности-штрихкода содержит третью нуклеиновую последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нук
- 3 046546 леиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой полипептиды химерного антигенного рецептора (CAR).
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные рецепторные полипептиды.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих модульные рецепторные полипептиды, причем указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные каркасные белки.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки протеинкиназ или протеинфосфатаз.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные транскрипционные регуляторные белки.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные эпигенетические регуляторные белки.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки рекомбиназ или нуклеаз.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, содержат модульный домен, выбранный из группы состоящий из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка SUМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.
В настоящем изобретении предложна клеточная библиотека, содержащая: множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид содержит: i) кодирующую область, кодирующую уникальный синтетический модульный поли
- 4 046546 пептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, ii) область нуклеиновой последовательности-штрихкода, содержащую первую нуклеиновую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и при этом секвенирование каждой области нуклеиновой последовательностиштрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид каждой клетки библиотеки.
В настоящем изобретении также предложена клеточная библиотека, в которой клетки представляют собой прокариотические клетки или эукариотические клетки. В настоящем изобретении также предложена клеточная библиотека, в которой эукариотические клетки представляют собой клетки человека. В настоящем изобретении также предложена клеточная библиотека, в которой клетки человека представляют собой Т-клетки человека.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, причем указанная первая и вторая кодирующие последовательности непосредственно соединены без каких-либо промежуточных некодирующих нуклеотидов.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, причем указанная кодирующая область дополнительно содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью.
В настоящем изобретении также предложена клеточная библиотека, которая содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, причем указанный репортер представляет собой эпитопную метку.
В настоящем изобретении также предложена клеточная библиотека, которая содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, причем указанный репортер представляет собой флуоресцентный белок.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанное множество клеток содержит по меньшей мере 1000 уникальных полинуклеотидов.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, причем указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и область нуклеиновой последовательностиштрихкода содержит третью последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой полипептиды химерного антигенного рецептора (CAR).
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уни
- 5 046546 кальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные рецепторные полипептиды.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные каркасные белки.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки протеинкиназ или протеинфосфатаз.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные транскрипционные регуляторные белки.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные эпигенетические регуляторные белки.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки рекомбиназ или нуклеаз.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, содержат модульный домен, выбранный из группы, состоящей из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка SUМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.
В настоящем изобретении предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ включает: приведение первого полинуклеотида, содержащего последовательность, кодирующую первый модуль, соединенную с первой нуклеиновой последовательностью-штрихкодом, в контакт со вторым полинуклеотидом, содержащим последовательность, кодирующую второй модуль, соединенную со второй нуклеиновой последовательностьюштрихкодом, в условиях, достаточных для введения первого полинуклеотида во второй полинуклеотид в месте соединения второй кодирующей последовательности со второй нуклеиновой последовательностью-штрихкодом с получением бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ дополнительно включает приведение первого и второго полинуклеотидов в контакт с третьим полинуклеотидом, содержащим третью модульную
- 6 046546 кодирующую последовательность, соединенную с третьей нуклеиновой последовательностьюштрихкодом, причем указанный третий полинуклеотид встраивается в первый полинуклеотид в месте соединения первой кодирующей последовательности и первой нуклеиновой последовательностиштрихкода с получением трехмодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, при этом трехмодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с сохранением открытой рамки считывания с третьей модульной кодирующей последовательностью, соединенной с третьей нуклеиновой последовательностью-штрихкодом, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностьюштрихкодом.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанная первая и вторая модульные кодирующие последовательности соединены с сохранением открытой рамки считывания без каких-либо промежуточных некодирующих нуклеотидов.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанная библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержит 1000 или более уникальных нуклеиновых кислот, каждая из которых кодирует уникальный синтетический модульный полипептид.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанные нуклеиновые последовательности-штрихкоды расположены в направлении 5'-конца относительно последовательностей, кодирующих модули, или в направлении 3'-конца относительно последовательностей, кодирующих модули.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем введение первого полинуклеотида во второй полинуклеотид в месте соединения второй кодирующей последовательности и второй нуклеиновой последовательностиштрихкода опосредовано активностью фермента рестрикции, который распознает сайт распознавания фермента рестрикции на втором полинуклеотиде и расщепляет второй полинуклеотид между второй кодирующей последовательностью и второй нуклеиновой последовательностью-штрихкодом, включая случаи, когда используемый фермент рестрикции представляет собой фермент рестрикции типа II, включая случаи, когда используемый фермент рестрикции представляет собой фермент рестрикции типа IIS.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный первый полинуклеотид также содержит сайт распознавания фермента рестрикции, который присутствует на втором полинуклеотиде.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ дополнительно включает приведение бимодульных полинуклеотидов, содержащих нуклеиновые последовательности-штрихкоды, в контакт с полинуклеотидом, кодирующим репортер, в условиях, достаточных для введения полинуклеотида, кодирующего репортер, в бимодульный полинуклеотид, содержащий нуклеиновые последовательностиштрихкоды, в месте соединения первой модульной кодирующей последовательности и первой нуклеиновой последовательности-штрихкода с получением связанного с репортером бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный связанный с репортером бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с сохранением открытой рамки считывания с последовательностью, кодирующей репортер, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностьюштрихкодом. В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой последовательность, кодирующая репортер, кодирует эпитопную метку или флуоресцентный репортер.
В настоящем изобретении предложен химерный антигенный рецептор (CAR), идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR содержит по меньшей мере один комодулирующий домен, перечисленный в табл. 3 или табл. 4.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный
- 7 046546
CAR содержит CD19-специфичный антигенсвязывающий домен.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR содержит первичный сигнальный домен CD3-дзета.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR стимулирует активность Т-клеток и содержит по меньшей мере один костимулирующий домен, перечисленный в табл. 3.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR ингибирует активность Т-клеток и содержит по меньшей мере один коингибирующий домен, перечисленный в табл. 4.
В настоящем изобретении также предложена нуклеиновая кислота, кодирующая CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, включая, например, любой из CAR, описанных в настоящем документе.
Краткое описание чертежей
На фиг. 1 представлена модульная последовательность, содержащая нуклеиновую последовательность-штрихкод, субклонированная для сборки библиотеки согласно одному варианту реализации настоящего изобретения.
На фиг. 2 представлена модульная последовательность, содержащая нуклеиновую последовательность-штрихкод, показанная на фиг. 1, после расщепления ферментом рестрикции типа IIS при подготовке к сборке библиотеки.
На фиг. 3 представлен примерный фрагмент последовательности в соответствии с фиг. 1 (перед расщеплением ферментом рестрикции типа IIS (RE), SEQ ID NO: 16) и фиг. 2 (после расщепления ферментом рестрикции IIS, SEQ ID NO: 17), содержащий последовательность, кодирующую костимулирующий домен CD28 (трансляция фрагмента после расщепления ферментом рестрикции IIS, SEQ ID NO: 18).
На фиг. 4 представлена табл. 1. Идентификационные номера последовательностей для последовательностей, представленных в табл. 1, были следующими: индекс 1 - SEQ ID NO: 19; индекс 2 - SEQ ID NO: 20; индекс 3 - SEQ ID NO: 21; индекс 4 - SEQ ID NO: 22; индекс 5 - SEQ ID NO: 23; индекс 6 - SEQ ID NO: 24;
индекс 7 - SEQ ID NO: 25; индекс 8 - SEQ ID NO: 26; индекс 9 - SEQ ID NO: 27; индекс 10 - SEQ ID NO: 28; индекс 11 - SEQ ID NO: 29; индекс 12 - SEQ ID NO: 30; индекс 13 -SEQ ID NO: 31; индекс 14 SEQ ID NO: 32; индекс 15 - SEQ ID NO: 33; индекс 16 - SEQ ID NO: 34; индекс 17 - SEQ ID NO: 35; индекс 18 - SEQ ID NO: 36; индекс 19 - SEQ ID NO: 37; индекс 20 - SEQ ID NO: 38; индекс 21 - SEQ ID NO: 39; индекс 22 - SEQ ID NO: 40; индекс 23 - SEQ ID NO: 41; индекс 24 - SEQ ID NO: 42; индекс 25 - SEQ ID NO: 43; индекс 26 - SEQ ID NO: 44; индекс 27 - SEQ ID NO: 45; индекс 28 - SEQ ID NO: 46; индекс 29 - SEQ ID NO: 47; индекс 30 - SEQ ID NO: 48; индекс 31 - SEQ ID NO: 49; индекс 32 - SEQ ID NO: 50; индекс 33 - SEQ ID NO: 51; индекс 34 - SEQ ID NO: 52; индекс 35 - SEQ ID NO: 53; индекс 36 - SEQ ID NO: 54; индекс 37 - SEQ ID NO: 55; индекс 38 - SEQ ID NO: 56; индекс 39 - SEQ ID NO: 57; индекс 40 - SEQ ID NO: 58; индекс 41 - SEQ ID NO: 59; индекс 42 - SEQ ID NO: 60; индекс 43 - SEQ ID NO: 61; индекс 44 - SEQ ID NO: 62; индекс 45 - SEQ ID NO: 63; индекс 46 - SEQ ID NO: 64; индекс 47 - SEQ ID NO: 65; индекс 48 - SEQ ID NO: 66; индекс 49 - SEQ ID NO: 67; индекс 50 - SEQ ID NO: 68; индекс 51 - SEQ ID NO: 69; индекс 52 - SEQ ID NO: 70; индекс 53 - SEQ ID NO: 71; индекс 54 - SEQ ID NO: 72; индекс 55 - SEQ ID NO: 73; индекс 56 - SEQ ID NO: 74; индекс 57 - SEQ ID NO: 75; индекс 58 - SEQ ID NO: 76; индекс 59 - SEQ ID NO: 77; индекс 60 - SEQ ID NO: 26; индекс 61 - SEQ ID NO: 26; индекс 62 - SEQ ID NO: 26.
На фиг. 5 представлена общая схема ступенчатой сборки двумерной библиотеки комодулирующих модулей, содержащей нуклеиновые последовательности-штрихкоды, в соответствии с одним вариантом реализации настоящего изобретения.
На фиг. 6 представлена общая схема получения двумерной библиотеки из 62x62 комодулирующих модулей согласно одному варианту реализации настоящего изобретения.
На фиг. 7 представлена общая конфигурация элементов одномерной библиотеки химерных антигенных рецепторов (CAR) в соответствии с одним вариантом реализации настоящего изобретения.
На фиг. 8 представлены результаты функциональной сортировки (т.е. бининга) стимулированных CAR-экспрессирующих Т-клеток на основании конечного уровня активации.
На фиг. 9 представлены результаты количественной оценки относительного влияния каждого комодулирующего домена библиотеки на активность Т-клеток, которую осуществляли с помощью количественного секвенирования специфичных для модуля последовательностей-штрихкодов.
На фиг. 10 представлены характеристики зависимости ответа от дозы для шести комодулирующих доменов при трех повышающихся уровнях вносимого антигена, полученные с использованием 62элементной одномерной библиотеки.
На фиг. 11 представлен неограничивающий пример библиотеки CAR, который свидетельствует о
- 8 046546 том, что различные домены CAR могут варьироваться в библиотеке в соответствии с одним вариантом реализации настоящего изобретения.
На фиг. 12 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 13 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 14 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 15 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 16 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 17 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 18 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 19 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 20 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 21 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.
На фиг. 22 представлена схема стратегии комбинаторной вложенной сборки библиотеки модульных химерных антигенных рецепторов (CAR) в соответствии с вариантом реализации настоящего изобретения.
На фиг. 23 представлена схема получения объединенной клеточной модульной библиотеки CAR в соответствии с вариантом реализации настоящего изобретения.
На фиг. 24 представлен схематичный пример интегрированного способа детектирования фенотипа и идентификации модульного полипептида для применения в условиях in vitro и/или в условиях in vivo в соответствии с вариантом реализации настоящего изобретения.
На фиг. 25 представлена табл. 2.
На фиг. 26 исчерпывающе представлен каждый элемент двумерной библиотеки из 61x61 элемента, согласно результатам определения путем глубокого секвенирования собранной библиотеки.
На фиг. 27 представлены результаты количественной оценки элементов предварительно нормированной комбинаторной библиотеки нуклеиновых кислот, описанной в настоящем документе.
На фиг. 28 представлено линейное уравнение, использованное при расчете корректировок для нормирования, относящихся к элементам библиотеки, количественно определенным, как показано на фиг. 27.
На фиг. 29 представлены результаты, подтверждающие предсказуемость корректировок для нормирования, выполненных в соответствии с описанным в настоящем документе способом.
Определения
В настоящем изобретении термины полинуклеотид и нуклеиновая кислота используются взаимозаменяемо и относятся к полимерной форме нуклеотидов любой длины, как рибонуклеотидов, так и дезоксирибонуклеотидов. Следовательно, данный термин включает, но не ограничивается ими, одно-, двух- или многоцепочечную ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК или полимер, содержащий пуриновые и пиримидиновые основания или другие природные, химически или биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания.
В настоящем изобретении термины полипептид, пептид и белок используются взаимозаменяемо и относятся к полимерной форме аминокислот любой длины, которая может включать генетически кодируемые и не кодируемые генетически аминокислоты, химически или биохимически модифицированные или дериватизированные аминокислоты и полипептиды, имеющие модифицированные пептидные остовы. Термин включает гибридные белки, включая, но не ограничиваясь ими, гибридные белки с гетерологичной аминокислотной последовательностью, гибриды с гетерологичными и гомологичными лидерными последовательностями, с N-концевыми остатками метионина или без указанных остатков; иммунологически меченые белки; и т.п.
В настоящем изобретении термины домен и мотив используются взаимозаменяемо и относятся к структурированным доменам, имеющим одну или более конкретных функций, и неструктурированным сегментам полипептида, которые, несмотря на отсутствие структурированности, сохраняют одну или более конкретных функций. Например, структурированный домен может включать, но не ограничивается ими, непрерывное или дискретное множество аминокислот, или их частей, в свернутом полипептиде, который имеет трехмерную структуру, которая вносит вклад в определенную функцию полипептида. В других случаях домен может включать неструктурированный сегмент полипептида, содержащий множе
- 9 046546 ство из двух или более аминокислот, или их частей, который поддерживает определенную функцию полипептида, развернутого или неупорядоченного. Данное определение также включает домены, которые могут быть неупорядоченными или неструктурированными, но становятся структурированными или упорядоченными при связывании с мишенью или партнером по связыванию. Неограничивающие примеры исходно неструктурированных доменов и доменов исходно неструктурированных белков описаны, например, в Dyson & Wright. Nature Reviews Molecular Cell Biology 6:197-208.
В настоящем изобретении термин модуль относится к непрерывной полипептидной последовательности или ее фрагменту, который связан с той или иной функцией, в частности с биологической функцией.
В настоящем изобретении термины химерный антигенный рецептор и CAR используются взаимозаменяемо и относятся к искусственным многомодульным молекулам, способным инициировать или ингибировать активацию иммунной клетки, которые обычно, но не исключительно, содержат внеклеточный домен (например, домен, связывающий лиганд/антиген), трансмембранный домен и один или более внутриклеточных сигнальных доменов. Термин CAR не ограничивается конкретными молекулами CAR, а также включает варианты CAR. Варианты CAR включают разделенные CAR, в которых внеклеточная часть (например, участок связывания лиганда) и внутриклеточная часть (например, внутриклеточная сигнальная часть) CAR присутствуют на двух отдельных молекулах. Варианты CAR также включают CAR-включатели и CAR-выключатели, которые представляют собой активируемые/подавляемые при определенных условиях CAR, например, указанные варианты включают расщепленный CAR, в котором условная гетеродимеризация двух частей расщепленного CAR контролируется фармакологически. Варианты CAR также включают биспецифичные CAR, которые содержат домен связывания дополнительного CAR, который может усиливать или ингибировать активность основного CAR. Варианты CAR также включают ингибиторные химерные антигенные рецепторы (iCAR), которые можно применять, например, в качестве компонента биспецифичной системы CAR, когда связывание домена связывания с дополнительным CAR приводит к ингибированию активации основного CAR. Молекулы CAR и их производные (т.е. варианты CAR) описаны, например, в заявке РСТ US2014/016527; Fedorov et al. Sci Transl Med (2013) ;5(215):215ra172; Glienke et al. Front Pharmacol (2015) 6:21; Kakarla & Gottschalk 52 Cancer J (2014) 20(2):151-5; Riddell et al. Cancer J (2014) 20(2):141-4; Pegram et al. Cancer J (2014) 20(2): 127-33; Cheadle et al. Immunol Rev (2014) 257(1):91-106; Barrett et al. Annu Rev Med (2014) 65:333-47; Sadelain et al. Cancer Discov (2013) 3(4):388-98; Cartellieri et al., J Biomed Biotechnol (2010) 956304, содержание которых полностью включено в настоящее изобретение посредством ссылки.
Термин ген относится к определенной единице наследственности, присутствующей в определенном локусе в генетическом компоненте организма. Ген может представлять собой последовательность нуклеиновой кислоты, например, последовательность ДНК или РНК, присутствующую в геноме нуклеиновых кислот, геноме ДНК или РНК, организма, и, в некоторых случаях, может присутствовать на хромосоме. Ген может представлять собой последовательность ДНК, кодирующую мРНК, которая кодирует белок. Г ен может состоять из одного экзона и может не иметь интронов или может содержать несколько экзонов и один или более интронов. Одна из двух или более идентичных или альтернативных форм гена, присутствующих в определенном локусе, называется аллель, и, например, диплоидный организм обычно будет иметь два аллеля определенного гена. Новые аллели определенного гена могут возникнуть природным или искусственным путем посредством природной или индуцированной мутации и могут распространяться путем размножения или клонирования. Ген или аллель может быть выделен из генома организма и реплицирован и/или подвергнут манипуляциям, или ген или аллель может быть модифицирован в условиях in situ методами генной терапии. Локус гена или аллель может иметь связанные регуляторные элементы, и генная терапия, в некоторых случаях, может включать модификацию регуляторных элементов гена или аллеля, оставляя кодирующие последовательности гена или аллеля немодифицированными.
Термин функционально соединенный относится к сопоставлению, при котором описанные компоненты взаимосвязаны, что позволяет им функционировать предполагаемым способом. Например, промотор функционально соединен с кодирующей последовательностью, если промотор влияет на ее транскрипцию или экспрессию.
Вектор или вектор экспрессии представляет собой репликон, такой как плазмида, фаг, вирус или космида, к которому может быть присоединен другой сегмент ДНК, т.е. вставка, чтобы вызвать репликацию присоединенного сегмента в клетке.
В настоящем изобретении термин гетерологичный означает нуклеотидную или полипептидную последовательность, которая не встречается в нативной (например, природной) нуклеиновой кислоте или белке, соответственно.
Термины антитела и иммуноглобулин включают антитела или иммуноглобулины любого изотипа, фрагменты антител, которые сохраняют специфичное связывание с антигеном, включая, но не ограничиваясь ими, фрагменты Fab, Fv, scFv и Fd, химерные антитела, гуманизированные антитела, одноцепочечные антитела и гибридные белки, содержащие антигенсвязывающую часть антитела и белка, не относящегося к антителам.
- 10 046546
Фрагменты антитела содержат часть интактного антитела, например, антигенсвязывающую или вариабельную область интактного антитела. Примеры фрагментов антител включают фрагменты Fab, Fab', F(ab')2 и Fv; диатела; линейные антитела (Zapata et al., Protein Eng. 8(10): 1057-1062 (1995)); молекулы одноцепочечных антител; и полиспецифичные антитела, образованные из фрагментов антител. Расщепление антител папаином позволяет получить два идентичных антигенсвязывающих фрагмента, называемых фрагментами Fab, каждый из которых содержит один антигенсвязывающий сайт, и остаточный фрагмент Fc, обозначение, которое отражает способность фрагмента легко кристаллизоваться. Обработка пепсином позволяет получить фрагмент F(ab')2, который содержит два антигенсвязывающих сайта и по-прежнему способен к сшиванию антигена.
Одноцепочечные Fv или sFv фрагменты антитела содержат домены VH и VL антитела, причем указанные домены присутствуют в одной полипептидной цепи. Согласно некоторым вариантам реализации настоящего изобретения полипептид Fv дополнительно содержит полипептидный линкер между доменами VH и VL, который позволяет sFv формировать желаемую структуру для связывания антигена. Для обзора sFv см. Pluckthun in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds., Springer-Verlag, New York, pp. 269-315 (1994).
В настоящем изобретении термин аффинность относится к константе равновесия для обратимого связывания двух агентов и выражается как константа диссоциации (Kd). Аффинность может быть по меньшей мере в 1 раз больше, по меньшей мере в 2 раза больше, по меньшей мере в 3 раза больше, по меньшей мере в 4 раза больше, по меньшей мере в 5 раз больше, по меньшей мере в 6 раз больше, по меньшей мере в 7 раз больше, по меньшей мере в 8 раз больше, по меньшей мере в 9 раз больше, по меньшей мере в 10 раз больше, по меньшей мере в 20 раз больше, по меньшей мере в 30 раз больше, по меньшей мере в 40 раз больше, по меньшей мере в 50 раз больше, по меньшей мере в 60 раз больше, по меньшей мере в 70 раз больше, по меньшей мере в 80 раз больше, по меньшей мере в 90 раз больше, по меньшей мере в 100 раз больше или по меньшей мере в 1000 раз больше или более, чем аффинность антитела в отношении нецелевых аминокислотных последовательностей. Аффинность антитела в отношении целевого белка может быть, например, от приблизительно 100 наномоль (нМ) до приблизительно 0,1 нМ, от приблизительно 100 нМ до приблизительно 1 пикомоль (пМ) или от приблизительно 100 нМ до приблизительно 1 фемтомоль (фМ) или более.
Термин связывание относится к непосредственной связи двух молекул посредством, например, ковалентных, электростатических, гидрофобных и ионных и/или водородных связей, включая такие взаимодействия как солевые мостики и водные мостики. Неспецифичное связывание относится к связыванию с величиной аффинности менее приблизительно 10-7 М, например, к связыванию с аффинностью 106 М, 10-5 М, 10-4М и т.д.
В настоящем изобретении термин иммунные клетки обычно включает белые клетки крови (лейкоциты), которые получены из гемопоэтических стволовых клеток (HSC), вырабатываемых в костном мозге. Иммунные клетки включают, например, лимфоциты (Т-клетки, В-клетки, природные клеткикиллеры (NK)) и клетки миелоидного происхождения (нейтрофилы, эозинофилы, базофилы, моноциты, макрофаги и дендритные клетки).
Термин Т-клетка включает все типы иммунных клеток, экспрессирующих CD3, включая хелперные Т-клетки (CD4+ клетки), цитотоксические Т-клетки (CD8+ клетки), регуляторные Т-клетки (Treg) и гамма-дельта Т-клетки.
Термин цитотоксическая клетка включает CD8+ Т-клетки, природные клетки-киллеры (NK) и нейтрофилы, которые способны опосредовать цитотоксические ответы.
В настоящем изобретении термин стволовая клетка обычно включает плюрипотентные или мультипотентные стволовые клетки. Стволовые клетки включают, например, эмбриональные стволовые клетки (ES); мезенхимальные стволовые клетки (MSC); индуцированные плюрипотентные стволовые клетки (iPS); и коммитированные клетки-предшественники (гемопоэтические стволовые клетки (HSC), клетки, полученные из костного мозга, и т.д.).
В настоящем изобретении термин лечение, лечащий и т.п. относятся к получению желательного фармакологического и/или физиологического действия. Действие может быть профилактическим с точки зрения полного или частичного предотвращения заболевания или его симптома и/или может быть терапевтическим с точки зрения частичного или полного излечения заболевания и/или нежелательного явления, связанного с заболеванием. В настоящем изобретении термин лечение охватывает любой способ лечения заболевания у млекопитающего, например, у человека, и включает: (а) предотвращение возникновения заболевания у субъекта, который может быть предрасположен к заболеванию, но у которого данное заболевание еще не было диагностировано; (b) ингибирование заболевания, т.е. прекращение его развития; и (с) облегчение заболевания, т.е. индукцию регресса заболевания.
В настоящем изобретении термины индивидуум, субъект, хозяин и пациент используются взаимозаменяемо и относятся к млекопитающему, включая, но не ограничиваясь ими, мышевидных грызунов (например, крыс, мышей), зайцеобразных (например, кроликов), приматов, отличных от человека, человека, собачьих, кошачьих, копытных (например, лошадей, крупный рогатый скот, овец, свиней, коз) и т.д.
- 11 046546
Терапевтически эффективное количество или эффективное количество относится к количеству агента, или комбинированным количествам двух агентов, которое, при введении млекопитающему или другому субъекту для лечения заболевания, является достаточным для осуществления указанного лечения заболевания. Терапевтически эффективное количество будет варьироваться в зависимости от агента(ов), заболевания и степени его тяжести, а также от возраста, массы и т.д., субъекта, подлежащего лечению.
Термины контроль, контрольная реакция, контрольное количественное исследование и т.п. относятся к реакции, тесту или другой части экспериментальной или диагностической процедуры или дизайна эксперимента, для которых ожидаемый результат известен с высокой степенью достоверности, например, для того чтобы указать, являются ли результаты, полученные из соответствующих экспериментальных образцов надежными, указать с какой степенью достоверности соответствующие экспериментальные результаты указывают на истинный результат и/или чтобы обеспечить калибровку экспериментальных результатов. Например, в некоторых случаях, контроль может представлять собой отрицательный контроль так, что существенный компонент количественного исследования исключается из реакции отрицательного контроля так, что экспериментатор может иметь высокую степень уверенности в том, что реакция отрицательного контроля не приведет к положительному результату. В некоторых случаях контроль может представлять собой положительный контроль так, что все компоненты конкретного количественного исследования охарактеризованы и известны, при их объединении, для получения конкретного результата в количественном исследовании, выполняемом экспериментатором, который может иметь высокую степень уверенности в том, что реакция положительного контроля не приведет к отсутствию положительного результата.
В настоящем изобретении термин праймер или олигонуклеотидный праймер относится к олигонуклеотиду, который инициирует синтез комплементарной цепи нуклеиновой кислоты в условиях, когда индуцируется синтез продукта удлинения праймера, например, в присутствии нуклеотидов и агента, индуцирующего полимеризацию, такого как ДНК- или РНК-полимераза, и при подходящей температуре, рН, концентрации металлов и концентрации соли. Праймеры обычно имеют длину, совместимую с их использованием при синтезе продуктов удлинения праймера, и могут иметь длину, которая находиться в диапазоне от 8 до 100 нуклеотидов, например, от 10 до 75, от 15 до 60, от 15 до 40, от 18 до 30, от 20 до 40, от 21 до 50, от 22 до 45, от 25 до 40 и т.д., включая диапазон 18-40, 20-35, 21-30 нуклеотидов и любую длину в пределах указанных диапазонов. В некоторых случаях длина праймеров может находиться в пределах диапазона от 10 до 50 нуклеотидов, например, 15-45, 18-40, 20-30, 21-25 и т.д., и праймер может иметь любую длину в пределах указанных диапазонов. Согласно некоторым вариантам реализации настоящего изобретения праймеры обычно содержат не более 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65 или 70 нуклеотидов.
Термины гибридизоваться и гибридизация относятся к образованию комплексов между нуклеотидными последовательностями, которые достаточно комплементарны, чтобы образовывать комплексы посредством спаривания оснований по Уотсону-Крику. Например, при гибридизации праймера с мишенью (матрицей) такие комплексы (или гибриды) достаточно стабильны, чтобы обеспечивать прайминг, необходимый, например, для инициирования синтеза ДНК ДНК-полимеразой.
Термин биологический образец включает множество типов образцов, полученных от индивидуума или популяции индивидуумов, и может быть использован в диагностическом, контрольном или скрининговом количественном исследовании. Определение включает кровь и другие жидкие образцы биологического происхождения, образцы плотных тканей, такие как образец биопсии или культур тканей или полученные из них клетки и их потомство. Определение также включает образцы, которые были обработаны каким-либо образом после их получения, например, путем смешивания или объединения отдельных образцов, обработки реагентами, солюбилизации или обогащения определенными компонентами, такие как клетки, полинуклеотиды, полипептиды и т.д. Термин биологический образец включает клинический образец, а также включает клетки в культуре, клеточные супернатанты, клеточные лизаты, сыворотку, плазму, биологическую жидкость и образцы тканей. Термин биологический образец включает мочу, слюну, спинномозговую жидкость, интерстициальную жидкость, глазную жидкость, синовиальную жидкость, фракции крови, такие как плазма крови и сыворотка крови, и т.п. Термин биологический образец также включает образцы плотных тканей, образцы культур тканей и клеточные образцы.
Термин оценка включает любую форму измерения и включает определение присутствия или отсутствия элемента. Термины определение, измерение, исследование, оценка и количественное исследование используются взаимозаменяемо и включают количественные и качественные определения. Оценка может быть относительной или абсолютной. Оценка присутствия включает определение количества присутствующего объекта и/или определение его присутствия или отсутствия. В настоящем изобретении термины определение, измерение и оценка и количественное исследование используются взаимозаменяемо и включают количественные и качественные определения.
Настоящее изобретение будет дополнительно описано ниже, однако следует понимать, что настоящее изобретение не ограничено конкретными описанными вариантами реализации, поскольку очевидно, что они могу варьироваться. Также следует понимать, что терминология, используемая в настоящем до
- 12 046546 кументе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения, поскольку объем настоящего изобретения будет ограничен только прилагаемой формулой изобретения.
В тех случаях, когда представлен диапазон значений, следует понимать, что каждое промежуточное значение, до десятой части единицы нижнего предела, если из контекста явно не следует иное, между верхним и нижним пределом указанного диапазона и любым другим заявленным или промежуточным значением в указанном диапазоне, включено в область настоящего изобретения. Верхний и нижний пределы указанных меньших диапазонов могут быть независимо включены в меньшие диапазоны и также включены в область настоящего изобретения, с учетом любого конкретно исключенного предела в указанном диапазоне. В тех случаях, когда указанный диапазон включает один или оба предела, в область настоящего изобретения также включены диапазоны, исключающие один или оба из указанных включенных пределов.
Если не указано иное, в настоящем изобретении все технические и научные термины имеют то же значение, которое обычно понятно специалисту в данной области техники, к которой относится настоящее изобретение. Несмотря на то, что любые способы и материалы, аналогичные или эквивалентные тем, которые описаны в настоящем документе, также могут быть использованы при реализации настоящего изобретения или при испытаниях настоящего изобретения, в настоящем документе описаны предпочтительные способы и материалы. Все публикации, упомянутые в настоящем документе, включены в настоящее изобретение посредством ссылки для раскрытия и описания способов и/или материалов, в связи с которыми цитируются публикации.
Следует отметить, что в настоящем изобретении и в прилагаемой формуле изобретения формы единственного числа a, an и the включают множественные формы референтов, если из контекста явно не следует иное. Например, ссылка на полипептид включает множество таких полипептидов, и ссылка на антиген включает ссылку на один или более антигенов и их эквивалентов, известных специалистам в данной области техники, и т.д. Также следует отметить, что формула настоящего изобретения может быть составлена для исключения любого необязательного элемента. Следовательно, данное заявление предназначено для применения в качестве предшествующей основы для использования такой исключающей терминологии как исключительно, только и т.п. в отношении описания элементов формулы настоящего изобретения или использования отрицательного ограничения.
Следует понимать, что некоторые признаки настоящего изобретения, которые для ясности описаны применительно к отдельным вариантам реализации, также могут быть представлены в комбинации в одном варианте реализации. И наоборот, различные признаки изобретения, которые для краткости описаны применительно к одному варианту реализации, также могут быть представлены по отдельности или в любой подходящей дополнительной комбинации. Все комбинации вариантов реализации, относящихся к настоящему изобретению, конкретно охватываются настоящим изобретением и раскрыты в настоящем документе точно так же, как если бы каждая комбинация была индивидуально и явно раскрыта. Помимо этого все дополнительные комбинации различных вариантов реализации и их элементов также конкретно включены в область настоящего изобретения и раскрыты в настоящем документе точно так же, как если бы каждая такая дополнительная комбинация была индивидуально и явно раскрыта в настоящем документе.
Публикации, обсуждаемые в настоящем документе, представлены исключительно для их раскрытия до даты подачи настоящего изобретения. Ничто из содержащегося в настоящем документе не должно быть истолковано как допущение того, что изобретение не имеет права предшествовать такому раскрытию на основании предшествующего изобретения. Помимо этого даты представленных публикаций могут отличаться от фактических дат публикаций, которые, возможно, необходимо будет подтвердить самостоятельно.
Подробное описание изобретения
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследованиях в условиях in vitro и в условиях in vivo.
Библиотеки.
Аспекты настоящего изобретения относятся к библиотекам нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которые кодируют множество синтетических модульных полипептидов. Аспекты настоящего изобретения также включают клеточные библиотеки, в которых каждая клетка экспрессирует отдельную нуклеиновую кислоту, содержащую нуклеиновую последовательность-штрихкод, кодирующую уникальный синтетический модульный полипептид, или множество указанных индивидуальных нуклеиновых кислот, содержащих нуклеиновые последовательности
- 13 046546 штрихкоды. Как описано более подробно ниже, аспекты настоящего изобретения также включают способы получения указанных библиотек и способы скрининга указанных библиотек для детектирования конкретных фенотипов.
Библиотеки нуклеиновых кислот согласно настоящему изобретению обычно комбинаторно собраны из модульных компонентов и включают многозвенную последовательность-штрихкод, которую можно секвенировать, чтобы определить идентичность и конфигурацию модульных компонентов каждого элемента библиотеки. Следовательно, каждый отдельный элемент библиотеки нуклеиновых кислот будет содержать по меньшей мере кодирующую область и область нуклеиновой последовательностиштрихкода. В настоящем изобретении термин кодирующая область, поскольку он относится к отдельным элементам библиотеки нуклеиновых кислот, относится к области каждой нуклеиновой кислоты, которая кодирует синтетический полипептид, представляющий интерес, например, синтетический полипептид, содержащий один или более полипептидных модулей, которые могут быть подвергнуты скринингу для определения их влияния на конкретный желательный или нежелательный фенотип. В некоторых случаях кодирующая область может дополнительно содержать последовательности, кодирующие репортерную молекулу, например, молекулу, которая используется для детектирования и/или измерения экспрессии представляющего интерес синтетического полипептида.
Кодирующая область обычно кодирует один модульный полипептид, более подробно описанный ниже; однако настоящее описание не исключает библиотеки, в которых кодирующая область каждого элемента библиотеки кодирует два или более отдельных модульных полипептидов. Такие элементы библиотеки могут включать одну кодирующую область, которая является полицистронной (например, бицистронной, полицистронной и т.д.), например, путем включения разделимого линкера (например, участка внутренней посадки рибосомы (IRES), рибосомальной шунтирующей последовательности, нуклеиновой кислоты, кодирующей саморасщепляющийся пептид, и т.д.) между последовательностями, кодирующими разделяемые модульные полипептиды. Кодирующая область, содержащая последовательность, кодирующую два или более отдельных модульных полипептидов, будет непрерывной и будет собрана и подвергнута скринингу в соответствии со способами, описанными в настоящем документе для одномодульных полипептидных конструкций.
Кодирующая область будет содержать вариабельные модули и невариабельные модули, причем предполагаемый способ применения библиотеки будет определять, является ли конкретная часть синтетического модульного полипептида вариабельной или невариабельной. Вариабельные модули кодирующей области обычно представляют собой те модули, которые подвергают скринингу, индивидуально или комбинаторно, для определения функционального свойства и/или влияния на представляющий интерес фенотип. В целом, вариабельные модули будут связаны с последовательностью-штрихкодом, идентифицирующей модуль, тогда как невариабельные модули не будут связаны с последовательностьюштрихкодом. Любой модуль может служить вариабельным или невариабельным модулем в зависимости от конструкции конкретной библиотеки и/или способа скрининга, с которым связана библиотека.
В качестве неограничивающего примера в некоторых вариантах реализации, в которых кодирующая область кодирует химерный антигенный рецептор (CAR), любой модуль CAR может служить в качестве вариабельного модуля в зависимости от активности CAR, которую подвергают скринингу, включая, помимо прочего, внеклеточный домен, корегуляторный домен или первичный сигнальный домен. Например, на фиг. 11 представлен один элемент библиотеки CAR, в которой каждый член библиотеки содержит внеклеточный домен, корегуляторный домен и первичный сигнальный домен и предоставляет неограничивающие примеры случаев, когда каждый домен может служить в качестве вариабельного модуля.
В некоторых случаях внеклеточный домен может быть вариабельным модулем, например, в тех случаях, когда интерес представляет нацеленное воздействие на антиген, в тех случаях, когда интерес представляет сила взаимодействия между антигеном и внеклеточным доменом и т.д. В некоторых случаях корегуляторный домен может быть вариабельным модулем, например, в тех случаях, когда индивидуальный корегуляторный домен или комбинации корегуляторных доменов должны быть подвергнуты скринингу для оценки совместной модуляции функциональной активности. В некоторых случаях первичный сигнальный домен может быть вариабельным модулем, например, в тех случаях, когда различные внутриклеточные пути передачи сигналов должны быть подвергнуты скринингу.
В качестве неограничивающего примера, в некоторых случаях, кодируемый синтетический модульный полипептид может представлять собой химерный полипептид рецептора Notch, содержащий внеклеточный связывающий домен, расщепляемый домен полипептида рецептора Notch (включая индуцируемый связыванием сайт расщепления) и внутриклеточный домен. Подходящие химерные полипептиды рецептора Notch и их домены включают, но не ограничиваются ими, например, те, которые описаны в заявке на патент США РСТ US0201/019188; содержание которой полностью включено в настоящее изобретение посредством ссылки. В некоторых случаях один или более доменов химерного полипептида рецептора Notch служат в качестве вариабельного домена, включая, но не ограничиваясь ими, например, внеклеточный связывающий домен, домен полипептида рецептора Notch, внутриклеточный домен, внеклеточный связывающий домен и домен полипептида рецептора Notch, внеклеточный связывающий до
- 14 046546 мен и внутриклеточный домен или домен полипептида рецептора Notch и внутриклеточный домен.
Невариабельные модули, включенные в кодирующую область, будут выбраны, если это необходимо, так, чтобы все элементы библиотеки имели функцию невариабельного модуля, т.е. когда функция, которая обеспечивается невариабельным модулем, поддерживается постоянной во всех элементах библиотеки. В качестве неограничивающих примеров, в некоторых случаях, внеклеточный домен, корегуляторный домен или первичный сигнальный домен, описанные выше, могут служить в качестве невариабельных модулей, если это необходимо, или если для проведения количественного исследования необходимо, чтобы все элементы библиотеки имели функцию внеклеточного домена, корегуляторного домена или первичного сигнального домена. В качестве неограничивающих примеров, в некоторых случаях, внеклеточный связывающий домен, расщепляемый домен полипептида рецептора Notch или внутриклеточный домен, описанные выше, могут представлять собой невариабельные модули, если это необходимо, или если для проведения количественного исследования необходимо, чтобы все элементы библиотеки имели функцию внеклеточного связывающего домена, расщепляемого домена полипептида рецептора Notch или внутриклеточного домена.
В зависимости от конкретных применяемых модулей и скринингового количественного исследования, для которых используется библиотека согласно настоящему изобретению, кодирующая область каждого элемента библиотеки может кодировать любую комбинацию вариабельных и невариабельных модулей, при этом простейшая кодирующая область кодирует только вариабельный модуль. В некоторых случаях каждый отдельный элемент библиотеки, например, каждый вектор, в который вставлен вариабельный модуль, может содержать, перед вставкой вариабельного модуля, одну или более кодирующих последовательностей так, что при вставке вариабельного модуля кодирующая область будет содержать вариабельный модуль и ранее существовавшие кодирующие последовательности, которые могут содержать невариабельный модуль и/или немодульную кодирующую последовательность или не содержать их. В некоторых случаях такая ранее существовавшая кодирующая последовательность, которая присутствует во всех элементах библиотеки, может упоминаться как константный домен.
В некоторых случаях кодирующая область может кодировать два или более вариабельных модулей, включая, но не ограничиваясь ими, например, три или более вариабельных модулей, четыре или более вариабельных модулей, пять или более вариабельных модулей, шесть или более вариабельных модулей, семь или более вариабельных модулей, восемь или более вариабельных модулей и т.д. В некоторых случаях кодирующая область может кодировать два или более невариабельных модулей, включая, но не ограничиваясь ими, например, три или более невариабельных модулей, четыре или более невариабельных модулей, пять или более невариабельных модулей, шесть или более невариабельных модулей, семь или более невариабельных модулей, восемь или более невариабельных модулей и т.д. Количество вариабельных и невариабельных модулей в кодирующей области может быть лимитировано практическими ограничениями способа клонирования кодирующей последовательности и конструирования библиотеки.
Количество уникальных элементов библиотеки, кодирующей уникальные синтетические модульные полипептиды, будет зависеть от количества вариабельных модулей, используемых при конструировании библиотеки и общей предполагаемой сложности библиотеки. Согласно некоторым вариантам реализации настоящего изобретения сложность библиотеки может быть описана применительно к размерности библиотеки, причем размерность библиотеки коррелирует с количеством последовательностей, кодирующих вариабельные модули, которые присутствуют в кодирующей области элементов библиотеки. Следовательно, одномерная библиотека содержит одну последовательность, кодирующую вариабельный модуль, в каждой кодирующей области каждого элемента библиотеки, двумерная библиотека содержит две последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки, трехмерная библиотека содержит три последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки, четырехмерная библиотека содержит четыре последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки и так далее.
Размерность библиотеки не обязательно должна быть однородной во всей библиотеке, и, следовательно, в некоторых случаях, библиотека может иметь смешанную размерность. Под смешанной размерностью подразумевается, что библиотека содержит элементы библиотеки, отличные от одномерных, описанных выше. Например, библиотека может быть частично одномерной, частично двумерной, частично трехмерной и т.д. Указанные библиотеки со смешанной размерностью могут представлять собой смешанные одно- и двумерные библиотеки, двух- и трехмерные библиотеки, одно, двух- и трехмерные библиотеки и т.д. Представленные описания библиотек со смешанной размерностью не являются ограничивающими, и специалист в данной области техники легко поймет, что разнообразие библиотек со смешанной размерностью, включенных в область настоящего изобретения, выходит далеко за рамки явно описанных.
Следовательно, количество уникальных элементов библиотеки, кодирующих уникальные синтетические модульные полипептиды, будет различаться и будет являться результатом размерности библиотеки и количества модулей, использованных при конструировании библиотеки. Например, одномерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20 уникаль
- 15 046546 ных элементов библиотеки. Двумерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20x20 (т.е. 400) уникальных элементов библиотеки. Трехмерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20x20x20 (т.е. 8000) уникальных элементов библиотеки. В некоторых случаях уникальный элемент библиотеки из многомерной библиотеки может содержать две или более последовательностей, кодирующих один и тот же вариабельный модуль.
В некоторых случаях, когда каждый элемент библиотеки содержит два или более вариабельных модулей, указанные модули могут иметь конкретное положение, это означает, что подмножество вариабельных модулей может быть помещено только в определенном месте в пределах синтетического модульного полипептида по отношению к другим вариабельным модулям. Например, синтетический модульный полипептид, содержащий два вариабельных модуля, может содержать первый набор и второй набор вариабельных модулей, причем модули первого набора всегда находятся в определенном положении относительно модулей второго набора. Следовательно, двумерная библиотека, сконструированная с учетом специфичного положения модулей, состоящая из 30 уникальных вариабельных модулей, включая первый набор из 10 уникальных вариабельных модулей и второй набор из 20 уникальных вариабельных модулей, может содержать 10x20 (т.е. 200) уникальных элементов библиотеки.
Специалист в данной области техники легко поймет значительную изменчивость конфигураций библиотек, учитывая описанную выше вариабельную размерность и вариабельные количества модулей, которые могут быть объединены, с использованием специфичных положений или без них, при конструировании библиотек согласно настоящему изобретению. Следовательно, общее количество уникальных элементов библиотеки будет сильно варьироваться и может находиться в пределах диапазона от менее чем 20 до 50000 и более, включая, но не ограничиваясь ими, например, 20 или более, 30 или более, 40 или более, 50 или более, 60 или более 70 или более, 80 или более, 90 или более, 100 или более, 150 или более, 200 или более, 250 или более, 300 или более, 350 или более, 400 или более, 450 или более, 500 или более, 550 или более, 600 или более, 650 или более, 700 или более, 750 или более, 800 или более, 850 или более, 900 или более, 950 или более, 1000 или более, 1500 или более, 2000 или более, 2500 или более, 3000 или более, 3500 или более, 4000 или более, 4500 или более, 5000 или более, 5500 или более, 6000 или более, 6500 или более, 7000 или более, 7500 или более, 8000 или более, 8500 или более, 9000 или более, 9500 или более, 10000 или более, 20000 или более, 30000 и более, 40000 или более, 50000 и более и т.д.
В тех случаях, когда многомерные библиотеки сконструированы путем объединения, общее количество уникальных элементов библиотеки в пуле может значительно варьироваться и может находиться в пределах диапазона от менее чем 20 до 50000 или более, как описано выше, и может иметь более высокую степень разнообразия, включая, но не ограничиваясь указанными, например, 105 или более, 106 или более, 107 или более, 108 или более, или 109 или более.
Уникальные элементы библиотек, описанные в настоящем документе, не обязательно должны быть физически упорядочены для целей конструирования библиотеки или скрининга. Как описано более подробно ниже, комбинаторная сборка компонентов нуклеиновых кислот, кодирующих каждый синтетический модульный полипептид, и совместная сборка многозвенных последовательностей-штрихкодов с помощью способа, который характеризует идентичность и ориентацию собранных модулей, обеспечивает однореакторный синтез и общий скрининг библиотек, описанных в настоящем документе. Следовательно, библиотека, и множество уникальных элементов библиотеки, может присутствовать в одном подходящем растворе и/или присутствовать в одном подходящем контейнере.
Синтетические модульные полипептиды
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие синтетические модульные полипептиды. Под модульным полипептидом подразумевают функциональный белок, содержащий два или более функционально связанных модульных компонентов, так, что модули физически соединены и совместно функционируют в одной молекуле полипептида. Модули модульного полипептида могут иметь связанные или несвязанные функции или виды активности. Во многих вариантах реализации по меньшей мере два из модульных компонентов синтетических модульных полипептидов получены из отдельных белков. Модули, полученные из отдельных белков, могут быть получены из различных белков, которые функционально не связаны или функционально связаны, и могут быть получены из разных молекул организма, из одной и той же молекулы организма, разных ортологичных белков, различных паралогичных белков и т.д.
Согласно некоторым вариантам реализации настоящего изобретения отдельные элементы библиотеки синтетических модульных полипептидов, описанной в настоящем документе, будут включать, как минимум, модуль, который является членом специфичной связывающейся пары (например, связывающейся пары антиген-антитело, связывающейся пары лиганд-рецептор и т.д.), и функциональный или сигнальный модуль, который участвует в индукции клеточного ответа. В некоторых случаях элемент конкретной связывающейся пары может быть упомянут в настоящем документе как внеклеточный домен или внеклеточный распознаваемый домен. В некоторых случаях элемент конкретной связывающейся
- 16 046546 пары может относиться к белку, участвующему в сигнальном взаимодействии белок-белок, или к белку, участвующему во взаимодействии белок-липид.
Во многих вариантах реализации элемент конкретной связывающейся пары, который можно применять в отдельных элементах библиотеки, может включать антигенсвязывающий домен. Антигенсвязывающий домен, подходящий для применения в элементах библиотеки согласно настоящему изобретению, может представлять собой любой антигенсвязывающий полипептид, широкий спектр которых известен в данной области техники. В некоторых случаях антигенсвязывающий домен представляет собой одноцепочечный фрагмент Fv (scFv). Для применения подходят другие домены распознавания на основе антител (cAb VHH (вариабельные домены антител верблюдовых) и гуманизированные варианты, IgNAR VH (вариабельные домены антител акул) и гуманизированные варианты, sdAb VH (вариабельные домены однодоменных антител) и вариабельные домены антител, содержащих фрагменты антител верблюдовых. В некоторых случаях для применения также подходят домены распознавания на основе Тклеточных рецепторов (TCR), таких как одноцепочечный TCR (scTv, одноцепочечный двухдоменный TCR, содержащий VaVe).
Антигенсвязывающий домен, подходящий для применения в элементах библиотек согласно настоящему изобретению, может иметь множество видов антигенсвязывающей специфичности. В некоторых случаях антигенсвязывающий домен специфичен в отношении эпитопа, присутствующего в антигене, который экспрессируется (синтезируется) раковой клеткой, т.е. в антигене, связанном с раковой клеткой. Антиген, связанный с раковой клеткой, может представлять собой антиген, связанный, например, с клеткой рака молочной железы, В-клеточной лимфомой, клеткой лимфомы Ходжкина, клеткой рака яичников, клеткой рака предстательной железы, мезотелиомой, клеткой рака легких (например, клеткой мелкоклеточного рака легких), клеткой неходжкинской В-клеточной лимфомы (B-NHL), клеткой рака яичников, клеткой рака предстательной железы, клеткой мезотелиомы, клеткой рака легких (например, клеткой мелкоклеточного рака легких), клеткой меланомы, клеткой хронического лимфоцитарного лейкоза, клеткой острого лимфоцитарного лейкоза, клеткой нейробластомы, глиомой, глиобластомой, медуллобластомой, клеткой колоректального рака и т.д. Антиген, связанный с раковой клеткой, также может быть экспрессирован нераковой клеткой.
Неограничивающие примеры антигенов, с которыми может связываться антигенсвязывающий домен библиотеки согласно настоящему изобретению, включают, например, CD19, CD20, CD38, CD30, Her2/neu, ERBB2, СА125, MUC-1, специфичный для предстательной железы мембранный антиген (PSMA), молекулу адгезии CD44, мезотелин, онкоэмбриональный антиген (СЕА), рецептор эпидермального фактора роста (EGFR), EGFRvIII, рецептор фактора роста эндотелия сосудов 2 (VEGFR2), высокомолекулярный антиген, связанный с меланомой (HMW-MAA), MAGE-A1, IL-13R-a2, GD2 и т.п.
В некоторых случаях элемент конкретной связывающейся пары, подходящий для применения в элементах библиотек согласно настоящему изобретению, представляет собой лиганд для рецептора. Лиганды включают, но не ограничиваются ими, цитокины (например, ИЛ-13 и т.д.); факторы роста (например, херегулин, фактор роста эндотелия сосудов (VEGF) и т.п.); пептид, связывающий интегрин (например, пептид, содержащий последовательность Arg-Gly-Asp); лиганды Notch (например, Delta, Serrate, Delta-like, X-Delta, Jagged и т.д., а также их гомологи и ортологи) и т.п.
В случае если элемент конкретной связывающейся пары в элементах библиотек согласно настоящему изобретению является лигандом, то конкретный элемент библиотеки может быть активирован в присутствии второго члена конкретной связывающейся пары, причем второй элемент конкретной связывающейся пары представляет собой рецептор для лиганда. Например, если лиганд представляет собой VEGF, второй элемент специфичной связывающейся пары может представлять собой рецептор VEGF, включая растворимый рецептор VEGF. В другом примере, если лиганд является лигандом Notch, то второй член специфичной связывающейся пары может представлять собой рецептор Notch или его лигандсвязывающий участок. В качестве другого примера, если лиганд представляет собой херегулин, то второй член специфичной связывающейся пары может представлять собой Ней.
В некоторых случаях член специфичной связывающейся пары, который включен в элементы библиотеки согласно настоящему изобретению, представляет собой рецептор, например, рецептор для лиганда, корецептор и т.д. Рецептор может представлять собой лигандсвязывающий фрагмент рецептора. Подходящие рецепторы включают, но не ограничиваются ими, рецептор фактора роста (например, рецептор VEGF); полипептид члена 1 подсемейства лектиноподобных рецепторов клеток-киллеров K (NKG2D) (рецептор для MICA, MICB и ULB6); рецептор цитокинов (например, рецептор ИЛ-13, рецептор ИЛ-2 и т.д.); Her2; CD27; полипептид рецептора естественной цитотоксичности (NCR) (например, NKP30 (NCR3/CD337) (рецептор для HLA-B-ассоциированного транскрипта 3 (ВАТ3) и В7-Н6) и т.д.); рецептор Notch (например, NOTCH1 человека, NOTCH2 человека, NOTCH3 человека, NOTCH4 человека и т.д.) и т.п.
Специфичные партнеры по связыванию также включают димерные пары.
Отдельные члены димерных пар подходят для применения в качестве элемента библиотек согласно настоящему изобретению и включают, но не ограничиваются ими, связывающиеся с димеризатором пары. Связывающиеся с димеризатором пары связываются с различными участками одной и той же моле
- 17 046546 кулы (называемой в настоящем документе димеризатор). В присутствии димеризатора оба члена связывающейся с димеризатором пары связываются с различными участками димеризатора и, следовательно, сближаются друг с другом. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является обратимым. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является необратимым. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является нековалентным. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является ковалентным.
Другие димерные пары, подходящие для применения, включают связывающиеся с димеризатором пары, которые димеризуются при связывании первого члена димерной пары с димеризирующим агентом, причем димеризующий агент индуцирует конформационное изменение в первом члене димерной пары, и при этом конформационное изменение позволяет первому члену димерной пары связываться (ковалентно или нековалентно) со вторым членом димерной пары. Другие димерные пары, подходящие для применения, включают димерные пары, в которых воздействие света (например, синего света) индуцирует димеризацию димерной пары.
В некоторых случаях член специфичной связывающейся пары может включать белок, участвующий в сигнальном взаимодействии белок-белок или сигнальном взаимодействии белок-липид, и в этой связи синтетические модульные полипептиды, описанные в настоящем документе, могут включать один или более доменов взаимодействия белок-белок или доменов взаимодействия белок-липид. Подходящие домены взаимодействия белок-белок или домены взаимодействия белок-липид включают, но не ограничиваются ими, например, домен 14-3-3 (например, тот, который присутствует в структуре 2В05 PDB (база данных белковых структур RCSB, доступная на веб-сайте www.rcsb.org)), домен фактора деполимеризации актина (ADF) (например, присутствующий в структуре 1CFY PDB), домен ANK (например, присутствующий в структуре 1SW6 PDB), домен ANTH (N-концевой гомологии АР180) (например, присутствующий в структуре 5AHV PDB), домен Armadillo (ARM) (например, присутствующий в структуре 1BK6 PDB), домен BAR (Bin/Amphiphysin/Rvs) (например, присутствующая в структуре 1I4D PDB), домен BEACH (beige and CHS) (например, присутствующий в структуре 1MI1 PDB), домены ВН (гомологии Bcl-2) (BH1, ВН2, ВН3 и ВН4) (например, присутствующие в структуре 1BXL PDB), домен повтора бакуловируса IAP (BIR) (например, присутствующий в структуре 1G73 PDB), домен BRCT (BRCA1 Сконец) (например, присутствующий в структуре 1Т29 PDB), бромдомен (например, присутствующий в структуре 1E6I PDB), домен ВТВ (BR-C, ttk и bab) (например, присутствующий в структуре 1R2B PDB), домен С1 (например, присутствующий в структуре 1PTQ PDB), домен С2 (например, присутствующий в структуре 1А25 PDB), домены привлечения каспазы (CARD) (например, присутствующие в структуре 1CWW PDB), суперспиральный домен (СС) (например, присутствующий в структуре 1QEY PDB), домен CALM (Clathrin Assembly Lymphoid Myeloid) (например, присутствующий в структуре 1HFA PDB), домен гомологичности калопонина (СН) (например, присутствующий в структуре 1BKR PDB), домен, модифицирующий организацию хроматина (Chromo) (например, присутствующий в структуре 1KNA PDB), домен CUE (например, присутствующий в структуре 1OTR PDB), домены гибели (DD) (например, присутствующие в структуре 1FAD PDB), домен гибели-эффектора (DED) (например, присутствующий в структуре 1A1W PDB), домен Discheveled, EGL-10 и плекстрин (DEP) (например, присутствующий в структуре 1FSH PDB), домен гомологии Db1 (DH) (например, присутствующий в структуре 1FOE PDB), домен EF-руки (EFh) (например, присутствующий в структуре 2PMY PDB), домен Eps15-гомологии (ЕН) (например, присутствующий в структуре 1ЕН2 PDB), домен NH2-концевой гомологии эпсина (ENTH) (например, присутствующий в структуре 1EDU PDB), домен гомологии Ena/Vasp 1 (EVH1) (например, присутствующий в структуре 1QC6 PDB), домен F-box (например, присутствующий в структуре 1FS1 PDB), домен FERM (полоса 4.1, эзрин, радиксин, моэзин) (например, присутствующий в структуре 1GC6 PDB), домен FF (например, присутствующий в структуре 1UZC PDB), домен гомологии формина-2 (FH2) (например, присутствующий в структуре 1UX4 PDB), домен, ассоциированный с Forkhead (FHA) (например, присутствующий в структуре 1G6GPDB), домен FYVE (Fab-1, YGL023, Vps27 и ЕЕА1) (например, присутствующий в структуре 1VFY PDB), домен GAT (GGA и Toml) (например, присутствующий в структуре Ю3Х PDB), домен гомологии гелсолина (GEL) (например, присутствующий в структуре 1H1V PDB), домен GLUE (GRAM-подобный убиквитин-связывающий домен в ЕАР45) (например, присутствующий в структуре 2CAY PDB), домен GRAM (из глюкозилтрансфераз, Rab-подобные активаторы ГТФаз и миотубуларины) (например, присутствующий в структуре 1LW3 PDB), домен GRIP (например, присутствующий в структуре 1UPT PDB), домен глицин-тирозин-фенилаланин (GYF) (например, присутствующий в структуре 1GYF PDB), домен HEAT (хантингтон, фактор удлинения 3, PR65/A, TOR) (например, присутствующий в структуре 1IBR PDB), домен, гомологичный С-концевому домену Е6-АР (НЕСТ) (например, присутствующий в структуре 1C4Z PDB), домен IQ (например, присутствующий в структуре 1N2D PDB), домен LIM (Lin-1, Isl-1 и Мес-3) (например, присутствующий в структуре 1QLI PDB), домен обогащенных лейцином повторов (LRR) (например, присутствующий в структуре 1YRG PDB), домен злокачественной опухоли головного мозга (МВТ) (например, присутствующий в структуре 10YX PDB), домен МН1 (гомологии Mad 1) (например, присутствующий в структуре 1OZJ PDB), домен МН2 (гомологии Mad 2) (например, присутствующий в структуре 1DEV PDB), домен MIU (взаимодейст
- 18 046546 вующий с убиквитином мотив) (например, присутствующий в структуре 2С7М PDB), домен NZF (цинковый палец Npl4) (например, присутствующий в структуре 1Q5W PDB), домен PAS (Per-ARNT-Sim) (например, присутствующий в структуре 1Р97 PDB), домен Phox и Bem1 (РВ1) (например, присутствующий в структуре 1IPG PDB), домен PDZ (постсинаптическая плотность 95, PSD-85, discs large, Dlg, zonula occludens-1, ZO-1) (например, присутствующей в структуре 1ВЕ9 PDB), домен гомологичности плекстрина (РН) (например, присутствующий в структуре 1MAI PDB), домен Polo-Box (например, присутствующий в структуре 1Q4K PDB), домен связывания фосфотирозина (РТВ) (например, присутствующего в структуре 1SHC PDB), домен Pumilio/Puf (PUF) (например, присутствующий в структуре 1M8W PDB), домен PWWP (например, присутствующий в структуре 1KHC PDB), домен гомологии Phox (PX) (например, присутствующий в структуре 1Н6Н PDB), домен RGS (регулятор опосредованной Gбелком передачи сигналов) (например, присутствующий в структуре 1AGR PDB), домен RING (например, присутствующий в структуре 1FBV PDB), домен SAM (стерильный альфа-мотив) (например, присутствующий в структуре 1В0Х PDB), домен Shadow Chromo (SC) (например, присутствующий в структуре 1E0B PDB), домен Src-гомологии 2 (SH2) (например, присутствующий в структуре 1SHB PDB), домен Src-гомологии 3 (SH3) (например, присутствующий в структуре 3SEM PDB), домен SOCS (супрессоры передачи сигналов с участием цитокинов) (например, присутствующий в структуре 1VCB PDB), домен SPRY (например, присутствующий в структуре 2AFJ PDB), родственный стероидогенному острому регуляторному белку (StAR) домен переноса липидов (START) (например, присутствующий в структуре 1ЕМ2 PDB), домен SWIRM (например, присутствующий в структуре 2AQF PDB), домен рецептора Toll/I1-1 (TIR) (например, присутствующий в структуре 1FYV PDB), домен тетратрикопептидного повтора (TPR) (например, присутствующий в структуре 1ELW PDB), домен TRAF (факторы, связанные с рецептором фактора некроза опухолей (ФНО)) (например, присутствующий в структуре 1F3V PDB), домен tSNARE (домен SNARE (растворимый чувствительный к N-этилмалеимиду рецептор, обеспечивающий прикрепление белков (SNAP)) (например, присутствующий в структуре 1SFC PDB), домен Tubby (например, присутствующий в структуре 1I7E PDB), домен TUDOR (например, присутствующий в структуре 2GFA PDB), связанный с убиквитином (UBA) домен (например, присутствующий в структуре 1IFY PDB), домен UEV (вариант убиквитина Е2) (например, присутствующий в структуре 1S1Q PDB), домен мотива, взаимодействующего с убиквитином (UIM) (например, присутствующий в структуре 1Q0W PDB), домен VHL (например, присутствующий в структуре 1LM8 PDB), домен VHS (Vps27p, Hrs и STAM) (например, присутствующий в структуре 1ELK PDB), домен WD40 (например, присутствующий в структуре 1NEX PDB), домен WW (например, присутствующий в структуре 1I6C PDB) и т.п.
Отдельные элементы библиотеки согласно настоящему изобретению, описанной в настоящем документе, могут содержать модулирующий домен. Модулирующие домены включают домены со стимулирующими и ингибирующими функциями и домены, которые модулируют активирующие и/или ингибирующие функции других сигнальных доменов, реакции с участием которых протекают раньше, чем реакции с участием модулирующих доменов. В некоторых случаях модулирующие домены включают костимулирующие домены. В некоторых случаях модулирующие домены включают коингибирующие домены.
Модулирующий домен, пригодный для включения в элементы библиотеки согласно настоящему изобретению, может представлять собой любую функциональную единицу полипептида, длина которой равна длине аминокислотного мотива из 3 аминокислот, и длина которой равна длине полноразмерного белка, причем размер модулирующего домена ограничен только тем, что домен должен быть достаточно большим, чтобы сохранить свою функцию, и достаточно маленьким, чтобы быть совместимым с желательным способом сборки. Соответственно, модулирующий домен может иметь размер в диапазоне от 3 аминокислот до 1000 аминокислот или более, и, в некоторых случаях, может иметь в длину от приблизительно 30 аминокислот до приблизительно 70 аминокислот (а.к.), например, модулирующий домен может иметь в длину от приблизительно 30 а.к. до приблизительно 35 а.к., от приблизительно 35 а.к. до приблизительно 40 а.к., от приблизительно 40 а.к. до приблизительно 45 а.к., от приблизительно 45 а.к. до приблизительно 50 а.к., от приблизительно 50 а.к. до приблизительно 55 а.к., от приблизительно 55 а.к. до приблизительно 60 а.к., от приблизительно 60 а.к. до приблизительно 65 а.к. или от приблизительно 65 а.к. до приблизительно 70 а.к. В других случаях модулирующий домен может иметь в длину от приблизительно 70 а.к. до приблизительно 100 а.к., от приблизительно 100 а.к. до приблизительно 200 а.к. или более 200 а.к.
В некоторых случаях костимулирующие домены можно применять в отдельных элементах библиотек согласно настоящему изобретению. Совместная стимуляция обычно относится к вторичному неспецифичному механизму активации, посредством которого распространяется первичная специфичная стимуляция. Примеры совместной стимуляции включают неспецифичную для антигена Т-клеточную стимуляцию после антигенспецифичной передачи сигналов через рецептор Т-клеток и неспецифичную для антигена В-клеточную совместную стимуляцию после передачи сигналов через рецептор В-клеток. Совместная стимуляция, например, совместная Т-клеточная стимуляция и связанные с ней факторы были описаны в работе Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42, содержание которой полностью включено в настоящее изобретение посредством ссылки. Костимулирующие домены обычно представ
- 19 046546 ляют собой полипептиды, полученные из рецепторов. Согласно некоторым вариантам реализации настоящего изобретения костимулирующие домены гомодимеризуются. Костимулирующий домен согласно настоящему изобретению может представлять собой внутриклеточную часть трансмембранного белка (т.е., костимулирующий домен может быть получен из трансмембранного белка). Неограничивающие примеры подходящих костимулирующих полипептидов включают, но не ограничиваются ими, 4-1ВВ (CD137), CD28, ICOS, ОХ-40, BTLA, CD27, CD30, GITR и HVEM. В некоторых случаях костимулирующий домен, например, используемый в элементе библиотеки согласно настоящему изобретению, может включать костимулирующий домен, перечисленный в табл. 1. В некоторых случаях костимулирующий домен отдельного элемента библиотеки содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотной последовательности костимулирующего домена, описанного в настоящем документе.
В некоторых случаях коингибирующие домены можно применять в отдельных элементах библиотек согласно настоящему изобретению. Подходящие коингибирующие домены обычно представляют собой полипептиды, полученные из рецепторов. Совместное ингибирование обычно относится к вторичному ингибированию первичных антигенспецифичных механизмов активации, которое предотвращает совместную стимуляцию. Совместное ингибирование, например, совместное ингибирование Т-клеток и связанные с ним факторы были описаны в работах Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42 и Thaventhiran et al. J Clin Cell Immunol (2012) S12, содержание которых полностью включено в настоящее изобретение посредством ссылки. Согласно некоторым вариантам реализации настоящего изобретения коингибирующие домены гомодимеризуются. Коингибирующий домен согласно настоящему изобретению может быть внутриклеточной частью трансмембранного белка (т.е. коингибирующий домен может быть получен из трансмембранного белка). Неограничивающие примеры подходящих коингибирующих полипептидов включают, но не ограничиваются ими, CTLA-4 и PD-1. В некоторых случаях коингибирующий домен, например, используемый в элементе библиотеки согласно настоящему изобретению, может включать коингибирующий домен, перечисленный в табл. 1. В некоторых случаях костимулирующий домен отдельного элемента библиотеки содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотной последовательности костимулирующего домена, описанного в настоящем документе.
В некоторых случаях отдельные элементы библиотеки из библиотеки синтетических модульных полипептидов могут включать модуль внутриклеточного сигнального домена. Внутриклеточные сигнальные домены, подходящие для применения в качестве модулей библиотеки согласно настоящему изобретению, включают любой желательный сигнальный домен, который обеспечивает различимый и детектируемый сигнал (например, увеличение выработки одного или более цитокинов клеткой; изменение транскрипции гена-мишени; изменение активности белка; изменение поведения клеток, например, гибель клеток, пролиферацию клеток, дифференцировку клеток, выживаемость клеток; модуляцию клеточных сигнальных реакций и т.д.) в ответ на активацию отдельного элемента библиотеки. Домен внутриклеточной сигнализации может быть ковалентно присоединен к отдельным элементам библиотеки или может не иметь такой связи, например, в тех случаях, когда все элементы библиотеки используют общий внутриклеточный сигнальный домен, внутриклеточный сигнальный домен может быть не связан с элементами библиотеки, например, может диффундировать в цитоплазме.
В некоторых случаях отдельные элементы библиотеки согласно настоящему изобретению будут включать трансмембранный домен для введения в мембрану эукариотических клеток. Трансмембранный домен может присутствовать в любом удобном месте в пределах элементов библиотек, например, на Nконце для модульных компонентов библиотеки, на С-конце для модульных компонентов библиотеки, может быть расположен между по меньшей мере двумя модульными компонентами библиотеки (например, между антигенсвязывающим доменом и костимулирующим доменом элементов модульной библиотеки CAR) и т.д.
Любой трансмембранный (ТМ) домен, который обеспечивает введение полипептида в мембрану эукариотических клеток (например, млекопитающего), подходит для применения. В качестве одного неограничивающего примера, подходящей для использования является ТМ-последовательность IYIWAPLAGTCGVLLLSLVITLYC (SEQ ID NO: 1). Дополнительные неограничивающие примеры подходящих ТМ-последовательностей включают:
a) последовательности, полученные из CD8-бета: LGLLVAGVLVLLVSLGVAIHLCC (SEQ ID NO: 2);
b) последовательности, полученные из CD4: ALIVLGGVAGLLLFIGLGIFFCVRC (SEQ ID NO: 3);
c) последовательности, полученные из CD3-дзета: LCYLLDGILFIYGVILTALFLRV (SEQ ID NO: 4);
d) последовательности, полученные из CD28: WVLVVVGGVLACYSLLVTVAFIIFWV (SEQ ID NO: 5);
- 20 046546
e) последовательности, полученные из CD134 (ОХ40): VAAILGLGLVLGLLGPLAILLALYLL (SEQ ID NO: 6); и
f) последовательности, полученные из CD7: ALPAALAVISFLLGLGLGVACVLA (SEQ ID NO: 7).
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более дополнительных модульных элементов. Например, в тех случаях, когда библиотека представляет собой библиотеку химерных антигенных рецепторов (CAR), отдельные элементы библиотеки могут быть сконфигурированы так, чтобы содержать один или более дополнительных компонентов, как описано, например, в РСТ публикации заявки на патент WO2014/127261, содержание которой полностью включено в настоящее изобретение посредством ссылки.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей многодоменного каркасного белка. В настоящем изобретении термин каркасные белки включает якорные белки и адаптерные белки. Указанные белки содержат несколько связывающих доменов, каждый из которых привлекает или закрепляет определенные элементы сигнального пути, например, закрепляет их в комплексах, локализует их в клетке или модулирует процесс передачи сигналов (например, контролирует положительную и/или отрицательную обратную связь, стабилизирует активированные сигнальные компоненты от инактивации и т.д.). Следовательно, домены многодоменных каркасных белков, многодоменных якорных белков и многодоменных адаптерных белков обычно включают связывающие домены членов пути передачи сигналов.
Неограничивающие примеры каркасных белков и путей передачи сигналов, в которых они функционируют, включают, например, каркасный белок Ste5 пути с участием митоген-активируемой протеинкиназы (MAPK); якорные белки А-киназы (AKAP) пути передачи сигналов с участием протеинкиназы А (PKA); супрессор киназы Ras 1 (KSR) пути передачи сигналов с участием MAPK; белок В-клеточной лимфомы 10 (BCL-10) пути передачи сигналов с участием N-концевой киназы JUN (JNK) и пути передачи сигналов с участием MAPK; киназу киназы митоген-активируемой протеинкиназы 1 (MEKK1) пути передачи сигналов с участием JNK и пути передачи сигналов с участием MAPK; AHNAK-1 кальцийзависимого пути передачи сигналов; HOMER кальций-зависимого пути передачи сигналов; белки Pellino пути передачи сигналов врожденной иммунной системы; семейство NLR, содержащие пириновые домены (NLRP) белки пути передачи сигналов врожденной иммунной системы; гомолог Disks large 1 (DLG1) пути передачи сигналов с участием рецептора Т-клеток; спинофилин пути передачи сигналов дендритных клеток; и т.п. Каркасные белки также включают, но не ограничиваются ими, например, те, которые описаны в работе Buday & Tompa. FEBS Journal (2010) 277:4348-4355; содержание которой полностью включено в настоящее изобретение посредством ссылки. В некоторых случаях каркасный белок может представлять собой белок, связанный с терминами генной онтологии (GO) каркасный белковый комплекс (GO: 0032947) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей протеинкиназ. Протеинкиназы представляют собой белки, которые функционируют путем добавления фосфатных групп к белкамсубстратам для управления активностью белка-субстрата, ассоциацией с другими белками и/или локализацией. Протеинкиназы могут включать белки, которые связаны с терминами GO фосфорилирование белка (GO: 0006468), активность протеинкиназы (GO: 0004672), активность сериновой/треониновой протеинкиназы (GO: 0004674), активность киназы (GO: 0016301) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. Протеинкиназы содержат один или более доменов киназы, которые осуществляют каталитическую функцию протеинкиназы. Домены протеинкиназы связаны с идентификатором Pfam PF00069, который может быть использован для получения информации о протеинкиназных доменах тех белков, которые содержат протеинкиназные домены, включая последовательности и структуры, представленные, например, на вебсайте pfam.xfam.org.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей протеинфосфатаз. Протеинфосфатазы представляют собой белки, которые функционируют путем удаления фосфатной группы из фосфорилированного остатка аминокислоты своего белка-субстрата, что приводит к дефосфорилированию для управления активностью белка-субстрата, и выполняют функции, обратные таковым протеинкиназ. Протеинфосфатазы сгруппированы в три класса: фосфопротеиновые фосфатазы (например, РРР1СА, РРР1СВ, РРР1СС, РРР2СА, РРР2СВ, РРР3СА, РРР3СВ, РРР3СС, РРР4С, РРР5С, РРР6С и т.д.), протеинтирозинфосфатазы (например, CDC14A, CDC14B, CDC14C, CDKN3, PTEN, SSH1, SSH2, SSH3 и т.д.) и протеинфосфатазы с двойной специфичностью (например, DUSP1, DUSP2, DUSP3, DUSP4, DUSP5, DUSP6, DUSP7, DUSP8, DUSP9, DUSP10, DUSP11, DUSP12, DUSP13, DUSP14, DUSP15,
- 21 046546
DUSP16, DUSP18, DUSP19, DUSP21, DUSP22, DUSP23, DUSP26, DUSP27, DUSP28 и т.д.); однако некоторые протеинфосфатазы остаются неклассифицированными. Протеинфосфатазы могут включать белки, которые связаны с термином GO активность фосфатазы (GO: 0016791) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинфосфатазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. Протеинфосфатазы содержат один или более фосфатазных доменов, которые осуществляют функцию дефосфорилирования протеинфосфатазы. Домены протеинфосфатаз связаны с идентификатором Pfam PF15698, который может быть использован для получения информации о протеинфосфатазных доменах тех белков, которые содержат протеинфосфатазные домены, включая последовательности, например, представленные на веб-сайте pfam.xfam.org.
В некоторых случаях отдельные элементы библиотеки синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка рецепторной тирозинкиназы, также называемых рецепторными тирозинкиназами (RTK). RTK представляют собой связанные с мембраной рецепторы клеточной поверхности. Существует подкласс тирозинкиназ, RTK, которые функционируют посредством связывания внеклеточного лиганда и последующего фосфорилирования цитоплазматической части белка. RTK можно разделить на семейства, включающие, например, семейство рецепторов эпидермального фактора роста, семейство рецепторов фактора роста фибробластов (FGFR), семейство рецепторов фактора роста эндотелия сосудов (VEGFR), семейство рецепторов RET и семейство рецепторов с дискоидиновым доменом (DDR). RTK могут включать белки, которые связаны с терминами GO активность трансмембранной рецепторной тирозинкиназы (GO: 0004714), путь передачи сигналов с участием трансмембранной рецепторной тирозинкиназы (GO: 0007169) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к RTK, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. RTK содержат один или более тирозинкиназных доменов, которые осуществляют киназную функцию RTK. Киназные домены RTK связаны с идентификатором Pfam PF07714, который может быть использован для получения информации о киназных доменах RTK и белках, содержащих киназные домены RTK, включая последовательности и структуры, например, представленные на веб-сайте pfam.xfam.org.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка липидкиназы. Белки липидкиназы фосфорилируют клеточные липиды, что приводит к модуляции реактивности липида, передаче сигнала и/или локализации липидов. Липидкиназы можно разделить на семейства, включая, например, фосфатидилинозитолкиназы и сфингозинкиназы. Липидкиназы могут включать белки, которые связаны с терминами GO активность липидкиназы (GO: 0001727), фосфорилирование липидов (GO: 0046834) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к липидкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка липидфосфатазы. Белки липидфосфатаз дефосфорилируют клеточные липиды и их активность противоположна активности липидкиназ, которая приводит к модуляции реактивности липида, передаче сигнала и/или локализации липидов. Липидфосфатазы могут включать белки, которые связаны с терминами GO активность липидфосфатазы (GO: 0042577), дефосфорилирование фосфолипидов (GO: 0046839) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к липидфосфатазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка убиквитинилазы. Белки убиквитинилазы представляют собой белки, которые опосредуют посттрансляционную модификацию убиквитинирования, присоединение убиквитина к белку-субстрату. Убиквитинирование белка-субстрата может привести к деградации белка-субстрата, перемещению белка-субстрата, модуляции активности белка-субстрата, модуляции белок-белкового взаимодействия белка-субстрата и т.д. Убиквитинилазы могут включать белки, связанные с терминами GO убиквитинирование белка (GO: 0016567), активность убиквитин-протеинтрансферазы (GO: 0004842) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к убиквитинилазам, включая последовательности, представленные, например, на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деубиквитинилазы. Белки деубиквитинилазы представляют собой белки, которые опосредуют обращение убиквитинирования, удаление убиквитина из белка-субстрата. Деубиквитинирование белка-субстрата может обратить действие убиквитинилаз и предотвратить деградацию белка-субстрата, обратить связанное с убиквитином перемещение белка-субстрата, обратить связанную с убиквитином модуляцию активности белкасубстрата, обратить связанную с убиквитином модуляцию белок-белкового взаимодействия белкасубстрата и т.д. Деубиквитинилазы могут включать белки, которые связаны с термином GO деубикви
- 22 046546 тинирование белка (GO: 0016579) и синонимичными терминами, которые можно использовать для получения информации, относящейся к деубиквитинилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка SUМОилазы. Белки SUМОилазы представляют собой белки, которые опосредуют посттрансляционную модификацию SUМОилирования, добавление небольшого убиквитинподобного модифицирующего белка (SUMO) к белку-субстрату. SUМОилирование может модулировать различные функции белка, включая стабильность белка, ядерно-цитозольный транспорт, регуляцию транскрипции и т.д. SUМОилазы могут включать белки, связанные с термином GO SUМОилирование белка (GO: 0016925), и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к SUМОилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка ацетилазы, также называемых ацетилтрансферазами. Ацетилтрансферазы представляют собой ферменты-трансферазы, которые катализируют перенос ацетильной группы на белок-субстрат и участвуют в эпигенетической и транскрипционной модуляции. Ацетилтрансферазы могут быть классифицированы на группы, включающие, например, гистонацетилтрансферазы, холинацетилтрансферазы, хлорамфениколацетилтрансферазы, серотонин-Ы-ацетилтрансферазы, NatA-ацетилтрансферазы, NatB-ацетилтрансферазы. Ацетилтрансферазы могут включать белки, которые связаны с термином GO активность ацетилтрансферазы (GO: 0016407) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к ацетилтрансферазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деацетилазы. Белки деацетилазы обращают действие ацетилтрансфераз и удаляют ацетильные группы, перенесенные на белок-субстрат, и, следовательно, также участвуют в эпигенетической и транскрипционной модуляции. Деацетилазы включают, например, гистондеацетилазы и сиртуины. Деацетилазы могут включать белки, которые связаны с термином GO активность деацетилазы (GO: 0019213) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к деацетилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка метилазы, также называемых метилтрансферазами. Метилтрансферазы алкилируют субстраты (включая такие субстраты как белки и нуклеиновые кислоты) путем переноса метильной группы на субстрат и участвуют в эпигенетической и транскрипционной модуляции. Метилтрансферазы можно разделить на классы на основании их структуры, включая, например, класс I, класс II, класс III, и можно сгруппировать в соответствии с их субстратами или способом метилирования, включая, например, протеинметилтрансферазы, ДНКметилтрансферазы, метилтрансферазы природного продукта и SAM-независимые метилтрансферазы. Метилтрансферазы могут включать белки, которые связаны с терминами GO активность ДНКметилтрансферазы (GO: 0009008), активность гистонметилтрансферазы (GO: 0042054) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к метилтрансферазам, включая последовательности, например, представленные на вебсайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деметилазы. Деметилазы обращают действие метилтрансфераз и катализируют удаление метальных групп с субстратов (включая такие субстраты как белки и нуклеиновые кислоты) и, следовательно, также участвуют в эпигенетической и транскрипционной модуляции. Деметилазы могут включать белки, которые связаны с терминами GO активность деметилазы (GO: 0032451), активность ДНК-деметилазы (GO: 0035514), активность гистондеметилазы (GO: 0032452) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к деметилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка нуклеазы. Нуклеазы катализируют расщепление фосфодиэфирных связей между нуклеотидными субъединицами нуклеиновых кислот-субстратов. Нуклеазы можно подразделить на не взаимоисключающие категории, такие как эндонуклеазы и экзонуклеазы. Нуклеазы могут включать белки, которые связаны с терминами GO активность нуклеазы (GO: 0004518), активность дезоксирибонуклеазы I (GO: 0004530), активность рибонуклеазы в отношении гибрида РНК-ДНК (GO: 0004523), гидролиз фосфодиэфирной связи нуклеиновых кислот (GO: 0090305), активность эндонуклеазы (GO: 0004519), активность экзонуклеазы (GO: 0004527) и синонимичными терминами, которые могут быть использованы для получения инфор
- 23 046546 мации, относящейся к нуклеазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка рекомбиназы. Рекомбиназы катализируют чувствительные к направлению реакции обмена нуклеиновых кислот между последовательностями участков-мишеней, специфичных для каждой рекомбиназы, что приводит к вырезанию/вставке, инверсии, транслокации и обмену фрагментов нуклеиновых кислот. Примеры рекомбиназ включают, но не ограничиваются ими, рекомбиназу Cre, рекомбиназу Hin, рекомбиназу Tre, рекомбиназу FLP и т.п. Рекомбиназы могут включать белки, которые связаны с терминами GO активность рекомбиназы (GO: 0000150), рекомбинация ДНК (GO: 0006310) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к рекомбиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка фактора транскрипции. Факторы транскрипции представляют собой белки, которые связываются с определенными последовательностями ДНК и контролируют транскрипцию. Факторы транскрипции могут являться активаторами, которые усиливают транскрипцию, или репрессорами, которые подавляют транскрипцию. Факторы транскрипции могут быть классифицированы на суперклассы на основании структуры их ДНКсвязывающих доменов, включая, например, содержащие основной домен факторы транскрипции, факторы транскрипции, содержащие цинк-координирующий ДНК-связывающий домен, факторы транскрипции спираль-поворот-спираль, факторы транскрипции, содержащие бета-каркасные факторы, и те факторы транскрипции, которые не включены ни в один из вышеуказанных суперклассов (см., например, Stegmaier et al. Genome Inform (2004) 15(2):276-86). Факторы транскрипции содержат один или более ДНК-связывающих доменов. ДНК-связывающие домены факторов транскрипции могут представлять собой один или более ДНК-связывающих доменов, связанных с идентификаторами Pfam PF00010, PF00170, PF00172, PF00046, PF00319, PF08279, PF00096, PF00105 и т.п., которые могут быть использованы для получения информации о последовательностях и структуре доменов, например, на веб-сайте pfam.xfam.org. Факторы транскрипции также могут содержать один или более транс-активирующих доменов, один или более доменов, воспринимающих сигналы. Факторы транскрипции могут включать белки, связанные с термином GO комплекс факторов транскрипции (GO: 0005667), и синонимичными и родственными терминами, которые могут быть использованы для получения информации, относящейся к факторам транскрипции, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
Другие ДНК-связывающие домены, например, ДНК-связывающие домены, полученные не из факторов транскрипции, или ДНК-связывающие домены, не принадлежащие факторам транскрипции, также можно применять в некоторых случаях в одном или более модулях отдельных элементов библиотек синтетических модульных полипептидов, описанных в настоящем документе. Подходящие ДНКсвязывающие домены, полученные не из факторов транскрипции, включают природные и синтетические полипептидные домены, которые неспецифично связываются с ДНК или связываются со специфичными последовательностями ДНК. ДНК-связывающие домены, полученные не из факторов транскрипции, могут включать, но не ограничиваются ими, например, природный или модифицированный ДНКсвязывающий домен из полипептида эндонуклеазы, содержащей цинковый палец, природный или модифицированный ДНК-связывающий домен из полипептида эффекторной нуклеазы, подобной активаторам транскрипции (TALEN), природный или модифицированный ДНК-связывающий домен полипептида Cas9 (включая, например, Cas9 с полной инактивацией нуклеазной активности (dCas9) и тому подобное) и т.д.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей, описанных в РСТ заявке US2004/019778, содержание которой полностью включено в настоящее изобретение посредством ссылки.
Компоновка модулей в синтетические модульные полипептиды, описанные в настоящем документе, позволит получить библиотеку, содержащую множество отдельных модульных функциональных белков, которые могут, но необязательно, обладать общей функцией. Например, отдельные элементы библиотеки могут содержать или могут состоять из синтетических модульных полипептидов, которые представляют собой модульные каркасные белки, синтетических модульных полипептидов, которые представляют собой модульные рецепторные белки, синтетических модульных полипептидов, которые представляют собой модульные белки протеинкиназ или протеинфосфатаз, синтетических модульных полипептидов, которые представляют собой модульные транскрипционные регуляторные белки, синтетических модульных полипептидов, которые представляют собой модульные эпигенетические регуляторные белки, синтетических модульных полипептидов, которые представляют собой модульные белки рекомбиназ или нуклеаз и т.д. Подходящие библиотеки можно подвергать скринингу для определения желательного фенотипа в соответствии со способами, описанными в настоящем документе.
- 24 046546
Репортеры.
Библиотеки, описанные в настоящем документе, включают детектируемые сигнальные белки, экспрессия которых кодируется последовательностями нуклеиновых кислот библиотек. Конкретные детектируемые сигнальные белки, используемые в системах библиотек, описанных в настоящем документе, будут варьироваться и частично зависеть от предпочтительного способа детектирования полученного сигнала. Например, если сигнал детектируется оптическими способами, например, с использованием флуоресцентной микроскопии или проточной цитометрии (включая флуоресцентно-активированную сортировку клеток (FACS)), то используется флуоресцентный репортер.
Подходящие детектируемые сигнальные белки включают, например, флуоресцентные белки; ферменты, которые катализируют реакцию, которая приводит к получению детектируемого сигнала в качестве продукта; эпитопные метки, поверхностные маркеры и т.п. Детектируемые сигнальные белки могут быть обнаружены непосредственно или косвенно. Например, если используется флуоресцентный репортер, то флуоресценцию репортера можно детектировать непосредственно. В некоторых случаях, если используется эпитопная метка или поверхностный маркер, то эпитопную метку или поверхностный маркер можно детектировать косвенно, например, с помощью детектируемого связывающего агента, который специфично связывается с эпитопной меткой или поверхностным маркером, например, с помощью флуоресцентномеченого антитела, которое специфично связывается с эпитопной меткой или поверхностным маркером. В некоторых случаях репортер, который обычно детектируют косвенно, например, эпитопную метку или поверхностный маркер, можно детектировать непосредственно, или репортер, который обычно детектируют непосредственно, можно детектировать косвенно, например, посредством использования детектируемого антитела, которое специфично связывается с флуоресцентным репортером.
Подходящие флуоресцентные белки включают, но не ограничиваются ими, зеленый флуоресцентный белок (GFP) или его варианты, синий флуоресцентный вариант GFP (BFP), голубой флуоресцентный вариант GFP (CFP), желтый флуоресцентный вариант GFP (YFP), улучшенный GFP (EGFP), улучшенный CFP (ECFP), улучшенный YfP (EYFP), GFPS65T, Изумруд, Топаз (TYFP), Venus, Citrine, mCitrine, GFPuv, дестабилизированный EGFP (dEGFP), дестабилизированный ECFP (dECFP), дестабилизированный EYFP (dEYFP), mCFPm, Cerulean, T-Sapphire, CyPet, YPet, mKO, HcRed, t-HcRed, DsRed, DsRed2, мономерный DsRed, J-Red, dimer2, t-dimer2(12), mRFP1, поциллопорин, Renilla GFP, Monster GFP, paGFP, белок Kaede и фотоактивируемый белок, фикобилипротеины и конъюгаты фикобилипротеинов, включая В-фикоэритрин, R-фикоэритрин и аллофикоцианин. Другие примеры флуоресцентных белков включают mHoneydew, mBanana, mOrange, dTomato, tdTomato, mTangerine, mStrawberry, mCherry, mGrapel, mRaspberry, mGrape2, mPlum (Shaner et al. (2005) Nat. Methods 2:905-909) и т.п. Любой из множества флуоресцентных и окрашенных белков из видов Anthozoa, описанных, например, Matz et al. (1999) Nature Biotechnol. 17:969-973, подходит для применения.
Подходящие ферменты включают, но не ограничиваются ими, пероксидазу хрена (HRP), щелочную фосфатазу (АР), бета-галактозидазу (GAL), глюкозо-6-фосфатдегидрогеназу, бета-Nацетилглюкозаминидазу, β-глюкуронидазу, инвертазу, ксантиноксидазу, люциферазу светлячков, глюкозооксидазу (GO) и т.п.
Линкеры и соединения.
Соединения между модульными компонентами, кодирующими один полипептид, внутри отдельных элементов библиотеки обычно сохраняют рамку считывания, т.е. открытая рамка считывания кодонов многомодульной кодирующей последовательности поддерживается от одного модуля до следующего. Указанные соединения могут быть упомянуты в настоящем документе как соединения с сохранением открытой рамки считывания и/или связи с сохранением открытой рамки считывания. Линкеры между модульными компонентами многомодульных полипептидов обычно будут гибкими и/или не будут содержать остатков аминокислот, которые нарушают функцию модульных доменов.
Подходящие соединения с сохранением открытой рамки считывания могут быть достигнуты, как описано более подробно ниже, с помощью любого удобного способа компоновки кодирующей последовательности и вложенной сборки модульных компонентов для включения линкера с сохранением открытой рамки считывания.
Подходящие линкеры могут быть легко выбраны и могут иметь любую подходящую длину, например, от 1 аминокислоты (например, Gly) до 20 аминокислот, от 2 аминокислот до 15 аминокислот, от 3 аминокислот до 12 аминокислот, включая от 4 аминокислот до 10 аминокислот, от 5 аминокислот до 9 аминокислот, от 6 аминокислот до 8 аминокислот или от 7 аминокислот до 8 аминокислот и могут содержать 1, 2, 3, 4, 5, 6, или 7 аминокислот.
Типичные линкеры включают полимеры глицина (G)n, полимеры глицин-серин (включая, например, (GS)n, (GSGGS)n (SEQ ID NO: 8) и (GGGS)n (SEQ ID NO: 9), где n представляет собой целое число, по меньшей мере один), полимеры глицин-аланин, полимеры аланин-серин и другие гибкие линкеры, известные в данной области техники. Подходящими для использования являются полимеры глицина и полимеры глицин-серин; Gly и Ser относительно неструктурированы и поэтому могут служить нейтральным линкером между компонентами. Подходящими для использования являются полимеры глицина;
- 25 046546 глицин получает значительно больше конформационного пространства (φ-Ψ, даже по сравнению с аланином, и гораздо менее ограничен, чем остатки с более длинными боковыми цепями (см. Scheraga, Rev. Computational Chem. 11173-142 (1992)). Типичные линкеры могут содержать аминокислотные последовательности, включая, но не ограничиваясь ими, GGSG (SEQ ID NO: 10), GGSGG (SEQ ID NO: 11), GSGSG (SEQ ID NO: 12), GSGGG (SEQ ID NO: 13), GGGSG (SEQ ID NO: 14), GSSSG (SEQ ID NO: 15) и т.п.
В некоторых случаях линкер содержит последовательность сайта распознавания фермента рестрикции BamHI для целей клонирования и как часть линкера, поскольку сайт BamHI кодирует GS.
В некоторых случаях линкерные последовательности могут быть устранены с помощью одной или более стадий клонирования (например, с использованием рестрикционных эндонуклеаз типа IIS или гомологичной рекомбинации) или путем прямого расщепления (например, расщепления ферментом рестрикции BamHI).
В некоторых случаях соединение с сохранением открытой рамки считывания достигается за счет отсутствия линкера в месте соединения двух модульных компонентов. Следовательно, соединение с сохранением открытой рамки считывания может, в некотором смысле, не содержать промежуточной нуклеиновой кислоты, кодирующей аминокислоты, между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может содержать две или менее пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может содержать одну или более пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может не содержать пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями.
Нуклеиновые последовательности-штрихкоды.
Нуклеиновые последовательности-штрихкоды представляют собой специфичные уникальные последовательности нуклеиновых кислот, которые могут быть идентифицированы любым подходящим способом идентификации последовательности нуклеиновой кислоты, включая, но не ограничиваясь ими, например, идентификацию на основе гибридизации (т.е. гибридизацию в условиях in situ), идентификацию на основе амплификации (т.е., идентификацию на основе ПНР) и секвенирование нуклеиновой кислоты. Нуклеиновые последовательности-штрихкоды согласно настоящему изобретению могут представлять собой нуклеиновые последовательности-штрихкоды, специфичные для модуля, это означает, что каждый уникальный модуль многомодульной библиотеки коррелирован с конкретной уникальной нуклеиновой последовательностью-штрихкодом так, что идентификация конкретной последовательности-штрихкода эквивалентна положительной идентификации соответствующей последовательности, кодирующей модуль.
Специфичная для модуля нуклеиновая последовательность-штрихкод, описанная в настоящем документе, будет ограничена используемым способом сборки библиотеки. Например, если вложенную сборку многомодульных конструкций осуществляют с помощью способа на основе фермента рестрикции, нуклеиновые последовательности-штрихкоды будут исключать любую последовательность, которая представляет собой сайт распознавания фермента рестрикции для ферментов рестрикции, используемых при сборке. Следовательно, в некоторых случаях последовательности-штрихкоды не будут содержать последовательностей, распознаваемых рестриктазами. В некоторых случаях последовательностиштрихкоды не будут содержать последовательностей, распознаваемых рестриктазой типа IIS.
В тех случаях, когда идентификацию нуклеиновой последовательности-штрихкода и/или количественную оценку выполняют путем секвенирования, включая, например, методы секвенирования следующего поколения, будут применены стандартные критерии для нуклеиновых последовательностейштрихкодов, детектируемых путем секвенирования. В некоторых случаях коммерчески доступные нуклеиновые последовательности-штрихкоды и/или наборы, содержащие нуклеиновые последовательностиштрихкоды и/или адаптеры нуклеиновых последовательностей-штрихкодов, могут быть использованы или модифицированы для применения в способах, описанных в настоящем документе, включая, например, нуклеиновые последовательности-штрихкоды и/или наборы адаптеров нуклеиновых последовательностей-штрихкодов коммерчески доступные от таких поставщиков как, но не ограничиваясь ими, например, New England Biolabs (Ипсвич, Массачусетс, США), Illumina, Inc. (Хейвард, Калифорния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США), Bioo Scientific Corporation (Остин, Техас, США) и т.п., или могут быть изготовлены на заказ, например, как доступно, например, в Integrated DNA Technologies, Inc. (Коралвилл, Айова, США).
Длина нуклеиновой последовательности-штрихкода будет варьироваться и будет зависеть от сложности библиотеки и используемого метода детектирования последовательности-штрихкода. Поскольку нуклеиновые последовательности-штрихкоды (например, последовательности-штрихкоды ДНК) хорошо известны, то дизайн, синтез и использование нуклеиновых последовательностей-штрихкодов находится в пределах компетенции специалиста в данной области техники.
В некоторых случаях длина используемых нуклеиновых последовательностей-штрихкодов также будет зависеть от вероятности того, что отдельная нуклеиновая последовательность-штрихкод случайно
- 26 046546 появится в каком-либо другом компоненте библиотеки, включая, но не ограничиваясь ими, например, кодирующую модуль последовательность, вектор, компонент вектора и т.д., или на стыке двух звеньев нуклеиновых последовательностей-штрихкодов. Например, в некоторых случаях, если существует значительная вероятность того, что последовательность, не относящаяся к нуклеиновой последовательности-штрихкоду, может быть случайно детектирована в виде последовательности-штрихкода, например, как это имеет место в очень сложных библиотеках, могут быть использованы звенья нуклеиновых последовательностей-штрихкодов большей длины. В некоторых случаях метод детектирования нуклеиновой последовательности-штрихкода может быть принят во внимание при определении необходимой длины последовательности-штрихкода, например, в тех случаях, когда нуклеиновую последовательностьштрихкод детектируют путем гибридизации, могут быть использованы более длинные нуклеиновые последовательности-штрихкоды, по сравнению с тем случаем, когда применяют секвенирование с использованием определенных праймеров для секвенирования.
В настоящем изобретении термин область нуклеиновой последовательности-штрихкода, поскольку он применяется по отношению к отдельным элементам библиотеки нуклеиновых кислот, относится к области каждой нуклеиновой кислоты, которая содержит последовательность нуклеиновой кислоты, специфичную для вариабельной модульной части синтетического полипептида. В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для специфичной идентификации вариабельного модуля или модулей, присутствующих в кодирующей области конкретного элемента библиотеки. В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для специфичной идентификации вариабельного модуля(ей) и идентификации порядка вариабельных модулей, присутствующих в кодирующей области конкретного элемента библиотеки (т.е. архитектуры). В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для количественной оценки, например, полуколичественной оценки, частоты конкретного элемента библиотеки или частоты конкретного модуля в популяции, содержащей множество элементов библиотеки.
В пределах синтетического модульного полипептида, содержащего нуклеиновую последовательность-штрихкод, библиотеки, описанной в настоящем документе, звенья нуклеиновых последовательностей-штрихкодов в области последовательностей-штрихкодов будут иметь обратную ориентацию по отношению к последовательностям, кодирующим модули. Помимо этого звенья нуклеиновых последовательностей-штрихкодов в области последовательностей-штрихкодов будут расположены в обратном порядке по отношению к соответствующей им последовательности, кодирующей модуль. Однако по отношению к кодируемому полипептиду область нуклеиновых последовательностей-штрихкодов может быть расположена в направлении N-конца или С-конца относительно последовательности нуклеиновой кислоты, кодирующей синтетический модульный полипептид.
Специфичные для вектора элементы.
Под специфичными для вектора элементами понимают элементы, которые используют при получении, конструировании, распространении, поддержании и/или количественном исследовании вектора до, во время или после его конструирования. Подходящие специфичные для вектора элементы включают, но не ограничиваются ими, например, элементы вектора, необходимые для распространения, клонирования и выбора вектора во время его использования, и могут включать, но не ограничиваются ими, например, сайт инициации репликации, сайт множественного клонирования, прокариотический промотор, фаговый промотор, селективный маркер (например, ген устойчивости к антибиотикам, кодируемый ферментный белок, кодируемый флуоресцентный или хромогенный белок и т.д.) и т.п. В векторах, описанных в настоящем документе, можно использовать любые подходящие специфичные для вектора элементы, если это необходимо.
Подходящие промоторные и энхансерные элементы, используемые в качестве специфичных для вектора элементов, известны в данной области техники. Промоторы, подходящие для экспрессии в бактериальной клетке включают, но не ограничиваются ими, lacI, lacZ, Т3, Т7, gpt, lambda P и trc. Промоторы, подходящие для экспрессии в эукариотической клетке, включают, но не ограничиваются ими, промоторные и энхансерные элементы гена легкой и/или тяжелой цепей иммуноглобулина; немедленный ранний промотор цитомегаловируса; промотор тимидинкиназы вируса простого герпеса; ранние и поздние промоторы SV40; промотор, присутствующий в длинных концевых повторах ретровируса; промотор металлотионеина-1 мыши; и различные тканеспецифичные промоторы, известные в данной области техники.
Подходящие обратимые промоторы, включая обратимые индуцибельные промоторы, известны в данной области техники. Подходящие обратимые промоторы могут быть выделены и получены из многих организмов, например, эукариотов и прокариотов. Модификация обратимых промоторов, полученных из первого организма для применения во втором организме, например, первый организм является прокариотом, и второй организм является эукариотом, первый организм является эукариотом, и второй организм является прокариотом и т.д., хорошо известна в данной области техники. Подходящие обратимые промоторы и системы, основанные на подходящих обратимых промоторах, при этом также содержащие дополнительные контрольные белки, включают, но не ограничиваются ими, промоторы, регули
- 27 046546 руемые спиртом (например, промотор гена алкогольдегидрогеназы I (alcA), промоторы, реагирующие на белки, трансактивируемые спиртом (AlcR) и т.д.), регулируемые тетрациклином промоторы (например, промоторные системы, включая TetActivators, TetON, TetOFF и т.д.), регулируемые стероидами промоторы (например, промоторные системы рецептора глюкокортикоидов крысы, промоторные системы рецептора эстрогенов человека, регулируемые ретиноидами промоторные системы, системы промоторов щитовидной железы, регулируемые экдизоном промоторные системы, регулируемые мифепристоном промоторные системы и т.д.), регулируемые металлом промоторы (например, промоторные системы металлотионеина и т.д.), регулируемые патогенезом промоторы (например, промоторы, регулируемые салициловой кислотой, промоторы, регулируемые этиленом, промоторы, регулируемые бензотиадиазолом и т.д.), регулируемые температурой промоторы (например, индуцируемые тепловым шоком промоторы (например, HSP-70, HSP-90, промотор белка теплового шока сои и т.д.), регулируемые светом промоторы, синтетические индуцибельные промоторы и т.п.
В некоторых случаях локус или конструкцию или трансген, содержащий подходящий промотор, необратимо переключают посредством индукции индуцируемой системы. Подходящие системы для индукции необратимого переключения хорошо известны в данной области техники, например, индукция необратимого переключения может быть основана на использовании рекомбинации, опосредованной Cre-lox (см., например, работу Fuhrmann-Benzakein, et al., PNAS (2000) 28:e99, содержание которой полностью включено в настоящее изобретение посредством ссылки). Любая подходящая комбинация рекомбиназы, эндонуклеазы, лигазы, сайтов рекомбинации и т.д., известная в данной области техники, может быть использована для создания промотора с необратимым переключением. Способы, механизмы и требования к выполнению сайтспецифичной рекомбинации, описанные в другом месте в настоящем документе, могут быть использованы для получения промоторов с необратимым переключением и хорошо известны в данной области техники, см., например, Grindley et al. (2006) Annual Review of Biochemistry, 567-605 и Tropp (2012) Molecular Biology (Jones & Bartlett Publishers, Sudbury, MA), содержание которой включено в настоящее изобретение посредством ссылки.
Способы получения библиотек
В настоящем изобретении предложены способы получения библиотек нуклеиновых кислот, кодирующих синтетические модульные полипептиды, причем каждая нуклеиновая кислота библиотеки содержит многозвенную нуклеиновую последовательность-штрихкод, которая идентифицирует вариабельный модуль (модули) модульного полипептида и, если присутствуют несколько вариабельных модулей, ориентацию модулей друг относительно друга. В многочисленных вариантах реализации настоящего изобретения предложены способы поэтапной комбинаторной сборки синтетических модульных полипептидов из кодирующих модули нуклеиновых кислот, содержащих нуклеиновые последовательностиштрихкоды, так, что каждая из полученных нуклеиновых кислот, кодирующих синтетические модульные полипептиды, содержит область, кодирующую модули, встроенную с сохранением открытой рамки считывания, и многозвенную нуклеиновую последовательность-штрихкод, при этом расположение звеньев нуклеиновой последовательности-штрихкода соответствует расположению модулей, встроенных с сохранением открытой рамки считывания. В целом, в тех случаях, когда в каждый элемент библиотеки включено несколько вариабельных модулей, совместно собранная многозвенная нуклеиновая последовательность-штрихкод обеспечивает характеристику сборки вариабельных модулей каждого элемента библиотеки.
Не желая быть связанными соответствием какой-либо теории, авторы настоящего изобретения полагают, что поэтапная комбинаторная сборка синтетических модульных полипептидов, представленных в настоящем документе, обеспечивает конструирование более крупных и более сложных библиотек, чем было бы возможно или осуществимо с использованием стандартных способов конструирования на основе индивидуальных (т.е. по одному) полипептидов. Авторы настоящего изобретения выявили, что стандартные способы конструирования синтетических модульных полипептидов представляют собой значительное техническое препятствие для высокопроизводительного скрининга синтетических модульных полипептидов. Скоординированная сборка каждого многомодульного синтетического полипептида и соответствующей многозвенной нуклеиновой последовательности-штрихкода, предложенная в настоящем документе, позволяет преодолеть указанное препятствие и обеспечивает сборку в одном реакторе из множества уникальных нуклеиновых кислот, кодирующих синтетические модульные полипептиды, подходящие для скрининга. Упомянутая высокопроизводительная сборка в одном реакторе не может быть выполнена с использованием стандартных способов конструирования полипептидов.
Авторы настоящего изобретения также выявили, что стандартные, сгруппированные физически, синтетические полипептидные библиотеки также представляют собой серьезные технические препятствия для высокопроизводительного скрининга. В частности, при скрининге больших библиотек число физически разделенных реакционных камер и изменчивость условий количественного исследования между каждой камерой представляют значительные технические препятствия при попытке скрининга всей сложной большой библиотеки и анализа полученных данных. Авторы настоящего изобретения выявили, что скрининг объединенной библиотеки может решить указанную проблему, однако имеет другие значительные препятствия, такие как трудность или нецелесообразность идентификации и/или количественно
- 28 046546 го определения отдельных полипептидов, обеспечивающих желательный фенотип при скрининге из сложного смешанного пула уникальных модульных полипептидов. Использование короткой многозвенной нуклеиновой последовательности-штрихкода устраняет эту проблему, обеспечивая апостериорную эффективную положительную идентификацию и/или количественную оценку отдельных уникальных синтетических модульных полипептидов, которые обеспечивают желательный фенотип в сложном пуле, путем секвенирования только многозвенной нуклеиновой последовательности-штрихкода.
Стратегии клонирования.
В целом, в настоящем изобретении предложен способ получения библиотек, описанных в настоящем документе, путем вложенной сборки кодирующих полипептидные модули нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды. Например, как показано на фиг. 12, вектор нуклеиновой кислоты (100), содержащий последовательность, кодирующую полипептидный модуль (101), соединенную со специфичной для модуля нуклеиновой последовательностью-штрихкодом (102), линеаризуют (103) путем расщепления связи между последовательностью, кодирующей полипептидный модуль, и специфичной для модуля нуклеиновой последовательностью-штрихкодом. После линеаризации вектора, содержащего первую кодирующую модуль последовательность и первую специфичную для модуля нуклеиновую последовательность-штрихкод, нуклеиновую кислоту, содержащую вторую кодирующую модуль последовательность (104) и вторую нуклеиновую последовательность-штрихкод (105), специфичную для второго модуля, вставляют (т.е. встраивают) между первой кодирующей модуль последовательностью и первой нуклеиновой последовательностью-штрихкодом (106). Собранная нуклеиновая кислота содержит кодирующую область, кодирующую синтетический модульный полипептид и область нуклеиновой последовательности-штрихкода, которая содержит многозвенную нуклеиновую последовательность-штрихкод (т.е. нуклеиновые последовательности-штрихкоды (ВС)). В некоторых случаях последовательности, кодирующие модули, собирают так, чтобы они соединялись с помощью последовательности, кодирующей желательный линкер, описанный в настоящем документе. В некоторых случаях последовательности, кодирующие модули, собирают так, чтобы они соединялись без использования линкерной последовательности, например, без линкерной последовательности, кодирующей одну или более линкерных аминокислот, без каких-либо промежуточных некодирующих нуклеотидов между первой и второй последовательностями, кодирующими модули, и т.д. Следовательно, обозначение желательная линкерная последовательность или линкер, в частности, использованное в чертежах, включает полное отсутствие любого линкера или линкерной последовательности и прямое соединение полипептидных модулей и последовательностей, кодирующих модули.
Линеаризация векторной последовательности путем расщепления участка между первой кодирующей модуль последовательностью и первой специфичной для модуля нуклеиновой последовательностью-штрихкодом может быть достигнута с помощью любого удобного и подходящего средства. Например, полинуклеотид, содержащий кодирующую модуль последовательность и нуклеиновую последовательность-штрихкод, может быть сконфигурирован так, чтобы содержать сайт расщепления фермента рестрикции (т.е. рестрикционной эндонуклеазы) между кодирующей модуль последовательностью и нуклеиновой последовательностью-штрихкодом. Сайт расщепления может представлять собой сайт расщепления фермента рестрикции типа II и, более конкретно, может представлять собой сайт расщепления, который содержится в последовательности, распознаваемой используемым ферментом рестрикции типа II. Любой удобный фермент рестрикции типа II, который осуществляет расщепление в пределах своей последовательности распознавания, можно применять для описанной цели, включая ферменты рестрикции типа II, которые осуществляют расщепление в пределах своих последовательностей распознавания, которые известны в данной области техники. В некоторых случаях сайт расщепления может представлять собой сайт расщепления BamHI, который имеет последовательность распознавания 5'-GGATCC-3' и расщепляет нити после первого G последовательности распознавания на обеих нитях, оставляя липкий конец 5'-GATC-3'. Другие ферменты рестрикции, которые могут быть использованы для указанной цели, включают, но не ограничиваются ими, например.
В некоторых случаях вложенную сборку осуществляют путем использования сайтов двух ферментов рестрикции (RE1 и RE2), расположенных между первой кодирующей модуль последовательностью и первой специфичной для модуля нуклеиновой последовательностью-штрихкодом, и фланкирующих вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательностьштрихкод (фиг. 13). В случае стратегии сборки, основанной на использовании двух ферментов рестрикции, расщепление в двух сайтах RE1 и RE2 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй последовательностями, кодирующими модули, и первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.
В некоторых случаях вложенную сборку осуществляют путем использования сайтов четырех ферментов рестрикции (RE1, RE2, RE3 и RE4), причем RE1 и RE2 расположены между обеими кодирующими модули последовательностями и соответствующими им нуклеиновыми последовательностями
- 29 046546 штрихкодами, тогда как RE3 и RE4 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (фиг. 14). В случае стратегии сборки с использованием четырех ферментов рестрикции раздельное расщепление первого вектора в сайтах RE1 и RE2 и второго вектора в сайтах RE3 и RE4 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй последовательностями, кодирующими модули, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.
В некоторых случаях ферменты рестрикции намеренно выбирают так, что после лигирования соединения между первой и второй кодирующими модули последовательностями и первой и второй нуклеиновыми последовательностями-штрихкодами не содержат последовательностей распознавания ферментов рестрикции RE1, RE2, RE3 или RE4. В целом, в соответствии с указанной стратегией использованные сайты RE1, RE2, RE3 и RE4 инактивированы после лигирования так, что полученный в результате вектор содержит только активные сайты RE1 и RE2 между второй кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Следовательно, данная стратегия обеспечивает последовательную вложенную сборку не только двумерной конструкции путем повторной линеаризации полученного вектора с помощью расщепления ферментами рестрикции RE1 и RE2 кодирующей модуль последовательности, содержащей нуклеиновую последовательностьштрихкод, которая была вставлена в последнюю очередь.
В случае способа сборки с использованием четырех ферментов рестрикции RE1 выбирают так, чтобы после расщепления полученный конец линеаризованного вектора был совместимым (т.е. был способен к лигированию) с концом высвобожденного фрагмента, полученного с помощью расщепления ферментом рестрикции RE3. RE2 выбирают так, чтобы после расщепления полученный конец линеаризованного вектора был совместимым (т.е. мог быть лигирован и/или был способен к полной или по меньшей мере частичной гибридизации) с концом высвобожденного фрагмента, полученного при расщеплении с помощью фермента рестрикции RE4. В некоторых случаях один или более концов, полученных в результате расщепления с помощью RE1, RE2, RE3 или RE4, могут быть модифицированы, например, путем добавления или удаления одного или более нуклеотидов или другой химической модификации для получения концов, совместимых между RE1 и RE3 или RE2 и RE4. Любой удобный способ концевой модификации можно применять для получения совместимых концов, включая способы концевой модификации, которые хорошо известны в данной области техники, включая, но не ограничиваясь ими, например, создание тупых концов, фосфорилирование, дефосфорилирование и т.д.
В некоторых случаях вложенную сборку осуществляют путем использования последовательности распознавания фермента рестрикции типа IIS (RE1), причем два сайта RE1 присутствуют между первой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностьюштрихкодом, и два сайта RE1 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (фиг. 15). В случае указанной стратегии, опосредованной ферментом рестрикции типа IIS, расщепление в сайтах, смежных с сайтами распознавания RE1, приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. Сайты расщепления, смежные с сайтами распознавания RE1, сконфигурированы так, что после расщепления 3'-конец вектора совместим с 5'-концом фрагмента, и 5'-конец вектора совместим с 3'-концом фрагмента. В некоторых случаях указанные совместимые концы могут называться совместимыми липкими концами. Следовательно, при лигировании линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй кодирующими модули последовательностями, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.
Любой удобный фермент рестрикции типа IIS можно применять в стратегиях сборки с использованием указанных ферментов, описанных в настоящем документе, включая, но не ограничиваясь ими, например, AceIII, AcuI, AlwI, AarI, BbsI, BbvI, BbvII, BccI, Bce83I, BceAI, BcefI, BciVI, BfuAI, BmrI, BmuI, BpmI, BpuEI, BsaI, BsbI, BseRI, BsgI, BslFI, BsmAI, BsmFI, BsoMAI, BspCNI, BspGI, BspMI, BspNCI, BspQI, BsrDI, Bst71I, BtgZI, BtsCI, BtsI, BveI, DrdII, EarI, EciI, FaqI, FinI, FokI, HgaI, Hin4II, HphI, HpyAV, LguI, MboII, MmeI, MnlI, NmeAIII, PleI, SapI, SfaNI, SgeI и т.п.
В некоторых случаях фермент рестрикции, использованный, например, при линеаризации вектора и/или высвобождении фрагмента, содержащего второй модуль, представляет собой фермент рестрикции, который расщепляет цепи по обе стороны от своего сайта распознавания. Любой удобный фермент рестрикции, обладающий указанной активностью, можно применять в способах сборки, описанных в настоящем документе, включая, но не ограничиваясь им, например, BcgI.
В некоторых случаях вложенную сборку осуществляют путем использования нескольких последовательностей распознавания ферментов рестрикции типа IIS, например, двух последовательностей распознавания ферментов рестрикции типа IIS (RE1 и RE2), причем два сайта RE1 присутствуют между ко
- 30 046546 дирующими модули последовательностями и соответствующими им нуклеиновыми последовательностями-штрихкодами, и два сайта RE2 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (фиг. 16). В случае стратегии сборки с использованием двух ферментов рестрикции типа IIS раздельное расщепление первого вектора в сайтах RE1 и второго вектора в сайтах RE2 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательностьштрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй кодирующими модули последовательностями, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.
В целом, в соответствии с данной стратегией сайты RE1 и RE2, использованные в первом раунде линеаризации и высвобождения фрагментов, не сохраняются в векторе и встраиваются так, что полученный вектор содержит только активные сайты RE1 между второй кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Следовательно, данная стратегия обеспечивает последовательную вложенную сборку не только двумерной конструкции путем повторной линеаризации полученного вектора с помощью расщепления ферментами рестрикции сайтов распознавания RE1 в кодирующей модуль последовательности, содержащей нуклеиновую последовательность-штрихкод, которая была вставлена в последнюю очередь.
В данном способе сборки с использованием фермента рестрикции типа IIS сайты расщепления, смежные с последовательностями распознавания RE1 и RE2, сконфигурированы так, что после расщепления полученные концы линеаризованного вектора являются совместимыми (т.е. способны к лигированию) с концами высвобожденного фрагмента. В некоторых случаях один или более концов, полученных при расщеплении RE1 и/или RE2, могут быть модифицированы, например, путем добавления или удаления одного или более нуклеотидов или другой химической модификации для получения совместимых концов. Любой удобный способ модификации концов можно применять для получения совместимых концов, включая способы модификации концов, которые хорошо известны в данной области техники, включая, но не ограничиваясь ими, например, получение тупых концов, фосфорилирование, дефосфорилирование и т.д.
В некоторых случаях совместимые концы могут быть получены с помощью фермента с экзонуклеазной активностью, например, экзонуклеазы. Например, в некоторых вариантах реализации первый вектор и второй вектор или фрагмент нуклеиновой кислоты сконфигурированы так, что при расщеплении первого вектора первым ферментом рестрикции (RE1) и второго вектора или нуклеиновой кислоты вторым ферментом рестрикции (RE2) полученные новые концы совместимы для лигирования после использования фермента с экзонуклеазной активностью. Способы получения совместимых концов с использованием фермента с экзонуклеазной активностью хорошо известны в данной области техники и включают, но не ограничиваются ими, например, клонирование с помощью системы In-Fusion®, сборку по Гибсону и т.п.
В некоторых случаях сборку первого вектора, расщепленного ферментом рестрикции, и второй нуклеиновой кислоты, например, второго вектора, содержащего фрагмент нуклеиновой кислоты, осуществляют с помощью реакции In-Fusion®, и, в таких случаях, совместимые концы, полученные в результате использования фермента с экзонуклеазной активностью, могут быть упомянуты как липкие концы In-Fusion (липкие концы IF) (фиг. 17). Соединение двух липких концов IF может быть сконфигурировано так, чтобы получить желательные линкеры и/или желательные линкерные последовательности между двумя соединенными концами нуклеиновой кислоты. Например, соединенные липкие концы IF между первой кодирующей модуль последовательностью и второй кодирующей модуль последовательностью могут быть сконфигурированы так, что первый и второй модули расположены с сохранением открытой рамки считывания. Как описано более подробно в настоящем документе, кодирующие модули последовательности, которые расположены с сохранением открытой рамки считывания, могут быть разделены последовательностью, кодирующей одну или более линкерных аминокислот, или могут не иметь такой последовательности. Например, как показано на фиг. 17, расщепление первого вектора в сайте распознавания (RE1) первого фермента рестрикции приводит к получению концов, которые могут быть совмещены посредством реакции In-Fusion® с концами, полученными при расщеплении второго вектора или фрагмента нуклеиновой кислоты ферментом рестрикции типа IIS в сайтах расщепления, определенных сайтами распознавания (RE2), присутствующими на втором векторе или фрагменте нуклеиновой кислоты. Совместимые концы лигируют посредством реакции In-Fusion®, что приводит к получению желательной линкерной последовательности между первой и второй кодирующими модули последовательностями и многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первое звено и второе звено нуклеиновых последовательностей-штрихкодов, которые имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям. В некоторых случаях после сборки In-Fusion® первой и второй кодирующих модули последовательностей и многозвенной нуклеиновой последовательности-штрихкода сайт фермента рестрикции присутствует между кодирующей об
- 31 046546 ластью и областью последовательности-штрихкода, чтобы обеспечить возможность введения дополнительных последовательностей, кодирующих модули, и звеньев нуклеиновых последовательностейштрихкодов.
В некоторых случаях после лигирования нуклеиновой кислоты, содержащей первую кодирующую модуль последовательность, со второй нуклеиновой кислотой, содержащей вторую кодирующую модуль последовательность, первая и вторая кодирующие модули последовательности соединены так, что между первой и второй кодирующими модули последовательностями отсутствует линкер и промежуточные некодирующие нуклеотиды. В одном неограничивающем примере первый вектор, содержащий первую кодирующую модуль последовательность и соответствующую ей нуклеиновую последовательностьштрихкод, соединен без линкера или промежуточных некодирующих нуклеотидов со вторым вектором или фрагментом нуклеиновой кислоты, содержащим вторую кодирующую модуль последовательность и соответствующую ей нуклеиновую последовательность-штрихкод, с помощью расщепления ферментом рестрикции (фиг. 18). Первый вектор и второй вектор или фрагмент нуклеиновой кислоты расщепляют с использованием двух разных ферментов рестрикции типа IIS, имеющих два разных сайта распознавания (RE1 и RE2), причем первый фермент рестрикции расщепляет обе нити нуклеиновой кислоты в одном и том же положении на некотором расстоянии от своего сайта распознавания (RE1), оставляя тупой конец, тогда как второй фермент рестрикции расщепляет обе нити нуклеиновой кислоты в разных положениях на некотором расстоянии от своего сайта распознавания (RE2), оставляя выступающий конец или липкий конец. Исходные нуклеиновые кислоты сконфигурированы так, что после расщепления первого вектора и второго вектора вторым ферментом рестрикции образующиеся липкие концы являются совместимыми для лигирования. Следовательно, после лигирования полученных тупых концов и липких концов полученный вектор содержит первую кодирующую модуль последовательность, гибридизованную непосредственно, без линкера или промежуточных некодирующих нуклеиновых кислот, со второй кодирующей модуль последовательностью и многозвенной нуклеиновой последовательностьюштрихкодом, содержащей нуклеиновую последовательность-штрихкод первой кодирующей модуль последовательности и нуклеиновую последовательность-штрихкод второй кодирующей модуль последовательности в обратной ориентации по отношению к первой и второй кодирующим модули последовательностям.
Любой удобный фермент рестрикции типа IIS, который приводит к получению тупых концов после расщепления, можно применять в способах, описанных в настоящем документе, с использованием лигирования тупых концов, включая ферменты, которые хорошо известны в данной области техники, включая, но не ограничиваются ими, например, SlyI, MlyI и т.д. Помимо этого при необходимости можно использовать способы получения тупых концов после расщепления с помощью рестрикционной эндонуклеазы, которая не образует тупые концы, т.е. может быть использовано затупление, при необходимости, включая, но не ограничиваясь перечисленным, заполнение конца ДНК-полимеразой, такой как, например, большой фрагмент ДНК-полимеразы I (например, фрагмент Кленова), ДНК-полимеразой Т4, нуклеазой золотистой фасоли и т.д., или концевые неспаренные нуклеотиды могут быть удалены ферментом с экзонуклеазной активностью.
В некоторых случаях, когда последовательность, совместимая с ферментом рестрикции, не относящимся к типу IIS, присутствует на конце кодирующей модуль последовательности, расщепление может быть выполнено с помощью фермента рестрикции, не относящегося к типу IIS, например, фермента рестрикции типа II, который расщепляет нити внутри своей последовательность распознавания. В таких случаях может быть использован фермент рестрикции, который образует тупой конец на конце кодирующей модуль последовательности, если кодирующая модуль последовательность содержит всю или часть последовательности распознавания фермента рестрикции на своем З'-конце или 5'-конце. В некоторых случаях, когда кодирующая модуль последовательность содержит всю или часть последовательности распознавания фермента рестрикции, который разрезает нити внутри своей последовательности распознавания и не образует тупой конец, может быть использован фермент рестрикции, не образующий тупых концов, и полученные липкие концы могут быть затуплены, например, любым удобным способом, включая, но не ограничиваясь ими, например, способы, описанные в настоящем документе.
Поскольку последовательности на концах кодирующих модули последовательностей будут ограничены концевыми аминокислотами модуля, то случаи, когда подходящие последовательности распознавания фермента рестрикции присутствуют в удобном положении, или могут быть модифицированы для этого, на одном или нескольких концах кодирующей модуль последовательности, чтобы обеспечить надлежащее расщепление и/или образование тупого конца, могут быть редкими в зависимости от конкретного используемого модуля. Следовательно, во многих случаях эффективное получение большой или многомерной библиотеки синтетических модульных полипептидов будет зависеть от сайтов распознавания ферментов, которые присутствуют за пределами кодирующей модуль последовательности. Следовательно, в некоторых случаях одна или более, включая все, из последовательностей распознавания ферментов рестрикции, используемых при сборке библиотеки, будут присутствовать за пределами кодирующей модуль последовательности. Во многих случаях одна или более, включая все, из последовательностей распознавания ферментов рестрикции, используемых при сборке библиотеки, будут присутство
- 32 046546 вать за пределами нуклеиновой последовательности-штрихкода.
В некоторых случаях получают синтетический модульный полипептид, в котором кодирующие модули последовательности легко соединяются с концами линкерного домена так, что между кодирующими модули последовательностями и соответствующими им соединениями с линкерным доменом отсутствует промежуточная последовательность. В одном неограничивающем примере указанное непрерывное соединение кодирующих модули последовательностей с линкерным доменом облегчается вектором или фрагментом нуклеиновой кислоты, сконфигурированным так, чтобы содержать часть желательной линкерной последовательности, легко присоединяемой к любому концу кодирующей модуль последовательности. Например, первый вектор, сконфигурированный так, чтобы содержать первую кодирующую модуль последовательность, легко присоединенную к первой части линкерного домена, лигируют со вторым вектором или фрагментом нуклеиновой кислоты, сконфигурированным так, чтобы содержать вторую часть линкерного домена, последовательно присоединенную ко второй кодирующей модуль последовательности (фиг. 19). Первый вектор может быть сконфигурирован так, чтобы содержать два сайта распознавания первого фермента рестрикции типа IIS (RE1) между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Второй вектор, или фрагмент нуклеиновой кислоты, может быть сконфигурирован так, чтобы содержать два сайта распознавания второго фермента рестрикции типа IIS (RE2), фланкирующие вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. Может быть использован третий вектор или фрагмент нуклеиновой кислоты, содержащий оставшуюся, например, среднюю часть линкерного домена, которая фланкирована двумя сайтами распознавания второго фермента рестрикции типа IIS (RE2). Последовательность предварительно расщепленных векторов и/или фрагментов нуклеиновых кислот конфигурируют так, чтобы после расщепления получить совместимые концы между первой частью линкерного домена и средней частью линкерного домена, второй частью линкерного домена и средней частью линкерного домена и двумя нуклеиновыми последовательностями-штрихкодами. После расщепления и лигирования полученный вектор содержит первую кодирующую модуль последовательность, последовательно соединенную с линкерным доменом, последовательно соединенным со второй кодирующей модуль последовательностью, соединенной с областью нуклеиновой последовательности-штрихкода, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к первой и второй кодирующим модули последовательностям (фиг. 19). Последовательная сборка, например, между модулями и линкерными доменами, может быть достигнута с использованием опосредованной экзонуклеазами сборки (например, клонирование с помощью системы In-Fusion®, сборка по Гибсону и т.д.) или без нее.
Вышеописанные стратегии сборки на основе расщепления, в некоторых случаях, можно комбинировать, полностью или частично, любым удобным и подходящим путем, чтобы обеспечить способ, пригодный для получения библиотеки синтетических модульных полипептидов, описанной в настоящем документе. Помимо этого, в тех случаях, когда альтернативные способы сборки на основе расщепления известны в данной области техники и будут совместимы с описанными в настоящем документе способами, подходящие альтернативные способы можно применять при сборке библиотеки синтетических модульных полипептидов, описанной в настоящем документе. В некоторых случаях описанные стратегии на основе расщепления можно комбинировать, полностью или частично, со способами, не связанными с расщеплением, для сборки нуклеиновых кислот.
Сборка нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов, описанную в настоящем документе, не ограничена стратегиями сборки на основе расщепления, т.е. сборки на основе ферментов рестрикции. В некоторых случаях способы, не связанные с расщеплением, можно применять при сборке библиотеки, описанной в настоящем документе, включая, но не ограничиваясь ими, например, стратегии на основе амплификации, стратегии на основе рекомбинации и т.д. Подходящими для применения являются способы, не связанные с расщеплением, вместо стратегий на основе расщепления, т.е. вся стратегия сборки в целом не связана с расщеплением ферментами рестрикции или может быть использована в комбинации со стратегиями на основе расщепления, т.е., так, что стратегия сборки в целом включает как способы, основанные на использовании ферментов рестрикции, так и способы, не связанные с расщеплением ферментами рестрикции.
В некоторых случаях библиотека синтетических модульных полипептидов, описанная в настоящем документе, может быть собрана полностью или частично с использованием способа сборки на основе амплификации, включая, но не ограничиваясь ими, например, клонирование ПЦР, клонирование ТА, удлинение концов методом ПЦР и т.п. Подходящие стратегии на основе амплификации будут варьироваться, но обычно будут основаны на использовании множества сайтов связывания праймеров в исходных векторах и/или фрагментах нуклеиновых кислот. Подходящие сайты связывания праймеров, в зависимости от желательного конечного продукта, могут быть специально добавлены к векторам и/или фрагментам нуклеиновых кислот, или ранее существовавшая последовательность, присутствующая в векторе или фрагменте нуклеиновой кислоты, может быть использована в качестве сайта связывания праймера в соответствии с различными стратегиями сборки, основанными на амплификации. Сайты связывания праймеров могут быть расположены в любой удобной конфигурации и/или ориентации, доста
- 33 046546 точной для получения желательного клонированного продукта, включая, но не ограничиваясь ими: расположение между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом в направлении от 5'-конца к 3'-концу относительно последовательности, кодирующей модуль; расположение между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом в направлении от 5'-конца к 3'-концу относительно последовательности-штрихкода; расположение перед (т.е. в направлении 5'-конца) кодирующей модуль последовательностью в направлении от 5'-конца к 3'-концу относительно кодирующей модуль последовательности; расположение после (т.е. в направлении 3'-конца) кодирующей модуль последовательности в направлении от 5'-конца к 3'-концу относительно кодирующей модуль последовательности, содержащей нуклеиновую последовательность-штрихкод; и т.п. Последовательности сайтов связывания праймеров могут быть сконфигурированы так, что после клонирования на основе амплификации, в том числе после одного раунда клонирования на основе амплификации, одна или более желательных линкерных последовательностей присутствуют между собранными элементами, включая, например, собранные последовательности, кодирующие модули, собранные нуклеиновые последовательности-штрихкоды и т.д.
В качестве неограничивающего примера стратегий сборки на основе амплификации может быть использована стратегия амплификации липких концов методом ПЦР (фиг. 20), при которой первый вектор содержит первый сайт связывания праймера (PBS1) и второй сайт связывания праймера (PBS2), расположенный, в ориентации, противоположной ориентации от 5'-конца к 3'-концу, между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Может быть использован второй вектор или фрагмент нуклеиновой кислоты, содержащий вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, фланкированную первым и вторым сайтами связывания праймеров (PBS1 и PBS2). После удлинения и амплификации с помощью удлинения липких концов методом ПЦР с использованием праймеров, которые специфично гибридизуются с сайтами PBS1 и PBS2, синтезируется собранный продукт, в котором первая кодирующая модуль последовательность соединена с помощью желательного линкера со второй кодирующей модуль последовательностью, которая соединена с многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к соответствующим им кодирующим модули последовательностям (фиг. 20).
Ввиду вышеописанных стратегий сборки специалист в данной области техники легко поймет, как любая из вышеописанных стратегий может быть комбинирована, полностью или частично, чтобы привести к желаемому результату и/или обеспечить наибольшие преимущества и/или свести к минимуму недостатки конкретных методик клонирования в соответствии со сборкой с использованием желательной библиотеки и/или компонента библиотеки. В качестве неограничивающего примера, стратегии на основе амплификации можно комбинировать со стратегиями на основе расщепления, когда комбинирование указанных стратегий приводит к сборке желательной библиотеки и/или компонентов библиотеки. Например, как показано на фиг. 21, расщепление ферментом рестрикции первого вектора в соответствии с сайтом распознавания фермента рестрикции (RE1), расположенным между первой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом, можно комбинировать с амплификацией на основе ПЦР с использованием сайтов связывания праймеров, фланкирующих вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, содержащуюся в пределах второго вектора или фрагмента нуклеиновой кислоты, чтобы обеспечить вложенную сборку. После сборки с применением описанной гибридной стратегии сборки может быть получен собранный продукт, в котором первая кодирующая модуль последовательность соединена с помощью желательного линкера со второй кодирующей модуль последовательностью, которая соединена с многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к соответствующим им кодирующим модули последовательностям (фиг. 21).
Г ибридные стратегии не ограничиваются комбинированием стратегий, основанных на расщеплении и амплификации, и могут включать другие способы клонирования и/или синтетической биологии, полностью или частично, включая, но не ограничиваясь ими, например, стратегии клонирования на основе рекомбинации (включая, но не ограничиваясь ими, например, стратегии клонирования на основе технологии Gateway, клонирования на основе рекомбиназы Cre/Flp (включая, стратегии, при которых сайт инактивирован при рекомбинации) и т.д.), сборку последовательности de novo, синтез нуклеиновой кислоты de novo и т.п. В некоторых случаях стратегии клонирования на основе рекомбинации, сборки последовательности de novo, синтеза нуклеиновой кислоты de novo и т.п. могут быть использованы независимо, т.е. по отдельности в качестве независимой стратегии клонирования, а не как часть гибридной стратегии клонирования.
В некоторых случаях, когда используемая конкретная стратегия клонирования приводит к присутствию нежелательной промежуточной последовательности между двумя клонированными элементами, также известной как шрамы или швы клонирования, такие шрамы клонирования могут быть уменьшены
- 34 046546 и/или удалены путем мономолекулярного расщепления и повторного лигирования вектора, содержащего шрам. Мономолекулярное расщепление и повторное лигирование можно осуществлять любым удобным способом, включая, но не ограничиваясь ими, например, мономолекулярное расщепление, опосредованное ферментами рестрикции, и повторное лигирование, такое как, например, мономолекулярное расщепление ферментами рестрикции типа IIS и повторное лигирование. Например, в некоторых случаях, шов, который содержит полный сайт рекомбинации или его часть, в результате сборки на основе рекомбинации, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования. В некоторых случаях шрам после расщепления, который содержит весь сайт распознавания фермента рестрикции или его часть в результате стратегии на основе расщепления, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования. В некоторых случаях шов, который содержит весь сайт связывания праймера или его часть в результате сборки на основе амплификации, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования.
В одном неограничивающем варианте реализации комбинаторная библиотека получена путем итеративного клонирования компонентов библиотеки каждого типа размерности посредством клонирования на основе расщепления и клонирования с помощью системы In-Fusion®. Например, как показано на фиг. 22, на первом этапе исходную нуклеиновую кислоту (например, вектор), содержащую кодирующую scFv последовательность и смежный линкер Gly/Ser, расщепляют в сайте BamHI в пределах или рядом с линкером Gly/Ser. На втором этапе фрагмент нуклеиновой кислоты, содержащий первую кодирующую модуль последовательность, соединенную со вторым линкером Gly/Ser, гибридизованным с первой специфичной для модуля нуклеиновой последовательностью-штрихкодом, клонируют в расщепленный сайт BamHI путем клонирования с помощью системы In-Fusion®. После лигирования путем клонирования с помощью системы In-Fusion® линкер Gly/Ser между scFv и первой кодирующей модуль последовательностью сохраняется. На третьем этапе нуклеиновую кислоту, собранную на этапе 2, расщепляют в сайте BamHI, импортированном в пределах или рядом с линкером Gly/Ser фрагмента первой кодирующей модуль нуклеиновой кислоты, и повторяют клонирование с помощью системы In-Fusion® со вторым фрагментом нуклеиновой кислоты, содержащим вторую кодирующую модуль последовательность, соединенную с третьим линкером Gly/Ser, гибридизованным со второй нуклеиновой последовательностьюштрихкодом, специфичной для модуля. Как и на этапе 2, после лигирования путем клонирования с помощью системы In-Fusion линкер Gly/Ser между первой и второй кодирующими модули последовательностями сохраняется. Если необходимы элементы библиотеки большей размерности, этап 3 можно повторять итеративно. На четвертом этапе расщепление в сайте BamHI, импортированном в пределах или рядом с линкером Gly/Ser, кодирующей модуль последовательности, содержащей нуклеиновую кислоту, которая была добавлена в последнюю очередь, позволяет осуществлять клонирование In-Fusion® концевой репортерной последовательности (например, последовательности, кодирующей GFP, которая также содержит последовательность сигнала стоп (например, стоп-кодон)) между готовой кодирующей модуль последовательностью и нуклеиновой последовательностью-штрихкодом, расположенной после нее. В этом варианте реализации каждый готовый элемент библиотеки содержит комбинаторный CAR, встроенный с сохранением открытой рамки считывания, и комбинаторную нуклеиновую последовательностьштрихкод, описывающую архитектуру комбинаторного CAR, встроенного с сохранением открытой рамки считывания.
Объединенные библиотеки.
В настоящем изобретении предложены способы получения объединенных библиотек синтетических модульных полипептидов, содержащих нуклеиновые последовательности-штрихкоды. Подразумевают, что в объединенной библиотеке элементы библиотеки присутствуют в общем контейнере и/или общем растворе, и отдельные элементы библиотеки не должны быть физически разделены в пространстве, например, отдельные элементы библиотеки могут быть объединены во время конструирования библиотеки (например, как при сборке в одном реакторе) или после создания отдельных элементов библиотеки. Например, в случае объединенной библиотеки синтетических модульных полипептидов, сконструированной путем комбинаторной вложенной сборки, компоненты библиотеки могут быть объединены во время сборки элементов библиотеки, до завершения сборки элементов библиотеки и/или после завершения сборки элементов библиотеки и т.д. В настоящем изобретении объединенные библиотеки не ограничены библиотеками только синтетических модульных полипептидов, но также включают объединенные библиотеки клеток, экспрессирующих синтетические модульные полипептиды, объединенные библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды, и т.п.
Соответственно, в некоторых случаях, отдельные компоненты нуклеиновых кислот, используемые для сборки элементов библиотеки, можно комбинировать до сборки и они могут оставаться объединенными во время сборки элементов библиотеки. В других случаях собранные элементы библиотеки могут быть смешаны после сборки, чтобы получить объединенную библиотеку.
Поскольку библиотеки и способы сборки библиотек, описанные в настоящем документе, включают получение элементов библиотеки, которые могут быть идентифицированы путем секвенирования соот
- 35 046546 ветствующей области нуклеиновой последовательности-штрихкода, отдельные нуклеиновые кислоты могут быть объединены в любой момент до, во время или после сборки, при этом сохраняется возможность последующей идентификации и количественного определения отдельных элементов библиотеки в количественных исследованиях. В некоторых случаях конечную размерность библиотеки может контролировать путем объединения компонентов библиотеки в определенные моменты во время сборки. Например, библиотека смешанной размерности может быть получена путем раздельной сборки частичных библиотек разной размерности и последующего объединения частичных библиотек (например, с использованием сборки разделить-и-объединить). В некоторых случаях, например, после объединения частичных библиотек различной размерности, может быть выполнена последующая сборка, включая добавление дополнительных вариабельных доменов.
В одном неограничивающем варианте реализации, как показано на фиг. 23, объединенную библиотеку нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, трансформируют в общую популяцию первичных Т-клеток человека для получения первичных Т-клеток человека, экспрессирующих синтетический модульный полипептид CAR. Необязательно, если кодируемые элементы библиотеки синтетических модульных полипептидов CAR содержат один или более репортерных модулей, трансформированные Т-клетки могут быть отсортированы на основании экспрессии ими репортерного модуля (который указывает на экспрессию синтетического модульного полипептида CAR), чтобы выделить трансформированные клетки с одинаковыми уровнями экспрессии элементов библиотеки синтетических модульных полипептидов CAR. Указанные отсортированные трансформированные Т-клетки с одинаковыми уровнями экспрессии представляют собой объединенную библиотеку Т-клеток, экспрессирующих синтетические модульные полипептиды CAR.
В некоторых случаях модулируют трансформационную эффективность нуклеиновых кислот и/или первичных Т-клеток человека, экспрессирующих синтетические модульные полипептиды CAR. Такая модуляция может быть выполнена по различным практическим причинам, например, для контроля вероятности экспрессии каждого элемента библиотеки и/или для контроля вероятности экспрессии каждой клеткой не более чем одного элемента библиотеки. Указанная модуляция может быть достигнута любым удобным способом, включая, но не ограничиваясь ими, например, модулирование исходного количества нуклеиновой кислоты, кодирующей синтетический модульный полипептид, присутствующей во время трансформации, контроль исходного количества первичных Т-клеток, присутствующих во время трансформации, контроль соотношения кодирующей нуклеиновой кислоты и первичных Т-клеток во время трансформации и т.п. Следовательно, в некоторых случаях, эффективность трансформации модулируют так, что по существу каждая трансдуцированная Т-клетка экспрессирует один уникальный синтетический модульный полипептид CAR. В некоторых случаях готовые объединенные библиотеки клеток, экспрессирующих уникальные синтетические модульные полипептиды CAR, можно культивировать, размножать, сохранять и т.д. в соответствии с требованиями последующих количественных исследований.
Подходящие объединенные библиотеки, независимо от того, содержат они объединенные нуклеиновые кислоты, объединенные модульные полипептиды, объединенные трансдуцированные клетки и т.д., не ограничены нуклеиновыми кислотами, кодирующими синтетические модульные полипептиды CAR, синтетическими модульными полипептидами CAR или клетками (например, Т-клетками), экспрессирующими синтетические модульные полипептиды CAR. Любая библиотека нуклеиновых кислот, кодирующих модульные полипептиды, модульные полипептиды и/или соответствующие трансдуцированные клетки, экспрессирующие модульные полипептиды, полученные в соответствии со способами, описанными в настоящем документе, могут быть объединены аналогичным способом, чтобы получить объединенную библиотеку, которую можно применять, например, при скрининговых исследованиях.
Отдельные элементы объединенных библиотек, описанных в настоящем документе, могут быть положительно идентифицированы благодаря специфичной многозвенной нуклеиновой последовательности-штрихкоду, связанной с каждым членом библиотеки. Благодаря специфичной комбинаторной вложенной сборке, которая приводит к предсказуемой позиционной взаимосвязи между каждой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностьюштрихкодом, идентичность и архитектура каждого синтетического модульного полипептида может быть установлена путем простого секвенирования соответствующей многозвенной нуклеиновой последовательности-штрихкода. Следовательно, в некоторых случаях, идентичность и/или архитектура отдельных элементов библиотеки синтетических модульных полипептидов может быть определена на основании данных о последовательности, связанной с областями нуклеиновых последовательностей-штрихкодов элементов библиотеки. Например, в некоторых случаях, все элементы и/или каждый отдельный элемент объединенной библиотеки, описанной в настоящем документе, могут быть определены, например, после конструирования библиотеки, после использования библиотеки в конкретном количественном исследовании и т.д.
Компартментализованные компоненты библиотеки.
Отдельные нуклеиновые кислоты-элементы, содержащие кодирующую область и область нуклеиновой последовательности-штрихкода, в некоторых случаях могут быть компартментализованы. Объединенные библиотеки и библиотеки с компартментализованными компонентами не обязательно должны
- 36 046546 быть взаимоисключающими, и, например, в некоторых случаях библиотека может быть объединена и может содержать компартментализованные компоненты в разные моменты времени, например, библиотека может быть сконструирована, например, элементы библиотеки могут быть собраны, в виде пула, например, как при сборке в одном реакторе, и затем может быть впоследствии компартментализована, например, путем трансфекции элементов библиотеки нуклеиновых кислот в отдельные клетки или неклеточные компартменты. В других случаях элементы библиотеки могут быть компартментализованы в ходе их сборки и затем объединены для последующих способов, включая, но не ограничиваясь ими, например, дальнейшую сборку или скрининг. В целом, нуклеиновые кислоты, кодирующие синтетические полипептиды, содержащие нуклеиновые последовательности-штрихкоды, собранные в соответствии со способами вложенной сборки и стратегиями клонирования, описанными в настоящем документе, собирают в виде пула и впоследствии могут подвергать компартментализации или могут оставить без изменений.
Компартментализация собранных нуклеиновых кислот, кодирующих синтетические полипептиды, содержащих нуклеиновые последовательности-штрихкоды, может быть достигнута любым подходящим способом, обеспечивающим транскрипцию и трансляцию отдельных элементов библиотек нуклеиновых кислот так, что каждый элемент библиотеки нуклеиновых кислот остается связанным с продуктом, который он кодирует. В некоторых случаях, как описано более подробно ниже, компартментализация может быть достигнута путем создания клеточных библиотек, в которых отдельные клетки служат в качестве компартмента и обеспечивают трансляцию и транскрипцию элементов библиотек нуклеиновых кислот.
В некоторых случаях компартментализация может быть достигнута посредством создания неклеточных библиотек, например, библиотек на основе инкапсуляции. Бесклеточные библиотеки на основе инкапсуляции обычно содержат эмульсию двух или более несмешивающихся жидкостей, причем элементы библиотеки нуклеиновых кислот растворимы в первой жидкости, например, в водной жидкости, такой как вода или водный буфер, и нерастворимы во второй жидкости, например, в масле или другом органическом растворителе, так, что первая жидкость образует компартменты, например, капли, содержащие отдельные элементы библиотеки. Эмульсия, содержащая библиотеку, может быть сконфигурирована так, что каждый компартмент содержит любое количество отдельных элементов библиотеки, включая, но не ограничиваясь этим, не более одного элемента в компартменте. Нуклеиновые кислотыэлементы из инкапсулированных библиотек могут быть транскрибированы (например, в условиях in vitro) и транслированы (например, в условиях in vitro) в условиях, в которых продукты транскрипции и трансляции остаются связанными, т.е. остаются в пределах компартмента, с отдельным элементом библиотеки нуклеиновых кислот, кодировавшим их. Любой удобный и подходящий способ получения инкапсулированной библиотеки полипептидов, кодируемых нуклеиновыми кислотами, может быть использован в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, например, способы, описанные в Bernath et al. Anal Biochem. (2004) 325(1): 151-7; содержание которой полностью включено в настоящее изобретение посредством ссылки.
После получения кодируемого продукта элемента библиотеки внутри компартмента, элемент библиотеки нуклеиновых кислот и кодируемый синтетический модульный полипептид могут быть, но необязательно, физически соединены. Например, в некоторых случаях, элемент библиотеки нуклеиновых кислот и кодируемый продукт могут быть соединены, например, с помощью любого удобного и подходящего способа, включая химическую связь или конъюгацию (т.е., путем получения ковалентной связи между элементом библиотеки нуклеиновых кислот и кодируемым синтетическим модульным полипептидом) или посредством молекулярного связывания (например, путем прямого связывания элемента библиотеки с кодируемым синтетическим модульным полипептидом или посредством непрямого связывания элемента библиотеки с кодируемым продуктом, которое опосредовано одним или более связывающими промежуточными продуктами (например, партнерами по связыванию, субстратами и т.д.). Любой удобный и подходящий способ соединения компартментализованных кодируемых полипептидов с элементами библиотеки нуклеиновых кислот можно применять в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, использование, например, субстрата, содержащего присоединенный связывающий агент для эпитопной метки, который специфично связывается с эпитопной меткой, кодируемой элементом библиотеки нуклеиновых кислот, например, как описано в Griffiths & Tawfik. EMBO J (20030 22(1):24-35, содержание которой полностью включено в настоящее изобретение посредством ссылки. В некоторых случаях после связывания элементы библиотек нуклеиновых кислот могут быть компартментализованы, например, объединены, и затем количественно исследованы как объединенная библиотека.
В некоторых случаях элемент библиотеки нуклеиновых кислот и кодируемый продукт остаются связанными в достаточной степени, не будучи физически соединенными, например, путем компартментализации внутри компартмента, включая клеточные и неклеточные компартменты.
Компартментализация, как клеточная, так и неклеточная, обычно позволяет идентифицировать синтетический модульный полипептид или его часть, который коррелирует с детектированным фенотипом посредством секвенирования области нуклеиновой последовательности-штрихкода отдельного элемента библиотеки нуклеиновых кислот, кодирующего синтетический модульный полипептид, который остает
- 37 046546 ся связанным с синтетическим модульным полипептидом на основании их компартментализации или в результате физической связи, образующейся во время их компартментализации.
Клеточные библиотеки.
Как описано более подробно выше, в настоящем изобретении библиотеки включают клеточные библиотеки, в которых клетки библиотеки экспрессируют синтетические модульные полипептиды. Трансформация нуклеиновых кислот, кодирующих синтетические модульные полипептиды, может быть осуществлена любым удобным способом, включая, но не ограничиваясь ими, например, вирусную трансфекцию, электропорацию, липофекцию, бомбардировку, химическую трансформацию, использование подходящего для трансдукции носителя (например, подходящего для трансдукции белка-носителя) и т.п. В некоторых случаях клетка, в которую трансформируют нуклеиновую кислоту, кодирующую синтетический модульный полипептид, упоминается в настоящем документе как клетка-хозяин.
Клетки-хозяева могут экспрессировать одну отдельную нуклеиновую кислоту, содержащую нуклеиновую последовательность-штрихкод, кодирующую уникальный синтетический модульный полипептид, или могут экспрессировать множество, включая две или более, отдельных нуклеиновых кислот, содержащих нуклеиновую последовательность-штрихкод, кодирующих уникальные синтетические модульные полипептиды. Следует понимать, что количество отдельных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которое экспрессирует клетка-хозяин, можно контролировать, например, путем контроля частоты или вероятности доставки рассматриваемых нуклеиновых кислот в клетку-хозяина, например, путем модуляции параметров способа доставки. В некоторых случаях конечное количество отдельных нуклеиновых кислот, содержащих нуклеиновые последовательностиштрихкоды, которые кодируют уникальные синтетические модульные полипептиды, присутствующих в клетке-хозяине, может быть упомянуто как множественность инфекции (MOI) и может быть определено как соотношение нуклеиновых кислот и клеток-хозяев до или после доставки. Стандартные способы модуляции MOI, например, путем увеличения или уменьшения соотношения нуклеиновых кислот и клетокхозяев до доставки, могут быть использованы для получения желательного конечного количества отдельных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих уникальные синтетические модульные полипептиды, на клетку-хозяина после доставки.
Нуклеиновые кислоты, кодирующие синтетические модульные полипептиды, могут быть трансформированы в любую подходящую клетку-хозяина или клеточную линию, включая, например, прокариотические и эукариотические клетки. Выбор типа клетки-хозяина будет зависеть от ряда факторов, включая тип библиотеки синтетических модульных полипептидов, подлежащей скринингу, и конкретное скрининговое количественное исследование. В некоторых случаях клетка-хозяин может представлять собой прокариотическую клетку, включая, но не ограничиваясь ими, Acidobacteria, Actinobacteria, Aquificae, Bacteroidetes, Caldiserica, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Elusimicrobia, Fibrobacteres, Firmicutes, Fusobacteria, Gemmatimonadetes, Lentisphaerae, Nitrospirae, Planctomycetes, Proteobacteria, Spirochaetes, Synergistetes, Tenericutes, Thermodesulfobacteria, Thermotogae и Verrucomicrobia. Согласно некоторым вариантам реализации настоящего изобретения клетка-хозяин может представлять собой бактериальную клетку, например, Е. coli. В некоторых случаях может быть использован стандартный бактериальный штамм, включая, но не ограничиваясь ими, например, коммерчески доступные штаммы от таких поставщиков как Американская коллекция типовых культур (АТСС) (Манассас, Виргиния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США) и т.п.
Подходящие эукариотические клетки включают первичные клетки и культивируемые клетки, первоначально полученные из животного-хозяина, включая, но не ограничиваясь ими, например, млекопитающих (включая, например, человека, приматов, человекообразных обезьян, копытных, собачьих, кошачьих, кроликов, грызунов и т.д.), рептилий, земноводных (например, шпорцевых лягушек, саламандру, тритона и т.д.), рыб (например, данио и т.д.), птиц (например, курицу и т.д.), беспозвоночных (например, насекомых (например, плодовую муху и т.д.)), червей (например, нематод и т.д.), морских беспозвоночных (например, морского ежа и т.д.) и т.д.), дрожжи и т.п. Согласно некоторым вариантам реализации настоящего изобретения клетки могут представлять собой первичные клетки грызунов или культивированные клетки грызунов, полученные от мыши или крысы. В других вариантах реализации клетки могут представлять собой первичные клетки человека или культивированные клетки человека. Любая подходящая эукариотическая клетка может быть использована в качестве клетки-хозяина в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного скринингового количественного исследования, однако в некоторых случаях могут быть использованы подходящие линии эукариотических клеток, включая, но не ограничиваясь ими, например, коммерчески доступные от таких поставщиков как Американская коллекция типовых культур (АТСС) (Манассас, Виргиния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США) и т.п.
В некоторых случаях клетки клеточной библиотеки представляют собой первичные клетки (например, первичные моноциты, первичные лимфоциты (например, первичные Т-клетки, первичные В-клетки, первичные NK-клетки и т.д.), первичные дендритные клетки и т.д.), первичные эндотелиальные клетки, первичные эпителиальные клетки, первичные фибробласты, первичные гемопоэтические стволовые
- 38 046546 клетки, первичные кератиноциты, первичные меланоциты, первичные мезенхимальные стволовые клетки, первичные преадипоциты, первичные мышечные клетки (например, первичные клетки гладкой мускулатуры, первичные клетки скелетной мускулатуры и т.д.) и т.д. В некоторых случаях клетки клеточной библиотеки представляют собой известные клеточные линии (например, клетки Jurkat и т.д.). В некоторых случаях клетки клеточной библиотеки представляют собой специфичные для пациента клетки (специфичные для пациента иммунные клетки (например, первичные Т-клетки и т.д.), специфичные для пациента стволовые клетки (например, гемопоэтические стволовые клетки, мезенхимальные стволовые клетки, стволовые клетки, полученные из жировой ткани и т.д.), специфичные для пациента раковые клетки (например, опухолевые клетки, клетки рака крови и т.д.).
Подходящие клетки млекопитающих включают первичные клетки и иммортализованные клеточные линии. Подходящие линии клеток млекопитающих включают линии клеток человека, линии клеток приматов, отличных от человека, линии клеток грызунов (например, мыши, крысы) и т.п. Подходящие линии клеток млекопитающих включают, но не ограничиваются ими, клетки HeLa (например, Американская коллекция типовых культур (АТСС) № CCL-2), клетки СНО (например, АТСС №№CRL9618, CCL61, CRL9096), клетки HEK293 (например, АТСС №CRL-1573), клетки Vero, клетки NIH 3Т3 (например, АТСС №CRL-1658), клетки Huh-7, клетки BHK (например, АТСС №CCL10), клетки РС12 (АТСС №CRL1721), клетки COS, клетки COS-7 (АТСС №CRL1651), клетки RAT1, L-клетки мыши (АТСС №CCLI.3), клетки мезонефроса человека (HEK) (АТСС №CRL1573), линии клеток HLHepG2, Hut-78, Jurkat, HL-60, NK (например, NKL, NK92 и YTS) и т.п.
В некоторых случаях клетка не является клеткой иммортализованной клеточной линии, а, напротив, представляет собой клетку (например, первичную клетку), полученную от индивидуума. Например, в некоторых случаях, клетка представляет собой иммунную клетку, полученную от индивидуума. В качестве примера клетка представляет собой Т-лимфоцит, полученный от индивидуума. В качестве другого примера клетка представляет собой цитотоксическую клетку, полученную от индивидуума. В качестве другого примера клетка представляет собой стволовую клетку или клетку-предшественника, полученную от индивидуума.
После трансформации множества нуклеиновых кислот, кодирующих синтетические модульные полипептиды библиотеки, трансформированные клетки-хозяева могут быть отсортированы на основании экспрессии ими синтетических модульных полипептидов, например, для удаления клеток, которые не экспрессируют синтетические модульные полипептиды, из библиотеки, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды на уровнях, превышающих определенный порог экспрессии, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды на уровнях, ниже определенного порога экспрессии, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды в определенном диапазоне уровней экспрессии, и т.д. В некоторых случаях сортировка трансформированных клеток на основании уровня экспрессии может быть выполнена, чтобы выделить только те клетки в библиотеке, которые имеют одинаковый уровень экспрессии, причем одинаковый уровень экспрессии может варьироваться в зависимости от конкретных способов применения и в некоторых случаях может быть определен как уровень экспрессии в пределах определенного диапазона, который выше и ниже среднего уровня экспрессии популяции.
Согласно некоторым вариантам реализации настоящего изобретения сортировка трансформированных клеток на основании уровня экспрессии ими элементов библиотеки, например, сортировка клеток, экспрессирующих или имеющих приблизительно равный уровень экспрессии элементов библиотеки, позволяет улучшить оценку влияния элемента библиотеки и/или модулей, входящих в ее состав. Например, при выделении только тех клеток, которые экспрессируют элементы библиотеки в определенном диапазоне уровней, идентификация элементов библиотеки, влияющих на конкретный фенотип, будет основана на фактической функции элементов библиотеки и тех модулей, которые входят в ее состав, а не на эффективности экспрессии конкретного элемента библиотеки. Согласно некоторым вариантам реализации настоящего изобретения, например, при выполнении полуколичественного исследования частоты экспрессии отдельных элементов библиотеки и/или ее модулей, сортировка клеток, экспрессирующих элементы библиотеки в пределах заранее определенного диапазона уровней, обеспечивает более точное количественное исследование и количественное определение элементов библиотеки и/или модулей на основании их влияния на определенный фенотип, а не на основании характерного для них относительного уровня экспрессии.
Помимо этого сортировка позволяет идентифицировать элементы библиотеки и ее модули, функционирование которых создает или влияет на конкретный фенотип при экспрессии в пределах определенного диапазона уровней экспрессии или выше или ниже определенного порога, включая, например, низкий уровень экспрессии или высокий уровень экспрессии.
Нормирование библиотеки.
Библиотеки согласно настоящему изобретению могут быть нормированы или могут не быть нормированы в зависимости от ситуации, в которой создается библиотека, и/или предполагаемого окончательного способа применения библиотеки. В настоящем изобретении под термином нормированный, при
- 39 046546 менительно к описанным библиотекам, подразумевают, что относительные количества каждого элемента библиотеки корректируют, чтобы по меньшей мере уравнять их количества, по сравнению с относительными количествами каждого элемента библиотеки до корректировки. В некоторых случаях нормирование библиотеки приводит к тому, что библиотека имеет меньший диапазон между количеством наиболее представленных элементов библиотеки и количеством наименее представленных элементов библиотеки. В некоторых случаях нормирование приводит к увеличению количества наименее представленного элемента(ов) библиотеки. В некоторых случаях нормирование приводит к уменьшению количества наиболее представленного элемента(ов) библиотеки.
В некоторых случаях нормирование библиотеки может включать количественную оценку всех или большинства или репрезентативной выборки (или всей или большей части репрезентативной выборки) элементов библиотеки для определения относительного количества каждого элемента библиотеки в библиотеке. После количественной оценки корректировку проводят на основании количественной оценки, чтобы уравнять относительное присутствие каждого элемента библиотеки в библиотеке. В зависимости от ситуации указанная корректировка может быть выполнена непосредственно в уже полученной библиотеке так, что библиотека подвергается непосредственному нормированию. В другом варианте корректировка может быть выполнена как часть способа получения библиотеки так, что следующая полученная библиотека будет нормирована.
Любая библиотека согласно настоящему изобретению может быть нормирована, включая, но не ограничиваясь ими, например, библиотеки нуклеиновых кислот, библиотеки полипептидов, неклеточные инкапсулированные библиотеки, клеточные библиотеки и т.д., и в зависимости от библиотеки, которую нормируют, могут быть использованы различные способы. Например, в зависимости от типа библиотеки, которую нормируют, могут быть использованы различные способы количественной оценки относительных количеств элементов библиотеки. Различные способы количественного определения элементов библиотеки нуклеиновых кислот, которые могут быть использованы, включают, но не ограничиваются ими, например, количественное секвенирование (например, секвенирование следующего поколения), количественную ПЦР, количественную гибридизацию (например, микрочип) и т.п. Могут быть использованы различные способы количественного определения элементов полипептидной библиотеки, включая, но не ограничиваясь ими, например, количественную масс-спектрометрию, ИФА и т.п. Могут быть использованы различные способы количественного определения элементов клеточной библиотеки, включая, но не ограничиваясь ими, проточную цитометрию, иммуногистохимическое исследование, количественное секвенирование (например, секвенирование следующего поколения), количественную ПЦР, количественную гибридизацию (например, микрочип) и т.п.
В некоторых случаях, когда элементы библиотеки количественно определены, может быть рассчитана корректировка(и), необходимая для нормирования. Любой удобный и подходящий способ расчета нормирования может быть использован в зависимости от типа библиотеки и/или размера библиотеки. В некоторых случаях может быть использовано линейное уравнение, включая, но не ограничиваясь им, линейное уравнение, представленное на фиг. 28.
В некоторых случаях, когда нормирование рассчитано для каждого элемента библиотеки, библиотека может быть скорректирована. Могут быть использованы различные способы непосредственной корректировки библиотеки. Например, в некоторых случаях, клеточная библиотека может быть нормирована с использованием FACS для сортировки равного количества клеток, представляющих каждый элемент библиотеки, в пул или в индивидуально доступные компартменты. В некоторых случаях, когда библиотека уже компартментализована, библиотека может быть нормирована путем корректировки объема каждого компартмента, включая, например, те случаи, когда различные концентрации элементов библиотеки в каждом компартменте нормируют путем добавления определенного объема жидкости в каждый компартмент, достаточного для выравнивания концентраций.
В некоторых случаях может быть выполнено нормирование объединенной библиотеки нуклеиновых кислот. Объединенные библиотеки нуклеиновых кислот могут быть нормированы по разным причинам. В одном варианте реализации объединенная библиотека нуклеиновых кислот может быть нормирована для компенсации избыточной или недостаточной представленности отдельных элементов библиотеки в библиотеке, например, вследствие более или менее эффективного включения отдельных модулей нуклеиновых кислот в элементы библиотеки во время комбинаторной сборки.
В некоторых случаях элементы библиотеки нуклеиновых кислот и/или модули нуклеиновых кислот, составляющие элементы библиотеки, могут быть количественно определены (например, путем количественного секвенирования). После такой количественной оценки рассчитывается корректировка каждого элемента, необходимая для нормирования. В одном варианте реализации рассчитанная корректировка может быть применена к следующей комбинаторной сборке библиотеки, например, количество каждого модуля нуклеиновой кислоты, используемое для сборки библиотеки нуклеиновых кислот, может быть скорректировано на основании относительной представленности этого модуля в количественно оцененной библиотеке. Следовательно, готовая комбинаторная библиотека будет нормирована путем корректировки начального количества модулей нуклеиновых кислот перед следующей сборкой библиотеки. Соответственно, в некоторых случаях нормирование библиотеки, описанной в настоящем докумен
- 40 046546 те, может включать сборку библиотеки с последующей количественной оценкой собранной библиотеки и повторной сборкой нормированного варианта библиотеки, который основан на количественной оценке.
Способы скрининга.
В настоящем изобретении предложены способы скрининга библиотек синтетических модульных полипептидов, включая, но не ограничиваясь ими, например, способы скрининга в условиях in vitro и способы скрининга в условиях in vivo. Под скринингом in vivo обычно подразумевают, что библиотеку, содержащую множество уникальных синтетических модульных полипептидов, количественно исследуют в биологической среде живого организма. Живые организмы, которые можно количественно исследовать в условиях in vivo в соответствии со способами, описанными в настоящем документе, включают одноклеточные и многоклеточные организмы.
Скрининг одноклеточного организма в условиях in vivo обычно включает приведение одноклеточного организма в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование фенотипа в одноклеточном организме. В других случаях скрининг одноклеточного организма в условиях in vivo может включать приведение одноклеточного организма или множества одноклеточных организмов в контакт с библиотекой нуклеиновых кислот, кодирующих синтетические модульные полипептиды, в условиях, достаточных для экспрессии кодируемых синтетических модульных полипептидов одноклеточными организмами.
Скрининг многоклеточного организма в условиях in vivo обычно включает приведение многоклеточного организма в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование фенотипа в многоклеточном организме. В других случаях скрининг многоклеточного организма в условиях in vivo может включать приведение многоклеточного организма или множества многоклеточных организмов в контакт с библиотекой нуклеиновых кислот, кодирующих синтетические модульные полипептиды, в условиях, достаточных для экспрессии кодируемых синтетических модульных полипептидов многоклеточным организмом(ами). Любой подходящий многоклеточный организм может быть использован при скрининге в условиях in vivo библиотеки, описанной в настоящем документе, в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного используемого количественного исследования в условиях in vivo, причем конкретные многоклеточные организмы включают, но не ограничиваются ими, например, млекопитающих (например, мышей, крыс и т.д.).
Под термином скрининг в условиях in vitro обычно подразумевают, что библиотеку, содержащую множество уникальных синтетических модульных полипептидов, количественно исследуют вне нормальной биологической среды, например, полипептидных модулей библиотеки, биологического материала, используемого при скрининге, или фенотипа, который подвергают скринингу. Например, в некоторых случаях, скрининг в условиях in vitro может быть выполнен с использованием искусственной или синтетической экспериментальной среды, включая, но не ограничиваясь ими, например, выделенный образец, выделенную клетку, культуру клеток, выделенную или иссеченную ткань, определенный образец, определенную среду, искусственную ткань, искусственный орган, клеточный экстракт, тканевой экстракт, множество образцов и т.д. Скрининг в условиях in vitro может быть выполнен в любом удобном и подходящем сосуде, включая, но не ограничиваясь ими, например, реакционный сосуд, реакционную камеру, пробирку, флакон, планшет, колбу, чашку, предметное стекло и т.п.
Скрининг образца в условиях in vitro, включая клеточный образец или неклеточный образец, обычно включает приведение образца в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование клеточного фенотипа или другой реакции или молекулярного фенотипа. Любой подходящий образец может быть использован при скрининге библиотеки, описанной в настоящем документе, в условиях in vitro в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного используемого количественного исследования в условиях in vitro, причем конкретные образцы включают, но не ограничиваются ими, например, биологические образцы, клеточные образцы, образцы полипептидов, образцы нуклеиновых кислот, химические образцы и т.п.
В некоторых случаях бесклеточные библиотеки синтетических модульных полипептидов могут быть подвергнуты скринингу в условиях in vitro. Например, компартментализованную библиотеку синтетических модульных полипептидов можно подвергнуть скринингу для определения фенотипа путем приведения компартментализованной библиотеки синтетических модульных полипептидов в контакт с одним или более агентами, с которыми, согласно прогнозам, реагируют отдельные элементы библиотеки. Любые подходящие способы скрининга бесклеточных библиотек полипептидов, как инкапсулированных, так и объединенных, можно применять в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, например, детектирование методом проточной цитометрии или детектирование фенотипа методом флуоресцентно-активированной сортировки клеток в бесклеточных количественных
- 41 046546 исследованиях, основанных на инкапсуляции, например, описанных в Griffiths & Tawfik. EMBO J (2003) 22(1):24-35 и Bernath et al. Anal Biochem (2004) 325(1):151-7; содержание которых полностью включено в настоящее изобретение посредством ссылки.
Фенотипы и способы идентификации.
Способы скрининга, в условиях in vivo или в условиях in vitro, обычно включают детектирование фенотипа и идентификацию одного или более элементов библиотеки, связанных с фенотипом. В настоящем изобретении термин фенотип обычно относится к характеристике молекулы, клетки, ткани, органа или организма, которую детектируют в конкретном количественном исследовании, и, следовательно, может включать, но не ограничивается ими, например, молекулярные фенотипы, клеточные фенотипы, фенотипы организма, фенотипы тканей, фенотипы органов, фенотипы организма и т.д. Фенотип, детектируемый в конкретном количественном исследовании, может представлять собой заранее определенный фенотип, например, известный или ожидаемый фенотип (например, включая известный или ожидаемый уровень определенной характеристики, присутствие или отсутствие известной или ожидаемой характеристики уровня и т.д.) или может быть идентифицирован во время количественного исследования, например, впервые детектируемый или ранее неопределенный фенотип (например, включая впервые детектируемый или ранее неопределенный уровень конкретной характеристики, присутствие или отсутствие впервые детектируемой или ранее неопределенной характеристики и т.д.). Любой подходящий количественный способ исследования для детектирования фенотипа, относящегося к библиотеке синтетических модульных полипептидов, описанной в настоящем документе, можно применять при скрининге указанных библиотек.
Скрининг библиотеки синтетических модульных полипептидов или нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов, позволяет идентифицировать полипептиды и/или их модули, которые эффективно обеспечивают желательный фенотип. Соответственно, в область настоящего изобретения в целом включены полипептиды, идентифицированные путем скрининга описанных в настоящем документе библиотек.
В некоторых случаях клеточный фенотип детектируют после приведения популяции клеток в контакт с библиотекой, описанной в настоящем документе. Клеточные фенотипы могут включать, но не ограничиваются ими, например, поведение клеток (включая, но не ограничиваясь ими, жизнеспособность клеток, пролиферацию клеток, активацию клеток, морфологию клеток, миграцию клеток, адгезию клеток, дифференцировку клеток, плюрипотентность клеток и т.д.), клеточную экспрессию (включая, но не ограничиваясь ими, экспрессию гена, экспрессию белка, экспрессию некодирующей РНК, активацию гена, репрессию гена и т.д.), экспрессию репортера (включая, но не ограничиваясь ими, например, экспрессию трансгенного репортера, экспрессию маркера) и т.п.
В некоторых случаях фенотип ткани, органа или организма детектируют после приведения ткани, органа или организма в контакт с библиотекой, описанной в настоящем документе. Фенотипы ткани включают, но не ограничиваются ими, например, жизнеспособность ткани, морфологию ткани, физические характеристики ткани (включая, но не ограничиваясь ими, защитную функцию, механическую прочность, эластичность и т.д.), экспрессию в ткани (включая, но не ограничиваясь ими, например, экспрессию тканевого гена, экспрессию тканевого белка и т.д.), экспрессию репортера в ткани (включая, но не ограничиваясь ими, например, экспрессию трансгенного репортера, экспрессию маркера) и т.п. Фенотипы органа включают, но не ограничиваются ими, например, внешний вид органа, жизнеспособность органа, морфологию органа, функцию органа (включая, но не ограничиваясь ими, производство биомолекулы (например, фермента, метаболита, белка и т.д.), фильтрацию, механическую функцию и т.д.). Фенотипы организма включают, но не ограничиваются ими, например, внешний вид организма, жизнеспособность организма (например, продолжительность жизни), физиологию организма, фертильность организма/плодовитость, поведение организма и т.д.
В некоторых случаях фенотип может быть количественно исследован в отношении патологического состояния, причем указанное патологическое состояние может представлять собой моделируемое патологическое состояние (например, клетку, ткань или организм, который был изменен или обработан, чтобы проявлять характеристики конкретного заболевания) или может представлять собой клиническое патологическое состояние (например, организм, проявляющий характеристики заболевания или у которого диагностировано заболевание, или клетки или ткани, полученные из него). Фенотипы, связанные с заболеванием, могут быть количественно исследованы на любом удобном уровне, включая, но не ограничиваясь ими, например, клеточный уровень, тканевой уровень, органный уровень, уровень организма. В некоторых случаях количественно исследованные фенотипы заболевания могут представлять собой фенотипы самого возбудителя заболевания, включая, но не ограничиваясь ими, например, фенотипы опухолей, фенотипы раковых клеток, фенотипы аутоиммунных клеток, фенотипы инфекционных агентов (бактериальных, вирусных и т.д.) и т.д. В других случаях количественно исследованные фенотипы заболевания могут представлять собой фенотипы клетки, ткани или организма, пораженного указанным заболеванием, или связанные с моделируемым заболеванием, которые обеспечивают информацию о присутствии и/или прогрессировании заболевания, включая, но не ограничиваясь ими, например, активацию клеток (например, активацию иммунных клеток), ответ на заболевание (например, иммунный ответ),
- 42 046546 биомаркеры, количество клеток, физиологические реакции организма, клинические исходы и т.д.
В некоторых случаях оценка фенотипа может быть проведена на уровне популяции, например, может быть проведена оценка популяции клеток, оценка популяции организмов и т.д. В некоторых случаях при популяционной оценке фенотипа действие конкретного элемента библиотеки на присутствие или отсутствие популяционного фенотипа может быть измерено. Например, можно оценить действие конкретного элемента библиотеки на клеточный фенотип популяции клеток. В других случаях можно оценить действие конкретного элемента библиотеки на фенотип организмов в популяции организмов.
Согласно некоторым вариантам реализации настоящего изобретения фенотип оценивают в ответ на применяемый стимул, причем применение стимула включает, но не ограничивается перечисленными, например, приведение клеток в контакт со стимулом, приведение ткани в контакт со стимулом, приведение органа в контакт со стимулом, приведение организма в контакт со стимулом и т.д. По существу исследуемый образец или исследуемый субъект может быть приведен в контакт со стимулом в условиях in vitro или in vivo в зависимости от используемого количественного способа исследования, в зависимости от стимула и в зависимости от конкретной библиотеки, которую подвергают скринингу. Различные стимулы могут быть использованы по отдельности или в комбинации. Стимул может представлять собой свободный стимул (например, растворимый стимул, свободный лиганд и т.д.), связанный стимул (например, связанный с твердым носителем), экспрессируемый клетками стимул (например, экспрессированная костимулирующая молекула, экспрессированный антиген, экспрессированный клеточный лиганд и т.д.) и т.п.
Согласно некоторым вариантам реализации настоящего изобретения популяцию Т-клеток, экспрессирующую библиотеку синтетических модульных CAR, приводят в контакт со стимулом в условиях in vitro и детектируют полученный в результате фенотип. Стимулы в условиях in vitro, пригодные для скрининга клеточной библиотеки, экспрессирующей синтетические модульные CAR, обычно будут включать антигены, включая, например, свободный антиген, связанный антиген, экспрессируемый клетками антиген (например, экспрессируемый на антигенпрезентирующей клетке, экспрессируемый на клетке-мишени и т.д.) и т.д. Подходящие антигены будут варьироваться в зависимости от конкретной библиотеки CAR, подлежащей скринингу, и желательного результата скрининга. Неограничивающие примеры антигенов включают, но не ограничиваются ими, например, растворимый антиген, антиген, связанный с твердой подложкой (например, связанный с планшетами антиген, связанный с гранулами антиген, связанный с предметным стеклом антиген и т.д.), экспрессируемый антиген (например, трансгенная клетка, экспрессирующая антиген, клетка, экспрессирующая антиген в природных условиях (например, клетка, экспрессирующая нативный антиген, раковая клетка, экспрессирующая раковый антиген и т.д.). Клетки, экспрессирующие нативный антиген, которые можно применять для скрининга библиотеки в условиях in vitro, будут варьироваться и могут включать, но не ограничиваются ими, например, наивные опухолевые клетки (например, полученные при биопсии опухоли).
Согласно некоторым вариантам реализации настоящего изобретения популяцию Т-клеток, экспрессирующую библиотеку синтетических модульных CAR, приводят в контакт со стимулом в условиях in vivo и детектируют полученный в результате фенотип. Ситуации скрининга библиотеки синтетических модульных CAR в условиях in vivo будут сильно различаться и могут включать, но не ограничивается ими, животные модели. В некоторых случаях скрининг в условиях in vivo может быть выполнен у небольших модельных животных, таких как, например, моделирование на грызунах, включая, но не ограничиваясь ими, например, мышиные модели, крысиные модели и т.д. В некоторых случаях скрининг в условиях in vivo выполняют на мышиных моделях опухолей, включая трансгенные и нетрансгенные мышиные модели опухолей.
В некоторых случаях используемая модель может представлять собой ксенотрансплантатную модель. Например, используемая модель может представлять собой гуманизированную модель, причем указанные гуманизированные модели определяют как имеющие один или более компонентов человеческого происхождения, например, гуманизированная иммунная система, гуманизированные Т-клетки, экспрессирующие белок человека, несущие раковые клетки человека и т.д. В этой связи гуманизированные модели могут быть полностью или частично гуманизированы. В других случаях модель может быть не полностью или частично гуманизированной, но вместо этого может быть просто введена с клетками человека или тканью человека посредством инъекции или трансплантации. Например, в некоторых случаях, раковые клетки человека или клетки из клеточных линий рака человека вводят в животную модель. Любые удобные опухолевые клетки человека или линия опухолевых клеток человека может быть использована в указанных моделях, включая, но не ограничиваясь ими, например, клетки K562, клетки лимфомы Дауди и т.д.
Животные модели и/или клетки или ткани, введенные в животные модели, могут быть трансгенными или нетрансгенными, например, могут быть модифицированы для экспрессии одного или более трансгенов. Например, в некоторых случаях, животная модель может быть трансгенно модифицирована для экспрессии гетерологичного гена, например, репортерного гена (например, для идентификации клеток животного-хозяина), гена-мишени (например, гена, кодирующего генный продукт, который должен быть мишенью при скрининге в условиях in vivo). В некоторых случаях клетка, введенная в животную
- 43 046546 модель, может быть трансгенно модифицирована для экспрессии гетерологичного гена, например, репортерного гена (например, для идентификации введенной клетки), гена-мишени (например, гена, кодирующего генный продукт, который должен быть мишенью при скрининге в условиях in vivo). В качестве неограничивающего примера мышиная модель опухоли может быть подвергнута скринингу в соответствии со способами, описанными в настоящем документе, при этом мыши вводят опухолевые клетки человека, экспрессирующие раковый трансген-мишень (например, CD19, мезотелин и т.д.).
Элементы библиотеки, внедренные в системы in vivo, могут быть подвергнуты скринингу для определения любого подходящего фенотипа, причем указанный фенотип может зависеть от конкретной библиотеки, которую подвергают скринингу, конкретной ситуации в условиях in vivo (например, животной модели) и т.д. В некоторых случаях, например, если система в условиях in vivo представляет собой животную модель опухоли, библиотека может быть подвергнута скринингу для определения фенотипов, связанных с селективностью элементов библиотеки в отношении опухолей, например, путем введения библиотеки в животную модель, содержащую две разные опухоли, путем введения библиотеки в животную модель или несколько животных моделей, содержащих опухоли, экспрессирующие различные уровни опухолевого антигена и т.д. Любой удобный способ количественного исследования фенотипа, включая описанные в настоящем документе клеточные и биохимические/молекулярные способы, можно применять при оценке систем in vivo, причем такие оценки обычно включают получение биологического образца из животной модели. В некоторых случаях биологический образец, пригодный для оценки модели в условиях in vivo, может включать образец ткани (например, крови, опухоли и т.д.) или образец органа (например, селезенки).
В некоторых случаях библиотека может быть подвергнута скринингу в условиях in vitro или в условиях in vivo в соответствии с фенотипом Т-клеток. Фенотипы Т-клеток будут варьироваться и будут включать стимулированные фенотипы Т-клеток, т.е. ответ на антиген. Неограничивающие примеры фенотипов Т-клеток включают, но не ограничиваются ими, например, пролиферацию Т-клеток, выработку цитокинов (например, ИЛ-2, ИФН-γ, ФНО, ЛТ-α, ИЛ-4, ИЛ-5, ИЛ-6, ИЛ-13, ИЛ-9, ИЛ-10, ИЛ-17А, ИЛ17F, ИЛ-21, ИЛ-22, ИЛ-26, CCL20, ИЛ-21, ФРО-β и т.д.), экспрессию поверхностных маркеров Т-клеток (например, CD3, CD4, CD8 и т.д.), маркеры активации Т-клеток (например, CD69 и т.д.), маркеры внутриклеточной сигнализации (например, фосфорилированную форму ERK1/2, фосфорилированную форму P38MAPK и т.д.) и т.п.
Фенотипы Т-клеток могут быть количественно исследованы в условиях in vitro и в условиях in vivo и могут быть детектированы любым удобным способом. В некоторых случаях устройство для подсчета клеток или проточный цитометр можно использовать для количественного исследования фенотипа Тклеток, включая, например, пролиферацию Т-клеток и/или количественную оценку Т-клеток. Например, пролиферация Т-клеток может быть количественно исследована с помощью метода проточной цитометрии путем разбавления красителя для мечения клеток. В некоторых случаях экспрессия маркеров клеточной поверхности также может быть количественно исследована с помощью проточной цитометрии. Экспрессия внутриклеточных маркеров может быть определена клеточными способами (например, с помощью проточной цитометрии, проточной цитометрии с использованием фосфо-специфичных антител, проточной цитометрии внутриклеточных маркеров, иммунофлуориметрии, гибридизации in situ, флуоресцентной гибридизации in situ и т.д.) или может быть количественно исследована с помощью молекулярных и/или биохимических способов (например, ИФА, захвата цитокинов, способов на основе амплификации (например, количественной ПЦР), способов, основанных на секвенировании (например, с помощью количественного секвенирования), количественной масс-спектрометрии и т.д.).
В некоторых случаях Т-клетки могут быть количественно исследованы для определения фенотипа активации природных киллеров. Любой подходящий способ оценки активации природных киллеров можно применять в указанных количественных исследованиях. Например, Т-клетки могут быть количественно исследованы для определения экспрессии CD107a/b, например, методом проточной цитометрии.
В некоторых случаях Т-клетки могут быть количественно исследованы для определения одного или более фенотипов дифференцировки. Любой подходящий способ оценки дифференцировки Т-клеток можно применять в указанных количественных исследованиях. Например, дифференцировку в Т-клетку памяти можно определить, например, путем количественного исследования маркеров Т-клеток памяти (например, Th1, Th2, Th17, Treg и т.д.) с использованием любого подходящего клеточного или молекулярно-биохимического способа. В некоторых случаях может быть проведена оценка экспрессии одного или более факторов внутриклеточной транскрипции, указывающих на дифференцировку в Т-клетки памяти (например, Gata3, Tbet, RORyt, FoxP3, Bcl-6, CCR7, CD45RO, CD45RA, CD69 и т.д.).
Скрининг библиотеки синтетических модульных полипептидов CAR или нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов CAR, позволяет идентифицировать CAR и/или их части (например, антигенсвязывающие домены, первичные сигнальные домены, комодулирующие домены и т.д.), которые эффективно приводят к возникновению желательного фенотипа Т-клеток. Соответственно, в область настоящего изобретения включены CAR, идентифицированные путем скрининга библиотек, описанных в настоящем документе, а также нуклеиновых кислот, кодирующих указан
- 44 046546 ные CAR. В область настоящего изобретения также включены CAR, содержащие подходящие модули CAR (например, антигенсвязывающие домены, первичные сигнальные домены, комодулирующие домены и т.д.), идентифицированные путем скрининга библиотек, описанных в настоящем документе, а также нуклеиновых кислот, кодирующих указанные CAR.
В некоторых случаях CAR согласно настоящему изобретению может содержать один или более комодулирующих доменов, идентифицированных как стимулирующие Т-клетки или ингибирующие Тклетки домены при скрининге библиотеки синтетических модульных полипептидов CAR или нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, описанных в настоящем документе. Соответственно, общий Т-клеточный фенотип CAR может заключаться в имитации активности Тклеток или ингибировании активности Т-клеток. Виды активности Т-клеток, которые могут быть подвергнуты стимулированию или ингибированию, включают, но не ограничиваются ими, например, виды активности Т-клеток, описанные в настоящем документе.
В некоторых случаях CAR, идентифицированный путем скрининга библиотеки, может содержать по меньшей мере один комодулирующий домен, перечисленный в таблице 3 или таблице 4, включая, но не ограничиваясь ими, например, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR, идентифицированный путем скрининга библиотеки, может содержать два или более комодулирующих доменов, перечисленных в табл. 3 и табл. 4, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR согласно настоящему изобретению может содержать комодулирующий домен, идентифицированный при скрининге, описанном в настоящем документе, в качестве костимулирующего домена, включая, но не ограничиваясь ими, например, те, которые перечислены в таблице 3, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR согласно настоящему изобретению может содержать комодулирующий домен, идентифицированный при скрининге, описанном в настоящем документе, в качестве коингибирующего домена, включая, но не ограничиваясь ими, например, те, которые перечислены в табл. 4, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR, который содержит один или более коингибирующих доменов, может представлять собой iCAR.
В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может содержать два костимулирующих домена, включая, но не ограничиваясь ими, например, два или более костимулирующих доменов, перечисленных в табл. 3. В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может содержать два коингибирующих домена, включая, но не ограничиваясь ими, например, два или более коингибирующих доменов, перечисленных в табл. 4. В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может включать смесь костимулирующих и коингибирующих доменов, включая, но не ограничиваясь ими, по меньшей мере один костимулирующий домен, перечисленный в табл. 3, и по меньшей мере один коингибирующий домен, перечисленный в табл. 4.
- 45 046546
Таблица 3
Комодулирующие домены, обладающие стимулирующей функцией (костимулирующие домены)
Домен | Последовательность | SEQ ID NO: |
4-1ВВ | KRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL | 26 |
CD7 | ARTQIKKLCSWRDKNSAACVVYEDMSHSRCNTLSSPNQYQ | 25 |
2В4 | WRRKRKEKQSETSPKEFLTIYEDVKDLKTRRNHEQEQTFPGGGSTIYSMIQS QSSAPTSQEPAYTLYSLIQPSRKSGSRKRNHSPSFNSTIYEVIGKSQPKAQNP ARLSRKELENFDVYS | 41 |
HVEM | MEESWRPSVFWDGQTDIPFTRLGRSHRRQSCSV | 23 |
CRTAM | KLRKAHVIWKKENEVSEHTLESYRSRSNNEETSSEEKNGQSSHPMRCMNYI TKLYSEAKTKRKENVQHSKLEEKHIQVPESIV | 35 |
CD30 | RRACRKRIRQKLHLCYPVQTSQPKLELVDSRPRRSSTQLRSGASVTEPVAEE RGLMSQPLMETCHSVGAAYLESLPLQDASPAGGPSSPRDLPEPRVSTEHTN NKIEKIYIMKADTVIVGTVKAELPEGRGLAGPAEPELEEELEADHTPHYPEQ ETEPPLGSCSDVMLSVEEEGKEDPLPTAASGK | 42 |
TLT2 | KKRHMASYSMCSDPSTRDPPGRPEPYVEVYLI | 21 |
CD27 | HQRRKYRSNKGESPVEPAEPCHYSCPREEEGSTIPIQEDYRKPEPACSP | 28 |
CTLA4 | SLSKMLKKRSPLTTGVYVKMPPTEPECEKQFQPYFIPIN | 24 |
Таблица 4
Комодулирующие домены, обладающие ингибиторной функцией (коингибирующие домены)
Домен | Последовательность | SEQ ID NO: |
DNAM-1 | NRRRRRERRDLFTESWDTQKAPNNYRSPISTSQPTNQSMDDTREDIYVNYPTFSRR PKTRV | 31 |
CD80 | RCRERRRNERLRRESVRPV | 19 |
PD-1 | ICSRAARGTIGARRTGQPLKEDPSAVPVFSVDYGELDFQWREKTPEPPVPCVPEQT EYATIVFPSGMGTSSPARRGSADGPRSAQPLRPEDGHCSWPL | 36 |
TIM-3 | KWYSHSKEKIQNLSLISLANLPPSGLANAVAEGIRSEENIYTIEENVYEVEEPNEYY CYVSSRQQPSQPLGCRFAMP | 33 |
BTLA | CCLRRHQGKQNELSDTAGREINLVDAHLKSEQTEASTRQNSQVLLSETGIYDNDPD LCFRMQEGSEVYSNPCLEENKPGIVYASLNHSVIGPNSRLARNVKEAPTEYASICV RS | 39 |
CD40 | KKVAKKPTNKAPHPKQEPQEINFPDDLPGSNTAAPVQETLHGCQPVTQEDGKESRI SVQERQ | 32 |
ICOS | TKKKYSSSVHDPNGEYMFMRAVNTAKKSRLTDVTL | 22 |
LAG3 | RRQWRPRRFSALEQGIHPPQAQSKIEELEQEPEPEPEPEPEPEPEPEPEQL | 29 |
GITR | HIWQLRSQCMWPRETQLLLEVPPSTEDARSCQFPEEERGERSAEEKGRLGDLWV | 30 |
TIGIT | RKKKALRIHSVEGDLRRKSAGQEEWSPSAPSPPGSCVQAEAAPAGLCGEQRGEDC AELHDYFNVLSYRSLGNCSFFTETG | 34 |
PD-L1 | RKGRMMDVKKCGIQDTNSKKQSDTHLEET | 20 |
CD28 | WVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS | 27 |
LAIR1 | HRQNQIKQGPPRSKDEEQKPQQRPDLAVDVLERTADKATVNGLPEKDRETDTSAL AAGSSQEVTYAQLDHWALTQRTARAVSPQSTKPMAESITYAAVARH | 37 |
CAR | CCRKKRREEKYEKEVHHDIREDVPPPKSRTSTARSYIGSNHSSLGSMSPSNMEGYS KTQYNQVPSEDFERTPQSPTLPPAKVAAPNLSRMGAIPVMIPAQSKDGSIV | 38 |
CD2 | TKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRS QAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQPKPPHGAAENSL SPSSN | 40 |
CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические полипептиды CAR, может содержать любой подходящий антигенсвязывающий домен, включая, но не ограничиваясь ими, те, которые используются в клинических условиях в различных конструкциях CAR, включая, например, ВСМАспецифичный антигенсвязывающий домен, CD123-специфичный антигенсвязывающий домен, CD138специфичный антигенсвязывающий домен, CD171-специфичный антигенсвязывающий домен, CD19специфичный антигенсвязывающий домен, CD22-специфичный антигенсвязывающий домен, CD30специфичный антигенсвязывающий домен, CD33-специфичный антигенсвязывающий домен, CD7специфичный антигенсвязывающий домен, CD70-специфичный антигенсвязывающий домен, СЕАспецифичный антигенсвязывающий домен, EGFRvIII-специфичный антигенсвязывающий домен, ЕРСАМ-специфичный антигенсвязывающий домен, EphA2-специфичный антигенсвязывающий домен, ErbB-специфичный антигенсвязывающий домен, FAP-специфичный антигенсвязывающий домен, GD2специфичный антигенсвязывающий домен, GPC3-специфичный антигенсвязывающий домен, HER2специфичный антигенсвязывающий домен, IL1RAP-специфичный антигенсвязывающий домен, каппаспецифичный антигенсвязывающий домен, LeY-специфичный антигенсвязывающий домен, Mesoспецифичный антигенсвязывающий домен, MG7-специфичный антигенсвязывающий домен, MUC1специфичный антигенсвязывающий домен, NKG2D-специфичный антигенсвязывающий домен, PSCAспецифичный антигенсвязывающий домен, ROR1-специфичный антигенсвязывающий домен и т.п.
CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, может содержать любой подходящий первичный сигнальный домен (также называемый в настоящем
- 46 046546 документе внутриклеточным сигнальным доменом), включая, но не ограничиваясь ими, например, те, которые содержат один или более иммунорецепторных тирозиновых активирующих мотивов (ITAM).
Подходящий внутриклеточный сигнальный домен может быть частью, содержащей мотив ITAM, которая получена из полипептида, который содержит мотив ITAM. Например, подходящий внутриклеточный сигнальный домен может представлять собой домен, содержащий мотив ITAM, из любого содержащего мотив ITAM белка. Следовательно, подходящий внутриклеточный сигнальный домен необязательно содержит полную последовательность всего белка, из которого он получен. Примеры подходящих полипептидов, содержащих мотив ITAM, включают, но не ограничиваются ими: DAP12; FCER1G (гамма-цепь рецептора Fcε I); CD3D (CD3-дельта); CD3E (ОЗ-эпсилон); CD3G (CD3-гамма); CD3Z (CD3-дзета); и CD79A (альфа-цепь белка, связанного с антигенраспознающим рецепторным комплексом).
В некоторых случаях внутриклеточный сигнальный домен получен из DAP12 (также известного как TYROBP; белок, связывающий тирозинкиназу TYRO, KARAP;
PLOSL; DNAX-активирующий белок 12; связанный с KAR белок; связывающий тирозинкиназу TYRO белок; активирующий киллеры ассоциированный с рецептором белок; активирующий киллеры рецептор-ассоциированный белок и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей (4 изоформы):
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTVLIAL
AVYFLGRLVPRGRGAAEAATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQ
ID NO: 107);
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLT
VLIALAVYFLGRLVPRGRGAAEATRKQRITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 108);
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGR
LVPRGRGAAEAATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 109); или
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGR
LVPRGRGAAEATRKORITETESPYOELOGORSDVYSDLNTQRPYYK (SEQ ID NO; 110), в которых мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности DAP12. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
ESPYQELQGORSDVYSDLNTO (SEQ ID NO:111), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из FCER1G (также известного как FCRG; гамма-цепь рецептора Fcε I; гамма-цепь рецептора Fc; Fc-эпсилон RI-гамма; FcR-гамма; FcεRI гамма; высокоаффинная гамма-субъединица эпсилон-рецептора иммуноглобулина; рецептор иммуноглобулина Е; высокоаффинная гамма-цепь и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
MIPAVVLLLLLLVEQAAALGEPQLCYILDAILFLYGIVLTLLYCRLKIQVRKAAITSYEKS
DGVYTGLSTRNOETYETLKHEKPPQ (SEQ ID NO: 112), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности FCER1G. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере прибли
- 47 046546 зительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
DGVYTGLSTRNOETYETLKHE (SEQ ID NO: 113), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из дельта-цепи поверхностного гликопротеина CD3 Т-клеток (также известного как CD3D; CD3-DELTA; T3D; антиген CD3; дельтасубъединица; CD3-дельта; CD3d-антиген; дельта-полипептид (комплекс TiT3); ОКТ3; дельта-цепь; дельта-цепь Т-клеточного рецептора Т3; дельта-цепь поверхностного гликопротеина CD3 Т-клеток и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 170 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG
KRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALG VFCFAGHETGRLSGAADTOALLRNDOVYQPLRDRDDAOYSHLGGNWARNK (SEQ ID
NO: 114) или
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG
KRILDPRGIYRCNGTDIYKDKESTVOVHYRTADTOALLRNDOVYQPLRDRDDAOYSHL
GGNWARNK (SEQ ID NO: 115), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3дельта. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
DOVYQPLRDRDDAOYSHLGGN (SEQ ID NO: 116), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из эпсилон-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3ε; эпсилон-цепь поверхностного антигена T3/Leu-4 Т-клеток; эпсилон-цепь поверхностного гликопротеина CD3 Т-клеток; AI504783; CD3; CD3эпсилон; T3ε и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 205 а.к. следующей аминокислотной последовательности:
MQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILW
QHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARV CENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQ NKERPPPVPNPDYEPIRKGORDLYSGLNORRI (SEQ ID NO: 117), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3 эпсилон. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98%
- 48 046546 или 100% идентична следующей аминокислотной последовательности: NPDYEPIRKGORDLYSGLNQR (SEQ ID NO: 118), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из гамма-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3G; гамма-цепь Т-клеточного рецептора Т3; CD3гамма; T3G; гамма-полипептид (комплекс TiT3) и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 180 а.к. следующей аминокислотной последовательности:
MEQGKGLAVLILAIILLQGTLAQSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDG KMIGFLTEDKKKWNLGSNAKDPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATIS GFLFAEIVSIFVLAVGVYFIAGODGVROSRASDKOTLLPNDOLYOPLKDREDDOYSHLQ GNQLRRN (SEQ ID NO: 119), в которой ITAM мотивы выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3гамма. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
DOLYQPLKDREDDOYSHLOGN (SEQ ID NO: 120), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из дзета-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3Z; дзета-цепь Т-клеточного рецептора Т3; CD247; CD3-дзета; CD3H; CD3Q; T3Z; TCRZ и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 160 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):
MKWKALFTAAILQAQLP1TEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA PAYQOGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPOEGLYNELQKDK MAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 121)или
MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA
PAYOOGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPORRKNPOEGLYNELQKD
KMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR (SEQ ID NO:
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3дзета. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей:
- 49 046546
RVKFSRSADAPAYQQGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEG
LYNELOKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 123);
NQLVNELNLGRREEYDVLDKR (SEQ ID NO: 124); EGLYNELQKDKMAEAYSEIGMK (SEQ ID NO: 125); или DGLYQGLSTATKDTYDALHMO (SEQ ID NO: 126), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из CD79A (также известной как альфа-цепь белка, связанного с антигенным рецептором В-клеток; антиген CD79a (ассоциированная с иммуноглобулином альфа-цепь); мембранный гликопротеин МВ-1; ig-альфа; связанный с мембраной ассоциированный с иммуноглобулином белок; поверхностный IgM-ассоциированный белок и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 200 а.к. или от приблизительно 200 а.к. до приблизительно 220 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):
MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNGTLIIQNVNKSHGGIYVCRVQEGNESYQ QSCGTYLRVRQPPPRPFLDMGEGTKNRIITAEGIILLFCAVVPGTLLLFRKRWQNEKLGL DAGDEYEDENLYEGLNLDDCSMYEDISRGLOGTYODVGSLNIGDVOLEKP (SEQ ID
NO: 127); или
MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNEPPPRPFLDMGEGTKNRIITAEGIILLFCA VVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGLNLDDCSMYEDISRGLQGTYQDV GSLNIGDVQLEKP (SEQ ID NO: 128), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD79A. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
ENLYEGLNLDDCSMYEDISRG (SEQ ID NO: 129), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты. Внутриклеточные сигнальные домены, подходящие для применения в CAR согласно настоящему изобретению, содержат сигнальную цепь типа DAP10/CD28.
Примером сигнальной цепи DAP10 является аминокислотная последовательность: RPRRSPAQDGKVYINMPGRG (SEQ ID NO: 130).
Согласно некоторым вариантам реализации настоящего изобретения подходящий внутриклеточный сигнальный домен содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или по меньшей мере приблизительно на 99% идентична по всей длине аминокислотной последовательности
RPRRSPAQDGKVYINMPGRG (SEQ ID NO: 130).
Примером сигнальной цепи CD28 является аминокислотная последовательность:
FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYA PPRDFAAYRS (SEQ ID NO; 131).
Согласно некоторым вариантам реализации настоящего изобретения подходящий внутриклеточный сигнальный домен содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или по меньшей мере приблизительно на 99% идентична по всей длине аминокислотной последовательности
- 50 046546
FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYOPYA
PPRDFAAYRS (SEQ ID NO: 131).
Внутриклеточные сигнальные домены, пригодные для применения в CAR согласно настоящему изобретению, включают полипептид ZAP70, например, полипептид, содержащий аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98%, по меньшей мере приблизительно на 99% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 300 аминокислот до приблизительно 400 аминокислот, от приблизительно 400 аминокислот до приблизительно 500 аминокислот или от приблизительно 500 аминокислот до 619 аминокислот следующей аминокислотной последовательности:
MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDV
RFHHFPIERQLNGTYAIAGGKAHCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGV FDCLRDAMVRDYVRQTWKLEGEALEQAIISQAPQVEKLIATTAHERMPWYHSSLTREE AERKLYSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEGTKFDT LWQLVEYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSD GYTPEPARITSPDKPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGS VRQGVYRMRKKQIDVAIKVLKQGTEKADTEEMMREAQIMHQLDNPYIVRLIGVCQAE ALMLVMEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEEKNFVHRDLAAR NVLLVNRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVW SYGVTMWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKW EDRPDFLTVEQRMRACYYSLASKVEGPPGSTQKAEAACA (SEQ ID NO: 132).
В некоторых случаях CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, включая CAR, содержащий по меньшей мере один или два или более комодулирующих доменов, перечисленных в табл. 3 и табл. 4, может быть разделен на две полипептидные цепи, способные соединяться, в присутствии димеризатора, посредством домена димеризации, присутствующего в каждой цепи. Указанные расщепленные CAR являются условно активными и фармакологически индуцируемыми/подавляемыми, например, как те, которые описаны в РСТ публикации патентной заявки WO2014/127261, содержание которой полностью включено в настоящее изобретение посредством ссылки.
Соответственно, в некоторых случаях, каждый полипептид расщепленного варианта CAR из CAR, идентифицированного путем скрининга библиотеки, описанной в настоящем документе, может содержать одну половину пары димеризации (также называемой парой, связывающей димеризатор). Неограничивающие примеры подходящих димеров (например, пар, связывающих димеризатор) включают, но не ограничиваются ими: а) FK506-связывающий белок (FKBP) и FKBP; b) FKBP и каталитическая субъединица кальцинейрина А (CnA); с) FKBP и циклофилин; d) FKBP и FKBP-рапамицин-ассоциированный белок (FRB); е) гираза В (GyrB) и GyrB; f) дигидрофолатредуктаза (DHFR) и DHFR; g) DmrB и DmrB; h) PYL и ABI; i) Cry2 и CIB1; и j) GAI и GID1.
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) рассматриваемого CAR получен из FKBP. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIR GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 78).
В некоторых случаях элемент пары, связывающей димеризатор, рассматриваемого CAR получен из каталитической субъединицы А кальцинейрина (также известной как РРР3СА; CALN; CALNA; CALNA1; CCN1; CNA1; РРР2В; каталитическая субъединица CAM-PRP; кальцинейрин А альфа; кальмодулин-зависимая изоформа альфа-субъединицы кальцинейрина А; протеинфосфатаза 2В; каталитическая субъединица, альфа-изоформа и т.д.). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности (домен РР2Ас):
- 51 046546
LEESVALRIITEGASILRQEKNLLDIDAPVTVCGDIHGQFFDLMKLFEVGGSPANT RYLFLGDYVDRGYFSIECVLYLWALKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYS ERVYDACMDAFDCLPLAALMNQQFLCVHGGLSPEINTLDDIRKLDRFKEPPAYGPMCDI LWSDPLEDFGNEKTQEHFTHNTVRGCSYFYSYPAVCEFLQHNNLLSILRAHEAQDAGYR MYRKSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNVMNIRQFNCSPHPYWLPNFM (SEQ ID NO: 79).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из циклофилина (также известного как циклофилин A; PPIA; CYPA; CYPH; РРкгза А и т.д.). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
MVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHR
IIPGFMCQGGDFTRHNGTGGKSIYGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICT AKTEWLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKITIADCGQLE (SEQ ID NO: 80).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из MTOR (также известного как с FKBP-рапамицин-ассоциированный белок; FK506-связывающии белок 12-рапамицин-ассоциированный белок 1; FK506-связывающий белок 12-рапамицин-ассоциированный белок 2; FK506-связывающий белок 12-ассоциированный с рапамициновым комплексом белок 1; FRAP; FRAP1; FRAP2; RAFT1; и RAPT1). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности (также известной как Frb: Fbbp-рапамицин-связывающий домен):
MILWHEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQ AYGRDLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISK (SEQ ID NO: 81).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из GyrB (также известного как субъединица В ДНК-гиразы). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 200 аминокислот (а.к.), от приблизительно 200 а.к. до приблизительно 300 а.к., от приблизительно 300 а.к. до приблизительно 400 а.к., от приблизительно 400 а.к. до приблизительно 500 а.к., от приблизительно 500 а.к. до приблизительно 600 а.к., от приблизительно 600 а.к. до приблизительно 700 а.к. или от приблизительно 700 а.к. до приблизительно 800 а.к. следующей аминокислотной последовательности GyrB из Escherichia coli (или последовательности субъединицы В ДНК-гиразы из любого организма):
MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALA
GHCKEIIVTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSG GLHGVGVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPS LETFTNVTEFEYEILAKRLRELSFLNSGVSIRLRDKRDGKEDHFHYEGGIKAFVEYLNKN KTPIHPNIFYFSTEKDGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRT LNAYMDKEGYSKK АК VS ATGDD AREGLIAVVS VKVPDPKF S SQTKDKL VS SEVK SAVE QQMNELLAEYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLA DCQERDPALSELYL VEGD S AGGS AKQGRNRKNQ AILPLKGKILNVEKARFDKMLS SQE VATLITALGCGIGRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHV YIAQPPLYKVKKGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSE YNATQKMINRMERRYPKAMLKELIYQPTLTEADLSDEQTVTRWVNALVSELNDKEQH GSQWKFDVHTNAEQNLFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLE EDAFIERGERRQPVASFEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRR MLRVTVKDAIAADQLFTTLMGDAVEPRRAFIEENALKAANIDI (SEQ Ш NO: 82).
- 52 046546
В некоторых случаях элемент пары, связывающей димеризатор, содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотам 1-220 из вышеуказанной аминокислотной последовательности GyrB из Escherichia coli.
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из DHFR (также известного как дигидрофолатредуктаза, DHFRP1 и DYR). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
MVGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKT
WFSIPEKNRPLKGRINLVLSRELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIV
GGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLEKYKLLPEYPGVLSDVQEEKGI
KYKFEVYEKND (SEQ ID NO: 83).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из DmrB-связывающего домена (т.е. домена гомодимеризации DmrB). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
MASRGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQ
EVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID
NO: 84).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка PYL (также известного как рецептор абсцизовой кислоты и RCAR). Например, элемент рассматриваемой пары, связывающей димеризатор, может быть получен из белков, например, белков Arabidopsis thaliana: PYR1, RCAR1(PYL9), PYL1, PYL2, PYL3, PYL4, PYL5, PYL6, PYL7, PYL8 (RCAR3), PYL10, PYL11, PYL12, PYL13. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей:
- 53 046546
PYL10:
MNGDETKKVESEYIKKHHRHELVESQCSSTLVKHIKAPLHLVWSIVRRFDEPQKYKPFIS RCVVQGKKLEVGSVREVDLKSGLPATKSTEVLEILDDNEHILGIRIVGGDHRLKNYSSTI SLHSETIDGKTGTLAIESFVVDVPEGNTKEETCFFVEALIQCNLNSLADVTERLQAESME KKI(SEQIDNO: 85).
PYL11:
METSQKYHTCGSTLVQTIDAPLSLVWSILRRFDNPQAYKQFVKTCNLSSGDGGEGSVRE VTVVSGLPAEFSRERLDELDDESHVMMISIIGGDHRLVNYRSKTMAFVAADTEEKTVVV ESYVVDVPEGNSEEETTSFADTIVGFNLKSLAKLSERVAHLKL (SEQ ID NO: 86).
PYL12:
MKTSQEQHVCGSTVVQTINAPLPLVWSILRRFDNPKTFKHFVKTCKLRSGDGGE GSVREVTVVSDLPASFSLERLDELDDESHVMVISIIGGDHRLVNYQSKTTVFVAAEEEKT VWESYVVDVPEGNTEEETTLFADTIVGCNLRSLAKLSEKMMELT (SEQ Ш NO: 87).
PYL13:
MESSKQKRCRSSVVETIEAPLPLVWSILRSFDKPQAYQRFVKSCTMRSGGGGGK GGEGKGSVRDVTLVSGFPADFSTERLEELDDESHVMVVSIIGGNHRLVNYKSKTKVVAS PEDMAKKTVVVESYVVDVPEGTSEEDTIFFVDNIIRYNLTSLAKLTKKMMK (SEQ ID NO: 88).
PYL1:
MANSESSSSPVNEEENSQRISTLHHQTMPSDLTQDEFTQLSQSIAEFHTYQLGNGR CSSLLAQRIHAPPETVWSVVRRFDRPQIYKHFIKSCNVSEDFEMRVGCTRDVNVISGLPA NTSRERLDLLDDDRRVTGFSITGGEHRLRNYKSVTTVHRFEKEEEEERIWTVVLESYVV DVPEGNSEEDTRLFADTVIRLNLQKLASITEAMNRNNNNNNSSQVR (SEQ ID NO: 89).
PYL2:
MSSSPAVKGLTDEEQKTLEPVIKTYHQFEPDPTTCTSLITQRIHAPASVVWPLIRRF DNPERYKHFVKRCRLISGDGDVGSVREVTVISGLPASTSTERLEFVDDDHRVLSFRVVG GEHRLKNYKSVTSVNEFLNQDSGKVYTVVLESYTVDIPEGNTEEDTKMFVDTVVKLNL QKLGVAATSAPMHDDE (SEQ ID NO: 90).
PYL3:
MNLAPIHDPS S S STTTTS S STP YGLTKDEF STLDSIIRTHHTFPRSPNTCTSLIAHRV DAPAHAIWRFVRDFANPNKYKHFIKSCTIRVNGNGIKEIKVGTIREVSVVSGLPASTSVEI LEVLDEEKRILSFRVLGGEHRLNNYRSVTSVNEFVVLEKDKKKRVYSVVLESYIVDIPQG NTEEDTRMFVDTVVKSNLQNLAVISTASPT (SEQ ID NO: 91).
PYL4:
MLAVHRPSSAVSDGDSVQIPMMIASFQKRFPSLSRDSTAARFHTHEVGPNQCCSA
- 54 046546
VIQEISAPISTVWSVVRRFDNPQAYKHFLKSCSVIGGDGDNVGSLRQVHVVSGLPAASST ERLDILDDERHVISFSVVGGDHRLSNYRSVTTLHPSPISGTVVVESYVVDVPPGNTKEET CDFVDVIVRCNLQSLAKIAENTAAESKKKMSL (SEQ ID NO: 92).
PYL5:
MRSPVQLQHGSDATNGFHTLQPHDQTDGPIKRVCLTRGMHVPEHVAMHHTHDV
GPDQCCSSVVQMIHAPPESVWALVRRFDNPKVYKNFIRQCRIVQGDGLHVGDLREVMV VSGLP AVS STERLEILDEERHVISF S VVGGDHRLKNYRS VTTLHASDDEGT VVVES YIVD VPPGNTEEETLSFVDTIVRCNLQSLARSTNRQ (SEQ ID NO: 93).
PYL6:
MPTSIQFQRSSTAAEAANATVRNYPHHHQKQVQKVSLTRGMADVPEHVELSHT
HWGPSQCFSVVVQDVEAPVSTVWSILSRFEHPQAYKHFVKSCHVVIGDGREVGSVREV RVVSGLPAAFSLERLEIMDDDRHVISFSVVGGDHRLMNYKSVTTVHESEEDSDGKKRTR VVESYVVDVPAGNDKEETCSFADTIVRCNLQSLAKLAENTSKFS (SEQ ID NO: 94).
PYL7:
MEMIGGDDTDTEMYGALVTAQSLRLRHLHHCRENQCTSVLVKYIQAPVHLVWS
LVRRFDQPQKYKPFISRCTVNGDPEIGCLREVNVKSGLPATTSTERLEQLDDEEHILGINII GGDHRLKNYSSILTVHPEMIDGRSGTMVMESFVVDVPQGNTKDDTCYFVESLIKCNLKS LACVSERLAAQDITNSIATFCNASNGYREKNHTETNL (SEQ ID NO: 95).
PYL8:
MEANGIENLTNPNQEREFIRRHHKHELVDNQCSSTLVKHINAPVHIVWSLVRRFD QPQKYKPFISRCVVKGNMEIGTVREVDVKSGLPATRSTERLELLDDNEHILSIRIVGGDH RLKNYSSIISLHPETIEGRIGTLVIESFVVDVPEGNTKDETCYFVEALIKCNLKSLADISERL AVQDTTESRV (SEQ ID NO: 96).
PYL9:
MMDGVEGGTAMYGGLETVQYVRTHHQHLCRENQCTSALVKHIKAPLHLVWSL
VRRFDQPQKYKPFVSRCTVIGDPEIGSLREVNVKSGLPATTSTERLELLDDEEHILGIKIIG GDHRLKNYSSILTVHPEIIEGRAGTMVIESFVVDVPQGNTKDETCYFVEALIRCNLKSLA DVSERLASQDITQ (SEQ ID NO: 97).
PYRE
MPSELTPEERSELKNSIAEFHTYQLDPGSCSSLHAQRIHAPPELVWSIVRRFDKPQ
TYKHFIKSCSVEQNFEMRVGCTRDVIVISGLPANTSTERLDILDDERRVTGFSIIGGEHRL TNYKSVTTVHRFEKENRIWTVVLESYVVDMPEGNSEDDTRMFADTVVKLNLQKLATV AEAMARNSGDGSGSQVT (SEQ ID NO: 98).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка ABI (также известного как нечувствительный к абсцизовой кислоте белок). Например, элемент рассматриваемой пары, связывающей димеризатор, может быть получен из белков, таких как белки Arabidopsis thaliana: ABI1 (также известный как нечувствительный к абсцизовой кислоте белок 1, протеинфосфатаза 2С 56, AtPP2C56, Р2С56 и РР2С ABI1) и/или ABI2 (также известный как Р2С77, протеинфосфатаза 2С 77, AtPP2C77, нечувствительный к абсцизовой кислоте белок 2, протеинфосфатаза 2С ABI2 и РР2С ABI2). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно
- 55 046546
180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:
ABI1:
MEEVSPAIAGPFRPFSETQMDFTGIRLGKGYCNNQYSNQDSENGDLMVSLPETSSCSVSG
SHGSESRKVLISRINSPNLNMKESAAADIVVVDISAGDEINGSDITSEKKMISRTESRSLFE FKSVPLYGFTSICGRRPEMEDAVSTIPRFLQSSSGSMLDGRFDPQSAAHFFGVYDGHGGS QVANYCRERMHLALAEEIAKEKPMLCDGDTWLEKWKKALFNSFLRVDSEIESVAPETV GSTSVVAVVFPSHIFVANCGDSRAVLCRGKTALPLSVDHKPDREDEAARIEAAGGKVIQ WNGARVFGVLAMSRSIGDRYLKPSIIPDPEVTAVKRVKEDDCLILASDGVWDVMTDEE ACEMARKRILLWHKKNAVAGDASLLADERRKEGKDPAAMSAAEYLSKLAIQRGSKDN ISVVVVDLKPRRKLKSKPLN (SEQ ID NO: 99).
ABi2:
MDEVSPAVAVPFRPFTDPHAGLRGYCNGESRVTLPESSCSGDGAMKDSSFEINTRQDSL TSSSSAMAGVDISAGDEINGSDEFDPRSMNQSEKKVLSRTESRSLFEFKCVPLYGVTSICG RRPEMEDSVSTIPRFLQVSSSSLLDGRVTNGFNPHLSAHFFGVYDGHGGSQVANYCRER MHLALTEEIVKEKPEFCDGDTWQEKWKKALFNSFMRVDSEIETVAHAPETVGSTSVVA VVFPTHIFVANCGDSRAVLCRGKTPLALSVDHKPDRDDEAARIEAAGGKVIRWNGARV FGVLAMSRSIGDRYLKPSVIPDPEVTSVRRVKEDDCLILASDGLWDVMTNEEVCDLARK RILLWHKKNAMAGEALLPAEKRGEGKDPAAMSAAEYLSKMALQKGSKDNISVVVVDL KGIRKFKSKSLN (SEQ ID NO: 100).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка Cry2 (также известного как криптохром 2). Например, элемент рассматриваемого димера (например, пары, связывающей димеризатор) может быть получен из белков Cry2 из любого организма (например, растения), такого как, но не ограничиваясь ими, Arabidopsis thaliana. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:
Cry2 (Arabidopsis thaliana)
MKMDKKTIVWFRRDLRIEDNPALAAAAHEGSVFPVFIWCPEEEGQFYPGRASRW
WMKQSLAHLSQSLKALGSDLTLIKTHNTISAILDCIRVTGATKVVFNHLYDPVSLVRDH TVKEKLVERGISVQSYNGDLLYEPWEIYCEKGKPFTSFNSYWKKCLDMSIESVMLPPPW RLMPITAAAEAIWACSIEELGLENEAEKPSNALLTRAWSPGWSNADKLLNEFIEKQLIDY AKNSKKVVGNSTSLLSPYLHFGEISVRHVFQCARMKQIIWARDKNSEGEESADLFLRGIG LREYSRYICFNFPFTHEQSLLSHLRFFPWDADVDKFKAWRQGRTGYPLVDAGMRELWA TGWMHNRIRVIVSSFAVKFLLLPWKWGMKYFWDTLLDADLECDILGWQYISGSIPDGH ELDRLDNPALQGAKYDPEGEYIRQWLPELARLPTEWIHHPWDAPLTVLKASGVELGTN YAKPIVDIDTARELLAKAISRTREAQIMIGAAPDEIVADSFEALGANTIKEPGLCPSVSSN DQQ VPS AVRYNGSKRVKPEEEEERDMKKSRGFDERELF STAES S S S S S VFF VSQSC SLAS EGKNLEGIQDSSDQITTSLGKNGCK (SEQ ID NO: 101)
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка CIB1 Arabidopsis thaliana (также известного как транскрипционный фактор bHLH63). Например, подходящий элемент димера (например, пары, связывающий димеризатор) может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизи
- 56 046546 тельно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. следующей аминокислотной последовательности:
MNGAIGGDLLLNFPDMSVLERQRAHLKYLNPTFDSPLAGFFADSSMITGGEMDS
YLSTAGLNLPMMYGETTVEGDSRLSISPETTLGTGNFKKRKFDTETKDCNEKKKKMTM
NRDDLVEEGEEEKSKITEQNNGSTKSIKKMKHKAKKEENNFSNDSSKVTKELEKTDYIH VRARRGQATDSHSIAERVRREKISERMKFLQDLVPGCDKITGKAGMLDEIINYVQSLQR QIEFLSMKLAIVNPRPDFDMDDIFAKEVASTPMTVVPSPEMVLSGYSHEMVHSGYSSEM VNSGYLHVNPMQQVNTSSDPLSCFNNGEAPSMWDSHVQNLYGNLGV (SEQ ID NO: 102).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка GAI Arabidopsis thaliana (также известного как нечувствительный к гибберелловой кислоте белок и белок GAI семейства DELLA). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. следующей аминокислотной последовательности:
MI<RDHHHHHHQDI<I<TMMMNEEDDGNGMDELLAVLGYI<VRSSEMADVAQI<L
EQLEVMMSNVQEDDLSQLATETVHYNPAELYTWLDSMLTDLNPPSSNAEYDLKAIPGD AILNQFAIDSASSSNQGGGGDTYTTNKRLKCSNGVVETTTATAESTRHVVLVDSQENGV RLVHALLACAEAVQKENLTVAEALVKQIGFLAVSQIGAMRKVATYFAEALARRIYRLSP SQSPIDHSLSDTLQMHFYETCPYLKFAHFTANQAILEAFQGKKRVHVIDFSMSQGLQWP ALMQALALRPGGPPVFRLTGIGPPAPDNFDYLHEVGCKLAHLAEAIHVEFEYRGFVANT LADLDASMLELRPSEIESVAVNSVFELHI<LLGRPGAIDI<VLGVVNQII<PEIFTVVEQESN HNSPIFLDRFTESLHYYSTLFDSLEGVPSGQDKVMSEVYLGKQICNVVACDGPDRVERH ETLSQWRNRFGSAGFAAAHIGSNAFKQASMLLALFNGGEGYRVEESDGCLMLGWHTR
PLIATSAWKLSTN (SEQ ID NO: 103).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка GID1 Arabidopsis thaliana (также известного как рецептор гибберелловой кислоты GID1). Например, подходящий элемент димера может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:
- 57 046546
GID ΙΑ:
MAASDEVNLIESRTVVPLNTWVLISNFKVAYNILRRPDGTFNRHLAEYLDRKVT
ANANPVDGVFSFDVLIDRRINLLSRVYRPAYADQEQPPSILDLEKPVDGDIVPVILFFHGG
SFAHSSANSAIYDTLCRRLVGLCKCVVVSVNYRRAPENPYPCAYDDGWIALNWVNSRS
WLKSKKDSKVHIFLAGDSSGGNIAHNVALRAGESGIDVLGNILLNPMFGGNERTESEKS
LDGKYFVTVRDRDWYWKAFLPEGEDREHPACNPFSPRGKSLEGVSFPKSLVVVAGLDL
IRDWQLAYAEGLKKAGQEVKLMHLEKATVGFYLLPNNNHFHNVMDEISAFVNAEC (SEQ ID NO: 104).
GID IB:
MAGGNEVNLNECKRIVPLNTWVLISNFKLAYKVLRRPDGSFNRDLAEFLDRKVP
ANSFPLDGVFSFDHVDSTTNLLTRIYQPASLLHQTRHGTLELTKPLSTTEIVPVLIFFHGGS FTHSSANSAIYDTFCRRLVTICGVVVVSVDYRRSPEHRYPCAYDDGWNALNWVKSRVW LQSGKDSNVYVYLAGDSSGGNIAHNVAVRATNEGVKVLGNILLHPMFGGQERTQSEKT LDGKYFVTIQDRDWYWRAYLPEGEDRDHPACNPFGPRGQSLKGVNFPKSLVVVAGLD LVQDWQLAYVDGLKKTGLEVNLLYLKQATIGFYFLPNNDHFHCLMEELNKFVHSIEDS QSKSSPVLLTP (SEQ ID NO: 105).
GID1C:
MAGSEEVNLIESKTVVPLNTWVLISNFKLAYNLLRRPDGTFNRHLAEFLDRKVPANANP
VNGVFSFDVIIDRQTNLLSRVYRPADAGTSPSITDLQNPVDGEIVPVIVFFHGGSFAHSSA
NS AIYDTLCRRL VGLCGAVVVSVNYRRAPENRYPC AYDDGWAVLKWVNS S SWLRSKK
DSKVRIFLAGDSSGGNIVHNVAVRAVESRIDVLGNILLNPMFGGTERTESEKRLDGKYFV TVRDRDWYWRAFLPEGEDREHPACSPFGPRSKSLEGLSFPKSLVVVAGLDLIQDWQLK YAEGLKKAGQEVKLLYLEQATIGFYLLPNNNHFHTVMDEIAAFVNAECQ (SEQ ID NO: 106).
Как легко понять, CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, или библиотеки синтетических модульных полипептидов CAR, может быть модифицирован, например, путем добавления одного или более доменов (например, комодулирующих доменов), путем удаления одного или более доменов (например, путем удаления флуоресцентного репортера, используемого в процессе скрининга), путем разделения CAR на два полипептида (и добавления доменов димеризации), путем перегруппировки доменов и т.д.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, связанного с клеточным ответом на конкретную клеточную среду. В этой связи клеточный фенотип может быть определен по ответу клетки (например, на основании активации или ингибирования) на воздействие определенной среды. Например, ответ Т-клеток можно оценить в ответ на воздействие конкретной клеточной среды. Согласно некоторым вариантам реализации настоящего изобретения ингибирование Тклеток можно оценить в ответ на воздействие микроокружения опухоли.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, связанного с локализацией клеток, например, под влиянием хоуминга или нацеливания на клетку. Следовательно, может быть проведен скрининг, чтобы определить влияние элементов библиотеки на нацеливание на клетку. Например, клеточная библиотека может быть введена в организм-хозяина, и клетки библиотеки могут быть выделены из целевого положения организма-хозяина через некоторое время, чтобы оценить, какие клетки были успешно направлены к целевому положению. В некоторых случаях Тклетки могут быть количественно исследованы, чтобы определить их нацеливание на опухоль в условиях in vivo.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, специфичного для состояния пациента. Специфичные для пациента состояния, подвергнутые скринингу указанным способом, будут сильно различаться и могут включать состояния, связанные с конкретным патологическим состоянием пациента, и могут включать скрининг библиотеки для идентификации конкретного элемента(ов) библиотеки, проявляющего усиленный или оптимальный фенотип, специфичный для состояния пациента. В некоторых случаях локализация элементов клеточной библиотеки может быть оценена после контакта с эксплантом или ксенотрансплантатом, полученным от пациента. Например, локализация Т-клеток клеточной библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В некоторых случаях пролиферация элементов клеточной библиотеки может быть оценена после контакта с эксплантом или ксе
- 58 046546 нотрансплантатом, полученным от пациента. Например, пролиферация Т-клеток клеточной библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В некоторых случаях специфичный для пациента эксплантат или ксенотрансплантат может быть количественно исследован для определения увеличения или уменьшения жизнеспособности после контакта с клеточной библиотекой или конкретными элементами клеточной библиотеки. Например, гибель Т-клеток библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В этой связи библиотека может быть подвергнута скринингу для идентификации оптимального элемента(ов) библиотеки для лечения конкретного пациента.
В некоторых случаях фенотипы могут быть количественно исследованы в условиях in vitro с помощью динамической иммунизации антигеном. Под динамической иммунизацией антигеном подразумевают, что фенотип оценивают не только для определения присутствия или отсутствия антигена, и, следовательно, антиген может динамически варьироваться, например, динамически варьироваться в диапазоне концентраций, динамически варьироваться в течение определенного периода времени и т.д. Например, уровни антигена могут быть протитрованы (например, с использованием различных концентраций), чтобы оценить фенотип, который подвергают скринингу, при различных дозах, т.е. для оценки ответа в зависимости от дозы. Антиген может быть представлен в разных концентрациях любым удобным способом. В качестве неограничивающего примера различные количества антигена могут быть представлены с использованием клеток, экспрессирующих антиген на разных уровнях, включая диапазон уровней. В некоторых случаях время применения антигена можно динамически варьировать, например, чтобы оценить фенотип в количественном исследовании в зависимости от времени или оценить кинетику фенотипа, который подвергают скринингу. В некоторых случаях библиотека может быть подвергнута скринингу для определения отличительной черты фенотипа. В настоящем изобретении термин отличительная черта фенотипа обычно относится к комбинации отдельных фенотипов. Например, в некоторых случаях клетка может иметь отличительную черту фенотипа, которая включает определенную морфологию в сочетании с экспрессией конкретного маркера. Отличительная черта фенотипа может сочетать фенотипы с аналогичными или различными фенотипическими категориями, например, отличительная черта фенотипа может включать экспрессию двух связанных, но разных маркеров клеточной поверхности, или отличительная черта фенотипа может включать экспрессию маркера клеточной поверхности и маркера клеточной пролиферации, или отличительная черта фенотипа может включать экспрессию маркера клеточной поверхности и конкретного секретируемого маркера (например, цитокина), или отличительная черта фенотипа может включать экспрессию двух разных цитокинов и т.д. Любой подходящий фенотип, включая тот, который описан в настоящем документе, можно применять в качестве компонента отличительной черты фенотипа.
Идентификация синтетических модульных полипептидов, связанных с фенотипом В настоящем изобретении предложены способы идентификации элементов библиотеки, которые связаны с определенным детектируемым фенотипом. Не желая быть связанными соответствием какой-либо теории, авторы настоящего изобретения полагают, что скоординированная сборка каждого мультимодульного синтетического полипептида наряду с каждой соответствующей многозвенной нуклеиновой последовательностью-штрихкодом обеспечивает сборку и последующую идентификацию каждого уникального синтетического модульного полипептида. Как описано выше, область нуклеиновой последовательностиштрихкода каждой нуклеиновой кислоты, кодирующей синтетический модульный полипептид, обеспечивает не только идентичность отдельных модулей, которые составляют каждый синтетический модульный полипептид, но также специфичное расположение (именуемое в настоящем документе как архитектура) модулей. Следовательно, идентичность и архитектура каждого элемента библиотеки могут быть определены путем секвенирования области нуклеиновой последовательности-штрихкода.
Соответственно, скрининг библиотеки не обязательно должен быть выполнен с использованием физически разделенных элементов библиотеки, и элементы библиотеки можно объединять и подвергать скринингу одновременно. Объединение элементов библиотеки может быть выполнено в условиях in vitro, например, в пробирке или в образце клеток, выделенных из соответствующего организма, или в условиях in vivo, у животного или в ткани. После одновременного скрининга элементы библиотеки и/или их модули, связанные с фенотипом, могут быть идентифицированы путем идентификации и/или количественной оценки связанной области нуклеиновой последовательности-штрихкода. В некоторых случаях объединенный скрининг позволяет проводить скрининг большого количества уникальных элементов библиотеки, что нецелесообразно с помощью стандартного последовательного или параллельного скрининга. Количество уникальных элементов библиотеки, которые могут быть подвергнуты скринингу для определения фенотипа, будет зависеть от размера и сложности библиотеки и, следовательно, может варьироваться в диапазоне от 96 или менее до миллионов и более, включая, но не ограничиваясь перечисленными, например, 100 или более, 200 или более, 300 или более, 400 или более, 500 или более, 1000 или более, 2000 или более, 3000 или более, 4000 или более, 5000 или более, 6000 или более, 7000 или более, 8000 или более, 9000 или более, 10000 или более, 20000 или более, 30000 и более, 40000 и более, 50000 и более, 60000 и более, 70000 и более, 80000 или более, 90000 и более, 100000 и более и т.д.
- 59 046546
В некоторых случаях количество или частота конкретной нуклеиновой последовательностиштрихкода может быть измерена для идентификации наиболее представленного модуля. Например, частота каждой нуклеиновой последовательности-штрихкода может быть количественно определена в объединенном образце, содержащем элементы библиотеки и связанные с ней нуклеиновые кислоты, кодирующие элементы библиотеки, так, что нуклеиновые последовательности-штрихкоды с наибольшей частотой обеспечат идентификацию тех модулей, которые наиболее представлены в образце. Согласно некоторым вариантам реализации настоящего изобретения такие образцы могут представлять собой клеточные образцы.
В некоторых случаях количество или частота конкретной многозвенной нуклеиновой последовательности-штрихкода (например, области последовательности-штрихкода) может быть измерена для идентификации наиболее представленного модульного полипептида. Например, частота каждой многозвенной нуклеиновой последовательности-штрихкода может быть количественно определена в объединенном образце, содержащем элементы библиотеки и связанные с ней нуклеиновые кислоты, кодирующие элементы библиотеки, так, что многозвенные нуклеиновые последовательности-штрихкоды с наибольшей частотой обеспечивают идентификацию указанных модульных полипептидов, наиболее представленных в образце. Согласно некоторым вариантам реализации настоящего изобретения указанные образцы могут представлять собой клеточные образцы.
В некоторых случаях детектирование фенотипа и идентификация элементов библиотеки и их компонентов могут быть выполнены как часть интегрированного способа. Например, в некоторых случаях, фенотип можно детектировать методом проточной цитометрии, и элементы библиотеки могут быть идентифицированы с помощью секвенирования. Указанные интегрированные способы могут быть выполнены в комбинации с количественными исследованиями в условиях in vitro и/или in vivo, например, как показано на фиг. 24, где FLOW-Seq используется как неограничивающий пример интегрированного способа.
В настоящем изобретении термин FLOW-seq обычно относится к комбинации способов сортировки с помощью проточной цитометрии (например, FACS) с методами секвенирования (например, секвенирования следующего поколения) в одном связанном рабочем процессе. Любой удобный и подходящий способ сортировки с помощью проточной цитометрии и любой удобный и подходящий способ секвенирования можно применять в указанном методе FLOW-Seq. Например, в некоторых случаях, клеточная библиотека, экспрессирующая синтетические модульные полипептиды, содержащие нуклеиновые последовательности-штрихкоды, описанная в настоящем документе, может быть количественно исследована для определения фенотипа методом проточной цитометрии, и те клетки, которые имеют конкретный фенотип, могут быть отсортированы, и их нуклеиновые последовательности-штрихкоды впоследствии секвенированы для идентификации конкретных элементов библиотеки и/или для количественного определения частоты отдельных элементов библиотеки и/или их модулей, экспрессируемых в отсортированных клетках. Сортировка может быть выполнена любым удобным и подходящим способом, включая, например, сортировку в одну или более групп на основании фенотипа, детектированного с помощью проточной цитометрии. После сортировки секвенирование может быть выполнено непосредственно на отсортированном образце и/или отсортированной клетке, или отсортированный образец и/или отсортированная клетка может быть размножена и/или культивирована перед сортировкой, например, для увеличения количества копий нуклеиновых кислот, кодирующих элементы библиотеки. Способы FLOW-seq были использованы, например, для фенотипического измерения уровней белка и идентификации родственных генетических элементов в бактериях (см., например, Kosuri et al. Proc Natl Acad Sci USA (2013) 110(34): 14024-9 и Goodman et al. Science (2013) 342(6157):475-479), помимо этого секвенирование комбинировали с проточной цитометрией для корреляции Т-клеток, отсортированных на основании их функции, с соответствующими им секвенированными генами рецепторов Т-клеток (см., например, Han et al. Nature Biotechnology (2014) 32:684-692).
В некоторых случаях идентификация синтетического модульного полипептида, связанного с конкретным фенотипом, может включать хирургическое выделение ткани или органа из модели in vivo, в которую была введена библиотека. Например, в некоторых случаях, после периода времени, достаточного для проведения количественного исследования, орган или ткань могут быть выделены из животногохозяина, и нуклеиновые кислоты, присутствующие в органе или ткани, могут быть секвенированы для идентификации отдельных элементов библиотеки, присутствующих в органе или ткани. В других случаях нуклеиновая кислота, выделенная из органа или ткани или животного-хозяина, может быть количественно определена, включая полуколичественную оценку, секвенирована для количественного определения относительной частоты или присутствия конкретного элемента библиотеки в органе или ткани. В других случаях нуклеиновая кислота, выделенная из органа или ткани или животного-хозяина, может быть количественно определена, включая полуколичественную оценку, секвенирована для количественного определения относительной частоты или присутствия конкретного модуля в органе или ткани.
В некоторых случаях, например, когда конкретный модуль высоко представлен после полуколичественной оценки или отдельный модуль идентифицирован как способствующий желательному фенотипу, может быть выполнен следующий раунд сборки новой библиотеки, в котором идентифицированный
- 60 046546 модуль включен во все вновь созданные элементы библиотеки (т.е. идентифицированный вариабельный модуль используется впоследствии как невариабельный модуль), и вновь созданную библиотеку подвергают скринингу для идентификации дополнительных модулей, которые влияют на фенотип совместно с первоначально идентифицированным модулем. Специалист в данной области техники легко поймет, в каких случаях итеративная сборка и скрининг библиотеки могут быть выполнены для развития библиотек и отдельных элементов библиотеки с желательными фенотипами.
Примеры
Следующие примеры приведены, чтобы предоставить специалистам в данной области техники полное описание настоящего изобретения, а также описание способов получения и применения настоящего изобретения, и не предназначены для ограничения объема настоящего изобретения согласно мнению авторов настоящего изобретения, также авторы настоящего изобретения не подразумевают, что эксперименты, приведенные ниже, представляют собой все или единственные эксперименты, которые были выполнены. Были предприняты усилия для обеспечения точности в отношении используемых чисел (например, количеств, температуры и т.д.), однако следует учитывать некоторые экспериментальные ошибки и отклонения. Если не указано иное, части представляют собой части по массе, молекулярная масса представляет среднюю молекулярную массу, температура представлена в градусах Цельсия и давление соответствует или приблизительно равно атмосферному давлению. Могут быть использованы стандартные аббревиатуры, например, п.о., пара (пары) оснований; тыс.п.о., тысяча (тысячи) пар оснований; пл, пиколитр (пиколитры); с или сек., секунда (секунды); мин, минута (минуты); ч или час, часы; а.к., аминокислота (аминокислоты); тыс.п.о., тысяча (тысячи) пар оснований; п.о., пара (пары) оснований; нук., нуклеотид (нуклеотиды); в/м, внутримышечный (внутримышечно); в/б, внутрибрюшинный (внутрибрюшинно); п/к, подкожный (подкожно); и т.п.
Пример 1. Конструирование и скрининг модульных библиотек комодулирующих доменов.
Для получения фрагментов нуклеиновых кислот, кодирующих модули, содержащих нуклеиновые последовательности-штрихкоды, которые содержат необходимые элементы для конструирования библиотеки, нуклеиновые кислоты, кодирующие полипептидные модули (т.е. комодулирующие домены (т.е. костимулирующие или коингибирующие домены)), субклонировали в вектор для клонирования, подходящий для секвенирования и расщепления ферментами рестрикции типа IIS. После субклонирования вектор содержал: последовательность, кодирующую модуль, оптимальные линкерные последовательности Gly/Ser, фланкирующие последовательность, кодирующую модуль, специфичную для модуля нуклеиновую последовательность-штрихкод, подходящие для клонирования 3'-концевые гомологичные плечи, фланкирующие специфичную для модуля последовательность-штрихкод, сайт рестрикции BamHI между кодирующей модуль последовательностью и специфичной для модуля последовательностьюштрихкодом и сайты ферментов рестрикции типа IIS на 5'-конце кодирующей модуль последовательности и на 3'-конце последовательности-штрихкода, специфичной для модуля (фиг. 1). Субклонированные векторные вставки секвенировали для подтверждения идентичности вставленных комодулирующих доменов. Комодулирующие домены, используемые в данной комбинаторной библиотеке, и соответствующие им последовательности белка представлены в табл. 1.
Векторы для клонирования, содержащие кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, расщепляли с использованием фермента рестрикции типа IIS для высвобождения нуклеиновых кислот с оптимальной последовательностью, кодирующих каждый полипептидный модуль (фиг. 2). Представлен пример части вектора для клонирования, содержащей описанные элементы и последовательность, кодирующую костимулирующий домен CD28, до и после расщепления ферментом рестрикции типа IIS (фиг. 3), который представляет общую конфигурацию каждой модульной плазмиды/фрагмента, использованных при конструировании библиотеки.
Вектор экспрессии (т.е. лентивирусный упаковочный вектор pHR (также называемый векторреципиент)) получали путем расщепления 3'-конца промотора вируса некроза селезенки (pSFFV) ферментом рестрикции в сайте BamHI. Конструкции элементов библиотеки собирали поэтапно (фиг. 5). Клонирование In-Fusion® сначала использовали для вставки в вектор экспрессии последовательности, кодирующей одноцепочечный вариабельный фрагмент (scFv) и трансмембранные (ТМ) домены (scFVТМ), общие для всех элементов библиотеки. Реакционную смесь In-Fusion® трансформировали в компетентные клетки Е. coli. Трансформированные клетки высаживали. Колонии отбирали и получали минипрепараты для экстракции ДНК, чтобы выделить сконструированную плазмиду. После успешного конструирования плазмиды для экспрессии, содержащей scFV-TM, каждый последовательный компонент многомодульного полипептида, включая репортер EGFP, вставляли в направлении 3'-конца относительно предыдущего компонента на отдельных стадиях в соответствии с фиг. 5. Каждая стадия включала расщепление с помощью BamHI и сборку In-Fusion® с последующей трансфекцией реакционной смеси InFusion®, отбор колонии и очистку плазмиды.
Как показано на фиг. 5, каждый готовый элемент библиотеки заключительной реакции In-Fusion® содержал общий scFV-TM, соединенный со специфичной для элемента комбинацией двух комодулирующих доменов, соединенных с общим репортером (CD3z-EGFP), и пару специфичных для модуля нук
- 61 046546 леиновых последовательностей-штрихкодов в обратной ориентации относительно комодулирующих доменов. Нуклеиновые последовательности-штрихкоды фланкировали сайтами связывания праймеров, обеспечивающими амплификацию и/или секвенирование конкретной комбинации нуклеиновых последовательностей-штрихкодов, соответствующей комбинации комодулирующих доменов, специфичных для элементов библиотеки.
После завершения конструирования последней плазмиды для библиотеки отдельные элементы библиотеки трансфицировали в клетки HEK-293, и лентивирусные частицы получали стандартными способами. Полученный лентивирус использовали для инфицирования Т-клеток, чтобы получить модифицированные иммунные клетки, экспрессирующие многомодульные полипептиды.
Модифицированные иммунные клетки сортировали методом проточной цитометрии на основании экспрессии репортера EGFP. Сортировку проводили для выделения популяции модифицированных клеток с одинаковыми уровнями экспрессии. Сортированные клетки с одинаковыми уровнями экспрессии многомодульных полипептидов использовали для последующих этапов функционального скрининга.
Данную общую стратегию использовали для создания четырех отдельных библиотек. Конструировали одномерные библиотеки (т.е. каждый элемент библиотеки содержал один комодулирующий домен) и двумерные библиотеки (т.е. каждый элемент библиотеки содержал два комодулирующих домена). Элементы двумерных библиотек собирали в соответствии с общей схемой, представленной на фиг. 6. Четыре библиотеки и соответствующие им этапы скрининга были следующими:
1) конструировали одномерную библиотеку из 20 элементов и использовали для проверки возможности количественного исследования функции Т-клеток с помощью FLOWseq. Каждый элемент библиотеки конфигурировали так, чтобы он содержал домен CD8, гибридизованный с модулем комодулирующего домена, гибридизованным с доменом CD3Z. Модифицированные Т-клетки распределяли на группы в соответствии с экспрессией ими репортера с помощью проточной цитометрии, и библиотеку подвергали скринингу для измерения дозозависимого ответа активации Т-клеток (CD69) на связанные с планшетом антигены;
2) конструировали одномерную CD19-специфичную библиотеку из 62 элементов и подвергали скринингу в мышиной модели опухоли в условиях in vivo. Каждый элемент библиотеки конфигурировали так, чтобы он содержал CD19-специфичный домен, гибридизованный с модулем комодулирующего домена, гибридизованного с доменом CD3Z, который был гибридизован с репортером EGFP;
3) конструировали двумерную библиотеку, состоящую из 62x62 элементов. Каждый элемент библиотеки содержал CD19-специфичный домен, гибридизованный с первым модулем комодулирующего домена, гибридизованным со вторым модулем комодулирующего домена, гибридизованным с доменом CD3Z, гибридизованным с репортером EGFP;
4) конструировали одномерную мезотелин-специфичную библиотеку из 62 элементов. Каждый элемент библиотеки содержал мезотелин-специфичный домен, гибридизованный с доменом комодулирующего модуля, гибридизованным с доменом CD3Z, гибридизованным с репортером EGFP.
Объединенную одномерную CD19-специфичную библиотеку из 62 элементов подвергали функциональному скринингу для идентификации альтернативных комодулирующих последовательностей в химерных антигенных рецепторах (CAR). Каждый элемент библиотеки содержал CD19-специфичный scFv, который указывает на целевой антиген раковых клеток, один из модулей комодулирующих доменов, перечисленных в табл. 1, и первичный сигнальный домен CD3Z (фиг. 7).
После антигенной стимуляции (при концентрации антигена 32 нг/мл, 125 нг/мл и 1000 нг/мл) модифицированных Т-клеток объединенной библиотеки, Т-клетки функционально сортировали методом проточной цитометрии на группы высокой или низкой стимуляции на основании экспрессии CD69 (фиг. 8). Относительное обогащение специфичных последовательностей-штрихкодов, соответствующих индивидуальным комодулирующим доменам, определяли количественно в клетках с высокой и низкой стимуляцией путем секвенирования (при концентрации антигена 1000 нг/мл) (фиг. 9). Данный подход позволил сравнить стимулирующий и ингибирующий эффект каждого комодулирующего домена в CD19-CD3Z-специфичных CAR и в отношении конкретной использованной антигенной стимуляции. Например, результаты скрининга дополнительно анализировали при разных уровнях вносимого антигена, что позволило быстро оценить зависимый от дозы ответ отдельных комодулирующих доменов (фиг. 10).
Пример 2. Подтверждение полной сборки двумерной библиотеки из 61x61 элементов.
Шестьдесят один вариабельный модуль CAR (табл. 2, представленная на фиг. 25) собирали в библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих двумерные (2D) синтетические модульные полипептиды CAR, с помощью вложенной сборки. Библиотеку глубоко секвенировали с помощью метода секвенирования посредством синтеза (SBS) с использованием системы MiSeq (Illumina Inc., Хейворд, Калифорния, США) и определяли количество считываний каждого элемента собранной библиотеки (фиг. 26).
Из всего 3721 возможного элемента библиотеки (т.е. вариантов CAR) все возможные элементы библиотеки детектировали путем секвенирования с максимальной частотой 1216 считываний и минимальной частотой 2 считывания. Среднее количество считываний по всей библиотеке составило 333 с
- 62 046546 медианой 311 считываний и стандартным отклонением 140. 90% элементов библиотеки были представлены считываниями, количество которых находилось в пределах двукратного значения медианы, и 98% элементов библиотеки были представлены считываниями, количество которых находилось в пределах трехкратного значения медианы.
Следовательно, результаты секвенирования подтвердили, что способ вложенной сборки способен обеспечить 2D-библиотеку, содержащую элементы библиотеки, которые представляют все возможные комбинации вариабельных модулей.
Пример 3. Нормирование частей библиотеки.
Был разработан способ повышения распределения клонов в комбинаторной библиотеке с использованием нормирования частей библиотеки.
В любой реакции комбинаторной сборки некоторые части (например, модули) интегрированы в собранные продукты более эффективно, чем другие. Как следствие, собранные продукты (например, варианты белка), которые содержат части, которые интегрируются относительно неэффективно, представлены в недостаточном количестве или отсутствуют в готовой комбинаторной библиотеке. По аналогичным причинам другие собранные продукты (например, те варианты белка, которые содержат части, которые эффективно интегрируются) чрезмерно представлены и, следовательно, определяются с избыточной частотой во всех последующих количественных исследованиях.
Для решения этой проблемы был разработан способ улучшения сборки библиотек. Указанный способ включает проведение начальной сборки с использованием одинаковых объемов каждой части (вставки ДНК). Для этой цели создавали общую реакционную смесь, содержащую 1 мкл каждой части. После завершения комбинаторной сборки смесь продуктов определяли с помощью подходящего способа количественного исследования. Например, в данном примере использовали секвенирование следующего поколения (см. фиг. 27), и рассчитывали долю каждой части в общей библиотеке (обозначенную как e1, e2... в линейном уравнении, представленном на фиг. 28). Линейную алгебру использовали для одновременного вычисления нового оптимизированного объема для каждой части (в общей реакционной смеси), и затем библиотеку повторно синтезировали, чтобы достичь более равномерного распределения вариантов.
Указанный подход подтверждали путем синтеза комбинаторной библиотеки CAR, в которой каждый CAR содержит два из 61 различного костимулирующого домена, соединенных в виде тандема (612 для 3721 варианта белка). Воспользовавшись преимуществом простой, линейной взаимосвязи между эффективностью, концентрацией и представленностью в собранной комбинаторной библиотеке, было продемонстрировано, что указанный способ можно применять для количественного контроля относительной частоты отдельных частей. Как показано на фиг. 29, согласно прогнозам (черные столбики), 10-кратное изменение относительной концентрации набора частей в основной реакционной смеси для сборки приведет к 10-кратному изменению представленности частей в готовой композиции комбинаторной библиотеки. При измерении средней частоты 5 частей в собранной комбинаторной библиотеке (белые столбики) действительно наблюдали предсказанное влияние 10-кратного изменения. Полученная в результате нормированная большая комбинаторная библиотека (как показано на фиг. 26) имела значительно улучшенное распределение вариантов в библиотеке (например, по сравнению с распределением варианта в библиотеке до нормирования (фиг. 27).
Несмотря на то, что настоящее изобретение было описано со ссылкой на конкретные варианты реализации, специалисты в данной области техники поймут, что могут быть осуществлены различные изменения, и эквиваленты могут быть заменены, не отступая от истинной сущности и объема настоящего изобретения. Помимо этого множество модификаций может быть выполнено для адаптации конкретной ситуации, материала, состава вещества, способа, этапа или этапов способа, чтобы достичь цели, сущности и объема настоящего изобретения. Подразумевается, что все указанные модификации включены в прилагаемую формулу изобретения.
Claims (15)
1. Способ ex vivo/in vitro идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий:
a) введение библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательностиштрихкоды, в клетки-хозяева с получением гетерогенной популяции генетически модифицированных клеток-хозяев, причем указанная библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержит множество элементов, каждый из которых содержит нуклеотидную последовательность, кодирующую отличающийся синтетический модульный полипептид, где нуклеотидная последовательность содержит: кодирующую область, содержащую две или более кодирующих последовательности, кодирующих два или более вариабельных модуля, где две или более кодирующих последовательности находятся в одной рамке считывания друг с другом, и область нуклеиновой последовательности-штрихкода, содержащей две или более уникальных последовательности-штрихкода, где каждый вариабельный модуль в кодирующей области коррелирует с определенной уникальной последовательностью-штрихкодом в области нуклеиновой последовательности-штрихкода;
- 63 046546
b) идентификацию генетически модифицированной клетки-хозяина в указанной гетерогенной популяции, которая экспрессирует выбранный фенотип в ответ на стимул;
с) из идентифицированной клетки-хозяина (b), идентификация и/или количественное определение области нуклеиновой последовательности-штрихкода путем секвенирования, тем самым идентифицируя синтетический модульный полипептид и/или его модуль, дающий выбранный фенотип;
где клетки-хозяева представляют собой Т-клетки, а синтетический модульный полипептид представляет собой модульный рецептор.
2. Способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ включает:
приведение первого полинуклеотида, содержащего первую кодирующую модуль последовательность, соединенную с первой нуклеиновой последовательностью-штрихкодом, в контакт со вторым полинуклеотидом, содержащим вторую кодирующую модуль последовательность, соединенную со второй нуклеиновой последовательностью-штрихкодом, в условиях, достаточных для введения первого полинуклеотида во второй полинуклеотид на стыке между второй кодирующей последовательностью и второй нуклеиновой последовательностью-штрихкодом с получением бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный бимодульный полинуклеотид, содержащий нуклеиновые последовательностиштрихкоды, содержит вторую кодирующую модуль последовательность, соединенную с сохранением открытой рамки считывания с первой кодирующей модуль последовательностью, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом, где синтетический модульный полипептид представляет собой модульный рецептор.
3. Способ по п.1 или 2, отличающийся тем, что указанный модульный рецептор представляет собой полипептид химерного антигенного рецептора (CAR).
4. Способ по п.3, отличающийся тем, что указанное множество элементов содержит нуклеотидную последовательность, кодирующую модульный рецептор, содержащий модульный домен, выбранный из группы, включающей: антигенсвязывающий домен, специфичный связывающий домен или белок специфичного партнера по связыванию, костимулирующий домен, коингибирующий домен, внутриклеточный белок, трансмембранный домен и их комбинации.
5. Способ по п.3, отличающийся тем, что CAR содержит один или более комодулирующих домена, стимулирующих Т клетки или ингибирующих Т клетки.
6. Способ по п.5, отличающийся тем, что CAR содержит по меньшей мере один комодулирующий домен, имеющий по меньшей мере 85% идентичности последовательности с аминокислотной последовательностью SEQ ID NO: 19-42.
7. Способ по п.3, отличающийся тем, что CAR содержит антигенсвязывающий домен, выбранный из анти-ВСМА, анти-CD123, анти-CD138, анти-CD171, анти-ОПТУ анти-CD22, анти-CD30, анти-CD33, анти-CD7, анти-CD70, анти-СЕА, анти-EGFRvШ, анти-ЕРСАМ, анти-EphA2, анти-ErbB, анти-FAP, антиGD2, анти-GPC3, анти-HER2, анти-ILlRAP, анти-Карра, анти-LeY, анти-Meso, анти-MG7, анти-MUCl, анти-ИКД2П, анти-PSCA и анти-RORl антигенсвязывающих доменов.
8. Способ по п.3, отличающийся тем, что CAR содержит полипептид внутриклеточного сигнального домена, содержащий один или более иммунорецепторных тирозиновых активирующих мотивов (ITAM).
9. Способ по п.8, отличающийся тем, что внутриклеточный полипептид сигнального домена имеет по меньшей мере 85% идентичность последовательности с аминокислотной последовательностью SEQ ID NO: 107-132.
10. Способ по п.3, где CAR является условно-активным CAR, содержащим домен димеризации в каждой своей цепи, и где образующая димер пара выбрана из белка, связывающего FK506 (FKBP) и FKBP; FKBP и каталитической субъединицы кальцинейрина A; FKBP и циклофилина; FKBP и FKBPрапамицин-ассоциированного белка; гиразы В (GyrB) и GyrB; дигидрофолат редуктазы (DHFR) и DHFR; DmrB и DmrB; Pyl и ABI; Cry2 и CIB1; и GAI и GID1.
11. Способ по п.1, где идентифицированный фенотип является клеточной локализацией или фенотипом, специфичным для состояния пациента.
12. Библиотека нуклеиновых кислот, содержащая нуклеиновые последовательности-штрихкоды, содержащая:
множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид содержит:
i) кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащий первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль,
- 64 046546 ii) много-субъединичную область нуклеиновой последовательности-штрихкода, содержащую первую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая нуклеиновые последовательностиштрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и при этом секвенирование каждой субъединицы в много-субъединичной области нуклеиновой последовательности-штрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид, где синтетический модульный пептид является модульным рецептором.
13. Библиотека по п.12, отличающаяся тем, что указанная первая и вторая кодирующие последовательности соединены непосредственно без каких-либо промежуточных некодирующих нуклеотидов.
14. Библиотека по п.12 или 13, которая объединена in vitro, причем объединенная библиотека содержит по меньшей мере 96 уникальных членов библиотеки.
15. Клеточная библиотека, содержащая множество клеток, каждая из которых содержит уникальный полинуклеотид из библиотеки нуклеиновых кислот, содержащей нуклеиновые последовательностиштрихкоды, по любому из пп.12-14, при этом секвенирование каждой области нуклеиновой последовательности-штрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид каждой клетки из библиотеки.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/212,999 | 2015-09-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
EA046546B1 true EA046546B1 (ru) | 2024-03-26 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230212557A1 (en) | Modular polypeptide libraries and methods of making and using same | |
US20240084253A1 (en) | Method of assessing activity of recombinant antigen receptors | |
US9732392B2 (en) | Modular sensor architecture for cell based biosensors | |
JP7335224B2 (ja) | 全長t細胞受容体オープンリーディングフレームの迅速な組立ておよび多様化のための二成分ベクターライブラリシステム | |
US20160097773A1 (en) | Intercellular labeling of ligand-receptor interactions | |
US20220348657A1 (en) | Bioassay for t-cell co-stimulatory proteins containing fc domains | |
WO2018167481A1 (en) | Method of selecting for antibodies | |
EA046546B1 (ru) | Библиотеки модульных полипептидов и способы их получения и применения | |
EA041085B1 (ru) | Библиотеки модульных полипептидов и способы их получения и применения | |
US20100203509A1 (en) | Inducible fluorescently-tagged protein expression system | |
US20200370085A1 (en) | Method for screening the activity of expressed polypeptides | |
JP2002243739A (ja) | リガンドのレセプター結合活性の測定方法ならびに測定試薬 |