KR20230157387A - Cas 효소를 이용한 다중 편집 - Google Patents
Cas 효소를 이용한 다중 편집 Download PDFInfo
- Publication number
- KR20230157387A KR20230157387A KR1020237034371A KR20237034371A KR20230157387A KR 20230157387 A KR20230157387 A KR 20230157387A KR 1020237034371 A KR1020237034371 A KR 1020237034371A KR 20237034371 A KR20237034371 A KR 20237034371A KR 20230157387 A KR20230157387 A KR 20230157387A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- rna
- target
- endonuclease
- locus
- Prior art date
Links
- 102000004190 Enzymes Human genes 0.000 title abstract description 28
- 108090000790 Enzymes Proteins 0.000 title abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 144
- 210000004027 cell Anatomy 0.000 claims abstract description 120
- 210000001744 T-lymphocyte Anatomy 0.000 claims abstract description 71
- 108010042407 Endonucleases Proteins 0.000 claims description 211
- 108091008874 T cell receptors Proteins 0.000 claims description 129
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 126
- 125000003729 nucleotide group Chemical group 0.000 claims description 101
- 108020004414 DNA Proteins 0.000 claims description 93
- 239000002773 nucleotide Substances 0.000 claims description 92
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 86
- 230000008685 targeting Effects 0.000 claims description 71
- 125000006850 spacer group Chemical group 0.000 claims description 70
- 150000007523 nucleic acids Chemical class 0.000 claims description 68
- 108020005004 Guide RNA Proteins 0.000 claims description 63
- 102000039446 nucleic acids Human genes 0.000 claims description 62
- 108020004707 nucleic acids Proteins 0.000 claims description 62
- 101000634853 Homo sapiens T cell receptor alpha chain constant Proteins 0.000 claims description 60
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 claims description 58
- 108090000623 proteins and genes Proteins 0.000 claims description 58
- 102100033417 Glucocorticoid receptor Human genes 0.000 claims description 57
- 102000004533 Endonucleases Human genes 0.000 claims description 55
- 101000926939 Homo sapiens Glucocorticoid receptor Proteins 0.000 claims description 47
- 102000004169 proteins and genes Human genes 0.000 claims description 41
- 108700019146 Transgenes Proteins 0.000 claims description 40
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 claims description 39
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 claims description 39
- 230000000295 complement effect Effects 0.000 claims description 36
- 239000013598 vector Substances 0.000 claims description 35
- 238000004458 analytical method Methods 0.000 claims description 31
- 238000000684 flow cytometry Methods 0.000 claims description 25
- 230000005782 double-strand break Effects 0.000 claims description 22
- 108700026244 Open Reading Frames Proteins 0.000 claims description 20
- 108091026890 Coding region Proteins 0.000 claims description 19
- 108091033409 CRISPR Proteins 0.000 claims description 18
- 239000003862 glucocorticoid Substances 0.000 claims description 18
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 16
- 239000002243 precursor Substances 0.000 claims description 15
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 claims description 14
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 12
- 239000013603 viral vector Substances 0.000 claims description 12
- 238000009396 hybridization Methods 0.000 claims description 11
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 10
- 108700004991 Cas12a Proteins 0.000 claims description 8
- 101710124882 Glucocorticoid receptor Proteins 0.000 claims description 8
- 108010029485 Protein Isoforms Proteins 0.000 claims description 8
- 102000001708 Protein Isoforms Human genes 0.000 claims description 8
- -1 TRBC Proteins 0.000 claims description 8
- 230000009615 deamination Effects 0.000 claims description 8
- 238000006481 deamination reaction Methods 0.000 claims description 8
- 239000013607 AAV vector Substances 0.000 claims description 7
- 108010088751 Albumins Proteins 0.000 claims description 7
- 102000007339 Nerve Growth Factor Receptors Human genes 0.000 claims description 5
- 108010032605 Nerve Growth Factor Receptors Proteins 0.000 claims description 5
- OFHCOWSQAMBJIW-AVJTYSNKSA-N alfacalcidol Chemical compound C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C\C=C1\C[C@@H](O)C[C@H](O)C1=C OFHCOWSQAMBJIW-AVJTYSNKSA-N 0.000 claims description 5
- 229940104302 cytosine Drugs 0.000 claims description 5
- 238000003780 insertion Methods 0.000 claims description 5
- 230000037431 insertion Effects 0.000 claims description 5
- 229930024421 Adenine Natural products 0.000 claims description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 4
- 108020004705 Codon Proteins 0.000 claims description 4
- 102300064574 Epidermal growth factor receptor isoform 2 Human genes 0.000 claims description 4
- 208000034951 Genetic Translocation Diseases 0.000 claims description 4
- 101600123877 Homo sapiens Epidermal growth factor receptor (isoform 2) Proteins 0.000 claims description 4
- 108020004485 Nonsense Codon Proteins 0.000 claims description 4
- 229960000643 adenine Drugs 0.000 claims description 4
- 231100000221 frame shift mutation induction Toxicity 0.000 claims description 4
- 230000037433 frameshift Effects 0.000 claims description 4
- 241000702421 Dependoparvovirus Species 0.000 claims description 2
- 102000005962 receptors Human genes 0.000 claims description 2
- 108020003175 receptors Proteins 0.000 claims description 2
- 102000009027 Albumins Human genes 0.000 claims 2
- 102000001301 EGF receptor Human genes 0.000 claims 1
- 108060006698 EGF receptor Proteins 0.000 claims 1
- 108010025020 Nerve Growth Factor Proteins 0.000 claims 1
- 102000015336 Nerve Growth Factor Human genes 0.000 claims 1
- 229940053128 nerve growth factor Drugs 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 6
- 102100031780 Endonuclease Human genes 0.000 description 156
- 102000053602 DNA Human genes 0.000 description 90
- 229920002477 rna polymer Polymers 0.000 description 78
- 102000040430 polynucleotide Human genes 0.000 description 41
- 108091033319 polynucleotide Proteins 0.000 description 41
- 239000002157 polynucleotide Substances 0.000 description 41
- 235000018102 proteins Nutrition 0.000 description 40
- 241000282414 Homo sapiens Species 0.000 description 35
- 108091027544 Subgenomic mRNA Proteins 0.000 description 29
- 101710163270 Nuclease Proteins 0.000 description 26
- 108090000765 processed proteins & peptides Proteins 0.000 description 25
- 229920001184 polypeptide Polymers 0.000 description 23
- 102000004196 processed proteins & peptides Human genes 0.000 description 22
- 239000000427 antigen Substances 0.000 description 21
- 108091007433 antigens Proteins 0.000 description 21
- 102000036639 antigens Human genes 0.000 description 21
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 19
- 108020004682 Single-Stranded DNA Proteins 0.000 description 18
- 235000001014 amino acid Nutrition 0.000 description 18
- 229940024606 amino acid Drugs 0.000 description 17
- 150000001413 amino acids Chemical class 0.000 description 17
- 238000002474 experimental method Methods 0.000 description 17
- 238000010362 genome editing Methods 0.000 description 17
- 102000004389 Ribonucleoproteins Human genes 0.000 description 16
- 108010081734 Ribonucleoproteins Proteins 0.000 description 16
- 230000027455 binding Effects 0.000 description 14
- 230000011664 signaling Effects 0.000 description 14
- 238000007481 next generation sequencing Methods 0.000 description 13
- 230000009977 dual effect Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 12
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 11
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 11
- 230000010354 integration Effects 0.000 description 11
- 230000007017 scission Effects 0.000 description 11
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 10
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 10
- 108091034117 Oligonucleotide Proteins 0.000 description 10
- 238000003556 assay Methods 0.000 description 10
- 108010050848 glycylleucine Proteins 0.000 description 10
- 229950010342 uridine triphosphate Drugs 0.000 description 10
- 108010038633 aspartylglutamate Proteins 0.000 description 9
- 108010054155 lysyllysine Proteins 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 238000012163 sequencing technique Methods 0.000 description 9
- 238000010354 CRISPR gene editing Methods 0.000 description 8
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003209 gene knockout Methods 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 108010062796 arginyllysine Proteins 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 210000004986 primary T-cell Anatomy 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 238000010453 CRISPR/Cas method Methods 0.000 description 6
- 230000033616 DNA repair Effects 0.000 description 6
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 239000012636 effector Substances 0.000 description 6
- 108020001507 fusion proteins Proteins 0.000 description 6
- 102000037865 fusion proteins Human genes 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004936 stimulating effect Effects 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 102100027211 Albumin Human genes 0.000 description 5
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 5
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 108010013835 arginine glutamate Proteins 0.000 description 5
- 230000000139 costimulatory effect Effects 0.000 description 5
- 230000001086 cytosolic effect Effects 0.000 description 5
- VYXSBFYARXAAKO-UHFFFAOYSA-N ethyl 2-[3-(ethylamino)-6-ethylimino-2,7-dimethylxanthen-9-yl]benzoate;hydron;chloride Chemical compound [Cl-].C1=2C=C(C)C(NCC)=CC=2OC2=CC(=[NH+]CC)C(C)=CC2=C1C1=CC=CC=C1C(=O)OCC VYXSBFYARXAAKO-UHFFFAOYSA-N 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 235000011178 triphosphate Nutrition 0.000 description 5
- 239000001226 triphosphate Substances 0.000 description 5
- GZEFTKHSACGIBG-UGKPPGOTSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-propyloxolan-2-yl]pyrimidine-2,4-dione Chemical compound C1=CC(=O)NC(=O)N1[C@]1(CCC)O[C@H](CO)[C@@H](O)[C@H]1O GZEFTKHSACGIBG-UGKPPGOTSA-N 0.000 description 4
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 4
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 4
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 4
- 102100021277 Beta-secretase 2 Human genes 0.000 description 4
- 101710150190 Beta-secretase 2 Proteins 0.000 description 4
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 4
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 4
- 108060003951 Immunoglobulin Proteins 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 4
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 102000018358 immunoglobulin Human genes 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 108010000761 leucylarginine Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 229920002521 macromolecule Polymers 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 4
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 4
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 4
- 229940045145 uridine Drugs 0.000 description 4
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 3
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 3
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 3
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 3
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 3
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 3
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 3
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 3
- 241000195940 Bryophyta Species 0.000 description 3
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 3
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 3
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 3
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 3
- 101000662909 Homo sapiens T cell receptor beta constant 1 Proteins 0.000 description 3
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 3
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 3
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 3
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 3
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 3
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 3
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 3
- 102100037272 T cell receptor beta constant 1 Human genes 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 3
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 3
- HDRRAMINWIWTNU-NTSWFWBYSA-N [[(2s,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1CC[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HDRRAMINWIWTNU-NTSWFWBYSA-N 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108010084389 glycyltryptophan Proteins 0.000 description 3
- 229940029575 guanosine Drugs 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 238000010845 search algorithm Methods 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 238000012070 whole genome sequencing analysis Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 2
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 2
- KZEYUNCYYKKCIX-UMMCILCDSA-N 2-amino-8-chloro-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one Chemical compound C1=2NC(N)=NC(=O)C=2N=C(Cl)N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O KZEYUNCYYKKCIX-UMMCILCDSA-N 0.000 description 2
- GNYDOLMQTIJBOP-UMMCILCDSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-8-fluoro-3h-purin-6-one Chemical compound FC1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GNYDOLMQTIJBOP-UMMCILCDSA-N 0.000 description 2
- WCKQPPQRFNHPRJ-UHFFFAOYSA-N 4-[[4-(dimethylamino)phenyl]diazenyl]benzoic acid Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(O)=O)C=C1 WCKQPPQRFNHPRJ-UHFFFAOYSA-N 0.000 description 2
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 2
- ASUCSHXLTWZYBA-UMMCILCDSA-N 8-Bromoguanosine Chemical compound C1=2NC(N)=NC(=O)C=2N=C(Br)N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ASUCSHXLTWZYBA-UMMCILCDSA-N 0.000 description 2
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 description 2
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 2
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 2
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 2
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 2
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 2
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 2
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 2
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 2
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 2
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 2
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 2
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 2
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 2
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 2
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 2
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 2
- QIRJQYQOIKBPBZ-IHRRRGAJSA-N Asn-Tyr-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QIRJQYQOIKBPBZ-IHRRRGAJSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 2
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 2
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 2
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 2
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 2
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 2
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 2
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 2
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- UVAOVENCIONMJP-GUBZILKMSA-N Gln-Cys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O UVAOVENCIONMJP-GUBZILKMSA-N 0.000 description 2
- LTXLIIZACMCQTO-GUBZILKMSA-N Gln-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LTXLIIZACMCQTO-GUBZILKMSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 2
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 2
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 2
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 2
- CJWANNXUTOATSJ-DCAQKATOSA-N Glu-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N CJWANNXUTOATSJ-DCAQKATOSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 2
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 2
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- 108090000079 Glucocorticoid Receptors Proteins 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 2
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 2
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 2
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 2
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 2
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 2
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 2
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 2
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- 241000712431 Influenza A virus Species 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 2
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 2
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- CTVJSFRHUOSCQQ-DCAQKATOSA-N Met-Arg-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTVJSFRHUOSCQQ-DCAQKATOSA-N 0.000 description 2
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 201000004458 Myoma Diseases 0.000 description 2
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 2
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 2
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- ODPIUQVTULPQEP-CIUDSAMLSA-N Pro-Gln-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ODPIUQVTULPQEP-CIUDSAMLSA-N 0.000 description 2
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 2
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 2
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- CXUFDWZBHKUGKK-CABZTGNLSA-N Trp-Ala-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O)=CNC2=C1 CXUFDWZBHKUGKK-CABZTGNLSA-N 0.000 description 2
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 2
- YDTKYBHPRULROG-LTHWPDAASA-N Trp-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YDTKYBHPRULROG-LTHWPDAASA-N 0.000 description 2
- FQNUWOHNGJWNLM-QWRGUYRKSA-N Tyr-Cys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FQNUWOHNGJWNLM-QWRGUYRKSA-N 0.000 description 2
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 2
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 2
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 2
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 125000003342 alkenyl group Chemical group 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 108700032552 influenza virus INS1 Proteins 0.000 description 2
- 230000004068 intracellular signaling Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 229930000044 secondary metabolite Natural products 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 229940037128 systemic glucocorticoids Drugs 0.000 description 2
- 230000009258 tissue cross reactivity Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 108010045269 tryptophyltryptophan Proteins 0.000 description 2
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 2
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 1
- SUQWGICKJIJKNO-IHRRRGAJSA-N (2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]acetyl]amino]pentanedioic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O SUQWGICKJIJKNO-IHRRRGAJSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- LAXVMANLDGWYJP-UHFFFAOYSA-N 2-amino-5-(2-aminoethyl)naphthalene-1-sulfonic acid Chemical compound NC1=CC=C2C(CCN)=CC=CC2=C1S(O)(=O)=O LAXVMANLDGWYJP-UHFFFAOYSA-N 0.000 description 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 1
- SJQRQOKXQKVJGJ-UHFFFAOYSA-N 5-(2-aminoethylamino)naphthalene-1-sulfonic acid Chemical compound C1=CC=C2C(NCCN)=CC=CC2=C1S(O)(=O)=O SJQRQOKXQKVJGJ-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- NJYVEMPWNAYQQN-UHFFFAOYSA-N 5-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C21OC(=O)C1=CC(C(=O)O)=CC=C21 NJYVEMPWNAYQQN-UHFFFAOYSA-N 0.000 description 1
- WQZIDRAQTRIQDX-UHFFFAOYSA-N 6-carboxy-x-rhodamine Chemical compound OC(=O)C1=CC=C(C([O-])=O)C=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 WQZIDRAQTRIQDX-UHFFFAOYSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 1
- SHKGHIFSEAGTNL-DLOVCJGASA-N Ala-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 SHKGHIFSEAGTNL-DLOVCJGASA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- LFFOJBOTZUWINF-ZANVPECISA-N Ala-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O)=CNC2=C1 LFFOJBOTZUWINF-ZANVPECISA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 239000012099 Alexa Fluor family Substances 0.000 description 1
- 102100032187 Androgen receptor Human genes 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- SBVJJNJLFWSJOV-UBHSHLNASA-N Arg-Ala-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SBVJJNJLFWSJOV-UBHSHLNASA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 1
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- BMNVSPMWMICFRV-DCAQKATOSA-N Arg-His-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CN=CN1 BMNVSPMWMICFRV-DCAQKATOSA-N 0.000 description 1
- MMGCRPZQZWTZTA-IHRRRGAJSA-N Arg-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N MMGCRPZQZWTZTA-IHRRRGAJSA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- DIIGDGJKTMLQQW-IHRRRGAJSA-N Arg-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N DIIGDGJKTMLQQW-IHRRRGAJSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- QUBKBPZGMZWOKQ-SZMVWBNQSA-N Arg-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QUBKBPZGMZWOKQ-SZMVWBNQSA-N 0.000 description 1
- JBQORRNSZGTLCV-WDSOQIARSA-N Arg-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 JBQORRNSZGTLCV-WDSOQIARSA-N 0.000 description 1
- BFDDUDQCPJWQRQ-IHRRRGAJSA-N Arg-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O BFDDUDQCPJWQRQ-IHRRRGAJSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- 241000512259 Ascophyllum nodosum Species 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 1
- MECFLTFREHAZLH-ACZMJKKPSA-N Asn-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N MECFLTFREHAZLH-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- GURLOFOJBHRPJN-AAEUAGOBSA-N Asn-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GURLOFOJBHRPJN-AAEUAGOBSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 1
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 1
- YWFLXGZHZXXINF-BPUTZDHNSA-N Asn-Pro-Trp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC2=CC=CC=C12 YWFLXGZHZXXINF-BPUTZDHNSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- KSZHWTRZPOTIGY-AVGNSLFASA-N Asn-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KSZHWTRZPOTIGY-AVGNSLFASA-N 0.000 description 1
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- LXKLDWVHXNZQGB-SRVKXCTJSA-N Asp-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O LXKLDWVHXNZQGB-SRVKXCTJSA-N 0.000 description 1
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 1
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- XSXVLWBWIPKUSN-UHFFFAOYSA-N Asp-Leu-Glu-Asp Chemical compound OC(=O)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(O)=O)C(O)=O XSXVLWBWIPKUSN-UHFFFAOYSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- HSGOFISJLFDMBJ-CIUDSAMLSA-N Asp-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N HSGOFISJLFDMBJ-CIUDSAMLSA-N 0.000 description 1
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 1
- RRUWMFBLFLUZSI-LPEHRKFASA-N Asp-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N RRUWMFBLFLUZSI-LPEHRKFASA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- KCOPOPKJRHVGPE-AQZXSJQPSA-N Asp-Thr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O KCOPOPKJRHVGPE-AQZXSJQPSA-N 0.000 description 1
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 1
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 1
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241001474374 Blennius Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 102100027207 CD27 antigen Human genes 0.000 description 1
- 101100121123 Caenorhabditis elegans gap-1 gene Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 1
- 244000249214 Chlorella pyrenoidosa Species 0.000 description 1
- 235000007091 Chlorella pyrenoidosa Nutrition 0.000 description 1
- 241000195628 Chlorophyta Species 0.000 description 1
- 241000243321 Cnidaria Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- FIADUEYFRSCCIK-CIUDSAMLSA-N Cys-Glu-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIADUEYFRSCCIK-CIUDSAMLSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 241000258955 Echinodermata Species 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- RRYLMJWPWBJFPZ-ACZMJKKPSA-N Gln-Asn-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RRYLMJWPWBJFPZ-ACZMJKKPSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 1
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 1
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 1
- BYKZWDGMJLNFJY-XKBZYTNZSA-N Gln-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)O BYKZWDGMJLNFJY-XKBZYTNZSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- CGYFDYFOAWDTPI-VJBMBRPKSA-N Gln-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CGYFDYFOAWDTPI-VJBMBRPKSA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- RSUVOPBMWMTVDI-XEGUGMAKSA-N Glu-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(O)=O)C)C(O)=O)=CNC2=C1 RSUVOPBMWMTVDI-XEGUGMAKSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- QLPYYTDOUQNJGQ-AVGNSLFASA-N Glu-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N QLPYYTDOUQNJGQ-AVGNSLFASA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 1
- GTFYQOVVVJASOA-ACZMJKKPSA-N Glu-Ser-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N GTFYQOVVVJASOA-ACZMJKKPSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- 108700011498 Glucocorticoid Receptor Deficiency Proteins 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- LJXWZPHEMJSNRC-KBPBESRZSA-N Gly-Gln-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LJXWZPHEMJSNRC-KBPBESRZSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 1
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- GULGDABMYTYMJZ-STQMWFEESA-N Gly-Trp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O GULGDABMYTYMJZ-STQMWFEESA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 108091093094 Glycol nucleic acid Proteins 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 241000888612 Hepacivirus D Species 0.000 description 1
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 1
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 1
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 1
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 1
- SDTPKSOWFXBACN-GUBZILKMSA-N His-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O SDTPKSOWFXBACN-GUBZILKMSA-N 0.000 description 1
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- YVCGJPIKRMGNPA-LSJOCFKGSA-N His-Met-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O YVCGJPIKRMGNPA-LSJOCFKGSA-N 0.000 description 1
- SGLXGEDPYJPGIQ-ACRUOGEOSA-N His-Phe-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N SGLXGEDPYJPGIQ-ACRUOGEOSA-N 0.000 description 1
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 1
- OWYIDJCNRWRSJY-QTKMDUPCSA-N His-Pro-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O OWYIDJCNRWRSJY-QTKMDUPCSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- QLBXWYXMLHAREM-PYJNHQTQSA-N His-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N QLBXWYXMLHAREM-PYJNHQTQSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 1
- 101000711567 Homo sapiens E3 ubiquitin-protein ligase RNF125 Proteins 0.000 description 1
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 description 1
- 101000582254 Homo sapiens Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108700039609 IRW peptide Proteins 0.000 description 1
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 1
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 1
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 241000689670 Lachnospiraceae bacterium ND2006 Species 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- GPXFZVUVPCFTMG-AVGNSLFASA-N Leu-Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C GPXFZVUVPCFTMG-AVGNSLFASA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 1
- LKXANTUNFMVCNF-IHPCNDPISA-N Leu-His-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LKXANTUNFMVCNF-IHPCNDPISA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- UFPLDOKWDNTTRP-ULQDDVLXSA-N Leu-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=C(O)C=C1 UFPLDOKWDNTTRP-ULQDDVLXSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 241000195947 Lycopodium Species 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- OAPNERBWQWUPTI-YUMQZZPRSA-N Lys-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O OAPNERBWQWUPTI-YUMQZZPRSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- HQXSFFSLXFHWOX-IXOXFDKPSA-N Lys-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N)O HQXSFFSLXFHWOX-IXOXFDKPSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- TYEJPFJNAHIKRT-DCAQKATOSA-N Lys-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N TYEJPFJNAHIKRT-DCAQKATOSA-N 0.000 description 1
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 1
- SKUOQDYMJFUMOE-ULQDDVLXSA-N Lys-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N SKUOQDYMJFUMOE-ULQDDVLXSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- RJEFZSIVBHGRQJ-SRVKXCTJSA-N Met-Arg-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RJEFZSIVBHGRQJ-SRVKXCTJSA-N 0.000 description 1
- STTRPDDKDVKIDF-KKUMJFAQSA-N Met-Glu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 STTRPDDKDVKIDF-KKUMJFAQSA-N 0.000 description 1
- OOSPRDCGTLQLBP-NHCYSSNCSA-N Met-Glu-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OOSPRDCGTLQLBP-NHCYSSNCSA-N 0.000 description 1
- ULLIQRYQNMAAHC-RWMBFGLXSA-N Met-His-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N ULLIQRYQNMAAHC-RWMBFGLXSA-N 0.000 description 1
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 1
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- JHVNNUIQXOGAHI-KJEVXHAQSA-N Met-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N)O JHVNNUIQXOGAHI-KJEVXHAQSA-N 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 description 1
- 101150065958 NR3C1 gene Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241001250129 Nannochloropsis gaditana Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 101100259224 Oryctolagus cuniculus SYPL2 gene Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 1
- MQWISMJKHOUEMW-ULQDDVLXSA-N Phe-Arg-His Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 MQWISMJKHOUEMW-ULQDDVLXSA-N 0.000 description 1
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 1
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 1
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- CUMXHKAOHNWRFQ-BZSNNMDCSA-N Phe-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CUMXHKAOHNWRFQ-BZSNNMDCSA-N 0.000 description 1
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 1
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 1
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 1
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 241000985694 Polypodiopsida Species 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- QCARZLHECSFOGG-CIUDSAMLSA-N Pro-Glu-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O QCARZLHECSFOGG-CIUDSAMLSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 1
- FJLODLCIOJUDRG-PYJNHQTQSA-N Pro-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FJLODLCIOJUDRG-PYJNHQTQSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 1
- LEBTWGWVUVJNTA-FKBYEOEOSA-N Pro-Trp-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC4=CC=CC=C4)C(=O)O LEBTWGWVUVJNTA-FKBYEOEOSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000593524 Sargassum patens Species 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 1
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 230000006044 T cell activation Effects 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- VOGXLRKCWFLJBY-HSHDSVGOSA-N Thr-Arg-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VOGXLRKCWFLJBY-HSHDSVGOSA-N 0.000 description 1
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 1
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- ZOCJFNXUVSGBQI-HSHDSVGOSA-N Thr-Trp-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ZOCJFNXUVSGBQI-HSHDSVGOSA-N 0.000 description 1
- XEVHXNLPUBVQEX-DVJZZOLTSA-N Thr-Trp-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N)O XEVHXNLPUBVQEX-DVJZZOLTSA-N 0.000 description 1
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108091046915 Threose nucleic acid Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 241000703392 Tribec virus Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- OETOOJXFNSEYHQ-WFBYXXMGSA-N Trp-Ala-Asp Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O)=CNC2=C1 OETOOJXFNSEYHQ-WFBYXXMGSA-N 0.000 description 1
- NAQBQJOGGYGCOT-QEJZJMRPSA-N Trp-Asn-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NAQBQJOGGYGCOT-QEJZJMRPSA-N 0.000 description 1
- XZSJDSBPEJBEFZ-QRTARXTBSA-N Trp-Asn-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O XZSJDSBPEJBEFZ-QRTARXTBSA-N 0.000 description 1
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 1
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 1
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 1
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 1
- YPBYQWFZAAQMGW-XIRDDKMYSA-N Trp-Lys-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N YPBYQWFZAAQMGW-XIRDDKMYSA-N 0.000 description 1
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 1
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 1
- RNDWCRUOGGQDKN-UBHSHLNASA-N Trp-Ser-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RNDWCRUOGGQDKN-UBHSHLNASA-N 0.000 description 1
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 1
- DDHFMBDACJYSKW-AQZXSJQPSA-N Trp-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DDHFMBDACJYSKW-AQZXSJQPSA-N 0.000 description 1
- VMXLNDRJXVAJFT-JYBASQMISA-N Trp-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O VMXLNDRJXVAJFT-JYBASQMISA-N 0.000 description 1
- YCEHCFIOIYNQTR-NYVOZVTQSA-N Trp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CO)C(=O)O)N YCEHCFIOIYNQTR-NYVOZVTQSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- NSOMQRHZMJMZIE-GVARAGBVSA-N Tyr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NSOMQRHZMJMZIE-GVARAGBVSA-N 0.000 description 1
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 1
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 1
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 1
- WPXKRJVHBXYLDT-JUKXBJQTSA-N Tyr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPXKRJVHBXYLDT-JUKXBJQTSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- LRHBBGDMBLFYGL-FHWLQOOXSA-N Tyr-Phe-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LRHBBGDMBLFYGL-FHWLQOOXSA-N 0.000 description 1
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- CLEGSEJVGBYZBJ-MEYUZBJRSA-N Tyr-Thr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CLEGSEJVGBYZBJ-MEYUZBJRSA-N 0.000 description 1
- LVILBTSHPTWDGE-PMVMPFDFSA-N Tyr-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=C(O)C=C1 LVILBTSHPTWDGE-PMVMPFDFSA-N 0.000 description 1
- DJSYPCWZPNHQQE-FHWLQOOXSA-N Tyr-Tyr-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 DJSYPCWZPNHQQE-FHWLQOOXSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- LABUITCFCAABSV-BPNCWPANSA-N Val-Ala-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-BPNCWPANSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- VDPRBUOZLIFUIM-GUBZILKMSA-N Val-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N VDPRBUOZLIFUIM-GUBZILKMSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 1
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 1
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- JCZSFCLRSONYLH-UHFFFAOYSA-N Wyosine Natural products N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3C1OC(CO)C(O)C1O JCZSFCLRSONYLH-UHFFFAOYSA-N 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- NOXMCJDDSWCSIE-DAGMQNCNSA-N [[(2R,3S,4R,5R)-5-(2-amino-4-oxo-3H-pyrrolo[2,3-d]pyrimidin-7-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O NOXMCJDDSWCSIE-DAGMQNCNSA-N 0.000 description 1
- AZJLCKAEZFNJDI-DJLDLDEBSA-N [[(2r,3s,5r)-5-(4-aminopyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 AZJLCKAEZFNJDI-DJLDLDEBSA-N 0.000 description 1
- AZRNEVJSOSKAOC-VPHBQDTQSA-N [[(2r,3s,5r)-5-[5-[(e)-3-[6-[5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]hexanoylamino]prop-1-enyl]-2,4-dioxopyrimidin-1-yl]-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(\C=C\CNC(=O)CCCCCNC(=O)CCCC[C@H]2[C@H]3NC(=O)N[C@H]3CS2)=C1 AZRNEVJSOSKAOC-VPHBQDTQSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- ZXZIQGYRHQJWSY-NKWVEPMBSA-N [hydroxy-[[(2s,5r)-5-(6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy]phosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)O)CC[C@@H]1N1C(NC=NC2=O)=C2N=C1 ZXZIQGYRHQJWSY-NKWVEPMBSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 108010080146 androgen receptors Proteins 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 239000013584 assay control Substances 0.000 description 1
- 230000005784 autoimmunity Effects 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229960000106 biosimilars Drugs 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 230000004154 complement system Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000008472 epithelial growth Effects 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 208000026352 glucocorticoid resistance Diseases 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 108010059573 lysyl-lysyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 108010091617 pentalysine Proteins 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 102000003998 progesterone receptors Human genes 0.000 description 1
- 108090000468 progesterone receptors Proteins 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010015840 seryl-prolyl-lysyl-lysine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 108700029760 synthetic LTSP Proteins 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- IBVCSSOEYUMRLC-GABYNLOESA-N texas red-5-dutp Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(C#CCNS(=O)(=O)C=2C=C(C(C=3C4=CC=5CCCN6CCCC(C=56)=C4OC4=C5C6=[N+](CCC5)CCCC6=CC4=3)=CC=2)S([O-])(=O)=O)=C1 IBVCSSOEYUMRLC-GABYNLOESA-N 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- FVRDYQYEVDDKCR-DBRKOABJSA-N tiazofurine Chemical compound NC(=O)C1=CSC([C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)=N1 FVRDYQYEVDDKCR-DBRKOABJSA-N 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- NMEHNETUFHBYEG-IHKSMFQHSA-N tttn Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 NMEHNETUFHBYEG-IHKSMFQHSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
- JCZSFCLRSONYLH-QYVSTXNMSA-N wyosin Chemical compound N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JCZSFCLRSONYLH-QYVSTXNMSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70503—Immunoglobulin superfamily
- C07K14/7051—T-cell receptor (TcR)-CD3 complex
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/72—Receptors; Cell surface antigens; Cell surface determinants for hormones
- C07K14/721—Steroid/thyroid hormone superfamily, e.g. GR, EcR, androgen receptor, oestrogen receptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1138—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/03—Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Endocrinology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Graft Or Block Polymers (AREA)
Abstract
Cas 효소를 사용하는 다중 편집 또는 Cas 효소를 사용하는 T 세포 또는 관련 세포의 편집을 위한 방법, 조성물 및 시스템이 본원에 기술된다.
Description
상호 참조
본 출원은 2021년 3월 19일에 "MULTIPLEX EDITING WITH CAS ENZYMES"이란 발명의 명칭으로 출원된 미국 특허 가출원 제63/163,510호; 2021년 5월 10일에 "MULTIPLEX EDITING WITH CAS ENZYMES"이란 발명의 명칭으로 출원된 미국 특허 가출원 제63/186,506호; 및 2021년 9월 8일에 "MULTIPLEX EDITING WITH CAS ENZYMES"라는 발명의 명칭으로 출원된 미국 특허 가출원 제63/241,916호의 이익을 주장하며, 이들 각각은 그 전체가 참조로서 본원에 통합된다.
서열 목록
본 출원은 ASCII 포맷으로 전자적으로 제출된 서열 목록을 포함하며, 동 서열 목록은 그 전체가 참조로서 본원에 통합된다. 2022년 3월 17일에 생성된 상기 ASCII 사본의 명칭은 55921-719-601-SL.txt이며, 크기는 70,612바이트이다.
Cas 효소는 이와 연관된 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복서열(CRISPR) 가이드 리보 핵산(RNA)과 함께 원핵 면역 체계의 만연한(약 45%의 박테리아, 약 84%의 고세균) 구성요소인 것으로 보이는데, 이들은 CRISPR-RNA 가이드된 핵산 절단에 의해 비자기 핵산, 예컨대 감염성 바이러스 및 플라스미드에 대해 이러한 미생물을 보호하는 역할을 한다. CRISPR RNA 요소를 암호화하는 데옥시리보핵산(DNA) 요소는 구조 및 길이가 비교적 보존될 수 있지만, 이들의 CRISPR-연관(Cas) 단백질은 매우 다양하며, 매우 다양한 핵산-상호 작용 도메인을 함유한다. CRISPR DNA 요소는 1987년 초에 관찰되었지만, CRISPR/Cas 복합체의 프로그램 가능한 엔도뉴클레아제 절단 능력은 비교적 최근에 인식되었고, 이는 다양한 DNA 조작 및 유전자 편집 응용에서 재조합 CRISPR/Cas 시스템의 사용으로 이어지고 있다.
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 클래스 2, II형 Cas 엔도뉴클레아제 복합체로서, (i) 클래스 2, II형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 제1 조작된 가이드 RNA를 포함하는, 클래스 2, II형 Cas 엔도뉴클레아제 복합체; (b) 클래스 2, V형 Cas 엔도뉴클레아제 복합체로서, (i) 클래스 2, V형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, V형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 제2 조작된 가이드 RNA를 포함하는, 클래스 2, V형 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함한다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas12a 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 클래스 2, V형 Cas 엔도뉴클레아제는, 서열번호 7, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 방법은 전술한 제1 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하고/하거나 전술한 제2 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 200 pmol 이하, 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 도입된다. 일부 구현예에서, 전술한 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만의 빈도로 파괴된다. 일부 구현예에서, 전술한 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만의 빈도로 파괴된다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 T 세포 수용체(TCR) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 10 내지 15 중 어느 하나, 이의 보체 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 알부민(ALB) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 17 내지 19 중 어느 하나, 이의 보체 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 핵 수용체 서브패밀리 3 그룹 C 구성원 1(Nuclear Receptor Subfamily 3 Group C Member 1, NR3C1) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 이의 보체 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 일부 구현예에서, 방법은, 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 하나 이상의 표적 유전자좌의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 전술한 하나 이상의 표적 유전자좌의 제1 세트의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 편집은 인델, 조기 종결 코돈, 미스센스 코돈, 프레임시프트 돌연변이, 아데닌 탈아민화, 시토신 탈아민화, 또는 이들의 임의의 조합의 삽입을 포함한다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 조작된 T 세포를 제조하는 방법을 제공하며, 방법은, T 세포 또는 이의 전구체에: (a) T 세포 수용체(TCR) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서: (i) 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제1 RNA 가이드 엔도뉴클레아제를 암호화하는 DNA; 및 (ii) 전술한 제1 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 TCR 유전자좌의 적어도 일부에 혼성화하도록 구성된 제1 스페이서 서열을 포함하는 제1 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체, 및 (b) T 세포 수용체 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서: (i) 제2 RNA 가이드 엔도뉴클레아제; 및 (ii) 전술한 제2 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 NR3C1 유전자좌의 적어도 일부에 혼성화하도록 구성된 제2 스페이서 서열을 포함하는 제2 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체를 도입하는 단계를 포함한다. 일부 구현예에서, 전술한 TCR 유전자좌의 전술한 적어도 일부는 전술한 T-세포 유전자좌 내에 있다. 일부 구현예에서, 방법은, (b) 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 전술한 TCR 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제2 RNA 가이드 엔도뉴클레아제는 클래스 2, II형 또는 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 이종 조작된 T-세포 수용체는 CAR 분자이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 T 세포 수용체 알파 불변(TRAC) 유전자좌 또는 T 세포 수용체 베타 불변(TRBC) 유전자좌이다. 일부 구현예에서, 전술한 상동 아암은 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부에 인접한 전술한 TCR 유전자좌 내에 인트론 또는 엑손 영역을 포함한다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRAC의 제1 또는 제3 엑손이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 전술한 TCR 유전자좌 및 전술한 NR3C1 유전자좌의 게놈 서열을 파괴한다. 일부 구현예에서, 전술한 효율은 전술한 TCR 및 NR3C1 유전자좌로부터 발현된 단백질에 대한 유세포 계측법에 의해 결정된다. 일부 구현예에서, 전술한 NR3C1 유전자좌의 전술한 적어도 일부는 엑손 2 또는 엑손 3이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 CAR 분자에 대해 양성이고 NR3C1에 대해 음성인 세포를 생산한다. 일부 구현예에서, 전술한 방법은 (a) 내지 (c)를 전술한 T 세포 또는 이의 전구체에 동시에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는, 서열번호 1, 4, 또는 7 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는, 서열번호 3, 6, 또는 9 중 어느 하나, 이의 보체, 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 존재한다. 일부 구현예에서, 전술한 T-세포 또는 전술한 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함한다. 일부 구현예에서, 전술한 제2 스페이서 서열은, 서열번호 16, 20, 21, 또는 22 중 어느 하나, 이의 보체, 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 스페이서 서열은 적어도 약 19 내지 24개 뉴클레오티드, 적어도 약 19개 뉴클레오티드, 적어도 약 20개 뉴클레오티드, 적어도 약 22개 뉴클레오티드, 또는 적어도 약 24개 뉴클레오티드를 포함한다. 일부 구현예에서, 전술한 공여자 DNA 서열은 바이러스 벡터로 전달된다. 일부 구현예에서, 전술한 바이러스 벡터는 AAV 또는 AAV-6 벡터이다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 T 세포 또는 이의 전구체의 집단을 제공하며, 집단은: (a) TCR 유전자좌 내에 서열번호 10 내지 15 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열을 포함한다. 일부 구현예에서, T 세포 또는 이의 전구체는 (b) 인델을 포함하는 NR3C1 유전자좌를 추가로 포함한다. 일부 구현예에서, 전술한 이종 서열은 인델이다. 일부 구현예에서, 전술한 이종 서열은 이종 T-세포 수용체 또는 CAR 분자를 암호화하는 뉴클레오티드 서열을 포함하는 개방 해독 프레임을 포함한다. 일부 구현예에서, 전술한 NR3C1 유전자좌는 서열번호 16, 20, 21 또는 22 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 인델을 포함한다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 전술한 세포의 0.2% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 전술한 세포의 0.01% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 전술한 세포 집단에는 염색체 전위가 실질적으로 없다.
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 제1 Cas 엔도뉴클레아제 복합체로서, (i) 제1 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 제1 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는, 제1 Cas 엔도뉴클레아제 복합체; (b) 제2 Cas 엔도뉴클레아제 복합체로서, (i) 제2 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 제2 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는, 제2 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 세포에 (c) 제1 이식유전자를 암호화하는 개방 해독 프레임, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 전술한 제1 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제1 공여자 DNA 서열; (d) 제2 이식유전자를 암호화하는 개방 해독 프레임, 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 전술한 제2 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제2 공여자 DNA 서열을 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제1 이식유전자 및 전술한 제2 이식유전자는 상이하다. 일부 구현예에서, 전술한 제1 표적 서열 또는 전술한 제2 표적 서열은 T-세포 수용체 유전자좌, TRAC, TRBC, NR3C1, 또는 AAVS1 유전자좌, 또는 이들의 임의의 조합 내의 표적 서열이다. 일부 구현예에서, 전술한 제1 또는 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 서열, 상피 성장 인자 수용체(tEGFR)의 절단된 버전, GFP 코딩 서열, 또는 이들의 임의의 조합이다. 일부 구현예에서, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 5' 상동 아암 또는 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 5' 상동 아암은 서열번호 42 또는 23을 포함하거나, 이에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 3' 상동 아암 또는 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 3' 상동 아암은 서열번호 43 또는 24를 포함하거나, 이에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는, 서열번호 3, 6, 또는 9 중 어느 하나, 이의 보체, 또는 이의 역방향 보체에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 표적 서열에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 제2 표적 서열에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 22, 또는 41 중 어느 하나, 또는 이의 보체, 이의 보체 또는 이의 역방향 보체 중 어느 하나에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 엔도뉴클레아제는 클래스 2, II형 Cas 엔도뉴클레아제 또는 클래스 2, V형 Cas 엔도뉴클레아제, 또는 이들의 임의의 조합을 포함한다.
일부 양태에서, 본 개시는 서열번호 63 내지 65 중 어느 하나의 서열을 포함하거나, 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함하는 단리된 핵산을 제공한다.
일부 양태에서, 본 개시는 본원에 기술된 서열 중 어느 하나, 이의 보체, 또는 이의 역방향 보체를 포함하는 단리된 핵산을 제공한다. 일부 구현예에서, 단리된 핵산은 가이드 RNA이다.
일부 양태에서, 본 개시는 본원에 기술된 핵산 서열 중 어느 하나를 포함하는 세포를 제공한다. 일부 구현예에서, 전술한 세포는 T-세포 또는 이의 전구체이다. 일부 구현예에서, 전술한 T-세포 또는 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함한다.
일부 구현예에서, 본 개시는 본원에 기술된 핵산 중 어느 하나를 포함하는 벡터를 제공한다. 일부 구현예에서, 전술한 벡터는 아데노-연관 바이러스(AAV)벡터이다. 일부 구현예에서, 전술한 AAV 벡터는 AAV-6 혈청형 벡터이다.
일부 양태에서, 본 개시는 서열번호 23, 24, 42, 또는 43 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함하는 벡터를 제공한다. 일부 구현예에서, 벡터는 서열번호 23, 24, 42, 또는 43 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 전술한 서열의 측면에 위치하는 이식유전자를 추가로 포함한다. 일부 구현예에서, 전술한 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 서열, 상피 성장 인자 수용체(tEGFR)의 절단된 버전, GFP 코딩 서열, 또는 이들의 임의의 조합을 포함한다. 일부 구현예에서, 벡터는 서열번호 63의 tEGFR 코딩 서열 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함한다. 일부 구현예에서, 벡터는 서열번호 64의 tLNGFR 코딩 서열 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 포함한다. 일부 구현예에서, 벡터는 서열번호 63의 MND 포로모터 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함한다. 일부 구현예에서, 벡터는 서열번호 64의 MSCV 포로모터 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함한다.
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 클래스 2, II형 Cas 엔도뉴클레아제 복합체 또는 폴리뉴클레오티드로서: (i) 클래스 2, II형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는 클래스 2, II형 Cas 엔도뉴클레아제 복합체 또는 이를 암호화하는 폴리뉴클레오티드를 접촉시키거나 도입하는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 세포에: (b) 클래스 2, V형 Cas 엔도뉴클레아제 복합체로서: (i) 클래스 2, V형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, V형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는 클래스 2, V형 Cas 엔도뉴클레아제 복합체를 접촉시키거나 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제는 아니다. 일부 구현예에서, 클래스 2, II형 Cas 엔도뉴클레아제는 Cas12a 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 클래스 2, V형 Cas 엔도뉴클레아제는, 서열번호 7, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 방법은 전술한 제1 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하고/하거나 전술한 제2 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 200 pmol 이하, 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 도입된다. 일부 구현예에서, 전술한 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만의 빈도로 파괴된다. 일부 구현예에서, 전술한 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단에 의해 결정 시, 0.01% 미만의 빈도로 파괴된다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석은, HTGTS 검정(고처리량, 게놈-와이트 전좌 시퀀싱; 예를 들어, Chiarle 등의 문헌[Cell. 2011 Sep 30;147(1):107-19. doi: 10.1016/j.cell.2011.07.049] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), LAM-HTGTS 검정(선형 증폭 매개 고처리량 게놈-와이드 시퀀싱; 예를 들어, Hu 등의 문헌[Nat Protoc. 2016. 11(5):853-71. doi:10.1038/nprot.2016.043] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), 또는 Digenome-Seq 검정(시험관 내 Cas-소화 전체 게놈 시퀀싱; 예를 들어, Kim 등의 문헌[Nat Methods. 2015. 12(3):237-43. doi:10.1038/nmeth.3284] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨))을 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 T 세포 수용체(TCR) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 10 내지 15 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다. 일부 구현예에서, 방법은, 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 하나 이상의 표적 유전자좌의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 전술한 하나 이상의 표적 유전자좌의 제1 세트의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 편집은 인델, 조기 종결 코돈, 미스센스 코돈, 프레임시프트 돌연변이, 아데닌 탈아민화, 시토신 탈아민화, 또는 이들의 임의의 조합의 삽입을 포함한다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 조작된 T 세포를 제조하는 방법을 제공하며, 방법은, T 세포 또는 이의 전구체에: (a) T 세포 수용체(TCR) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체, 또는 폴리뉴클레오티드로서: (i) 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제1 RNA 가이드 엔도뉴클레아제를 암호화하는 DNA; 및 (ii) 전술한 제1 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 TCR 유전자좌의 적어도 일부에 혼성화하도록 구성된 제1 스페이서 서열을 포함하는 제1 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체, 또는 이를 암호화하는 폴리뉴클레오티드 및 (b) T 세포 수용체 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체 또는 폴리뉴클레오티드로서로서: (i) 제2 RNA 가이드 엔도뉴클레아제; 및 (ii) 전술한 제2 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 NR3C1 유전자좌의 적어도 일부에 혼성화하도록 구성된 제2 스페이서 서열을 포함하는 제2 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체, 또는 이를 암호화하는 폴리뉴클레오티드를 도입하는 단계를 포함한다. 일부 구현예에서, 전술한 TCR 유전자좌의 전술한 적어도 일부는 전술한 T-세포 유전자좌 내에 있다. 일부 구현예에서, 방법은, (b) 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 전술한 TCR 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제2 RNA 가이드 엔도뉴클레아제는 클래스 2, II형 또는 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 이종 조작된 T-세포 수용체는 CAR 분자이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 T 세포 수용체 알파 불변(TRAC) 유전자좌 또는 T 세포 수용체 베타 불변(TRBC) 유전자좌이다. 일부 구현예에서, 전술한 상동 아암은 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부에 인접한 전술한 TCR 유전자좌 내에 인트론 또는 엑손 영역을 포함한다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRAC의 제1 또는 제3 엑손이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 전술한 TCR 유전자좌 및 전술한 NR3C1 유전자좌의 게놈 서열을 파괴한다. 일부 구현예에서, 전술한 효율은 전술한 TCR 및 NR3C1 유전자좌로부터 발현된 단백질에 대한 유세포 계측법에 의해 결정된다. 일부 구현예에서, 전술한 NR3C1 유전자좌의 전술한 적어도 일부는 엑손 2 또는 엑손 3이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 CAR 분자에 대해 양성이고 NR3C1에 대해 음성인 세포를 생산한다. 일부 구현예에서, 전술한 방법은 (a) 내지 (c)를 전술한 T 세포 또는 이의 전구체에 동시에 도입하는 단계를 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는, 서열번호 1, 4, 또는 7 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 존재한다. 일부 구현예에서, 전술한 T-세포 또는 전술한 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함한다. 일부 구현예에서, 전술한 제2 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 스페이서 서열은 적어도 약 19 내지 24개 뉴클레오티드, 적어도 약 19개 뉴클레오티드, 적어도 약 20개 뉴클레오티드, 적어도 약 22개 뉴클레오티드, 또는 적어도 약 24개 뉴클레오티드를 포함한다. 일부 구현예에서, 전술한 공여자 DNA 서열은 바이러스 벡터로 전달된다. 일부 구현예에서, 전술한 바이러스 벡터는 AAV 또는 AAV-6 벡터이다.
일부 양태에서, 본 개시는 T 세포의 집단을 제공하며, 집단은: (a) TCR 유전자좌 내에 서열번호 10 내지 15 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열 또는 서열번호 42의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열을 포함한다. 일부 구현예에서, T-세포의 집단은 (b) 인델을 포함하는 NR3C1 유전자좌를 추가로 포함한다. 일부 구현예에서, 전술한 NR3C1 유전자좌 내의 전술한 인델은 전술한 T-세포에 대해 글루코코르티코이드-내성을 부여한다. 전술한 이종 서열의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열은 인델이다. 일부 구현예에서, 전술한 이종 서열은 이종 T-세포 수용체 또는 CAR 분자를 암호화하는 뉴클레오티드 서열을 포함하는 개방 해독 프레임을 포함한다. 일부 구현예에서, 전술한 NR3C1 유전자좌는 서열번호 16, 20, 21 또는 22 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 인델을 포함한다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 전술한 세포 집단에는 염색체 전위가 실질적으로 없다.
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 제1 Cas 엔도뉴클레아제 복합체 또는 폴리뉴클레오티드로서, (i) 제1 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 제1 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는, 제1 Cas 엔도뉴클레아제 복합체, 또는 이를 암호화하는 폴리뉴클레오티드; (b) 제2 Cas 엔도뉴클레아제 복합체로서, (i) 제2 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 제2 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는, 제2 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 세포에 (c) 제1 이식유전자를 암호화하는 개방 해독 프레임, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 전술한 제1 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제1 공여자 DNA 서열; (d) 제2 이식유전자를 암호화하는 개방 해독 프레임, 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 전술한 제2 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제2 공여자 DNA 서열을 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 제2 이식유전자는 상이하다. 일부 구현예에서, 전술한 제1 표적 서열 또는 전술한 제2 표적 서열은 T-세포 수용체 유전자좌, TRAC, TRBC, NR3C1, 또는 AAVS1 유전자좌, 또는 이들의 임의의 조합 내의 표적 서열이다. 일부 구현예에서, 전술한 제1 또는 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 또는 이들의 임의의 조합이다. 일부 구현예에서, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 5' 상동 아암 또는 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 5' 상동 아암은 서열번호 42 또는 23을 포함한다. 일부 구현예에서, 전술한 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 3' 상동 아암 또는 전술한 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 전술한 3' 상동 아암은 서열번호 43 또는 24를 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 표적 서열에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 제2 표적 서열에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 22, 또는 41 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 엔도뉴클레아제는 클래스 2, II형 Cas 엔도뉴클레아제 또는 클래스 2, V형 Cas 엔도뉴클레아제, 또는 이들의 임의의 조합을 포함한다.
본 개시의 추가 양태 및 이점은, 본 개시의 예시적인 구현예만이 도시되고 설명되는, 다음의 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 인지하게 되겠지만, 본 개시는 다른 구현예 및 상이한 구현예가 가능하고, 본 개시의 몇몇 세부 사항은 다양한 명백한 측면에서 본 개시를 벗어나지 않고도 변형될 수 있다. 따라서, 도면 및 본 발명을 실시하기 위한 구체적인 내용은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되지 않아야 한다.
참조에 의한 통합
본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 마치 각각의 개별 간행물, 특허, 또는 특허 출원이 참조에 의해 구체적으로 및 개별적으로 통합된 것으로 표시된 것과 동일한 정도로 참조에 의해 본원에 통합된다.
본 발명의 신규한 특징은 특히 첨부된 청구범위에 명시되어 있다. 본 발명의 특징 및 장점은 본 발명의 원리가 활용되는 예시적인 구현예가 제시되는 하기 발명을 실시하기 위한 구체적인 내용 및 첨부 도면을 참조함으로써 보다 잘 이해될 것이다.
도 1은 CAR-T 공여자 서열을 전달하는 AAV 벡터와 조합하여 본원에 기술된 Cas 엔도뉴클레아제를 사용하여 동종 CAR-T 세포를 생산하기 위한 개념도를 도시한다.
도 2는 Cas9 대조군과 함께 TRAC를 표적화하는 가이드 RNA를 함유하는 MG3-6, MG3-8, 및 MG29-1 RNP에 의한 TRAC에서의 인델 형성을 시험하는 실시예 1에서의 실험 결과를 도시한다. 좌측 패널은 차세대 시퀀싱(NGS)에 의해 측정된 인델의 형성%를 나타내고, 우측 패널은 유세포 계측법에 의해 평가된 세포 표현형(TCR+ 또는 TCR-)을 나타낸다.
도 3은 CAR-T 서열을 함유하는 AAV 공여자 벡터와 조합하여 TRAC를 표적화하는 본원에 기술된 RNP 뉴클레아제 복합체를 사용하여 표적화된 CAR-T 통합을 시험하는 실시예 1에서의 실험의 결과를 도시한다. CAR 항원 결합 도메인의 발현(y-축)과 함께 TCR 발현 상태(TCR- 또는 TCR+, x-축)를 나타내는 유세포 계측 플롯이 도시되어 있다. MG3-6, MG3-8, 및 MG29-1 모두에 대해 유사한 결과를 얻었다.
도 4는 실시예 2에 기술된 바와 같은 MG3-6 및 MG29-1 RNP 복합체의 조합을 사용한 2개의 유전자좌(하나는 TRAC임)의 다중 편집을 도시한다.
도 5는 실시예 2에 기술된 바와 같은 MG3-6 및 MG29-1 RNP 복합체의 조합을 사용한 3개의 유전자좌(하나는 TRAC임)의 다중 편집을 도시한다.
도 6은 AAVS1 유전자좌(A) 내로의 GR 이식유전자의 통합을 시험하기 위한 실시예 3에서와 같은 PCR 실험의 설계를 도시하고, 여기에서 아가로스 겔 사진(B 및 C)은 AAVS1 및 TRAC 유전자좌가 실시예 3에서와 같이 각각의 부위를 표적화하는 별도의 공여자 DNA에 대한 노출과 함께 상이한 Cas 효소를 사용하여 동시에 표적화된 실험의 결과를 도시한다. (B)는 T-세포가 GR 이식유전자 보유 AAV 작제물(레인 2 내지 5), GR 이식유전자 AAV 작제물/SpCas9 표적화 AAVS1/MG3-6-표적화 TRAC/CAR 이식유전자 AAV(레인 6 내지 9) 작제물, 또는 25K 다중성 감염(MOI)에서 AAVS1을 단독으로 표적화하는 GR AAV 작제물/SpCas9(레인 10 내지 13)에 노출된 조건 중 하나로부터의 GR 이식유전자의 증폭을 도시한다. (C)는 T-세포가 분석 대조군(모의 형질감염 또는 이식유전자가 없는 Cas 복합체; 레인 2 내지 4), AAVS1을 단독으로 표적화하는 50K MOI/SpCas9에서의 GR AAV 작제물(레인 5 내지 8), 또는 50K 다중성 감염(MOI)에서 AAVS1을 단독으로 표적화하는 100K MOI/SpCas9에서의 GR AAV 작제물(레인 9 내지 12)에 노출된 조건 중 하나로부터의 GR 이식유전자의 증폭을 도시한다. 결과는 추가적인 TRAC 유전자좌가 표적화되었는지의 여부와 상관없이 유사한 효율로 AAVS1 유전자좌 내에 통합된 GR 이식유전자를 나타낸다.
도 7은 실시예 3에서와 같이 각각의 부위를 표적화화는 별도의 공여자 DNA에 대한 노출과 함께 상이한 Cas 효소를 사용하여 AAVS1 및 TRAC 유전자좌가 동시에 표적화되는, 실시예 3에서의 실험의 결과를 도시하는 유세포 계측 플롯을 도시한다. 각각의 GR 이식 유전자를 보유하는 AAV가 AAVS1-표적화 SpCas9 복합체, TRAC-표적화 MG3-6 복합체, 및 CAR-보유 AAV와 함께 T-세포에 도입된 개별 플롯(A 내지 D)이 도시되어 있다. 결과는 TCR 녹아웃 및 CAR 통합이 모든 GR 이식유전자에서 유사하게 효율적이며, AAVS1 유전자좌의 동시 표적화에도 불구하고 높다(51.31% 내지 61.1% 효율)는 것을 나타낸다.
도 8은 실시예 4에서와 같이 SpCas9("Cas9")와 함께 MG3-6, MG3-8, 및 MG29-1 엔도뉴클레아제의 오프-타겟 특이성을 평가하기 위해 수행된 게놈-와이드 오프-타겟 이중 가닥 절단 분석 검정의 결과를 도시한다.
도 9는 활성 전장 TCR을 만드는 델타, 감마 및 엡실론 사슬의 어셈블리를 도시한다.
도 10은 인델을 함유하는 표적화된 유전자좌에서의 서열의 백분율로 평가된 바와 같은, 실시예 5에 기술된 바와 같은 일차 T 세포에서의 다중 TRAC/TRBC 편집을 나타낸다. 결과는, 두 부위가 동시에 표적화될 때 두 부위에서의 높은 빈도의 파괴를 나타낸다.
도 11은 실시예 6에 기술된 단일 유전자 녹아웃 실험에 대한 유세포 계측법에 의한 유전자 편집 결과를 도시한다. TCR 및 B2M(TCR- B2M- DKO, TCR- B2M+, TCR+ B2M-, 및 TCR+ B2M+)의 녹아웃을 평가하는 4개의 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 막대 그래프가 도시되어 있다. 그래프는: (a) 가장 효율적인 TCR 녹아웃을 생성하는 MG3-6 TRAC6 및 MG3-6 TRBC E2 sgRNA을 사용하여, 모든 TCR 표적화 조건이 TCR 녹아웃을 효율적으로 생산하였고; (b) 가장 효율적인 B2M 녹아웃을 생성하는 B2M H1 및 B2M D2를 사용하여, 모든 B2M 표적화 조건이 B2M 녹아웃을 생성하였음을 도시한다.
도 12는 실시예 7에 기술된 이중 유전자 녹아웃 실험에 대한 유세포 계측법에 의한 유전자 편집 결과를 도시한 것으로서, 이는 실시예 6에서의 B2M 및 TRAC 조건을 사용하되, 이들을 조합하여 사용한다. TCR 및 B2M(TCR- B2M- DKO, TCR- B2M+, TCR+ B2M-, 및 TCR+ B2M+)의 녹아웃을 평가하는 4개의 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 막대 그래프가 도시되어 있다. 그래프는 가장 효율적인 이중 표적화 조건이 MG29-1 B2M H1, D2, 또는 A3 조건을 갖는 MG3-6 TRAC6 조건을 포함하는, A4, B4, 및 C4라는 것을 도시한다. 가장 효율적인 이중 표적화 조건은, MG3-6 TRAC6 sgRNA 및 MG29-1 B2M D2 sgRNA를 사용한 B4인 것으로 나타났다.
도 13은 실시예 8에 기술된 삼중 유전자 녹아웃 실험에 대한 유세포 계측법에 의한 유전자 편집 결과를 도시한 것으로서, 이는 실시예 6에서의 B2M, TRAC 및 TRBC 조건을 사용하되, 이들을 조합하여 사용한다.
도 14는 실시예 8에 기술된 삼중 유전자 녹아웃 실험에 대한 DNA 수준에서의 유전자 편집 결과를 도시한 것으로서, 이는 실시예 6에서의 B2M, TRAC 및 TRBC 조건을 사용하되, 이들을 조합하여 사용한다.
도 15는 실시예 8에 기술된 삼중 유전자 녹아웃 실험에 대한 차세대 시퀀싱(NGS)에 의해 결정된 유전자 편집 결과의 분석을 도시한다.
도 16은 실시예 9에 기술된 실험에 대한 T 세포 중 단백질 수준에서의 유전자 편집 결과를 도시한다. 실시예 9에 기술된 뉴클레아제, 가이드, 및 AAV의 조합을 사용하여, 형광-활성화 세포 분류(FACS)에 의해 결정했을 때의, GFP/tEGFR, tLNGFR, 이중 표적 통합(GFP/tLNGFR), 이중 표적 통합(tEGFR/tLNGFR), 또는 TCR에 대해 양성인 T-세포의 백분율(%)을 나타내는 막대 그래프가 도시되어 있다.
도 17은 실시예 10에 기술된 실험에 대한 AAVS1 부위 및 TRAC 유전자좌에 대한 T 세포 중 DNA 수준에서의 유전자 편집 결과를 도시한다. 실시예 10에 기술된 조건을 사용하여, AAVS1 유전자좌에서 검출된 적어도 하나의 인델(인델 %)을 사용하여 차세대 시퀀싱(Illumina MiSeq)에 의해 검출된 서열의 백분율의 막대 그래프가 도시되어 있다.
도 1은 CAR-T 공여자 서열을 전달하는 AAV 벡터와 조합하여 본원에 기술된 Cas 엔도뉴클레아제를 사용하여 동종 CAR-T 세포를 생산하기 위한 개념도를 도시한다.
도 2는 Cas9 대조군과 함께 TRAC를 표적화하는 가이드 RNA를 함유하는 MG3-6, MG3-8, 및 MG29-1 RNP에 의한 TRAC에서의 인델 형성을 시험하는 실시예 1에서의 실험 결과를 도시한다. 좌측 패널은 차세대 시퀀싱(NGS)에 의해 측정된 인델의 형성%를 나타내고, 우측 패널은 유세포 계측법에 의해 평가된 세포 표현형(TCR+ 또는 TCR-)을 나타낸다.
도 3은 CAR-T 서열을 함유하는 AAV 공여자 벡터와 조합하여 TRAC를 표적화하는 본원에 기술된 RNP 뉴클레아제 복합체를 사용하여 표적화된 CAR-T 통합을 시험하는 실시예 1에서의 실험의 결과를 도시한다. CAR 항원 결합 도메인의 발현(y-축)과 함께 TCR 발현 상태(TCR- 또는 TCR+, x-축)를 나타내는 유세포 계측 플롯이 도시되어 있다. MG3-6, MG3-8, 및 MG29-1 모두에 대해 유사한 결과를 얻었다.
도 4는 실시예 2에 기술된 바와 같은 MG3-6 및 MG29-1 RNP 복합체의 조합을 사용한 2개의 유전자좌(하나는 TRAC임)의 다중 편집을 도시한다.
도 5는 실시예 2에 기술된 바와 같은 MG3-6 및 MG29-1 RNP 복합체의 조합을 사용한 3개의 유전자좌(하나는 TRAC임)의 다중 편집을 도시한다.
도 6은 AAVS1 유전자좌(A) 내로의 GR 이식유전자의 통합을 시험하기 위한 실시예 3에서와 같은 PCR 실험의 설계를 도시하고, 여기에서 아가로스 겔 사진(B 및 C)은 AAVS1 및 TRAC 유전자좌가 실시예 3에서와 같이 각각의 부위를 표적화하는 별도의 공여자 DNA에 대한 노출과 함께 상이한 Cas 효소를 사용하여 동시에 표적화된 실험의 결과를 도시한다. (B)는 T-세포가 GR 이식유전자 보유 AAV 작제물(레인 2 내지 5), GR 이식유전자 AAV 작제물/SpCas9 표적화 AAVS1/MG3-6-표적화 TRAC/CAR 이식유전자 AAV(레인 6 내지 9) 작제물, 또는 25K 다중성 감염(MOI)에서 AAVS1을 단독으로 표적화하는 GR AAV 작제물/SpCas9(레인 10 내지 13)에 노출된 조건 중 하나로부터의 GR 이식유전자의 증폭을 도시한다. (C)는 T-세포가 분석 대조군(모의 형질감염 또는 이식유전자가 없는 Cas 복합체; 레인 2 내지 4), AAVS1을 단독으로 표적화하는 50K MOI/SpCas9에서의 GR AAV 작제물(레인 5 내지 8), 또는 50K 다중성 감염(MOI)에서 AAVS1을 단독으로 표적화하는 100K MOI/SpCas9에서의 GR AAV 작제물(레인 9 내지 12)에 노출된 조건 중 하나로부터의 GR 이식유전자의 증폭을 도시한다. 결과는 추가적인 TRAC 유전자좌가 표적화되었는지의 여부와 상관없이 유사한 효율로 AAVS1 유전자좌 내에 통합된 GR 이식유전자를 나타낸다.
도 7은 실시예 3에서와 같이 각각의 부위를 표적화화는 별도의 공여자 DNA에 대한 노출과 함께 상이한 Cas 효소를 사용하여 AAVS1 및 TRAC 유전자좌가 동시에 표적화되는, 실시예 3에서의 실험의 결과를 도시하는 유세포 계측 플롯을 도시한다. 각각의 GR 이식 유전자를 보유하는 AAV가 AAVS1-표적화 SpCas9 복합체, TRAC-표적화 MG3-6 복합체, 및 CAR-보유 AAV와 함께 T-세포에 도입된 개별 플롯(A 내지 D)이 도시되어 있다. 결과는 TCR 녹아웃 및 CAR 통합이 모든 GR 이식유전자에서 유사하게 효율적이며, AAVS1 유전자좌의 동시 표적화에도 불구하고 높다(51.31% 내지 61.1% 효율)는 것을 나타낸다.
도 8은 실시예 4에서와 같이 SpCas9("Cas9")와 함께 MG3-6, MG3-8, 및 MG29-1 엔도뉴클레아제의 오프-타겟 특이성을 평가하기 위해 수행된 게놈-와이드 오프-타겟 이중 가닥 절단 분석 검정의 결과를 도시한다.
도 9는 활성 전장 TCR을 만드는 델타, 감마 및 엡실론 사슬의 어셈블리를 도시한다.
도 10은 인델을 함유하는 표적화된 유전자좌에서의 서열의 백분율로 평가된 바와 같은, 실시예 5에 기술된 바와 같은 일차 T 세포에서의 다중 TRAC/TRBC 편집을 나타낸다. 결과는, 두 부위가 동시에 표적화될 때 두 부위에서의 높은 빈도의 파괴를 나타낸다.
도 11은 실시예 6에 기술된 단일 유전자 녹아웃 실험에 대한 유세포 계측법에 의한 유전자 편집 결과를 도시한다. TCR 및 B2M(TCR- B2M- DKO, TCR- B2M+, TCR+ B2M-, 및 TCR+ B2M+)의 녹아웃을 평가하는 4개의 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 막대 그래프가 도시되어 있다. 그래프는: (a) 가장 효율적인 TCR 녹아웃을 생성하는 MG3-6 TRAC6 및 MG3-6 TRBC E2 sgRNA을 사용하여, 모든 TCR 표적화 조건이 TCR 녹아웃을 효율적으로 생산하였고; (b) 가장 효율적인 B2M 녹아웃을 생성하는 B2M H1 및 B2M D2를 사용하여, 모든 B2M 표적화 조건이 B2M 녹아웃을 생성하였음을 도시한다.
도 12는 실시예 7에 기술된 이중 유전자 녹아웃 실험에 대한 유세포 계측법에 의한 유전자 편집 결과를 도시한 것으로서, 이는 실시예 6에서의 B2M 및 TRAC 조건을 사용하되, 이들을 조합하여 사용한다. TCR 및 B2M(TCR- B2M- DKO, TCR- B2M+, TCR+ B2M-, 및 TCR+ B2M+)의 녹아웃을 평가하는 4개의 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 막대 그래프가 도시되어 있다. 그래프는 가장 효율적인 이중 표적화 조건이 MG29-1 B2M H1, D2, 또는 A3 조건을 갖는 MG3-6 TRAC6 조건을 포함하는, A4, B4, 및 C4라는 것을 도시한다. 가장 효율적인 이중 표적화 조건은, MG3-6 TRAC6 sgRNA 및 MG29-1 B2M D2 sgRNA를 사용한 B4인 것으로 나타났다.
도 13은 실시예 8에 기술된 삼중 유전자 녹아웃 실험에 대한 유세포 계측법에 의한 유전자 편집 결과를 도시한 것으로서, 이는 실시예 6에서의 B2M, TRAC 및 TRBC 조건을 사용하되, 이들을 조합하여 사용한다.
도 14는 실시예 8에 기술된 삼중 유전자 녹아웃 실험에 대한 DNA 수준에서의 유전자 편집 결과를 도시한 것으로서, 이는 실시예 6에서의 B2M, TRAC 및 TRBC 조건을 사용하되, 이들을 조합하여 사용한다.
도 15는 실시예 8에 기술된 삼중 유전자 녹아웃 실험에 대한 차세대 시퀀싱(NGS)에 의해 결정된 유전자 편집 결과의 분석을 도시한다.
도 16은 실시예 9에 기술된 실험에 대한 T 세포 중 단백질 수준에서의 유전자 편집 결과를 도시한다. 실시예 9에 기술된 뉴클레아제, 가이드, 및 AAV의 조합을 사용하여, 형광-활성화 세포 분류(FACS)에 의해 결정했을 때의, GFP/tEGFR, tLNGFR, 이중 표적 통합(GFP/tLNGFR), 이중 표적 통합(tEGFR/tLNGFR), 또는 TCR에 대해 양성인 T-세포의 백분율(%)을 나타내는 막대 그래프가 도시되어 있다.
도 17은 실시예 10에 기술된 실험에 대한 AAVS1 부위 및 TRAC 유전자좌에 대한 T 세포 중 DNA 수준에서의 유전자 편집 결과를 도시한다. 실시예 10에 기술된 조건을 사용하여, AAVS1 유전자좌에서 검출된 적어도 하나의 인델(인델 %)을 사용하여 차세대 시퀀싱(Illumina MiSeq)에 의해 검출된 서열의 백분율의 막대 그래프가 도시되어 있다.
본 발명의 다양한 구현예가 본원에 도시되고 기술되었지만, 이러한 구현예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 수 있다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
달리 명시되지 않는 한, 본원에 개시된 일부 방법을 실시하는 데에는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 게놈, 및 재조합 DNA의 기술이 사용된다. 예를 들어 Sambrook 및 Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel 등(편); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames 및 G.R. Taylor(편) (1995)), Harlow and Lane(편) (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney(편) (2010))을 참조한다(이들은 그 전체가 참조로서 본원에 통합됨).
본원에서 사용되는 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥상 달리 명시되지 않는 한, 복수 형태도 포함하도록 의도된다. 또한, 용어 "포함하는(including, includes, having, has, with)" 또는 이의 변형된 표현이 발명을 실시하기 위한 구체적인 내용 및/또는 청구범위에 사용되는 정도까지, 이러한 용어는 용어 "포함하는(comprising)"과 유사한 방식으로 포괄적인 것으로 의도된다.
용어 "약" 또는 "대략"은 당업자에 의해 결정되는 특정 값에 대한 허용 가능한 오차 범위 내의 것을 의미하며, 이는 값이 측정되거나 결정되는 방법, 즉, 측정 시스템의 한계에 부분적으로 좌우될 것이다. 예를 들어, "약"은 당 기술분야의 관행에 따라 하나 또는 둘 이상의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 20%, 최대 15%, 최대 10%, 최대 5%, 또는 최대 1%의 범위를 의미할 수 있다.
본원에서 사용되는 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본 구조, 기능, 및/또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 갖는 임의의 유기체로부터 유래될 수 있다. 일부 비제한적인 예는 다음을 포함한다: 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵생물의 세포, 원생동물 세포, 식물 유래의 세포(예를 들어, 식물 작물, 과일, 야채, 곡물, 대두, 옥수수(corn), 옥수수(maize), 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 면, 대마, 담배, 개화 식물, 침엽수, 겉씨식물, 양치류, 석송, 뿔이끼류, 우산이끼, 이끼 유래의 세포), 해조류 세포(예를 들어, 보트리오코커스 브라우니(Botryococcus braunii), 녹조류(Chlamydomonas reinhardtii), 클라미도모나스 라인하르트티(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 쌍발이모자반(Sargassum patens C. Agardh, 등), 해초(예를 들어, 켈프), 진균 세포(예를 들어, 효모 세포, 버섯 유래의 세포), 동물 세포, 무척추 동물(예를 들어, 초파리, 자포류, 극피동물, 선충 등) 유래의 세포. 척추동물(예를 들어, 생선, 양서류, 파충류, 새, 포유동물) 유래의 세포, 포유동물(예를 들어, 돼지, 젖소, 염소, 양, 설치류, 랫트, 마우스, 비인간 영장류, 인간 등) 유래의 세포, 등. 때로는, 세포는 천연 유기체로부터 유래되지 않는다(예를 들어, 세포는 합성으로 만들어질 수 있고, 이는 가끔 인공 세포라 불린다).
본원에서 사용되는 용어 "뉴클레오티드"는 일반적으로 염기-당-인산염의 조합을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 핵산 서열(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))의 단량체 단위일 수 있다. 뉴클레오티드라는 용어는 리보뉴클레오시드 삼인산, 아데노신 삼인산(ATP), 우리딘 삼인산(UTP), 시토신 삼인산(CTP), 구아노신 삼인산(GTP), 및 데옥시리보뉴클레오시드 삼인산, 예컨대 dATP, dCTP, dITP, dUTP, dGTP, dTTP, 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는, 예를 들어, [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이를 함유하는 핵산 분자에 뉴클레아제 저항성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에서 사용되는 바와 같이, 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 삼인산(ddNTP) 및 이들의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 삼인산의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP, 및 ddTTP를 포함할 수 있지만, 이에 한정되지는 않는다. 뉴클레오티드는 표지되지 않거나, 예컨대 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)를 포함하는 모이어티를 사용하여 검출 가능하게 표지될 수 있다. 표지화는 양자점(quantum dots)으로 수행될 수도 있다. 검출 가능한 표지는, 예를 들어, 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지, 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조) 벤조산(DABCYL), 캐스케이드 블루(Cascade Blue), 오레곤 그린(Oregon Green), 텍사스 레드(Texas Red), 사아닌, 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)를 포함할 수 있지만 이에 한정되지는 않는다. 형광 표지된 뉴클레오티드의 특정 예는 다음을 포함할 수 있다: Perkin Elmer(Foster City, Calif)로부터 입수할 수 있는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP; Amersham(Arlington Heights, Il.)으로부터 입수할 수 있는 FluoroLink 데옥시뉴클레오티드, FluoroLink Cy3-dCTP, FluoroLink Cy5-dCTP, FluoroLink 플루오르 X-dCTP, FluoroLink Cy3-dUTP, 및 FluoroLink Cy5-dUTP; Boehringer Mannheim(Indianapolis, Ind.)으로부터 입수할 수 있는 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP; 및 Molecular Probes(Eugene, Oreg.)로부터 입수할 수 있는 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP, 및 텍사스 레드-12-dUTP. 뉴클레오티드는 화학적 변형에 의해 표지되거나 표시될 수도 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오틴화된 dNTP의 일부 비제한적인 예는 다음을 포함할 수 있다: 비오틴-dATP(예를 들어, 비오-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP). 뉴클레오티드는 뉴클레오티드 유사체를 포함할 수 있다. 일부 구현예에서, 뉴클레오티드 유사체는 뉴클레오티드의 특정 화학적 특성을 변경시키지만 뉴클레오티드 유사체가 의도된 기능을 수행하는 능력(예를 들어, RNA 또는 DNA 내의 다른 뉴클레오티드에 혼성화)을 유지하도록 임의의 위치에서 변형되는 천연 뉴클레오티드의 구조를 포함할 수 있다. 유도체화될 수 있는 뉴클레오티드의 위치의 예는, 위치 5, 예를 들어, 5-(2-아미노)프로필 우리딘, 5-브로모 우리딘, 5-프로핀 우리딘, 5-프로페닐 우리딘 등; 위치 6, 예를 들어, 6-(2-아미노)프로필 우리딘; 아데노신 및/또는 구아노신의 경우 위치 8, 예를 들어, 8-브로모 구아노신, 8-클로로 구아노신, 8-플루오로구아노신 등을 포함한다. 뉴클레오티드 유사체는 또한 데아자 뉴클레오티드, 예를 들어, 7-데아자-아데노신: O- 및 N-변형된(예를 들어, 알킬화된, 예를 들어, N6-메틸 아데노신, 또는 달리 적합하게 변형된) 뉴클레오티드; 및 Herdewijn의 문헌[Antisense Nucleic Acid Drug Dev., 2000 Aug. 10(4):297-310]에 기술된 것과 같은 다른 헤테로시클릭적으로 변형된 뉴클레오티드 유사체를 포함한다. 뉴클레오티드 유사체는 또한 뉴클레오티드의 당 부분에 대한 변형을 포함할 수 있다. 예를 들어, 2' OH-기는 H, OR, R, F, Cl, Br, I, SH, SR, NH2, NHR, NR2, COOR, 또는 OR로부터 선택되는 기에 의해 치환될 수 있다(여기에서 R은 치환되거나 치환되지 않은 C1-C6 알킬, 알케닐, 알키닐, 아릴 등임). 다른 가능한 변형은 미국 특허 제5,858,988호 및 제6,291,438호에 기술되어 있다. 유도체화될 수 있는 뉴클레오티드의 위치의 예는, 위치 5, 예를 들어, 5-(2-아미노)프로필 우리딘, 5-브로모 우리딘, 5-프로핀 우리딘, 5-프로페닐 우리딘 등; 위치 6, 예를 들어, 6-(2-아미노)프로필 우리딘; 아데노신 및/또는 구아노신의 경우 위치 8, 예를 들어, 8-브로모 구아노신, 8-클로로 구아노신, 8-플루오로구아노신 등을 포함한다. 뉴클레오티드 유사체는 또한 데아자 뉴클레오티드, 예를 들어, 7-데아자-아데노신: O- 및 N-변형된(예를 들어, 알킬화된, 예를 들어, N6-메틸 아데노신, 또는 달리 적합하게 변형된) 뉴클레오티드; 및 Herdewijn의 문헌[Antisense Nucleic Acid Drug Dev., 2000 Aug. 10(4):297-310]에 기술된 것과 같은 다른 헤테로시클릭적으로 변형된 뉴클레오티드 유사체를 포함한다.
뉴클레오티드 유사체는 또한 뉴클레오티드의 당 부분에 대한 변형을 포함할 수 있다. 예를 들어, 2' OH-기는 H, OR, R, F, Cl, Br, I, SH, SR, NH2, NHR, NR2, COOR, 또는 OR로부터 선택되는 기에 의해 치환될 수 있다(여기에서 R은 치환되거나 치환되지 않은 C1-C6 알킬, 알케닐, 알키닐, 아릴 등임). 다른 가능한 변형은 미국 특허 제5,858,988호 및 제6,291,438호에 기술되어 있다.
용어 "폴리뉴클레오티드", "올리고뉴클레오티드", 및 "핵산"은 일반적으로 임의의 길이를 가진 뉴클로에티드의 중합체 형태를 지칭하도록 사용 교환적으로 사용되며, 상기 뉴클레오티드는 단일 가닥, 이중 가닥, 또는 다중 가닥의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드이거나, 이의 유사체일 수 있다. 폴리뉴클레오티드는 세포에 대해 외인성이거나 내인성일 수 있다. 폴리뉴클레오티드는 무세포 환경에서 존재할 수 있다. 폴리뉴클레오티드는 유전자이거나 이의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있고 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예를 들어, 백본, 당, 또는 핵염기가 변경된 유사체)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적인 예는 다음을 포함한다: 5-브로모우라실, 펩티드 핵산, 제노 핵산(xeno nucleic acid), 모르폴리노, 잠금 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코르디세핀, 7-데아자-GTP, 형광단 (예를 들어, 당류에 연결된 로다민 또는 플루오레세인), 티올 함유 뉴클레오티드, 비오틴 연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우리딘, 디하이드로우리딘, 큐오신, 및 와이오신. 폴리뉴클레오티드의 비제한적인 예는 다음을 포함한다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌/유전자좌들, 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA (tRNA), 리보솜 RNA (rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA (miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 포함하는 무세포 폴리뉴클레오티드, 핵산 프로브, 및 프라이머. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 중단될 수 있다. 폴리뉴클레오티드는 자연에서 발견되는 뉴클레오티드 및 뉴클레오티드 유사체(예를 들어, 합성 뉴클레오티드 유사체)의 혼합물을 포함할 수 있다.
용어 "형질감염(transfection 또는 transfected)"은 일반적으로 비-바이러스적인 방법 또는 바이러스-기반 방법에 의해 핵산을 세포 내로 도입하는 것을 지칭한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 암호화하는 유전자 서열일 수 있다. 예를 들어, Sambrook 등의 문헌[1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88 (이는 본원에 참조로서 전체적으로 통합됨).
용어 "펩티드", "폴리펩티드", 및 "단백질"은 일반적으로 펩티드 결합(들)에 의해 결합된 적어도 2개의 아미노산 잔기로 이루어진 중합체를 지칭하도록 본원에서 상호 교환적으로 사용된다. 이 용어는 중합체의 특정 길이를 의미하지 않으며, 펩티드가 재조합 기술, 화학적 또는 효소적 합성을 사용해 생산되는지 또는 자연적으로 발생하는지를 암시하거나 구별하도록 의도되지도 않는다. 상기 용어는 자연적으로 발생하는 아미노산 중합체뿐만 아니라 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 경우에, 중합체는 비-아미노산에 의해 중단될 수 있다. 상기 용어는 전장 단백질을 포함하는 임의의 길이의 아미노산 사슬, 및 2차 및/또는 3차 구조(예를 들어, 도메인)가 있거나 없는 단백질을 포함한다. 상기 용어는 예를 들어, 이황화 결합 형성, 당질화, 지질화, 아세틸화, 인산화, 산화, 및 표지 성분과의 접합과 같은 임의의 다른 조작에 의해 변형된 아미노산 중합체도 포함한다. 본원에서 사용되는 용어 "아미노산(들)"은, 변형된 아미노산 및 아미노산 유사체를 포함하되 이에 한정되지 않는, 천연 및 비-천연 아미노산을 일반적으로 지칭한다. 변형된 아미노산은, 아미노산 상에는 자연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 천연 아미노산 및 비-천연 아미노산을 포함할 수 있다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산 및 L-아미노산 둘 모두를 포함한다.
본원에서 사용되는 바와 같이, "비-고유(non-native)"는 고유 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 일반적으로 지칭할 수 있다. 비-고유는 친화도 태그를 지칭할 수 있다. 비-고유는 융합을 지칭할 수 있다. 비-고유는 돌연변이, 삽입, 및/또는 결실을 포함하는 자연 발생 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비-고유 서열은 비-고유 서열이 융합되는 핵산 및/또는 폴리펩티드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 금속전이효소 활성, 아세틸전이효소 활성, 키나아제 활성, 유비퀴틴화 활성 등)을 나타내고/나타내거나 이를 암호화할 수 있다. 비-고유 핵산 또는 폴리펩티드 서열은 유전자 조작에 의해 자연 발생 핵산 및/또는 폴리펩티드 서열(또는 이의 변이체)에 연결되어 키메라 핵산 또는 폴리펩티드를 암호화하는 키메라 핵산 및/또는 폴리펩티드 서열을 생성할 수 있다.
본원에서 사용되는 바와 같이, 용어 "프로모터"는, 유전자의 전사 또는 발현을 조절하고 RNA 전사가 개시되는 뉴클레오티드 또는 뉴클레오티드의 영역에 인접하게 위치하거나 이와 중첩될 수 있는 조절 DNA 영역을 일반적으로 지칭한다. 프로모터는 종종 전사 인자로서 지칭되는 단백질 인자에 결합하는 특이적 DNA 서열을 함유할 수 있는데, 상기 인자는 RNA 중합효소가 DNA에 결합하는 것을 용이하게 하여 유전자 전사를 유도한다. '코어 프로모터'로도 지칭되는 '기저 프로모터(basal promoter)'는 작동 가능하게 연결된 폴리뉴클레오티드의 전사 발현을 촉진하는 모든 기본 요소를 함유하는 프로모터를 일반적으로 지칭할 수 있다. 진핵생물 기저 프로모터는, 반드시 그런 것은 아니지만, 통상적으로, TATA-박스 및/또는 CAAT 박스를 함유한다.
본원에서 사용되는 바와 같이, 용어 "발현"은 핵산 서열 또는 폴리뉴클레오티드가 DNA 템플릿으로부터 (예컨대 mRNA 또는 다른 RNA 전사체로) 전사되는 공정 및/또는 전사된 mRNA가 후속하여 펩티드, 폴리펩티드, 또는 단백질로 번역되는 공정을 일반적으로 지칭한다. 전사체 및 암호화된 폴리펩티드는 "유전자 산물"로서 통칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래되는 경우, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
본원에서 사용되는 바와 같이, "작동 가능하게 연결된(operably linked, operable linkage, operatively linked)" 또는 이와 문법적으로 동등한 표현은 유전자 요소, 예를 들어, 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 일반적으로 지칭하는데, 여기서 요소들은 이들이 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 및/또는 인핸서 서열을 포함할 수 있는 조절 요소가 코딩 서열의 전사 개시에 도움을 주는 경우, 조절 요소는 코딩 영역에 작동 가능하게 연결된다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 개재 잔기가 있을 수 있다.
본원에서 사용되는 바와 같이, "벡터"는 일반적으로 폴리뉴클레오티드를 포함하거나 폴리뉴클레오티드와 결합하고 폴리뉴클레오티드를 세포로 전달하는 것을 매개하는데 사용될 수 있는 거대분자 또는 거대분자의 연관을 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포좀, 및 기타 유전자 전달 비히클을 포함한다. 벡터는 유전자에 작동 가능하게 연결되어 표적에서 유전자의 발현을 용이하게 하는 유전자 요소, 예를 들어 조절 요소를 일반적으로 포함한다.
본원에서 사용되는 바와 같이, "발현 카세트" 및 "핵산 카세트"는 함께 발현되거나 발현을 위해 작동 가능하게 연결된 핵산 서열 또는 요소의 조합을 지칭하기 위해 일반적으로 상호 교환적으로 사용된다. 일부 경우에, 발현 카세트는 조절 요소와 발현을 위해 조절 요소가 작동 가능하게 연결되는 유전자(들)의 조합을 지칭한다.
본원에서 사용되는 바와 같이, "조작된" 객체란 객체가 인간 개입에 의해 변형되었음을 일반적으로 나타낸다. 비제한적인 실시예에 따르면: 핵산은 이의 서열을 자연에서 발생하지 않는 서열로 변경함으로써 변형될 수 있고; 핵산은 이 핵산을 자연에서 연관되지 않는 핵산과 결합시키되, 결합 산물이 원래 핵산에 존재하지 않는 기능을 갖도록 결합시킴으로써 변형될 수 있고; 조작된 핵산은 자연에서 존재하지 않는 서열을 이용해 시험관 내에서 합성될 수 있고; 단백질은 이의 아미노산 서열을 자연에서 존재하지 않는 서열과 치환함으로써 변형될 수 있고; 조작된 단백질은 새로운 기능 또는 특성을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에서 사용되는 바와 같이, "합성" 및 "인공"은, 대체적으로 자연 발생 인간 단백질과 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 갖는 단백질 또는 이의 도메인을 지칭하도록 상호 교환적으로 사용될 수 있다. 예를 들어, VPR 및 VP64 도메인은 합성 전사 활성화 도메인이다.
본원에서 사용되는 바와 같이, 용어 "Cas12a"는 대체적으로 클래스 2, V-A형 Cas 엔도뉴클레아제이고, (a) CRISPR 어레이로부터의 전사 후 뉴클레아제 자체에 의해 가공되는 비교적 작은 가이드 RNA(약 42 내지 44개 뉴클레오티드)를 사용하고, (b) 엇갈린 절단 부위를 남기도록 DNA를 절단하는 Cas 엔도뉴클레아제의 패밀리를 지칭한다. 이러한 효소 패밀리의 추가적인 특징은, 예를 들어, 본원에 참조로서 통합되는, Zetsche B, Heidenreich M, Mohanraju P, 등의 문헌[ Nat Biotechnol 2017;35:31-34], 및 Zetsche B, Gootenberg JS, Abudayyeh OO, 등의 문헌[Cell 2015;163:759-771]을 참조한다.
본원에서 사용되는 바와 같이, "가이드 핵산" 또는 이의 변이체는 대체적으로 다른 핵산에 혼성화될 수 있는 핵산을 지칭할 수 있다. 가이드 핵산은 RNA일 수 있다. 가이드 핵산은 DNA일 수 있다. 가이드 핵산은 핵산의 서열에 부위 특이적으로 결합하도록 프로그래밍될 수 있다. 표적화될 핵산 또는 표적 핵산은 뉴클레오티드를 포함할 수 있다. 가이드 핵산은 뉴클레오티드를 포함할 수 있다. 표적 핵산의 일부는 가이드 핵산의 일부에 상보적일 수 있다. 가이드 핵산에 상보적이고 가이드 핵산과 혼성화되는 이중-가닥 표적 폴리뉴클레오티드의 가닥은 상보적 가닥으로 지칭될 수 있다. 상보적 가닥에 상보적이고, 따라서 가이드 핵산에 상보적이 아닐 수 있는 이중 가닥 표적 폴리뉴클레오티드의 가닥은 비상보적 가닥으로 지칭될 수 있다. 가이드 핵산은 하나의 폴리뉴클레오티드 사슬을 포함할 수 있고 "단일 가이드 핵산"으로 지칭될 수 있다. 가이드 핵산은 2개의 폴리뉴클레오티드 사슬을 포함할 수 있고 "이중 가이드 핵산"으로 지칭될 수 있다. 달리 명시되지 않는 경우, 용어 "가이드 핵산"은 단일 가이드 핵산 및 이중 가이드 핵산 둘 다를 포함할 수 있고, 둘 다를 지칭할 수 있다. 가이드 핵산은 "핵산-표적화 분절" 또는 "핵산-표적화 서열" 또는 "스페이서 서열"로서 지칭될 수 있는 분절을 포함할 수 있다. 핵산-표적화 분절은 "단백질 결합 분절" 또는 "단백질 결합 서열" 또는 "Cas 단백질 결합 분절"로서 지칭될 수 있는 하위 분절을 포함할 수 있다. 가이드 핵산은 sgRNA를 포함할 수 있다. 가이드 핵산은 crRNA를 포함할 수 있다.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서의 용어 "서열 동일성" 또는 "동일성 백분율"은, 서열 비교 알고리즘을 사용해 측정했을 때, 부분적 또는 전체 비교 윈도우에 걸쳐 비교하고 최대 상응에 정렬했을 때 동일한 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열; 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 백분율을 갖는 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열을 일반적으로 지칭한다. 폴리펩티드 서열에 대한 적절한 서열 비교 알고리즘은 예를 들어 다음을 포함한다: 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 30개 잔기를 초과하는 길이의 폴리펩티드 서열에 대해서는 조건부 조성 스코어 매트릭스 조정(conditional compositional score matrix)을 사용하는 BLASTP; 단어 길이(W) 2, 기대치(E) 1000000의 파라미터, 및 30개 잔기 미만의 서열에 대해서는 PAM30 스코어링 매트릭스(개방 갭 9, 연장 갭 1의 갭 비용 설정 - 이들은 https://blast.ncbi.nlm.nih.gov에서 이용할 수 있는 BLAST 세트 중 BLASTP에 대한 디폴트 파라미터임)를 사용하는 BLASTP; 일치 2, 불일치 -1, 및 갭 -1의 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW; 디폴트 파라미터를 사용하는 MUSCLE; retree 2 및 최대 반복 1000의 파라미터를 사용하는 MAFFT; 디폴트 파라미터를 사용하는 Novafold; 디폴트 파라미터를 사용하는 HMMER hmmalign.
본원에서 사용되는 바와 같이, 용어 "키메라 항원 수용체", "CAR", 또는 "CAR 분자"는 대체적으로 적어도 세포외 항원 결합 도메인, 막관통 도메인 및 본원에서 정의된 바와 같은 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인(본원에서 "세포내 신호전달 도메인"으로도 지칭됨)을 포함하는 재조합 폴리펩티드 작제물을 지칭한다. 일부 구현예에서, 자극 분자는 T 세포 수용체 복합체 또는 NKG2D의 신호전달 도메인과 연관된 제타 사슬이다. 일부 구현예에서, 세포내 신호전달 도메인은 아래에 정의된 바와 같은 적어도 하나의 공자극 분자로부터 유래된 하나 이상의 기능적 신호전달 도메인을 추가로 포함한다. 일부 구현예에서, 공자극 분자는 4-1BB(즉, CD137), CD27, 및/또는 CD28로부터 선택된다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인, 막관통 도메인 및 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인을 포함하는 키메라 융합 단백질을 포함한다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인, 막관통 도메인 및 공자극 분자로부터 유래된 기능적 신호전달 도메인 및 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인을 포함하는 키메라 융합 단백질을 포함한다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인, 막관통 도메인 및 하나 이상의 공자극 분자(들)로부터 유래된 2개의 기능적 신호전달 도메인 및 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인을 포함하는 키메라 융합 단백질을 포함한다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인, 막관통 도메인 및 하나 이상의 공자극 분자(들)로부터 유래된 적어도 2개의 기능적 신호전달 도메인 및 자극 분자로부터 유래된 기능적 신호전달 도메인을 포함하는 세포질 신호전달 도메인을 포함하는 키메라 융합 단백질을 포함한다. 일부 구현예에서, CAR은 CAR 융합 단백질의 아미노-말단(N-말단)에서의 선택적인 리더 서열을 포함한다. 일부 구현예에서, CAR은 세포외 항원 인식 도메인의 N-말단에서의 리더 서열을 추가로 포함하되, 리더 서열은 세포 처리 및 CAR의 세포막 위치화 동안 항원 인식 도메인(예를 들어, scFv)으로부터 선택적으로 절단된다.
용어 "신호전달 도메인"은 대체적으로 제2 메신저를 생성하거나 이러한 메신저에 대해 반응하여 효과기로 기능함으로써 정의된 신호전달 경로를 통해 세포 활성을 조절하기 위해 세포 내에서 정보를 전달함으로써 작용하는 단백질의 기능적 부분을 지칭한다.
본원에서 사용되는 바와 같이, 용어 "항체"는 대체적으로, 예를 들어, 비공유적으로, 가역적으로, 그리고 특정 방식으로 항원과 특이적으로 결합하는 면역글로불린 분자로부터 유래된 단백질 또는 폴리펩티드 서열을 지칭한다. 항체는 다클론 또는 단클론, 다중 또는 단쇄, 또는 온전한 면역글로불린일 수 있고, 자연 공급원 또는 재조합 공급원으로부터 유래될 수 있다. 항체는 면역글로불린 분자의 사량체일 수 있다. 예를 들어, 자연적으로 발생하는 IgG 항체는 이황화 결합에 의해 상호 연결된 적어도 2개의 중쇄(H) 및 2개의 경쇄(L)를 포함하는 사량체이다. 각각의 중쇄는 중쇄 가변 영역(본원에서 VH로서 약칭됨) 및 중쇄 불변 영역으로 구성된다. 중쇄 불변 영역은 3개의 도메인 CH1, CH2 및 CH3으로 구성된다. 각각의 경쇄는 경쇄 가변 영역(본원에서 VL로서 약칭됨) 및 경쇄 불변 영역으로 구성된다. 경쇄 불변 영역은 하나의 도메인인 CL로 구성된다. VH 및 VL 영역은 상보성 결정 영역(CDR)으로 지칭되는 초가변성 영역, 프레임워크 영역(FR)으로 지칭되는 보다 보존된 산재된 영역으로 추가로 세분화될 수 있다. 각각의 VH 및 VL은 다음의 순서로 아미노 말단으로부터 카르복시 말단까지 배열된 3개의 CDR 및 4개의 FR로 구성된다: FR1, CDR1, FR2, CDR2, FR3, CDR3, 및 FR4. 중쇄 및 경쇄의 가변 영역은 항원과 상호작용하는 결합 도메인을 함유한다. 항체의 불변 영역은 면역 체계의 다양한 세포(예를 들어, 효과기 세포) 및 고전적 보체 시스템의 제1 성분(C1q)을 포함하는, 숙주 조직 또는 인자에 대한 면역글로불린의 결합을 매개할 수 있다. 용어 "항체"는 단클론 항체, 인간 항체, 인간화 항체, 카멜리드 항체, 및 키메라 항체를 포함하나, 이에 한정되지는 않는다. 항체는 임의의 이소형/클래스(예를 들어, IgG, IgE, IgM, IgD, IgA 및 IgY), 또는 서브클래스(예를 들어, IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2)일 수 있다.
용어 "항체 단편"은 온전한 항체 또는 이의 재조합 변이체의 적어도 일부를 지칭하며, 항원 결합 도메인, 예를 들어, 항원과 같은 표적에 대한 항체 단편의 인식 및 특이적 결합을 부여하기에 충분한 온전한 항체의 가변 영역을 결정하는 항원을 지칭한다. 항체 단편의 예는, Fab, Fab', F(ab')2, 및 Fv 단편, 단쇄 또는 "scFv" 항체 단편, 선형 항체, sdAb(VL 또는 VH)와 같은 단일 도메인 항체, 카멜리드 VH 도메인, 및 항체 단편으로부터 형성된 다중특이적 항체를 포함하나, 이에 한정되지는 않는다. 용어 "scFv"는 경쇄의 가변 영역을 포함하는 적어도 하나의 항체 단편 및 중쇄의 가변 영역을 포함하는 적어도 하나의 항체 단편을 포함하는 융합 단백질을 지칭하되, 경쇄 및 중쇄 가변 영역은 짧은 가요성 폴리펩티드 링커를 통해 인접하게 연결되고, 단쇄 폴리펩티드로서 발현될 수 있으며, 여기에서 상기 scFv는 scFv가 유래되는 온전한 항체의 특이성을 유지한다. 달리 명시되지 않는 한, 본원에서 사용되는 바와 같이, scFv는 VL 및 VH 가변 영역을, 예를 들어, 폴리펩티드의 N-말단 및 C-말단 종결에 대하여, 어느 순서로든 가질 수 있고, scFv는 VL-링커-VH를 포함할 수 있거나, VH-링커-VL을 포함할 수 있다.
항체 또는 이의 항체 단편을 포함하는 CAR 조성물의 부분은 항원 결합 도메인이 다음의 예를 포함하는 인접 폴리펩티드 사슬의 일부로서 발현되는 다양한 형태로 존재할 수 있다: 단일 도메인 항체 단편(sdAb), 단쇄 항체(scFv) 및 인간화 항체(Harlow 등의 문헌[1999, In: Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, NY]; Harlow 등의 문헌[1989, In: Antibodies: A Laboratory Manual, Cold Spring Harbor, N.Y.]; Houston 등의 문헌[1988, Proc. Natl. Acad. Sci. USA 85:5879-5883]; Bird 등의 문헌[1988, Science 242:423-426]). 일부 구현예에서, 본 발명의 CAR 조성물의 항원 결합 도메인은 항체 단편을 포함한다. 일부 구현예에서, CAR은 scFv를 포함하는 항체 단편을 포함한다.
하나 이상의 보존적 아미노산 치환을 갖는 본원에 기술된 효소 중 어느 하나의 변이체가 본 개시에 포함된다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 파괴하지 않고도 폴리펩티드의 아미노산 서열에서 이루어질 수 있다. 보존적 치환은 소수성, 극성, 및 R 사슬 길이가 서로 유사한 아미노산들을 치환함으로써 달성될 수 있다. 추가적으로 또는 대안적으로, 상이한 종의 상동성 단백질의 정렬된 서열을 비교함으로써, 종들 간에 돌연변이된 아미노산 잔기(예를 들어, 암호화된 단백질의 기본 기능을 변경시키지 않은 비보존적 잔기)를 위치시킴으로써 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기술된 엔도뉴클레아제 단백질 서열 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체를 포함할 수 있다. 일부 구현예에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 엔도뉴클레아제의 하나 이상의 중요한 활성 부위 잔기 또는 RNA 결합 잔기의 활성이 파괴되지 않도록 치환된 서열을 포함할 수 있다. 일부 구현예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체는 Cas 엔도뉴클레아제의 보존된 잔기 또는 기능적 잔기 특성 중 적어도 하나의 치환이 결여되어 있다. 일부 구현예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체는 Cas 엔도뉴클레아제의 보존된 잔기 또는 기능적 잔기 특성 모두의 치환이 결여되어 있다.
또한, 본 개시에는 효소의 활성을 감소시키거나 제거하기 위해 하나 이상의 촉매 잔기의 치환을 갖는, 본원에 기술된 효소 중 어느 하나의 변이체(예를 들어, 감소된-활성 변이체)가 포함된다. 일부 구현예에서, 본원에 기술된 단백질로서의 감소된 활성 변이체는 적어도 1개, 적어도 2개, 또는 3개의 RuvC 촉매 잔기 모두의 파괴 치환을 포함한다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참조 문헌을 통해 이용할 수 있다(예를 들어, Creighton의 문헌[Proteins: Structures and Molecular Properties (W H Freeman & Co.; 2nd Edition (1993년 12월)] 참조). 다음의 8개의 기는 서로에 대해 보존적 치환인 아미노산을 각각 함유한다:
1) 알라닌 (A), 글리신 (G);
2) 아스파르트산 (D), 글루탐산 (E);
3) 아스파라긴 (N), 글루타민 (Q);
4) 아르기닌 (R), 리신 (K);
5) 이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V);
6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W);
7) 세린 (S), 트레오닌 (T); 및
8) 시스테인 (C), 메티오닌 (M)
개요
독특한 기능 및 구조를 갖는 새로운 Cas 효소의 발견은 데옥시리보핵산(DNA)을 추가로 파괴할 수 있는 편집 기술을 제공함으로써, 속도, 특이성, 기능, 및 사용 편이성을 개선할 수 있다. 미생물에서 CRISPR 시스템의 예측 유병률 및 미생물 종의 순수한 다양성과 관련하여, 기능적으로 특성화된 CRISPR/Cas 효소는 문헌에 상대적으로 거의 존재하지 않는다. 이는 부분적으로는 많은 수의 미생물 종이 실험실 조건에서 쉽게 배양되지 않을 수 있기 때문이다. 많은 수의 미생물 종을 포함하는 자연 환경 적소로부터의 메타게놈 시퀀싱은 신규 문서화된 CRISPR/Cas 시스템의 수를 극적으로 증가시키고 새로운 올리고뉴클레오티드 편집 기능의 발견을 가속화할 수 있는 가능성을 제공할 수 있다. 이러한 접근법의 결실에 대한 최근의 예는 2016년에 천연 미생물 군집의 메타게놈 분석에서 CasX/CasY CRISPR 시스템을 발견한 것에 의해 입증된다.
CRISPR/Cas 시스템은 미생물에서 적응성 면역 체계로서 기능하는 것으로 기술된 RNA-지향성 뉴클레아제 복합체이다. 이들의 자연적인 맥락에서, CRISPR/Cas 시스템은 CRISPR(일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복서열) 오페론 또는 유전자좌에서 발생하며, 이는 일반적으로 2개의 부분을 포함한다: (i) RNA-기반 표적화 요소를 암호화하는, 동일하게 짧은 스페이서 서열에 의해 분리된 짧은 반복 서열(30 내지 40 bp)의 어레이; 및 (ii) 부속 단백질/효소와 함께 RNA-기반 표적화 요소가 지향하는 뉴클레아제 폴리펩티드를 암호화하는 Cas를 암호화하는 ORF. 특정 표적 핵산 서열의 효율적인 뉴클레아제 표적화는 일반적으로 다음 두 가지 모두를 필요로 한다: (i) 표적의 첫 6 내지 8개의 핵산(표적 시드)과 crRNA 가이드 사이의 상보적 혼성화; 및 (ii) 표적 시드의 정의된 근위 이내에 프로토스페이서-인접 모티프(PAM) 서열의 존재(PAM은 일반적으로 숙주 게놈 내에서 흔히 나타나지 않는 서열임). 시스템의 정확한 기능 및 구성에 따라, CRISPR-Cas 시스템은 공통의 기능적 특성 및 진화적 유사성을 기반으로 일반적으로 2개의 클래스, 5개의 유형, 및 16개의 하위 유형으로 구성된다(도 1 참조).
클래스 I CRISPR-Cas 시스템은 큰 다중 서브유닛 작동자 복합체를 가지며, I형, III형, 및 IV형을 포함한다. 클래스 II CRISPR-Cas 시스템은 단일-폴리펩티드 다중도메인 뉴클레아제 작동자를 일반적으로 가지며, II형, V형, 및 VI형을 포함한다.
II형 CRISPR-Cas 시스템은 구성요소 측면에서 가장 단순한 것으로 간주된다. II형 CRISPR-Cas 시스템에서, CRISPR 어레이를 성숙한 crRNA로 가공하는 데에는 특별한 엔도뉴클레아제 서브유닛의 존재가 필요하지 않고, 오히려 어레이 반복 서열에 상보적인 영역을 갖는 작은 트랜스-암호화된 crRNA(tracrRNA)가 필요하며; 여기서 tracrRNA는 이의 상응하는 작동자 뉴클레아제(예: Cas9) 및 반복 서열 둘 다와 상호작용하여 전구체 dsRNA 구조를 형성하는데, 이는 내인성 RNAse III에 의해 절단되어 tracrRNA 및 crRNA 둘 다와 함께 로딩되는 성숙한 작동자 효소를 생성한다. Cas II 뉴클레아제는 DNA 뉴클레아제로서 식별된다. 2형 작동자는 대체적으로 RuvC-유사 뉴클레아제 도메인의 접힘부 내에 삽입된 무관한 HNH 뉴클레아제 도메인과 함께 RNase H 접힘부를 입양하는 RuvC-유사 엔도뉴클레아제 도메인을 포함하는 구조를 나타낸다. RuvC-유사 도메인은 표적 (예를 들어, crRNA 상보적인) DNA 가닥의 절단을 담당하는 반면, HNH 도메인은 변위된 DNA 가닥의 절단을 담당한다.
V형 CRISPR-Cas 시스템은 II형 작동자의 구조와 유사하고, RuvC-유사 도메인을 포함하는 뉴클레아제 작동자(예를 들어, Cas 12) 구조를 특징으로 한다. II형과 유사하게, (전부는 아니지만) 대부분의 V형 CRISPR 시스템은 tracrRNA를 사용해 pre-crRNA를 성숙한 crRNA로 처리하지만; pre-crRNA를 다수의 crRNA로 절단하기 위해 RNAse III을 필요로 하는 II형 시스템과 달리, V형 시스템은 작동자 뉴클레아제 자체를 사용해 pre-crRNA를 절단할 수 있다. II형 CRISPR-Cas 시스템과 마찬가지로, V형 CRISPR-Cas 시스템도 DNA 뉴클레아제로서 식별된다. II형 CRISPR-Cas 시스템과 달리, 일부 V형 효소(예를 들어, Cas12a)는 이중 가닥 표적 서열의 제1 crRNA 가이드 절단에 의해 활성화되는 강력한 단일 가닥 비특이적 데옥시리보뉴클레아제 활성을 갖는 것으로 보인다.
CRISPR-Cas 시스템은 표적화 가능성과 사용 용이성으로 인해 최근 몇 년 동안 유전자 편집 기술의 선택지로서 각광받고 있다. 가장 흔히 사용되는 시스템은 클래스 2 II형 SpCas9 및 클래스 2 V-A형 Cas12a(종래 Cpf1)이다. 특히, V-A형 시스템은 세포에서 기록되는 특이성이 다른 뉴클레아제보다 높고, 오프-타겟 효과가 적거나 없기 때문에 점차적으로 널리 사용되고 있다. V-A 시스템은 또한 가이드 RNA가 작고(SpCas9 경우의 대략 100 nt와 비교하여 42 내지 44개의 뉴클레오티드) CRISPR 어레이로부터의 전사 후 뉴클레아제 자체에 의해 처리되기 때문에, 다중 유전자 편집으로 다중화된 응용을 단순화시킨다는 점에서 유리하다. 또한, V-A 시스템은 엇갈린 절단 부위를 가지며, 이는 미세상동성-의존성 표적 통합(MITI)과 같은 유도 복구 경로를 촉진시킬 수 있다.
가장 통상적으로 사용되는 V-A형 효소는 선택된 표적 부위 옆에 다음과 같은 5' 프로토스페이서 인접 모티프(PAM)를 필요로 한다: 라크노스피라세아에(Lachnospiraceae) 박테리아 ND2006 LbCas12a 및 아시다미노코쿠스 종(Acidaminococcus sp.) AsCas12a의 경우 5'-TTTV-3'; 및 프란치셀라 노비치다(Francisella novicida) FnCas12a의 경우 5'-TTV-3'. 최근의 병렬상동체(ortholog)에 대한 연구는, 포유류 세포 배양물, 예를 들어, YTV, YYN 또는 TTN에서도 활성인, 보다 덜 제한적인 PAM 서열을 갖는 단백질을 발견하였다. 그러나, 이들 효소는 V-A 생물다양성 및 표적화 능력을 완전히 포함하지 않으며, 모든 가능한 활성 및 PAM 서열 요건을 나타내지 않을 수 있다. 여기에서, 수천 개의 게놈 단편을 V-A형 뉴클레아제에 대한 다수의 메타게놈으로부터 채굴하였다. V-A 효소의 문서화된 다양성이 확장되었을 수 있고, 신규 시스템이 고도로 표적화되고, 콤팩트하고, 정확한 유전자 편집제로 개발되었을 수 있다.
예시적인 구현예
일부 양태에서, 본 개시는 세포 내에서 2개 이상의 유전자좌를 편집하는 방법을 제공하며, 방법은, 전술한 세포에: (a) 클래스 2, II형 Cas 엔도뉴클레아제 복합체로서: (i) 클래스 2, II형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는 클래스 2, II형 Cas 엔도뉴클레아제 복합체를 접촉시키거나 도입하는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 세포에, (b) 클래스 2, V형 Cas 엔도뉴클레아제 복합체로서: (i) 클래스 2, V형 Cas 엔도뉴클레아제; 및 (ii) 클래스 2, V형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는 하나 이상의 조작된 가이드 RNA를 포함하는 클래스 2, V형 Cas 엔도뉴클레아제 복합체를 접촉시키거나 도입하는 단계를 추가로 포함한다. 일부 구현예에서, Cas 엔도뉴클레아제는 리보뉴클레오단백질(RNP) 입자의 형태로 접촉된다(예를 들어, 지질 기반 또는 전기천공/뉴클레오펙션 기반 형질감염의 경우). 일부 구현예에서, Cas 엔도뉴클레아제는 전술한 엔도뉴클레아제 또는 연관된 가이드 RNA를 암호화하는 서열의 형태로 도입된다(예를 들어, 벡터 또는 시험관 내 전사된 mRNA의 경우). 일부 구현예에서, 편집은 인델, 조기 종결 코돈, 미스센스 코돈, 프레임시프트 돌연변이, 아데닌 탈아민화, 시토신 탈아민화, 또는 이들의 임의의 조합의 삽입을 포함한다.
Cas 엔도뉴클레아제는 특정 Cas 엔도뉴클레아제일 수 있고, 특정 파라미터 하에서 도입되거나, 특정 표적 메트릭을 달성하는 방식으로 도입될 수 있다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는 Cas12a 엔도뉴클레아제는 아니다. 일부 구현예에서, 전술한 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 클래스 2, V형 Cas 엔도뉴클레아제는, 서열번호 7, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 방법은 전술한 제1 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하고/하거나 전술한 제2 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 200 pmol 이하, 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 도입된다. 일부 구현예에서, 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만의 빈도로 파괴된다. 일부 구현예에서, 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만의 빈도로 파괴된다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석은, HTGTS 검정(고처리량, 게놈-와이트 전좌 시퀀싱; 예를 들어, Chiarle 등의 문헌[Cell. 2011 Sep 30;147(1):107-19. doi: 10.1016/j.cell.2011.07.049] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), LAM-HTGTS 검정(선형 증폭 매개 고처리량 게놈-와이드 시퀀싱; 예를 들어, Hu 등의 문헌[Nat Protoc. 2016. 11(5):853-71. doi:10.1038/nprot.2016.043] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), 또는 Digenome-Seq 검정(시험관 내 Cas-소화 전체 게놈 시퀀싱; 예를 들어, Kim 등의 문헌[Nat Methods. 2015. 12(3):237-43. doi:10.1038/nmeth.3284] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨))을 포함한다.
표적화된 유전자좌는 임의의 유전자좌를 포함할 수 있다. 표적화된 유전자좌는, T 세포 수용체(TCR) 유전자좌(TRAC 및 TRBC와 같은 T-세포의 다수의 아형이 보존된 TCR 유전자좌의 불변 영역을 포함함), 글루코코르티코이드 수용체 유전자좌(GR 유전자좌로도 지칭됨), 다른 핵 호르몬 수용체를 암호화하는 유전자좌(예를 들어, 에스트로겐 수용체, 프로게스테론 수용체, 또는 안드로겐 수용체 유전자좌), 또는 특정 종양 또는 종양 억제제를 암호화하는 유전자좌와 같은 특정 치료적 관심 유전자좌일 수 있다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 T 세포 수용체(TCR) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 10 내지 15 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트는 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 포함한다. 일부 구현예에서, 전술한 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 전술한 스페이서 서열 또는 전술한 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 전술한 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는다.
본원에 사용된 편집 방법 중 어느 하나는, 예를 들어, Cas 효소 또는 Cas 복합체에 의해 표적화된 부위 중 하나에서의 상동성 재조합에 의해 이식유전자를 도입하기 위해, 공여자 핵산 분자와 함께 사용될 수 있다. 일부 구현예에서, 방법은, 내인성 유전자의 이식유전자 버전을 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 내인성 유전자의 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다. 일부 경우, 이식유전자는 CAR-T 분자일 수 있다. 일부 구현예에서, 방법은, 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 TCR 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 조작된 T 세포를 제조하는 방법을 제공하며, 방법은, T 세포 또는 이의 전구체에: (a) T 세포 수용체(TCR) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서: (i) 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제1 RNA 가이드 엔도뉴클레아제를 암호화하는 DNA; 및 (ii) 전술한 제1 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 TCR 유전자좌의 적어도 일부에 혼성화하도록 구성된 제1 스페이서 서열을 포함하는 제1 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체를 도입하는 단계를 포함한다. 일부 구현예에서, 방법은, 전술한 T 세포 또는 전술한 이의 전구체에: (b) T 세포 수용체 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서: (i) 제2 RNA 가이드 엔도뉴클레아제; 및 (ii) 전술한 제2 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및 전술한 NR3C1 유전자좌의 적어도 일부에 혼성화하도록 구성된 제2 스페이서 서열을 포함하는 제2 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체를 도입하는 단계를 추가로 포함한다. 일부 구현예에서, 전술한 TCR 유전자좌의 전술한 적어도 일부는 전술한 T-세포 유전자좌 내에 있다. 일부 구현예에서, 방법은, (b) 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 전술한 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 TCR 유전자좌 내의 전술한 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 전술한 세포에 도입하는 단계를 추가로 포함한다.
II형 또는 V형 엔도뉴클레아제는 특정 Cas 엔도뉴클레아제를 포함할 수 있다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제 또는 전술한 제2 RNA 가이드 엔도뉴클레아제는 클래스 2, II형 또는 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제2 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 전술한 제1 RNA 가이드 엔도뉴클레아제는 전술한 클래스 2, V형 Cas 엔도뉴클레아제를 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는, 서열번호 1, 4, 또는 7 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 조작된 가이드 RNA 또는 전술한 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 RNA-가이드 엔도뉴클레아제 또는 전술한 제2 RNA-가이드 엔도뉴클레아제는 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 존재한다.
본원에 사용된 편집 방법 중 어느 하나는, 예를 들어, Cas 효소 또는 Cas 복합체에 의해 표적화된 부위 중 하나에서의 상동성 재조합에 의해 이식유전자를 도입하기 위해, 공여자 핵산 분자와 함께 사용될 수 있다. 일부 구현예에서, 전술한 이종 조작된 T-세포 수용체는 CAR 분자이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 T 세포 수용체 알파 불변(TRAC) 유전자좌 또는 T 세포 수용체 베타 불변(TRBC) 유전자좌이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRAV 또는 TRAJ 유전자좌이다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRBV 또는 TRBJ 유전자좌이다. 일부 구현예에서, 전술한 상동 아암은 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부에 인접한 TCR 유전자좌 내에 인트론 또는 엑손 영역을 포함한다. 일부 구현예에서, 전술한 T 세포 수용체 유전자좌의 전술한 적어도 일부는 TRAC의 제1 또는 제3 엑손이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 전술한 TCR 유전자좌 및 전술한 NR3C1 유전자좌의 게놈 서열을 파괴한다. 일부 구현예에서, 전술한 효율은 전술한 TCR 또는 NR3C1 유전자좌로부터 발현된 단백질에 대한 유세포 계측법에 의해 결정된다. 일부 구현예에서, 전술한 NR3C1 유전자좌의 전술한 적어도 일부는 엑손 2 또는 엑손 3이다. 일부 구현예에서, 전술한 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 CAR 분자에 대해 양성이고 NR3C1에 대해 음성인 세포를 생산한다. 일부 구현예에서, 전술한 방법은 (a) 내지 (c)를 전술한 T 세포 또는 이의 전구체에 동시에 도입하는 단계를 포함한다. 일부 구현예에서, 전술한 T-세포 또는 전술한 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함한다. 일부 구현예에서, 전술한 제2 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 전술한 제1 또는 전술한 제2 스페이서 서열은 적어도 약 19 내지 24개 뉴클레오티드, 적어도 약 19개 뉴클레오티드, 적어도 약 20개 뉴클레오티드, 적어도 약 22개 뉴클레오티드, 또는 적어도 약 24개 뉴클레오티드를 포함한다.
본원에 기술된 방법과 함께 사용된 공여자 서열은 본 방법에서 다양한 형태로 제공될 수 있다. 일부 구현예에서, 공여자 서열은 핵산 분자(예를 들어, 단일- 또는 이중-가닥 DNA, 또는 RNA)의 형태로 제공된다. 일부 구현예에서, 공여자 서열은 벡터(예를 들어, 플라스미드, YAC미드, BAC미드, 파지미드, 또는 바이러스 벡터)에 제공된다. 바이러스 벡터의 경우, 바이러스 벡터는 특정 혈청형을 갖는 AAV 바이러스를 포함할 수 있다. 일부 구현예에서, 전술한 공여자 DNA 서열은 바이러스 벡터로 전달된다. 일부 구현예에서, 전술한 바이러스 벡터는 AAV 또는 AAV-6 벡터이다.
일부 양태에서, 본 개시는 글루코코르티코이드-내성 CAR-T 세포의 집단을 제공하며, 집단은: (a) TCR 유전자좌 내에 서열번호 10 내지 15 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열을 포함한다. 일부 구현예에서, 집단은 (b) 인델을 포함하는 NR3C1 유전자좌를 추가로 포함한다. 일부 구현예에서, 전술한 이종 서열은 인델이다. 일부 구현예에서, 전술한 이종 서열은 이종 T-세포 수용체 또는 CAR 분자를 암호화하는 뉴클레오티드 서열을 포함하는 개방 해독 프레임을 포함한다. 일부 구현예에서, 전술한 NR3C1 유전자좌는 서열번호 16, 20, 21 또는 22 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 인델을 포함한다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 전술한 집단 중 세포의 0.2% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 전술한 집단 중 세포의 0.01% 미만은 오프-타겟 유전자좌에서 인델을 갖는다. 일부 구현예에서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석은, HTGTS 검정(고처리량, 게놈-와이트 전좌 시퀀싱; 예를 들어, Chiarle 등의 문헌[Cell. 2011 Sep 30;147(1):107-19. doi: 10.1016/j.cell.2011.07.049] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), LAM-HTGTS 검정(선형 증폭 매개 고처리량 게놈-와이드 시퀀싱; 예를 들어, Hu 등의 문헌[Nat Protoc. 2016. 11(5):853-71. doi:10.1038/nprot.2016.043] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨)), 또는 Digenome-Seq 검정(시험관 내 Cas-소화 전체 게놈 시퀀싱; 예를 들어, Kim 등의 문헌[Nat Methods. 2015. 12(3):237-43. doi:10.1038/nmeth.3284] 참조(이는 모든 목적을 위해 본원에 참조로서 명시적으로 포함됨))을 포함한다. 일부 구현예에서, 전술한 세포 집단에는 염색체 전위가 실질적으로 없다.
일부 양태에서, 본 개시는 본원에 기술된 방법 중 어느 하나에 의해 생산된 세포를 제공한다.
일부 양태에서, 본 개시는 아래의 표 1에 제공된 단백질 서열 또는 뉴클레오티드 서열을 제공한다.
일부 경우, 본원에 기술된 엔도뉴클레아제 중 어느 하나는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 엔도뉴클레아제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 서열번호 25 내지 40 중 어느 하나, 또는 서열번호 25 내지 40 중 어느 하나에 대해 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 변이체에 대해 N-말단 또는 C-말단에 첨부될 수 있다. 일부 경우, NLS는 서열 번호 25 내지 40 중 어느 하나와 실질적으로 동일한 서열을 포함할 수 있다.
일부 경우, 본원에 기술된 엔도뉴클레아제 방법 중 어느 하나는 단일 또는 이중 가닥 DNA 복구 템플릿을 세포에 도입하는 단계를 추가로 포함할 수 있다. 일부 경우, 조작된 뉴클레아제 시스템은 단일 가닥 DNA 복구 템플릿을 추가로 포함한다. 일부 경우, 조작된 뉴클레아제 시스템은 이중 가닥 DNA 복구 템플릿을 추가로 포함한다. 일부 경우에, 단일 또는 이중 가닥 DNA 복구 템플릿은 5'에서 3'까지 다음을 포함할 수 있다: 상기 표적 데옥시리보핵산 서열에 대해 5'에 있는 적어도 20개 뉴클레오티드의 서열을 포함하는 제1 상동 아암, 적어도 10개 뉴클레오티드의 합성 DNA 서열, 및 전술한 표적 서열에 대해 3'에 있는 적어도 20개 뉴클레오티드의 서열을 포함하는 제2 상동 아암.
일부 경우, 제1 상동 아암은 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 적어도 120개, 적어도 130개, 적어도 140개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 250개, 적어도 300개, 적어도 400개, 적어도 500개, 적어도 750개, 또는 적어도 1000개 뉴클레오티드의 서열을 포함한다. 일부 경우, 제2 상동 아암은 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 적어도 120개, 적어도 130개, 적어도 140개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 250개, 적어도 300개, 적어도 400개, 적어도 500개, 적어도 750개, 또는 적어도 1000개 뉴클레오티드의 서열을 포함한다.
일부 경우, 제1 및 제2 상동 아암은 원핵생물의 게놈 서열과 상동이다. 일부 경우, 제1 및 제2 상동 아암은 박테리아의 게놈 서열과 상동이다. 일부 경우, 제1 및 제2 상동 아암은 진균의 게놈 서열과 상동이다. 일부 경우, 제1 및 제2 상동 아암은 진핵생물의 게놈 서열과 상동이다.
일부 경우, 본원에 기술된 엔도뉴클레아제 방법 중 어느 하나는 DNA 복구 템플릿을 세포에 도입하는 단계를 추가로 포함할 수 있다. DNA 복구 템플릿은 이중 가닥 DNA 분절을 포함할 수 있다. 이중 가닥 DNA 분절에는 하나의 단일 가닥 DNA 분절이 측면에 위치할 수 있다. 이중 가닥 DNA 분절에는 2개의 단일 가닥 DNA 분절이 측면에 위치할 수 있다. 일부 경우, 단일 가닥 DNA 분절은 이중 가닥 DNA 분절의 5' 단부에 접합된다. 일부 경우, 단일 가닥 DNA 분절은 이중 가닥 DNA 분절의 3' 단부에 접합된다.
일부 경우, 단일 가닥 DNA 분절은 1 내지 15개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 4 내지 10개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 4개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 5개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 6개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 7개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 8개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 9개 뉴클레오티드 염기의 길이를 갖는다. 일부 경우, 단일 가닥 DNA 분절은 10개 뉴클레오티드 염기의 길이를 갖는다.
일부 경우, 단일 가닥 DNA 분절은 스페이서 서열 내의 서열에 상보적인 뉴클레오티드 서열을 갖는다. 일부 경우, 이중 가닥 DNA 서열은 바코드, 개방 해독 프레임, 인핸서, 프로모터, 단백질 코딩 서열, miRNA 코딩 서열, RNA 코딩 서열, 또는 이식유전자를 포함한다.
일부 경우, 본원에 기술된 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, 또는 MAFFT 알고리즘, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW 알고리즘에 의해 결정될 수 있다. 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, 전술한 BLASTP 상동성 검색 알고리즘에 의해 결정될 수 있다.
본 개시의 시스템 또는 방법은, 예를 들어 핵산 편집(예를 들어, 유전자 편집), 핵산 분자에 대한 결합(예를 들어, 서열-특이적 결합)과 같은 다양한 응용에 사용될 수 있다. 이러한 시스템 또는 방법은, 예를 들어 대상체에서 질환을 유발할 수 있는 유전적으로 물려받은 돌연변이를 처리(예를 들어 제거 또는 치환)하는 데 사용될 수 있고, 세포에서 유전자의 기능을 확실하게 하기 위해 유전자를 불활성화시키는 데 사용될 수 있고, (예를 들어, 역-전사된 바이러스 RNA를 절단하거나 질환-유발 돌연변이를 암호화하는 증폭된 DNA 서열을 절단함으로써) 질환을 유발하는 유전적 요소를 검출하기 위한 진단 도구로서 사용될 수 있고, 특정 뉴클레오티드 서열(예를 들어, 박테리아에서 항생제 내 박테리아를 암호화하는 서열)을 표적화하고 검출하기 위한 프로브와 조합된 비활성화된 효소로서 사용될 수 있고, 바이러스 게놈을 표적화함으로써 바이러스를 불활성화시키거나 바이러스가 숙주 세포를 감염시킬 수 없게 하는 데 사용될 수 있고, 유전자를 추가하거나 대사 경로를 변경하여 유기체가 귀중한 소분자, 거대분자, 또는 이차 대사물을 생산하도록 이를 조작하는 데 사용될 수 있고, 진화적 선택을 위한 유전자 구동 요소를 확립하는 데 사용될 수 있고, 바이오센서로서 외래 소분자 및 뉴클레오티드에 의한 세포 섭동을 검출하는 데 사용될 수 있다.
실시예
실시예 1 - TCAR 유전자좌에서의 편집
본원에 기술된 뉴클레아제를 사용하여 CAR-T 세포(및 이종 T-세포 수용체를 보유하는 다른 T-세포 유사 세포)를 생산하기 위한 워크플로우를 개발하였다(도 1). 이에 따라, T-세포 수용체 유전자좌(예를 들어, TRAC 유전자좌)를 표적화하기 위한 뉴클레아제 복합체를 개발하였다. 클래스 2 II형 엔도뉴클레아제 MG3-6(서열번호 1) 또는 SpCas9 또는 클래스 2, V형 엔도뉴클레아제 MG29-1(서열번호 7)과 조합하여 TRAC 유전자를 표적화하기 위해 스페이서 서열(서열번호 10 내지 15)을 개발하였고, 이를 각 효소에 대해 상응하는 sgRNA 내로 도입하였다(표 1 참조). 각각의 TRAC-표적화 sgRNA를 함유하는 RNP 복합체를 조립하고, CD2/3/28 비드(Miltenyi T 세포 활성화/확장 키트 #130-091-441)를사용한 음성 선택 및 활성화를 사용하여 PBMC로부터 정제한 후(Stemcell Technologies 인간 T 세포 단리 키드 #17951) 4일 동안 배양한 인간 T 세포(프로그램 EO-115 및 P3 완충액을 사용하는 Lonza 4-D Nucleofector를 사용한 200,000개의 T 세포)에 뉴클레오펙션시켰다. TRAC 유전자에서의 인델 형성에 대해 차세대 시퀀싱(NGS)(도 2 좌측), 및 TCR 발현에 대해 유세포 계측법(도 2 우측)을 사용하여, 모의 형질감염된 T 세포와 함께 세포를 분석하였다. NGS 및 유세포 계측법에 의한 분석은 형질감염된 T 세포에서의 인델 형성 또는 T 세포 수용체 발현의 파괴 유도에 있어서, MG3-6 및 MG29-1이 SpCas9와 유사하거나 보다 양호함을 나타냈다.
다음으로, TRAC 유전자좌 내로의 CAR-T 분자의 표적화된 통합을 촉진하기 위해 전술한 RNP 복합체를 사용하는 편집 능력을 시험하였다. 5' 및 3' 상동 아암(예를 들어, 서열번호 23-24)이 측면에 위치한 CAR-T 분자를 포함하는 뉴클레오티드 서열을 포함하는 AAV-6 벡터를 개발하여 TRAC 유전자를 표적화하였다. 전술한 바와 같이 MG29-1 RNP를 사용하는 TRAC 표적화를 수행하였지만, 이에 이어서 형질감염 후 AAV-6 벡터의 100,000 벡터 게놈(vg)을 T 세포에 첨가하였다. 유세포 계측법을 사용하여 TCR 수용체 및 CAR 항원 결합 도메인의 발현에 대해 세포를 분석하였다(도 3). 유세포 계측법은 AAV-엔도뉴클레아제 조합으로 치료한 T 세포의 약 60%가 CAR 항원 결합 도메인을 발현하였음을 나타냈다. TRAC를 표적화하는 MG3-6 및 MG3-8 RNP를 AAV-6/CAR-T 통합 작제물과 조합한 실험에서 이와 유사한 결과를 얻었다.
실시예 2 - TCR-유사 세포에서의 다중 편집
TRAC 유전자좌의 변형(예를 들어, CAR-T 통합)과 조합하여 다른 유전자를 변형시키는 것이 유리할 수 있다. 따라서, 본원에 기술된 뉴클레아제 복합체의 TRAC + 추가 유전자좌를 표적화하는 능력을 결정하였다. 이러한 유전자좌 중 하나는 NR3C1(즉, GR, 또는 글루코코르티코이드 수용체) 유전자좌이며, 이는 CAR-T 세포에 대한 글루코코르티코이드 제제에 대한 비반응성 부여를 파괴하는 데 유리할 수 있다(예를 들어, 글루코코르티코이드로 동시에 치료되고 있는 암 환자의 경우, 또는 글루코코르티코이드 유지를 필요로 하는 자가면역 질환을 가진 암 환자의 경우). 3개의 MG29-1-호환성 표적화 서열(표적 B-D; 서열 번호 20, 21, 22)을 NR3C1 유전자를 표적화하도록 설계하고 MG29-1 가이드 RNA에 통합하였다. 이러한 가이드 RNA를 갖는 MG29-1을 포함하는 RNP 복합체를 조립하였다. T 세포를 전술한 MG29-1/NR3C1 gRNA RNP 복합체 및 MG3-6/TRAC RNP의 다양한 조합의 뉴클레오펙션으로 치료하였다(도 4). 각 유전자좌에서의 인델 형성을 평가하기 위해 NGS를 사용한 뉴클레오펙션 후 세포를 분석하였다. 결과는 상이한 가이드 RNA가 NR3C1 표적화에서 상이한 효율을 갖는 반면("MG29-1 GR-13", "MG29-1 GR-28", "MG29-1 GR-29" 참조), TRAC를 표적화하는 MG3-6 복합체 및 NR3C1을 표적화하는 MG29-1 복합체의 조합은 두 유전자 모두에서 인델 형성을 효율적으로 유도할 수 있음을 나타냈다(도 4의 최우측 조건 참조).
본원에 기술된 뉴클레아제 복합체를 사용하여 2개의 상이한 유전자좌를 표적화하는 능력을 확립한 후, 3개의 유전자좌(예를 들어, TRAC, 유전자좌 B-29/서열번호 16, 유전자좌 C-87/서열번호 17, 유전자좌 C-74/서열번호 18, 또는 유전자좌 C-83/서열번호 19로부터 선택됨)를 표적화하는 능력을, 각각의 유전자좌에 해당하는 RNP 단독으로 그리고 전술한 3개의 조합으로 T 세포 내로 뉴클레오펙션시키고 NGS에 의한 인델 형성을 평가함으로써 평가하였다(도 5). 실험의 결과는 상이한 유전자좌를 표적화하는 3개의 상이한 RNP를 조합한 조건에서도, 3개의 유전자좌 모두에서 인델이 상당한 양으로 생성되었음을 나타냈다.
실시예 3 - 다중 유전자 치환을 이용한 다중 편집
다수의 유전자좌를 편집하고 이식유전자를 적어도 하나의 유전자좌에 통합하는 능력을 확립한 경우, 2개 이상의 유전자좌를 동시에 편집하고 두 유전자좌 모두에서 유전자를 동시에 통합하는 능력을, T 세포 내에서 2개의 상이한 유전자좌를 편집하고 해당 2개의 상이한 유전자좌를 표적화하는 2개의 상이한 공여자 DNA 템플릿을 제공함으로써 시험하였다. AAVS1(안전한 하버) 유전자좌 및 위의 TRAC 유전자좌를 표적 부위로서 선택하였다. 실시예 1 및 2에서와 같이 제조된 일차 T 세포(2 x 105)를 (a) SpCas9(12 pmol) 및 AAVS1 유전자좌를 표적화하는 호환성 sgRNA(60 pmol, 서열번호 41은 스페이서 서열을 나타냄) 및 (b) MG3-6(52 pmol) 및 호환성 TRAC3-6 6 sgRNA(60 pmol, 서열번호 10)의 조합으로 뉴클레오펙션시켰다. 뉴클레오펙션 후, 세포를 각각 50,000의 감염 다중도(MOI)에서의 다음과 같은 2개의 상이한 AAV-6 벡터와 함께 인큐베이션하였다: (a) AAVS1 유전자좌를 표적화하는 5' 및 3' 상동 아암(서열번호 42, 43)이 측면에 위치한 4개의 상이한 이소형의 GR(GR-알파, GR-베타, GR-알파 D3, 및 GR-베타 D3)을 각각 포함하는 이식유전자를 보유하는 벡터; 및 (b) TRAC 유전자좌를 표적화하는 5' 및 3' 상동 아암(서열번호 23-24)이 측면에 위치한 CAR을 보유하는 벡터. 4일 동안 인큐베이션한 후, (a) AAVS1 유전자좌에서의 GR 이식유전자의 존재에 대한 PCR(PCR 설계 및 결과는 도 6 참조), 또는 (b) TRAC 유전자좌에서의 CAR의 통합을 평가하기 위한 CAR 항원 결합 도메인 및 T 세포 수용체에 대한 유세포 계측법에 의해 T 세포를 분석하였다(도 7). PCR 및 유세포 계측법 실험으로부터의 데이터는 두 이식유전자(GR 및 CAR) 모두가 유의미한 성능 손실 없이 동시에 삽입될 수 있음을 나타냈다; 이중 AAVS1/TCR 표적화 조건 하의 GR 이식유전자(도 6b, 중간 4개 레인)에 대한 PCR은 AAVS1 단독 표적화(도 7b, 마지막 4개 레인, 또는 도 7c, 중간 4개 레인)와 유사한 통합 결과를 나타냈으며, TCR에 대한 유세포 분석(도 7a, 7b, 7c, 7d)은 AAVS1이 동시에 표적화되는 경우에서도 CAR의 높은 통합 및 TCR의 손실을 나타냈다.
실시예 4 - 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의한 특이성 분석
게놈-와이드 오프-타겟 이중 가닥 절단 분석을 통해 MG3-6, MG3-8, 및 MG29-1의 표적 특이성을 SpCas9("Cas9")와 함께 평가하였다. 도 8은 그 결과를 나타낸다. 결과는 MG3-6, MG3-8, 및 MG29-1이 Cas9보다 낮은 수준의 오프-타겟 편집을 가짐을 나타냈다.
실시예 5 - T 세포에서의 다중 편집
재조합-TCR-기반 T 세포 생성물의 제조는, a/b 사슬이 항원-특이적 인식을 제공하는 TCR의 서브유닛이기 때문에, T 세포의 풀 내에 TCR의 새롭고 바람직한 알파 및 베타 사슬을 도입하는 것을 필요로 할 수 있다. 이러한 새로운 a/b 사슬은, 이에 이어서 델타/감마/엡실론 사슬과 조립되어 활성인 전장 TCR을 만들 수 있다(도 9 참조). 불행하게도, 이러한 간단한 경우, 기존의 a/b 사슬은 수용자 세포에서 여전히 발현된다. 이는, 기존의 알파가 새로운 베타와 쌍을 이룰 수 있고 새로운 알파가 기존의 베타와 쌍을 이룰 수 있다는 바람직하지 않은 가능성을 제시한다: 예를 들어, 새롭고 바람직한 TCR a/b 사슬은 이들이 함께 쌍을 이루기 위해 "보충"된다는 것을 알지 못한다. 추가의 작용 없이, T 세포는 이제 조작된 특이성을 갖는 4개의 상이한 TCR(a/b, a'/b, a/b', a'/b')을 발현하게 된다. 이는 2가지 문제를 야기한다: i) 이는 새로운 바람직한 TCR의 발현을 4배까지 감소시킴; ii) 2개의 혼성 a/b 쌍(a'/b 및 a/b')은 예측할 수 없고, 잠재적으로 자가 반응하는 방식으로 항원을 인식하므로 자가 면역의 위험을 갖게 됨.
이 실험에서, CD2/3/28 비드로 증식된 일차 T 세포를 Lonza 4D 전기천공기 및 용액 P3을 사용하여, 조건 당 200K 세포로 뉴클레오펙션시키고, 104 pmol의 MG3-6 단백질 및 128 pmol의 가이드 RNA를 전달하거나, V형 효소 MG29-1 또는 MG3-6 및 MG29-1 둘 모두를 동일한 양을 전달하였다. 사용된 MG3-6 가이드는 MG3-6-TRAC-6(서열 번호 44) 및 MG3-6-TRBC(서열 번호 45)였으며; 길이는 22 nt이다. 이들 세포로부터 게놈 DNA를 3일 후에 수확하고 NGS로 분석하였다(도 10 참조). 인델을 갖는 표적화된 부위에서의 서열의 백분율을 나타내는 도 10의 결과는, 두 부위 모두를 표적화하는 RNP가 세포 내로 동시에 도입될 때 이들 세포에서 이중 TRAC/TRBC 녹아웃이 있음을 입증한다.
실시예 6 - 단일-유전자 녹아웃에 대한 유세포 분석에 의한 유전자-편집 결과
제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC(말초 혈액 단핵 세포)로부터 일차 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 RNP(100 pmol 단백질 및 150 pmol 가이드 RNA)의 뉴클레오펙션을 수행하였다. 유세포 계측법에 의한 분석을 위해, 뉴클레오펙션 후 3일차에, 항-CD3 항체 및 항-B2M 항체로 100,000개의 T 세포를 4℃에서 30분 동안 염색하고, Attune Nxt 유세포 계측기를 이용해 분석하였다(도 11). TCR 및 B2M의 녹아웃을 평가하는 4개 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 도 11은: (a) 가장 효율적인 TCR 녹아웃을 생성하는 MG3-6 TRAC6 및 MG3-6 TRBC E2 sgRNA을 사용하여, 모든 TCR 표적화 조건이 TCR 녹아웃을 효율적으로 생산하였고; (b) 가장 효율적인 B2M 녹아웃을 생성하는 B2M H1 및 B2M D2를 사용하여, 모든 B2M 표적화 조건이 B2M 녹아웃을 생성하였음을 도시한다.
실시예 7 - 이중-유전자 녹아웃에 대한 유세포 분석에 의한 유전자-편집 결과
실시예 6에서 TCR/B2M 표적화 조건의 단일 성능을 평가한 후, TRAC 및 B2M 표적화에 대해, 해당 조건의 조합을 사용하여 동시 이중 파괴를 또한 시험하였다(도 12 참조). 제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC로부터 일차 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 RNP(100 pmol 단백질 및 150 pmol 가이드 RNA)의 뉴클레오펙션을 수행하였다. 유세포 계측법에 의한 분석을 위해, 뉴클레오펙션 후 3일차에, 항-CD3 항체 및 항-B2M 항체로 100,000개의 T 세포를 4℃에서 30분 동안 염색하고, Attune Nxt 유세포 계측기를 이용해 분석하였다(도 12). TCR 및 B2M의 녹아웃을 평가하는 4개의 표현형 각각을 함유하는 분석된 세포의 백분율을 나타내는 도 12는, 가장 효율적인 이중 표적화 조건이 MG29-1 B2M H1, D2, 또는 A3 조건을 갖는 MG3-6 TRAC6 조건을 포함하는 A4, B4, 및 C4임을 나타낸다. 가장 효율적인 이중 표적화 조건은, MG3-6 TRAC6 sgRNA 및 MG29-1 B2M D2 sgRNA를 사용한 B4인 것으로 나타났다.
실시예 8 - 삼중-유전자 녹아웃에 대한 유세포 분석에 의한 유전자-편집 결과
실시예 6에서 TCR/B2M 표적화 조건의 단일 성능, 실시예 7에서 이의 이중 성능을 평가한 후, TRAC, TRBC, 및 B2M 표적화에 대해, 해당 조건의 조합을 사용하여 동시 이중 파괴를 또한 시험하였다. 제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC로부터 일차 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 RNP(100 pmol 단백질 및 150 pmol 가이드 RNA)의 뉴클레오펙션을 수행하였다. 유세포 계측법에 의한 분석을 위해, 뉴클레오펙션 후 3일차에, 항-CD3 항체로 100,000개의 T 세포를 4℃에서 30분 동안 염색하고, Attune Nxt 유세포 계측기를 이용해 분석하였다(도 13). 유세포 분석 결과는 조건 B2, E1 및 F1이 녹아웃에 대한 가장 효율적인 삼중-표적화 조건임을 나타낸다.
형질감염 후 5일차에 세포를 수확하고 게놈 DNA를 제조하였다. NGS-기반 DNA 시퀀싱에 사용하기에 적합한 PCR 프라이머를 생성하고, 최적화하고, 이를 사용해 각 가이드 RNA에 대한 개별 표적 서열을 증폭시켰다. Illumina MiSeq 기계를 이용해 앰플리콘을 시퀀싱하고, 독점적인 Python 스크립트로 분석하여 유전자 편집을 측정하였다(도 14). 여기에서의 시퀀싱 결과는 도 13의 결과와 충돌하는데, 이는 인델이 유전자의 기능적 파괴를 반드시 반영하지는 않을 수 있기 때문이다(예컨대, 유세포 계측법에 의해 측정될 것이다).
따라서, 추가 분석을 수행하여(도 15 참조) 시퀀싱에 의한 삼중 녹아웃 세포의 생성을 검증하였다. 도 15는 삼중 녹아웃 세포의 성공적인 생성을 입증하는 데이터를 도시한다. "편집된" 컬럼의 데이터는 도 14로부터 취해졌으며, 여기에서 "야생형" 컬럼의 데이터는 100%에서 편집 백분율을 뺀 것이다. 이중 및 삼중 녹아웃의 최소(Min.) 빈도는 개별 세포에서의 편집 이벤트 사이의 가능한 최소 중첩을 가정하여 계산된다. 따라서, TRBC와 B2M 사이의 최소 이중 녹아웃 빈도는 100%에서 TRBC에 대한 세포 야생형 백분율을 빼고, B2M에 대한 세포 야생형 백분율을 뺀 값이 된다. 따라서, 최소 삼중 녹아웃 빈도는 100%에서 이중 녹아웃을 함유하지 않을 수 있는 세포의 백분율을 빼고, TRAC에 대한 세포 야생형 백분율을 뺀 값이 된다. 관찰된 높은 편집 빈도는 모든 편집 이벤트가 별도의 세포에서 발생했을 가능성을 배제한다. 따라서, 도 15의 데이터는 삼중 녹아웃 TRAC/TRBC/B2M 세포가 성공적으로 생성되었음을 입증한다.
실시예 9 - 편집된 T 세포에서의 GFP 및 표면 마커의 발현
제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC로부터 일차 인간 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 MG3-6 mRNA(500 ng/150 pmol 가이드), MG29-1 RNP(100 pmol/150 pmol 가이드), 및/또는 SpCas9 RNP(12 pmol/60 pmol 가이드)의 뉴클레오펙션을 수행하였다. 뉴클레오펙션 후, AAV-6(50,000 MOI)을 함유하는 배지에서 세포를 즉시 회수하였다. 사용된 AAV 벡터는 다음을 포함한다: (a) MG3-6-TRAC-6(서열번호 64) 또는 MG29-1-TRAC-35(서열번호 65)의 절단 부위에 상응하는 상동 아암이 측면에 위치한 MSCV 프로모터-유도 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 코딩 서열을 전달하는 AAV 벡터; 및 (b) Mali 등의 AAVS1 T2의 절단 부위에 상응하는 상동 아암(서열번호 63)이 측면에 위치한 절단된 버전의 상피 성장 인자 수용체(tEGFR)와 함께 GFP를 암호화하는 MND 프로모터-유도 폴리시스트론 작제물을 전달하는 AAV 벡터. 형질감염 후 4일차에, 생존력(Live/Dead Fixable Aqua Cell Stain Kit; ThermoFisher Scientific) 및 tLNGFR(CD271)(VioBlue REAfinity??, 클론 REA844; Miltenyi Biotech), tEGFR(Cetuximab Biosimilar, AlexaFluor ® 647, 클론 Hu1; R&D Systems) 및 TCR a/b(Brilliant Violet 785, 클론 IP26; BioLegend)의 발현에 대해 100,000개의 세포를 염색하였다. 세포를 4°C에서 30분 동안 염색하고, Attune NxT 유세포 분석기 상에서 데이터를 수득하였다. tLNGFR, GFP, tEGFR, 및/또는 TCR a/b를 발현하는 세포를 단일 세포, 생존 세포에 대해 게이팅하였다(도 16).
실시예 10 - 편집된 T 세포에서 AAVS1 부위에서의 인델 분석
제조사의 권장 지침에 따라 음성 선택 키트(Miltenyi)를 사용하여 PMBC로부터 일차 T 세포를 정제하였다. Lonza 4D 전기천공기를 사용하여, T 세포(200,000) 내로의 MG3-6 mRNA(500 ng/150 pmol 가이드), MG29-1 RNP(100 pmol/150 pmol 가이드), 및/또는 SpCas9 RNP(12 pmol/60 pmol 가이드)의 뉴클레오펙션을 수행하였다. 뉴클레오펙션 후, AAV-6(50,000 MOI)을 함유하는 배지에서 세포를 즉시 회수하였다. 사용된 AAV 벡터는, MG3-6-TRAC-6 또는 MG29-1-TRAC-35의 절단 부위에 상응하는 상동 아암이 측면에 위치한 MSCV 프로모터-유도 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 코딩 서열, GFP를 암호화하는 MND 프로모터-유도 폴리시스트론 작제물, 및 Mali 등의 AAVS1 T2의 절단 부위에 상응하는 상동 아암이 측면에 위치한 절단된 버전의 상피 성장 인자 수용체(tEGFR)를 포함한다. 형질감염 후 4일차에 세포를 수확하고 게놈 DNA를 제조하였다. NGS-기반 DNA 시퀀싱에 사용하기에 적합한 PCR 프라이머를 생성하고, 최적화하고, 이들 실험에 사용된 상이한 AAVS1 부위 특이적 RNA 가이드의 표적 부위를 포함하는 영역을 증폭시키는 데 사용하였다. Illumina MiSeq 기계를 이용해 앰플리콘을 시퀀싱하고, 독점적인 Python 스크립트로 분석하여 유전자 편집을 측정하였다(도 17 참조). 결과는 TRAC 및 AAVS1에 대한 가장 효율적인 이중 표적화 조건이 sgRNA F3을 갖는 MG29-1 및 sgRNA TRAC3-6 #6을 갖는 MG3-6과 관련된 조건임을 나타냈다.
본 발명의 바람직한 구현예가 본원에 도시되고 기술되었지만, 이러한 구현예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명은 본 명세서 내에 제공된 특정 실시예에 의해 한정되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 기술되었지만, 본원의 구현예의 설명 및 예시는 한정적인 의미로 해석되는 것을 의미하지는 않는다. 이제 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 것이다. 또한, 본 발명의 모든 양태는 다양한 조건 및 변수에 따라 달라지는 본원에 제시된 특정 도시, 구성, 또는 상대 비율로 한정되지 않음을 이해할 것이다. 본원에 기술된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는 데 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변형, 변이, 또는 균등물도 포괄하는 것으로 고려된다. 다음의 청구범위는 본 발명의 범위를 정의하고, 이들 청구범위의 범위에 속하는 방법 및 구조와 이들의 등가물이 이에 의해 포괄되는 것으로 의도된다.
SEQUENCE LISTING
<110> METAGENOMI, INC.
<120> MULTIPLEX EDITING WITH CAS ENZYMES
<130> 55921-719.601
<140>
<141>
<150> 63/241,916
<151> 2021-09-08
<150> 63/186,506
<151> 2021-05-10
<150> 63/163,510
<151> 2021-03-19
<160> 65
<170> PatentIn version 3.5
<210> 1
<211> 1132
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG3-6 protein sequence (Class 2, type II)
<400> 1
Met Ser Ala Asp Ser Leu Asn Tyr Arg Ile Gly Val Asp Val Gly Asp
1 5 10 15
Arg Ser Val Gly Leu Ala Ala Ile Glu Leu Asp Asp Asp Gly Phe Pro
20 25 30
Leu Lys Lys Leu Ala Met Val Thr Phe Arg His Asp Gly Gly Lys Asp
35 40 45
Pro Ala Thr Gly Lys Thr Pro Lys Ser Arg Lys Glu Thr Ala Gly Val
50 55 60
Ala Arg Arg Thr Met Arg Met Arg Arg Arg Lys Lys Lys Arg Leu Lys
65 70 75 80
Asp Leu Asp Lys Lys Leu Arg Asp Leu Gly Tyr Phe Val Pro Arg Asp
85 90 95
Glu Glu Pro Gln Thr Tyr Glu Ala Trp Ser Ser Arg Ala Arg Leu Ala
100 105 110
Glu Ser Arg Phe Glu Asp Pro His Glu Arg Gly Glu His Leu Val Arg
115 120 125
Ala Val Arg His Met Ala Arg His Arg Gly Trp Arg Asn Pro Trp Trp
130 135 140
Ser Phe Ser Gln Leu Glu Glu Ala Ser Gln Glu Pro Ser Glu Thr Phe
145 150 155 160
Gly Arg Ile Leu Glu Arg Ala Gln His Glu Trp Gly Glu Arg Val Ser
165 170 175
Asp Asn Ala Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Asn
180 185 190
Ile Leu Leu Arg Pro Arg Arg Tyr Glu His Asn Pro Lys Thr Gly Lys
195 200 205
Asn Ala Glu Lys Leu Asn Val Arg Gly Gln Glu Pro Ile Leu Leu Asp
210 215 220
Lys Val Arg Gln Glu Asp Val Leu Ala Glu Leu Arg Arg Ile Cys Lys
225 230 235 240
Val Gln Gly Ile Glu Asp Gln Tyr Pro Glu Leu Ala His Ala Val Phe
245 250 255
Thr Gln Val Arg Pro Tyr Val Pro Thr Glu Arg Val Gly Lys Asp Pro
260 265 270
Leu Gln Pro Met Lys Ile Arg Ala Ser Arg Ala Ser Leu Glu Phe Gln
275 280 285
Glu Phe Arg Ile Arg Asp Ala Val Ala Asn Leu Arg Ile Arg Val Gly
290 295 300
Gly Ser Glu Arg Arg Pro Leu Thr Glu Glu Glu Tyr Asp Arg Ala Val
305 310 315 320
Asp Tyr Leu Met Glu Tyr Ser Asp Thr Thr Pro Pro Thr Trp Gly Glu
325 330 335
Val Ala Asp Glu Leu Glu Ile Ala Glu Asn Thr Leu Ile Ala Pro Val
340 345 350
Ile Asp Asp Val Arg Leu Asn Val Ala Pro Tyr Asp Arg Ser Ser Ala
355 360 365
Ile Val Glu Ala Lys Leu Lys Arg Lys Thr Gln Ala Arg Gln Trp Trp
370 375 380
Asp Asp Asp Ala Asn Leu Asp Leu Arg Ser Gln Leu Ile Leu Leu Val
385 390 395 400
Ser Asp Ala Thr Asp Asp Thr Ala Arg Val Ala Glu Asn Ser Gly Leu
405 410 415
Leu Glu Val Phe Glu Ser Trp Ser Asp Glu Glu Lys Gln Thr Leu Gln
420 425 430
Asp Leu Lys Phe Asp Ser Gly Arg Ala Ala Tyr Ser Ile Asp Thr Leu
435 440 445
Asn Lys Leu Asn Ala Tyr Met His Glu His Arg Val Gly Leu His Glu
450 455 460
Ala Arg Gln Asn Val Phe Gly Val Ser Asp Thr Trp Arg Pro Pro Arg
465 470 475 480
Asp Arg Leu Asp Glu Pro Thr Gly Gln Pro Thr Val Asp Arg Val Leu
485 490 495
Thr Ile Val Arg Arg Phe Ile Leu Asp Cys Glu Arg Ala Trp Gly Arg
500 505 510
Pro Gln Lys Ile Val Val Glu His Ala Arg Thr Gly Leu Met Gly Pro
515 520 525
Ser Gln Arg Ala Asp Val Leu Lys Glu Ile Ala Arg Asn Arg Asn Ala
530 535 540
Asn Glu Arg Ile Arg Gln Glu Leu Arg Glu Gly Gly Ile Glu Ala Pro
545 550 555 560
Asn Arg Ala Asp Ile Arg Arg Asn Ser Ile Ile Gln Asp Gln Glu Ser
565 570 575
Gln Cys Leu Tyr Cys Gly Lys Glu Ile Gly Val Leu Thr Ala Glu Leu
580 585 590
Asp His Ile Val Pro Arg Ala Gly Gly Gly Ser Ser Lys Arg Glu Asn
595 600 605
Leu Ala Ala Val Cys Arg Ala Cys Asn Ala Ser Lys Gly Ser Arg Pro
610 615 620
Phe Ala Val Trp Ala Gly Pro Ala Arg Leu Glu Arg Thr Ile Gln Arg
625 630 635 640
Leu Arg Glu Leu Gln Ala Phe Lys Thr Lys Ser Lys Lys Arg Thr Leu
645 650 655
Asn Ala Ile Ile Arg Arg Leu Lys Gln Arg Glu Glu Asp Glu Pro Ile
660 665 670
Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr Ala Ala Thr Ser Ile Arg
675 680 685
Glu Arg Leu Glu Gln His Phe Asn Asp Asp Leu Pro Asp Gly Phe Ala
690 695 700
Pro Val Ala Val Asp Val Tyr Gly Gly Ser Leu Thr Arg Glu Ser Arg
705 710 715 720
Arg Ala Gly Gly Ile Asp Lys Ser Ile Met Leu Arg Gly Gln Ser Asp
725 730 735
Lys Asn Arg Phe Asp Val Arg His His Ala Ile Asp Ala Ala Val Met
740 745 750
Thr Leu Leu Asn Pro Ser Val Ala Val Thr Leu Glu Gln Arg Arg Met
755 760 765
Leu Lys Gln Glu Asn Asp Tyr Ser Ser Pro Arg Gly Gln His Asp Asn
770 775 780
Gly Trp Arg Asp Phe Ile Gly Arg Gly Glu Ala Ser Gln Ser Lys Phe
785 790 795 800
Leu His Trp Lys Lys Thr Ala Val Val Leu Ala Asp Leu Ile Ser Glu
805 810 815
Ala Ile Glu Gln Asp Thr Ile Pro Val Val Asn Pro Leu Arg Leu Arg
820 825 830
Pro Gln Asn Gly Ser Val His Lys Asp Thr Val Glu Ala Val Leu Glu
835 840 845
Arg Thr Val Gly Asp Ser Trp Thr Asp Lys Gln Val Ser Arg Ile Val
850 855 860
Asp Pro Asn Thr Tyr Ile Ala Phe Leu Ser Leu Leu Gly Arg Lys Lys
865 870 875 880
Glu Leu Asp Ala Asp His Gln Arg Leu Val Ser Val Ser Ala Gly Val
885 890 895
Lys Leu Leu Ala Asp Glu Arg Val Gln Ile Phe Pro Glu Glu Ala Ala
900 905 910
Ser Ile Leu Thr Pro Arg Gly Val Val Lys Ile Gly Asp Ser Ile His
915 920 925
His Ala Arg Leu Tyr Gly Trp Lys Asn Gln Arg Gly Asp Ile Gln Val
930 935 940
Gly Met Leu Arg Val Phe Gly Ala Glu Phe Pro Trp Phe Met Arg Glu
945 950 955 960
Ser Gly Val Lys Asp Ile Leu Arg Val Pro Ile Pro Gln Gly Ser Gln
965 970 975
Ser Tyr Arg Asp Leu Ala Ala Thr Thr Arg Lys Phe Ile Glu Asn Gly
980 985 990
Gln Ala Thr Glu Phe Gly Trp Ile Thr Gln Asn Asp Glu Ile Glu Ile
995 1000 1005
Ser Ala Glu Glu Tyr Leu Ala Thr Asp Lys Gly Asp Ile Leu Ser
1010 1015 1020
Asp Phe Leu Gly Ile Leu Pro Glu Ile Arg Trp Lys Val Thr Gly
1025 1030 1035
Ile Glu Asp Asn Arg Arg Ile Arg Leu Arg Pro Leu Leu Leu Ser
1040 1045 1050
Ser Glu Ala Ile Pro Asn Met Leu Asn Gly Arg Leu Leu Thr Gln
1055 1060 1065
Glu Glu His Asp Leu Ile Ala Leu Val Ile Asn Lys Gly Val Arg
1070 1075 1080
Val Val Val Ser Thr Phe Leu Ala Leu Pro Ser Thr Lys Ile Ile
1085 1090 1095
Arg Arg Asn Asn Leu Gly Ile Pro Arg Trp Arg Gly Asn Gly His
1100 1105 1110
Leu Pro Thr Ser Leu Asp Ile Gln Arg Ala Ala Thr Gln Ala Leu
1115 1120 1125
Glu Gly Arg Asp
1130
<210> 2
<211> 7
<212> RNA
<213> Unknown
<220>
<223> Description of Unknown:
MG3-6 consensus 3' PAM with sgRNA
<220>
<221> modified_base
<222> (1)..(2)
<223> a, c, u, g, unknown or other
<400> 2
nnrgryy 7
<210> 3
<211> 110
<212> RNA
<213> Unknown
<220>
<223> Description of Unknown:
MG3-6 sgRNA
<220>
<221> modified_base
<222> (1)..(22)
<223> a, c, u, g, unknown or other
<400> 3
nnnnnnnnnn nnnnnnnnnn nnguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110
<210> 4
<211> 1132
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG3-8 protein sequence (Class 2, type II)
<400> 4
Met Ser Thr Asp Met Lys Asn Tyr Arg Ile Gly Val Asp Val Gly Asp
1 5 10 15
Arg Ser Val Gly Leu Ala Ala Ile Glu Phe Asp Asp Ala Gly Phe Pro
20 25 30
Ile Gln Lys Leu Ala Leu Val Thr Phe Arg His Asp Gly Gly Leu Asp
35 40 45
Pro Thr Asp Asn Pro Lys Ser Arg Lys Glu Thr Arg Gly Glu Ala Arg
50 55 60
Arg Arg Met Arg Met Thr Arg Arg Arg Lys Gln Arg Leu Arg Asp Leu
65 70 75 80
Asp Lys Val Leu Glu Asn Leu Gly Tyr Thr Val Pro Glu Gly Pro Glu
85 90 95
Pro Glu Thr Tyr Glu Ala Trp Thr Ser Arg Ala Leu Leu Ala Ser Ile
100 105 110
Lys Leu Ala Ser Ala Asp Glu Leu Asn Glu His Leu Val Arg Ala Val
115 120 125
Arg His Ile Ala Arg His Arg Gly Trp Val Asn Pro Trp Trp Ser Leu
130 135 140
Asp Gln Leu Glu Arg Ala Ser Gln Glu Pro Ser Glu Thr Phe Glu Ile
145 150 155 160
Ile Leu Ala Arg Ala Arg Glu Leu Phe Gly Glu Arg Val Pro Ala Asn
165 170 175
Pro Thr Leu Gly Met Leu Gly Ala Leu Ala Ala Asn Asn Glu Val Leu
180 185 190
Leu Arg Pro Arg Ala Glu Lys Lys Lys Lys Thr Gly Tyr Val Arg Gly
195 200 205
Thr Pro Leu Leu Ala Ala Gln Val Arg Gln Ile Asp Gln Val Ala Glu
210 215 220
Leu Arg Arg Ile Cys Glu Val Gln Gly Ile Glu Glu Gln Tyr Glu Thr
225 230 235 240
Leu Arg Asn Ala Ile Phe Ala His Lys Val Ala Tyr Val Pro Thr Glu
245 250 255
Arg Val Gly Lys Asp Pro Leu Ala Pro Ser Lys Asn Arg Thr Ile Arg
260 265 270
Ala Ser Leu Glu Phe Gln Glu Phe Arg Ile Leu Asp Ser Val Ala Asn
275 280 285
Leu Arg Val Arg Thr Asp Ser Arg Ala Lys Arg Glu Leu Thr Glu Gly
290 295 300
Glu Tyr Asp Ala Ala Val Glu Phe Leu Met Gly Tyr Thr Ala Lys Glu
305 310 315 320
Gln Pro Ser Trp Ala Asp Val Ala Glu Glu Ile Gly Val Pro Gly Asn
325 330 335
Arg Leu Ile Ala Pro Val Leu Glu Asp Val Gln Gln Lys Thr Ala Pro
340 345 350
Phe Asp Arg Ser Ser Ala Ala Phe Glu Lys Ala Met Ser Lys Arg Thr
355 360 365
Glu Ala Arg Gln Trp Trp Glu Ala Asn Asp Asp Asp Gln Leu Arg Ser
370 375 380
Leu Phe Ile Met Phe Leu Ala Asp Ala Thr Asn Asp Thr Glu Glu Ala
385 390 395 400
Ala Ala Val Ala Gly Leu Pro Glu Leu Tyr Met Ser Trp Pro Ala Glu
405 410 415
Glu Arg Glu Ala Leu Ser Asn Ile Asp Phe Glu Lys Gly Arg Val Ala
420 425 430
Tyr Ser His Glu Thr Leu Ser Lys Leu Ser Glu Tyr Met His Glu His
435 440 445
Arg Val Gly Leu His Glu Ala Arg Lys Ala Val Phe Gly Val Asp Asp
450 455 460
Thr Trp Arg Pro Pro Leu Ala Lys Leu Glu Glu Pro Thr Gly Gln Pro
465 470 475 480
Thr Val Asp Arg Val Leu Thr Ile Leu Arg Arg Phe Val Leu Asp Cys
485 490 495
Glu Arg Gln Trp Gly Arg Pro Arg Ala Ile Thr Val Glu His Ala Arg
500 505 510
Ile Gly Leu Val Gly Pro Ala Gln Arg Gln Asn Ile Leu Lys Glu Gln
515 520 525
Glu Asp Asn Arg Lys Asn Asn Glu Cys Ile Arg Asp Glu Leu Arg Lys
530 535 540
Ser Gly Val Glu Asn Pro Ser Arg Thr Glu Val Arg Arg His Leu Val
545 550 555 560
Val Gln Asp Gln Glu Ser Gln Cys Leu Tyr Cys Gly Ala Val Ile Arg
565 570 575
Thr Asp Thr Ser Glu Leu Asp His Ile Val Pro Arg Ala Gly Gly Gly
580 585 590
Ser Ser Arg Arg Glu Asn Leu Ala Ala Val Cys Arg Tyr Cys Asn Ser
595 600 605
Lys Lys Asp Arg Thr Leu Phe Tyr Asp Trp Ala Gly Ser Val Arg Leu
610 615 620
Gln Glu Thr Ile Asp Arg Val Arg Gln Leu Lys Ala Phe Lys Asp Ser
625 630 635 640
Lys Lys Ala Lys Met Phe Lys Asn Gln Ile Arg Arg Leu Arg Gln Thr
645 650 655
Glu Ala Asp Glu Pro Ile Asp Glu Arg Ser Leu Ala Ser Thr Ser Tyr
660 665 670
Ala Ala Val Ala Val Arg Glu Arg Leu Glu Gln His Phe Asn Glu Gly
675 680 685
Leu Ala Pro Asp Asp Lys Asn Arg Val Val Leu Asp Val Tyr Ala Gly
690 695 700
Ser Val Thr Arg Glu Ser Arg Arg Ala Gly Gly Ile Asp Glu Arg Ile
705 710 715 720
Leu Leu Arg Gly Glu Arg Asp Lys Asn Arg Phe Asp Val Arg His His
725 730 735
Ala Ile Asp Ala Ala Val Met Thr Leu Leu Asn Arg Ser Val Ala Leu
740 745 750
Thr Leu Glu Gln Arg Ser Gln Leu Arg Arg Ala Phe Tyr Glu Gln Gly
755 760 765
Leu Asp Lys Leu Asp Arg Asp Gln Leu Lys Pro Glu Glu Asp Trp Arg
770 775 780
Asn Phe Ile Gly Leu Ser Leu Ala Ser Gln Glu Lys Phe Leu Glu Trp
785 790 795 800
Lys Lys Val Thr Thr Val Leu Gly Asp Leu Leu Ala Glu Ala Ile Glu
805 810 815
Asp Asp Ser Ile Ala Val Val Ser Pro Leu Arg Leu Arg Pro Gln Asn
820 825 830
Gly Arg Val His Lys Asp Thr Ile Ala Ala Val Lys Lys Gln Thr Leu
835 840 845
Gly Ser Ala Trp Ser Ala Asp Ala Val Lys Arg Ile Val Asp Pro Glu
850 855 860
Ile Tyr Leu Ala Met Lys Asp Ala Leu Gly Lys Ser Lys Val Leu Pro
865 870 875 880
Glu Asp Ser Ala Arg Thr Leu Glu Leu Ser Asp Gly Arg Tyr Leu Glu
885 890 895
Ala Asp Asp Glu Val Leu Phe Phe Pro Lys Asn Ala Ala Ser Ile Leu
900 905 910
Thr Pro Arg Gly Val Ala Glu Ile Gly Gly Ser Ile His His Ala Arg
915 920 925
Leu Tyr Ser Trp Leu Thr Lys Lys Gly Glu Leu Lys Ile Gly Met Leu
930 935 940
Arg Val Tyr Gly Ala Glu Phe Pro Trp Leu Met Arg Glu Ser Gly Ser
945 950 955 960
His Asp Val Leu Arg Met Pro Ile His Pro Gly Ser Gln Ser Phe Arg
965 970 975
Asp Met Gln Asp Thr Thr Arg Lys Ala Val Glu Ser Ser Glu Ala Val
980 985 990
Glu Phe Ala Trp Ile Thr Gln Asn Asp Glu Leu Glu Phe Glu Pro Glu
995 1000 1005
Asp Tyr Ile Ala His Gly Gly Lys Asp Glu Leu Arg Gln Phe Leu
1010 1015 1020
Glu Phe Met Pro Glu Cys Arg Trp Arg Val Asp Gly Phe Lys Lys
1025 1030 1035
Asn Tyr Gln Ile Arg Ile Arg Pro Ala Met Leu Ser Arg Glu Gln
1040 1045 1050
Leu Pro Ser Asp Ile Gln Arg Arg Leu Glu Ser Lys Thr Leu Thr
1055 1060 1065
Glu Asn Glu Ser Leu Leu Leu Lys Ala Leu Asp Thr Gly Leu Val
1070 1075 1080
Val Ala Ile Gly Gly Leu Leu Pro Leu Gly Thr Leu Lys Val Ile
1085 1090 1095
Arg Arg Asn Asn Leu Gly Phe Pro Arg Trp Arg Gly Asn Gly Asn
1100 1105 1110
Leu Pro Thr Ser Phe Glu Val Arg Ser Ser Ala Leu Arg Ala Leu
1115 1120 1125
Gly Val Glu Gly
1130
<210> 5
<211> 7
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
MG3-8 consensus 3'PAM
<220>
<221> modified_base
<222> (1)..(2)
<223> a, c, t, g, unknown or other
<400> 5
nnrgrty 7
<210> 6
<211> 110
<212> RNA
<213> Unknown
<220>
<223> Description of Unknown:
MG3-8 sgRNA
<220>
<221> modified_base
<222> (1)..(22)
<223> a, c, u, g, unknown or other
<400> 6
nnnnnnnnnn nnnnnnnnnn nnguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc ggcuccucuu aggaacgggc gguauguuuu 110
<210> 7
<211> 1280
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
MG29-1 (Class 2, type V-A Cas effector, Cas12a class) protein
sequence
<400> 7
Met Phe Asn Asn Phe Ile Lys Lys Tyr Ser Leu Gln Lys Thr Leu Arg
1 5 10 15
Phe Glu Leu Lys Pro Val Gly Glu Thr Ala Asp Tyr Ile Glu Asp Phe
20 25 30
Lys Ser Glu Tyr Leu Lys Asp Thr Val Leu Lys Asp Glu Gln Arg Ala
35 40 45
Lys Asp Tyr Gln Glu Ile Lys Thr Leu Ile Asp Asp Tyr His Arg Glu
50 55 60
Tyr Ile Glu Glu Cys Leu Arg Glu Pro Val Asp Lys Lys Thr Gly Glu
65 70 75 80
Ile Leu Asp Phe Thr Gln Asp Leu Glu Asp Ala Phe Ser Tyr Tyr Gln
85 90 95
Lys Leu Lys Glu Asn Pro Thr Glu Asn Arg Val Gly Trp Glu Lys Glu
100 105 110
Gln Glu Ser Leu Arg Lys Lys Leu Val Thr Ser Phe Val Gly Asn Asp
115 120 125
Gly Leu Phe Lys Lys Glu Phe Ile Thr Arg Asp Leu Pro Glu Trp Leu
130 135 140
Gln Lys Lys Gly Leu Trp Gly Glu Tyr Lys Asp Thr Val Glu Asn Phe
145 150 155 160
Lys Lys Phe Thr Thr Tyr Phe Ser Gly Phe His Glu Asn Arg Lys Asn
165 170 175
Met Tyr Thr Ala Glu Ala Gln Ser Thr Ala Ile Ala Asn Arg Leu Met
180 185 190
Asn Asp Asn Leu Pro Lys Phe Phe Asn Asn Tyr Leu Ala Tyr Gln Thr
195 200 205
Ile Lys Glu Lys His Pro Asp Leu Val Phe Arg Leu Asp Asp Ala Leu
210 215 220
Leu Gln Ala Ala Gly Val Glu His Leu Asp Glu Ala Phe Gln Pro Arg
225 230 235 240
Tyr Phe Ser Arg Leu Phe Ala Gln Ser Gly Ile Thr Ala Phe Asn Glu
245 250 255
Leu Ile Gly Gly Arg Thr Thr Glu Asn Gly Glu Lys Ile Gln Gly Leu
260 265 270
Asn Glu Gln Ile Asn Leu Tyr Arg Gln Gln Asn Pro Glu Lys Ala Lys
275 280 285
Gly Phe Pro Arg Phe Met Pro Leu Phe Lys Gln Ile Leu Ser Asp Arg
290 295 300
Glu Thr His Ser Phe Leu Pro Asp Ala Phe Glu Asn Asp Lys Glu Leu
305 310 315 320
Leu Gln Ala Leu Arg Asp Tyr Val Asp Ala Ala Thr Ser Glu Glu Gly
325 330 335
Met Ile Ser Gln Leu Asn Lys Ala Met Asn Gln Phe Val Thr Ala Asp
340 345 350
Leu Lys Arg Val Tyr Ile Lys Ser Ala Ala Leu Thr Ser Leu Ser Gln
355 360 365
Glu Leu Phe His Phe Phe Gly Val Ile Ser Asp Ala Ile Ala Trp Tyr
370 375 380
Ala Glu Lys Arg Leu Ser Pro Lys Lys Ala Gln Glu Ser Phe Leu Lys
385 390 395 400
Gln Glu Val Tyr Ala Ile Glu Glu Leu Asn Gln Ala Val Val Gly Tyr
405 410 415
Ile Asp Gln Leu Glu Asp Gln Ser Glu Leu Gln Gln Leu Leu Val Asp
420 425 430
Leu Pro Asp Pro Gln Lys Pro Val Ser Ser Phe Ile Leu Thr His Trp
435 440 445
Gln Lys Ser Gln Glu Pro Leu Gln Ala Val Ile Ala Lys Val Glu Pro
450 455 460
Leu Phe Glu Leu Glu Glu Leu Ser Lys Asn Lys Arg Ala Pro Lys His
465 470 475 480
Asp Lys Asp Gln Gly Gly Glu Gly Phe Gln Gln Val Asp Ala Ile Lys
485 490 495
Asn Met Leu Asp Ala Phe Met Glu Val Ser His Ala Ile Lys Pro Leu
500 505 510
Tyr Leu Val Lys Gly Arg Lys Ala Ile Asp Met Pro Asp Val Asp Thr
515 520 525
Gly Phe Tyr Ala Asp Phe Ala Glu Ala Tyr Ser Ala Tyr Glu Gln Val
530 535 540
Thr Val Ser Leu Tyr Asn Lys Thr Arg Asn His Leu Ser Lys Lys Pro
545 550 555 560
Phe Ser Lys Asp Lys Ile Lys Ile Asn Phe Asp Ala Pro Thr Leu Leu
565 570 575
Asn Gly Trp Asp Leu Asn Lys Glu Ser Asp Asn Lys Ser Ile Ile Leu
580 585 590
Arg Lys Asp Gly Asn Phe Tyr Leu Ala Ile Met His Pro Lys His Thr
595 600 605
Lys Val Phe Asp Cys Tyr Ser Ala Ser Glu Ala Ala Gly Lys Cys Tyr
610 615 620
Glu Lys Met Asn Tyr Lys Leu Leu Ser Gly Ala Asn Lys Met Leu Pro
625 630 635 640
Lys Val Phe Phe Ser Lys Lys Gly Ile Glu Thr Phe Ser Pro Pro Gln
645 650 655
Glu Ile Leu Asp Leu Tyr Lys Asn Asn Glu His Lys Lys Gly Ala Thr
660 665 670
Phe Lys Leu Glu Ser Cys His Lys Leu Ile Asp Phe Phe Lys Arg Asn
675 680 685
Ile Pro Lys Tyr Lys Val His Pro Thr Asp Asn Phe Gly Trp Asp Val
690 695 700
Phe Gly Phe His Phe Ser Pro Thr Ser Ser Tyr Gly Asp Leu Ser Gly
705 710 715 720
Phe Tyr Arg Glu Val Glu Ala Gln Gly Tyr Lys Leu Trp Phe Ser Asp
725 730 735
Val Ser Glu Ala Tyr Ile Asn Lys Cys Val Glu Glu Gly Lys Leu Phe
740 745 750
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Pro Asn Ser Thr Gly Lys
755 760 765
Pro Asn Leu His Thr Leu Tyr Trp Lys Gly Leu Phe Glu Pro Glu Asn
770 775 780
Leu Lys Asp Val Val Leu Lys Leu Asn Gly Glu Ala Glu Ile Phe Tyr
785 790 795 800
Arg Lys His Ser Ile Lys His Glu Asp Lys Thr Ile His Arg Ala Lys
805 810 815
Asp Pro Ile Ala Asn Lys Asn Ala Asp Asn Pro Lys Lys Gln Ser Val
820 825 830
Phe Asp Tyr Asp Ile Ile Lys Asp Lys Arg Tyr Thr Gln Asp Lys Phe
835 840 845
Phe Phe His Val Pro Ile Ser Leu Asn Phe Lys Ser Gln Gly Val Val
850 855 860
Arg Phe Asn Asp Lys Ile Asn Gly Leu Leu Ala Ala Gln Asp Asp Val
865 870 875 880
His Val Ile Gly Ile Asp Arg Gly Glu Arg His Leu Leu Tyr Tyr Thr
885 890 895
Val Val Asn Gly Lys Gly Glu Val Val Glu Gln Gly Ser Leu Asn Gln
900 905 910
Val Ala Thr Asp Gln Gly Tyr Val Val Asp Tyr Gln Gln Lys Leu His
915 920 925
Ala Lys Glu Lys Glu Arg Asp Gln Ala Arg Lys Asn Trp Ser Thr Ile
930 935 940
Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Leu Ser Gln Val Val His
945 950 955 960
Lys Leu Ala Gln Leu Ile Val Lys His Asn Ala Ile Val Cys Leu Glu
965 970 975
Asp Leu Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln
980 985 990
Val Tyr Gln Lys Phe Glu Lys Ala Leu Ile Asp Lys Leu Asn Tyr Leu
995 1000 1005
Val Phe Lys Glu Arg Gly Ala Thr Gln Ala Gly Gly Tyr Leu Asn
1010 1015 1020
Ala Tyr Gln Leu Ala Ala Pro Phe Glu Ser Phe Glu Lys Leu Gly
1025 1030 1035
Lys Gln Thr Gly Ile Leu Tyr Tyr Val Arg Ser Asp Tyr Thr Ser
1040 1045 1050
Lys Ile Asp Pro Ala Thr Gly Phe Val Asp Phe Leu Lys Pro Lys
1055 1060 1065
Tyr Glu Ser Met Ala Lys Ser Lys Val Phe Phe Glu Ser Phe Glu
1070 1075 1080
Arg Ile Gln Trp Asn Gln Ala Lys Gly Tyr Phe Glu Phe Glu Phe
1085 1090 1095
Asp Tyr Lys Lys Met Cys Pro Ser Arg Lys Phe Gly Asp Tyr Arg
1100 1105 1110
Thr Arg Trp Val Val Cys Thr Phe Gly Asp Thr Arg Tyr Gln Asn
1115 1120 1125
Arg Arg Asn Lys Ser Ser Gly Gln Trp Glu Thr Glu Thr Ile Asp
1130 1135 1140
Val Thr Ala Gln Leu Lys Ala Leu Phe Ala Ala Tyr Gly Ile Thr
1145 1150 1155
Tyr Asn Gln Glu Asp Asn Ile Lys Asp Ala Ile Ala Ala Val Lys
1160 1165 1170
Tyr Thr Lys Phe Tyr Lys Gln Leu Tyr Trp Leu Leu Arg Leu Thr
1175 1180 1185
Leu Ser Leu Arg His Ser Val Thr Gly Thr Asp Glu Asp Phe Ile
1190 1195 1200
Leu Ser Pro Val Ala Asp Glu Asn Gly Val Phe Phe Asp Ser Arg
1205 1210 1215
Lys Ala Thr Asp Lys Gln Pro Lys Asp Ala Asp Ala Asn Gly Ala
1220 1225 1230
Tyr His Ile Ala Leu Lys Gly Leu Trp Asn Leu Gln Gln Ile Arg
1235 1240 1245
Gln His Asp Trp Asn Val Glu Lys Pro Lys Lys Leu Asn Leu Ala
1250 1255 1260
Met Lys Asn Glu Glu Trp Phe Gly Phe Ala Gln Lys Lys Lys Phe
1265 1270 1275
Arg Ala
1280
<210> 8
<211> 4
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
MG29-1 consensus 5' PAM
<220>
<221> modified_base
<222> (4)..(4)
<223> a, c, t, g, unknown or other
<400> 8
tttn 4
<210> 9
<211> 44
<212> RNA
<213> Unknown
<220>
<223> Description of Unknown:
MG29-1 crRNA
<220>
<221> modified_base
<222> (21)..(44)
<223> a, c, u, g, unknown or other
<400> 9
uaauuucuac uguuguagau nnnnnnnnnn nnnnnnnnnn nnnn 44
<210> 10
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> MG3-6-TRAC-6-22
<400> 10
cgaatcctcc tcctgaaagt gg 22
<210> 11
<211> 20
<212> DNA
<213> Homo sapiens
<220>
<223> SpyCas9 TRAC-1-20
<400> 11
acaaaactgt gctagacatg 20
<210> 12
<211> 20
<212> DNA
<213> Homo sapiens
<220>
<223> SpyCas9 TRAC-2-20
<400> 12
agagcaacag tgctgtggcc 20
<210> 13
<211> 20
<212> DNA
<213> Homo sapiens
<220>
<223> SpyCas9 TRAC-3-20
<400> 13
tctctcagct ggtacacggc 20
<210> 14
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> MG29-1-TRAC-19-22
<400> 14
ttgctccagg ccacagcact gt 22
<210> 15
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> MG29-1-TRAC-35-22
<400> 15
gagtctctca gctggtacac gg 22
<210> 16
<211> 20
<212> DNA
<213> Homo sapiens
<220>
<223> MG29-1-GR-29-20 (NR3C1 targeting)
<400> 16
cagcttccac aagttaagac 20
<210> 17
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> MG29-1-ALB-87 (albumin targeting)
<400> 17
cgcactaagg aaagtgcaaa gt 22
<210> 18
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> MG29-1-ALB-74 (albumin targeting)
<400> 18
aataaagcat agtgcaatgg at 22
<210> 19
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> MG29-1-ALB-83 (albumin targeting)
<400> 19
tgagatcaac agcacaggtt tt 22
<210> 20
<211> 20
<212> DNA
<213> Homo sapiens
<220>
<223> NR3C1 spacer target sequence MG29-1-GR-13-20 ("target B")
<400> 20
gtctgtggta tacaatttca 20
<210> 21
<211> 20
<212> DNA
<213> Homo sapiens
<220>
<223> NR3C1 spacer target sequence MG29-1-GR-28-20 ("target C")
<400> 21
ggaggtggtc ctgttgttgc 20
<210> 22
<211> 20
<212> DNA
<213> Homo sapiens
<220>
<223> NR3C1 spacer target sequence MG29-1-GR-29-20 ("target D")
<400> 22
cagcttccac aagttaagac 20
<210> 23
<211> 500
<212> DNA
<213> Homo sapiens
<220>
<223> CAR 5' homology arm targeting TRAC
<400> 23
ttaatgccaa cataccataa acctcccatt ctgctaatgc ccagcctaag ttggggagac 60
cactccagat tccaagatgt acagtttgct ttgctgggcc tttttcccat gcctgccttt 120
actctgccag agttatattg ctggggtttt gaagaagatc ctattaaata aaagaataag 180
cagtattatt aagtagccct gcatttcagg tttccttgag tggcaggcca ggcctggccg 240
tgaacgttca ctgaaatcat ggcctcttgg ccaagattga tagcttgtgc ctgtccctga 300
gtcccagtcc atcacgagca gctggtttct aagatgctat ttcccgtata aagcatgaga 360
ccgtgacttg ccagccccac agagccccgc ccttgtccat cactggcatc tggactccag 420
cctgggttgg ggcaaagagg gaaatgagat catgtcctaa ccctgatcct cttgtcccac 480
agatatccag aaccctgacc 500
<210> 24
<211> 500
<212> DNA
<213> Homo sapiens
<220>
<223> CAR 3' homology arm targeting TRAC
<400> 24
ctgccgtgta ccagctgaga gactctaaat ccagtgacaa gtctgtctgc ctattcaccg 60
attttgattc tcaaacaaat gtgtcacaaa gtaaggattc tgatgtgtat atcacagaca 120
aaactgtgct agacatgagg tctatggact tcaagagcaa cagtgctgtg gcctggagca 180
acaaatctga ctttgcatgt gcaaacgcct tcaacaacag cattattcca gaagacacct 240
tcttccccag cccaggtaag ggcagctttg gtgccttcgc aggctgtttc cttgcttcag 300
gaatggccag gttctgccca gagctctggt caatgatgtc taaaactcct ctgattggtg 360
gtctcggcct tatccattgc caccaaaacc ctctttttac taagaaacag tgagccttgt 420
tctggcagtc cagagaatga cacgggaaaa aagcagatga agagaaggtg gcaggagagg 480
gcacgtggcc cagcctcagt 500
<210> 25
<211> 7
<212> PRT
<213> Simian virus 40
<220>
<223> SV40
<400> 25
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 26
<211> 16
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Nucleoplasmin bipartite NLS sequence
<400> 26
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 27
<211> 9
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
C-myc NLS sequence
<400> 27
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 28
<211> 11
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
C-myc NLS sequence
<400> 28
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 29
<211> 38
<212> PRT
<213> Homo sapiens
<220>
<223> hRNPA1 M9 NLS
<400> 29
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 30
<211> 42
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Importin-alpha IBB domain sequence
<400> 30
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 31
<211> 8
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Myoma T protein sequence
<400> 31
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 32
<211> 8
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Myoma T protein sequence
<400> 32
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 33
<211> 8
<212> PRT
<213> Homo sapiens
<220>
<223> p53
<400> 33
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 34
<211> 12
<212> PRT
<213> Mus musculus
<220>
<223> mouse c-abl IV
<400> 34
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 35
<211> 5
<212> PRT
<213> Influenza A virus
<220>
<223> influenza virus NS1
<400> 35
Asp Arg Leu Arg Arg
1 5
<210> 36
<211> 7
<212> PRT
<213> Influenza A virus
<220>
<223> influenza virus NS1
<400> 36
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 37
<211> 10
<212> PRT
<213> Hepacivirus D
<220>
<223> Hepatitis virus delta antigen
<400> 37
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 38
<211> 10
<212> PRT
<213> Mus musculus
<220>
<223> mouse Mx1 protein
<400> 38
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 39
<211> 20
<212> PRT
<213> Homo sapiens
<220>
<223> human poly(ADP-ribose) polymerase
<400> 39
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 40
<211> 17
<212> PRT
<213> Homo sapiens
<220>
<223> steroid hormone receptors (human) glucocorticoid
<400> 40
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 41
<211> 20
<212> DNA
<213> Homo sapiens
<220>
<223> AAVS1 spacer target sequence
<400> 41
ggggccacta gggacaggat 20
<210> 42
<211> 500
<212> DNA
<213> Homo sapiens
<220>
<223> GR isoform 5' homology arm targeting AAVS1
<400> 42
ctccttctgg ggcctgtgcc atctctcgtt tcttaggatg gccttctccg acggatgtct 60
cccttgcgtc ccgcctcccc ttcttgtagg cctgcatcat caccgttttt ctggacaacc 120
ccaaagtacc ccgtctccct ggctttagcc acctctccat cctcttgctt tctttgcctg 180
gacaccccgt tctcctgtgg attcgggtca cctctcactc ctttcatttg ggcagctccc 240
ctacccccct tacctctcta gtctgtgcta gctcttccag ccccctgtca tggcatcttc 300
caggggtccg agagctcagc tagtcttctt cctccaaccc gggcccctat gtccacttca 360
ggacagcatg tttgctgcct ccagggatcc tgtgtccccg agctgggacc accttatatt 420
cccagggccg gttaatgtgg ctctggttct gggtactttt atctgtcccc tccaccccac 480
agtggggcca ctagggacag 500
<210> 43
<211> 500
<212> DNA
<213> Homo sapiens
<220>
<223> GR isoform 3' homology arm targeting AAVS1
<400> 43
gattggtgac agaaaagccc catccttagg cctcctcctt cctagtctcc tgatattggg 60
tctaaccccc acctcctgtt aggcagattc cttatctggt gacacacccc catttcctgg 120
agccatctct ctccttgcca gaacctctaa ggtttgctta cgatggagcc agagaggatc 180
ctgggaggga gagcttggca gggggtggga gggaaggggg ggatgcgtga cctgcccggt 240
tctcagtggc caccctgcgc taccctctcc cagaacctga gctgctctga cgcggccgtc 300
tggtgcgttt cactgatcct ggtgctgcag cttccttaca cttcccaaga ggagaagcag 360
tttggaaaaa caaaatcaga ataagttggt cctgagttct aactttggct cttcaccttt 420
ctagtcccca atttatattg ttcctccgtg cgtcagtttt acctgtgaga taaggccagt 480
agccagcccc gtcctggcag 500
<210> 44
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG3-6 sgRNA targeting TRAC
<400> 44
cgaauccucc uccugaaagu ggguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110
<210> 45
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG3-6 sgRNA targeting TRBC1/2
<400> 45
cggcgcugac gaucugggug guugagaauc gaaagauucu uaauaaggca uccuuccgau 60
gcugacuucu caccguccgu uuuccaauag gagcgggcgg uauguuuu 108
<210> 46
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG29-1 sgRNA targeting TRAC
<400> 46
uaauuucuac uguuguagau gagucucuca gcugguacac gg 42
<210> 47
<211> 40
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG29-1 sgRNA targeting TRBC1/2
<400> 47
uaauuucuac uguuguagau agccaucaga agcagagauc 40
<210> 48
<211> 40
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG29-1 sgRNA targeting TRBC1/2
<400> 48
uaauuucuac uguuguagau gcccuauccu ggguccacuc 40
<210> 49
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG29-1 sgRNA targeting B2M
<400> 49
uaauuucuac uguuguagau uaucucuugu acuacacuga au 42
<210> 50
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG29-1 sgRNA targeting B2M
<400> 50
uaauuucuac uguuguagau agugggggug aauucagugu ag 42
<210> 51
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG29-1 sgRNA targeting B2M
<400> 51
uaauuucuac uguuguagau cauucucugc uggaugacgu ga 42
<210> 52
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> TRAC spacer target sequence (MG3-6-TRAC-6)
<400> 52
cgaatcctcc tcctgaaagt gg 22
<210> 53
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> AAVS1 spacer target sequence (MG3-6-AAVS1-D2)
<400> 53
taggaaggag gaggcctaag ga 22
<210> 54
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> TRAC spacer target sequence (MG29-1-TRAC-35)
<400> 54
gagtctctca gctggtacac gg 22
<210> 55
<211> 22
<212> DNA
<213> Homo sapiens
<220>
<223> AAVS1 spacer target sequence (MG29-1-AAVS1-F3)
<400> 55
tctgtcccct ccaccccaca gt 22
<210> 56
<211> 23
<212> DNA
<213> Homo sapiens
<220>
<223> AAVS1 spacer target sequence (SpCas9, Mali et al. AAVS1 T2)
<400> 56
ggggccacta gggacaggat tgg 23
<210> 57
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG3-6 sgRNA targeting TRAC (MG3-6-TRAC-6)
<400> 57
cgaauccucc uccugaaagu ggguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110
<210> 58
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG3-6 sgRNA targeting AAVS1 (MG3-6-AAVS1-D2)
<400> 58
uaggaaggag gaggccuaag gaguugagaa ucgaaagauu cuuaauaagg cauccuuccg 60
augcugacuu cucaccgucc guuuuccaau aggagcgggc gguauguuuu 110
<210> 59
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG29-1 sgRNA targeting TRAC (MG29-1-TRAC-35)
<400> 59
uaauuucuac uguuguagau gagucucuca gcugguacac gg 42
<210> 60
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> MG29-1 sgRNA targeting AAVS1 (MG29-1-AAVS1-F3)
<400> 60
uaauuucuac uguuguagau ucuguccccu ccaccccaca gu 42
<210> 61
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> SpCas9 sgRNA targeting AAVS1 (SpCas9, Mali et al. AAVS1 T2)
<400> 61
ggggccacua gggacaggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 62
<211> 3705
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> MG3-6 nuclease (mRNA sequence)
<400> 62
atgcatgcgc ggccgcaagc tttaatacga ctcactataa ggaaaagcca gctccagcag 60
gcgctgctca ctcctcccca tcctctccct ctgtccctct gtccctctga ccctgcactg 120
tcccagcacc atggccccca agaagaagcg gaaagttggc ggcggaggca gcagcaccga 180
catgaagaac taccggatcg gcgtggacgt gggcgataga tctgttggac tggccgccat 240
cgagttcgac gatgatggac tgcccatcca gaagctggcc ctggtcacct ttagacacga 300
tggcggactg gaccccacca agaacaagac ccctatgagc cggaaagaga cacggggaat 360
cgccagacgg accatgcgga tgaacagaga gcggaagcgg cggctgagaa acctggacaa 420
cgtgctggaa aacctgggct actctgtgcc tgagggccct gagcctgaga catatgaggc 480
ctggacaagc agagccctgc tggcctctat caaactggcc tctgccgacg agctgaacga 540
acaccttgtc agagccgtgc ggcacatggc cagacataga ggatgggcca atccttggtg 600
gtccctggac cagctggaaa aggccagcca agagcctagc gagacattcg agatcatcct 660
ggccagagcc agagagctgt tcggcgagaa ggtgcccgct aatcctacac tgggaatgct 720
gggagccctg gccgctaaca atgaggtgct gctgaggccc agggacgaga agaagagaaa 780
gaccggatac gtgcggggca cccctctgat gtttgctcaa gttcgacagg gcgatcagct 840
ggccgagctg cggagaattt gtgaagtgca gggcatcgag gaccagtacg aggctctgag 900
actgggcgtg ttcgaccaca agcaccccta cgtgcccaaa gaaagagtgg gcaaagaccc 960
tctgaacccc agcaccaaca gaaccatcag agccagcctg gaatttcaag agttccgcat 1020
cctggacagc gtggccaatc tgagagtgcg gatcggcagc agagccaaga gggaactgac 1080
agaggccgag tatgatgccg ccgtggaatt cctgatggac tacgccgaca aagagcagcc 1140
tagctgggcc gatgtggccg agaaaattgg cgtgcccggc aacagactgg tggcccctgt 1200
tctggaagat gtgcagcaga aaacagcccc ttacgacaga agcagcgccg cctttgagaa 1260
ggccatgggc aagaaaaccg aggccagaca gtggtgggag tccaccgatg atgaccagct 1320
gagaagcctg ctgattgcct tcctggtgga cgccaccaac gacacagaag aagccgctgc 1380
tgaagccggc ctgagcgagc tgtataagtc ttggcctgcc gaggaaagag aggccctgtc 1440
caacatcgac ttcgagaagg gcagagtggc ctacagccaa gaaaccctga gcaagctgag 1500
cgagtacatg cacgagtaca gagtgggact gcacgaggct agaaaggccg tgttcggagt 1560
ggatgatacc tggcggcctc ctctggataa gctggaagaa cctacaggac agcctgccgt 1620
ggacagagtg ctgaccatcc tgagaagatt cgtgctggac tgcgagcggc aatggggcag 1680
acctagagcc atcaccgtgg aacacacacg gacaggcctg atgggcccaa cacagagaca 1740
gaagatcctg aacgagcaga agaagaaccg ggccgacaac gagagaatcc gggatgagct 1800
gagagaatct ggcgtggaca acccctccag agccgaagtt cggagacacc tgatcgtgca 1860
agagcaagag tgccagtgcc tgtactgcgg caccatgatc accaccacca caagcgagct 1920
ggaccacatc gttcctagag ccggtggcgg cagcagcaga agggaaaatc tggccgctgt 1980
gtgcagagcc tgcaacgcca agaagaaacg cgagctgttc tacgcctggg ctggcccagt 2040
gaagtcccaa gagacaatcg agagagtcag acagctgaag gcctttaagg acagcaagaa 2100
agccaagatg ttcaagaacc agatccgccg gctgaaccag accgaggccg atgagcctat 2160
cgacgaaaga agcctggcca gcacatctta cgccgctgtg gccgttagag agcggctgga 2220
acagcacttc aacgaaggcc tggcactgga cgacaagtcc agagtggtgc tggatgtgta 2280
tgccggcgct gtgaccagag agtctcgtag agctggcggc atcgacgagc ggattctgct 2340
gagaggcgag cgggacaaga acagattcga tgtgcggcat cacgccgtgg acgctgctgt 2400
tatgaccctg ctgaacagat ccgtggctct gaccctggaa cagagatcac agctgcggcg 2460
gaccttctac gagcaaggac tggacaaact ggaccggaac cagctgaagc ccgaggaaga 2520
ttggagagac ttcaccggac tggcccctgc ctctcaagag aagtttctgg aatggcggaa 2580
ggccgccacc atcctgggag atttgctggc cgaagccatc gaggatgact ctatcgccgt 2640
ggtgtcccca ctgagactga ggccacagaa tggcagcgtg cacctggaaa caatcagcgc 2700
cgtgaagaag cagaccctgg gctctgattg gccagccgac gccgtgaaaa gaatcgtgga 2760
ccccgagatc tacctggcta tgaaggatgc cctgggaaag ctgaaagagc tgcccgagga 2820
tagcgccaga tctctggaac tgcccgacgg cagattcgtg gaagccgatg acgaggtgct 2880
gttcttccca gagaacgccg ccagcattct gacccctaga ggcgtggcag agatcggcgg 2940
ctctattcac catgccagac tgtacggctg gctgaccaaa aagggcgagc tgaaagtggg 3000
catgctgaga gtgtacggcg ccgagtttcc ctggctgatg agagagtccg gctccagaaa 3060
cgtgctgagc atgcctatcc acagaggcag ccagagcttc cgggacatgc aggacacaac 3120
ccggaaagcc gtggaaagcg gagaggctgt ggaattcgcc tggatcaccc agaacgatga 3180
gctggaattc gaccccgacg actacattgc ccacggcgga aaggacgaac tgagacagtt 3240
cctgggcttt atgcccgagt gccgttggag agtggacggc ttcaagaaga attaccagat 3300
cagaatcagg cccgccatgc tgagcagaga gcagctgcct agcgacatcc agcggagact 3360
ggaaagcaag accctgacca agaacgagtc cctgctgctg aaagccctgg atacaggact 3420
ggtggtggcc atcggaggac tgctgcctct cgagacactg aaagtgatcc ggcgcaacaa 3480
tctgggcttc cccaggtggc gcggaaacgg aaatctgccc accagctttg aagtgcggag 3540
cagcgctctg agagccctgg gagttgaagg atctggcgga aaaagacctg ccgccacaaa 3600
gaaagccgga caggccaaga aaaagaagtg accacacccc cattccccca ctccagatag 3660
aacttcagtt atatctcacg tgtctggagt tggatccatg catgc 3705
<210> 63
<211> 4036
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Transgene inserted at AAVS1 locus (MND promoter-driven GFP and
tEGFR coding sequences flanked by homology arms corresponding
to the cut site of Mali et al. AAVS1 T2 guide)
<400> 63
ggccgcttaa ttaataataa ggaagtgcca ttccgcctga cctctccttc tggggcctgt 60
gccatctctc gtttcttagg atggccttct ccgacggatg tctcccttgc gtcccgcctc 120
cccttcttgt aggcctgcat catcaccgtt tttctggaca accccaaagt accccgtctc 180
cctggcttta gccacctctc catcctcttg ctttctttgc ctggacaccc cgttctcctg 240
tggattcggg tcacctctca ctcctttcat ttgggcagct cccctacccc ccttacctct 300
ctagtctgtg ctagctcttc cagccccctg tcatggcatc ttccaggggt ccgagagctc 360
agctagtctt cttcctccaa cccgggcccc tatgtccact tcaggacagc atgtttgctg 420
cctccaggga tcctgtgtcc ccgagctggg accaccttat attcccaggg ccggttaatg 480
tggctctggt tctgggtact tttatctgtc ccctccaccc cacagtgggg ccactaggga 540
cagatttgtg tgaacagaga aacaggagaa tatgggccaa acaggatatc tgtggtaagc 600
agttcctgcc ccggctcagg gccaagaaca gttggaacag cagaatatgg gccaaacagg 660
atatctgtgg taagcagttc ctgccccggc tcagggccaa gaacagatgg tccccagatg 720
cggtcccgcc ctcagcagtt tctagagaac catcagatgt ttccagggtg ccccaaggac 780
ctgaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg 840
cgcgcttctg ctccccgagc tctatataag cagagctcgt ttagtgaacc gtcagatcaa 900
atgcctggag acgccatcca cgctgttttg acctccatag aagacaccga ctctagagga 960
tccaccggtc gccaccatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat 1020
cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga 1080
gggcgatgcc acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc 1140
cgtgccctgg cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta 1200
ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca 1260
ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt 1320
cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg 1380
caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc 1440
cgacaagcag aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg 1500
cagcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct 1560
gctgcccgac aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa 1620
gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga 1680
cgagctgtac aagggcagcg gcgaaggaag gggttctctg ttgacttgcg gggatgttga 1740
agaaaacccg ggaccaatgc ttctcctggt gacaagcctt ctgctctgtg agttaccaca 1800
cccagcattc ctcctgatca ggaaggtgtg caacggcatc ggcatcggcg agttcaagga 1860
cagcctgagc atcaacgcca ccaacatcaa gcacttcaag aactgcacca gcatcagcgg 1920
cgacctgcac atcctgcccg tggccttcag gggcgacagc ttcacccaca ccccccccct 1980
ggacccccag gagctggaca tcctgaagac cgtgaaggag atcaccggct tcctgctgat 2040
ccaggcctgg cccgagaaca ggaccgacct gcacgccttc gagaacctgg agatcatcag 2100
gggcaggacc aagcagcacg gccagttcag cctggccgtg gtgagcctga acatcaccag 2160
cctgggcctg aggagcctga aggagatcag cgacggcgac gtgatcatca gcggcaacaa 2220
gaacctgtgc tacgccaaca ccatcaactg gaagaagctg ttcggcacca gcggccagaa 2280
gaccaagatc atcagcaaca ggggcgagaa cagctgcaag gccaccggcc aggtgtgcca 2340
cgccctgtgc agccccgagg gctgctgggg ccccgagccc agggactgcg tgagctgcag 2400
gaacgtgagc aggggcaggg agtgcgtgga caagtgcaac ctgctggagg gcgagcccag 2460
ggagttcgtg gagaacagcg agtgcatcca gtgccacccc gagtgcctgc cccaggccat 2520
gaacatcacc tgcaccggca ggggccccga caactgcatc cagtgcgccc actacatcga 2580
cggcccccac tgcgtgaaga cctgccccgc cggcgtgatg ggcgagaaca acaccctggt 2640
gtggaagtac gccgacgccg gccacgtgtg ccacctgtgc caccccaact gcacctacgg 2700
ctgcaccggc cccggcctgg agggctgccc caccaacggc cccaagatcc ccagcatcgc 2760
caccggcatg gtgggcgccc tgctgctgct gctggtggtg gccctgggca tcggcctgtt 2820
catgggcagc ggcgaaggaa ggggttctct gttgacttgc ggggatgttg aagaaaaccc 2880
gggaccaatg gggaatgaag caagttatcc attggaaatg tgtagccatt ttgatgctga 2940
tgaaataaag agactcggaa aacgatttaa gaaactcgat cttgataata gtggatctct 3000
ctctgtcgaa gaattcatgt cccttcctga actccaacaa aatccactcg tccaaagagt 3060
cattgatata tttgatacgg atgggaatgg tgaagtcgat tttaaagaat ttattgaagg 3120
ggttagtcaa ttttccgtca aaggggataa agaacagaaa ctccgctttg cgtttcgaat 3180
ttatgacatg gacaaggacg gatacatctc caacggggaa ctctttcaag ttctcaaaat 3240
gatggtagga aataacacca aacttgcgga cactcaactc caacaaattg ttgataaaac 3300
aattattaac gctgataaag atggagatgg tcgtattagc tttgaagaat tttgcgcagt 3360
tgtcggcggt ttggacatcc acaagaagat ggtagtcgat gtttgaaact tgtttattgc 3420
agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 3480
ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttacg ccgattggtg 3540
acagaaaagc cccatcctta ggcctcctcc ttcctagtct cctgatattg ggtctaaccc 3600
ccacctcctg ttaggcagat tccttatctg gtgacacacc cccatttcct ggagccatct 3660
ctctccttgc cagaacctct aaggtttgct tacgatggag ccagagagga tcctgggagg 3720
gagagcttgg cagggggtgg gagggaaggg ggggatgcgt gacctgcccg gttctcagtg 3780
gccaccctgc gctaccctct cccagaacct gagctgctct gacgcggccg tctggtgcgt 3840
ttcactgatc ctggtgctgc agcttcctta cacttcccaa gaggagaagc agtttggaaa 3900
aacaaaatca gaataagttg gtcctgagtt ctaactttgg ctcttcacct ttctagtccc 3960
caatttatat tgttcctccg tgcgtcagtt ttacctgtga gataaggcca gtagccagcc 4020
ccgtcctggc agggcc 4036
<210> 64
<211> 4263
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Transgene inserted at TRAC locus (MSCV promoter-driven tLNGFR
coding sequence flanked by homology arms corresponding to the
cut site of MG3-6-TRAC-6.)
<400> 64
caatggtcct gtctctcaag aatcccctgc cactcctcac acccaccctg ggcccatatt 60
catttccatt tgagttgttc ttattgagtc atccttcctg tggtagcgga actcactaag 120
gggcccatct ggacccgagg tattgtgatg ataaattctg agcacctacc ccatccccag 180
aagggctcag aaataaaata agagccaagt ctagtcggtg tttcctgtct tgaaacacaa 240
tactgttggc cctggaagaa tgcacagaat ctgtttgtaa ggggatatgc acagaagctg 300
caagggacag gaggtgcagg agctgcaggc ctcccccacc cagcctgctc tgccttgggg 360
aaaaccgtgg gtgtgtcctg caggccatgc aggcctggga catgcaagcc cataaccgct 420
gtggcctctt ggttttacag atacgaacct aaactttcaa aacctgtcag tgattgggtt 480
ccgaatcctc ctcctgaaag ttaattaatg aatgaatgaa ataaaagatc tttattttca 540
ttagatctgt gtgttggttt tttgtgtgat cctcgaggga atgaaagacc ccacctgtag 600
gtttggcaag ctagcttaag taacgccatt ttgcaaggca tggaaaatac ataactgaga 660
atagagaagt tcagatcaag gttaggaaca gagagacagc agaatatggg ccaaacagga 720
tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 780
ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 840
tgaaaatgac cctgtgcctt atttgaacta accaatcagt tcgcttctcg cttctgttcg 900
cgcgcttctg ctccccgagc tcaataaaag agcccacaac ccctcactcg gcgcgcgcca 960
gtccggtacc agtcgccacc atggccctgc ctgtgacagc tctgctcctc cctctggccc 1020
tgctgctcca tgccgccaga cccgacatcg tgctgaccca gagccccccc agcctggcca 1080
tgtctctggg caagagagcc accatcagct gccgggccag cgagagcgtg accatcctgg 1140
gcagccacct gatccactgg tatcagcaga agcccggcca gccccccacc ctgctgatcc 1200
agctcgccag caatgtgcag accggcgtgc ccgccagatt cagcggcagc ggcagcagaa 1260
ccgacttcac cctgaccatc gaccccgtgg aagaggacga cgtggccgtg tactactgcc 1320
tgcagagccg gaccatcccc cggacctttg gcggaggcac caaactggaa atcaagggca 1380
gcaccagcgg ctccggcaag cctggctctg gcgagggcag cacaaaggga cagattcagc 1440
tggtgcagag cggccctgag ctgaagaaac ccggcgagac agtgaagatc agctgcaagg 1500
cctccggcta caccttcacc gactacagca tcaactgggt gaaaagagcc cctggcaagg 1560
gcctgaagtg gatgggctgg atcaacaccg agacaagaga gcccgcctac gcctacgact 1620
tccggggcag attcgccttc agcctggaaa ccagcgccag caccgcctac ctgcagatca 1680
acaacctgaa gtacgaggac accgccacct acttttgcgc cctggactac agctacgcca 1740
tggactactg gggccagggc accagcgtga ccgtgtccag cttcgtgccc gtgttcctgc 1800
ccgccaaacc taccaccacc cctgccccta gacctcccac cccagcccca acaatcgcca 1860
gccagcctct gtctctgcgg cccgaagcct gtagacctgc tgccggcgga gccgtgcaca 1920
ccagaggcct ggacttcgcc tgcgacatct acatctgggc ccctctggcc ggcacctgtg 1980
gcgtgctgct gctgagcctg gtgatcaccc tgtactgcaa ccaccggaac agaagcaagc 2040
ggagccggct gctgcacagc gactacatga acatgacccc aagacggcct ggccccaccc 2100
ggaagcacta ccagccttac gcccctccca gagacttcgc cgcctaccgg tccagagtga 2160
agttcagcag atccgccgac gcccctgcct accagcaggg acagaaccag ctgtacaacg 2220
agctgaacct gggcagacgg gaagagtacg acgtgctgga caagcggaga ggccgggacc 2280
ccgagatggg cggaaagccc agacggaaga acccccagga aggcctgtat aacgaactgc 2340
agaaagacaa gatggccgag gcctacagcg agatcggcat gaagggcgag cggaggcgcg 2400
gcaagggcca cgatggcctg taccagggcc tgagcaccgc caccaaggac acctacgacg 2460
ccctgcacat gcaggccctg ccccccagag gatccggcgc tacaaatttt tcactgctga 2520
aacaggcggg tgatgtggag gagaaccctg gacccatggg tgctggcgca actggacgcg 2580
ctatggatgg acctcgcttg ctgcttcttc tgcttctcgg ggtctcattg ggtggtgcta 2640
aggaagcatg cccaacggga ctttatacgc atagcggaga gtgttgcaaa gcttgtaacc 2700
tgggcgaagg cgtcgcgcaa ccttgtggtg caaatcaaac cgtctgcgag ccatgtttgg 2760
actctgttac gtttagtgac gtagtatctg cgacagagcc atgcaagcct tgtacggaat 2820
gtgtaggatt gcagagcatg tctgcccctt gtgtagaagc cgacgatgca gtttgcaggt 2880
gcgcgtatgg ctattaccaa gacgaaacaa ccggacgatg tgaagcttgc cgagtttgtg 2940
aagcgggttc cgggcttgta ttctcatgtc aggataagca gaacaccgtc tgcgaagagt 3000
gccccgatgg cacctacagc gatgaagcga accatgtaga cccctgcctg ccttgcaccg 3060
tttgtgaaga cacggaacga cagttgcggg agtgtacccg gtgggcagac gccgagtgcg 3120
aagagattcc aggccgctgg atcacgcgaa gtaccccgcc agaaggttcc gacagtactg 3180
caccaagcac ccaagaacca gaggcgcccc ccgagcagga cctgattgcc tccaccgtgg 3240
cgggtgttgt tactacggtt atgggctcat cccagcccgt tgttacccga ggaactacag 3300
acaacctgat tccggtatat tgttctatct tggcggctgt agtagttggc ttggtcgcgt 3360
acatcgcttt caaaagatga aagcttgata atcaacctct ggattacaaa atttgtgaaa 3420
gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 3480
tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 3540
cctggttagt tcttgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag 3600
gggctcggct gttgggcact gacaattccg tggaacttgt ttattgcagc ttataatggt 3660
tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 3720
agttgtggtt tgtccaaact catcaatgta tcttagttta aactggccgg gtttaatctg 3780
ctcatgacgc tgcggctgtg gtccagctga ggtgaggggc cttgaagctg ggagtggggt 3840
ttagggacgc gggtctctgg gtgcatccta agctctgaga gcaaacctcc ctgcagggtc 3900
ttgcttttaa gtccaaagcc tgagcccacc aaactctcct acttcttcct gttacaaatt 3960
cctcttgtgc aataataatg gcctgaaacg ctgtaaaata tcctcatttc agccgcctca 4020
gttgcacttc tcccctatga ggtaggaaga acagttgttt agaaacgaag aaactgaggc 4080
cccacagcta atgagtggag gaagagagac acttgtgtac accacatgcc ttgtgttgta 4140
cttctctcac cgtgtaacct cctcatgtcc tctctcccca gtacggctct cttagctcag 4200
tagaaagaag acattacact catattacac cccaatcctg gctagagtct ccgcaccctc 4260
ctc 4263
<210> 65
<211> 4295
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<223> Transgene inserted at TRAC locus (MSCV promoter-driven tLNGFR
coding sequence flanked by homology arms corresponding to the
cut site of MG29-1-TRAC-35.)
<400> 65
gcggccgctt aattaattaa tgccaacata ccataaacct cccattctgc taatgcccag 60
cctaagttgg ggagaccact ccagattcca agatgtacag tttgctttgc tgggcctttt 120
tcccatgcct gcctttactc tgccagagtt atattgctgg ggttttgaag aagatcctat 180
taaataaaag aataagcagt attattaagt agccctgcat ttcaggtttc cttgagtggc 240
aggccaggcc tggccgtgaa cgttcactga aatcatggcc tcttggccaa gattgatagc 300
ttgtgcctgt ccctgagtcc cagtccatca cgagcagctg gtttctaaga tgctatttcc 360
cgtataaagc atgagaccgt gacttgccag ccccacagag ccccgccctt gtccatcact 420
ggcatctgga ctccagcctg ggttggggca aagagggaaa tgagatcatg tcctaaccct 480
gatcctcttg tcccacagat atccagaacc ctgaccttaa ttaatgaatg aatgaaataa 540
aagatcttta ttttcattag atctgtgtgt tggttttttg tgtgatcctc gagggaatga 600
aagaccccac ctgtaggttt ggcaagctag cttaagtaac gccattttgc aaggcatgga 660
aaatacataa ctgagaatag agaagttcag atcaaggtta ggaacagaga gacagcagaa 720
tatgggccaa acaggatatc tgtggtaagc agttcctgcc ccggctcagg gccaagaaca 780
gatggtcccc agatgcggtc ccgccctcag cagtttctag agaaccatca gatgtttcca 840
gggtgcccca aggacctgaa aatgaccctg tgccttattt gaactaacca atcagttcgc 900
ttctcgcttc tgttcgcgcg cttctgctcc ccgagctcaa taaaagagcc cacaacccct 960
cactcggcgc gcgccagtcc ggtaccagtc gccaccatgg ccctgcctgt gacagctctg 1020
ctcctccctc tggccctgct gctccatgcc gccagacccg acatcgtgct gacccagagc 1080
ccccccagcc tggccatgtc tctgggcaag agagccacca tcagctgccg ggccagcgag 1140
agcgtgacca tcctgggcag ccacctgatc cactggtatc agcagaagcc cggccagccc 1200
cccaccctgc tgatccagct cgccagcaat gtgcagaccg gcgtgcccgc cagattcagc 1260
ggcagcggca gcagaaccga cttcaccctg accatcgacc ccgtggaaga ggacgacgtg 1320
gccgtgtact actgcctgca gagccggacc atcccccgga cctttggcgg aggcaccaaa 1380
ctggaaatca agggcagcac cagcggctcc ggcaagcctg gctctggcga gggcagcaca 1440
aagggacaga ttcagctggt gcagagcggc cctgagctga agaaacccgg cgagacagtg 1500
aagatcagct gcaaggcctc cggctacacc ttcaccgact acagcatcaa ctgggtgaaa 1560
agagcccctg gcaagggcct gaagtggatg ggctggatca acaccgagac aagagagccc 1620
gcctacgcct acgacttccg gggcagattc gccttcagcc tggaaaccag cgccagcacc 1680
gcctacctgc agatcaacaa cctgaagtac gaggacaccg ccacctactt ttgcgccctg 1740
gactacagct acgccatgga ctactggggc cagggcacca gcgtgaccgt gtccagcttc 1800
gtgcccgtgt tcctgcccgc caaacctacc accacccctg cccctagacc tcccacccca 1860
gccccaacaa tcgccagcca gcctctgtct ctgcggcccg aagcctgtag acctgctgcc 1920
ggcggagccg tgcacaccag aggcctggac ttcgcctgcg acatctacat ctgggcccct 1980
ctggccggca cctgtggcgt gctgctgctg agcctggtga tcaccctgta ctgcaaccac 2040
cggaacagaa gcaagcggag ccggctgctg cacagcgact acatgaacat gaccccaaga 2100
cggcctggcc ccacccggaa gcactaccag ccttacgccc ctcccagaga cttcgccgcc 2160
taccggtcca gagtgaagtt cagcagatcc gccgacgccc ctgcctacca gcagggacag 2220
aaccagctgt acaacgagct gaacctgggc agacgggaag agtacgacgt gctggacaag 2280
cggagaggcc gggaccccga gatgggcgga aagcccagac ggaagaaccc ccaggaaggc 2340
ctgtataacg aactgcagaa agacaagatg gccgaggcct acagcgagat cggcatgaag 2400
ggcgagcgga ggcgcggcaa gggccacgat ggcctgtacc agggcctgag caccgccacc 2460
aaggacacct acgacgccct gcacatgcag gccctgcccc ccagaggatc cggcgctaca 2520
aatttttcac tgctgaaaca ggcgggtgat gtggaggaga accctggacc catgggtgct 2580
ggcgcaactg gacgcgctat ggatggacct cgcttgctgc ttcttctgct tctcggggtc 2640
tcattgggtg gtgctaagga agcatgccca acgggacttt atacgcatag cggagagtgt 2700
tgcaaagctt gtaacctggg cgaaggcgtc gcgcaacctt gtggtgcaaa tcaaaccgtc 2760
tgcgagccat gtttggactc tgttacgttt agtgacgtag tatctgcgac agagccatgc 2820
aagccttgta cggaatgtgt aggattgcag agcatgtctg ccccttgtgt agaagccgac 2880
gatgcagttt gcaggtgcgc gtatggctat taccaagacg aaacaaccgg acgatgtgaa 2940
gcttgccgag tttgtgaagc gggttccggg cttgtattct catgtcagga taagcagaac 3000
accgtctgcg aagagtgccc cgatggcacc tacagcgatg aagcgaacca tgtagacccc 3060
tgcctgcctt gcaccgtttg tgaagacacg gaacgacagt tgcgggagtg tacccggtgg 3120
gcagacgccg agtgcgaaga gattccaggc cgctggatca cgcgaagtac cccgccagaa 3180
ggttccgaca gtactgcacc aagcacccaa gaaccagagg cgccccccga gcaggacctg 3240
attgcctcca ccgtggcggg tgttgttact acggttatgg gctcatccca gcccgttgtt 3300
acccgaggaa ctacagacaa cctgattccg gtatattgtt ctatcttggc ggctgtagta 3360
gttggcttgg tcgcgtacat cgctttcaaa agatgaaagc ttgataatca acctctggat 3420
tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 3480
ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 3540
tcctccttgt ataaatcctg gttagttctt gccacggcgg aactcatcgc cgcctgcctt 3600
gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtgga acttgtttat 3660
tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 3720
tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt agtttaaacc 3780
tgccgtgtac cagctgagag actctaaatc cagtgacaag tctgtctgcc tattcaccga 3840
ttttgattct caaacaaatg tgtcacaaag taaggattct gatgtgtata tcacagacaa 3900
aactgtgcta gacatgaggt ctatggactt caagagcaac agtgctgtgg cctggagcaa 3960
caaatctgac tttgcatgtg caaacgcctt caacaacagc attattccag aagacacctt 4020
cttccccagc ccaggtaagg gcagctttgg tgccttcgca ggctgtttcc ttgcttcagg 4080
aatggccagg ttctgcccag agctctggtc aatgatgtct aaaactcctc tgattggtgg 4140
tctcggcctt atccattgcc accaaaaccc tctttttact aagaaacagt gagccttgtt 4200
ctggcagtcc agagaatgac acgggaaaaa agcagatgaa gagaaggtgg caggagaggg 4260
cacgtggccc agcctcagtg tttaaacgcg gccgc 4295
Claims (73)
- 세포 내에서 2개 이상의 유전자좌를 편집하는 방법으로서, 상기 방법은, 상기 세포에:
(a) 클래스 2, II형 Cas 엔도뉴클레아제 복합체로서:
(i) 클래스 2, II형 Cas 엔도뉴클레아제; 및
(ii) 제1 조작된 가이드 RNA이되:
상기 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및
상기 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는, 제1 조작된 가이드 RNA를 포함하는, 클래스 2, II형 Cas 엔도뉴클레아제 복합체;
(b) 클래스 2, V형 Cas 엔도뉴클레아제 복합체로서:
(i) 클래스 2, V형 Cas 엔도뉴클레아제; 및
(ii) 제2 조작된 가이드 RNA이되:
상기 클래스 2, V형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및
상기 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 스페이서 서열을 포함하는, 제2 조작된 가이드 RNA를 포함하는, 클래스 2, V형 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함하는, 방법. - 제1항에 있어서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는 Cas9 엔도뉴클레아제가 아닌, 방법.
- 제1항 또는 제2항에 있어서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는 Cas12a 엔도뉴클레아제인, 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 클래스 2, V형 Cas 엔도뉴클레아제는, 서열번호 7, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 제1 조작된 가이드 RNA 또는 상기 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 방법은 상기 제1 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하고/하거나 상기 제2 유전자좌의 게놈 서열을 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 그 이상의 효율로 편집하는, 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 제1 RNA-가이드 엔도뉴클레아제 또는 상기 제2 RNA-가이드 엔도뉴클레아제는 200 pmol 이하, 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 도입되는, 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만의 빈도로 파괴되는, 방법.
- 제9항에 있어서, 상기 세포 내의 오프-타겟 부위는 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만의 빈도로 파괴되는, 방법.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트 또는 상기 하나 이상의 표적 유전자좌의 제2 세트는 T 세포 수용체(TCR) 유전자좌를 포함하는, 방법.
- 제11항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 상기 스페이서 서열 또는 상기 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 상기 스페이서 서열은 서열번호 10 내지 15 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는, 방법.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트 또는 상기 하나 이상의 표적 유전자좌의 제2 세트는 알부민(ALB) 유전자좌를 포함하는, 방법.
- 제13항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 상기 스페이서 서열 또는 상기 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 상기 스페이서 서열은 서열번호 17 내지 19 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는, 방법.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트 또는 상기 하나 이상의 표적 유전자좌의 제2 세트는 핵 수용체 서브패밀리 3 그룹 C 구성원 1 유전자좌를 포함하는, 방법.
- 제15항에 있어서, 상기 하나 이상의 표적 유전자좌의 제1 세트에 혼성화하도록 구성된 상기 스페이서 서열 또는 상기 하나 이상의 표적 유전자좌의 제2 세트에 혼성화하도록 구성된 상기 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는, 방법.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 상기 하나 이상의 표적 유전자좌의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 상기 하나 이상의 표적 유전자좌의 제1 세트의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 상기 세포에 도입하는 단계를 추가로 포함하는, 방법.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 편집 단계는 인델, 조기 종결 코돈, 미스센스 코돈, 프레임시프트 돌연변이, 아데닌 탈아민화, 시토신 탈아민화, 또는 이들의 임의의 조합의 삽입 단계를 포함하는, 방법.
- 글루코코르티코이드-내성 조작된 T 세포를 제조하는 방법으로서, 상기 방법은 T 세포 또는 이의 전구체에:
(a) T 세포 수용체(TCR) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서:
(i) 제1 RNA 가이드 엔도뉴클레아제 또는 상기 제1 RNA 가이드 엔도뉴클레아제를 암호화하는 DNA; 및
(ii) 제1 조작된 가이드 RNA이되:
상기 제1 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및
상기 TCR 유전자좌의 적어도 일부에 혼성화하도록 구성된 제1 스페이서 서열을 포함하는, 제1 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체; 및
(b) T 세포 수용체 핵 수용체 서브패밀리 3 그룹 C 구성원 1(NR3C1) 유전자좌를 표적화하는 RNA 가이드 엔도뉴클레아제 복합체로서:
(i) 제2 RNA 가이드 엔도뉴클레아제; 및
(ii) 제2 조작된 가이드 RNA이되:
상기 제2 RNA 가이드 엔도뉴클레아제와 복합체를 형성하도록 구성된 RNA 서열, 및
상기 NR3C1 유전자좌의 적어도 일부에 혼성화하도록 구성된 제2 스페이서 서열을 포함하는, 제2 조작된 가이드 RNA를 포함하는, RNA 가이드 엔도뉴클레아제 복합체를 도입하는 단계를 포함하는, 방법. - 제19항에 있어서, 상기 TCR 유전자좌의 상기 적어도 일부는 상기 T 세포 유전자좌 내에 있는, 방법.
- 제19항 또는 제20항 중 어느 한 항에 있어서, (b) 이종 조작된 T-세포 수용체 분자를 암호화하는 개방 해독 프레임, 상기 표적 서열의 제1 세트의 제1 측면 상에 위치한 DNA 서열을 포함하는 제1 상동 아암, 및 상기 TCR 유전자좌 내의 상기 표적 서열의 제2 측면 상에 위치한 DNA 서열을 포함하는 제2 상동 아암을 포함하는 공여자 DNA 서열을 상기 세포에 도입하는 단계를 추가로 포함하는, 방법.
- 제19항 내지 제21항 중 어느 한 항에 있어서, 상기 제1 RNA 가이드 엔도뉴클레아제 또는 상기 제2 RNA 가이드 엔도뉴클레아제는 클래스 2, II형 또는 클래스 2, V형 Cas 엔도뉴클레아제를 포함하는, 방법.
- 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 제1 RNA 가이드 엔도뉴클레아제는 상기 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 상기 제2 RNA 가이드 엔도뉴클레아제는 상기 클래스 2, V형 Cas 엔도뉴클레아제를 포함하는, 방법.
- 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 제2 RNA 가이드 엔도뉴클레아제는 상기 클래스 2, II형 Cas 엔도뉴클레아제를 포함하고, 상기 제1 RNA 가이드 엔도뉴클레아제는 상기 클래스 2, V형 Cas 엔도뉴클레아제를 포함하는, 방법.
- 제19항 내지 제24항 중 어느 한 항에 있어서, 상기 이종 조작된 T-세포 수용체는 CAR 분자인, 방법.
- 제19항 내지 제25항 중 어느 한 항에 있어서, 상기 T 세포 수용체 유전자좌의 상기 적어도 일부는 T 세포 수용체 알파 불변(TRAC) 유전자좌 또는 T 세포 수용체 베타 불변(TRBC) 유전자좌인, 방법.
- 제19항 내지 제26항 중 어느 한 항에 있어서, 상기 상동 아암은 상기 T 세포 수용체 유전자좌의 상기 적어도 일부에 인접한 상기 TCR 유전자좌 내에 인트론 또는 엑손 영역을 포함하는, 방법.
- 제19항 내지 제26항 중 어느 한 항에 있어서, 상기 T 세포 수용체 유전자좌의 상기 적어도 일부는 TRAC의 제1 또는 제3 엑손인, 방법.
- 제19항 내지 제28항 중 어느 한 항에 있어서, 상기 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 상기 TCR 유전자좌 및 상기 NR3C1 유전자좌의 게놈 서열을 파괴하는, 방법.
- 제28항에 있어서, 상기 효율은 상기 TCR 및 NR3C1 유전자좌로부터 발현된 단백질에 대한 유세포 계측법에 의해 결정되는, 방법.
- 제19항 내지 제30항 중 어느 한 항에 있어서, 상기 NR3C1 유전자좌의 상기 적어도 일부는 엑손 2 또는 엑손 3인, 방법.
- 제19항 내지 제31항 중 어느 한 항에 있어서, 상기 방법은 적어도 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 그 이상의 효율로 CAR 분자에 대해 양성이고 NR3C1에 대해 음성인 세포를 생산하는, 방법.
- 제19항 내지 제32항 중 어느 한 항에 있어서, (a) 내지 (c)를 상기 T 세포 또는 이의 전구체에 동시에 도입하는 단계를 포함하는, 방법.
- 제19항 내지 제33항 중 어느 한 항에 있어서, 상기 제1 RNA-가이드 엔도뉴클레아제 또는 상기 제2 RNA-가이드 엔도뉴클레아제는, 서열번호 1, 4, 또는 7 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제19항 내지 제34항 중 어느 한 항에 있어서, 상기 제1 조작된 가이드 RNA 또는 상기 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제19항 내지 제35항 중 어느 한 항에 있어서, 상기 제1 RNA-가이드 엔도뉴클레아제 또는 상기 제2 RNA-가이드 엔도뉴클레아제는 100 pmol 이하, 50 pmol 이하, 25 pmol 이하, 5 pmol 이하, 또는 1 pmol 이하의 농도로 존재하는, 방법.
- 제19항 내지 제36항 중 어느 한 항에 있어서, 상기 T-세포 또는 상기 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함하는, 방법.
- 제19항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 스페이서 서열은 서열번호 16, 20, 21, 또는 22 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제19항 내지 제38항 중 어느 한 항에 있어서, 상기 제1 또는 상기 제2 스페이서 서열은 적어도 약 19 내지 24개 뉴클레오티드, 적어도 약 19개 뉴클레오티드, 적어도 약 20개 뉴클레오티드, 적어도 약 22개 뉴클레오티드, 또는 적어도 약 24개 뉴클레오티드를 포함하는, 방법.
- 제19항 내지 제38항 중 어느 한 항에 있어서, 상기 공여자 DNA 서열은 바이러스 벡터로 전달되는, 방법.
- 제40항에 있어서, 상기 바이러스 벡터는 AAV 또는 AAV-6 벡터인, 방법.
- 글루코코르티코이드-내성 CAR-T 세포의 집단으로서:
(a) TCR 유전자좌 내에 서열번호 10 내지 15 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 이종 서열;
(b) 인델을 포함하는 NR3C1 유전자좌를 포함하는, 글루코코르티코이드-내성 CAR-T 세포의 집단. - 제42항에 있어서, 상기 이종 서열은 인델인, 글루코코르티코이드-내성 T 세포의 집단.
- 제42항 또는 제43항에 있어서, 상기 이종 서열은 이종 T-세포 수용체 또는 CAR 분자를 암호화하는 뉴클레오티드 서열을 포함하는 개방 해독 프레임을 포함하는, 글루코코르티코이드-내성 T 세포의 집단.
- 제42항 내지 제44항 중 어느 한 항에 있어서, 상기 NR3C1 유전자좌는 서열번호 16, 20, 21 또는 22 중 어느 하나의 혼성화 영역의 100, 75, 50, 25 또는 10개 뉴클레오티드 이내의 인델을 포함하는, 글루코코르티코이드-내성 T 세포의 집단.
- 제42항 내지 제45항 중 어느 한 항에 있어서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.2% 미만은 오프-타겟 유전자좌에서 인델을 갖는, 글루코코르티코이드-내성 T 세포의 집단.
- 제43항에 있어서, 게놈-와이드 오프-타겟 이중 가닥 절단 분석에 의해 결정 시, 0.01% 미만은 오프-타겟 유전자좌에서 인델을 갖는, 글루코코르티코이드-내성 T 세포의 집단.
- 제42항 내지 제47항 중 어느 한 항에 있어서, 상기 세포 집단에는 염색체 전위가 실질적으로 없는, 글루코코르티코이드-내성 T 세포의 집단.
- 세포 내에서 2개 이상의 유전자좌를 편집하는 방법으로서, 상기 방법은, 상기 세포에:
(a) 제1 Cas 엔도뉴클레아제 복합체로서:
(i) 제1 Cas 엔도뉴클레아제; 및
(ii) 하나 이상의 조작된 가이드 RNA이되:
상기 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및
제1 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 하나 이상의 조작된 가이드 RNA를 포함하는, 제1 Cas 엔도뉴클레아제 복합체;
(b) 제2 Cas 엔도뉴클레아제 복합체로서:
(i) 제2 Cas 엔도뉴클레아제; 및
(ii) 하나 이상의 조작된 가이드 RNA이되:
상기 클래스 2, II형 Cas 엔도뉴클레아제에 결합하도록 구성된 RNA 서열, 및
제2 표적 서열에 혼성화하도록 구성된 스페이서 서열을 포함하는, 하나 이상의 조작된 가이드 RNA를 포함하는, 제2 Cas 엔도뉴클레아제 복합체를 접촉시키는 단계를 포함하는, 방법. - 제49항에 있어서, 상기 세포에:
(c) 제1 이식유전자를 암호화하는 개방 해독 프레임, 상기 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 상기 제1 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제1 공여자 DNA 서열; 및
(d) 제2 이식유전자를 암호화하는 개방 해독 프레임, 상기 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 5' 상동 아암 및 상기 제2 표적 서열의 3' 측 상에 위치한 DNA 서열을 포함하는 3' 상동 아암을 포함하는 제2 공여자 DNA 서열을 도입하는 단계를 추가로 포함하는, 방법. - 제50항에 있어서, 상기 제1 이식유전자 및 상기 제2 이식유전자는 상이한, 방법.
- 제50항 또는 제51항 중 어느 한 항에 있어서, 상기 제1 표적 서열 또는 상기 제2 표적 서열은 T-세포 수용체 유전자좌, TRAC, TRBC, NR3C1, 또는 AAVS1 유전자좌, 또는 이들의 임의의 조합 내의 표적 서열인, 방법.
- 제50항 내지 제52항 중 어느 한 항에 있어서, 상기 제1 또는 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 서열, 상피 성장 인자 수용체(tEGFR)의 절단된 버전, GFP 코딩 서열, 또는 이들의 임의의 조합인, 방법.
- 제50항 내지 제53항 중 어느 한 항에 있어서, 상기 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 상기 5' 상동 아암 또는 상기 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 상기 5' 상동 아암은 서열번호 42 또는 23을 포함하는, 방법.
- 제50항 내지 제54항 중 어느 한 항에 있어서, 상기 제1 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 상기 3' 상동 아암 또는 상기 제2 표적 서열의 5' 측 상에 위치한 DNA 서열을 포함하는 상기 3' 상동 아암은 서열번호 43 또는 24를 포함하는, 방법.
- 제49항 내지 제55항 중 어느 한 항에 있어서, 상기 제1 또는 상기 제2 클래스 2, II형 Cas 엔도뉴클레아제는, 서열번호 1 또는 4 중 어느 하나, 또는 이의 변이체에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%의 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제49항 내지 제56항 중 어느 한 항에 있어서, 상기 제1 조작된 가이드 RNA 또는 상기 제2 조작된 가이드 RNA는 서열번호 3, 6 또는 9 중 어느 하나에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는 서열을 포함하는, 방법.
- 제49항 내지 제57항 중 어느 한 항에 있어서, 상기 제1 표적 서열에 혼성화하도록 구성된 상기 스페이서 서열 또는 상기 제2 표적 서열에 혼성화하도록 구성된 상기 스페이서 서열은 서열번호 16, 20, 21, 22, 또는 41 중 어느 하나, 또는 이의 보체에 대해 적어도 80%, 85%, 90%, 또는 95%의 서열 동일성을 갖는, 방법.
- 제49항 내지 제58항 중 어느 한 항에 있어서, 상기 제1 또는 상기 제2 엔도뉴클레아제는 클래스 2, II형 Cas 엔도뉴클레아제 또는 클래스 2, V형 Cas 엔도뉴클레아제, 또는 이들의 임의의 조합을 포함하는, 방법.
- 서열번호 63 내지 65 중 어느 하나의 서열, 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함하는, 단리된 핵산.
- 제60항의 단리된 핵산을 포함하는, 세포.
- 제61항에 있어서, 상기 세포는 T-세포 또는 이의 전구체인, 세포.
- 제62항에 있어서, 상기 T-세포 또는 이의 전구체는 T-세포, 조혈 줄기 세포(HSC), 또는 말초 혈액 단핵 세포(PBMC)를 포함하는, 세포.
- 제60항의 단리된 핵산 서열을 포함하는, 벡터.
- 제64항에 있어서, 상기 벡터는 아데노-연관 바이러스(AAV) 벡터인, 벡터.
- 제65항에 있어서, 상기 AAV 벡터는 AAV-6 혈청형 벡터인, 벡터.
- 서열번호 23, 24, 42, 또는 43 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 서열을 포함하는, 벡터.
- 제67항에 있어서, 서열번호 23, 24, 42, 또는 43 중 어느 하나에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 상기 서열의 측면에 위치하는 이식유전자를 추가로 포함하는, 벡터.
- 제68항에 있어서, 상기 제2 이식유전자는 GR의 알파, 베타, 알파-D3, 또는 베타-D3 이소형, CAR 분자, 절단된 저친화성 신경 성장 인자 수용체(tLNGFR) 서열, 상피 성장 인자 수용체(tEGFR)의 절단된 버전, GFP 코딩 서열, 또는 이들의 임의의 조합을 포함하는, 벡터.
- 제67항 또는 제68항에 있어서, 서열번호 63의 tEGFR 코딩 서열 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함하는, 벡터.
- 제67항 또는 제68항에 있어서, 서열번호 64의 tLNGFR 코딩 서열 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함하는, 벡터.
- 제67항 또는 제68항에 있어서, 서열번호 63의 MND 포로모터 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함하는, 벡터.
- 제67항 또는 제68항에 있어서, 서열번호 64의 MSCV 포로모터 또는 이에 대해 적어도 약 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 변이체를 추가로 포함하는, 벡터.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163163510P | 2021-03-19 | 2021-03-19 | |
US63/163,510 | 2021-03-19 | ||
US202163186506P | 2021-05-10 | 2021-05-10 | |
US63/186,506 | 2021-05-10 | ||
US202163241916P | 2021-09-08 | 2021-09-08 | |
US63/241,916 | 2021-09-08 | ||
PCT/US2022/021004 WO2022198080A1 (en) | 2021-03-19 | 2022-03-18 | Multiplex editing with cas enzymes |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230157387A true KR20230157387A (ko) | 2023-11-16 |
Family
ID=83321225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237034371A KR20230157387A (ko) | 2021-03-19 | 2022-03-18 | Cas 효소를 이용한 다중 편집 |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP4308699A1 (ko) |
JP (1) | JP2024515936A (ko) |
KR (1) | KR20230157387A (ko) |
AU (1) | AU2022237663A1 (ko) |
BR (1) | BR112023018948A2 (ko) |
CA (1) | CA3210361A1 (ko) |
MX (1) | MX2023010969A (ko) |
WO (1) | WO2022198080A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021178933A2 (en) | 2020-03-06 | 2021-09-10 | Metagenomi Ip Technologies, Llc | Class ii, type v crispr systems |
WO2022159758A1 (en) * | 2021-01-22 | 2022-07-28 | Metagenomi, Inc | Novel engineered and chimeric nucleases |
WO2024127370A1 (en) * | 2022-12-16 | 2024-06-20 | LifeEDIT Therapeutics, Inc. | Guide rnas that target trac gene and methods of use |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10982200B2 (en) * | 2019-02-14 | 2021-04-20 | Metagenomi Ip Technologies, Llc | Enzymes with RuvC domains |
GB201907733D0 (en) * | 2019-05-31 | 2019-07-17 | Governing Council Of The Univ Of Toronto | Methods and compositions for multiplex gene editing |
-
2022
- 2022-03-18 BR BR112023018948A patent/BR112023018948A2/pt unknown
- 2022-03-18 MX MX2023010969A patent/MX2023010969A/es unknown
- 2022-03-18 KR KR1020237034371A patent/KR20230157387A/ko unknown
- 2022-03-18 WO PCT/US2022/021004 patent/WO2022198080A1/en active Application Filing
- 2022-03-18 EP EP22772310.3A patent/EP4308699A1/en active Pending
- 2022-03-18 JP JP2023556950A patent/JP2024515936A/ja active Pending
- 2022-03-18 AU AU2022237663A patent/AU2022237663A1/en active Pending
- 2022-03-18 CA CA3210361A patent/CA3210361A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
BR112023018948A2 (pt) | 2023-10-17 |
AU2022237663A1 (en) | 2023-10-12 |
JP2024515936A (ja) | 2024-04-11 |
CA3210361A1 (en) | 2022-09-22 |
AU2022237663A9 (en) | 2023-10-26 |
WO2022198080A1 (en) | 2022-09-22 |
EP4308699A1 (en) | 2024-01-24 |
MX2023010969A (es) | 2023-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7012645B2 (ja) | キメラタンパク質および免疫治療の方法 | |
EP3359184B1 (en) | Genetically-modified cells comprising a modified human t cell receptor alpha constant region gene | |
KR20230157387A (ko) | Cas 효소를 이용한 다중 편집 | |
KR20230057487A (ko) | 게놈 조정을 위한 방법 및 조성물 | |
JP6965466B2 (ja) | 操作されたカスケード構成要素およびカスケード複合体 | |
US20210102183A1 (en) | Engineered cascade components and cascade complexes | |
KR102547738B1 (ko) | 발현 강화 유전자좌의 사용에 기초하여 항체를 만들기 위한 조성물 및 방법 | |
CA3072777A1 (en) | Compositions and methods for chimeric ligand receptor (clr)-mediated conditional gene expression | |
KR20210138603A (ko) | 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기를 갖는 변형된 면역 세포 | |
JP7471289B2 (ja) | 抗liv1免疫細胞癌療法 | |
KR20240019791A (ko) | 원형 rna 조성물 및 방법 | |
KR102151065B1 (ko) | 동물 배아의 염기 교정용 조성물 및 염기 교정 방법 | |
US20240287453A1 (en) | Persistent allogeneic modified immune cells and methods of use thereof | |
CN109071633A (zh) | 基于使用表达增强性基因座来制备抗体的组合物和方法 | |
KR20210149734A (ko) | Rna-가이드된 엔도뉴클레아제를 사용한 dna 작제물의 통합을 위한 개선된 방법 | |
KR20230068401A (ko) | 치료 단백질 생산을 위한 고 생산 재조합 차이니즈 햄스터 난소 세포주의 생성 | |
CN117043327A (zh) | 用cas酶进行多重编辑 | |
TW202102669A (zh) | 含有新穎選擇標記的細胞株及其用於蛋白製造的用途 | |
CA3130645A1 (en) | Use of an improved sleeping beauty transposase with increased solubility to facilitate and control transfection of a target cell with a transgene | |
KR20240103154A (ko) | 비-푸코실화 단백질 생산 세포주 제조방법 및 이 방법에 따라 제조된 세포주 | |
WO2023187779A1 (en) | Site-specific in vivo t cell engineering, systems, compositions and methods thereof | |
KR20200085781A (ko) | 선택된 항체를 발현하도록 유전자 변형된 b 세포를 생산하기 위한 시스템 및 방법 | |
KR20240156649A (ko) | 선택된 항체를 발현하도록 유전자 변형된 b 세포를 생산하기 위한 시스템 및 방법 |